色丁香久久,波多野结衣久久,精品国产自产拍在线观看

當(dāng)前位置： OFweek 人工智能網(wǎng) > 正文

英偉達(dá)發(fā)布全新 AI 音頻模型 Fugatto

2024-11-26 11:21

編譯/前方智能

英偉達(dá)近日推出了一款名為 Fugatto（全稱為 Foundational Generative Audio Transformer Opus 1）的 AI 音頻模型。這款模型不僅能通過(guò)文字提示生成音樂(lè)和音效，還能對(duì)現(xiàn)有音頻進(jìn)行修改和轉(zhuǎn)換，創(chuàng)造出前所未有的聲音組合。

圖源：英偉達(dá)

據(jù)英偉達(dá)介紹，F(xiàn)ugatto 具備多項(xiàng)獨(dú)特功能，比如可以將鋼琴演奏的音樂(lè)轉(zhuǎn)換為人聲演唱，能夠調(diào)整語(yǔ)音的口音和情緒，甚至可以創(chuàng)造出"尖叫的薩克斯"或"犬吠般的小號(hào)聲"等超現(xiàn)實(shí)音效。該模型采用了創(chuàng)新的 ComposableART 技術(shù)，能夠?qū)⒂?xùn)練過(guò)程中分別出現(xiàn)的音頻特征進(jìn)行組合，從而產(chǎn)生全新的聲音效果。

在技術(shù)層面，研究團(tuán)隊(duì)使用了來(lái)自全球多個(gè)開(kāi)源數(shù)據(jù)集的約 2000 萬(wàn)個(gè)音頻樣本進(jìn)行訓(xùn)練，形成了一個(gè)擁有 25 億參數(shù)的大規(guī)模模型。該項(xiàng)目由來(lái)自印度、巴西、中國(guó)、約旦和韓國(guó)等多個(gè)國(guó)家的研究人員共同開(kāi)發(fā)，這種多元化的團(tuán)隊(duì)構(gòu)成也使得模型在處理多語(yǔ)言和多重口音方面表現(xiàn)出色。

英偉達(dá)應(yīng)用深度學(xué)習(xí)研究副總裁 Bryan Catanzaro 表示，生成式 AI 技術(shù)將為音樂(lè)、游戲和普通創(chuàng)作者帶來(lái)全新的創(chuàng)作可能性。不過(guò)，考慮到生成式技術(shù)可能帶來(lái)的潛在風(fēng)險(xiǎn)，英偉達(dá)目前尚未計(jì)劃對(duì)外發(fā)布這項(xiàng)技術(shù)。

原文標(biāo)題 : 英偉達(dá)發(fā)布全新 AI 音頻模型 Fugatto

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫(xiě)，觀點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

登錄登錄即可訪問(wèn)所有OFweek服務(wù)

用戶名/郵箱/手機(jī)：
密碼：
忘記密碼？
用其他賬號(hào)登錄： QQ | 微信 | 新浪微博

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

暫無(wú)評(píng)論

暫無(wú)評(píng)論

圖片新聞

最新發(fā)布

最新活動(dòng)更多

一周熱點(diǎn) 月點(diǎn)擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報(bào)告

人工智能獵頭職位更多

掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯(cuò)

x

_*文字標(biāo)題：

_*糾錯(cuò)內(nèi)容：

聯(lián)系郵箱：

_*驗(yàn) 證碼：

看不清，點(diǎn)擊換一張

粵公網(wǎng)安備 44030502002758號(hào)

感谢您访问我们的网站，您可能还对以下资源感兴趣：

精品剧情v国产在线观看

精品一区二区三区在线观看视频肉体奉公hd中文字幕看片在线男女h视频