讓失聲群體重獲“新聲”,腦機接口領(lǐng)域現(xiàn)重大突破
日前,學(xué)術(shù)期刊《自然》在線發(fā)表了一篇文章,其中涉及一種解碼器,能夠?qū)⒋竽X神經(jīng)信號轉(zhuǎn)化為語音,幫助無法說話的患者實現(xiàn)發(fā)聲交流。
據(jù)了解,該解碼器由加州大學(xué)舊金山分校的神經(jīng)外科學(xué)家Edward Chang教授與其同事一同開發(fā)。他們采用了一種叫做“高密度腦皮層電圖”的技術(shù),能夠基于癲癇患者腦中被植入的電極(醫(yī)療監(jiān)測需要)所傳出的數(shù)據(jù),直接記錄下受試者大腦皮層的神經(jīng)活動。
過程中,受試者會被要求大聲讀出幾百條句子,研究人員則會同步記錄他們大腦腹側(cè)感覺運動皮層區(qū)的神經(jīng)活動,這里是大腦的語音產(chǎn)生中心。
隨后,研究人員將利用循環(huán)神經(jīng)網(wǎng)絡(luò)破譯采集到的神經(jīng)信號,其中涉及兩個步驟:第一步,他們將神經(jīng)信號轉(zhuǎn)換為表征發(fā)音器動作的信號,包括下巴、喉、嘴唇和舌頭動作相關(guān)的腦信號;第二步,他們則根據(jù)解碼出來的發(fā)音器官動作,把信號轉(zhuǎn)換為說出的語句。
為了驗證自己的成果,研究人員已經(jīng)在亞馬遜的眾包任務(wù)平臺Mechanical Turk上招募了聽眾,來辨認解碼器合成的語音,測試內(nèi)容包括325個單詞和101局整句。結(jié)果顯示,聽眾能夠成功的識別出單詞,和對自然語音的感知模式一樣。
對于這一測試結(jié)果,第一作者Gopala Anumanchipalli博士表示,該結(jié)果意味著這種神經(jīng)合成語音對于現(xiàn)實世界的應(yīng)用來說已經(jīng)達到即刻聽懂的實用程度。
此外,研究人員還進行了另一項測試,讓受試者用默讀的方式讀出同一個句子。結(jié)果顯示,無聲言語的合成效果不如有聲言語。但Edward Chang表示,雖然語音解碼的準(zhǔn)確性大大降低,但受試者在沒有聲音的情況下模仿發(fā)聲仍然可以進行語音合成。至于那些已經(jīng)喪失語音相關(guān)動作能力的群體,該系統(tǒng)的是適用性還需要進一步研究。
針對這一項研究成果,生物工程學(xué)教授Chethan Pandarinath等人在文章評論中表示,這一系統(tǒng)要成為一個臨床可行的語音合成腦機接口,還存在許多挑戰(zhàn)。但可以肯定的是,腦機接口技術(shù)的持續(xù)進步可以讓存在發(fā)聲障礙問題的群體重新獲得“說話”的能力。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?