實(shí)時(shí)翻譯是如何實(shí)現(xiàn)的?
科技讓我們能夠隨時(shí)通過(guò)手機(jī)聯(lián)系到身處世界各地的人。它打破了距離與時(shí)間的限制,無(wú)論是朋友、家人,還是商務(wù)伙伴,我們都能輕松自如地和他們建立聯(lián)系。然而,直到現(xiàn)在,語(yǔ)言仍是我們面對(duì)面溝通的一個(gè)障礙。
盡管我們能夠向全球各地發(fā)送消息、撥打電話或是視頻聊天,但仍不能進(jìn)行跨語(yǔ)言的流暢交談,F(xiàn)在,國(guó)內(nèi)領(lǐng)先的智能學(xué)習(xí)公司——有道,正利用AI來(lái)解決這一問(wèn)題。過(guò)去一年半的時(shí)間,Qualcomm持續(xù)與有道開(kāi)展合作,通過(guò)終端側(cè)的實(shí)時(shí)翻譯來(lái)幫助人們打破語(yǔ)言的限制、輕松自如地進(jìn)行溝通。
想象一下:你與海外客戶進(jìn)行電話會(huì)議。雖然你說(shuō)的是普通話,但海外客戶能夠?qū)崟r(shí)地聽(tīng)到標(biāo)準(zhǔn)的英文翻譯,這種無(wú)縫、流暢的實(shí)時(shí)翻譯十分令人驚嘆。但是,這樣的實(shí)時(shí)翻譯對(duì)技術(shù)要求頗高,是此前技術(shù)無(wú)法實(shí)現(xiàn)的。Qualcomm驍龍865 5G移動(dòng)平臺(tái)和其集成的第五代Qualcomm人工智能引擎AI Engine,其AI性能是前代平臺(tái)的2倍,能夠支持實(shí)時(shí)離線翻譯的實(shí)現(xiàn)。事實(shí)上,在2019年12月舉行的驍龍技術(shù)峰會(huì)期間,我們已經(jīng)在現(xiàn)場(chǎng)展示過(guò)部分用例。
實(shí)時(shí)翻譯是如何實(shí)現(xiàn)的
翻譯功能通常由CPU執(zhí)行,但對(duì)于特定應(yīng)用而言,CPU作為一個(gè)通用的性能模塊,不能提供足夠強(qiáng)大或?qū)嵱玫男阅苤С帧ualcomm驍龍與有道合作,把翻譯移植到更合適的處理模塊——Qualcomm Hexagon DSP上,以實(shí)現(xiàn)端到端的時(shí)延和性能優(yōu)化。這樣做的優(yōu)勢(shì)在于,能夠有效降低功耗并加大算力,以提高翻譯準(zhǔn)確性,為實(shí)時(shí)翻譯帶來(lái)更好的體驗(yàn)。
無(wú)論用戶正在進(jìn)行傳統(tǒng)的語(yǔ)音通話還是網(wǎng)絡(luò)通話,當(dāng)用戶的語(yǔ)音進(jìn)入驍龍865終端的麥克風(fēng)并傳入驍龍865集成的第五代Qualcomm AI Engine時(shí),有道實(shí)時(shí)翻譯就會(huì)馬上開(kāi)始運(yùn)行。在翻譯的過(guò)程中,驍龍865會(huì)喚醒Qualcomm傳感器中樞(Sensing Hub)來(lái)消除噪聲和回聲,然后啟動(dòng)Hexagon處理器進(jìn)行神經(jīng)網(wǎng)絡(luò)處理,這主要包括以下三個(gè)階段:
1、 自動(dòng)語(yǔ)音識(shí)別(ASR)——以英文來(lái)舉例,通過(guò)在Hexagon處理器上運(yùn)行卷積神經(jīng)網(wǎng)絡(luò)(CNN),用戶的英文語(yǔ)音可以被轉(zhuǎn)錄為英文文字。
2、 神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT)——接下來(lái),英文文字能夠通過(guò)神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯轉(zhuǎn)換成中文文字。這不僅僅是逐字翻譯,而是結(jié)合語(yǔ)句結(jié)構(gòu)的翻譯。Hexagon處理器能夠助力有道算法更好的理解兩種語(yǔ)言之間語(yǔ)句結(jié)構(gòu)的區(qū)別,以及詞語(yǔ)在不同語(yǔ)境中可能具有的不同含義。
3、 文字轉(zhuǎn)語(yǔ)音——最后,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯出的中文文字會(huì)轉(zhuǎn)化為普通話語(yǔ)音。
值得關(guān)注的是,上述處理過(guò)程全部都能夠在終端側(cè)實(shí)時(shí)地進(jìn)行,這讓跨語(yǔ)言交談?wù)嬲兊幂p松自如。
實(shí)時(shí)翻譯的未來(lái)
目前,有道實(shí)時(shí)翻譯技術(shù)支持包括普通話、英文在內(nèi)的多種語(yǔ)言。未來(lái),該技術(shù)甚至可以扮演口譯員的角色,在人們面對(duì)面交談時(shí)進(jìn)行翻譯。
在5G技術(shù)的支持下,實(shí)時(shí)翻譯將會(huì)以更具沉浸感的方式呈現(xiàn)在人們的生活中。例如,由新一代無(wú)線通信和驍龍5G終端賦能的超低時(shí)延技術(shù)能夠在視頻電話中支持面部識(shí)別,這帶來(lái)的不僅僅只是聲音同步,而是逼真的口型同步,對(duì)方就連看起來(lái)也像是正在使用與用戶相同的語(yǔ)言進(jìn)行對(duì)話。
Qualcomm Technologies希望幫助全世界進(jìn)行連接、計(jì)算和溝通。這也是為什么我們很高興能夠與有道合作,并打造能夠幫助人們克服語(yǔ)言障礙的技術(shù)。我們很榮幸可以與合作伙伴一起豐富用戶體驗(yàn),共同架起全世界溝通的橋梁。
Qualcomm驍龍、Qualcomm人工智能引擎AI Engine、Qualcomm Hexagon和Qualcomm傳感器中樞是Qualcomm Technologies, Inc.和/或其子公司的產(chǎn)品。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?