語(yǔ)言技術(shù):AI皇冠上的明珠
新技術(shù)未來(lái)的發(fā)展軌跡
在語(yǔ)音識(shí)別、語(yǔ)義理解和語(yǔ)音合成領(lǐng)域,它們?nèi)〉眠M(jìn)步的主要原因是引入深度學(xué)習(xí),更加依賴(lài)機(jī)器學(xué)習(xí)可能對(duì)語(yǔ)音領(lǐng)域的研究有更大的幫助。
處理多語(yǔ)言支持伴隨著不同的語(yǔ)法規(guī)則,這也是目前主要的挑戰(zhàn)之一,語(yǔ)音處理模型必須考慮并適應(yīng)這些語(yǔ)法規(guī)則,大多數(shù)自然語(yǔ)言處理模型采集句子,進(jìn)行詞性標(biāo)注在某種意義上識(shí)別語(yǔ)法,并創(chuàng)建規(guī)則來(lái)確定如何解釋該語(yǔ)法。
機(jī)器學(xué)習(xí)以及自然語(yǔ)言處理技術(shù)的進(jìn)步,開(kāi)啟了人與人工智能進(jìn)行語(yǔ)音交互的可能,人們透過(guò)對(duì)話(huà)的方式獲取信息、與機(jī)器進(jìn)行交互,將不再只是存在科幻情結(jié)當(dāng)中。語(yǔ)音交互是未來(lái)的方向,而智能音箱則是語(yǔ)音交互落地的第一代產(chǎn)品。
AI對(duì)話(huà)所需要的技術(shù)模塊有4個(gè)部分,分別為:
自動(dòng)語(yǔ)音識(shí)別(ASR)自然語(yǔ)言理解(NLU)自然語(yǔ)言生成(NLG)文字轉(zhuǎn)語(yǔ)音(TTS)。
一次完整的語(yǔ)音交互流程,成功的語(yǔ)音對(duì)話(huà),通常是有以下幾個(gè)階段。
意圖:交互流程的核心
所謂意圖,表示用戶(hù)在使用應(yīng)用時(shí)所做的動(dòng)作(譬如:?jiǎn)栆粋(gè)問(wèn)題或發(fā)送一條指令),這些意圖代表了應(yīng)用的核心功能。
如果應(yīng)用成功地識(shí)別了用戶(hù)意圖,則需要在完成業(yè)務(wù)動(dòng)作后,將結(jié)果反饋給用戶(hù);如果應(yīng)用無(wú)法識(shí)別用戶(hù)意圖,則需要給用戶(hù)友好的提示,指導(dǎo)用戶(hù)使用。
如何識(shí)別意圖語(yǔ):解析
對(duì)語(yǔ)音識(shí)別結(jié)果進(jìn)行分析理解,簡(jiǎn)單來(lái)說(shuō)就是將用戶(hù)語(yǔ)音輸入映射到機(jī)器指令。它可能定義了一組包含指定的單詞或短語(yǔ)的語(yǔ)法結(jié)構(gòu),用戶(hù)通過(guò)說(shuō)出滿(mǎn)足這種結(jié)構(gòu)的語(yǔ)句,來(lái)調(diào)用意圖。
云端交互:如何處理意圖
調(diào)用意圖的結(jié)構(gòu)化請(qǐng)求,向服務(wù)器請(qǐng)求處理后做出反饋?lái)憫?yīng)。通俗來(lái)講該流程主要處理用戶(hù)的請(qǐng)求,解決用戶(hù)問(wèn)題的答案。
對(duì)話(huà)管理:上下文意圖的處理
在用戶(hù)進(jìn)行自然對(duì)話(huà)時(shí),可能會(huì)因?yàn)楸磉_(dá)事情的復(fù)雜度、時(shí)間、地點(diǎn)、效率等,產(chǎn)生具有脈絡(luò)的對(duì)話(huà)過(guò)程,所有的對(duì)話(huà)元素會(huì)編織在一個(gè)連貫的線性對(duì)話(huà)中。
組織語(yǔ)言:語(yǔ)言合成模塊
根據(jù)解析模塊得到的內(nèi)部表示,在對(duì)話(huà)管理機(jī)制的作用下生成自然語(yǔ)言句子。同時(shí)將生成模塊生成的句子轉(zhuǎn)換成語(yǔ)音輸出。
語(yǔ)音技術(shù)在未來(lái)將大展宏圖
未來(lái),科技創(chuàng)新將使人類(lèi)的交流與溝通提升到另外一個(gè)層次,它不僅僅是幫助語(yǔ)言障礙患者進(jìn)行無(wú)障礙交流;還會(huì)在人與人或人與機(jī)器之間進(jìn)行信息交換。
由于人類(lèi)語(yǔ)言的多樣化,限制了人與人之間的溝通,特別是跨國(guó)別和跨語(yǔ)種的交流。近幾年,隨著實(shí)時(shí)翻譯技術(shù)的成熟,語(yǔ)言鴻溝正被慢慢地消除。
各種便攜式翻譯設(shè)備可以幫助游客在幾秒鐘內(nèi)進(jìn)行語(yǔ)言翻譯。未來(lái),小小的耳機(jī)設(shè)備將打破出行的語(yǔ)言限制,而傳統(tǒng)的翻譯這一職業(yè)也將被新技術(shù)所替代。
利益于人工智能技術(shù)的飛速發(fā)展,機(jī)器不僅僅是充當(dāng)翻譯人員,還可以成為溝通伙伴。據(jù)Gartner預(yù)測(cè),到今年年底,我們與新技術(shù)的互動(dòng)中有30%將通過(guò)與智能機(jī)器完成。
無(wú)論是在醫(yī)療、旅游、還是商業(yè)活動(dòng),以人工智能為代表的新技術(shù)正在徹底改變?nèi)伺c人之間的交流方式,并將打破身體、地域、國(guó)別、語(yǔ)種的各種限制。未來(lái),我們的交流對(duì)象也將不再局限在人類(lèi),可以是機(jī)器、可以是動(dòng)物。
不過(guò)目前的語(yǔ)音識(shí)別仍處于起步階段。與期望相比,語(yǔ)音技術(shù)的應(yīng)用還處在滿(mǎn)足基本需求的階段,并且有很大的上升空間。
結(jié)尾
當(dāng)我們?cè)谡Z(yǔ)音技術(shù)的推動(dòng)下向前邁進(jìn)時(shí),世界應(yīng)該擁抱它所創(chuàng)造的充滿(mǎn)希望的人文精神。即使是類(lèi)人機(jī)器人,它們能做的也只是笨拙地移動(dòng),使用語(yǔ)言是人類(lèi)這個(gè)物種真正與眾不同的地方。
語(yǔ)音技術(shù)為世界帶來(lái)了新的力量和便利性,如果應(yīng)對(duì)得當(dāng),語(yǔ)音技術(shù)有可能成為最有感情的技術(shù)。認(rèn)為人工智能只能是冷冰冰的算法的觀點(diǎn)是錯(cuò)誤的,人類(lèi)可以將最好的價(jià)值觀和同理心注入其中。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?