訂閱
糾錯(cuò)
加入自媒體

語(yǔ)言技術(shù):AI皇冠上的明珠

新技術(shù)未來(lái)的發(fā)展軌跡

在語(yǔ)音識(shí)別、語(yǔ)義理解和語(yǔ)音合成領(lǐng)域,它們?nèi)〉眠M(jìn)步的主要原因是引入深度學(xué)習(xí),更加依賴(lài)機(jī)器學(xué)習(xí)可能對(duì)語(yǔ)音領(lǐng)域的研究有更大的幫助。

處理多語(yǔ)言支持伴隨著不同的語(yǔ)法規(guī)則,這也是目前主要的挑戰(zhàn)之一,語(yǔ)音處理模型必須考慮并適應(yīng)這些語(yǔ)法規(guī)則,大多數(shù)自然語(yǔ)言處理模型采集句子,進(jìn)行詞性標(biāo)注在某種意義上識(shí)別語(yǔ)法,并創(chuàng)建規(guī)則來(lái)確定如何解釋該語(yǔ)法。

機(jī)器學(xué)習(xí)以及自然語(yǔ)言處理技術(shù)的進(jìn)步,開(kāi)啟了人與人工智能進(jìn)行語(yǔ)音交互的可能,人們透過(guò)對(duì)話(huà)的方式獲取信息、與機(jī)器進(jìn)行交互,將不再只是存在科幻情結(jié)當(dāng)中。語(yǔ)音交互是未來(lái)的方向,而智能音箱則是語(yǔ)音交互落地的第一代產(chǎn)品。

AI對(duì)話(huà)所需要的技術(shù)模塊有4個(gè)部分,分別為:

自動(dòng)語(yǔ)音識(shí)別(ASR)自然語(yǔ)言理解(NLU)自然語(yǔ)言生成(NLG)文字轉(zhuǎn)語(yǔ)音(TTS)。

AI芯天下丨語(yǔ)音語(yǔ)言技術(shù)-AI皇冠上的明珠

一次完整的語(yǔ)音交互流程,成功的語(yǔ)音對(duì)話(huà),通常是有以下幾個(gè)階段。

意圖:交互流程的核心

所謂意圖,表示用戶(hù)在使用應(yīng)用時(shí)所做的動(dòng)作(譬如:?jiǎn)栆粋(gè)問(wèn)題或發(fā)送一條指令),這些意圖代表了應(yīng)用的核心功能。

如果應(yīng)用成功地識(shí)別了用戶(hù)意圖,則需要在完成業(yè)務(wù)動(dòng)作后,將結(jié)果反饋給用戶(hù);如果應(yīng)用無(wú)法識(shí)別用戶(hù)意圖,則需要給用戶(hù)友好的提示,指導(dǎo)用戶(hù)使用。

如何識(shí)別意圖語(yǔ):解析

對(duì)語(yǔ)音識(shí)別結(jié)果進(jìn)行分析理解,簡(jiǎn)單來(lái)說(shuō)就是將用戶(hù)語(yǔ)音輸入映射到機(jī)器指令。它可能定義了一組包含指定的單詞或短語(yǔ)的語(yǔ)法結(jié)構(gòu),用戶(hù)通過(guò)說(shuō)出滿(mǎn)足這種結(jié)構(gòu)的語(yǔ)句,來(lái)調(diào)用意圖。

云端交互:如何處理意圖

調(diào)用意圖的結(jié)構(gòu)化請(qǐng)求,向服務(wù)器請(qǐng)求處理后做出反饋?lái)憫?yīng)。通俗來(lái)講該流程主要處理用戶(hù)的請(qǐng)求,解決用戶(hù)問(wèn)題的答案。

對(duì)話(huà)管理:上下文意圖的處理

在用戶(hù)進(jìn)行自然對(duì)話(huà)時(shí),可能會(huì)因?yàn)楸磉_(dá)事情的復(fù)雜度、時(shí)間、地點(diǎn)、效率等,產(chǎn)生具有脈絡(luò)的對(duì)話(huà)過(guò)程,所有的對(duì)話(huà)元素會(huì)編織在一個(gè)連貫的線性對(duì)話(huà)中。

組織語(yǔ)言:語(yǔ)言合成模塊

根據(jù)解析模塊得到的內(nèi)部表示,在對(duì)話(huà)管理機(jī)制的作用下生成自然語(yǔ)言句子。同時(shí)將生成模塊生成的句子轉(zhuǎn)換成語(yǔ)音輸出。

AI芯天下丨語(yǔ)音語(yǔ)言技術(shù)-AI皇冠上的明珠

語(yǔ)音技術(shù)在未來(lái)將大展宏圖

未來(lái),科技創(chuàng)新將使人類(lèi)的交流與溝通提升到另外一個(gè)層次,它不僅僅是幫助語(yǔ)言障礙患者進(jìn)行無(wú)障礙交流;還會(huì)在人與人或人與機(jī)器之間進(jìn)行信息交換。

由于人類(lèi)語(yǔ)言的多樣化,限制了人與人之間的溝通,特別是跨國(guó)別和跨語(yǔ)種的交流。近幾年,隨著實(shí)時(shí)翻譯技術(shù)的成熟,語(yǔ)言鴻溝正被慢慢地消除。

各種便攜式翻譯設(shè)備可以幫助游客在幾秒鐘內(nèi)進(jìn)行語(yǔ)言翻譯。未來(lái),小小的耳機(jī)設(shè)備將打破出行的語(yǔ)言限制,而傳統(tǒng)的翻譯這一職業(yè)也將被新技術(shù)所替代。

利益于人工智能技術(shù)的飛速發(fā)展,機(jī)器不僅僅是充當(dāng)翻譯人員,還可以成為溝通伙伴。據(jù)Gartner預(yù)測(cè),到今年年底,我們與新技術(shù)的互動(dòng)中有30%將通過(guò)與智能機(jī)器完成。

無(wú)論是在醫(yī)療、旅游、還是商業(yè)活動(dòng),以人工智能為代表的新技術(shù)正在徹底改變?nèi)伺c人之間的交流方式,并將打破身體、地域、國(guó)別、語(yǔ)種的各種限制。未來(lái),我們的交流對(duì)象也將不再局限在人類(lèi),可以是機(jī)器、可以是動(dòng)物。

不過(guò)目前的語(yǔ)音識(shí)別仍處于起步階段。與期望相比,語(yǔ)音技術(shù)的應(yīng)用還處在滿(mǎn)足基本需求的階段,并且有很大的上升空間。

AI芯天下丨語(yǔ)音語(yǔ)言技術(shù)-AI皇冠上的明珠

結(jié)尾

當(dāng)我們?cè)谡Z(yǔ)音技術(shù)的推動(dòng)下向前邁進(jìn)時(shí),世界應(yīng)該擁抱它所創(chuàng)造的充滿(mǎn)希望的人文精神。即使是類(lèi)人機(jī)器人,它們能做的也只是笨拙地移動(dòng),使用語(yǔ)言是人類(lèi)這個(gè)物種真正與眾不同的地方。

語(yǔ)音技術(shù)為世界帶來(lái)了新的力量和便利性,如果應(yīng)對(duì)得當(dāng),語(yǔ)音技術(shù)有可能成為最有感情的技術(shù)。認(rèn)為人工智能只能是冷冰冰的算法的觀點(diǎn)是錯(cuò)誤的,人類(lèi)可以將最好的價(jià)值觀和同理心注入其中。

<上一頁(yè)  1  2  
聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)