訂閱
糾錯
加入自媒體

智能語音:人工智能領(lǐng)域的重要入口

智能語音是人工智能技術(shù)的重要組成部分,包括語音識別、語義理解、自然語言處理、語音交互等。

當前,人工智能的關(guān)鍵技術(shù)均以實現(xiàn)感知智能和認知智能為目標。語音識別、圖像識別和機器人視覺、生物識別等目前最火熱的領(lǐng)域,主要解決的是感知智能的需求,就是使得人工智能能夠感知周圍的世界,能夠“聽見”或者“看到”。

自然語言理解、智能會話、智能決策、人機交互等技術(shù)更加側(cè)重的是認知智能的領(lǐng)域,解決“聽懂”、“看懂”,并且根據(jù)學習到的知識對人類的要求或者周圍的環(huán)境做出反應的能力。

在關(guān)鍵技術(shù)層中,語音識別、自然語義理解(Nature Language Process, NLP)、機器學習領(lǐng)域的關(guān)鍵技術(shù)在人工智能技術(shù)當中居于重要地位,是人機交互技術(shù)的基礎(chǔ)。

圖表 1 語音交互流程圖

 

智能語音:人工智能領(lǐng)域的重要入口

資料來源: OFweek產(chǎn)業(yè)研究院

智能語音應用場景廣闊,市場規(guī)模始終保持高速增長

智能語音技術(shù)在經(jīng)濟社會中應用場景持續(xù)擴展,目前已被廣泛應用于教育、醫(yī)療、客服、個人語音助手等行業(yè)市場和個人用戶等領(lǐng)域。中國智能語音市場已形成了包括上游的基礎(chǔ)設(shè)施制造(芯片、傳感器、算力)、中游的技術(shù)實現(xiàn)(語音合成、語音識別、語義理解等)以及下游的眾多應用服務(wù)(家居、客服、教育等)的完整產(chǎn)業(yè)鏈結(jié)構(gòu)。

智能語音技術(shù)在整個產(chǎn)業(yè)鏈中起到了承接的作用,將人工智能的技術(shù)低層產(chǎn)業(yè)化,并在智能家居、可穿戴設(shè)備、機器人等行業(yè)落地,是整個人工智能產(chǎn)業(yè)鏈中的關(guān)鍵一環(huán)。

圖表 2 智能語音行業(yè)產(chǎn)業(yè)鏈 

智能語音:人工智能領(lǐng)域的重要入口

資料來源: OFweek產(chǎn)業(yè)研究院

根據(jù)中國信息通信研究院的數(shù)據(jù)顯示,2018年中國人工智能市場規(guī)模達230億元,智能語音所占市場份額為22%,約50.4億元。

在整個人工智能產(chǎn)業(yè)中,智能語音產(chǎn)業(yè)化程度相對成熟,是所占份額比例較大的細分領(lǐng)域,由2014年的8.5億元人民幣發(fā)展至2018年的50.4億元人民幣,整個行業(yè)始終保持著高速發(fā)展,并將在未來持續(xù)保持下去。預計到2023年,智能語音行業(yè)市場規(guī)模將突破100億元人民幣。

圖表 3 2014-2018年中國智能語音行業(yè)市場規(guī)模及增速(單位:億元)

 

智能語音:人工智能領(lǐng)域的重要入口

數(shù)據(jù)來源:中信證券, OFweek產(chǎn)業(yè)研究院

智能語音技術(shù)以其廣闊的產(chǎn)業(yè)化應用席卷人們?nèi)粘I詈凸ぷ鞯姆椒矫婷?其產(chǎn)業(yè)規(guī)模的大幅提升主要源于兩方面的驅(qū)動支持。第一,大數(shù)據(jù)、云計算等技術(shù)的快速發(fā)展使得智能語音技術(shù)的應用不斷成熟,能夠滿足政府、金融、家電、汽車等多領(lǐng)域垂直行業(yè)的應用需求。

第二,各國政府、相關(guān)行業(yè)及資本都持續(xù)關(guān)注智能語音技術(shù)的研發(fā)和產(chǎn)業(yè)化。作為戰(zhàn)略性和前瞻性的重要新興產(chǎn)業(yè),語音交互技術(shù)始終是世界各國科學界和投資界的關(guān)注焦點,各國都力爭率先取得關(guān)鍵技術(shù)突破,占據(jù)產(chǎn)業(yè)先機位置,以取得智能語音產(chǎn)業(yè)的領(lǐng)導權(quán)。中國、美國、歐洲、日本等國政府均專門立項予以重點扶持,并投入重金設(shè)立專項計劃。

圖表 4 多方驅(qū)動智能語音產(chǎn)業(yè)規(guī)模升級

智能語音:人工智能領(lǐng)域的重要入口

數(shù)據(jù)來源:廣證恒生, OFweek產(chǎn)業(yè)研究院

相比西方國家,語音識別技術(shù)和自然語言處理技術(shù)在中國的發(fā)展尤其迅猛,很大程度上是由自身的獨特因素所導致。如用戶規(guī)模較大,以及中文難以手寫等。

(1)用戶群體龐大:作為人口大國,中國有著更大的用戶基數(shù),且人均資源少,可用機器替代的崗位數(shù)量多于其余國家,有著廣闊的增長空間。如在客服領(lǐng)域,在中國每個客服需要處理的業(yè)務(wù)數(shù)量遠大于西方國家,智能語音識別技術(shù)能夠很好地解決類似問題。

(2)中文難以手寫:與其他語系的文字相比,中文的手寫較為繁瑣,語音相比打字是一種更為自然的輸入方式。且漢語句法和語法相對簡單,沒有虛擬語氣和條件語句,降低了語音識別的難度。

中國智能語音行業(yè)發(fā)展現(xiàn)狀:市場集中度高,參與者不斷涌入

隨著人工智能和語音交互等概念的日益火熱,國內(nèi)各類企業(yè)紛紛涌入智能語音市場,以產(chǎn)業(yè)內(nèi)合作的方式,將語音技術(shù)植入產(chǎn)品或應用于相關(guān)業(yè)務(wù)場景,開放語音生態(tài)系統(tǒng),構(gòu)建全產(chǎn)業(yè)生態(tài)鏈。以企業(yè)性質(zhì)作為劃分標準,中國智能語音行業(yè)的參與企業(yè)可分為以下四類:

(1)行業(yè)經(jīng)驗豐富的專業(yè)語音公司。在深度學習算法大規(guī)模應用前,就已開始從事這個領(lǐng)域的專業(yè)語音公司,如科大訊飛和小i機器人,專注在垂直領(lǐng)域并深耕多年,具備豐富的行業(yè)知識。

(2)AI初創(chuàng)公司。如思必馳、云知聲、出門問問,此類公司主要關(guān)注多用途的云平臺和某些特定的垂直領(lǐng)域,如智能汽車或智能家居,并集中研發(fā)智能語音技術(shù)在這些領(lǐng)域的應用。

(3)中國本土互聯(lián)網(wǎng)公司。如百度、阿里、騰訊等為代表,主要推出移動端消費者語音產(chǎn)品。所使用的多用途云平臺源自其自身的核心產(chǎn)品,如騰訊的微信。

(4)海外互聯(lián)網(wǎng)公司。如亞馬遜、蘋果、Nuance等,近年來通過并購等手段,夯實核心技術(shù),開放應用平臺,擴展以AI為核心的生態(tài)系統(tǒng)。如亞馬遜公布的開源深度學習和機器學習工具DSSTNE,微軟的開源AI平臺Project Malmo等。

主要參與廠商:在全球市場方面,2018年全球智能語音行業(yè)市值超過150億美元,Nuance、谷歌、蘋果、微軟和科大訊飛作為排名前五的廠商,市場份額合計占比超過80%。

在中國智能語音市場,科大訊飛以44%的市占率高居榜首,2018年,中國智能語音市場排名前五的廠商是科大訊飛、百度、蘋果、Nuance和小i機器人,合計占據(jù)了85%的市場份額,行業(yè)整體呈現(xiàn)高集中度。

圖表 5 2018年全球智能語音行業(yè)市場份額(左)2018年中國智能語音行業(yè)市場份額(右)

 

智能語音:人工智能領(lǐng)域的重要入口

數(shù)據(jù)來源:中信證券, OFweek產(chǎn)業(yè)研究院

競爭格局:馬太效應凸顯,頭部企業(yè)壟斷市場

智能語音行業(yè)作為技術(shù)先導型的新興行業(yè),具有顯著的馬太效應與較高的行業(yè)壁壘。行業(yè)發(fā)展初期,技術(shù)領(lǐng)先型企業(yè)占據(jù)市場先機后,會通過數(shù)據(jù)與資源的積累在后繼競爭中占據(jù)更大的競爭優(yōu)勢,導致后來者短期內(nèi)難以趕超的局面。

圖表 6 智能語音行業(yè)主要壁壘

智能語音:人工智能領(lǐng)域的重要入口

數(shù)據(jù)來源:廣證恒生, OFweek產(chǎn)業(yè)研究院

由于行業(yè)壁壘高且具有馬太效應,在中國范圍內(nèi)看來,僅有少數(shù)廠商在智能語音市場具備較強競爭力。一類是傳統(tǒng)語音技術(shù)廠商,如科大訊飛,擁有長期技術(shù)和用戶積累。另一類是以BAT為代表的IT巨頭,憑借在互聯(lián)網(wǎng)端的優(yōu)勢迅速搶占了語音信息流入口。

2010年后,各大IT巨頭紛紛通過自主研發(fā)或并購/參股的方式深入布局智能語音產(chǎn)業(yè),不采用傳統(tǒng)的技術(shù)授權(quán)、技術(shù)解決方案提供、技術(shù)維護等業(yè)務(wù)模式,推動技術(shù)免費、增值服務(wù)收費成為新型商業(yè)模式,打破了以科大訊飛等為代表的傳統(tǒng)語音技術(shù)廠商一家獨大的局面,并不斷對消費者的交互習慣產(chǎn)生影響。

另一方面,隨著深度學習的引入和發(fā)展,智能語音的算法紅利正逐漸消失,自2010年深度學習首次引入語音識別后,配合計算能力的提升和海量語音語料數(shù)據(jù)的積累,識別準確率得到大幅提升?萍季揞^對于深度學習算法及機器學習框架的開源使得智能語音技術(shù)的調(diào)用變得更為簡單,模塊化的設(shè)計顯著降低了應用部署和實施的門檻,在此大環(huán)境下,智能語音產(chǎn)業(yè)由一家獨大演變?yōu)槎喾礁偁幍母窬帧?/p>

本文內(nèi)容選自O(shè)Fweek產(chǎn)業(yè)研究院發(fā)布的《2019-2023年智能語音行業(yè)研究及前景預測報告》,更多詳細內(nèi)容請點擊http://research.ofweek.com/2019-11/RET-10789.html,或致電15014120070(劉冰),郵箱:lixinyi@ofweek.com

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點。刊用本站稿件,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復制、翻譯及建立鏡像,違者將依法追究法律責任。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號