訂閱
糾錯(cuò)
加入自媒體

科大訊飛:發(fā)布AI云,五大版塊構(gòu)建AI科技樹(shù)

發(fā)布AI云,五大版塊構(gòu)建AI科技樹(shù)

“企業(yè)數(shù)字化升級(jí)的終局是智能化,AI+大數(shù)據(jù)已經(jīng)成為拓寬新局面的決定性因素!笨拼笥嶏w集團(tuán)副總裁于繼棟在現(xiàn)場(chǎng)表示。

而為了更好地賦能企業(yè)數(shù)字化轉(zhuǎn)型,科大訊飛在現(xiàn)場(chǎng)帶來(lái)了全新生態(tài)新品——訊飛AI云。

根據(jù)現(xiàn)場(chǎng)介紹,訊飛AI云由磐石平臺(tái)和擎天平臺(tái)構(gòu)成,前者針對(duì)AI服務(wù)對(duì)云主機(jī)集群進(jìn)行了103項(xiàng)專業(yè)優(yōu)化,降本提效的同時(shí)進(jìn)行多種認(rèn)證和加密,從而保證臟專屬云用戶接入安全;后者定位“授人以漁”,從數(shù)據(jù)標(biāo)注、模型訓(xùn)練、引擎托管、服務(wù)編排等維度,滿足更多用戶不同業(yè)務(wù)場(chǎng)景組合下的AI需求。

隨著訊飛AI云的發(fā)布,我們可以預(yù)想到,在未來(lái),訊飛開(kāi)放平臺(tái)除了提供諸多AI基礎(chǔ)服務(wù)之外,還將能夠針對(duì)用戶更多個(gè)性化的需求提供高效服務(wù)。

與此同時(shí),科大訊飛AI研究院常務(wù)副院長(zhǎng)劉聰也在大會(huì)現(xiàn)場(chǎng)提出“AI科技樹(shù)”構(gòu)造理念,并從5大板塊掀開(kāi)了科大訊飛技術(shù)全景的一角。

具體來(lái)看,此次介紹的5大板塊分別是:

· 語(yǔ)音識(shí)別

科大訊飛的語(yǔ)音識(shí)別技術(shù)通過(guò)結(jié)合自學(xué)習(xí)更新的能力,可以對(duì)領(lǐng)域關(guān)鍵詞、應(yīng)用場(chǎng)景、口音、領(lǐng)域風(fēng)格等個(gè)性化需求進(jìn)行建模,真實(shí)、復(fù)雜場(chǎng)景下的語(yǔ)音交互也更自然。

這一技術(shù)上,科大訊飛還針對(duì)說(shuō)話背景復(fù)雜多樣、多人說(shuō)話語(yǔ)音混疊、文字內(nèi)容外的特殊聲音現(xiàn)象等問(wèn)題,給出了全場(chǎng)景音頻解析的整體方案。

此外,針對(duì)包含語(yǔ)音的有效內(nèi)容,使用基于富信息的語(yǔ)音降噪和分離方案,綜合利用聲音、文本、說(shuō)話人等信息。在有條件的情況下,還可以使用多模態(tài)的唇形、視線以及麥克風(fēng)陣列的空間位置等信息來(lái)進(jìn)行聯(lián)合建模,多次在國(guó)際語(yǔ)音識(shí)別與分離大賽中奪冠。

· 語(yǔ)音合成

過(guò)去,語(yǔ)音合成的效果主要用合成自然度MOS分來(lái)評(píng)估,但是未來(lái)的AI應(yīng)用,不光追求技術(shù)可實(shí)現(xiàn),還要更加人性化、更具有表現(xiàn)力、展示維度多模態(tài)。

科大訊飛的語(yǔ)音合成目前已經(jīng)能夠做到從語(yǔ)音到聲音的全場(chǎng)景音頻合成;谧匀徽Z(yǔ)言理解技術(shù),科大訊飛能夠從文本當(dāng)中分析到合適的情感焦點(diǎn),以及與角色相關(guān)的信息。與此同時(shí),他們也將單一的情感合成升級(jí)為微情緒合成,這意味著機(jī)器人能夠?qū)σ恍┚植康那楦凶龅骄珳?zhǔn)預(yù)測(cè)和控制,從而讓整個(gè)人機(jī)交互過(guò)程顯得更加具備趣味性和人情味。

· OCR識(shí)別

科大訊飛在OCR識(shí)別領(lǐng)域,做的可謂是細(xì)致入微。目前訊飛的OCR框架已經(jīng)進(jìn)化到了第四代篇章級(jí)的Encoder+Decoder,可以完成高精度二維復(fù)雜版面的端到端識(shí)別,相關(guān)能力調(diào)用量已經(jīng)超過(guò)10億次。

· 多語(yǔ)種

目前,科大訊飛現(xiàn)在已經(jīng)將語(yǔ)音合成、圖文識(shí)別等AI能力成功遷移到了多個(gè)語(yǔ)種,文檔拍照識(shí)別已經(jīng)支持56種語(yǔ)言,并且平均正確率超過(guò)了85%,機(jī)器翻譯更是擴(kuò)展到了168種語(yǔ)言。

· 行業(yè)認(rèn)知

當(dāng)前,科大訊飛基于在各個(gè)行業(yè)積累的豐富經(jīng)驗(yàn),構(gòu)建了一個(gè)行業(yè)認(rèn)知中臺(tái),來(lái)降低問(wèn)題定義的難度。

有了這個(gè)認(rèn)知中臺(tái),就可以基本達(dá)到一個(gè)資深行業(yè)人士80%左右的認(rèn)知能力,讓場(chǎng)景定義的效率提升50%以上,而且認(rèn)知中臺(tái)可以完全私有化部署,數(shù)據(jù)安全無(wú)需擔(dān)憂。目前,基于認(rèn)知中臺(tái)的訊飛智醫(yī)機(jī)器人已經(jīng)拿到了執(zhí)業(yè)醫(yī)師資格證,這也是全球第一個(gè)拿到醫(yī)師執(zhí)照的機(jī)器人。

在演講的最后,劉聰表示:“除了上述的幾個(gè)方向,伴隨著科技樹(shù)枝葉的持續(xù)點(diǎn)亮,訊飛科技樹(shù)的全景已經(jīng)展現(xiàn)在大家的眼前。我想從原始的一顆種子發(fā)展到參天大樹(shù),科技樹(shù)的每一片枝葉、每一個(gè)技術(shù)背后都蘊(yùn)含了大量的付出和努力。”他也說(shuō)到,未來(lái)科大訊飛會(huì)用科學(xué)的方法,合理有序的侯建科技樹(shù),從而保證科技樹(shù)的根基穩(wěn)固,以及多個(gè)技術(shù)職業(yè)之間的高效協(xié)同。

最后

時(shí)至今日,科大訊飛1024開(kāi)發(fā)者大會(huì)已經(jīng)辦過(guò)四屆,而距離訊飛開(kāi)放平臺(tái)推出也已經(jīng)走過(guò)10年光陰。

前面也說(shuō)到,這10年間,“(訊飛開(kāi)放平臺(tái))從早期的只有語(yǔ)音合成和識(shí)別兩個(gè)能力,到現(xiàn)在300多個(gè)AI能力。從最早的十幾個(gè)團(tuán)隊(duì),到現(xiàn)在超過(guò)150萬(wàn)團(tuán)隊(duì)!迸c此同時(shí),平臺(tái)也已對(duì)外開(kāi)放了334項(xiàng)AI能力及方案,鏈接超200萬(wàn)生態(tài)合作伙伴,累計(jì)支持超過(guò)29.9億+終端。

在會(huì)后對(duì)開(kāi)發(fā)者的采訪中,我們知悉了科大訊飛開(kāi)發(fā)者競(jìng)賽等項(xiàng)目對(duì)于他們的幫助,而反過(guò)來(lái),開(kāi)發(fā)者們的聚攏,也為科大訊飛的生態(tài)建設(shè)提供了極大的助力。正如劉慶峰所說(shuō),唯有生態(tài),才能生生不息!

<上一頁(yè)  1  2  
聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)