訂閱
糾錯(cuò)
加入自媒體

用AI回憶起曾被忘卻的語言

2023-03-28 16:46
腦極體
關(guān)注

語言是文明的DNA,然而聯(lián)合國教科文組織調(diào)查數(shù)據(jù)顯示,全球有七千多種有記錄的語言,超過400種瀕危,兩千種極危。中國語言種類繁多,目前有130 多種語言,有25種語言使用人口已不足千人。

以前的少數(shù)民族語言保護(hù)是采用田野調(diào)查建立起龐大的口語語料庫,保存了原始聲音文件和國際音標(biāo)標(biāo)注等豐富素材,但工作人員往往只能獲得單語語料,無法有效解讀語義,而且中國國土面積廣闊,田野調(diào)查的時(shí)間和經(jīng)費(fèi)成本非常高,少數(shù)民族語言的保護(hù)傳承工作道阻且長。

隨著AI技術(shù)在千行百業(yè)中的深入發(fā)展,大家發(fā)現(xiàn)AI技術(shù)在保護(hù)少數(shù)民族語言方面有獨(dú)特的優(yōu)勢,研發(fā)出的無監(jiān)督跨語言詞向量算法+OCR光學(xué)智能識別技術(shù)合成的自動(dòng)生成式“漢語-少數(shù)民族語言”辭典成為保護(hù)少數(shù)民族語言的曙光。下面就讓白洞帶大家了解AI究竟是如何保護(hù)少數(shù)民族語言的吧!

       原文標(biāo)題 : 用AI回憶起曾被忘卻的語言

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號