訂閱
糾錯(cuò)
加入自媒體

車(chē)萬(wàn)翔教授:ACL 2010-2020 研究趨勢(shì)總結(jié)

文本生成強(qiáng)勢(shì)上升

嚴(yán)格來(lái)講自然語(yǔ)言處理應(yīng)被分為自然語(yǔ)言處理和自然語(yǔ)言生成兩個(gè)方向,然而受到技術(shù)的限制,傳統(tǒng)的文本生成多采用基于模板的方法,因此在研究上并沒(méi)有引起太多的關(guān)注。隨著序列到序列模型的產(chǎn)生,人們意識(shí)到可以采用類(lèi)似的方法進(jìn)行逐詞的文本生成,從而產(chǎn)生了大量的研究和應(yīng)用問(wèn)題,因此文本生成也成為了目前自然語(yǔ)言處理的熱門(mén)研究領(lǐng)域。今年ACL上的研究熱點(diǎn)如下圖所示。

車(chē)萬(wàn)翔教授:ACL 2010-2020 研究趨勢(shì)總結(jié)

問(wèn)答系統(tǒng)絕地反擊

隨著斯坦福大學(xué)SQuAD數(shù)據(jù)集的誕生,以抽取式閱讀理解為代表的問(wèn)答系統(tǒng)近年來(lái)引起了大量的關(guān)注。但是為什么說(shuō)是“絕地反擊”呢?主要是因?yàn)樵诟弥,?wèn)答系統(tǒng)就曾經(jīng)是信息檢索和自然語(yǔ)言處理領(lǐng)域的熱門(mén)研究方向,但是受限于當(dāng)時(shí)的技術(shù)手段,答案準(zhǔn)確率并不是很高,因此該研究方向曾一度被人們所冷落。經(jīng)過(guò)這幾年的發(fā)展,問(wèn)答系統(tǒng)的模型逐漸被預(yù)訓(xùn)練模型所統(tǒng)一,因此今年ACL上的相關(guān)文章更關(guān)注問(wèn)答系統(tǒng)的各個(gè)子任務(wù)或引入更多資源。

車(chē)萬(wàn)翔教授:ACL 2010-2020 研究趨勢(shì)總結(jié)

新任務(wù)和資源挑戰(zhàn)機(jī)器

仍然是受預(yù)訓(xùn)練模型的影響,在很多剛被提出不久的自然語(yǔ)言處理任務(wù)上,機(jī)器的表現(xiàn)很快超過(guò)人類(lèi)。因此最近有大量的研究工作試圖提出對(duì)機(jī)器更具有挑戰(zhàn)性的任務(wù)和資源,從而逼迫機(jī)器更像人一樣“思考”。

車(chē)萬(wàn)翔教授:ACL 2010-2020 研究趨勢(shì)總結(jié)

機(jī)器翻譯有所衰落

幾家歡樂(lè)幾家愁,由于上述領(lǐng)域的快速崛起,更重要的是由于模型逐漸為T(mén)ransformer所統(tǒng)一,使得機(jī)器翻譯這一“老牌”自然語(yǔ)言處理任務(wù)受關(guān)注的程度有所降低。今年ACL的相關(guān)研究也分散到不同的翻譯場(chǎng)景設(shè)置上。

車(chē)萬(wàn)翔教授:ACL 2010-2020 研究趨勢(shì)總結(jié)

句法分析逐漸式微

和機(jī)器翻譯類(lèi)似,句法分析這一曾經(jīng)自然語(yǔ)言處理領(lǐng)域的當(dāng)家任務(wù)也逐漸式微。其背后的原因有兩個(gè):一方面是因?yàn)锽iaffine Parser的出現(xiàn)證明了結(jié)構(gòu)學(xué)習(xí)這一自然語(yǔ)言處理的特色問(wèn)題,對(duì)于句法分析并不重要;另一方面,預(yù)訓(xùn)練模型的出現(xiàn)使得句法分析的處境更是雪上加霜。預(yù)訓(xùn)練模型不但能大幅提高句法分析的效果,更重要的是其內(nèi)部已經(jīng)蘊(yùn)含了句法結(jié)構(gòu)信息,因此就無(wú)需為下游任務(wù)提供顯式的句法結(jié)構(gòu)了。由于這些原因,今年ACL上句法分析的熱點(diǎn)也主要集中在了研究探針任務(wù)和句法分析的應(yīng)用上了。不過(guò)蘇州大學(xué)李正華老師所提出的高階TreeCRF模型還是能進(jìn)一步提升句法分析的效果,這一點(diǎn)非常難得。

車(chē)萬(wàn)翔教授:ACL 2010-2020 研究趨勢(shì)總結(jié)

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)