忌憚百度AI技術(shù)?美國要讓其退市!AI領(lǐng)域,百度科研板凳有厚度!
07詞匯聯(lián)想功能
對特定詞語,進行詞語的聯(lián)想。
比如對于“陰森”,能聯(lián)想到“走廊”,“森林”,“古堡”等名詞。
對于“太陽”,推薦“圓盤,金鑼,火爐,火球“等可以用來比喻的詞匯,用戶可以借助此功能來激發(fā)寫作靈感,或者據(jù)此寫一些比喻句。本功能在寫比喻句的時候尤其有幫助。
技術(shù)實現(xiàn)上,可以預先從大規(guī)模數(shù)據(jù)中自動挖掘出聯(lián)想詞表,聯(lián)想詞表中記錄詞與聯(lián)想的詞之間的對應關(guān)系,因此,根據(jù)聯(lián)想詞典可以確定出一個給定詞語對應的聯(lián)想詞匯。
具體挖掘聯(lián)想詞表時,可以根據(jù)預設(shè)模板(如規(guī)定預設(shè)句式,如“就像…”)從名家名篇語料庫中挖掘出形容詞到名詞以及名詞到名詞的聯(lián)想詞表,也可以通過詞語搭配(可以限定詞性)統(tǒng)計從大規(guī)模數(shù)據(jù)中自動挖掘獲得。
進一步的,在抽出聯(lián)想詞表的同時也可以抽取模板,再通過新的模板挖掘新的聯(lián)想詞,不斷迭代。
08靈感激發(fā)功能
在用戶寫作原文后,用人工智能相關(guān)技術(shù)在名家名作中精準地找到可供用戶參考的句子或段落,從而激發(fā)用戶靈感,提供修改的參考樣例,同時讓用戶通過學習名作來加強寫作水平。
簡單說,給寫手提供名家名言名句抄襲對象!
你寫的粗俗不堪,上不了臺面,沒關(guān)系,給你經(jīng)典造句對著抄。
技術(shù)實現(xiàn)上,可以從預先建立的文章庫中,選擇與寫作原文整體粒度匹配的切分文本單元中,作為候選文本;基于人工智能計算寫作原文與每個候選文本的相似度,根據(jù)相似度選擇預設(shè)個數(shù)的候選文本作為靈感激發(fā)信息。
具體的,首先建立一個高質(zhì)量的名家名作文章的庫,然后進行切分,切分分別按照句子,自然段落和多段落三個不同粒度進行切分,最后形成句子,自然段落,多段落三種切分文本單元。
其次,在用戶輸入寫作原文后,以寫作原文整體與文章庫中的切分文本單元進行比較,得到粒度匹配的切分文本單元作為候選文本。粒度匹配是指長度最相近的切分文本單元。
例如,寫作原文是句子時,則將文章庫中的句子作為候選文本;或者,寫作原文是段落時,將文章庫中的段落作為候選文本;或者,寫作原文是多段落時,將文章庫中的多段落作為候選文本。
再次,計算寫作原文與每個候選文本的相似度,根據(jù)相似度選擇預設(shè)個數(shù)的候選文本作為靈感激發(fā)信息。
計算寫作原本與候選文本的相似度時,可以根據(jù)應用效果采用已有或?qū)沓霈F(xiàn)的計算相似度的方案中的一種或幾種的融合。
其中一種計算相似度的方案是:抽取出用戶輸入的寫作原文中的關(guān)鍵實體詞(實體詞如命名實體,具體如地名、人名等)(或關(guān)鍵詞)以及主題詞(抽象出的原文主題,如體育、娛樂等)。如果用戶輸入的是長文本(如字數(shù)大于或等于預設(shè)字數(shù)),則使用主題模型和關(guān)鍵實體詞(或關(guān)鍵詞)兩個維度來計算候選文本與輸入文本的相似度。如果用戶輸入的是短文本(如字數(shù)小于預設(shè)字數(shù)),則可以使用GRNN或者CNN深度學習網(wǎng)絡(luò)加上關(guān)鍵實體詞(或關(guān)鍵詞)兩個維度來計算候選文本與輸入文本的相似度,最后根據(jù)相似度進行召回和排序,呈現(xiàn)給用戶。
09智能素材推薦功能
深度分析和理解用戶提供的寫作原文,為用戶推薦相關(guān)主題的寫作素材(如新聞,歷史故事),用戶也可以自己選擇想要的素材類型,比如新聞,歷史故事等(在圖片中沒有體現(xiàn))。此功能在議論文寫作中非常實用。
技術(shù)實現(xiàn)上,基于人工智能抽取寫作原文的主題詞,并根據(jù)主題詞從預先建立的素材庫中,選擇主題相近的素材作為候選素材;根據(jù)主題模型計算寫作原文與每個候選素材的相似度,根據(jù)相似度選擇預設(shè)個數(shù)的候選素材作為智能推薦信息。
具體的,首先從公開的網(wǎng)頁數(shù)據(jù)中抓取優(yōu)質(zhì)的新聞,人文歷史故事等候選素材,然后用摘要技術(shù)和文檔標簽技術(shù)分別對抓取的語料進行處理,生成相應摘要和文檔標簽。
抽取出用戶輸入文本中的主題詞,然后與語料的標簽進行比對,召回一批候選的相近主題的素材,然后再使用主題模型計算用戶輸入與摘要的相似度,對候選的素材進行排序,將相似較高的呈現(xiàn)的素材的摘要呈現(xiàn)給用戶,用戶可以進一步通過點擊來查看素材原文。
可以通過搜集用戶的點擊信息,作為素材質(zhì)量水平的參考,并加入召回和排序的規(guī)則中去,不斷演進產(chǎn)品的效果。
10智能基礎(chǔ)改寫功能
具體的,在用戶輸入寫作原文后,在保證語義不變的情況下自動替換詞語,修改句子的樣式,改變語句語序等。如果用戶在某種情況下希望借鑒某一段文字,但不能原封不動地直接使用,就可以通過本功能進行自動地改寫。
技術(shù)實現(xiàn)上,可以采用兩種方案,其一是:基于人工智能,對寫作原文執(zhí)行如下項中的至少一項,得到寫作輔助信息:詞語替換、句子改寫、語序調(diào)整。其二是:采用基于人工智能建立的LSTM模型,確定與寫作原文對應的智能基礎(chǔ)改寫信息。
具體的,本功能可以有兩種方案進行實現(xiàn):第一種是將改寫任務分解成詞語替換,句子改寫和語序調(diào)整三個部分。詞語替換直接使用詞語替換推薦功能的技術(shù)方案(存在多個推薦詞語時選擇最優(yōu)的),句子改寫和語序調(diào)整可以使用規(guī)則模板,用語言模型進行過濾,去除低概率的改寫方案。
另外需要加入一定的隨機性,讓用戶每次點擊可以生成不一樣的改寫。第二種方案是使用LSTM(Long Short-Term Memory)深度神經(jīng)網(wǎng)絡(luò)通過學習人工標注的復述語料直接對句子進行序列到序列的生成。
11智能潤色改寫功能
具體的,在原有文章基礎(chǔ)上進行修改潤色,讓文章更有文采,更具文學性和可讀性。比如替換一些更“高級”的詞匯,增加一些形容詞和短句等。
技術(shù)實現(xiàn)上,基于人工智能對所述寫作原文進行詞語替換、句子改寫以及增加短語或短句,得到智能潤色改寫信息。
具體的,本功能主要可以分解為三個部分:詞語的替換,句子的改寫,以及增加詞語或短句。詞語的替換沿用詞語替換推薦功能的技術(shù)方案,使用最優(yōu)的替換結(jié)果。句子的改寫有兩種方案,方案一是人工配置一些潤色的規(guī)則,方案二是人工標注一些潤色的訓練語料,用RNN或者LSTM神經(jīng)網(wǎng)絡(luò)來進行學習。增加詞或短句(比喻,描寫等)可以通過一定的模板挖掘從大數(shù)據(jù)語料中挖掘出實體或者主題對應的描寫詞和描寫短句,并同時記錄下短句周圍的關(guān)鍵詞。
每次對輸入文本的句子作解析,用CRF模型或者句法分析規(guī)則找出句子的核心主體詞,然后根據(jù)周圍關(guān)鍵詞的匹配,添加合適的描寫詞或描寫短句。
本實施例中,由于加入了人工智能,特別是自然語言理解技術(shù),功能更豐富更強大,更加智能。用戶可以直接輸入自己的寫作原文,利用多項功能對自己的文章進行改進。
原文標題 : 忌憚百度AI技術(shù)?美國要讓其退市!AI領(lǐng)域,百度科研板凳有厚度!

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風翻身?