知識圖譜走出至暗時刻
世界擁有不計其數(shù)的實體,以人力已無法將實體和概念建立完整的聯(lián)系,而知識圖譜可以彌補這樣的空缺。
@數(shù)科星球 原創(chuàng)
作者丨科科 編輯丨十里香
人工智能行至半途,在各行各業(yè),AI的滲透與日俱增。作為人工智能的分支,知識圖譜可謂歷史已久。如今,新的應用場景被開發(fā),一幅技術革命的畫面已然呈現(xiàn)在世人面前。
01
沉默的技術高地
和大多數(shù)的AI技術一樣,知識圖譜也是一種交叉學科,其橫跨了包括知識工程、自然語言處理、機器學習、圖數(shù)據(jù)庫等在內的多個領域。
在構建知識圖譜的流程中,也要通過知識建模、關系抽取、圖存儲、自動推理、圖譜表示學習、語義搜索、智能問答、圖計算分析等一系列步驟才可得以完成。
在這個角度上,說知識圖譜是復雜的技術并不為過。
在這項技術的發(fā)展時間線上,數(shù)科星球(ID:digital-planet)看到,其有谷歌、百度等搜索引擎企業(yè)參與,再到后來,知識圖譜開始走出大企業(yè),開始在醫(yī)療、金融和安全等領域發(fā)揮作用,人們喜聞樂見的小度音箱和天貓精靈等產品更是新一代知識圖譜技術應用的集中體現(xiàn)。
由大型搜索引擎公司所構建的知識圖譜,正在賦能于垂直,其提供了更多的旨在表明實體和關系的語義信息,可以賦能用戶在不同場景下查詢。
如今,市面上仍然可以看到上一代知識圖譜產品的影子:比如出現(xiàn)在谷歌搜索結果信息流右側的知識卡片等等。
知識圖譜技術支撐起了互聯(lián)網發(fā)展的下一個高峰。機器人的聊天、企業(yè)服務行業(yè)的智能問答產品以及現(xiàn)在的搜索引擎中的智能推薦,都用到了知識圖譜功能。總的來說,知識圖譜正在走出通用的象牙塔,向著垂直領域發(fā)展。這種垂直不僅意味著垂直行業(yè),更意味著在決策、推薦和問答場景中的細分。
現(xiàn)在,在知識圖譜界已出現(xiàn)兩大技術方向——其一是數(shù)據(jù)互聯(lián)網,可以理解成基于網頁的產品形態(tài);其二是事物互聯(lián)網,其交互場景不以傳統(tǒng)互聯(lián)網形態(tài)存在,如在數(shù)科星球(ID:digital-planet)報道過的汽車后市場、高鐵等領域就以音頻等方式存在。
所以,未來知識圖譜的競爭將在人們看不見的語義網絡中展開。在巨型企業(yè)中,語義網絡的競爭已經成為常態(tài),其中谷歌有Freebase、IBM Waston有DBpedia和Yago、Amazon Alexa有True Knowledge,幾乎每個人都接觸過的蘋果Siri有Wolfram Alpha等等。
有了知識圖譜,大數(shù)據(jù)分析、語言理解就能更上一個臺階。在發(fā)現(xiàn)更多概念和事物之間的關系后,“隱藏”知識將被發(fā)現(xiàn),當然這其中少不了運用圖數(shù)據(jù)庫、自然語言處理、機器學習等多方面的技術。
在未來,知識圖譜技術將會增強機器學習的可解釋性,將在圖卷積輔助圖像分類等多個領域發(fā)揮出越來越重要的作用。數(shù)科星球(ID:digital-planet)將在其后的文章中一一解答知識圖譜所涉及的相關領域。
02
知識圖譜技術正在成為新變量
在人工智能發(fā)展早期,人們希望通過用計算機符號模擬人腦知識并推倒人類的心智,在神經網絡中,強調信息傳導,F(xiàn)在由于計算機算力和數(shù)據(jù)量的提升,人工智能的研究取得了長足進步。
在新的時代下,遙感影像、攝像頭、問卷調查、手機信令、GPS追蹤等領域以肉眼可見的速度成長。在這個過程中,所謂“多源異構數(shù)據(jù)”正在呈指數(shù)級爆發(fā)。
數(shù)據(jù)的來源更多了,數(shù)據(jù)的類型也不僅僅是上個時代喜聞樂見的表格等信息。在這樣的趨勢下,數(shù)據(jù)庫行業(yè)也在發(fā)生變革,基礎庫、主題庫甚至專題庫紛紛上線,以地理信息、IoT、軌跡數(shù)據(jù)為代表的時空數(shù)據(jù)正在得到大面積應用,AP、TP數(shù)據(jù)庫需求顯著分化。
對于企業(yè)來說,多源異構數(shù)據(jù)的處理難度變得越來越高。在制造業(yè)中,儀器的檢修、采購、運行數(shù)據(jù)以及產品的銷售、退回記錄和反饋都會遺留在各種各樣的終端之上。在這種情況下,與其將所有數(shù)據(jù)整理成一個整體,不如將數(shù)據(jù)之間建立關聯(lián),來改善運營現(xiàn)狀,而這就是知識圖譜更大的應用場景。
從信息的模糊到準確、從數(shù)據(jù)的失真到真實,構成了企業(yè)在提高效率方面的新閉環(huán),其中不可缺少的就是知識圖譜所帶來的諸多好處。
如今的知識圖譜產品甚至正在沖擊傳統(tǒng)ERP市場。在之前,人們已經習慣手動錄入數(shù)據(jù)到數(shù)據(jù)庫,再通過SQL查詢。現(xiàn)在,二維表可能被知識圖譜取代,割裂在不同領域的知識正在成為一個整體。
這種整體的知識也正在成為企業(yè)新的競爭力體現(xiàn):如在智能搜索、競品分析、反欺詐、論文查重和實時輿情分析中,知識圖譜都有用武之地。
一段時間后,隨著軟件廠商在圖數(shù)據(jù)模型、規(guī)則模型和算法模型的進一步積累,各行各業(yè)也將出現(xiàn)服務于不同行業(yè)的知識圖譜產品。至少,已經有不少公司正在這樣做。
03
知識圖譜的未來展望
客觀上,世界擁有不計其數(shù)的實體,以人力已無法將實體和概念建立完整的聯(lián)系,而知識圖譜可以彌補這樣的空缺。
目前知識圖譜行業(yè)還存在一些軟肋有待攻破:
其一,知識圖譜對所屬行業(yè)的業(yè)務了解不夠透徹,底層技術能力難以覆蓋完整的生產流程;
其二,一些知識圖譜公司將太多精力投入在可視化展示之中,而在場景的深度挖掘以及數(shù)據(jù)積累上還有待提高;
其三,是行業(yè)人才匱乏,技術難以趕上業(yè)務需求的增長。
在不足的另一側,是行業(yè)的迅速增長。艾瑞的咨詢報告顯示,2021年,知識圖譜核心市場規(guī)模預計達到107億元,而到2026年,相應規(guī)模將超過296億元,2021-2026年CA?GR=22.5%。知識圖譜成為20%以上增長的行業(yè)之一,高速的增長理應引起廣大投資者們的重視。
目前,金融和公安行業(yè)已成為知識圖譜行業(yè)應用最快的垂直行業(yè)。在上述兩個行業(yè)中,企業(yè)的投入不遺余力,成為了知識圖譜行業(yè)增長的不可忽視的動力。在未來,政務+知識圖譜的市場將被喚醒,一些行業(yè)專家認為,政務的需求同樣不可忽視。
目前,知識圖譜的國家標準正在積極籌備中,一些知名企業(yè)也在其中起到了重要作用。以達觀數(shù)據(jù)為例,其產品已廣泛應用于汽車工業(yè)、軍事裝備、核工業(yè)、電力電網、能源、消費電子、通信、集成電路、船舶制造、材料、航空航天、制藥、醫(yī)療設備、機械裝備、礦業(yè)、鋰電等領。
回顧知識圖譜的發(fā)展歷史,人們會驚訝于該領域的崛起速度。早期,ConceptNet 5.0也僅包含2800萬個RDF三元組關系描述,而現(xiàn)在,這樣的數(shù)據(jù)已超千億級別。
*數(shù)科星球(ID:digital-planet)出品
原文標題 : 知識圖譜走出至暗時刻

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?