達觀數(shù)據(jù)孫亞彬:如何做好非結構化數(shù)據(jù)文本智能審閱市場
雖然是創(chuàng)業(yè)型公司,但因為在盛大、騰訊等知名科技公司所做的深厚積累,達觀數(shù)據(jù)備受市場青睞。目前,公司的主營業(yè)務立足于非結構化數(shù)據(jù)處理中的文本處理。2017年,公司營收同比增長3-4倍,達到盈虧平衡。作為數(shù)據(jù)界的“復旦系”,達觀數(shù)據(jù)是如何立足于數(shù)據(jù)市場的
致力于非結構化數(shù)據(jù)文本智能審閱市場
“雖然是一家創(chuàng)業(yè)型的公司,但實際上在專業(yè)領域達觀數(shù)據(jù)已經(jīng)有了深厚積累。我們創(chuàng)始人陳運文博士,最早是在盛大文學,包括全國百分之七八十的小說文學網(wǎng)站數(shù)據(jù)的體系搭建都是由陳博團隊所領導的,這也成為騰訊文學的前身。后來,陳博帶領著這個團隊一同創(chuàng)辦了達觀數(shù)據(jù)。所以,雖然是創(chuàng)業(yè)型公司,我們在專業(yè)的挖掘上還是有深厚的積累。”對于達觀數(shù)據(jù)的創(chuàng)立背景,公司市場總監(jiān)孫亞彬如是表示。
目前,達觀數(shù)據(jù)的業(yè)務主要立足于非結構化的文本數(shù)據(jù)處理。對于何謂非結構化文本,孫亞彬解釋說:“我們通常所理解的數(shù)據(jù)分析公司,大部分是處理結構化的數(shù)據(jù)。但事實上還有大量的,占到總量60%以上的非結構化數(shù)據(jù),文本是非結構化數(shù)據(jù)中的一種,因為目前市場上大部分產(chǎn)品的處理能力還比較弱,所以還沒能把它很好的挖掘出來!
其舉例說,在銀行的信貸部門,當有很多消費者申請借款,無論是提交的申請報告,還是銀行簽訂的合同,都需要進行大量的審計。用人工進行審核會耗費大量的時間和精力,而且因為人的精力有限,工作效率的降低,讓審計的準確率也隨之降低。但對于基于數(shù)據(jù)處理的機器來說,就可以避免這樣的問題,機器的效率會快很多,準確率也可以達到更高的水平。在達觀為國內知名保險公司提供的財務審閱系統(tǒng)中,財務信息提取準確率達高到98%。
“所以,我們提供的系統(tǒng)就是代替人做機械化和重復性的工作。機器可以自動閱讀文檔內容,閱讀合同,我們把關鍵核心信息進行提取,把可能存在的錯誤內容標識出來,這樣審核人員就不需要檢查整個文檔,只要看標注出來的可能存在的錯誤信息便可,大大減少了人員的處理時間,也提升了整個的工作流程效率!
基于以上業(yè)務,達觀數(shù)據(jù)的文檔智能審閱系統(tǒng)可協(xié)助金融、制造、通信、法律、審計、媒體、政府多個行業(yè)的文字密集企業(yè)完成文檔審閱工作。

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?