文/智物
”不要相信那種(基于海量數(shù)據(jù)的AI優(yōu)勢(shì))炒作!盠anding AI創(chuàng)始人、CEO,曾經(jīng)的谷歌大腦的創(chuàng)始人,百度首席科學(xué)家吳恩達(dá)簡(jiǎn)單明了地談到自己對(duì)下一步AI趨勢(shì)的看法。
他認(rèn)為,AI的下一步趨勢(shì)應(yīng)該是圍繞更小的數(shù)據(jù)集構(gòu)建算法。他舉的例子是,智能手機(jī)裝配線上的劃痕檢測(cè),不會(huì)有哪個(gè)工廠擁有上百萬(wàn)張的智能手機(jī)劃痕圖片數(shù)據(jù)。
他指的是之前的圖像識(shí)別機(jī)器學(xué)習(xí)算法,需要靠百萬(wàn)張圖片數(shù)據(jù),用以訓(xùn)練模型和系統(tǒng)。但是,現(xiàn)在的手機(jī)巨頭們應(yīng)該沒(méi)有哪個(gè)工廠,有這樣多的瑕疵產(chǎn)品的圖片。
除非是20年前的某家中國(guó)手機(jī)廠。
吳恩達(dá)認(rèn)為,AI在這些傳統(tǒng)行業(yè)中的價(jià)值將會(huì)比消費(fèi)互聯(lián)網(wǎng)中潛在的價(jià)值會(huì)更大。雖然,目前還處于一個(gè)比較初級(jí)的階段。
麥肯錫預(yù)測(cè),在醫(yī)療保健、制造業(yè)和農(nóng)業(yè)當(dāng)中,AI可以幫助實(shí)現(xiàn)13萬(wàn)億美金的附加價(jià)值。
但問(wèn)題在于,較小數(shù)據(jù)樣本意味著數(shù)據(jù)的質(zhì)量,比數(shù)據(jù)規(guī)模更重要。吳恩達(dá)指出,不同的人,即使是同一個(gè)工廠的兩個(gè)檢查員,記錄數(shù)據(jù)的方式也會(huì)完全不同,讓較小的數(shù)據(jù)集的采納面臨挑戰(zhàn)。
吳恩達(dá)關(guān)于Small Data的觀點(diǎn),此前在工業(yè)界和學(xué)術(shù)界已有討論!敦(cái)富》網(wǎng)站在評(píng)述的時(shí)候?qū)⑵渑c此前數(shù)據(jù)石油觀點(diǎn)對(duì)立,這一派觀點(diǎn)的代表人物是創(chuàng)新工場(chǎng)創(chuàng)始人李開(kāi)復(fù)。
李開(kāi)復(fù)曾稱(chēng),中國(guó)外賣(mài)訂購(gòu)的數(shù)量是美國(guó)的10倍,移動(dòng)支付的數(shù)量是美國(guó)的50倍,共享單車(chē)的使用是美國(guó)的300倍,這些數(shù)據(jù)可以成為新的商業(yè)引擎,從而幫助改善用戶(hù)體驗(yàn)。
據(jù)此,中國(guó)公司因?yàn)閾碛泻A康臄?shù)據(jù),而在AI時(shí)代擁有優(yōu)勢(shì)。李開(kāi)復(fù)的結(jié)論是,中國(guó)會(huì)成為數(shù)據(jù)時(shí)代的沙特!督(jīng)濟(jì)學(xué)人》也曾經(jīng)用一篇封面文章,來(lái)解釋數(shù)據(jù)作為新時(shí)代的石油的觀點(diǎn)。
李開(kāi)復(fù)這一觀點(diǎn)一個(gè)附帶的結(jié)論是,如今的互聯(lián)網(wǎng)數(shù)據(jù)牢牢把握在位數(shù)不多的幾家中、美巨頭手中,比如阿里巴巴、騰訊、Facebook、谷歌、蘋(píng)果等等。這也成為李開(kāi)復(fù)口中所謂的數(shù)據(jù)黑洞,這些公司在AI領(lǐng)域的巨大優(yōu)勢(shì),以及其他創(chuàng)始團(tuán)隊(duì)難以逾越的鴻溝。
吳恩達(dá)明確反對(duì)這一觀點(diǎn),他認(rèn)為,不應(yīng)該相信這一炒作,即使是沒(méi)有海量數(shù)據(jù)集,初創(chuàng)企業(yè)和大公司仍然有機(jī)會(huì)去推動(dòng)AI創(chuàng)新。龐大的數(shù)據(jù)集除了對(duì)互聯(lián)網(wǎng)公司有用之外,沒(méi)有太大的應(yīng)用空間。
“龐大的搜索數(shù)據(jù)、經(jīng)濟(jì)數(shù)據(jù)對(duì)于檢測(cè)時(shí)裝缺陷毫無(wú)用處,對(duì)于醫(yī)療記錄也沒(méi)有太大的幫助!