文丨光錐智能 周文斌
ChatGPT席卷全球,在中國疊加出了一個更強沖擊波。
如今,從市值千億的互聯(lián)網(wǎng)企業(yè)高管,到路邊賣菜的大爺大媽,大家都樂此不疲的在談?wù)揅hatGPT,比如事前讓它幫忙“算一卦”,或者聊聊誰將被優(yōu)先替代。用網(wǎng)友的話說,ChatGPT出現(xiàn)之后,就像村里來了個免費算命的。
當然,要說通用人工智能取代大部分人類的工作那肯定還比較遙遠,但它仍然在科技圈扔下了一枚原子彈。
在二級市場,包括百度、網(wǎng)易有道、360等幾乎所有和ChatGPT沾上邊的企業(yè),股價都在近期拔地而起。而在股價高漲的背后,企業(yè)也都在試圖搭上ChatGPT這輛快車。
2月7日開始,百度率先宣布了自家類ChatGPT產(chǎn)品的名字,之后網(wǎng)易有道宣布在教育場景研發(fā)類ChatGPT技術(shù),阿里、騰訊、京東也都紛紛表態(tài)。
但從全球范圍來看,ChatGPT這顆原子彈還是率先在搜索引擎領(lǐng)域炸開。
比如微軟拿到ChatGPT之后的第一件事,就是將其和搜索引擎Bing結(jié)合,并且已經(jīng)在近期展開內(nèi)測;谷歌也聞訊而動,倉促發(fā)布Bard,并也表示要在搜索領(lǐng)域落地。在國內(nèi),百度文心一言發(fā)布后,CEO李彥宏今年一季度的OKR也被媒體扒了出來,寫著要“引領(lǐng)搜索體驗的代際變革”。
除了搜索之外,ChatGPT的應(yīng)用也在向其他領(lǐng)域延伸,比如微軟計劃將其接入包括云業(yè)務(wù)在內(nèi)的所有產(chǎn)品線。百度文心一言發(fā)布后,小度隨后發(fā)布了首款搭載ChatGPT同源技術(shù)的平板產(chǎn)品。除此之外,以ChatGPT為代表的大模型在自動駕駛、翻譯、文本撰寫等方面也都有落地。
顯而易見,AI將會逐漸波及到幾乎整個信息技術(shù)行業(yè)——讓所有的業(yè)務(wù)用AI重新做一遍。
而在中國,百度是第一家公布類ChatGPT的公司,也是最大的搜索引擎公司。那么,在All in AI之后的第六年,ChatGPT來了,百度將會發(fā)生哪些變化?機遇和挑戰(zhàn),哪個對百度更多一些?
01 誰能率先做出中國ChatGPT ?
2月7日,百度公布了自家類ChatGPT的產(chǎn)品名稱文心一言,成為ChatGPT席卷全球之后第一家跟進相關(guān)產(chǎn)品的國內(nèi)企業(yè)。從這往后,網(wǎng)易有道、京東、阿里、騰訊紛紛表態(tài),相關(guān)計劃已提上日程。做一款類似ChatGPT的產(chǎn)品,成為當前許多企業(yè)最緊迫的一件事情。
不過,雖然現(xiàn)在投入類ChatGPT研發(fā)的企業(yè)如過江之鯽,但也有業(yè)內(nèi)人士指出,大多數(shù)做同類產(chǎn)品的企業(yè)只是在原有的產(chǎn)品里加入了一個BOT,因為并不是每家公司都具備自己建語料庫和特征工程的能力,畢竟做這件事情不僅花錢多,而且效果還不一定好。
所以這里面其實就涉及到一個問題,即做一個類ChatGPT產(chǎn)品到底需要具備哪些底層能力。
比如ChatGPT基于GPT-3.5這個大語言模型訓(xùn)練,使用了約45TB數(shù)據(jù),包含約1萬億個單詞的文本內(nèi)容。這些數(shù)據(jù)顯然不是從網(wǎng)上爬取下來就能用,有做模型訓(xùn)練的工程師就提到,他們之前訓(xùn)練模型時使用了某社交平臺的數(shù)據(jù),導(dǎo)致該模型“除了罵人什么都不會”。
所以對于模型訓(xùn)練來說,高質(zhì)量且大規(guī)模的數(shù)據(jù)來源本身就是一個問題,而要訓(xùn)練如此大規(guī)模的數(shù)據(jù)也太燒錢,有數(shù)據(jù)顯示,GPT-3訓(xùn)練的硬件和電力成本就達到1200萬美元。
這其實也是為什么OpenAI和Anthropic會分別接受微軟和谷歌投資的原因。除了背靠大樹好乘涼之外(給到充足的資金和落地場景),微軟、谷歌都分別和OpenAI、Anthropic簽訂了大型的云計算供應(yīng)合同。就像周鴻祎說的:“這個東西最終還是要拼算力的!
除了算力的支持,ChatGPT的訓(xùn)練需要引入“人工標注數(shù)據(jù)+強化學(xué)習(xí)”來不斷Fine-tune(微調(diào))預(yù)訓(xùn)練語言模型,以此來讓大語言模型(LLM)學(xué)會理解人類的命令指令的含義,以及讓LLM學(xué)會判斷對于給定的prompt輸入指令(用戶的問題),給出什么樣的回答才是優(yōu)質(zhì)的。
整體上,這都反映了ChatGPT背后,對于大語言模型、數(shù)據(jù)來源、特征工程等更具體的工程性的問題。所以就像張朝陽在節(jié)目《星空下的對話》中一直堅持的那樣,ChatGPT的產(chǎn)生,是從量變到質(zhì)變,它積累了很多年,絕對不是一個新企業(yè)進去就能做好的技術(shù)。
那什么樣的企業(yè)更適合做中國的ChatGPT呢?周鴻祎的答案是有搜索業(yè)務(wù)的公司,他認為做搜索的公司在這方面有許多優(yōu)勢。
比如在算力方面,做搜索的公司都有服務(wù)器集群。在數(shù)據(jù)積累和自然語言處理方面,搜索引擎本身需要每天在全網(wǎng)爬取所有的網(wǎng)頁,而人類真正積累的知識庫就存在在這些網(wǎng)頁里;同時搜索本身就需要做大量的自然語言處理,和人類知識標注,這些都是GPT模型必備的基礎(chǔ)。
“GPT模型做出來之后,它實際上像剛具備學(xué)習(xí)能力的小朋友一樣,并不會馬上表現(xiàn)出很強悍的智能,它需要用戶不斷的使用,而搜索引擎每天有巨大的用戶流量,有用戶每天的carry,有搜索詞可以對它進行修正和持續(xù)不斷的訓(xùn)練,這個飛輪才能不斷的越轉(zhuǎn)越快!敝茗櫟t提到。
而回過頭來,從搜索業(yè)務(wù)的角度來看,國內(nèi)做ChatGPT最有優(yōu)勢的自然是百度,作為看家本領(lǐng),百度搜索坐擁千億級全網(wǎng)索引,覆蓋超50億實體的中文知識圖譜。
此外,從2017年百度宣布All in AI到今天的6年多里,百度還建立了全棧AI技術(shù)構(gòu)架,百度將這樣的技術(shù)構(gòu)架分為四層,分別是芯片層、框架層、模型層和應(yīng)用層。
比如在底層算力層面,百度在2020年發(fā)布了第一塊專注于數(shù)據(jù)中心和云計算業(yè)務(wù)的量產(chǎn)AI芯片昆侖芯1代。目前,昆侖芯已經(jīng)量產(chǎn)了兩代,并達到數(shù)萬片規(guī)模部署。
比如在框架層,百度飛槳深度學(xué)習(xí)平臺集深度學(xué)習(xí)核心框架、基礎(chǔ)模型庫、端到端開發(fā)套件和豐富的工具組件于一體,到2022年5月,飛槳官方支持的產(chǎn)業(yè)級開源算法模型超過500個,發(fā)布了23個PP系列模型。到2022年12月,飛槳已匯聚 535 萬開發(fā)者。
而基于飛槳深度學(xué)習(xí)平臺,百度訓(xùn)練了文心大模型。在去年AI繪畫火熱的時候,百度基于文心大模型推出了AI繪畫平臺文心一格。
到2022年11月,文心已累計發(fā)布11個行業(yè)大模型,涵蓋電力、燃氣、金融、航天、傳媒、城市、影視、制造、社科等領(lǐng)域,推動行業(yè)的智能化轉(zhuǎn)型升級,這也讓百度在大模型的應(yīng)用上積累了豐富的經(jīng)驗。
整體上,從算力到應(yīng)用,百度在各個層面都有關(guān)鍵的自研技術(shù),這其實也是為什么百度能在ChatGPT上線僅僅兩個月后,就能迅速宣布推出自家的類ChatGPT大模型,并給出具體上線日期的原因。
有業(yè)內(nèi)頂尖的NLP專家對光錐智能表示,認為百度的NLP能力在中國是最好的,但真正做出像ChatGPT同等水平的產(chǎn)品,可能至少還需要一年。不過百度已經(jīng)確認,文心一言“3月和大家正式見面”。
02 搜索對百度不只是防御戰(zhàn),更是一場攻堅戰(zhàn)
正如最適合做“ChatGPT”的是搜索公司一樣,ChatGPT落地的第一戰(zhàn)也將從搜索展開。
比如微軟在“拿到”ChatGPT之后,第一件事就是將其與Bing搜索相結(jié)合,緊跟著谷歌也表示將推出類似的模型,并以“搜索伴侶”的形式使用。
在國內(nèi),百度發(fā)布文心一言的第二天,有媒體就扒出來了李彥宏2023年第一季度的OKR—“引領(lǐng)搜索體驗的代際變革”。搜索,這個互聯(lián)網(wǎng)1.0時代的業(yè)務(wù)在人工智能時代被ChatGPT再次推到了風(fēng)口浪尖上。
作為第一家將搜索和ChatGPT結(jié)合的企業(yè),微軟目前已經(jīng)開放融合了ChatGPT的Bing的全球內(nèi)測。
新版本的Bing沒有搜索欄,取而代之的是一個寫著“向我提問吧”的對話框,用戶可以在其中輸入問題并展開對話。
和傳統(tǒng)搜索只能通過關(guān)鍵詞給出結(jié)果展示,然后由用戶自己在海量信息中篩查有效內(nèi)容不同,升級后的Bing可以幫助用戶完成這個信息篩選和內(nèi)容整理過程。
比如根據(jù)微軟發(fā)布會上的展示,用戶可以讓新版Bing編寫一份為期五天的墨西哥城旅行行程單并且轉(zhuǎn)化成一封電子郵件,隨后發(fā)送給他的家人。除此之外,在Bing給出的示例中,還涉及到包括做計劃安排、寫詩和創(chuàng)作故事、制定菜單、提供買車建議等等生活的方方面面。
如果說上一代搜索引擎搜索的是信息,那升級后的搜索引擎搜索的就是知識,并且可以通過這種方式,成為用戶的“全職助手”。
事實上,隨著移動互聯(lián)網(wǎng)的發(fā)展越來越成熟,搜索作為PC互聯(lián)網(wǎng)時代的產(chǎn)品一直都面臨著許多挑戰(zhàn)。
比如移動APP將互聯(lián)網(wǎng)的信息割裂成一個又一個孤島,在這樣的背景下,搜索變得越來越場景化,搜索需求也在被不斷分化。比如越來越多年輕人將小紅書作為搜索的第一選擇,同時微信、今日頭條、知乎、B站都有自己的獨特的信息和展現(xiàn)形式。
而隨著搜索的場景和需求被逐步解構(gòu),這塊業(yè)務(wù)放在公司整體估值上也通常會被低估。而目前,無論是百度還是谷歌,搜索業(yè)務(wù)在營收中的占比都在60%左右,這其實也直接影響了百度和谷歌的估值。
但新一代產(chǎn)品的升級,再次讓市場對搜索引擎可以應(yīng)用的場景有了更多期待,估值也自然水漲船高。一個最直接的表現(xiàn)是,在宣布自己類ChatGPT產(chǎn)品文心一言的名字之后,百度股價當時就上漲的超13%。
圖:近3個月百度股價走勢
如今,隨著ChatGPT對傳統(tǒng)搜索能力的提升,“搜索”這個產(chǎn)品的定義也將被改寫,所以這不僅對百度來說是一場“老樹煥新”的機會,對于只在全球搜索市場占比2.46%的微軟必應(yīng)也是難得的一次開疆擴土的機會。
所以說,推出中國版ChatGPT,然后接入搜索,對于百度來說不只是一場防御戰(zhàn),更是一場攻堅戰(zhàn)。
03 用AI將傳統(tǒng)業(yè)務(wù)再做一遍
除了百度、微軟和谷歌之外,AI對企業(yè)的影響也越來越大。
1月27日,美版頭條BuzzFeed宣布使用ChatGPT來創(chuàng)作之后,股價在兩天里暴漲了306.94%。2月8日,網(wǎng)易有道宣布投入到ChatGPT同源技術(shù)在教育場景的落地研發(fā),當前股價盤前漲超20%。
類似的例子還有很多,最近只要有公司宣布正在研發(fā)類ChatGPT的產(chǎn)品,無論是否有實際進展,股市都會先漲為敬。
雖然這種現(xiàn)象背后有炒作和跟風(fēng)的因素,但這其實也宣告了一種潛在的變化,即二級市場的投資者對企業(yè)估值邏輯的改變。
在互聯(lián)網(wǎng)行業(yè)的估值邏輯里,我們通常更關(guān)注營收、用戶規(guī)模、MAU等數(shù)據(jù)及其增速,但如今投資者更關(guān)心一家企業(yè)是否具備下一代技術(shù)能力。
而在這個時代,AI已經(jīng)被當成底層技術(shù),被認為是今后推動企業(yè)發(fā)展的重要底層驅(qū)動力。
而具體到百度、微軟或者谷歌這樣的企業(yè)來說,ChatGPT要改變的顯然不只是搜索,而是所有的業(yè)務(wù)線。
以百度為例,在云業(yè)務(wù)上,百度一直強調(diào)智能云的標簽,其特點它能夠?qū)I的能力賦能到具體的場景中,比如實現(xiàn)某些具體場景的數(shù)據(jù)識別、清洗、分類的自動化等等,并以此來提高效率。
如果百度智能云與百度文心一言結(jié)合,那使用百度智能云的企業(yè)就可以直接調(diào)用文心一言的能力來解決自己場景里的具體問題。
這其實也是微軟為什么需要將ChatGPT接入它的Azure云服務(wù)中的原因。所以這其實代表一種趨勢,即在未來的云業(yè)務(wù)中,競爭將越來越聚焦智能,而不只是存儲帶寬和算力。
從最新的財報數(shù)據(jù)來看,百度2022年三季度核心收入為人民幣252億元,同比增長2%。其中,廣告收入為人民幣187億元,相比第二季度增長10%;非廣告收入為人民幣65億元,同比增長25%,主要受百度智能云及其他AI驅(qū)動業(yè)務(wù)的推動。而隨著文心一言接入百度智能云,顯然這樣的驅(qū)動力還將持續(xù)增長。
除此之外,大模型也已經(jīng)成為自動駕駛能力提升的核心驅(qū)動力。
比如通過10億以上參數(shù)規(guī)模的大模型訓(xùn)練小模型,能夠顯著提高自動駕駛的感知泛化能力。這種技術(shù)諸如特斯拉、毫末等自動駕駛企業(yè)都在應(yīng)用。
具體到百度而言,百度自動駕駛基于文心大模型數(shù)千種物體識別能力訓(xùn)練的圖文弱監(jiān)督預(yù)訓(xùn)練模型,能夠大幅擴充自動駕駛語義識別數(shù)據(jù),如特殊車輛(消防車、救護車)識別、塑料袋等,自動駕駛長尾問題解決效率指數(shù)級提升。
截至2022年第三季度末,百度Apollo自動駕駛出行服務(wù)平臺“蘿卜快跑”向公眾提供的乘車次數(shù)已累計達到140萬,是全世界最大的自動駕駛出行服務(wù)商。而隨著文心一言在百度自動駕駛方面的應(yīng)用,或?qū)⒓铀偻七M百度自動駕駛的落地和服務(wù)的增長。
除了智能云和駕駛業(yè)務(wù)外,百度的一些創(chuàng)新業(yè)務(wù)也將受到類ChatGPT產(chǎn)品的影響。
比如小度智能音箱,根據(jù)RUNTO1月份發(fā)布的2022年中國智能音箱市場調(diào)研報告數(shù)據(jù),2022年中國智能音箱綜合全年銷量僅2631萬臺,同比下降達 28%。
對于智能音箱,許多購買過的用戶都表示更像一個雞肋,所謂的智能更像是一個“智障”。而且相比于其他電子產(chǎn)品,當前不同品牌之間的智能音箱功能基本雷同,也沒有太多革命式的創(chuàng)新可以刺激消費者換代。
而類ChatGPT應(yīng)用出來之后,與智能音箱結(jié)合必然會變得更加智能,而有作為私人秘書一樣的ChatGPT作為樣例,智能音箱必然也將打開更多剛性的需求場景。
比如百度旗下的小度音箱在2月8日就已經(jīng)宣布推出旗下首款搭載ChatGPT同源技術(shù)的教育硬件產(chǎn)品—小度光學(xué)護眼學(xué)習(xí)平板。使用這款新的產(chǎn)品用戶可以體驗作文批改和主動潤色等AI功能。
據(jù)了解,用戶在該產(chǎn)品上已經(jīng)可以體驗作文批改和主動潤色等AI功能,更多基于ChatGPT同源技術(shù)的功能和體驗后續(xù)將在該產(chǎn)品陸續(xù)上線。
就像小冰公司CEO李笛所言,對于科技企業(yè)來說,它的商業(yè)格局由它的技術(shù)創(chuàng)新所代表,這在全球范圍內(nèi)都一樣。大模型的出現(xiàn)打破了之前已經(jīng)進入瓶頸的商業(yè)格局,大模型代表一種新的思想,如果你使用,就有可能抓住未來幾年集中的創(chuàng)新,如果不使用,你就可能在這個新的時代落后了。
如今,行業(yè)結(jié)合ChatGPT已經(jīng)成為一種趨勢,比如有廣告公司已經(jīng)開始使用ChatGPT撰寫營銷文案,有新聞網(wǎng)站開始使用ChatGPT編寫新聞等等。
比如2月14日,包括澎湃新聞、每日經(jīng)濟新聞、重慶日報報業(yè)集團在內(nèi)的7家傳媒巨頭同時宣布將全面體驗并接入文心一言的能力。
作為文心一言首批生態(tài)合作伙伴,這些媒體或能借助AI的能力,在智慧內(nèi)容、數(shù)字文傳、產(chǎn)教融合、智能營銷等方面實現(xiàn)產(chǎn)品和內(nèi)容創(chuàng)新,并帶來顛覆式變化。而顯然,未來這樣的生態(tài)還將擴展到更多的行業(yè)。
就像20年前互聯(lián)網(wǎng)可以將傳統(tǒng)行業(yè)重做一遍一樣,未來AI也將重塑目前大多數(shù)行業(yè),這個過程中,許多商業(yè)價值也將得到挖掘。而當AI的潛力在具體的業(yè)務(wù)上得到發(fā)掘,如百度、微軟、谷歌等企業(yè)價值也將面臨重估。
市值排行榜或?qū)⒚媾R一次新的洗牌也猶未可知。