百度文心一言體驗(yàn):不夠完美,但在ChatGPT面前已展現(xiàn)威力
在等待了一個(gè)多月后,百度的文心一言終于正式發(fā)布,只是對(duì)于百度來(lái)說(shuō)整個(gè)發(fā)布會(huì)過(guò)程多少有點(diǎn)“煎熬”,現(xiàn)場(chǎng)沒(méi)有進(jìn)行實(shí)機(jī)測(cè)試,而是用一段視頻來(lái)展示文心一言的功能。
百度似乎對(duì)文心一言的表現(xiàn)有些忐忑,甚至從李彥宏的演講過(guò)程來(lái)看,這位中國(guó)互聯(lián)網(wǎng)的傳奇人物,竟然有點(diǎn)緊張。對(duì)于百度來(lái)說(shuō),文心一言的重要性不言而喻,甚至有人將其看做是中國(guó)互聯(lián)網(wǎng)對(duì)抗ChatGPT的唯一希望,而在過(guò)去的一個(gè)月里,已經(jīng)有眾多企業(yè)宣布與文心一言合作,進(jìn)軍未來(lái)的人工智能行業(yè)。
氣氛烘托到這個(gè)程度,文心一言的具體表現(xiàn)將會(huì)直接影響投資者以及用戶對(duì)百度的信心。
圖源:文心一言發(fā)布會(huì)
果不其然,從發(fā)布會(huì)上用視頻代替實(shí)機(jī)演示的時(shí)間點(diǎn)開(kāi)始,百度的股價(jià)就開(kāi)始暴跌,僅10分鐘的跌幅就達(dá)到10%,240億元的市值就此蒸發(fā),換算一下,每過(guò)一秒百度就損失四千萬(wàn)元市值。
不過(guò),就像過(guò)去很多大企業(yè)在發(fā)布新品時(shí)的遭遇一樣,百度的股價(jià)同樣坐上了“過(guò)山車(chē)”,16日暴跌,17號(hào)暴漲,百度的股價(jià)甚至高于16號(hào)的最高值。
百度的市值忽起忽落,不知道李彥宏的心情是否也一樣跟著上下顛簸。不過(guò),至少在發(fā)布會(huì)現(xiàn)場(chǎng),李彥宏也承認(rèn),現(xiàn)如今的文心一言還有很多不完美的地方,但是未來(lái)將會(huì)變得更好,用一句網(wǎng)友熟悉的話來(lái)形容:未來(lái)可期。
文心一言的表現(xiàn)到底如何?
文心一言,會(huì)畫(huà)畫(huà)?
在正式發(fā)布前,百度就已經(jīng)對(duì)外宣傳文心一言除了可以提供類(lèi)似于ChatGPT的對(duì)話問(wèn)答功能外,還支持生成圖片、視頻等功能。不過(guò)在測(cè)試中,內(nèi)測(cè)版的文心一言似乎并不能提供視頻生成功能,而是直接生成了一段文字。
雖然答非所問(wèn),但是從文字描述來(lái)看,對(duì)應(yīng)的視頻畫(huà)面倒也是符合我的要求。
對(duì)此,李彥宏其實(shí)也給出了解釋,視頻功能未上線主要是因?yàn)閷?duì)資源的消耗過(guò)大,考慮到整體用戶體驗(yàn)所以在內(nèi)測(cè)版中沒(méi)有推出。
視頻功能不行,那么繪畫(huà)呢?
我嘗試用不同的描述來(lái)讓文心一言生成不同的照片和畫(huà)作,不得不說(shuō)結(jié)果確實(shí)出乎我的預(yù)料。
這是生成的第一張照片,草原、太陽(yáng),基本上符合我的要求,只是太陽(yáng)似乎少了一個(gè)。
以畢加索的風(fēng)格生成一幅油畫(huà)呢?
我想文心一言恐怕對(duì)畢加索風(fēng)格有“億”點(diǎn)誤解。
試試梵高風(fēng)格?
居然比畢加索的好多了,文心一言難道是個(gè)梵高粉絲?
再來(lái)看看日系風(fēng)格。
木屋里變成木屋外,遠(yuǎn)方還有個(gè)雨傘頭怪人,雖然意境上是符合描述,但是BUG也不少。
再來(lái)試試科幻風(fēng)格的,比如機(jī)甲大戰(zhàn)怪獸。
看著挺不錯(cuò)的,但是怪獸呢?
拿武器的男人、異形都沒(méi)有,只有一片農(nóng)田。
在嘗試用不停的話術(shù)來(lái)生成照片后,可以看出文心一言的繪畫(huà)功能處于一個(gè)不穩(wěn)定的狀態(tài),即使是類(lèi)似的描述,也有可能因?yàn)槊枋鰞?nèi)容而出現(xiàn)差別極大的結(jié)果,可以是大致符合的,也可以是背道而馳的。
至少?gòu)臏y(cè)試結(jié)果來(lái)看,雖然文心一言的繪畫(huà)照片生成速度和質(zhì)量都很不錯(cuò),但是在對(duì)用戶語(yǔ)義和內(nèi)容的理解上,顯然是存在一定的問(wèn)題,后續(xù)還有著很大的優(yōu)化空間。
對(duì)話文心一言
對(duì)比繪畫(huà)功能,對(duì)話式問(wèn)答或許才是大多數(shù)人需要的功能,百度或許是把更多的精力用在對(duì)話功能的優(yōu)化上了?那么就讓我們看看,文心一言在對(duì)話式問(wèn)答上的表現(xiàn)如何。
我首先嘗試著讓文心一言評(píng)價(jià)一下2023年的春節(jié)檔電影《流浪地球2》。
單看評(píng)價(jià)內(nèi)容確實(shí)可圈可點(diǎn),但是注意看第一行回復(fù),“該片于2020年春節(jié)期間上映”,《流浪地球》是2019年的春節(jié)檔電影,《流浪地球2》則是2023年的春節(jié)檔,不管是1還是2顯然都與2020年搭不上邊,邏輯上的錯(cuò)誤使得這個(gè)回復(fù)的評(píng)分大打折扣。
如果我們指出回答的錯(cuò)誤會(huì)怎樣呢?
得,直接變成未上映了。
換一種方式提問(wèn)會(huì)怎樣?
我們得到了一個(gè)前后矛盾的回答。
實(shí)話說(shuō),就現(xiàn)在的表現(xiàn)來(lái)看,文心一言即使在常識(shí)性的問(wèn)答上都有不少的錯(cuò)誤,甚至?xí)谝粋(gè)回答中給出完全相反的觀點(diǎn)。
特別是涉及到具體時(shí)間的問(wèn)題回答上,文心一言似乎有嚴(yán)重的BUG。
再來(lái)試試腦筋急轉(zhuǎn)彎。
回答不出所料。
有意思的是,在我指出回答中存在的問(wèn)題后,文心一言居然圓回來(lái)了。
腦筋急轉(zhuǎn)彎還是有點(diǎn)難度過(guò)高,讓我們?cè)囋嚻胀ǖ奶釂?wèn)。
終于回答正確了,不容易啊。
再來(lái)測(cè)試一下其他應(yīng)用場(chǎng)景。
咋看之下,這個(gè)回答是沒(méi)有問(wèn)題的,只不過(guò),若是懂行的人看到這份回答, 恐怕會(huì)忍不住笑出聲。比如,銳龍9 6900HX確實(shí)是一顆高性能處理器,而RX 5800XM則是一個(gè)不存在的產(chǎn)品,即使有也是AMD的顯卡產(chǎn)品而非處理器。
再來(lái)看顯卡推薦,RTX 2060是正確的,但是Intel iGPU就多少讓人摸不著頭腦了,Intel自己估計(jì)都不知道還有這樣的東西,下面的內(nèi)存、硬盤(pán)兩項(xiàng)回答上同樣有不少問(wèn)題。
讓我們換個(gè)領(lǐng)域試試。
看來(lái)在生活領(lǐng)域的問(wèn)答中,文心一言的準(zhǔn)確度要高很多。
換個(gè)方式問(wèn),同樣回答正確。
再來(lái)上點(diǎn)難度。
雖然去兩遍長(zhǎng)城有點(diǎn)讓人摸不著頭腦,但是從計(jì)劃來(lái)看,并沒(méi)有太大的問(wèn)題,完全是一個(gè)可實(shí)現(xiàn)的簡(jiǎn)略旅游計(jì)劃。
那么能否生成一個(gè)詳細(xì)一點(diǎn)的旅游計(jì)劃呢?
可以說(shuō),如果你想來(lái)一趟短暫的廣州旅行,但是卻不知道去哪里,按照這份攻略來(lái)走基本上不會(huì)出錯(cuò),文心一言在生活問(wèn)答方面的表現(xiàn)遠(yuǎn)遠(yuǎn)超出了我的預(yù)料。
雖然在涉及到文藝作品、數(shù)碼等領(lǐng)域的問(wèn)答存在許多問(wèn)題,但是在使用率最高的生活問(wèn)答中,文心一言的表現(xiàn)已然合格,結(jié)合手機(jī)端的APP定位和用戶人像,可以提供更準(zhǔn)確、詳細(xì)的建議。
至少在旅游娛樂(lè)方面,文心一言已經(jīng)展示出很大的潛力。
文心一言,可以成為生產(chǎn)力工具嗎?
在此之前,我們聊到ChatGPT,除了驚嘆于強(qiáng)大的對(duì)話式問(wèn)答功能,其在生產(chǎn)力方面的表現(xiàn)也讓許多人產(chǎn)生了危機(jī)感,甚至有聲音認(rèn)為,ChatGPT將會(huì)取代許多工作,導(dǎo)致失業(yè)危機(jī)。
那么,文心一言作為同類(lèi)型的人工智能產(chǎn)品,在生產(chǎn)力方面的表現(xiàn)又如何呢?
首先來(lái)一篇簡(jiǎn)單的廣州風(fēng)土人情介紹文章。
額,好像被我玩壞了。
在刪去字?jǐn)?shù)要求后,文心一言給出了正常的回答。
換個(gè)條件再試試。
還是正常的。
讓我們繼續(xù)測(cè)試。
額,看樣子“500字”似乎是文心一言的死穴,隨后我對(duì)500字進(jìn)行了一些微調(diào),但是給出的回答都是正常的,恐怕這里存在一個(gè)未知的BUG,有待后續(xù)百度的工程師進(jìn)行修復(fù)。
拋開(kāi)意外觸發(fā)的BUG不談,文心一言確實(shí)可以生成簡(jiǎn)單的文案,可以為使用者提供一個(gè)基本的內(nèi)容框架,只需要進(jìn)行內(nèi)容填充就可以成為一篇簡(jiǎn)單直白的介紹文。當(dāng)然要求不高的話,直接復(fù)制粘貼使用也是可以的,在生產(chǎn)力方面,文心一言的表現(xiàn)并不如生活領(lǐng)域的表現(xiàn)突出,甚至可以說(shuō)有些稀疏平常。
圖源:文心一言發(fā)布會(huì)
不過(guò),考慮到目前文心一言還是初始內(nèi)測(cè)版本,后續(xù)的優(yōu)化空間還是很大的。綜合體驗(yàn)下來(lái),文心一言給我的感受既有驚喜也有“驚嚇”,雖然在一些專業(yè)性質(zhì)較強(qiáng)的領(lǐng)域上,文心一言有著不少的問(wèn)題,但是在一些重點(diǎn)優(yōu)化的領(lǐng)域,如生活?yuàn)蕵?lè),可以看到文心一言的回答已經(jīng)有了不錯(cuò)的表現(xiàn)。
在生活?yuàn)蕵?lè)領(lǐng)域表現(xiàn)出來(lái)的潛力,或許就是百度在發(fā)布文心一言后,第二天股價(jià)暴漲的原因,雖然在生產(chǎn)力等方面的表現(xiàn)不如人意,但是卻已經(jīng)表現(xiàn)出了驚人的潛力。
對(duì)于文心一言的未來(lái),個(gè)人是十分看好的。
來(lái)源:雷科技
原文標(biāo)題 : 百度文心一言體驗(yàn):不夠完美,但在ChatGPT面前已展現(xiàn)威力

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?