嗯,我從「文心一言」發(fā)布會回來了
不要完全相信截圖。
文 / 書航 2023.3.16
從我家到百度科技園,我單程需要跨越 66 公里,花費 3 個小時。去現(xiàn)場參加發(fā)布會絕對不是第一時間領(lǐng)略「文心一言」魅力的最佳方案。
實際上,在現(xiàn)場可以看到的內(nèi)容,和直播的內(nèi)容基本一致。在現(xiàn)場能看到的也是錄屏演示,沒有額外「加餐」。
當我回到家安頓下來再打開電腦,已經(jīng)有少量真實截圖,以及一個簡單的評測出來了。實際上,今晚開始確實有一批媒體會首先拿到邀請碼,推出相對簡單的評測。而未來幾天,預計會有更多人拿到邀請碼,相信也會有更深度的評測出現(xiàn)。
我觀察到一個挺有意思的現(xiàn)象,有一兩個微博上的娛樂營銷號,在發(fā)布會剛結(jié)束,就發(fā)布了相信是來自「文心一言」的截圖。另一些則是濫竽充數(shù),比如我看到有個博主說是「文心一言」的截圖,實際上來自另一款產(chǎn)品「寫作貓」。
這提醒了一個之前我沒有注意到的可能,就是對 AI 聊天畫面造假。例如有一張 ChatGPT 的問答,展示了它可以正確識別「文心一言邀請碼:KFCV50」這個段子的含義。然而我實際拿去測試了 GPT-3.5、GPT-4 和必應,結(jié)果是不論是否聯(lián)網(wǎng),圖里的回答都不可復現(xiàn)。
從技術(shù)上,對網(wǎng)頁截圖造假非常容易,只要打開瀏覽器的 F12 開發(fā)者工具就可以修改相應段落,不需要 P 圖。作為對應,「文心一言」的界面樣式在發(fā)布會上已經(jīng)公布,而其真實的界面截圖都帶有唯一的浮水印。
差評做的評測也許是第一個完整的「文心一言」評測,其中測試了發(fā)布會沒提到的編程功能,以及以表格方式呈現(xiàn)結(jié)果。這說明「文心一言」的相關(guān)「涌現(xiàn)」能力其實已經(jīng)展露,但因為算力差距擺在那里,不能預期它發(fā)揮跟 ChatGPT 一樣穩(wěn)定,出現(xiàn)不可控結(jié)果是完全有可能的。
在 ChatGPT 以及新必應搜索剛剛引起社會關(guān)注時,很多關(guān)于它「發(fā)瘋」或出現(xiàn)滑稽結(jié)果的報道,一度讓人懷疑它的實際能力。但當大家逐漸用上之后,有些擔心自然而然地消失了。我覺得,一個對讀者有意義的評測,或許不應該聚焦于如何讓生成式 AI 突破禁錮或「發(fā)瘋」,而是看它可不可以完成一些實際任務,可以真正作為生產(chǎn)力工具使用。
至少目前已經(jīng)可以證明:這次發(fā)布的「文心一言」并不害怕真機評測。在發(fā)布會使用預錄視頻,或許只是想讓發(fā)布會的流程更順暢一些。
整場活動大多都是演講,講的內(nèi)容或多或少之前都有線索可循。像我昨天預測的可能會用到百度自家的知識圖譜,結(jié)果今天發(fā)現(xiàn)果然如此,官方說法叫「知識增強」。而所有的發(fā)言其實都圍繞著一個目的,就是「預期管理」。
鑒于 OpenAI 的技術(shù)實力即使在硅谷范圍里也是遙遙領(lǐng)先,沒有任何理由要求「文心一言」剛發(fā)布就趕上乃至超越 ChatGPT。整場發(fā)布會的很多地方都希望大家能真實認識到這一點,正如我昨天所說:「跟 ChatGPT 比了不行是意料之中的,如果有地方勝出,那就是意外收獲!
另一個需要「管理」的預期,或許是「文心一言」的響應速度。預錄視頻可以說明兩個問題:
「文心」大模型拆分 token(可以理解為不可拆分的最小生成單位)的方法可能和 GPT 不同。當你留心觀察 ChatGPT 輸出答案的動畫時,可以發(fā)現(xiàn)它是一兩個詞這么往外「蹦」字,實際上代表了 token 在被消耗。而「文心一言」輸出答案則是非常流暢地從頭輸出到尾,這可能因為它選擇了獲得全部回答之后才展現(xiàn)出來,也可能就是拆 token 的方法不一樣,單個 token 意味著更長的字符串。
響應速度肯定是理想狀態(tài),實際使用可能會慢一些,F(xiàn)在「文心一言」就沒幾個人用,即使過幾天估計也只是小范圍測試,所以這段時間的響應都會很快。但不要忘記生成式 AI 時時刻刻都在消耗算力。今天下午,或許是因為進不去「一言」就轉(zhuǎn)而測試「一格」的緣故,生成圖片的工具「文心一格」排隊速度比平時肉眼可見的減慢,似乎涌進了更多的用戶。所以等輪到你用「文心一言」的時候,也有可能對百度的算力會提出一些挑戰(zhàn)。不過,百度本身有云服務,而且曾經(jīng)服務過春晚這種超大型并發(fā),所以也或許到時候會優(yōu)化得比現(xiàn)在好很多。
所以,隨著發(fā)布會的進行,百度股價跌一點是完全在預期之中的,甚至可以說「小跌算漲」。發(fā)布會采用錄播可能進一步把當天的股價壓了點,但「文心一言」其實并不害怕就這樣接受實測。所以稍給一點時間,股價就有漲回來的空間。
美股開盤后,百度 ADR 走勢如下 ↓
最后,你問我能不能拿到邀請碼也做個評測?
我哪知道啊
題圖:使用「文心一言」作畫時,它會讓你精準給出 prompt,舉的例子是「幫我畫一枝晶瑩剔透的牡丹花」。我用「文心一格」畫了這個 prompt。
原文標題 : 嗯,我從「文心一言」發(fā)布會回來了

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風翻身?