“文心一言”發(fā)布會李彥宏演講全文
3月16日,百度發(fā)布類ChatGPT產(chǎn)品“文心一言”,以下為李彥宏在發(fā)布會上的演講全文:
各位媒體朋友,各位嘉賓,大家好。歡迎參加文心一言新聞發(fā)布會。非常感謝大家對文心一言的關(guān)注和支持。
最近一段時間,很多朋友問我,“為什么是今天,你們真的ready了嗎”。其實從某種意義上說我們已經(jīng)為此準(zhǔn)備了多年,我們十幾年前就開始投入AI研究,2019年就推出了文心大語言模型,今天的發(fā)布是過去多年努力的延續(xù)。
但也不能說我們完全ready了,文心一言對標(biāo)chatGPT,門檻是很高的,全球大廠還沒有一個做出來的,百度是第一個,我自己測試感覺還是有很多不完美的地方。
那為什么是今天?因為市場有需求。百度的很多產(chǎn)品,從搜索到智能云,再到自動駕駛,大家都有需要,更重要的是我們的客戶需要,合作伙伴需要,從我們承認(rèn)文心一言的存在到現(xiàn)在,短短一個月的時間,就有超過650家合作伙伴宣布加入文心一言生態(tài),大家都希望能早一點用上最新最先進(jìn)的大語言模型。
當(dāng)然,一旦發(fā)布,有了真實的人類反饋,文心一言的進(jìn)步速度會非?,我們都希望它快點成長,早日為用戶和客戶創(chuàng)造價值。
百度希望和大家一起,推動人工智能技術(shù)進(jìn)步,讓所有人都能使用最先進(jìn)的生產(chǎn)力工具,讓所有人都能從中受益。
十月懷胎,一朝分娩,F(xiàn)在,我就帶大家來看看,百度新一代大語言模型、生成式AI產(chǎn)品文心一言。
下面,我會演示五個場景的Demo,包括文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成。
首先來體驗一下文學(xué)創(chuàng)作!度w》是非常知名的科幻小說,我們就以這個開頭。
Demo1:
剛才的演示中,“總結(jié)三體的核心內(nèi)容”,體現(xiàn)的是文心一言的總結(jié)、分析能力。
續(xù)寫《三體》,體現(xiàn)的是內(nèi)容創(chuàng)作生成能力。
《三體》的作者是誰?他是哪里人?電視劇三體演員都有誰?文心一言回答是正確的。大家可能知道,生成式AI這類產(chǎn)品,在回答事實性問題時,有時候會出錯。
文心一言延續(xù)了百度知識增強(qiáng)的大模型理念,大幅度提升了事實性問題的準(zhǔn)確率。
于和偉和張魯一有哪些共同點、于和偉和張魯一誰更高?這類問題背后,則體現(xiàn)的是文心一言的推理能力。比如,它得先知道兩人的準(zhǔn)確身高,才能得出正確答案。
我們再來試試文心一言在商業(yè)文案創(chuàng)作方向的能力。以常見的公司起名字、寫slogan、寫新聞稿為例。
Demo2:
剛才的演示,展現(xiàn)了文心一言連續(xù)三次內(nèi)容創(chuàng)作生成。
AI要寫好一篇稿子,除了需要準(zhǔn)確理解我們的意圖,還要有清晰的表達(dá)能力。
這背后有一個基礎(chǔ),就是龐大的數(shù)據(jù)規(guī)模。人類常說“讀萬卷書”,而AI可以說是“讀書破千億卷”。文心一言大模型的訓(xùn)練數(shù)據(jù)就包括,萬億級網(wǎng)頁數(shù)據(jù),數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù),百億級的語音日均調(diào)用數(shù)據(jù),以及5500億事實的知識圖譜等,這讓百度在中文語言的處理上,能夠處于獨一無二的位置。
有研究表明,數(shù)據(jù)規(guī)模足夠大,參數(shù)達(dá)到千億級,大模型就可能發(fā)生“智能涌現(xiàn)”,即使在沒有專門訓(xùn)練過的領(lǐng)域,也能涌現(xiàn)出知識理解和邏輯推理能力。
我們接下來看文心一言對數(shù)理邏輯推算任務(wù)做的怎么樣。雞兔同籠是鍛煉人類邏輯思維的經(jīng)典題,這個對生成式AI同樣有挑戰(zhàn)。
Demo3:
對于第一道題,文心一言經(jīng)過演算,認(rèn)為可能是題出錯了。
對于第二道,文心一言不但給出了正確結(jié)果,還詳細(xì)給出解題步驟。
可以看出,文心一言能理解題意,并有正確的解題思路,進(jìn)而像學(xué)生做題一樣,按正確的步驟,一步步算出正確答案。
文心一言已具備了一定的思維能力,能夠?qū)W會數(shù)學(xué)推演及邏輯推理這類相對復(fù)雜任務(wù)。當(dāng)然,現(xiàn)階段準(zhǔn)確率還不是100%,我們還需要給它更多的時間來學(xué)習(xí)和成長。前面三個例子,我們演示了大語言模型比較常見的優(yōu)勢和能力。
下面我們演示一下文心一言的中文理解能力。
Demo4:
“洛陽紙貴”,“藏頭詩”,這很考驗AI對中文和中國文化的理解。
作為扎根于中國市場的大語言模型,文心一言具備中文領(lǐng)域最先進(jìn)的自然語言處理能力。這個例子就比較清楚的展示了我們在中文上的優(yōu)勢。
相對應(yīng)的,一言目前對英文語種、代碼場景的訓(xùn)練還不夠多,表現(xiàn)還不夠好,接下來我們還要加緊訓(xùn)練,不斷完善這些能力。
接下來,我再演示一個多模態(tài)生成方向的Demo。
Demo5:
剛才這一段演示,文心一言生成了文本、圖片、音頻和視頻,展示了多模態(tài)生成能力。目前的版本,已經(jīng)能夠生成文字、圖片和語音。生成視頻因為成本比較高,還沒有對所有用戶開放,未來我們會逐步接入。但是熟悉百家號創(chuàng)作的朋友,應(yīng)該都體驗過這個功能了,每天有幾萬篇文章通過這個能力轉(zhuǎn)成視頻內(nèi)容在百度分發(fā)。
多模態(tài)是生成式AI一個明確的發(fā)展趨勢。
未來,隨著百度多模態(tài)統(tǒng)一大模型的能力增強(qiáng),文心一言的多模態(tài)生成能力,也會不斷提升。
上面這些演示案例,在發(fā)布會后,大家也可以親自去測試體驗。
從文心一言的表現(xiàn)看,某種程度上它具有了對人類意圖的理解能力,回答的準(zhǔn)確性、邏輯性、流暢性,都逐漸接近人類水平。
但整體而言,這類大語言模型還遠(yuǎn)未到發(fā)展完善的階段,它們有時候會有很驚艷的表現(xiàn),但不少場景下,細(xì)究起來還有明顯的bug,進(jìn)步空間很大。未來這段時間它一定會飛速發(fā)展,日新月異。
通過定向微調(diào),可以在百度內(nèi)外部各類產(chǎn)品上逐步展示出驚人的親和力,讓每一個產(chǎn)品離自己的用戶和客戶更近。
文心一言這樣的大語言模型,會成為每個人必不可少的生產(chǎn)力工具。
不過,無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學(xué)習(xí)、自然語言處理,需要多年的堅持和積累,沒法速成。
人類進(jìn)入人工智能時代,IT技術(shù)的技術(shù)棧發(fā)生了根本性變化。過去基本分為三層:芯片層,操作系統(tǒng)層和應(yīng)用層,F(xiàn)在可以分為四層:芯片層、框架層、模型層和應(yīng)用層。
今天,百度是全球為數(shù)不多、在這四層進(jìn)行全棧布局的人工智能公司,從高端芯片昆侖芯,到飛槳深度學(xué)習(xí)框架,再到文心預(yù)訓(xùn)練大模型,到搜索、智能云、自動駕駛、小度等應(yīng)用,各個層面都有領(lǐng)先業(yè)界的自研技術(shù)。
文心一言位于模型層。2019年,百度推出了文心大模型ERNIE 1.0。目前,ERNIE 3.0每天接受數(shù)十億次用戶的搜索請求。這讓文心一言能夠基于一個龐大的、高效的數(shù)據(jù)池,快速地學(xué)習(xí)和改進(jìn)。
大模型訓(xùn)練堪稱暴力美學(xué),需要有大算力、大數(shù)據(jù)和大模型,每一次訓(xùn)練任務(wù)都耗資巨大。全棧布局的優(yōu)勢在于,可以在技術(shù)棧的四層架構(gòu)中,實現(xiàn)端到端優(yōu)化,大幅提升效率。尤其是,框架層和模型層之間,有很強(qiáng)的協(xié)同作用,可以幫助構(gòu)建更高效的模型,并顯著降低成本。事實上,超大規(guī)模模型的訓(xùn)練和推理,給深度學(xué)習(xí)框架帶來了很大考驗。比如,為了支持千億參數(shù)模型的高效分布式訓(xùn)練,百度飛槳專門研發(fā)了4D混合并行技術(shù)。
另外,芯片、框架、大模型、和終端應(yīng)用場景,可以形成一個高效的反饋閉環(huán),幫助大模型不斷去調(diào)優(yōu)迭代,越做越好。更好的大模型,會讓用戶體驗不斷升級。
我還想強(qiáng)調(diào)一點,在全球范圍內(nèi),在四層架構(gòu)的每一層都有領(lǐng)先產(chǎn)品的公司幾乎沒有,百度的優(yōu)勢非常獨特,相信大家會在后續(xù)文心的迭代速度上有明顯感受。
自2月份百度官宣“文心一言”以來,已有超過650家企業(yè)宣布接入文心一言生態(tài),感謝每一位伙伴的支持。
這也意味著,很多的企業(yè)已經(jīng)理解到,文心一言和生成式AI,代表了一個新的技術(shù)范式,是一個每家企業(yè)都不可以錯過的巨大的機(jī)會。AI市場即將迎來爆發(fā)性的需求增長,其商業(yè)價值的釋放將是前所未有的、指數(shù)級的。
我們對文心一言的定位,是一個通用的賦能平臺,金融、能源、媒體、政務(wù)等千行百業(yè),都可以基于這個平臺來實現(xiàn)智能化變革,實現(xiàn)效率提升,創(chuàng)造巨大的商業(yè)價值。
文心一言不僅僅會影響搜索或者互聯(lián)網(wǎng)公司,而是會影響到每一家公司,由于它超強(qiáng)的自然語言理解和表達(dá)能力,它讓任何公司都有機(jī)會離自己的客戶更近,有機(jī)會通過這些能力去創(chuàng)建最好的客戶體驗,從而比其他人更能抓住客戶,獲得更強(qiáng)的競爭優(yōu)勢。
文心一言對個人的改變也會是巨大的,有機(jī)構(gòu)預(yù)測,到2030年,人工智能可以將每一個知識工作者的生產(chǎn)力提高4倍以上。很多人的工作性質(zhì)會發(fā)生不可逆轉(zhuǎn)的改變。
我認(rèn)為生成式AI,將催生新產(chǎn)品、新業(yè)態(tài),會有很多創(chuàng)業(yè)和投資機(jī)會。
對于大部分創(chuàng)業(yè)者和企業(yè)來說,真正的機(jī)會并不是從頭開始做ChatGPT和文心一言這樣的基礎(chǔ)大模型,這很不現(xiàn)實,也不經(jīng)濟(jì)。
對于大部分創(chuàng)業(yè)者和企業(yè)來說,真正的機(jī)會是,基于通用大語言模型,搶先開發(fā)重要的應(yīng)用服務(wù)。就像移動互聯(lián)網(wǎng)時代,最成功的商業(yè)產(chǎn)品不見得是安卓和IOS,而是基于安卓和IOS開發(fā)的微信、淘寶、抖音等各種超級應(yīng)用。
我認(rèn)為大模型時代將產(chǎn)生三大產(chǎn)業(yè)機(jī)會:
第一類是新型云計算公司,其主流商業(yè)模式從IaaS變?yōu)镸aaS。文心一言,將根本性地改變云計算行業(yè)的游戲規(guī)則。之前企業(yè)選擇云廠商更多看算力、存儲等基礎(chǔ)云服務(wù)。未來,更多會看框架好不好、模型好不好,以及模型、框架、芯片、應(yīng)用這四層之間的協(xié)同。
文心一言將通過百度智能云對外提供服務(wù),幫助企業(yè)構(gòu)建自己的模型和應(yīng)用,農(nóng)業(yè)、工業(yè)、金融、教育、醫(yī)療、交通、能源等重點領(lǐng)域,都會因此效率大幅提升,并在每一個行業(yè)快速形成新的產(chǎn)業(yè)空間,助力數(shù)字中國的實現(xiàn)。百度智能云將于近期舉辦發(fā)布會。發(fā)布基于文心一言的云服務(wù)和應(yīng)用產(chǎn)品,我們既有公有云服務(wù)和也可以做私有化部署,請大家期待。
第二類是進(jìn)行行業(yè)模型精調(diào)的公司,這是通用大模型和企業(yè)之間的中間層,他們具有行業(yè)Know how,調(diào)用通用大模型能力,為行業(yè)客戶提供解決方案。我們的文心大模型,已經(jīng)在電力、金融、媒體等領(lǐng)域,發(fā)布了10多個行業(yè)大模型。在各行各業(yè)都有機(jī)會。非常歡迎大家來跟我們合作。
第三類是基于大模型底座進(jìn)行應(yīng)用開發(fā)的公司,即應(yīng)用服務(wù)提供商。今天,基于文本生成、圖像生成、音頻生成、視頻生成、數(shù)字人、3D等場景,已經(jīng)涌現(xiàn)出很多創(chuàng)業(yè)明星公司,他們可能就是未來的新巨頭。這里面的機(jī)會非常多,可以說每家企業(yè)在現(xiàn)在這個階段都有機(jī)會。
我們相信,人工智能會徹底改變我們今天的每一個行業(yè)。AI的長期價值,對各行各業(yè)的顛覆性改變,才剛剛開始。未來,將會有更多的殺手級應(yīng)用、現(xiàn)象級產(chǎn)品出現(xiàn),將會有更多的里程碑事件發(fā)生。
文心一言發(fā)布之后,將建立起真實用戶反饋、開發(fā)者調(diào)用和模型迭代之間的飛輪,效果會迅速提升,給你“士別三日,當(dāng)刮目相看”的驚喜。
最后我想說,文心一言不是中美科技對抗的工具,而是一代代百度技術(shù)人員追逐科技改變世界的夢想的產(chǎn)物,是我們服務(wù)億萬用戶,賦能千行百業(yè)的全新的平臺,是創(chuàng)新驅(qū)動發(fā)展的最佳證明。
謝謝大家的關(guān)注和支持。
原文標(biāo)題 : “文心一言”發(fā)布會李彥宏演講全文

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?