大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
今年大廠們沖刺Agent成了共識,字節(jié)扣子“大戰(zhàn)”心響、夸克,但Agent還未到“GPT時刻”。
原創(chuàng)科技新知 AI新科技組
作者丨櫻木 編輯丨江籬
2025年5月,紅杉資本AI峰會在舊金山落下帷幕,在這場包含Open AI創(chuàng)始人山姆·奧特曼以及谷歌首席科學家Jeff Dean等150位全球頂尖AI公司創(chuàng)始人、科學家以及投資人的大會中,一個共識逐漸被確立下來——即下一輪 AI,賣的不是工具,而是收益。這句看起來有些跳躍的話,紅杉給出了一個模式性的解釋,即未來AI將從賣工具到賣協(xié)作,最終走向賣成果(Software as an Outcome)。如何從賣工具到賣結(jié)果,這場紅杉的峰會更具落地的意義,也許在于強調(diào)了Agent的價值。隨后,硅谷大廠開啟了第一波加速,微軟CEO納德拉在主題演講中宣布:“我們已經(jīng)進入了AI Agent時代,正在見證AI系統(tǒng)如何以全新方式幫助我們解決問題。”Open AI CEO山姆·奧特曼宣布,推出面向開發(fā)者的新Codex 智能體,稱“這可能是編程史上最大的變革。”
而在大洋這一端的國內(nèi)市場,已經(jīng)蠢蠢欲動的大廠們,似乎也有了相同的判斷,從字節(jié)、百度、阿里的動作來看,頭部互聯(lián)網(wǎng)大廠紛紛加速布局Agent應用。據(jù)內(nèi)部人士透露,字節(jié)已經(jīng)有7個團隊在競速Agent,而百度在前不久的create大會中直接拿出了心響,聲稱其為直接可用的Agent。而在阿里一側(cè),夸克內(nèi)部已經(jīng)自我定位為“超級Agent”。而除了通用Agent之外,各個大廠在垂類Agent方面也在不斷加速。阿里飛豬問一問,百度旗下的法行寶等也在不斷擴張。 Agent作為大模型之后的第二波確定性浪潮,已經(jīng)開啟了加速爭奪,而最后影響戰(zhàn)局的變量,除了各家的生態(tài)厚度,還有對于心智、用戶習慣的占領(lǐng)。這也就意味著最終能夠參戰(zhàn)的,也許只剩下阿里與百度、字節(jié)、騰訊等少數(shù)玩家,而率先出牌的百度與阿里,能否搶得先機,值得一番拆解。
01
Agent爆發(fā)年,也是沖刺年
第一個叫醒大廠的,顯然是Manus,這家由真格基金投資的國產(chǎn)Agent團隊,在2025年3月初突然上線了Manus,從開啟內(nèi)測伊始,就贏得了全世界的關(guān)注。“10萬元搶一內(nèi)測碼”、“一碼難求”等熱詞刺激著人們的神經(jīng)。主流觀點第一次意識到,基于主流大模型的Agent居然能夠?qū)崿F(xiàn)如此強大的實操型功能應用與用戶體驗。而大廠的動作,似乎從那時起,就開啟了加速。 字節(jié)是飽和攻擊的代表。在晚點的報道之中,3月初,智能體應用Manus出圈前后,字節(jié)已有至少5個團隊在開發(fā)不同智能體產(chǎn)品,其中有些是對內(nèi)工具。而這一數(shù)字在4月底時,已經(jīng)達到了7個團隊。4月底,字節(jié)的flow團隊拿出定位為 “用戶與AIAgent協(xié)同辦公的最佳場所”的扣子空間并開啟內(nèi)測,扣子基于自研的豆包大模型(如豆包1.5Pro)構(gòu)建,支持 MCP(模型上下文協(xié)議)協(xié)議,可調(diào)用飛書多維表格、高德地圖、圖像工具等組件。
而百度的動作,也可以從李彥宏的發(fā)言中看出端倪。在4月的百度create大會之中,李彥宏直接表明“AI的終極價值在于應用落地,而智能體是連接模型能力與用戶需求的核心載體”,就在大會期間,百度一口氣拿出了通用智能體心響,同時宣布mcp全兼容。
而另一方面,阿里也沒有放松,基礎(chǔ)模型的優(yōu)勢,以及對夸克、釘釘?shù)募哟a,讓其在tob和toc端都有了競爭的實力。 從大模型的競爭,到Agent的競爭,大廠到底在角逐什么?簡而言之,是技術(shù)加速后,交互方式的變化,對生態(tài)級別的入口爭奪。一個典型的類比,就是在大模型時代,當DeepSeek出現(xiàn)之后,由于其技術(shù)的領(lǐng)先性,沒有花費任何營銷費用,就輕松獲取了龐大的用戶量,而騰訊憑借著元寶對DeepSeek的鏈接,直接搶奪到了大模型時代的入場券。今天的Agent也是一樣的邏輯,技術(shù)的底層已經(jīng)成型,誰家的產(chǎn)品可以快速的成型,就意味著對市場碾壓級別的領(lǐng)先。
在紅杉分享會中,一個特殊的方向也被提到,即企業(yè)級市場中,真正先跑出來的入口未必是通用大模型,而是Harvey(法律)、Open Evidence(醫(yī)療)這類垂直領(lǐng)域智能體 OS,因為它們能聽懂行業(yè)語言,理解真實需求。而對于這兩個Agent,其中open evidence大家較為熟悉,投資人朱嘯虎在多次訪談中提及,作為專為醫(yī)生設(shè)計的AI診斷輔助工具,通過精準的臨床支持和創(chuàng)新的商業(yè)模式,迅速在美國醫(yī)生群體中普及。所以可以看到的是,Agent的潛力不僅局限在某一兩個應用上,更重要的則是生態(tài)級別的入口。而從這個角度來看,大廠無論是做智能體生態(tài),垂直應用Agent,還是做通用Agent(心響、扣子,以及夸克)似乎都是必須要爭奪的方向。
02
勝負手在哪兒?
“Manus能夠成功,我們可以看到它用的是cloude3.5模型。”秘塔創(chuàng)始人在一檔播客欄目中曾經(jīng)評價到。從某種程度來說,這也意味著行業(yè)內(nèi)的共識,最明顯的例證來自于字節(jié)的扣子團隊。在晚點的報道中“扣子是個開放的平臺,如果國內(nèi)有大模型效果比豆包好,我們也會積極使用。”扣子團隊開發(fā)扣子空間時,豆包深度思考模型還沒發(fā)布,他們曾考慮優(yōu)先使用DeepSeek-R1,測試后發(fā)現(xiàn)它調(diào)用工具的能力不夠。后來團隊又對比六款國內(nèi)大模型,使用了豆包1.5 Pro為主的多款模型。因為豆包在指令遵循、調(diào)用工具,以及多模態(tài)處理能力上表現(xiàn)最好,而且推理成本很低,能支撐大規(guī)模調(diào)用。
而這一觀點,也被行業(yè)內(nèi)廣泛認同,拾象科技李廣密曾在播客中坦言,預訓練可能會重新變得重要,而大模型的能力也決定著Agent等能力。 從這個角度來看,百度、阿里與字節(jié)幾乎可以說不分伯仲。百度拿下了與蘋果的合作,從某種程度來說,蘋果作為智能手機行業(yè)最大的入口,承認了百度在模型能方向上的能力。而阿里則擁有qwen這個可能是最優(yōu)秀的開源大模型。對于字節(jié)來說,基于豆包大模型的產(chǎn)品長期霸占著c端下載量,實力也非常出眾。
而三方大量資源的傾注,讓這場爭奪愈發(fā)激烈。 當然,從Agent應用的角度來看,生態(tài)的厚度也是考量勝負手的關(guān)鍵。Agent的本質(zhì)上其實就是能夠“讓 AI 真正實現(xiàn)自主完成任務”,而相關(guān)能夠調(diào)用的應用的能力也是其能否贏得戰(zhàn)役的關(guān)鍵。 這一點,幾家大廠的選擇似乎有所區(qū)別,百度開放了大模型和千帆開發(fā)平臺兼容,地圖、文庫、網(wǎng)盤、Comate也開放了MCP Server。但字節(jié)則相對保守,更愿意自身成為全新的Agent工廠,阿里把所有都集合在夸克之中,超級框的概念,就是另一種能力上的調(diào)用。
而從行業(yè)從業(yè)者3月的一份數(shù)據(jù)來看,阿里的厚度優(yōu)勢明顯。從該報告來看,國內(nèi)調(diào)用較高的MCP Servers,包含了高德地圖、notion、支付寶,以及minimax,而其中高德地圖憑借著提供全場景覆蓋的地圖服務,包括地理編碼、逆地理編碼、IP定位、天氣查詢、騎行路徑規(guī)劃、步行路徑規(guī)劃、駕車路徑規(guī)劃成為被調(diào)用較高的APP。當然,評價生態(tài)的厚度的變量還有很多,但可以看出的是,阿里的領(lǐng)先優(yōu)勢正在擴大。從形態(tài)上來看,Agent仍然是一種社交,而從社交的視角來看,騰訊系則無疑占據(jù)著強大的優(yōu)勢。
騰訊總裁劉熾平回應道:“在微信生態(tài)系統(tǒng)內(nèi),我認為我們有機會創(chuàng)造一個非常獨特的Agent,即AI與微信生態(tài)系統(tǒng)特有的內(nèi)容相連接,包括社交、通信和社區(qū)能力以及內(nèi)容生態(tài)系統(tǒng),比如公眾號和視頻號,以及數(shù)以百萬計的小程序。實際上你可以接入各種信息,以及許多不同垂直應用程序的交易和操作能力。”獨一無二的社交生態(tài),讓騰訊特別是微信Agent也成為了不容忽視的力量。此外,成本也是Agent能否完成蛻變的另一重關(guān)鍵。3月18日,The Information報道,Manus現(xiàn)階段的產(chǎn)品同時受制于其服務器容量和高昂的運營成本。據(jù)兩位直接了解情況的人士透露,Manus使用人工智能公司Anthropic的模型,平均每完成一項任務需向Anthropic支付2美元。
總結(jié)來看,基礎(chǔ)模型能力、生態(tài)厚度、成本等都在成為Agent能否突出重圍的關(guān)鍵,而從當下來看,這些變量的發(fā)酵暫時難以區(qū)分明顯的優(yōu)劣。
03
Agent還未到“GPT時刻”
盡管大廠的競速與Manus等爆款產(chǎn)品的出現(xiàn)讓Agent賽道熱度飆升,但可以確認的是,當前行業(yè)似乎遠未達到類似GPT的顛覆性臨界點。從技術(shù)成熟度、商業(yè)模式落地到用戶心智占領(lǐng),Agent仍需跨越多重鴻溝。一方面,當前Agent的核心能力仍高度依賴大模型,但模型本身存在顯著局限性。CSDN博客指出,在處理多步驟任務時,大模型的規(guī)劃能力容易崩潰,例如銀行轉(zhuǎn)賬這類需十幾步操作的流程,模型常因邏輯鏈斷裂而失敗。同時,盡管大廠紛紛推出Agent平臺,但生態(tài)整合仍處于碎片化狀態(tài),“各自為戰(zhàn)”的局面導致工具調(diào)用接口不統(tǒng)一。不同Agent對其功能的調(diào)用方式差異顯著,開發(fā)者需重復適配。
紅杉峰會提出的“Software as an Outcome”理念雖被廣泛認同,但落地路徑仍不清晰。當前Agent主要以訂閱制或按調(diào)用次數(shù)收費,本質(zhì)上仍是工具思維。例如,Manus的高成本導致其難以向中小企業(yè)普及,而百度心響雖宣稱直接可用,但企業(yè)用戶更關(guān)注其能否真正提升銷售轉(zhuǎn)化率或降低運營成本。此外,垂直領(lǐng)域的探索雖初現(xiàn)曙光,但規(guī);孕钑r間。阿里飛豬問一問在旅游場景的表現(xiàn)可圈可點,百度法行寶在法律領(lǐng)域也積累了案例,但這些垂類Agent的行業(yè)滲透率仍然不高。用戶對Agent的信任度尚未建立,尤其在涉及敏感數(shù)據(jù)的場景中,企業(yè)更傾向于保留人工審核環(huán)節(jié)。
當前Agent的用戶體驗呈現(xiàn)明顯的兩極分化。垂直場景如設(shè)計領(lǐng)域的Lovart,通過整合行業(yè)知識庫和多模態(tài)輸出,實現(xiàn)了“需求 - 交付”全閉環(huán),設(shè)計師可直接基于其生成的分層文件進行迭代,效率提升數(shù)倍。但通用Agent如Manus,在處理復雜任務時仍顯得笨拙——例如生成設(shè)計圖時可能出現(xiàn)字體過小、元素堆砌等問題,用戶需頻繁手動調(diào)整。
更關(guān)鍵的是,用戶對Agent的期待與實際能力存在落差。部分用戶誤認為Agent能完全替代人類,而實際上其在模糊指令解析、任務邊界把控等方面仍需人工干預。Agent的爆發(fā)印證了AI從技術(shù)到應用的躍遷,但距離真正的“GPT 時刻”仍有漫長道路。當前的競爭本質(zhì)上是生態(tài)卡位與場景定義權(quán)的爭奪,大廠的角逐布局似乎都在為未來的生態(tài)戰(zhàn)爭鋪路。而決定最終勝負的,不僅是技術(shù)迭代速度,更是對行業(yè)痛點的理解深度與商業(yè)模式的創(chuàng)新勇氣。
當Agent能像水電煤一樣融入日常生活,真正的變革才會到來。晚點latepost《字節(jié)AI再創(chuàng)業(yè):獨立組織、全鏈條的飽和攻擊》新皮層newthings《掌權(quán)一年半來,吳泳銘是如何管理阿里巴巴的》騰訊科技《微軟一晚上發(fā)了50個新東西,要建一個Agent互聯(lián)的“伊甸園”》AI深度研究員《只談生存:AI Agent倒計時 730 天,硅谷 3 位“異見者”給出 3 條活路》AI深度研究員《紅杉 AI 峰會閉門 6 小時,150 位創(chuàng)始人共識浮現(xiàn):AI 不再賣工具,而是賣收益》中國企業(yè)家《AI新戰(zhàn)場,騰訊押注Agent》
原文標題 : 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字