快手、字節(jié)“AI軍備競賽”:一場沒有贏家的技術泡沫秀?
2024年初,OpenAI公布的Sora AI視頻生成模型,震撼了國產(chǎn)大模型行業(yè)。隨后國產(chǎn)廠商集體發(fā)力視頻大模型,快手發(fā)布視頻生成大模型可靈,字節(jié)跳動發(fā)布豆包視頻生成模型,正式打響了國內(nèi)AI視頻生成領域第一槍。
眾多企業(yè)匆忙入局,只為在這片新興市場中搶占先機,卻往往忽視了技術成熟度與應用規(guī)范的打磨。
以社交平臺上泛濫的 AI 偽造視頻為例,全紅嬋家人被惡意仿冒博流量賣貨,明星們也紛紛中招,劉曉慶、張馨予等均曾反饋有人在視頻號上通過AI生成視頻假冒她。這些偽造視頻不僅嚴重侵犯他人權益,更在商業(yè)利益的驅(qū)使下,充斥著虛假營銷,讓不明真相的消費者屢屢受騙。
AI視頻生成領域正處于應用爆發(fā)前夜,快手、字節(jié)等業(yè)內(nèi)玩家試圖通過技術迭代推動產(chǎn)品破圈,卻也陷入了無序競爭困境。
AI視頻賽道尚未成熟
當前,AI視頻生成賽道看似熱鬧非凡,實則整體仍處于不成熟的初級階段。
盡管各大廠商拼命投入資源,力求在模型性能指標上不斷突破,從生成時長的延長到畫面質(zhì)量的優(yōu)化,看似讓AI視頻生成賽道加速邁進“技術突破期”,但AI視頻技術應用仍有不完善之處。
以快手和字節(jié)跳動為例,快手于近期發(fā)布了可靈2.0視頻生成模型及可圖2.0圖像生成模型,自2024年6月6日首次上線開放測試以來,可靈AI已快速迭代二十余次,其模型在動態(tài)質(zhì)量、語義響應、畫面美學等維度表現(xiàn)出色。
字節(jié)跳動的Seed團隊也推出了Seedream 3.0,據(jù)第三方榜單Artificial Analysis顯示,Seedream 3.0綜合性能追平文生圖SOTA模型GPT-4o,進入全球第一梯隊。
然而,這背后也暴露出AI視頻生成領域存在的諸多問題。
一方面,部分企業(yè)為了在競爭中脫穎而出,過度追求技術迭代速度,而忽視了產(chǎn)品應用的實際情況,使得AI視頻生成技術在實際應用中漏洞百出。
例如,當用戶輸入“敦煌飛天”時,AI可能生成面部扭曲的虛擬形象;要求制作科普視頻時,常出現(xiàn)違背物理規(guī)律的懸浮物體。據(jù)MIT媒體實驗室測試,當前主流AI視頻模型在復雜敘事連貫性上的準確率不足63%,這嚴重制約了AI視頻生成技術在商業(yè)應用中的邊界。
另一方面,隨著技術的快速發(fā)展,版權問題逐漸凸顯,成為AI視頻生成領域的一大“雷區(qū)”。
當AI融合多個版權素材生成新內(nèi)容時,現(xiàn)有的“合理使用”原則已難以適用,這讓企業(yè)在版權問題上面臨著巨大的法律風險。從Getty Images起訴Stability AI使用其版權圖片訓練模型,到日本漫畫家協(xié)會禁止使用AI生成分鏡,再到全球首個AI視頻版權案判決金額高達2.3億美元,版權問題仍未得到合理解決。
更值得關注的是,當前的AI視頻生成技術雖然在畫面質(zhì)量、生成速度等方面取得了顯著進步,但在視頻內(nèi)容的邏輯連貫性、情感表達深度以及對復雜場景的理解等方面仍存在較大不足,無法完全滿足市場對高質(zhì)量、多樣化視頻內(nèi)容的需求。
由此可見,快手想要讓可靈AI成為營收規(guī)模全球第一的視頻生成AI應用,這條路任重道遠。
字節(jié)與快手“搶灘”
當前 AI 視頻生成領域風起云涌,字節(jié)跳動與快手作為行業(yè)內(nèi)的兩大巨頭,正在 AI 視頻賽道上奮力搶灘,二者策略各有側(cè)重,呈現(xiàn)出別樣的競爭態(tài)勢。
快手主張商業(yè)化先行,打造多元變現(xiàn)模式,已在 AI 視頻生成領域取得了令人矚目的成績。
在技術方面,快手可靈 AI 展現(xiàn)出了強大的實力,為其商業(yè)化拓展提供了堅實的技術支撐。據(jù)全球知名 AI 基準測試機構 Artificial Analysis 發(fā)布的榜單顯示,快手可靈 1.6pro(高品質(zhì)模式)以 1000 分的 Arena ELO 基準測試評分登陸圖生視頻賽道榜首,超越了 Google Veo 2、Pika Art 等強勁對手。
在商業(yè)化方面,快手無疑走在了前列?伸` AI 采取了“C 端訂閱 + B 端 API 服務 + 定制化場景解決方案”的多元變現(xiàn)模式,既滿足了個人用戶的創(chuàng)意需求,又為企業(yè)客戶提供了強大的視頻生成工具。
據(jù)了解,可靈視頻大模型全球用戶規(guī)模突破 2200 萬,吸引了來自世界各地的超 1.5 萬開發(fā)者和企業(yè)客戶,將可靈的 API 應用于不同的行業(yè)場景中。截至 2025 年 2 月底,可靈 AI 的累計營業(yè)收入超 1 億元。
字節(jié)跳動則展現(xiàn)了不同的野心和策略,其對 AI 視頻生成的布局更側(cè)重于對 AGI(通用人工智能)的探索。
年初字節(jié)跳動豆包大模型團隊在內(nèi)部組建了代號為“Seed Edge”的 AGI 長期研究團隊,鼓勵項目成員探索更長周期、不確定的和大膽的 AGI 研究課題,目標是探索 AGI 的新方法,并鼓勵跨模態(tài)、跨團隊合作。
字節(jié)跳動近期發(fā)布的 Seaweed-7B 模型,以其音畫一體生成、長鏡頭生成、實時生成等多項前沿技術。該模型能夠在短短 25 秒內(nèi)生成高質(zhì)量的視頻內(nèi)容,且推理速度比同類模型提升 62 倍,其性能與 Wan 2.1-14B 相當,在文本轉(zhuǎn)視頻的任務中,Elo 評分僅次于排名第一的模型 Veo 2。
相比于快手的商業(yè)化先行,字節(jié)跳動更注重在技術層面的深耕和突破,試圖通過解決 AGI 這一終極難題,來實現(xiàn)其在 AI 視頻生成領域的長遠發(fā)展和全面領先。快手需要在保持商業(yè)化優(yōu)勢的基礎上,進一步加大技術研發(fā)投入,提升 AI 視頻生成的質(zhì)量和效率,以免被字節(jié)跳動搶了“風頭”。
更大的目標和挑戰(zhàn)
AI浪潮洶涌,快手正試圖借助 AI 之力重塑自身商業(yè)版圖,AI視頻生成賽道只是其宏偉藍圖中的一部分。
從快手的營收數(shù)據(jù)來看,2024 年總營收同比增長 11.8% 至 1269 億元,經(jīng)調(diào)整凈利潤大幅增長 72.5% 達 177 億元,線上營銷服務和其他服務收入同比增長率均超 20%,亮眼的成績背后,AI 成為了關鍵的增長引擎。
快手設定的AI目標很宏大,其面臨的挑戰(zhàn)也全方位且極為嚴峻。
一方面,快手計劃持續(xù)強化 AI 技術對原有商業(yè)生態(tài)的改造,為線上營銷服務和電商業(yè)務開拓新的增長空間。
理論上 AI 可以精準分析用戶需求,為商家提供更有效的營銷方案,但實際操作中卻困難重重。在內(nèi)容生產(chǎn)環(huán)節(jié),AI 更多只能起到輔助作用,無法從根本上解決內(nèi)容質(zhì)量參差不齊的問題;在經(jīng)營成本方面,AI 技術的引入可能會在一定程度上降低某些環(huán)節(jié)的成本,但同時也帶來了新的成本,如技術使用成本、數(shù)據(jù)安全維護成本等。
另一方面,快手全力升級以可靈為代表的 AI 商業(yè)化變現(xiàn)模式,試圖將可靈 AI 打造成為全球 1200 億美元視頻創(chuàng)作市場的 AI 基礎設施,進而實現(xiàn)從“中國第二大短視頻平臺”到“AI 視頻生態(tài)領軍者”的華麗轉(zhuǎn)身。
這無疑是一場豪賭。構建基礎設施意味著要具備強大的技術通用性、穩(wěn)定性以及廣泛的市場認可度,快手需要投入海量的資源用于技術研發(fā)、生態(tài)建設與市場推廣。而當前行業(yè)內(nèi),技術標準尚未統(tǒng)一,市場格局分散,快手在推動自身技術成為行業(yè)標準的過程中,必然會遭遇來自各方的阻力。
機遇與挑戰(zhàn)并存,如果快手不能在技術研發(fā)、商業(yè)策略以及行業(yè)責任擔當?shù)确矫孀龀錾羁陶{(diào)整與優(yōu)化,那么其所謂的“AI 視頻生態(tài)領軍者”的愿景,很可能只是鏡花水月,最終在激烈的市場競爭與行業(yè)變革中被無情淘汰。
原文標題 : 快手、字節(jié)“AI軍備競賽”:一場沒有贏家的技術泡沫秀?

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?
- 9 地平線自動駕駛方案解讀
- 10 封殺AI“照騙”,“淘寶們”終于不忍了?