訂閱
糾錯
加入自媒體

鯨對話|圖森未來為何要從自動駕駛駛轉向AIGC?

2024-12-27 15:06
藍鯨
關注

圖片

圖片來自視覺中國

藍鯨新聞12月23日訊(記者 武靜靜)昔日自動駕駛明星公司圖森未來在經歷退市等一系列風波后,已經重新選擇了創(chuàng)業(yè)航向。

2024年8月,公司首次透露將瞄準AIGC方向,四個月后的12月17日,公司宣布啟用全新品牌CreateAI,并發(fā)布了其首個圖生視頻大模型產品“Ruyi”。

目前,Ruyi-Mini-7B版本已經在huggingface上正式開源,用戶可以從下載使用,據了解,“Ruyi”專為在消費級顯卡(例如 RTX 4090)上運行。

從自動駕駛轉向AIGC,好調頭嗎?

公司為何從自動駕駛邁向截然不同的視覺大模型賽道?

圖森未來技術負責人在接受藍鯨新聞專訪時告訴藍鯨新聞,此次轉型主要是從公司轉型和業(yè)務發(fā)展的角度出發(fā)。一方面,公司此前在做自動駕駛時已經在AI領域積累了算法、算力和數據經驗;另一方面,聯合創(chuàng)始人陳默在游戲圈有資源積累,有機會快速將技術落地。

陳默也在此前接受媒體采訪時提到,圖森未來在試圖尋找一條更快能夠依靠現有資源“救活”公司的路,隨著視覺模型技術的不斷推進和公開,AIGC成為在商業(yè)化空間、技術可達性方面都符合條件的一個目前的最佳選擇。

據藍鯨新聞了解,圖森未來做視覺模型的團隊就是此前公司做自動駕駛的團隊,一些技術經驗可以復用。

圖森未來技術負責人談道,AI視覺模型和自動駕駛都依賴于算法、算力和數據這“三駕馬車”來推動技術發(fā)展,且兩者都依賴大量的數據進行訓練和優(yōu)化。而視頻生成技術與自動駕駛中的感知模塊非常相似,兩者都以數據驅動為主,研發(fā)路徑相對較短,依賴的技術基礎也比較清晰。

在他看來, 自動駕駛技術涉及感知、定位、規(guī)劃、控制等多個算法模塊,以及軟件系統、硬件設計、車輛結構設計等多個領域。相比之下,視頻模型技術的研發(fā)路徑更短,技術面更窄,主要集中在數據處理和模型訓練方面。

數據的重要性甚至超過算法,”圖森未來技術負責人強調,他提到圖森在自動駕駛領域積累了豐富的數據標注經驗,擁有自建的標注團隊和標注平臺,并建立了完整的數據處理流程。 “這些經驗和工具可以直接應用到視頻模型的數據準備階段,從而節(jié)省大量時間和成本!

當然,在很多視覺模型的技術和效果上,圖森還需要從零開始探索。目前,公司視頻模型主要圍繞五大關鍵指標進行:生成質量、一致性、可控性、易用性和成本

圖森未來技術負責人告訴藍鯨新聞,模型生成質量是首要目標, 確保生成的視頻內容在畫面、動作、細節(jié)等方面達到高水平。“公司采取螺旋上升式的研發(fā)策略,在保證生成質量和一致性的前提下,逐步提升模型的可控性、易用性和成本效益!

圖森選擇第三條路:不靠模型賺錢,自己下場做內容

當下,視覺模型領域新進展不斷,當地時間12月9日,美國OpenAI公司正式發(fā)布了最新版本的視頻生成大模型Sora-Turbo,它能夠根據文本、圖像或視頻輸入生成新的視頻內容。此外,國內市場,不論是字節(jié)、快手等大型科技巨頭,還是創(chuàng)業(yè)公司Pika、愛詩科技、生數科技等都在持續(xù)有緊鑼密鼓的推進技術和產品迭代。

圖森的入局是否是想在競爭激烈的視覺大模型賽道分一杯羹?

從目前公司的業(yè)務進展和采訪中得知,這個答案是否。圖森未來技術負責人告訴藍鯨新聞,更準確的說法是,圖森未來要成為一家內容公司而非大模型技術公司,和快手等平臺以及Pika等創(chuàng)業(yè)公司的方向并不相同。

目前,市面上視覺大模型的商業(yè)模式無非兩種:一類是Runway、Pika等公司,面向C端用戶,提供付費的視頻生成工具或服務,讓創(chuàng)作者付費自制內容;另一類是面向B端影視文娛以及游戲等公司,幫助產業(yè)降本增效。

圖森未來技術負責人向藍鯨新聞談道,如果定位成純粹的視頻模型公司,to C和to B都存在明顯挑戰(zhàn):

一方面,to C方向,視頻生成工具的目標用戶群是專業(yè)創(chuàng)作者,而非普通大眾收費模式和盈利前景都不明確,且視頻模型需要大量的算力支持,運營成本高,國內市場,很難在短期內依靠收費,吸引用戶并實現盈利。

另一方面,單純面向B端的技術賦能落地挑戰(zhàn)巨大,因為技術公司很難深入了解具體場景的需求,也很難將技術有效地融入到實際的制作流程中,控制內容的質量和風格。

相比很多視頻模型正在將重心瞄準在追求技術的通用性上,圖森選擇了不一樣的第三條路:直接把模型技術開源,不靠模型賺錢,并購入了經典IP,自己下場用大模型做內容。

據藍鯨新聞了解,公司目前有專門的動漫和游戲團隊已經在開發(fā)新項目。

“我們希望打造一家以AI技術驅動的視頻內容創(chuàng)作公司,打造端到端的視頻內容生成鏈條。最終通過優(yōu)質內容來吸引用戶和實現商業(yè)價值!眻D森未來技術負責人說道!技術只是工具,最終的目標是為用戶提供內容!

目前,圖森已經布局動漫、游戲板塊,其全新品牌CreateAI已經獲著名武俠IP《金庸群俠傳》正版授權,將開發(fā)一款大型武俠開放世界RPG游戲。2024年8月,公司也官宣了和上海三體動漫有限公司達成合作,共同開發(fā)《三體》系列的首部動畫長篇電影和視頻游戲。據悉,公司也會在12月推出 SLG 游戲工具和游戲本身。

“我們現在擁有「金庸群俠傳」和「三體」這兩個頂級 IP,我們的目標是在 2027 年實現 10 億美元的收入。”陳默在最近一次接受采訪時說到了圖森在AIGC方向的未來目標。

       原文標題 : 鯨對話|圖森未來為何要從自動駕駛駛轉向AIGC?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號