SORA放大招?讓馬斯克認(rèn)輸?shù)腁I到底有多猛?
回顧剛剛過(guò)去的2023年,如果要問(wèn)什么東西最火的話(huà),大模型肯定是其中最靚的仔,就在最近用GPT引爆全球大模型賽道的OPEN AI再度給市場(chǎng)一記重拳,甚至連馬斯克都不得不愿賭服輸,這就是全新的視頻生成大模型,這個(gè)全新的大模型到底有多猛?我們?cè)撊绾慰创@件事?
一、視頻生成大模型再放大招?
據(jù)每日經(jīng)濟(jì)新聞的報(bào)道,據(jù)OpenAI官網(wǎng),OpenAI首個(gè)視頻生成模型Sora發(fā)布,完美繼承DALL·E 3的畫(huà)質(zhì)和遵循指令能力,能生成長(zhǎng)達(dá)1分鐘的高清視頻。
AI想象中的龍年春節(jié),紅旗招展人山人海。有緊跟舞龍隊(duì)伍抬頭好奇觀(guān)望的兒童,還有不少人掏出手機(jī)邊跟邊拍,海量人物角色各有各的行為。一位時(shí)髦女士漫步在東京街頭,周?chē)菧嘏W爍的霓虹燈和動(dòng)感的城市標(biāo)志。
一名年約三十的宇航員戴著紅色針織摩托頭盔展開(kāi)冒險(xiǎn)之旅,電影預(yù)告片呈現(xiàn)其穿梭于藍(lán)天白云與鹽湖沙漠之間的精彩瞬間,獨(dú)特的電影風(fēng)格、采用35毫米膠片拍攝,色彩鮮艷。
OpenAI表示,公司正在教授人工智能理解和模擬運(yùn)動(dòng)中的物理世界,目標(biāo)是訓(xùn)練出能夠幫助人們解決需要與現(xiàn)實(shí)世界互動(dòng)的問(wèn)題的模型。在此,隆重推出文本到視頻模型——Sora。Sora可以生成長(zhǎng)達(dá)一分鐘的視頻,同時(shí)保證視覺(jué)質(zhì)量和符合用戶(hù)提示的要求。
Sora模型能夠生成包含多個(gè)角色、特定類(lèi)型運(yùn)動(dòng)和主體及背景精確細(xì)節(jié)的復(fù)雜場(chǎng)景。該模型不僅能理解用戶(hù)在提示中所要求的內(nèi)容,還能理解這些事物在現(xiàn)實(shí)世界中的存在方式。
對(duì)于這款全新的產(chǎn)品,世界知名企業(yè)家馬斯克也不吝贊美之詞,馬斯克回應(yīng)稱(chēng):“gg人類(lèi)(gg humans)。”據(jù)媒體引申,gg是網(wǎng)絡(luò)游戲用語(yǔ)“goodgames”的縮寫(xiě),主要用于游戲結(jié)束后,輸贏(yíng)雙方都可以用。但現(xiàn)在多由失敗方發(fā)出,表示認(rèn)賭服輸、心服口服的意思。在馬斯克帖子的評(píng)論區(qū)里,還有用戶(hù)附和道:“gg好萊塢”。
360集團(tuán)創(chuàng)始人、董事長(zhǎng)周鴻祎在微博發(fā)文談文生視頻模型Sora。周鴻祎認(rèn)為,Sora意味著AGI實(shí)現(xiàn)將從10年縮短到1年。他分析說(shuō),OpenAI訓(xùn)練這個(gè)模型應(yīng)該會(huì)閱讀大量視頻,大模型加上Diffusion技術(shù)需要對(duì)這個(gè)世界進(jìn)行進(jìn)一步了解,學(xué)習(xí)樣本就會(huì)以視頻和攝像頭捕捉到的畫(huà)面為主。一旦人工智能接上攝像頭,把所有的電影都看一遍,把YouTube上和TikTok的視頻都看一遍,對(duì)世界的理解將遠(yuǎn)遠(yuǎn)超過(guò)文字學(xué)習(xí),一幅圖勝過(guò)千言萬(wàn)語(yǔ),而視頻傳遞的信息量又遠(yuǎn)遠(yuǎn)超過(guò)一幅圖,這就離AGI真的就不遠(yuǎn)了,不是10年20年的問(wèn)題,可能一兩年很快就可以實(shí)現(xiàn)。
二、Sora到底有多猛?
隨著科技的飛速發(fā)展,人工智能(AI)已經(jīng)成為了當(dāng)今世界最為熱門(mén)的話(huà)題之一。其中,OpenAI的ChatGPT和Sora等模型的出現(xiàn),更是顛覆了我們的認(rèn)知,Sora的出現(xiàn)到底意味著什么?當(dāng)馬斯克都要認(rèn)輸?shù)臅r(shí)候我們到底該怎么看?
首先,Sora的出現(xiàn)無(wú)疑是另一大里程碑。ChatGPT作為OpenAI研發(fā)的里程碑式語(yǔ)言模型,其強(qiáng)大的自然語(yǔ)言處理能力和對(duì)上下文理解的深度,在推出后迅速引發(fā)了全球范圍內(nèi)的廣泛關(guān)注和熱議。ChatGPT不僅能夠流暢對(duì)話(huà)、解答問(wèn)題,還能生成具有邏輯性和創(chuàng)造性的文本內(nèi)容,這一突破性進(jìn)展讓人們看到了人工智能在認(rèn)知智能領(lǐng)域取得的重大飛躍。
緊隨ChatGPT之后,OpenAI又推出了視頻生成模型Sora,該模型更是將AI技術(shù)推到了一個(gè)全新的視覺(jué)維度。Sora憑借其創(chuàng)新的文本到視頻轉(zhuǎn)換能力,使得AI從理解和生成文本躍升至創(chuàng)作高清視頻內(nèi)容的新高度。通過(guò)理解用戶(hù)輸入的文字描述,Sora可以自動(dòng)生成包括復(fù)雜場(chǎng)景、多角色動(dòng)態(tài)交互在內(nèi)的長(zhǎng)達(dá)一分鐘的流暢高清視頻,這標(biāo)志著OpenAI在跨模態(tài)學(xué)習(xí)與生成方面取得了重大突破。
其次,Sora的最大突破還是在于理解人類(lèi)語(yǔ)言并且通感成為視頻。Sora模型的核心優(yōu)勢(shì)體現(xiàn)在它能夠理解人類(lèi)語(yǔ)言輸入,并基于這種理解進(jìn)行視頻內(nèi)容的創(chuàng)造性生成。通過(guò)深度學(xué)習(xí)和跨模態(tài)技術(shù),Sora能夠?qū)⑽谋久枋鲋械某橄蟾拍、情境、甚至是情感色彩映射到視覺(jué)表達(dá)上,生成與描述相匹配且具有一定連貫性的視頻片段。
盡管目前生成的視頻可能在細(xì)節(jié)處理、物理真實(shí)感或者復(fù)雜交互場(chǎng)景等方面還存在不完善之處,但其突破性在于首次實(shí)現(xiàn)了從文本到高質(zhì)量視頻內(nèi)容的有效轉(zhuǎn)化,這為內(nèi)容創(chuàng)作者提供了一種全新的工具,大大提升了創(chuàng)意表達(dá)的效率和可能性。此外,Sora的應(yīng)用價(jià)值也體現(xiàn)在教育、娛樂(lè)、廣告設(shè)計(jì)等眾多領(lǐng)域中,它有可能重塑這些行業(yè)的生產(chǎn)方式,并為未來(lái)更加智能化的內(nèi)容創(chuàng)作打下堅(jiān)實(shí)基礎(chǔ)。
第三,視頻的變革可能遠(yuǎn)超過(guò)文字的變革,而且速度會(huì)更快。在當(dāng)前的互聯(lián)網(wǎng)時(shí)代,視頻已經(jīng)成為人們獲取信息、娛樂(lè)休閑的主要方式之一。每天都有大量的視頻內(nèi)容被上傳到網(wǎng)絡(luò)上,涵蓋了新聞、教育、娛樂(lè)、廣告等各個(gè)領(lǐng)域。這些豐富的視頻資源為大模型的學(xué)習(xí)提供了寶貴的素材。
通過(guò)對(duì)這些視頻進(jìn)行深度學(xué)習(xí)和分析,大模型可以不斷地提取和總結(jié)視頻中的視覺(jué)元素、場(chǎng)景轉(zhuǎn)換、敘事結(jié)構(gòu)等規(guī)律,從而提高自身的生成能力。同時(shí),大模型還可以利用這些視頻資源進(jìn)行自我迭代和優(yōu)化,不斷提升自身的性能和效率。
隨著Sora等大模型的快速普及和應(yīng)用,我們可以預(yù)見(jiàn)一場(chǎng)行業(yè)變革正在醞釀之中。對(duì)于內(nèi)容創(chuàng)作者來(lái)說(shuō),大模型將極大地提高他們的創(chuàng)作效率和質(zhì)量,降低創(chuàng)作成本。他們只需輸入簡(jiǎn)短的文字描述或創(chuàng)意想法,就可以快速生成符合要求的視頻內(nèi)容,大大節(jié)省了時(shí)間和精力。
對(duì)于廣告公司、影視制作公司等企業(yè)來(lái)說(shuō),大模型將為他們帶來(lái)更多的商業(yè)機(jī)會(huì)和創(chuàng)新空間。他們可以利用大模型快速生成廣告宣傳片、宣傳片等視頻內(nèi)容,提高品牌曝光度和用戶(hù)黏性。同時(shí),大模型還可以幫助他們實(shí)現(xiàn)個(gè)性化定制服務(wù),滿(mǎn)足客戶(hù)的個(gè)性化需求。
第四,人類(lèi)到底該怎么辦?隨著人工智能技術(shù)的不斷發(fā)展和普及,嚴(yán)防死守來(lái)防止其應(yīng)用已經(jīng)變得不再現(xiàn)實(shí)。從長(zhǎng)遠(yuǎn)來(lái)看,更好的策略是積極地去理解和利用人工智能,而不是試圖阻止它的發(fā)展。
一方面,人工智能在很多領(lǐng)域已經(jīng)展現(xiàn)出了巨大的潛力和價(jià)值。例如,在醫(yī)療領(lǐng)域,人工智能可以幫助醫(yī)生進(jìn)行疾病診斷和治療方案制定;在交通領(lǐng)域,人工智能可以提高交通流量和安全性;在金融領(lǐng)域,人工智能可以幫助進(jìn)行風(fēng)險(xiǎn)評(píng)估和投資決策等。因此,通過(guò)積極利用人工智能,人類(lèi)可以創(chuàng)造更多的價(jià)值,提高生活質(zhì)量。
另一方面,理解和利用人工智能也需要人類(lèi)不斷地進(jìn)行探索和創(chuàng)新。隨著人工智能技術(shù)的不斷發(fā)展,新的應(yīng)用場(chǎng)景和商業(yè)模式也將不斷涌現(xiàn)。通過(guò)不斷學(xué)習(xí)和實(shí)踐,人類(lèi)可以更好地掌握人工智能的技術(shù)和應(yīng)用,推動(dòng)其與社會(huì)、經(jīng)濟(jì)、文化等各個(gè)領(lǐng)域的深度融合。
因此,與其盲目地抗拒人工智能,不如積極地去理解和利用它。通過(guò)不斷學(xué)習(xí)和創(chuàng)新,人類(lèi)可以更好地掌握人工智能的技術(shù)和應(yīng)用,推動(dòng)其與社會(huì)各個(gè)領(lǐng)域的深度融合,這樣才是人工智能時(shí)代真正的生存之道。
原文標(biāo)題 : SORA放大招?讓馬斯克認(rèn)輸?shù)腁I到底有多猛?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線(xiàn)大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線(xiàn)下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線(xiàn)會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線(xiàn)自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?