聲明:本文來自于微信公眾號 頭號AI玩家(ID:AIGCplayer),采訪| 月山橘 賴賴,授權轉載發布
48小時不到,OpenAI首個文生視頻模型Sora官宣推文在X上瀏覽量破八千萬。
爆火的原因無它,該模型能根據文字提示詞生成長達1分鐘的多視角高清視頻,僅這點就足以吊打市面上主流的如Runway、Pika、SVD等AI視頻生成工具。
圍繞Sora發布,全網各路玩家熱議不斷,有人贊美、有人唱衰,也有人已經做好99元限時優惠的Sora模型課程。
喧囂之下,我們今天邀請到9位業內一線玩家,探討Sora對內容行業、尤其是視頻領域帶來的影響,以及AIGC沖擊下,誰會被淘汰,未來內容從業者又需要具備什么樣的核心競爭力。
@海辛 實驗電影人、AIGC藝術家
“Sora可能是目前AI視頻模型里,寫實類表現最好的”
目前看demo,Sora寫實類的效果應該表現特別好,可能會是目前AI視頻模型里寫實類表現最好的。
風格化的demo展現有限(只有一個2D插畫類型的)可能和訓練素材更多在寫實素材上有關。我認為可能會出現和DallE2一樣比較尷尬的位置:至今你都沒辦法讓DallE2畫具體某個游戲畫風的角色/場景,由于數據集本身的多樣性不夠,導致沒有辦法做具體的項目風格,風格沒有辦法自定義,對于大多數商業項目來說就沒有意義,即實用性很低。
但看img2video(圖生視頻)的部分,做氛圍片、概念片,這種類型的片子應該綽綽有余了,是能吃掉一部分市場的。
Sora還有兩個很厲害的地方:
1. 生成多個鏡頭,同時主角保持相對連貫,這個是在之前的AI視頻生成工具(只能生成單個鏡頭且細節總是無法保持統一)沒有做到的。
2. 提供了一種新的視頻編輯交互范式,即用自然語言來描述視頻的修改需求,然后生成新的視頻,這在其V2V editing(視頻生視頻)的部分體現得很突出。
十分贊同“人人都是導演”這種說法,工具和資本本來都是創作的門檻,這個門檻越來越低了是好事。
@土豆人toudou_man AIGC藝術家
“Sora面世,未來創作者的價值體現在解決實際問題”
60秒在生成式視頻領域里算是長視頻了。Sora模型在多鏡頭、連續內容、穩定性、高畫質、空間認知等方面,給現有的技術工具如SVD、Pika和Runway帶來了不小沖擊。
Sora的面世意味著個人創作者的應用空間被進一步拓展,無需依賴傳統拍攝和制作手段就能創作出高質量的內容。未來這樣穩定的生成式內容也會逐步滲透到廣告和影視領域,至少在一定程度上替代部分現有的工作流程。
對于Sora的實際效果,我持謹慎態度。真正影響AI生成式視頻內容在廣告和影視領域發展的,還是內容一致性和內容準確性兩個重要的判斷標準。這兩個標準是決定技術能否被引入工業流程的關鍵因素。
可以預見,Sora會和早期圖文生成一樣,進一步降低視效內容創作的門檻,卷死一些中層的內容創作者和制作公司。但同時,帶來的也是全新的機會點,因為創作門檻降低,視頻創作內容的維度也會迎來新的井噴。
部分創作者和公司焦慮的主要源頭是“單位價值”,如果內容被判定為廉價且易于制作的,那就意味著產出的內容不值錢。AIGC的核心競爭力是降本增效,創作者的價值則體現在是否能解決實際問題、內容產出的定位和創作者的IP影響力。
@八云 宙晴營銷實驗室創始人
“談不上打擊,企業和內容生產者應該看到Sora帶來的降本提效機會”
我一直比較堅信未來商業組織的形式會發生改變。DAO(去中心化自治組織)實現了公平的分配機制,剩下的是如何最大化解放個體生產力。Sora的出現則提供了更廣闊的想象空間,比如一個由AGI和區塊鏈結合的、沒有總部的獨角獸公司。
回看抖音的發展路線,是工具到社區、再到國民級娛樂應用。但是抖音犧牲了一部分工具屬性來換取更多的社交屬性,所以后面有了剪映來支持比抖音直拍更復雜的內容生產。
Sora通過指令去生成完整視頻這個形式,抖音和剪映沒法比較了,因為在降低門檻和成本上已經不在一個級別。
所以Sora是否能從工具走向內容消費,在于上線后看看這個工具對生產力解放到什么地步,通過指令生成的視頻需要“調教”的比例是多少、難度高低如何。
我目前對AIGC使用最多是基礎編輯、設計工作,提升工作效率。另外,我的一個小癖好是編寫世界設定,已經寫滿了幾個備忘錄。之所以會成為一個獨特的興趣是因為沒有生產力和時間把這么多的設定變成長內容,無論是小說還是影像,目前都需要投入大量時間甚至新的學習成本。所以我對Sora是充滿期待的。
以目前Sora的測試視頻看,我覺得對于影視工業來說談不上打擊,更多的作用是降低成本。個體創作者應該會加倍興奮,技術迭代讓創作者的核心能力集中在內容本身,比如故事能力,光影分鏡只要你腦海里有,且能表達出來,生產內容的能力會指數級提高。
Sora對內容行業的賦能是雙向的。其實短視頻平臺已經實現了“人人都是導演”,生產工具從膠片到手機,人人持有。個體KOL比拼的也已經是性格魅力、表演里和故事力,當本來就手握生產工具、制作和發行的賬號創作者迎來Sora這樣的工具的時候,未來可能會有影視公司購買短視頻作品版權。因為你可以一個人生產有完整設定和世界觀的短片。
另一方面,Sora在國內很可能會先解決營銷號重復內容、碎片內容、純情緒內容的生產成本。相比影視行業,可能直接沖擊的工作崗位是營銷號小編或者集中編短劇的“內容村”。
企業營銷負責人和內容生產者應看到Sora帶來的降本提效的機會,尤其是在短視頻傳播和獲客方面。此外,如何把個人編寫的世界設定變成短片,也是等Sora模型上線后,我會去觀察的另一個方向。
@尹伯昊 猴子無限CEO
“內容生產成本降低之后,需求也會更大規模地提升”
Sora在技術上最大的變化就是,引入了在文本模型中被充分驗證有效的自回歸策略(以Tranformer為具體的技術實現方式),讓視頻生成的邏輯從關注像素變化變成關注語義變化,從空鏡頭生成變成故事的生成。
作為對比,在Sora之前的文本生成視頻的工作大多關心:如何讓單幀圖片強行動起來,導致生成出來的內容很像空鏡頭。
這實際上是技術路徑上的系統性升級,但是恰恰因為這是找到了一條很好的路徑,所以其他團隊跟進會更容易(而GPT-4才是真正大量具體技巧組成的,更難以被跟進)。我相信三個月內市場上就會有達到現有Sora80%效果的跟進模型出現,甚至有局部場景的領先。
目前看X上發布的Sora視頻,可以看出其下限是非常高的,而且有很多內容上限也很高,基本上達到了可以在大熒幕上直出的狀態。
猴子無限不是基座模型公司,所以理論上所有基座模型上的進展對于我們來說,都是充分的利好,因為我們可以在基座模型的能力基礎上做很多額外的工作,比如產品化地解決穩定性和可擴展性的問題,并變成給客戶的解決方案。“客戶不需要鉆頭而需要是墻上鉆好的眼”,市場上新的“鉆頭”出現之后,能加速我們“鉆出的眼”的質量和價值,這件事對于行業中絕大多數公司是一致的。
很多創作者擔心Sora(和已經出現很久的其他大模型)帶來影視行業的失業,是因為我們看到了供給效率的快速提升,而沒有去關心因為內容生產成本降低之后,需求更大規模的提升,如果我們相信全新的需求會因此井噴,那么大概率焦慮會小很多。
未來內容創作者最大的機會其實是,從商業的角度看世界,跳出傳統的“工具人”角色,去找到因為新技術出現能夠滿足的新機會,比如:將已有的內容規模化地變成更有吸引力和LTV的形式(小說變有聲書和視頻);根據長尾理論,滿足過去因為成本過高無法被滿足的需求;將單語言和單文化的內容快速擴展到更多文化和國家中(換臉和配音本地化),機會遠超在現有需求中和AI內卷。
至于Sora未來會不會取代TikTok,從一個內容創作工具變成內容分發、消費平臺,我認為一個很好的例子是印刷術,這涉及到內容消費的權力。在印刷術發明之前,人們需要聚集在教堂里聽識字的人拿著羊皮卷圣經傳道,這個過程中,掌握媒介的人實際上掌握了社會權力。
現在內容創作的權力被新技術下放了,TikTok帶來的權力結構(中心化的內容生產者)一定會發生系統性的變化。未來大概率是有新的形態出現,但是和TikTok是平行而不是替代的關系,就像雖然圣經隨處可得,現在仍然有教堂一樣。
@Genji 人工智能頭部博主
“Sora實現了從0到1的突破,從1到100甚至10000只是時間問題”
Sora被描述為一個“世界模型”,這個概念意味著它不遠不止是一個簡單的視頻生成器,而是一個能夠理解和模擬物理世界復雜運行規律的模型。
從放出的Demo中,我們可以看到,Sora在視頻長度、一致性、分辨率、對世界的理解等方面表現出了許多突破,但是對于文生視頻領域中一個非常重要的問題——真實世界的事件運行方式需要符合物理定律,Sora目前并沒有給出完美的解決方案。
關于Sora模型的技術細節和實現方式,以及它是否使用了虛幻引擎UE5(Unreal Engine5),都只是基于模型展示的效果和現有AI技術的推測。
Sora發布后,很多人宣稱電影特效、影視拍攝、短視頻等工作崗位將面臨失業危機,我認為這在短時間內不會到來。目前,我已經把AIGC工具融入了自己日常的工作流,雖然AI的強大能力不容置疑,但我的直觀感受是,現在的AI仍缺乏“靈性”。
一個好的文學藝術作品,不止需要有好的技術呈現形式,更要有好的故事創意和情感溫度。在一些短平快的內容上,AI的速度優勢已經明顯體現出來了,我認為這不是一件壞事,它可以把人類創作者從中解放出來,從事更具創造性的活動。
可以說,Sora的誕生讓我們離AGI更近了。一旦實現了從0到1的突破,那么1到100甚至10000就只是時間問題。
@喬治 電影制作與游戲引擎從業者
“影視制作預可視化、特效低成本化開啟新紀元”
Sora完全是一個跨時代的產物,它的底層邏輯完全不是目前已知的模式,跟Runway Gen-2、Pika,還有本地部署的SVD都不是一個級別的。
Runway和Pika我都使用過,真正生成視頻素材的過程中,就是在抽卡,抽個十次才有可能得到一個能用的鏡頭,效果實際也一般,畫質有待進一步提升。但兩者都收費,不是很實用。
“人人都是導演”的趨勢是擋不住的,這是一個時代進程問題。未來會更考驗創作者的功底,AI繪畫的門檻是低,但想把AI繪畫工具用好,可能還是有專業繪畫背景的那幫人更有優勢。你要有審美和認知,懂原理,才能更好地駕馭AI。現在做視頻也一樣,像我們做電影電視劇的,即便交給AI去生成視頻鏡頭和素材,也依然需要了解傳統制作的所有方法,普通人入圈是沒有什么用的。
對于高成本的特效場景,Sora可以提供一種成本更低的替代方案,尤其是在預算有限的項目中。比如電視劇和電影有些鏡頭,按照傳統的拍攝和制作流程,報價比較高,就可以直接用AI來做。
還有一種情況,導演很多天馬行空的創意,成本和經費都是hold不住的。但AI可以在影視制作前期用于預可視化,幫助導演和制片人更直觀地規劃場景和故事線,大大降低制作公司、影視公司、視效指導等多方的溝通成本和試驗成本。
@李3水 W的野狗頭子
“人人都是導演”是五年前的說法,目前應該是“人人都是電視臺”
對于Sora可能會給個體內容創作者或廣告公司帶來的沖擊,W的態度是“只嫌風浪還不夠大”,希望各行業最期(焦)盼(慮)的影響加速到來,且趨勢成真。
歷史性技術大爆發都是漸進加速的,目前所有東西都是外部技術和應用環境遠超內部、定義和定價權全然不在自己人手上,比起Sora最后實際落地是否能夠超預期,這種不理想體驗更心塞。
“人人都是導演”是五年前的說法,目前應該是“人人都是電視臺”。
面對AI沖擊,W一直倡導的務虛能力和哲科思維,我認為是未來內容創作者應該培養的核心競爭力。
@雷濤 新壹科技CEO
“Sora仍是生成視頻素材級別的AI工具”
在視頻生成技術方面,目前新壹科技實現了4秒視頻生成,效果與Pika/Runway類似。而Sora支持最長60秒視頻生成,目前釋放出的試用效果遠遠超出了市場上已有的其它產品。但整體而言,Sora仍然是生成視頻素材級別的AI工具,一個完整的視頻作品通常需要幾十個素材才能構成。
新壹科技的一幀秒創可以通過已有素材、AI素材的組合完成作品級的視頻生成,Sora生成的素材同樣可以為秒創所用。素材生成技術的進步對秒創是極大的利好,一方面可以降低對現成素材的依賴,另一方面也能夠提升生成效果。
不過,視頻最終比拼的還是創意,有創意的人始終是少數,GPT出來這么久了也沒見人人都成為作家。Sora可以幫助那些沒有視頻制作技能但有好創意的人,跟專業創作者站到同一條起跑線。
@方偉 游方科技CEO
“一個生產力爆炸的時代正在開啟,內容行業會卷到沒法想象”
相比之前的模型,Sora確實讓影視從業者更加焦慮了。目前來看,Sora生成視頻的效果和時長都可以滿足商業。身邊做AI文生視頻的朋友,很巧也在面臨裁員,不做底層模型轉做應用了。我們也在等Sora的API開放,落地接一些短視頻之類的廣告業務。
至于短劇是否可行,還得等模型出來后自己測一波。
一個生產力爆炸的時代正在開啟,以后大家都要拼創意,內容行業會卷到沒法想象。
Sora完全有可能從一個視頻內容創作工具變成視頻內容分發、消費平臺,這要看Sam(OpenAI CEO)怎么想,但Sora替代不了TikTok,團隊基因不一樣。
寫在最后
Sora的橫空出世,無疑給AI視頻生成領域帶來了新一輪洗牌。內容從業者和AI創業公司都需要重新審視自己的核心競爭力,在新一輪技術浪潮中找到自己的位置。
對于個人內容創作者,Sora將視頻創作門檻無限拉低,內容創作將不再受限于技術呈現形式,而進入拼創意、拼內容調性、拼人設、拼IP的時代。每個人都有可能成為機構之外的超級個體,借助Sora等AI工具,將自己的創意轉化為引人入勝的視頻。
對于企業而言,Sora不僅僅是一個降本增效的工具,也開啟了一種全新的商業模式和組織形態的探索。誰能篤定未來不會出現一家由AGI和區塊鏈結合的、沒有總部的獨角獸公司呢?
目前,市場上對Sora的期待與溢美之詞已經鋪天蓋地,然而,其真正的價值與影響還需要在實際應用中驗證。本文通過分享9位一線從業者的思考,希望能幫助大家更理性地評估Sora帶來的機遇與挑戰。