投資觀點

知識小學堂(關閉)

2024/03/14

【AI領航】Sora驚艷亮相!一句話就能生成高畫質擬真短片!

OpenAI新模型「Sora」讓馬斯克服輸

聊天機器人ChatGPT已經推出一年多,你跟他聊過天或是請他幫你寫文案了嗎? 當大家還在摸索如何有效透過指令使用ChatGPT時,OpenAI再次引爆全球焦點,你相信只要一段簡單文字就能夠創造出60秒高度擬真的影片嗎? 新的AI模型「Sora」辦到了!OpenAI稱Sora是「世界模擬器」,Tesla創辦人馬斯克更直言「人類認賭服輸」。

只要一段文字指令,Sora就可創造極度擬真的短片

Sora的名字來自日語的「天空」,意味著可以喚起無限創意,透過文字指令就可以生成最長60秒的高質量、高解析度、高連貫性的影片,而且只要幾分鐘就可以完成。Sora透過長達1萬小時的高品質影片進行訓練,其技術建構於先前推出的GPT和DALL-E,其中DALL-E是可根據文字生成靜態圖片的模型,而GPT則是能夠根據文字生成更長的文字描述。

Sora不僅了解用戶在指令中所描述的內容和物體,還知道這些物體是如何存在於現實世界。OpenAI網站可以看到Sora模型生成的範例影片,包括獨自走在東京街頭的時尚女性、一群在雪地狂奔的長毛象、在色彩繽紛的建築旁跳著窗沿行走的大麥町,這些影片栩栩如生,涵蓋了不同的風格、主題、角色、特定動作類型以及大量細節的複雜場景,液體流動和光影變化都處理地極為逼真,透過虛擬的AI創造出讓人驚豔的真實感。

除此之外,Sora還具有將現有靜態圖片轉化為影片的能力,能夠精準地將圖片內容動態化,並注重細節的表現;甚至能夠接續現有的影片內容,或是補充那些缺失的畫面,讓影片更完整。


資料來源:OpenAI,2024/02

一般民眾想要使用Sora還要再等等

Sora引起了廣泛的討論和期待,不過當前的Sora模型仍存在弱點,像是難以準確模擬複雜場景的物理原理,同時可能無法理解前因後果之間的關聯等。舉例來說,可能一個人咬了一口餅乾卻不會出現咬痕;此外,OpenAI意識到AI生成的內容可能引起的爭議和風險,特別是假訊息和仇恨內容等問題,目前仍需要採取幾項重要的安全步驟,因此僅暫時開放於特定對象測試使用。

Sora夾帶破壞式創新的影響力

目前除了受微軟資助的OpenAI之外,不少科技巨頭也在積極研發AI影片生成器,例如Meta的Emu Video、Google的Lumiere,但Sora能夠保持多鏡頭之間的流暢切換,確保連貫性和對象的一致性,這使得他在AI影片生成領域中獨具優勢。

生成式AI進化的速度遠遠超乎預期,並且夾帶著極具破壞式創新的潛力,雖然短期仍無法撼動影視產業,然而Sora的出現無疑對短影音、動畫、電影等影視產業帶來衝擊,卻也帶來了新的機遇和可能性,或許未來透過Sora模型可以大幅降低影片製作的成本、時間和難度,讓更多的「素人」創作者能夠實現自己的想法,甚至可以激發現有創作者不同的創造靈感,並且改變影片創作的遊戲規則!

資料來源:OpenAI,數位時代,風傳媒,科技新報,保德信整理,2024/03。注意:本資料所示之指數或個股係為說明或舉例之目的,並非推薦投資,且未必為保德信投信所管理基金之對比指數及或持有之部位或所投資之標的。投資人申購基金係持有基金受益憑證,而非本文提及之投資資產或標的。

PGIMSITE20240329


上一篇 上一篇 下一篇 下一篇

立即交易

線上預約開戶

基金淨值

訂閱電子報

行事曆