Sora自今年初開始,OpenAI便不斷在社群上釋出用Sora製作的各種AI生成影片,成功吊起全球創作者與技術愛好者的胃口。許多人好奇Sora究竟該如何使用、何時上線,如今終於在「Shipmas」產品發布期間正式亮相。全新「Sora Turbo」模型延續了DALL·E與GPT系列模型,將生成式AI技術從圖像、文字擴展至影音領域,不僅可以透過prompt生成影片,甚至可以擴展、融合不同影片,還能透過分鏡腳本(storyboard)創造每一幀的畫面。Sora目前已向美國及大多數國家的ChatGPT訂閱者開放,而台灣也在名單之中。
值得一提的是,許多使用者認為每月200美元的ChatGPT Pro訂閱費有點昂貴。然而,若你只是想先「試水溫」,每月20美元的ChatGPT Plus方案其實也可以使用Sora,雖然在此方案中功能相對有限(影片解析度最多只能達到720p,而且影片時長僅有5秒)。但至少能初步體驗Sora的威力,再決定是否升級到更高方案。
什麼是Sora:Sora的技術背景
Sora是一款以「擴散模型」(diffusion model)為基礎的影片生成工具。此模型透過逐步將「雜訊」影片轉化為清晰成品,並且能同時考量多個畫面格幀,確保影片中的主體與場景在鏡頭移動或消失時仍能保持一致。此特性解決了傳統模型易出現角色或物件失真、畫面不連貫等問題。
Sora借鑑了DALL·E與GPT模型的成功經驗,並使用稱為「重描述」(recaptioning)的技術,能為訓練素材產生高度描述性的文字標籤,讓模型更精準理解並回應使用者的指令。透過此技術,使用者可以純粹透過文字描述影片場景、動作、風格,即可生成對應影片。此外,Sora支援將靜態圖片動畫化、延伸既有影片畫面,甚至填補遺失的片段。這些技術正是OpenAI在朝向通用人工智慧(AGI)邁進的一大里程碑。
另外,許多人會在意Sora的訓練資料來源,OpenAI也有作出解釋。Sora的訓練數據來自多元管道,包括公開可取得的影片與圖像資料集、合作夥伴(如Shutterstock、Pond5)所提供的專有素材,以及OpenAI自行委託與建立的客製化資料集。宣稱這些內容全都在合法授權及嚴謹使用條款下取得。
同時,OpenAI不僅依靠訓練師的專業審查,還設有專門的「紅隊」來進行嚴格測試。紅隊成員以「攻擊者」或「質疑者」的角度刻意挑戰模型,透過提出棘手或潛在不當的指令,協助發現模型的弱點並給予回饋。藉由訓練師與紅隊的雙重把關,持續優化Sora的生成品質與安全性,期望在真實使用情境中保持穩定、可靠與合乎道德的表現。
不過,在先前訪談中,OpenAI前CTO Mira Murati對於「訓練資料中是否包含來自YouTube、Instagram Reels等平台的影片」這敏感的提問,並未給出明確的答覆(甚至表情有點僵),僅強調Sora以公開可取得的素材為基礎。巧合的是,知名科技評論家MKBHD在他最新Sora評測影片中指出,當他輸入與自己相關的關鍵字時,Sora生成的影片中竟出現與他頻道影片中曾出現的「假盆栽」類似的元素。這讓大家不免猜測,任何曾公開發佈的影片都有可能成為模型學習的一部分。
Sora影片編輯功能介紹
Sora不僅能從文字指令生成影片,更提供多種編輯方式,以下讓我來介紹一下主要功能:
1.Remix(重混)
Remix功能的精髓在於透過一連串的文字指令,逐步對影片中的元素、風格和場景進行局部或大幅度的變更。不需要重新從零開始生成影片,而是能在既有基礎上持續「微調」或「轉換」影片內容。例如官方給的例子:
- 「打開通往圖書館的大門」 → 換成「將這些門替換為法式門」
- 「把圖書館變成一艘太空船」再改為「移除太空船,加入一片叢林」
- 最後再「將叢林景色替換為月球景致」
2.Re-cut(重新剪輯)
Re-cut功能讓你在生成的影片中選擇特定的畫面,並針對這些片段進行前後的擴展或對焦處理。
3.Storyboard(分鏡編輯)
Storyboard功能可說是這次釋出中最令人矚目的一項。透過這個功能,可以在時間軸上逐格安排影片內容,替每個時間點設定特定的畫面、風格或動作。如此一來,還未生成影片前就能清楚掌握整體敘事結構,非常適合用來製作廣告、劇情短片等各類作品。
4.Loop(循環動畫)
將持續搖曳的樹影、燃燒的營火、海浪迭接成無縫重複影片,適合製作背景動態、GIF風格素材。
5.Blend(融合)
Blend功能讓兩部影片合併成一個流暢的片段。如果你有一段在森林中拍攝的片段,另一段則在海岸邊拍攝,透過Blend可將森林過渡到海岸的轉場做得自然順暢,看起來像是一氣呵成。
6.Style presets(預設風格)
預設風格是將複雜指令組合成簡單的一鍵套用方案。想要看起來真實又有年代感,可選擇「紀實」(Archival)風格;想展現黑白懸疑的神秘氣氛,則可以選擇「黑色電影」(Film Noir)風格。
Sora怎麼用:從下指令到成品的流程
Sora的介面設計相當簡潔直覺,就算是初學者也能輕鬆上手。
1.輸入指令或上傳素材
在Sora Video Editor底部的輸入框中,以文字描述想要的影片內容、場景或氛圍,或上傳已取得合法授權的圖片、影片素材。無論是天馬行空的創意,還是現成的素材,都能成為影片製作的出發點。
2.調整設定
在提交生成前,先決定影片的比例、解析度、影片長度,以及要產出多少個不同版本(variations)。這些設定會影響點數(credits)的消耗量,可以先考量需求與成本後再按下確認。
3.生成與預覽
點擊提交後,系統通常在數十秒至一分鐘內生成影片。完成後,如果你選擇同時生成多個版本,可前往「Library」一口氣瀏覽所有版本,從中挑選最接近理想的成品。
4.收藏、分享、下載
每個生成的影片都能下載成MP4格式,也可以透過連結分享。如果是較高級的ChatGPT Pro訂閱方案,下載檔案將不會有浮水印,能夠做更廣泛的用途。
5.社群探索功能(Explore)
Sora的「Explore」探索頁面就像是個短影音平台,可以在這裡滑滑別人公開的創作,從中還可以看到他們的指令和使用的功能。
使用Sora必須知道的幾件事
1.預設為公開分享
Sora生成的影片,預設為自動公開在探索頁面。如果不想讓自己的創作馬上曝光,可以到設定中關閉「Publish to explore」選項。
2.版權與肖像權
請務必使用擁有合法授權的素材,並避免上傳他人肖像。違規內容不僅可能引發法律問題,也可能產生不當的深偽影片。
3.安全防護機制與禁止內容
別想拿Sora來做壞壞的事!Sora會在影片中自動加入數位浮水印和符合C2PA標準的中繼資訊,以確保影片溯源。系統嚴格禁止製作違法、有害、誤導及涉及性剝削、兒童不當內容的影片。
4.地區支援與流量限制
台灣目前已列為支援地區,但因為流量爆量,很多人(包括我自己)嘗試使用時都收到「Sora account creation is temporarily unavailable」的訊息。所以即便是訂閱用戶,也可能受到流量的限制,無法使用。
方案比較:訂閱與功能一覽
目前ChatGPT Free、Enterprise、Edu帳戶無法使用Sora。以下為ChatGPT Plus與Pro的比較表:
訂閱方案 | 價格(月費) | 影片額度與點數 | 解析度與時長限制 | 浮水印 |
ChatGPT Plus | 20美元 | 每月最多50部高優先序影片 (1,000點數) | 最多720p、5 秒。 | 有 |
ChatGPT Pro | 200美元 | 每月最多500部高優先序影片 (10,000點數) 用完後仍可「無限生成」影片,只是需要花上較多時間生成。 | 最多1080p、20 秒,可同時生成5 部影片。 | 無 |
只是在OpenAI「Shipmas」12天活動的第三天,就等到了Sora的推出,讓人很好奇接下來的幾天還能有什麼「大的」?不過在此之前,拜託先讓Sora穩定一點,別再讓大家乾等,讓更多人能早點試試看啊!