姍姍來遲的Sora,一來就亂殺了。
磨磨蹭蹭了快一年, OpenAI 終於捨得把 Sora 這盤菜端上來了。
這不,咱們還在做夢的時候, Sora 就已經那能用了, 登錄網址 Sora.com ,訂閱會員搶先體驗。
反正從昨天晚上折騰到今天,國內外各大媒體瘋狂報道,有不少老哥已經把 Sora 生成的視頻發到了網上,那叫一個熱鬧。
可能哥幾個也好奇,這個傳說中的 Sora 到底有多少斤兩,跟國內的視頻生成模型相比,誰又會更勝一籌?
本來吧,這個問題世超可以在第一時間替大夥兒解答,會員賬號早早就薅到手了。結果誰能想到, Sora 的服務器被擠爆了,現在進都進不去。。。
不過說實在的,光是發佈會上對 Sora 具體功能的展示,硬貨就夠多的了。
所以今天世超就先拿發佈會上的 “ 餐前甜點 ” ,給大夥兒開開胃,看看 Sora 跟之前咱們體驗過的那些視頻生成模型到底有啥區別。
首先在產品形態上,世超覺得, Sora 就更接近 一個擁有完整工作流程的生產力工具。
這次發佈的 Sora Turbo 支持文字、圖片和視頻三種生成方式,能夠生成最高分辨率 1080p 、時長 20 秒的視頻,支持寬屏、豎屏和方形比例。
但這些東西其實都挺常規的,最讓世超覺得驚豔的地方,還是 Sora 把 AI 生成的能力融入到了視頻創作的每一個環節中。
就比如 Storyboard 故事板功能,大夥兒可以簡單理解成,給一段視頻添加不同的分鏡。
咱直接來看官方的例子,一共 440 幀的視頻,前 114 幀的場景 prompt 是 “ 一片廣闊的紅色景觀,遠處停靠着一艘宇宙飛船 ” 。
接着可以繼續發揮想象力,把 114-324 幀的場景變成 “ 從宇宙飛船內部向外看,一位太空牛仔站在畫面中央 ” 。
最後用 “ 宇航員眼睛的特寫鏡頭,眼睛被針織面料製成的面罩框柱 ” 的 prompt ,結束這段視頻。
這些 “ 分鏡 ” 在哪個時間點添加,添加什麼內容,都可以由用戶自己決定。
而在故事板的基礎上,咱們又可以把生成好的視頻用 Re-cut ( 在線重新剪輯 )功能,繼續調整一波。
這種剪輯,跟咱們理解的這裁一段那剪一截還不太一樣。在視頻的時間軸上,你可以把不滿意的部分都剪掉,剩下來的活兒就可以扔給 Re-cut 功能,讓它幫你把空白的地方再重新補全。
這還沒完啊。
Sora 還有一個 Remix 功能,那才叫一個酷炫。
用 prompt“ 毛茸茸的猛獁在沙漠中行走 ” 生成一段視頻,看起來也沒啥特別的對吧。
有意思的地方來了,如果你想把視頻裡的猛獁象給換了,比如換成機器人, ok , Remix 功能就能派上用場了。
硅基生物無痕替換碳基生物,而且從替換後的視頻效果裡也能看出來,機器人的步態、沙漠背景,幾乎沒有出現太大的畸變, 畫面穩定性和主體一致性整體都在線。
當然這只是官方給的案例,咱們也別太侷限,大膽點兒把沙漠變成大海,也不是不行。
另外, Sora 的發佈會上還介紹了 Loop ( 循環 )和 Blend ( 視頻融合 )兩個功能。
一個能讓視頻實現首尾視頻幀的絲滑銜接,讓視頻一直循環。
還有一個,則是把兩個視頻無縫合併成一個視頻。
怎麼個無縫法呢,用雪花飄落和花瓣飄落的視頻作爲例子,大夥兒一看就明白了。
除此之外, Sora 還有個 Style-Presets 的功能,其實說白了就是換換風格。同樣都是兩頭猛獁象在雪地行走,但你可以把初始版換成黑白電影,或者紙板風和膠片檔案風。
相信看到這兒,大夥兒應該多少能品出來, Sora 跟現在市面上很多視頻生成應用的區別了吧?
咱沒有拉踩的意思,也沒有非要分個高下。單純從客觀地角度來說, Sora 已經做到了一個視頻生成模型理想狀態下,相對完整的產品形態。
生成功能,不過是 Sora 最最基本的一塊磚,沒有了不行,但由一塊塊磚搭起來的大廈,肯定會更引人注目。
而之前咱們上手體驗到的一些視頻生成模型,大多隻專注在生成效果這個單一維度上,魔改玩玩還可以,但要當真正的生產力工具,還差點意思。
其次,在最直觀的生成效果上, Sora 雖說有瑕疵,但總體上瑕不掩瑜。
看看外網老哥們在 X 上發的視頻,世超是真饞了。
先用 Midjourney 生成圖片,再把 prompt 餵給 Sora ,這清晰度,這穩定性,老人臉上的皺紋都不帶動一下的,還有眼神裡透出來的 “ 嚴肅和焦慮 ” ,也讓 Sora 悟到了。
prompt :鏡頭聚焦在茂密茂盛的森林中一位飽經風霜的老人。他的臉上沾滿了藍漆和泥巴,深深的皺紋表明他一生都在荒野中度過。背景是一片模糊的綠色和棕色,捕捉到了未馴化環境的本質。這名男子嚴肅而焦慮的目光暗示着一種生存、堅韌和與自然的深厚聯繫,爲場景增添了一種神秘感和緊張感。
還有這個金毛衝浪,狗狗重心往下壓的時候,衝浪板的方向也在跟着往下,而且水面也因爲金毛的這個動作掀起了一陣浪花。
該說不說, Sora 對物理規律的掌握,可比年初的時候好太多了。
等世超能用上了,高低也給咱火鍋也安排一次。
不過,也有一些網友用 Sora 跟咱們國內的視頻生成應用,對比了一把。
同樣的 prompt ,打眼這麼一看真看不出來太大差距,非要說的話,就是 Sora 版的頭髮更柔順一些。
問題是 KLING 免費就能用。。拿這個視頻對比,就顯得開 200 美元 / 月 Sora 會員的有點冤種了。
在一些網友的測試裡, Sora 生成的視頻還會出現手部不夠自然的情況。
包括昨晚的發佈會上, Sora 也小小翻車了一下。
工作人員輸入了 “ 鶴把頭扎進水中,叼起一條小魚 ” 的提示詞,結果視頻中的白鶴,壓根就沒叼到魚。
最後,可能是大夥兒不太關注到的一個點, Sora 對 AI 生成的安全性考慮。
之前不是老有人嚷嚷 AI 爲禍人間,看圖片看視頻,現在都分不清到底是人乾的還是 AI 生成的了。
所以這次 Sora 生成的視頻都帶有 C2PA 元數據, C2PA 咱們之前專門寫文章嘮過,感興趣的差友可以翻出來看看。 它最大的特點就是可以溯源,內容是誰創作的、歷史的修改記錄,這些都會被記錄下來。
總的來說,這次 Sora 的亮相還是帶來了不少驚喜,特別是在產品形態上,視頻創作的完整工作流提供了一個更新的視角。
不是我說,國內視頻生成下一步要往哪卷,應該有方向了吧。 ( 狗頭 )
撰文:西西
編輯:江江&面線
美編:煥妍
圖片、資料來源:
OpenAI、X
部分圖源網絡