“中國Sora”正在快速崛起。
多知12月10日消息,Open AI周一宣布,旗下視頻生成模型Sora正式面向大眾推出,該系統(tǒng)可以根據(jù)文本提示生成逼真的視頻。新版工具Sora Turbo可以生成最長達20秒的視頻,并且可以提供這些視頻的多種變體。據(jù)介紹,Sora將在10日開始向美國及其他市場的ChatGPT付費用戶開放。
今年2月,Open AI首次推出Sora,這是一種可以根據(jù)文本創(chuàng)建逼真視頻的模型,并分享了我們在世界模擬方面的初步研究進展。Sora是理解和模擬現(xiàn)實的人工智能的基礎(chǔ)。這是開發(fā)可以與物理世界交互的模型的重要一步。
今年2月的Sora是預覽模型,只有部分藝術(shù)家、電影制作人和安全測試人員可以使用。周一,OpenAI發(fā)布了 Sora 的新版本——Sora Turb,它比2月份預覽的模型快得多,使用人群更多了。
Sora是可根據(jù)文本創(chuàng)建逼真視頻的模型,Open AI網(wǎng)站展示了一個示例,對Sora輸入文字“在開闊的沙漠中拍攝一群猛犸象的廣闊寧靜鏡頭”,隨后生成的視頻展示了三只猛犸象緩慢穿過沙丘。
Sora生成的視頻分辨率高達1080p、最長20秒,并可以寬屏、豎屏或方形屏形式呈現(xiàn),用戶可以自帶素材進行擴展、混音和混合,或者更新文本生成全新的內(nèi)容。
值得注意的是,“中國Sora”正在快速崛起,如快手可靈視頻生成大模型生成的視頻分辨率最高可達1080p,時長最高可達2分鐘,提供首尾幀控制、鏡頭控制等功能;字節(jié)跳動自研的視頻生成模型Seaweed僅需60秒即能生成時長5秒的高質(zhì)量AI視頻;騰訊混元大模型已經(jīng)上線視頻生成能力;Minmax旗下海螺AI新模型可以生成2D 視頻;商湯Vimi只通過一張人物照片,就能生成一段1分鐘左右的人物視頻;由清華大學聯(lián)合生數(shù)科技共同研發(fā)Vidu生成一段4秒片段只需30秒……
不過,從商業(yè)可用的角度來說,持續(xù)生成動作連貫、風格穩(wěn)定、高分辨、長時長的視頻還需要一些時間。