Sora v2 ممکن است در شرف سقوط باشد – نکاتی جدید در مورد مدل ویدیویی OpenAI جدید
ویدیویی در آخر هفته در X منتشر شد که ظاهراً حاوی فیلمی از Sora v2، نسخه جدیدی از مدل ویدیویی هوش مصنوعی OpenAI است که هنوز منتشر نشده است.
OpenAI اولین بار در اوایل سال جاری سورا را با سر و صدای زیادی معرفی کرد. در زمانی که بهترین مدل های ویدیویی هوش مصنوعی تصاویری با مدت زمان 3-5 ثانیه تولید می کنند فقط سورا که شبیه حرکت واقعی بود، تصاویری تقریباً واقعی تا یک دقیقه ارائه کرد.
Ruud van der Linden، مدیر عامل LontVideo، یک ویدیوی کمی لرزان را به اشتراک گذاشت که یک فیلم پیش بینی شده را نشان می دهد. اگرچه ممکن است در نگاه اول فیلمی از یک فیلم وایکینگ به نظر برسد، اما در واقع تصویری است که از نسخه نسل جدید سورا گرفته شده است.
این تصویر که ظاهراً با ایجاد تصاویر در Midjourney و استفاده از آنها به عنوان اولین درخواست در Sora v2 ایجاد شده است، در جریان C21Media Keynote Chad Nelson’s OpenAI در لندن نمایش داده شد.
چیزی که ما هنوز نمی دانیم این است که آیا این مدل جدید Sora در طول رویداد 12 Days of OpenAI منتشر خواهد شد یا اینکه آیا این یک “نسخه آینده” است که برای فیلمسازان و خودی های صنعت اختصاص داده شده است (همانطور که در حال حاضر در مورد نسخه 1 وجود دارد. ).
نسخه Sora نسخه 2 نزدیک می شود: * خروجی های ویدئویی 1 دقیقه ای * متن به ویدئو * متن + تصویر به ویدئو * متن + ویدئو به ویدئو * چاد نلسون از OpenAI این را در C21Media Keynote در لندن نشان داد. و همانطور که @sama پیش بینی کرده بود، به زودی این را خواهیم دید. pic.twitter.com/xZiDaydoDV7 دسامبر 2024
به گفته van der Lindon، Sora v2 با خروجی ویدیوی یک دقیقهای، متن به ویدئو، تصویر و حالتهای ویدئو به ویدئو عرضه میشود و به گفته van der Lindon، “به زودی آن را خواهیم دید.”
مدلهای چینی مانند Kling و Hailuo MiniMax در حال حاضر به سطوح تولیدی مشابه آنچه در اولین نسخه Sora در اوایل سال جاری شاهد بودیم، رسیدهاند. Runway، Luma Labs Dream Machine و Pika نیز در سطح مشابهی قرار دارند.
حتی مدل های متن باز مانند Mochi-1 و Hunyuan از Tencent نیز از نظر حرکت و واقع گرایی بصری از Sora فاصله زیادی ندارند. در جریان نشت اخیر Sora، شاهد بودیم که تصاویر برخی از مشکلاتی را که مدل های پیشرو فعلی با آن مواجه هستند را نشان می دهد.
در حالی که نمیتوانم بگویم آنچه در طول این افشاگری دیدیم همان چیزی است که میتوانیم در این هفته به دست آوریم یا به فیلمهایی که در Sora v2 مشاهده میشود نزدیکتر است، واضح است که ما نوعی فید ویدیوی هوش مصنوعی از OpenAI دریافت خواهیم کرد. 12 روز.
حدس من این است که ما چیزی شبیه به Sora v1 با ویدیوهای اولیه کوتاه تر و وضوح کمتر در برنامه 20 دلاری در ماه دریافت خواهیم کرد و Sora v2 اعلام خواهد شد اما منتشر نمی شود. و 200 دلار در ماه در ChatGPT Pro در هنگام راه اندازی خواهد بود.