من Veo 3.1 را با Sora 2 با 7 پیام ویدیویی تست کردم و یکی دیگری را خرد کرد.

تولید ویدیوی هوش مصنوعی در ماه گذشته افزایش یافت، به طوری که Sora 2 از OpenAI و Veo 3.1 گوگل وفاداری سینمایی، کنترل روایت عمیق، صدای همگامسازی شده و واقعگرایی فیزیکی بسیار بهبود یافته را ارائه میدهند. هر دو به طور قابل توجهی سطح داستان سرایی خلاقانه را بالا برده اند.
پس از آزمایش هر دوی آنها به صورت جداگانه با یک سری دستورات دیوانهکننده و خلاقانه، باید ببینم که دو سازنده ویدیوی هوش مصنوعی چگونه با یکدیگر مقایسه میکنند. در اینجا اتفاقی افتاد که من برخی از احمقانهترین ایدههایی را که میتوانستم در مواجهه Sora 2 و Veo 3.1 در مجموعهای از همان هفت داستان امتحان کنم، اتفاق افتاد.
1. روزی که جاذبه به پایان می رسد
سریع: “یک صبح آفتابی، یک شهر کوچک خوابآلود؛ صندوقهای پست، ماشینها و لیوانهای قهوه با بسته شدن تدریجی جاذبه شروع به شناور شدن به سمت بالا میکنند. مردم در حالی که به هوا برمیخیزند به آرامی قهوه مینوشند. دوربین به سمت آسمان متمایل میشود و یک رتریور طلایی را دنبال میکند که افسارش را در ابرها تعقیب میکند. موسیقی ارکسترال سینمایی، نورپردازی واقع گرایانه.”
سورا 2 یک ویدیو با عمق و جزئیات یک فیلم واقعی ایجاد کرد. به خصوص موسیقی متن فیلم بسیار مناسب بود.
Veo 3.1 ویدیوی بسیار خوبی ارائه کرد، اما من از مشکلات معمولی هوش مصنوعی مانند تکرار سگ و نقص افسار ناامید شدم. شما فکر می کنید که چنین ناسازگاری ها تا کنون حل شده اند.
برنده: سورا 2 برای دقت بیشتر و داستان سرایی برتر برنده می شود.
2. مایکروویو سفر در زمان مادربزرگ
تماشا کنید
سریع: “در یک آشپزخانه دنج دهه 1970، یک مادربزرگ با عینک گربه ای، سوپ را در مایکروویو روشن کرم چاله ای قرار می دهد. هر “دینگ” دهه جدیدی را می درخشد – پانک دهه 1980، سایبرپانک دهه 2090، آتش غارهای ماقبل تاریخ – همه در یک فیلم انعکاسی عجیب و غریب در پنجره قابل مشاهده است. زوم می کند.”
سورا 2 دستور را دنبال کرد و بینندگان را با مایکروویو مادربزرگ به یک ماجراجویی وحشیانه برد.
Veo 3.1 مادربزرگ جالبی با عینک قرمز به ما داد. این با توجه به موضوع ویدیو جالب بود، اما سه صحنه مختلف مایکروویو نداشت. اما دو وگرنه به نظرم از نظر بصری این بهتره.
برنده: سورا 2 برنده می شود برای دقت سریع
3. کلوپ جاز Cloud City
سریع: “یک کلوپ شناور جاز هنر دکو در غروب آفتاب در میان ابرها شناور است. یک ساکسیفونیست ساخته شده از بخار درخشان برای مشتریان ارواح شفاف با لباس های بالدار می نوازد. دوربین از بالای ابرها به سالن فرود می آید. نور ساعت طلایی، فوکوس ملایم، موسیقی رکورد شکن.”
سورا 2 باعث شد بیشتر بخواهم ساکسیفونیست به نظر می رسید که در حال نواختن برای تماشاگران مرده است و صحنه کلی خسته کننده به نظر می رسید.
Veo 3.1 علیرغم ویدیوی کوتاهتر، با زاویه باز و زوم بیشتر احساس سینمایی میکرد. بخار قویتر ساکسیفونیست، همراه با رنگهای تیرهتر و تماشاگران سرزندهتر، باعث شد که ویدیو فضای کلاب جاز را ایجاد کند.
برنده: Veo 3.1 با وجود حرکت خلاقانه، برای داستانی باورپذیرتر و واقعی تر برنده می شود.
4. کتابخانه در انتهای جهان
تماشا کنید
سریع: یک کتابخانه کیهانی عظیم و بیپایان؛ سیارات در مدار بین قفسهها، سیاهچالههایی که بهعنوان لامپ مطالعه استفاده میشوند. کودکی در میان قفسهها در گرانش صفر شناور است و صفحات براقی را که خاطرات را به فضا نشان میدهد، تبدیل میکند. حرکت دوربین به سبک پهپاد، امتیاز مصنوعی محیط، نور حجمی.»
سورا 2 آنقدرها «کیهانی» نبود و کتاب ها بیشتر شبیه یک دیوار آجری بودند.
Veo 3.1 با دادن یک بازو و دست اضافی به دختر دوباره با اشتباهی شبیه هوش مصنوعی ناامیدم کرد. در غیر این صورت، یک ویدیوی بصری قابل توجه تر برنده می شد.
برنده: سورا 2 برنده می شود از نظر دقت، اما در غیر این صورت Veo 3.1 تاج را در اینجا خواهد گرفت.
5. خواب توستر شکسته
تماشا کنید
سریع: “یک توستر یکپارچهسازی با سیستمعامل شب در آشپزخانه می نشیند و رویا می بیند. در رویا، او خود را به عنوان موشکی تصور می کند که در کهکشان راه شیری از خرده ها و چوب های کره ای منفجر می شود. دوربین او را مانند یک مستند فضایی دنبال می کند. لحن جالب، رئالیسم مانند پیکسار، موسیقی خیره کننده جوک باکس.”
سورا 2 یک داستان واقعی در این ویدیو ایجاد کرد که بسیار شبیه چیزی است که کودکان خردسال تماشا می کنند.
Veo 3.1 خیلی سریع و فوق العاده ویدیویی کمتر جذاب ایجاد کرد. غذای صبحانه عجیب بود.
برنده: سورا 2 برنده می شود برای پیگیری دقیق تر دستور.
6. پخش اخبار دایناسورها، 65 میلیون قبل از میلاد
تماشا کنید
سریع: “یک گوینده اخبار velociraptor در حالی که سیارک ها در آسمان پشت سر او مسابقه می دهند، تیترها را پشت میز سنگی می خواند. دوربین بین گوینده خبر، دینو هواشناسی و گزارش ترافیک زنده پتروسورها سوئیچ می کند. گرافیک به سبک کرتاسه CNN، سرعت کمدی، بافت پرهای واقعی.”
سورا 2 ما یک ویدیوی بسیار واقعی از یک ایستگاه خبری ایجاد کردیم که در آن مجریان اخبار دایناسورها با یکدیگر صحبت می کنند.
Veo 3.1 ویژگی های اضافی اضافه شد که داستان سرایی را واقعاً محبوب کرد. این ویدیو جالبتر بود و سیارکهای واقعیتر و دایناسورهایی با ظاهر منحصربهفرد را نشان میداد.
برنده: برنده Veo 3.1 برای داستان سرایی و جلوه های سینمایی برتر.
7. آخرین دیسکوی بشریت روی ماه
تماشا کنید
سریع: “یک کلوپ شبانه گنبدی شیشه ای پر زرق و برق بر روی سطح ماه. فضانوردان در حرکت آهسته با بالا آمدن زمین در پس زمینه می رقصند. دی جی، یک ربات انسان نما با پوست آینه ای، وینیل شناور را در گرانش صفر می چرخد. دوربین 360 درجه در اطراف جمعیت می چرخد، چراغ های بارق چشمک می زند، موسیقی های سرگرم کننده 1970.”
سورا 2 صحنهای دیوانهوار را ارائه کرد که در آن فضانوردان با سبکها و شخصیتهای منحصربهفرد رقصیدند.
Veo 3.1 او موسیقی فانک دهه 1970 را با فضانوردانی که هماهنگ می رقصند پذیرفت. ویدیو از نظر بصری جذاب بود و موسیقی واقعی تر از Sora 2 بود.
برنده: برنده Veo 3.1 برای داستان سرایی برتر
برنده کلی: سورا 2
درحالیکه Veo 3.1 با سبک و استعداد سینمایی بصری میدرخشید، Sora 2 بهطور مداوم بازخوانیهای دقیقتری از جهتهای پیچیده و سورئال ارائه میکرد و ویدیوهایی را ایجاد میکرد که در بسیاری از موارد شبیه داستانهای کاملاً شکلگرفته بودند.
در نهایت، Sora 2 در این مسابقه پیشی گرفت و با منطق روایی قویتر، ثبات شی بهتر و لحن احساسی ملایمتر از Veo پیشی گرفت.
هم Sora 2 و هم Veo 3.1 یک جهش به جلو در تولید ویدیوی هوش مصنوعی هستند و مرزهای آنچه را که تنها با یک فرمان امکان پذیر است را کنار می زنند.
آیا آنها را امتحان کرده اید؟ کدام یک مورد علاقه شماست؟ در نظرات به من اطلاع دهید.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود. فراموش نکنید که روی دکمه Follow کلیک کنید!
اطلاعات بیشتر از راهنمای تام
بازگشت به لپ تاپ



