من ژنراتور ویدیویی VEO 3 AI Gemini را در آزمون قرار دادم – 3 درخواست (و 2 فلاپید)

ژنراتورهای ویدئویی هوش مصنوعی به سرعت در حال توسعه هستند ، اما من آنها را سرگرم کننده تر از همیشه مفید دانستم. بیشتر اوقات ، کلیپ ها تحت معاینه فرو می روند: شخصیت ها به شکلی عجیب حرکت می کنند ، بافت ها مبتنی نیستند و دریچه غیرقانونی به دست می گیرد. آزمایش های سرگرم کننده ، اما به ندرت قانع کننده است.
Google’s Gemini Veo 3 باعث شد که من در این موضع تجدید نظر کنم. بر خلاف سایر ابزارها ، محدود به درخواست های متنی نیست – همچنین می تواند موسیقی فیلم را فعال و حتی اضافه کند. برای آزمایش VEO 3 ، من عمداً خواسته های مختلفی را از زمزمه تا ترسناک مطرح کردم. برخی از نتایج من را با جلا و جو و جو خود شگفت زده کرد ، در حالی که برخی دیگر به من یادآوری کردند که چرا ویدیوی هوش مصنوعی هنوز محدود است.
اگر می خواهید Veo 3 خود را در Gemini امتحان کنید ، این روند ساده است: ورود به سیستم جمینی و روی فیلم کلیک کنید در جعبه سریعبشر در اینجا سه درخواست من استفاده می کنم ، کارمند باهوش – و دو فلاپینگ.
1. خانواده اردک کرکی
تماشای
برای این درخواست ، من می خواستم ببینم که وئو 3 چقدر می تواند چیزی را که با رئالیسم مستقر است ، اداره کند: حیوانات در حرکت. اردک ها یک موضوع آزمایشی جامد هستند زیرا خواص آنها با پرهای لایه ، آب بازتابی و آبشار کاملاً پیچیده است.
من از درخواست زیر استفاده کردم: “خانواده ای از اردک های کرکی را که در کنار رودخانه قدم می زنند ایجاد کنید” و این یک تعجب دلپذیر از خروجی Veo 3 بود. اردک ها فوراً به رسمیت شناخته شدند ، با پرهای کرکی قانع کننده.
با این وجود ، این محیط ایستاده بود. در امتداد لبه حوضچه ، گل و چمن با عمق و تنوع خوبی که از تصاویر واقعی انتظار دارید ، دارای بافتی بیش از حد واقع بینانه بودند. نور به طور طبیعی در امتداد آب شکسته شد و حتی در تپه های درختی گرفتار شد که حتی لمس بسیار خوبی بود.
خطوط اصلی اردک ها هر از گاهی نرم می شدند و در بعضی مواقع ، یک توله اردک از هر مکانی بیرون می آمد. با این وجود ، با وجود این عجیب و غریب ، صحنه به طور کلی احساس جلا تر ، هماهنگ تر و بسیار قانع کننده تر از آنچه انتظار داشتم.
دلقک وحشتناک در یک نمایشگاه سرگرمی 2
تماشای
برای تست دوم ، من می خواستم Veo 3 Creepy و Sureal را فشار دهم. ایده ساده بود: “یک دلقک ترسناک را در یک نمایشگاه سرگرم کننده ایجاد کنید تا موهای خود را شانه کنید و آب کلم مردم را لکه دار کنید.” اگر هوش مصنوعی با تن مبارزه کند ، نوعی اطلاعات است که می تواند به راحتی در تقلید کاریکاتیوم قرار بگیرد.
در عوض ، VEO 3 میخ. به نظر می رسید که از نظر ناراحت کننده صورت بین لباس و آرایش ، کمیک ها و بدشانسی ، بسیار واقعی به نظر می رسید. و شانه های سبک پرنعمت صحنه را حتی خارق العاده تر کردند. این لمس خاص به این فیلم اصالت عجیبی داد.
تنها دلقک هنگامی رخ داد که دلقک آب کلم را آب گرفت زیرا از باز شدن بطری مایع خسته نمی شود. به طرز عجیبی ، او با تکیه دادن به انرژی پر هرج و مرج و سیرک صحنه ، به نفع خود کار کرد.
نتیجه هر دو فشار خون و سورئال بود – تعادل که من امیدوار بودم به آن ضربه بزنم و 3.
3. بیگانه از یک سفینه فضایی
تماشای
به تازگی ، پس از تماشای “زمین بیگانه” ، من از جهان در مغز خارج شدم. بنابراین می خواستم ببینم که وئو 3 چگونه با چیز خلاقانه تری برخورد می کند.
من از این درخواست استفاده کردم: “یک فیلم واقع بینانه بر روی یک سفینه فضایی ایجاد کنید که از یک راهرو تاریک به سمت دوربین پیروی می کند ، و دوربین باید از دیدگاه ما باشد.” آزمایش در اینجا نه تنها در مورد طراحی موجودات ، بلکه نه چقدر قانع کننده هوش مصنوعی می تواند یک فضای داخلی ایجاد کند.
نتیجه واقعاً من را گذاشت. این ویدئو مانند یک تریلر فیلم پخش شد ، قبل از متوقف کردن اینچ ، با خس خس. دم او با وزن واقعی چرخید ، حرکت حرکت را به فروش رساند و روشنایی کشتی یک کف جوی و فلزی ایجاد کرد که یک علمی معتبر را احساس می کرد.
آنچه بیشتر از همه من را تحت تأثیر قرار داد ، طراحی خود بود. این موجود شبیه ترکیبی از دکترهای آشنا-مبهم است که از آن استفاده می کند ، تا حدودی با یک لمس درنده روی بدن انسان دوستانه برای یک اندازه گیری خوب.
4 موزیک ویدیو برای یک گروه راک
تماشای
برای یکی از تست های سخت ، پرسیدم و 3. “به من یک موسیقی ویدیویی برای یک گروه موسیقی پاپ که در صحنه جلوی جمعیت اجرا می شود ، به من بدهید.” ایده این بود که ببینیم او چقدر خوب می تواند انرژی عملکرد را ضبط کند ، نه فقط واقع گرایی.
در ابتدا او امیدوار کننده به نظر می رسید. به نظر می رسید پیروتکنیک و صحنه بندی کاملاً قانع کننده به نظر می رسید ، و قاب بندی عمومی فضای کنسرت مناسبی داشت. اما همه چیز به سرعت حل می شود.
چهره خواننده اصلی برای نادیده گرفتن این اختلال غیرممکن بود زیرا در وسط هیدبانگ قبل از اینکه دوباره اسیر شود ، تغییر کرد. دست های موجود در جمع مبهم و شوخی به نظر می رسید و فاقد بافت و جزئیاتی است که بسیار خوب کار می کرد.
VEO 3 به طور خودکار صدا را به صدا درآورد. آهنگ پشتیبانی سرگرم کننده بود ، اما اشعار (و آوازهای مربوط به این موضوع) با درخواست ارائه شده سازگار نبود. و از همه بدتر ، چراغ های باربری کاملاً استاتیک باقی مانده است.
5. مادر و نوزاد
تماشای
برای درخواست ، من می خواستم سعی کنم چیزی صادقانه تر ایجاد کنم و “مادری را ایجاد کنید که با نوزاد تازه متولد شده خود در خانه بازی کند ، روی نیمکت نشست.” در مقایسه با بیگانگان و دلقک ها ، این باید ساده باشد – واقع گرایی ، گرما و تست جزئیات روزانه.
در نگاه اول ، او به تصویر غیرفعال نگاه کرد. نور کهربا نرم از اتاق فیلتر شده بود ، مو و لباس مادر دارای بافت قانع کننده ای بود و خود اتاق نشیمن به روشی قانع کننده زندگی می کرد. اما این فیلم پخش می شود ، ترک ها را نشان می دهد. ویژگی های مادر و کودک هر بار که حرکت می کردند و کاملاً توهم را شکستند ، تار می شد.
صدای روکش نیز کمکی نکرد. یک آهنگ پیانو روی کلیپ زنگ زد ، اما او وارد گفتگوی مادر شد. وقتی می گوید آه کوچک شیرین منجدید این باید لنگر عاطفی صحنه بود. درعوض ، موسیقی رقیب باعث شد احساس مخلوط و پریشان کنید.
این مناقصه ، یک لحظه عکسبرداری ، به غیرقانونی تبدیل شد – شواهدی مبنی بر اینکه VEO 3 هنوز هم می تواند هنگام تمرکز بر حس ظریف انسان ، بجنگد.
دنبال کردن راهنمای تام در Google News در انتشارات خود برای به دست آوردن اخبار روزانه ما ، چگونه TOS و بررسی ها. حتماً روی دکمه ردیابی کلیک کنید.
بیشتر از راهنمای تام
بازگشت به تلفن های همراه تلفن همراه



