Runway Gen-3 اکنون برای همه در دسترس است – من آن را با 5 پیام ویدیویی هوش مصنوعی آزمایش کردم
تولید ویدیوی هوش مصنوعی در مدت زمان کوتاهی مسیر طولانی را طی کرده است و از کلیپهای ۲ ثانیهای با شکلگیری و اعوجاج قابل توجه به فیلمهایی که تقریباً از فیلمهای فیلمبرداری شده قابل تشخیص نیستند، حرکت کرده است. Runway آخرین بازیکنی است که در این فضا مدل نسل بعدی خود را عرضه کرده است.
Gen-3 اولین بار دو هفته پیش معرفی شد و پس از چند آزمایش اولیه توسط شرکای خلاق، اکنون برای همه، حداقل نسخه متن به ویدیو، در دسترس است. نسخه متن به تصویر به زودی ارائه می شود.
هر نسل یک کلیپ فوتورئالیستی 10 تا 11 ثانیه ای با حرکات شگفت آور دقیق، از جمله نمایشی از اعمال انسان که منعکس کننده سناریو و محیط است، تولید می کند.
از آزمایشهای اولیه من، در برخی از کارها به خوبی سورا است، اما بهتر از مدل ویدیویی OpenAI است زیرا به طور گسترده در دسترس همه است. همچنین در درک حرکت بهتر از Luma Labs Dream Machine است، اما بدون یک مدل تصویر-ویدئو از یکنواختی شکست میخورد.
کار با Gen-3 چگونه است؟
من از زمان انتشارش با آن بازی کردهام و بیش از دهها کلیپ ایجاد کردهام تا روند مسیریابی را به طور موثر بهبود بخشم. “کمتر بیشتر است” و “توصیفی بودن” نکات کلیدی من هستند، اما Runway راهنمای مفیدی برای پیمایش Gen-3 ارائه می دهد.
شما باید سعی کنید از همان ابتدا دستورات را دریافت کنید، زیرا هر نسل بین 1 تا 2.40 دلار در هر نسل 10 ثانیه با Gen-3 هزینه دارد. ارزان ترین گزینه این است که وام های 10 دلاری در هر 1000 را تکمیل کنید. در مقایسه، هزینه آن برای هر نسل در طرح پایه Luma Labs 20 سنت است.
از نظر استفاده واقعی از سازنده ویدیو، درست مانند Gen-2 کار می کند. شما دستور خود را به آن می دهید و منتظر می مانید تا ویدیو را بسازد. شما همچنین می توانید از همگام سازی لب استفاده کنید، که اکنون در همان رابط ایجاد ویدیو ادغام شده است و در کل ویدیو متحرک می شود.
من پنج فرمان را پیدا کردم که به طور خاص خوب کار کردند و آنها را در زیر به اشتراک گذاشتم. از تصویر تا ویدیو، اگر میخواهید ظاهر خاصی داشته باشید، باید بسیار توصیفکننده باشید، اما تولید تصویر Gen-3 Runway چشمگیر است. همچنین برای یک درخواست فقط 500 کاراکتر دریافت می کنید.
1. مسابقه شهر سایبری
این یکی از آخرین درخواست هایی بود که ایجاد و اصلاح کردم. به دلیل توصیف نسبتاً کوتاه اما خاص آن از حرکت و سبک، Runway این را دقیقاً همانطور که انتظار داشتم تفسیر کرد.
اعلان: “Hyperspeed POV: همانطور که در یک شهر سایبرپانک با نور نئون به رقابت می پردازیم، جریان های داده و هولوگرام ها در دنیایی از کدهای دیجیتال محو می شوند.”
2. غواص
قسمت اول این شامل یک تاری حرکتی عجیب روی چشم ها و انگشتان دراز بود که خود به خود برطرف شد. جدای از آن، تفسیری تاثیرگذار و واقع بینانه بود. مشکل تاری حرکت بخشی از هشدار بود که نور خورشید ضمنی از آن عبور می کرد. هشدار بیش از حد پیچیده بود.
درخواست: “تصویر ردیابی حرکت آهسته: یک غواص یک صخره مرجانی پر جنب و جوش پر از ماهی های رنگارنگ را کاوش می کند. پرتوهای خورشید آب شفاف کریستالی را سوراخ می کند و فضایی رویایی ایجاد می کند. دوربین در کنار غواص هنگام برخورد با لاک پشت دریایی کنجکاو حرکت می کند.”
3. نمای خیابان
این نه تنها یکی از ویدیوهای مورد علاقه من از Runway Gen-3 Alpha است، بلکه یکی از همه چیزهایی است که با استفاده از ابزارهای ویدیویی هوش مصنوعی در سال گذشته ساخته ام. دقیقاً دستور را دنبال نکرد، اما آسمان در حال تغییر را در طول روز به تصویر کشید.
اعلان: “تایم لپس با سرعت بسیار بالا: دوربین از سطح خیابان به پشت بام بالا می رود و دگرگونی شهر را از روز به شب به نمایش می گذارد. تابلوهای نئونی به زندگی چشمک می زنند، ترافیک به جریان های نور تبدیل می شود و آسمان خراش ها در برابر آسمانی تاریک روشن می شوند. نمای پایانی یک منظره شهری خیره کننده در زیر یک شب پرستاره است.”
4. خرس
من تا حد زیادی این درخواست را بازنویسی کردم. قرار بود خرس را تا آخر سرزندهتر نشان دهد، اما من میخواستم در 10 ثانیه کارهای زیادی انجام دهد.
اعلان: “نمای نزدیک به زاویه باز: خرس عروسکی پیر و پیر بی حرکت روی تخت کودکی در اتاقی با نور کم می نشیند. نور طلایی خورشید به آرامی از میان پرده های توری عبور می کند و به آرامی خرس را روشن می کند. وقتی نور گرم خزش را لمس می کند، چشمک های شیشه ای خرس ناگهان پلک می زند.
من دستور را به این صورت ویرایش کردم: “نمای نزدیک به زاویه باز: خرس عروسکی پیری روی تخت کودکی زنده می شود که نور طلایی خورشید از میان پرده های توری عبور می کند، دوربین عقب می کشد تا خرس را نشان دهد که نشسته و در حال حرکت است.”
این در جهت مخالف اصل حرکت کرد و حرکت بهتری را ارائه داد، اما برخی از علائم را روی صورت خرس ایجاد کرد و هنوز آن را مناسب نکرد.
5. کشاورز پیر
این اولین درخواستی بود که با Runway Gen-3 Alpha امتحان کردم. این بسیار پیچیده و توصیفی بود زیرا من سعی می کردم چیزی را که با استفاده از تصویر-ویدئو در Luma Labs Dream Machine ایجاد می کنم تکرار کنم. این یکسان نبود، اما بسیار خوب انجام شد.
پیام: “کشاورز آفتابزده در دهه 70 خود، مزرعهی خشکشده را بررسی میکند. پوست چرمی، ریش نقرهای، چشمهای خیره شده از زیر کلاه غبارآلود. پیراهن نازک، لباسهای وصلهای. قاطعیت روی زمینهای بیثبات بزرگنمایی میکند، نردههای تقویتشده ظاهر میشوند.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide