Runway Gen-3 را معرفی می کند – ویدیوی هوش مصنوعی جهشی بزرگ به جلو انجام می دهد
Runway، یکی از اولین پلتفرم های ایجاد ویدئو با هوش مصنوعی که به صورت عمومی راه اندازی شد، نسل سوم مدل خود را معرفی کرد. این یک گام بزرگ رو به جلو برای فناوری است و ممکن است یکی از بهترین سازندگان ویدیوی هوش مصنوعی باشد.
به همین ترتیب، OpenAI می گوید هدف نهایی آن برای Runway، مدل های جهانی عمومی آن، هوش عمومی مصنوعی است. این یک سیستم هوش مصنوعی است که می تواند یک نمایش داخلی از یک محیط ایجاد کند و از آن برای شبیه سازی رویدادها در آن محیط استفاده کند.
مدل جدید Runway، Gen-3 Alpha، مدلی است که استارتاپ به این هدف بلندمدت نزدیکتر است. این شرکت میگوید تمام ابزارهای تصویر و متن به ویدئو را در پلتفرم Runway و همچنین ویژگیهای دیگری مانند Motion Brush و متن به تصویر را تامین میکند.
آهنگ: Gen-3 چه تفاوتی با Gen-2 دارد؟
با Gen-3 Alpha: مدل پایه جدید Runway برای تولید ویدیو آشنا شوید. Gen-3 Alpha می تواند ویدیوهای بسیار دقیق با تغییرات صحنه پیچیده، طیف گسترده ای از گزینه های سینمایی و جهت هنری دقیق ایجاد کند.https://t.co/YQNE3eqoWf(1/10) pic.twitter.com/VjEG2ocLZ817 ژوئن 2024
Runway نگفت چه زمانی Gen-3 برای جایگزینی مدل های Gen-2 موجود اجرا می شود، اما اضافه کرد که اقدامات امنیتی جدیدی برای Gen-3 در دسترس است، از جمله بازرسی بصری بهبود یافته و استاندارد C2PA که ردیابی منشاء مختلف را آسان تر می کند. مدل ها. انواع رسانه ها
این جدیدترین در نسل جدید مدلهای ویدیویی هوش مصنوعی، مانند OpenAI Sora، Luma Labs Dream Machine، و Kling است که هر کدام دارای کلیپهای طولانیتر و حرکت بهبودیافته هستند.
Runway میگوید Gen-3 اولین مدل از سری مدلهایی است که در زیرساختهای جدید آموزش دیدهاند. این به طور خاص برای آموزش چند وجهی در مقیاس بزرگ طراحی شده است و وفاداری، ثبات و حرکت را افزایش می دهد.
یکی از درسهایی که از سورا آموخته شد این است که مقیاس بیش از سایر موارد اهمیت دارد، بنابراین افزودن محاسبات و دادههای بیشتر میتواند به طور قابل توجهی مدل را بهبود بخشد.
Gen-3 چگونه به نظر می رسد؟
این جهش رو به جلو در فناوری نشان دهنده نقطه عطف مهمی در تعهد ما به توانمندسازی هنرمندان است و راه را برای نسل جدیدی از نوآوری های خلاقانه و هنری هموار می کند. نسل سوم آلفا در روزهای آینده در دسترس همه خواهد بود. درخواست: یک پیشرفت سینمایی آهسته… pic.twitter.com/cLaZvGpeu617 ژوئن 2024
مدل جدید به طور همزمان بر روی ویدئو و تصویر آموزش داده شده است، که Runway می گوید کیفیت بصری تغییر مسیر متن به ویدئو را بهبود می بخشد.
مدل جدید همچنین ابزارهای جدیدی را تامین می کند که کنترل دقیق تری بر مواردی مانند ساختار، سبک و حرکت ارائه می دهند.
من فرصتی نداشتم که Gen-3 را خودم امتحان کنم و هنوز در حالت آلفا است، اما به نظر می رسد ویدیوها پیشرفت قابل توجهی در حرکت و واکنش نشان می دهند.
هر ویدیو تقریباً ده ثانیه است. این تقریباً دو برابر طولانیتر از Luma پیشفرض است و از نظر طول شبیه به ویدیوهای Sora است. همچنین تقریباً سه برابر بیشتر از ویدیوهای موجود Runway Gen-2 است.
1. سوار شدن به قطار
دستور: “انعکاس باریک یک زن در پنجره قطار در حال حرکت با سرعت سرسام آور در یکی از شهرهای ژاپن.”
2. مرد فضایی در شهر
فرمان: “یک فضانورد در حال دویدن در کوچه ای در ریودوژانیرو.”
3. جامعه زیر آب
اعلان: “FPV در خیابان های رنگارنگ مرجانی یک محله زیر آب در حومه پرواز می کند.”
4. بالون هوای گرم
اعلان: “عکس ردیابی دستی به دنبال یک بالن آبی کثیف شناور در بالای زمین در خیابان متروکه قدیمی اروپایی در شب.”
5. تصویر بزرگ
اعلان: “نمای نزدیک از یک مورچه که از لانه خود بیرون می آید. دوربین عقب می کشد تا محله ای را بر فراز تپه نشان دهد.”
6. افراد واقع بین
اعلان: “روی صورت زن جوانی که روی نیمکتی در وسط یک سالن ورزشی خالی مدرسه نشسته است، بزرگنمایی کنید.”
7. پهپاد داخل قلعه
اعلان: “یک هواپیمای بدون سرنشین FPV از میان یک قلعه صخره ای پرواز کرد.”
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide