چگونه با Runway AI ویدیوهای همگام سازی لب بسازیم

پروین میرمیران1 جولای 2024آخرین به روز رسانی: 1 جولای 2024

0 2,661 خواندن این مطلب 3 دقیقه زمان میبرد

با اعلام اخیر ابزارهای Gen-3 Alpha، Runway آماده است تا ساخت ویدیو با هوش مصنوعی را به سطح بعدی برساند. در پایان این راهنما، درک واضحی از نحوه استفاده از ابزار همگام سازی لب Runway خواهید داشت و می توانید تصمیم بگیرید که آیا این ابزار برای نیازهای ایجاد ویدیوی شما راه حل مناسبی است یا خیر.

به عنوان یکی از اولین توسعه دهندگان پلتفرم رندر پیشگامانه Stable Diffusion، Runway تجربه زیادی را در تمام جنبه های ایجاد تصویر و ویدیو با هوش مصنوعی به ارمغان می آورد. یکی از در دسترس ترین و محبوب ترین ویژگی های Runway ابزار همگام سازی صدا به تصویر است. این فناوری به کاربران این امکان را می‌دهد تا با تطبیق حرکات لب با ورودی صدا، ویدیوهای واقعی از سر صحبت کردن ایجاد کنند. چه سازنده محتوا، چه معلم یا حرفه ای در کسب و کار باشید، این ابزار برنامه های کاربردی مختلفی را برای بهبود پروژه های ویدیویی شما ارائه می دهد.

1. وارد شوید

(تصویر: © آینده)

ورود آهنگ در حال اجرا. اگر برای اولین بار است که از پلتفرم هوش مصنوعی استفاده می کنید، می توانید با استفاده از حساب جیمیل خود ثبت نام کنید.

2. پیمایش در رابط

گزینه‌های صوتی همگام‌سازی لب پودیوم برجسته شده است

عملکرد همگام‌سازی لب ویدیو زیر منوی صوتی در داشبورد حساب Runway است ابزارهای سه بعدی و همچنین تولید تصویر و ویدئو. صدای دلخواه خود را انتخاب کنید از گزینه ها

نکته خوب در مورد رابط کاربری استفاده فراوان از مواد آموزشی در هر مرحله است که برای کسانی که به تازگی سفر رسانه ای هوش مصنوعی خود را آغاز کرده اند، اطمینان بخش است.

3. درخواست خود را وارد کنید

خود صفحه همگام سازی لب بسیار ساده و آسان برای استفاده است. بالا سمت چپ، قسمتی برای ورود کاربران است. این می تواند از طریق یک پیام متنی، یک فایل صوتی آپلود شده یا ابزاری باشد که صدا را در لحظه ضبط می کند.

اگر ماهانه 35 دلار به برنامه Pro ارتقا دهید، حتی می توانید صدای سفارشی خود را برای استفاده با آواتار ضبط کنید.

4. صدای خود را انتخاب کنید

تصمیم گرفتم یک آواتار تولید شده توسط هوش مصنوعی را که قبلا ساخته بودم آپلود کنم و آن را با یک سناریوی کوتاه ترکیب کنم تا دقت حرکات لب را آزمایش کنم.

طیف وسیعی از صداها برای انتخاب وجود دارد، که احتمالاً تاریخچه همکاری نزدیک Runway با صنعت فیلم را منعکس می کند، بنابراین برای همه چیزی وجود دارد.

5. ویدیوی خود را بسازید

هنگامی که تست و انتخاب صدا را انجام دادید، تنها چیزی که باقی می ماند این است یک اسکریپت (یا یک کلیپ صوتی از پیش ضبط شده) را بارگذاری کنید و دکمه ایجاد را فشار دهید.

طرح رایگان با سرعت کمتری نسبت به برنامه های پولی ارائه می شود، بنابراین باید چند دقیقه در صف منتظر بمانید تا درخواست شما پردازش شود. کل فرآیند حدود 3 تا 4 دقیقه طول می کشد بسته به طول ویدیو و بارگذاری سرور در آن زمان.

6. درک استفاده از اعتبار

متن به گفتار از 1 اعتبار برای هر 50 کاراکتر متنی که به گفتار تبدیل می‌شود، استفاده می‌کند، و همگام‌سازی لب برای هر 1 ثانیه صدا، 5 اعتبار مصرف می‌کند.

کل ویدیو هر دو هزینه را ترکیب می کند، به این معنی که ویدیوی 38 ثانیه ای من از حدود 250 اعتبار استفاده کرده است. ارزش هر اعتبار 0.01 دلار است. کاربران طرح استاندارد هر ماه 625 اعتبار برای اشتراک 15 دلاری خود دریافت می کنند.

نتایج…

برای تماشای ساخت نهایی زیر به 3.25 بروید.

پس از اتمام ساخت ویدیو، می‌توانید نتایج را در سمت راست صفحه وب پیش‌نمایش کنید. کاربران رایگان یک واترمارک به هر ویدیو اضافه می کنند، اما حداقل خیلی زشت نیست.
نتایج واقعی ویدیو نیز واقعاً خوب است، حتی زمانی که از یک تصویر آپلود شده استفاده می‌کنید، که برای من تعجب‌آور بود. لب‌ها در حین صحبت به درستی حرکت می‌کنند و حتی برخی حرکات صورت هم وجود دارد.

اثر کلی کامل نیست، هنوز کمی «دره عجیب» در کار است، اما برای نیازهای عمومی تجاری بسیار خوب است. پس از ایجاد ویدیو، چندین گزینه از جمله دانلود، بازسازی، ویرایش اسکریپت و موارد دیگر در دسترس هستند.

این یک فرآیند سریع و بدون دردسر است و نتایج واقعا درجه یک هستند، همانطور که از شرکتی با این شجره انتظار می رود.

شباهت های زیادی بین Runway و Pika Labs، یکی دیگر از بازیگران اصلی در فضای تولید ویدیوی هوش مصنوعی وجود دارد. در واقع، Pika Labs همچنین دارای یک ویژگی مشابه همگام سازی لب است که از صداهای طبیعی ElevenLabs استفاده می کند. ژنراتورهای ویدیویی هوش مصنوعی زیادی در بازار وجود دارد و بهترین آنها نتایج چشمگیری ارائه می دهند.