ReelMagic را ملاقات کنید، ابزار ویدیویی هوش مصنوعی جدید برای ایجاد کل فیلم های کوتاه با یک دستور
ابزارهای ویدیویی مولد هوش مصنوعی به جایی رسیدهاند که میتوانید یک ویدیوی پنج ثانیهای ایجاد کنید که عملاً از یک کلیپ عکسبرداری شده توسط انسان قابل تشخیص نیست. با این حال، اگر میخواهید یک فیلم کوتاه، تجاری یا موزیک ویدیو بسازید، ثبات هنوز هم مشکل است زیرا شخصیتها بین کلیپها جابهجا نمیشوند.
انجام این کار امکان پذیر است، اما ابتدا باید از یک تصویر استفاده کنید و از یکنواختی در بین هر تصویری که در پیام های ویدیویی استفاده می کنید اطمینان حاصل کنید. اولین پلتفرمی که این مشکل را حل کرد استودیوی لایتریکز LTX بود، اما این به مدل های روی پلتفرم محدود شد. ReelMagic از Higgsfield در حال تغییر آن است.
ReelMagic بهترین جریانهای کاری محتوای هوش مصنوعی را در یک پلتفرم واحد گرد هم میآورد، یک اسکریپت از درخواست شما ایجاد میکند، یک تصویر با کاراکترهای خاص برای هر عکس ایجاد میکند، و سپس به شما این امکان را میدهد که آن تصاویر را به ویدیو تبدیل کنید و داستان را در نمای جدول زمانی سفارشی کنید.
می توانید یک فیلم کوتاه تا 10 دقیقه بسازید و بین Recraft، Keyframe، Flux و Higgsfield Frame برای تصاویر، و Runway Kling و MiniMax برای ایجاد ویدیو یکی را انتخاب کنید. شما همچنین دارای جلوههای صوتی و صداهایی هستید که توسط ElevenLabs و همگامسازی لب برای بازیگران هوش مصنوعی پشتیبانی میشوند.
تست کردن ReelMagic
تماشا کنید
ReelMagic از این واقعیت استفاده می کند که هر تصویر یا ویدیوی AI چیزی متفاوت ارائه می دهد. برخی در ضبط احساسات بهتر هستند، برخی فوق العاده واقع گرایانه هستند. هنگامی که من به صورت دستی یک پروژه ویدئویی هوش مصنوعی را ایجاد می کنم، اغلب مجبورم از ترکیبی از مدل ها برای رسیدن به اثر مورد نظر استفاده کنم.
ایجاد یک ویدیوی 3 دقیقهای با هوش مصنوعی میتواند بهترین بخش هفته را ببرد، اگر شامل نوشتن فیلمنامه، برنامهریزی عکسها، و ایجاد هر تصویر باشد (توجه داشته باشید که برای دریافت بهترین نتایج، اغلب لازم است دستور را چندین بار اجرا کنید. ). تصویر دقیقی را که در ذهن دارید) و سپس سعی کنید کلیپ ویدیویی را از هر تصویر ایجاد کنید (دوباره به دلیل هر گونه خطا چندین بار آن را اجرا کنید).
سپس، پس از دریافت ویدیوها، باید به سراغ طراحی صدا بروید، جلوه های صوتی، اتمسفر، موسیقی و صداگذاری را آماده کنید. برخی از عکس ها به همگام سازی لب نیاز دارند. اغلب پس از تماشای مجدد متوجه می شوم که یک عکس از دست رفته است، بنابراین باید به عقب برگردم و روند را تکرار کنم.
ReelMagic این کار را به یکباره از یک خط فرمان واحد انجام می دهد. اسکریپتی به شما ارائه میشود که میتوانید ویرایش کنید، فهرستی از تصاویری که میتوانید بازآفرینی یا تغییر دهید، و سپس راهی برای ایجاد ویدیو برای هر عکس، چه مدل به مدل یا بهطور کلی. به طور خودکار جلوه های صوتی را اضافه می کند که می توانید با نیازهای خود سازگار شوید.
خالق ReelMagic، هیگزفیلد، نوشت که «به سازندگان اجازه میدهد تا عناصر خاصی را بدون تأثیر بر ظاهر/احساس داستان کلی خود ویرایش کنند». ویژگی مورد علاقه من این است که می توانم یک بار کاراکترها را تعریف و طراحی کنم و آنها را در طول پروژه تغییر دهم.
ایجاد داستان با ReelMagic
این ویدیوی نهایی است که از طریق فرآیند ذکر شده در زیر تولید شده است. کل زمان از درخواست اولیه تا ویدیوی صادر شده تقریباً 35 دقیقه بود.
من به ReelMagic دستور زیر را دادم:
«شب زمانی است که موجودات سایه زاییده نفرت ما ظهور می کنند. کابوس هایی که رویاهای ما را تسخیر می کنند و کلمات ویرانگر و ناامیدی را در گوش قدرتمندان زمزمه می کنند. هیچ کس نمی داند از کجا آمده اند، هیچ کس هرگز آنها را ندیده است، اما آنها همیشه آنجا هستند و از آغاز تمدن بشری همیشه بوده اند. برخی می گویند آنها اولین گونه روی زمین بودند. ارواح در بادهای ستاره ای از دنیایی که مدت هاست مرده اند حمل می شوند. برخی دیگر می گویند اینها ساختگی اجداد ماست که نمی توانستند رها کنند. تنها چیزی که می دانیم این است که آنها در حال قوی تر شدن هستند.»
سپس مجبور شدم یک “سبک” را انتخاب کنم. این می تواند از یک نمایش موجود مانند چهارشنبه یا یک مفهوم خاص الهام گرفته شود. من نسخه اصلی را ترجیح دادم زیرا می خواستم ببینم هوش مصنوعی چه چیزی را ارائه کرده است.
پس از حدود سه دقیقه، یک فیلمنامه، مجموعهای از شخصیتها و فهرستی از مکانها به من ارائه شد که میتوانم آنها را تطبیق دهم، بازطراحی کنم، صداها را به آنها اختصاص دهم یا آنها را متناسب با ایدهام تغییر دهم.
در حالی که این کار را برای آزمایش پلتفرم انجام میدادم، با تمام تنظیمات ارائه شده از جمله اسکریپت رفتم. من چیزی را تغییر ندادم زیرا می خواستم ببینم هوش مصنوعی به تنهایی چه چیزی را ارائه کرده است. ایده این است که ببینید چقدر خوب می توانید یک پروژه کامل از یک خط فرمان ایجاد کنید.
نمای استوری بورد به شما امکان می دهد تمام فیلم های ایجاد شده را مرور کنید و تغییرات مناسب را ایجاد کنید. این شامل بازسازی یک عکس با یک مدل تصویر متفاوت، تعویض چهرهها در صورتی که با دید شما مطابقت ندارد، و رندر کردن ویدیو است.
سپس می توانید به نمای ویرایشگر بروید. این شبیه به یک پلت فرم معمولی ویرایش ویدیو است، که در آن کلیپ های فردی یکی پس از دیگری در یک جدول زمانی، با جلوه های صوتی و گفتگو قرار می گیرند. پس از ایجاد فیلم ها، می توانید هر یک از نمای چهره را با صدای تولید شده همگام سازی کنید.
من تصمیم گرفتم تمام کلیپ ها را با استفاده از همان مدل (Kling 1.5 Pro) ایجاد کنم زیرا این یک همه کاره خوب است. همچنین کندترین مدل ارائه شده است، بنابراین این مقاله کمی بیشتر از آنچه انتظار داشتم طول کشید.
چگونه کار کرد؟
خروجی نهایی را میتوانید در ویدیوی YouTube مشاهده کنید، همراه با صدا، همگامسازی لب، و جلوههای صوتی. من همچنین یک مثال کوتاه 30 ثانیه ای از نحوه مدیریت صحنه افتتاحیه با استفاده از گردش کار عادی خود در Pika 2.0 (در زیر) ساختم.
با توجه به اینکه فرآیند تا حد زیادی خودکار است، خروجی نهایی نزدیکتر از چیزی بود که انتظار داشتم به چیزی که به صورت دستی ایجاد کردم.
من داستان را آنطور که نوشته شده بود نمی گرفتم زیرا کمی ساده بود و شخصیت ها را تغییر می دادم، تنوع بیشتری به نماها اضافه می کردم و ظرافت بیشتری را اضافه می کردم، اما برای یک تلاش یکباره – بد نبود.
ارزش واقعی این است که تغییر هر عنصر در فرآیند چقدر آسان است. این آن را به ابزاری برای تولید و همچنین راهی برای ایجاد یک ویدیوی هوش مصنوعی با فرم طولانیتر از یک درخواست تبدیل میکند. من می توانم از این برای ایجاد یک اسکریپت از یک ایده استفاده کنم، تغییرات را به سرعت تکرار کنم و سپس در مدل های مختلف در یک مکان رندر کنم.
این نمونه ای است از جایی که من فکر می کنم نسل بعدی ابزارهای هوش مصنوعی به چه سمتی خواهد رفت: تولید. مدل ها به سرعت در حال تکامل هستند. بنابراین گام منطقی بعدی ایجاد ابزارهای مبتنی بر هوش مصنوعی است که می توانید از آنها برای ایجاد پروژه ها به جای یک کلیپ استفاده کنید.