ویدیوی هوش مصنوعی به تازگی شخصی شده است – Mochi-1 به شما امکان می دهد مدل خود را فقط با چند ویدیو آموزش دهید
آزمایشگاه ویدئویی AI منبع باز مستقر در سانفرانسیسکو Genmo یک پلاگین جدید برای مدل تولید ویدیوی پیشرفته Mochi-1 خود اعلام کرده است.
ابزار جدید بهینه سازی به کاربران اجازه می دهد تا خروجی ویدیوی خود را به دلخواه خود با نمایش ویدیوی مورد نظر با تعداد کمی کلیپ آموزشی اضافی سفارشی کنند. توانایی تنظیم دقیق خروجی ویدیو به این روش چیز جدیدی نیست، اما این اولین بار است که آن را به عنوان یک محصول ویدیویی متن باز منتشر می کنیم.
تنظیم با استفاده از فناوری استاندارد LoRA انجام می شود که مدت هاست برای تنظیم دقیق مدل های تصویر برای ایجاد خروجی مورد نظر استفاده می شود.
با استفاده از آداپتورهای درجه پایین مانند این، کاربران می توانند یک مدل تعمیم یافته را انتخاب کرده و آن را به سلیقه خود سفارشی کنند. نمونه ای از این می تواند ایجاد تصاویر محصول با یک لوگوی خاص و نمایش آنها در فیلم ها باشد.
Mochi-1 چیست؟
Mochi 1 به دلیل کیفیت بالای خروجی ویدیو، سر و صدای زیادی به پا کرد. بنابراین، این جدیدترین پیشرفت، نقطه عطفی در مسابقه به سوی کیفیت سینما و خروجی ویدیوی همه کاره است. موجود در وب سایت Genmo.
مانند بسیاری از اعلانهای اخیر هوش مصنوعی، توییکر Mochi 1 یک آزمایش تحقیقاتی است تا یک محصول انبوه. در حالی که این نسخه اولیه برای اجرا با یک کارت گرافیک طراحی شده است، اما فقط روی سیستم هایی با پردازنده های گرافیکی گران قیمت و سطح بالا با حداقل 60 گیگابایت VRAM اجرا می شود. این کار او را فوراً از دسترس انسان های معمولی دور می کرد.
نسخه ی نمایشی راه اندازی نشان می دهد که برای تنظیم دقیق مدل با نیازهای خود به بیش از دوازده کلیپ ویدیویی نیاز نخواهید داشت که این یک شاهکار بسیار چشمگیر برای ویدیو است. با این حال، طرفهای علاقهمند نیز باید با کدنویسی و رابطهای خط فرمان آشنایی کامل داشته باشند تا سیستم کار کند. بنابراین برای افراد ضعیف نیست.
ارزش منبع باز
به نظر میرسد ویدیوی متنباز بهترین ویدیو در قانون است، با توجه به میزان اعلانهایی که دریافت میشود. مدل Allegro-T12V این هفته عرضه شد. این یکی دیگر از فناوری های ویدئویی منبع باز امیدوارکننده است.
شش ثانیه ویدیوی 720p را از یک پیام متنی ارائه می دهد، اما نکته مهم این است که همه اینها در 9 گیگابایت VRAM اتفاق می افتد، که به نظر استفاده عالی از فضا است.
باز هم، در حال حاضر یک بسته بندی خوب وجود ندارد که کار را برای کاربران نهایی آسان تر کند، اما امیدواریم که به زودی ارائه شود.
در همین حال، من فقط با جعبه غول پیکرم پر از ذرت بو داده کره ای داغ اینجا می نشینم و به سمت در نگاه می کنم تا سورا از راه برسد. سورا چه شد؟ کسی میدونه؟ هر حدسی؟ سام؟ هر کدام؟