Luma Dream Machine 1.5 را منتشر کرد — این موارد جدید است
به روز رسانی به Luma Labs Dream Machine وجود دارد، اما در ظاهر ممکن است تفاوتی را متوجه نشوید. این تغییر یک ارتقاء به مدل پایه است که ما را به نسخه 1.5 می رساند و واقع گرایی، ردیابی حرکت و درک فوری را ارائه می دهد.
این استارتآپ وقتی در ژوئن سال جاری بهطور مخفیانه راهاندازی شد، چشمانداز ویدیویی هوش مصنوعی را تکان داد و انطباق آنی بهتر، حرکت واقعیتر و فوتورئالیسم متن به ویدیو را بهبود بخشید. این به سرعت در بین سازندگان ویدیوهای هوش مصنوعی محبوب شده است.
از زمان شروع آن و نشان دادن سرعت حرکت چشم انداز هوش مصنوعی، ما شاهد ارتقاءهایی از Runway، راه اندازی Kling و مدل و پلتفرم ویدیویی هوش مصنوعی Haiper بوده ایم. پیکا همچنین شاهد بهروزرسانی مدل تصویری-ویدیویی خود بود.
Luma AI با انتشار نسخه 1.5 خود نشان می دهد که به موفقیت اولیه خود نمی نشیند و تبدیل متن به ویدیو را به همان سطح واقع گرایی Runway Gen-3 Alpha و Kling AI می رساند.
ایجاد متن در Dream Machine نسخه 1.5
Luma همچنین در مواردی مانند عکسبرداری سریع، تبدیل متن به ویدیو، و حرکات واقعیتر انسان پیشرفتهایی ایجاد کرد و به مدل خود قابلیتهای بهتری برای رندر متن داد.
این بدان معناست که از طریق یک پیام متنی ساده میتواند صفحههای لوگو، پانلهای انتهایی یا حتی گرافیکهایی تولید کند که میتوانید در ارائه پاورپوینت وارد کنید.
دریافت متن قابل خواندن از Dream Machine مانند دریافت متن خوانا از Midjourney یا هر رندر هوش مصنوعی است. فقط کلمات را در دو گیومه قرار دهید و توصیفی باشد.
نتایج ممکن است ضربه بخورند یا از دست بروند، به خصوص اگر سعی کنید آن را مجبور کنید. من از Dream Machine خواستم تا کلمات «گربهها در فضا» را بسازد، با پریدن روی ماه با گربههایی که در دو طرف لباس فضایی پوشیده بودند.
دقیقاً همان کاری را انجام داد که من میخواستم، اما آنقدر توصیفی نبودم که بتوانم کلمات را در یک خط بنویسم و آنها را روی هم بگذارم. او همچنین نپرید. در عوض، یک حرکت زوم ناخوشایند انجام دادم. وقتی از او خواستم نامم را نشان دهد، همان حرکت را کپی کرد و حرف به حرف از روی شن بیرون آمد.
با وجود اینکه حرکت یا طرح متن دقیقاً آن چیزی نبود که میخواستم، اما در هر آزمونی که میدادم کلمات کاملاً خوانا بودند. اگر می خواهید سبک خاصی را منعکس کند، من از یک تصویر به عنوان دستور استفاده می کنم.
کیفیت در Dream Machine نسخه 1.5 بهبود یافته است
قبل از اینکه به سراغ کیفیت برویم، همچنین باید اشاره کنم که Dream Machine v1.5 به طور قابل توجهی سریعتر از نسخه قبلی خود است. می تواند یک ویدیوی پنج ثانیه ای را در حدود دو دقیقه تولید کند.
قابل توجه ترین تغییر سطح واقع گرایی است، چه از نظر کیفیت بصری و چه از نظر حرکت. من چند تست مختلف انجام دادم، از جمله یک خانم مسن زیر آب، یک ببر در برف و یک پرواز پهپاد از یک قلعه، و در هر صورت با وجود اینکه مشکلاتی وجود داشت، بهتر از v1 بود.
آخرین ارتقای قابل توجه در سازگاری کاراکتر در نسل های ویدیویی، از جمله برنامه های افزودنی است. این شامل سازگاری حرکت و انطباق با فیزیک دنیای واقعی است.
نکته ای در مورد Dream Machine وجود دارد. او در بهبود درخواست شما بسیار خوب است، اما اگر به او درخواست طولانی و تشریحی میدهید، حتماً علامت کادر دستور افزایش را بردارید، در غیر این صورت ممکن است گیج شود یا مسائل را بیش از حد پیچیده کند.
به طور کلی، این یک ارتقاء در مقیاس رفتن از باند Gen-2 به باند Gen-3 نیست، زیرا در کل یک جهش بزرگ بود. با این حال، به اندازه کافی قابل توجه و مهم است که به Dream Machine کمک می کند تا در صدر پلتفرم های ویدیویی هوش مصنوعی مولد باقی بماند.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide