Sora را فراموش کنید — MiniMax یک سازنده ویدیوی واقعی هوش مصنوعی جدید است و واقعاً چشمگیر است
MiniMax جدیدترین تولیدکننده ویدیوی هوش مصنوعی است که از چین خارج شده است. در حال حاضر با توانایی خود برای تولید تصاویر فوق واقعی از افراد، از جمله حرکات دقیق دست، امواج ایجاد می کند. این چیزی است که ابزارهای دیگر با آن مبارزه می کنند.
این جدیدترین سرمایه گذاری در زمینه هوش مصنوعی مولد برای استارت آپ تک شاخ Alibaba و Tencent است. برنامه همراه هوش مصنوعی آن، Talkie، بیش از 15 میلیون بار دانلود شده است و مانند Character.ai، به شما امکان می دهد با یک خلاق مجازی چت کنید.
به نظر می رسد نسخه ی نمایشی رسمی برنامه که در X به اشتراک گذاشته شده است، تریلر یک ماجراجویی جادویی را نشان می دهد که در آن کودکی سکه ای را لمس می کند و در طول تاریخ سفر می کند. جلوه های ویژه شخصیت و واقع گرایی ثابتی دارند. همه اینها فقط پیام های متنی، هوش مصنوعی و ویرایش هوشمندانه است.
برای اینکه بفهمم آیا ابزار واقعی به همان اندازه ای که هیپ شده بود خوب است یا خیر، یک حساب کاربری باز کردم، چند دستور پیدا کردم و شروع به تست کردم. در حالی که چشمگیر است و با Runway Gen-3، Dream Machine و Kling برابری می کند – آنقدرها هم که ویدیو نشان می دهد یک جهش بزرگ نیست.
ویدیوی MiniMax چیست؟
یکی دیگر از «سورا» چینی: یک ابزار ویدیویی جدید هوش مصنوعی که امروز توسط Minimax راه اندازی شد و توسط سرمایه گذاران اصلی Alibaba Group و Tencent پشتیبانی می شود. 🎞️Magic Coin🪙 را تماشا کنید، فیلم رسمی هوش مصنوعی آنها که کاملاً با تبدیل متن به ویدیو ایجاد شده است. 🥁هم اکنون آن را به صورت رایگان امتحان کنید: https://t.co/Kl1avPXkFL pic.twitter.com/df14ZVq1Es31 آگوست 2024
MiniMax video-01 جدیدترین مدل از سری مدلهای این استارتآپ است که شامل تولید گفتار، زبان و موسیقی است. او مدل ویدیویی جدید خود را بدون سر و صدا در اوایل سپتامبر منتشر کرد و به سرعت در رسانه های اجتماعی در چین و غرب منفجر شد.
بنیانگذار ما، Yan Junjie به خبرنگاران گفت: “ما واقعاً پیشرفت قابل توجهی در ایجاد مدل ویدیویی داشته ایم و بر اساس ارزیابی ها و امتیازات داخلی، عملکرد ما بهتر از Runway در رندر ویدیو است.”
این شرکت در حال حاضر روی نسخه 02 مدل ویدیویی خود کار می کند و قصد دارد به روز رسانی آن را ادامه دهد تا شامل تصویر به ویدیو، متن به تصویر و تولید کلیپ اولیه طولانی تر باشد.
این مدل از ویدیوهایی با رزولوشن 1280×720 با سرعت 25 فریم بر ثانیه پشتیبانی می کند. مانند Kling و Runway، شما می توانید حرکات دوربین سینمایی را تعریف کنید، و در حالی که در حال حاضر تنها کلیپ های شش ثانیه ای وجود دارد، برنامه این است که 10 ثانیه از رهبران فعلی صنعت را با به روز رسانی بعدی مطابقت دهید.
افزودن MiniMax video-01 به متن؟
من مجموعهای از اعلانها را گردآوری کردم که انواع مختلف حرکت، رندر متن و ترکیبی از انواع مناظر، کلوزآپ و حرکت دوربین را پوشش میدهد. اگر میخواهید خودتان آنها را امتحان کنید، همه دستورات را در زیر آوردهام صفحه ویدیو-01.
1. طوفان رعد و برق بر فراز یک شهر آینده نگر
خلاصه داستان: “صحنه شبانه یک خط افق شهری بلندآمیز با ساختمان های زیبا و درخشان. رعد و برق ناگهان در آسمان می درخشد، ساختمان ها را روشن می کند و سایه های چشمگیری ایجاد می کند. باران شروع به باریدن می کند و صحنه با برخورد نزدیک قطرات باران به پایان می رسد. خیابان نورگیر نئون.”
2. فرود پروانه بر روی نیلوفر آبی
اعلان: “صحنه آرام و نزدیک از یک برکه آرام با نیلوفر آبی شکوفه در مرکز. پروانه ای ظریف از کناره به داخل پرواز می کند و به آرامی روی گل فرود می آید. امواج در آب به آرامی حرکت می کنند همانطور که بال های پروانه به آرامی بسته می شوند و باز، ایجاد یک فضای آرام و آرام.”
3. پرتاب یک سفینه فضایی از یک سیاره بیگانه
اعلان: «عکس از زمین ناهموار و بیگانه در زیر آسمانی پر از دو قمر، یک سفینه فضایی شیک با عناصر طراحی آینده نگر در پیش زمینه، که با برخاستن کشتی، زمین کمی می لرزد ردی از گرد و غبار و اخگرهای درخشان در پی آن برمیخیزد.”
4. غرور شیرها در غروب
موضوع: “منظره ای باشکوه در ساوانای آفریقا در هنگام غروب. غرور شیرها در نزدیکی یک چاله آب جمع شده اند، با شیر نر غالب در پیش زمینه. خز طلایی شیرها در نور محو شده خورشید می درخشد که آنها آب می نوشند و مناظر را بررسی می کنند. این صحنه با شیر نر شروع می شود که سر خود را بلند می کند و آسمان تاریک می شود.
5. کارت عنوان سینمای قدیمی
اعلان: “یک کارت عنوان سینمای قدیمی و با رنگ قهوه ای با حاشیه ای پرآذین و فونت قدیمی. متن “ارائه: ماجراهای گنج گمشده” در مرکز ظاهر می شود، همراه با جلوه ظریف فیلم و لرزش یک حلقه فیلم قدیمی قبل از ناپدید شدن عنوان “یک لحظه می ایستد و تنها یک پس زمینه دانه دار است.”
6. دختری که در کافه صحبت می کند
اعلان: «یک غذاخوری دنج به سبک یکپارچهسازی با نور محیطی گرم، غرفههای چرمی قرمز، و جوکباکس قدیمی در گوشه. قهوه ای تا شانه “او مو دارد و یک ژاکت و شلوار جین آبی روشن می پوشد. هنگام صحبت کردن با دستانش اشاره می کند که حس اشتیاق و مشارکت را منتقل می کند.”
7. شفق شمالی
موضوع: “یک شب خیره کننده در قطب شمال که آسمان با نمایش خیره کننده شفق های شمالی زنده می شود. امواج شفق سبز، بنفش و آبی در سراسر آسمان می رقصند، با ریتمی مسحورکننده جابجا می شوند و می چرخند. کوه های پوشیده از برف با شکوه در این منطقه ایستاده اند. پسزمینه، قلههای آنها با درخشش ماورایی روشن شده است.»
افکار نهایی
MiniMax video-01، برخلاف ادعای مدیر عامل، مدل خوبی است که تقریباً معادل ماشین رویایی Luma Labs است اما به خوبی Runway Gen-3 نیست.
مدل اصلی ویدیوی چینی دیگری که در غرب نیز موجود است Kling است و بسیار جلوتر از کلیپ هایی است که من با MiniMax ایجاد کردم. همچنین دارای مجموعه ای از ویژگی های گسترده تر است، از جمله کلیپ های 10 ثانیه ای، حالت حرفه ای که طولانی تر تولید می کند و تبدیل تصویر به ویدیو.
با این حال، به نظر می رسد MiniMax در ضبط حرکات انسان به خوبی موفق شده است و وعده می دهد که این تنها نسخه اول است، دنباله آن در هفته ها و نه ماه ها خواهد آمد، بنابراین قطعاً یک تولید کننده ویدیوی هوش مصنوعی است که باید دنبال شود.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide