Mystic جدیدترین مدل رندر هوش مصنوعی در بازار است و توسط پلتفرم رندر هوش مصنوعی Freepik و تیم Magnific AI اخیراً خریداری شده است.
مدل مبتنی بر Flux می تواند تصاویر فوق واقع گرایانه از افراد، مکان ها و حتی صحنه های مبهم ایجاد کند، دستورات را به دقت دنبال کند و متن واقعی روی تصاویر تولید کند. جاوی لوپز خالق Mystic میگوید این «پیشرفتهترین تولیدکننده هوش مصنوعی است که مستقیماً فول اچدی را خروجی میدهد».
برای آزمایش Mystic، من با ترکیبی از دستورات پیچیده و بسیار ساده آمدم تا ببینم هوش مصنوعی چگونه درخواستها را مدیریت میکند. تمرکز بر روی فوتورئالیسم است، اما با لمسی از عجیب و غریب، مانند گربهها در حال نواختن پیانو یا جزیرهای شناور با آبشار.
Mystic در حال حاضر فقط در Freepik و برای مشترکین پریمیوم در دسترس است، اما انتظار میرود در آینده به مخاطبان بیشتری برسد.
Freepik Mystic چیست؟
ما 40000 نفر هستیم. تو انجامش دادی 🥳 ما بهت قول دادیم، نه؟ به مدت 24 ساعت از Freepik Mystic لذت ببرید. از کد استفاده کنید: 40KFreepik بیایید شروع کنیم! 🚀 pic.twitter.com/MI8wFVpGNR29 آگوست 2024
Mystic یک مدل تصویر جدید هوش مصنوعی است که توسط Freepik و Magnific توسعه یافته است که مجموعهای از تنظیمات دقیق مدلهای Stable Diffusion، Flux و Magnific است. این با ورودی و ویرایش تصویر توسط تیمی از عکاسان، هنرمندان دیجیتال، کارشناسان و طراحان VFX توسعه یافته است.
یکی از سخنگویان Freepik به Tom’s Guide گفت که این آموزش شامل “ساعتها آموزش از سوی کارشناسان داخلی با چشم بسیار خوبی برای تنظیم جزئیات کوچک است.”
در اصل، این یک گردش کار جدید است که حالت Flux را فعال میکند، یکی از بهترین مدلهای مبتنی بر تصویر هوش مصنوعی در حال حاضر. در جریان کار، برخی از فرآیندهای Stable Diffusion، تغییرات توسط تیم و ارتقاء از Magnific را راهاندازی میکند.
سخنگو توضیح داد: «این ترکیب تصاویری نفسگیر را با وضوح بالا (2k) بدون نیاز به مراحل اضافی ارائه میکند.
درخواست ایجاد کنید
به دلیل این برنامه، جایی که Freepik میگوید یکی از زمینههایی که Mystic در آن برتری دارد، پاسخگویی فوری است، من مجموعهای از دستورات بسیار توصیفی با جزئیاتی مانند سبک و پایان پیانو و حالات چهره ایجاد کردم.
Freepik همچنین مدیریت فوری را ارائه می دهد، بنابراین من دو دستور بسیار ساده اضافه کردم تا ببینم چگونه آنها با تصویری که در ذهن داشتم مطابقت دارند.
من همه درخواستهای زیر و خروجیای که از اجرای آن فرمان دریافت میکنم به اشتراک گذاشتهام، بنابراین میتوانید خودتان آن را امتحان کنید. این دستورات همچنین در نصب استاندارد Flux، Midjourney یا Ideogram به درجات متفاوتی کار خواهند کرد.
1. گربه در حال نواختن پیانو
اعلان: “گربه ای که به صورت عمودی روی یک پیانوی بزرگ نشسته است و به آرامی کلیدها را با پنجه هایش فشار می دهد. محیط اتاقی مجلل و کم نور با پرده های مخملی و یک لوستر بالای سر است. گربه یک گربه سیاه زیبا با کتی براق است. چشمان او طوری به نظر می رسند که گویی عمیقاً در موسیقی غوطه ور شده اند.” “پیانو به درخشش بالایی که منعکس کننده درخشش ملایم لوستر است جلا داده شده است و کمی جادو در هوا وجود دارد.”
من فکر می کنم این سریع را به خوبی نشان می دهد. او دستورالعمل های گربه و پیانو را دنبال کرد، اما فکر می کنم می توانست گربه را کمی بیشتر انسان سازی کند.
2. فردی با سر شناور
اعلان: “یک فرد جوان در اتاقی مینیمال ایستاده است و سرش چند اینچ بالاتر از گردنش شناور است. سر کاملاً جدا شده است، اما همراستایی کامل با بدن را حفظ می کند، گویی هیچ چیز غیرعادی نیست. بیان روی آنها اتاق ساده و مدرن است، با خطوط تمیز و با نورپردازی ملایم، طبیعت سورئال صحنه را تقویت می کند.
صحنه عالی به نظر می رسد. فوقالعاده واقعگرایانه اما سرش را پاره نکرد. من دستور را چندین بار اجرا کردم و یک بار هم سر بالای گردن ظاهر نشد.
3. لاک پشت غول پیکر با شهری بر پشت
خلاصه داستان: “لاک پشت بزرگ به آرامی در یک صحرای وسیع حرکت می کند، با یک شهر پر رونق و شلوغ که در بالای پوسته عظیم آن ساخته شده است. این شهر دارای آسمان خراش های بلند، پل های معلق و پارک های سرسبز است که همه به دقت در پشت لاک پشت متعادل شده اند. خود لاک پشت است. باستانی، هوازدگی که حکایت از سفرهای بیشماری دارد.” “آسمان بالا آبی تیره است، با ابرهایی که بر منظره بیابانی سایه میاندازند.”
این یکی حال و هوای تری پراچت را در خود دارد و میستیک دقیقاً همان چیزی را که من انتظارش را داشتم با این درخواست نشان داد. در واقع به نظر من کار بهتری انجام می دهد زیرا فضای شهر را نیز منعکس می کند.
4. زن با موهای ساخته شده از آتش
پیام: “زنی خشن و قدرتمند، موهای بلندش که تماماً از شعله های آتش تشکیل شده است، روی لبه صخره ای مشرف به اقیانوس طوفانی ایستاده است. موهای آتشین او در باد می ترقد و می رقصد و چهره اش را با نوری گرم و درخشان روشن می کند. لباسی روان و تیره می پوشد که با شعله های پر جنب و جوش تضاد دارد.” “آسمان مملو از ابرهای تیره و رعد و برق است و امواج به شدت به صخره های زیر برخورد می کنند و به جو دراماتیک می افزایند.”
من عاشق تضاد مو و موج هستم. کاری که من فکر می کنم Mystic در اینجا به خوبی انجام می دهد این است که نور را به خوبی جذب کند.
5. رقصنده با سیلوئت درخشان
اعلان: “یک رقصنده برازنده در اواسط اجرا، تمام بدنش در یک درخشش اخروی سوسو زننده قاب شده است. پس زمینه صحنه ای تاریک و خالی است، یک نور کانونی متمرکز روی او است، اما درخشش فرم او را مشخص می کند. در حالتی روان و برازنده گرفته شده است. ژست، نور مانند ستاره ها در اطراف او می درخشد “تضاد بین شبح تاریک و روشن یک اثر مسحور کننده و تقریباً ماورایی ایجاد می کند که زیبایی و ظرافت رقصنده را برجسته می کند.”
یک صحنه ساده و زیبا وقتی سعی کردم آن را با Runway متحرک کنم، مفهوم “درخشش و ستاره ها” را با اضافه کردن چرخشی از ستاره ها که با دست ها و پاها حرکت می کردند را به تصویر کشید.
6. روباتی که آسمان پر ستاره را نقاشی می کند
این اولین مورد از دو خواسته بسیار اساسی است. عنوان کل عبارتی است که من از آن استفاده کردم “ربات نقاشی یک آسمان پرستاره”.
سپس از ChatGPT خواستم تا دستور دقیقی را که احتمالاً برای ایجاد تصویر استفاده شده است، توضیح دهد: “منظره ای مربوط به اینده با یک ربات انسان نما با طراحی زرد براقی که در غروب خورشید به دیوار بیرونی تکیه داده است. ربات به طرز پیچیده ای کهکشان مارپیچی درخشان را روی دیوار می کشد. و کهکشان در حال تاریک شدن است.” “محیط نور آبی ملایمی از خود ساطع می کند که در مقابل آسمان متضاد است، محیط شهری با نورهای شهری تار در پس زمینه است که فناوری پیشرفته و بیان هنری ربات را برجسته می کند.”
من واقعاً دوست دارم که Mystic این اعلان ساده را تفسیر کرد. حدس میزنم خودم آن را اینطور توصیف نمیکنم زیرا او را به پشت میخوابانم و آسمان واقعی را نقاشی میکنم، اما واقعاً خوب کار میکند.
7. جزیره شناور با آبشار
این دومین و آخرین ادعای دو ادعای بسیار اساسی است. پیامی که من استفاده کردم “جزیره شناور با آبشار” بود.
سپس از ChatGPT خواستم تا دستور دقیقی را که احتمالاً برای ایجاد تصویر استفاده شده است توضیح دهد: “یک منظره فانتزی شبانه سورئال شامل یک جزیره شناور عظیم پر از پوشش گیاهی سرسبز و آبشارهایی که در اقیانوس آرام زیر آبشار دارند. یک ماه کامل بر آسمان مسلط است و نور را روشن می کند. صحنه با نوری ملایم و اخروی. جزیره در هوا معلق است و آبشارها فضایی عرفانی ایجاد می کنند، صحنه آرام است و اخروی، افق دوردست به سختی زیر نور مهتاب قابل مشاهده است.
این دقیقاً همان چیزی بود که من تصور می کردم و Mystic این مفهوم را کاملاً از یک دستور ساده پنج کلمه ای دریافت کرد.
افکار نهایی
شما می توانید “Flux” را در تصاویر ایجاد شده توسط Mystic ببینید، به خصوص اگر زمان زیادی را با ابزارهای Flux سپری کنید. با این حال، نسل های آن به طور قابل توجهی واقعی تر هستند و می توانید کارهایی را که برای تنظیم دقیق مدل و گردش کار انجام شده است، مشاهده کنید.
Mysic یک مدل واقعاً چشمگیر است و خروجی آن به طرز شگفتآوری با Runway یا Luma Labs Dream Machine متحرک میشود و فیلمهای ثابت را به فیلمهای ویدیویی واقعی تولید شده توسط هوش مصنوعی تبدیل میکند.
Midjourney با مجموعه ابزار گسترده، کتابخانه عظیم sref، و تصاویری بسیار واقع گرایانه و سبک، همچنان پیشرو در صنعت است. اما شرکت هایی مانند Freepik، Leonardo (در حال حاضر مالک Canva) و Ideogram در حال انجام این کار هستند.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران