رندر جدید هوش مصنوعی مایکروسافت در حال حاضر رقیب Nano Banana است – در اینجا 5 دستوری وجود دارد که برای آزمایش آن استفاده کردم.

مایکروسافت MAI‑Image‑1 را منتشر کرده است، اولین مدل رندر این شرکت که کاملاً داخلی ساخته شده است. در حال حاضر در صدر رتبه بندی مدل های اصلی تبدیل متن به تصویر مانند Gemini’s Imagen و ChatGPT در سایت مستقل LMARena رقابت می کند.
برای کسانی که ناآشنا هستند، LMARena شبیه به نمودارهای بیلبورد است. اما به جای رتبه بندی موسیقی، این رتبه بندی می کند که مدل های هوش مصنوعی در ایجاد تصاویر بصری از متن چقدر خوب هستند. تابلوی امتیازات عمومی جایی است که شرکتهای مختلف (مانند مایکروسافت، گوگل یا پروژههای منبع باز) مدلهای هوش مصنوعی متن به تصویر خود را ارسال میکنند، و این مدلها بر اساس چگونگی ترجمه درخواستهای نوشته شده به تصاویر با کیفیت بالا ارزیابی میشوند.
بنابراین وقتی مایکروسافت میگوید که MAI-Image-1 در رده 10 برتر LMARena قرار گرفته است، به این معنی است که بسیاری از رقبای خود را در یک آزمایش سر به سر کور شکست داده و اکنون یکی از بهترین تولیدکنندگان تصویر هوش مصنوعی موجود بر اساس بازخورد عمومی در نظر گرفته میشود.
چگونه تلاش کنیم
شروع با MAI-Image-1 آسان است. اگر میخواهید آثار خود را پیگیری کنید، به اشتراک نیاز ندارید، فقط به اطلاعات ورود به سیستم مایکروسافت نیاز دارید.
- برو bing.com/images/create
(یا از تب “Renderer” در Copilot استفاده کنید) - یک اعلان بنویسید
- روی “ایجاد” کلیک کنید و چند ثانیه صبر کنید؛ شما 3-4 تنوع دریافت خواهید کرد
- دانلود یا ویرایش کنید تصویر برای مورد استفاده شما
MAI-Image-1 همچنین در Microsoft Designer و PowerPoint در Copilot ادغام شده است. در اینجا می توانید با کلیک راست و استفاده از زبان طبیعی، تصاویر پشتیبانی کننده برای ارائه ها، گرافیک های اجتماعی یا تابلوهای مفهومی ایجاد کنید.
مایکروسافت میگوید آنها انتخاب دقیق دادهها و ارزیابی متفکرانه متمرکز بر وظایفی را که دقیقاً موارد استفاده خلاقانه در دنیای واقعی را منعکس میکنند، در اولویت قرار میدهند. ویژگی های کلیدی ذکر شده عبارتند از:
- فوتورئالیسم: رندر بهتر نور، بازتاب و مناظر.
- سرعت + کیفیت: چرخه تکرار سریعتر در مقایسه با برخی از مدلهای بزرگتر و کندتر.
- آموزش اولیه برای خلاقیت: نه فقط ساخت تصویر عمومی، بلکه بازخورد حرفه ای در صنایع خلاق.
با توجه به اینکه این ابزار را می توان در Copilot استفاده کرد، موارد استفاده برای MAI-Image-1 بسیار گسترده است. ایدههای نمونهسازی را با فشار دادن یک فرمان برای ایجاد سه تا پنج تغییر امتحان کنید تا زمانی که به آنچه میخواهید برسید، مورد علاقه خود را انتخاب کنید و سپس درخواست بعدی را بر اساس خروجی اصلاح کنید.
از اینجا می توانید تصویر خود را صادر کرده و آن را به ابزار طراحی مورد علاقه خود (Photoshop، Figma، Illustrator) برای ویرایش/برندسازی بیشتر بیاورید. علاوه بر این، سعی کنید تصاویر ایجاد شده مورد علاقه خود را به پستهای وبلاگ، صفحه اصلی، پستهای اجتماعی یا تابلوهای خلق و خوی مانند Mixboard اضافه کنید.
5 درخواست برای امتحان با MAI-Image-1
در اینجا اعلانهایی وجود دارد که میتوانید در Bing Image Creator یا Copilot کپی/پیست کنید تا آزمایش کنید که MAI-Image-1 چه کاری میتواند انجام دهد. توجه داشته باشید که رندر به طور تصادفی از یک الگو به الگوی دیگر تغییر می کند. بنابراین قبل از ایجاد، دوباره بررسی کنید تا مطمئن شوید که واقعاً از MAI-Image-1 استفاده می کنید.
1. سازه ها
سریع: “در غروب خورشید، با ساختمانهای شیشهای بازتابنده و وسایل نقلیه الکتریکی پرنده، در سبکی با زاویه دید وسیع سینمایی، یک تصویر واقعی از افق شهری آیندهنگر ایجاد کنید.”
من قبلاً از نسخههای مختلفی از این فرمان استفاده کردهام، زیرا به من کمک میکند تا بفهمم رندر چگونه با طبیعت، کنتراستها و عناصری که هنوز واقعی نیستند (وسایل نقلیه پرنده) برخورد میکند. خلاقیت و تفاوت های ظریف را آزمایش می کند. این چهار تصویر با بهترین سازندگان ویدیو همتراز هستند.
2. خلاقیت های آشپزی
سریع: “یک نمای نزدیک از یک غذای لذیذ وگان ایجاد کنید که روی یک بشقاب سرامیکی مشکی شیک، با نور طبیعی ملایم از کنار، حداقل پسزمینه و وضوح بالا سرو شده است.”
MAI-Image-1 به شما این امکان را می دهد که انتخاب کنید چند تصویر در یک زمان ایجاد شود. من می خواستم زوایای مختلف و پایان غذا را ببینم و تصاویر ناامید کننده نبودند.
3. تصاویر بازاریابی
سریع: یک تصویر قهرمان بازاریابی با کنتراست بالا برای یک استارتاپ فناوری ایجاد کنید: صفحه نمایش هولوگرافیک، نورپردازی نئون محیط، یک تیم متنوع چهار نفره در اطراف یک لنز فوق عریض.
این تصویر به طرز عجیبی تیره تر و شفاف تر است. بر اساس این تصویر، من دستور را تغییر می دهم تا جزئیات بیشتر و نورپردازی بهتر را تشویق کنم.
4. حیوانات و طبیعت
سریع: “نمایش یک صحنه بیآرام از حیات وحش: روباه قرمزی که در سپیدهدم از جنگلی مه آلود عبور میکند، نور ساعت طلایی گرم، بافتهای خز بسیار دقیق، عمق میدان کم است.”
این یک تصویر خیره کننده با توجه زیادی به جزئیات است. با نگاه کردن به این تصویر، تشخیص اینکه ChatGPT، Nano Banana یا MAI-Image-1 است، دشوار خواهد بود. به راحتی می توان فهمید که چرا این سازنده تصویر با رقبای خود برابری می کند.
5. داستان بازی
سریع: یک استوریبورد بصری ایجاد کنید: سه پانل که تکامل گردش کار ویرایش را از نوتبوکهای کاغذی > صفحه لپتاپ > دستیار هوش مصنوعی هولوگرافیک، انتقال بدون درز، سبک شرکتی تمیز نشان میدهد.
این استوری بورد عالی نیست، اما شروع خوبی است. ادغام MAI-Image-1 با چیزی مانند Mixboard یا Nano Banana می تواند به کاربران کمک کند خلاقیت خود را ارتقا دهند و محصولات و داستان های خود را زنده کنند.
Microsoft MAI-Image-1 View
MAI‑Image‑1 گام مهمی برای مایکروسافت در زمینه هوش مصنوعی بصری است. در دسترس، سریع، و با در نظر گرفتن جریان های کاری خلاقانه در دنیای واقعی ساخته شده است. اگرچه این کامل نیست و هنوز حکم در مورد اینکه آیا به خوبی نانو موز است یا خیر، مشخص نیست، نتایج اولیه بسیار چشمگیر است. شما می توانید به زودی یک مقایسه کامل MAI-Image-1 در مقابل نانو موز را از من انتظار داشته باشید.
اگر قبلاً در حال ایجاد محتوا با هوش مصنوعی هستید، اضافه کردن MAI-Image-1 به جعبه ابزارتان مفید خواهد بود. آن را امتحان کنید و نظر خود را در نظرات به من بگویید.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.
اطلاعات بیشتر از راهنمای تام
بازگشت به لپ تاپ



