StabilityAI نسخه Stable Diffusion 3.5 را منتشر کرد که یک گام به جلو در واقع گرایی است
StabilityAI امروز خانواده جدید Stable Diffusion 3.5 مدل های بینایی AI خود را منتشر می کند. این با واقع گرایی بهبود یافته، انطباق سریع و رندر متن در مقایسه با SD3 همراه است.
Stable Diffusion 3.5 مانند اولین نسخه SD3 در سه اندازه بزرگ (8B)، توربو بزرگ (8B) و متوسط (2.6B) عرضه می شود. اینها همه قابل تنظیم هستند و روی سخت افزار مصرف کننده اجرا می شوند. همچنین تحت مجوز جامعه هوش مصنوعی پایداری موجود است.
به طور خلاصه، این یک گام بزرگ برای هر کاربری است که بتواند تصاویر واقعی تری از هوش مصنوعی ایجاد کند. StabilityAI در یک بیانیه مطبوعاتی اعتراف کرد که مدل Stable Diffusion 3 Medium که در ژوئن منتشر شد، “به طور کامل استانداردهای ما یا انتظارات جوامع ما را برآورده نمی کند.”
این شرکت افزود: «پس از گوش دادن به بازخوردهای ارزشمند جامعه، ما وقت گذاشتیم تا نسخهای را توسعه دهیم که به جای یک راه حل سریع، مأموریت ما در تغییر رسانههای بصری را پیش میبرد.»
رایان موریسون، ویرایشگر هوش مصنوعی ما، SD3.5 را آزمایش کرده است و میگوید که این یک ارتقاء قابل توجه است، که مطابقت دارد و احتمالاً از قابلیتهای Flux 1.1 Pro که اخیراً منتشر شده است، پیشی میگیرد.
چه چیزی در Stable Diffusion 3.5 وجود دارد؟
هوش مصنوعی پایداری میگوید مدلهای ارائهشده بر روی قابلیت سفارشیسازی، عملکرد کارآمد و خروجیهای متنوع تمرکز دارند. یکی از سخنگویان گفت: “به عنوان قدرتمندترین مدل ما، Stable Diffusion 3.5 نشان دهنده تعهد ما به توانمندسازی سازندگان با ابزارهایی است که هم به طور گسترده در دسترس و هم پیشرفته هستند.”
این بدان معناست که تصاویر را میتوان بهخوبی تنظیم کرد، مدلها را میتوان «خارج از جعبه» روی سختافزار مصرفکننده اجرا کرد، و تصاویر ایجاد شده برای یکدیگر منحصربهفردتر خواهند بود.
همچنین تمرکز بر انتخاب های سبک جدید از جمله عکاسی، نقاشی و موارد دیگر وجود دارد. برای نشان دادن سبکی مانند بوهو یا مرسوم، به دستور هشتگ نیاز است. همچنین می توانید از برجسته سازی در اعلان برای هدایت مدل در یک جهت خاص استفاده کنید.
در بیانیه مطبوعاتی توضیح داده شده است: «تحلیل ما همچنین نشان میدهد که Stable Diffusion 3.5 Large بازار را در تناسب سریع پیشرو است و از نظر کیفیت تصویر با مدلهای بسیار بزرگتر رقابت میکند.
Stable Diffusion 3.5 Turbo برخی از سریعترین زمانهای استخراج را برای اندازهاش ارائه میکند، در حالی که در کیفیت تصویر و سازگاری سریع، حتی در مقایسه با مدلهای غیر ثابت با اندازههای مشابه، بسیار رقابتی باقی میماند.
Stable Diffusion 3.5 Medium با ایجاد تعادل بین تناسب سریع و کیفیت تصویر، بهتر از سایر مدلهای سایز متوسط عمل میکند و آن را به بهترین انتخاب برای عملکرد کارآمد و با کیفیت تبدیل میکند.
این مدل برای استفاده غیرتجاری از جمله تحقیقات علمی رایگان است و برای مشاغل کوچک و متوسط با درآمدی بالغ بر 1 میلیون دلار در دسترس است. هر چیزی فراتر از این نیاز به مجوز سازمانی دارد.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide