OpenAI تولید کننده جدید تصویر Chatgpt را که توسط SORA پشتیبانی شده است معرفی کرد – در اینجا کاری است که اکنون می توانید انجام دهید

OpenAI امروز تولید کننده تصویر GPT-4O را اعلام کرد و ویژگی های پیشرفته شکل گیری تصویر را در مدل زبان ChatGPT-4O ارائه داد.
این شرکت می گوید GPT-4O یک جهش مهم را نشان می دهد که باید تصاویری را ایجاد کند که نه تنها در تولید تصویر از نظر بصری قابل توجه است ، بلکه تصاویر عملاً مفید است.
تصاویر عملی برای استفاده هر روز
مدل تصویر GPT-4O به این معنی است که کاربران اکنون می توانند از مدل AI برای نیازهای روزانه مانند آرم ، نمودارها و Infograpics استفاده کنند.
بر خلاف مدل های تولیدی قبلی که تصاویر سورئال اما عملی را تولید می کنند ، GPT-4O به گونه ای طراحی شده است که تصاویر مرتبط و دقیق تری را ارائه می دهد.
ادغام متن برتر
ویژگی های اصلی GPT-4O شامل ایجاد متن به روز شده است که ادغام بدون دردسر اطلاعات متن را در تصاویر فراهم می کند. این ویژگی با افزایش فواید تصاویر ایجاد شده ، از ارتباطات بصری پشتیبانی می کند.
علاوه بر این ، GPT-4O از بسیاری از تولید چرخشی پشتیبانی می کند و با فراهم کردن تصحیح و تنظیم تصاویر از طریق تعامل گفتار طبیعی ، سازگاری را در کل فرآیندهای طراحی حفظ می کند.
پردازش دستورالعمل پیچیده
ایجاد تصویر از GPT-4O می تواند خواسته های پیچیده ای را که شامل اشیاء مختلف حداکثر 20 است ، مدیریت کند که این یک پیشرفت با توجه به سیستم های موجود است.
از طریق یادگیری داخلی ، GPT-4O می تواند تصاویر نصب شده توسط کاربر را تجزیه و تحلیل کند ، این جزئیات را در نسل های بعدی بدون هیچ مشکلی درج می کند ، بنابراین یک خروجی بصری آگاهانه شخصی تر و متنی تر ایجاد می کند.
آموزش جامع چند مدلی
GPT-4O ، ساخته شده بر روی آموزش جامع چند حالته بر روی خوشه های گسترده تصویر و متن تصویر آنلاین ، تسلط بصری پیشرفته ای را ایجاد کرده است ، که به این مدل امکان می دهد تصاویر قانع کننده را به عنوان یک متنی ، سبک و نوری تولید کند.
محدودیت ها و نگرانی های امنیتی
علیرغم توانایی های پیشرفته ، OpenAI برخی از محدودیت ها را از جمله مشکلات گاه به گاه محصول ، جزئیات توهم ، مشکلات ایجاد اطلاعات شدید در مقیاس های کوچک و مشکلات تنظیم دقیق می پذیرد. ایجاد متن چند زبانه همچنان منطقه ای تحت توسعه فعال است ، به خصوص برای سناریوهای لاتین غیر پیچیده.
اقدامات دقیق برای جلوگیری از محتوای مضر ، از جمله امنیت ، مواد باز یا تصاویر که نقض سیاست های محتوا است ، وجود دارد. ابزارهای اثبات شده ، مانند برچسب زدن به داده های C2PA و جستجوی معکوس داخلی ، شفافیت و پاسخگویی را در تصاویر ایجاد شده ارائه می دهند.
قابلیت استفاده و نمای آینده
تولید تصویر GPT-4O در کلیه سیستم عامل های چتپپ ، از جمله لایه های Plus ، Pro ، Team و Free ، و به زودی دسترسی به شرکت ها و آموزش های آموزشی در دسترس است.
صرف نظر از لایه ، کاربران می توانند نیازهای دقیق تصویر را از رنگ های دقیق و تلاش برای پس زمینه های شفاف گرفته تا پس زمینه های شفاف تهیه آن را ساده به عنوان یک تعامل ساده گپ تعیین کنند.
GPT-4O OpenAi پیشرفت زیادی در ارتباط بصری با هدایت هوش مصنوعی نشان می دهد و تصاویر تولیدی را به یک وسیله نقلیه در دسترس ، عملی و قدرتمند برای کاربران و متخصصان روزمره تبدیل می کند.