OpenAI تولید کننده جدید تصویر Chatgpt را که توسط SORA پشتیبانی شده است معرفی کرد – در اینجا کاری است که اکنون می توانید انجام دهید

پروین میرمیران25 مارس 2025آخرین به روز رسانی: 25 مارس 2025

0 2,664 خواندن این مطلب 2 دقیقه زمان میبرد

OpenAI تولید کننده جدید تصویر Chatgpt را که توسط SORA پشتیبانی شده است معرفی کرد – در اینجا کاری است که اکنون می توانید انجام دهید

OpenAI امروز تولید کننده تصویر GPT-4O را اعلام کرد و ویژگی های پیشرفته شکل گیری تصویر را در مدل زبان ChatGPT-4O ارائه داد.

این شرکت می گوید GPT-4O یک جهش مهم را نشان می دهد که باید تصاویری را ایجاد کند که نه تنها در تولید تصویر از نظر بصری قابل توجه است ، بلکه تصاویر عملاً مفید است.

تصاویر عملی برای استفاده هر روز

(وام تصویر: OpenAi)

مدل تصویر GPT-4O به این معنی است که کاربران اکنون می توانند از مدل AI برای نیازهای روزانه مانند آرم ، نمودارها و Infograpics استفاده کنند.

بر خلاف مدل های تولیدی قبلی که تصاویر سورئال اما عملی را تولید می کنند ، GPT-4O به گونه ای طراحی شده است که تصاویر مرتبط و دقیق تری را ارائه می دهد.

ادغام متن برتر

کتاب طنز با هوش مصنوعی

(وام تصویر: OpenAi)

ویژگی های اصلی GPT-4O شامل ایجاد متن به روز شده است که ادغام بدون دردسر اطلاعات متن را در تصاویر فراهم می کند. این ویژگی با افزایش فواید تصاویر ایجاد شده ، از ارتباطات بصری پشتیبانی می کند.

علاوه بر این ، GPT-4O از بسیاری از تولید چرخشی پشتیبانی می کند و با فراهم کردن تصحیح و تنظیم تصاویر از طریق تعامل گفتار طبیعی ، سازگاری را در کل فرآیندهای طراحی حفظ می کند.

پردازش دستورالعمل پیچیده

لیست کوکتل های AI تصویر

(وام تصویر: OpenAi)

ایجاد تصویر از GPT-4O می تواند خواسته های پیچیده ای را که شامل اشیاء مختلف حداکثر 20 است ، مدیریت کند که این یک پیشرفت با توجه به سیستم های موجود است.

از طریق یادگیری داخلی ، GPT-4O می تواند تصاویر نصب شده توسط کاربر را تجزیه و تحلیل کند ، این جزئیات را در نسل های بعدی بدون هیچ مشکلی درج می کند ، بنابراین یک خروجی بصری آگاهانه شخصی تر و متنی تر ایجاد می کند.

آموزش جامع چند مدلی

هوش مصنوعی نیوتن

(وام تصویر: AI باز)

GPT-4O ، ساخته شده بر روی آموزش جامع چند حالته بر روی خوشه های گسترده تصویر و متن تصویر آنلاین ، تسلط بصری پیشرفته ای را ایجاد کرده است ، که به این مدل امکان می دهد تصاویر قانع کننده را به عنوان یک متنی ، سبک و نوری تولید کند.

محدودیت ها و نگرانی های امنیتی

تصویر سوارکاری

(وام تصویر: OpenAi)

علیرغم توانایی های پیشرفته ، OpenAI برخی از محدودیت ها را از جمله مشکلات گاه به گاه محصول ، جزئیات توهم ، مشکلات ایجاد اطلاعات شدید در مقیاس های کوچک و مشکلات تنظیم دقیق می پذیرد. ایجاد متن چند زبانه همچنان منطقه ای تحت توسعه فعال است ، به خصوص برای سناریوهای لاتین غیر پیچیده.

اقدامات دقیق برای جلوگیری از محتوای مضر ، از جمله امنیت ، مواد باز یا تصاویر که نقض سیاست های محتوا است ، وجود دارد. ابزارهای اثبات شده ، مانند برچسب زدن به داده های C2PA و جستجوی معکوس داخلی ، شفافیت و پاسخگویی را در تصاویر ایجاد شده ارائه می دهند.

قابلیت استفاده و نمای آینده

تولید تصویر GPT-4O در کلیه سیستم عامل های چتپپ ، از جمله لایه های Plus ، Pro ، Team و Free ، و به زودی دسترسی به شرکت ها و آموزش های آموزشی در دسترس است.

صرف نظر از لایه ، کاربران می توانند نیازهای دقیق تصویر را از رنگ های دقیق و تلاش برای پس زمینه های شفاف گرفته تا پس زمینه های شفاف تهیه آن را ساده به عنوان یک تعامل ساده گپ تعیین کنند.

GPT-4O OpenAi پیشرفت زیادی در ارتباط بصری با هدایت هوش مصنوعی نشان می دهد و تصاویر تولیدی را به یک وسیله نقلیه در دسترس ، عملی و قدرتمند برای کاربران و متخصصان روزمره تبدیل می کند.