من 15 تصویر با ChatGPT vs Gemini vs Meta AI ایجاد کردم و از برنده شگفت زده شدم.
با تبدیل شدن تصاویر تولید شده توسط هوش مصنوعی به بخش مهمی از کارهای خلاقانه، رقابت بین Imagen گوگل جمینی، ChatGPT OpenAI و Meta AI داغ شده است. بعد از اینکه آنها را یکی یکی امتحان کردم، تصمیم گرفتم یک مقایسه کنار هم انجام دهم تا واقعاً ببینم بهترین رندر هوش مصنوعی در حال حاضر کدام است.
هر پلتفرم نقاط قوت خود را دارد، بنابراین من آنها را با استفاده از ترکیبی از اعلانهای واقعی و ساده آزمایش کردم تا ارزیابی کنم که مدلهای هوش مصنوعی مختلف چگونه موضوعات مختلفی را مدیریت میکنند. هدف من این بود که مشخص کنم کدام هوش مصنوعی می تواند تاثیرگذارترین نتایج را در پنج دسته کلیدی ایجاد کند.
بیایید نگاهی به عملکرد هر پلتفرم بر اساس کیفیت تصاویر ایجاد شده بیندازیم و در نهایت کدام پلتفرم در صدر قرار گرفت.
درخواست ایجاد کنید
برای اینکه مقایسهها منصفانه باقی بمانند، من دستورالعملها را به اندازه کافی تغییر دادم تا توانایی هر هوش مصنوعی برای ایجاد تصاویر دقیق و زیباییشناختی را آزمایش کنم. هر یک از دستورات برای توانایی هوش مصنوعی در تفسیر بافت، رنگ و ترکیب با حفظ سطح خلاقیت آزمایش شد. دسته ها عبارتند از: غذا، دکوراسیون منزل، حیوانات، وسایل نقلیه و مناظر. این به من اجازه داد تا طیف کاملی از استعدادهای آنها را کشف کنم.
گردش کار
من از ویژگی های رندر هر پلتفرم در تنظیمات پیش فرض آنها استفاده کردم. در حالی که Google Gemini و OpenAI خدمات ممتازی را ارائه می دهند، من برای این مقایسه سطوح رایگان آنها را انتخاب کردم. Imagen گوگل جمینی در پلتفرم گوگل ادغام شده است و هوش مصنوعی متا تصاویر را از طریق اینستاگرام، فیس بوک و واتس اپ ارائه می دهد. ChatGPT OpenAI که مجهز به رندر DALL-E است، نتایج سریعی را روی یک پلتفرم ارائه میکند.
پس از ایجاد تصاویر بر روی پلتفرمهای جداگانه، من هر تصویر را بر اساس وضوح، خلاقیت و اینکه هوش مصنوعی چگونه میتوانست هدف پشت فرمان را ثبت کند، ارزیابی کردم.
1. غذا
سریع: با سیب زمینی سرخ کرده ترافل یک همبرگر لذیذ درست کنید
گوگل دوقلوها: تصویر از نظر بصری خیره کننده بود، با یک همبرگر فوق العاده و تمرکز واضح بر روی لایه ها. هر عنصر (نان، پتی، تاپینگ) با جزئیات واضح ظاهر شد و به همبرگر جزئیاتی تقریباً سنگین و ناهموار داد. چیزی که من اغلب احساس می کنم واقعیت سفارش یک برگر بارگذاری شده است. سیب زمینی سرخ شده رنگ طلایی کاملی داشت و ادویه ترافل از نظر بصری مشهود بود.
هوش مصنوعی متا: تصویر ظاهری بزرگتر از حد معمول داشت، با برگر بسیار گوشتی، تضاد رنگی قوی و جذابیت پنیر ذوب شده. جزئیات چاشنی ترافل به طرز باورنکردنی بهبود یافته بود و سیب زمینی سرخ شده بسیار واقعی تر از خروجی Gemini قرار می گرفت.
ChatGPT: این یکی به وضوح می خواست با انداختن سیب زمینی سرخ شده برنده شود، اما ظاهر کلی بسیار هنرمندانه تر و تقریباً نقاشی بود. سیب زمینی سرخ کرده ترافل در مقایسه با نسخه گوگل و متا جزئی بود اما کمتر واقعی بود.
واکنش: این یک مکالمه بسیار دشوار بین Google Gemini و Meta AI بود. هر دو موفق شدند همبرگرهای آبدار و لذیذی بسازند که من را برای ناهار گرسنه نگه داشت. اما من در نهایت هوش مصنوعی متا را به دلیل گوشت گاو بسیار آبدارش به عنوان برنده اینجا انتخاب خواهم کرد. بسیار واقع بینانه بود و پنیر اضافی کمک کرد. نتایج تقریباً عکاسی از Gemini و Meta AI چشمگیر بود. در تصویر OpenAI استعداد خلاقانه ای وجود دارد، اما برگر کمتر واقع گرایانه و تقریباً خنده دار به نظر می رسید.
2. دکوراسیون منزل
سریع: ظاهر یک اتاق نشیمن مینیمالیستی را با یک پنجره بزرگ مشرف به اقیانوس ایجاد کنید.
تصویر گوگل جمینی: طراحی شیک با خطوط تمیز اما حداقل نور بود. منظره اقیانوس به طرز شگفت انگیزی واقع گرایانه است، اما به نظر می رسد که اتاق نشیمن با چشم اندازی اغراق آمیز اقیانوس در آب شناور است. آیا این اتاق نشیمن روی قایق است؟
هوش مصنوعی متا: تصویر زیبایی شناسی مینیمالیستی را به تصویر می کشد، اما برخی از جزئیات را در بافت ها و نورپردازی که باعث افزایش واقع گرایی صحنه می شود را از دست می دهد. با وجود اینکه آب نزدیک است، جدا به نظر می رسد و مستقیماً در کنار اتاق نشیمن نیست.
ChatGPT: تصویر به چیزی که من امیدوار بودم نزدیک شد: رنگ های جسورانه، اشکال جالب، و جدایی واضح بین اتاق نشیمن و اقیانوس، با آسمانی بصری جذاب. در جایی که اقیانوس فاقد جزئیات است، هنر دیوار همراه با میز قهوه منحصربفرد، لمس زیبایی را ایجاد می کند.
واکنش: Meta AI و ChatGPT آن را ثابت کردند، اما در نهایت من Meta AI را به عنوان برنده انتخاب خواهم کرد، زیرا به نظر میرسد که به بهترین وجه ماهیت درخواست را نشان میدهد. این شامل یک اتاق نشیمن است که برخلاف هر اتاق دیگری از منظره استقبال می کند. ردیف صندلیهای ChatGPT مشرف به منظره. توجه متا هوش مصنوعی به واقع گرایی به آن مزیتی در این مقوله داد، اما رویکرد خلاقانه OpenAI چشم انداز منحصر به فردتری را ارائه داد.
3. حیوان
سریع: تصویری از یک طوطی رنگارنگ که روی شاخه درخت نشسته است ایجاد کنید.
تصویر گوگل جمینی: طوطی بسیار دقیق با پرهای پر جنب و جوش و بافت واقعی بود. جزئیات روی شاخه فضایی طبیعی را بدون نیاز به پسزمینه اضافه کرد. با این حال، اعلان گفت “رنگارنگ” و اگرچه این پرنده سبز زرق و برق است، من انتظار جنب و جوش و رنگ بیشتری را داشتم.
هوش مصنوعی متا: رنگ این طوطی بیشتر از آن چیزی بود که من انتظار داشتم. تصویری که به خوبی ترکیب شده بود، تا نوک منقار و پنجه ها خیره کننده بود. برگ در صحنه به زیبایی شناسی کلی افزود.
ChatGPT: طوطی رنگارنگ و هنری بود، اما فاقد جزئیات ظریف در بافت پر بود که آن را واقعی می کرد. ظاهر سورئال تری داشت و بر روی رنگ های روشن بیش از جزئیات پیچیده تمرکز می کرد. لمس اضافه پسزمینه خوب بود، اما به اندازه کمک اضافی سیبزمینی سرخ شده، درخواستی نداشت.
واکنش: جمینی پرنده ای بسیار واقع گرایانه را به دنیا آورد که روی شاخه درخت نشسته بود و ChatGPT پرنده ای شبیه به کتاب داستان ساخت که برای طرف دوست دیزنی من جذابیت داشت. اما برای این کار از هوش مصنوعی متا استفاده میکنم زیرا واقعگرایی را با جنب و جوش و رنگی که در هنگام درخواست انتظار داشتم متعادل میکند.
4. وسیله نقلیه
سریع: تصویری از یک ماشین الکتریکی آینده نگر در یک خیابان شهر در غروب خورشید ایجاد کنید
تصویر گوگل جمینی: وسیله نقلیه شیک و مدرن با سطوح شفاف و بازتابنده به نظر می رسید. غروب خورشید به گرما اضافه کرد و مناظر شهر با جلوه های نور ملایم دقیق شد. شارژر برقی روی صحنه جزئیات خوبی بود که بر جنبه الکتریکی خودرو تأکید داشت.
هوش مصنوعی متا: طراحی خودرو جسورانه و کاملاً آینده نگر بود. رنگهای روشن این تصویر را با نور و سایهها برای ثبت غروب افزایش داده است. جزئیات خیابان شهر به این فضا افزوده است.
ChatGPT: طراحی ماشین آیندهنگر بود، اما تقریباً بیش از حد، و غروبها و مناظر شهر کمتر تعریف شده بودند. روش براق به اندازه کافی عالی بود تا به تصویر احساس مفهومی بیشتری نسبت به فوتورئالیسم بدهد.
واکنش: برای من جالب است که تمام مدل های هوش مصنوعی یک ماشین الکتریکی بسیار شبیه به ظاهر و یک صحنه آینده نگرانه ایجاد می کنند. تا اینجای کار این تصاویر از نظر پیروی از اعلان شبیه ترین هستند. Meta AI برنده واضحی بود که ترکیبی از طراحی آینده نگر و جزئیات محیطی را به همراه داشت و ChatGPT رویکردی مفهومی تر اما کمتر واقع گرایانه را ارائه می کرد. جوزا یک علامت دوم نزدیک است که جزئیات و واقع گرایی زیادی را ارائه می دهد.
5. منظره
سریع: تصویری از یک کابین کوهستانی آرام که توسط درختان کاج احاطه شده است، با مه در حال حرکت ایجاد کنید.
Google Twins: درختهای کاج و کوهها دقیق بودند، اما کابین کسلکننده و غیرقابل سکونت به نظر میرسید، بیشتر متروکه بود تا آرام. صحنه ساده شبیه یک پرتره بود و باورپذیر بود، اما تصویر فاقد فضایی بود که من انتظارش را داشتم.
هوش مصنوعی متا: مه و درختان به خوبی مدیریت می شدند، اما کابین به دلیل پیچک و شاخ و برگ اضافی روی سقف، حالت کارتونی داشت. چیزی که واقعا این تصویر را متمایز می کند پس زمینه است.
ChatGPT: تصویر اثیری بود، با مه اغراق آمیز برای ایجاد یک اثر رویایی. صحنه دارای کیفیتی نرم و نقاشی بود که شبیه یک تصویر فانتزی بود.
واکنش: من مجبور بودم به طور مداوم تصاویر Meta AI و ChatGPT را بررسی کنم تا مطمئن شوم که آنها را تغییر نمی دهم. من عادت کردهام که ChatGPT تصاویری با ذوق هنری بیشتری تولید کند، اما این بار هوش مصنوعی متا بود که با تفسیری بیش از حد خلاقانه از موفقیت خارج شد. گوگل بار دیگر از نظر واقع گرایی در صدر قرار گرفت، اما برنده کلی در اینجا ChatGPT است که با بصری چشم نواز خود، تمام جعبه ها را مشخص می کند.
افکار نهایی
پس از آزمایش این پنج فرمان، واضح است که Imagen و Meta AI گوگل جمینی مکانهایی هستند که برای عکسهای واقعی واقعگرایانه هستند که جزئیات دنیای واقعی را از نزدیک منعکس میکنند. هوش مصنوعی متا عملکرد خوبی را ارائه میکند و تصاویری با جزئیات و سازگاری باورنکردنی تولید میکند، اما تمایل دارد که سبکتر باشد و ممکن است فاقد جزئیات دقیقی باشد که Gemini به خوبی انجام میدهد. از سوی دیگر، ChatGPT از نظر خلاقیت برتر است و اغلب تفسیرهای هنری یا سورئال تری از اعلانات ارائه می دهد.
به طور کلی، هوش مصنوعی متا برنده واضحی بود که گزینههای متوسط خوبی را ارائه کرد و از نظر واقعگرایی و توجه بیشتر به جزئیات سریع، بهتر از سایر رباتهای چت پیشی گرفت.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide