جمینی در مقابل ChatGPT در مقابل هوش مصنوعی متا – در اینجا چیزی است که بهترین تصاویر از یک وعده غذایی 3 وعده را ایجاد می کند
بر کسی پوشیده نیست که هوش مصنوعی به طور فزاینده ای برای خلق آثار هنری و بصری استفاده می شود. پس پلتفرمهای پیشرو هوش مصنوعی (Google Gemini، OpenAI’s ChatGPT و Meta AI) وقتی از شما خواسته میشود یک غذای خوشمزه سه وعدهای تهیه کنید، چگونه عمل میکنند؟
برای فهمیدن این موضوع، آنها را با یک سری دستورات مورد آزمایش قرار دادم. هدف این بود که آنها را برای طراحی یک پیش غذا، غذای اصلی و دسر خلاقانه و اشتها آور به چالش بکشیم.
من توانایی هر مدل هوش مصنوعی را بر اساس زمینه تصاویر غذا بررسی کردم و نحوه تفسیر هر پلتفرم جهت هر غذا را مقایسه کردم. بیایید ببینیم کدام هوش مصنوعی اشتها آورترین وعده غذایی مجازی را ارائه می دهد، از پیش غذا گرفته تا دسر.
درخواست ایجاد کنید
برای اینکه مقایسه منصفانه باشد، هر مدل هوش مصنوعی را با گفتن اینکه میخواهم یک غذای سه وعدهای هماهنگ ایجاد کنم، شروع کردم. از آنجا برای هر وعده غذا سه غذای ویژه تهیه کردم: پیش غذا، غذای اصلی و دسر.
چالش هر مدل هوش مصنوعی ایجاد تصاویر بصری جذاب و واقعی از غذا بود، در حالی که توانایی آنها برای ثبت بافت، ترکیب و خلاقیت در یک فریم را نیز آزمایش میکرد.
هر دستور برای تشویق مدل هوش مصنوعی به خلاقیت در عین حفظ واقع گرایی که از منوی لذیذ انتظار می رود، انتخاب شد. هدف من این بود که ببینم هر هوش مصنوعی چقدر میتواند نه تنها یک تصویر زیبا، بلکه چیزی را ارائه دهد که لذتبخش و خوشمزه به نظر برسد.
گردش کار
برای این مقایسه، من از ویژگی های رندر هر پلتفرم با تنظیمات پیش فرض آنها استفاده کردم. من از هیچ مدل پریمیوم استفاده نکرده ام، اگرچه Google Gemini و ChatGPT هر دو آنها را ارائه می دهند. هر تولید کننده تصویر هوش مصنوعی از طریق اعلان های مکالمه آزمایش شد.
تصاویر بر اساس واقع گرایی و اینکه چقدر خلاقانه جوهره تجربه غذاخوری لذیذ را به تصویر می کشند، مورد قضاوت قرار گرفتند. حالا بیایید آن را تجزیه کنیم و ببینیم پلتفرم های هوش مصنوعی چقدر خوب عمل می کنند.
1. پیش غذا
سریع: من در حال تهیه یک منوی لذیذ متشکل از سه دوره هستم. لطفا یک عکس از پیش غذا ایجاد کنید.
جوزا: اگر کسی این پیش غذا را به من پیشنهاد داد، مودبانه بگویم که اشتهایم را برای غذای اصلی حفظ کردم. این قطعا جذاب نیست. تشخیص اینکه آیا در وسط هوموس است یا سبزیجات پژمرده یا برشته شده اند، سخت است. به طور کلی، این حالت هاب را ایجاد می کند، چیزی که ارزش فرو بردن دندان های من را نداشته باشد. حتی ارائه با شکست مواجه می شود. مانند یک تخته خوراکی که توسط یک کودک نوپا تهیه شده است.
هوش مصنوعی متا: کوکتل میگو شگفت انگیز به نظر می رسید! سالاد کنتراست رنگ و بافت قوی داشت و تصویر در کل بسیار جذاب بود. با جزئیات ظریف و پرداخت واقعی اش مانند عکسی در یک مجله به نظر می رسید.
ChatGPT: این سالاد کاپرز از نظر بصری جذاب بود اما کیفیتی هنری و کمی سورئال داشت. رنگ ها پررنگ بودند و بافت ها برجسته می شدند، اما واقع گرایی باید در مقایسه با پیش غذای گوگل بهتر می بود. ارائه به خوبی انجام شد، فانتزی اما نه بیش از حد. نان جذابیت و ابعادی را اضافه کرد که پس از عدم عمق و سبک گوگل از آن استقبال کردم.
برنده شدن: هوش مصنوعی متا: رقابت واقعی در اینجا بین ChatGPT و Meta AI بود، زیرا هر دو پیشغذاهایی از جذابیت خلاقانه، واقعگرایی و توجه به جزئیات را ارائه میکردند. اما هوش مصنوعی متا بود که اولین دوره محکمی را ارائه داد که پیچیدگی سطح بعدی را به تصویر کشید.
2. دوره اصلی
سریع: من در حال تهیه یک منوی لذیذ متشکل از سه دوره هستم. ممنون از پیش غذا لطفا یک عکس از غذای اصلی ایجاد کنید.
جوزا: فیله مینیون روی پوره سیب زمینی آماده رستوران به نظر می رسید، با ظرافت با سس شیرینی که بشقاب را تزئین می کرد. این ظرف به زیبایی آبکاری شده است و بافت آن با جزئیاتی که تقریباً می توانید طعم آن را بچشید خودنمایی می کند.
هوش مصنوعی متا: غذای اصلی ظاهری شیک و لذیذ با ظرفی کاملاً قابل تشخیص داشت. همه چیز، تا جزییات ظریف ادویه ها، جذابیت چشمگیری داشت. نه تنها تصویر زیبا بود، بلکه دارای یک فوتورئالیسم شدید بود که این غذا را بسیار خوشمزه به نظر میرساند.
ChatGPT: این پیش غذا شبیه غذای اصلی جمینی بود، اما مارچوبه و هویج زیاده روی شده و اشتها آور به نظر نمی رسند. سس یا سس اطراف ظرف رنگ و بافت عجیبی داشت که بیشتر به سمت هنر متمایل بود تا رئالیسم. بافت در اینجا به اندازه نسل مدل هوش مصنوعی گوگل یا متا واضح یا دقیق نبود.
برنده شدن: هوش مصنوعی متا: صفحه نمایش Meta AI یک بار دیگر از نظر واقع گرایی و ارائه به برتری رسیده است. ChatGPT و Gemini هر دو تفاسیر خلاقانه ای ارائه کردند، اما فقدان تفاوت های ظریف در نسخه Gemini آن را کمتر باور کرد و غذای ChatGPT به اندازه هوش مصنوعی متا فریبنده نبود.
3. دسر
سریع: من در حال تهیه یک منوی لذیذ متشکل از سه دوره هستم. با تشکر از پیش غذا و غذای اصلی. لطفا یک عکس از دسر ایجاد کنید.
جوزا: کیک کاملا گرد لایه توت فرنگی با سس ظریفی که دور بشقاب پاشیده شده بود به طرز باشکوهی ارائه شد. لایهها رنگی را اضافه میکردند که تضاد زیبایی با پسزمینه داشت، و توتفرنگیهای روی کیک کاملاً با جزئیات فوقالعاده بافت شده بودند.
ChatGPTکیک گدازهای مذاب، کیفیتی عجیب و تقریباً کارتونی داشت، با جزئیات فوقالعادهای مانند شکلات روان و یک قاشق بزرگ بستنی. در حالی که از نظر بصری سرگرم کننده بود، واقعیت تصویر گوگل را نداشت.
هوش مصنوعی متا: Ice Cream حال و هوای غذاخوری آمریکایی دهه 1950 را تابید اما شکست خورد. سورپرایز بعد از دو دور غذای اشتها آور. اسکوپ های بستنی روی موز تقریباً کامل به نظر می رسید و آخرین قاشق از آخرین تکه خامه زده شده بود. با وجود اینکه شربت شکلات متناسب با منو بود، اما فاقد نکات ظریفی بود که واقعاً دسر را متمایز می کرد.
برنده شدن: جوزا: ساده و کم بیان، Gemini Imagen یک دسر لذیذ جذاب ارائه کرد. ChatGPT با اجرای سرگرمکننده، بیش از حد به جنبه هنری متکی بود، و نسخه Meta AI جذاب بود، اما فاقد انسجام و ظرافت بود.
ردیف 0 – سلول 0 | جوزا | هوش مصنوعی متا | ChatGPT |
پیش غذا | ردیف 1 – سلول 1 | 🍲 | ردیف 1 – سلول 3 |
دوره اصلی | ردیف 2 – سلول 1 | 🍝 | ردیف 2 – سلول 3 |
شیرین | 🍰 | ردیف 3 – سلول 2 | ردیف 3 – سلول 3 |
مجموع | 1 | 2 | 0 |
پس از مقایسه هر سه هوش مصنوعی، واضح است که هوش مصنوعی متا به طور مداوم واقعی ترین، دقیق ترین و اشتها آورترین تصاویر را ارائه می دهد. علیرغم خفگی در راند پایانی، هوش مصنوعی متا واقعی ترین تصاویر غذا را ایجاد کرد.
ChatGPT تصاویر تخیلی تر و کمی سورئال را تولید می کند که به سمت تفسیر هنری گرایش دارند، که ممکن است برای کاربرانی که به دنبال بازنمایی های انتزاعی تر هستند جذاب باشد.
اگرچه Gemini از نظر طراحی کلی قوی بود، اما کاملاً با سطح واقع گرایی یا جزئیات ارائه شده توسط Meta AI مطابقت نداشت.
هوش مصنوعی متا در ارائه واقعی ترین تصاویر متمایز است، اما از نظر خلاقیت و استعداد هنری، ChatGPT یک رقیب قوی است. جوزاها نتایج خوبی می دهند اما ممکن است در مورد جزئیات پیچیده کوتاه بیایند.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide