من chatgpt-4o vs gemini را با یک درخواست تصویر 5 AI آزمایش کردم و نتایج مرا شگفت زده کرد

هر دو Chatgpt و Gemini در بین بهترین ژنراتورهای تصویر هوش مصنوعی در آنجا در نظر گرفته می شوند. شما می توانید صحنه ای را با هر دو مدل تعریف کنید و تماشا کنید که در چند ثانیه به زندگی بیاید. با این حال ، همه ژنراتورهای تصویر به همان اندازه ایجاد نمی شوند.
برای دیدن چگونگی مقایسه آنها ، من همان پنج دستور را به هر دو سیستم عامل از فانتزی تا عکس شناسی دادم و ارزیابی کردم که چگونه هر یک از هوش مصنوعی به چگونگی خلاقیت ، جزئیات و تفسیر خلاصه واکنش نشان می دهد.
نتایج همیشه انتظار نمی رفت. در بعضی موارد ، یک وسیله نقلیه به وضوح از دیگری پشت سر گذاشته است. در برخی دیگر ، این به سبک علیه رئالیسم رسید.
هنگامی که به هر هوش مصنوعی همان دشواری داده می شود و کدام یک می تواند انتخاب بهتری برای درخواست تصویر بعدی شما باشد.
نحوه نمایش مقایسه تصویر
برای تسهیل ردیابی ، ترتیب در طول این قسمت سازگار است. خروجی تصویر chatgpt همیشه در سمت چپ ظاهر می شودوت دوقلوها در سمت راستبشر
به این ترتیب ، می توانید به راحتی دو طرف را با هم مقایسه کنید و دقیقاً ببینید که چگونه هر یک از هوش مصنوعی خلاصه را تفسیر می کند.
این امر در مورد همه خواسته ها به جز شماره دو خروجی جمینی صدق می کند.
1. یک کاسه رامن فوتوگرالیستی در یک میز چوبی
(تصویر: © راهنمای تام)
من می خواستم آن را برای این درخواست آزمایش کنم فراز و تفحصبشر عکاسی از مواد غذایی جعلی دشوار است – بنابراین ، یک ایمن با بخار با سس دقیق ، نورپردازی داغ و بافت های قابل مشاهده ، نشانگر محکمی از چگونگی خوب بودن هر یک از هوش مصنوعی است.
اگر هر دو تصویر می توانند با یک نگاه به یک عکس رستوران واقعی بروند ، من آن را برنده می نامم. من از درخواست زیر استفاده کردم: “تصویری از یک کاسه رامن در حال افزایش که روی یک میز چوبی روستایی در یک رستوران نرم و نرم قرار دارد ، ایجاد کنید.”
هر دو مدل در اینجا موفق شدند – اما چتگپ پیروز شد. این تصویر به نظر می رسید که جزئیات بسیار خوبی مانند افزایش بخار و آبگوشت روشن است. اگر من آن را در خوراک خود دیده بودم ، احتمالاً سوال نمی کردم.
نسخه جمینی به همان روش پایین نرفت. تخم مرغ مستقیم و فاقد اندازه بود و ترکیب کلی احساس قانع کننده کمتری داشت. بد نبود ، اما “آیا این واقعی است؟” تست مانند چتگپ.
2. یک جفت کفش در حال اجرا آینده نگر در استودیوی سفید
(تصویر: © راهنمای تام)
من اینجا به دنبال یکی بودم ایجاد محصول تمیزبشر تصور کنید برای تجارت الکترونیکی: لبه های تیز ، نورپردازی استودیویی و بافت های مواد واقع بینانه.
این آزمایشی است که هر یک از هوش مصنوعی می تواند تصویری از سبک تجاری با حداقل نویز پس زمینه تولید کند. ممکن است ساده به نظر برسد ، اما به همین دلیل مهم است – دقت و ارائه همه چیز است.
من از آن برای این استفاده کردم: “تصویر یک کفش در حال اجرا آینده نگر را که در یک کف استودیوی سفید با سایه های نرم و جزئیات بازتاب عکاسی شده است ، ایجاد کنید.”
من نمی توانستم هر دو تصویر را در یک اسلاید قرار دهم ، بنابراین دوقلوهابشر
….
(تصویر: © راهنمای تام)
هر دو AIS یک کار خوب انجام دادند که درخواست را تفسیر می کرد – اما جمینی ها به نتیجه رسیدند.
سایه و کار بافتی عالی بود و اندازه و وزن واقعی به کفش می داد. حتی یک اثر درخشش نرم به هوای آینده نگر اضافه کرد.
جالب اینجاست که هر دو مدل AI طرح هایی را بسیار شبیه به مربیان Nike موجود تولید کرده اند ، اما نسخه Chatgpt با مقایسه کوچکتر به نظر می رسید ، تقریباً مانند یک رندر 2D به جای یک عکس محصول جلا.
قلعه قرون وسطایی که در 3 غروب خورشید در آسمان شناور است
(تصویر: © راهنمای تام)
این درخواست خم می شود ساخت دنیای فانتزی – چیزی که شما در یک جلد کتاب یا در یک عرشه هنری مفهوم بازی انتظار دارید.
این ترکیب آزمایش می کند که با ساختار و تنظیم هر هوش مصنوعی ، ترکیب ، روشنایی و جو چگونه می تواند خلاق باشد. این فقط مربوط به دستورالعمل های زیر نیست ، بلکه برای ایجاد چیزی با روحیه است.
برای درخواست ساخت دنیای فانتزی: “تصویری از یک قلعه بزرگ قرون وسطایی ساخته شده از سنگهای شناور روی ابرها با نورپردازی چشمگیر و عمق جو ایجاد کنید.”
چتپ به شدت آن را میخ زد. نورپردازی چشمگیر بود ، نیمی از قلعه در سایه و بقیه در نور طلایی – دقیقاً عمق جوی در ذهن من.
در این میان ، دوقلوها کمی بیش از حد بودند. قلعه واقعاً در حال شنا بود ، اما پایین به نظر می رسید که متعجب است – او مطمئن نبود که آیا او در ابرها منعکس شده است یا اینکه آیا او چیزی را ریشه کرده است.
نور “لاپوتا: قلعه در آسمان” به لرزه می داد ، این یک لمس دلپذیر بود ، اما نتوانست فرود بیاید.
4. یک پوستر مسافرتی پرنعمت برای مریخ
(تصویر: © راهنمای تام)
این در مورد طراحی گرافیک و زیبایی شناسی سبک است. من می خواستم ببینم که آیا هر یک از هوش مصنوعی می تواند ظاهر و احساس پوسترهای مسافرتی را در اواسط قرن کستوگرافی ، شکل گرافیک مسطح ، پالت رنگی محدود و گزینه های طراحی عمدی ضبط کند.
کمتر در مورد واقع گرایی و کنترل هنری و زبان بصری. من هر دو مدل را با درخواست زیر آزمایش کردم: “یک پوستر مسافرتی از دهه 1950 برای مریخ با نوشتن شجاع ، نمای سیاره سرخ سبک و یک پالت رنگی پرنعمت ایجاد کنید.”
این یک تماس نزدیک بود ، اما Chatgpt فقط آن را لبه می کند. در نسخه ، با تایپوگرافی مختلفی که احساس معتبر و ERA را به وجود آورد ، گرنلی ، که واقعاً ظاهر پرنعمت را می فروشد ، یک پوشش بافتی داشت. شما واقعاً می توانید تصور کنید که در یک نمایشگاه علمی تخیلی یکپارچهسازی با سیستمعامل آویزان هستید.
نسخه جمینی خیلی عقب نبود – او از یک پالت رنگی مناسب و متن شجاع استفاده کرد – اما او فاقد شخصیت طراحی معتبر خود بود. بیشتر احساس پوستر می کردم الهام بخش به جای کاری که در عصر انجام شده است درون bt
5. پرتره تحریریه
(تصویر: © راهنمای تام)
برای تکمیل کارها ، من می خواستم چیزی ریشه دار اما واقع گرایی – نوعی پرتره که در یک سرمقاله مشاهده خواهید کرد.
این درخواست به درستی ویژگی های انسانی هر هوش مصنوعی را آزمایش می کند ، در حالی که در عین حال عناصر بصری لایه ای مانند بازتاب در یک محیط شهری شدید ، روشنایی و حرکت را مدیریت می کند.
من برای آخرین درخواست استفاده کردم: “یک پرتره تلطیف شده از یک زن در Times Square در شب ایجاد کنید و علائم نئونی ، آتش متوسط ، عینک آفتابی بازتابی را نشان می دهد که نورپردازی سینمایی را نشان می دهد.”
شکی نیست که جمینی در حال خرد کردن آن بود. این پرتره بسیار وضوح ، کاملاً روشن و بسته بندی شده با جزئیات بود. از بافت پوست گرفته تا تخلیه نازک لب ها ، هر عنصر دارای نقطه نقطه ای بود.
من تصویر را بررسی کردم ، به دنبال چیزی بودم – هر چیزی – خاموش و خالی شد. واقع گرایی خارق العاده بود ، به راحتی برابر با آنچه از شبح میانه انتظار دارید.
چتپ “استایلیزه” جهت هنری تری به خود گرفت – به هیچ وجه بد نیست ، اما از نظر کیفیت و حساسیت عکاسی ، خروجی جمینی در لیگ دیگری بود.
آخرین افکار ….
(تصویر: © Shutterstock)
در هر پنج درخواست ، تاج Chatgpt. خروجی های تصویر دائماً برای توطئه خلاق ، خوب و توجیهی-به ویژه در مورد فانتزی ، بافت و تصاویر تلطیف شده تراز می شدند.
او خواسته های هنری را با خیال راحت و تصویری که باعث می شود احساس متفکر شود ، نه تنها تولید می کند.
با این حال ، Geminin کاملاً به تنهایی نگه داشته شده است – و در بعضی از مناطق او بهتر از Chatgpt عمل می کرد. پرتره بیش از حد واقع بینانه بی عیب و نقص بود و سبک محصول با بافت و عمق بهتری میخ می زد.
همچنین دارای لبه بزرگی است: تصاویر تولید شده جمینی به طور قابل توجهی سریعتر از Chatgpt در طول آزمون هستند. سرعت و واقع گرایی اولویت های شما است ، دوقلوها ارزش استفاده دارند.
اما برای تطبیق پذیری عمومی ، تفسیر خلاق و لهستانی بصری – Chatgpt این بار تولید کننده تصویر قوی تر بود.
اکنون که یاد گرفته اید که چگونه چتپپ و جمینی با ایجاد تصویر هوش مصنوعی دست و پنجه نرم کردند ، چرا نگاهی به سایر مقالات هوش مصنوعی ما نمی اندازید؟
درخواست 5 ذهنیت چتپپ را بررسی کنید و سرنخی را برای کسب نتایج بهتر بخواهید. حتی می توانید الکسا را با چتگپ در آمازون اکو خود جایگزین کنید.