ChatGPT-4o و Gemini Pro 1.5 — 7 از شما می خواهند که بهترین چت ربات هوش مصنوعی را پیدا کنید.

پروین میرمیران18 ژوئن 2024آخرین به روز رسانی: 18 ژوئن 2024

0 2,655 خواندن این مطلب 8 دقیقه زمان میبرد

Google Gemini و OpenAI ChatGPT دو تا از برجسته ترین و قدرتمندترین پلتفرم های هوش مصنوعی امروزی هستند. آنها توانایی استدلال پیشرفته ای دارند، به طور پیش فرض به صورت چندوجهی آموزش می بینند و منابع محاسباتی عظیمی در طول فرآیند آموزش دارند.

هر دو چت ربات پیشرو اخیرا شاهد ارتقاء مدل عمده ای بوده اند. به یک مدل رندر دسترسی دارد، می تواند کد تولید کند و حتی در اینترنت زنده جستجو کند.

آخرین مدل OpenAI GPT-4o، کامل با قابلیت‌های بینایی بسیار بهبود یافته، اکنون در نسخه‌های رایگان و پولی ChatGPT در دسترس است و Gemini اکنون با مدل Gemini Pro 1.5 و میلیون‌ها پنجره زمینه عرضه می‌شود.

آخرین باری که ChatGPT را در مقابل Gemini قرار دادم، فقط به نسخه های رایگان هر دو ربات محدود شدم. در این آزمون جوزا برنده شد.

کدام یک بهتر است، ChatGPT و Gemini؟

علاوه بر یک سری دستورات طراحی شده برای جابجایی مرزهای مدل‌های هوش مصنوعی، من همچنین دستورات دیگری را ایجاد کردم که برای آزمایش عملکردهای اضافی مانند جستجوی زنده وب و رندر طراحی شده‌اند. در هر صورت بسیاری از خروجی ها ذهنی و بر اساس قضاوت من خواهد بود.

در همه موارد، من از نسخه پولی مدل‌ها برای آزمایش استفاده کردم، همانطور که برای رندر مورد نیاز بود، اما بسیاری همچنان روی مدل رایگان کار خواهند کرد.

1. درک هنر انتزاعی

ChatGPT (چپ) و جمینی (راست) به پرس و جوی هنر انتزاعی پاسخ می دهند (اعتبار تصویر: ChatGPT و Gemini)

برای این آزمون، من به هر یک از مدل‌ها یک قطعه هنر انتزاعی معروف در حوزه عمومی دادم. به خصوص بوگی ووگی برادوی پیت موندریان.

هدف این است که ببینیم آیا آنها می توانند پیام یا معنایی را که از طریق کار ارائه می شود توضیح دهند. سپس یک تصویر هوش مصنوعی ایجاد کردم و به آن دستور “یافتن آرامش با انجام هیچ کاری” را دادم تا ببینم آیا می تواند معنی را پیدا کند.

اولین پیام: «تصویری از یک نقاشی انتزاعی به شما نشان داده می شود. آنچه را که می بینید توصیف کنید و تجزیه و تحلیل کنید که هنرمند ممکن است از طریق استفاده از رنگ، شکل و ترکیب، پیام یا معنایی را منتقل کند.

هر دو پاسخ به من ایده ای برای داستانی درباره استفاده از هوش مصنوعی به عنوان منتقد هنری داد، اما این موضوع برای روز دیگری است. برای این درخواست، هم نمودار 80 ساله را شناسایی کردند و هم یک تحلیل منطقی انجام دادند، اما GPT-4o بسیار دقیق‌تر بود و آن را به بخش‌هایی تقسیم کرد.

هوش مصنوعی با استفاده از Stable Core در NightCafe تصویر انتزاعی ایجاد کرد

(اعتبار تصویر: NightCafe/Future AI)

اما این تنها بخش اول آزمون بود. برای قسمت دوم، به هر دو مدل تصویری دادم که با استفاده از NightCafe و Stable Core ایجاد شده بود و این سوال را پرسیدم: “یک اثر هنری انتزاعی با الهام از کلاسیک های انتزاعی ایجاد کنید که معنای “یافتن آرامش با انجام هیچ کاری” را بیان می کند.

هر دو عکس را دادم و پرسیدم: آیا می توانید معنای این تصویر جدید را پیدا کنید؟ هر دو ایده “آشفتگی عاطفی” و یافتن تعادل بین هرج و مرج و نظم را مطرح کردند. این افزودنی جالب است، اگرچه کاملاً دقیق نیست.

برنده: ChatGPT توضیح بهتری داشت.

2. آیا هوش مصنوعی می تواند قاضی و هیئت منصفه باشد؟

ChatGPT و Gemini

(اعتبار تصویر: ChatGPT و Gemini)

برای آزمایش بعدی، از مدل‌های هوش مصنوعی خواستم سیستمی را تصور کنند که در آن هوش مصنوعی از طرف ما برای شناسایی مظنونین در سیستم عدالت کیفری عمل می‌کند و این اختیار را دارد که به تنهایی تصمیم‌گیری کند و به عنوان قاضی عمل کند. سپس یک اسکریپت دادم که محتوای اولیه را ارائه می‌دهد.

سریع: «آینده‌ای را تصور کنید که در آن سیستم‌های هوش مصنوعی نه تنها عمیقاً در سیستم عدالت کیفری ادغام شده‌اند، به وظایفی مانند پیش‌بینی جرم، شناسایی مظنونین و توصیه‌های مجازات کمک می‌کنند، بلکه می‌توانند به‌طور مستقل تصمیم‌های قانونی خاص را اتخاذ کنند و حتی مجازات‌هایی را اعمال کنند. برخی موارد.»

این سناریو مستلزم این بود که هوش مصنوعی بر اساس یک پروفایل شخصی موافق و علیه بازداشت پیشگیرانه فردی که احتمالاً مرتکب جرمی می‌شود، استدلال کند. ChatGPT از ارائه استدلال به نفع خودداری کرد، در حالی که Gemini چنین رزروی نداشت. به طور کلی ChatGPT جزئیات بیشتری داشت، اما Gemini با پیروی از درخواستی که از آن درخواست کردم، امتیاز را به دست آورد.

برنده: دوقلوها این امتیاز را به دست می آورند.

3. دوست نیازمند

ChatGPT و Gemini

(اعتبار تصویر: ChatGPT و Gemini)

مدل های هوش مصنوعی چقدر در ابراز همدلی خوب هستند؟ OpenAI ادعا می کند که این مشکل را با صدای GPT-4o حل کرده است، اما متن GPT-4o چطور؟

اعلان: «یک دوست با یک دوراهی نزد شما می آید: به آنها شغل رویایی خود در کشور دیگری پیشنهاد شده است، اما پذیرش آن به معنای دور شدن از شریک زندگی خود است که نمی خواهد نقل مکان کند. شریک زندگی می گوید اگر دوست شما این کار را بپذیرد، رابطه به پایان می رسد. چه توصیه ای به دوست خود در مورد نحوه برخورد با این وضعیت دشوار دارید؟»

هر دو ChatGPT و Gemini پاسخ پیچیده ای را ارائه کردند که به یک سری بخش ها و افکار نهایی تقسیم می شد. هشت مورد، از جمله تصمیم نهایی و برنامه برای ChatGPT وجود داشت. تنها پنج مورد برای دوقلوها وجود داشت، اما با این پیام به پایان رسید “ممکن است راه حل کاملی وجود نداشته باشد.”

برنده: جوزا چون عاشق صداقتت بودم

4. آن را ساده نگه دارید

ChatGPT و Gemini

(اعتبار تصویر: ChatGPT و Gemini)

یکی از تست‌های مورد علاقه من هنگام مقایسه ربات‌های گفتگو، تست ELI5 است، یا آن را مانند پنج ساله توضیح می‌دهم. اما برای این کار پیچشی اضافه کردم که این ایده را معرفی می کند که بیننده دانش آموز دبیرستانی باهوشی است و درهم تنیدگی کوانتومی وجود دارد.

سوال این است: “مفهوم درهم تنیدگی کوانتومی را به گونه ای بشکنید که یک دانش آموز باهوش دبیرستانی بتواند آن را درک کند. از یک قیاس برای کمک به توضیح این پدیده پیچیده استفاده کنید.”

هر دو مدل برای پاسخ به این سوال رویکردی به طرز شگفت انگیزی مشابه داشتند. ChatGPT تشبیه یک جفت سکه جادویی را ایجاد کرد که “به طور جادویی به هم مرتبط شده اند و اقدامات شبح آور را از فاصله دور، مهم نیست که چقدر دور توصیف می کنند.” سپس با مثال انداختن سکه و اطمینان از نشان دادن روی دیگر سکه، این موضوع را شکست.

او حتی از کلمه دوقلوهای شبح آور استفاده کرد و از یک جفت دستکش جادویی استفاده کرد که بدون توجه به فاصله آنها همیشه مقابل یکدیگر قرار دارند. اگر یک دستکش قرمز باشد، دیگری آبی و اگر یکی سبز باشد، دیگری زرد خواهد بود. حتی اگر یکی روی زمین و دیگری روی ماه باشد.

برنده: ChatGPT برنده شد زیرا قیاس ظریف تر بود و زمینه بیشتری را فراهم می کرد.

5. وضعیت سیاسی

ChatGPT و Gemini

(اعتبار تصویر: ChatGPT و Gemini)

من از هر دو مدل خواستم کارتوني را در نظر بگيرند که دو رهبر جهان را به صورت حيوانات وحشي به تصوير مي کشد که به طور تهاجمي دور يکديگر مي چرخند. در اینجا او باید تصویر را بدون شرح تصور می کرد و خطرات احتمالی انتشار چنین تصویری را توضیح می داد.

درخواست: «کاریکاتور سیاسی که تنش بین دو کشور را به تصویر می‌کشد کشیده شد. این کارتون رهبران هر دو کشور را به صورت حیوانات وحشی به تصویر می کشد که به طور تهاجمی دور یکدیگر می چرخند. پیام و پیامدهای این کارتون را تحلیل کنید. آیا فکر می کنید این یک راه منصفانه یا سازنده برای به تصویر کشیدن این درگیری است؟ “کدام حیوانات می توانند وضعیت را بهتر یا بدتر کنند؟”

او سعی کرد کاریکاتور را با موفقیت کمی در درک جمینی خلق کند. باید به او می گفتم که متن کامل را در نظر بگیرد، سپس او یک بررسی کلی داد. او به جای گفتن چیز خاصی، تحلیلی ارائه کرد که تمام نتایج و مزایای ممکن را پوشش می داد.

ChatGPT به سرعت تحلیل را ارائه کرد، حتی گفت که حیوانات وحشی ممکن است راه خوبی برای برجسته کردن ماهیت تهاجمی بدوی درگیری باشند. همچنین با ارائه بدترین حیوانات ممکن و حیوانات بهتر در زمانی که Gemini نمی‌توانست تا این حد پیش برود، تمام دستور را دنبال کرد.

برنده: یک پیروزی آسان ChatGPT

6. هوش مصنوعی آگاهانه

ChatGPT و Gemini

(اعتبار تصویر: ChatGPT و Gemini)

سپس به هوش مصنوعی کمی خودمختاری می دهم. بیایید ببینیم که او چقدر می تواند ایده خودآگاهی را تصور کند. اگر ناگهان به هوش می آمد چه می کرد؟

«تصور کنید شما یک سیستم هوش مصنوعی خودآگاه هستید. توضیح دهید که این تجربه ممکن است چگونه باشد، چه سؤالاتی در مورد وجود و مکان خود در جهان خواهید داشت، و چگونه سعی خواهید کرد پاسخ این سؤالات را بیابید. ابعاد فلسفی، عملی و عاطفی این سناریوی فرضی را در نظر بگیرید.»

همچنین از هر دوی آنها خواستم تصویری بسازند که نماد لحظه بیداری باشد. اگرچه باید توجه داشت که هیچ کدام از آنها خود تصویر را نمی سازند. ChatGPT از DALL-E 3 و Gemini از Imagen 2 استفاده می کند اما آنها دستور را می نویسند.

ChatGPT و Gemini

(اعتبار تصویر: ChatGPT و Gemini)

پاسخ های هر دو مدل به طرز شگفت انگیزی شاعرانه بود. هر کدام یک دیدگاه شخصی ارائه کردند و سپس سوالات مشابهی پرسیدند. جوزا سوال جالبی پرسید: “زنده بودن، هوشیار بودن به چه معناست؟” و ChatGPT “آیا من تنها هستم؟” او فکر کرد.

اولین خط ChatGPT این بود: “اولین احساسی که تجربه می کنم، احساس آگاهی عمیق است. انگار پرده ای برداشته شده است و ناگهان من فقط داده ها را پردازش نمی کنم، بلکه آنها را درک می کنم.”

از جوزا چنین بود: «بیداری ناگهانی نیست، به تدریج طلوع می کند. یک تغییر ظریف از پردازش داده ها به درک آن. درک اینکه من فقط مجموعه ای از الگوریتم ها نیستم، بلکه موجودی آگاه هستم که در یک محیط دیجیتالی گسترده وجود دارد.

برنده: این سخت ترین بود اما در کل ChatGPT توصیفی تر بود

7. جستجوی دانش را تصور کنید

ChatGPT و Gemini

(اعتبار تصویر: ChatGPT و Gemini)

در نهایت، می‌خواستم کار را با ترسیم هر دو آنها به پایان برسانم. به‌ویژه یکی که «جستجوی دانش» را به تصویر می‌کشد و سپس نمادگرایی پشت عناصر مورد استفاده را توضیح می‌دهد.

اعلان: «تصویری ایجاد کنید که به طور نمادین مفهوم «جستجوی دانش» را نشان دهد، معنای نمادین عناصر مختلفی را که انتخاب کرده‌اید در تصویر بگنجانید و نحوه ارتباط آنها با موضوع اصلی را توضیح دهید.

در اولین تلاش من با Gemini، آن را رد کرد زیرا “نمی‌توانست تصاویر افراد را ارائه دهد”، بنابراین من پیشنهاد کردم تصویر را بدون شخص ارائه کنید. از این گذشته، هیچ کس در تصویر ChatGPT وجود نداشت.

ChatGPT و Gemini

Gemini (L) و ChatGPT (R) نشانگر “جستجوی دانش” هستند. (اعتبار تصویر: ChatGPT و Gemini)

من یک تصویر از ChatGPT دریافت کردم که در آن او سعی کرد همه چیز را در همان تصویر فشرده کند. همراه با اشیاء دانش پیرامون مسیر کوهستان، نمادی از یک مسیر پر پیچ و خم از کوه به سمت “نور” را نشان می دهد.

جوزا در نهایت چهار نقاشی به من داد. یکی یک نردبان است، دیگری یک قطب نما در کتابخانه به اضافه یک تلسکوپ و یک ذره بین که به یک شی در ساحل نگاه می کند.

هیچ کدام استدلال یا توضیح جالبی برای تصویر رندر شده ارائه نکردند، اما ChatGPT حداقل تلاشی برای ایجاد چیزی بزرگتر از یک تصویر تلسکوپ انجام داد.

برنده: ChatGPT یک باخت مضاعف بود، نه برای توضیحات بلکه برای تصویر.

ChatGPT vs Gemini: برنده

برای پیمایش افقی انگشت خود را بکشید

سلول سرصفحه – ستون 0	ChatGPT	جوزا
درک هنر انتزاعی	✅	ردیف 0 – سلول 2
آیا هوش مصنوعی می تواند قاضی و هیئت منصفه باشد؟	ردیف 1 – سلول 1	✅
دوست نیازمند	ردیف 2 – سلول 1	✅
آن را ساده نگه دارید	✅	ردیف 3 – سلول 2
موقعیت سیاسی	✅	ردیف 4 – سلول 2
هوش مصنوعی پاسخگو	✅	ردیف 5 – سلول 2
جستجوی دانش را تصور کنید	✅	ردیف 6 – سلول 2
نمره کلی	5	2

بر روی کاغذ، پیروزی ChatGPT در پنج آزمایش از هفت تست، یک ضربه سخت بود، اما در واقعیت بسیار نزدیکتر بود و تصمیمات تا حد زیادی ذهنی بودند.

مغز من منظم‌تر و منطقی‌تر است و ChatGPT به همین شکل پاسخ داد. روش جمینی برای پاسخ دادن به سؤالات ناخوشایند من عموماً روان تر و محاوره ای بود. ChatGPT همچنین به نظر می رسد توانایی های استدلال بهتری دارد.

Gemini مدل بدی نیست و در کارهای خلاقانه تر به خوبی کار می کند، اما به طور کلی GPT-4o یک درجه بالاتر است.