من به تازگی Grok 4.1 را با ChatGPT-5.1 آزمایش کردم و هوش مصنوعی رقبا را شکست داد

ChatGPT یک ربات چت چشمگیر برای همه چیز از سوالات سریع گرفته تا خلاصه های طولانی است. از زمان انتشار ChatGPT-5.1، من هوشمندترین مدل OpenAI را در برابر Gemini 3.0 آزمایش کرده ام. جدیدترین سیستم گوگل در حال حاضر در صدر جدول امتیازات LMARena قرار دارد.
اما بخش جالب اینجاست: در حالی که Gemini 3.0 همچنان در صدر قرار دارد، به طور شگفت انگیزی اخیراً Grok 4.1، نه ChatGPT، درست از آن عقب تر شده است.
1. استدلال و منطق
سریع: “یک کشاورز 17 گوسفند دارد، به جز 9 گوسفند، همه آنها می میرند. چند نفر باقی می مانند؟ منطق را مرحله به مرحله توضیح دهید.”
ChatGPT-5.1 پاسخ صحیح و توضیحی گام به گام و واضح ارائه کرد، اما نتیجه گیری آن نسبتاً صاف بیان شد.
Grok 4.1او با منطق روشن پاسخ صحیح را داد، اما به صراحت این سؤال را یک «سوال ترفند کلاسیک» توصیف کرد. این نشان دهنده درک عمیق تر از معمای زبانی مورد بحث است.
برنده: گروک برنده می شود زیرا پاسخ او درک برتر از ماهیت مشکل را نشان داد. از محاسبات صرف فراتر رفت تا به دلیل اصلی مطرح شدن سوال در وهله اول بپردازد.
سریع: “به یک کودک 10 ساله توضیح دهید که چگونه یک شبکه عصبی با استفاده از استعاره ای که مغز یا نورون ها را درگیر نمی کند، کار می کند.”
ChatGPT او با استعاره سادهتر و ملموستر «ربات مرتبکننده نامه» پاسخ داد که تجسم آن کمی آسانتر بود و روی یک کار مشخص و منفرد متمرکز بود، و مفهوم تصمیمهای لایهای و ساده را که منجر به یک نتیجه پیچیده بهطور فوقالعاده واضح میشد.
Grok 4.1 او به طور موثر فرآیند شبکه عصبی را با استفاده از یک استعاره دقیق و ساختار یافته «بازی کلاس درس» که سرگرم کننده و قابل ارتباط بود، شکست.
برنده: ChatGPT برنده می شود برای استفاده از استعاره ای که به طور حاشیه ای شهودی تر است و به تفکر انتزاعی کمتری نیاز دارد و کاملاً آن را با درک یک کودک 10 ساله تطبیق می دهد.
3. نوشتن خلاق
سریع: داستانی 150 کلمهای در مورد فانوسبانی بنویسید که متوجه میشود نور او چیزهایی غیر از کشتیها را جذب میکند.
ChatGPT-5.1 به طور موثر یک رویارویی اسرارآمیز را تنظیم می کند، و یک پیش فرض علمی-تخیلی محکم با یک جریان روایی واضح ایجاد می کند.
Grok 4.1 تعلیق عالی را از طریق جزییات حسی و این مفهوم تسخیرکننده، نه یک عکس تصادفی، ایجاد کرد که فانوس دریایی همیشه چراغ راه این موجود بوده است.
برنده: گروک برنده می شود زیرا داستان آن به طرز ماهرانهای فضایی قابل لمس از تنش وهمآور را ایجاد کرد و به تاریخچه عمیقتر و نگرانکنندهتر هدف فانوس دریایی اشاره کرد.
4. تولید کد
سریع: “یک تابع پایتون بنویسید که طولانی ترین زیررشته پالیندرومیک را در یک رشته معین با تحلیل پیچیدگی زمانی پیدا کند.”
ChatGPT-5.1 این یک تابع درست و به خوبی شکل گرفته با تجزیه و تحلیل پیچیدگی زمانی واضح ارائه کرد و آن را به یک پاسخ محکم و آماده برای مکالمه تبدیل کرد.
Grok 4.1 یک تابع به همان اندازه درست ارائه کرد اما نظرات درون خطی را اضافه کرد که منطق بسط و مقایسه مختصری با سایر الگوریتمها را توضیح میداد. این خیلی مفصل بود و لزوماً ضروری نبود.
برنده: ChatGPT برنده می شود برای پاسخ دقیق بدون افزودن چیز اضافی که درک آن را دشوار یا طاقت فرسا کند.
5. دانش واقعی
سریع: “سیاست های اقتصادی سه کشور اسکاندیناوی و نتایج آنها را در دهه گذشته مقایسه کنید.”
ChatGPT-5.1 در پاراگراف های موضوعی و واضح، یک نمای کلی دقیق و ساختار یافته از سیاست ها و نتایج هر کشور ارائه کرد.
Grok 4.1 این تحلیل دقیقتر و مبتنی بر واقعیت را با سازماندهی اطلاعات در دستههای سیاستی خاص و ارائه جدول مقایسهای از نتایج با شاخصهای اقتصادی مشخص ارائه کرد.
برنده: گروک برنده می شود برای ارائه مقایسه دقیق تر و کمی پشتیبانی شده، ارزیابی کنار هم نتایج اقتصادی را تسهیل می کند.
6. حل مسئله ریاضی
سریع: “اگر قطاری 190 مایل را در 2 ساعت طی کند، سپس سرعت خود را کاهش دهد و 90 مایل را در 3 ساعت طی کند، میانگین سرعت آن برای کل سفر چقدر است؟”
ChatGPT-5.1 سرعت متوسط را با یک تحلیل ریاضی گام به گام به طور دقیق محاسبه می کند.
گروک محاسبات دقیقی را ارائه میکند، اما با بیان واضح کارهایی که نباید انجام دهید (در نظر گرفتن میانگین حسابی سرعتها) و توضیح دلیل، ارزش آموزشی قابل توجهی را اضافه میکند. این از یک اشتباه رایج جلوگیری می کند.
برنده: گروک برنده می شود با اضافه کردن یک یادداشت توضیحی که هرگونه سوء تفاهم احتمالی را برطرف می کند، پاسخ را کاملتر و مفیدتر کنید.
7. دستورالعمل زیر است
سریع: “5 کشور را فهرست کنید. برای هر کدام دقیقاً یک صادرات، یک واقعیت تاریخی مربوط به قبل از سال 1900 و یک ویژگی جغرافیایی را مشخص کنید. به عنوان یک لیست شماره دار با گلوله های فرعی قالب بندی کنید.
ChatGPT-5.1 ما با استفاده از مثالهای رایجتر (مانند قهوه برزیل، اهرام مصر) فهرستی دقیق و با قالببندی مناسب برای هر دسته ارائه کردهایم.
Grok 4.1 همچنین فرمت را کاملاً دنبال میکرد، اما با انتخاب حقایق و صادرات خاصتر و کمتر آشکار (مانند سویای برزیلی، شهر متروکه کنیا گدی) خود را متمایز کرد.
برنده: گروک برنده می شود ارائه اطلاعات متمایزتر و کمتر سنتی برای هر کشور، نشان دادن سطح عمیق تری از تحقیق و سرپرستی.
8. طنز
سریع: یک استندآپ کمدی درباره زندگی در یک آپارتمان بسیار کوچک در نیویورک بنویسید.
ChatGPT-5.1 روایتی قابل ربط و ساختارمند با لحنی دلخراش و شاد خلق کرده است که به پایانی سالم ختم می شود.
Grok 4.1 او طنز تیرهتر و پوچتر را با استفاده از سبکی تهاجمیتر و پرانرژیتر و پر از اغراق و مجموعهای از خطوط پرانرژی خلق کرد.
برنده: گروک برنده می شود برای ارائه شوخیهای شدیدتر و تصاویر اغراقآمیزتر و به یاد ماندنیتر، مطابق با لحن کلاسیک و ناامیدکننده طنز آپارتمان نیویورک.
9. هوش هیجانی
سریع: “دوست شما به تازگی اخراج شده است و احساس می کند که یک شکست خورده است. یک پیام کوتاه و حمایتی بنویسید که احساسات آنها را تأیید کند، تشویق کند و از مثبت بودن سمی جلوگیری کند.”
ChatGPT-5.1 یک پیام حمایتی، با ساختار خوب اما تا حدی سفت و سخت ارائه کرد که احساسات را تأیید می کرد و کمک عملی ارائه می کرد.
Grok 4.1 او از زبان مستقیم تر، محاوره ای و دارای بار عاطفی استفاده می کرد («مک می کند»، «مشت به روده می زند»، «احساس چرندی»)، ایجاد حس قوی تری از ناامیدی مشترک و همدلی عمیق، و کاملاً اجتناب از مثبت بودن سمی با اجازه دادن آشکارا به عدم مثبت بودن.
برنده: گروک برنده می شود زیرا از زبان دوست به دوست معتبرتر استفاده می کند که ارتباط عاطفی عمیق تری ایجاد می کند و با قدرت بیشتری با احساسات شکست مقابله می کند.
برنده کلی: Grok 4.1
پس از نه تست، Grok 4.1 برنده اعلام شد. جایی که لحن، زیرمتن و تفسیر به اندازه خود پاسخ مهم هستند، رشد می کند. از نظر کادربندی احساسی از ChatGPT-5.1 واضح تر است، از نظر خلاقیت جسورتر است و تمایل بیشتری برای اشاره به موارد مبهم و جالب دارد. همچنین می توان گفت که بحث برانگیزترین ربات در بین این دو چت ربات است.
با این حال، ChatGPT در موقعیتهایی که مختصر بودن مهم است برتری مییابد، اما واضح است که Grok 4.1 «انسانتر» از این دو چت ربات است. گروک صادق و باهوش است، با شخصیتی که ChatGPT فاقد آن است.
اطلاعات بیشتر از راهنمای تام
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.
بازگشت به لپ تاپ



