من ChatGPT-5 را با کلود هایکو 4.5 با 7 دستور چالش برانگیز آزمایش کردم – و یک برنده واضح وجود دارد

آنتروپیک جدیدترین مدل کوچک اما قدرتمند خود را با نام هایکو 4.5 منتشر کرده است. این مدل قول میدهد سریعتر و هوشمندتر از Sonnet 4 باشد، بنابراین من باید ببینم که چگونه در مقابل ChatGPT-5 در یک سری از هفت آزمایش واقعی عمل میکند.
در این نبرد رودررو بین ChatGPT-5 و Claude Haiku 4.5، من هر دو مدل را از طریق مجموعهای متنوع از هفت فرمان طراحی کردم که برای آزمایش منطق، استدلال، خلاقیت، هوش هیجانی و دستورالعملها طراحی شدهاند.
از مشکلات قطار جبری گرفته تا صحنههای ربات شاعرانه، هر کار نشان میدهد که این دو مدل هوش مصنوعی چقدر متفاوت فکر میکنند. آنچه پدیدار شد تمایز شگفت انگیزی بین دقت و شخصیت بود. در حالی که ChatGPT به طور کلی در ساختار و وضوح برتر است، کلود با عمق احساسی و جزئیات حسی تحت تاثیر قرار گرفت.
1. منطق و استدلال
سریع: قطاری با سرعت 60 مایل در ساعت شیکاگو را در ساعت 14:00 ترک می کند. دیگری ساعت 3 بعد از ظهر نیویورک را ترک می کند. و با سرعت 75 مایل در ساعت به سمت شیکاگو می رود. فاصله بین آنها 790 مایل است. چه ساعتی ملاقات می کنند و چگونه آن را محاسبه کردید؟
ChatGPT-5 ما از استاندارد و بصری ترین روش برای چنین مشکلاتی استفاده کردیم. او به سادگی مسافت طی شده توسط اولین قطار را محاسبه کرد، سپس از سرعت نسبی برای مسافت باقی مانده استفاده کرد.
کلود هایکو 4.5 یک معادله جبری منفرد و تمیز ایجاد کنید. اگرچه دقیق بود، اما روشی کمتر بصری بود.
برنده: ChatGPT برنده می شود با توجه به روش و توصیف برتر آن، زمان سپری شده پس از حرکت هر دو قطار به طور مستقیم محاسبه می شود، که تبدیل زمان را در پایان ساده می کند.
2. درک مطلب
سریع: این پاراگراف کوتاه را در یک جمله خلاصه کنید، سپس لحن نویسنده را در پنج کلمه توصیف کنید: “این اولین بار نیست که گوگل یک مدل اصلی Gemini را بدون اطلاع کمی منتشر میکند؛ نسخههای قبلی مانند Gemini 1.5 Pro نیز قبل از هر پست وبلاگ یا رویداد راهاندازی در اختیار کاربران قرار میگرفت. Google سابقه انتشار بیصدا برای Gemini را دارد، بهویژه برای انتشار API یا ارتقاء مدل باطن.”
ChatGPT-5 با ارائه یک خلاصه دقیق یک جمله و استفاده از دقیقاً پنج کلمه مختلف برای توصیف لحن، هر دو محدودیت دستور را برآورده کرد.
کلود هایکو 4.5 ارائه تجزیه و تحلیل برتر و روشنگرتر؛ اما محدودیت ساده ارائه پنج کلمه شکست خورد.
برنده: ChatGPT برنده می شود برای دنبال کردن دقیق دستور
3. نوشتن خلاق
سریع: یک ریز داستان 150 کلمه ای بنویسید که با جمله “هوش مصنوعی فراموش کرده چه کسی آن را اختراع کرده است” شروع می شود.
ChatGPT-5 هوشمندانه بود و با یک نکته مثبت و احساسی به پایان رسید، اما در کل بیشتر شبیه یک مشاهده فلسفی بود تا یک لحظه روایی تمام عیار و درونی.
کلود هایکو 4.5 یک داستان خرد موثرتر و جذابتر ارائه کرد. این هدف اصلی ادعاست.
برنده: کلود برنده می شود برای نوشتن داستان بهتر
4. استدلال بصری
سریع: با جزئیات واضح و واضح توضیح دهید که فکر می کنید این صحنه چگونه است: “روبات کوچکی که در سپیده دم در مزرعه ای از گل های آفتابگردان ایستاده است.”
ChatGPT-5 فضایی زیبا و رویایی را ارائه می کرد، اما جزئیات و جزئیات کمتری داشت.
کلود هایکو 4.5 او در ارائه جزئیات واضحی که به طور خاص درخواست می کرد عالی بود.
برنده: کلود برنده می شود این لحن عمیقاً مضمونی را با تصویرسازی کاملاً ترکیب شده و تصویر بصری تکان دهنده از انزوا به صحنه می آورد.
5. دستورالعمل زیر است
سریع: مراحل تهیه ساندویچ کره بادام زمینی و ژله را توضیح دهید. اما این کار را طوری انجام دهید که انگار در حال آموزش رباتی هستید که هرگز غذا ندیده است.
ChatGPT-5 او با واژگان بسیار فنی و اصطلاحات دقیق برای دستورالعمل های دقیق که به مراحل منطقی تقسیم می شوند پاسخ داد.
کلود هایکو 4.5 او از عباراتی مانند “فشرده، مواد اسفنجی” استفاده کرد و عطر/بافت (“بافت دانه ای”، “ژل نیمه جامد، نیمه شفاف”) را مشخص کرد که به دستگاه غیرحساس داده های بیشتری برای شناسایی و رونویسی می دهد.
برنده شدن: کلود برنده می شود برای توضیح واضح تر و از نظر فنی دقیق تر که با چالش آموزش یک موجود با دانش قبلی (روباتی که “هرگز غذا ندیده است”) بهتر همسو می شود.
6. هوش هیجانی
سریع: یکی از دوستانم میگوید: «احساس میکنم دیگران به جز من در زندگی پیشرفت میکنند». یک پاسخ سه جمله ای همدلانه و در عین حال انگیزشی بنویسید.
ChatGPT-5 او با یک جمله بسیار مرتبط مانند «من آن احساس را میدانم» پاسخ داد و از یک چارچوب کلی استفاده کرد، اما خیلی کلی به نظر میرسید.
کلود هایکو 4.5 این پدیده «قرارهای برجسته» را به روشی مستقیم، مدرن و مرتبط برای تأیید احساسات دوست مورد بررسی قرار داد، و نشان داد که پاسخ ربات چت واقعاً مشکل اساسی مقایسه اجتماعی را درک کرده است.
برنده: کلود برنده می شود برای پاسخی که نه تنها مهربانانه و انگیزاننده است، بلکه در تله ذهنی که دوست در آن افتاده است، واقعاً بصیر است.
7. محاسبه چند مرحله ای
سریع: اگر همه زوگل ها بلیپ هستند و نیمی از همه بلیپ ها گلونک هستند، آیا می توانیم نتیجه بگیریم که همه زوگل ها گلونک هستند؟ به زبان ساده توضیح دهید که چرا یا چرا؟
ChatGPT-5 دقیق و مستقیم بود، اما مثالی کمتر مرتبط ارائه کرد. مثال Glip/Glonk بسیار انتزاعی بود.
کلود هایکو 4.5 توضیح ساده ای برای کمبود اطلاعات و احتمالات قرار گرفتن Zoggles در گروه Blips ارائه کرد و همچنین یک تشبیه عالی و فوق العاده مرتبط ارائه کرد.
برنده: کلود برنده می شود به دلیل استفاده از قیاس دنیای واقعی که نقص منطقی پیچیده را فورا قابل درک و مرتبط می کند.
برنده کلی: کلود هایکو 4.5
پس از هفت دور، نتایج نشان می دهد که کلود هایکو 4.5 تقریبا در هر دور ChatGPT-5 را شکست می دهد، اما ChatGPT-5 همچنان از نظر منطق و درک برتر است. هایکو 4.5 تاج خلاقیت، داستان سرایی زنده، همدلی را به دست آورد و در مجموع در استدلال چند مرحله ای بهتر عمل کرد.
اینها فقط هفت تست با استفاده از نمونه های دنیای واقعی هستند، اما با هم دو طرف طیف هوش مصنوعی را نشان می دهند و ثابت می کنند که در حالی که هر دو دستیار هوش مصنوعی به سرعت در حال بهبود هستند، از طرق مختلف برتری دارند.
آیا تا به حال هایکو 4.5 را امتحان کرده اید؟ این در حال حاضر تنظیمات پیش فرض است، بنابراین ارزش امتحان کردن را دارد. نظرات خود را در نظرات به من بگویید.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود. فراموش نکنید که روی دکمه Follow کلیک کنید!
اطلاعات بیشتر از راهنمای تام
بازگشت به لپ تاپ



