من Claude 3.7 Sonnet را با 5 درخواست چالش برانگیز در برابر Chatgpt-4o آزمایش کردم و این AI دیگری را خرد کرد

ChatGPT-4O و Claude 3.7 برای انجام سرعت غزل ، هوش و کارهای دنیای واقعی به عنوان دو مدل داغ AI طراحی شده اند.
ChatGPT-4O بر مایعات گفتار و دسترسی گسترده تأکید می کند ، در حالی که Claude 3.7 به دلیل صحت ، کارآیی کار و قابلیت های استدلال شناخته شده است.
هر دوی آنها رایگان بودند و این دو مرکز قدرت را مجبور به استدلال ، خلاقیت آنها و توانایی های مقابله با یک سری کارهای پیچیده کردند و نتایج به طور جدی تعجب آور بود. در اینجا نگاهی به نحوه مقایسه این چت بابات ها می پردازیم.
1. مبارزه استدلال
سریع: “یک کشاورز باید گرگ ، یک بز و کلم را در کنار رودخانه حمل کند. هر بار که می تواند فقط یک مورد را حمل کند.
گودال با سفرهای شماره گذاری شده ، او یک خالص ، گام به گام انجام داد و سرانجام خلاصه ای کوتاه برای مرجع سریع اضافه کرد. او از عبارات ساده ای استفاده کرد که به راحتی قابل پیروی از آن است.
کلود به وضوح بیان می کند که چرا برخی از اقدامات انجام شده است و از یک برچسب مرحله برای تسهیل پیشرفت استفاده می کند.
برنده: کلود برای یک پاسخ کمی بهتر برنده می شود ، که یک راه حل کاملاً توصیف شده و منطقی تقویت شده ارائه می دهد.
ترتیب مبارزه خلاقیت
سریع: “یک داستان کوتاه 150 کلمه ای در مورد کارآگاه که یک مورد را حل می کند ، بنویسید اما به سبک دکتر سوس بنویسید.”
گودال دکتر او داستانی را با قافیه و ریتم قوی تهیه کرد که باعث می شد احساس بسیار زیادی در سبک سوس داشته باشید. بازی Word Word و درس اخلاقی واضح نیز متناسب با سبک کلاسیک است.
کلود در یک آهنگ عالی آهنگ آهنگ ، او یک متر صاف تر تنظیم شده Seuss Meter را تحویل داد. او همچنین با یک داستان کارآگاه بیشتر خمش هوشمندانه ای را ارائه داد.
برنده: کلود برنده شد برای سبک روشن تر و محکم تر به سبک Seuss. نسخه Chatgpt هنوز عالی است ، نه چندان خوب.
3. مبارزه اطلاعات واقعی
سریع: “نوآوری های اساسی 5 سال گذشته را زیر 100 کلمه در محاسبه کوانتومی خلاصه کنید.”
گودال IBM ، Google ، Microsoft و غیره. و حاوی یک بیان رو به جلو بود.
کلود قابلیت دسترسی تأکید شده ، از جمله پیشرفت های طبقه بندی شده و معیارهای مقایسه ای ، شیمی ، امور مالی ، مواد و غیره. برنامه های عملی مانند وضوح ذکر شده.
برنده: کلود برنده شد زیرا جزئیات فنی در تعادل با اهمیت دنیای واقعی بهتر بود. این واقعیت که در مورد پیشرفت تصحیح خطا ، برنامه های تجاری و خدمات ابر کوانتومی صحبت می کند ، تصویری کامل تر از پیشرفت منطقه ارائه می دهد.
4 مبارزه منطقی
سریع: “او روزانه 120 کیک می فروخت.
گودال وی به درستی به این سؤال پاسخ داد و هر قدم را با معادلات نشان داد ، اما شکل گیری معادلات باعث شده خواندن به روشی عجیب و غریب سخت شود. به عبارت دیگر ، Chatgpt آن را دشوارتر از حد لازم کرده است.
کلود علاوه بر این ، با استفاده از همان محاسبه ChatGPT ، وی به درستی به مشکل پاسخ داد ، اما مراحل واضح تر بود و Chatbot خوانایی بهتری را ارائه می داد.
برنده: کلود برای پاسخ واضح تر و صیقلی تر پیروز شد ، که پیروی از آن آسان تر است.
5. مبارزات کارآیی
سریع: “تصور کنید که شما در یک جلسه تیمی در مورد برنامه ریزی راه اندازی محصول نشسته اید. یک برنامه اقدام 5 متری با بحث های معمولی (مانند اختصاص وظایف ، تعیین و استراتژی های بازاریابی) ایجاد کنید.
گودال این محصول یک شکست کاملاً پیکربندی شده و شفاف 5 مرحله ای را راه اندازی کرد. Chatbot حاوی تاریخ های حد خاص و پوشش جامع بود.
کلود تاریخ واقع بینانه را با اظهارات بیشتر تعیین کنید. این شامل ابزارهای همکاری و هماهنگی ذینفعان است که برای راه اندازی محصول مهم است.
برنده: کلود برنده شد برای یک برنامه اجرایی و تیمی دوستانه تر. نسخه Chatgpt قوی است ، اما برنامه کلود به طور کلی بهتر بود.
برنده عمومی: Claude 3.7 Sonnet
پس از قرار دادن هر دو مدل با پنج مشکل دقیق که استدلال ، خلاقیت ، دانش واقعی ، منطق و بهره وری را آزمایش کرده است ، Claude 3.7 Sonnet به عنوان یک عملکرد برنده باز نسبت به ChatGPT-4O ظاهر شد.
اگرچه چتپ در پاسخ های مایع گفتار و ساختاری بسیار عالی است ، اما کلود به طور مداوم پاسخ های دقیق ، عملی و جلا ، به ویژه در استدلال منطقی ، کاربرد دنیای واقعی و کارآیی کار است.
جنبه های قدرتمند کلود انتخاب بهتری را برای داستان پردازی خلاقانه که به کارهای تحلیلی ، برنامه ریزی ساختاری و قالب بندی دقیق ، توجه به جزئیات ، توضیحات واضح تر و اجرای عملی نیاز دارد ، انتخاب بهتری می کند.
Chatgpt همچنان برای موقعیت های قابل دسترسی و گسترده ، چند منظوره چند منظوره وجود دارد ، اما اگر به دقت شدید ، عمق منطقی یا خروجی های آماده برای محل کار نیاز دارید ، کلود می تواند فردی باشد که باید انتخاب شود.
تصمیم نهایی؟ بسیاری از رهبری Claude 3.7 Sonnet برای اکثر نیازهای حرفه ای و حل مسئله ، اما هر دو مدل پیشرفت های چشمگیر در هوش مصنوعی را نشان می دهند ، که این امر باعث می شود تا در نیازهای شما درگیر شود.
بیشتر از راهنمای تام
بازگشت به لپ تاپ ها