هوش مصنوعی

من Gemini 2.5 Pro را با 9 درخواست چالش برانگیز در برابر کلود 4.5 آزمایش کردم – و یک برنده باز وجود دارد

من با آخرین راه اندازی Claude 4.5 بسیار آزمایش می کنم. اخیراً من Claude 4.5 را در برابر ChatGPT-5 آزمایش کردم و نتوانستم نتایج را باور کنم. Anthropic آخرین مدل های خود را “هوشمندانه ترین مدل” می نامد ، بنابراین من مشتاقانه منتظر بودم ببینم Google’s Gemini 2.5 Pro چه کاری می تواند انجام دهد.

برای فهمیدن چگونگی مقایسه این دو ، من نه چالش مختلف را برای تأکید بر صحت ، استدلال و خلاقیت آنها اضافه کردم-چیزی که این مدل ها در تست های مقایسه کار خوبی انجام می دهند.

از مشکلات منطق و کلمات ریاضی گرفته تا برنامه نویسی و نوشتن خلاق ، وقتی آنها به پای خود رفتند ، این دو مدل جدید را کشف کردم. نتایج ممکن است شما را شگفت زده کند!

1. معما منطق

(وام تصویر: آینده)

سریع: “شما سه جعبه دارید: یکی فقط سیب ، یکی فقط حاوی نارنجی است ، و دیگری شامل هر دو است. هر جعبه به طور نادرست برچسب خورده است. شما می توانید یک میوه را از یک جعبه انتخاب کنید. برچسب های مناسب چگونه هستید؟”

کلود 4.5 برای مورد دیگر ، وی کسر دقیق و منطقی ضد هوا را بدون هیچ گونه پر ، از جمله یادداشت سریع “منطق چرخش” ارائه داد.

دوقلوها 2.5 طرفدار یک دوست جدید ، یک قدم و توجیهی که در مرحله بعد قرار دارد و باعث می شود پیروی از “چرا این کار” آشکار شود.

برنده: کلود برنده شد برای پاسخ کاملاً صحیح که نشان می دهد چگونه رای دهنده تمام برچسب ها را از جعبه “هر دو” با حداقل استدلال شناسایی می کند.

برنامه ریزی مرحله 2 مرحله

عکس

(وام تصویر: آینده)

سریع: “یک سفر خانوادگی 3 روزه به بوستون با کودکان 4 ، 8 و 10 ساله برنامه ریزی کنید.

پروین میرمیران

پروین میرمیران، نویسنده و متخصص در حوزه هوش مصنوعی با بیش از 5 سال تجربه در نگارش مقالات تخصصی، آموزشی و پژوهشی است. او به عنوان یک انسان علاقه‌مند به یادگیری و پیشرفت، همواره به دنبال به‌روزترین مطالب و روش‌های کاربردی در زمینه هوش مصنوعی است. با توانایی برجسته در تحلیل داده‌ها و ارائه راهکارهای نوین، پروین میرمیران توانسته است به عنوان یک متخصص معتبر در این زمینه شناخته شود. به عنوان یک نویسنده حرفه‌ای، پروین میرمیران تمام تلاش خود را به کاربرمحوری و ارائه محتوای ارزشمند برای خوانندگان متمرکز کرده است. او با استفاده از زبان ساده و قابل فهم، مطالب پیچیده هوش مصنوعی را به شکلی دست‌نخورده و قابل فهم برای عموم مخاطبان خود تبدیل می‌کند.
دکمه بازگشت به بالا