Anthropic با به‌روزرسانی جدید خود Gemini و ChatGPT را شکست می‌دهد – در اینجا دلیل آن است

پروین میرمیراندسامبر 3, 2025آخرین به روز رسانی: دسامبر 3, 2025

2,664 خواندن این مطلب 4 دقیقه زمان میبرد

Anthropic با به‌روزرسانی جدید خود Gemini و ChatGPT را شکست می‌دهد – در اینجا دلیل آن است

دنیای هوش مصنوعی به شدت رقابتی است. هر سال، شرکت‌های بزرگ به این سو و آن سو می‌روند و همگی تلاش می‌کنند تا به عنوان بهترین و مبتکرترین شرکت، رتبه اول را به خود اختصاص دهند، و در رتبه‌های برتر قرار بگیرند و به انتخاب جهان تبدیل شوند.

اما در حالی که لیست طولانی از گزینه‌ها برای انتخاب وجود دارد، سه نفر برای کسب رتبه برتر می‌جنگند. اینها ChatGPT OpenAI، Claude Anthropic و Gemini خود گوگل هستند. با آخرین به روز رسانی خود، Anthropic ممکن است از بسیاری جهات به انتخاب پیشرو تبدیل شود. در اینجا دلیل آن است.

کد نویسی

(اعتبار تصویر: Future/NPowell)

از زمانی که چت ربات‌های هوش مصنوعی اجازه کدگذاری ارتعاشی (قابلیت نوشتن کد از طریق اعلان‌ها) را آغاز کردند، آنتروپیک در این فضا پیشرو بوده است. از آن زمان، این موضوع به تمرکز اصلی شرکت تبدیل شده است، با پیشرفت های قابل توجهی در این زمینه با هر تکرار انجام می شود.

وقتی نوبت به عرضه کلود اپوس 4.5 می رسید، وضعیت فرقی نداشت. در آزمایش خود Anthropic، Opus 4.5 بهتر از Gemini 3 Pro و GPT-5.1 Pro عمل کرد.

این بدان معنا نیست که رقبای آن در کل مدل های بدتری هستند. Gemini 3 در تکالیف سختی درک و نوشتن در سطح فارغ التحصیل از کلود بهتر عمل کرد.

اما این جدیدترین مدل برای Anthropic قصد دارد در کدنویسی به اندازه کافی خوب باشد تا از انسان پیشی بگیرد.

مهندسی نرم افزار کلود

(اعتبار تصویر: Anthropic)

هنگامی که Anthropic با نامزدهای مهندسی مصاحبه می کند، به آن ها چیزی داده می شود که شرکت ادعا می کند “آزمون بسیار دشوار” است. این آزمون همچنین به هر مدل جدید به عنوان بخشی از دوره آزمایش داده می شود.

در 2 ساعت داده شده برای آزمایش، کلود اوپوس امتیاز 4.5 را کسب کرد که بالاتر از هر داوطلب انسانی تا به امروز بود. این آزمون برای آزمایش قضاوت و توانایی های فنی و همچنین عملکرد تحت فشار طراحی شده است.

برای Anthropic، آنها در حال کار بر روی مدلی هستند که می تواند بهتر از یک انسان کدنویسی کند و آن را در نیمی از زمان انجام دهد.

یک رهبر محل کار

کلود اکسل

(اعتبار تصویر: Anthropic)

هنگامی که آخرین نسخه Opus کلود معرفی شد، Anthropic منطقه ای از چت بات خود را معرفی کرد که اغلب در مورد آن صحبت نمی شود. Gemini و ChatGPT را می توان برای کار و بهره وری استفاده کرد، اما Opus 4.5 به شدت به عنوان ابزار محل کار شما به فروش می رسد.

با ابزارهای مایکروسافت مانند Word، PowerPoint و Excel ادغام می شود. این قابلیتی است که در دستگاه‌هایی مانند ChatGPT نیز یافت می‌شود و Gemini نیز همین کار را با مجموعه ابزارهای Google انجام می‌دهد.

تفاوت این است که Anthropic این ویژگی را به یک ویژگی اصلی تبدیل می کند، نه یک افزونه. آنتروپیک می خواهد ابزار اساسی باشد که در محل کار از آن استفاده می کنید.

با این به روز رسانی، Anthropic کلود را برای اکسل راه اندازی کرد. این قابلیتی است که کل کتابخانه اسناد اکسل شما را درک می کند و می تواند تکه های عظیمی از داده ها را مدیریت کند و همچنین فرمول های دقیق و پیچیده را ایجاد و استفاده کند.

این نوع پیشرفت می تواند باعث صرفه جویی در ساعات کار افراد شود، کارهای خسته کننده مانند کار بر روی صفحات گسترده یا ایجاد فرمول های طولانی و دقیق برای جمع آوری اطلاعات را حذف کند.

تمرکز امنیتی

نگرانی های امنیتی کلود

(اعتبار تصویر: Anthropic)

آنتروپیک توجه زیادی به زنگ و سوت ندارد. با این حال، یکی از زمینه هایی که توجه زیادی به آن دارد امنیت آن است.

Anthropic ادعا می‌کند که Claude Opus 4.5 قوی‌ترین مدلی است که تا به امروز منتشر کرده‌ایم، و ما به بهترین مدل مرزی تراز شده توسط هر توسعه‌دهنده‌ای مشکوک هستیم.

این به توانایی کلود برای مقابله با حملات مخرب یا تلاش برای فریب مدل اشاره دارد. Claude Opus 4.5 به طور قابل توجهی کمتر از Gemini 3 Pro و GPT-5.1 Pro در آزمایشی که تعداد دفعات آن رفتار مرتبط را نشان می دهد، کسب کرد.

به عبارت دیگر، بهتر است برای تزریق فوری (موقعیت‌هایی که در آن افراد به‌طور بدخواهانه درخواست‌هایی را در متن پنهان می‌کنند تا سعی کنند یک مدل هوش مصنوعی را فریب دهند) آماده شود. همچنین احتمال کمتری دارد که قربانی تلاش های مخرب برای ربودن مدل به روش های دیگر شود.

افزایش تدابیر امنیتی حیاتی است زیرا هوش مصنوعی کنترل بیشتری بر زندگی ما دارد و انتظار می رود وظایفی را از طرف ما انجام دهد.

نگرانی های قیمت

کلود هوش مصنوعی در گوشی های هوشمند

(اعتبار تصویر: Shutterstock)

اما علی‌رغم همه این‌ها، احتمالاً ارتقاء کلود برای اکثر افراد (حداقل در ابتدا) کار نخواهد کرد. آنتروپیک Claude Opus 4.5 را پشت یک دیوار پرداخت عظیم قفل کرده است و استفاده از آن مستلزم سرمایه گذاری 90 دلاری در ماه است.

در مقایسه با قیمت های ورودی بسیار پایین تر Gemini 3 و GPT-5.1 (هر دو حدود 20 دلار در ماه)، این بسیار گران به نظر می رسد.

Claude Opus 4.5 برای کاربران سنگین هوش مصنوعی طراحی شده است و دستیاران چت ربات هوش مصنوعی را به نهایت می رساند. برای یک فرد معمولی که کمی کدنویسی می کند، در طول روز پرس و جو می کند، و تحقیقات عمیقی انجام می دهد، همه اینها کمی بیش از حد به نظر می رسد.

اما برای کسانی که می‌بینند در طول روز کاری به هوش مصنوعی می‌رسند، آن را با کارهای پیچیده بار می‌کنند و اغلب به آن تکیه می‌کنند، Opus 4.5 ممکن است بهترین مدل در بازار در حال حاضر باشد.

اخبار گوگل

دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.

اطلاعات بیشتر از راهنمای تام

بازگشت به لپ تاپ

نمایش بیشتر

پروین میرمیراندسامبر 3, 2025آخرین به روز رسانی: دسامبر 3, 2025

2,664 خواندن این مطلب 4 دقیقه زمان میبرد

Anthropic با به‌روزرسانی جدید خود Gemini و ChatGPT را شکست می‌دهد – در اینجا دلیل آن است

کد نویسی

پروین میرمیران

بایننس سه توکن رمزنگاری را به ساعت حذف از فهرست اضافه می کند: چه کسی تحت تأثیر قرار می گیرد؟ – یو.امروز

کیا دارای 8 مدل در سال 2026 است

بهترین قاب‌های Samsung Galaxy Z Flip 8 برای محافظت از دستگاه تاشو جدید شما – از 19 دلار شروع می‌شود

جریان های نقطه ای XRP با وجود پویایی مثبت بازار 182 درصد افزایش یافت – U.Today

هکرهای کره شمالی پس از شستشوی بودجه دولتی با Crypto – U.Today دستگیر شدند

نشت تاخیر آیفون Ultra در پی رونمایی پیروزمندانه گلکسی فولد 8 سامسونگ باعث شد که منتظر دستگاه تاشو اپل باشم.

3 بهترین فیلم Prime Video که باید این آخر هفته (24 تا 26 ژوئیه) پخش کنید

3 میلیون SHIB به کیف پول مرده فرستاده شد، اما نرخ سوزاندن سوزاندن بدن پایین است – U.Today

ChatGPT به من گفت باردار هستم. کاملا اشتباه بود.

Dogecoin (DOGE) افزایش عظیم 123٪ در حجم تراکنش ها را اعلام کرد – U.Today