Anthropic با بهروزرسانی جدید خود Gemini و ChatGPT را شکست میدهد – در اینجا دلیل آن است

دنیای هوش مصنوعی به شدت رقابتی است. هر سال، شرکتهای بزرگ به این سو و آن سو میروند و همگی تلاش میکنند تا به عنوان بهترین و مبتکرترین شرکت، رتبه اول را به خود اختصاص دهند، و در رتبههای برتر قرار بگیرند و به انتخاب جهان تبدیل شوند.
اما در حالی که لیست طولانی از گزینهها برای انتخاب وجود دارد، سه نفر برای کسب رتبه برتر میجنگند. اینها ChatGPT OpenAI، Claude Anthropic و Gemini خود گوگل هستند. با آخرین به روز رسانی خود، Anthropic ممکن است از بسیاری جهات به انتخاب پیشرو تبدیل شود. در اینجا دلیل آن است.
کد نویسی
از زمانی که چت رباتهای هوش مصنوعی اجازه کدگذاری ارتعاشی (قابلیت نوشتن کد از طریق اعلانها) را آغاز کردند، آنتروپیک در این فضا پیشرو بوده است. از آن زمان، این موضوع به تمرکز اصلی شرکت تبدیل شده است، با پیشرفت های قابل توجهی در این زمینه با هر تکرار انجام می شود.
وقتی نوبت به عرضه کلود اپوس 4.5 می رسید، وضعیت فرقی نداشت. در آزمایش خود Anthropic، Opus 4.5 بهتر از Gemini 3 Pro و GPT-5.1 Pro عمل کرد.
این بدان معنا نیست که رقبای آن در کل مدل های بدتری هستند. Gemini 3 در تکالیف سختی درک و نوشتن در سطح فارغ التحصیل از کلود بهتر عمل کرد.
اما این جدیدترین مدل برای Anthropic قصد دارد در کدنویسی به اندازه کافی خوب باشد تا از انسان پیشی بگیرد.
هنگامی که Anthropic با نامزدهای مهندسی مصاحبه می کند، به آن ها چیزی داده می شود که شرکت ادعا می کند “آزمون بسیار دشوار” است. این آزمون همچنین به هر مدل جدید به عنوان بخشی از دوره آزمایش داده می شود.
در 2 ساعت داده شده برای آزمایش، کلود اوپوس امتیاز 4.5 را کسب کرد که بالاتر از هر داوطلب انسانی تا به امروز بود. این آزمون برای آزمایش قضاوت و توانایی های فنی و همچنین عملکرد تحت فشار طراحی شده است.
برای Anthropic، آنها در حال کار بر روی مدلی هستند که می تواند بهتر از یک انسان کدنویسی کند و آن را در نیمی از زمان انجام دهد.
یک رهبر محل کار
هنگامی که آخرین نسخه Opus کلود معرفی شد، Anthropic منطقه ای از چت بات خود را معرفی کرد که اغلب در مورد آن صحبت نمی شود. Gemini و ChatGPT را می توان برای کار و بهره وری استفاده کرد، اما Opus 4.5 به شدت به عنوان ابزار محل کار شما به فروش می رسد.
با ابزارهای مایکروسافت مانند Word، PowerPoint و Excel ادغام می شود. این قابلیتی است که در دستگاههایی مانند ChatGPT نیز یافت میشود و Gemini نیز همین کار را با مجموعه ابزارهای Google انجام میدهد.
تفاوت این است که Anthropic این ویژگی را به یک ویژگی اصلی تبدیل می کند، نه یک افزونه. آنتروپیک می خواهد ابزار اساسی باشد که در محل کار از آن استفاده می کنید.
با این به روز رسانی، Anthropic کلود را برای اکسل راه اندازی کرد. این قابلیتی است که کل کتابخانه اسناد اکسل شما را درک می کند و می تواند تکه های عظیمی از داده ها را مدیریت کند و همچنین فرمول های دقیق و پیچیده را ایجاد و استفاده کند.
این نوع پیشرفت می تواند باعث صرفه جویی در ساعات کار افراد شود، کارهای خسته کننده مانند کار بر روی صفحات گسترده یا ایجاد فرمول های طولانی و دقیق برای جمع آوری اطلاعات را حذف کند.
تمرکز امنیتی
آنتروپیک توجه زیادی به زنگ و سوت ندارد. با این حال، یکی از زمینه هایی که توجه زیادی به آن دارد امنیت آن است.
Anthropic ادعا میکند که Claude Opus 4.5 قویترین مدلی است که تا به امروز منتشر کردهایم، و ما به بهترین مدل مرزی تراز شده توسط هر توسعهدهندهای مشکوک هستیم.
این به توانایی کلود برای مقابله با حملات مخرب یا تلاش برای فریب مدل اشاره دارد. Claude Opus 4.5 به طور قابل توجهی کمتر از Gemini 3 Pro و GPT-5.1 Pro در آزمایشی که تعداد دفعات آن رفتار مرتبط را نشان می دهد، کسب کرد.
به عبارت دیگر، بهتر است برای تزریق فوری (موقعیتهایی که در آن افراد بهطور بدخواهانه درخواستهایی را در متن پنهان میکنند تا سعی کنند یک مدل هوش مصنوعی را فریب دهند) آماده شود. همچنین احتمال کمتری دارد که قربانی تلاش های مخرب برای ربودن مدل به روش های دیگر شود.
افزایش تدابیر امنیتی حیاتی است زیرا هوش مصنوعی کنترل بیشتری بر زندگی ما دارد و انتظار می رود وظایفی را از طرف ما انجام دهد.
نگرانی های قیمت
اما علیرغم همه اینها، احتمالاً ارتقاء کلود برای اکثر افراد (حداقل در ابتدا) کار نخواهد کرد. آنتروپیک Claude Opus 4.5 را پشت یک دیوار پرداخت عظیم قفل کرده است و استفاده از آن مستلزم سرمایه گذاری 90 دلاری در ماه است.
در مقایسه با قیمت های ورودی بسیار پایین تر Gemini 3 و GPT-5.1 (هر دو حدود 20 دلار در ماه)، این بسیار گران به نظر می رسد.
Claude Opus 4.5 برای کاربران سنگین هوش مصنوعی طراحی شده است و دستیاران چت ربات هوش مصنوعی را به نهایت می رساند. برای یک فرد معمولی که کمی کدنویسی می کند، در طول روز پرس و جو می کند، و تحقیقات عمیقی انجام می دهد، همه اینها کمی بیش از حد به نظر می رسد.
اما برای کسانی که میبینند در طول روز کاری به هوش مصنوعی میرسند، آن را با کارهای پیچیده بار میکنند و اغلب به آن تکیه میکنند، Opus 4.5 ممکن است بهترین مدل در بازار در حال حاضر باشد.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.
اطلاعات بیشتر از راهنمای تام
بازگشت به لپ تاپ



