کلود به تازگی هوش مصنوعی خود را ارتقا داده است و اکنون می تواند همه پروژه ها را یکجا پردازش کند

در حالی که همه ما در حال کشف عملکرد بهبود یافته Claude Opus 4.6 هستیم، Anthropic نیز Claude Sonnet 4.6 را معرفی می کند – و ارتقاء بزرگتری نسبت به شماره نسخه آن است. این شرکت میگوید که این تواناترین مدل Sonnet است که تاکنون پیشرفتهای عمدهای در کدنویسی، استدلال، محاسبات و طراحی ایجاد کرده است، در حالی که قیمت آن را با Sonnet 4.5 یکسان نگه میدارد.
مهمتر از آن، Sonnet 4.6 فاصله بین مدل های هوش مصنوعی میان رده و پرچمدار را پر می کند. کارهایی که قبلاً به یک مدل کلاس Opus نیاز داشتند، اکنون می توانند با هزینه بسیار کمتر در Sonnet اجرا شوند. در اینجا چیزی است که شما باید بدانید.
یک مدل هوشمندتر بدون قیمت بالاتر
Claude Sonnet 4.6 اکنون مدل پیش فرض برای کاربران Free و Pro در Claude.ai و Claude Cowork است. آزمایش اولیه توسعه دهندگان ترجیح قوی برای مدل جدید را نشان می دهد. کاربران Sonnet 4.6 را نسبت به مدل قبلی با حدود 70% ترجیح می دهند. در برخی از گردشهای کاری، آزمایشکنندگان حتی آن را به Claude Opus 4.5 ترجیح دادند، زیرا دستورالعملها را بهتر دنبال میکردند و توهمات کمتری داشتند.
یکی از بزرگترین ارتقاها پنجره زمینه 1 میلیون سکه است (در حال حاضر در نسخه بتا). این برای تحلیل کافی است:
- همه پایگاه های کد
- قراردادهای حقوقی طولانی
- ده ها مقاله تحقیقاتی
- گردش کار چند سندی پیچیده
اما اندازه تمام ماجرا نیست. Sonnet 4.6 برای استدلال در این زمینه طراحی شده است و برنامه ریزی طولانی مدت بهتر و حل مشکلات چند مرحله ای را در عین اولویت دادن به امنیت امکان پذیر می کند.
در یک ارزیابی شبیهسازی عملیات تجاری، مدل به شدت در اوایل سرمایهگذاری، سپس به سمت سودآوری متمرکز شد. این یک تغییر استراتژیک بود که به آن کمک کرد تا از رقبای خود پیشی بگیرد.
ما به هوش مصنوعی واقعا مستقل نزدیک می شویم
آنتروپیک به حرکت خود به سمت هوش مصنوعی ادامه می دهد که بتواند نرم افزارهایی مانند انسان ها را اجرا کند. به جای تکیه بر API ها، کلود می تواند:
- روی رابط ها کلیک کنید
- فرم های وب چند مرحله ای را پر کنید
- پیمایش صفحات گسترده
- هماهنگ کردن وظایف در سربرگ های مرورگر
تست هوش مصنوعی با استفاده از نرمافزار واقعی مانند Chrome، LibreOffice و VS Code، معیارهای OSWorld بهبود مستمری را نشان میدهند و کاربران اولیه عملکرد در سطح انسانی را در گردشهای کاری پیچیده گزارش میکنند.
این مهم است زیرا اکثر نرم افزارهای تجاری برای اتوماسیون طراحی نشده اند. مدلی که بتواند از ابزارها به همان روشی که انسان ها استفاده می کنند استفاده کند، می تواند به طور قابل توجهی آنچه را که هوش مصنوعی می تواند به دست آورد، گسترش دهد. با این حال، این شرکت اعتراف می کند که این فناوری همچنان در حال تعقیب کاربران قدرتمند است، اما پیشرفت در حال شتاب گرفتن است.
دفاع تزریق فوری قوی تر
همانطور که هوش مصنوعی توانایی اجرای رایانه ها را به دست می آورد، خطرات امنیتی نیز افزایش می یابد. یکی از بزرگترین تهدیدات تزریق فلاش است که در آن دستورالعمل های مخرب در داخل وب سایت ها یا اسناد پنهان می شوند.
Anthropic می گوید که Sonnet 4.6 در مقایسه با Sonnet 4.5 پیشرفت زیادی در مقاومت در برابر این حملات نشان می دهد و عملکردی مشابه آخرین مدل Opus در معیارهای امنیتی دارد.
Sonnet 4.6 چندین بهبود پلت فرم را معرفی می کند:
- حالت های تفکر تطبیقی و توسعه یافته
- فشرده سازی زمینه برای خلاصه کردن محتوای مکالمه قدیمی (در حال حاضر در نسخه بتا)
- ابزارهای جستجوی وب که به طور خودکار نتایج را فیلتر می کنند
- فراخوانی ابزار، حافظه و قابلیت های اجرای کد گسترش یافته است
- پشتیبانی از افزونه اکسل برای اتصالات MCP (FactSet، PitchBook، S&P Global و موارد دیگر)
در نتیجه
برای اکثر کارهای بهره وری در دنیای واقعی، Sonnet 4.6 اکنون عملکرد تقریباً پرچمدار را با هزینه بسیار کمتر ارائه می دهد. Anthropic میگوید Opus 4.6 بهترین انتخاب برای بازآفرینی پایگاه کد پیچیده، هماهنگی چند عاملی، و وظایف استدلالی با دقت بالا است.
Claude Sonnet 4.6 اکنون در Claude.ai، Claude Cowork، Claude Code، Claude API و پلتفرم های ابری اصلی در دسترس است. سطح رایگان نیز ارتقا یافته است و اکنون شامل ایجاد فایل، پیوند دهندهها و فشردهسازی محتوا میشود.
این نسخه با مدیریت جامع زمینه و قابلیتهای محاسباتی پیشرفته، هوش مصنوعی را به جای یک ربات چت معمولی، به یک همکار دیجیتال واقعی نزدیکتر میکند.
برای آزمایش در دنیای واقعی به اینجا مراجعه کنید تا ببینید این مدل جدید چه کاری می تواند انجام دهد.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.



