Claude Opus 4.8 اخیرا منتشر شده است، و Anthropic می گوید که احتمال “جعلی” بودن پاسخ ها بسیار کمتر است.

Anthropic به طور رسمی Claude Opus 4.8، آخرین نسخه از پرچمدار مد هوش مصنوعی خود را منتشر کرد. با این ارائه، این شرکت قول می دهد که ممکن است یکی از بزرگترین نقص های هوش مصنوعی را اصلاح کرده باشد. به گفته آنتروپیک، Claude Opus 4.8 به گونهای طراحی شده بود که صادقتر، متفکرتر باشد و بهطور چشمگیری کمتر تظاهر کند که چیزی را نمیداند.
این شرکت میگوید Opus 4.8 تقریباً چهار برابر کمتر از نسخه قبلی خود اجازه میدهد نقصهایی در کدی که مینویسد بدون هشدار به کاربر منتقل شود. در زمانی که شرکتهای هوش مصنوعی در حال رقابت برای ساخت مدلهای سریعتر، کاربردیتر و مستقلتر هستند، به نظر میرسد Anthropic روی یک چیز نادیده گرفته شده تمرکز میکند: هوش مصنوعی باید بداند چه زمانی ممکن است اشتباه باشد و آن را بپذیرد.
Claude Opus 4.8 به عنوان یک همکار بهتر قرار گرفته است
Anthropic میگوید آزمایشکنندگان اولیه کار با Opus 4.8 را بیشتر شبیه کار کردن با یک همکار واقعی نسبت به مدلهای قبلی توصیف کردند. به گفته این شرکت، آزمایشکنندگان بهجای موافقت با کاربران گفتند که این مدل سؤالات بهتری میپرسد، اشتباهات خود را میگیرد و زمانی که برنامهها منطقی نیستند، عقبنشینی میکند.
یکی از بزرگترین انتقادها به چتباتها این است که بسیاری از آنها به «مرد بله» تبدیل میشوند که اغلب به جای اینکه کاربران را به چالش بکشند، ایدههای بد، فرضیات ضعیف یا اطلاعات نادرست آشکار را تأیید میکنند. از سوی دیگر، Antropik به نظر می رسد بر روی رویکرد مخالف تمرکز دارد.
این شرکت همچنین میگوید Opus 4.8 پیشرفتهای قابلتوجهی در استدلال قانونی، کدنویسی، عوامل مرورگر و وظایف تجزیه و تحلیل طولانی مدت نشان میدهد و برخی از شرکای دسترسی اولیه ادعا میکنند که عملکرد آن از مدلهای قبلی Opus و حتی GPT-5.5 در برخی از گردشهای کاری آژانس بهتر است.
کاربران اکنون می توانند میزان تفکر مدل را کنترل کنند
در کنار مدل جدید، آنتروپیک در حال معرفی یک سیستم کنترل تلاش جدید در داخل کلود است. کاربران اکنون می توانند تصمیم بگیرند که کلود چقدر برای یک کار فکر می کند.
حالتهای تلاش بیشتر به هوش مصنوعی اجازه میدهد زمان بیشتری را صرف فکر کردن به پاسخها کند، در حالی که تنظیمات تلاش کمتر سرعت و استفاده کمتر از سکه را در اولویت قرار میدهند. Anthropic می گوید Opus 4.8 به طور پیش فرض روی “تلاش زیاد” تنظیم شده است زیرا بهترین تعادل را بین کیفیت و قابلیت استفاده ارائه می دهد.
بهجای اینکه چتباتها فوراً پاسخها را ارسال کنند، به نظر میرسد شرکتها به طور فزایندهای بر روی مکث، استدلال و تأیید اطلاعات مدلها قبل از پاسخ دادن تمرکز میکنند. همانطور که سیستمهای هوش مصنوعی مستقلتر میشوند و بر عامل متمرکز میشوند، OpenAI، Google و Anthropic در این مسیر حرکت میکنند.
کلود اکنون میتواند گردشهای کاری پویاتری را اجرا کند
علاوه بر مدل جدید، یک ویژگی پیش نمایش تحقیقاتی جدید به نام Dynamic Workflows نیز اعلام شد. این ویژگی به کلود اجازه می دهد تا صدها عامل فرعی موازی را در طول یک کار راه اندازی کند، کار را تأیید کند و نتایج را قبل از پاسخ دادن به کاربر ترکیب کند.
به گفته آنتروپیک، Claude Code اکنون میتواند از ابتدا تا انتها انتقالهای گسترده کد را انجام دهد که شامل صدها هزار خط کد است. آینده به طور فزاینده ای کمتر شبیه یک ربات چت است که در یک زمان به یک درخواست پاسخ می دهد و بیشتر شبیه سیستم های مستقلی است که در پشت صحنه چندین فرآیند هوش مصنوعی را هماهنگ می کنند. Anthropic توضیح میدهد که در حال حاضر روی «کلاس جدیدی از مدلهای با هوش بالاتر از Opus» کار میکند و به چیزی حتی بزرگتر در آینده اشاره میکند.
این شرکت میگوید که در حال آزمایش سیستمی به نام Claude Mythos Preview برای تلاشهای امنیت سایبری برخی سازمانها است، اما مدلهای ادعای Anthropic در این سطح، قبل از انتشار گستردهتر، به محافظتهای قویتری نیاز دارند.
به جلو نگاه کن
در حالی که شرکتهای هوش مصنوعی به سمت سیستمهای قدرتمندتر حرکت میکنند، آنها همچنین به طور فزایندهای تشخیص میدهند که مدلهای نسل بعدی ممکن است خطراتی را به همراه داشته باشند که به استانداردهای امنیتی کاملاً جدیدی نیاز دارند.
واضح است که آنتروپیک در تلاش است تا هوش مصنوعی را به عنوان یک همکار دقیق قرار دهد که خود را زیر سوال می برد، عدم اطمینان را نشان می دهد و قبل از پاسخ دادن بیشتر فکر می کند. به نظر می رسد این یک استراتژی دیرهنگام است. از قضا، این محدودیت ممکن است به یکی از با ارزش ترین ویژگی های هوش مصنوعی تبدیل شود.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود. مشترک شدن در راهنمای تام یوتیوب و ما را دنبال کنید tiktok.



