«Mythos» آنتروپیک خیلی خطرناک بود، بنابراین آنها نسخه «مدنی» را منتشر کردند

امروز Anthropic به طور رسمی Claude Opus 4.7 را منتشر کرد، قوی ترین مدل هوش مصنوعی در دسترس عموم. این نوید می دهد که یک جانور روی کاغذ باشد: یک جهش قابل توجه به جلو در مهندسی نرم افزار پیشرفته، چشم انداز قابل توجهی بهتر برای قابلیت های تجزیه و تحلیل، و یک حالت جدید “خود تایید” که به آن اجازه می دهد قبل از گزارش دادن به کاربر، کار خود را بررسی کند.
اما سایه ای بر این پرتاب آویزان است. برای اولین بار در تاریخ هوش مصنوعی مرزی، یک شرکت اعتراف کرد که به عمد یک مدل احمقانه برای محافظت از جهان در برابر آن ساخته است. بذار توضیح بدم
Opus 4.7 نسخه “ایمن غیرنظامی” مدل Mythos است
برای درک واقعی اینکه چرا انتشار Opus 4.7 چنین نقطه عطف مهمی است، ابتدا باید پیامدهای Claude Mythos Preview از Anthropic را درک کنید. من با عرضه امروز به این موضوع اشاره کردم زیرا Mythos همچنان قدرتمندترین مدل این شرکت باقی مانده است. اما انتشار آن به شدت محدود به مدافعان سایبری و شرکای زیرساخت های حیاتی است. در حالی که Opus 4.7 یک “پیشرفت قابل توجه” نسبت به نسخه های قبلی است، در اصل یک لایه ثانویه است.
ادامه مقاله در زیر
در یادداشتهای منتشر شده برای Opus 4.7، Anthropic بمبی را پرتاب کرد که در طول آموزش برای Opus 4.7، تیم تلاشهایی را برای “کاهش متفاوت” قابلیتهای حمله سایبری مدل انجام داد.
برای من و شما، این بدان معناست که این شرکت عمداً توانایی مدل را برای استفاده به عنوان یک سلاح دیجیتال ضعیف کرده است.
Project Glasswing و اولین آزمایش در دنیای واقعی آن

Opus 4.7 به عنوان اولین خوکچه هندی زنده برای Project Glasswing، ابتکار امنیتی که Anthropic هفته گذشته معرفی کرد، عمل می کند. این چارچوب اقدامات امنیتی خودکاری را ارائه میکند که درخواستهای امنیت سایبری ممنوع یا پرخطر را در زمان واقعی شناسایی و مسدود میکند.
برای یک توسعه دهنده متوسط، این به معنای دستیار مفیدتر است. برای جامعه امنیتی، این به معنای دروازه بان است.
اگر شما یک محقق حرفه ای هستید، دیگر نمی توانید به صورت ناشناس به این ویژگی ها دسترسی داشته باشید. اکنون باید برای برنامه تأیید سایبری جدید Anthropic درخواست دهید. این حرکت به طور موثر “هوش مصنوعی مرزی” را در پس زمینه بررسی قرار می دهد.
ارتقاء Opus 4.7

Opus 4.7 حتی با بریده شدن بالهایش در مورد امنیت سایبری، نوید ارتقای بزرگی برای گردشهای کاری حرفهای را میدهد. اگر قصد هک کردن هاست را ندارید، دریافت می کنید:
- مهندسی خودمختار: این مدل جدید سختترین کارهای کدنویسی را آسانتر از همیشه میکند. Anthropic وعده می دهد که کارهایی که قبلاً به “نظارت دقیق” نیاز داشتند اکنون می توانند با اطمینان کامل انجام شوند.
- خود تأییدی: Opus 4.7 دیگر فقط “حدس زدن” نمی کند. روش هایی را برای اعتبارسنجی خروجی های خود با انجام بررسی های منطقی داخلی قبل از ارائه بازخورد ایجاد می کند. این برای کاهش توهمات و کنترل واقعیت ارزش زیادی دارد.
- نمای با وضوح بالا: در حالی که رندر هنوز بخشی از ویژگی های کلود نیست، این مدل اکنون می تواند تصاویر را با وضوح بسیار بالاتر مشاهده کند. این اختراع می تواند برای تجزیه نمودارهای فنی پیچیده، مدل های UI/UX یا حتی اسلایدهای حرفه ای برای ارائه بعدی شما مفید باشد.
- “لذت” خلاقانه: Anthropic ادعا میکند که این مدل هنگام ایجاد اسناد حرفهای «سلیقهتر» است، رابطها و اسنادی با کیفیت بالاتر تولید میکند که کمتر «تولید شده توسط هوش مصنوعی» و توسعه یافتهتر توسط انسان به نظر میرسند. این چیزی است که من هنوز هم مشتاق بازی کردن با آن هستم، زیرا “طعم” به عنوان یکی از دشوارترین جنبه های انسانی برای تکرار تحقیق شده است.
غذای آماده
Claude Opus 4.7 یک نیروگاه “ایمن” است که قیمت آن مانند Opus 4.6 باقی می ماند: 5 دلار / میلیون توکن ورودی، 25 دلار / میلیون توکن خروج. با همان قیمت نسخه قبلی خود، وعده افزایش عظیم 3 برابری در تکمیل ماموریت تولید و دقت دید تقریباً عالی (98.5٪) را می دهد.
اما من محتاطانه خوشبین هستم، زیرا داستان واقعی در اینجا نسخه “غیر نظامی” آنتروپیک از مدل مخفیانه Mythos است. قابلیت های هک عمداً برای آزمایش دوره جدید هوش مصنوعی دردار و احراز هویت شده محدود شده است. ما وارد عصر جدیدی از هوش مصنوعی شدهایم و من از نزدیک تماشا خواهم کرد (و گزارش میکنم).
آیا تا به حال آن را امتحان کرده اید؟ نظر خود را در نظرات به من بگویید.

دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.



