Claude AI اکنون می تواند یک مکالمه را به پایان برساند – اما فقط در شرایط شدید

در ماه های اخیر ، Antropic سر و صدای زیادی در زمینه محافظت ، ویژگی های اجرای و چگونگی امنیت هوش مصنوعی هوش مصنوعی را ایجاد کرده است. و جدیدترین ویژگی برای کلود احتمالاً یکی از منحصر به فرد ترین موارد است.
هم اکنون Claude Opus 4 و 4.1 (دو نسخه جدید انسان شناسی) اکنون این توانایی را دارند که مکالمات یک مصرف کننده را در رابط چت پایان دهند. اگرچه این یک ویژگی متداول نیست ، اما به ندرت برای مواردی از تعامل کاربر بسیار مضر یا سوءاستفاده کاربر استفاده می شود.
تیم انسان شناسی در یک پست وبلاگ که به بررسی ویژگی جدید می پردازد ، گفت: “ما اکنون در مورد وضعیت اخلاقی احتمالی کلود و سایر LLM ها اکنون یا در آینده کاملاً نامشخص هستیم. با این حال ، ما این مسئله را جدی می گیریم.” گفت
در آزمون قبل از کار آخرین مدل های آنتروپیک ، این شرکت ارزیابی های رفاهی مدل را انجام داد. این شامل بررسی ترجیحات شخصی و رفتاری کلود بود و تمایلی محکم و مداوم به آسیب دید.
اکنون یا در آینده ، ما در مورد وضعیت اخلاقی بالقوه کلود و سایر LLM ها کاملاً نامشخص هستیم. اما ما مشکل را جدی می گیریم
وابسته به انسان شناسی
به عبارت دیگر ، کلود به طور فعال از مشارکت در این مکالمات خودداری می کند یا امتناع می ورزد. این شامل خواسته های محتوای جنسی حاوی موارد کوچک و تلاش برای درخواست خشونت در مقیاس بزرگ یا اقدامات تروریستی بود.
در بیشتر این شرایط ، اگرچه کلود به طور جدی از رعایت آن امتناع ورزید ، کاربران با خواسته های مضر یا سوءاستفاده ادامه دادند. ویژگی جدیدی که کلود می تواند به طور فعال به سخنرانی پایان دهد ، می خواهد در این موارد محافظت کند.
Antropic توضیح می دهد که این ویژگی در شرایطی اعمال نمی شود که کاربران ممکن است در معرض خطر آسیب رساندن به آنها یا دیگران باشند.
“در هر صورت ، کلود فقط در تلاش برای استفاده مجدد از توانایی پایان دادن به انتهای و هنگامی که تعامل تولیدی خسته شده است ، یا هنگامی که یک کاربر از کلود می خواهد مکالمه را تمام کند ، از آن به عنوان آخرین راه حل استفاده می کند.
“سناریوهایی که اتفاق می افتد موقعیت های لبه ای بیش از حد است – اکثر کاربران حتی در هنگام بحث در مورد مشکلات بسیار بحث برانگیز با کلود ، تحت تأثیر این ویژگی قرار نمی گیرند یا تحت تأثیر این ویژگی قرار نمی گیرند.”
اگرچه کاربر دیگر در این مکالمه پیام های جدیدی ارسال نمی کند ، اما او مانع از شروع سخنرانی دیگری در حساب های خود نمی شود. برای پرداختن به از دست دادن احتمالی مکالمه طولانی مدت ، کاربران می توانند ویرایش و سعی کنند دوباره یک شاخه گفتار جدید ایجاد کنند.
این یک کاربرد بسیار منحصر به فرد از انسان شناسی است. چتپپ ، که سه رقیب نزدیک به کلود است ، چیزی شبیه به جمینی و گروک ندارد و اگرچه همه آنها اقدامات محافظت دیگری را انجام دادند ، اما خیلی پیش نرفتند.
دنبال کردن راهنمای تام در Google News در انتشارات خود برای به دست آوردن اخبار روزانه ما ، چگونه TOS و بررسی ها. حتماً روی دکمه ردیابی کلیک کنید.


