مطالعه جدید نشان می دهد که تست های امنیتی هوش مصنوعی عمیقاً ناقص هستند. در اینجا این است که چرا این می تواند یک مشکل بزرگ باشد.

پروین میرمیراننوامبر 13, 2025آخرین به روز رسانی: نوامبر 13, 2025

2,662 خواندن این مطلب 2 دقیقه زمان میبرد

مطالعه جدید نشان می دهد که تست های امنیتی هوش مصنوعی عمیقاً ناقص هستند. در اینجا این است که چرا این می تواند یک مشکل بزرگ باشد.

یک مطالعه جدید در مورد روش آزمایش مدل های رایج هوش مصنوعی به نتایج هشداردهنده ای رسیده است.

مطالعه مشترک بین محققان آمریکایی و بریتانیایی داده‌های بیش از 440 معیار مورد استفاده برای سنجش توانایی هوش مصنوعی در حل مشکلات و تعیین پارامترهای امنیتی را بررسی کرد. این تست ها نقص هایی را گزارش کردند که قابلیت اطمینان این مدل ها را تضعیف می کند.

بر اساس این تحقیق، نقص ها به این دلیل به وجود می آیند که این معیارها بر اساس تعاریف مبهم یا روش های تحلیلی ضعیف ساخته شده اند. این امر ارزیابی دقیق قابلیت های مدل یا پیشرفت هوش مصنوعی را دشوار می کند.

اندرو بین، نویسنده اصلی این مطالعه گفت: معیارها تقریباً از تمام ادعاهای پیشرفت در هوش مصنوعی پشتیبانی می کنند. اما بدون تعاریف رایج و اندازه‌گیری‌های قوی، تشخیص اینکه آیا مدل‌ها واقعاً در حال بهبود هستند یا به بهبود ادامه می‌دهند، دشوار می‌شود.

این تست‌ها به شرکت‌های هوش مصنوعی اجازه می‌دهد ببینند مدل‌هایشان کجا می‌افتند و بر اساس آن نتایج در تکرار بعدی، بهبودهایی را انجام دهند. اینها همچنین معیارهایی هستند که معمولاً در تصمیمات سیاست گذاری یا نظارتی استفاده می شوند.

این برای هوش مصنوعی چه معنایی دارد؟

(اعتبار تصویر: Shutterstock)

امنیت مدل های هوش مصنوعی موضوعی است که مدتی است مورد بحث قرار گرفته است. در گذشته، شرکت هایی مانند OpenAI و گوگل مدل های خود را بدون تکمیل گزارش های امنیتی منتشر کردند.

در جاهای دیگر، مدل‌ها پس از کسب امتیاز بالا در مجموعه‌ای از تست‌های بنچمارک عرضه شدند، اما پس از عرضه عمومی شکست خوردند.

گوگل اخیراً یکی از جدیدترین مدل‌های خود به نام گاما را پس از مشکلات مشابه در گذشته، از جمله ادعاهای نادرست درباره یک سناتور آمریکایی و تئوری‌های توهم توهم گروک xAI، کنار کشید.

راه حل چیست؟

این مطالعه توسط محققان دانشگاه کالیفرنیا، برکلی و دانشگاه آکسفورد در بریتانیا انجام شد. این تیم هشت توصیه برای شرکت‌های هوش مصنوعی ارائه کرد تا به مسائلی که مطرح کردند رسیدگی کنند:

شناسایی و جداسازی کنید: ارائه یک تعریف دقیق و عملیاتی برای مفهوم مورد سنجش و کنترل عوامل نامربوط.
نظرات نماینده ایجاد کنید: مطمئن شوید که آیتم های آزمایشی شرایط دنیای واقعی را نشان می دهند و دامنه کامل مهارت یا رفتار هدف را پوشش می دهند.
تقویت تحلیل و توجیه: استفاده از روش های آماری برای گزارش عدم قطعیت و ارائه مقایسه های قوی. انجام تجزیه و تحلیل دقیق خطا برای درک دلیل شکست یک مدل؛ و توجیه کنید که چرا معیار معیاری معتبر برای هدف مورد نظر است.

آنها همچنین چک لیستی ارائه کردند که مقایسه کنندگان می توانند از آن برای آزمایش مناسب بودن آزمون های خود استفاده کنند.

زمان نشان خواهد داد که آیا شرکت های هوش مصنوعی به این توصیه ها توجه خواهند کرد یا خیر.

اخبار گوگل

دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.

اطلاعات بیشتر از راهنمای تام

بازگشت به لپ تاپ

نمایش بیشتر

پروین میرمیراننوامبر 13, 2025آخرین به روز رسانی: نوامبر 13, 2025

2,662 خواندن این مطلب 2 دقیقه زمان میبرد

مطالعه جدید نشان می دهد که تست های امنیتی هوش مصنوعی عمیقاً ناقص هستند. در اینجا این است که چرا این می تواند یک مشکل بزرگ باشد.

پروین میرمیران

رئیس F1: سیاستمداران مشکلات “تقریبا غیرقابل جبران” برای خودروسازان ایجاد کردند

مرسدس یک CLE “Extreme” با V8 ایجاد می کند – در اینجا همه چیزهایی است که می دانیم

گزارش شده است که Anthropic کنترل خطرناک ترین مدل هوش مصنوعی خود را از دست داده است

بیت کوین به 79000 دلار می رسد زیرا عدم تعادل انحلال 4.362% فشار کوتاه بزرگ را تأیید می کند – U.Today

آنتونی پمپلیانو عنوان ساتوشی را برای همه دارندگان بیت کوین – U.Today به ارمغان می آورد

جنرال موتورز می‌گوید هیچ کامیون الکتریکی را لغو نمی‌کند

اتحادیه اروپا باتری های «به راحتی قابل جابجایی» را برای تلفن ها الزامی می کند – اما آیفون ها ممکن است معاف شوند

XRP Rare 0 $ ETF Inflow Milestone با عبور قیمت از سد 1.45 دلاری می رسد – U.Today

پورشه و پیکسار دوباره متحد می شوند

Shiba Inu: Shibarium شاهد افت ناگهانی 758٪ در معاملات است، چه چیزی پشت آن است؟ – یو.امروز