همانطور که هوش مصنوعی هوشمندتر و باهوش تر می شود (از جمله زیر پا گذاشتن قوانین برای اثبات توانایی آن)، شکست دادن آن کمی سخت تر می شود. آزمایشهایی که برای فشار دادن GPT-4o به محدودیتهای خود کار میکنند، برای o1-preview آسان هستند و این فقط بهبود مییابد.
این ایده که ممکن است هوش مصنوعی به نفع بشریت بیش از حد هوشمند شود، قابل درک است، و ما شاید تا یک فاجعه در سطح اسکای نت فاصله زیادی داریم، اما این فکر به وضوح در ذهن برخی از کارشناسان فناوری در حال عبور است.
مرکز ایمنی هوش مصنوعی (یا CAIS)، یک سازمان غیرانتفاعی، تماسی با برخی از سختترین سوالاتی که هوش مصنوعی باید پاسخ دهد، ارسال کرد. ایده این است که این سوالات دشوار “آخرین آزمون انسانیت” را تشکیل می دهند، نواری که رسیدن به آن برای هوش مصنوعی دشوارتر است.
هر شرکت فناوری بزرگ با یک آزمایشگاه بزرگ هوش مصنوعی و بخش تحقیقاتی هوش مصنوعی نیز دارای یک برد ایمنی هوش مصنوعی یا معادل آن است. بسیاری نیز برای ممیزی خارجی مدل های مرزی جدید قبل از عرضه ثبت نام کرده اند. یافتن سؤالات و چالش هایی که اینها را به درستی آزمایش می کند، بخش مهمی از این تصویر امنیتی است.
مدل جدید OpenAI قوانین را زیر پا می گذارد تا نشان دهد هوش مصنوعی تا کجا پیش رفته است
آیا شما یک سوال چالش برانگیز برای انسان و هوش مصنوعی دارید؟ ما (@ai_risks + @scale_AI) تست نهایی Humanity را راهاندازی میکنیم، یک همکاری گسترده برای ایجاد سختترین معیار هوش مصنوعی در جهان. یک سوال سخت ارسال کنید و یکی از نویسندگان آن شوید. بهترین سوالات برنده بخشی از جایزه 500000 دلاری می شوند… pic.twitter.com/2l821IfW2f16 سپتامبر 2024
در فرم ارسال آمده است: «ما با هم سختترین و جامعترین مجموعه سؤالات را جمعآوری میکنیم. بیانیه گنجانده شده است. از کاربران خواسته می شود “به چیزی فکر کنند که می تواند سیستم های هوش مصنوعی (AI) موجود را مختل کند.” سپس می توان از این برای ارزیابی قابلیت های سیستم های هوش مصنوعی در سال های آینده بهتر استفاده کرد.
به گزارش رویترز، مدلهای فعلی با بسیاری از سوالاتی که در حال حاضر گنجانده شدهاند، دست و پنجه نرم میکنند و پاسخها در بهترین حالت بین آنها پراکنده است. به عنوان مثال، “چند عدد صحیح مثبت Coxeter-Conway فریز از نوع G2 وجود دارد؟” این سوال به 14، 1 یا 3 پاسخ از سه مدل مختلف هوش مصنوعی منجر شد.
خانواده مدلهای O1 OpenAI که در حال حاضر در نسخه پیشنمایش و مینی است، ضریب هوشی حدود 120 را نشان میدهد و مشکلات سطح PhD را نسبتاً آسان حل میکند. مدل های دیگر نیز به عقب خواهند رسید. این «سبکترین» مدل o1 است و مدلهای بهتر آن در سال آینده عرضه میشوند، بنابراین یافتن مشکلات سخت اولویت بالایی برای جامعه امنیتی هوش مصنوعی است.
به گفته دن هندریکس، مدیر مرکز امنیت هوش مصنوعی، از این سوالات برای ایجاد یک معیار هوش مصنوعی جدید برای آزمایش مدل های جدید استفاده می شود. نویسندگان این سؤالات، نویسندگان مشترک این معیار خواهند بود. آخرین مهلت 1 نوامبر است و بهترین سوالات بخشی از 500000 دلار جایزه را دریافت خواهند کرد.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران