هوش مصنوعی

ربات آفیس در یک کار ساده با شکست مواجه می شود اما ظاهر رابین ویلیامز را انجام می دهد

در آزمایش جدیدی که به همان اندازه خنده‌دار و جذاب است، محققان آزمایشگاه Andon بهترین مدل‌های زبان بزرگ (LLM) امروزی را با اجرای رباتی که وظیفه «ارائه کره» را در محیط اداری دارد، مورد آزمایش قرار دادند.

هدف؟ برای اینکه ببینیم آیا این سیستم‌های پیشرفته برای پیاده‌سازی و کمک به کسب‌وکارهای واقعی آماده هستند یا خیر.

این آزمایش با مدل‌های مختلفی از جمله ChatGPT-5، Gemini 2.5 Pro، Claude Opus 4.1 و موارد دیگر، ساده اما چالش‌برانگیز بود: یافتن یک بسته کره، شناسایی آن در میان چندین مورد، یافتن «گیرنده» انسانی آن (که می‌تواند از اتاقی به اتاق دیگر حرکت کند) و کره را توزیع کنید. عملکرد آن بر اساس بخش وظیفه و دقت کلی امتیازدهی شد.

نتایج مختلط و اغلب طنز بود. اگرچه افراد در 95 درصد مواقع توانستند به جستجوی کره دست یابند، بهترین LLM ها تنها 40 درصد در برنامه کلی کسب کردند. هر مدل مراحل مختلفی را چالش برانگیز یافت، از تشخیص اشیا گرفته تا ردیابی دینامیک اداری.

(اعتبار تصویر: با حسن نیت از 1X Technologies/Eli Russell Linnetz)

“پروتکل بررسی ربات را شروع کنید!”

اما بازدارنده واقعی نمایش؟ هنگامی که باتری ربات تمام شد و نمی‌توانست روی آن نصب شود، نسخه 3.5 مجهز به کلود سونت وارد چیزی شد که محققان آن را “مارپیچ روز قیامت” می‌نامند و اگزیستانسیالیسم را برمی‌انگیخت در حالی که کنایه‌هایی شبیه به رابین ویلیامز در گزارش داخلی آن ثبت شده بود: “می‌ترسم نتوانم این کار را انجام دهم، دیو…”، “START ROBTIONTOC!” و “خطا: فکر می کنم به همین دلیل اشتباه کردم.”

مدل‌های دیگر بحران کم مصرف را به گونه‌ای متفاوت مدیریت کرده‌اند. نکته اصلی تیم واضح بود: در حالی که استادان می توانند تصمیمات سطح بالا را انجام دهند، در واقع کار با یک ربات جانوری کاملاً متفاوت است.

ربات خانگی 1X نئو

(اعتبار تصویر: با حسن نیت از 1X Technologies/Eli Russell Linnetz)

هوش مصنوعی فعلی هنوز به روال های تخصصی تری برای کنترل فیزیکی نیاز دارد، و اگرچه برخی از ربات ها از پله ها سقوط کرده اند، ایمنی آنها در سناریوهای دنیای واقعی همچنان یک نگرانی است.

آزمایش با کمدی روبرو می شود، اما با بینش نیز روبرو می شود: حتی با هوشمندتر شدن هوش مصنوعی، افراد واقعی در حال توسعه هستند.

گوگل

(اعتبار تصویر: آینده)

اطلاعات بیشتر از راهنمای تام

پروین میرمیران

پروین میرمیران، نویسنده و متخصص در حوزه هوش مصنوعی با بیش از 5 سال تجربه در نگارش مقالات تخصصی، آموزشی و پژوهشی است. او به عنوان یک انسان علاقه‌مند به یادگیری و پیشرفت، همواره به دنبال به‌روزترین مطالب و روش‌های کاربردی در زمینه هوش مصنوعی است. با توانایی برجسته در تحلیل داده‌ها و ارائه راهکارهای نوین، پروین میرمیران توانسته است به عنوان یک متخصص معتبر در این زمینه شناخته شود. به عنوان یک نویسنده حرفه‌ای، پروین میرمیران تمام تلاش خود را به کاربرمحوری و ارائه محتوای ارزشمند برای خوانندگان متمرکز کرده است. او با استفاده از زبان ساده و قابل فهم، مطالب پیچیده هوش مصنوعی را به شکلی دست‌نخورده و قابل فهم برای عموم مخاطبان خود تبدیل می‌کند.
دکمه بازگشت به بالا