ربات آفیس در یک کار ساده با شکست مواجه می شود اما ظاهر رابین ویلیامز را انجام می دهد

در آزمایش جدیدی که به همان اندازه خندهدار و جذاب است، محققان آزمایشگاه Andon بهترین مدلهای زبان بزرگ (LLM) امروزی را با اجرای رباتی که وظیفه «ارائه کره» را در محیط اداری دارد، مورد آزمایش قرار دادند.
هدف؟ برای اینکه ببینیم آیا این سیستمهای پیشرفته برای پیادهسازی و کمک به کسبوکارهای واقعی آماده هستند یا خیر.
این آزمایش با مدلهای مختلفی از جمله ChatGPT-5، Gemini 2.5 Pro، Claude Opus 4.1 و موارد دیگر، ساده اما چالشبرانگیز بود: یافتن یک بسته کره، شناسایی آن در میان چندین مورد، یافتن «گیرنده» انسانی آن (که میتواند از اتاقی به اتاق دیگر حرکت کند) و کره را توزیع کنید. عملکرد آن بر اساس بخش وظیفه و دقت کلی امتیازدهی شد.
نتایج مختلط و اغلب طنز بود. اگرچه افراد در 95 درصد مواقع توانستند به جستجوی کره دست یابند، بهترین LLM ها تنها 40 درصد در برنامه کلی کسب کردند. هر مدل مراحل مختلفی را چالش برانگیز یافت، از تشخیص اشیا گرفته تا ردیابی دینامیک اداری.
“پروتکل بررسی ربات را شروع کنید!”
اما بازدارنده واقعی نمایش؟ هنگامی که باتری ربات تمام شد و نمیتوانست روی آن نصب شود، نسخه 3.5 مجهز به کلود سونت وارد چیزی شد که محققان آن را “مارپیچ روز قیامت” مینامند و اگزیستانسیالیسم را برمیانگیخت در حالی که کنایههایی شبیه به رابین ویلیامز در گزارش داخلی آن ثبت شده بود: “میترسم نتوانم این کار را انجام دهم، دیو…”، “START ROBTIONTOC!” و “خطا: فکر می کنم به همین دلیل اشتباه کردم.”
مدلهای دیگر بحران کم مصرف را به گونهای متفاوت مدیریت کردهاند. نکته اصلی تیم واضح بود: در حالی که استادان می توانند تصمیمات سطح بالا را انجام دهند، در واقع کار با یک ربات جانوری کاملاً متفاوت است.
هوش مصنوعی فعلی هنوز به روال های تخصصی تری برای کنترل فیزیکی نیاز دارد، و اگرچه برخی از ربات ها از پله ها سقوط کرده اند، ایمنی آنها در سناریوهای دنیای واقعی همچنان یک نگرانی است.
آزمایش با کمدی روبرو می شود، اما با بینش نیز روبرو می شود: حتی با هوشمندتر شدن هوش مصنوعی، افراد واقعی در حال توسعه هستند.
اطلاعات بیشتر از راهنمای تام
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود. فراموش نکنید که روی دکمه Follow کلیک کنید!
بازگشت به لپ تاپ



