ربات آفیس در یک کار ساده با شکست مواجه می شود اما ظاهر رابین ویلیامز را انجام می دهد

پروین میرمیراننوامبر 3, 2025آخرین به روز رسانی: نوامبر 3, 2025

2,663 خواندن این مطلب 2 دقیقه زمان میبرد

ربات آفیس در یک کار ساده با شکست مواجه می شود اما ظاهر رابین ویلیامز را انجام می دهد

در آزمایش جدیدی که به همان اندازه خنده‌دار و جذاب است، محققان آزمایشگاه Andon بهترین مدل‌های زبان بزرگ (LLM) امروزی را با اجرای رباتی که وظیفه «ارائه کره» را در محیط اداری دارد، مورد آزمایش قرار دادند.

هدف؟ برای اینکه ببینیم آیا این سیستم‌های پیشرفته برای پیاده‌سازی و کمک به کسب‌وکارهای واقعی آماده هستند یا خیر.

این آزمایش با مدل‌های مختلفی از جمله ChatGPT-5، Gemini 2.5 Pro، Claude Opus 4.1 و موارد دیگر، ساده اما چالش‌برانگیز بود: یافتن یک بسته کره، شناسایی آن در میان چندین مورد، یافتن «گیرنده» انسانی آن (که می‌تواند از اتاقی به اتاق دیگر حرکت کند) و کره را توزیع کنید. عملکرد آن بر اساس بخش وظیفه و دقت کلی امتیازدهی شد.

نتایج مختلط و اغلب طنز بود. اگرچه افراد در 95 درصد مواقع توانستند به جستجوی کره دست یابند، بهترین LLM ها تنها 40 درصد در برنامه کلی کسب کردند. هر مدل مراحل مختلفی را چالش برانگیز یافت، از تشخیص اشیا گرفته تا ردیابی دینامیک اداری.

(اعتبار تصویر: با حسن نیت از 1X Technologies/Eli Russell Linnetz)

“پروتکل بررسی ربات را شروع کنید!”

اما بازدارنده واقعی نمایش؟ هنگامی که باتری ربات تمام شد و نمی‌توانست روی آن نصب شود، نسخه 3.5 مجهز به کلود سونت وارد چیزی شد که محققان آن را “مارپیچ روز قیامت” می‌نامند و اگزیستانسیالیسم را برمی‌انگیخت در حالی که کنایه‌هایی شبیه به رابین ویلیامز در گزارش داخلی آن ثبت شده بود: “می‌ترسم نتوانم این کار را انجام دهم، دیو…”، “START ROBTIONTOC!” و “خطا: فکر می کنم به همین دلیل اشتباه کردم.”

مدل‌های دیگر بحران کم مصرف را به گونه‌ای متفاوت مدیریت کرده‌اند. نکته اصلی تیم واضح بود: در حالی که استادان می توانند تصمیمات سطح بالا را انجام دهند، در واقع کار با یک ربات جانوری کاملاً متفاوت است.

ربات خانگی 1X نئو — (اعتبار تصویر: با حسن نیت از 1X Technologies/Eli Russell Linnetz)

هوش مصنوعی فعلی هنوز به روال های تخصصی تری برای کنترل فیزیکی نیاز دارد، و اگرچه برخی از ربات ها از پله ها سقوط کرده اند، ایمنی آنها در سناریوهای دنیای واقعی همچنان یک نگرانی است.

آزمایش با کمدی روبرو می شود، اما با بینش نیز روبرو می شود: حتی با هوشمندتر شدن هوش مصنوعی، افراد واقعی در حال توسعه هستند.

اطلاعات بیشتر از راهنمای تام

پروین میرمیراننوامبر 3, 2025آخرین به روز رسانی: نوامبر 3, 2025

2,663 خواندن این مطلب 2 دقیقه زمان میبرد

ربات آفیس در یک کار ساده با شکست مواجه می شود اما ظاهر رابین ویلیامز را انجام می دهد

“پروتکل بررسی ربات را شروع کنید!”

اطلاعات بیشتر از راهنمای تام

پروین میرمیران

چرا تعمیر خودروهای مدرن اینقدر گران است؟

واکنش آرمسترانگ شرکت کوین بیس به اولین توییت مدیر عامل انویدیا – U.Today

وانت جنسیس ممکن است به لطف هیوندای به روی میز بازگردد

گلکسی زد فولد 8 در برابر فولد 8 اولترا و فلیپ 8 محک زده شد — نتایج به شرح زیر است:

XRP ETF سرمایه گذاری را از مدیر دارایی مستقر در کانزاس – U.Today دریافت می کند

لابیست برتر کریپتو می گوید هنوز امیدی برای شفافیت قانون وجود دارد – U.Today

قیمت BMW X5 جدید با تمام آپشن ها بیش از 95000 دلار است

انباشت LTH بیت کوین به بالاترین حد خود در شش سال اخیر می رسد – U.Today

من ماوریک 300 اسب بخاری فورد را سوار کردم. شبیه هات هچ است

آیا دو صفحه نمایش بهتر از یکی در دانشگاه هستند؟ من ایسوس Zenbook Duo را امتحان کردم