من انتظار نداشتم پوکمون یک مرکز آزمایش هوش مصنوعی باشد – اما این چیزی است که من پیدا کردم

احتمالاً در مقطعی از زندگی خود با پوکمون مواجه شده اید. چه بازی را انجام داده باشید، چه انیمه را تماشا کرده باشید، چه کارت ها را جمع آوری کرده باشید، یا به سادگی آن را از طریق اسمز فرهنگی جذب کرده باشید.
زمانی که بازیهای اصلی پوکمون در سال 1996 منتشر شدند، جرقهای را برانگیختند که یک پدیده جهانی را به وجود آوردند. بهمنی از اسپینآفها به دنبال داشت: یک مجموعه انیمیشن طولانی مدت، یک بازی کارتی تجاری بسیار محبوب، کوههای کالا، و دههها بازیهای اصلی و تجربی جدید. نزدیک به 30 سال بعد، پوکمون نه تنها دوام آورده، بلکه تکامل یافته است.
اما اخیرا پوکمون نقش جدید شگفت انگیزی پیدا کرده است.
در زیر، نحوه استفاده از پوکمون برای آزمایش هوش مصنوعی را بررسی خواهیم کرد و چرا این مجموعه چندین دهه از جمع آوری هیولاها یکی از مؤثرترین راه ها برای آشکار کردن کارهایی است که هوش مصنوعی می تواند (و نمی تواند) انجام دهد.
سه تا از هوشمندترین سیستمهای هوش مصنوعی و تحقیقاتی جهان در برابر بازیهای قدیمیتر پوکمون آزمایش شدند
اکنون به Twitch سفر کنید تا چیزی جذاب را در عمل ببینید. سه تا از هوشمندترین ماژولهای هوش مصنوعی جهان – GPT 5.2، Claude Opus 4.5 و Gemini 3 Pro – در چالش تکمیل یکی از محبوبترین بازیهای دستی پوکمون قدم برداشتهاند. با توجه به اینکه بچه های دهه 90 (مثل من) می توانستند این بازی ها را حتی با چشمان بسته ما شکست دهند، به سرعت متوجه خواهید شد که این سیستم های هوش مصنوعی چندان موفق نیستند. این خیلی سرگرم کننده است.
برخی از سیستمهای هوش مصنوعی هنوز در تلاش هستند تا در بازیهای کلاسیک پوکمون پیشرفت معنیداری داشته باشند، اغلب بیهدف سرگردان میشوند یا زود گیر میکنند. برای مثال، تایم برای اولین بار گزارش داد که مدلهای قبلی کلود بدون اهداف مشخص سرگردان بودند و نتوانستند فراتر از اولین شهر پوکمون رد پیشروی کنند، و ضعفهای اساسی در برنامهریزی و اجرای بلندمدت را برجسته کرد.
در فوریه 2025، دیوید هرشی، محقق Anthropic، با پخش زنده Claude Plays Pokémon Red در Twitch همزمان با انتشار Claude Sonnet 3.7، علاقه خود را به این معیار غیرمعمول برانگیخت. اگرچه این نسخه با بازی تعامل داشت، اما مکمل گیم پلی کلاسیک نبود و اغلب ساعت ها گیر می کرد.
در مقایسه، Gemini 2.5 Pro گوگل بعداً موفق شد در می 2025 پوکمون بلو را شکست دهد و بر چالش های بازی غلبه کند و با بازی پایدار به پایان برسد. اما به زمان و مراحل بسیار بیشتری نسبت به یک بازیکن معمولی انسانی نیاز داشت.
محققان و مفسران به محدودیتهای مدلهای هوش مصنوعی فعلی در برنامهریزی، حافظه و اجرای وظایف به عنوان علت این مشکلات اشاره میکنند. محقق هوش مصنوعی مستقل Peter Whidden خاطرنشان کرد که اگرچه مدلهای بزرگ تقریباً همه چیز را در مورد پوکمون از طریق دادههای آموزشی میدانند، اما اجرای این برنامهها در یک محیط بازی پویا دشوار و اغلب ناشیانه است.
فراتر از این مدلهای زبانی گسترده، سایر رویکردهای هوش مصنوعی در زمینه پوکمون آزمایش شدهاند – از جمله رباتهای تخصصی با استفاده از جستجوی درخت مونت کارلو (MCTS) و عوامل یادگیری تقویتی که بیش از دهها هزار ساعت شبیهسازی شده آموزش دیدهاند – که هر کدام چالشهای متفاوتی را در رابطه با استراتژی و استدلال بلندمدت ارائه میکنند.
بسیاری به آزمایش اجتماعی «Twitch Plays Pokémon» در سال 2014 اشاره میکنند که در آن میلیونها بیننده به طور جمعی دستورات بازی Pokémon Red را وارد کردند، بهعنوان پیشروی فرهنگی اولیه برای استفاده از پوکمون بهعنوان بستر آزمایشی برای بازی مشارکتی و الگوریتمی.
محققان هوش مصنوعی بازی های یکپارچهسازی با سیستمعامل را به عنوان محیط آزمایشی عالی می بینند
برای درک بهتر اینکه چرا محققان از Pokémon به عنوان ابزاری برای تست هوش مصنوعی استفاده می کنند، تصمیم گرفتم به یک ربات چت هوش مصنوعی مراجعه کنم تا به من کمک کند.
پس از پرسیدن، چرا پوکمون برای محققان هوش مصنوعی جذاب است؟
Perplexity توضیح خود را اینگونه آغاز کرد:
پوکمون برای محققان هوش مصنوعی جذاب است زیرا محیطی غنی و کنترلشده است که ذاتاً بسیاری از قابلیتهایی را که سیستمهای هوش مصنوعی مدرن هنوز ضعیف هستند، آزمایش میکند، در حالی که ایمن، کاملاً تعریف شده و اندازهگیری آسان است.
سه مورد از نکات مهم زیر که سرگشتگی به عنوان نکات اصلی پاسخ خود مطرح کرد، بیش از همه برای من برجسته بود:
- مبتنی بر انقباض نیست، مبتنی بر نوبتاز آنجایی که نبردها و حرکت در سراسر جهان را می توان مرحله به مرحله انجام داد، محققان می توانند به جای زمان واکنش یا کنترل حرکتی، بر قضاوت و استراتژی تمرکز کنند. این آزمایشها را با مدلهای زبان و ابزارهای برنامهریزی ساده میکند.
- محدودتر از معیارهای بازی قدیمی تر: آزمایشهای قبلی بازیهای هوش مصنوعی از چیزهایی مانند بازی Pong یا بازیهای ساده آتاری استفاده میکردند که نسبتاً محدود و تکراری بودند. پوکمون بازتر است: مسیرهای قابل دوام، گزینه های تیمی و استراتژی های زیادی وجود دارد که نقاط قوت و ضعف یک کهن الگو را بیشتر نشان می دهد.
- از نظر فرهنگی آشنا و جالب: بسیاری از محققان و کاربران با Pokémon بزرگ شدهاند، بنابراین به طور مستقیم درک میکنند که «خوب بازی کردن» چگونه به نظر میرسد، و در حالی که تماشای پخش زنده مدلهایی که در حال بازی هستند سرگرمکننده است، اما همچنان دادههای ارزیابی جدی را ارائه میدهد. این ترکیب سودمندی فنی و جذابیت گسترده، پوکمون را به یک بستر آزمایشی غیرمعمول قانع کننده تبدیل می کند.
دیوید هرشی، که رهبری هوش مصنوعی در Anthropic را بر عهده دارد، با وال استریت ژورنال صحبت کرد تا توضیحی درباره اینکه چرا اولین سری بازیهای پوکمون به روشی محبوب برای آزمایش هوش مصنوعی تبدیل شده است، ارائه دهد. او توضیح داد: «این یک راه عالی به ما می دهد تا ببینیم یک مدل چگونه کار می کند و آن را به روش کمی ارزیابی کنیم.
غذای آماده
سیستم های هوش مصنوعی در آزمون نهایی یادگیری مستمر، استدلال استراتژیک و برنامه ریزی قرار گرفته اند. بازیهای رومیزی کلاسیک مانند شطرنج، و همچنین جواهرات عالی بازیهای ویدیویی مانند Pong و DOOM، همگی در استفاده به عنوان نقاط مرجع برای هوش مصنوعی نقش داشتهاند.
بازیهای پوکمون که همه ما میشناسیم و دوست داریم به یکی از بهترین روشهای تست هوش مصنوعی تبدیل شدهاند. این یک جعبه شنی پر از انواع مشکلاتی است که هوش مصنوعی ارائه می کند تا ببیند آیا آنها با منطق انسانی مطابقت دارند یا خیر.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.
اطلاعات بیشتر از راهنمای تام
بازگشت به بازی با ورق



