اینترنت پر از مزخرفات هوش مصنوعی است و می تواند ChatGPT بعدی را مسموم کند. تحقیقات جدید به ما می گوید که چگونه آن را متوقف کنیم

احتمالاً متوجه شده اید که نحوه پاسخ ربات چت تا حدودی یکسان است. خواه این یک بررسی بیش از حد مثبت محصول باشد یا نتایج جستجو که پستهای واقعی را به قطعههای کوتاهشده و بدون اطلاعات واقعی تبدیل میکند. واضح است که وب مملو از پرکننده های تولید شده توسط هوش مصنوعی معروف به “slop” است و نگرانی فزاینده ای در آزمایشگاه های هوش مصنوعی وجود دارد که این زباله ها می توانند بی سر و صدا باعث اختلال در نسل بعدی هوش مصنوعی شوند.
یک نام دارد: سقوط مدل. و خبر خوب این است که همان محققانی که زنگ خطر را به صدا درآوردهاند، اکنون در حال کشف چگونگی جلوگیری از آن هستند، و در یک مورد، با راهحلی که بیش از حد ساده به نظر میرسد درست باشد.
فروپاشی مدل دقیقا چیست؟
مدلهای هوش مصنوعی امروزی از طریق حجم عظیمی از متن و تصویر از اینترنت یاد میگیرند. این زمانی به کار آمد که اینترنت تا حد زیادی ساخته دست بشر بود. مشکل این است که هر چه بخشهای بیشتری از وب توسط هوش مصنوعی ایجاد میشود، مدلهای جدید به طور فزایندهای بر روی خروجی مدلهای قدیمیتر آموزش داده میشوند. اینها بر روی مدل هایی که قبل از آنها آمده اند آموزش دیده اند. مثل تهیه یک فتوکپی از یک فتوکپی فکر کنید. هر پاس تقریباً خوب به نظر می رسد، اما اشکالات کوچکی به تدریج ظاهر می شوند و ترکیب می شوند و در نهایت شما را با یک آشفتگی کثیف که شباهت کمی به نسخه اصلی دارد ایجاد می کند.
وقتی این اتفاق برای یک هوش مصنوعی رخ می دهد، خروجی مدل به سمت یک میانگین صاف و مطمئن حرکت می کند. به اندازه کافی آن را فشار دهید، و محققان نشان داده اند که الگوها در نهایت به مزخرفات تکراری تبدیل می شوند.
این پدیده به طور رسمی توسط تیمی از دانشگاههای آکسفورد و کمبریج توضیح داده شد و کار پیشگامانه آنها در مجله Nature در سال 2024 منتشر شد. هشدار آنها واضح بود: اگر هوش مصنوعی را بهطور بیرویه بر روی محتوای تولید شده توسط هوش مصنوعی آموزش دهید، در معرض خطر کاهش سرعت آهسته در توانایی آن برای تولید نتایج متنوع و با کیفیت بالا هستید.
چرا الان این مهمتر است؟
دو چیز با هم برخورد کرده اند تا آن چیزی که زمانی یک نگرانی تئوریک بود، فوری باشد. اول، حجم زیادی از محتوای مصنوعی. بر اساس برخی تخمین ها، بیش از نیمی از متنی که در حال حاضر به صورت آنلاین منتشر می شود توسط هوش مصنوعی تولید شده است. از پستهای وبلاگ گرفته تا تریلرهای محصول و پاسخهای رسانههای اجتماعی، هرکسی که نتایج جستجو یا فیدهای اجتماعی خود را تماشا کرده است که با پستهای عمومی نگرانکنندهای پر شده است، این موضوع را از نزدیک دیدهاند.
دوم، شرکتهای هوش مصنوعی در حال اتمام اسکریپتهای انسانی جدید برای یادگیری هستند. محققان هشدار داده اند که عرضه متن انسانی با کیفیت بالا می تواند به طور موثری تمام شود. این امر باعث میشود آزمایشگاهها بیشتر به دادههای مصنوعی روی بیاورند، دقیقاً عنصری که خطر فروپاشی را ایجاد میکند. این یک حلقه بازخورد است که در آن اشتها همچنان به رشد خود ادامه میدهد در حالی که اندازه بخش کوچک میشود.
رفع احتمالی
مطالعهای که در ماه می ۲۰۲۶ توسط محققان کینگز کالج لندن، دانشگاه علم و فناوری نروژ و مرکز بینالمللی فیزیک نظری عبدالسلام در Physical Review Letters منتشر شد، آنچه را که هوش مصنوعی «آدمخواری داده» نامیدند بررسی کرد و دریافت که یک مداخله کوچک شگفتآور میتواند چرخه را بشکند.
این تیم با کار با دستهای از مدلهای آماری سادهتر از رباتهای گفتگوی کامل، نشان داد که مدلی که صرفاً بر اساس خروجی خودش آموزش داده شده، محکوم به سقوط است. اما هنگامی که آنها حتی یک نقطه داده واقعی و واقعی را از خارج از این حلقه بسته به هم ریختند، هر بار از فروپاشی جلوگیری شد. حتی شگفتانگیزتر این بود که حتی زمانی که انبوه دادههای تولید شده توسط ماشین بسیار زیاد و تقریباً بیاندازه بود، لنگر واحد به واقعیت به کار خود ادامه داد.
پروفسور کینگ یاسر رودی توضیح داد: «با تمرکز بر یک مدل ساده، محققان توانستند مشخص کنند که چرا یک نقطه داده بیرونی از بیمعنا شدن سیستم جلوگیری میکند.
این تیم خاطرنشان می کند که کار آنها از مدل های ساده شده استفاده می کند، نه از شبکه های عصبی غول پیکر پشت ChatGPT یا Gemini، و آنها می خواهند این اصل را در سیستم های بزرگتر آزمایش کنند. اما نتیجه این باور را تشویق میکند که اگر قطرهای از دادههای واقعی انسانی، یا حداقل یک خط پایه از دانش قبلی واقعی، در ترکیب باقی بماند، ممکن است فروپاشی مدل، چرخه رستاخیز اجتنابناپذیر برخی ترسها نباشد.
این همچنین نشان دهنده سایر یافته های اخیر است. محققان نشان دادند که از فروپاشی تا حد زیادی زمانی جلوگیری شد که داده های مصنوعی در کنار داده های واقعی انسان به جای جایگزینی با داده های واقعی انباشته شدند. این به نحوه عملکرد واقعی دنیای واقعی نزدیکتر است: هیچکس کل اینترنت را حذف نمیکند و هر سال از نو شروع میکند.
افکار نهایی
لازم نیست نگران باشید که ChatGPT در آینده نزدیک استاتیک می شود. آزمایشگاههای بزرگ هوش مصنوعی به خوبی از این تله آگاه هستند و مبالغ هنگفتی را صرف دادههای انسانی، مراقبت دقیق و قراردادهای صدور مجوز با ناشران میکنند تا مجموعههای آموزشی خود را دست نخورده نگه دارند.
اما فروپاشی مدل یک لنز مفید برای مواردی است که قبلاً متوجه آن شده اید. چرا این “توسط هوش مصنوعی نوشته شده است؟” بخشی از سوال ارزش برچسب گذاری، منبع یابی محتوا و تخصص واقعی انسانی همچنان در حال ظهور است.
دلیل شلختگی توری باز این است که واقعاً یک مشکل طولانی مدت است و فقط یک شکایت زیبایی شناختی نیست. و این یک استدلال آرام برای ارزش ماندگار چیزهای واقعی است – نظرات شما، پست های انجمن، نوشته های انسانی واقعی شما – در عصری که به طور فزاینده ای وسوسه انگیز است که به چیزهای مصنوعی بسنده کنید. به نظر می رسد ماشین ها هنوز به ما نیاز دارند. نه حتی کمی.
آماندا کاسول را دنبال کنید و از منحنی هوش مصنوعی جلوتر بمانید
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود. مشترک شدن در راهنمای تام یوتیوب و ما را دنبال کنید tiktok. در نهایت می توانید از بخش ویژه ما دیدن فرمایید. دفتر مرکزی تیم پس انداز راهنمای تام برای کمک متخصصان برای دریافت بهترین محصولات با قیمت کمتر.



