مدل های پیشرو Openai به انجام کاری ادامه می دهند – به همین دلیل

Openai’s Newly O3 و O4-Mini ، برخی از هوشمندترین مدل های هوش مصنوعی که منتشر می شوند ، اما فقط از یک مشکل بزرگ رنج می برند.
هر دو مدل توهم هستند. از آنجا که بیشتر مدل های هوش مصنوعی هنوز هم تمایل به انجام این کار دارند ، این به خودی خود معمولی نیست. با این حال ، به نظر می رسد این دو نسخه جدید بیش از مدل های قدیمی Openai توهم می کنند.
از نظر تاریخی ، در حالی که بیشتر مدل های جدید توهم را ادامه می دهند ، خطر در هر نسخه جدید کاهش می یابد. مشکل بالقوه بزرگتر در اینجا این است که Openai نمی داند چرا این است.
توهم چیست؟
اگر از یک مدل AI استفاده کرده اید ، احتمالاً توهم را دیدید. این زمانی است که مدل نتایج نادرست یا گمراه کننده تولید می کند. این ممکن است به معنای تولید آمار دروغین ، گرفتن درخواست تصویر اشتباه یا مخلوط کردن فقط در درخواست داده شده باشد.
اگر از یک مدل AI استفاده کرده اید ، احتمالاً توهم را دیدید. این زمانی است که مدل نتایج نادرست یا گمراه کننده تولید می کند.
این می تواند یک مشکل کوچک و مهم نباشد. به عنوان مثال ، اگر از یک قایق گپ خواسته می شود با استفاده از فقط کلمات شروع شده با “B” شعر ایجاد کند و شامل کلمه “درخت” باشد ، حتی اگر این یک توهم باشد ، یک شرط کاملاً کم است.
با این حال ، اگر یک لیست غذایی ایمن برای شخصی که دارای عدم تحمل گلوتن است درخواست شده و رول نان را توصیه می کند ، این یک توهم خطرناک خواهد بود.
این برای مدل های O3 و O4-Mini معنی دارد؟
گزارش فنی Openai برای این دو مدل ، مدل AI ، ارزیابی میزان توهم شخص Personqa’da اعلام کرد که هر دو عملکرد کم دارند.
وی گفت: “انتظار می رود این مدل های کوچکتر از توهم کمتر و بیشتر دانش کمتری داشته باشند. با این حال ، ما برخی از تفاوت های عملکرد را مشاهده کرده ایم که O1 و O3 را مقایسه می کنند.
“به ویژه ، O3 تمایل به ادعاهای بیشتر دارد ، که منجر به ادعاهای دقیق تر و ادعاهای دروغین/توهم می شود. تحقیقات بیشتری برای درک علت این نتیجه لازم است.”
گزارش اوپای نشان داد که O3 در پاسخ به 33 ٪ از سؤالات توهم شده است. این تقریباً دو برابر میزان توهم مدل های استدلال قبلی Openai است.
هر دوی این مدل ها هنوز کاملاً جدید بودند و اکنون برای عموم آزاد بودند ، همانطور که این آزمایش ادامه داشت ، می توانستند تحولات سختی را در نرخ توهم مشاهده کنند. با این حال ، از آنجا که هر دو مدل برای کارهای پیچیده تر ایجاد شده اند ، این می تواند به جلو مشکل ساز باشد.
همانطور که در بالا ذکر شد ، توهم می تواند یک عجیب و غریب خنده دار در خواسته های غیر مهم باشد. با این حال ، مدل های استدلال (AI طراحی شده برای انجام کارهای پیچیده تر) به طور معمول با اطلاعات مهمتر سروکار دارد.
این الگویی است که با OpenAI با مدل های استدلال آینده ادامه می یابد ، به ویژه برای شرکت های بزرگتر که می خواهند مبلغ سنگینی را برای استفاده از O3 و O4-Mini هزینه کنند.