هوش مصنوعی

استارت‌آپ کوچک هوش مصنوعی در آزمون استدلالی حیاتی، جمینی 3 گوگل را شکست – این چیزی است که ما می‌دانیم

Gemini 3 از زمان اولین حضور خود توانسته در صدر جدول امتیازات LMARena قرار گیرد. این تابلوی امتیازات یک رتبه‌بندی جمع‌سپاری است که در آن هزاران کاربر واقعی مدل‌های هوش مصنوعی را در طیف گسترده‌ای از وظایف به‌هم مقایسه می‌کنند و در مورد اینکه کدام پاسخ بهتر است رأی می‌دهند. اما وقتی نوبت به دستیابی به سخت ترین معیارهای استدلال می رسد، یک بچه جدید در بلوک وجود دارد و قبلاً گوگل را شکست داده است، و بدون آموزش مدل خود این کار را انجام داد.

یک استارتاپ تیم شش نفره معروف به Poetiq می‌گوید که در مجموعه تست نیمه خصوصی ARC-AGI-2، یک چالش استدلالی بسیار دشوار که توسط محقق هوش مصنوعی فرانسوا شولت ایجاد شده است، مقام اول را به خود اختصاص داده است. سیستم این استارت آپ 54 درصد را به دست آورد که از 45 درصدی که قبلاً توسط گوگل برای Gemini 3 Deep Think گزارش شده بود، شکست.

برای در نظر گرفتن این موضوع، بیشتر مدل‌های هوش مصنوعی تنها شش ماه پیش در این معیار کمتر از 5 درصد بودند. شکست 50 درصدی چیزی است که محققان سال‌ها پیش به طور گسترده آن را فرض کردند.

پروین میرمیران

پروین میرمیران، نویسنده و متخصص در حوزه هوش مصنوعی با بیش از 5 سال تجربه در نگارش مقالات تخصصی، آموزشی و پژوهشی است. او به عنوان یک انسان علاقه‌مند به یادگیری و پیشرفت، همواره به دنبال به‌روزترین مطالب و روش‌های کاربردی در زمینه هوش مصنوعی است. با توانایی برجسته در تحلیل داده‌ها و ارائه راهکارهای نوین، پروین میرمیران توانسته است به عنوان یک متخصص معتبر در این زمینه شناخته شود. به عنوان یک نویسنده حرفه‌ای، پروین میرمیران تمام تلاش خود را به کاربرمحوری و ارائه محتوای ارزشمند برای خوانندگان متمرکز کرده است. او با استفاده از زبان ساده و قابل فهم، مطالب پیچیده هوش مصنوعی را به شکلی دست‌نخورده و قابل فهم برای عموم مخاطبان خود تبدیل می‌کند.
دکمه بازگشت به بالا