من 8 chatbot AI را برای اولین جنون هوش مصنوعی خود تست کردم – و این برنده غافلگیرانه

در راهنمای تام ، با اولین مسابقات براکت ما ، هشت چکمه چت بهترین را در مقابل یکدیگر قرار می دهیم تا قهرمان نهایی AI را تاج گذاری کنیم.
پس از هفته ها مسابقات شدید ، اختلالات قطع فک و نمایش های ستاره ، یک قایق از بقیه بقیه: Deepseek بلند شد.
AI Madness یک عنصر واحد از هشت chatbot پیشرو AI را به حساب می آورد. ما از عوامل اساسی مانند صحت ، خلاقیت ، سودمندی ، مهارت های چند مدلی ، تجربه کاربر و کیفیت رابط داوری کرده ایم.
از کنترل واقعی گرفته تا برنامه نویسی ، داستان پردازی ، حل مسئله ، این چکمه ها تست استرس کامل را انجام دادند. این شکست است.
دور اول
این عمل با چتپپ و حیرت آغاز شد. Chatbot Openai در هر دور پیروز شد و رقابت را جارو کرد. Chatgpt نشان داد که در دسته های آزمایش شده ، یک انتخاب عالی به عنوان یک انتخاب قدرتمند تر ، به ویژه خلاقیت ، عمق و تجربه کاربر دوستانه است.
سپس او با همان درخواست ها سوءاستفاده را گرفت. در این رقابت ، جمینی به دلیل وضوح برتر ، سازماندهی و عملی در پاسخ دادن به عنوان برنده عمومی ظاهر شد. Gemini پاسخ های پیکربندی شده تر ، جالب و دوستانه تر را در چند دسته ارائه می داد.
در این میان ، گوک ، بازتاب و بازتاب دهنده آنتروپیک ، با استدلال قایق ، کلوددان را پشت سر گذاشت. گوک در طول هر درخواست پاسخ های دقیق تر ، جامع تر و جالب تری ارائه می داد.
سرانجام ، او با Deepseek Meta AI آشنا شد و با برنده شدن در واکنش های دقیق تر ، ظریف تر و همه کاره ، خلاقانه ، شروع به لرزیدن کرد.
نیمه نهایی
دور دوم با دو حماسه جنگید: چتپ و غیره. جمینی و گوک و غیره Deepseek. دوقلوها چتپپ را با یک ساختار محکم ، منطق واضح تر و استدلال واضح تر پشت سر گذاشتند.
پاسخ های جمینی توانایی سازگاری با خواسته های مختلف از طراحی طرح پایگاه داده تا برنامه ریزی غذایی مبتنی بر گیاه و مسائل اخلاقی در تحقیقات دانشگاهی را به نمایش گذاشت.
در مسابقات دیگر ، Deepseek یک حیرت انگیز دیگر ایجاد کرد و ضمن افزودن تجزیه و تحلیل قوی تر و حقایق جامد ، استعدادهای گوک را هماهنگ کرد. گوک ثابت کرد که در زمینه های دانشگاهی ، فنی و تدریس قابل اطمینان تر است ، حتی اگر در لحن گفتار و داستان پردازی کامل باشد.
AI Madness: Final
مسابقات قهرمانی جمینی در مقابل مسابقات غیرمعمول Deepseek با هم جمع شده است. جمینی پاسخ های کاملی به نه درخواست ارائه می داد ، اما Deepseek تقریباً هر بار بهترین ، صیقلی ترین پاسخ ها و ظرافت های چند حالته را ارائه می داد.
از ساده سازی مفاهیم دشوار برای کودکان برای مقابله با چالش های دنیای واقعی با راه حل های هوشمند ، Deepseek واکنش های برتر را در خواسته های مختلف نشان داد و این عنوان را دریافت کرد. ترکیبی از وضوح ، خلاقیت و کاربردی ، رقابت را در گرد و غبار قرار داد.
این آزمون در نهایت چه اثبات می کند
اگرچه Chatgpt و Gemini معمولی AI Go-Tos ، Deepseek ثابت کرد که می تواند غول های AI را مشت و غلبه کند. اما چرا؟
DeepSeek-R1 یک روش آموزشی جدید را اتخاذ می کند که به جای تکیه بر تنظیم خوب کنترل شده ، بر تقویت یادگیری (RL) متمرکز است.
این رویکرد نوآورانه به مدل اجازه می دهد تا از طریق آزمایش و خطا یاد بگیرد و جوایز الگوریتمی دریافت کند که توسعه آن را به سمت قابلیت های استدلال مؤثرتر سوق می دهد.
به عنوان مثال ، DeepSeek-R1 توانایی کشف تکنیک های حل مسئله مانند بازتاب و تأیید بدون دستورالعمل روشن را نشان داده است. این رویکرد به مدل اجازه می دهد تا پاسخ های خود را بهبود بخشد و عملکرد را با یادگیری از اشتباهات خود بهبود بخشد.
DeepSeek-R1 با استفاده از RL نشان می دهد که امکان توسعه قابلیت های استدلال پیشرفته در هوش مصنوعی بدون بسته به این خوشه های داده جامع و فشرده کار ، امکان پذیر است.
بدیهی است ، همانطور که این تست ها ثابت کرده اند ، RL می تواند روشی کارآمدتر و بالقوه کمتری برای توسعه هوش مصنوعی باشد ، که معتقد است مجموعه داده های بزرگ و کنترل شده برای آموزش مدلهای زبان پیشرفته مورد نیاز است.
آخرین افکار
به طور خلاصه ، پیروزی Deepseek ثابت می کند که فراتر از روشهای آموزش معمولی است.
اتکا به Deepseek-R1 به یادگیری تقویت خالص به عزیمت قابل توجهی از روشهای تنظیم دقیق کنترل شده سنتی. شاید به مدل های هوش مصنوعی اجازه دهد تا از خودشان بیاموزند و در نهایت مدل های زبان را باهوش تر کنند.
AI Madness بر آخرین امکانات چکمه چت تأکید کرد ، اما اگر از ما سؤال کنید ، مسابقه فقط داغ می شود! با ما همراه باشید