Deepseek R1 مدل AI چین است که Openai و Anthropic را می شکند – آنچه شما باید بدانید
شکی نیست ، Deepseek R1 خیلی زیاد است. بزرگ موافقت مانند اکثر فن آوری های جدید ، در تجارت هوش مصنوعی بیش از حد زیادی وجود دارد. اما گاهی اوقات ورود جدید به عنوان یک نیروی مخرب بزرگ با ادعای واقعی همراه است. Deepseek R1 چنین موجودی است (شما می توانید خودتان در اینجا به مدل دسترسی پیدا کنید).
در مواجهه با این ، این فقط یک مدل جدید هوش مصنوعی چینی است و هر هفته مشکلی برای پرتاب وجود ندارد. با این حال ، دو چیز مهم وجود دارد که Deepseek R1 را متفاوت می کند.
اول ، مردم در مورد آن با همان عملکرد Openai's O1 صحبت می کنند. به طور خلاصه ، O1 به دلیل توانایی استدلال قبل از پاسخ دادن ، رهبر جهان در مدل های هوش مصنوعی است. این امر برای کارهای پیچیده تری که AI به طور معمول با آن تلاش می کند بسیار قوی می کند.
جای تعجب آور است که یک شخص جدید وارد یکباره با رهبر بازار منتقل می شود.
ثانیا ، این مدل جدید نه تنها عملکرد مشابه مدل O1 را ارائه می دهد ، بلکه منبع باز نیز دارد. این بدان معنی است که هر محقق یا مهندس هوش مصنوعی در جهان می تواند برای بهبود و تنظیم خوب آن برای برنامه های مختلف تلاش کند.
این یک جهش کوانتومی از نظر میزان بالقوه توسعه است که در ماههای آینده در هوش مصنوعی خواهیم دید. این دیگر وضعیتی نیست که در آن یک یا دو شرکت زمینه AI را کنترل کنند ، اما اکنون یک جامعه جهانی بزرگ وجود دارد که می تواند در پیشرفت این ابزارهای جدید غافلگیرکننده نقش داشته باشد.
برای توهین به مصدومیت ، خانواده Deepseek Model فقط در دو ماه با 5.6 میلیون دلار آموزش دیده و توسعه یافتند. این با هزینه های توسعه میلیارد دلاری مقامات بزرگ مانند OpenAi و Anthropics مقایسه می شود.
این یک کاستی است که بگوییم این فناوری سیلی در مقابل غول ها است. دارندگان صندوق پرچین چینی High-Flyer ، Deepseek سابقه توسعه هوش مصنوعی را دارند ، بنابراین جای تعجب ندارد. تعجب آور است که آنها برای آنها چیزی خیلی سریع و ارزان ایجاد کرده اند و آخرین فناوری بدون دسترسی به فناوری پردازش اطلاعات غربی.
تماشای
البته ، یک رتبه خوب در مورد یک معیار چیزی است ، اما اکثر مردم اکنون به دنبال شواهد دنیای واقعی در مورد نحوه عملکرد مدل ها به صورت روزانه هستند. اولین گزارش ها نشان می دهد که معیارهای Deepseek دروغ نمی گویند ، و این که Anthropic با توجه به Claude Sonnet 3.5 برنامه نویسی هوش مصنوعی از یک سری از کاربران را اتخاذ کرده است.
با کمال تعجب ، به نظر می رسد که مدل R1 قطب های قلعه را در جستجوی خلاق تر حرکت می دهد. یک کاربر Reddit نمونه ای از برخی از مقالات خلاقانه تولید شده توسط مدل تکان دهنده را منتشر کرده است.
روزهای اول
تست شخصی من نشان می دهد که Deepseek برای کسانی که می خواهند از محلی در رایانه های خود استفاده کنند محبوب خواهد بود. سه تست های کوچک و بدون شک در تست های غیر علمی ، تست هایی که من با مدل انجام داده ام ، چقدر خوب انجام می دهم.
در یک تست ، من می خواستم به من کمک کند تا نام یک سکوی جمع آوری کمک مالی غیر انتفاعی را که از مدل به دنبال آن بودم ، تماشا کنم. یک جستجوی استاندارد Google نتوانست OpenAi و Gemini را در هر نقطه نزدیک جواب من به من بدهد. Deepseek در یک زمان شلیک کرد ، این تعجب آور بود.
ما در یک جدول زمانی زندگی می کنیم که یک شرکت بدون ایالات متحده ماموریت اصلی Openai را زنده نگه می دارد – واقعاً باز است و تحقیقات مرزی است که همه را تقویت می کند. منطقی نیست سرگرم کننده ترین نتیجه به احتمال زیاد است.20 ژانویه 2025
روزهای اول برای عبور از داوری نهایی در مورد این الگوی جدید هوش مصنوعی ، اما تاکنون نتایج به نظر می رسد بسیار امیدوار کننده است. نکته ای که من متوجه شدم این است که درخواست و درخواست سیستم هنگام اجرای مدل به صورت محلی بسیار مهم است.
بدون درخواست خوب ، نتایج کاملاً متوسط است یا حداقل در مقایسه با مدل های محلی موجود پیشرفت واقعی وجود ندارد. اما وقتی درست است ، خوب بودن من قطعاً پرواز می کند.