Deepseek در وسط محبوبیت قریب به اتفاق و تجربیات “حملات مخرب بزرگ” در حال وقفه است

پروین میرمیران27 ژانویه 2025آخرین به روز رسانی: 27 ژانویه 2025

0 2,666 خواندن این مطلب 3 دقیقه زمان میبرد

Deepseek R1 مدل AI چین است که Openai و Anthropic را می شکند - آنچه شما باید بدانید

Deepseek ، که در حال حاضر به عنوان بهترین برنامه رایگان در فروشگاه App Apple ذکر شده است ، امروز صبح وقفه های گسترده ای را تجربه کرده است که بر خدمات API و چت وب تأثیر می گذارد. طبق صفحه وضعیت این شرکت ، API با “عملکرد فاسد” کار می کند ، سرویس چت وب “کسر جزئی” با آن روبرو شد.

Deepseek ، یک ابتکار چینی از چتپپ و یک رقیب عالی هوش مصنوعی ، به سرعت به عنوان یک بازیکن عالی در نمای هوش مصنوعی ظاهر شد. Deepseek ، با پشتیبانی صندوق پرچین ، که در سال 2023 تأسیس شده است ، بر توسعه مدل های بزرگ زبان (LLMS) متمرکز است ، که در عملکرد و کارآیی هزینه از رهبران صنعت موجود رقابت می کند یا فراتر می رود.

Deepseek که توسط Liang Wenfeng ، که High Flyer را تأسیس کرده است ، تأسیس شده است ، در ژجیانگ ، دفتر مرکزی Hangzhou واقع شده است. وظیفه این شرکت بر توسعه اطلاعات عمومی مصنوعی (AGI) از طریق تحقیق و توسعه منبع باز متمرکز است. این رویکرد با هدف دموکراتیک کردن فناوری هوش مصنوعی و در دسترس بودن آن برای شیوه های تجاری و دانشگاهی است.

Deepseek به طور موقت سوابق کاربر جدید را با افراد دارای شماره تلفن های مبتنی بر چینی محدود کرد. این اقدام در پاسخ به “حملات مخرب در مقیاس بزرگ” با هدف خدمات آنلاین این سکو انجام شد. کاربران موجود تحت تأثیر قرار نمی گیرند و ممکن است به طور بدون وقفه به حساب های خود ادامه دهند.

در ابتدا ، Deepseek اعلام کرد که کاربران دارای شماره تلفن با کد +86 کشور را می توان در حساب های جدید ثبت کرد. بعداً ، پیام وب سایت به روز شد تا نشان دهد که “سوابق ممکن است شلوغ باشد” ، که نشان می دهد این محدودیت به طور بالقوه تسهیل می شود. در آن زمان ، برخی از کاربران گزارش دادند که شما می توانید با استفاده از آدرس های e -post ثبت کنید -من امروز صبح با استفاده از آدرس e -posta شخصی من ثبت شده ام.

تعهد منبع باز

بر خلاف بسیاری از شرکت های هوش مصنوعی که مدلهای مبتنی بر اشتراک را ارائه می دهند ، Deepseek مدل های خود را تحت مجوز MIT کاملاً پاک کرده و اجازه استفاده نامحدود تجاری و دانشگاهی را داده است. این تعهد به وضوح با رویکردهای ثبت شده برخی از رقبا مغایرت دارد و در افزایش سریع محبوبیت مؤثر بوده است.

Deepseek از زمان اولین راه اندازی این شرکت ، از جمله Deepseek-V3 ، مدلهای مختلف پیشگامانه را معرفی کرد. این مدل پارامتر 671 میلیارد دلار دارد و در حدود 55 روز در مجموعه داده های سکه 14.8 تریلیون آموزش دیده و تقریباً 5.58 میلیون دلار هزینه دارد. تست های معیار نشان می دهد که Deepseek-V3 قادر به عملکرد بهتر از Lama 3.1 و Qwen 2.5 است ، در حالی که مطابق با ویژگی های GPT-4O و Claude 3.5 Sonnet است. معماری وی از ترکیبی از متخصصان با ترانسفورماتور توجه پنهان چند منظوره استفاده می کند ، که شامل 256 متخصص کارگردانی و یک متخصص مشترک است و 37 میلیارد پارامتر در هر جتون امکان پذیر است.

آخرین مدل Deepseek-R1 ، که در ژانویه 2025 منتشر شده است ، بر استنباط منطقی ، استدلال ریاضی و حل مسئله در زمان واقعی متمرکز است. به منظور افزایش قابلیت های استدلال ، این گروه با استفاده از یادگیری تقویت شده بدون انجام تنظیم دقیق کنترل شده با استفاده از بهینه سازی خط مشی نسبی (GRPO) آموزش داده شد. این مدل به عملکرد قابل مقایسه در کارهای مختلف ، از جمله ریاضیات و برنامه نویسی می رسد.

یکی از مهمترین کمک های Deepseek نشان دادن این است که مدل های AI با عملکرد بالا می توانند با هزینه ها و منابع پایین تر به طور قابل توجهی توسعه یابد. به عنوان مثال ، Deepseek-V3 با استفاده از حدود 2000 تراشه Nvidia H800 و مخالف 16000 تراشه ، که معمولاً توسط رقبا استفاده می شود ، آموزش داده شد. این کارآیی منجر به ارزیابی مجدد سرمایه گذاری های عمده در زیرساخت های هوش مصنوعی توسط شرکت های پیشرو فناوری شده است.

منتظر جزئیات بیشتر

این شرکت جزئیات خاصی در مورد ماهیت حملات مخرب یا مدت زمان انتظار محدودیت های ثبت نام ارائه نداد. این تأکید بر مشکلاتی است که توسط سکوهای پیشرفته در حال رشد در زمینه اطمینان از امنیت و حضور خدمات در میان تهدیدات سایبری روبرو است.

با پیشرفت اوضاع ، دیده می شود که چگونه Deepseek هنگام مدیریت پایگاه کاربر در حال گسترش ، این نگرانی های ایمنی را برطرف خواهد کرد.