علی بابا مدلهای استدلال هوش مصنوعی خود را برای رقابت با Deepseek راه اندازی می کند

باز هم ، یک بازیکن دیگر برای AI در صدر قرار دارد. Alibaba ، یکی از بزرگترین شرکت های تجارت الکترونیکی در جهان ، از راه اندازی آخرین مدل استدلال هوش مصنوعی معروف به Qwen 3 خبر داد.
Alibaba ادعا می کند که این مدل ها در کارهای استدلال خود در هر دو Google و Openai مطابقت دارند (و حتی عملکرد بهتری دارند).
خود Qwen جدید نیست (همانطور که از نامی که پیشنهاد شده است) ، اما علی بابا برای اولین بار سعی کرد بهترین سگ ها را به چالش بکشد و اولین قدم های خود را به کارهای استدلال پیچیده تر ترسیم می کند.
بیشتر مدل ها به زودی می توانند از شرکت های غول AI تحت مجوز باز از بغل کردن Face یا GitHub بارگیری شوند. در پارامترهای آنها چندین مدل از 0.6 میلیارد تا 235 میلیارد وجود دارد.
با Qwen3 ملاقات کنید! 2 مدل MOE و 6 مدل فشرده ، از جمله 0.6b تا 235b ، آخرین مدل های اصلی زبان ما ، QWEN3 و وزن باز. مدل پرچمدار ما QWEN3-235B-A22B ، برنامه نویسی ، ریاضی ، عمومی… pic.twitter.com/jwzkjehwhc’s مقایسه نتایج رقابتی.28 آوریل 2025
پارامترها در این مثال به توانایی حل مسئله یک مدل خشن تبدیل می شوند. هرچه پارامترها بیشتر باشد ، توانایی او بهتر می شود ، طول می کشد و هزینه آن نیز بیشتر می شود.
اگرچه آنها جزئیات بیشتری را توضیح نداده اند ، اما این مدل ها احتمالاً در پایان به Qwen Chatbot منتقل می شوند.
مدل ها دو حالت را ارائه می دهند. در حالت تفکر ، مدل گام به گام برای پاسخ دادن پیشرفت خواهد کرد. در حالت غیر تفکر ، مدل پاسخ های سریع به سؤالات ساده تر ارائه می دهد که سرعت آن از عمق مهمتر است.
در یک پست وبلاگ ، “این انعطاف پذیری به کاربران اجازه می دهد تا بر اساس کار مورد نظر چقدر” تفکر “را بررسی کنند. به عنوان مثال ، مشکلات آسانتر را می توان با استدلال گسترده ای برطرف کرد و به موارد ساده تر می توان بدون تأخیر پاسخ داد.” گفت
“مهمتر از همه ، ادغام این دو حالت توانایی مدل در اجرای کنترل بودجه تفکر پایدار و کارآمد را به شدت افزایش می دهد.”
علاوه بر Deepseek ، Alibaba نشانه ای از رشد چین به شرکت های هوش مصنوعی آمریکایی است. Deepseek در کارهای استدلال بهتر از Chatgpt و امثال Google عمل کرد ، حتی اگر بهتر نبود.
اگر ادعاهای علی بابا صحیح باشد ، این مجموعه دیگری از مدل استدلال است که می تواند با عملکرد چتگپت مطابقت داشته باشد. جالب اینجاست که این یک مدل قوی تر و باهوش تر از Deepseek ایجاد خواهد شد.
مانند Deepseek ، به نظر می رسد علی بابا از بازار ایالات متحده ناراحت است ، اما همچنین یک فناوری قدرتمند اما ارزان تر هوش مصنوعی را ارائه می دهد. با این حال ، از آنجا که چند شرکت هوش مصنوعی متهم به برش گوشه ها هستند ، این مشکلات اخلاقی و ایمنی را ایجاد می کند.
چه چیزی برای این مدل ها مهم است؟
شرکت های هوش مصنوعی برای مدل های AI به یک سیستم جدید تغییر یافته اند. در ابتدا ، فقط یک نسخه از سیستم هوش مصنوعی وجود داشت ، اکنون بیش از یک وجود دارد. این سیستم های مختلف برای انجام کارهای مختلف ، تلاش بیشتر برای کارهای پیچیده ساخته شده اند و از انرژی کمتری برای مشکلات آسان استفاده می کنند.
به عنوان مثال ، ChatGPT برای اکثر کارها یک مدل کلی دارد ، chatgpt 4o ، اما 4o مینی برای درخواست های ساده. علاوه بر این ، یک سری مدل های استدلال دارد.
مدل های استدلال برای انجام کارهای پیچیده طراحی شده اند. این همه چیز است ، از برنامه نویسی گرفته تا درخواست های چند مرحله ای (از او درخواست می کند چند کار را پشت سر هم انجام دهد) و با پروژه های تحقیقاتی عمیق.
با استفاده از این آخرین به روزرسانی QWEN ، علی بابا قصد دارد همین کار را انجام دهد ، مدلی را ارائه می دهد که می تواند کارهای ساده ای را انجام دهد ، اما امروزه همچنین فکر پیچیده ای را که از هوش مصنوعی انتظار می رود ، می کند.
بیشتر از راهنمای تام
بازگشت به لپ تاپ ها