مایکروسافت Phi-3.5 را معرفی کرد – این مدل جدید هوش مصنوعی کوچک عملکرد بهتری از Gemini و GPT-4o دارد.

پروین میرمیران22 آگوست 2024آخرین به روز رسانی: 22 آگوست 2024

0 2,658 خواندن این مطلب 2 دقیقه زمان میبرد

مایکروسافت Phi-3.5 را معرفی کرد – این مدل جدید هوش مصنوعی کوچک عملکرد بهتری از Gemini و GPT-4o دارد.

مایکروسافت آخرین نسخه از مدل Phi-3.5 زبان کوچک خود را منتشر کرده است. این نسخه جدید یک ارتقای بزرگ نسبت به نسل قبلی است و مدل‌های کوچک‌تر از بازیکنان پیشرو مانند Google، OpenAI، Mistral و Meta را در چندین معیار کلیدی شکست می‌دهد.

Phi-3.5 در نسخه هایی با 3.8 میلیارد، 4.15 میلیارد و 41.9 میلیارد پارامتر عرضه می شود. هر سه را می توان به صورت رایگان دانلود کرد و با استفاده از یک ابزار بومی مانند اوللاما اجرا کرد.

به ویژه در استدلال خوب عمل کرد و تنها توسط یکی از مدل های کوچکتر پیشرو، GPT-4o-mini پیشی گرفت. همچنین در معیارهای ریاضی عملکرد خوبی داشت و به طور قابل توجهی از Llama و Gemini بهتر بود.

مدل‌های زبان کوچک مانند Phi-3.5 پیشرفت‌هایی را در بهره‌وری در هوش مصنوعی نشان می‌دهند و از هدف سام آلتمن، مدیر عامل OpenAI برای ایجاد هوش بی‌اندازه ارزان پشتیبانی می‌کنند.

چه چیزی در Phi-3.5 جدید است

🔥 مدل‌های جدید Phi-3.5 اکنون در تابلوی امتیازات Open LLM هستند!• Phi-3.5-MoE-instruct در همه مدل‌های مایکروسافت با میانگین امتیاز 35.1 پیشتاز است و رتبه اول را در دسته سه بعدی و رتبه 10 را در بین همه مدل‌های چت دارد• Phi- 3.5-mini -instruct با 27.4 امتیاز در رده سوم در رده سه بعدی قرار دارد… pic.twitter.com/yNcOR2bcxX22 آگوست 2024

Phi-3.5 در نسخه‌ای از مدل ویژن ارائه می‌شود که می‌تواند تصاویر را درک کند، نه فقط متن، و ترکیبی از مدل‌های خبره برای تقسیم وظایف یادگیری به زیرشبکه‌های مختلف برای پردازش کارآمدتر.

ترکیبی از مدل‌های خبره از Gemini Flash 1.5، مدلی که در نسخه رایگان چت‌بات جمینی استفاده می‌شود، در معیارهای متعدد و دارای یک پنجره زمینه بزرگ 128k است. این با ChatGPT و Claude برابری می کند، اگرچه به طور قابل توجهی کوچکتر از خود Gemini است.

مزیت اصلی یک مدل بسیار کوچک مانند مدلی که من ساختم این است که می توان آن را با یک برنامه بسته بندی کرد یا روی دستگاه اینترنت اشیا مانند زنگ درب هوشمند نصب کرد. این کار تشخیص چهره را بدون ارسال داده به فضای ابری امکان پذیر می کند.

کوچکترین مدل بر روی 3.4 تریلیون سکه داده با استفاده از 512 پردازنده گرافیکی Nvidia H100 در مدت 10 روز آموزش داده شد. ترکیبی از مدل های خبره شامل 16 مدل پارامتر 3.8b بود که از 4.9 تریلیون توکن استفاده کرد و آموزش آن 23 روز طول کشید.

واقعاً Phi-3.5 چقدر خوب کار می کند؟

من نسخه کوچکتر 3.8 میلیارد پارامتری Phi-3.5 را بر روی لپ تاپ خود نصب و اجرا کردم و آن را کمتر از معیارهای پیشنهادی چشمگیر یافتم. اگرچه در پاسخ‌هایش مفصل بود، اما غالباً این عبارات چیزهای زیادی را می‌خواست و او با آزمایش‌های ساده دست و پنجه نرم می‌کرد.

من یک سوال کلاسیک پرسیدم: “یک داستان کوتاه و یک جمله ای بنویسید که حرف اول یک کلمه با حرف آخر کلمه قبلی یکی باشد.” حتی بعد از توضیحات به طرز چشمگیری شکست خورد.

من ترکیب مدل های تخصصی بزرگتر را امتحان نکرده ام. با این حال، با توجه به مقایسه ها، گفته شد که در نسخه مدلی که من امتحان کردم، برخی از مشکلات را حل کرد. بنچمارک‌ها نشان می‌دهند که کیفیت خروجی آن مشابه نسخه GPT-4o-mini OpenAI است که با نسخه رایگان ChatGPT ارائه می‌شود.

یکی از زمینه هایی که GPT-4o-mini از سایرین بهتر عمل می کند، در زمینه STEM و علوم اجتماعی است. معماری آن به آن اجازه می دهد تا کارایی خود را در حین مدیریت وظایف پیچیده هوش مصنوعی به زبان های مختلف حفظ کند.