در طی ساخت 2024، مایکروسافت نسخه جدیدی از مدل هوش مصنوعی uvula این شرکت به نام Phi-3 را معرفی کرد که می تواند تصاویر را تجزیه و تحلیل کند و به کاربران بگوید چه چیزی در آنها وجود دارد.
نسخه جدید Phi-3-vision یک مدل چند وجهی است. برای کسانی که نمی دانند، یک مدل چند وجهی به این معنی است که ابزار هوش مصنوعی می تواند متن و تصاویر را بخواند، به ویژه به لطف GPT-4o OpenAI و به روز رسانی های گوگل برای Gemini.
Phi-3-vision مدلی با 4.2 میلیارد پارامتر دارد، بنابراین برای استفاده در دستگاه های تلفن همراه در نظر گرفته شده است. پارامترهای یک مدل هوش مصنوعی برای درک اینکه یک مدل چقدر پیچیده است و چقدر آموزش دیده است، مختصر هستند. مایکروسافت مدل Phi را در نسخه های قبلی تکرار می کند. بنابراین، به عنوان مثال، Phi-2 از Phi-1 یاد گرفت و با توانایی های جدید رشد کرد، و Phi-3 مشابه Phi-2 است که در Phi-2 آموزش دیده و دارای توانایی های اضافه شده است.
Phi-3-vision می تواند وظایف متداول استدلال بصری، مانند تجزیه و تحلیل نمودارها و تصاویر را انجام دهد. برخلاف سایر مدلهای شناختهشدهتر، مانند DALL-E OpenAI، Phi-3-vision فقط میتواند یک تصویر را “خواند” کند. نمی تواند تصاویر ایجاد کند.
مایکروسافت چندین مورد از این مدل های کوچک هوش مصنوعی را منتشر کرده است. آنها به گونهای طراحی شدهاند که بهطور بومی و روی طیف وسیعتری از دستگاهها نسبت به مدلهای بزرگتری مانند Gemini Google و حتی ChatGPT اجرا شوند. بدون اتصال به اینترنت مورد نیاز است. آنها همچنین مانند مدل کوچک Orca-Math مایکروسافت، قدرت محاسباتی مورد نیاز برای انجام برخی وظایف، مانند حل مسائل ریاضی را کاهش می دهند.
اولین تکرار Phi-3 در آوریل اعلام شد، زمانی که مایکروسافت Phi-3-mini کوچک را منتشر کرد. در تستهای بنچمارک، در برابر مدلهای بزرگتری مانند Llama 2 متا بسیار خوب عمل کرد. مدل مینی تنها 3.8 میلیارد پارامتر دارد. دو مدل دیگر Phi-3-small و Phi-3-medium وجود دارد که به ترتیب شامل 7 میلیارد پارامتر و 14 میلیارد پارامتر هستند.
Phi-3-vision اکنون در پیش نمایش در دسترس است. سه مدل دیگر Phi-3 (Phi-3-mini، Phi-3-small و Phi-3-medium) از طریق کاتالوگ و مجموعه های مدل یادگیری ماشینی Azure در دسترس هستند. برای استفاده از آنها، به یک حساب Azure پولی و مرکز Azure AI Studio نیاز دارید.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران