متا آخرین مورد در تعداد فزاینده ای از شرکت های فناوری است که ایده صدا را به عنوان روشی که ما با فناوری تعامل داریم پذیرفته اند. به ChatGPT Voice OpenAI، Gemini Voice گوگل و البته گارد قدیمی، Alexa آمازون و Siri اپل میپیوندد.
برخلاف سیری و الکسا، MetaAI Voice در رده گفتار قرار میگیرد و دلیل خوبی هم دارد: این شرکت به روش بهتری نیاز داشت تا به مردم اجازه دهد با عینکهای هوشمند Ray-Ban، هدستهای Quest VR و دستگاههای اصلی که به صفحه کلید یا صفحه نمایش لمسی
صدای هوش مصنوعی مکالمه ای به شما این امکان را می دهد که با هوش مصنوعی به زبان طبیعی طوری صحبت کنید که انگار با یک انسان صحبت می کنید. آن را قادر می سازد تا به پرس و جوهای پیچیده و مبهم رسیدگی کند. به عنوان مثال، در نسخه ی نمایشی متا کانکت، مارک زاکربرگ از او پرسید که یک آووکادو را به عینک هوشمند Meta Ray-Ban خود نگه دارد و از او پرسید: “با این چه کاری می توانم انجام دهم؟” او گفتن را پیشنهاد کرد، اما ماهیت «این» را مشخص نکرد.
متا کاری کرد که گوگل و OpenAI انجام ندادند. به جای یک بازیگر بی نام یا صدای ساخته شده، صدای افراد مشهور را نشان می دهد. در ابتدا، میتوانید با هوش مصنوعی که صدایی مانند دام جودی دنچ، جان سینا، کریستن بل و غیره دارد چت کنید.
متأسفانه، کیفیت صدای مصنوعی در حد Gemini یا ChatGPT Voice نیست، اما میتوانید در اواسط استریم را کاهش دهید و سؤالات طبیعی را در همان سطح بپرسید. در واتس اپ، فیسبوک مسنجر و اینستاگرام موجود است.
در حالی که صدای MetaAI نسبت به ChatGPT Advanced Voice کمتر واقعی و طبیعی است، تنها چیزی که به نفع آن است اکوسیستم متا است. بیش از سه میلیارد نفر در سراسر جهان هر روز حداقل از یکی از محصولات اصلی متا استفاده می کنند. MetaAI بیش از 400 میلیون کاربر فعال ماهانه دارد و واقعاً فقط در ایالات متحده در دسترس است.
نسخه مبتنی بر متن در همه محصولات اصلی موجود است و چه در واتس اپ، اینستاگرام، فیس بوک یا مسنجر باز کنید، یکسان به نظر می رسد. در حال حاضر، می توانید تصاویر تولید کنید، یک چت مبتنی بر متن داشته باشید و حتی با استفاده از آن بازی کنید. با صدا، می توانید آن را روی میز بگذارید و در حین انجام کارهای دیگر چت کنید.
MetaAI اکنون از Llama 3.2 90b به عنوان “مغز” خود استفاده می کند. این یک مدل چند وجهی جدید از متا است که می تواند هم تصاویر و هم متن را تجزیه و تحلیل کند. این احتمال وجود دارد که نسخههای آینده بتوانند با صدا، اسناد و حتی ویدیوی بیشتری کار کنند – اگر مدلهای OpenAI با پیشرفت آن همگام باشند.
این بدان معناست که میتوانید با ضربه زدن یک دکمه در هر برنامهای که روزانه استفاده میکنید، با هوش مصنوعی صحبت کنید. میتوانید عکسی را که به تازگی گرفتهاید به او بدهید، از او جزئیات عکس را بخواهید، یا از او بخواهید که جنبهای از تصویر را تغییر دهد، مانند حذف یک سطل زباله زشت.
قدرت واقعی MetaAI Voice را کسانی که از عینک هوشمند Ray-Ban یا هدفون Quest استفاده می کنند احساس می کنند. این دستگاهها میتوانند جهان را آنگونه که شما میبینید ببینند و به شما این امکان را میدهند که در زمان واقعی درباره هر چیزی که میبینید با هوش مصنوعی صحبت کنید.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران