Google I/O تمرکز خود را به هوش مصنوعی Gemini تبدیل می‌کند – آنچه ممکن است گوگل اعلام کند در اینجا آمده است:

پروین میرمیران14 می 2024آخرین به روز رسانی: 14 می 2024

0 2,658 خواندن این مطلب 3 دقیقه زمان میبرد

گوگل در روز سه‌شنبه، 14 می، میزبان Google I/O 2024 خواهد بود و هوش مصنوعی در کانون توجه قرار خواهد گرفت، زیرا در طول رویداد سالانه توسعه‌دهندگان، به‌روزرسانی‌های جدید در سراسر دستگاه‌های تلفن همراه، خانگی و پوشیدنی وجود خواهد داشت.

Google Gemini، خانواده مدل‌های هوش مصنوعی غول جستجوگر است که به طور فزاینده‌ای در هر کاری که گوگل انجام می‌دهد، از جایگزینی Assistant در اندروید گرفته تا تقویت تجزیه‌وتحلیل در نتایج جستجو، جلو و محور است.

احتمالاً نسخه جدیدی از Gemini را در I/O خواهیم دید. ادغام بیشتر در محصولات بیشتر و همچنین ویژگی‌های چند وجهی که به چت ربات Gemini توانایی دریافت گفتار، کد، موسیقی و ویدیو را برای اولین بار می‌دهد، به وجود خواهد آمد. . (شما می توانید با راهنمای ما در مورد نحوه پخش جریانی سخنرانی اصلی Google I/O، متوجه شوید که گوگل چه چیزی را برای خود اعلام کرده است.)

شایعات حاکی از آن است که ممکن است Gemini برخی از ویژگی‌های برجسته‌تر OpenAI ChatGPT از جمله حافظه پایدار در تمام مکالمات را بپذیرد. با این حال، گوگل مجبور خواهد شد تا با معرفی OpenAI مدل جدید GPT-4o خود با دستیار صوتی داخلی و ویژگی‌های بینایی، عقب نشینی کند.

از مدل های جمینی چه انتظاری می توان داشت؟

(اعتبار تصویر: گوگل)

گوگل دوست دارد مردم را گیج کند. یا حداقل گاهی اوقات چنین احساسی دارد. نام Gemini برای مدل‌های زبان بزرگ زیربنایی، جایگزینی Assistant در اندروید، ربات چت و تکمیل خودکار هوش مصنوعی در فضای کاری اعمال می‌شود.

برای گیج شدن بیشتر، سه نسخه از Gemini وجود دارد. اولین مورد Nano است که روی تلفن‌ها و دستگاه‌های کوچک کار می‌کند، Pro که در فضای ابری اجرا می‌شود و Assistant را تقویت می‌کند و نسخه رایگان چت‌بات Gemini است. Ultra قدرتمندترین مدل حداقل روی کاغذ است و Gemini Advanced را با 20 دلار در ماه نیرو می دهد.

اوایل سال جاری، گوگل Gemini Pro 1.5 را معرفی کرد. این یک ارتقای بزرگ نسبت به نسل قبلی Gemini بود، زیرا بینش بهتر، ورودی موسیقی و ویدیو و یک پنجره بزرگ میلیونی سکه را اضافه کرد. این مقدار داده ای است که می تواند از یک مکالمه ذخیره و ارجاع دهد.

Gemini Pro 1.5 هنوز فقط برای توسعه دهندگان و محققان در دسترس است. اگرچه منطق Gemini Ultra را ندارد، اما از بسیاری جهات قوی تر است.

من گمان می‌کنم که در Google I/O تا حدودی شاهد اصلاح این وضعیت باشیم، و هر یک از مدل‌های رایگان خانواده نسخه 1.5 ارتقا یافته است. ربات چت جمینی و دستیار اندروید نیز احتمالا در دسترس خواهند بود.

ویژگی های هوش مصنوعی جدید در Google I/O

یک روز تا #GoogleIO باقی مانده است! ما احساس می کنیم 🤩 . برای آخرین اخبار در مورد هوش مصنوعی، جستجو و موارد دیگر فردا شما را می بینیم. pic.twitter.com/QiS1G8GBf913 مه 2024

گوگل قبلاً نسخه جدیدی از Gemini را معرفی کرده است که از دستیار صوتی و ویژگی های ویدیویی گوگل برای توضیح آنچه در دید دوربین شما اتفاق می افتد و ارائه کمک استفاده می کند. منتظر شنیدن بیشتر در مورد این ویژگی هستیم.

Gemini می تواند بسیار بیشتر از آنچه در حال حاضر از طریق چت یا رابط های صوتی امکان پذیر است انجام دهد. این شامل دریافت محتوای ویدیویی و موسیقی است. من گمان می کنم که هر دو برای افزودن این گزینه های ورودی جدید به I/O ارتقا داده می شوند.

من فکر می کنم ما همچنین شاهد ادغام با سایر محصولات و سرویس های Google خواهیم بود که ویژگی های هوش مصنوعی کارآمدتری را به Photos، Docs و Slides می آورد. اینها همچنین بیشتر با دستیار Gemini و ربات چت ادغام خواهند شد.

یکی از جنبه های مفید Gemini نسبت به ChatGPT یکپارچگی عمیق آن با اکوسیستم گوگل است. قابل دسترسی از طریق برنامه های افزودنی، این شامل دسترسی به جستجو، نقشه های پرواز، همه اسناد شما و البته YouTube است. حتی YouTube Music هم به این لیست برنامه‌های افزودنی می‌پیوندد. اما فقط در نسخه دستیار اندروید Gemini.

اگرچه بعید است، اما می‌توانیم ببینیم که گوگل ارائه‌دهندگان شخص ثالث را به فهرست برنامه‌های افزودنی خود اضافه می‌کند. این عملکرد موجود در ChatGPT و Microsoft Copilot را منعکس می کند. اگر گوگل این را ادغام کند، می‌توانیم شاهد دسترسی شرکت‌هایی مانند اوبر و کایاک به جمینی باشیم. به عنوان مثال، می توانید یک سفر را در Assistant برنامه ریزی کنید و همه رزروها را از داخل چت مدیریت کنید.

رقابت گوگل و هوش مصنوعی

یک گوشی با آرم ChatGPT و یک لپ تاپ با آرم OpenAI

(اعتبار تصویر: Shutterstock)

دنیا از نظر هوش مصنوعی از متنی به صدا دیگر در حال حرکت است. این در هر آزمایشگاه هوش مصنوعی که روی راه حل های صوتی مصنوعی کار می کند دیده می شود.

ما همچنین از چت دور می‌شویم و وارد نمایندگی‌هایی می‌شویم که در آنها به هوش مصنوعی دستور می‌دهید تا به جای یک چت دوستانه، یک سری وظایف را از طرف شما انجام دهد.

این چیزی است که قبلاً از OpenAI دیده‌ایم. همچنین گفته می شود که اپل به این موضوع به عنوان رویکردی برای Siri 2.0 نگاه می کند که انتظار داریم ماه آینده در WWDC 2024 شاهد آن باشیم. و تا حدودی گوگل در حال ساخت نسخه هایی از این با دستیار Gemini در اندروید است.