Google I/O تمرکز خود را به هوش مصنوعی Gemini تبدیل میکند – آنچه ممکن است گوگل اعلام کند در اینجا آمده است:
گوگل در روز سهشنبه، 14 می، میزبان Google I/O 2024 خواهد بود و هوش مصنوعی در کانون توجه قرار خواهد گرفت، زیرا در طول رویداد سالانه توسعهدهندگان، بهروزرسانیهای جدید در سراسر دستگاههای تلفن همراه، خانگی و پوشیدنی وجود خواهد داشت.
Google Gemini، خانواده مدلهای هوش مصنوعی غول جستجوگر است که به طور فزایندهای در هر کاری که گوگل انجام میدهد، از جایگزینی Assistant در اندروید گرفته تا تقویت تجزیهوتحلیل در نتایج جستجو، جلو و محور است.
احتمالاً نسخه جدیدی از Gemini را در I/O خواهیم دید. ادغام بیشتر در محصولات بیشتر و همچنین ویژگیهای چند وجهی که به چت ربات Gemini توانایی دریافت گفتار، کد، موسیقی و ویدیو را برای اولین بار میدهد، به وجود خواهد آمد. . (شما می توانید با راهنمای ما در مورد نحوه پخش جریانی سخنرانی اصلی Google I/O، متوجه شوید که گوگل چه چیزی را برای خود اعلام کرده است.)
شایعات حاکی از آن است که ممکن است Gemini برخی از ویژگیهای برجستهتر OpenAI ChatGPT از جمله حافظه پایدار در تمام مکالمات را بپذیرد. با این حال، گوگل مجبور خواهد شد تا با معرفی OpenAI مدل جدید GPT-4o خود با دستیار صوتی داخلی و ویژگیهای بینایی، عقب نشینی کند.
از مدل های جمینی چه انتظاری می توان داشت؟
گوگل دوست دارد مردم را گیج کند. یا حداقل گاهی اوقات چنین احساسی دارد. نام Gemini برای مدلهای زبان بزرگ زیربنایی، جایگزینی Assistant در اندروید، ربات چت و تکمیل خودکار هوش مصنوعی در فضای کاری اعمال میشود.
برای گیج شدن بیشتر، سه نسخه از Gemini وجود دارد. اولین مورد Nano است که روی تلفنها و دستگاههای کوچک کار میکند، Pro که در فضای ابری اجرا میشود و Assistant را تقویت میکند و نسخه رایگان چتبات Gemini است. Ultra قدرتمندترین مدل حداقل روی کاغذ است و Gemini Advanced را با 20 دلار در ماه نیرو می دهد.
اوایل سال جاری، گوگل Gemini Pro 1.5 را معرفی کرد. این یک ارتقای بزرگ نسبت به نسل قبلی Gemini بود، زیرا بینش بهتر، ورودی موسیقی و ویدیو و یک پنجره بزرگ میلیونی سکه را اضافه کرد. این مقدار داده ای است که می تواند از یک مکالمه ذخیره و ارجاع دهد.
Gemini Pro 1.5 هنوز فقط برای توسعه دهندگان و محققان در دسترس است. اگرچه منطق Gemini Ultra را ندارد، اما از بسیاری جهات قوی تر است.
من گمان میکنم که در Google I/O تا حدودی شاهد اصلاح این وضعیت باشیم، و هر یک از مدلهای رایگان خانواده نسخه 1.5 ارتقا یافته است. ربات چت جمینی و دستیار اندروید نیز احتمالا در دسترس خواهند بود.
ویژگی های هوش مصنوعی جدید در Google I/O
یک روز تا #GoogleIO باقی مانده است! ما احساس می کنیم 🤩 . برای آخرین اخبار در مورد هوش مصنوعی، جستجو و موارد دیگر فردا شما را می بینیم. pic.twitter.com/QiS1G8GBf913 مه 2024
گوگل قبلاً نسخه جدیدی از Gemini را معرفی کرده است که از دستیار صوتی و ویژگی های ویدیویی گوگل برای توضیح آنچه در دید دوربین شما اتفاق می افتد و ارائه کمک استفاده می کند. منتظر شنیدن بیشتر در مورد این ویژگی هستیم.
Gemini می تواند بسیار بیشتر از آنچه در حال حاضر از طریق چت یا رابط های صوتی امکان پذیر است انجام دهد. این شامل دریافت محتوای ویدیویی و موسیقی است. من گمان می کنم که هر دو برای افزودن این گزینه های ورودی جدید به I/O ارتقا داده می شوند.
من فکر می کنم ما همچنین شاهد ادغام با سایر محصولات و سرویس های Google خواهیم بود که ویژگی های هوش مصنوعی کارآمدتری را به Photos، Docs و Slides می آورد. اینها همچنین بیشتر با دستیار Gemini و ربات چت ادغام خواهند شد.
یکی از جنبه های مفید Gemini نسبت به ChatGPT یکپارچگی عمیق آن با اکوسیستم گوگل است. قابل دسترسی از طریق برنامه های افزودنی، این شامل دسترسی به جستجو، نقشه های پرواز، همه اسناد شما و البته YouTube است. حتی YouTube Music هم به این لیست برنامههای افزودنی میپیوندد. اما فقط در نسخه دستیار اندروید Gemini.
اگرچه بعید است، اما میتوانیم ببینیم که گوگل ارائهدهندگان شخص ثالث را به فهرست برنامههای افزودنی خود اضافه میکند. این عملکرد موجود در ChatGPT و Microsoft Copilot را منعکس می کند. اگر گوگل این را ادغام کند، میتوانیم شاهد دسترسی شرکتهایی مانند اوبر و کایاک به جمینی باشیم. به عنوان مثال، می توانید یک سفر را در Assistant برنامه ریزی کنید و همه رزروها را از داخل چت مدیریت کنید.
رقابت گوگل و هوش مصنوعی
دنیا از نظر هوش مصنوعی از متنی به صدا دیگر در حال حرکت است. این در هر آزمایشگاه هوش مصنوعی که روی راه حل های صوتی مصنوعی کار می کند دیده می شود.
ما همچنین از چت دور میشویم و وارد نمایندگیهایی میشویم که در آنها به هوش مصنوعی دستور میدهید تا به جای یک چت دوستانه، یک سری وظایف را از طرف شما انجام دهد.
این چیزی است که قبلاً از OpenAI دیدهایم. همچنین گفته می شود که اپل به این موضوع به عنوان رویکردی برای Siri 2.0 نگاه می کند که انتظار داریم ماه آینده در WWDC 2024 شاهد آن باشیم. و تا حدودی گوگل در حال ساخت نسخه هایی از این با دستیار Gemini در اندروید است.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide