کنفرانس توسعهدهندگان Google I/O 2024 روز سهشنبه با تعدادی از اعلامیههای مورد انتظار در مورد هوش مصنوعی، برنامهها و ابزارهای آینده آغاز شد.
واژه هوش مصنوعی تنها در روز افتتاحیه بیش از صد بار ذکر شد. اما جدا از همه هیاهوی Gemini، برخی اخبار ویدیویی و تصویری واقعاً جالب نیز منتشر شده است. آزمایشگاه های گوگلاین نوید خوبی برای آینده است.
به تاکید بر آینده توجه کنید. متأسفانه بهترین این «آزمایشها» در حال حاضر فقط بر اساس انتظار و دید قابل انجام است. در اینجا نحوه دسترسی به وسایل نقلیه فعال در حال حاضر و قرار گرفتن در لیست انتظار برای مدل هایی که هنوز عرضه نشده اند آمده است.
دسترسی به آشپزخانه تست هوش مصنوعی
در بالای لیست، VideoFX جدید گوگل قرار دارد، یک ویژگی تبدیل متن به ویدئو که جایگزینی برای Sora از OpenAI است. ابزار جدید مبتنی بر مدل Veo گوگل دیپ مایند است و به کاربر این امکان را میدهد تا کلیپهای ویدیویی با کیفیت 1080p به طول «بیش از یک دقیقه» بسازد.
کلیپهای ویدیویی در صفحه نمایشی Veo چشمگیر هستند و نوید برخی از ویژگیهای آینده عالی مانند پسوند کلیپ، ویدیو از تصویر ثابت و ویرایش ماسک را میدهند.
متأسفانه این شگفتی جدید هنوز در دسترس نیست، برای دسترسی به آن باید در لیست انتظار پروژه ثبت نام کنید.
مدل تبدیل متن به تصویر گوگل، Imagen 2، سه ماه پیش راه اندازی شد و این فناوری در حال حاضر در وب سایت ImageFX موجود است.
با این حال، روحهای ماجراجوی که میخواهند مدل جدید بهروزرسانیشده Imagen 3 را امتحان کنند، همچنان باید به لیست انتظار آزمایشکننده قابل اعتماد بپیوندند.
نتایج تصویر کنونی خوب است، اما مطمئناً چیزی برای گفتن در مورد پیشگام هوش مصنوعی نیست. ما امیدواریم که نسخه جدید پیشرفت قابل توجهی را ارائه دهد.
ساخت موسیقی با هوش مصنوعی
MusicFX این در دسامبر سال گذشته منتشر شد و در آن زمان تلاشی محکم برای تولید کننده موسیقی هوش مصنوعی بود.
اما پنج ماه معادل دو عمر هوش مصنوعی است، و این ابزار اکنون به طرز ناامیدکننده ای توسط تازه واردانی مانند Udio و Suno پیشی گرفته است. و احتمالاً با عرضه آتی ElevenLabs Music اوضاع بدتر خواهد شد.
با این حال، گوگل شجاعانه مبارزه می کند تا با ارتقاء به MusicFX در نمایشگاه I/O این هفته، مرتبط باقی بماند. حالت جدید DJ به شما امکان می دهد ژانرهای مختلف را در کنار دستور متن خود با استفاده از لغزنده ها برای تنظیم شدت هر کدام ترکیب کنید.
هنوز هیچ اکشن صوتی وجود ندارد، اما نتایج خوب هستند، اگرچه در مقایسه با پیچیدگی مجلل سرویسهایی مانند Udio، باز هم پایینتر هستند. خبر خوب این است که هر دو حالت DJ و Creator اکنون در دسترس هستند آشپزخانه تست هوش مصنوعی محل.
تلاش جسورانه در ارتباط
به طور کلی 12 ماه سخت برای گوگل بوده است. به طور فزاینده ای هوش مصنوعی شبیه غول پای صافی است که پشت میز آشپزخانه چرت می زند.
در حالی که این شرکت به آرامی برنامههای جدیدی را عرضه میکند، به نظر میرسد اکثر آنها تلاشی ناامیدکننده برای رسیدن به رقبای چابکتر و خلاقتر هستند.
در طول یک سخنرانی کلیدی در مورد قدرت Gemini 1.5 برای ارائه سرعت چند وجهی به NotebookLM، یک جمله کوچک در سمت راست پایین صفحه نمایش وجود داشت که میگوید «صوت از قبل رندر شده است». ظاهر خوبی برای سازندگان DeepMind نیست.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران