Google Veo 3.1 اخیرا منتشر شد و در حال حاضر ارتقاء بهتری نسبت به Sora 2 است

این داستانی به قدمت زمان… یا حداقل به قدمت یکی دو سال گذشته است. گوگل در نبرد برای تبدیل شدن به برترین نیروگاه هوش مصنوعی در برابر OpenAI است. هر دو بهروزرسانیها، ویژگیها و ابزارهای چپ، راست و وسط را منتشر میکنند، اما رویکردهای آنها در حال حاضر نمیتواند متفاوتتر از این باشد.
OpenAI اخیراً مدل ویدیویی Sora 2 را منتشر کرده است. این اولین بهروزرسانی ویدیویی هوش مصنوعی این شرکت در بیش از یک سال بود و جای تعجب نیست که افزایش زیادی در ترافیک و کاربران ایجاد کرد.
با این حال، برخلاف برخی از رقبای خود، OpenAI تصمیم بحث برانگیزی گرفت تا استفاده از شخصیتهای واقعی و افراد مشهور در Sora 2 را مجاز کند. این باعث شده است که همه چیز از سم آلتمن (مدیر عامل OpenAI) به هر ویدیو چسبیده باشد تا افراد مشهور با موقعیتهای عجیب (و گاهی اوقات) هیجانانگیز مواجه شوند.
تماشا کنید
OpenAI از آن زمان بهروزرسانیای را منتشر کرده است که در آن بیان میکند که شخصیتهای عمومی باید برای استفاده از شباهت خود ثبت نام کنند. اما با شرکت نکردن در آن، متن فرعی را از دست می دادند.
سپس، اخیرا، OpenAI اعلام کرد که این شرکت به زودی محدودیتهای سنی را اعمال خواهد کرد و به افرادی که میتوانند ثابت کنند بالای 18 سال دارند، اجازه میدهد محتوای «شهوانی» را از طریق OpenAI ایجاد کنند.
به عبارت دیگر، OpenAI برای گروه بزرگی از مردم که میخواهند هوش مصنوعی بازتر باشد و نردههای محافظ کمتری داشته باشند، جذاب است. این شبیه به روشی است که گروک ایلان ماسک برای مدتی کار کرده است.
در حالی که ثابت شده است که این امر پایگاه کاربران شرکت را تقویت می کند، خطرات بیشتری نیز به همراه دارد. هر دو OpenAI و xAI (شرکتی که در پشت Grok قرار دارد) بر سر چنین رویکردی با مناقشه مواجه شدهاند و وقتی کاربران محتوای نامناسب را از طریق ابزارهای خود ایجاد میکنند، بیشترین تقصیر را به دوش میکشند.
رویکرد جوزا
با انتشار Veo 3.1، گوگل تعدادی تغییرات عمده را اعمال کرد، اما تقریباً همه آنها بر بهبود کیفیت و سرعت تمرکز داشتند.
پس همه اینها چه ربطی به جمینی دارد؟ با انتشار Veo 3.1، گوگل تعدادی تغییرات عمده را اعمال کرد، اما تقریباً همه آنها بر بهبود کیفیت و سرعت تمرکز داشتند.
با استفاده از Veo 3.1، میتوانید اشیا را از هر صحنه اضافه یا حذف کنید، یک ویدیو را قبل از پایان اصلی آن بکشید، بین دو فریم ثابت ایجاد کنید و ظاهر و احساس یک صحنه را با استفاده از تصاویر مرجع، اشیا و حالات هدایت کنید.
جمینی با بهبود کیفیت تصویر و صدا در ویدیوهای خود حتی فراتر رفته است. این شامل صدای پسزمینه غنیتر است و از نظر متنی به آنچه در حال وقوع است حساستر است.
در حالی که Sora 2 بهبودهای واضحی را در کیفیت به ارمغان می آورد (و بازتولید صدا را ارائه می دهد)، هنوز با بسیاری از مشکلات قابل توجه، به ویژه در مورد اشیاء پر زرق و برق در پس زمینه دست و پنجه نرم می کند.
Sora 2 شبیه به یک پلتفرم پخش ویدیو مانند Instagram Reels یا TikTok کار می کند. با انجام این کار، OpenAI قصد دارد ویدیوهای هوش مصنوعی را ویروسیتر و سریعتر کند.
از سوی دیگر، Gemini برای استفاده های کاربردی تر ساخته شده است. وقتی صحبت از نسلهای واقعی افراد میشود، بسیار محدودتر است و تصاویر ترسناک یا خطرناک را محدود میکند.
با بهروزرسانی 3.1، Veo در این زمینه از این هم فراتر رفته و بر بهبود کیفیت و میزان مشارکت کاربر در محصول نهایی تمرکز میکند.
به همین دلیل است که ما معتقدیم جمینی در حال حاضر پیشتاز هوش مصنوعی است و یکی از مواردی است که Sora 2 را عقب نگه می دارد. نظر خود را در نظرات زیر با ما در میان بگذارید.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود. فراموش نکنید که روی دکمه Follow کلیک کنید!
اطلاعات بیشتر از راهنمای تام
بازگشت به لپ تاپ



