OpenAI هنگامی که ChatGPT-4o را در اوایل این هفته به جهان معرفی کرد، همه چشم ها را به آن معطوف کرد، و در حالی که برخی از ویژگی های آن هنوز در حال عرضه هستند، ما مطمئناً تا کنون تحت تأثیر قرار گرفته ایم.
GPT-4o (“O” مخفف “Omni”) تغییر بزرگی در ربات چت ایجاد می کند و صدایی طبیعی با احساسات تقریباً واقعی در پشت آن اضافه می کند. و اکنون یک شرکت هوش مصنوعی دیگر نشان داده است که چگونه می توان از حالت صوتی مدل GPT-4o برای ترکیب یک انسان دیجیتال استفاده کرد.
به x برده شودویکتور ریپاربلی، یکی از بنیانگذاران موتور ویدئویی AI Synthesia گفت: حالت صوتی GPT-4o واقعاً چشمگیر است.
او با اشاره به اهمیت پلتفرمهای تماس ویدیویی مانند: سنتی، افزود: «ما با آخرین مدل آواتار خود به آن نشان دادیم وقتی همدلی مهم است (مراقبتهای بهداشتی، مربیگری، آموزش). تماس های فقط صوتی بزرگنمایی کنید.
قرار دادن چهره به یک LLM
ما قبلاً Synthesia را پوشش دادهایم که یک آواتار کاربر ایجاد میکند که بیش از کمی آزاردهنده است.
در مثال ریپاربلی، Synthesia زنی با پیراهن قرمز ایجاد میکند که به خوبی با آنچه حالت صدای ChatGPT-4o میگوید، همگامسازی میکند.
هنگامی که نسخه نمایشی در اتاق حرکت می کند، ویدئو در یک نقطه قطع می شود، بنابراین تشخیص اینکه آیا آواتار هوش مصنوعی با نگاه کردن به اطراف اتاق او را همراهی می کند یا خیر، دشوار است، اما او در حین تعجب یک ژست مرتب “شبه سر” انجام می دهد. به مدل توضیح می دهد که دمو برای به نمایش گذاشتن توانایی های او است.
اگر میخواهید GPT-4o را بررسی کنید، اکنون در دسترس است. نحوه دسترسی در زیر توضیح داده شده است. اما اگر OpenAI هنوز شما را به لیست اضافه نکرده است، آماده صبر باشید.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران