اگر فکر می کنید نسخه ی نمایشی OpenAI ChatGPT Voice چشمگیر است، این را تماشا کنید!

پروین میرمیران15 می 2024آخرین به روز رسانی: 15 می 2024

0 2,657 خواندن این مطلب 1 دقیقه زمان میبرد

OpenAI هنگامی که ChatGPT-4o را در اوایل این هفته به جهان معرفی کرد، همه چشم ها را به آن معطوف کرد، و در حالی که برخی از ویژگی های آن هنوز در حال عرضه هستند، ما مطمئناً تا کنون تحت تأثیر قرار گرفته ایم.

GPT-4o (“O” مخفف “Omni”) تغییر بزرگی در ربات چت ایجاد می کند و صدایی طبیعی با احساسات تقریباً واقعی در پشت آن اضافه می کند. و اکنون یک شرکت هوش مصنوعی دیگر نشان داده است که چگونه می توان از حالت صوتی مدل GPT-4o برای ترکیب یک انسان دیجیتال استفاده کرد.

به x برده شودویکتور ریپاربلی، یکی از بنیانگذاران موتور ویدئویی AI Synthesia گفت: حالت صوتی GPT-4o واقعاً چشمگیر است.

او با اشاره به اهمیت پلتفرم‌های تماس ویدیویی مانند: سنتی، افزود: «ما با آخرین مدل آواتار خود به آن نشان دادیم وقتی همدلی مهم است (مراقبت‌های بهداشتی، مربیگری، آموزش). تماس های فقط صوتی بزرگنمایی کنید.

قرار دادن چهره به یک LLM

ما قبلاً Synthesia را پوشش داده‌ایم که یک آواتار کاربر ایجاد می‌کند که بیش از کمی آزاردهنده است.

در مثال ریپاربلی، Synthesia زنی با پیراهن قرمز ایجاد می‌کند که به خوبی با آنچه حالت صدای ChatGPT-4o می‌گوید، همگام‌سازی می‌کند.

هنگامی که نسخه نمایشی در اتاق حرکت می کند، ویدئو در یک نقطه قطع می شود، بنابراین تشخیص اینکه آیا آواتار هوش مصنوعی با نگاه کردن به اطراف اتاق او را همراهی می کند یا خیر، دشوار است، اما او در حین تعجب یک ژست مرتب “شبه سر” انجام می دهد. به مدل توضیح می دهد که دمو برای به نمایش گذاشتن توانایی های او است.

اگر می‌خواهید GPT-4o را بررسی کنید، اکنون در دسترس است. نحوه دسترسی در زیر توضیح داده شده است. اما اگر OpenAI هنوز شما را به لیست اضافه نکرده است، آماده صبر باشید.