ChatGPT Voice ممکن است داستان سرایی را برای همیشه تغییر دهد. ویدیوی جدید ایجاد صدای شخصیت های خاص را نشان می دهد
هر ویدیوی جدیدی که قابلیتهای ChatGPT Voice را نشان میدهد، من را هیجانزدهتر میکند تا خودم آن را امتحان کنم، و جدیدترین آنها از این قاعده مستثنی نیست. در اینجا می بینیم که هوش مصنوعی تعدادی از صداهای شخصیت های مختلف را بر اساس یک فرمان صوتی ساده اتخاذ می کند. این برای داستان سرایی عالی است.
مشخص نیست نسخه بعدی ChatGPT Voice که با نام Omni Voice نیز شناخته میشود چه زمانی منتشر میشود، اما شایعات حاکی از آن است که اولین کاربران در اواخر تابستان به آن دسترسی خواهند داشت.
برخلاف نسخه فعلی ChatGPT Voice، این مدل جدید با استفاده از GPT-4o ساخته شده است و به صورت بومی گفتار به گفتار است، به این معنی که لازم نیست ابتدا آنچه را که میگویید به متن رونویسی کند.
این روش صدای طبیعی به مدل این امکان را می دهد که صداهای مختلف ایجاد کند، احساسات را بیان کند و حتی هنگام صحبت کردن، نشانه هایی از احساسات را در صدای شما تشخیص دهد.
نسخه ی نمایشی جدید ChatGPT چه چیزی را نشان می دهد؟
OpenAI به آرامی در حال کشف بسیاری از قابلیت های پنهان در حالت صوتی جدید GPT-4o است. تا کنون ما او را دیدهایم که مکالمات را به صورت بلادرنگ ترجمه میکند، در انجام تکالیف کمک میکند و حتی در یک کنفرانس فناوری فرانسوی به مخاطبان سلام میدهد.
آخرین نسخه نمایشی با ارائه دستورالعملهایی به ربات چت هوش مصنوعی توسط یکی از کارکنان OpenAI باز میشود. او به هوش مصنوعی می گوید که در حال نوشتن یک داستان است و می خواهد چند صدا را برای شخصیت های مختلف تمرین کند. یکی از آنها شیر است و ChatGPT صدای خشن و باشکوهی تولید می کند.
ChatGPT کار بسیار خوبی با شیر انجام می دهد و سپس می تواند به سرعت به شخصیت دوم بپرد، یعنی “موش مخفیانه به داخل غار”.
چیزی که واقعاً جالب بود این بود که او هوش مصنوعی صدا را تغییر داد و به آن گفت: «کمی جیرجیرتر، بیشتر شبیه یک موش کوچک».
او بعداً شخصیتهای دیگری مانند جغدی که به نظر عاقل به نظر میرسید، شیر را نصیحت میکرد و شخصیتی شیطانی با خندههای شیطانی به آن اضافه کرد. ChatGPT خنده ای دیوانه وار کرد! او مجموعه ای گرد از شخصیت ها را برای استفاده در داستان ایجاد کرد.
به طور کلی، این کار بسیار عالی بود و به ما ایده میدهد که چگونه ChatGPT میتواند به طور بالقوه برای بازی به عنوان استاد سیاه چال در یک بازی D&D یا جایگزینی کتابهای صوتی با داستانهای تعاملی سفارشی ساخته شده در پرواز استفاده شود.
چه زمانی ChatGPT Voice در دسترس خواهد بود؟
OpenAI روشن می کند که “قابلیت های صوتی و تصویری جدید با GPT-4o در هفته های آینده در دسترس خواهد بود”، اگرچه حالت صوتی در برنامه ChatGPT در حال حاضر برای همه کاربران در دسترس است.
برخی از کاربران شروع به فراخوانی حالت جدید Omni Voice یا صدای GPT-4o کردند. ویژگی های نشان داده شده در ویدیوی جدید فقط با صدا و تصویر GPT-4o در دسترس است. برخی از کاربران طی چند ماه آینده دسترسی خواهند داشت.
وقتی وارد اپلیکیشن آیفون یا اندروید می شوید و وارد حالت صدا می شوید، می توانید با کلیک بر روی نماد (i) در سمت راست بالا، ببینید از کدام نسخه استفاده می کنید. اگر از نسخه فعلی استفاده می کنید، ChatGPT Voice جدید باید بگوید “به زودی خواهد آمد”.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide