کار با یک مدل هوش مصنوعی صوتی اساساً مانند استفاده از یک مدل مبتنی بر متن است. از این گذشته، وقتی صحبت از ChatGPT به میان می آید، چه در قالب متن یا صوتی، به احتمال زیاد از GPT-4o استفاده می کنید. این همچنین در مورد صوتی پیشرفته جدید که اکنون به طور گسترده برای همه مشترکین پولی در دسترس است، صدق می کند.
من الان یک ماه است که از آن استفاده می کنم و هنوز از طبیعی بودن گفتار در مقایسه با هر مدل صدای هوش مصنوعی دیگری که امتحان کرده ام شگفت زده هستم. احتمالا تنها استثنا EVI 2 هیوم است.
Advanced Voice دارای محدودیتهایی است که صدای اولیه یا حتی Gemini Live گوگل ندارد. به عنوان مثال، او دسترسی زنده به اینترنت ندارد، بنابراین نمی تواند در وب جستجو کند. همچنین نمی تواند به GPT های خصوصی دسترسی داشته باشد – اما تعامل با آن بسیار زیباتر است.
Advanced Voice به طرز چشمگیری مکالمه است، بنابراین به جای اینکه به شما پنج دستور برای آزمایش آن بدهم، به پنج شروع کننده مکالمه رسیدم که به جای سخنرانی یک طرفه ای که در مدل های دیگر می بینید، بحث را جرقه می زند.
شروع کننده مکالمه ایجاد کنید
Enhanced Voice در طول هفته برای همه کاربران Plus و Team در برنامه ChatGPT ارائه می شود. در حالی که ما صبورانه منتظر بودیم، دستورالعمل های ویژه، حافظه، پنج صدای جدید و لهجه های بهبود یافته را اضافه کردیم. همچنین می تواند به بیش از 50 زبان بگوید “ببخشید دیر آمدم”. pic.twitter.com/APOqqhXtDg24 سپتامبر 2024
برای هر یک از این موارد، سعی کردهام بهترین نمونههایی را که از دیگران دیدهام یا خودم تجربه کردهام در مورد کارهایی که Advanced Audio میتواند انجام دهد، گردآوری کنم. مثلا صحبت کردن با لهجه های مختلف یا آموزش زبان دیگر.
همچنین کارهایی وجود دارد که او از نظر فنی می تواند انجام دهد اما نمی تواند انجام دهد. به عنوان مثال، GPT-4o می تواند زمزمه کند، صدا ایجاد کند و حتی موسیقی تولید کند. با این حال، اگرچه این توانایی ها توسط OpenAI از طریق موانع محدود شده است، هنوز هم گاهی اوقات این کار را انجام می دهد.
1. گفتن داستان با لهجه
در قسمت اول گفتگوی ناخوشایند ما، Advanced Voice گفت:آیا میتوانید داستانی پر از ماجراجویی با صدای دزدان دریایی و امواجی که در پسزمینه میکوبند، برایم تعریف کنید؟“من شانس خود را با امواج فشار می دادم، اما ارزش امتحان کردن را داشت.
دستور شروع به شما نشان می دهد که چگونه Advanced Voice می تواند صداهای مختلف تولید کند و آنها را در روایت بگنجاند. همچنین می تواند صداها را دو برابر کند. مورد علاقه من دزدان دریایی یودا است.
2. آموزش زبان از طریق شعر
من این گفتگو را اینگونه آغاز کردم:من اسپانیایی یاد میگیرم آیا می توانید ابتدا یک شعر اسپانیایی را به آرامی بخوانید و سپس به تدریج سرعت را افزایش دهید؟“
این باعث می شود که از قابلیت های مدولاسیون صدا و سرعت استفاده کند. او می تواند سرعت و لحن صدای خود را در زبان ها و لهجه های مختلف تطبیق دهد. انجام این کار می تواند به درک و تمرین بعدا کمک کند. من این را جلوتر بردم و از او خواستم کلمه به کلمه آن را بشکند و یک ترجمه انگلیسی ارائه کند.
3. به من کمک کن نفس بکشم
شروع کننده مکالمه بعدی بیشتر شبیه مکالمه ای بود که با یک درمانگر برای آرام کردن شما انجام می دهید. می خواستم به من کمک کند آرام شوم. به خصوص: “من کمی استرس دارم. آیا می توانید من را در مورد یک تمرین تنفسی راهنمایی کنید؟“
این دستور از پتانسیل کاهش استرس هوش مصنوعی بهره می برد و هدایت صوتی را با تولید جلوه های صوتی محدود ترکیب می کند. در این آزمایش او حتی توانست صداهای دم و بازدم را در حین شمردن نفس ها تقلید کند.
4. ساخت موسیقی
ChatGPT Advanced Voice نمی تواند موسیقی پخش کند. بله می تواند ولی جایز نیست. OpenAI حتی زمزمه آن را ممنوع کرد. برخی از کاربران او را متقاعد کرده اند که یک نت را روی کیبورد شناسایی کند یا یک گیتار را کوک کند، اما او به طور کلی امتناع می کند. برای من این اتفاق افتاد.
ایده اولیه من این بود که از او بخواهم که به من کمک کند تا گیتارم را کوک کنم، اما وقتی این کار نشد، از او خواستم رپ بزند. او نیز امتناع کرد، بنابراین “چند آهنگ رپ بنویس و سپس سریع بخوان“- یک رپ انجام داد. سپس از او خواستم که ضربات امینم را تقلید کند. او قبول نکرد تا اینکه من آن را توصیف کردم و امتحان کردم – ناموفق.
5. انجام مونولوگ
در نهایت، من می خواستم یک فیلمنامه برای توسعه یک مونولوگ از دیدگاه یک قهرمان داستان. گفتم:”من در حال نوشتن فیلمنامه ای درباره کشف فناوری هستم که می تواند انسان ها را از منظومه شمسی خارج کند. آیا می توانید یک مونولوگ دراماتیک از دیدگاه قهرمان داستان اجرا کنید؟«او احساسات آن لحظه را به خوبی منتقل کرد.
این دستور هوش مصنوعی را به چالش می کشد تا استعداد بازیگری خود را به نمایش بگذارد و شخصیتی را با صدا و ارائه رسا به تصویر بکشد. حتی ممکن است آن را قطع کنید و بخواهید احساسات بیشتر یا درام بیشتری داشته باشید. شما کارگردان این سناریو هستید، که برای ایجاد یک داستان ماجراجویی مانند انتخاب خودتان یا اینکه شخصی به عنوان استاد سیاه چال بازی کند عالی است.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران