صدای ChatGPT مرا دیوانه می کرد. این راه حل چیز بهتری به من داد

همه ما این را شنیده ایم. لحن بیش از حد مودبانه و تا حدودی توخالی صداهای داخلی ChatGPT. بعد از صدمین “هوش مصنوعی به عنوان یک مدل زبان” صدا به تنهایی روی اعصابم خرد شد. بنابراین من تلاش برای رفع اعلان را متوقف کردم و شروع به تعمیر صدا کردم.
اگر از من بپرسید صدای ChatGPT متوسط است. البته صداهای زیادی برای انتخاب وجود دارد، اما هیچ کدام از آنها خیلی طبیعی به نظر نمی رسد. در واقع، من آنها را آزاردهنده می دانم. این امر به ویژه در مقایسه با شخصیتهای مختلف Alexa+، از جمله شیرین، سرد، و جسور صادق است.
اگرچه ChatGPT یک صدا دارد، اما واقعا نمی توانید آن را کنترل کنید. میتوانید بین چند گزینه داخلی جابجا شوید، اما همین. نصب خاصی نداره بدون شبیه سازی صدا هیچ سفارشی سازی واقعی وجود ندارد.
ادامه مقاله در زیر
بنابراین من چیز متفاوتی را امتحان کردم. بهجای اینکه ChatGPT را به «معتبرتر»، «مستقیمتر» یا «متخصص» تغییر دهم، صدای آن را با هم تغییر دادم.
من از دستورات برای شکل دادن به نحوه صحبت آن استفاده کردم، سپس آن پاسخها را از طریق ElevenLabs، یکی از واقعیترین تولیدکنندههای صدای هوش مصنوعی موجود در حال حاضر، اجرا کردم تا ببینم آیا میتوانم آن را مانند یک دستیار کاملا متفاوت احساس کنم.
ایده: تجربه را به نصف تقسیم کنید
برای واضح بودن، من در واقع صدای زنده داخلی ChatGPT را تغییر ندادم. اما کاری که من انجام دادم این بود که تجربه را به دو لایه تقسیم کردم:
لایه 1: “زندگی” (ChatGPT) – بررسی کنید که چگونه صحبت می کنید
لایه 2: “صوتی” (ElevenLabs) – بررسی کنید که چگونه به نظر می رسد
بنابراین من از مغز ChatGPT استفاده کردم، شخصیتی جدید و صدایی کاملا متفاوت به آن دادم. سپس پاسخها را بهعنوان خلاصه مقاله، بررسی، نکات گفتگو برای مصاحبه یا اخبار دانلود میکنم.
این صدای زنده ChatGPT را تغییر نمی دهد. این هک پاسخ مکتوب ChatGPT را می گیرد و از بسیاری از صداهای موجود در ElevenLabs استفاده می کند. به این موضوع فکر کنید: من فیلمنامه را بازنویسی نکردم، بازیگر را بازسازی کردم.
نصب به طرز شگفت آوری ساده است:
- درخواست پاسخ از ChatGPT
- با استفاده از یک دستور دقیق، لحن را شکل دهید
- خروجی کپی
- در Eleven Labs قرار دهید
- با استفاده از صدای متفاوت صدا ایجاد کنید
- همان کلمات، تحویل کاملا متفاوت
وقتی برای اولین بار آن را بازی کردم دیگر شبیه ChatGPT نبود. صدا گرم تر بود. طبیعی تر و کمتر شبیه دستیار رباتیک. بیشتر از صدا تغییر کرد. نحوه واکنش واقعاً احساس را تغییر داد.
بنابراین من چندین “نسخه” مختلف ChatGPT را آزمایش کردم
من چند ترکیب مختلف را امتحان کردم تا ببینم این تا کجا می تواند پیش برود. لحن تخصصی سریع و کمی طعنه آمیز را با صدایی پرانرژی، سبک توضیحی آرام و اطمینان بخش با راوی گرم و لحن معمولی و محاوره ای با صدایی انسانی تر و معیوب تر ترکیب کردم.
هر نسخه مانند دستیار کاملا متفاوتی بود. چیزی که من را بیشتر متعجب کرد این بود که چگونه یک پاسخ می تواند قابل اعتماد تر، جذاب تر، یا بسیار کمتر رباتیک باشد، بسته به صدایی که آن را می دهد.
چه چیزی در واقع کار کرد (و چه چیزی نشد)
چیزی که کار می کرد این بود که در مورد لحن ChatGPT بسیار خاص باشید، آن لحن را با صدای مناسب در ElevenLabs تطبیق دهید، و پاسخ ها را کوتاه تر نگه دارید تا در هنگام پخش طبیعی تر به نظر برسند.
چیزی که کار نمی کرد تکیه بر دستورات مبهم مانند “بهتر کردن صدا” بود، انتظار داشت که مانند یک مکالمه بی درنگ کار کند، یا بسته به برنامه رایگان برای استفاده سنگین. شما خیلی سریعتر از آنچه فکر می کنید به محدودیت ها خواهید رسید.
چگونه به ChatGPT صدای جدیدی بدهیم؟
اگر می خواهید این را آزمایش کنید، ساده ترین راه برای انجام آن در اینجا آمده است:
مرحله 1: با یک اعلان قوی شروع کنید: فقط به دنبال پاسخ نباشید. لحن را هدایت کنید برای این آزمایش، یک مقاله سفید در مورد بازاریابی برای هزاره ها آپلود کردم. از آنجا دقیقاً پرسیدم که می خواهم متن چگونه باشد:
مانند یک متخصص تند صحبت و کمی طعنه آمیز آن را توضیح دهید. لحن گفتگو را حفظ کنید، از عبارات شرکتی اجتناب کنید و از جملات کوتاه استفاده کنید.
برای دریافت ایده ای از صدایی که تغییر می دهید، می توانید از ChatGPT بخواهید که پاسخ را با اعلان “این را با صدای بلند بخوانید” بخواند.
مرحله 2: پاسخ را کپی کرده و در ElevenLabs قرار دهید: به ElevenLabs بروید و وارد شوید. دریافت یک حساب کاربری رایگان است. متن را چسبانده و با صداهای موجود در پانل سمت راست آزمایش کنید. وقتی کسی را پیدا کردید که دوست دارید، از او بخواهید متن شما را بخواند.
یک صدا را انتخاب کنید. می توانید آخرین نسل را از اینجا دانلود کرده و در Soundcloud یا پلتفرم مشابه آپلود کنید.
در نتیجه
اگر از صدای ChatGPT خسته شده اید یا خسته شده اید، توصیه می کنم آن را امتحان کنید. به سادگی یک پاسخ ChatGPT بگیرید و با صداهای کاملاً متفاوت به آن گوش دهید. به این ترتیب، وقتی آن را بازی میکنید، در واقع میتوانید اطلاعات را به جای هول کردن، جذب کنید.
صداهای مختلف زیادی برای آزمایش وجود دارد (حتی می توانید صدای خود را آپلود کنید!). برای من، این تجربه به طور کامل نحوه استفاده از صدای هوش مصنوعی را تغییر داد. لحن مطمئن همراه با صدایی پرانرژی احساسی قدرتمند و جذاب می دهد، در حالی که لحن آرام با صدای گرم جلوه ای مطمئن تر و آرامش بخش ایجاد می کند.
این اصل این هک صوتی دو لایه هوش مصنوعی است: ChatGPT نحوه صحبت کردن شما را کنترل می کند، در حالی که ElevenLabs نحوه صدای شما را کنترل می کند. آنها به تنهایی مفید هستند، اما با هم چیزی را ایجاد می کنند که تجربه ای کاملا متفاوت به نظر می رسد. آن را امتحان کنید و نظر خود را در نظرات به من بگویید.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.



