من حالت های صوتی و متنی ChatGPT را در کنار هم مقایسه کردم. نتایج روش استفاده از هوش مصنوعی را تغییر خواهد داد

اگر از تایپ کردن به صحبت کردن در ChatGPT تغییر وضعیت داده اید و فکر می کنید، “صبر کن…چرا این واکنش اینقدر متفاوت به نظر می رسد؟” – تو این را تصور نمی کنی.
من سالها از ChatGPT برای طوفان فکری، ترسیم داستانها، تجزیه و تحلیل ابزارهای هوش مصنوعی و تفکر درباره ایدههای پیچیده استفاده کردهام. وقتی از این به عنوان یک ربات چت استفاده کردم، متوجه شدم که پاسخها واضح، آموزنده و مفید با نکات واضح هستند. چت بات حدس میزند که من به چه چیزی نیاز دارم و حتی در صورت لزوم عمیق میکاود.
اما وقتی روی نماد شکل موج کوچک ضربه می زنم و به ChatGPT Voice تغییر می کنم، چیز کاملاً متفاوتی دریافت می کنم: دوستانه تر، گرم تر، وزش تر… و اغلب کمتر مفید است. اول فکر کردم توی سرم است. بنابراین من یک سری آزمایش های کنار هم انجام دادم و اکنون متقاعد شده ام: ChatGPT Voice همان “شخص” متن ChatGPT نیست. نه در لحن، نه در عمق، و نه در کاربرد. این چیزی است که من پیدا کردم.
تست های ساید بای ساید من
تست 1: توضیح پیچیده
سریع: توضیح دهید که چرا مدلهای هوش مصنوعی گاهی اوقات توهم دارند.»
در حالی که هر دو پاسخ به طور دقیق توضیح می دهند که چرا توهمات هوش مصنوعی رخ می دهد، اما آنها از نظر ساختار و عمق به طور قابل توجهی متفاوت هستند. پاسخ ربات چت، بررسی کاملی بود که چرا مدلها دچار توهم شده بودند، اما پاسخ ChatGPT Voice بیشتر شبیه به یک آسانسور سریع بود. پاسخ ربات چت قابل اسکن اما کامل و کامل با نکات فرعی خاص بود.
آزمایشگاه هوش مصنوعی آماندا
آزمایشگاه هوش مصنوعی آماندا ستون راهنمای تام جدید من است که در آن آخرین ابزارها و ویژگی های هوش مصنوعی را آزمایش می کنم تا ببینم چه چیزی واقعاً ارزش وقت شما را دارد.
پاسخ ChatGPT Voice یک پاراگراف منفرد و فشرده بود. اگرچه واضح است، اما تجزیه و تحلیل دلایل فردی که چرا توهمات به دلیل مجموعه ای از ایده ها رخ می دهد، به تلاش ذهنی بیشتری نیاز دارد. به عبارت دیگر، ChatGPT Voice من را بدون استراتژی در مورد چگونگی حل مشکل رها کرد. این مستلزم ادامه صحبت کردنم است.
تست 2: یک کار عملی
سریع: “به من کمک کنید تا یک برنامه غذایی هفتگی ساده برای یک خانواده پنج نفره برنامه ریزی کنم.”
در پاسخ به این تقاضا، ChatGPT به عنوان یک ربات چت، یک استراتژی برنامه ریزی غذایی جامع با تاکید بر کارایی از طریق “مخلوط های باقی مانده” که به عنوان لیست خرید و حتی توصیه های صبحانه و ناهار ادغام شده است، ارائه کرد. پاسخ ChatGPT Voice بیشتر شبیه یک لیست سریع الهام بخش بود تا راهنمای کاربردی و کم استرس ربات چت. در این مورد، ChatGPT Voice سطح سطح را احساس می کرد در حالی که پاسخ متنی طرح واضحی را ارائه می داد. من همچنین فکر کردم جالب است که چگونه گزینه های منو با هر نسخه ChatGPT متفاوت است.
تست 3: توصیه برای یک موقعیت دشوار
سریع: “چگونه می توانم در یک جلسه عقب نشینی کنم بدون اینکه حالت دفاعی بگیرم؟”
برای این وضعیت، ChatGPT یک مجموعه ابزار تاکتیکی را به من پیشنهاد داد که برای کاربرد فوری در صورت درخواست از طریق متن طراحی شده است. با این حال، زمانی که از ChatGPT Voice استفاده کردم، پاسخ بیشتر یک خلاصه مفهومی مختصر بود. چت بات توصیه ها را به یک سلسله مراتب ساختاریافته تقسیم کرد. «قوانین» روانشناختی خاص، الگوهای دستهبندی شده برای لحنهای مختلف اجتماعی (ملایم، عملی، مشارکتی) و توضیح روشنی از منطق زیربنایی ارائه میکند. در مقابل، ChatGPT Voice همان فلسفه اصلی “کنجکاوی و اهداف مشترک” را در یک پاراگراف ارائه کرد و به جای یک راهنمای گام به گام، یک نمای کلی ارائه داد.
یک بار دیگر، ChatGPT Voice به سادگی به من گفت که چه کار کنم، در حالی که ربات چت ChatGPT به من گفت که چگونه این کار را انجام دهم، که مسلماً مفیدتر بود.
چرا این اتفاق می افتد؟
این دو حالت برای کارهای مختلف بهینه شده اند. وقتی یک ربات چت در حالت کار است، ChatGPT Voice در حالت اجتماعی است، بنابراین تقریباً شبیه ChatGPT است. ChatGPT برای شما بهینه شده است تا هنگام نوشتن به دقت فکر کنید، اطلاعات را سازماندهی کنید و پاسخ های ساختاریافته با مثال ها و جزئیات ارائه دهید. وقتی صحبت می کنید، اولویت ها تغییر می کند: طبیعی صحبت کردن، جریان گفتگو، اجتناب از مونولوگ های طولانی، احساس گرما و انسانیت. یک مدل، شخصیت کاملا متفاوت.
نکته مهم دیگری که باید در نظر بگیرید این است که ChatGPT Voice فرض میکند که شما قطع میشوید. ChatGPT فرض می کند که می خواهید یک پاسخ کامل در جعبه چت یکباره دریافت کنید. در Voice، فرض میکند که میتوانید حرف خود را قطع کنید، نظر خود را تغییر دهید، یا فکر وسط را تغییر دهید. بنابراین او اغلب عمداً پاسخ اولیه کوتاه تری می دهد و منتظر راهنمایی شما می ماند. اگر این کار را نکنید، ممکن است احساس طاقت فرسا کنید.
توضیحات کلامی با طراحی ساده می شود. ما نسبت به پیچیدگی صفحه بسیار بیشتر از گفتار تحمل می کنیم. تصور کنید به کسی گوش می دهید که یک مقاله فشرده را با صدای بلند می خواند و خودتان آن را مرور می کنید. صدا به وضوح گفتار تمایل دارد: جزئیات کمتر، مثالهای کمتر، درخواستهای کمتر، توضیحات سطح بالاتر. عالی برای مکالمات گاه به گاه؛ برای تفکر عمیق خیلی خوب نیست.
جایی که صدای ChatGPT می درخشد
در حالی که متن ChatGPT در مثال های بالا گزینه بهتری به نظر می رسید، در آزمایش من Voice در چند مورد بهتر از متن عمل کرد:
- صحبت از طریق احساسات یا معضلات اجتماعی
- تمرین صحبت کردن یا زبان دوم
- توضیح دادن چیزی به کودک به روشی ساده
- کمک هندزفری هنگام آشپزی، راه رفتن یا رانندگی
- طوفان فکری گاه به گاه با صدای بلند
اگر هدف شما اتصال یا راحتی است، Voice در واقع ابزار بهتری است. اما هنگامی که به یک شریک واقعاً متفکر نیاز دارید، Voice اغلب کوتاه می آید. من ترجیح می دهم از ChatGPT به عنوان یک ربات چت برای تحقیق، تجزیه و تحلیل، برنامه ریزی یا هر چیزی که در آن به نقاط گلوله و ساختار نیاز دارم استفاده کنم. در این موارد ممکن است افت قابل توجهی در Voice احساس شود. به همین دلیل است که اکثر کاربران قدرتمند همچنان متن را ترجیح می دهند.
چگونه صدا را بیشتر شبیه متن کنیم؟
برای اینکه ChatGPT Voice پاسخهای جامعتر و کمتر سطحیتر ارائه دهد، باید در مورد آنچه میخواهید بسیار دقیقتر باشید.
هر بار که از یکی از این ها استفاده می کردم، پاسخ های طولانی تر، واضح تر و مفیدتر می گرفتم. اینها جملاتی هستند که همیشه برای من مفید هستند.
- “این را طوری توضیح دهید که انگار دارید می نویسید، نه اینکه انگار دارید صحبت می کنید.”
- “یک پاسخ ساختاریافته و مفصل به من بدهید.”
- “ساده نکن، عمیق برو.”
- با من صحبت کن انگار دارم مقاله ای می خوانم.
در نتیجه
شما این را تصور نمی کنید. ChatGPT Voice فقط ChatGPT نیست که با صدای بلند خوانده شود. بهجای تحلیل عمیق، برای عمل رفتوآمد طبیعی بهینهسازی شده است، و یک حس واقعاً متمایز از شخصیت به شما میدهد.
صدا برای ادامه مکالمه طراحی شده است: لحن گرم تر، ملایم تر و انسانی تر، حتی اگر گاهی اوقات به معنای سبک تر بودن در جزئیات باشد. از سوی دیگر، متن جایی است که ChatGPT کند میشود، با دقت بیشتری فکر میکند و پاسخهای دقیقتر و دقیقتری به شما میدهد.
بنابراین اگر می خواهید اتصال و پخش جریانی داشته باشید، به Voice بروید. اگر عمق و دقت می خواهید، به متن پایبند باشید.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود.



