OpenAI به کاربران رایگان ChatGPT نگاهی دزدکی به حالت صدای پیشرفته چشمگیر آن می دهد. این پیشنمایش محدود در جریان رویداد Dev Day این شرکت در سانفرانسیسکو تأیید شد و به غیر مشترکین نگاهی کوتاه به تفاوت آن با صدای پایه میدهد.
چیزی که Advanced Voice را از نسخه رایگان یا حتی Gemini Live جدید گوگل متمایز می کند، این است که یک ویژگی بومی مکالمه به گفتار است. این بدان معناست که به جای اینکه آنچه می گویید را به متن تبدیل کنید، آن متن را تجزیه و تحلیل کنید، و سپس آن را به عنوان گفتار برگردانید، می توانید به سادگی به آنچه می گویید گوش دهید و حتی تفاوت های ظریف در لحن صدا یا ویژگی های احساسی خود را درک کنید.
من گمان میکنم که در آینده، OpenAI خواهد توانست مدلهای پایه را بهبود بخشد و آنها را ارزانتر کند، و Advanced Audio را به طور گستردهتری در دسترس همه کاربران قرار دهد.
حتی محدودیتهایی در مورد میزان استفاده از Advanced Voice به عنوان مشترک ماهانه 20 دلاری ChatGPT Plus وجود دارد. با این حال، من بیش از یک ماه است که از آن به شدت استفاده می کنم و هنوز نتوانسته ام به آن محدودیت ها برسم.
چرا صدای پیشرفته اینقدر مهم است؟
از این هفته، Advanced Voice برای همه کاربران ChatGPT Enterprise، Edu و Team در سراسر جهان در دسترس است. کاربران رایگان همچنین نگاهی دزدکی به Advanced Voice.Plus و کاربران رایگان در اتحادیه اروپا خواهند داشت… ما قول می دهیم، شما را در جریان قرار خواهیم داد.1 اکتبر 2024
تا زمانی که واقعاً از آن استفاده نکنید، توضیح اینکه چرا Advanced Voice بسیار بهتر از Gemini Live یا صدای جدید AI متا است، دشوار است. Gemini Live بسیار چشمگیر است. مهندسان گوگل توانستهاند صداهای طبیعی را ضبط کنند و به شما اجازه دهند آنها را در زمان واقعی قطع کنید، اما فاقد این ویژگی خاص است.
مثلا داشتم به پسر سه ساله ام Advanced Voice را نشان می دادم و به او گفتم: “Hey ChatGPT، این پسر من است، او سه سال دارد و نامش تئودور است” و لحن صدا بلافاصله به نوع تغییر کرد. صدایی که هنگام صحبت با یک کودک خردسال از آن استفاده می کنید. او حتی مستقیماً او را مورد خطاب قرار می داد و می دانست که من یا او چه زمانی صحبت می کنیم.
یکی دیگر از ویژگی های چشمگیر این است که او لهجه خود را تغییر می دهد و سپس آن لهجه را در حافظه خود قفل می کند و هر بار به این روش صحبت می کند. این ممکن است شامل صحبت کردن او مانند یودا، یک دزد دریایی یا یک دزد دریایی یودا باشد!
همچنین به دلیل نگرانیهای امنیتی و نردههای محافظ تعبیهشده در مدل پایه، تواناییهای بالقوه مکالمه به گفتار بومی را بسیار اندک دیدیم. زمانی که بیت باکس یا خوانندگی را شروع می کند، به ندرت اجمالی از پتانسیل واقعی او می بینید. در آینده شاهد ظهور بیشتر این قابلیتها خواهیم بود، زیرا OpenAI راههایی را کشف میکند که امنیت را کمتر مشکل ساز میکند.
این اساساً راه طولانی برای گفتن این بود که اگر نسخه رایگان ChatGPT دارید و فقط نگاهی گذرا به Advanced Voice می اندازید، آن را امتحان کنید زیرا مانند اپل واچ، نمی دانید چقدر خوب یا مفید است. . تا زمانی که واقعاً از آن استفاده کنید.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران