ElevenLabs هوش مصنوعی مکالمه جدیدی را معرفی می کند. این به اندازه چت کردن با یک نفر طبیعی است.
صدا آینده تعامل انسان و کامپیوتر است. اخیراً چند بار این را گفتهام، و شرکت صدای هوش مصنوعی ElevenLabs محصول جدیدی دارد که قدرت گفتار را در انجام کارها بیشتر برجسته میکند.
سیستم هوش مصنوعی ElevenLabs یک ربات صوتی است. درست مثل تماس گرفتن با یک نفر است که طوری تنظیم شده است که احساس کنید در حال برقراری تماس تلفنی و گفتگو با او هستید.
کاملا قابل تنظیم؛ این امکان را به شما می دهد تا صدای مورد استفاده خود را انتخاب، طراحی و حتی کپی کنید. شما همچنین می توانید پایگاه دانش خود را اضافه کنید. به عنوان مثال، اگر معلم ریاضی هستید، ممکن است دسترسی به راهنماهای آمادگی SAT را در نظر بگیرید.
مفیدترین جنبه این است که بتوانید مدل مغز یا زبان زیرین را تنظیم کنید. شما می توانید بین هر مدل OpenAI، Google یا Anthropic یکی را انتخاب کنید، یا حتی اگر شرکتی را اداره می کنید، مدل سفارشی خود را اضافه کنید.
هوش مصنوعی محاوره ای چگونه کار می کند؟
هوش مصنوعی مکالمه ای اینجاست. عوامل هوش مصنوعی مکالمه را در چند دقیقه با تاخیر کم، پیکربندی کامل و مقیاس پذیری یکپارچه بسازید. pic.twitter.com/JqBlwVczdX3 دسامبر 2024
برخلاف ChatGPT Advanced Voice، این حالت گفتار به گفتار بومی نیست. این مانند صوتی Gemini Live یا MetaAI کار می کند. شما صحبت می کنید، آن را به متن تبدیل می کند و به هوش مصنوعی می فرستد. هوش مصنوعی به صورت متن پاسخ می دهد و ElevenLabs آن را با استفاده از مدل های صوتی موجود صدا می کند. این به قدری سریع اتفاق می افتد که می تواند از گفتار به گفتار دیگر اتفاق بیفتد.
برای انجام این کار، مهندسان ElevenLabs مجبور شدند یک مدل گفتار به متن سفارشی جدید ایجاد کنند که بتواند کلمات کاربر را آنقدر سریع که نامحسوس بود رونویسی کند و سپس همه آنها را به طور یکپارچه با هم کار کنند.
ElevenLabs به طور مستقیم با ارائه API بلادرنگ OpenAI با هوش مصنوعی مکالمه رقابت می کند. آنها سیستم های مدلی هستند که برای تسهیل ارائه تعامل صوتی با محصولات برای یک شرکت یا سازمان طراحی شده اند. این می تواند در مرکز تماس برقراری تماس های تلفنی یا چیزی کمتر واضح مانند محصولات یادگیری باشد.
یک نمونه استفاده از اسباببازی کودکان است که در آن مدل برای ارائه پشتیبانی و بازخورد به شیوهای مناسب برای سن آموزش دیده است.
یک دستیار صوتی ایجاد کنید
هر کسی که یک حساب ElevenLabs داشته باشد می تواند یک نماینده مکالمه ایجاد کند. دارای چهار قالب پیش فرض است که کاملاً قابل تنظیم هستند.
یکی نماینده پشتیبانی به نام اریک است که برای حل مسائل طراحی شده است، دیگری ماتیلدا، معلم ریاضی، و سومی راهنمای سفر با اطلاعات بسیاری از نقاط جهان به نام جورج است. چهارمی یک جادوگر بازی ویدیویی با صدای مرموز است.
شما همچنین می توانید اینها را از ابتدا ایجاد کنید، و من این را با یک مربی زندگی امتحان کردم که دسترسی به ابزارهای مربیگری رایج مانند ردیابی عادت و تعیین هدف را فراهم کرد. به دلیل سرعت و قیمت از فلاش Gemini 1.5 استفاده می کند.
هزینه تماس با نماینده 500 اعتبار در دقیقه در طول توسعه است. طرح شروع به شما 30000 اعتبار برای 4 دلار در ماه می دهد.
به طور کلی، نصب یک فرآیند ساده است. انعطاف پذیری زیادی در نحوه تنظیم این وجود دارد و تکرارهای شما در نوار کناری حساب ElevenLabs شما ظاهر می شوند. همچنین می توانید شماره تلفن های Twilio را وارد کرده و آنها را به دستیار صوتی خود متصل کنید.
برای سرگرمی، یک نماینده پشتیبانی مشتری به نام رایان ایجاد کردم که از یک کپی از صدای خودم استفاده می کند. ببینم وقتی شماره تلفنی به پدرم می دهم متوجه می شود و به او می گویم شماره کار جدید من است و به او می گویم اگر به کمک فنی نیاز داشت تماس بگیرد.