من فقط با Deepseek گپ کردم – در اینجا نحوه ادغام صوتی جدید یازدهم را امتحان خواهید کرد
در یک همکاری پیشگام ، Elevenlabs با موفقیت پلت فرم پیشرفته گفتار هوش مصنوعی را با مدل R1 Deepseek ادغام کرد. اکنون ، به جای نوشتن درخواست های متن با Chatbot محبوب چینی ، به طور طبیعی می توانید با صدای انسانی مانند نماینده گپ بزنید.
این همجوشی نه تنها تعامل کاربر را افزایش می دهد ، بلکه تطبیق پذیری فناوری Elevenlabs را در تطبیق با مدلهای مختلف زبان بزرگ (LLMS) نشان می دهد.
پلت فرم AI گفتار Elevellabs
Elevenlabs یک پلت فرم گفتار -ART -ART را برای توزیع عوامل صوتی گفتار سفارشی و واقعی ایجاد کرد. انعطاف پذیری یک ویژگی مهم است که امکان ادغام بدون مشکل با LLM های مختلف را از طریق API های سازگار با OpenAI فراهم می کند. این سازگاری به آن اجازه می دهد تا از برنامه های مختلف از چکمه های خدمات مشتری گرفته تا معلمان آموزش و پرورش استفاده کند.
از آنجا که Deepseek اخیراً R1 را اعلام کرده است ، هوش مصنوعی به یک بازیگر مهم در صنعت تبدیل شده است. مشهور به دلیل قابلیت های استدلال فوق العاده خود در زمینه های پیچیده مانند ریاضیات و برنامه نویسی ، مدل R1 از رویکرد استدلال “زنجیره ای فکری” استفاده می کند که به آن اجازه می دهد تا گام به گام مشکلات پیچیده را پردازش و حل کند. با این حال ، هیچ رابط زبان طبیعی وجود ندارد که دسترسی به کاربران را محدود کند.
فرآیند ادغام
برای Voice Deepseek R1 ، Elevenlabs از Deepseek-R1-Distill-Qwen-32B ، نسخه مقطر R1 بر اساس QWEN2.5 استفاده کرد. این مدل برای پشتیبانی از تماس عملکردی انتخاب شد که یک ویژگی بسیار مهم برای عوامل گفتاری تعاملی است. فرآیند ادغام شامل چندین مرحله از جمله ایجاد عامل بود. در سکوی Elevenlabs ، یک عامل جدید هوش مصنوعی “Deepseeker” با استفاده از الگوی معلم ریاضی متولد شد. این الگوی عمدتاً به این دلیل انتخاب شده است که وی بر توانایی های استدلال در زمینه های ریاضی Deepseek تأکید می کرد.
Elevenlabs همچنین از پلت فرم هوش مصنوعی کارگران Cloudflare استفاده کرد. Deepseek-R1-Distill-Qwen-32B با API سازگار با OpenAI قابل دسترسی بود. سوئیچ های API و نقاط پایانی مورد نیاز بر روی پلت فرم Elevellabs برای ایجاد یک اتصال بدون وقفه پیکربندی شده است. درخواست سیستم برای افزایش وضوح کاربران با فعال کردن هوش مصنوعی برای بیان اعداد و معادلات به زبان طبیعی سفارشی شد.
برنامه ها و انتظارات آینده
این ادغام منجر به یک ابزار هوش مصنوعی با صدا می شود که می تواند کاربران را در یک گفتگوی طبیعی و گفتاری قرار دهد. من خودم آن را امتحان کردم و سؤالاتی پرسیدم ، “من سرگرم کننده بودم که فکر کنم و به سوالاتم پاسخ دهم.
با این حال ، فراتر از سخنرانی عمومی ، Chatbot در بخش های مختلف پتانسیل دارد. به عنوان مثال ، در یک سناریوی دوره ریاضی ، نماینده می تواند دانش آموزان را برای مشکلات پیچیده راهنمایی کند و هر مرحله را به روشنی و خلاصه بیان کند.
این ادغام موفق ، پتانسیل خود را برای ترکیب مدل های استدلال پیشرفته با رابط های زبان طبیعی تأکید می کند. با ادامه پیشرفت AI ، چنین همکاری هایی با باز کردن مسیر برنامه های هوش مصنوعی بصری و در دسترس ، شکاف بین مدل های محاسبه پیچیده و تعامل روزانه کاربر را پر می کند.