تنها چند هفته پس از اینکه ElevenLabs موتور صوتی هوش مصنوعی خود را راهاندازی کرد که به شما امکان میدهد با استفاده از دستورات متنی صدا ایجاد کنید، هوش مصنوعی Hume اکنون مجموعهای از رباتهای صوتی هوش مصنوعی را در یک مجموعه برنامه با کاربری آسان ارائه میدهد که میتوانید از وب استفاده کنید. اسکنر
این برنامه از مدل زبان محاوره ای خود شرکت، EVI 2، با LLM های اضافی از جمله Claude 3.5 Haiku از Anthropic استفاده می کند و به عنوان رقیب مدل ChatGPT Enhanced Voice (که به تازگی در مک وارد شده است) عمل می کند قرار داده شده است. و ویندوز).
در حالی که من از اینکه شروع به کار چقدر ساده است تحت تأثیر قرار گرفتهام، قطعاً تا کنون تغییراتی در برخی از جنبههای برنامه وجود دارد.
من این را با برخی از اعلانهای رایج آزمایش کردم و متوجه شدم که برخی واقعاً چشمگیر بودند، در حالی که برخی دیگر کوتاهی کردند.
کار عملی با برنامه هوش مصنوعی Hume
معرفی برنامه جدید Hume با دستیارهای کاملاً جدید که صداها و شخصیتهای ایجاد شده توسط مدل زبان گفتاری ما EVI 2 را با LLMها و ابزارهای تکمیلی مانند Haiku جدید Claude 3.5 @AnthropicAI ترکیب میکنند. pic.twitter.com/Tej3f7mBFW4 نوامبر 2024
بخش سرگرم کننده برنامه هوش مصنوعی Hume این است که چندین صدا را تقسیم بندی می کند، که هر کدام لحن و سبک خاص خود را دارند تا احساس کنید که تصمیم دارید با “شخصیت های” مختلف برای موضوعات مختلف صحبت کنید.
برای مثال، یکی برای پاسخهای سریع و به سبک چتبات وجود دارد و دیگری بر توصیههای فلسفی تمرکز دارد. هر کدام به یک شکل عمل می کنند. شما کلیک میکنید و از طریق میکروفون صحبت میکنید، و اگر میخواهید آن را امتحان کنید، نیازی به حساب Hume نیست.
از ربات گفتگوی Quick Answers پرسیدم که ارتفاع برج ایفل چقدر است و پاسخی سریع دریافت کردم و به دنبال آن اطلاعات بیشتری در مورد نحوه اضافه شدن آن در طول زمان و بزرگی بخشهای خاصی از آن دریافت کردم.
من از Storytelling داستانی در مورد یک ماشین خواستم و انتظار نداشتم که یک حماسه رقیب Pixar باشد، اما ماشین چندین بار زمین خورد و تصادف کرد. او خطوط را تکرار کرد و حتی صدا را در یک نقطه تغییر داد، که بسیار ناخوشایند بود، اما خوشحال بود که سرنخهای بیشتری به دست آورد تا به جریان داستان کمک کند (متاسفانه داستان ماشینی به نام کارا که به دنبال منبع برق میگردد، این کار را انجام نمیدهد. به نظر می رسد به زودی هر جایزه ای برنده شود).
از سوی دیگر، بین برخی از صداها همپوشانی وجود دارد، و من آن را راهی خوب برای اذعان به اینکه واقعاً یک پاسخ درست وجود ندارد، یافتم.
از صدای معنویت پرسیدم که چگونه میتوانم بهتر در لحظه زندگی کنم، و این به من پیشنهاد کرد که نسیم را در موهایم احساس کنم، خورشید را روی پوستم احساس کنم و به طرز عجیبی یک انبه بخورم.
همین دستور در ربات Deeper Questions باعث شد قهوه صبحم را بو کنم و بنا به دلایلی نور خورشید به میز برخورد کند. جالب اینجاست که ربات Deeper Questions مدام برخی از خطوط دیالوگ مانند Storytelling را تکرار می کرد.
من مطمئناً کنجکاو هستم که ببینم اوضاع از اینجا چگونه گسترش مییابد، و فکر میکنم هیوم پایه محکمی دارد که اگر بتواند این مشکلات کوچک رویش را حل کند، باید روی آن بنا شود.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide
نظرات کاربران