ElevenLabs AI Reader میتواند هر متنی را به صدا تبدیل کند — در اینجا نحوه کار آن آمده است
غول پیشرو هوش مصنوعی Eleven Labs با اپلیکیشن AI Reader خود، تولید تبدیل متن به گفتار را به سطح بعدی ارتقا داده است. این شرکت سال ها در این فضا پیشرو بوده است و از زمان معرفی سنتز گفتار پیشرفت چشمگیری داشته است. و اکنون، آخرین ویژگی آن، صداهای نمادین، انقلابی است.
برنامه Reader به عنوان یک ابزار همه کاره و قدرتمند تبدیل متن به گفتار در دسترس به زبان انگلیسی برای ساکنان ایالات متحده، کانادا و بریتانیا ظاهر شده است. اگر کاربر آیفون هستید، میتوانید بلافاصله برنامه را نصب کنید. برای کاربران اندروید، برای دسترسی زودهنگام باید به لیست انتظار بپیوندید.
ویژگی های پیشرفته و صداهای طبیعی آن را به انتخابی عالی برای کسانی که دارای اختلال بینایی هستند یا در خواندن مشکل دارند و هرکسی که ترجیح می دهد به جای خواندن متن گوش دهد، تبدیل کرده است. بیا شروع کنیم.
1. برنامه را دانلود کنید
به اپ استور برویددانلود ElevenLabs Reader و روی ایجاد حساب کلیک کنید. می توانید حساب خود را به صورت دستی ایجاد کنید یا با حساب Google یا Apple خود ادامه دهید.
2. صفحه اصلی را پیمایش کنید
پس از ورود مستقیماً به صفحه اصلی هدایت می شوید. روی دکمه پلاس کلیک کنید بالا سمت راست برای افزودن محتوا.
3. ورود متن
برنامه Reader به شما امکان می دهد به سه روش محتوا اضافه کنید. برای وارد کردن مستقیم متن، Write Text را انتخاب کنیدبا تایپ یا چسباندن برای تبدیل محتویات یک صفحه وب، برای وارد کردن URL، پیوند پیوند را انتخاب کنید. شما همچنین می توانید فایلی مانند این را آپلود کنید: روی Import File کلیک کنید.
4. کتابخانه صداها
کتابخانه از نظر صداهای موجود بسیار گسترده است. برای دسترسی، روی دکمه Sounds کلیک کنید.
این بخش طیفی از تمام سنین، گویش ها و حالات را ارائه می دهد. صداها بر اساس لحن صدا، مانند “خوشایند”، و بر اساس مناطقی که صدا مناسب ترین است، مانند “رسانه های اجتماعی” طبقه بندی می شوند.
و البته، کاربران اکنون می توانند متون خود را برای اسطوره های برنده جایزه اسکار، سر لارنس اولیویه، جیمز دین، برت رینولدز و دیگران آپلود کنند. ، جودی گارلند.
چه کاری می تواند انجام دهد؟
به اوزوال خوش آمدید
من می خواستم قابلیت های چشمگیر برنامه ElevenLabs Reader را به نمایش بگذارم یک پادکست تخیلی ایجاد کنید با الهام از یکی از پادکست های مورد علاقه من، به Nightvale خوش آمدید. این سریال به چشم انداز سورئال اوزواله می پردازد، جایی که هر آجر در جاده زرد راز جدیدی را آشکار می کند.
در هر اپیزود، رویدادهای مهم با پیچشهای غیرمنتظره، مانند حکم شورای مونچکین با مشت آهنین یا تلاش مترسک برای کسب حکمت در مسیری تاریک، بازسازی میشوند. من آن را انجام دادم ChatGPT 4 با اعلانو یک فیلمنامه جزئی به من داد تا روی آن کار کنم.
دوروتی گیل امضا میکند
اولین، با کلیک بر روی پخش کننده، Iconic Voice را انتخاب کنیدبه دنبال با کلیک بر روی دکمه پلاس این به طور خودکار صدا را به کتابخانه شما اضافه می کند.
من توانستم فیلمنامه را به صدایی واقع گرایانه ترسناک تبدیل کنم و دوروتی را با رئالیسم خیره کننده زنده کنم. صدای تولید شده توسط هوش مصنوعی به طرز چشمگیری لحن ها و تفاوت های ظریف جودی گارلند را به تصویر می کشد و باعث می شود پادکست شبیه یک درام رادیویی واقعی از دوران طلایی هالیوود باشد.
نتایج…
تماشا کردن
من از پیچیدگی صداگذاری کاملاً متحیر شدم. مکث ها و لحن های استادانه اجرا شده به روایت جان می بخشد و حسی از ریتم و درام را ارائه می دهد. چیزی که بیش از همه مرا تحت تأثیر قرار داد، استفاده او از نفس بود که ریتم طبیعی یک داستان نویس با تجربه را با دقت قابل توجهی تقلید می کرد.
به نظر می رسید که هر کلمه با دقت انتخاب شده و با نیت عمدی ارائه شده است. توانایی هوش مصنوعی برای تقلید از چنین تفاوت های ظریف واقعاً چشمگیر بود. ریتم صدا به طور طبیعی جریان داشت و بین جملات توصیفی طولانی تر و عبارات کوتاه تر تغییر می کرد. این تنوع به داستان گویی عمق می بخشید و من را از ابتدا تا انتها درگیر خود نگه می داشت.
من مشتاقانه منتظر تحولات بعدی ElevenLabs هستم. همانطور که هوش مصنوعی به یافتن صدای خود ادامه میدهد، آینده ارتباطات کاملاً واضح است و بسیار انسانی به نظر میرسد.
صداهای هوش مصنوعی انسان مانند اکنون به واقعیت تبدیل شده اند و تبدیل متن به گفتار به سرعت به یکی از مهم ترین ابزارهای هوش مصنوعی تبدیل شده است. این فناوری به سرعت در سراسر سیستم عامل ها در حال گسترش است. به عنوان مثال، Runway یک ابزار تبدیل متن به گفتار دارد که به کاربران خود اجازه می دهد چندین صدا ایجاد کنند. به طور مشابه، ChatGPT دارای ویژگی های صوتی یکپارچه است.
منبع: tomsguide