معرفی Whisper Web — روشی جدید و رایگان برای رونویسی صدا
کسانی که به دنبال یک ابزار رونویسی عالی برای سرعت بخشیدن به گردش کار خود هستند، ممکن است بخواهند یک ابزار هوش مصنوعی جدید به نام Whisper Web را در نظر بگیرند. این سرویس که اساساً یک سرویس رونویسی درون مرورگر است، میتواند با وعده پردازش دقیق روی دستگاه، در وقت ما صرفهجویی کند.
تا اینجا خیلی قابل توجه نیست. اما اینجاست که هوش مصنوعی وارد عمل می شود. از آنجایی که این ابزار در زمینه یادگیری ماشینی آموزش دیده است، از رونویسی و ترجمه چند زبانه به 100 زبان مختلف پشتیبانی می کند. علاوه بر این، این فقط به یادداشتهای صوتی ضبطشده توسط خودتان محدود نمیشود. میتوانید یک URL وارد کنید یا یک فایل آپلود کنید تا Whisper Web در چند ثانیه رونویسی ایجاد کند.
این ابزار که هفته گذشته راه اندازی شد، به پلتفرم منبع باز هوش مصنوعی Hugging Face اضافه شده و اکنون برای استفاده در دسترس است. بنابراین طبیعتا آن را امتحان کردم.
در نهایت ممکن است: تشخیص گفتار در مرورگر در زمان واقعی با OpenAI Whisper! 🤯 این مدل به طور کامل بر روی دستگاه با استفاده از Transformers.js و ONNX Runtime Web اجرا می شود و از رونویسی چند زبانه به 100 زبان مختلف پشتیبانی می کند! 🔥دمو (+ کد منبع) را بررسی کنید! 👇 pic.twitter.com/W9CSM9zPwB7 ژوئن 2024
آیا کار می کند؟
در طول سالها، از سهم خود از برنامههای رونویسی برای کمک به ضبط مصاحبهها، ذخیره پیشنویسهای ایمیل یا فقط پیگیری یادداشتها و ایدههایم استفاده کردهام. یکی از پیشنهادات مورد علاقه من تا به امروز، برنامه ضبط کننده گوگل است که مختص گوشی های پیکسل است. البته نکته منفی این است که باید یک گوشی پیکسل در دست داشته باشید.
Whisper Web توانست یک کلیپ صوتی 25 ثانیه ای را از میکروفون لپ تاپ من (همراه با نویز پس زمینه) بگیرد و در حدود ده ثانیه یک رونویسی کامل از کلمه ایجاد کند. متن بهدستآمده به تکههایی تقسیم شد و آماده صادرات در قالب TXT یا JSON شد.
من کاملاً تحت تأثیر این ابزار تازه کشف شده هستم و فکر می کنم می تواند یک منبع واقعاً مفید باشد. یعنی به شرطی که انگلیسی صحبت کنید…
برای آزمایش تواناییهای چندزبانه، به فرانسوی تغییر مکان دادم و یک قطعه کوتاه 17 ثانیهای ضبط کردم که میگفت صبحانه را حذف میکنم، بنابراین ناهار را زود میخورم. احتمالا چیزبرگر
من فرانسوی صحبت نمی کنم، اما تلفظ من این است او دور. بنابراین کمی عجیب به نظر می رسد”فکر می کنم چقدر همه چیز زیباست“(بنابراین فکر می کنم زودتر ناهار بخورم)”J'ai ton femme et j'aime reste déjeuner totes(همسر شما با من است و من دوست دارم ناهار ببرم).
برای استخدام واقعی Whisper Web، به فردی با مهارت های زبانی بسیار بهتر از من نیاز دارید. اما با توجه به اینکه 99.5٪ از تمام نیازهای رونویسی من به زبان انگلیسی است، من به اندازه کافی تحت تأثیر این ابزار رایگان مفید هستم که می توانم آن را در جریان کار روزانه خود قرار دهم. به احتمال زیاد در اواخر امروز، زمانی که من باید تمام اخبار سنگین هوش مصنوعی را که احتمالاً از کوپرتینو در رویداد اصلی WWDC اپل منتشر می شود، رونویسی کنم.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide