کلونینگ صدا ، تقلید معروف و نیازهای محافظت – مدیرعامل هیوم در دنیای تولید صدا AI می آید

بعد از ظهر چهارشنبه ، من در یک جلسه ویدیویی می نشینم که به ریکی گراویس گوش می دهد تا شوخی در مورد کلونینگ صوتی بگوید. سپس آدری هبرن از من پیروی می کند تا در مورد نظرات او در مورد هوش مصنوعی به من بگوید.
هیچکدام از این افراد در واقع تماس نمی گرفتند. در عوض ، از طرف دیگر ، مدیرعامل هیوم و دانشمند ارشد دکتر آلن کاون. خانه خدمات ایجاد صدا AI این شرکت آخرین به روزرسانی 3 را نشان می دهد.
با توجه به تنها 30 ثانیه صدا ، وسیله نقلیه می تواند یک نسخه عالی از صدای کسی را تهیه کند. نه تنها سایه یا لهجه آنها ، بلکه این ویژگی جدید نگرش و شخصیت را ضبط و چند برابر می کند.
ریکی گراویس در مورد ویژگی های کلونینگ صدا از همان هوش خشک و لحن بدبینانه به من شوخی می کند. و آدری هبورن مشتاق و مشتاق صحبت با لهجه نرم تر انگلیس در آن زمان است.
اما این فقط افراد مشهور نیست. این ابزار فقط می تواند از یک کلیپ صوتی کوچک صدا در جهان ایجاد کند و تولید مثل کند. بدیهی است ، ابزاری مانند این مزیت تغییر جهان را برای بهتر و بدتر دارد.
کاون با راهنمای تام برای توضیح این وسیله نقلیه جدید ، گذشته و اینکه چرا تیمش می خواست در دنیای کلونینگ صوتی هوش مصنوعی متحول شود ، نشست.
دنیای تولید صدا هیوم و هوش مصنوعی
هیوم در یک زمینه هوش مصنوعی فعالیت می کند که به طرز عجیبی به وجود نمی آید. آنها یک نرم افزار تولید صدا هستند که ادعا می کنند “واقع بینانه ترین صدا در جهان” است.
من فکر می کنم این سریعترین بخش در حال توسعه از زمینه AI است. OpenAI و Google رقبایی دارند ، اما کاری که ما با خانه 3 انجام می دهیم این است که این فناوری را به مرحله بعدی برسانیم.
دکتر آلن کاون ، مدیر عامل هیوم
با گذشت سالها ، مسیری طولانی به طول انجامید ، اکنون یک سری از گفتار متن با یک سری صدای از پیش تنظیم شده و همچنین امکان طراحی یک صدا از توضیحات را ارائه می دهد. اکنون ، با این آخرین به روزرسانی ، این شرکت همچنین می تواند تمام صداها را کلون کند.
وی گفت: “سریعترین بخش در حال توسعه این زمینه هوش مصنوعی. OpenAi و Google رقبایی دارند ، اما آنچه ما با خانه 3 انجام می دهیم این است که این فناوری را به مرحله بعدی برسانیم.”
“مدل های قبلی مبتنی بر تقلید از افراد خاص بود. سپس به داده های زیادی نیاز دارید تا بتوانید برای هر شخص یک نتیجه گیری خوب ایجاد کنید. در عوض ، این مدل دقیقاً همان چیزی را که به نظر می رسد ، از جمله احساسات و شخصیت یک شخص تکرار می کند.”
این به گونه ای بدست می آید که هیوم نیازی به تقلید از افراد خاصی با استفاده از داده های صوتی بزرگ هیوم و تجمع یادگیری تقویت ندارد. یک کلیپ 30 ثانیه ای به مدل بدهید و می تواند از ابتدا بازسازی شود. این به مدل اجازه می دهد تا خم ، لهجه و شخصیت ویژه شما را بیاموزد ، در حالی که مدل را در برابر تجمع داده های صوتی بزرگ برای پر کردن شکاف ها آموزش می دهد.
البته ، الگویی مانند این به بهترین وجهی انجام می شود که یک نمایش خوب ارائه شود. کلیپ خفه کننده ای که با صدای یکنواخت در مورد آن صحبت می کنید ، متناسب با شخصیت شما نخواهد بود. با این حال ، در حال حاضر فقط در آینده برای برنامه های انگلیسی و اسپانیایی و بیشتر زبان کار می کند.
اخلاق تولید صداهای واقعی

مثل من ، اگر اولین فکر شما همه اینها را می شنوید ، چیزی با Cowen مشترک دارید.
وی گفت: “من فکر می کنم این می تواند بسیار ناپسند باشد. در آغاز هیوم ، ما آنقدر نگران این خطرات بودیم که تصمیم گرفتیم کلون سازی صدا را حفظ نکنیم. اما ما نظر خود را تغییر دادیم زیرا افراد زیادی با استفاده مشروع وجود دارند تا به کلون کردن صدا به ما نزدیک شوند.”
“از جمله استفاده قانونی از ترجمه زنده ، دوبله ، ساختن محتوا ، تولید مثل صدای خود برای سناریوها ، حتی افراد مشهور که می خواهند به طرفداران خود برسند.”
اگرچه این استفاده ها در دسترس است ، اما موارد منفی زیادی وجود دارد. سام آلتمن ، مدیرعامل OpenAi ، اخیراً هشدار داده است که خطرات کلونینگ صوتی هوش مصنوعی و امکان استفاده از آن در کلاهبرداری و فعال سازی صدا بانکی.
این فناوری ، که با تولید فیلم و تصویر مطابقت دارد ، ممکن است فشار باشد که به عمق برای مدتی مورد نیاز است تا عمق واقعاً مشکل ساز باشد. کاون اعلام کرد که از این نگرانی ها آگاه است و ادعا کرد که هیوم تا حد ممکن خوب است.
Cowen گفت ، Uz ما با این فناوری از محافظت زیادی استفاده می کنیم. ما هر مکالمه را تجزیه و تحلیل می کنیم و هنوز در حال پیشرفت هستیم. با این حال ، ما می توانیم امتیاز بگیریم که احتمالاً چیزی در اندازه های مختلف مورد سوء استفاده قرار می گیرد.
“وقتی مردم به درستی از آن استفاده نمی کنند ، می توانیم دسترسی را به وضوح ببندیم. با شرایط ما ، شما باید دستورالعمل های اخلاقی زیادی را که علاوه بر ابتکار عمل هیوم معرفی کرده ایم ، رعایت کنید. از آنجا که این نگرانی ها آغاز شده است ، ما از زمان شروع کار در ذهن خود بوده ایم و محافظت خود را همانطور که همچنان این فناوری ها را حل می کنیم ، توسعه می دهیم.”
ایجاد اصول راهنمایی در دنیای هوش مصنوعی

ابتکار هیوم پروژه ای است که توسط شرکت هیوم تأسیس شده است. اخلاق این است که فناوری مدرن قبل از هر چیز باید به رونق عاطفی ما خدمت کند. این کمی نامشخص است ، اما سرمایه گذاری شش اصل را برای فن آوری های همدلی ذکر کرده است:
- فناوری فقط باید در صورتی توزیع شود که مزایای آن هزینه های آنها را برای افراد و جامعه تشدید کند.
- برای خدمت به رفاه عاطفی ما و جلوگیری از برخورد با احساسات انسانی برای یک هدف ، باید فناوری هایی ساخته شوند.
- ادعاهای مربوط به توانایی ها ، هزینه ها و مزایای فن آوری های همدلی باید توسط علم دقیق ، فراگیر ، چند منظوره و مشارکتی پشتیبانی شود.
- اعضای گروه های مختلف جمعیتی و فرهنگی سزاوار دسترسی به مزایای فن آوری های همدلی بدون ایجاد هزینه های مختلف هستند
- افرادی که تحت تأثیر فناوری همدلی قرار دارند ، باید به اطلاعات لازم برای تصمیم گیری آگاهانه در مورد استفاده از آن دسترسی پیدا کنند.
- یک فناوری همدلی فقط باید با تأیید آگاهانه افرادی که بر آن تأثیر می گذارد مستقر شود.

البته ، حتی اگر این دستورالعمل های خوبی باشد که باید رعایت شود ، آنها ذهنی هستند و فقط در صورت پیگیری مفید هستند. کاون گفت که آنها اعتقاداتی هستند که هیوم با هیوم است و در مورد کلون سازی صدا از خطرات آگاه هستند.
در هیوم ، ما آنقدر نگران این خطرات بودیم که تصمیم گرفتیم کلونینگ صدا را حفظ نکنیم. اما ما نظر خود را تغییر داده ایم زیرا افراد زیادی با موقعیت های مشروع وجود دارند که برای کلونینگ صدا به ما نزدیک می شوند.
دکتر آلن کاون ، مدیر عامل هیوم
Cowen ما در صدر این فناوری قرار داریم و سعی می کنیم جلوی آن بمانیم. من فکر می کنم افرادی خواهند بود که به دستورالعمل چنین وسیله نقلیه احترام نمی گذارند.
“مردم باید در مورد دندانهای عمیق تلفن نگران باشند ، در برابر چنین کلاهبرداری ها مراقب باشند ، و فکر می کنم ما به آزمایشی بین سینه ها نیاز داریم.”
اگرچه او از خطرات آگاه است ، اما کاون توضیح داد که فکر می کند این فناوری است که آنها باید بسازند.
وی گفت: “حوزه هوش مصنوعی آنقدر سریع در حال حرکت است که من شک ندارم که یک بازیگر بد می تواند در شش ماه به چیزی شبیه به این فناوری برسد. ما باید به این موضوع توجه کنیم.”
افکار عمومی
کاون بیشتر مکالمه ما را صرف تمرکز بر دستورالعمل ها و نگرانی های مشروع از چنین فناوری هایی کرد. او معتقد است که در روانشناسی و چنین فناوری هایی تأثیر مثبتی بر رفاه مردم خواهد گذاشت تا منفی.
مردم کاون واقعاً از کلون کردن صدای خود با نسخه ی نمایشی ما لذت می برند. ما قبلاً هزاران مکالمه داشته ایم ، این قابل توجه است. Cow Cowen پس از بحث در مورد اینکه مردم فکر می کنند در مورد این نوع فناوری اشتباه است ، از آن به روشی واقعاً سرگرم کننده استفاده می کند.
او معتقد است که می توان از آن برای سرگرمی ، برای کمک به بهبود اعتماد مردم ، و حتی برای اهداف آموزشی یا نیازهای بازیگری صدا استفاده کرد و می تواند برای دوبله استفاده شود.
البته ، مانند بسیاری از مناطق دیگر هوش مصنوعی ، مزایای مثبت با منفی رقابت می کنند. داشتن یک صدای کلی برای خواندن سناریو ، اما از نظر خطر مفید است.
بازسازی هر صدایی در جهان با لیست طولانی نگرانی ها همراه است. در حال حاضر ، به نظر می رسد که کاون و تیمش در این تلاش به سمت اخلاقی بحث وصل شده اند ، اما ما در اوایل زندگی چنین فناوری می مانیم.
بیشتر از راهنمای تام
بازگشت به لپ تاپ ها


