NVIDIA متهم به برداشت 80 سال ویدیو هر روز برای آموزش مدل های هوش مصنوعی – آنچه باید بدانید
همانطور که درباره نحوه ساخت هوش مصنوعی بیشتر می آموزیم، گزارش های بیشتری از شرکت هایی که از محتوای دارای حق چاپ برای آموزش هوش مصنوعی بدون مجوز استفاده می کنند ظاهر می شود.
گفته میشود که انویدیا ویدیوهایی را از YouTube، Netflix و سایر مجموعههای داده دانلود کرده است تا پروژههای تجاری هوش مصنوعی را آموزش دهد. 404 Media گزارش میدهد که این شرکت از ویدیوهای دانلود شده برای آموزش مدلهای هوش مصنوعی برای محصولاتی مانند مولد جهان سه بعدی Omniverse و تلاشهای «انسان دیجیتال» مانند پروژه تجسمشده AI Gr00t استفاده میکند.
هنگامی که Tom’s Guide از طریق ایمیل با آنها تماس گرفت، NVIDIA گفت که آنها “حقوق همه سازندگان محتوا را احترام میگذارند” و تلاشهای تحقیقاتی آنها “کاملاً با روح و قانون کپیرایت مطابقت دارد.”
آنها اظهار داشتند: “قانون کپی رایت از عبارات خاص محافظت می کند، اما نه از حقایق، ایده ها، داده ها یا اطلاعات.” «هرکسی آزاد است که حقایق، ایدهها، دادهها یا اطلاعات را از منبعی دیگر بیاموزد و از آنها برای تشکیل اظهارات خود استفاده کند.»
آنها همچنین استدلال کردند که آموزش مدل هوش مصنوعی نمونه ای از استفاده رایگان است که از محتوا برای هدفی متحول کننده استفاده می کند.
نتفلیکس از اظهار نظر خودداری کرد، اما یوتیوب با ارزیابی NVIDIA مخالف است. جک مالون، مدیر ارتباطات سیاسی یوتیوب، به اظهاراتی اشاره کرد که نیل موهان، مدیرعامل این شرکت در ماه آوریل به بلومبرگ ارائه کرد و در آن گفت: «نظرات قبلی ما همچنان پابرجاست».
در آن زمان، موهان به گزارشهایی پاسخ میداد که OpenAI سازنده ویدیوی Sora AI خود را بدون اجازه در ویدیوهای YouTube آموزش داده است. “این اجازه نمیدهد چیزهایی مانند رونوشتها یا قطعههای ویدئویی بارگیری شوند، و این به وضوح نقض شرایط خدمات ما است. اینها قوانین راه برای محتوا در پلتفرم ما هستند.” گفت.
این حتی اولین باری نیست که NVIDIA در تابستان امسال به حذف یوتیوب متهم می شود. چندین شرکت بزرگ، از جمله اپل و آنتروپیک، گزارش شدهاند که اطلاعاتی را از مجموعه داده عظیمی به نام «Pile» که حاوی هزاران ویدیوی یوتیوب است، از جمله از سازندگان محبوبی مانند Marques Brownlee و PewDiePie استخراج کردهاند.
نگرانی های اخلاقی مطرح و رد شد
Et404Media گزارش داد که مدیران به کارکنانی که نگرانیهای اخلاقی یا قانونی را مطرح میکردند گفته بودند که این برنامه از «بالاترین سطوح شرکت» تأیید شده است.
مینگ یو لیو، معاون تحقیقات انویدیا، پاسخ داد: «این یک تصمیم مدیریتی است. “ما برای همه داده ها تایید کلی داریم.”
ظاهراً برخی از مدیران این موضوع را به تعویق انداختند و گفتند که ضایعات یک مسئله حقوقی آشکار است که شرکت بعداً با آن برخورد خواهد کرد.
ویدئوهای یوتیوب و نتفلیکس تنها مجموعه دادههایی نبودند که توسط NVIDIA حذف شدند. همچنین گفته میشود که این شرکت دادهها را از پایگاه داده تریلر فیلم MovieNet، کتابخانههای فیلم بازیهای ویدیویی و مجموعه دادههای ویدئویی Github WebVid استخراج میکند.
بازی ناعادلانه چیست؟
گفته می شود، برخی از ویدیوهای مورد استفاده NVIDIA از یک کتابخانه ویدیویی عظیم یوتیوب بوده که فقط برای اهداف آکادمیک علامت گذاری شده است. این مجوز استفاده بیان می کند که ویدیوها فقط برای اهداف تحقیقاتی دانشگاهی هستند. ظاهرا NVIDIA ادعا کرده است که کتابخانه دانشگاهی یک بازی منصفانه برای محصولات تجاری هوش مصنوعی است.
شرکت مادر یوتیوب، آلفابت، از این انتقاد که در حال استخراج اینترنت برای مدلهای هوش مصنوعی است مصون نیست. تابستان گذشته، گوگل طرح خود را برای «استفاده از اطلاعات عمومی» برای آموزش مدلهای هوش مصنوعی گوگل و ساخت محصولات و ویژگیهایی مانند Google Translate، Bard و قابلیتهای هوش مصنوعی Cloud منتشر کرد.
بیخطر میتوان فرض کرد که هر چیزی که در پلتفرمهای گوگل مانند یوتیوب پست میشود، بازی منصفانه تلقی میشود، اما به طور کلی برای هر چیزی که در اینترنت پست میشود، همینطور است.
در آن زمان، یکی از سخنگویان گوگل به Tom’s Guide گفت: “سیاست حفظ حریم خصوصی ما مدت هاست که شفاف بوده است؛ گوگل از اطلاعات عمومی در دسترس از وب باز برای آموزش مدل های زبان برای سرویس هایی مانند Google Translate استفاده می کند. این به روز رسانی اخیر روشن می کند که سرویس های جدیدتری مانند Bard هستند. همچنین گنجانده شده است.” “در راستای اصول هوش مصنوعی، ما اصول حفظ حریم خصوصی و اقدامات امنیتی را در توسعه فناوری های هوش مصنوعی خود لحاظ می کنیم.” او گفت.
این بدان معنی است که هر پست عمومی که در هر زمان ارسال شود، برای اهداف هوش مصنوعی خود گوگل مفید است.
گزارش کامل رسانه 404 جزئیات بسیار بیشتری دارد و ارزش خواندن دارد.
اطلاعات بیشتر از راهنمای تام
منبع: tomsguide