من از این تهیه کننده رایگان آهنگ AI برای ایجاد یک قطعه استفاده می کنم – و کیفیت آن به طرز حیرت انگیزی خوب است

AI Music Generation Arena در دو سال گذشته یکی از بخش های پایدار انقلاب AI بوده است. سونو و اودیو ، دو شرکت غالب ، هم شهرت و هم یک فن هوادار را تأسیس کردند.
با این حال ، این وضع موجود راحت می تواند به میزان قابل توجهی تغییر کند. یک پلت فرم جدید تولید موسیقی ، Yue ، به تازگی افتاده است و قطعات موسیقی رایگان ، منبع آزاد و شگفت آور خوبی را تولید می کند.
یو ، که به معنی “موسیقی” و “خوشبختی” در چین است ، در واقع گروهی از مدل ها هستند که برای ارائه آهنگ های کامل با هم کار می کنند.
مدل ها شامل تولید متن ترانه ، ابزارها و انواع هستند. همانطور که در بیشتر این مدل های جدید هوش مصنوعی چینی ، ماهیت باز یو توسعه بیش از حد خانگی را ترغیب کرده است تا نیاز به پردازش اطلاعات را برای بهره مندی از افراد بیشتری کاهش دهد.
پروژه اصلی به حداقل 24 گیگابایت رم ویدیویی نیاز داشت و پیشنهاد رسمی برای ایجاد یک آهنگ کامل هنوز روی 80 گیگابایت تنظیم شده است. این یک روش آشکارا در دسترس برای کاربران عادی خانگی است و متخصصان به کار و آکادمی هدایت می شوند.
خبر خوب تلاش زیادی برای ایجاد بسته های کوچکتر برای توده ها از جمله پلت فرم محبوب Pinokio انجام شده است ، که به همه امکان می دهد پروژه های هوش مصنوعی باز را به سرعت و به راحتی اجرا کنند.
مبادله کردن
تغییر ایجاد شده با این نسخه های کوچک VRAM این واقعیت است که کیفیت صدا کاملاً رو به وخامت است و دوره های تولید می تواند به عنوان یخچال آهسته باشد.
حتی استفاده از Pinokio این بود که همه نمی توانند به نیاز اساسی VRAM در 12 گیگابایت برسند. با این حال ، یک کاربر کارآفرین اخیراً نسخه جدید حافظه فوق العاده ای را معرفی کرده است که برای من برای باز کردن درب و بازی با استفاده از سیستم GPU Paltry 8GB RTX My Paltry.
این کاری است که من انجام می دهم:
برداشت اول یک رابط کاربری Gradio بسیار صالح است. در سمت چپ صفحه ، یک جعبه درخواست ، یک جعبه آهنگ برای وارد کردن کلمات خود در زیر و شماره ای که می خواهید بعداً ایجاد کنید وجود دارد. همچنین می توان مقدار قوچ مورد نظر برای استفاده را تنظیم کرد که این بستگی به طول آهنگ و تعداد آیات دارد.
دکمه ایجاد را فشار داده و به عقب تکیه دهید و در هنگام ایجاد قسمت پلتفرم منتظر بمانید.
توسعه دهندگان ادعا می کنند که فقط چهار دقیقه طول می کشد تا یک قسمت یک دقیقه ای با GPU 16 گیگابایتی VRAM ایجاد شود. متأسفانه ، به نظر می رسد که این به سمت پایین مقیاس بندی شده است ، زیرا برای تولید دو قطعه 40 و 50 ثانیه با 8 گیگابایت 2 تا 2.5 ساعت طول کشید.
توسعه دهندگان ادعا می کنند که فقط چهار دقیقه طول می کشد تا یک قسمت یک دقیقه ای با GPU 16 گیگابایتی VRAM ایجاد شود.
اما چه قطعات عالی آنها ممکن است کوتاه باشند و کیفیت صدا ممکن است سطح حق بیمه نباشد ، اما موسیقی باورنکردنی است.
وقتی آخرین بار نسل موسیقی AI را روی رایانه خود آزمایش کردم ، از دهه 90 مانند یک کنسول بازی کثیف به نظر می رسید. این موسیقی واقعی با عضله مناسب ، آوازهای عالی و سازهایی است که می توانید از یک سرویس تجاری هوش مصنوعی انتظار داشته باشید.
می توانید نتایج بیشتری را که در SoundCloud دفن شده است بشنوید:
آخرین افکار
بنابراین این پروژه هنوز بسیار بی ادب و آماده است و شما به منابع پردازش اطلاعات مضحک هستند.
حتی اگر رایانه خوبی داشته باشید ، زمان زیادی را صرف انتظار برای ظاهر شدن قطعات خواهید کرد. اما – و این یک “اما” عالی است – با وجود همه این مضرات ، این یک است باور نکردنی ابتدا سعی کنید یک محصول باز در این بخش تولید کنید.
این نوع کیفیت است که در حال حاضر تولید موسیقی AI Open -Source می تواند تولید کند ، و خدمات تجاری مانند Udio و Suno مدت زیادی قبل از شروع جامعه DIY احساس گرمای واقعی نخواهد داشت.