Meta open sources – مولد موسيقى يعمل بالذكاء الاصطناعي
لكي لا تتفوق عليها Google ، أصدرت Meta مولد الموسيقى الخاص بها الذي يعمل بالذكاء الاصطناعي – وعلى عكس Google ، قامت بفتح مصدره.
يمكن لأداة توليد الموسيقى التي يطلق عليها اسم MusicGen ، والتي يمكن العثور على عرض توضيحي لها هنا ، تحويل وصف نصي (على سبيل المثال ، “أغنية موسيقى البوب تقود الثمانينيات مع طبول ثقيلة ووحدات سينث في الخلفية”) إلى حوالي 12 ثانية من الصوت ، اعط او خذ. يمكن “توجيه” MusicGen اختياريًا باستخدام صوت مرجعي ، مثل أغنية موجودة ، وفي هذه الحالة سيحاول اتباع كل من الوصف واللحن.
يقول ميتا إن MusicGen تم تدريبه على 20000 ساعة من الموسيقى ، بما في ذلك 10000 مقطوعة موسيقية مرخصة “عالية الجودة” و 390.000 مقطوعة للآلات فقط من ShutterStock و Pond5 ، وهي مكتبة وسائط ضخمة. لم تقدم الشركة الكود الذي استخدمته لتدريب النموذج ، لكنها لديه توفير نماذج مدربة مسبقًا بحيث يمكن لأي شخص لديه الأجهزة المناسبة – بشكل أساسي وحدة معالجة الرسومات (GPU) بسعة 16 جيجابايت من الذاكرة – تشغيلها.
إذن كيف يعمل MusicGen؟ حسنًا ، أود أن أقول – على الرغم من أنه ليس جيدًا بما يكفي لإخراج الموسيقيين من وظائفهم. أغانيها لحنية بشكل معقول ، على الأقل للمطالبات الأساسية مثل “موسيقى chiptunes المحيطة” ، و- إلى أذني- على قدم المساواة (إن لم تكن أفضل قليلاً) مع نتائج مولد الموسيقى AI من Google ، MusicLM. لكنهم لن يفوزوا بأي جوائز.
هذا هو الإخراج من MusicGen لـ “موسيقى الجازي المصعد”:
وإليك طريقة MusicLM:
بعد ذلك ، أعطيت دفعة أكثر تعقيدًا لمحاولة إلقاء MusicGen في حلقة: “Lo-fi بطيئة BPM الكهربائية مع عينات عضوية.” تفوقت MusicGen بشكل مدهش على MusicLM من حيث التماسك الموسيقي ، مما أدى إلى إنتاج شيء من السهل العثور عليه في Lofi Girl.
إليك نموذج MusicGen:
وإليك برنامج MusicLM:
لتبديل الأمور قليلاً ، حاولت استخدام كلتا الأداتين لإنشاء آلة بيانو بأسلوب جورج غيرشوين. أقول “جربت” لأنه في محاولة لإحباط مشكلات حقوق النشر المتعلقة بأدوات الموسيقى التوليفية ، نفذت Google مرشحًا في الإصدار العام من MusicLM يمنع المطالبات من ذكر فنانين معينين.
MusicGen ليس لديه مثل هذا المرشح. لكن نتائج “موسيقى البيانو الخلفية بأسلوب غيرشوين” تركت شيئًا مطلوبًا ، يجب أن أقول:
الموسيقى التوليدية تتحسن بشكل واضح (انظر Riffusion و Dance Diffusion و Jukebox OpenAI). لكن القضايا الأخلاقية والقانونية الرئيسية لم يتم تسويتها بعد. الذكاء الاصطناعي مثل MusicGen “يتعلم” من الموسيقى الموجودة لإنتاج تأثيرات مماثلة ، وهي حقيقة لا يشعر بها كل الفنانين – أو مستخدمي الذكاء الاصطناعي المولدين – بالراحة.
على نحو متزايد ، أصبحت المسارات محلية الصنع التي تستخدم الذكاء الاصطناعي التوليدي لاستحضار الأصوات المألوفة التي يمكن تمريرها على أنها أصلية ، أو على الأقل قريبة بدرجة كافية ، منتشرة بشكل كبير. سارعت شركات الموسيقى إلى الإبلاغ عنها لشركاء البث ، مستشهدة بمخاوف الملكية الفكرية – وكانت منتصرة بشكل عام. ولكن لا يزال هناك نقص في الوضوح بشأن ما إذا كانت الموسيقى “المزيفة العميقة” تنتهك حقوق الطبع والنشر للفنانين والعلامات التجارية وأصحاب الحقوق الآخرين.
قد لا يمر وقت طويل قبل أن تكون هناك إرشادات حول هذه المسألة. من المحتمل أن يكون للعديد من الدعاوى القضائية التي تشق طريقها في المحاكم تأثير على الذكاء الاصطناعي المولّد للموسيقى ، بما في ذلك قضية تتعلق بحقوق الفنانين الذين تُستخدم أعمالهم لتدريب أنظمة الذكاء الاصطناعي دون علمهم أو موافقتهم.
من جانبها ، تقول Meta ، التي لا تفرض قيودًا على كيفية استخدام MusicGen ، أن كل الموسيقى التي تم تدريب MusicGen عليها كانت “مغطاة باتفاقيات قانونية مع أصحاب الحقوق” ، بما في ذلك صفقة مع Shutterstock.
اكتشاف المزيد من خيال التقنية
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.