MIDNATT والرئيس التنفيذي لشركة Supertone Lee Kyogu حول إحياء أول فنان HYBE المدعوم بالذكاء الاصطناعي

MIDNATT والرئيس التنفيذي لشركة Supertone Lee Kyogu حول إحياء أول فنان HYBE المدعوم بالذكاء الاصطناعي


تريد شركة Supertone لتكنولوجيا الصوت بالذكاء الاصطناعي “تغيير نموذج العملية الإبداعية” ، كما يقول الرئيس التنفيذي لي كيوغو ، وهي تبدأ بالكيبوب.

يمكن لـ Supertone تكرار أصوات أصلية أو إتقانها أو توليدها لمساعدة الفنانين على تجاوز “عمليات التسجيل والتحرير المتكررة” وتحقيق الأفكار التي “لم تكن موجودة حتى الآن إلا في أذهانهم”. لي هيون ، مغني القصص الكوري المعروف ، كان يحلم بالتواصل مع المعجبين العالميين بينما يعيد تخيل صورته. جنبا إلى جنب مع Supertone ، ابتكر MIDNATT ، الأنا المتغيرة التي تغني بست لغات باستخدام قوة الذكاء الاصطناعي.

أنظر أيضا:

يستخدم فنان الكيبوب هذا الذكاء الاصطناعي للغناء بست لغات

أصدر MIDNATT أغنيته المنفردة الأولى “Masquerade،(يفتح في علامة تبويب جديدة)“في مايو. عبر البريد الإلكتروني ، أخبر Lee و MIDNATT (AKA Lee Hyun) موقع Mashable المزيد عن كيفية ظهور المشروع.

ذكر بيان صحفي أن MIDNATT “أكثر جرأة وصدق من Lee Hyun.” ما الشيء الأكثر صدقًا حول MIDNATT؟ ما هي الطرق التي تساعدك بها التكنولوجيا على أن تكون أكثر صدقًا؟

ميدنات: حاولت أن أضع قصصي الخاصة ومشاعري في الموسيقى بأمانة قدر الإمكان. إنه يعكس الطموح والخوف الذي كان لدي من إظهار هذا الجانب الجديد من نفسي كفنان للجمهور. تم تطبيق التكنولوجيا على المضمار لإحياء هذه القصة. إنه شيء جديد تمامًا قبلته ، لكنني أردت مواجهة التحدي مع العلم أنه يمكن أن يوسع طيفي الموسيقي. [Through it]، لقد تمكنت من التعبير عن صوتي ورسالتي بطرق أكثر تنوعًا.

مما أفهمه من التحدث إلى الرئيس التنفيذي لشركة HYBE IM Chung، قامت Supertone بتطوير تقنية نطق خصيصًا لهذا المشروع. هل يمكنك إخباري بالمزيد عن هذه العملية؟

Lee: نحن نسمي هذا “تقنية تصحيح النطق متعدد اللغات”. تعمل هذه التقنية على تصحيح نطق الشخص بحيث يبدو أكثر طبيعية وطلاقة ، على الرغم من عدم التحدث بلغة معينة من قبل. من خلال هذه التكنولوجيا ، يمكن لأي شخص التحدث أو الغناء بشكل طبيعي بأي لغة ، والتغلب على حواجز اللغة وتقديم العاطفة والمعنى الدقيقين في أغنية أو خطاب.

بالنسبة للمشروع L ، مررنا بالعملية التالية: أولاً ، سجل الفنان المسار بست لغات مختلفة. بالطبع ، لم يكن نطقه مثاليًا في هذه المرحلة. ثم قام كل متحدث أصلي برواية نفس المحتوى أو كلمات الأغاني. أخيرًا ، من خلال تطبيق تقنية Supertone ، تمكنا من استخراج النطق الأصلي واستبدال المحتوى اللغوي الموجود في تسجيل الفنان. ونتيجة لذلك ، احتفظ الصوت بجرس الفنان أو خصائصه الصوتية ، بينما استحوذ النطق على طلاقة المتحدث الأصلي.

لقد استخدمت تقنية Supertone معينة قامت بتعديل نطقك في اللغات الأجنبية. كيف تم اختيار اللغات الست؟

ميدنات: استخدمنا تقنية الصوت على أمل تخفيف حواجز اللغة التي قد يشعر بها المشجعون العالميون عند الاستماع إلى أغنية بلغة أجنبية. تغطي اللغات الست المستخدمة على المسار ما يصل إلى 8 مليارات شخص في جميع أنحاء العالم. كنت أرغب في صنع موسيقى تلقى صدى لدى أكبر عدد ممكن من الناس.

كيف درست كل لغة لتتعلم تفاصيل نطقها؟ ما هي اللغة التي كان من الصعب إتقانها؟

ميدنات: قبل هذا المشروع ، لم أحصل على تعليم مناسب باللغات الخمس الأجنبية بالنسبة لي [English, Japanese, Chinese, Spanish, and Vietnamese]. في البداية ، استمعت إلى تسجيل لنطق متحدثين أصليين وقمت بتقليده. من هناك ، مارستها مرارًا وتكرارًا. لحسن الحظ ، كان لدي موظفين من حولي يجيدون لغات مختلفة ، لذلك حصلت على الكثير من المساعدة منهم أيضًا. تحتوي اللغة الصينية على طرق نطق معينة غير موجودة في اللغة الكورية ، لذا كان التسجيل باللغة الصينية صعبًا بشكل خاص. أيضًا ، يُنظر إلى اللغة الإنجليزية على أنها لغة عالمية ، لذا فقد أولت أيضًا الكثير من الاهتمام لتقديم اللغة الإنجليزية في نطق المتحدثين الأصليين قدر الإمكان.

Lee Hyun في سترة حمراء للدراجات النارية

جلب Lee Hyun غروره المتغيرة إلى MIDNATT باستخدام تقنية الصوت AI التي طورتها Supertone.
الائتمان: HYBE

Lee Hyun ، لقد تحول صوتك إلى صوت امرأة لأغنية “Masquerade”. هناك العديد من الطرق التي كان يمكن أن يسمع بها الصوت ؛ يمكن أن تحتوي على عدد من الأجراس المختلفة ، أو خشونة أو نعومة ، وما إلى ذلك. كيف قررت كيف يجب أن تبدو النسخة “الأنثوية” من MIDNATT؟

ميدنات: الصوت الأنثوي في “Masquerade” يعبر عن غرور آخر لي. إنها تمثل ذاتي السابقة ، ولأن هناك العديد من الأنا التي أردت التعبير عنها في المسار ، فقد توصلنا إلى أن استخدام صوت أنثوي ، فوق صوتي ، سيوصل رسالة كلمات الأغاني بشكل أفضل. بدأ الأمر بي أفكر كيف ستبدو مغنية لديها أسلوب صوتي مشابه لي. لكن إضافة صوت أنثوي لم أتخذه وحدي ، [it was] ولد من تعاوني مع Hitchhiker.

Lee: استمعت Supertone إلى النسخة التجريبية من “Masquerade” وصممت صوتًا أنثويًا باستخدام تقنية Face2Voice®. ثم استخدم Hitchhiker مرجع Supertone والبيانات الأخرى التي ساعدت في تصميم النسخة الأنثوية من صوت MIDNATT.

كيف ظهرت فكرة استخدام أدوات Supertone في المناقشات حول MIDNATT؟ من الذي طرحها وكيف عرفت كيف يمكن أن تفيد الفنان قبل أن تقرر متابعتها؟

Lee: ذكر Hitchhiker أنه عندما يغني الفنان ، فإنهم يحاولون التعبير عن معنى الأغنية والرسالة في كلمات الأغاني ونقلها بأسلوبهم الفريد. يسعى الفنانون إلى الغناء بلغات متعددة للتواصل مع المعجبين العالميين. ومع ذلك ، إذا لم يكن النطق مثاليًا ، فقد يؤدي ذلك إلى الحد من الانغماس وحتى إساءة تفسير الأغنية. ونتيجة لذلك ، فكر في تقنية يمكنها تصحيح النطق دون الإضرار بالمعنى الأصلي للأغنية. على الرغم من إدراك MIDNATT للشكوك المصاحبة نظرًا لحقيقة أن هذا كان أول تعاون لـ HYBE بين التكنولوجيا والترفيه ، فقد اعتبره فرصة لتحديات جديدة واختار المشاركة في هذا المشروع ، خاصة مع استمرار ارتفاع توقعات الجماهير.

تقنية الواقع الممتد (XR) المستخدمة في إنشاء فيديو موسيقي “Masquerade” تكاد تكون جديدة مثل التقنية المستخدمة لتصحيح النطق. لقد صورت العديد من مقاطع الفيديو الموسيقية في حياتك المهنية ، كيف كانت هذه العملية مختلفة؟ ما هي مزايا استخدام هذا النوع من التكنولوجيا في إنتاج الفيديو الموسيقي برأيك؟

MIDNATT: استخدم الفيديو الموسيقي لـ “Masquerade” طريقة مختلفة تمامًا للتصوير ، لذلك كنت في حالة ذهول دائم. إذا كان علي اختيار اختلاف رئيسي واحد [between shooting this music video and past ones]، أود أن أقول إن هناك مجموعة متنوعة من الخلفيات في الفيديو ، لكن الغالبية منها تم تصويرها في نفس المكان دون الحاجة إلى السفر إلى موقع مختلف. في الماضي ، إذا كان لدينا خلفية معينة في الاعتبار ، كان علينا أن نجد موقعًا حقيقيًا يشبهها. ولكن الآن ، بمساعدة التكنولوجيا ، يمكننا إنشاء خلفية نريدها بحرية أكبر. أعتقد أن استخدام مثل هذه التكنولوجيا هو الشيء الذي يتيح مستوى أعلى من التعبير الإبداعي.

هل وجدت استخدامات أخرى للذكاء الاصطناعي في حياتك اليومية؟ على سبيل المثال ، هل تستخدم ChatGPT أو أي صورة توليدية AI؟ أو ربما تكون مهتمًا أكثر بالواقع الافتراضي أو الألعاب؟

لي: هذا مثير للاهتمام. في الواقع ، أستخدم أحيانًا GPT-4 أثناء العمل على المستندات. لكن لم تتح لي الفرصة لاستخدام أي صورة أو فيديو ذي صلة مباشرة بالذكاء الاصطناعي. ومع ذلك ، فأنا أستخدم الذكاء الاصطناعي كل يوم بشكل غير مباشر. عندما أستمع إلى الموسيقى أو أشاهد مقاطع الفيديو على YouTube ، فإن المحتوى الذي أوصيت به يعتمد أيضًا على خوارزميات الذكاء الاصطناعي. يمكن أن تكون القيادة شبه المستقلة في السيارات مثالاً آخر.

ميدنات: أنا لا أمارس الكثير من الألعاب ، ولكن إذا كان علي الاختيار ، فأنا أستمتع بألعاب الواقع الافتراضي. إن التكنولوجيا التي أستخدمها أكثر من غيرها في حياتي اليومية ، كما أقول ، هي على الأرجح التطبيقات والوظائف المختلفة على هاتفي الذكي.

كان الكثير من تركيز المستمع ووسائل الإعلام على ظهور MIDNATT على عنصر الذكاء الاصطناعي في المشروع. ما هي أفكارك حول اعتبار الذكاء الاصطناعي “وسيلة للتحايل”؟ كيف يمكن دمجها في الموسيقى بطريقة لا تنفر المستمعين وتضر بالفنانين؟

لي: بالطبع ، قد توجد مثل هذه المخاوف. ولكن تمامًا مثل العديد من التقنيات الأخرى ، نعتقد اعتقادًا راسخًا أنه يمكن استخدام الذكاء الاصطناعي كأداة رائعة لتعظيم إبداع المبدعين والفنانين الحقيقيين. عزز اختراع الجيتار الكهربائي فنانين رائعين مثل جيمي هندريكس ، واستخدم دفت بانك آلات المزج بطرقهم الإبداعية الخاصة لجلب الابتكار إلى الموسيقى الإلكترونية. أيضًا ، بناءً على ردود فعل المعجبين بعد الكشف عن المشروع L ، نعتقد أنه يمثل قيمة إيجابية للفن الذي يدمج تقنية الذكاء الاصطناعي.

ميدنات: كان لدي اتجاه واضح لما أود أن يكون عليه مشروع MIDNATT الأول. ذهبت إلى المشروع بالتفكير حتى لو عرضنا أحدث التقنيات وصوتًا عصريًا ، فلا ينبغي أن يأخذ أي شيء من قصتي الفريدة وأصالتي كفنانة. لقد عملنا على المسار وطبقنا التكنولوجيا بطريقة لا تزال تحافظ على تفرد صوتي وتمنحه وسائل متنوعة للتعبير. أنا ممتن جدًا لأن المعجبين قد فهموا النية والصدق وراء ذلك.



اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى