منصة توليد الصوت ElevenLabs تجمع 19 مليون دولار وتطلق أداة الكشف


نجحت ElevenLabs ، المنصة الفيروسية المدعومة بالذكاء الاصطناعي لإنشاء أصوات اصطناعية ، في جمع جولة جديدة من النقود.

أعلنت الشركة الناشئة اليوم عن إغلاق جولة بقيمة 19 مليون دولار من السلسلة الأولى بقيادة رواد الأعمال نات فريدمان ودانييل جروس جنبًا إلى جنب مع أندريسن هورويتز. ومن بين المشاركين الآخرين كرياتور فينتشرز ، إس في أنجل ، المؤسس المشارك لإنستغرام مايك كريجر ، المؤسس المشارك لشركة أوكيولوس بريندان إيريبي ، مصطفى سليمان المؤسس المشارك لشركة ديب مايند وإنفلكشن إيه آي ، وتيم أورايلي مؤسس شركة O’Reilly Media.

يقول مصدر مطلع على الأمر لـ TechCrunch أن الشريحة تقدر ElevenLabs بمبلغ 99 مليون دولار بعد المال – وهو رقم محترم ، لا سيما بالنظر إلى أن الشركة الناشئة بدأت منذ أكثر من عام بقليل.

“سيتم استخدام هذا الاستثمار لمواصلة البناء ElevenLabهو مركز أبحاث متطور للذكاء الاصطناعي الصوتي ولإطلاق مجموعة من المنتجات الإضافية لدعم قطاعات السوق المحددة مثل النشر والألعاب والترفيه وتطبيقات المحادثة “، قال المؤسس المشارك والرئيس التنفيذي ماتي ستانيسيفسكي لموقع TechCrunch عبر البريد الإلكتروني.

ElevenLabs ، التي تصدرت عناوين الصحف على مدار الأشهر القليلة الماضية لأسباب جيدة ومقيتة ، أسسها Staniszewski ، الذي عمل سابقًا في Palantir ، وصديق طفولته Piotr Dabkowski ، موظف سابق في Google. مستوحى من الدبلجة المتواضعة للأفلام الأمريكية التي شاهدوها وهم نشأوا في بولندا ، بلدهم الأصلي ، شرع الزوجان في تصميم منصة يمكن أن تؤدي بشكل أفضل – الاستفادة من الذكاء الاصطناعي بالطبع.

يمكن لـ ElevenLabs تحويل النص إلى كلام باستخدام أصوات اصطناعية أو أصوات مستنسخة أو أصوات “اصطناعية” جديدة تمامًا تحاكي أصوات الأشخاص من مختلف الأجناس والأعمار والأعراق. تعد نماذج تحويل النص إلى كلام بالذكاء الاصطناعي للشركة حيادية اللغة ، مما يسمح لعملاء الشركات بضبطها وبناء نماذج الكلام الخاصة بهم في الأعلى.

بالتزامن مع زيادة المجموعة أ ، تطلق ElevenLabs المكونة من 15 موظفًا مشاريع ، وهي عبارة عن سير عمل لتحرير وإنشاء محتوى منطوق طويل. باستخدام المشاريع ، يمكن للمستخدمين إنشاء مقاطع حوار وحتى كتب صوتية دون الحاجة إلى مغادرة النظام الأساسي.

“بالنسبة لشركاء الأعمال التجارية ، يمكن استخدام تقنيتنا في مجالات مثل إنشاء كتب صوتية قابلة للتطوير ومتعددة اللغات ، والتعبير عن الشخصيات في ألعاب الفيديو ، والتعبير عن المقالات الرقمية ، ودعم ضعاف البصر للوصول إلى المحتوى المكتوب عبر الإنترنت وتشغيل راديو AI” قال.

اكتسب ElevenLabs ، الذي تم إطلاقه في مرحلة تجريبية في أواخر يناير ، زخمًا سريعًا إلى حد ما – نظرًا للجودة العالية للغاية للأصوات التي تم إنشاؤها ، وأوقات الجيل السريع والطبقة المجانية السخية. ولكن كما أشرنا سابقًا ، لم تكن الدعاية إيجابية دائمًا – لا سيما بمجرد أن بدأ الفاعلون السيئون في استغلال المنصة لتحقيق غاياتهم الخاصة.

أحد عشر مختبرات

يقدم ElevenLabs أدوات لاستنساخ – أو إنشاء من الصفر – أصوات تبدو واقعية ، والاستفادة من الذكاء الاصطناعي.

استخدمت 4chan ، لوحة الرسائل سيئة السمعة المعروفة بمحتواها التآمري ، أداة ElevenLabs لمشاركة رسائل بغيضة تحاكي المشاهير مثل الممثلة إيما واتسون. في مكان آخر ، تمكن جيمس فنسنت من The.Verge من النقر على ElevenLabs لاستنساخ أصوات الأهداف في غضون ثوانٍ – مما أدى إلى إنشاء عينات صوتية تحتوي على كل شيء بدءًا من التهديدات بالعنف وحتى التعبيرات عن العنصرية ورهاب المتحولين جنسياً.

رداً على ذلك ، قالت شركة ElevenLabs إنها ستقدم مجموعة من الضمانات الجديدة ، مثل قصر استنساخ الصوت على الحسابات المدفوعة ، وحظر المستخدمين الذين ينتهكون شروط الخدمة بشكل متكرر ، وتوفير أداة جديدة للكشف عن الذكاء الاصطناعي.

يتم تشغيل أداة الكشف اليوم. يسمى AI Speech Classifier ومتاح كواجهة برمجة تطبيقات للشركاء “المحددين” ، وهو مصمم لاكتشاف ما إذا كانت عينة الصوت التي تم تحميلها تحتوي على محتوى تم إنشاؤه بواسطة AI من ElevenLabs.

قال Staniszewski: “إن ضمان إمكانية تبني منصات الذكاء الاصطناعي التوليدية بأمان يمثل تحديًا رئيسيًا لقطاع الذكاء الاصطناعي بأكمله ، بما في ذلك المنصات النصية والصورة والصوتية”. “يجب أن نتأكد من تثقيف الأشخاص حول طبيعة المشهد الإعلامي التوليدي ومعرفة أن هذا المحتوى موجود – نحن ملتزمون ببناء أدوات لمساعدة الأشخاص على اكتشاف المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي ، من أجل الشفافية.”

أداة الكشف الطوعية – على افتراض أنها تعمل كما هو معلن عنها – لن تمنع بالضرورة السلوك السيئ. ولكن هناك فيل آخر في الغرفة لم يتعامل معه ElevenLabs: التهديد الوجودي الذي تشكله تقنيتها على الممثلين الصوتيين.

تكتب Motherboard عن كيفية مطالبة الممثلين الصوتيين بشكل متزايد بتوقيع الحقوق على أصواتهم بعيدًا حتى يتمكن العملاء من استخدام الذكاء الاصطناعي لإنشاء إصدارات اصطناعية يمكن أن تحل محلها في النهاية – في بعض الأحيان دون تعويض إضافي. تشير رسائل البريد الإلكتروني الداخلية التي شاهدتها صحيفة The New York Times ، إلى أن Activision Blizzard ، أحد أكبر ناشري الألعاب في العالم ، تعمل على أدوات “استنساخ الصوت” بمساعدة الذكاء الاصطناعي.

يبدو أن ElevenLabs ترى هذا على أنه تقدم طبيعي للأشياء ، حيث يروج لعملها مع ناشرين مثل Storytel ومنصات الوسائط مثل TheSoul Publishing و MNTN للكتب الصوتية وألعاب الفيديو والمحتوى الإذاعي. (ستوريتل و TheSoul Publishing مستثمران استراتيجيان.) تدعي الشركة أن لديها أكثر من مليون مستخدم مسجل عبر المساحات الإبداعية والترفيهية والنشر الذين ابتكروا محتوى صوتيًا لمدة عشر سنوات.

تخطط ElevenLabs لتوسيع نماذج الذكاء الاصطناعي الخاصة بها في نهاية المطاف لتشمل الدبلجة الصوتية ، وتتبع خطى الشركات الناشئة مثل Papercup و Deepdub وبناء ما تسميه “أساسًا لتكون قادرًا على نقل المشاعر والتنغيم من لغة إلى أخرى.”

كتب ElevenLabs في بيان صحفي: “سيمكن ذلك من دبلجة أي فيديو إلى أي لغة بطريقة جذابة وفعالة وقابلة للتطوير ، مع الحفاظ على صوت المتحدث الأصلي”. “[We are] أجرت بالفعل عددًا من الاختبارات مع شركاء الصناعة لتمكين دبلجة الذكاء الاصطناعي على نطاق واسع. “

مع وجود 21 مليون دولار في البنك (2 مليون دولار منها جاءت من جولة ما قبل التأسيس في يناير) ، تركز ElevenLabs – العواقب الملعونة – على هزيمة منافسيها في مجال الصوت التوليدي المزدهر. وهي تشمل الشركات القائمة مثل Amazon و Google و Microsoft بالإضافة إلى شركات ناشئة مثل Murf و Tavus و Resemble AI و Respeecher و Play.ht و Lovo.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى