تجمع Voice.ai مبلغ 6 ملايين دولار نظرًا لأن مغير الصوت في الوقت الفعلي يقترب من 500 ألف مستخدم


لقد دفعت خدمات مثل Midjourney و ChatGPT حدود كيف يمكن للذكاء الاصطناعي إنشاء الصور والنصوص من مطالبات النص الأساسية. الآن ، يبدو أن الصوت هو الحد التالي الذي لا مفر منه. لقد شهد إنشاء الموسيقى استنادًا إلى مطالبات الكلمات ومعلمي الذكاء الاصطناعي لتعلم اللغة والمحاكاة الصوتية تطورات في الأشهر الأخيرة. تأمل Voice.ai أن تكون جزءًا من تلك المحادثة (هيه) مع التكنولوجيا التي تتيح للمستخدمين تغيير (وإخفاء) أصواتهم في الوقت الفعلي ، وقد جمعت الآن أول تمويل خارجي لها في أعقاب النمو المبكر.

مع أكثر من 480.000 مستخدم ومكتبة تضم أكثر من 50000 مرشح صوت ، جمعت Voice.ai مبلغ 6 ملايين دولار ، بتمويل تخطط لاستخدامه لنقل تقنية تغيير الصوت إلى أماكن جديدة.

يتصدر Mucker Capital و M13 الجولة. قبل الآن ، نمت Voice.ai من خلال الحديث الشفهي – تمتلك الشركة الناشئة قناة Discord مع أكثر من 120،000 شخص – على خلفية تمويل ذاتي بقيمة 3 ملايين دولار.

يتم اعتماد أدوات الشركة حاليًا – المتوفرة كتطبيقات لأجهزة Mac و PC و Android و iOS – من قبل اللاعبين ومنشئي المحتوى و Vtubers وغيرهم على TikTok و Zoom و Discord و Minecraft و GTA5 و Fortnite و Valorant و League of Legends و بيننا و Skype و WhatsApp ومنصات أخرى. تتيح لهم واجهة Voice.ai إنشاء صوت جديد ، أو الاختيار من بين حوالي 50000 صوت مختلف تم إنشاؤه مسبقًا (تم إنشاؤها ومشاركتها بواسطة مستخدمين مثلهم) ، والتي يمكن استخدامها كما هي أو تعديلها ، لاستخدامها مباشرة في الأنظمة الأساسية المدعومة ، أو للتسجيلات.

تتمثل الخطة في استخدام التمويل لتوظيف المزيد من المواهب الفنية وبناء حزم SDK وواجهات برمجة تطبيقات جديدة للعمل مع منصات أخرى مثل Meta و Unreal و Unity ؛ جلب دعم متعدد اللغات ؛ وإضافة تطبيقات جديدة مثل الغناء حيث يكون الصوت في مركز الصدارة.

لا تفرد الشركة الناشئة ذلك ، ولكن سيكون من المثير للاهتمام معرفة ما إذا كانت تستخدم بعض التمويل أيضًا لزيادة سعة الخادم.

هذا ليس عبئا بسيطا. من خلال القصص المتناقلة ، سمعنا أن ألم وحدة معالجة الرسومات هو أحد أكبر العوامل المحورية في مدى قدرة الكثير من تطبيقات الذكاء الاصطناعي على التوسع في الوقت الحالي. (هذا جزئيًا سبب رؤيتك لصفقات كبيرة يتم إجراؤها تتضمن إستراتيجيات توفر المعالجة وسعة الخادم).

بالنسبة إلى Voice.ai على وجه التحديد ، تتم معالجة صوتك محليًا وتوجيهه إلى أي مكان سيتم استخدامه من خلال ما وصفه لي المؤسس والرئيس التنفيذي هيث آرينز بأنه “كابل صوت افتراضي”. ولكن عندما تنظر إلى مراجعات تطبيقاتها ، فإن الأسى الشائع هو أنه عندما تقوم بالتسجيل ، يتم وضعك في قائمة الانتظار لأن “الطلب الهائل يجعل خوادمنا بأقصى سعة” مع وعد بإبلاغك عندما تزيد الخدمة من ذلك سعة.

هناك العشرات من خدمات تحويل الكلام إلى صوت وتحويل الصوت إلى كلام في السوق اليوم ، وهناك بالفعل الكثير من النشاط فيما بينها: استحوذت Spotify العام الماضي على Sonantic واشترت Snap مساعد صوت AI حتى قبل ذلك ؛ شركة ناشئة أخرى ، Sanas ، تعمل على تغيير لهجتك وهناك محاكيات الصوت Murf و Acapela ، من بين العديد من الآخرين. تعد Voice.ai نفسها في نفس الفئة العامة مثل Respeecher و ElevenLabs ، وهما شركتان ناشئتان تعملان بالذكاء الاصطناعي للصوت إلى الصوت ، مما يسمح للمستخدمين بتطبيق أقنعة لتعديل أصواتهم أو تحويلها بالكامل – وفي بعض الحالات يتم إنشاء أصوات اصطناعية تمامًا بدلاً من الشيء الحقيقي.

Respeecher ، التي تأسست ومقرها أوكرانيا ، صنعت اسمًا لنفسها من خلال المساعدة في بناء صوت جديد لـ Darth Vader لأقساط Star Wars الجديدة ، استنادًا إلى الطريقة التي بدا بها جيمس إيرل جونز قبل 45 عامًا عندما بدأ الدور. (تمشيا مع شخصية عازمة على تدمير العوالم ، تم تسليم صوت دارث إلى عميل هوليوود من مكاتبها في أوكرانيا بينما كانت روسيا تسير إلى البلاد).

قامت شركة ElevenLabs – الشهيرة (أو سيئة السمعة كما قد تكون الحالة) – ببناء منصة جيدة بشكل مخيف في استنساخ الأصوات ، وفي وقت سابق من هذا الشهر حصلت على أحدث جولة تمويل بقيمة 19 مليون دولار من مجموعة من كبار المستثمرين.

تحاول Voice.ai ، في هذا المزيج ، أن تضع نفسها على أنها تطبيق تعديل صوت AI لـ Everyman.

قال آرينز لـ TechCrunch في رسالة بريد إلكتروني: “هناك الكثير من الشركات التي تحاول تقديم نكهة مختلفة لتكنولوجيا الصوت للشركات” (ومن المفارقات أنه لم يكن من الممكن ترتيب مقابلة مباشرة معه). يتمتع Ahrens ببعض الخبرة في بناء تقنية B2B AI: شركته السابقة – iSpeech لتحويل النص إلى كلام و Haystack للتعرف على الوجوه – مبنية على عروض API.

“ما يميز Voice.ai هو أننا نركز على جلب التكنولوجيا التي كانت مخصصة سابقًا لشركات المؤسسات إلى أيدي المستهلكين مباشرةً وبأسلوب ميسور التكلفة.” وأشار إلى أن العديد من المستخدمين “يأتون إلينا من مغيرات الصوت ومعدلات الصوت DSP الكلاسيكية التي كانوا يستخدمونها في الماضي والتي لا تزال تحظى بشعبية بين العديد من اللاعبين.”

تأتي كلمة “ميسور التكلفة” في مستويين ، حيث يستخدم معظم المستخدمين الآن خدمة مجانية تتطلب منهم الاشتراك في توفير قوة حسابية لتدريب نماذج Voice.ai ، مع خدمتها المبنية على مجموعة بياناتها الخاصة المؤلفة من “ملايين المستخدمين الفريدين . ” لا يوجد أسعار على الموقع: نحن نطلب هذه التفاصيل.

وأضاف آرينز: “نحن نؤمن بجعل التكنولوجيا في المتناول ونخطط للعمل جنبًا إلى جنب مع مجتمع المصادر المفتوحة لإضفاء الطابع الديمقراطي على تكنولوجيا الذكاء الاصطناعي الصوتي”.

تدعي Voice.ai أيضًا أنها تتخذ نهجًا مختلفًا جوهريًا لتحدي تغيير الصوت ، والاستفادة من بعض الروح التي نشأت حول استخدام الصور الرمزية من قِبل Vtubers واللاعبين وغيرهم عبر الإنترنت.

قال أرينز: “تحاول معظم شركات الذكاء الاصطناعي الصوتي التي تأتي إلى الفضاء بناء حلول تحويل النص إلى كلام قابلة للتطوير للمؤسسات أو خدمات تحويل الصوت إلى صوت باهظة الثمن لاستوديوهات الإنتاج”. “نبدأ من الطيف الآخر ونحاول تقديم قيمة للأفراد الذين يتطلعون إلى توسيع نطاق صوتهم عبر الإنترنت. إن اقتراح القيمة الأساسية للذكاء الاصطناعي الخاص بتحويل الكلام إلى كلام ليس أنه يمكنه تكرار أي شخص بشكل مثالي. إنه يحتفظ بالعناصر الأساسية لخطاب المستخدم: عواطفه وسرعته وتركيزه أثناء استبدال صوت الصوت ، من أجل إنشاء نتيجة نهائية جديدة وفريدة تمامًا ، في الوقت الفعلي “.

قد يكون ذلك بسبب انحراف التركيبة السكانية في المنصات التفاعلية مثل الألعاب ، ولكن في الوقت الحالي ، فإن جمهور Voice.ai هو 70٪ من الذكور مقابل 30٪ من الإناث مع فتح فئات جديدة ليس فقط حول من يستخدم التكنولوجيا ، ولكن لماذا.

لا يشمل ذلك فقط أولئك الذين يستخدمون الصور الرمزية ويبنون الأصوات لمطابقتها ، أو أولئك الذين يبحثون عن المزيد من حماية الخصوصية ، ولكن أيضًا ، كما قال ، “المستخدمون المتحولين جنسياً الذين يمكنهم تمثيل أنفسهم بأصوات تتطابق مع هويتهم ، وكذلك المستخدمين الذين يستكشفون الجديد تمامًا عبر الإنترنت شخصيات لأنفسهم “.

هناك بالفعل قاعدة من المستخدمين الذين يستفيدون من عروض Voice.ai الموجهة للمستهلكين ، ولكن أحد الأسباب التي تجعل Mucker يستثمر في الشركة الناشئة هو اعتقاده بوجود فرصة لبناء شبكة من المطورين باستخدام ودمج تقنيتها.

قال عمر الحموي ، الشريك في شركة Mucker Capital ، المستثمر الرئيسي: “إن Voice.ai على وشك إحداث ثورة في مجتمع مطوري الذكاء الاصطناعي بطريقة تشبه تأثير AdMob على مجتمع مطوري تطبيقات الأجهزة المحمولة”. (أسس الحموي سابقًا شركة AdMob الناشئة لإعلانات الجوّال ، واستحوذت عليها Google في النهاية ، لذلك لديه بعض الخبرة المباشرة في بناء أدوات مطوري الأجهزة المحمولة.) المطورين في جميع أنحاء العالم. “

قال كارل العمر ، مدير العمليات السابق لشركة Digital Ocean ، الذي قاد الاستثمار في M13 ، إن المستثمرين سيضطلعون بدور نشط في المرحلة التالية من التطوير. قال: “في Digital Ocean أيضًا ، رأينا قيمة بناء مجتمع من البناة بواسطة البناة”. “نحن متحمسون للمبدعين والمطورين للبناء على منصة Voice.ai.”

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى