تتفوق Speechmatics على Google في التعرف على الأصوات

تتفوق Speechmatics على Google في التعرف على الأصوات

تقول شركة Speechmatics إن أصول الكلام البريطاني ، وتقنيات التعرف على الصوت أفضل من شركات التكنولوجيا الكبرى مثل Google و Amazon في فهم أصوات السود.

يقول Speechmatics إن نظامه لديه درجة دقة مثالية تبلغ 83 بالمائة للناخبين الأمريكيين من أصل أفريقي.

وهذا أعلى من مايكروسوفت (73 بالمائة) وأمازون (69 بالمائة) وجوجل (69 بالمائة) وأبل (55 بالمائة) ، وفقًا لبحث نشرته جامعة ستانفورد في عام 2020.

قارن البحث في جامعة ستانفورد نتائج شركات التكنولوجيا الكبرى بدقة برامج الاتصال الكلامي التي يفهمها الأمريكيون من أصل أفريقي.

علاوة على ذلك ، ارتكبت أنظمة أمازون وجوجل ومايكروسوفت وأبل ما يقرب من ضعف عدد الأخطاء عند تحديد الكلمات التي يتحدث بها الأمريكيون من أصل أفريقي وليس البيض ، وفقًا لباحثين في جامعة ستانفورد.

تقول Speechmatics إن نظامها لا يتعرف على الكلمات من الأصوات السوداء بنسبة 17٪ من الوقت ، مقارنة بنسبة 31٪ في Google و Amazon.

قالت أليسون كوينيكي ، مؤلفة دراسة ستانفورد: "من المهم التحقيق وتعزيز المساواة في ممارسات تناقل الحديث بسبب احتمالية الضرر الفردي من خلال المستويات الأدنى التي تتراوح من الرعاية الصحية إلى العدالة الجنائية".

أصبحت تقنية التعرف على الصوت جزءًا لا يتجزأ من الحياة اليومية ، وذلك بفضل انتشار المساعدات التقنية من خلال الأجهزة الذكية مثل الهواتف ومكبرات الصوت.

كانت Apple رائدة في استخدام البرامج التي يتم تنشيطها صوتيًا على الأجهزة المحمولة من خلال مساعدها الرقمي Siri.

بينما كانت أمازون واحدة من أولى الشركات التي قدمت التعرف على الكلام داخليًا من خلال مكبرات الصوت Echo ومساعدة Alexa.

التحيز في تقنية التعرف على الصوت

يتزايد قلق الباحثين بشأن التحيز في الخوارزميات التي تدعم خدمات التعرف على الكلام هذه.

يقول الخبراء إن العديد من البرامج تكتشف الأصوات التي يتم تدريسها على مجموعات محدودة من السجلات ، مما يقلل من الفعالية.

يتعلق بجودة البيانات في مجموعات التدريب. وكان هناك تمييز وتحيز وإقليمية في تكنولوجيا الكلام لفترة طويلة. وهذه التكنولوجيا لا تعمل بالطريقة نفسها مع الجميع.

قالت Speechmatics إنها دربت الذكاء الاصطناعي على المعلومات غير المعلنة من وسائل التواصل الاجتماعي والبودكاست. هذا يساعدها على تعلم أجزاء مختلفة من الكلام بما في ذلك اللغة والقواعد.

علاوة على ذلك ، تقول الشركة إن تقنياتها مدربة على 1.1 مليون ساعة من الصوت. وصف علماء النطق التطور بأنه اضطراب.

ويأمل أن تكون شركات التكنولوجيا الأخرى أكثر وضوحًا بشأن الجهود المبذولة للحد من التحيز في الذكاء الاصطناعي.

ونتيجة لذلك ، زاد التقنيون من استثماراتهم في الترويج للخطابات الأخيرة. وافقت مايكروسوفت على الاستحواذ على شركة البرمجيات Nuance Communications مقابل 16 مليار دولار في أبريل.

المصدر




وضع القراءة :
حجم الخط
+
16
-
تباعد السطور
+
2
-