كشف مركز الأبحاث والتطوير التابع لشركة "بايدو"، الصينية المتخصصة فى مجال تقديم خدمات الإنترنت، عن إطلاق برنامجها للتعرف على الكلام "Speech Recognition " والذي يعتمد على مفهوم التعلم العميق " Deep Speech" أحد أهم تقنيات الذكاء الاصطناعي أو " تعلم الكمبيوتر"، وذلك يهدف إلى توفير أفضل تجربة بحث ممكنة عن طريق الأوامر الصوتية على شبكة الإنترنت في جميع الأسواق التي تعمل بها الشركة حالياً. ونجحت مركز أبحاث "بايدو" من خلال إجراء العشرات من الأبحاث المتخصصة في تقنيات "Deep Speech" في تحسين نتائج البحث عبر الصوت ومهمات الحوسبة عن طريق تدريب أجهزة الكمبيوتر على العمل أكثر على غرار العقل البشري خاصةً في مجال الاستجابة للأوامر الصوتية والصور الرقمية والتي تتطلب أجهزة وبرمجيات يمكنها أن تتعلم التعرف على الأغراض، وفهم السياق، وتقوم بالربط كما يفعل أي شخص. وأكدت الشركة أنه بناء على نتائج اختباراتها الأخيرة في مجال "التعلم العميق" ، فأنها تمكنت بصورة حقيقية فى زيادة وتحسين كفاءة برنامج " التعرف على الكلام " وتخفيض معدل الخطاء إلى نحو 16.5 % فقط كذلك نجحت الشركة فى تخطى كل من "جوجل ومايكروسوفت وأبل " في مجال التعرف على الكلام "Speech Recognition" بنسبة تتجاوز 10 % من حيث صحة المعلومات التى يوفرها البرامج مقارنة مع المشروعات المماثله في كل جوجل "Google Web Speech, wit.ai" وكذلك "مايكروسوفت" ing Speech Services " وشركة "آبل" Apple Dictation". كما أن نظام "Deep Speech" ، الذي طورته" بايدو " غير مسبوق لأنه يستطيع التعرف على الكلام مع وجود الضوضاء (مثل الزحام، في المطعم،—-..الخ) بكفاءة تصل إلى 81%، بينما بلغت أفضل درجة للأنظمة التي تنتجها شركات مثل "جوجل ومايكروسوفت " ، والتي لم تُصمم أصلًا للعمل في الضوضاء، نحو 65% فقط، الأمر لا يتوقف على الشركات التجارية فحسب، بل إن نظام "بايدو " يتفوق حتى على الأنظمة المُستخدمة في الجامعات البحثية. ومن جانبه، قال الدكتور أندرو نج، كبير العلماء في " بايدو " وعالِم الكمبيوتر الشهير والخبير في مجال الروبوتات والتعلّم الآلي ، إن أبحاث الشركة المتنامية في أحد فروع الذكاء الاصطناعي المعروفة باسم "التعلّم العميق " وانتاج اكثر من 100ألف ساعة من " Synthesized Data " ، تهدف إلى تحسين نتائج البحث والتعرف على الكلام الامر الذى يفتح الباب على مصراعيه امام ما يعرف بمفهوم "إنترنت الأشياء" وتزايد اعتماد مئات الملايين من البشر على الهواتف المحمول الذكية والأجهزة اللوحية، مؤكداً أن الفائز فى مجال " الذكاء الاصطناعي " هو من سيستطع الفوز والسيطرة على سوق خدمات الانترنت سواء فى الصين أو في كافة أنحاء العالم واعتقد ان " بايدو" تملك أفضل فرصة لتحقيق ذلك. ومن ناحية أخرى، أكد الدكتور دان جيرفسكى ، أستاذ اللغويات وعلوم الحاسب الآلي في جامعة ستانفورد، أن أحد أهم مزايا نظام " Deep Speech" الذي تطوره "بايدو" هو البساطة والسهولة في وضع نظام هندسي لجمع البيانات، وذلك اعتماداً على مهاراتها فى البرمجة ، بجانب توظيف سرعات معالجة الرسومات ومرونتها العالية وقدرتها على المرونة والتطوير، إذ تشير النتائج لنجاح " بايدو " في الظاهر بعض الاتجاهات المثيرة حقاً على المدى القريب في مجال برامج التعرف على الكلام، وخاصةً في البيئات صاخبة والمهام الصعبة الكلام "oisy Environments and Challenging Speech Tasks " والتي ما تزال صعبة وتشكل تحدى كبير للشركات المافسة وم ثمة تمتلك " بايدو " فرصة كبيرة لتصبح لاعباً أساسياً في مجال التكنولوجيات الحديثة مثل الذكاء الاصطناعي وهى أحد المجالات التي يمكها ان تمييز نفسها عن الآخرين. ووصف الدكتور إيان لين، أستاذ مساعد بحوث الهندسة جامعة كارنيجي ميلون، ابحاث "بايدو " فى مجال " التعلم العميق " بالابتكارية اذ تساعد على انتقالا خطوة واسعة فى مجال التحدث بشكل طبيعى مع الاجهزة الذكية " الهواتف المحمولة والكمبيوترات اللوحية والروبوتات و الاجهزة القابلة للارتاد " وحتى فى البيئات الصاخبة موضحا انه منذ تزايد أهتمام شركات التكنولوجيا العالمية بتقنيات" التعلم العميق " من 4 سنوات تقريبا ، ظهرت قدراتها وتطبيقاتها المحتملة باستخدام هذه التقنية والتى يمكنك بناء أنظمة تتعلم ذاتيًا بدون توجيه صريح " Unsupervised Learning" .