Arabic Speech Recognition بسم الله الرحمن الرحيم التعرف الآلي على الكلام العربي Arabic Speech Recognition اشراف/د. عبدالملك السلمان تقديم عبد الله محمد النوح 420001846 أحمد إبراهيم الدوسري 421000495
محتويات البحث المقدمة. تاريخ التعرف الآلي على الكلام العربي. عيوب و ميزات التعرف الآلي على الكلام العربي. الصعوبات و العوائق. آلية العمل . الجهود المبذولة في تطوير هذه التقنية. التقنيات المساعدة و المساندة . مجالات الاستخدام. النظرة المستقبلية . الخاتمة.
المقدمة الكلام هو أسهل وسيلة لدى الإنسان للتواصل مع الآخرين. بداية التعرف الآلي على الكلام. ظهرت أجهزة تليفون قادرة على تنفيذ أوامر صوتية بسيطة مثل اتصل بالبيت أو بالعمل .
تاريخ التعرف الآلي على الكلام العربي تاريخ التعرف الآلي على الكلام العربي شركة IBM بدأت في تطوير هذه التقنية عام 1995م . في نهاية عام 1997م طوّرت الشركة نظام الإملاء على نظام التشغيل ويندوز95 . وفي أثناء ذلك بدأت شركة صخر في تطوير هذه التقنية . (Arabic Speech Recognition- ASR ).
عيوب و ميزات التعرف الآلي على الكلام العربي أولاً المميزات: سهولة الاستخدام. توفير الجهد و الوقت. السرعة في عملية الإدخال و انجاز العمل. ازدياد عدد المستخدمين للحاسب الآلي. لا يلزم وضع جسمي معيّن.
عيوب و ميزات التعرف الآلي على الكلام العربي ثانياً: العيوب: تأثير البيئة المحيطة بالمتحدث تأثير وسيلة الإدخال ( الميكروفون) . أن التعرف على الكلام يعتمد اعتماداً كلياً على صوت المستخدم . التكلفة العالية لمنتجات هذه التقنية .
الصعوبات و العوائق أولاً: بالنسبة للمشاكل المتعلقة بالتعرف الآلي على الكلام بصفة عامة: أن نطق الكلمة الواحدة يختلف من شخص إلى لآخر رغم أن الكلمة المنطوقة واحدة. أن نطق الشخص للكلمة قد يختلف من نطق إلى آخر رغم أن المتحدث واحد و الكلمة المنطوقة واحدة، وأيضاً يختلف بحسب سياق الكلمة المنطوقة في الجملة.
الصعوبات و العوائق ثانياً: المعوقات المتعلقة بالتعرف الآلي على الكلام العربي بشكل خاص: تعدد اللهجات . عدم وجود علامات تحدد بدء و انتهاء الكلمة خاصة في اللغة العربية . صعوبة التعرف على الكلام إذا كان في بيئة تتسم بالضوضاء و الصخب. تغير صوت المتكلم حسب حالته النفسية و الجسدية . كثرة الكلمات التي تشكل شمولاً للغة العربية و مفرداتها .
آلية العمل يوجد هناك نوعين من أنظمة التعرف الآلي على الكلام : الأول وهو التعرف على الكلام عن طريق تدريب النظام على صوت المستخدم بالنطق بكلمات محددة ليتعرف عليها النظام لاحقاً . أما النوع الثاني فهو التعرف على الكلام من دون عمل تدريب للنظام على صوت المستخدم على كلمات محددة. لتحقيق ذلك لابد من وجود نظام لمقارنة الاشارات الصوتية وهو ما يعرف ب pattern matching فكرة عمل هذا النظام هي تخزين الاشارات الصوتية لكل الكلمات فى ذاكرة الكمبيوتر بالإضافة إلى تخزين الاشارات الصوتية لكل صور النطق الممكنة للكلمة الواحدة.
آلية العمل باختصار شديد: يتم تسجيل الصوت عبر الميكروفون. تفلتر الموجة الصوتية و تنقى من الشوائب. تقطع الاشارة الصوتية الى مقاطع عدة . يتم التعرف على جنس المتحدث ذكرٌ ام انثى. يتم التعرف على اللغة و على اللهجة. يتم التعرف على الحروف و الكلمات، ويتم معالجتها نحوياً وصرفياً. يتم مقارنة الكلمات بما هو مخزن في قاعدة البيانات باستخدام نظام pattern matching . يتم ادراك المعنى من العبارة.
الجهود المبذولة في تطوير هذه التقنية أشهر شركتين في هذا المجال هما شركة IBM و شركة صخر. أولاً شركة IBM : يحتاج هذا النظام الى التدريب على خصائص المستخدم الصوتية من خلال نطق 95جملة اختيرت بعناية. وتحتاج هذه الخطوة إلى ما بين 20 دقيقة إلى 30دقيقة، و تتراوح نسبة الدقة فيه إلى ما بين 92إلى 97% . طريقة عمل هذا النظام: في البداية يتم معالجة الإشارات الصوتية وتحويلها إلى إشارات رقمية. تتم فلترت الصوت لإخراج الخصائص الصوتية. تتم عملية مقارنة الصوت مع نماذج إحصائية تمثل طريقة نطق الكلمات الموجودة بالقاموس المعرف للنظام . بدأت في تطبيق هذه التقنية على نظام الرد الآلي للمكالمات الهاتفية.
الجهود المبذولة في تطوير هذه التقنية ثانياً شركة صخر: تستخدم تقنيات مساعدة مثل معالجة اللغة الطبيعية و المشكل الآلي و المصحح الآلي. تعتمد على ثلاثة محركات: محرك معالجة الإشارات الصوتية. محرك المطابقة السمعية. محرك البرمجة الديناميكية. فشلت الشركة في نشر هذه الإمكانيات التي تمتلكها و البرامج أيضاً في السوق العربية و العالمية و خاصة على مستوى المستخدمين الأفراد .
التقنيات المساعدة و المساندة لها أولاً: تقنيات برمجية: معالجة اللغة الطبيعية . التصحيح الآلي . التشكيل الآلي . تقنية مايكروسوفت SDKوالتي تعتمد على (Speech Application Language Tags- SALT-) . ثانياً تقنيات عتادّية: سرعة المعالجات . سعة حجم الذاكرة . الوسائط المتعددة .
مجالات الاستخدام مجال المكالمات الهاتفية (الاتصال السريع). مجال المكالمات الهاتفية (الاتصال السريع). الرد على لمكالمات الهاتفية (البدّالة). مجال الاستعلام في الدليل الهاتفي. مجال الاستعلام عن رحلات الطيران . مجال الاستعلام عن أسعار الأسهم والعملات . مجال الأعمال المكتبية (كتابة التقارير و الخطابات). مجال مساعدة المكفوفين في الكتابة . مجال مساعدة ذوي الاحتياجات الخاصة مثل المعوقين جسدياً. مجال الانترنت ( البريد الإلكتروني) .
النظرة المستقبلية مدى دقة و جودة التحويل . استخدامها في المجالات الحساسة كالمجال العسكري مثلاً. مجال التحدث إلى الروبوتات . استخدامها في تصفح الانترنت بالصوت . القدرة على بناء مترجم آلي كامل و فوري. إمكانية استخدامها في تصحيح تلاوة القران الكريم . إمكانية استخدامها في تعلم اللغة العربية . مجال الأمن و الحماية (البصمة الصوتية).
الخاتمة وفي الختام نتمنى أن نكون قد قدمنا ما هو نافع و مفيد . وفي الختام نتمنى أن نكون قد قدمنا ما هو نافع و مفيد . هذا والله اعلم وصلى الله وسلّم على نبينا محمد وعلى آله و صحبة أجمعين، والسلام عليكم ورحمة الله وبركاته.