Download presentation
1
التحليل الصرفي للغة العربية
تقديم: ثامر الحصين عمر صالح
2
التحليل الصرفي للغة العربية
المقدمة خليفة الموضوع دراسة مسحية للتحليل الصرفي للغة العربية برامج تحليل الألفاظ العربية المبنية على القواعد
3
المقدمة نظرة عامة إلى المشكلة الهدف من الدراسة
4
نظرة عامة إلى المشكلة النمو السريع للمعلومات.
تطور العديد من الأدوات المساعدة في إدارة المعلومات. أصبحت تقنيات التحليل الصرفي العربية مجالا دارجا للبحث. معالجة اللغات السامية مثل اللغة العربية مهمة غير سهلة. اللغة العربية لديها درجة عالية من الغموض. العمل على اللغة العربية لا يزال في مرحلة البزوغ. خدمة اللغة العربية بحد ذاتها هدفا أساسيا.
5
الهدف من الدراسة عرض موجز لنماذج مختلفة من أساليب معالجة التحليل الصرفي للغة العربية مع تصنيفها. تقديم عرض أكثر تفصيلا لإحدى هذه الجهود الجديدة.
6
خلفية الموضوع قياس فاعلية أسلوب التحليل الصرفي لغات الصرف
التحليل الصرفي واسترجاع المعلومات
7
قياس فاعلية أسلوب التحليل الصرفي
إن قياس فاعلية أي محلل للصرف تعتمد على عدة عوامل أهمها: الفاعلية صحة النتائج السرعة قلة نسبة الخطأ ثنائية الاتجاه صغر الحجم
8
لغات الصرف تختلف اللغات بشكل واضح من ناحية التعقيد الصرفي.
اللغة الإنجليزية هي أبسط من بعض اللغات الأخرى مثل العربية والعبرية من الناحية الصرفية. عملية إزالة الزوائد في اللغة الإنجليزية واللغات المشابهة لها أبسط مما هي في اللغة العربية. الفرق الرئيسي بين اللغة العربية وغيرها من اللغات هي أنها اشتقاقية أما اللغات الأخرى فهي تسلسلية.
9
التحليل الصرفي واسترجاع المعلومات (1)
حتى الآن، لم تظهر أي خوارزمية قياسية لاسترجاع المعلومات. استرجاع المعلومات العربية يمكن تطويره، حينما تستخدم الجذور في عملية الفهرسة والبحث. لكن، الصرف العربي معقد.
10
التحليل الصرفي واسترجاع المعلومات (2)
الدراسات المنشورة للمقارنة بين استخدام الجذور واستخدام الجذوع لاسترجاع المعلومات متباينة ومختلفة: الدراسات القديمة تذكر أن فهرسة الجذر يتفوق في الأداء على فهرسة الجذع في أداء عملية الاسترجاع. دراسات أحدث: عدم وجود اختلاف كبير بين الجذور والجذوع. الاسترجاع المعتمد على الجذع أكثر فعالية من الاسترجاع المعتمد على الجذر. الدراسات القديمة التي تظهر تفوق الجذور على الجذوع تعتمد على مجموعة اختبارات صغيرة وغير قياسية. استخدام الجذر في الاسترجاع يزيد من غموض الكلمة.
11
دراسة مسحية للتحليل الصرفي للغة العربية
12
تصنيفات مقترحة أسلوب جدول البحث الأساليب اللغوية الأساليب التوليفية
الأسلوب المعتمد على القواعد
13
أسلوب جدول البحث جميع الكلمات العربية المقبولة بالإضافة إلى تفكيكاتها الصرفية مخزنة في جداول كبيرة جدا. الكلمة المعطاة تحلل ببساطة عن طريق دخول الجدول واسترجاع المعلومات المتعلقة بذلك المدخل. الحاجة إلى جهد كبير جداَ.
14
الأساليب اللغوية تستفيد من القواعد اللغوية.
مثل هذه الأساليب اللغوية هي أكثر دقة. ولكنها، تتطلب عدد كبير جداً من القوائم. الميكانيكية لإزالة الزوائد هي تقريباً عملية تجربة وخطأ. الأفندي أعطى إطاراً للعمل: مصفوفات التوافق.
15
الأساليب التوليفية هي عمليات تجربة وخطأ.
تتم مقارنة جميع التشكيلات للحروف من كلمة معطاة مع مجموعة من الجذور. تأخذ وقت طويل للمعالجة.
16
الأسلوب المعتمد على القواعد
أسلوب جديد مقترح. يستغل هذا الأسلوب التشابه الملحوظ للكلمات العربية المولدة. يتم التوليد عن طريق إضافة/إزالة جميع الزوائد المقبولة.
17
برامج تحليل الألفاظ العربية المبنية على القواعد
يتم تطبيع الكلمات المستخلصة بإزالة حروف العلة. تخزن الكلمات في ملف ثنائي بنفس ترتيب النص الأصلي. حفظ ترتيب الكلمة يسهل استنتاج المعنى النصي لأي كلمة. بنية الكلمة في الملف الثنائي: هوية الكلمة الكلمة السابق الجذع اللاحق عدد القواعد المؤدية إلى التحليل سلسلة القواعد المتشابهة هوية القاعدة الصحيحة الحالة
18
المادة اللغوية لتصميم المحللات الصرفية واختبارها
عادةً يكون النص الطبيعي ملي بالأخطاء الإملائية. يتم تصحيح الأخطاء شبه أوتوماتيكياً. الجدول التالي يعرض بعض الأمثلة للأخطاء الإملائية: الخطأ الإملائي أمثلة تهجئة الكلمات الأجنبية انترنت و انترنيت الأسماء المركبة عبد الرحمن و عبدالرحمن الخلط بين الحروف هره و هرة أنباء و انباء على و علي
19
بناء القواعد صيغ القاعدة يتم بناؤها باستخدام الوسائل التالية:
<str> لمطابقة سلسلة الحروف str ولحذفها إذا كانت في جزء الجذع أو اعتبارها سوابق/لواحق إذا كانت في جزء السوابق/اللواحق. <s1 ^s2> لاستبدال s1 بـ s2. والعلامة التالية <^s2> تستخدم للإضافة. <> قوس فارغ لتمثيل عدم وجود سوابق أو لواحق. .n لمطابقة عدد n من الحروف, حيث n رقم صحيح أكبر من الواحد. ويرمز للحرف الواحد بنقطة واحدة.
20
مثال تطبيقي القاعدة المطبقة الكلمة النتائج السوابق الجذوع اللواحق 3.
على <ال>3.<ية> النارية ال نار ية <ال><أ>2.<^ا>.<ة><> الأتربة تراب <ولل>3.<ات^ة> وللمسرات ولل مسرة ات <ب><ه> به ب هـ <وال><أ><ئ^ؤا>.<ة><> والأفئدة وال فؤاد
21
مثال النص ”ظهرت لغة سي في بداية السبعينات“
النص ”ظهرت لغة سي في بداية السبعينات“ تحليل كلمات النص المعطى كما يلي: الرقم الكلمة التحليل 1 لغة: لغة غة لغ لغية 2 سي: سي 3 ظهرت: ظهر ظهرت 4 لغة: لغة غة لغ لغية 5 سي: سي 6 في: في 7 بداية: داية بدا بداي بدية 8 السبعينات: سبعين سبعينة سبعينات السبعينات
22
الخاتمــــــــــــــة
الحمد لله رب العالمين وصلى الله على نبينا محمد وعلى آله وصحبه أجمعين وشكراَ
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.