التحليل الصرفي للغة العربية

Slides:



Advertisements
Similar presentations
Conjunctions الروابـــــــــط.
Advertisements

Question-Tags الأسئلة المذيلة
المقدمه انتشار الحاسب . حالة العالم العربي : الحكومات والمنظمات .
Adverbsالظروف [الأحوال]
نظام حاسوبي لتشكيل النص العربي(المشكل الآلي) ICS484 الحوسبة العربية صقر العريفي فريق: ابداع.
المطيافية الذرية: تحليل المواد لمعرفة عناصرها
تعريب لوحة المفاتيح والشاشة
أنظمة العد الدرس الثاني.
مجالات التعلّم المستويات الأهداف النماذج المطلوبة الكلمات المفتاحية نظرة عامة عن المشروع الوصف البرمجيات المؤلفون المصادر.
منصور البصيلي خالد الزهراني
الفجوة الرقمية اعداد : محمود الضامن.
إدارة وتنمية مصادر المعلومات Information Resource Management (IRM)4.
أطاعن خيلا الشاعر المتنبي.
محرر قواعد التحليل الصرفي المصدري تصميم و تنفيذ : يوسف بن عبد الرحمن السحيباني هاشم بن علي الشبعان.
المبني والمعرب من الأسماء
كتابة المعادلات الرياضيه لمحرر الرياضيات العربي Math Braille
التعرف الآلي على الكلام العربي
الأجسام الصلبة والسوائل والغازات
كيفية عرض المكونات Hit Counter: يجب تخزينها ونشرها على موقع الويب (الخادم) Hover Button: يجب تخزينها وعرضها من الأمر Preview on Browser من قائمة File.
Reported Speech الكلام المنقول
تعريبــ محركات البحث إعداد الطلاب: 1 حسان وليد العبيداء.
الفصل الحادي عشر الطوارئ الإشعاعية
خطوات عملية باتجاه تطبيق مفهوم البحث بالمفاهيم لمحركات البحث والاسترجاع العربية حيدر العميد، شيخة الكتبي، آمنة الكعبي، خديجة الشبلي، نيلا الشامسي، نورة.
التعرف الآلي على الكلام المنطوق العربي
الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد،
محركات البحث العربية بواسطة: عبد الله عتيق العامر
محرك البحث الإدريسي غزوان البريكان
بسم الله الرحمان الرحيم
Workshop on Demographic Analysis and Evaluation. Mortality: Model Life Tables الوفيات: نموذج جداول الحياة.
Workshop on Demographic Analysis and Evaluation. Mortality: Assessing Completeness of Reporting الوفيات: تقييم مدى اكتمال الإبلاغ.
Review: Program Memory Addresses Program addresses are fixed at the time the source file is compiled and linked يتم إصلاحها عناوين البرنامج في الوقت يتم.
تقسيم الشبكات Subnetting
أعضاء الفريق 1- علي الدسوقي. 2- محمد عباس. 3- أحمد جمعة أحمد. 4- أحمد علاء. جميع الحقوق محفوظة لـفريق جيل المستحيل | ثانوية الملك عبد العزيز.
Alphabet game…. Think of a word – Your partner has to guess that word – you can give ONE word clues – no YES/NO responses allowed!!
مقدمة قواعد بيانات - أوراكل الفـصـل الــرابــع دوال الصف الواحد أ. جمانه الحازمي.
دبلوم الإرشاد الأسري. phrasal verb  The term phrasal verb is commonly applied to two or three distinct but related constructions in English: a verb and.
أهداف الدرس 1 ما هي محركات البحث ؟ Search engines
حظيرة 1 حظيرة 2 حظيرة 3 عدد الوحدات التجريبية = 6 عدد وحدات المعاينة = 12.
لنفرض أن هدف التجربة هو مقارنة صنفين من السماد (A و B) من حيث كمية محصول نوع معين من القمح.
Welcome, Students!. The Randomized Complete Block Design (RCBD) Dr. Zelal AL_Saftli Hama University Animal Production Department.
الأمثلة : ادّعى رجل النبوّة ايام الخليفة المأمون أعلم الناس القاضي يحيى بن أكثم ألق عصاك وصيّرها ثعبانا كما فعل الكليم موسى
10 0× 1 = 4× 4 = (وحدات)4 10 1× = 5 50 = (عشرات)5
تابع :تطبيع البيانات.
تابع الفصل الثاني: مبادى البناء ونماذج العلاقات لقواعد البيانات
المخدم الرئيسي في الشبكات
تابع جمل التحكم و معالجة الاستثناءات
إختر عنواناً لمشروعك يكون بسيطاً ويشد الانتباه!.
نظرية تدفق الاتصال على مرحلتين
نظام التشغيل Windows xp.
سياسات واستراتيجيات البحث
الفصل الثالث حصر و ترتيب البيانات.
Programming -2 برمجة -2 المحاضرة-1 Lecture-1.
مبادئ نظم وتقنية المعلومات (تال 101د)
Electronic Payment Systems أنظمة الدفع الالكتروني
مشكلة مصرية:الأمية.
مهارة التنظيم المتقدم تعريف مهارة التنظيم المتقدم Organizing in Advance هي تلك المهارة التي تستخدم من اجل ايجاد اطار عقلي او فكري يستطيع الافراد عن طريقه.
أ.إسراء الطريقي , 306 عال , المحاضره الثالثه
معالجة الاستثناءات.
البحث عن المعلومات على الانترنت
3. Browsing the Web تصفح الانترنت
التعرف على الخط العربي المكتوب يدوياً
Gateway (بوابة العبور أو الاتصال)
Non Accidental Death- 24 April 2013
User ID Symbol Description Site Engineer SE Office Engineer OE N/A SF
مصادر على شبكة الانترنت
Comparative and Superlative المقارنة والتفضيل
تعاريف أخرى للحموض و القواعد
العلاقة مع المصادر Source Relationship.
هيكلة نظم إدارة قواعد البيانات (DBMS Architecture)
بســـم الله الرَّحمن الرَّحيم. ثانوية الشيخ بوعمامة قسم سنة ثالثة علوم تجريبية مادة العلوم الطبيعية.
Presentation transcript:

التحليل الصرفي للغة العربية تقديم: ثامر الحصين 421002106 عمر صالح 420008632

التحليل الصرفي للغة العربية المقدمة خليفة الموضوع دراسة مسحية للتحليل الصرفي للغة العربية برامج تحليل الألفاظ العربية المبنية على القواعد

المقدمة نظرة عامة إلى المشكلة الهدف من الدراسة

نظرة عامة إلى المشكلة النمو السريع للمعلومات. تطور العديد من الأدوات المساعدة في إدارة المعلومات. أصبحت تقنيات التحليل الصرفي العربية مجالا دارجا للبحث. معالجة اللغات السامية مثل اللغة العربية مهمة غير سهلة. اللغة العربية لديها درجة عالية من الغموض. العمل على اللغة العربية لا يزال في مرحلة البزوغ. خدمة اللغة العربية بحد ذاتها هدفا أساسيا.

الهدف من الدراسة عرض موجز لنماذج مختلفة من أساليب معالجة التحليل الصرفي للغة العربية مع تصنيفها. تقديم عرض أكثر تفصيلا لإحدى هذه الجهود الجديدة.

خلفية الموضوع قياس فاعلية أسلوب التحليل الصرفي لغات الصرف التحليل الصرفي واسترجاع المعلومات

قياس فاعلية أسلوب التحليل الصرفي إن قياس فاعلية أي محلل للصرف تعتمد على عدة عوامل أهمها: الفاعلية صحة النتائج السرعة قلة نسبة الخطأ ثنائية الاتجاه صغر الحجم

لغات الصرف تختلف اللغات بشكل واضح من ناحية التعقيد الصرفي. اللغة الإنجليزية هي أبسط من بعض اللغات الأخرى مثل العربية والعبرية من الناحية الصرفية. عملية إزالة الزوائد في اللغة الإنجليزية واللغات المشابهة لها أبسط مما هي في اللغة العربية. الفرق الرئيسي بين اللغة العربية وغيرها من اللغات هي أنها اشتقاقية أما اللغات الأخرى فهي تسلسلية.

التحليل الصرفي واسترجاع المعلومات (1) حتى الآن، لم تظهر أي خوارزمية قياسية لاسترجاع المعلومات. استرجاع المعلومات العربية يمكن تطويره، حينما تستخدم الجذور في عملية الفهرسة والبحث. لكن، الصرف العربي معقد.

التحليل الصرفي واسترجاع المعلومات (2) الدراسات المنشورة للمقارنة بين استخدام الجذور واستخدام الجذوع لاسترجاع المعلومات متباينة ومختلفة: الدراسات القديمة تذكر أن فهرسة الجذر يتفوق في الأداء على فهرسة الجذع في أداء عملية الاسترجاع. دراسات أحدث: عدم وجود اختلاف كبير بين الجذور والجذوع. الاسترجاع المعتمد على الجذع أكثر فعالية من الاسترجاع المعتمد على الجذر. الدراسات القديمة التي تظهر تفوق الجذور على الجذوع تعتمد على مجموعة اختبارات صغيرة وغير قياسية. استخدام الجذر في الاسترجاع يزيد من غموض الكلمة.

دراسة مسحية للتحليل الصرفي للغة العربية

تصنيفات مقترحة أسلوب جدول البحث الأساليب اللغوية الأساليب التوليفية الأسلوب المعتمد على القواعد

أسلوب جدول البحث جميع الكلمات العربية المقبولة بالإضافة إلى تفكيكاتها الصرفية مخزنة في جداول كبيرة جدا. الكلمة المعطاة تحلل ببساطة عن طريق دخول الجدول واسترجاع المعلومات المتعلقة بذلك المدخل. الحاجة إلى جهد كبير جداَ.

الأساليب اللغوية تستفيد من القواعد اللغوية. مثل هذه الأساليب اللغوية هي أكثر دقة. ولكنها، تتطلب عدد كبير جداً من القوائم. الميكانيكية لإزالة الزوائد هي تقريباً عملية تجربة وخطأ. الأفندي أعطى إطاراً للعمل: مصفوفات التوافق.

الأساليب التوليفية هي عمليات تجربة وخطأ. تتم مقارنة جميع التشكيلات للحروف من كلمة معطاة مع مجموعة من الجذور. تأخذ وقت طويل للمعالجة.

الأسلوب المعتمد على القواعد أسلوب جديد مقترح. يستغل هذا الأسلوب التشابه الملحوظ للكلمات العربية المولدة. يتم التوليد عن طريق إضافة/إزالة جميع الزوائد المقبولة.

برامج تحليل الألفاظ العربية المبنية على القواعد يتم تطبيع الكلمات المستخلصة بإزالة حروف العلة. تخزن الكلمات في ملف ثنائي بنفس ترتيب النص الأصلي. حفظ ترتيب الكلمة يسهل استنتاج المعنى النصي لأي كلمة. بنية الكلمة في الملف الثنائي: هوية الكلمة الكلمة السابق الجذع اللاحق عدد القواعد المؤدية إلى التحليل سلسلة القواعد المتشابهة هوية القاعدة الصحيحة الحالة

المادة اللغوية لتصميم المحللات الصرفية واختبارها عادةً يكون النص الطبيعي ملي بالأخطاء الإملائية. يتم تصحيح الأخطاء شبه أوتوماتيكياً. الجدول التالي يعرض بعض الأمثلة للأخطاء الإملائية: الخطأ الإملائي أمثلة تهجئة الكلمات الأجنبية انترنت و انترنيت الأسماء المركبة عبد الرحمن و عبدالرحمن الخلط بين الحروف هره و هرة أنباء و انباء على و علي

بناء القواعد صيغ القاعدة يتم بناؤها باستخدام الوسائل التالية: <str> لمطابقة سلسلة الحروف str ولحذفها إذا كانت في جزء الجذع أو اعتبارها سوابق/لواحق إذا كانت في جزء السوابق/اللواحق. <s1 ^s2> لاستبدال s1 بـ s2. والعلامة التالية <^s2> تستخدم للإضافة. <> قوس فارغ لتمثيل عدم وجود سوابق أو لواحق. .n لمطابقة عدد n من الحروف, حيث n رقم صحيح أكبر من الواحد. ويرمز للحرف الواحد بنقطة واحدة.

مثال تطبيقي القاعدة المطبقة الكلمة النتائج السوابق الجذوع اللواحق 3. على <ال>3.<ية> النارية ال نار ية <ال><أ>2.<^ا>.<ة><> الأتربة تراب <ولل>3.<ات^ة> وللمسرات ولل مسرة ات <ب><ه> به ب هـ <وال><أ><ئ^ؤا>.<ة><> والأفئدة وال فؤاد

مثال النص ”ظهرت لغة سي في بداية السبعينات“ النص ”ظهرت لغة سي في بداية السبعينات“ تحليل كلمات النص المعطى كما يلي: الرقم الكلمة التحليل ........................................................................................... 1 لغة: لغة غة لغ لغية 2 سي: سي 3 ظهرت: ظهر ظهرت 4 لغة: لغة غة لغ لغية 5 سي: سي 6 في: في 7 بداية: داية بدا بداي بدية 8 السبعينات: سبعين سبعينة سبعينات السبعينات

الخاتمــــــــــــــة الحمد لله رب العالمين وصلى الله على نبينا محمد وعلى آله وصحبه أجمعين وشكراَ