خطوات عملية باتجاه تطبيق مفهوم البحث بالمفاهيم لمحركات البحث والاسترجاع العربية حيدر العميد، شيخة الكتبي، آمنة الكعبي، خديجة الشبلي، نيلا الشامسي، نورة.

Slides:



Advertisements
Similar presentations
Conjunctions الروابـــــــــط.
Advertisements

Question-Tags الأسئلة المذيلة
Arabic Speech Recognition
Active & Passive المبني للمعلوم و المبني للمجهول
مجالات التعلّم المستويات الأهداف النماذج المطلوبة الكلمات المفتاحية نظرة عامة عن المشروع الوصف البرمجيات المؤلفون المصادر.
منصور البصيلي خالد الزهراني
التعرف الآلي على الكلام العربي المنطوق
إدارة وتنمية مصادر المعلومات Information Resource Management (IRM)4.
Feb أنظمة المعلومات الجغرافية (لمحة عامة) شباط 2008.
مهارات الحاسب الآلي COMPUTER SKILLS ميسون القري. الفصل الدراسي الثاني 1431هـ الانترنت مجموعة ضخمة من شبكات الاتصالات المرتبطة ببعضها البعض، وهذه المجموعة.
تعريف الفهرس الدرس الرابع
التعرف الآلي على الكلام العربي
Introduction to Software
تعريبــ محركات البحث إعداد الطلاب: 1 حسان وليد العبيداء.
الفصل الحادي عشر الطوارئ الإشعاعية
اعداد : أ : عبد العزيز محمد العمري
مجالات التعبير الكتابي :
التعرف الآلي على الكلام المنطوق العربي
الملتقى العالمي الثالث في ممارسة علوم الحاسب باللغة العربية CSPA '06 الهيكلة الآلية للنّصوص العربيّة باقتباس المفاهيم الشّكلية المثالية علي الجوَة، أزهر.
الموضوع:-المتتالية الهندسية
الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد، 26 رمضان، 1436الأحد،
التحليل الصرفي للغة العربية
محركات البحث العربية بواسطة: عبد الله عتيق العامر
محرك البحث الإدريسي غزوان البريكان
الأعداد العشرية النسبية تقديم و مقارنة
بسم الله الرحمان الرحيم
بروتوكول الانترنت نظم تشغيل 1.
Workshop on Demographic Analysis and Evaluation. Mortality: Model Life Tables الوفيات: نموذج جداول الحياة.
بعض نظم الأرشفة الإلكترونية تقديم د. جبريل العريشي A microfiche reader.
المحاضرة الرابعة عشرة.
نظام إدارة قواعد البيانات Access
By Assist.prof. Hussein Hadi Abbass University of Kufa\College of Education for girls\ Department of Mathematics Hasan Mohammed Ali.
دبلوم الإرشاد الأسري. phrasal verb  The term phrasal verb is commonly applied to two or three distinct but related constructions in English: a verb and.
Activity Diagram.
State Chart Diagrams.
أهداف الدرس 1 ما هي محركات البحث ؟ Search engines
الذكاء الاصطناعي تطبيقاته Artificial Intelligence
معهد الادارة التقني قسم أنظمة الحاسبات تقدم.
تعريف تطبيقات واستخدامات نظم المعلومات الجغرافية المحتويات تعريف نظم المعلومات الجغرافية مكونات نظم المعلومات الجغرافية الاسئلة الخمسة التى تجيب عنها.
الفرق بين التصاميم التجريبية (التوزيع العشوائي) د. ظلال الصافتلي كلية الزراعة – جامعة حماه.
لنفرض أن هدف التجربة هو مقارنة نوعين من الأعلاف (A و B) لتغذية أبقار حلوب خلال 3 شهور. وتم اختيار عشرين بقرة متشابهة ( في الوزن / العمر / السلالة / الموسم.
لنفرض أن هدف التجربة هو مقارنة صنفين من السماد (A و B) من حيث كمية محصول نوع معين من القمح.
الأمثلة : ادّعى رجل النبوّة ايام الخليفة المأمون أعلم الناس القاضي يحيى بن أكثم ألق عصاك وصيّرها ثعبانا كما فعل الكليم موسى
التعلم الالكترونى الطريق نحو تعليم افضل
How to contact me Twitter Blog :-
10 0× 1 = 4× 4 = (وحدات)4 10 1× = 5 50 = (عشرات)5
برمجة قواعد بيانات تطبيق مفهوم الحماية في النماذج
تابع :تطبيع البيانات.
1.الدوال Function 2.الاجراءاتSub Procedure 3.وحده نمطيه Add Module
المخدم الرئيسي في الشبكات
إختر عنواناً لمشروعك يكون بسيطاً ويشد الانتباه!.
سياسات واستراتيجيات البحث
الفصل الثالث حصر و ترتيب البيانات.
Introduction to GIS Rugaia Omer Ahmed.
Programming -2 برمجة -2 المحاضرة-1 Lecture-1.
مبادئ نظم وتقنية المعلومات (تال 101د)
Electronic Payment Systems أنظمة الدفع الالكتروني
قسم الرياضيات - كليه العلوم الدكتور عبدا لهادى منصور الأحمدى
مهارة التنظيم المتقدم تعريف مهارة التنظيم المتقدم Organizing in Advance هي تلك المهارة التي تستخدم من اجل ايجاد اطار عقلي او فكري يستطيع الافراد عن طريقه.
البحث عن المعلومات على الانترنت
3. Browsing the Web تصفح الانترنت
التعرف على الخط العربي المكتوب يدوياً
تحليل النظم System Analysis
الإحصاء الاقتصادي المرحلة الثانية / قسم الاقتصاد
Gateway (بوابة العبور أو الاتصال)
الكلية الجامعية للعلوم التطبيقية
أ/المادة: م. لندا عمر البدري م. نجلاء حسن
العلاقة مع المصادر Source Relationship.
هيكلة نظم إدارة قواعد البيانات (DBMS Architecture)
4 أسباب وراء فشل حبك في مرحلة المراهقة. كثير من الفتيات والشابات يقعوا في الحب في مرحلة المراهقة، وهي المرحلة التي تبدأ فيها الفتاة في التعرف على الطرف.
Presentation transcript:

خطوات عملية باتجاه تطبيق مفهوم البحث بالمفاهيم لمحركات البحث والاسترجاع العربية حيدر العميد، شيخة الكتبي، آمنة الكعبي، خديجة الشبلي، نيلا الشامسي، نورة النعيمي، شيخة المهيري جامعة الإمارات العربية المتحدة كلية تقنية المعلومات قسم هندسة البرمجيات

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure2 الملخص تعتبر اللغة العربية واحدة من اللغات الشائعة الاستخدام في العالم، وعلى الرغم من ذلك فإن هنالك عدد محدود من الدراسات والبحوث المختصة بدراسة وتطوير طرق وإستراتيجيات استرجاع البيانات العربية. تبرز التحديات في أنظمة الاسترجاع العربية (IR) كون اللغة تحتوي على نوعين من الجنس؛ المذكر والمؤنث، وثلاث فئات من الأعداد التي تمثلها اللغة وهي المفرد والمثنى والجمع، بالإضافة إلى ثلاث حالات قواعدية وهي الرفع والنصب والجر. عادةً ما يتم تشكيل نمط الاسم في اللغة تبعاً للعوامل الثلاثة السابقة وهي نوع الجنس وفئة العدد والحالة القواعدية. وكنتيجة لهذه المعوقات، أصبحت إستراتيجية البحث بالمفاهيم أكثر ملاءمة للمستخدمين الباحثين عن معلومات أو مفردات تتعلق بموضوع معين، حيث أن استخدامها يزيد من نسبة الدقة للنتائج المسترجعة من حيث العدد وتعلقها بموضوع البحث. في هذه الدراسة، نقوم بعرض النتائج المسجلة لثلاثة نماذج مقترحة لتطبيق مفهوم البحث بالمفاهيم والتي تساهم في تطوير محركات البحث العربية والتقليل من نسبة الخطأ والنتائج العشوائية الناتجة عن الاختلاف الكبير في نمط الكلمات العربية باختلاف مواقعها في النصوص.

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure3 المـــقدمة يحتاج مستخدمو أنظمة استرجاع المعلومات عادةً لاستخدام أكثر من كلمة بحث رئيسية (مفتاحية) لضمان دقة وسرعة الحصول على المعلومة المطلوبة والاستغلال الأمثل للمعلومات الحيوية المتوفرة من المصادر المختلفة المتاحة. ميل المستخدمين لاستخدام كلمات مفتاحية مختصرة ومحدودة عادةً ما يؤدي إلى استرجاع عدد كبير من النتائج الغير وثيقة الصلة والخارجة عن الموضوع المقصود بالبحث، بالإضافة إلى أن إتباع الطرق التقليدية لتعزيز جودة اختيار كلمات البحث المفتاحية للمعلومات ذات الصلة بموضوع البحث مازال أدنى من المستوى الذي حققته التقنيات الحالية المستخدمة في تطبيقات البحث والاسترجاع لأنظمة البحث التقليدية. إن الزوائد والإضافات المضافة للكلمة في اللغة العربية سواء أكانت في مقدمة الكلمة (بادئة prefix) أو في نهايتها (لاحقةsuffix ) أو في بعض الأحيان خلال مصدر الكلمة (إضافة وسطية infix)، تشكل معضلة حقيقة للمستخدمين ولأنظمة البحث على حد سواء، لاسيما عندما تتشكل الكلمة المخزنة والمفهرسة بأنماط مختلفة عن نمط الكلمات المفتاحية للبحث، مما يقلل عدد الوثائق والمستندات المسترجعة ذات العلاقة بموضوع البحث كنتيجة حتمية لعدم التوافق في النمط بين سؤال البحث وبين نماذج الوثائق والمستندات المفهرسة. إن استخدام مشذب (light stemmer) لإزالة هذه الزوائد والإضافات في الأنظمة التي تعتمد على عملية المطابقة بين كلمات البحث والكلمات المتواجدة في مصادر المعلومات المختلفة سيزيد من فاعلية نتائج البحث. ان استخدام أنظمة استرجاع المعلومات المبنية على أساس المعنى الفعلي للكلمة وتركيز إستراتيجية البحث حول مفهوم الكلمات المستخدمة عوضاً عن مضاهاة النصوص المكتوبة سيزود المستخدم بوثائق ونتائج ذات علاقة اقوى بسؤال البحث وبخاصة مع استخدام خاصية الترادف.

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure4 الهيكل البنائي للكلمات في اللغة العربية النظام النحوي للغة العربية قائم على أساس الجذور والأوزان الصرفية للكلمات والتي لا تزيد عن جذر و900 وزن صرفي. تشكل الجذور الثلاثية الأغلبية العظمى لكلمات اللغة (85%)، بينما تشكل الجذور الرباعية والخماسية والسداسية الأقلية من الكلمات حيث أن الأسماء والأفعال تتشكل من هذه الجذور عن طريق إضافة الزوائد الاشتقاقية إليها. تحدد التغيرات التي يبديها الجذر والأوزان الصرفية المعنى الفعلي للكلمة ("كتاب" على وزن فعال و "كاتب" على وزن فاعل). إن الكلمة في اللغة العربية قد تكون مؤلفة من الأصل (stem) وهو عبارة عن جذر صحيح أو وزن صرفي مضافاً إليه بعض الزوائد. والزوائد هي الحروف المكونة للهيكل الصرفي للكلمة بخلاف حروف الجذر، وتشمل العلامات الصرفية للزمن والعدد وحالات التذكير والتأنيث. كما تتضمن أيضاً بعضاً من حروف الجر والربط والمحددات لعمل الأسماء وضمائر الملكية والضمائر المتصلة والمنفصلة.

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure5 الجذر الثلاثي والرباعي والأوزان الصرفية الخاصة بهما الأوزان الخاصة بالفعل الرباعيالأوزان الخاصة بالفعل الثـلاثي أمثلة الوزن الصرفي الوزن مع الإضافة الوسطية الجذرأمثلة الوزن الصرفي الوزن مع الإضافة الوسطية الجذر دحرجهندسزخرففعللعملعلمكتبفعل مدحرجانمهندسانمزخرفانمفعللانمعملانمعلمانمكتبانمفعلان دحرجتانهندستانزخرفتانفعللتانمستعملونمستعلمونمستكتبونمستفعلون متدحرجانمتهندسانمتزخرفانمتفعللانيعملانيعلمانيكتبانيفعلان تعملينتعلمينتكتبينتفعلين دحروجهندوسزخروففعلوليستعمليستعلميستكتبيستفعل يستعملوايستعلموايستكتبوايستفعلوا دحارجهنادسزخارففعاللاعملوااعلموااكتبواافعلوا دحارجةهنادسةزخارفةفعاللةعاملعالمكاتبفاعل عاملانعالمانكاتبانفاعلان دحراجهنداسزخراففعلالعاملاتعالماتكاتباتفاعلات دحراجاهنداسازخرافافعلالاعامولعالومكاتوبفاعول عامولاعالوماكاتوبافاعولا دحيرجهنيدسزخيرففعيللعمائلعلائمكتائبفعائل دحيرجاهنيدسازخيرفافعيللاعمالعلامكتابفعال عمالتينعلامتينكتابتينفعالتين دحريجهنديسزخريففعليلاستعمالاستعلاماستكتاباستفعال عمولعلومكتوبفعول دحاريجهناديسزخاريففعاليلمعمولمعلوممكتوبمفعول عميلعليمكتيبفعيل

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure6 الجذر الثلاثي والرباعي والأوزان الصرفية الخاصة بهما الأوزان الخاصة بالفعل الرباعيالأوزان الخاصة بالفعل الثـلاثي أمثلة الوزن الصرفي الوزن مع الإضافة الوسطية الجذرأمثلة الوزن الصرفي الوزن مع الإضافة الوسطية الجذر دحرجهندسزخرففعللعملعلمكتبفعل عوملعولمكوتبفوعل عواملعوالمكواتبفواعل عواميلعواليمكواتيبفواعيل عيملعيلمكيتبفيعل عياملعيالمكياتبفياعل عميميلعليليمكتيتيبفعيعيل عويملعويلمكويتبفويعل عتملعتلمكتتبفتعل معتملاتمعتلماتمكتتباتمفتعلات عتمالعتلامكتتابفتعال اعتمالاتاعتلاماتاكتتاباتافتعالات عاميلعاليمكاتيبفاعيل معاميلمعاليممكاتيبمفاعيل عموملعلولمكتوتبفعوعل اعموملاعلولماكتوتبافعوعل عميمالعليلامكتيتابفعيعال

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure7 المشذبات العربية التشذيب (Stemming) هو عملية إزالة كل من بوادئ الكلمة ولواحقها لإنتاج الجذر أو الأصل. تبرز أهمية هذه العملية في اجراءات التصنيف وبناء الفهارس وبحث واسترجاع البيانات، وذلك لكونها تقلل من تأثير اختلاف الأنماط والأشكال للكلمات العربية، كما أنه يساهم في تقليل الحجم المطلوب لخزن الكلمات في حالة تخزينها في الفهارس بأشكالها المختلفة والموجودة في النصوص الأصلية. التشذيب هو طريقة رياضية تجمع كل الكلمات التي تتقاسم نفس الأصل وتملك بعض العلاقات الدلالية. تصنف خوارزميات التشذيب العربية طبقاً لمستوى التحليل المطلوب: على أساس الأصل أو على أساس الجذر. طرق التشذيب المبنية على أساس الأصل تعمل على إزالة كل من البوادئ واللواحق الملحقة بالكلمة، بينما تحول الطرق المبنية على أساس الجذر كل من الأصول إلى جذور. إن المشذب العربي يشير إلى إزالة وتجريد الكلمة من الزوائد المضافة دون المحاولة للتعامل مع الإضافات الوسطية أو التعرف على الأوزان الصرفية واكتشاف الجذور للكلمات.

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure8 استرجاع المعلومات في اللغة العربية إن تعدد الأوزان الصرفية لكلمات اللغة العربية وما تتميز به من درجة عالية من إمكانية التشكل والاختلاف في بنية الكلمات بالإضافة لخاصية الاشتقاق يجعلها من إحدى اللغات التي يصعب على أنظمة استرجاع المعلومات التعامل معها. تتواجد الكلمة في اللغة العربية في عدد كبير من الأشكال المختلفة بحيث أن كل شكل من أشكال الكلمة لابد أن يعالج ليصل إلى شكل يتوافق مع ما يوجد في مصادر المعلومات المختلفة لغرض للتوصل إلى النتائج المطلوبة. بالإضافة لذلك، تعتبر الزوائد والأحرف المضافة للكلمات سواء في بدايتها أو وسطها أو نهايتها، أحد المشكلات التي تقف كعائق أمام أنظمة استرجاع المعلومات. تصنف انظمة استرجاع المعلومات الى صنفين : استرجاع المعلومات المبني على المطابقة النصية و مطابقة المفاهيم. أنظمة استرجاع المعلومات المبنية على المطابقة النصية ( Text-based) تعتبر النتائج المستردة من الأنظمة القائمة على أساس البحث المعتمد على كلمات المستخدم غير مرضية، حيث أنها تهمل الوثائق التي تشمل الأشكال الأخرى لكلمات سؤال البحث وتقوم باسترجاع الوثائق التي تحتوي على الكلمات المطابقة للسؤال المدخل فقط.

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure9 استرجاع المعلومات في اللغة العربية عادةً ما تشير الكلمات في أية لغة إلى مفاهيم محددة ومتعددة في نفس الوقت، مما يتيح لتمثيل العلاقة ما بين الكلمات ومفاهيمها بعلاقة ذات درجة متعددة الجهات (many-to-many)، بمعنى أن المفهوم الواحد قد يمثَل بكلمات مختلفة كثيرة (مترادفات)، وأن الكلمة الواحدة قد تصف العديد من المفاهيم المختلفة (تعدد المعاني). المترادفات بصفة عامة يمكن تعريفها بأنها كلمتان مختلفتان أو أكثر تستخدم لتمثيل المفهوم نفسه أو لوصف معان ٍ أخرى ذات صلة. يمكن أن يكون للكلمات معان ٍ مختلفة تمامًا عما تمثله وذلك اعتماداً على السياق التي وردت فيه في الجملة، على سبيل المثال: كلمة "ذهب" قد تدل على اسم لمعدن ثمين وقد تدل على فعل بمعنى سار. تعدد المعاني، أو بمعنى آخر“ الغموض المعجمي” هو اللبس أو الغموض الذي تبديه الكلمة أو العبارة والتي يمكن أن تكون مستخدمة في سياقات مختلفة للتعبير عن معنيين مختلفين أو أكثر. يمكن القول أن عملية الربط بين الكلمات والمفاهيم يمكن أن يجند بشكل إيجابي لإزالة الغموض في عمليات البحث والاسترجاع.

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure10 استرجاع المعلومات في اللغة العربية تطبيقات أنظمة استرجاع المعلومات المبنية على مفاهيم الكلمات ظهرت مؤخراً بعض المحاولات التي تهدف إلى عرض بعض الحلول الممكنة لمعالجة مشكلة الاختلاف بين معاني الكلمات المستخدمة في سؤال البحث مثل محرك البحث مورفيكس (Morfix) والدال. محرك البحث مورفيكس (Morfix) المنتج من قبل Melingo ( )، وهو عبارة عن محرك بحث مصمم للعمل باللغتين العربية والعبرية، ويعتمد من ناحية البناء على أساس قواعد البيانات المعجمية الشاملة للمعاني المختلفة. كما أنه مزود بإمكانية البحث بالكلمة الأصلية، والبحث اللغوي (morphology) الذي يتناول الكلمة بمختلف أشكالها، بالإضافة إلى وجود خاصية البحث بالمترادفات والبحث الموسع. علاوة على ذلك، يعتمد البحث بالمترادفات على أساس البحث عن الكلمة ومرادفاتها من خلال توظيف العلاقات المحددة التي تربط بين المفاهيم باستخدام قواعد البيانات المحددة والمعرفة مسبقاً لذلك الغرض. قدم محرك البحث العربي والمسمى الدّال ( ) حلاً متكاملاً لفهرسة المعلومات والبحث عنها، بالإضافة إلى ميزات البحث الخاصة باللغة العربية. وتتميز خدماته بمواصفات عالمية من حيث سرعة الوصول إلى المواقع الأقرب للموضوع المطلوب، ومن خلال ميزاته العديدة الغير محددة بحجم الوثائق أو الموقع. ويزود محرك البحث الدّال المستخدم بطرق جديدة مبتكرة للبحث في الوثائق العربية كالبحث باستخدام الجذور والمترادفات والأضداد، موفراً طريقة فعالة لإيجاد الموضوع الأقرب في المحتوى العربي.

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure11 استرجاع المعلومات في اللغة العربية ان كلاً من محركي البحث سابقي الذكر عبارة عن تطبيقات قائمة مبنية على أساس استخدام قواعد البيانات يتم تعبئتها بجميع الأنماط المحتملة والمشتقة من جذر الكلمة مع تعريف الروابط بينها وبين الجذر التي اشتقت منه بحيث تؤدي في المحصلة النهائية لإيجاد قاعدة بيانات تحتوي على جميع الكلمات التي تشترك في تمثيل المفاهيم نفسها بالإضافة لأنماطها المحتملة والعلاقات القائمة بين بعضها البعض. توفر مثل هذه الأنظمة نتائج ذات صلة قوية لما يلتمسه المستخدم استناداً إلى كلمات البحث المستخدمة خلال فترة زمنية قصيرة بسبب اقتصار الأمر على عمليات الاسترجاع من قاعدة البيانات المتاحة. تواجه هذه المحركات بعض المساوئ الرئيسية والتي تتمثل في الاستخدام المحدود للكلمات ذات المعاني المرتبطة ( فقط الكلمات المحددة من قبل المنتج )، والحجم المطلوب الكبير لسعة التخزين الكلية والتي تزداد بازدياد عدد الكلمات المخزنة وعلاقاتها مع بعضها البعض.

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure12 النماذج المقترحة هذا البحث يستعرض ثلاثة نماذج مقترحة كمحاولة لتحسين أنظمة استرجاع المعلومات العربية. تعتمد النماذج على توظيف التقنيات القائمة على المفهوم الفعلي للكلمات بالإضافة إلى الأنظمة التقليدية المبنية على مطابقة كلمات البحث. تتكون كل من الأمثلة الثلاثة المقترحة من مستويين عمليين: الخادم (Server) والعميل (Client)، كل منهما يتضمن مجموعة من العناصر التي تستخدم للمعالجة بالإضافة إلى قاعدة للبيانات. مسؤوليات جانب العميل هي الحصول على سؤال بحث المستخدم وتوسيعه باستخدام المترادفات ذات الصلة بموضوع البحث، بينما مسؤولية جانب الخادم هي معالجة السؤال الموسع وإيجاد حلول لحالات عدم التطابق في النمط بين كلمة السؤال ومفردات الوثائق والمستندات المفهرسة. تشترك النماذج الثلاثة في استخدام عدة عناصر متماثلة مثل: المشذب العربي (Arabic light stemmer)، وإزالة الكلمات المستثناة من البحث (stopwords removal)، والبحث بالأنماط للسؤال الموسع (query expansion wildcard search)، والمقارنة بين الكلمات الناتجة من المستويين العمليين.

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure13 النماذج المقترحة يدعى النموذج الأول بنظام البحث بالمترادفات "synonym-based model"الذي يعتمد أساساً على مبدأ التطابق بين كلمات سؤال البحث وبين مجموعة المترادفات المتاحة. المترادفات المخزنة في قاعدة البيانات الخاصة بالمترادفات قد تكون في صورة الجذور أو الأصول حيث تتضمن زوائد وإضافات، والذي يؤدي بالنتيجة إلى تقليل إمكانية تحقيق التطابق الحرفي بين كلمات البحث وبين قاعدة بيانات المترادفات. وعلاوة على ما تقدم من وصف للنموذج المقترح السابق، فإن النموذجين الإضافيين تم تصميمهما بهدف تحسين أداء النموذج الأول والتغلب على عيوبه، حيث تتحقق إستراتيجية التحسين في زيادة احتمالية التطابق بين الكلمات المترادفة و كلمات سؤال البحث. يدعى النموذج المقترح الثاني بنظام البحث بالمترادفات المشذبة "stemmed Synonym- based model"، حيث يقوم بتنفيذ عملية التشذيب مباشرة بعد عملية إزالة الكلمات المستثناة من البحث. إن الفكرة من استخدام المشذب جنباً إلى جنب مع قائمة المترادفات هدفت لتوحيد الكلمات بحيث تكون متماثلة بعد إزالة ما يتصل بها من زوائد. النموذج المقترح الثالث يدعى بالنظام النمطي للبحث بالمترادفات " wildcard synonym- based model"، حيث بني هذا النموذج على فكرة الاستفادة من خاصية البحث بالأنماط، بالإضافة إلى ضم وحدة المشذب المستخدمة في النموذج الثاني.

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure14 النموذج الاول : نظام البحث بالمترادفات

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure15 النموذج الثاني : نظام البحث بالمترادفات المشذبة

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure16 النموذج الثالث : النظام النمطي للبحث بالمترادفات

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure17 تقييم الانظمة المقترحة وتحليل النتائج المعايير الشائعة لقياس مدى فاعلية الأنظمة المطورة في مجال استرجاع المعلومات تبنى على أساس نسبة الصلة الثنائية (binary relevance) ونسبة الاسترجاع الثّنائي (binary retrieval). المعيار الأول للتقييم يدعى التّذكّر(Recall) والذي يعبر عن قدرة النظام لاسترجاع وتقديم جميع الكلمات ذات العلاقة، بينما يدعى المعيار الثاني بالدقة (Precision) وهو يعبر عن قدرة النظام لاسترجاع المعلومات وتقديم النتائج ذات العلاقة حصراً. التذكر (Recall) = عدد النتائج المسترجعة ذات العلاقة بالبحث \ العدد الكلي للكلمات المخزنة الدقة (Precision) = عدد النتائج المسترجعة ذات العلاقة بالبحث \ العدد الكلي للكلمات التي تم استرجاعها خلال عملية البحث لغرض اختبار كفاءة النظام المقترح لتقييم أداء النماذج الثلاثة، فقد تم إعداد عينة اختبار مكونة من أكثر من 4170 كلمة عربية تمثل جذور وأفعال وأسماء ومشتقات لأصول عربية تزيد عن 20 أصل. الأصول اختيرت من فئتين أساسيتين في اللغة وهي الأصول الثلاثية والرباعية حيث تم تحديد ثمان فئات للاختبار لكلمات العينة ذات الأصل الثلاثي وست فئات للأصول الرباعية

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure18 تقييم الانظمة المقترحة وتحليل النتائج تم تطبيق جميع الفئات المعدة على النماذج المقترحة كالآتي: –الفئة الأولى: جذر بدون إضافات –الفئة الثانية: جذر يحتوي على لواحق فقط –الفئة الثالثة: جذر يحتوي على بوادئ فقط –الفئة الرابعة: جذر يحتوي على بوادئ ولواحق –الفئة الخامسة: تصريف (مع إضافة وسطية) بدون بوادئ ولواحق –الفئة السادسة: تصريف (مع إضافة وسطية) يحتوي على لواحق فقط –الفئة السابعة: تصريف (مع إضافة وسطية) يحتوي على بوادئ فقط –الفئة الثامنة: تصريف (مع إضافة وسطية) يحتوي على بوادئ ولواحق وكنتيجة لتشغيل النماذج المقترحة مع عينة الاختبار وتسجيل النتائج التفصيلية لمخرجات كل نموذج من النماذج الثلاثة، تم تسجيل ارتفاع بعدد النتائج المتعلقة بكلمات البحث المفتاحية في نتائج النموذج الثالث بالنسبة إلى نتائج كلاً من النموذجين الأول والثاني.

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure19 تقييم الانظمة المقترحة وتحليل النتائج كلمة البحث (Query word) المترادفات المستعادة (Retrieved Synonyms) كلمة البحث (Query word) المترادفات المستعادة (Retrieved Synonyms) النموذج الأولالنموذج الثانيالنموذج الثالثالنموذج الأولالنموذج الثانيالنموذج الثالث عمل114عامل112 صدق114صادق112 علم116عالم112 درس115دارس113 كتب000كتائب000 حكم111حكام000 صحر000صحائر000 دعا000داعي000 قرأ000قراء000 سير000سيار000 فعل113فعول000 عملي124عمالة112 صدقهم124صداقة112 علموا126علامة123

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure20 تقييم الانظمة المقترحة وتحليل النتائج كلمة البحث (Query word) المترادفات المستعادة (Retrieved Synonyms) كلمة البحث (Query word) المترادفات المستعادة (Retrieved Synonyms) النموذج الأولالنموذج الثانيالنموذج الثالثالنموذج الأولالنموذج الثانيالنموذج الثالث درسوا12 5 دراسات11 2 قرؤوا11 1 قارئات12 2 فعلاء01 3 فاعلات00 1 تعمل12 4 اعمال12 2 تصدق12 4 نصادق12 2 تعلم12 6 معالم12 2 مستدرس12 5 مدارس12 3 مستعملين12 4 معاملات12 2 يصدقون12 4 مصداقية11 2 معلمين12 6 استعلامات12 3 مستدرسات12 5 مدروسة11 1 يكتبون00 0 مكتتبون00 0 متحكمون01 1 تحكيمتان00 0

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure21 تقييم الانظمة المقترحة وتحليل النتائج

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure22 الاستنتاجات والخلاصة قدم البحث دراسة وافية لمفهوم الاسترجاع المعنوي ( المعتمد على المفاهيم ) كبديل عن الاسترجاع الحرفي والذي يعتمد بالأساس على تطابق أشكال الكلمات المخزنة والمفهرسة في قاعدة البيانات والكلمات المفتاحية للبحث. الدراسة اعتمدت على عرض ثلاثة نماذج مقترحة لقياس مقدار الكفاءة التشغيلية لكل منها وللوصول إلى التوصية باستخدام أفضلها في المستقبل لتطوير محركات البحث العربية والتي تعاني من قلة المرونة والمحدودية في التعامل مع الكلمات المفهرسة من حيث استرجاعها وفهرستها. كما قدم البحث شرح وافي عن كل ما يتعلق بقواعد اللغة العربية وتراكيبها وأشكال تمثيلها في أنظمة الاسترجاع الآلية، بالإضافة إلى عرض أهم المعوقات الخاصة بتطوير محركات البحث العربية واقتراح السبل لحلها والتقليل من أخطائها.

Arabic Search Engines Improvement: A New Approach using Search Key Expansion Derived from Arabic Synonyms Structure23 AQ& Q U E S T I O N S A N S W E R S