Presentation is loading. Please wait.

Presentation is loading. Please wait.

المحاضرة العاشرة - تابع اختبار الفرضيات Hypothesis Testing الاختبارات المعلمية واللامعلمية Parametric and Non-Parametric Tests 1.

Similar presentations


Presentation on theme: "المحاضرة العاشرة - تابع اختبار الفرضيات Hypothesis Testing الاختبارات المعلمية واللامعلمية Parametric and Non-Parametric Tests 1."— Presentation transcript:

1 المحاضرة العاشرة - تابع اختبار الفرضيات Hypothesis Testing الاختبارات المعلمية واللامعلمية Parametric and Non-Parametric Tests 1

2 اختبار الفرضيات المتعلقة بمجتمع واحد
إن الفرضية الصفرية في هذه الحالة هي عبارة عن تقدير لمعلمة المجتمع، ومن ثم يتم اختبار هذه الفرضية من خلال مقارنة الاحصاءة المناظرة للمعلمة والتي يتم حسابها من العينة، وهنا يطرح تساؤل حول مدى تمثيل العينة للمجتمع المسحوبة منه أي مدى انتماء العينة للمجتمع الذي سحبت منه العينة، ومن المعروف أن إحصائي العينة ليس بالضرورة أن يساوي معلمة المجتمع حيث انه إحصائيا قد يكون هناك فرق بين الإحصائي والمعلمة سواء بالزيادة أو النقصان وهذا الفرق يمكن تجاهله إحصائيا إذا كان فرقا ظاهريا وليس حقيقيا أو جوهريا وبالتالي ليس له خطورة على مدى تمثيل العينة للمجتمع. وفي هذه الحالة يمكن اعتبار متوسط العينة لا يختلف إحصائيا عن متوسط المجتمع وان العينة المسحوبة فعلا تمثل المجتمع وفي هذه الحالة نعتبر (µ= x). وفي بعض الحالات لا يمكن أن نتجاهل هذا الفرق ونعتبره فرق حقيقي أو جوهري (معنوي) ومسالة تحديد ما إذا كان الفرق معنوي أو غير معنوي ليست متروكة للتقدير الشخصي للباحث ولكن تبنى اعتمادا على الخصائص الأساسية للتوزيع العيني للمتوسطات 2

3 اختبار الفرضيات حول الوسط في حالة σ للمجتمع مجهولة: في حالة عدم معلومية تباين المجتمع يتم استخدام اختبار t بدلا من اختبار z ويسمى أيضا باختبار student's t test والذي وضعه وليام جوست والذي تنبه إلى أن نقصان الدقة في تقدير الانحراف المعياري للمجتمع باستخدام الانحراف المعياري للعينة مع صغر حجم العينة حيث يكون هذا التقدير اقل بكثير من الانحراف المعياري للمجتمع وبالتالي حين يستخدم الانحراف المعياري للعينة في تقدير الخطأ المعياري للمتوسط فان هذا التقدير يكون أيضا اقل من الخطأ المعياري للأصل وعندئذ يكون من باب عدم الدقة الإحصائية استخدام القيم الاحتمالية لمنحنى التوزيع الطبيعي ويستخدم هذا الاختبار في حالة العينات الصغيرة (اقل من 30) وكذلك في حالة العينات الكبيرة. ودالة الاختبار في هذه الحالة هي كما يلي: ملاحظة: يمكن اعتبار قيمة t الجدولية لجميع درجات الحرية التي اكبر من 8 تساوي 2 بشكل عام. 3

4 مثال1 عملي بالتطبيق على SPSS
البيانات التالية (ملف رقم 1) تمثل درجات عينة من 20 طالب في مساق الإحصاء بكلية التجارة بالجامعة الإسلامية والمطلوب هو اختبار ما إذا كان متوسط درجات الطلاب تساوي 65 درجة أم لا عند مستوى دلالة (α= 0.05). H0: µ = 65 H1: µ ≠ 65 النتيجة حيث أن قيمة sig المحسوبة (0.02) >0.05 إذن فهي معنوية إحصائيا ونستنتج رفض الفرضية الصفرية بان المتوسط يساوي 65 درجة. 4

5 5

6 اختبار الفرضيات حول الفرق بين وسطين hypothesis testing regarding the difference between two means
هناك الكثير من المواقف التي نرغب فيها بإجراء مقارنة بين مجتمعين. مثلا المقارنة بين أداء الذكور وأداء الإناث. هناك نوعين من البيانات في هذه الحالة: وهما البيانات المستقلة independent والبيانات المرتبطة أو غير المستقلة dependent حيث أن لكل منهما أسلوبه الخاص في التحليل الإحصائي. 6

7 أداء مجموعة من الذكور وأداء مجموعة من الإناث.
أولاً: اختبار الفرضيات حول الفرق بين وسطين لعينتين مستقلتين two independent samples t-test يقصد بالبيانات المستقلة تلك البيانات التي لا يوجد فيما بينها ارتباط ومن الأمثلة على ذلك: أداء مجموعة من الذكور وأداء مجموعة من الإناث. حجم الإنتاج في الفرع الأول وحجم الإنتاج في الفرع الثاني لمؤسسة صناعية. وبالتالي فان وسط العينة الأولى في المثالين السابقين (وسط الذكور، ووسط حجم الإنتاج في الفرع الأول) مستقل عن وسط العينة الثانية (وسط الإناث، ووسط الانتهاج في الفرع الثاني). والفرضيات تكون على الشكل التالي: Ho: μ1= μ2 H1: μ1≠μ2 or, H1: μ1< μ2 or, H1: μ1> μ2 و 7

8 وعندما تكون الفرضية الصفرية صحيحة فان توزيع المعاينة لفروق الأوساط يتخذ شكل توزيع t بدرجات حرية (n1+n2 -2) حيث أن: n1 تمثل حجم العينة الأولى و (n2) حجم العينة الثانية. ويكون وسط التوزيع مساويا صفر. وبالتالي فان اختبار t هو الاختبار المناسب ويستند هذا الاختبار إلى توفر عدد من الافتراضات وهي: 1- التوزيع الطبيعي Normality: وهذا الافتراض يفترض أن العينة الأولى عينة عشوائية مسحوبة من المجتمع الأول يتبع التوزيع الطبيعي بوسط وانحراف معياري: N(µ1, σ1)، كذلك العينة الثانية عينة عشوائية مسحوبة من المجتمع الثاني يتبع التوزيع الطبيعي بوسط وانحراف معياري كما يلي: N(µ2, σ2). 2- تجانس التباين في المجتمعين homogeneity: هذا الافتراض يفترض تساوي التباين في كلا المجتمعين أي أن: σ22 =σ21 3- الاستقلالية independence: وهذا الافتراض يفترض أن مشاهدات العينة الأولى قد تم الحصول عليها عشوائيا من المجتمع الأول بشكل مستقل عن مشاهدات العينة الثانية المسحوبة من المجتمع الثاني. 8

9 مثال2 عملي بالتطبيق على SPSS
البيانات المرفقة في ملف 2 تمثل درجات مجموعتين من الطلبة في مساق الإحصاء الأولى مكونة من 59 طالب والثانية مكونة من 28 طالبة. هل تعتقد بوجود فرق معنوي بين مستوى الطلبة في المجموعتين عند مستوى دلالة (0.05) ؟. Ho: μ1= μ2 H1: μ1≠μ2 النتيجة حيث أن قيمة sig المحسوبة للفرق بين الوسطين (0.767) <0.05 إذن فهي غير معنوية إحصائيا ونستنتج عدم رفض الفرضية الصفرية بان متوسط درجات الطلاب يساوي متوسط درجات الطالبات. 9

10 10

11 ثانياً: اختبار الفرضيات حول الفرق بين وسطين للعينات المرتبطة two paired sample t-test
يقصد بالبيانات المرتبطة: تلك التي يوجد فيما بينها ارتباط وينشأ هذا الارتباط عندما يجرى الاختبار على المجموعة نفسها مرتين كاختبار قبلي واختبار بعدي أي أن البيانات تكون على شكل أزواج وبالتالي لابد أن يتساوى حجم العينتين أي أن: n1=n2 في العينات المرتبطة. 11

12 مثال3 عملي بالتطبيق على SPSS
البيانات المرفقة في الملف 3 تمثل نتائج تجربة أجريت على 20 شخص لاختبار مدى فعالية نظام غذائي خاص لتخفيف الوزن حيث تم قياس أوزان هؤلاء الأشخاص قبل البدء بتطبيق هذا النظام وقياس أوزانهم بعد مرور 3 شهور من بدء تطبيق النظام. هل تستطيع أن تستنتج أن نظام الغذاء كان فعالاً في تخفيف الوزن عند مستوى دلالة (0.05)؟. Ho: μbefore = μafter H1: μbefore > μafter من خلال النتائج يتضح أن قيمة (p-value or sig) تساوي sig/2 في هذه الحالة وتساوي صفر وهي اقل من (0.05) وبالتالي نرفض الفرضية الصفرية ونستنتج أن النظام الغذائي كان فعالاً. 12

13 13

14 تحليل التباين analysis of variance ANOVA
تحليل التباين الأحادي يركز على دراسة تأثير عامل واحد له عدة مستويات وعند كل مستوى تكرر التجربة عدد من المرات. مثال: اختبار ما إذا كان هناك فروق بين ثلاثة أساليب للإنتاج ويكون المطلوب هو معرفة ما إذا كانت هذه الأساليب الثلاثة لها تأثيرات متساوية على حجم الإنتاج أم لا. وبالتالي فالانحراف الكلي المشاهد ينقسم لمركبتين: الأولى ناتجة عن تأثير العامل (factor or treatment) (أسلوب الإنتاج) الثانية ناتجة عن الخطأ التجريبي. 14

15 مثال4 عملي بالتطبيق على SPSS
ملف البيانات 4 عبارة عن درجات مجموعة من الطلبة تم تدريسهم مساق الرياضيات بثلاثة طرق مختلفة وهي: M1، M2، M3، هل هناك فرق بين الطرق التدريس الثلاثة في تحصيل الطلاب ؟ عند مستوى دلالة (0.05) H0: μ1= μ2= μ3 H1: يوجد على الأقل متوسط واحد يختلف عن المتوسطات الأخرى من خلال النتائج يلاحظ أن قيمة F معنوية إحصائيا (sig = 0.014) وهي اقل من 0.05 وبالتالي نرفض الفرضية الصفرية ولمعرفة أي طرق التدريس التي كانت أفضل يتم استخدام اختبار بنفروني او شيفيه من post-hoc كما يلي: يلاحظ أن الفرق كان بين الطريقة الثانية والثالثة حيث أن قيمة Sig بلغت وهي معنوية ويتضح أن الطريقة الثالثة في التدريس هي الأفضل (وضح لماذا ) 15

16 16

17 17

18 المحاضرة الحادية عشر الاختبارات اللامعلمية Non-parametric Tests
18

19 الاختبارات اللامعلمية nonparametric tests
متى يتم استخدام الاختبارات اللامعلمية ؟ إذا كان توزيع المجتمع الذي سحبت منه العينة غير معروف ويرغب الباحث في إجراء استدلال إحصائي حول معالم المجتمع، ففي مثل هذه الحالة يعتمد على التوزيع الفعلي للعينة empirical distribution ولذلك تسمى هذه الاختبارات أيضا باسم الاختبارات أو الطرق حرة التوزيع distribution free methods تستخدم هذه الاختبارات في حالة التعامل مع عينات صغيرة الحجم (اقل من 30). في حالة أن تكون المتغيرات مقاسة بمقياس اسمي nominal scale أو بمقياس رتبي ordinal scale حيث لا يمكن في هذه الحالة استخدام الاختبارات المعلمية أذا لم تتوافر شروط أو افتراضات استخدام الاختبارات البارامتريه في اختبارات الفروض وأهمها شرط التوزيع المعتدل للمجتمع الذي تسحب منه العينة وكذلك تجانس التباين . 19

20 وحيث أننا في الاختبارات اللامعلمية لا نستطيع استخدام المتوسط في حالة البيانات الرتبية لذلك نختبر خصائص المجتمعات دون الاهتمام أو تحديد معلمات معينة لهذه المجتمعات ولذلك سميت بالاختبارات اللامعلمية. وبدلا من الاهتمام بالمعلمات فإننا نختبر مدى اختلاف مواقع المجتمعات (test to determine whether the populations locations differ).

21 ما هي الطريقة اللامعلمية المناسبة للتحليل ؟
للإجابة على هذا السؤال يجب علينا أن نضع في الاعتبار أربع نقاط أساسية وهي: هدف البحث: هل هو دراسة علاقة (ارتباط) أم دراسة فروق (اختلافات) أم الكشف عن اثر العينات: هل عينة واحدة أو عينتين أو ثلاث عينات فأكثر الاستقلالية أو الترابط في العينات: نفس العينة أم عينات مرتبطة أم عينات مستقلة نوع البيانات: اسمية nominal أو رتبية ordinal أو فترية interval أو نسبية ratio 21

22 الاختبار الإحصائي يمكن أن يتعلق بـ: عينة واحدة عينتان مستقلتان
عينتان مرتبطتان عينات مستقلة عينات مرتبطة 22

23 الاختبارات الإحصائية اللامعلمية لعينة واحدة
الاختبار الخاص بعينة واحدة يستطيع الإجابة على التساؤلات التالية: هل يوجد فروق دالة في الموقع LOCATION (النزعة المركزية) بين العينة والمجتمع ؟ هل يوجد فروق دالة بين التكرارات الملاحظة والتكرارات المتوقعة ؟ هل يوجد فروق دالة بين النسب الملاحظة والمتوقعة ؟ هل من المنطق الاعتقاد بان العينة المدروسة قد اشتقت من مجتمع له شكل معين معروف مثلا الاعتدالية normality ؟ وفي حالة العينة الواحدة فان الأسلوب البارامتري أو المعلمي كان اختبار (one sample t-test) للفروق بين متوسط العينة ومتوسط المجتمع. أما في حالة الأسلوب اللامعلمي فهناك أربعة اختبارات أخرى بديلة ويتوقف اختيار أي منها على طبيعة البيانات هل هي اسمية أو رتبية 23

24 الاختبارات اللامعلمية لعينة واحدة
اختبار ذات الحدين the binomial test اختبار كاي تربيع the Chi-square one sample test اختبار كولومجروف – سميرنوف the kolmogrov-smirnnov one sample test اختبار runs test والاختبارين 1 و2 يستخدمان في حالة البيانات الاسمية او الرتبية nominal or ordinal أما الاختبارين الأخيرين 3 و4 يستخدمان مع البيانات الرتبية ordinal فقط 24

25 1- اختبار ذات الحدين the binomial test
الافتراضات Assumptions المرتبطة باختبار ذي الحدين في اختبار الفروض الصفرية : يستخدم عندما تكون البيانات اسمية ثنائية التصنيف (مثل اسود وابيض، نعم ولا، صح وخطأ، ارغب ولا ارغب الخ). يستخدم عندما يكون حجم العينة صغير جدا حيث لا نستطيع عندها استخدام كاي تربيع لعينة واحدة chi-square one sample الفرض Hypothesis الذي يتم اختباره في المجتمع محل الاهتمام هل نسبة المشاهدات في إحدى الفئتين تساوي قيمة محددة؟. وعليه تتم صياغة فرض العدم (Null Hypothesis) والفرض البديل (Alternative ) كالتالي: فرض العدم: Н0 : p1 = π1 ويعني: (النسبة الفعلية للفئة الأولى تساوي قيمة محددة) 25

26 الفرض البديل وله ثلاث حالات: Нa : p1 # π1 …………………
الفرض البديل وله ثلاث حالات: Нa : p1 # π1 …………………. (1) ويعني: (النسبة الفعلية للفئة الأولى لا تساوي القيمة المحددة في فرض العدم). Нa : p1 > π1 …………………. (2) ويعني: (النسبة الفعلية للفئة الأولى أكبر من القيمة المحددة في فرض العدم). Нa : p1 < π1 …………………. (3) ويعني: (النسبة الفعلية للفئة الأولى أصغر من القيمة المحددة في فرض العدم). ويتم إ جراء الاختبار أخذاً في الاعتبار حالة واحدة فقط من الحالات الممكنة للفرض البديل كما أن فرض العدم يكون مكافئًا ل (p1 ≤ π1) في الحالة الثانية للفرض البديل و (p1 ≥ π1) في الحالة الثالثة

27 تم سؤال 10 أشخاص حول مدى تفضيلهم لمنتج معين فكانت إجاباتهم كالتالي:
المثال الأول (ملف البيانات 1): على اختبار ذات الحدين binomial test لعينة واحدة تم سؤال 10 أشخاص حول مدى تفضيلهم لمنتج معين فكانت إجاباتهم كالتالي: 6 أشخاص فضلوا المنتج على غيره و4 أشخاص لم يعطوا الأفضلية للمنتج محل الدراسة اختبر ما إذا كانت نسبة المؤيدين للمنتج لا تختلف إحصائيا عن 50% (بمعنى آخر عدم وجود فرق جوهري بين نسبة المؤيدين ونسبة غير المؤيدين للمنتج). الفرضية الصفرية التي يتم اختبارها : Н0 : p1 = 0.50 Н1 : p1 # 0.50 من خلال نتيجة الاختبار السابقة يلاحظ أن (sig>0.05) إذن لا نستطيع رفض الفرضية الصفرية وبالتالي لا تختلف نسبة المؤيدين للمنتج عن 50% أي انه لا يوجد اتجاه واضح لصالح المنتج من قبل عينة المستهلكين.

28

29 2- اختبار كاي تربيع the Chi-square one sample test
يستخدم اختبار كاي تربيع لتحليل البيانات التي تقع في تصنيفات متعددة (تصنيفين فأكثر) ويسمى اختبار كاي تربيع في هذه الحالة اختبار جودة المطابقة Chi-squared goodness-of-fit test لأنه يستخدم في الكشف عن وجود فروق دالة بين التكرار المشاهد observed frequency من الأشياء أو الاستجابات الواقعة في كل تصنيف والتكرار المتوقع expected frequency المعتمد على الفرض الصفري. 29

30 2- اختبار كاي تربيع the Chi-square one sample test
وفي كثير من الأحيان يرغب الباحث في التعرف على مدى تمثيل العينة للمجتمع إذا كان بالإمكان تقسيمه إلى فئات غير متجانسة وهذا يتم من خلال مقارنة التكرارات الملاحظة من العينة مع التكرارات المتوقعة (النظرية) للمجتمع. فإذا كانت العينة ممثلة للمجتمع في تكراراتها ومتطابقة معه فان قيمة كاي تربيع = صفر وتزداد هذه القيمة كلما كان هناك فرق بين التكرار المتوقع والتكرار المشاهد. وبصورة عامة فان اختبار كاي تربيع يستخدم للكشف عن حسن المطابقة بين النسب النظرية والنسب المشاهدة.

31 مثال1(ملف البيانات 2): على اختبار كاي تربيع لجودة المطابقة Chi-squared goodness-of-fit test
شركتين A و B قامتا بحملات إعلانية شديدة المنافسة من اجل زيادة كل منهما لحصتها السوقية. فإذا كانت حصة كل منهما قبل إجراء الحملات الإعلانية هي: 45% للشركة A و 40% للشركة B و 15% للشركات الأخرى الصغيرة في السوق. ولاختبار ما إذا حدث تحسن في الحصص السوقية بعد الحملات الإعلانية قام الباحث باختيار عينة مكونة من 200 زبون وقد تبين أن: 102 منهم فضلوا منتج الشركة A و82 منهم فضلوا منتج الشركة B و 16 المتبقين فضلوا منتج شركات أخرى. هل نستطيع الاستنتاج أن تفضيلات الزبائن اختلفت بعد الحملات الإعلانية مقارنة مع تفضيلاتهم قبل إجراء الحملات الإعلانية عند مستوى دلالة 5% .

32 الحل واضح أن البيانات هي بيانات اسمية nominal لان أفراد العينة سيختارون احد ثلاث خيارات وهي: تفضل منتج الشركة A نفضل منتج الشركة B تفضل منتج شركة أخرى الفرضية الصفرية المراد اختبارها هي: H0: P1 =0.45, P2 = P3 = 0.15 H1: at least one pi is not equal to its specific value إذا كنا نتوقع صحة الفرضية (H0) فإننا نتوقع عدد من يفضلون منتجات كل شركة كما يلي: e1 = 200(0.45) = 90 e2 = 200(0.40) = 80 e3 = 200(0.15) = 30

33 الآن إذا كانت التكرارات المتوقعة (expected frequencies) تختلف بشكل واضح عن التكرارات المشاهدة أو الفعلية من واقع العينة (observed frequencies) فإننا سنرفض (H0) أما إذا لم يكن هناك فرق واضح بينهما فإننا سنقبل هذه الفرضية. وهذا يتحدد من خلال احصاءة الاختبار كما سبق شرحه. من خلال النتائج يتضح أن قيمة كاي تربيع المحسوبة بلغت وهي معنوية إحصائيا حيث أن sig المحسوبة (0.017( < 0.05 وبناء عليه نرفض الفرضية الصفرية (H0) .وهذا يعني أن هناك اختلافات في تفضيلات الزبائن حدثت بعد الحملات الإعلانية.

34

35 مثال 2: (ملف البيانات 3) في احد الاستبيانات التي وزعها احد طلاب الماجستير أراد الطالب أن يختبر ما إذا كانت جميع المؤهلات العلمية: (ثانوية عامة فادني، دبلوم، بكالوريوس، دراسات عليا) ممثلة بنسب متساوية في عينة بحثه أم لا الفرضية الصفرية: H0: P1 = P2 = P3 = P4 H1: At least one proportion is different خلال نتيجة الاختبار يتضح أن (sig<0.05) وبالتالي فهي معنوية إحصائيا عند مستوى دلالة (0.05) وبالتالي نرفض الفرضية الصفرية بان جميع المؤهلات العلمية ممثلة بنسب متساوية، حيث كما نرى أن هناك تحيز واضح وان معظم العينة من حملة البكالوريوس (عددهم 57).

36

37 الاختبارات اللامعلمية للمقارنة بين عينتين مستقلتين
سبق أن بينا انه في حالة الاختبارات المعلمية يستخدم اختبار t لعينتين مستقلتين أما في حالة عدم تحقق شروط هذا الاختبار فهناك بدائل لا معلمية له منها: اختبار فشر fisher exact test اختبار مربع كاي للمقارنة بين مجموعتين the Chi-square two – samples test اختبار الوسيط median test اختبار مان وتني Mann-Whitney rank-sum U test وسنكتفي هنا باختبار مان وتني لأهميته وقوته الإحصائية وكثيرة استخدامه في تحليل الاستبيانات.

38 اختبار مان وتني Mann-Whitney rank-sum U test
يستخدم هذا الاختبار عندما يكون القياس رتبي ordinal على الأقل ولا يستخدم هذا الاختبار مع المقاييس الاسمية. يعتبر اختبار مان وتني من اقوي الاختبارات اللامعلمية . يستند هذا الاختبار على انه إذا كانت درجات مجموعتين دمجتا معا كأنهما مجموعة واحدة ثم ترتيبهما فانه سيكون هناك تمازج بين رتب المجموعتين ولكن إذا تفوقت إحدى المجموعتين على المجموعة الأخرى فان معظم الرتب للمجموعة المتفوقة ستكون أعلى من رتب المجموعة الأخرى. ولذا فان قيمة (U) تحسب بعد دمج رتب المجموعتين معا ثم يحسب عدد الرتب الخاصة بالمجموعة العليا والتي تقع تحت رتب المجموعة الدنيا.

39 فرضية العدم والفرضية البديلة:
فرض العدم: Н0 : M1 = M2 (وسيط المجتمع الأول يساوي وسيط المجتمع الثاني) ونظرا لأن الاختبار قائم على رتب البيانات لذا فإنه عند أخذ بيانات العينة في الاعتبار يمكن التعبير عن الفرضية بالشكل التالي :(متوسط رتب المجموعة الأولى يساوي متوسط رتب المجموعة الثانية) الفرض البديل: Нa : M1 # M2 …………………. (1) Нa : M1 > M2 …………………. (2) Нa : M1 < M2 …………………. (3) ويتم إجراء الاختبار أخذاً في الاعتبار حالة واحدة فقط من الحالات الممكنة للفرض البديل كما أن فرض العدم يكون مكافئًا ل M1 ≤ M2 في الحالة (2) و M1 ≥ M2 في الحالة (3)

40 مثال (ملف البيانات 5) على: اختبار مان وتني Mann-Whitney rank-sum U test
قامت إحدى الشركات بشراء ماكينات جديدة وأرادت تدريب عمالها عليها لاكتساب مهارة التشغيل فقسمت العمال لعينتين الأولى شملت (12 عامل) والثانية شملت (13 عامل) واتبعت برنامج تدريبي للعينة الأولى يقوم على إعطائهم محاضرات نظرية لمدة أسبوعين وبعد ذلك تدريبهم على الماكينات ميدانيا، أما العينة الثانية فقد اتبعت معها برنامج تدريبي آخر يقوم على إعطائهم المحاضرة النظرية ومباشرة بعدها التطبيق العملي في نفس اليوم. ثم حسب الزمن اللازم بالأيام للمتدربين (العمال) من اجل اكتساب المهارة المطلوبة. هل نستطيع أن نستنتج عدم وجود فروق جوهرية بين العينتين من حيث زمن اكتساب المهارة ؟

41 الفرضية الصفرية: (وسيط زمن اكتساب المهارة للعينة الأولى = وسيط زمن اكتساب المهارة للعينة الثانية)
Н0 : M1 = M2 Н1 : M1 # M2 من خلال النتائج يلاحظ أن قيمة Z= وقيمة (Asymp. Sig (2-tailed) تساوي وهي اقل من 0.05 وبالتالي فهي معنوية إحصائيا ولذلك نرفض الفرضية الصفرية ونستنتج أن هناك فرق معنوي إحصائيا بين فاعلية البرنامجين التدريبين. ويلاحظ من خلال متوسط الرتب كان للبرنامج الأول وهو أكبر من متوسط الرتب للبرنامج الثاني 8.81 وبالتالي نستنتج أن البرنامج الثاني كان أكثر فاعلية لان متوسط زمن اكتساب المهارة فيه كان اقل.

42

43 اختبار كروسكال - واليس ل K عينة مستقلة Kruskal-Wallis Test for K independent Samples
ويسمى اختبار كروسكال واليس لتحليل التباين باتجاه واحد المبني على الرتب وتكون البيانات التي يتم تحليلها بيانات رتبية (Ordinal Data)على الأقل. ويعد اختبار كروسكال واليس بديلاً لنظيره من الاختبارات المعلمية تحليل التباين باتجاه واحد (One Way Analysis of Variance) في حال عدم تحقق الافتراضات اللازمة لإجراء تحليل التباين باتجاه واحد،

44

45

46

47 مثال (كلف البيانات 6) على: اختبار كروسكال - واليس ل K عينة مستقلة Kruskal-Wallis Test for K independent Samples تم تدريس ثلاث مجموعات من الطلاب بطرق مختلفة (ثلاث طرق) كل مجموعة درست بطريقة معينة ثم تم الحصول على درجاتهم في الاختبار هل توضح النتائج أن هناك فرق معنوي بين الطرق الثلاثة الفرضية الصفرية: (وسيط درجات الطلاب الذين درسوا بالطريقة الأولى = وسيط درجات الطلاب الذين درسوا بالطريقة الثانية = وسيط درجات الطلاب الذين درسوا بالطريقة الثالثة) H0: m1 = m2 = m3 H1: At least one median is different

48 من خلال النتائج السابقة يلاحظ أن قيمة دالة الاختبار (Chi-square =7
من خلال النتائج السابقة يلاحظ أن قيمة دالة الاختبار (Chi-square =7.968) والمعنوية الإحصائية لها sig = وهي اقل من 0.05 وبالتالي فهي معنوية إحصائيا ونرفض الفرضية الصفرية أي أن هناك فروق بين طرق التدريس الثلاثة. ويلاحظ أن طريقة التدريس الأولى كانت الأفضل لان متوسط الرتب لها كان اكبر ويليها الطريقة الثانية وأخيرا الطريقة الثالثة ويمكن التأكد من مدى وجود الفروق بين الطرق لمعرفة أيها أكثر فاعلية من خلال إجراء مقارنات ثنائية بين كل طريقتين باستخدام اختبار مان وتني السابق. وبشكل عام يمكن معرفة أي الطرق أفضل من خلال الإحصاءات الوصفية (الحصول على متوسط الدرجات).

49

50 الاختبارات اللامعلمية لعينتين مرتبطيتن
في حالة عينتين مرتبطتين وكانت البيانات اسمية أو رتبية nominal or ordinal والمتغيرات ثنائية dichotomous variable يستخدم اختبار مكنمار McNemar test خاصة عند مقارنة قياسات لعينة محددة قبل وبعد إجراء معين. كأن يسأل مجموعة من الأشخاص عن مدى تفضيلهم (يفضلون أو لا يفضلون) لشيء معين قبل تطبيق سياسة دعائية معينة أو بعد تطبيقها. أما في حالة أن تكون البيانات رتبية على الأقل ومصنفة في أكثر من فئتين يستخدم اختبار ولكوكسن لعينتين مرتبطتين أو اختبار الإشارة.

51 اختبار ولكوكسن لعينتين مرتبطتين Wilcoxon- matched pairs signed- ranks test
يعتبر هذا الاختبار بديل لاختبار t المعلمي لعينتين مرتبطتين في حالة عدم توفر شروط اختبار t. لاستخدام هذا الاختبار فان البيانات يجب أن تكون بشكل أزواج من الدرجات وكل زوج منها يخص احد أفراد العينة وان هذه الدرجات عبارة عن بيانات فترية (interval data) على الأقل ولكنها لا تتبع التوزيع الطبيعي. هذا الاختبار لا يتأثر كثيرا بالقيم المتطرفة نظرا لأنه يعتمد في حسابه على رتب الفروق بين القيم وليس على القيم ذاتها. هذا الاختبار يقوم على إيجاد الفرق بين قيم الأزواج المرتبة (الفرق بين القيم قبل والقيم بعد) ومن ثم ترتيب القيم تصاعديا أو تنازليا وبالتالي إذا كان هناك فرق معنوي فستكون الفروق موجبة أو سالبة بشكل منتظم أو بثبات نسبي أما إذا لم يكن هناك فرق حقيقي فستكون الفروق المحسوبة متمازجة ولا يبدو لها اتجاه غالب على اتجاه آخر.

52 مثال (ملف البيانات 7) على : اختبار ولكوكسن لعينتين مرتبطتين Wilcoxon- matched pairs signed- ranks test لمعرفة مدى تأثير تركيب إشارة ضوئية في 12 مفترق طرق تم جمع عدد الحوادث على كل مفترق خلال أربعة أسابيع قبل تركيب الإشارة ثم جمع عدد الحوادث في كل مفترق بعد تركيب الإشارة أيضا خلال أربعة أسابيع. هل كان تركيب الإشارة الضوئية فعال في تخفيض عدد الحوادث ؟ الفرضية الصفرية: (وسيط عدد الحوادث قبل تركيب الإشارة = وسيط عدد الحوادث بعد تركيب الإشارة H0: M1 = M2 Н1 : M1 > M2

53 من خلال النتائج السابقة يلاحظ أن قيمة دالة الاختبار (z=-2
من خلال النتائج السابقة يلاحظ أن قيمة دالة الاختبار (z=-2.266) معنوية إحصائيا (sig = 0.023) لأنها اقل من القرار: نرفض الفرضية الصفرية وبالتالي نستنتج أن الإشارة الضوئية كان لها اثر فعال في تخفيض عدد الحوادث (حيث أن متوسط الرتبة لعدد الحوادث بعد تركيب الإشارة = 5.25 وهو اقل من متوسط الرتبة لعدد الحوادث قبل تركيب الإشارة 6.75 كما في الجدول الأول والتي تعني كما هو موضح أسفل الجدول (عدد الحوادث بعد تركيب الإشارة after كان أقل من عدد الحوادث قبل تركيب الإشارة before حدث 10 مرات، بينما عدد الحوادث بعد تركيب الإشارة after كان أكبر من عدد الحوادث قبل تركيب الإشارة before حدث مرتين فقط).

54

55 اختبار الإشارة لعينتين مرتبطتين the sign test
سمي باختبار الإشارة لأنه يستخدم إشارتي (+ ، -). يستخدم هذا الاختبار في اختبار الفروق بين عينتين مرتبطتين وهو مبني على اتجاه الفروق وليس على مقدار تلك الفروق ولذلك فان هذا الاختبار يعتبر اقل قوة من اختبار ولكوكسن السابق. يستخدم هذا الاختبار في حالة البيانات الرتبية (ordinal data) بشكل أساسي أما إذا كانت البيانات فترية أو نسبية (interval or ratio data) ولا تتبع التوزيع الطبيعي (لا تحقق الشروط) يجوز أيضا هنا استخدامه ولكننا نفضل استخدام اختبار ولكوكسن لعينتين مرتبطتين (Wilcoxon matched pairs test) السابق في هذه الحالة لأنه لا يعتمد على اتجاه الفروق (+، -) فقط بل يأخذ في الاعتبار مقدار الفروق أيضا لان الفروق لها معنى حقيقي في حالة البيانات الفترية والنسبية أما في حالة البيانات الرتبية فليس لها أي معنى وهذا يعتبر أكثر دقة والمثال التالي يوضح ذلك:

56 على فرض أننا نقارن بين مبيعات مندوبين أيهما أكثر دقة وأهمية للباحث:
أن يعرف مقدار الفرق بين مبيعات المندوبين مثلا 25 وحدة (المندوب الأول يبيع أكثر من المندوب الثاني بمقدار 25 وحدة). أم أن يعرف فقط أن المندوب الأول يبيع أكثر من المندوب الثاني (اتجاه الفرق +) فقط. واضح أن الأكثر دقة وفائدة أن نعلم مقدار الفرق وليس فقط اتجاه الفرق. ولذلك اختبار ولكوكسن يعتبر أكثر قوة من اختبار الإشارة

57 مثال (ملف البيانات 8) على اختبار الإشارة
أجريت دراسة على عينة مكونة من 25 شخص لتحديد مدى شعورهم بالراحة عند ركوبهم نوعين من السيارات (x و y) حيث طلب من كل شخص تقييم مدى شعوره بالراحة بناء على مقياس مكون من 5 نقاط (5-point scale) كما يلي: 1: غير مريح على الإطلاق 2: غير مريح نسبيا 3: حياد 4: مريحة 5: مريحة جدا وكانت نتائج الدراسة كما هو مرفق في الملف الخاص بالاختبار هل يمكن الاستنتاج عند مستوى دلالة 5% أن السيارة X أكثر راحة من السيارة y ؟

58 الحل مشكلة الباحث هنا تتعلق بالمقارنة بين مجتمعين كلاهما بيانات رتبية ordinal data حيث أن كل شخص أعطى نتيجتين للتقييم فان كلا العينتين مرتبطتين (matched pairs) وبالتالي فان الاختبار المناسب هو اختبار الإشارة sign test والذي يختبر الفرضية الصفرية التالية: H0: M1= M2 H1: M1 > M2 والفرضية الصفرية تعني أن (وسيط درجات المجتمع الأول = وسيط درجات المجتمع الثاني). من خلال النتائج وحيث أن الاختبار (right-tailed test) والنتيجة المحسوبة متسقة مع صياغة الفرضية البديلة إذن قيمة sig = 0.011/2 = وهي اقل من 0.05 إذن نرفض الفرضية الصفرية ونقبل البديلة والتي تنص على أن السيارة x أكثر راحة من السيارة y من وجهة نظر أفراد العينة.

59

60 اختبار لعدة عينات مرتبطة
في حالة المتغيرات الاسمية nominal أو الرتبية المنقسمة ثنائيا dichotomous variables يستخدم اختبار كوكران Cochran Q test وهو يعتبر تعميم لاختبار مكنمار السابق في حالة أكثر من عينتين أما عندما تكون البيانات على الأقل رتبية at least ordinal وموزعة في أكثر من فئتين يستخدم اختبار فريدمان.

61 اختبار فريدمان لعدة عينات مرتبطة Friedman Test for K dependent Samples
يستخدم هذا الاختبار عندما يريد الباحث أن يعرف ما إذا كان هناك فروق بين عدة مجتمعات (مجتمعين فأكثر والبيانات موزعة في أكثر من فئتين). مثلا قد يطلب من المبحوثين ترتيب بعض الأشياء كان تكون هناك أربع مهن مختلفة ويطلب من كل فرد في العينة أن يبدي رأيه بأفضلية كل مهنة أي أن يعطي الترتيب الأول للمهنة التي يفضلها أكثر وهكذا. ويريد الباحث معرفة ما إذا كان هناك فروق في تقييمات الأفراد أم لا. البيانات التي يتم تحليلها بيانات رتبية Ordinal Data كما يمكن تحليل البيانات الكمية (الفترية Interval والنسبية Ratio) وذلك بتحويلها إلى بيانات رتبية.

62 الفرضية الصفرية التي يختبرها اختبار فريدمان هي:
H0: M1= M2=M3= ……….=MK H1: At least one median is different والفرضية الصفرية تعني أن (وسيط درجات المجتمع الأول = وسيط درجات المجتمع الثاني = وسيط المجتمع الثالث الخ).

63 مثال (ملف البيانات 9) على اختبار فريدمان
احد الشركات قامت بإعلان طلب موظفين وقد تقدم للوظيفة 8 مرشحين وتم عقد لجنة مقابلات مكونة من 4 مدراء في الشركة حيث قام كل مدير بتقييم كل مرشح من عدة جوانب (الأداء الأكاديمي، الخبرة العملية، الشخصية ...الخ) باستخدام مقياس مكون من 5 نقاط بحيث 1 تشير إلى الأفضلية الكبيرة للموظف و2 أفضلية بدرجة اقل وهكذا حتى الدرجة 5 والتي تعني أن الموظف ضعيف وأراد المدير العام أن يختبر ما إذا كانت تقييمات المدراء الأربعة لا تختلف عن بعضها البعض أم أن تقييماتهم مختلفة بشكل كبير. البيانات في الجدول التالي. الفرضية المراد اختبارها هي: H0: M1=M2=M3=M4 H1: at least one Mi is different

64 من خلال النتائج يتضح أن قيمة كاي تربيع بلغت 12
من خلال النتائج يتضح أن قيمة كاي تربيع بلغت وهي معنوية إحصائيا عند مستوى دلالة 5% . بناء على ذلك نرفض الفرضية الصفرية ونستنتج أن تقييمات المدراء الأربعة ليست متشابهة.


Download ppt "المحاضرة العاشرة - تابع اختبار الفرضيات Hypothesis Testing الاختبارات المعلمية واللامعلمية Parametric and Non-Parametric Tests 1."

Similar presentations


Ads by Google