STATISTIK PENDIDIKAN EDU5950 SEM1 2015-16 STATISTIK INFERENSI: PENGUJIAN HIPOTESIS PERBANDINGAN MIN BAGI LEBIH DARIPADA DUA KUMPULAN (UJIAN-F) Rohani Ahmad Tarmizi - EDU5950
STATISTIK INFERENSI ATAU PENTAKBIRAN (Inferential Statistics) Bertujuan untuk menerangkan ciri populasi berdasarkan data yang dikumpul daripada sampel. Tujuan ini berkait rapat dengan objektif kajian serta hipotesis atau soalan kajian. Membolehkan penyelidik membuat kesimpulan bahawa terdapat “statistik yang signifikan” atau “statistical significance” yang bermaksud boleh diterima pakai dengan meluas, meyakinkan.
LANGKAH PENGUJIAN HIPOTESIS L1. Nyatakan hipotesis iaitu hipotesis statistik/sifar (H0) dan hipotesis penyelidikan (HA) – BERARAH ATAU TIDAK BERARAH L2. Tetapkan aras signifikan, taburan persampelan dan statistik pengujian yang akan digunakan – ARAS ALPHA = 0.01/ 0.05/ 0.10, TABURAN PERSAMPELAN z, t, F, STATISTIK PENGUJIAN z, t, F L3. Tentukan nilai kritikal bagi taburan persampelan yang akan digunakan - RUJUK JADUAL z, t, F L4. Kirakan statistik pengujian (tests statistics) bagi taburan persampelan tersebut – RUJUK FORMULA L5. Buat keputusan, tafsiran dan kesimpulan.
L1. Nyatakan hipotesis (dua kumpulan) Hipotesis penyelidikan – Terdapat perbezaan yang signifikan antara tahap kepimpinan pengajaran Pengetua dan GPK1. Hipotesis nol/sifar – Tiada terdapat perbezaan yang signifikan antara tahap kepimpinan pengajaran Pengetua dan GPK1.
HA : µ1 ≠ µ2 HO : µ1 ≥ µ2 HA : µ1 < µ2 HO : µ1 ≤ µ2 HA : µ1 > µ2 1. Nyata hipotesis nol dan penyelidikan. HO : µ1 = µ2 HA : µ1 ≠ µ2 HO : µ1 ≥ µ2 HA : µ1 < µ2 HO : µ1 ≤ µ2 HA : µ1 > µ2
L2. TETAPKAN ARAS ALPHA = 0. 01/ 0. 05/ 0 L2. TETAPKAN ARAS ALPHA = 0.01/ 0.05/ 0.10, TABURAN PERSAMPELAN, STATISTIK PENGUJIAN Nilai alpha ditetapkan oleh penyelidik. Ia merupakan nilai penetapan bahawa penyelidik akan menerima sebarang ralat semasa membuat keputusan pengujian hipotesis tersebut. Ralat yang sekecil-kecilnya ialah 0.01 (1%), 0.05 (5%) atau 0.10(10%). Nilai ini juga dipanggil nilai signifikan, aras signifikan, atau aras alpha.
L2. Taburan Persampelan Taburan yang bersesuaian dengan analisis yang dijalankan. Ia merupakan model taburan dan mengambil pelbagai bentuk: Taburan persampelan min-min, ujian-z (n>30) Taburan persampelan min-min, ujian-t (n<30) Taburan persampelan perbezaan min-min t bebas Taburan persampelan perbezaan min-min t sandar Taburan persampelan F atau varians
L3. Nilai Kritikal Nilai kritikal adalah nilai yang menjadi sempadan bagi kawasan Ho benar dan Hp benar. Nilai ini merupakan nilai dimana penyelidik meletakkan penetapan sama ada cukup bukti untuk menolak Ho (maka boleh menerima Hp) ataupun tidak cukup bukti menolak Ho (menerima Ho). Nilai ini bergantung kepada nilai alpha dan arah pengujian hipotesis yang dilakukan.
L4. Nilai Statistik Pengujian Ini adalah nilai yang dikira dan dijadikan bukti sama ada hipotesis sifar benar atau salah. Jika nilai statistik pengujian masuk dalam kawasan kritikal maka Ho adalah salah, ditolak dan Hp diterima Jika nilai statistik pengujian masuk dalam kawasan tak kritikal maka Ho adalah benar, maka terima Ho.
L5. Membuat Keputusan, Tafsiran, dan Kesimpulan Jika nilai statistik pengujian masuk dalam kawasan tak kritikal maka Ho adalah benar, maka terima Ho.
L5. Membuat Keputusan,Tafsiran dan Kesimpulan Jika nilai statistik pengujian masuk dalam kawasan kritikal maka Ho adalah tak benar, maka Ho ditolak dan seterusnya, Hp diterima (bermakna ada bukti Hp adalah benar)
UJIAN-t TAK BERSANDAR Ujian yang digunakan bagi membanding dua kumpulan yang tidak bersandar atau berkait antara satu sama lain. Contohnya, membezakan tahap CGPA, IQ, MOTIVASI antara kumpulan lelaki dan perempuan. Kenal pasti p/u tak bersandar dan juga p/u bersandar. Hanya terdapat dua kumpulan untuk dibandingkan dalam sesuatu analisis.
Terdapat perbezaan prestasi ujian menaakul selepas eksperimen antara dua kumpulan pelajar yang mendapat pengajaran secara SCL dengan pengajaran konvensional S1=20 S2=25 S3=36 .. S1=28 S2=35 S3=46 .. Kumpulan KONV Kumpulan SCL
4. Kirakan nilai statistik pengujian sp² = (n1 - 1)s1² + (n2 - 1)s2² n1 + n2 - 2 Equal variance formula t = X1 – X2 sp² sp² n1 n2 + n1 adalah bilangan dalam sampel 1 n2 adalah bilangan dalam sampel 2 S1 adalah sisihan piawai bagi sampel 1 S2 adalah sisihan piawai bagi sampel 2
Ujian-t Bersandar (Paired sample t-test) Ujian ini digunakan untuk mengkaji perbezaan bagi satu perkara ia itu p/u bersandar antara dua kumpulan ia itu p/u tak bersandar tetapi berkait, berpadanan atau “matched-pair”.
4. Kirakan statistik pengujian Students should recognize such an extreme standard score as being highly unlikely under the assumption that the null hypothesis is true.
Terdapat perbezaan prestasi ujian menaakul sebelum eksperimen berbanding dengan selepas eksperimen. .. S1=28 S2=35 S3=46 .. Sebelum eksperimen Selepas eksperimen
PENGUJIAN HIPOTESIS PERBANDINGAN LEBIH DARIPADA DUA KUMPULAN ANALISIS VARIANS (ANOVA) Pengujian hipotesis ini adalah lanjutan kepada pengujian hipotesis perbandingan dua min. Ia melibatkan perbandingan lebih daripada dua min ia itu membanding min-min antara tiga, empat, lima atau lebih kumpulan atau subpopulasi. Min merupakan asas bagi perbandingan antara kumpulan.
MODEL PENGUJIAN POPULASI SUB-POPULASI 1 SUB-POPULASI 3 SUB-POPULASI 2
Pengujian hipotesis ini telah dikemukakan oleh Sir Ronald Fisher. Oleh itu beliau menamakan taburan persampelan yang digunakan sebagai taburan F. Taburan persampelan F merupakan taburan varians (perbezaan antara skor-skor bagi kumpulan-kumpulan yang dikaji.) Oleh kerana itu pengujian hipotesis ini dipanggil ujian F ataupun ujian ANALISIS VARIANS (Analysis of Variance- ANOVA)
Bentuk taburan persampelan ini adalah pencong kanan oleh kerana ia bukan taburan min-min tetapi varian-varians. Kawasan dikiri menunjukkan bahawa min-min yang dibanding tidak jauh berbeza. Manakala dikanan (kawasan kritikal) menunjukkan bahawa min-min yang dibanding adalah jauh berbeza – ia itu “statistically” ataupun “berbeza dengan bererti atau signifikan”.
Dengan menggunakan nilai kritikal ini kawasan kritikal dapat ditentukan. Kawasan kritikal menunjukkan kawasan terdapat bukti bahawa hipotesis sifar (H0) adalah palsu dan hipotesis penyelidikan (Hp/ Ha) adalah benar. Jika F uji termasuk dikawasan kritikal maka, “terdapat perbezaan yang signifikan antara min-min kumpulan-kumpulan (sub-populasi) tersebut. Seterusnya, buat keputusan, tafsiran dan kesimpulan.
Taburan F Hp adalah benar Ho adalah benar F uji F kritikal
Statistik pengujian bagi ujian ini adalah F uji atau F ratio atau Nisbah-F Nilai kritikalnya adalah nilai F krit Seperti ujian-t, ujian F melibatkan perbandingan min bagi pembolehubah bersandar. Setiap kumpulan atau sub-populasi merupakan p/u bebas atau p/u tak bersandar. Sebagai contoh, perbandingan min pencapaian antara kumpulan pelajar daripada program Masters Sains BK, PP, dan SS. P/u bebas – Program pengajian P/u bersandar – min pencapaian
PENGIRAAN NILAI KRITIKAL Tetapkan aras signifikan Kirakan darjah kebebasan Dk antara kumpulan = k-1 Dk dalam kumpulan = n-k k adalah bilangan kumpulan n adalah bilangan cerapan Carikan nilai kritikal yang sepadan di Jadual F
Dengan menggunakan nilaik kritikal ini kawasan kritikal dapat ditentukan. Kawasan kritikal menunjukkan kawasan terdapat bukti bahawa hipotesis sifar (H0) adalah palsu dan hipotesis penyelidikan (Hp/ Ha) adalah benar. Jika F uji termasuk dikawasan kritikal maka, “terdapat perbezaan yang signifikan antara min-min kumpulan-kumpulan (sub-populasi) tersebut. Seterusnya, buat keputusan, tafsiran dan kesimpulan.
Taburan F Hp adalah benar Ho adalah benar F uji F kritikal
4. Kirakan nilai statistik pengujian (ANOVA) F uji = Variansak = SSak / dkak Variansdk SSdk / dkdk
F uji = SSak / dkak SSdk / dkdk 1. Kirakan “sum of squares” (SS) 4. Kirakan nilai statistik pengujian (ANOVA) 1. Kirakan “sum of squares” (SS) 2. Determine degrees of freedom (dk) (ΣX)² N a. SSJ = ΣX² - b. SSak = [(∑X1)²/ n1 + (∑X2)²/ n2 + (∑X3)²/ n3 +….] - (∑X)² / N c. SSdk = SSJ - SSak F uji = SSak / dkak SSdk / dkdk a. dkak = k - 1 b. dkdk = N- k
Kes 1: Dr. Durraini ingin menentukan sama ada tahap pengetahuan IT antara guru sekolah bandar, pinggir bandar dan luar bandar berbeza. Beliau telah memilih secara rawak satu sekolah yang telah dikategorikan oleh pihak Kementerian Pendidikan sebagai sekolah bandar, pinggir bandar dan luar bandar. Daripada wakil setiap jenis sekolah tersebut beliau telah mengumpul maklumat tentang aspek IT dalam pengajaran dan pembelajaran. Salah satu aspek yang telah dikaji adalah tahap pengetahuan IT. Bagi mengesahkan perbezaan tahap IT dikalangan guru yang dikaji, Dr. Durraini telah menjalankan satu ujian bagi mengukur tahap pengetahuan IT guru-guru sekolah tersebut.
Nyatakan objektif kajian bagi kes tersebut. Nyatakan persoalan kajian bagi kes tersebut . Jalankan pengujian hipotesis yang sesuai.
Bandar (5) Pinggir Bandar (6) Luar bandar (7) X 40 33 23 45 39 32 51 KES 1: DATA Bandar (5) Pinggir Bandar (6) Luar bandar (7) X 40 33 23 45 39 32 51 53 29 49 42 25 28 232 245 210
BANDAR PGR BANDAR LUAR BANDAR X1 2 X2 X3 40 1600 33 1089 23 529 45 2025 39 1521 32 1024 51 2601 53 2809 29 841 49 2401 42 1764 25 625 28 784 232 10860 245 10175 210 6492
1: Bentuk hipotesis kajian a. Pembolehubah bersandar : Pengetahuan IT guru b. Pembolehubah tak bersandar : Lokasi sekolah c. Ho : Tidak terdapat perbezaan pengetahuan IT berdasarkan sekolah yang berbeza lokasi dalam kalangan guru di Hulu Selangor. Ha : Terdapat perbezaan pengetahuan IT berdasarkan sekolah yang berbeza lokasi dalam kalangan guru di Hulu Selangor. Min pengetahuan IT bagi kumpulan bandar = 46.40 Min pengetahuan IT bagi kumpulan pinggir bandar= 40.83 Min pengetahuan IT bagi kumpulan luar bandar = 30.00
dk antara kump = k-1 = 3-1 = 2 dk dalam kump = n-k = 18 – 3 = 15 2. Tetapkan tahap alpha, taburan persampelan,statistik pengujian Aras signifikan : α = 0.05 Taburan persampelan : Taburan F Statistik pengujian : F uji (Nisbah F) dk antara kump = k-1 = 3-1 = 2 dk dalam kump = n-k = 18 – 3 = 15
3. Tetapkan nilai kritikal dan kawasan kritikal Aras signifikan : α = 0.05 Taburan persampelan : Taburan F Statistik pengujian : F uji (Nisbah F) dk antara kump = k-1 = 3-1 = 2 dk dalam kump = n-k = 18 – 3 = 15 Fk = 3.68 Fk=3.68
= (∑X1)² + (∑X2)² + (∑X3)² _ (∑X)² 4. Kirakan Statistik Pengujian Varians Antara kumpulan a. SSak = (∑X1)² + (∑X2)² + (∑X3)² _ (∑X)² n1 n2 n3 n = (232)² + (245)² + (210)² _ (687)² 5 6 7 18 = 848.47
ii Varians dalam kumpulan a. SS dk = ∑X² _ (∑X)² _ SS ak n = (27527 – [687] 2 /18) - 848.47 = 1306.5 – 848.47 = 458.03
a. dk ak = k – 1 = 3-1 = 2 b. dk dk = n -k = 18- 3 = 15
= 848.47/2 = 424.24 F uji = SSak / dkak SSdk / dkdk 458.03/15 = 30.54 F uji = 13.89
5. Keputusan, Tafsiran dan Kesimpulan F uji berada dalam kawasan Hp benar. Keputusannya, tolak Ho, terima Hp. Oleh itu, dapatan kajian menunjukkan bahawa terdapat perbezaan tahap pengetahuan IT berdasarkan lokasi sekolah dalam kalangan guru di Hulu Selangor dengan signifikan, F (2, 15) = 13.89, p <0.05.
Skor min pengetahuan IT bagi guru sekolah bandar adalah 46 Skor min pengetahuan IT bagi guru sekolah bandar adalah 46.40, guru sekolah pinggir bandar adalah 40.83. manakala bagi guru sekolah luar bandar adalah 30.00. Hasil analisis ujian-F menunjukkan bahawa terdapat perbezaan yang signifikan antara ketiga-tiga min pengetahuan IT bagi guru daripada sekolah bandar, pinggir bandar dan luar bandar, F(2,15) = 13.89, p<.05. Dengan itu, dapatan kajian menunjukkan bahawa pengetahuan IT di antara guru yang berlainan lokasi sekolah adalah berbeza dengan signifikan. Analisis deskriptif menunjukkan bahawa guru dari kumpulan bandar adalah lebih mahir dalam pengetahuan IT daripada kumpulan yang lain-lain. Dapatan juga menunjukkan bahawa tahap pengetahuan IT bagi kumpulan guru luar bandar dan pinggir bandar didapati agak rendah.Sehubungan dengan itu, dapatan ini menunjukkan bahawa guru di sekolah luar bandar dan pinggir bandar perlu diberi perhatian yang lebih dalam aspek meningkatkan kemahiran IT di kalangan guru.
DUA PERINGKAT ANALISIS – DESKRIPTIF DAN INFERENSI Secara deskriptif dihuraikan min-min kumpulan tersebut dan nyatakan terdapat perbezaan min antara kumpulan tersebut jika ada. Secara inferensi perbezaan min ini hendaklah disahkan melalui LIMA LANGKAH - PENGUJIAN HIPOTESIS. Dengan itu pengkaji dapat menghebahkan bahawa terdapat perbezaan yang signifikan antara min-min tersebut ataupun disebaliknya.
LATIHAN 1 – ANOVA IV- Jenis Sekolah, DV- Tahap Pengetahuan IT X1 X2 X3 X4 1 4 3 2 6
x1 x12 x2 x22 x3 x32 x4 x42 1 4 16 3 9 2 6 36 5 11 10 22 20 86
1: Bentuk hipotesis kajian a. Pembolehubah bersandar : pengetahuan IT b. Pembolehubah tak bersandar : jenis sekolah c. Ho : Tidak terdapat perbezaan pengetahuan IT berdasarkan sekolah yang berbeza jenis dalam kalangan pelajar sekolah menengah di Hulu Selangor. Ha : Terdapat perbezaan pengetahuan IT berdasarkan sekolah yang berbeza jenis dalam kalangan pelajar sekolah menengah di Hulu Selangor. Min pengetahuan IT bagi pelajar sekolah A = 1 Min pengetahuan IT bagi pelajar sekolah B = 2 Min pengetahuan IT bagi pelajar sekolah C = 4 Min pengetahuan IT bagi pelajar sekolah D = 1
dk antara kump = k-1 = 4-1 = 3 dk dalam kump = n-k = 20 – 4 = 16 2. Tetapkan tahap alpha, taburan persampelan,statistik pengujian Aras signifikan : α = 0.05 Taburan persampelan : Taburan F Statistik pengujian : F uji (Nisbah F) dk antara kump = k-1 = 4-1 = 3 dk dalam kump = n-k = 20 – 4 = 16
3. Tetapkan nilai kritikal dan kawasan kritikal Aras signifikan : α = 0.05 Taburan persampelan : Taburan F Statistik pengujian : F uji (Nisbah F) dk antara kump = k-1 = 4-1 = 3 dk dalam kump = n-k = 20 – 4 = 16 Fk = 3.24 Fk=3.24
4. Kirakan Statistik Pengujian Varians Antara kumpulan a. SSak =(∑X1)² + (∑X2)² + (∑X3)² + (∑X4)² _ (∑X)² n1 n2 n3 n4 n = (5)² + (10)² + (20)² + (5) ² - (40)² 5 5 5 5 20 = (5 + 20 + 80 + 5 ) - 80 = 30
ii Varians dalam kumpulan a. SS dk = ∑X² _ (∑X)² _ SS ak n = ( 128 – [40] 2 /20) - 30.00 = 128 - 80 – 30 = 18.00
iv. F uji (Nisbah F) F uji = SSak / dkak SSdk / dkdk = 10 1 iv. F uji (Nisbah F) F uji = SSak / dkak SSdk / dkdk = 10 1.125 F uji = 8.8888 = 8.89
5. Keputusan, Tafsiran dan cadangan F uji berada dalam kawasan Hp benar. Keputusannya, tolak Ho, terima H. Oleh itu, dapatan kajian menunjukkan bahawa terdapat perbezaan tahap pengetahuan IT pelajar berdasarkan jenis sekolah dalam kalangan pelajar sekolah menengah di Hulu Selangor dengan signifikan, F (3, 16) = 8.89, p <0.05
Latihan 2: x1 x12 x2 x22 x3 x32 2 4 10 100 3 9 8 64 13 169 7 49 14 196 5 25 6 36 15 225 N1 =5 N2= 5 N3 =5 20 102 40 338 65 859 4.00 8.00 13.00 sum mean
= (∑X1)² + (∑X2)² + (∑X3)² _ (∑X)² 4. Kirakan Statistik Pengujian i. Varians Antara kumpulan a. SSak = (∑X1)² + (∑X2)² + (∑X3)² _ (∑X)² n1 n2 n3 n = (20)² + (40)² + (65)² _ (125)² 5 5 5 15 = 80+320+845 – 1041.67 = 203.33
ii Varians dalam kumpulan a. SS dk = ∑X² _ (∑X)² _ SS ak n = (1299 – [125] 2 /15) - 203.33 = 1299 – 1041.67 – 203.33 = 54.00
iii. F uji (Nisbah F) F uji = SSak / dkak SSdk / dkdk = 101. 67 4 iii. F uji (Nisbah F) F uji = SSak / dkak SSdk / dkdk = 101.67 4.5 F uji = 22.59
5. Keputusan, Tafsiran dan Kesimpulan F uji berada dalam kawasan Hp benar. Keputusannya, tolak Ho, terima Hp, Oleh itu, dapatan kajian menunjukkan bahawa terdapat perbezaan tahap KEPUASAN BEKERJA berdasarkan lokasi sekolah dalam kalangan guru di Hulu Selangor dengan signifikan, F (2, 12) = 22.59, p <0.05.
Analysis of Variance (ANOVA) can be used to test for the equality of three or more population means. Data obtained from observational or experimental studies can be used for the analysis. We want to use the sample results to test the following hypotheses: H0: 1=2=3=. . . = k Ha: Not all population means are equal If H0 is rejected, we cannot conclude that all population means are different. Rejecting H0 means that at least two population means have different values.
ANOVA: No Treatment Effect H0: 1 = 2 = 3 = ... = c H1: not all the k are equal The Null Hypothesis is True
ANOVA: Treatment Effect Present H0: 1 = 2 = 3 = ... = c H1: not all the k are equal The Null Hypothesis is NOT True ≠