Statistik untuk Sains Sosial Bab 3 Pemerihalan Data
Kegunaan Taburan Kekerapan Memadatkan (condenses) data mentah kepada bentuk yang lebih berguna. Membolehkan interpretasi cepat secara visual ke atas data Membolehkan penentuan ciri utama data termasuk di mana tumpuan data Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-2
Jadual Taburan Kekerapan Jadual taburan kekerapan ialah satu kaedah & tatacara untuk memperihalkan semua data yang terkumpul dan tidak terkumpul.
Taburan Kekerapan Data Tidak Terkumpul Susun data daripada yang terkecil kepada yang terbesar mengikut nilai sebenar. Bentuk taburan kekerapan.
Data Mentah
Taburan Kekerapan Skor Pencapaian
Taburan Kekerapan Modal Terkumpul Mengkelas atau mengumpulkan data mengikut kelas atau kategori. Kategori yang dibuat dipanggil kelas. Kelas mengandungi selang kelas, had kelas, nilai titik tengah dan skor.
Bilangan Kelas Anda mesti berhati-hati dalam: memilih bilangan kumpulan kelas bagi jadual, menentukan lebar yang sesuai bagi satu kumpulan kelas, dan menentukan sempadan bagi setiap kumpulan kelas untuk mengelakkan pertindihan. Jumlah kumpulan kelas bergantung kepada jumlah data. Jika jumlah yang lebih besar, secara umumnya perlu lebih kelas.
Bilangan Kelas Satu taburan kekerapan patut mempunyai sekurang-kurangnya 8 tetapi tidak melebihi 15 kelas atau 10 – 15 kelas. Lihat Jadual 3.3
Had Sebenar Kelas Had sebenar setiap kelas perlulah ditunjukkan kerana setiap skor mempunyai had nilai terendah sebenar hingga had nilai tertinggi sebenar. Nilai skor 10 berada antara 9.5 (nilai terendah sebenar) dan 10.5 (nilai tertinggi sebenar). Nilai had sebenar, nilai titik tengah dan kekerapan bagi setiap kelas ditunjukkan dalam Jadual 3.4.
Peratus Kekerapan & Kekerapan Kumulatif Nilai kekerapan dijadikan peratus untuk memberi gambaran yang lebih baik. Kekerapan kumulatif: dikira jika analisis lanjut diperlukan untuk mendapat nilai min, median dan persentil. dikira dengan mencampurkan kekerapan bagi setiap kelas bermula daripada kelas yang terbawah. Jumlah kekerapan kumulatif pada kelas paling atas mestilah sama dengan N. Lihat Jadual 3.5.
Carta Turus Digunakan untuk menggambarkan data jenis nominal dan ordinal. Turun menegak dan turus mendatar mewakili setiap kategori yang bersifat eksklusif. Setiap turus hendaklah terpisah dengan turus yang lain. Panjang turus menunjukkan kekerapan (frekuensi) atau peratusan bagi setiap kategori.
Carta Turus
Carta Turus
Graf Garisan & Kekerapan Poligon Graf ini menggunakan nilai titik tengah yang mewakili setiap kelas taburan. Garisan graf dilukis melalui setiap titik tengah dalam bentuk garisan lurus. Lihat Rajah 3.5.
Poligon Kekerapan Titik Tengah Kelas Frekuensi 10 - 20 15 3 21 - 30 25 6 31 - 40 35 5 41 - 50 45 4 51 - 60 55 2 (In a percentage polygon the vertical axis would be defined to show the percentage of observations per class) Kelas Titik Tengah
Ogif Dilukiskan berdasarkan kepada nilai kekerapan kumulatif. Paksi mendatar menggunakan nilai had sebenar bagi setiap kelas dan peratusan kumulatif di sepanjang paksi menegak. Lihat Rajah 3.6
Carta Bulatan/Pai Digunakan untuk menunjukkan perbandingan kategori yang digunakan dalam data nominal atau ordinal. Carta bulatan/pai adalah satu bulatan yang dibahagikan kepada kepingan yang mewakili kategori. Saiz setiap kepingan berbeza mengikut peratusdalam setiap kategori.
Carta Bulatan/Pai
Nilai Asas dan Nilai Hujung (Stem-and-Leaf Display) Satu cara mudah untuk melihat bagaimana data tertabur dan di mana tertumpu. Kaedah - Asingkan siri data yang telah disusun dari min ke max kepada digit asas (stem) dan digit hujung (leaves)
Nilai Asas dan Nilai Hujung Metod pemerihalan data yang menggabungkan teknik taburan kekerapan dan gambaran taburan setiap kes/skor bermula daripada skor terendah hingga skor terbesar. Paksi menegak mewakili nilai asas iaitu digit pertama sesuatu skor.
Nilai Asas dan Nilai Hujung e.g. nilai asas 4 dan nilai hujung 5 mewakili skor 45. Nilai asas disusun pada paksi menegak dan nilai hujung diletakkan di sebelah kanan nilai asa dan membentuk garisan melintang. Lihat Jadual 3.7
Satu tatasusunan terurut adalah susunan data daripada nilai terkecil ke nilai terbesar (An ordered array is a sequence of data, in rank order, from the smallest value to the largest value). Menunjukkan julat (range) (nilai minimum ke nilai maksimum) Boleh membantu mengenalpasti nilai terpencil (outliers) Age of Surveyed College Students (Umur Pelajar Universiti yang dikumpul ) Day Students 16 17 18 19 20 21 22 25 27 32 38 42 Night Students 23 28 33 41 45 Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc..
Menyenarai Data Numerik: Taburan Kekerapan (Frequency Distribution) Taburan kekerapan adalah jadual ringkasan di mana data disusun kepada kelas numerik tertentu Anda mesti berhati-hati dalam memilih jumlah kumpulan kelas (class groupings) bagi jadual, menentukan lebar (width) yang sesuai bagi satu kumpulan kelas, dan menentukan sempadan (boundries) bagi setiap kumpulan kelas untuk mengelakkan pertindihan (overlapping). Jumlah kumpulan kelas bergantung kepada jumlah nilai –nilai dalam data. Dengan jumlah yang lebih besar, secara umumnya perlu lebih kelas. Secara umum, satu taburan kekerapan patut mempunyai sekurang-kurangnya 5 tetapi tidak melebihi 15 kelas. Untuk menentukan lebar satu sela kelas (width of a class interval), bahagikan julat (range ) iaitu Nilai tertinggi – Nilai terkecil dalam data dengan jumlah kumpulan kelas yang diinginkan. Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc..
Menyenarai Data Numerik : Contoh Taburan Kekerapan Contoh: Satu pembuat penebat haba (manufacturer of insulation) memilih 20 hari musim sejuk secara rawak (random) dan merekodkan suhu tertinggi harian 24, 35, 17, 21, 24, 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27 Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc..
Menyenarai Data Numerik : Contoh Taburan Kekerapan Susun data mentah dalam susunan menaik (Sort raw data in ascending order): 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Cari julat (Find range): 58 - 12 = 46 Pilih jumlah kelas (Select number of classes): 5 (usually between 5 and 15) Hitung sela kelas (Compute class interval) (width): 10 (46/5 then round up) Tentukan sempadan kelas (Determine class boundaries) (limits): Class 1: 10 to less than 20 Class 2: 20 to less than 30 Class 3: 30 to less than 40 Class 4: 40 to less than 50 Class 5: 50 to less than 60 Hitung titik tengah kelas (Compute class midpoints): 15, 25, 35, 45, 55 Kira pemerhatian dan letakkan ke kelas yang betul (Count observations & assign to classes) Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc..
Menyusun Numerical Data: Kekerapan Kumulatif (Cumulative Frequency) Data dalam tatasusunan terurut (ordered array): 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Cumulative Frequency Cumulative Percentage Class Frequency Percentage 10 but less than 20 3 15 3 15 20 but less than 30 6 30 9 45 30 but less than 40 5 25 14 70 40 but less than 50 4 20 18 90 50 but less than 60 2 10 20 100 Total 20 100 Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc..
Taburan Kekerapan (Frequency Distributions): Some Tips Sempadan data yang berbeza boleh menghasilkan gambaran yang berbeza bagi data yang sama (terutama bagi set data yang kecil) Pergerakan dalam tumpuan data mungkin berlaku bila sempadan kelas yang berbeza dipilih Apabila saiz set data meningkat, impak sebarang perubahan dalam pemilihan sempadan kelas dikurangkan Apabila membandingkan dua atau lebih kumpulan dengan saiz sampel yang berbeza, kita mesti menggunakan sama ada kekerapan relatif (relative frequency) atau taburan peratusan (percentage distribution).
Menyenarai Data Numerik: Histogram Satu carta turus menegak data dalam bentuk taburan kekerapan dipanggil histogram. Dalam histogram tidak terdapat jurang di antara turus yang berdekatan. Sempadan kelas (atau titik tengah kelas) ditunjukkan pada paksi mendatar . Paksi menegak adalah sama ada kekerapan, kekerapan relatif, atau peratusan. Tinggi turus mewakili kekerapan, kekerapan relatif, atau peratusan.