ការវិភាគទិន្នន័យ ORDINAL ជំពូកទី៨ ការវិភាគទិន្នន័យ ORDINAL
គោលបំណងនៃមេរៀន៖ ការសិក្សាលើមេរៀននេះគឺ ចង់អោយ និស្សិត យល់ច្បាស់ពីអត្ថន័យរបស់ទិន្នន័យ ORDINAL ដំណើរការរៀបចំការវិភាគទិន្នន័យ ចេះប្រើប្រាស់នូវរូបមន្ដ ដើម្បីដំណើរការវិភាគទិន្នន័យ ប្រកប ដោយប្រសិទ្ធភាព មានសមត្ថភាពក្នុងការរៀបចំដំណើរការស្រាវជ្រាវ វិភាគទិន្នន័យព្រមទាំង ធ្វើការវាយតំលៃលទ្ធផល។
I. ទិន្នន័យ ORDINAL ផ្សារភ្ជាប់ជាមួយ Frequency នោះទិន្នន័យ ORDINAL ត្រូវបានប្រើសំរាប់គណនាមធ្យម វារ៉្យង់, គំលាតស្ដង់ដា និង ទំរង់ស្ថិតិផ្សេងៗទៀត។ ក្នុងសំណួរស្ទង់មតិមួយចំនួន ចំលើយនៃសំនួរ ត្រូវបានប្រើជាលេខសំរាប់ឆ្លើយ។ (សូមមើលឧទាហរណ៍ទំព័រទី៥៥)
ការចាត់អត្រាប្រើពាក្យ ល.រ ការចាត់អត្រាប្រើពាក្យ តម្លៃជាលេខ ១ ២ ៣ ៤ ៥ សំខាន់ណាស់ សំខាន់ ធម្មតា មិនសូវសំខាន់ មិនសំខាន់ ពត៌មានជាច្រើនត្រូវបានប្រមូលតាមរយះនៃការស្ទង់មតិ ហើយវាមានប្រយោជន៍តាមកំរិតរបស់វា និង ត្រូវបានរៀបចំក្រោមទំរង់មួយ មុនពេលធ្វើការវិភាគ។
ទំរង់ទូទៅ ដែលត្រូវបានប្រើប្រាស់នោះគឺ បំណែងចែកប្រេកង់។ បំណែងចែកប្រេកង់ គឺជាការចាត់ក្រុមទិន្នន័យទៅ តាមប្រភេទ ដែលបង្ហាញនូវចំនួននៃការអង្កេតទាំងអស់ទៅក្នុងលក្ខណៈវិនិច្ឆ័យនិមួយៗ។ បំណែងចែកប្រកង់ផ្ដល់នូវ ចំនួនដងនៃតំលៃ (លក្ខណៈវិនិច្ឆ័យ) ដែលបានកើតឡើង។ ឧទាហរណ៍៖ បំណែងចែកប្រេកង់ (សូមមើលទំព័រទី ៥៥ និង ៥៦)
ខ្សែកោងប្រេកង់
ល.រ ចំនួនទស្សនាវដ្តីដែល បានអាន Frequency (ចំនួនដងបានបញ្ជាក់) ១ ២ ៣ ៤ ៥ ៦ ៧ ៨ ៩ ០ ២៣៧ ៥៨៨ ៩៧ ៣០ ១៥ ១២ សរុប ១,០០០
II. ការវាស់ប្រវែងទីតាំង ក្នុងមេរៀនមុន ទិន្នន័យដែលប្រមូលបាននោះត្រូវ បានគេសង្ខេបក្នុងតារាង និង បង្ហាញតាមក្រាហ្វិក។ ឥឡូវនេះយើងនឹង ធ្វើការវាស់វែងទីតាំងរបស់ទិន្ន ន័យដោយប្រើមធ្យម។ ១. មធ្យម (Mean)៖ ការពិព៌ណនាសង្ខេបទិន្នន័យដែលគេប្រើទូទៅ គឺជា ការវាស់វែងឈានទៅរកភាពកណ្ដាល(បង្ហាញចំណុចកណ្ដាល) នៃបំណែងចែកតំលៃជាលេខ។
ឧទាហរណ៍ ៖ កុមារ ៦នាក់ ដែលមានអាយុពី ០៧ឆ្នាំ ដល់ ១៤ឆ្នាំ។ បច្ចុប្បន្នកាលវាស់វែងឈានទៅរកភាពកណ្ដាលដែល គេនិយមប្រើក្នុងការស្រាវជ្រាវ M.K.T នោះគឺ មធ្យម នព្វន្ធ។ Mean គឺជាចំនួនសរុបនៃតំលៃជាលេខ ហើយចែកឲ្យចំនួន នៃ តំលៃជាលេខ (n) ៖ ហៅថាមធ្យមនៃលេខមួយចំនួន។ ឧទាហរណ៍ ៖ កុមារ ៦នាក់ ដែលមានអាយុពី ០៧ឆ្នាំ ដល់ ១៤ឆ្នាំ។ (n = ៦ ការវាស់វែង)
មានន័យថា Mean ស្ថិតនៅកន្លែងមួយចំកណ្តាល នៃ តំលៃទាំនោះ (សរុប អាយុក្មេងទាំង ៦ នាក់)។ វាបានសរុបនូវ តំលៃលេខ ទាំងអស់ទៅជា កន្សោមលេខតែមួយ។ ឧទាហរណ៍ ៖ គេលក់ខោ ៥ ដែលមានតំលៃខុសគ្នា គឺ X១= ១២ , X២=១៥ , X៣=១១ , X៤=១២,៥០ , X៥=១៣,៥០។ គណនាតំលៃជាមធ្យមនៃខោ ទាំង ៥។
F : ជាប្រេកង់ (Frequency) ដូចនេះខោនិមួយៗមានតំលៃជាមធ្យមគឺ $១២,៨០។ ខាងក្រោមនេះ គឺជារូបមន្តមួយទៀត សំរាប់គណនាមធ្យម (Mean) នៃបំណែង ចែកប្រេកង់។ ២. មធ្យមនៃបំណែងចែកប្រេកង់ ៖ F : ជាប្រេកង់ (Frequency) X : តំលៃជាលេខ
ឧទាហរណ៍ ៖ គណនា Mean នៃចំនួនទស្សនាវដ្តីដែលមនុស្សក្នុងប៉ាន់គំរូបានអាន ល.រ ចំនួនទស្សនាវដ្តីដែលបានអាន (X) ប្រេកង់ (F) F.X ១ ២ ៣ ៤ ៥ ៦ ៧ ៨ ៩ ០ ២៣៧ ៥៨៨ ៩៧ ៣០ ១៥ ១២ ១៩៤ ៩០ ៦០ ៥៤ ៤៩ ៤០ សរុប =១.០០០ =១,១៣៥
មធ្យមបំណែងចែកប្រេកង់ ចំពោះអ្នកអានទស្សនាវដ្តិ៍គឺ៖ ករណីនេះយើងអាចនិយាយថា ៖ មធ្យម (Mean) នៃចំនួនទស្សនាវដ្តី ដែលបាន អានដោយមនុស្សនៅក្នុងប៉ាន់គំរូ គឺច្រើនជាង ១ (តិចជាង២)។ ចំពោះមធ្យម (Mean) នៃការចាត់អត្រាអំពីសារៈសំខាន់ ត្រូវបាន គណនាដោយរូបមន្តធម្មតា គឺសំដៅទៅលើមធ្យមនៃតំលៃជាលេខនៅក្នុង របាយការណ៍ នៃការស្រាវជ្រាវ M.K.T ។
ដោយប្រើរូបមន្ត ៖ (Mean នៃតំលៃជាលេខ)។ ក្នុងករណីនេះយើងអាចនិយាយថា ៖ អកប្បកិរិយានៃប៉ាន់គំរូ គិតជាមធ្យម ៣,៤ (តំលៃជាលេខ) គឺមានលក្ខណៈធម្មតា មានទំនោរទៅរក សំខាន់។
III. ការវាស់វែងរប៉ាយ (ភាពប្រែប្រួលនៃទិន្នន័យ) (Measures of Dispersion / Variability in Data) ១. Range ការវាស់វែងឈានទៅរក ភាពកណ្តាលបង្ហាញនូវ ចំណុចកណ្តាលនៃ តំលៃជាលេខ។ ចំពោះការវាស់វែងនៃរប៉ាយបង្ហាញថា តើតំលៃជាលេខនោះលាតសន្ធឹង យ៉ាងណាពីចំណុចកណ្តាល។ ការវាស់វែងរប៉ាយដ៏ងាយបំផុតគឺ Range ដែលជាភាពខុសគ្នារវាង តំលៃទាប និងតំលៃខ្ពស់បំផុត នៅក្នុងបំណែងចែក។
ដោយប្រើនូវរូបមន្តពីអាយុក្មេង ០៦ នាក់ពីមុនយើងបាន ៖ Range =១៤-៧ = ៧ ឆ្នាំ ២. គំលាត់ស្តង់ដារ (Standard Deviation) វិធីសាស្រ្តដែលគេនិយមប្រើសំរាប់វស់រប៉ាយគឺ គំលាតស្តង់ដារ និងវ៉ារ្យ៉ង់នៃបំណែង ចែកមួយ។
ខ. គំលាតស្តង់ដារ ៖ ឧទាហរណ៍ ៖ ដោយប្រើទិន្នន័យ អំពីអាយុក្មេង (n= ៦ តំលៃ) យើង គណនាវ៉ារ្យ៉ង់ និងគំលាតស្តង់ដារ តាមជំហានដូចខាងក្រោម ៖
វ៉ារ៉្យង់ ៖ គំលាតស្តង់ដារ ៖ ជាទូទៅ ៖ គំលាតស្តង់ដារ (មធ្យមនៃគំលាតពីមធ្យម) ត្រូវបានប្រើញឹកញាប់ ជាងវ៉ារ្យ៉ង់។ នៅពេលដែលទិន្នន័យត្រូវបានរៀបចំជាក្រុម ទៅជាបំណែងចែកប្រេកង់ នោះរូបមន្តត្រូវបានប្តូ ដើម្បីគណនាជាដំបូងគឺ វ៉ារ្យ៉ង់ ហើយចុងក្រោយគឺគំលាត ស្តង់ដារដែលមានរូបមន្ត ៖
គំលាតនៅក្នុងសិ្ថតិមានន័យថា គំលាតពីមធ្យម (Mean)។ ឧទាហរណ៍ ៖ប្រសិនបើមធ្យម (Mean) នៃប្រាក់ឈ្នួល ស្មើនឹង ៧ ដុល្លាក្នុង ១ ម៉ោង។ លោក A ទទួលបាន $៩/h នោះគំលាតរបស់គាត់គឺ +$២។ ប្រសិនបើ លោក B ទទួលបាន $ ៥,៥០/h នោះគំលាតរបស់គាត់ស្មើនឹង -$១.៥០។ សញ្ញា (+) និង (-) បញ្ជាក់ថា “លើ” និង “ក្រោម” មធ្យម។
IV. ការបកស្រាយ និងការប្រើប្រាស់គំលាតស្តង់ដារ ៖ (Interpretation and Uses of the Standard Deviation) នៅពេលដែលចំនួន នៃការអង្កេត មានតំលៃធំ (n ច្រើនជាង ១០០) ការវិភាគ ទិន្នន័យទាំងនោះ និងបែងចែកខ្លួនវាជុំវិញមធ្យមទៅតាម រូបភាពស៊ីមេទ្រី។ បំណែង ចែកប៉ាន់គំរូនៃ (ជា) មធ្យមនឹង អនុញ្ញាតិឈានទៅរកបំណែងចែកធម្មតា (បំណែងចែក ប្រេកង់រាងដូចជួង)។ ប្រសិនបើគំលាតស្តង់ដារត្រូវគណនា មានតំលៃស្មើ “ S ” តើត្រូវបកស្រាយ ដោយរបៀបណា ?
+ ជារឿយៗវាត្រូវបានប្រើសំរាប់ធ្វើ ការវិភាគទំនាក់ទំនងរបស់វា ចំពោះមធ្យម នៃបំណែងចែកធម្មតាមួយ។ + គំលាតស្តង់ដារ គឺជាវិធីសាស្រ្តសំខាន់ ព្រោះវាមានទំនាក់ទំនងជាមួយ នឹងមធ្យម នៃបំណែងចែកស៊ីមេទ្រី។ + ទំនាក់ទំនងមួយ គឺក្នុងល័ក្ខខ័ណ្ឌនៃភាគរយរបស់ការសង្កេតក្នុង ១ គំលាត ស្តង់ដារខាងក្រោម និងខាងលើមធ្យម (Mean) ។ គឺថានៅក្នុងបំណែងចែកធម្មតា ប្រហែល ៦៨% នៃការអង្កេតឋិតនៅក្នុង (Mean) និង (គំលាតស្តង់ដារ)។ ហើយ ១/៦ ដែលនៅសល់ គឺសិ្ថតនៅលើ ១ គំលាតស្តង់ដារឃ្លាតពី Mean និង ១/៦ សិ្ថត នៅទាបជាង ១ គំលាតស្តង់ដារឃ្លាតពី មធ្យម Mean។
V. វិធាន EMPIRICAL (The Empirical Rule) ចំពោះខែ្សកោងបំណែងចែកស៊ីមេទ្រីរាងដូចជួង (រូបខាងក្រោម) យើងអាចពន្យល់ ឲ្យ កាន់តែច្បាស់នូវរប៉ាយពី Mean។ ទំនាក់ទំនងនេះពាក់ព័ន្ធដល់គំលាត ស្តង់ដារ និង Mean រួមមាននៅក្នុងវិធាន Empirical ពេលខ្លះគេហៅថា Normal Rule។ វិធាន Empirical ៖ ចំពោះបំណែងចែកប្រេកង់ស៊ីមេទ្រី (បំណែងចែកប្រេកង់ រាងដូចជួង) នោះប្រហែល ៦៨% នៃការអង្កេតសិ្ថតនៅក្នុង ធំ និងតូចជាង ១ គំលាតស្តង់ដារពី Mean ប្រហែល ៩៥ % នៃការអង្កេតសិ្ថតនៅក្នុង ធំ និងតូច ជាង ២
គំលាតស្តង់ដារពី Mean ហើយនៅក្នុងគ្រប់ការអនុវត្តន៍ ៩៩,៧ % សិ្ថតនៅក្នុង ធំ និងតូចជាង ៣ គំលាត ស្តង់ដារពី Mean ។
ក្នុងវិធាននេះយើងគួរកត់សំគាល់ ៖ ប្រសិនបើបំណែងចែកមួយ ស៊ីមេទ្រី ហើយ រាងដូចជួង នោះក្នុងការអនុវត្តន៍រាល់ការអង្កេតឋិតនៅរវាង ធំ ( + ) ឬ តូច ( - ) ជាង ៣ គំលាតស្តង់ដារពី Mean ។ ឧទាហរណ៍ ៖ ប្រសិនបើ = ១០០ និង S= ១០ នោះក្នុងការអនុវត្តន៍រាល់ការ អង្កេតឋិតនៅរវាង ១០០+ (៣ x 10) និង ១០០ - (៣x១០) ឬ ៧០ និង ១៣០។ ដូចនេះ Rang = ១៣០-៧០ = ៦០។
ផ្ទុយទៅវិញបើយើងដឹង Rang = ៦០ យើងអាចប៉ាន់ប្រមាណគំលាតស្តង់ ដារ ដោយចែក Rang នឹង ៦។ ឧទាហរណ៍ ៖ ប៉ាន់គំរូមួយនៃចំនួនប្រាក់ចំណាយប្រចាំខែសំរាប់អាហារដោយ គ្រួសារនៅភ្នំពេញ គឺប្រហែលជា បំណែងចែកប្រេកង់ស៊ីមេទ្រី (បំណែងចែកប្រេកង់ រាងដូចជួង) Mean នៃប៉ាន់គំរូស្មើ $១៥០ គំលាតស្តង់ដារគឺ $២០ ។ ដោយប្រើវិធាន Empirical ៖
ក. ប្រមាណ ៦៨% នៃការចំណាយប្រចាំខែលើម្ហូបអាហារ គឺឋិតនៅចន្លោះ ចំនួនពីរណានោះ ? ខ. ប្រមាណ ៩៥% នៃការចំណាយប្រចាំខែលើម្ហូបអាហារ គឺឋិតនៅចន្លោះ ចំនួនពីរណានោះ ? គ. ប្រមាណ ៩៩,៧% នៃការចំណាយប្រចាំខែលើម្ហូបអាហារ គឺឋិតនៅ ចន្លោះចំនួនពីរណានោះ ?
សំណួរ ៖ ១. តើទិន្នន័យ ORDINAL ប្រើសំរាប់គណនាអី្វខ្លះ ? ចូរពន្យល់ ? ២. តើការវិភាគទិន្នន័យ ORDINAL វាផ្តល់ប្រយោជន៍ អី្វខ្លះ? ចូរពន្យល់ ?