Vlastnosti kvantitatívnych dát Ukazovatele (miery) Poloha Central Tendency (Location) Menlivosť Variation (Dispersion) Tvar Shape Štatistika UVM
Kvantitatívne dáta Vlastnosti a ukazovatele Štatistika UVM
Vlastnosti kvantitatívnych dát Používané symboly Ukazovateľ Measure Populácia Population Výber Sample Rozsah (Size) N n Priemer (Mean) µ x Rozptyl (Variance) 2 s2 Štand.oddchýlka (Stand.Deviation) s Štatistika UVM
Aritmetický priemer (Mean) Miera polohy (často používaná) Bod „rovnováhy“ Citlivý na extrémne hodnoty („Outliers“) Vzorec (pre výber): Jednoduchý: Vážený (z frekv. tabuľky): Štatistika UVM
Modus (Mode) Miera polohy (centrálnej tendencie) Najčastejšie sa vyskytujúca hodnota Nie je citlivý na extrémne hodnoty Súbor môže mať aj viac modusov, alebo aj žiadny Používa sa u číselných ale aj kategoriálnych dát Príklady: Dáta: 10, 10, 11, 13, 9, 10, 10, 8 xMo=10 (1 modus) Dáta: 10, 10, 11, 12, 12, 8, 9, 10, 12 xMo=10 a 12 (2 modusy) Dáta: 10, 12, 8, 9, 11, 13, 7 - dáta bez modusu Štatistika UVM
Medián (Median) Miera polohy (centrál. tendencie) Necitlivý na extrémne hodnoty Stredná hodnota v usporiadanom súbore: ak n = nepárne, tak je to hodnota v strede usporiadaného súboru ak n = párne, tak je to priemer 2-och prostredných hodnôt usporiadaného súboru Pozícia mediánu v súbore: Štatistika UVM
Medián - príklad n = 5 (nepárne) Dáta: 24.1 22.6 21.5 23.7 22.6 Usporiadané: 21.5 22.6 22.6 23.7 24.1 Pozícia: 1 2 3 4 5 Štatistika UVM
Medián - príklad n = 6 (párne) Dáta: 10.3 4.9 8.9 11.7 6.3 7.7 Uspor.:4.9 6.3 7.7 8.9 10.3 11.7 Pozícia:1 2 3 4 5 6 Štatistika UVM
Variačné rozpätie (Range) Miera variability (menlivosti, dispersie) Vzorec: R = xmax - xmin Ignoruje rozdelenie dát (ich výskyt) Príklad: Dáta: 7, 7, 8, 8, 9, 9, 10, 10 R = 10-7 = 3 Dáta: 7, 8, 8, 9, 9, 9, 10, 10, 10, 10 7 8 9 10 7 8 9 10 Štatistika UVM
Rozptyl & štandardná odchýlka Variance & Standard Deviation Miery variability najviac používané (menlivosti, disperzie) Posudzujú rozdelenie dát Ukazujú variabilitu okolo priemeru ( x alebo ) Vzorec (výberový rozptyl): Jednoduchý: Vážený ( z frekv. tabuľky): Štatistika UVM
Štandardná odchýlka Smerodajná odchýlka (Standard Deviation) n - 1 v menovateli! Použi N ak počítaš rozptyl populácie namiesto n-1! Štatistika UVM
Rozptyl & štandardná odchýlka Príklad Dáta:17, 16, 21, 18, 13, 16, 12, 11 n = 8 Štatistika UVM
Relatívne miery variability Variačný koeficient (Coefficient of Variation): vyjadruje sa v percentách porovnanie variability 2-och rôznorodých súborov Štandardná chyba (Standard Error): Štatistika UVM
Miery tvaru Shape Popisujú ako sú dáta rozložené Miery tvaru sú: Šikmosť (Skew = Skewness) Špicatosť (Kurtosis) Šikmosť: Left-Skewed Symmetric Mean = Median Mode Mean Right-Skewed Median Mean Mode Štatistika UVM
Miery tvaru Shape Špicatosť (Kurtosis): Špicatejšie ako N(0,1) + Normálne rozdelenie N(0,1) Plochejšie ako N(0,1) - Štatistika UVM
Kvartily (Quartile) Miery alokácie (Measure of Noncentral Tendency) Rozdeľujú usporiadané dáta na 4 rovnako početné časti: Q1 Q2 Q3 Pozícia i-ho kvartilu: 25% Štatistika UVM
Kvartily (Quartile) Príklad Dáta: 10.3 4.9 8.9 11.7 6.3 7.7 Uspor.:4.9 6.3 7.7 8.9 10.3 11.7 Pozícia: 1 2 3 4 5 6 Štatistika UVM
Kvartilové rozpätie Interquartile Range miera variability výskyt (rozšírenie, Midspread) javu u 50% jednotiek súboru necitlivá na extrémne hodnoty Vzorec: RQ = Q3 – Q1 Dáta: 17,16, 21,18, 13, 16,1 2, 11 Uspor.: 11,12,13, 16, 16, 17, 18, 21 Pozícia: 1, 2, 3, 4, 5, 6, 7, 8 n = 8 kQ3 = 6,75 kQ1 = 2,25 RQ = 18 – 12 = 6 Štatistika UVM
Krabicový graf Box Plot Grafické zobrazenie dát pomocou 5-tich popisných štatistík (ukazovateľov) X Q Median Q X smallest 1 3 largest 4 6 8 10 12 Štatistika UVM
Tvar (Shape) & Box Plot Left-Skewed Symmetric Right-Skewed Q Median Q 1 3 1 3 1 3 Štatistika UVM
Miery tvaru Shape Koeficient šikmosti (Skew = Skewness), označenie 1 zošikmenie doľava kladný zošikmenie doprava záporný symetria 0 Koeficient špicatosti (Kurtosis) označenie 2 normálne rozdelenie 0 špicatejšie kladný plochejšie záporný Štatistika UVM