Download presentation
Presentation is loading. Please wait.
1
Vzorčenje in statistično zaključevanje
Anja Podlesek Podiplomski študij psihologije, Metodologija psihološkega raziskovanja
2
Populacija in vzorec posploševanje z vzorca na populacijo
opredelitev populacije in vzorca sestavljanje liste, s katere vzorčimo reprezentativnost, nepristranskost vzorec ima podobne lastnosti kot populacija (enakost deležev) velikost vzorca ekonomičen N, dopustna napaka vzorčenja, variabilnost pojava, pričakovana razlika, določitev N iz enačb za testiranje hipotez
3
Tehnike vzorčenja Naključno vzorčenje vsak element ima enako možnost izbora v vzorec; visoka zunanja veljavnost; reprezentativnost ni garantirana; vrečka, tabele naključnih števil, Excel - Random Number Generation Stratificirano vzorčenje razdelitev populacije na razrede, iz njih naključno / proporcionalno vzorčimo Sistematično vzorčenje naključno določen začetek, korak n elementov Vzorčenje klastrov naključen izbor klastra oziroma vzorčne enote, vzorec = vsi člani klastra Večstopenjsko vzorčenje določimo večje klastre, naključno izberemo nekaj klastrov, naključno vzorčimo iz posameznega klastra Priložnostni vzorec problem prostovoljnih udeležencev; kvotni vzorec
4
Vzorčne porazdelitve Če iz definirane populacije izberemo vse možne vzorce velikosti N, lahko za vsak vzorec določimo statistike (npr. M, SD). Statistike se od vzorca do vzorca spreminjajo. vzorčne porazdelitve statistik opisnih statistik vzorca, npr. M, var, p, r… drugih izrazov, npr. Vsako vzorčno porazdelitev lahko opišemo: Mstatistike SD = SEstatistike
5
Vzorčne porazdelitve frekvenčna porazdelitev spremenljivke SD M
vzorčna porazdelitev statistike SEstatistike Mstatistike
6
Standardne napake SEM = standardni odklon vzorčnih aritmetičnih sredin
= standardna napaka ocene m
7
Statistično zaključevanje
Izberemo vzorec. Določimo statistiko (npr. M). Posplošujemo z vzorca na populacijo. ocenjevanje parametra Vprašanje: Kolikšen je parameter (m) v populaciji? testiranje hipotez Vprašanje: Ali je M pomembno različna od neke vrednosti?
8
Ocenjevanje parametra
Vzorčna statistika je ocena populacijskega parametra. Točkovna ocena parametra nepristranska ocena - sredina vzorčne porazdelitve statistike je enaka ocenjevanemu parametru; vse mere centralne tendence, deleži, korelacijski koeficienti pristranska ocena - mere razpršenosti Intervalna ocena parametra razpon vrednosti, znotraj katerega se bo populacijski parameter nahajal z določeno verjetnostjo = interval zaupanja
9
Ocenjevanje parametra
Intervalna ocena parametra vzorčna porazdelitev grafični prikaz kvantilov 1 - a a / 2 SEM · zp p = a / 2 SEM sp zg (npr. 90 % interval zaupanja pri = 0,10) interval zaupanja
10
Ocenjevanje parametra
Splošno intervalno ocenjevanje parametrov pri velikih vzorcih SEG Gpop Gvz vzorčna porazdelitev G je N.D. 1 N (0,1) z
11
Ocenjevanje parametra
Pri majhnih vzorcih Vzorčna porazdelitev G je N.D. le, če je frekvenčna porazdelitev spremenljivke normalna. preveriti Ocena populacijske s se z večanjem vzorca vse bolj bliža dejanski vrednosti s. Vzorčna porazdelitev razmerja (glej desno) je t-porazdelitev, ki je odvisna od stopenj prostosti. SEG Gpop 1
12
Ocenjevanje parametra
Interval zaupanja za m df = N - 1 Interval zaupanja za s sp. meja: zg. meja: df = N - 1 c21-p c2p
13
Testiranje hipotez Postavimo dve nasprotni si hipotezi (ničelno in alternativno). Konstruiramo vzorčno porazdelitev (pod predpostavko pravilnosti ničelne hipoteze - MG , SEG). Na osnovi vzorčne porazdelitve poznamo verjetnost pojavljanja določene vrednosti statistike. Če je vrednost statistike verjetna (znotraj intervala zaupanja), ohranimo ničelno hipotezo. Če je vrednost višja/nižja od zgornje/spodnje meje intervala zaupanja (pade v kritično regijo), ničelno hipotezo zavrnemo. (Pravilnost ničelne hipoteze je malo verjetna. Alternativna hipoteza je verjetnejša. Statistika našega vzorca se od poznanega / predpostavljenega parametra pomembno razlikuje.)
14
Testiranje hipotez Gpop Gvz H0: Gvz = Gpop H1: Gvz Gpop z
SEG H1: Gvz Gpop Gpop Gvz 1 z z > zkrit. zkrit.
15
Napake pri statističnem zaključevanju
naš zaključek r = 0 Gvz= Gpop r 0 Gvz Gpop pravilna potrditev ničelne hipoteze r = 0 Gvz= Gpop a napaka dejansko stanje pravilna zavrnitev ničelne hipoteze r 0 Gvz Gpop b napaka
16
Napake pri statističnem zaključevanju
a napaka zkrit. zkrit. z z zkrit. b napaka
17
Izbor ustreznega statističnega testa
vrsta statistike nivo merjenja normalnost porazdelitve enakost varianc odvisni / neodvisni vzorci majhni / veliki vzorci vrednost ničelne hipoteze nivo tveganja enosmerno / dvosmerno testiranje Neparametrični testi pogosto pri majhnih vzorcih, pri omejenosti razpona, stališča (U-porazdelitev) Pri intervalnih ali razmernostnih spremenljivkah z neparametričnimi testi ne upoštevamo vseh informacij - nižja moč testa (ničelno hipotezo, ki je napačna, težje ovržemo).
18
Raziskovalni načrti z 1 NV in 1 OV
primerjava vzorca s populacijo (primerjava vzorčne statistike s poznano ali predpostavljeno vrednostjo parametra) primerjava statistik dveh vzorcev primerjava statistik več vzorcev Ali so vrednosti preveč različne? Ali vzorci pripadajo isti populaciji?
19
Testiranje hipotez Povprečja N.D. parametrični testi 1 vzorec 2 vzorca
več vzorcev neodvisna odvisna neodvisnih odvisnih t test (one-sample) t test (independent t test (paired-samples) enosmerna ANOVA (GLM - univariate) enosmerna ANOVA (GLM - repeated-measures)
20
Testiranje hipotez Povprečja ni N.D. neparametrični testi 1 vzorec
2 vzorca več vzorcev neodvisna odvisna neodvisnih odvisnih binomski test - Mann- Whitneyev U - medianski test - Wilcoxonov T test (matched pairs) - test predznakov - Kruskal- Wallisov H - medianski test Friedmanov test
21
Testiranje hipotez - t test razlike med deleži - c2 o varianci
en vzorec: c2 dva vzorca: F test o povezanosti - t test za testiranje H0: r = 0 - Fisherjeva transformacija in z test za testiranje H0: r = X NOMINALNE SPREMENLJIVKE - t test razlike med deleži - c2 o obliki porazdelitve - c2 test - preverjanje N.D.: c2 test Kolmogorov-Smirnov Shapiro-Wilksov test
22
Velikost učinka kako zelo se vrednost statistike razlikuje od neke vrednosti (tj. sredine iz ničelne hipoteze) glede na razpršenost vrednosti spremenljivke (v populaciji iz ničelne hipoteze) višina korelacijskega koeficienta 0,20 - majhen učinek 0,50 - srednje velik učinek 0,80 - velik učinek s0 0,10 - nizek r 0,30 - srednje visok r 0,50 - visok r
23
Testiranje hipotez o sredini
en vzorec Testiranje hipotez o sredini o aritmetični sredini: df = N - 1 o mediani: ; majhni vz.: iz tabel binomskih verjetnosti 0.71 20 21 M -2.01 -1.41 t
24
Testiranje hipotez o odstotkih
en vzorec Testiranje hipotez o varianci ocena populacijske variance (korigirana varianca vzorca) poznana/predpostavljena populacijska varianca
25
Testiranje hipotez o korelacijskih koeficientih
en vzorec Testiranje hipotez o korelacijskih koeficientih Testiranje hipoteze r = 0 Testiranje drugačnih hipotez o r - Fisherjeva transformacija r v zr
26
Testiranje razlik med aritmetičnima sredinama
dva neodvisna vzorca Testiranje razlik med aritmetičnima sredinama Parametrični test t test Neparametrični testi Wilcoxonov test za neodvisna vzorca (Wilcoxonov R) Mann-Whitneyev U
27
t test za primerjavo sredin
dva neodvisna vzorca t test za primerjavo sredin Ali oba vzorca izhajata iz iste populacije? Je razlika med njunimi M ničelna? Ima NV vpliv na OV? vzorčna distribucija razlik med pari M standardna napaka razlik med M1 in M2 m1 - m2 M1 - M2 vrednost ničelne hipoteze (navadno 0) df = N1 + N2 - 2
28
Primer t testa dva neodvisna vzorca za testiranje razlik med M
Pr.1 KS ES M s’ var’ SEd = Sqrt (2.902/ /10) = 1.16 za testiranje razlik med M dveh vzorcev z neenakima variancama uporabimo drugačne df t = ( ) / 1.16 = 2.97 df = = 18; t.05(18) = 2.101
29
Testiranje razlik med dvema m pri neenakih variancah
zaokrožimo
30
Wilcoxonov R in Mann-Whitneyev U test
dva neodvisna vzorca Wilcoxonov R in Mann-Whitneyev U test Statistiki temeljita na vsoti rangov namesto na M. Vse dosežke rangiramo od najmanjšega do največjega. V vsakem vzorcu seštejemo range. H0 : ni razlik med vsotama rangov (rangi so podobno porazdeljeni) H1 : razlika obstaja, vsota rangov pri manjšem vzorcu je pomembno premajhna (rangi enega vzorca pomembno manjkrat predhodijo rangom drugega) precej velika moč testa
31
rang točke spol 1 47 deček 2 50 deklica 3 52 deklica 4 53 deklica 5 56 deček 6 58 deček 7 61 deklica 8 66 deček 9 67 deklica 10 68 deček 11 69 deklica 12 70 deklica 13 71 deček 14 72 deklica paziti na 15 76 deklica vezane 16 78 deček range Rdeklice = 77 Pri velikih vzorcih se Rdečki = 59 R porazdeljuje normalno. R’dečki = 60 z vrednost točke deklice dečki 53 58 76 66 69 68 72 71 70 78 52 47 50 56 61 67 primerjati z Rkrit.
32
Testiranje razlik med variancama
dva neodvisna vzorca Testiranje razlik med variancama PARAMETRIČNI TEST: F test F = večja s2 / manjša s2 F = H0 sprejmemo F > 1.0 H0 zavrnemo df = N-1 (pri obeh variancah) NEPARAMETRIČNI TEST O’Brien (1981) Izvorne podatke transformiramo (Mtrans = var) t test Pr. 1 F = 8.41 / 5.15 = 1.63; df1 = 9, df2 = 9; F.05(9,9) = 4.03
33
Testiranje razlik med korelacijskima koeficientoma
dva neodvisna vzorca Testiranje razlik med korelacijskima koeficientoma S Fisherjevo transformacijo r vrednosti transformiramo v zr (vzorčna distribucija N.D.). Testiramo hipotezo, da med dvema r ni razlik. Razlika med distribucijama (oblikama distribucij) v dveh vzorcih: Wald-Wolfowitz test homogenih nizov, Kolmogorov-Smirnov test za dva vzorca, Siegel-Tukeyev test
34
Testiranje razlik med aritmetičnima sredinama
dva odvisna vzorca Testiranje razlik med aritmetičnima sredinama Parametrični test test diferenc (t) Neparametrični testi Wilcoxonov test za odvisna vzorca (W. test ekvivalentnih parov / Wilcoxonov T) test predznaka
35
Test diferenc Ali je med dvema meritvama prišlo do sprememb?
otrok znani neznani razlika (d) A.A B.B C.C Č.Č D.D E.E F.F G.G H.H I.I M Md = s’ Med = SEM SDd = SEd = / Sqrt(10) = 4.23 t = ( ) / 4.23 = df = N - 1 = 9; t.05(9) = 2.262 material Pr.2 Ali je med dvema meritvama prišlo do sprememb? = one-sample t test (X razlike, mrazlik = 0)
36
Testiranje razlik med dvema m
dva odvisna vzorca Testiranje razlik med dvema m Testi za ponovljene meritve imajo večjo moč. Pr.2 r = 0.300 t = ( ) / sqrt( *0.300*3.001*4.021) = = / sqrt (17.934) = -3.19
37
Wilcoxonov test ekv. parov
dva odvisna vzorca Wilcoxonov test ekv. parov Pri vsaki osebi izračunamo razlike med dosežkoma. Razlike uredimo po absolutnih vrednostih od najmanjše do največje, nato jim pripišemo pripadajoče predznake. Seštejemo pozitivne in negativne range. H0: Mrazlik = 0 (oz. vsota pozitivnih rangov = vsota negativnih) H1: Vsoti sta različni. Ali je T (nižja vsota rangov) manjša od kritične? Test predznaka Preštejemo pozitivne in negativne razlike. Nižje število primerjamo s kritičnim.
38
Wilcoxonov test ekvivalentnih parov
material otrok znani neznani razlika otrok abs.raz. rang predzn.rang S+ = 5 … T S- = 50 Pri velikih vzorcih se T statistika porazdeljuje normalno, s sredino N(N+1)/4 in standardno napako Sqrt(N(N+1)(2N+1)/24). Ali je T manjši od kritične vrednosti? Če da, zavrnemo ničelno hipotezo.
39
enosmerna analiza variance
več vzorcev preverjanje razlik med aritmetičnimi sredinami več vzorcev: enosmerna analiza variance
40
Enosmerna ANOVA več vzorcev
meritve v več pogojih (oz. vzorčenje iz več populacij); H0 : ni razlik med njihovimi m neponovljene in ponovljene meritve OV vsaj na intervalni merski ravni, N.D. ocena variance SS df
41
Varianco lahko razstavimo na dva dela:
več vzorcev Varianco lahko razstavimo na dva dela: varianco napake, nastale zaradi napake merjenja (merski instrumenti), napake kontrole (zunanje spremenljivke), razlik med posamezniki varianco, nastalo zaradi učinkov neodvisne spremenljivke
42
več vzorcev MT = 7 SSznotraj-1 = 1(2-4)2 + 2(3-4)2 + 3(4-4)2 + 2(5-4)2 + 1(6-4)2 =12 SSznotraj-2 = 1(8-10)2 + 2(9-10)2 + 3(10-10)2 + 2(11-10)2 + 1(12-10)2 =12 SSmed = 9(4-7)2 + 9(10-7)2 = = 162 df znotraj = N - a = = 16 dfmed = a - 1 = = 1 MSznotraj = SSznotraj / dfznotraj = 24 / 16 = 1.5 MSmed = SSmed / dfmed = 162 / 1 = 162 F = 162 /1.5 = 108 F.05(1,16) = 4.49
43
Povzetek analize variance
več vzorcev Povzetek analize variance izvor variabilnosti SS df MS F p NV , < ,001 napaka ,5 skupaj Neodvisna spremenljivka je imela statistično pomemben učinek na odvisno spremenljivko; F (1,16) = 108; MSE = 1,5; p < ,001.
44
Po analizi variance ANOVA - hipoteze so nespecifične
več vzorcev Po analizi variance ANOVA - hipoteze so nespecifične Med katerimi mi obstajajo razlike? primerjave a priori post hoc vnaprej pričakujemo razliko ANOVA odkrije razliko SSkontrast, df = 1, MS, F - Sheffejev test dve m: - Tukeyev test Bonferronijeva prilagoditev a
45
Primerjava median Kruskal-Wallisov H test
več neodvisnih vzorcev Primerjava median Kruskal-Wallisov H test zvezna spremenljivka, ordinalna Ali je porazdelitev (Me) v vseh vzorcih enaka? Vse podatke rangiramo. Izračunamo vsote rangov v vsakem vzorcu in statistiko H. Primerjamo jo s c2p, df=a-1 Razširjeni medianski test Poiščemo skupno mediano vseh podatkov. Preštejemo, koliko podatkov posameznega vzorca pade pod / nad skupno mediano - c2 test (2*a tabela).
46
Kruskal - Wallisov test
glasba tišina hrup 6 5 3 4 7 2 4 8 1 rangirano: 7 6 3 Rj Rj2 točke rang ozadje 1 1 hrup 2 2 hrup 3 3 hrup 4 4.5 glasba 5 6 tišina 6 7 glasba 7 8 tišina 8 9 tišina Pri majhnih vzorcih - tablice. Pri velikih vzorcih = (12/(9*10))*(256/3+529/3+36/3)-3(9+1) = 6.49 c2,05(2) = 5.991
47
neparametrična alternativa analizi variance za ponovljene meritve
več odvisnih vzorcev Primerjava median Friedmanov test neparametrična alternativa analizi variance za ponovljene meritve H0: ni razlik med medianami populacij Rangiramo rezultate znotraj osebe in seštejemo range pri posameznem pogoju. Testna statistika c2F je podobna Kruskal-Wallisovi.
48
Friedmanov test = (12/(3*5*6))*(225+49+49+49+81)-3*3*6 = 6.4
parfum oseba A B C D E 1 10(5) 8(4) 4(2) 5(3) 1(1) 2 10(5) 2(1) 3(2) 5(3) 8(4) 3 8(5) 5(2) 6(3) 4(1) 7(4) Rj = (12/(3*5*6))*( )-3*3*6 = 6.4 c2(4) = 9.49 Pri velikih vzorcih: Pri majhnih vzorcih - tablice.
49
Načrti z več NV = večfaktorski načrti
parametrični testi: dvosmerna ANOVA, trosmerna ANOVA neparametrični testi: c2 za dve NV, log-linearna analiza
50
Nominalni podatki
51
Statistično zaključevanje za frekvence
Opis: tabele, frekvenčni poligoni, histogrami Običajna vprašanja: - enakost deležev kategorij pri več vzorcih - ujemanje dejanskih podatkov s pričakovanimi, testiranje hipotez o obliki porazdelitve - povezanost (interakcija) med dvema nominalnima spremenljivkama
52
c2 test za eno spremenljivko
Ali je višja pogostost ene kategorije slučajna? pričakovane frekvence H0: Populacijska frekvenčna distribucija je enaka pričakovani. odstopanje dejanskih od pričakovanih vrednosti … Pearsonov c2 - približek c2 distribucije df = a - 1
53
Pogoji za uporabo c2 testa
ekskluzivnost kategorij neodvisnost podatkov ft > 5 Interpretacija c2 nespecifičen test pretvorba v odstotke pregled rezidualov - koliko se vsaka frekvenca razlikuje od pričakovane, doprinos k c2
54
Primer c2 testa za preverjanje pravokotnosti porazdelitve
Delež avtomobilov v 15 minutah, ki gredo v križišču levo, desno, naravnost levo naravnost desno fe ft rez c2(2) = 28, p < .001
55
Odgovori fe ft fe-ft (fe-ft)2/ft (fe-ft)/Sqrt(ft)
a b c d e c2 = 9.778 c2.05(4) = 9.49
56
c2 test odvisnosti dveh spremenljivk
kontingenčna tabela H0: Vpliv ene spremenljivke ni odvisen od druge spremenljivke (oz., na vseh nivojih ene sprem. so nivoji druge enako izraženi). pričakovana frekvenca fe = fvrsta fstolpec / N c2, df = (V-1)(S-1) pregled rezidualov
57
vrsta robcev papir tekstil ženske Sv* (29) (21) (+1.192)* (-1.645) moški (-1.192) (+1.645) c2 = (36-29)2/29 + (14-21)2/21 + (22-29)2/29 + (28-21)2/21 = = 8.05 df = (v-1)(s-1) = (2-1)(2-1) = 1 c2.05 (1) = 3.841 *SDrez = sqrt((100-50)/(100-58)) = sqrt(1.19) = rezidual = (36-29)/sqrt(29) = z = / = 1.192 Ss*
58
Odvisni vzorci, 2 x 2: McNemarjev test
primerjava frekvenc pri istem vzorcu na dveh meritvah test 2 - + test A* 55B B in C - neujemanje - 25C 15D* A in D - neujemanje *pričakovane frekvence: (A+D)/ polovica neujemanj -/+, polovica +/- c2 = (A-D)2 / (A+D) c2 = 100 / 20 = 5 ali c2 = (5 - 10)2 / 10 + ( )2 / 10 = 5
59
Previdnost! pomembna mesta
Interpretacija izsledka naj upošteva značilnosti raziskovalnega načrta. ni statistično pomembno = ni dokazano Če ničelne hipoteze ne zavrnemo, to še ne pomeni, da je pravilna. Pri opazovanem pojavu ni bilo tako izrazitega učinka NV, da bi ga zaznali, kar ne pomeni, da zagotovo ne obstaja.
60
Osnovna literatura Ferguson, G. A. (1998). Statistical analysis in psychology and education (3.izd.). New York: McGraw-Hill. Graveter, F.J., in Wallnau, L.B. (2000). Statistics for the Behavioral Sciences (5.izd.). Belmont, CA: Wadsworth/Thomson Learning. Pagano, R.R. (2001). Understanding Statistics in the Behavioral Sciences (6.izd.). Belmont, CA: Wadsworth/Thomson Learning. Petz, B. (1997). Osnovne statističke metode za nematematičare (3. izd.). Jastrebarsko: Naklada Slap. Spatz, C. (2001). Basic Statistics (7.izd.). Belmont, CA: Wadsworth/Thomson Learning. Spiegel, M. R. (1991). Theory and problems of statistics (2. izd.). New York: McGraw - Hill.
61
http://193.2.70.110/katedre/PM/ Studij/
Three statisticians go deer hunting with bows and arrows. They spot a big buck and take aim. One shoots and his arrow flies off three meters to the right. The second shoots and his arrow flies off three meters to the left. The third jumps up and down yelling: “We got him! We got him!”
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.