Stefán Hrafn Jónsson 7-11-2013 13-11-2013 Aðferðafræði II Stefán Hrafn Jónsson 7-11-2013 13-11-2013
Ný og gömul kennslubók Í útgáfu 9 er kafli 12 með sama efni og kafli 12+13 í útgáfu 7. Kaflar 12 og 13 í útgáfu 7 hafa verið sameinaðir í kafla 12 í útgáfu 9. Ég veit ekki hvernig þetta lítur út í útgáfu 8.
Að mæla samband með fylgnistuðli Svona reiknum við fí
Gildi phi Milli 0 og 0,1 veikt samband Milli 0,1 og 0,3 miðlungs sterkt Yfir 0,3 sterkt samband
Phi Ef krosstafla er stærri en 2*2 (sérstaklega þegar með fleiri en 2 dálkum OG fleiri en 2 röðum) þá eru efri mörk phi fyrir ofan 1,0 Fylgnistuðull sem nær fyrir ofan 1,0 er erfiður í túlkun Notum því Phi ekki nema fyrir 2*2 töflur
Stærri töflur Hægt að nota t.d. Cramers V og Lamda
Cramers V
Um phi og Cramers V Erfitt að túlka 0,0 er vissulega ekkert samband (ef kí-kvaðrat reiknast 0,0 þá er phi og Cramers V = 0,0) 1,0 er vissulega fullkomið samband en erfitt að túlka allt þar á milli
Phi (Fí) og V eru taldir hafa galla Erfitt að túlka, Þess vegna voru þróaðir nýir stuðlar sem sumir byggja á spádómum um hlutfallslega minnkun á villu þegar við spáum fyrir um gildi á mælingu Lamda er dæmi um forspárstuðul (tegund af fylgnistuðli) Tökum dæmi, fyrst um meðaltal
Spádómar Ef launadreifing er þessi: Meðaltal og miðgildi er 350þús Staðalfrávik er 45 þúsund Við þurfum að spá fyrir um laun einstaklings sem við veljm með tilviljun úr þýði án þess að vita nokkuð um einstaklinginn, hver eru líklegustu laun þessa einstaklings? Hvaða ágiskun er best til að við séum að jafnaði sem næst réttu gildi?
Ef við mælum laun öðru vísi Há laun 653 Lá laun 48 Við veljum einn einstakling af handahófi og við ættum að giska á hvort sá hafi há eða lá laun. Hvaða gildi myndum við giska á? Ef við þyrftum að giska á laun allra í úrtakinu (701 ) vitandi bara heildardreifingu ekki laun hvers og eins Hversu oft myndum við giska á rangar tekjur? Það er hafa rangt fyrir okkur?
En ef við höfum þetta 100 manna úrtak? 52 Hávaxin 48 Lávaxin Giskum á hæð þeirra vitandi bara heildardreifinguna
En ef við vitum kyn(úr kennslubók) Ef við ættum að spá fyrir um hæð einstaklings, án þess að vita nokkuð um þann einstakling, hvaða gildi á hæð myndum við giska á þannig að við hefðum rétt fyrir okkur sem oftast? Við myndum giska á að viðkomandi væri hávaxinn, þá myndum við hafa rétt fyrir okkur í 52% tilfella. Ef við erum að spá fyrir hæð 100 einstaklinga þá höfum við rétt fyrir okkur í 52 tilfellum.
Við hefðum þá rangt fyrir okkur í 48 tilfella. Fyrir útreikninga á lambda þurfum við að hætta að tala um prósentur heldur tala um fjölda Við hefðum þá rangt fyrir okkur í 48 tilfella. Köllum þessa villu, E1 = 48, villu (error) í fyrstu spá En ef við vitum kyn? Getum við spáð fyrir um hæð og verið með færri villur?
Já við getum fækkað villum með því að nota kyn Ef við fáum 50 karla og 50 konur. Giskum á að allir karlar séu háir Giskur að allar konur séu láar Þá eru 6 +8 villur Köllum það E2 = 14 = 6+8
Hversu mikið hefur villan minnkað
Gildi á lambda og styrkur sambands Á milli 0 og 0,1 Veikt samband Á milli 0,1 og 0,3 Miðlungs sterkt samband Hærra en 0,3 Sterkt samband
Reiknum lambda á tússtöflu Dæmi bls. 325 Viðhorf til dauðarefsinga eftir trú
Stefán, reikna dæmið á töfluna áður en þú kíkir á svörin
E1 E2 (80-65)/80 = 0,19 Lambda = 0,19
Kafli 13 Samband milli breyta sem mældar eru á raðkvarða.
Tvennskonar raðkvarðar Breytur sem eru með mörg möguleg gildi (rank order) Þá reiknum við Spearmans rho Breytur sem eru ekki með mörg möguleg gildi . Talað um collapsed ordinal variable Bókin miðar við að gildin séu ekki fleiri en 6 Aðrir hafa miðað við t.d. 9 gildi Þá reiknum við Gamma (ef gildi eru ekki mjög mörg). Sumir reikna Tau-b, Tau-c, eða sommers d. Við sleppum þeim að þessu sinni (í þessu námskeiði)
Byrjum á Gamma Oftast samt skrifað: Gamma eða G. Tekur gildi frá -1,0 til 1,0 Þar sem -1,0 og 1,0 er fullkomin fylgni 0,0 er engin fylgni
Gamma Byggir líka á PRE, proportion reduction in error Hlutfallsleg minnkun á villu En spáin er gerð öðru vísi en fyrir lambda
Dæmi bls 340
snúa eins eða ekki eins á breytunum tveimur. Finnum hversu margir (mörg stök, cases) snúa eins eða ekki eins á breytunum tveimur. Ns fyrir N same order Nd fyrir N different order Tökum alla reiti í töflunni (LL, MM, HH, LM…. o.s.frv.) (Lár-Lár, Meðal Meðal, Hár Hár, Lár Meðal) og margföldum hvert og eitt gildi t.d. LL með summu einstaklinga sem sem er í sömu röð og þau gildi. (þ.e. með hærra gildi á báðum breytum) Líklega er málsgreinin hér að ofan óskiljanleg nema með dæmi
Finnum Ns Finnum hversu mikið fjöldatölur raðast í sömu röð. Ein leið til að finna það er að fylgja reikni reglum sem kynntar eru hér.
Við tökum töluna í efsta reit til vinstri og margföldum með summunni af tölum sem eru hærri á báðum breytum 20 * (15+5+11+21) = 1040 Byrjum alltaf efst i vinstra horni Total Total
Klárum efstur röð, tökum næsta reit með 6 og margföldum með summunni af tölum sem er í reitum með hærra gildi á báðum breytum 6 * (5+21) = 156 Total Total
Klárum efstu röð. Tökum 4 og margföldum með 0, það er engin reitur með hærra gildi á báðum breytum. 4 * (0) = 0 Við tökum ekki samtals dálkinn Total Total
Höldum áfram með næstu röð 10 * (11+21) = 320 10 * (11+21) = 320 Total Total
15* (21) = 315 Total Total
21* (0) = 0 Við förum ekki í total dálk eða röð Total Total
15* (21) = 315 Total Total
8* (0) = 0 Við förum ekki í total röðin Total Total
Þá er Ns fundið 1040+156 + 320+ 315 = 1831 = Ns Ns (N in same direction) Næst er það Nd N in different direction
Við tökum gildið í efstu röð, lengst til hægri Margföldum með summu af gildum í reitum sem eru neðar í töflunni (lægri röð) og til vinstri (í dálkum) 4*(10+15+8+11) = 176 Total Total
Áfram reit fyrir reit, til vinstri 6*(10+8) = 108 Total Total
5*(8+11) = 95 (skrifaðu þetta á töfluna Stefán) Total Total
15*(8) = 120 (skrifaðu þetta á töfluna Stefán) Total Total
Nú höfum við fundið Nd Þá er Nd fundið Nd = 176+108+95+102 = 499
Þá getum við reiknað Gamma G=(Ns -Nd ) / (Ns +Nd ) Þetta lítur reyndar mun betur út á töflunni Hvernig getur G orðið = 1,0 ? Hvernig getur G orðið = -1,0 ? http://www.youtube.com/watch?v=8SbUC-UaAxE&feature=related
Styrkur Gamma Milli 0 og 0,3 Veikt samband Milli 0,3 og 0,6 Miðlungs sterkt samband Hærra en 0,6 Sterkt samband
En hvað um Ef önnur breytan er nafnbreyta og hin raðbreyta? Ef nafnbreytan er tvígild t.d. dæmi bls. 349 þá má reikna gamma Ef nafnbreytan er með meira en 2 gildi, þá reiknum við eins og við værum með 2 nafnbreytur (t.d. Lambda).
Rho Dómari dæmir 13 einstaklinga í tveimur dönsum. Sá besti fær 1 (fyrsta sæti) næsti 2 (annað sæti) o.s.frv. Einhverjir eru janfir og fá sama númer (e. tie)
Spearmans rho Ef einhverjir voru jafnir þá notum við meðaltal þeirra gilda sem notuð eru ef þeir hefðu ekki verið jafnir. T.d. Þorgeir, Þóroddur og Þorlákur voru allir í jafnir í sætum 10,11, 12 (meðaltal þeirra sæta er 11)
Stefán: Kláraðu útreikninga á töfluna Hvenær verður rho = 1,0? Mæling 1 Mæling 2 D D2 Anna 1 6 5 25 Beta 2 3 9 Daníel 4 Einar -2 Fanney -3 Gunnar -4 16 Halldór 7 Þorsteinn 8 Þormóður Þorgeir 11 10 -1 Þorlákur Þóroddur 12 Þórunn 13 Samtals 66 Sinnum 6 396 N*(N2-1) 2184 6*sum(D2)/ 0,181319 1- (6*sum(D2)/ N*(N2-1)) = Rho 0,818681 Stefán: Kláraðu útreikninga á töfluna Hvenær verður rho = 1,0?
Túlkun á rho Milli 0 og 0,3 Veikt samband Milli 0,3 og 0,6 Miðlungs sterkt samband Hærra en 0,6 Sterkt samband
Túlkun á rho Ef reiknað rho er sett í annað veldi segir það okkur til um minnkun í forspárvillu. 0,8186*0,8186 = 0,6701 67% minnkun í forspárvillu ef við spáum fyrir um mælingu 1 útfrá mælingu 2 miðað við að við spáum án vitneskju um mælingu 1.
Hvenær er samband marktækt? t-reiknað fyrir Spearmans rho Z reiknað fyrir Gamma
Prófa hvort gamma sé marktækt Skref fyrir skref Forsendur prófs: tilviljunarúrtak Raðbreytur Úrtakadreifing er normaldreifð
Núlltilgátan og rannsóknartilgátan fyrir Gamma:
Z reiknað fyrir gamma
Bera saman við Z vendi Í tilbúnu dæmi um tónlist og árangur í námi Z reiknað = 1,97
Reiknum eins fyrir Spearmans rho Forsendur prófs: tilviljunarúrtak 2 raðbreytur Úrtakadreifing er normaldreifð
Rannsóknartilgátan og núlltilgátan fyrir spearmans rho
Sampling distribution = t distribution (ef N er 10 eða stærra) 120 eða stærra er Z dreifingin nothæf Frelsisgráður N – 2 = 8 (miðað við dæmi í bók) T vendi = +/- 2,306
T reiknað