Presentation is loading. Please wait.

Presentation is loading. Please wait.

Esmane analüüs Kordamine.

Similar presentations


Presentation on theme: "Esmane analüüs Kordamine."— Presentation transcript:

1 Esmane analüüs Kordamine

2 Esmane analüüs Anname ülevaate ühe tunnuse väärtustest
Analüüsi küsimus KUI SUUR OSA? MILLIST VÄÄRTUST ESINES KÕIGE ROHKEM? Tunnuse tüüp NIMITUNNUS JÄRJESTUSTUNNUS BINAARNE TUNNUS INTERVALLTUNNUS Valimi suurus VÄHE VASTAJAID PALJU VASTAJAID Meetod TEKST TABEL DIAGRAMM

3 Andmete esitamine m2008L.sav
Keskmine sissetulek pereliikme kohta viimasel kuul Sugu Mitu aastat olete kooliharidust saanud, koolides õppinud? Milline on Teie praegune haridustase? Perekonnaseis Mitu inimest elab Teiega koos ühes leibkonnas, Teie kaasa arvatud? Vanus

4 Milliste järeldusteni te kodustes töödes jõudsite.
Kodune ül. nr. 3 Milliste järeldusteni te kodustes töödes jõudsite.

5 Binaarne tunnus 1. Sugu Mees Naine
A: pakun välja kasutada tulpdiagrammi, mis näitab meeste ja naiste osakaalu. B: pakume sektordiagrammi, kuna siis on visuaalselt näha 2. 2 ja 6 võib lahendada nii tulp- kui ka sektordiagrammiga. 3. Kas teil on auto? Jah Ei

6 intervalltunnus tulpdiagramm

7

8

9

10

11 Mis oli auto maksumus ostmise ajal?
alla 1000 Üle 16000 Siia sobib kõige rohkem histogramm, kuna see illustreerib vahed kõige paremini. Sektor sobiks ka, aga sektoriga on üsna raske visuaalselt võrrelda andmed.

12 4. Kui palju eurosid te keskmiselt kulutate ühes kuus toidule?
50-70 71-90 91-110 130 ja enam X: Tundub, et histogramm sobib nende tulemuste grupeerimiseks ning esitlemiseks kõige paremini? Y: Vahemikud on olemas ning neid võib kasutada nii histogrammi kui ka sektordiagrammina

13 3. Kes tunnevad end õnnelikematena, kas mehed või naised?
Tulemuse näitamiseks kasutame histogrammi.

14 3. Kes tunnevad end õnnelikematena, kas mehed või naised?
Tulemuse näitamiseks kasutame histogrammi.

15

16 VÕRDLEMINE ... kasutades õpitud meetode Andmed kokku võtta eraldi iga grupi jaoks ja siis neid võrrelda. Arvnäitajatest kasutatakse võrdluste läbiviimiseks kõige sagedamini aritmeetilist keskmist Nimitunnuste ja järjestustunnuste puhul saab teha võrdleva sagedustabeli. Tulemuste esitamiseks võib aga kasutada näiteks võrdlevat tulpdiagrammi või joondiagrammi.

17 Võrdleme meeste naiste sissetulekuid
Kas me saame võrrelda keskmiseid sissetulekuid? Millist sissetulekut esineb meeste hulgas kõige rohkem ja kas see langeb kokku tüdrukute hulgas kõige enamlevinud sissetulekuga? Arvutame sagedused ja nendest lähtuvad protsendid võrreldavate gruppide lõikes võrdlev sagedustabel e risttabel.

18 Võrdlev sagedustabel Tabelist näeme, et mehi osales uuringus rohkem (243) kui naisi (198), mistõttu on sageduste põhjal gruppide võrdlemine raskendatud.

19 1 3 Tabelis 2. on paigutatud võrreldavad grupid veergudesse ning tabelisse on lisatud protsent nii, et meeste ja naiste vastused on eraldi tervikud (eraldi 100%), mistõttu saame nende gruppide vastuseid võrrelda . 2

20 Risttabel Võrdlev sagedustabel

21 Risttabelid Mõnikord sagedusi välja ei tooda, esitatakse ainult protsendid

22 Mida oleks vaja muuta?

23 Vormista järeldus

24 Vormista järeldus

25 Erinevuste illustreerimine protsentuaalseid jaotusi võrdleva diagrammina
Samad andmed, erinev tulemus?

26 KIHtdiagramm Kui võrreldavaid gruppe on rohkem kui kaks, läheb tavaline võrdlev tulpdiagramm üsna kirjuks ja seega raskesti arusaadavaks. Kihtdiagrammis esitatakse iga võrreldava grupi kohta üks tulp, mis on jagatud võrdluse aluseks oleva tunnuse väärtuste protsentuaalse osakaalu järgi kihtideks, mis kokku moodustavad 100%.

27 kihtdiagramm Millist panka kasutatakse põhiliselt?

28 Millist panka...

29 Võrdleme Erinevate haridustasemetega vastajate vanuseid
KAS arvutame sagedused ja nendest lähtuvad protsendid võrreldavate gruppide lõikes?

30 Näiteks Riigieksami tulemuste analüüs Min, max
Keskväärtus (keskmise taseme võrdlemiseks) Standardhälve (hajuvuse võrdlemiseks)

31 Aritmeetiline keskmine Geomeetriline keskmine Harmooniline keskmine
Jaotus Kirjeldavad arvnäitajad Keskmine tase Mood Mediaan Aritmeetiline keskmine Geomeetriline keskmine Harmooniline keskmine Ruutkeskmine Kaalutud keskmine Hajuvus Ulatus Kvartiilid Protsentiilid Dispersioon Standardhälve Jaotuse kuju Asümmeetria Ekstsess

32 Keskmine tase Mood ... on tunnuse kõige enam esinenud väärtus
Unimodaalne mood Bimodaalne moodi Multimodaalne mitu moodi Mood ... on tunnuse kõige enam esinenud väärtus mo= Kõige enam kasutatud inimese nimi maailmas on… mo= Mohammed SPSSi vastus: mo=1 “Multiple modes exist. The smallest value is shown” NYDailyNews.com

33 Bimodaalne jaotus … on ka sümmeetriline
N: on mõõdetud kahte erinevat gruppi:

34 Keskmine tase Mediaan ... on variatsioonirea keskel paiknev väärtus
Tavaline andmerida: Variatsioonirida (samade andmete põhjal): me= me = Mida saate järeldada, kui arvutuste tulemusena saadi laste arvu mediaaniks 1? KUI on paarisarv andmeid: Siis mediaan on variatsioonirea kahe keskmise liikme aritmeetiline keskmine Me= (2+3)/2=2,5

35 Kas mediaan on alati reaalne väärtus variatsioonireast?

36 Keskmine tase Aritmeetiline keskmine e keskväärtus
...võimaldab suurt hulka numbrilisi andmeid koondada ja välja tuua üldtendentse. Puuduseks tundlikkus äärmuslike väärtuste suhtes, kasutatakse eelkõige väikese hajuvuse korral keskväärtuse suhtes. Nt keskmine vanus 44 ei ütle midagi selle kohta, kui palju on alla 20-aastaseid. Mood ja mediaan – muutuvad siis, kui esineb olulisi muutusi andmetes Aritmeetiline keskmine – muutub siis, kui muutub kasvõi üks rea liige Keskväärtus on võrreldes teiste näitajatega kõige stabiilsem Kõigile teada tuntud arvnäitaja (kõik teavad ja oskavad arvutada)

37 Keskväärtuse rakendamine
A. Masso

38 Keskmine tase Aritmeetiline keskmine e keskväärtus
Kui esineb ekstreemseid väärtuseid, siis ei näita objektiivselt keskmist tendentsi Töötajate sissetulekud: I gr II gr Aritmeetilised keskmised: Mediaanid: I gr. – I gr II gr. – II gr. -190

39 Stat.ee Eesti keskmine 2010 Täpsustatud andmetel vähenes aastal Eesti arvestuslik rahvaarv ligi 3000 inimese võrra 2012. aasta 1. jaanuaril elas Eestis inimest, teatab Statistikaamet.

40 Ekstreemsete väärtuste...
korral näitab keskmist taset paremini kui aritmeetiline keskmine: GEOMEETRILINE KESKMINE – ei ole tundlik ekstreemsete väärtuste suhtes KAALUTUD KESKMINE – arvestab erinevat palka saavate inimeste hulka => kui on rohkem madalamapalgalisi, siis nende mõju keskmisele on suurem. KOHANDATUD KESKMINE – keskmine, mille arvutamisel jäetakse välja 5% või 10% ekstreemsetest näitajatest, eemaldame ülisuurte ja üliväikeste väärtuste mõju MEDIAAN

41 1 3 2

42 2005 a. lõpueksami (kirjand)
tulemused: Esmasel vaatlusel ei teki ülevaadet: kuidas paiknevad hinded max. ja min. vahel? kas paiknevad ühtlaselt? kas erinevate koolide tasemed on sarnased? MILLINE ON TULEMUSTE HAJUVUS?

43 Jaotuse hajuvus Maksimaalne, minimaalne väärtus
Võrdlemisel erinevate maakondade tulemusi, saame juba rohkem infot. Milliste maakondade tulemused hajuvad kõige rohkem?

44 Jaotuse hajuvus Ulatus e. haar (Range) on ...
... maksimaalse ja minimaalse väärtuse vahe e. vahemiku laius, milles andmed paiknevad Milliste maakondade tulemused hajuvad kõige rohkem? + lihtsamini leitav - sõltub äärmistest väärtustest, mis võivad olla ekstreemsed!!

45 Kvartiilid Kvartiilid jagavad variatsioonirea nelja võrdsesse ossa
Q1= 40 Q2= 55 Q3= 70 25% õpilastest sai kirjandi eest 40 ja vähem punkti. Pooled õpilastest said 55 ja vähem punkti. 75% õpilastest sai …

46 Karp diagramm

47 karpdiagramm

48 tüvidiagramm

49 karpdiagramm

50 karpdiagramm

51 Protsentiilid Kvintiilid jagavad variatsioonrea viieks võrdseks osaks. Detsiilid jagavad variatsioonrea kümneks võrdseks osaks. Kvintiile ja detsiile kasutatakse palju majanduses. (tulukvintiilid ja –detsiilid) Protsentiilid jagavad variatsioonirea 100-ks võrdseks osaks Õpilaste vanuse 36-s protsentiil = 18 36% õpilastest on nooremad kui 18 aastat Mida tähendab: Tudengite keskmise eksamihinde 89-s protsentiil = 4,0 Mitmes protsentiil on: Mediaan Alumine kvartiil Ülemine kvartiil

52 Kõige olulisem hajuvuse näitaja
Standardhälve Kui palju üksikud tulemused erinevad keskmisest? Kui andmed on ühesugused => st.hälve=0 Mida rohkem nad erinevad => suurem on st.hälve

53 standardhälve Keskmine erinevus keskmisest
Kui standardhälve=0, kas siis… Kõikide tulemuste sagedused on võrdsed Keskmine = 0 Mood = 0 Kõik tulemused on samade väärtustega Keskmine erinevus keskmisest Millise grupi tulemused erinevad rohkem e. millise grupi väärtuste standardhälve on suurem A: B:

54 Starndardhälbe tõlgendamine
A. Masso

55 Jaotused on/ei ole enamasti ...
... sümmeetrilised Sümmeetriline jaotus: Kõige rohkem väärtusi jaotuse keskel, liikudes otspunktide poole tulemuste hulk väheneb Sümmeetriline jaotus on väga tavaline Temperatuurid Testi punktid Jne. (bioloogilised nähtused) Mida suurem on asümmeetria koefitsent (skewness), seda rohkem on jaotus väljavenitatud. Kui jaotus on sümmeetriline, a=0

56 asümmeetria Positiivne asümmeetria (skewness)
Jaotus on väljavenitatud paremalt poolt Jaotuse “saba” on paremal pool Skaalal väiksemaid väärtuseid rohkem

57 asümmeetria Negatiivne asümmeetria (skewness)
Jaotus on väljavenitatud vasakult poolt Jaotuse “saba” on vasakul poolt Skaalal suuremaid väärtuseid rohkem

58 Kirjeldavad arvnäitajad
Võrdleme erinevate eksamite tulemusi Inglise keele eksami tulemus Eesti keele eksami tulemus Valid VASTAJATE ARV 150 127 Missing PUUDUVAD VASTUSED 23 Mean KESKVÄÄRTUS 70,46 65,86 Median MEDIAAN 69,00 72,00 Mode MOOD 58(a) 70 Std. Deviation STANDARDHÄLVE 14,42 14,99 Skewness ASÜMMEETRIA ,30 -2,64 Minimum MIN. 46 15 Maximum MAX. 100 90 Percentiles 25-S PROTSENTIIL 58,00 55,00 50 50-S PROTSENTIIL 75 75-S PROTSENTIIL 82,00 80,00 a Multiple modes exist. The smallest value is shown

59 Kirjeldavad arvnäitajad
Ennustage rühmades järgmiste arvnäitajate väärtuseid tänases tunnis olevate õpilaste pikkuste jaotuse kohta Keskväärtus Mediaan Mood Minimaalne väärtus Maksimaalne väärtus Standardhälve Asümmeetria


Download ppt "Esmane analüüs Kordamine."

Similar presentations


Ads by Google