Download presentation
Presentation is loading. Please wait.
1
Esmane analüüs Kordamine
2
Esmane analüüs Anname ülevaate ühe tunnuse väärtustest
Analüüsi küsimus KUI SUUR OSA? MILLIST VÄÄRTUST ESINES KÕIGE ROHKEM? Tunnuse tüüp NIMITUNNUS JÄRJESTUSTUNNUS BINAARNE TUNNUS INTERVALLTUNNUS Valimi suurus VÄHE VASTAJAID PALJU VASTAJAID Meetod TEKST TABEL DIAGRAMM
3
Andmete esitamine m2008L.sav
Keskmine sissetulek pereliikme kohta viimasel kuul Sugu Mitu aastat olete kooliharidust saanud, koolides õppinud? Milline on Teie praegune haridustase? Perekonnaseis Mitu inimest elab Teiega koos ühes leibkonnas, Teie kaasa arvatud? Vanus
4
Milliste järeldusteni te kodustes töödes jõudsite.
Kodune ül. nr. 3 Milliste järeldusteni te kodustes töödes jõudsite.
5
Binaarne tunnus 1. Sugu Mees Naine
A: pakun välja kasutada tulpdiagrammi, mis näitab meeste ja naiste osakaalu. B: pakume sektordiagrammi, kuna siis on visuaalselt näha 2. 2 ja 6 võib lahendada nii tulp- kui ka sektordiagrammiga. 3. Kas teil on auto? Jah Ei
6
intervalltunnus tulpdiagramm
11
Mis oli auto maksumus ostmise ajal?
alla 1000 Üle 16000 Siia sobib kõige rohkem histogramm, kuna see illustreerib vahed kõige paremini. Sektor sobiks ka, aga sektoriga on üsna raske visuaalselt võrrelda andmed.
12
4. Kui palju eurosid te keskmiselt kulutate ühes kuus toidule?
50-70 71-90 91-110 130 ja enam X: Tundub, et histogramm sobib nende tulemuste grupeerimiseks ning esitlemiseks kõige paremini? Y: Vahemikud on olemas ning neid võib kasutada nii histogrammi kui ka sektordiagrammina
13
3. Kes tunnevad end õnnelikematena, kas mehed või naised?
Tulemuse näitamiseks kasutame histogrammi.
14
3. Kes tunnevad end õnnelikematena, kas mehed või naised?
Tulemuse näitamiseks kasutame histogrammi.
16
VÕRDLEMINE ... kasutades õpitud meetode Andmed kokku võtta eraldi iga grupi jaoks ja siis neid võrrelda. Arvnäitajatest kasutatakse võrdluste läbiviimiseks kõige sagedamini aritmeetilist keskmist Nimitunnuste ja järjestustunnuste puhul saab teha võrdleva sagedustabeli. Tulemuste esitamiseks võib aga kasutada näiteks võrdlevat tulpdiagrammi või joondiagrammi.
17
Võrdleme meeste naiste sissetulekuid
Kas me saame võrrelda keskmiseid sissetulekuid? Millist sissetulekut esineb meeste hulgas kõige rohkem ja kas see langeb kokku tüdrukute hulgas kõige enamlevinud sissetulekuga? Arvutame sagedused ja nendest lähtuvad protsendid võrreldavate gruppide lõikes võrdlev sagedustabel e risttabel.
18
Võrdlev sagedustabel Tabelist näeme, et mehi osales uuringus rohkem (243) kui naisi (198), mistõttu on sageduste põhjal gruppide võrdlemine raskendatud.
19
1 3 Tabelis 2. on paigutatud võrreldavad grupid veergudesse ning tabelisse on lisatud protsent nii, et meeste ja naiste vastused on eraldi tervikud (eraldi 100%), mistõttu saame nende gruppide vastuseid võrrelda . 2
20
Risttabel Võrdlev sagedustabel
21
Risttabelid Mõnikord sagedusi välja ei tooda, esitatakse ainult protsendid
22
Mida oleks vaja muuta?
23
Vormista järeldus
24
Vormista järeldus
25
Erinevuste illustreerimine protsentuaalseid jaotusi võrdleva diagrammina
Samad andmed, erinev tulemus?
26
KIHtdiagramm Kui võrreldavaid gruppe on rohkem kui kaks, läheb tavaline võrdlev tulpdiagramm üsna kirjuks ja seega raskesti arusaadavaks. Kihtdiagrammis esitatakse iga võrreldava grupi kohta üks tulp, mis on jagatud võrdluse aluseks oleva tunnuse väärtuste protsentuaalse osakaalu järgi kihtideks, mis kokku moodustavad 100%.
27
kihtdiagramm Millist panka kasutatakse põhiliselt?
28
Millist panka...
29
Võrdleme Erinevate haridustasemetega vastajate vanuseid
KAS arvutame sagedused ja nendest lähtuvad protsendid võrreldavate gruppide lõikes?
30
Näiteks Riigieksami tulemuste analüüs Min, max
Keskväärtus (keskmise taseme võrdlemiseks) Standardhälve (hajuvuse võrdlemiseks)
31
Aritmeetiline keskmine Geomeetriline keskmine Harmooniline keskmine
Jaotus Kirjeldavad arvnäitajad Keskmine tase Mood Mediaan Aritmeetiline keskmine Geomeetriline keskmine Harmooniline keskmine Ruutkeskmine Kaalutud keskmine Hajuvus Ulatus Kvartiilid Protsentiilid Dispersioon Standardhälve Jaotuse kuju Asümmeetria Ekstsess
32
Keskmine tase Mood ... on tunnuse kõige enam esinenud väärtus
Unimodaalne mood Bimodaalne moodi Multimodaalne mitu moodi Mood ... on tunnuse kõige enam esinenud väärtus mo= Kõige enam kasutatud inimese nimi maailmas on… mo= Mohammed SPSSi vastus: mo=1 “Multiple modes exist. The smallest value is shown” NYDailyNews.com
33
Bimodaalne jaotus … on ka sümmeetriline
N: on mõõdetud kahte erinevat gruppi:
34
Keskmine tase Mediaan ... on variatsioonirea keskel paiknev väärtus
Tavaline andmerida: Variatsioonirida (samade andmete põhjal): me= me = Mida saate järeldada, kui arvutuste tulemusena saadi laste arvu mediaaniks 1? KUI on paarisarv andmeid: Siis mediaan on variatsioonirea kahe keskmise liikme aritmeetiline keskmine Me= (2+3)/2=2,5
35
Kas mediaan on alati reaalne väärtus variatsioonireast?
36
Keskmine tase Aritmeetiline keskmine e keskväärtus
...võimaldab suurt hulka numbrilisi andmeid koondada ja välja tuua üldtendentse. Puuduseks tundlikkus äärmuslike väärtuste suhtes, kasutatakse eelkõige väikese hajuvuse korral keskväärtuse suhtes. Nt keskmine vanus 44 ei ütle midagi selle kohta, kui palju on alla 20-aastaseid. Mood ja mediaan – muutuvad siis, kui esineb olulisi muutusi andmetes Aritmeetiline keskmine – muutub siis, kui muutub kasvõi üks rea liige Keskväärtus on võrreldes teiste näitajatega kõige stabiilsem Kõigile teada tuntud arvnäitaja (kõik teavad ja oskavad arvutada)
37
Keskväärtuse rakendamine
A. Masso
38
Keskmine tase Aritmeetiline keskmine e keskväärtus
Kui esineb ekstreemseid väärtuseid, siis ei näita objektiivselt keskmist tendentsi Töötajate sissetulekud: I gr II gr Aritmeetilised keskmised: Mediaanid: I gr. – I gr II gr. – II gr. -190
39
Stat.ee Eesti keskmine 2010 Täpsustatud andmetel vähenes aastal Eesti arvestuslik rahvaarv ligi 3000 inimese võrra 2012. aasta 1. jaanuaril elas Eestis inimest, teatab Statistikaamet.
40
Ekstreemsete väärtuste...
korral näitab keskmist taset paremini kui aritmeetiline keskmine: GEOMEETRILINE KESKMINE – ei ole tundlik ekstreemsete väärtuste suhtes KAALUTUD KESKMINE – arvestab erinevat palka saavate inimeste hulka => kui on rohkem madalamapalgalisi, siis nende mõju keskmisele on suurem. KOHANDATUD KESKMINE – keskmine, mille arvutamisel jäetakse välja 5% või 10% ekstreemsetest näitajatest, eemaldame ülisuurte ja üliväikeste väärtuste mõju MEDIAAN
41
1 3 2
42
2005 a. lõpueksami (kirjand)
tulemused: Esmasel vaatlusel ei teki ülevaadet: kuidas paiknevad hinded max. ja min. vahel? kas paiknevad ühtlaselt? kas erinevate koolide tasemed on sarnased? MILLINE ON TULEMUSTE HAJUVUS?
43
Jaotuse hajuvus Maksimaalne, minimaalne väärtus
Võrdlemisel erinevate maakondade tulemusi, saame juba rohkem infot. Milliste maakondade tulemused hajuvad kõige rohkem?
44
Jaotuse hajuvus Ulatus e. haar (Range) on ...
... maksimaalse ja minimaalse väärtuse vahe e. vahemiku laius, milles andmed paiknevad Milliste maakondade tulemused hajuvad kõige rohkem? + lihtsamini leitav - sõltub äärmistest väärtustest, mis võivad olla ekstreemsed!!
45
Kvartiilid Kvartiilid jagavad variatsioonirea nelja võrdsesse ossa
Q1= 40 Q2= 55 Q3= 70 25% õpilastest sai kirjandi eest 40 ja vähem punkti. Pooled õpilastest said 55 ja vähem punkti. 75% õpilastest sai …
46
Karp diagramm
47
karpdiagramm
48
tüvidiagramm
49
karpdiagramm
50
karpdiagramm
51
Protsentiilid Kvintiilid jagavad variatsioonrea viieks võrdseks osaks. Detsiilid jagavad variatsioonrea kümneks võrdseks osaks. Kvintiile ja detsiile kasutatakse palju majanduses. (tulukvintiilid ja –detsiilid) Protsentiilid jagavad variatsioonirea 100-ks võrdseks osaks Õpilaste vanuse 36-s protsentiil = 18 36% õpilastest on nooremad kui 18 aastat Mida tähendab: Tudengite keskmise eksamihinde 89-s protsentiil = 4,0 Mitmes protsentiil on: Mediaan Alumine kvartiil Ülemine kvartiil
52
Kõige olulisem hajuvuse näitaja
Standardhälve Kui palju üksikud tulemused erinevad keskmisest? Kui andmed on ühesugused => st.hälve=0 Mida rohkem nad erinevad => suurem on st.hälve
53
standardhälve Keskmine erinevus keskmisest
Kui standardhälve=0, kas siis… Kõikide tulemuste sagedused on võrdsed Keskmine = 0 Mood = 0 Kõik tulemused on samade väärtustega Keskmine erinevus keskmisest Millise grupi tulemused erinevad rohkem e. millise grupi väärtuste standardhälve on suurem A: B:
54
Starndardhälbe tõlgendamine
A. Masso
55
Jaotused on/ei ole enamasti ...
... sümmeetrilised Sümmeetriline jaotus: Kõige rohkem väärtusi jaotuse keskel, liikudes otspunktide poole tulemuste hulk väheneb Sümmeetriline jaotus on väga tavaline Temperatuurid Testi punktid Jne. (bioloogilised nähtused) Mida suurem on asümmeetria koefitsent (skewness), seda rohkem on jaotus väljavenitatud. Kui jaotus on sümmeetriline, a=0
56
asümmeetria Positiivne asümmeetria (skewness)
Jaotus on väljavenitatud paremalt poolt Jaotuse “saba” on paremal pool Skaalal väiksemaid väärtuseid rohkem
57
asümmeetria Negatiivne asümmeetria (skewness)
Jaotus on väljavenitatud vasakult poolt Jaotuse “saba” on vasakul poolt Skaalal suuremaid väärtuseid rohkem
58
Kirjeldavad arvnäitajad
Võrdleme erinevate eksamite tulemusi Inglise keele eksami tulemus Eesti keele eksami tulemus Valid VASTAJATE ARV 150 127 Missing PUUDUVAD VASTUSED 23 Mean KESKVÄÄRTUS 70,46 65,86 Median MEDIAAN 69,00 72,00 Mode MOOD 58(a) 70 Std. Deviation STANDARDHÄLVE 14,42 14,99 Skewness ASÜMMEETRIA ,30 -2,64 Minimum MIN. 46 15 Maximum MAX. 100 90 Percentiles 25-S PROTSENTIIL 58,00 55,00 50 50-S PROTSENTIIL 75 75-S PROTSENTIIL 82,00 80,00 a Multiple modes exist. The smallest value is shown
59
Kirjeldavad arvnäitajad
Ennustage rühmades järgmiste arvnäitajate väärtuseid tänases tunnis olevate õpilaste pikkuste jaotuse kohta Keskväärtus Mediaan Mood Minimaalne väärtus Maksimaalne väärtus Standardhälve Asümmeetria
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.