Tečaj SPSS in statistike SPSS Inc. Tečaj SPSS in statistike Dr. Eva Podovšovnik Axelsson Copyright 2003-4, SPSS Inc. Copyright 2003-4, SPSS Inc.
Uporabljena literatura Blejec, Marijan (1981): Uvod v statistiko. Univerza Edvarda Kardelja v Ljubljani, Ekonomska fakulteta Borisa Kidriča. Ferligoj, Anuška (1997): Naloge iz statistike. Samozaložba, Ljubljana. Kožmelj, Blaženka (1979): Vaje iz statistike I. Univerza Edvarda Kardelja v Ljubljani, Ekonomska fakulteta Borisa Kidriča. Copyright 2003-4, SPSS Inc.
Razlika kvalitativno / kvantitativno znaki, besede, opisne spremenljivke, izračunamo lahko le pogostost pojava, primer: barva las, barva oči, verska pripadnost, zakonski stan, … Kvantitativno: številke, številske spremenljivke, izračunamo lahko zapletene statistike, primer: šolske ocene, starost, številka obutve, … Copyright 2003-4, SPSS Inc.
Baze podatkov Podatek je lastnost opazovane enote. Nanaša se na proučevanje pojava, ki mora biti množičen (se v času in prostoru pojavlja v velikem številu). Pojavi (in s tem tudi podatki) se med seboj razlikujejo od enote do enote. Opredeliti moramo natančno, katere pojave in podatke v raziskavi proučujemo. Copyright 2003-4, SPSS Inc.
Uvod v SPSS Start » programi » SPSS for Windows » SPSS for Windows. V bazi podatkov (Excel, Access, SPSS,…) vsako enoto vpišemo v novo vrstico, medtem ko vsak podatek vpišemo v nov stolpec (V ISTEM STOLPCU JE VEDNO ISTI PODATEK, SPREMENI SE LE NJEGOVA VREDNOST!). Copyright 2003-4, SPSS Inc.
Priprava modela raziskovanja Pri pripravi modela raziskovanja moramo na osnovi teoretičnih izhodišč določiti, katere spremenljivke so odvisne in katere so neodvisne. Neodvisne spremenljivke: spol, starost, izobrazba, razvitost države,… Odvisne spremenljivke: mnenja, stališča, BDP države,… Neodvisne spremenljivke vplivajo na odvisne!!! Copyright 2003-4, SPSS Inc.
Primer raziskovalnega modela spol starost izobrazba delovna doba dohodek Copyright 2003-4, SPSS Inc.
Manjkajoče vrednosti Pri manjkajočih vrednostih moramo označiti, da so to vrednosti, ki jih v statistični analizi ne bomo upoštevali. Manjkajoče vrednosti so lahko neodgovori (ni podatka za določeno enoto), odgovor ne vem in drugi odgovori, ki za našo raziskavo niso ključnega pomena (moramo vnaprej predvideti!). SPSS jih označuje kot “SYSMIS”. Copyright 2003-4, SPSS Inc.
Rekodiranje podatkov, spremenljivk in merskih lestvic Podatke, spremenljivke in merske lestvice moramo preurediti (rekodirati) tako, da nam bo karseda olajšana statistična obdelava. Pri rekodiranju moramo biti pozorni predvsem na merske lestvice, ki morajo biti v skladu z našimi pričakovanji. Copyright 2003-4, SPSS Inc.
Primer rekodiranja Raziskujemo pojav osebnih dohodkov in delovne dobe posameznikov. Neodvisne spremenljivke so spol, starost in izobrazba (ter pogojno tudi delovna doba). Spol: moški (1), ženske (2), ostalo izločimo. Starost rekodiramo v kategorije: 18-27 let (1), 28-37 let (2), 38-47 let (3), 48-57 let (4), nad 58 let (5), ostalo izločimo. Izobrazba: nedokončana oš (1), dokončana oš (2), dokončana poklicna šola (3), dokončana srednja šola (4), visokošolska in fakultetna izobrazba (5), ostale izločimo. Copyright 2003-4, SPSS Inc.
Primer rekodiranja Delovna doba: združimo v razrede: 0 let (1), 1-10 (2), 11-20 (3), 21-30 (4), nad 31 (5), ostale izločimo. Dohodek: združimo v razrede: nima dohodka (1), do 50000 SIT (2), med 50001 in 100000 SIT (3), med 100001 in 150000 SIT (4), med 150001 in 200000 SIT (5), nad 200000 SIT (6), ostale izločimo. Copyright 2003-4, SPSS Inc.
Rekodiranje v SPSS-u Transform » Recode » Into different variable. Izberemo spremenljivko, ki jo želimo rekodirati (npr. starost) in jo dvakrat kliknemo (postavi se v “input variable”). Izberemo “output variable” in določimo novo ime spremenljivke (npr. star_rek) in izberemo “change”. Copyright 2003-4, SPSS Inc.
Rekodiranje v SPSS-u Izberemo “old and new values”. Pri “old value” določimo stare vrednosti (ali vsako posamezno ali pa izberemo “Range” in pri tem imamo na voljo “- through _”, “lowest through _” in “_ through highest”. Npr. 18 through 27 Pri “new value” določimo novo vrednost. Npr. 1 (18-27 je 1. razred). Nato izberemo “add”. Ko smo končali rekodiranje, izberemo “continue” in nato še “ok”. Copyright 2003-4, SPSS Inc.
Frekvence Ločimo absolutne (f; v številkah), in relativne (f%; v procentih) ter kumulativne frekvence (F, F%; seštevek predhodnih frekvenc). Frekvenčna porazdelitev: prikažemo porazdelitev posameznih vrednosti za analizirane pojave (preštejemo, kolikokrat se posamezna vrednost pojavi). Copyright 2003-4, SPSS Inc.
Primer frekvenčne porazdelitve Starost f xmin xmax f% F F% od 18 do 28 45 18 28 22,5 od 28 do 38 70 38 35 od 38 do 48 40 48 20 115 57,5 od 48 do 58 30 58 15 155 77,5 od 58 do 68 8 68 4 185 92,5 nad 68 7 - 3,5 193 96,5 Skupaj 200 100 Copyright 2003-4, SPSS Inc.
Interpretacija frekvenc Največ anketiranih je starih med 28 in 38 let (70 oziroma 35% vseh). Sledijo jim anketiranci stari med 18 in 28 let (v vzorcu jih je 45 oziroma 22,5%),… Najmanj anketiranih je starejših od 58 let (15 oziroma 7,5%). Več kot polovica anketiranih (57,5% oziroma 115) je mlajših od 38 let. Copyright 2003-4, SPSS Inc.
Računanje frekvenc v SPSS-u Analyze » Descriptive Statistics » Frequencies. Z miško označimo vse spremenljivke, katerim želimo izračunati frekvence, in jih s puščico prenesemo iz prvega v drugi stolpec (Variable(s)). Nato kliknemo ok. Copyright 2003-4, SPSS Inc.
Pregled izpisa rezultatov Tabela s prikazom števila veljavnih (valid) in manjkajočih (missing) vrednosti za vsako analizirano spremenljivko. Frekvenčna tabela. Najprej so zapisane absolutne frekvence (frequency). Sledijo relativne frekvence (percent), veljavne relativne frekvence (valid percent) ter kumulativne relativne frekvence (cumulative percent). Na koncu sledi še seštevek enot (total). Interpretacija rezultatov: Izbrali smo podatke za 513 enot. Ugotovimo lahko, da se je 209 oziroma 40,7 % avtomobilistov odločilo za avtocesto, medtem ko se jih je 304 oziroma 59,3 % odločilo za drugo vrsto ceste. Copyright 2003-4, SPSS Inc.
Komentar izpisa SPSS-a V prvi tabeli imamo podano spremenljivko, število veljavnih odgovorov (Valid) in število manjkajočih vrednosti (Missing). V drugi tabeli imamo podane frekvence: veljavni odgovori (Valid), manjkajoči (Missing) in skupaj (Total). V stolpcih imamo podane frekvence: absolutne (Frequency), relativne glede na vse enote (Percent), relativne glede na veljavne odgovore (Valid Percent) in kumulativne relativne frekvence veljavnih odgovorov (Cumulative Percent). Copyright 2003-4, SPSS Inc.
Tipi opisnih spremenljivk So slabši tip spremenljivk (z njimi ne moremo izvajati zapletenih statističnih obdelav). Nominalne: ni reda med vrednostmi; primer: spol, barva las, zaposlitveni status,… Ordinalne: med vrednostmi obstaja vrstni red, ni pa jasna razlika med posameznima vrednostima; primer: ukvarjanje s športom (redno, občasno, nikoli),… Copyright 2003-4, SPSS Inc.
Tipi številskih spremenljivk So boljšega tipa, saj lahko z njimi izračunamo zahtevnejše statistične analize. Intervalne: ničla je dogovorjena, ne moremo trditi o produktu, le o razliki; primer: temperatura (če je 20 stopinj C, to še ne pomeni, da je dvakrat topleje kot pri 10 stopinj C, je pa 10 stopinj C razlike). Razmernostne: ničla je absolutna, definiramo lahko razmerje med dvema vrednostima; primer: cena avtomobila (avto, ki stane 3 milijone SIT, je dvakrat dražji od avta, ki stane 1,5 milijona SIT). Copyright 2003-4, SPSS Inc.
Določanje tipa spremenljivk v SPSS-u Postavimo se na list Variable view. Postavimo se na spremenljivko, kateri želimo določiti tip. Postavimo se na polje Measure in izberemo med tipi spremenljivk: lestvica oziroma številska (Scale), ordinalna (Ordinal) ali nominalna (Nominal). Copyright 2003-4, SPSS Inc.
Vrste statističnih analiz Univariatna (opazujemo eno spremenljivko), bivariatna (opazujemo dve spremenljivki naenkrat; kako ena vpliva na drugo), multivariatna (opazujemo več spremenljivk hkrati; kako ena ali več neodvisnih vplivajo na eno ali več odvisnih). Copyright 2003-4, SPSS Inc.
Primeri univariatne statistike Primerjamo vsako lastnost populacije posebej. Primer: naredimo frekvenčno porazdelitev populacije glede na spol, nato izračunamo še mere središčnosti in mere odklonskosti). Copyright 2003-4, SPSS Inc.
Primeri bivariatne statistike Med seboj primerjamo dve spremenljivki. Ena med njima je odvisna in ena je neodvisna. Primeri: s pomočjo statističnih koeficientov izračunamo smer in intenzivnost (v kolikor lahko) vpliva neodvisne spremenljivke na odvisno. Copyright 2003-4, SPSS Inc.
Primeri multivariatne statistike Med seboj hkrati primerjamo več spremenljivk. Nekatere med njimi so odvisne, druge so neodvisne. Primeri: s pomočjo regresijske analize primerjamo med seboj več spremenljivk in nato ugotavljamo, kakšna je stopnja vpliva neodvisnih spremenljivk na izbrane odvisne spremenljivke. Copyright 2003-4, SPSS Inc.
Mere središčnosti Najprimerneje je, da vrednosti najprej uredimo po vrsti (od najmanjše do največje), čemur pravimo RANŽIRNA VRSTA. Povprečje ali aritmetična sredina (M) je povprečna vrednost za celotno populacijo, modus (Mo) je najpogostejša vrednost, mediana (Me) je sredinska vrednost. Copyright 2003-4, SPSS Inc.
Izračun mer središčnosti v SPSS-u Analyze » Descriptive Statistics » Frequencies » Statistics » izberemo statistike, ki jih želimo računati: povprečje (Mean), mediana (Median), modus (Mode). Določimo spremenljivke, katerim želimo izračunati statistike. MERE SREDIŠČNOSTI RAČUNAMO SAMO ŠTEVILSKIM SPREMENLJIVKAM!!! Copyright 2003-4, SPSS Inc.
Komentar izpisa Pred tabelo s frekvenčnimi porazdelitvami dobimo tabelo, v kateri so navedeni izračuni izbranih mer središčnosti. Povprečje: Mean. Mediana: Median. Modus: Mode. Copyright 2003-4, SPSS Inc.
Mere odklonskosti Standardni odklon (odkloni od povprečja; SD), varianca (kvadrati odklonov od povprečja; SD2), variacijski razmik (razpon vseh enot populacije; Var). Copyright 2003-4, SPSS Inc.
Izračun mer odklonskosti v SPSS-u Analyze » Descriptive Statistics » Frequencies » Statistics » izberemo statistike, ki jih želimo računati: standardni odklon (Std. Deviation) in varianca (Variance). Določimo spremenljivke, katerim želimo izračunati statistike. MERE ODKLONSKOSTI RAČUNAMO SAMO ŠTEVILSKIM SPREMENLJIVKAM!!! Copyright 2003-4, SPSS Inc.
Komentar izpisa SPSS-a Podobno kot pri merah središčnosti tudi v primeru mer odklonskosti dobimo pred tabelo s frekvencami tabelo, v kateri so podani izračuni mer odklonskosti. Standardni odklon: Std. Deviation. Varianca: Variance. Copyright 2003-4, SPSS Inc.
Pregled izpisa rezultatov Tabela s prikazom števila veljavnih (valid) in manjkajočih (missing) vrednosti za vsako analizirano spremenljivko. Nato sledijo opisne statistike: povprečje (mean), mediana (median), modus (mode), standardni odklon (std. Deviation), varianca (variance), minimum in maksimum. Interpretacija rezultatov: Na osnovi zgornje tabele lahko sklepamo, da so v povprečju posamezniki pripravljeni odšteti 2,169 € za plačilo cestnine. Polovica anketiranih je pripravljena odšteti 1,9 € in več, druga polovica pa 1,9 € in manj. Največ posameznikov je pripravljenih odšteti 1,9 € za cestnino. Standardni odklon znaša 0,74 €. Razpon cene cestnine se giblje med 1,4 in 5 €. Copyright 2003-4, SPSS Inc.
Izračun koeficientov v SPSS-u Analyze » Descriptive Statistics » Frequencies » Statistics » izberemo statistike, ki jih želimo računati: koeficient asimetrije (Skewness) in koeficient sploščenosti (Kurtosis). Določimo spremenljivke, katerim želimo izračunati statistike. KOEFICIENTA SPLOŠČENOSTI IN ASIMETRIJE RAČUNAMO SAMO ŠTEVILSKIM SPREMENLJIVKAM!!! Copyright 2003-4, SPSS Inc.
Pregled izpisa rezultatov Tabela s prikazom števila veljavnih (valid) in manjkajočih (missing) vrednosti za vsako analizirano spremenljivko. Nato sledita koeficienta asimetrije (Skewness) in sploščenosti (Kurtosis) ter njuni standardni napaki. Interpretacija rezultatov: Koeficient asimetrij znaša 1,58 in nakazuje na asimetrijo v desno. Koeficient sploščenosti znaša 3,048 in nakazuje na zelo sploščeno porazdelitev. Copyright 2003-4, SPSS Inc.
Bivariatna statistična analiza Kadar je ena od spremenljivk nominalnega tipa, uporabljamo HI-kvadrat metodo (χ2). Kadar je ena od spremenljivk ordinalnega tipa, uporabljamo Spearmanov korelacijski koeficient (rs). Kadar je ena od spremenljivk številskega tipa, uporabljamo Pearsonov korelacijski koeficient (ρ). Copyright 2003-4, SPSS Inc.
Pearsonov korelacijski koeficient Pearsonov korelacijski koeficient meri povezanost med dvema spremenljivkama, od katerih je ena odvisna in druga neodvisna. Izračunamo ga lahko v primeru dveh številskih spremenljivk. Copyright 2003-4, SPSS Inc.
Vrednosti Pearsonovega koeficienta rxy se vedno nahaja v intervalu od –1 do +1. > 0.7 ali < -0.7 => je močna povezanost! < 0.7 ali > -0.7 => je šibka povezanost! < 0.3 ali > -0.3 => ni povezanosti! Copyright 2003-4, SPSS Inc.
Izračun Pearsonovega koeficienta v SPSS-u Analyze » Correlate » Bivariate. Izberemo koeficient, ki ga želimo izračunati (Pearson). Določimo spremenljivki, med katerima želimo izračunati povezanost. PEARSONOV KOEFICIENT RAČUNAMO SAMO ŠTEVILSKIM SPREMENLJIVKAM!!! Copyright 2003-4, SPSS Inc.
Pregled izpisa v SPSS-u Tabela s prikazom Pearsonovega korelacijskega koeficienta, njegove stopnje značilnosti in števila veljavnih enot. Interpretacija rezultatov: Pearsonov korelacijski koeficient znaša 0,893 in je statistično značilen s stopnjo značilnosti nižjo od 1 %. To pomeni, da sta spremenljivki pozitivno linearno povezani. V kolikor se veča čas na avtocesti, se veča čas prevoza tudi po magistralni cesti. Copyright 2003-4, SPSS Inc.
Spearmanov korelacijski koeficient Spearmanov korelacijski koeficient meri povezanost med dvema spremenljivkama, od katerih je ena odvisna in druga neodvisna. Izračunamo ga lahko v primeru, ko je ena spremenljivka ordinalnega, druga pa ordinalnega ali številskega tipa. Copyright 2003-4, SPSS Inc.
Vrednosti Spearmanovega koeficienta rs > 0 => premo sorazmerje rangov (+) rs ~ 0 => ni (linearne) povezanosti rangov rs < 0 negativen => obratno sorazmerje rangov (-) [-1.0, -0.7] ali [0.7, 1.0] => je močna povezanost! [-7.0, -0.7] ali [0.3, 0.7] => je šibka povezanost! [-0.3, -0.0] ali [0.0, 0.3] => ni povezanosti! Copyright 2003-4, SPSS Inc.
Izračun Spearmanovega koeficienta v SPSS-u Analyze » Correlate » Bivariate. Izberemo koeficient, ki ga želimo izračunati (Spearman). Določimo spremenljivki, med katerima želimo izračunati povezanost. SPEARMANOV KOEFICIENT RAČUNAMO, KO JE VSAJ ENA SPREMENLJIVKA ORDINALNEGA TIPA!!! Copyright 2003-4, SPSS Inc.
Pregled izpisa rezultatov v SPSS-u Tabela s prikazom Spearmanovega koeficienta korelacije rangov, njegove stopnje značilnosti in števila veljavnih enot. Interpretacija rezultatov: Spearmanov korelacijski koeficient rangov znaša 0,355 in nakazuje na pozitivno linearno korelacijo rangov. Povezava je statistično značilna s stopnjo značilnosti nižjo od 1 %. To pomeni, da v kolikor se veča čas prevoza po avtocesti, se viša tudi cena cestnine. Copyright 2003-4, SPSS Inc.
HI-kvadrat HI-kvadrat koeficient meri povezanost med dvema spremenljivkama, od katerih je ena odvisna in druga neodvisna. Izračunamo ga lahko v primeru, ko je ena od spremenljivk nominalna, druga pa nominalna, ordinalna ali številska. Copyright 2003-4, SPSS Inc.
Izračun HI-kvadrata v SPSS-u Analyze » Descriptive Statistics » Crosstabs. Določimo spremenljivki, med katerima želimo izračunati povezanost. Odvisna je v vrstici (Row), neodvisna pa v stolpcu (Column). V Statistics izberemo Chi-square. HI-KVADRAT KOEFICIENT RAČUNAMO, KO JE VSAJ ENA SPREMENLJIVKA NOMINALNEGA TIPA!!! Copyright 2003-4, SPSS Inc.
Pregled izpisa v SPSS-u Copyright 2003-4, SPSS Inc.
Pregled izpisa v SPSS-u Tabela s prikazom Hi-kvadrat testa. Pri tem je najprej prikazana vrednost koeficienta Hi-kvadrat, število prostostnih stopenj in njegova stopnja značilnosti. Sledi tudi opomba, iz katere je razvidno število veljavnih celic. Interpretacija rezultatov: Vrednost Hi-kvadrata znaša 22,74. Koeficient je statistično značilen s stopnjo tveganja nižjo od 1 %. Sklepamo lahko, da izbor avtoceste oziroma magistralne ceste vpliva na čas vožnje po cesti. Iz tabele na prejšnji strani lahko ugotovimo, da se tisti, ki na avtocesti vozijo manj časa, prej odločijo za avtocesto kot pa magistralno cesto. Copyright 2003-4, SPSS Inc.