Presentation is loading. Please wait.

Presentation is loading. Please wait.

SEKUNDARNA ANALIZA PODATKOV

Similar presentations


Presentation on theme: "SEKUNDARNA ANALIZA PODATKOV"— Presentation transcript:

1 SEKUNDARNA ANALIZA PODATKOV
PODATKOVNI ARHIVI in SEKUNDARNA ANALIZA PODATKOV Janez Štebe, ADP, Univerza v Ljubljani 2008, FF

2 Sekundarna analiza, kaj je kaj ni?
Metodološki pristop, ki lahko kombinira več različnih metod, virov podatkov in analitičnih postopkov Poudarek je na izkoriščanju prednosti uporabe obstoječih podatkovnih virov – vsebuje fazo iskanja in vrednotenja obstoječih podatkovnih virov Ni Metoda, analitični postopek (anketna metoda, večnivojska analiza, etnološka raziskava, analiza besedil...) – lahko pa uporablja katerokoli od teh Ne vsebuje faze načrtovanja in zbiranja podatkov na novo – lahko pa se kombinira

3 Razloge za uporabo sekundarne analize lahko razdelimo v tri skupine (Hayman v Štebe, 1999):
Konceptualno-vsebinski razlogi (primerjava med različnimi časovnimi obdobji; že testirani vprašalniki; abstraktna konceptualizacija) Metodološki razlogi (kombinacija več istovrstnih ali raznovrstnih virov podatkov; slabost – nepoznavanje podrobnosti zbranih podatkov- kakovost) Ekonomski razlogi (prihranek denarja in časa) Glej ŠTEBE, Janez. Izkoriščanje zapuščine slovenske empirične sociologije za današnje namene v okviru sekundarne analize. V: Družboslovne spremembe na Slovenskem / vabljena urednica Katja Boh. Ljubljana : Univerza : Slovensko sociološko društvo (1999). - (Družboslovne razprave), ISSN ; Letn. 15, št. 30/31). - str Dokument v RTF za ogledovanje.

4 Faze raziskave in posebnosti sekundarne analize
Izbor problema v SA Konceptualizacija in SA Enote in vzorci Merjenje (zanesljivost, veljavnosti) Analiza

5 Izbor problema v SA Iskanje problema:
Podatkovno-centrično pregledovanje po vsebinah spremenljivk v razpoložljivih virih za iskanje raziskovalnih zamisli (preizkus I) Potrjevanje teorije, prikaz stanja Izhajam iz vnaprej definiranega raziskovalnega problema in iščem vsebinsko ter metodološko ustrezne spremenljivke, podatkovne vire za analizo izbranega problema Pri odločanju za SA tehtam stroške (razpoložljivost podatkov, čas, kakovost in ustreznost za dani problem v primerjavi z novim zbiranjem podatkov) Medčasovno, primerjalno raziskovanje in raziskovanje specialnih populacij,...

6 Konceptualizacija in SA – več pristopov
Pristop z uporabo operacionalnih definicij – iščemo dobesedno ekvivalentne ali vsaj ex-post harmonizirane spremenljivke tem v referenčni literaturi Hyman (1972): Če ne najdemo dobesedno spremenljivk, poizkušamo razmišljati abstraktno – širše konceptualizacije Neodvisnost konceputalizacije – isti pojav lahko nastopa v različnih konceptualizacijah, npr. udeležba na lokalnih volitvah – indikator povezanosti v skupnosti ali političnega delovanja

7 Merjenje (zanesljivost, veljavnosti)
Prihrani čas za zbiranje (vendar moramo upoštevati dodatni čas, ki ga porabimo za seznanjanje z datoteko in za dodatno pripravo podatkov in analize) Najpomembnejše znane raziskave so narejene z upoštevanjem visokih standardov kvalitete, tudi pri uporabi uveljavljenih indikatorjev za merjenje konceptov Zaradi velikega števila vsebinskih področij je vsakemu konceptu namenjeno samo omejeno število indikatorjev – manjša zanesljivost; toda, večinoma so izbrani s predhodnim testiranjem merskih karakteristik Z uporabo večih virov bolje ocenimo pristranosti merjenja: Glej npr. Baumgartner in Steenkamp: Response Styles in Marketing Research: A Cross-National Investigation. Journal of marketing research, May 2001

8 Analiza Medčasovne longitudinalne analize in primerjalne mednarodne datoteke, ki jih analiziramo s kompleksnimi analitičnimi pristopi (kohortna analiza, večnivojska analiza, upoštevanje kontekstualnih dejavnikov in merske kvalitete spremenljivk) Širok nabor “neodvisnih spremenljivk” za multivaritno analizo vzročnosti

9 Enote in vzorci Kombiniranje večih vzorcev med sabo za pripravo datotek za medčasovno, študij specialnih populacij in mednarodno primerjalno raziskovanje Kombiniranje večih virov podatkov za večnivojsko analizo (npr. prostorski, statistični in anketni) Sekundarna analiza ima največ prednosti ko gre za datoteke velikih velikosti iz anket Možnost analize na specialnih podpopulacijah - npr. Iz General Household Survey (GHS) – letni vzorci nad anket posameznikov - problemi ostarelih (strejši od 65 let) ali poročene ženske (nad 40 let)

10 Primer kompleksne priprave in analize podatkov
Ganzeboom, Harry B. G. , Anton Kramberger, Paul Nieuwbeerta (2000): The Parental Effect on Educational and Occupational Attainment in Slovenia During hte 20th Century. Družboslovone razprave, No

11 Upoštevani podatkovni viri
SJM 1968 – 1998, štiri različne letne datoteke Slovenski podvzorci izbranih mednarodnih primerjalnih datotek ISJP, ISSP in TBS Združen vzorec več kot respondentov ki so odgovarjali na vsa zastavljena vprašanja Ex post harmonizacija spremenljivk (doseganje izobrazbe rekodirano v leta iz originalov, 4 – grobe kategorije izobrazbe , 7 mednarodno predpisanih kategorij ali direktnega merjenja let šolanja)

12 Analitični prijemi Različne tradicije raziskovanja mobilnosti (analiza tabel in regresijski modeli) Multivaratni regresijski modeli z upoštevanjem učinka kohorte za primerjavo različnih obdobij Upoštevanje učinka razlik v strukturi (izobrazbeni in poklicni)

13 Poučevanje ESDS guides UKDA Learning and teaching resources : ESS Edunet ICPSR Courses & Learning Tools Arhivski vodič

14 Ponovitev: pomagaš si z viri literature vezanimi na podatke
Ponovitev (replikacija), preverjanje originalnih raziskovalnih rezultatov na istih podatkih, primerno za poučevanje (Preizkus II: literatura in podatki) Arhiv materialov v povezavi z objavami ( View Titles in Publications-Related Archive; UK SARS: UK DA - Išči pod Publications; ess: ; evs issp gss - V POŠTEV PRIDEJO TUDI SPLOŠNE BIBLIOGRAFSKE ZBIRKE; PROBLEM, KAKO IDENTIFICIRATI TER DOSTOPATI DO PODATKOVNEGA VIRA?!

15

16 Glej tudi: S podatki podprta učna gradiva (predstavitev): Primer študije primerov uporabe podatkov v arhivu:

17 Preizkus I Literatura in podatki:
Za dan članek identificiraj glavni podatkovni vir; V kolikor je članek dostopen v polnem besedilu, identificiraj uporabljeno spremenljivko; Navedi bibliografsko referenco za članek in podatkovni vir.

18 Arhiv družboslovnih podatkov (ADP):
je osrednji slovenski družboslovni arhiv podatkov, pokriva vsa pomembnejša družboslovna področja Naloge Arhiva Poizvedovanje in pridobivanje podatkov Ravnanje s podatki Posredovanje in razširjanje podatkov Cilj: zagotoviti dostopne visoko kakovostne podatke za raziskovanje in izobraževanje, primerne za raziskovanje pojavov, ki bodo zanimivi za prihodnje generacije

19 Viri podatkov Akademski raziskovalni projekti
Po naročilu vlade (npr. PB), iz virov Statističnega urada, Tržne in javnomnenjske raziskave (Mediana, CATI, Gral – Iteo), Iz tujih arhivov

20 Pomen zapuščine slovenske empirične sociologije
Pomembno za poznavanje lastnih raziskovalnih tradicij Pretekli podatki za primerjave in analize družbenih sprememb Podatki ponekod izgubljeni ali uničeni (MKS, Stratifikacija in mobilnost, vrednote mladih) Glej: ŠTEBE, Janez. Izkoriščanje zapuščine slovenske empirične sociologije za današnje namene v okviru sekundarne analize. V: Družboslovne spremembe na Slovenskem / vabljena urednica Katja Boh. Ljubljana : Univerza : Slovensko sociološko društvo (1999). - (Družboslovne razprave), ISSN ; Letn. 15, št. 30/31). - str Dokument v RTF za ogledovanje.

21 Dostop do statističnih podatkov http://www.stat.si/
Uradne statistike pogosto objavljajo le agregirane podatke Problem dostopa do individualnih podatkov (popis, registri) Povezovanje registrov med sabo, s prostorskimi podatki, harmonizacija spremenljivk... Problem zaupnosti in spodbujanja stopenj sodelovanja Anonimizirani podatki nekaterih raziskav na voljo v ADP (Preizkus II)

22 Preizkus II Poišči na statističnem uradu predstavitev tabel iz zadnjega popisa prebivalstva Poišči datoteko popisa prebivalstva na ADP V čem se razlikujeta oba vira (naštej čim več razlik povezanih z možnostmi uporabe za različne namene)

23 Nekatere najbolj znane raziskave v UK DA ( http://www.esds.ac.uk/ )
British Crime Survey British Election Studies British Household Panel Survey BSA GHS, LFS...

24 Principi pri raziskavah namenjenih sekundarni analizi
Izpolnjevanje najvišjih metodoloških zahtev, standardizacija merjenja, izbor indikatorjev zanimivih za širše akademsko okolje in doslednost v ponavljanju skozi čas, takoj na voljo uporabnikom za sekundarno analizo kot infrastrukturni vir Vzorčni primer nacionalne splošne družboslovne raziskave (GSS)

25 Preko predstavitvene strani ADP na Internetu
Kako do podatkov? Preko predstavitvene strani ADP na Internetu

26 Splošni pogoji in omejitve uporabe
Podatki se izročijo samo za določen namen Uporabnik se zavezuje skrbeti za takšno ravnanje s podatki, da je ohranjena tajnost podatkov Seznanjena uporaba (upošteva metodološka in konceptualna izhodišča ter omejitve raziskave) Citiranje podatkov po modelu navajanja literature

27 KAJ SO PODATKI ”podatkovna datoteka” - računalniško berljive podatkovne datoteke, ki vsebujejo številke – šifre Spremenljivke - Lastnosti opazovanih enot zbranih po določenem postopku Ko govorimo o podatkih imamo v mislih računalniško berljive datoteke podatkov, ki jih je potrebno analizirati. Tukaj ne govorimo o tabelah in grafih, ki jih najdemo v različnih publikacijah, ampak o surovih podatkih, ki jih je potrebno analizirati. In the context of data libraries and archives, 'data' means computer-readable data. We acquire, store and disseminate data for secondary research. This implies that the data collected for a primary purpose are then made available for research by other individuals or groups. This research may seek to replicate analyses already carried out by primary researchers in order to verify, extend, or elaborate upon the original results, or to analyse the data from an entirely different perspective. Censuses and large surveys carried out by governments for their own policy purposes are particularly rich sources of data for further exploration.

28 VPRAŠALNIK

29 SEZNAM SPREMENLJIVK

30 Spremenljivke PODATKI Enote

31 Metapodatki Metapodatke lahko definiramo kot “vse informacije potrebne za obveščanje in procesiranje statističnih struktur”. (Grossmann v Vipavc in Klep, 2003). Pri kakovostnem oblikovanju metapodatkovnih standardov imajo velik pomen uporabniki informacij.  razvoj standardov (DDI)  Mednarodna izmenjava opisov raziskav (zapis v XML)  Možnost analize podatkov

32 Kaj hraniti: podatke, spremljajočo dokumentacijo,
informacije o vzorčenju,... podatke, ki se lahko zgubijo. Spremljajoča dokumentacija naj vsebuje informacije kot izvor podatkov; kaj je bil osnovni namen zbiranja; kdo so bili avtorji in naročniki oz. sponzorji; kako so bili podatki zbrani; kakšni so pravni pogoji uporabe podatkov; opis spremenljivk; kako so bili podatki združeni – kodirna shema; v kakšnem formatu je hranjena računalniško berljiva podatkovna datoteka; na katerem mediju je hranjena

33 Standard na katerem temelji priprava vsebin za ADP je XML DDI DTD (The Data Documentation Initiative Codebook Document Type Definition). Po tem standardu je kodirna knjiga sestavljena iz: Opis dokumenta (Document Description) Opis raziskave (Study Description) - Naslov, avtor, izdelava in distribucija - Vsebina raziskave - Metodologija - Dostop do podatkov Opis podatkov (Data Files Description) Opis spremenljivk (Variable Description) Ostali dokumenti (Other Documentation)

34

35

36

37

38

39

40

41

42 Razvrščanje po vsebini, seriji ...
Meni

43

44 NESSTAR je virtualna podatkovna knjižnica, ki omogoča iskanje, lociranje, pregledovanje in snemanje mnogo raznovrstnih statističnih in drugih podatkov in metapodatkov.

45

46

47

48

49

50 Za analizo podatkov potrebujemo uporabniško ime in geslo za NESSTAR.
IZPOLNEM NAROČILNICO

51

52

53

54

55

56

57 Preizkus III Poišči kakšno vprašanje iz ankete SJM, ki bi bilo zanimivo za raziskovane trendov in preveri, če je bilo to vprašanje že kdaj dobesedno ponovljeno Navodila: s pomočjo iskanja znotraj spremenljivk: prenesi del besedila vprašanja v okence za napredno iskanje, označi iskanje spremenljivk; izpiši oznake raziskav, ki vsebujejo identične ponovitve

58 Posebne zvrsti podatkov
Zbirke kvalitativnih podatkov (ESDS Qualidata web pages ) Kombinirani viri podatkov (npr. ESS in CSES: vsebuje mikro podatke iz ankete kombinirane s podatki o dogodkih in makropodatki o sistemu)

59 Mednarodne anketne raziskave
GLEJ Brina Malnar, Mitja Hafner Fink, Janez Štebe, Zmožnosti mednarodnih anketnih družboslovnih primerjalnih raziskav za oblikovanje subjektivnih indikatorjev razvitosti

60 POMEMBNEJŠE MEDNARODNE RAZISKAVE
Prosto dostopne za raziskovalne namene ISSP – International Social Survey Programme Mednarodna splošna družboslovna anketa [1985 – 2004) – Vloga države; razumevanje vloge državljana – Družbeni stiki – Neenakost – Družina – Stališča o delu; odnos do dela – Raziskava o vernosti in cerkvi – Ekologija – Narodna identiteta EB - Evrobarometer - Eurobarometer CEEB - Evrobarometer Srednje in Vzhodne Evrope - Central and Eastern Eurobarometer CCEB - Evrobarometer držav kandidatk - Candidate Countries Eurobarometer EES - Evropska volilna raziskava - European Election Study CSES - Primerjalna raziskava volitev - Comparative Study of Electoral Systems EVS /WVS – Evropska /Svetovna raziskava vrednot - European / World Values Study ESS - Evropska družboslovna raziskava - The European Social Survey ISSP - Mednarodna splošna družboslovna anketa - International Social Survey Programme IVCS - Mednarodna anketa o viktimizaciji - International Crime Victimisation Survey MTUS - Mednarodna anketa o porabi časa - Multinational Time Use Study ICSPR - The Inter-University Consortium for Political and Social Research

61 ISSP metodološke delovne skupine
Pet skupin raziskuje različna področja primerjalnega raziskovanja z vidika ekvivalence: Prevodi Učinek načina anketiranja Primerljivost demografije Stopnje sodelovanja Oblikovanje vprašalnika

62 Slovenija je uradno del projekta od neodvisnosti, leta 1990
Del projekta ankete SJM Več kot 15 tematskih modulov za mednarodno in medčasovno primerjalno analizo Predstavlja raziskovalno infrastrukturo – Publiciranje ni omejeno samo na člane raziskovalne skupine Ad hoc finančna podpora projektu

63 Dodamo še podatke iz mednarodne datoteke.
Ne pozabimo na ugodnosti, ki izhajajo iz mednarodnega sodelovanja arhivov!!

64 ESS (Evropska družboslovna anketa)
Rotirajoči moduli za posebne vsebine (30-60 kazalcev iz zaključenih tematskih blokov). Cilj je možnost intenzivne in sistematične analize določenega družbenega področja Tematike: Državljanstvo, participacija, demokracija; Stališča o priseljevanju (moduli ESS 2002); Ekonomska morala v Evropi, Stališča o zdravju in medsebojni pomoči; Družina, delo, blagostanje (moduli ESS 2004); Življenjski cikel in Oblikovanje kazalcev napredujoče Evrope (moduli 2006) Metodološke študije:

65

66

67 V ESS sta ponujeni dve uteži,ki jih lahko uporabimo (velikokrat moramo):
- vzorčna utež (design weight - dweight). Kar nekaj držav vključenih v raziskavo ni moglo zagotoviti enake verjetnosti za vključitev posameznikov starejših od 15 let. Tako so v določenih državah bolj zastopani posamezniki iz določenih skupin (npr. posamezniki iz večjih družin) in drugi manj. Te "napake" odpravimo z vzorčno utežjo. - populacijska utež (the Population Size weight - pweight). To utež uporabljamo pri primerjavi dveh ali več držav. Utež upošteva, da je večina držav vključenih v raziskavo imela enako velikost vzorca ne glede na velikost njihove dejanske populacije. Verjetnostna teorija namreč dokazuje, da je vzorec 1000 respondentov enako uporaben za državo z 10 milijoni prebivalci kot za države s samo 1 milijonom. Brez uteževanja bi združeni podatki nad-reprezentirali manjše države. Populacijska utež torej uvaja takšno prilagoditev, da je država predstavljena proporcionalno glede na svojo velikost.

68 Pri prikazovanju tabel v odstotkih morate vedno uporabiti utežene podatke.
Osnovni pravili: vedno uporabimo vzorčno utež in kadar primerjamo podatke dveh ali več držav in kadar jih združujemo v skupine (npr. države članice EU) moramo uporabiti tako vzorčno kot populacijsko utež.

69 “How interested in politics": Weighted and unweighted valid
“How interested in politics": Weighted and unweighted valid frequencies. The following example illustrates some of the effect of weighting. If we want to find the general political interest in the population covered by all the countries participating in the ESS survey, we could create a frequency table using the variable "How interested in politics". Table 7 gives the weighted and unweighted valid frequencies for this variable. The unweighted frequencies tell us the level of political interest in this sample only. If we want to say something about the population in these countries, we must use the weighted frequencies. The discrepancy may not seem very large, but it will have an important impact in many analyses. You should note that the N is less in the weighted column, and not directly interpretable. This is because respondents from smaller countries count less than one, and in this way make the samples more proportional to the population size.

70 Uteževanje

71

72 Iskanje spremenljivke

73

74 Rezultat iskanja besede ZRTEV

75

76

77 POMEMBNEJŠE MEDNARODNE RAZISKAVE
Prosto dostopne za raziskovalne namene ISSP – International Social Survey Programme Mednarodna splošna družboslovna anketa [1985 – 2004) – Vloga države; razumevanje vloge državljana – Družbeni stiki – Neenakost – Družina – Stališča o delu; odnos do dela – Raziskava o vernosti in cerkvi – Ekologija – Narodna identiteta EB - Evrobarometer - Eurobarometer CEEB - Evrobarometer Srednje in Vzhodne Evrope - Central and Eastern Eurobarometer CCEB - Evrobarometer držav kandidatk - Candidate Countries Eurobarometer EES - Evropska volilna raziskava - European Election Study CSES - Primerjalna raziskava volitev - Comparative Study of Electoral Systems EVS /WVS – Evropska /Svetovna raziskava vrednot - European / World Values Study ESS - Evropska družboslovna raziskava - The European Social Survey ISSP - Mednarodna splošna družboslovna anketa - International Social Survey Programme IVCS - Mednarodna anketa o viktimizaciji - International Crime Victimisation Survey MTUS - Mednarodna anketa o porabi časa - Multinational Time Use Study ICSPR - The Inter-University Consortium for Political and Social Research

78 CEEB – Central and Eastern EB [1990 – 1997]
EB – Eurobarometer [1975 – 2002) CEEB – Central and Eastern EB [1990 – 1997] Evrobarometer srednje in vzhodne Evrope CCEB – Candidate Countries EB [2001 – 2004] Evrobarometer držav kandidatk Politične in ekonomske spremembe; Evropska unija; mediji; družbene razmere v državah kandidatkah; mladina v novi Evropi; kultura; identiteta in vrednote; Euro, širitev EU in finančne storitve; pokojninski sistem; zdravje; itd.. EB - Evrobarometer - Eurobarometer CEEB - Evrobarometer Srednje in Vzhodne Evrope - Central and Eastern Eurobarometer CCEB - Evrobarometer držav kandidatk - Candidate Countries Eurobarometer EES - Evropska volilna raziskava - European Election Study CSES - Primerjalna raziskava volitev - Comparative Study of Electoral Systems EVS /WVS – Evropska /Svetovna raziskava vrednot - European / World Values Study ESS - Evropska družboslovna raziskava - The European Social Survey ISSP - Mednarodna splošna družboslovna anketa - International Social Survey Programme IVCS - Mednarodna anketa o viktimizaciji - International Crime Victimisation Survey MTUS - Mednarodna anketa o porabi časa - Multinational Time Use Study ICSPR - The Inter-University Consortium for Political and Social Research

79 EVS – European Values Study [1981, 1990, 1999)
EES – European Election Study [2004] CSES – Comparative Study of Electoral Systems [1996 – 2001, 2001 – 2005) ESS – European Social Survey [2002, 2004) ICVS – International Crime Victimisation Survey [1998 – 2000) EB - Evrobarometer - Eurobarometer CEEB - Evrobarometer Srednje in Vzhodne Evrope - Central and Eastern Eurobarometer CCEB - Evrobarometer držav kandidatk - Candidate Countries Eurobarometer EES - Evropska volilna raziskava - European Election Study CSES - Primerjalna raziskava volitev - Comparative Study of Electoral Systems EVS /WVS – Evropska /Svetovna raziskava vrednot - European / World Values Study ESS - Evropska družboslovna raziskava - The European Social Survey ISSP - Mednarodna splošna družboslovna anketa - International Social Survey Programme IVCS - Mednarodna anketa o viktimizaciji - International Crime Victimisation Survey MTUS - Mednarodna anketa o porabi časa - Multinational Time Use Study ICSPR - The Inter-University Consortium for Political and Social Research

80 DRUGI MEDNARODNI PODATKI
The MacroDataGuide ESDS International Integrated Public Use Microdata Series International

81 Preizkus IV Uporabi podatke iz mednarodne anketne raziskave za sprotno analizo Na katalogu ZA-cat ali ESS se registriraj, izberi neko raziskavo ter naredi kontingenčno tabelo Citiraj vir.

82 ________________________________________________
HVALA ZA POZORNOST ________________________________________________ Za dodatna pojasnila E-pošta:


Download ppt "SEKUNDARNA ANALIZA PODATKOV"

Similar presentations


Ads by Google