OBDELAVA (PROCESIRANJE PODATKOV) Pojem in vloga editiranja v obdelavi podatkov Osnovni pristopi in tehnike Avtomatsko editiranje Selektivno editiranje Makro editiranje Raziskovalni projekti Literatura
OBDELAVA (PROCESIRANJE PODATKOV) Vnos podatkov Editiranje Imputiranje Ocenjevanje, agregiranje Integriranje Analiza (časovne serije in sezonske prilagoditve, izračun indikatorjev, indeksov)
KAJ JE EDITIRANJE (UREJANJE) PODATKOV Editing procedure… process of detecting and handling errors in data. Glossary of Terms on Statistical Editing, UN, 2000 Editing is the examination of data for the purpose of error detection. (ABS; 1993)
KAJ PRINAŠA EDITIRANJE Informacije o kvaliteti podatkov Odpravo napak Izhodišča za izboljšanje raziskovanj v prihodnosti Nevarnost pre-editiranja
VIDIKI EDITIRANJA Kontrola polnoštevilnosti (kompletnosti) Rutinska kontrola Kontrola (veljavnosti) validnosti podatkov Relacijska kontrola Aritmetična kontrola Stohastične in deterministične kontrole
IZVEDBA EDITIRANJA Papir in svinčnik Iterativni postopek vnosa podatkov in odprave napak Računalniško podprt vnos in editiranje (head-up) Avtomatsko editiranje Selektivno editiranje
AVTOMATSKO EDITIRANJE Fellegi in Holt (1976) - identifikacija ‘okuženih’ področij; Uporaba v praksi (Kanada, Italija, Španija) Koraki pri avtomatskem editiranju: Identifikacija napak in nekonsistentnosti Nekonsistentnost: opredelitev področja z napako Popravki in imputiranje Primer Pogoji uporabe Fellegi - Holt metodologije
AVTOMATSKO EDITIRANJE Hot- deck pristop: kontinuirano korigiranje podatkov s pomočjo ažurirane tekoče baze Cold- deck pristop: korigiranje podatkov s pomočjo dane (fiksne) baze
SELEKTIVNO EDITIRANJE Odkrivanje individualnih napak- osamelcev (outlier) po vnaprej znanih kriterijih ; Hidiroglou in Berthelot (1986) – ‘Score Function’- indikator proritet za mikro editiranje Van de Pol and Molenaar (1996) - indeks rizičnosti, ki primerja velikost napake in pomen enote
MAKRO EDITIRANJE (OUTPUT KONTROLA) (Granquist, 1990; Granquist in Kovar , 1997) Agregatna metoda (primerjava agregatnih vrednosti različnih obdobij) Metoda porazdelitve (primerjava individualnih vrednosti glede na porazdelitev) Uporabnost pri ekonomskih spremenljivkah, tako kot pri mikroeditiranju težave pri sistematičnih napakah
RAZISKOVALNI PROJEKTI AUTIMP (Automatic Imputation software for business surves and population censuses) v okviru DOSIS EUREDIT (Development and Evaluation of New Methods for Editing and Imputation) v okviru EPROS CHINTEX The Change from Input Harmonisation to Ex-post Harmonisation in National Samples of the European Community Household Panel – DACSEIS Data Quality of Complex Surveys within the New Euroepan Information Society
Literatura Willeboordse Ad (ed.): Handbook on the Design and Implementation of Business Surveys, Eurostat, 7/C, 1998 UN Statistical Commission and Economic Commision for Europe: Statistical data Editing . Methods and Techniques. Volume 1. Statistical Standards and Studies. No.44, 1994, str.239. Statistical data Editing . Methods and Techniques. Volume 2. Statistical Standards and Studies. No.48, 1997, str.239.
LITERATURA UN Statistical Commission and Economic Commision for Europe: Glossary of terms on statistical data editing Evaluating efficiency of statistical data editing: general framework Work session on statistical data editing