Prikupljanje podataka Planiranje istraživanja

Slides:



Advertisements
Similar presentations
Ma.
Advertisements

Click on each of us to hear our sounds.
Katedra za informatiku
STATISTIKA 2. CIKLUS (STRUČNI STUDIJ) Korelacijska analiza
Metode merenja i obrade podataka Dragan Mirkov
Stabilnost, promjena i koherentnost ličnosti
Programi zasnovani na prozorima
Uvod u programiranje - matematika – VI predavanje
Osnove (i još malo više) statistike
Compression Plus Nonsteroidal Antiinflammatory Drugs, Aspiration, and Aspiration With Steroid Injection for Nonseptic Olecranon Bursitis ; RCT Joon Yub.
Opis podataka Doc. dr. sc. Ana Jerončić
Uzorkovanje.
Opis podataka Doc. dr. sc. Ana Jerončić
The Present Perfect Continuous Tense
Petlje FOR - NEXT.
Statistička obradba podataka uvodna razmatranja
Analiza brojčanih podataka, korelacija i regresija
Komponente izbora i kontejnerske komponente
Reference ćelije i opsega
LAPLACEOVA TRANSFORMACIJA
Mere položaja z vrednost (ili statndardna vrednost)
Dizajniranje upitnika
Sveučilište u Splitu Medicinski fakultet
SUDOKU Ivo Doko Saša Buzov.
Biostatistika: uvodna razmatranja
STATISTIKA Metoda uzoraka.
Element form Milena Kostadinović.
MessageBox.
KORELACIJSKA I REGRESIJSKA ANALIZA
Analitička statistika Testiranje hipoteze
Koordinatori: Doc.prim.dr.sc. Silvana Smojver-Ježek
OSNOVE STATISTIČKE OBRADE PODATAKA
DISKRETNI DINAMIČKI SUSTAVI –LOGISTIČKI MODEL -KAOS-
Pojmovi digitalnog zapisa
Uzorci i pogreška uzorkovanja
Prikupljanje podataka Planiranje istraživanja
Prikupljanje podataka Planiranje istraživanja
Kvantitativne metode istraživanja dr. sc. Dario Pavić
Istraživanje tržišta knjiga u RH-a
PROGRAMSKI JEZIK PASCAL
EPIDEMIOLOGIJA HIV INFEKCIJE U HRVATSKOJ
PRIMJENJENA SATELITSKA NAVIGACIJA
Osnovni simboli jezika Pascal
JEDNOSTAVNA LINEARNA REGRESIJA UTJECAJA VARIJABLI NA GODINE ŽIVOTA
FAKULTET KEMIJSKOG INŽENJERSTVA I TEHNOLOGIJE
Do While ... Loop struktura
Statistička obradba podataka – uvodna razmatranja
Programiranje – Small Basic
Analiza varijance prof. dr. sc. Nikola Šakić.
Strukture podataka i algoritmi 5. VRIJEME IZVRŠAVANJA ALGORITMA
Nizovi.
Odgovorna provedba istraživanja (Responsible Conduct of Research, RCR)
Analiza varijance prof. dr. sc. Nikola Šakić.
Autor: Marko Pletikosa Mentor: doc.dr.sc. Domagoj Jakobović
Naredbe u php-u.
Programski jezik C++ - Vježbe - 5. dio
Programski jezik Python
Medicina utemeljena na dokazima
Ljepota matematike Slijedi nekoliko zanimljivih jednakosti koje ukazuju na ljepotu matematike te povezanost matematike s Bogom koji je izvor svih čuda.
Kratkotrajne veze žena i muškaraca
LimeSurvey Uvjetni prikaz pitanja Internetska istraživanja
STATISTIKA (STRUČNI STUDIJ) Korelacijska analiza Regresijska analiza.
Ljepota matematike Slijedi nekoliko zanimljivih jednakosti koje ukazuju na ljepotu matematike te povezanost matematike s Bogom koji je izvor svih čuda.
Oduzimanje brojeva od 1 do 5.
Analiza varijance prof. dr. sc. Nikola Šakić.
Ponavljanje Pisana provjera
Programiranje - Naredbe za kontrolu toka programa – 1. dio
Utvrđivanje kvalitete oblikovanih pričuva šteta – run off analiza
INTERPOLACIJA PO DIJELOVIMA POLINOMIMA
Kako zaštititi privatnost na facebooku
Presentation transcript:

Prikupljanje podataka Planiranje istraživanja STATISTIČAR Tumačenje rezultata Obrada podataka Unos podataka Prikupljanje podataka Planiranje istraživanja

CILJ ISTRAŽIVANJA Opisati Objasniti Predvidjeti uzorak populacija Oruđe: STATISTIKA

UZORAK Kakvo je stanje u populaciji? Nereprezentativan Nezavršena Više ili visoko obrazovanje 12% Nezavršena osnovna škola 19% Osnovna škola 22% Srednja škola 47% Kakvo je stanje u populaciji? Nereprezentativan Reprezentativan Nereprezentativan

UZORAK Vrste uzoraka (načini uzimanja uzoraka) Slučajni Sustavni Svaki član populacije ima jednaku vjerojatnost biti odabran (izvlačenje brojeva iz šešira, tablice slučajnih brojeva, računalni programi...) Sustavni Uzima se svaki n-ti član populacije Stratificirani Populacija se dijeli na “slojeve” pa se iz njih uzimaju slučajni uzorci Slučajni uzorak – daje veliku vjerojatnost reprezentativnog uzorka (često preskupo ili nemoguće) Sistematski – oblik slučajnog uzorka – ima smisla samo ako je lista sastavljena bez smislenog sustava Stratificirani – često bolja reprezentativnost nego kod slučajnog uzorka Klaster – lošija verzija slučajnog uzorka (djelomično i strat.) Kvotni – još lošiji (zapravo neslučajni stratificirani) Prigodni – često jedina mogućnost, može biti sasvim u redu ali paziti na probleme (npr. Psihijatar procjenjuje % frigidnih žena) Prigodni Podatci se uzimaju od ispitanika koje imamo “pri ruci”

UZORAK Veličina uzorka Snaga istraživanja – Varijabilnost mjerene pojave Željena preciznost mjerenja Snaga istraživanja – vjerojatnost pronalaženja razlike koja zaista i postoji u populaciji Slučajni uzorak – daje veliku vjerojatnost reprezentativnog uzorka (često preskupo ili nemoguće) Sistematski – oblik slučajnog uzorka – ima smisla samo ako je lista sastavljena bez smislenog sustava Stratificirani – često bolja reprezentativnost nego kod slučajnog uzorka Klaster – lošija verzija slučajnog uzorka (djelomično i strat.) Kvotni – još lošiji (zapravo neslučajni stratificirani) Prigodni – često jedina mogućnost, može biti sasvim u redu ali paziti na probleme (npr. Psihijatar procjenjuje % frigidnih žena) Pogrješke: alfa – pronašli smo statistički značajnu razliku, a razlike zapravo nema beta – nismo pronašli razliku, a razlika zapravo postoji

OBLIKOVANJE SKUPINA randomizacija Uzorak Kontrolna Eksperimentalna (1 ili više) randomizacija

LJESTVICE MJERENJA NOMINALNA ORDINALNA INTERVALNA OMJERNA broj stoji umjesto imena (npr. spol – muški=0, žene=1) ORDINALNA brojevi označavaju redoslijed, ali ne znamo KOLIKE su razlike (npr. školske ocjene – 1, 2, 3, 4, 5) INTERVALNA imamo redoslijed i razlike ali brojčani odnosi ne označavaju odnose u mjerenoj pojavi jer nema apsolutne nule (npr. temperatura – 20ºC nije dvostruko toplije od 10ºC) OMJERNA brojčani odnosi označavaju odnose u mjerenoj pojavi jer postoji apsolutna nula (npr. dužina – 20 cm je dvostruko duže od 10 cm)

LJESTVICE MJERENJA-dopušteni postupci 1. NOMINALNA 2. ORDINALNA 3. INTERVALNA 4. OMJERNA Dominantna vrijednost, račun proporcija, χ2-test, Cramerov Fi, koeficijent kontingencije C Sve pod 1 + centralna vrijednost, koeficijent korelacije ρ (Ro), Tau, Theta i koeficijent W Sve pod 1 i 2 + aritmetička sredina, standardna devijacija, z-vrijednosti i koeficijent korelacije r (uključujući parcijalnu i multiplu korelaciju) Sve pod 1, 2 i 3 + geometrijska sredina i koeficijent varijabilnosti V

VJEŽBA ordinalna omjerna nominalna intervalna omjerna Stupanj opeklina Zbroj bodova na ljestvici stavova prema znanosti (najmanji mogući rezultat je 10, a najveći 50) Dob Brojevi na majicama nogometaša Doza lijeka koji se daje pacijentu (izražena u mg) Stupanj opeklina omjerna nominalna intervalna omjerna

OBRADA PODATAKA: Opis Usporedba Povezanost Kakvi su stavovi studenata medicine prema znanosti? Postoje li razlike u stavovima prema znanosti između studenata različitih godina? Postoji li povezanost između stavova prema znanosti prosjeka ocjena?

Srednje vrijednosti i raspšenja OPIS Raspodjela Srednje vrijednosti i raspšenja Dominantna vrijednost (Mode) -najčešći rezultatat- Središnja vrijednost (Median) -središnji rezultatat- Aritmetička sredina (Mean) -prosjek- Raspon Poluinterkvartilno raspršenje Standardna devijacija

SREDIŠNJE VRIJEDNOSTI I RASPRŠENJA

SREDNJE VRIJEDNOSTI = 3 M=C = 3 C=2 M=3 1+2+2+3+3+3+4+4+5 9 1+2+2+2+2+3+3+4+8 9 = 3 C=2 M=3

RASPODJELA PODATAKA C=4 C=4

Pažnja! Možda je pogrješka, a možda neistražena pojava! VRIJEDNOSTI KOJE SE JAKO RAZLIKUJU 151 Pažnja! Možda je pogrješka, a možda neistražena pojava!

Testiranje normaliteta raspodjele: Kolmogorov-Smirnov test NORMALNA RASPODJELA Testiranje normaliteta raspodjele: Kolmogorov-Smirnov test parametri

DRUGE RASPODJELE Asimetrična udesno Asimetrična ulijevo Stožasta Spljoštena Bimodalna

Aritmetička sredina i standardna devijacija Parametrijska statistika Središnja/dominantna vrijednost i interkvartilno raspršenje/totalni raspon Neparametrijska statistika

RASPON POUZDANOSTI Npr. M=20, 95%CI 18-24 C=76, 99%CI 69-85 ZBOG POGRJEŠKE MJERENJA DOBIVENI REZULTATI UVIJEK SU SAMO PROCJENA STANJA U POPULACIJI RASPON POUZDANOSTI (CONFIDENCE INTERVAL) RASPON U KOJEM SE, UZ ODREĐENU SIGURNOST (95%, 99%), NALAZI “PRAVI” REZULTAT U POPULACIJI Npr. M=20, 95%CI 18-24 C=76, 99%CI 69-85

IZBOR ODGOVARAJUĆEG STATISTIČKOG POSTUPKA

PRIKAZ p-vrijednosti – tri decimalna mjesta ŠTO ZNAČI “STATISTIČKI ZNAČAJNO”? p<0.05 – 95% sigurnosti da dobivena razlika/povezanost nije posljedica slučaja p<0.01 – 99% sigurnosti da dobivena razlika/povezanost nije posljedica slučaja PRIKAZ p-vrijednosti – tri decimalna mjesta Npr. p=0.024 p=0.007 p<0.001

Statistički značajno, ali ne i klinički! PRIMJER Rezultati randomiziranog kontroliranog pokusa pokazuju da je novi lijek u pokusnoj skupini prosječno smanjio dijastolički tlak s 99 mmHg na 96 mmHg, p<0.001 Statistički značajno, ali ne i klinički!

SAMO POKUSOM MOŽEMO UTVRDITI UZROČNOST!!! POVEZANOST NE ZNAČI I UZROČNOST Korelacija između stavova prema znanosti i slušanja kolegija “Uvod u znanstveni rad u medicini” iznosi ρ=0.84, p<0.001 Studenti koji su slušali kolegij vjerojatno imaju pozitivnije stavove prema znanosti Slušanje kolegija utječe na stvaranje pozitivnijih stavova prema znanosti Slušanje kolegija utječe na stvaranje pozitivnijih stavova prema znanosti

ELEMENTARY CONCEPTS IN STATISTICS http://www. statsoftinc BIOSTATISTICS INSTRUCTIONAL MANUAL http://www.sjsu.edu/faculty/gerstman/StatPrimer/ POWER CALCULATION http://calculators.stat.ucla.edu/powercalc/ ONLINE STATISTICS TEXTBOOK http://www2.chass.ncsu.edu/garson/pa765/statnote.htm

RAZGOVARAJTE SA STATISTIČARIMA, I ONI SU LJUDI! PAŽLJIVO PLANIRAJTE! SUSTAVNO OBRAĐUJTE! ODGOVORNO TUMAČITE!

Procjena veličine uzorka “Koliki uzorak mi treba?” često pitanje važno pitanje odgovor nije sasvim jednostavan grafički način procjene veličine uzorka – Altmanov nomogram

Procjena veličine uzorka potrebna 3 parametra (klinički) relevantna razlika razina značajnosti (0.05, 0.01) snaga na temelju razlike koju smatramo relevantnom možemo izračunati standardiziranu razliku koja ovisi o vrsti podataka (kontinuirani/kvantitativni ili kategorijski/kvalitativni) za kategorijske varijable: SR=δ/√p(1-p) , pri čemu je: δ=p1-p2 (razlika u proporcijama) p=(p1+p2)/2 (prosječna proporcija) za kontinuirane varijable: SR=δ/σ0, pri čemu je: δ – klinički relevantna razlika σ0 – očekivana standardna devijacija

Procjena veličine uzorka – primjer 1 kategorijske varijable Ispitujemo novi antibiotik. Dosad korišteni lijek učinkovit je u 40% slučajeva, a novi, da bi se isplatio mora biti učinkovit u barem 60% slučajeva. Koliko ispitanika trebamo da bismo, uz dvosmjernu značajnost od 0.05 i snagu od 80%, provjerili takvu razliku u učinkovitosti lijekova? SR=δ/√p(1-p) , pri čemu je: δ=p1-p2 (razlika u proporcijama) p=(p1+p2)/2 (prosječna proporcija) SR=(0.6-0.4)/0.5=04.

Procjena veličine uzorka – primjer 1 kategorijske varijable Koliki uzorak biste trebali da je sve isto, samo uz značajnost od 0.01?

Procjena veličine uzorka – primjer 2 kontinuirane varijable Koliki uzorak je potreban da bi se, uz dvosmjernu značajnost od 0.05 i 80% snage, provjerila razlika u razini kolesterola od 1.0 mmol/l između aritmetičkih sredina dviju skupina ispitanika? Očekujemo podjednaku standardnu devijaciju u obje skupine od 3.0 mmol/l. SR=δ/σ0, pri čemu je: δ – klinički relevantna razlika σ0 – očekivana standardna devijacija SR=1/3=0.333

Procjena veličine uzorka – primjer 2 kontinuirane varijable 150 po skupini

Procjena veličine uzorka – zaključno u procjenu veličine uzorka treba uključiti i očekivano osipanje ispitanika npr. dodati 20-30% za istraživanja koja će duže trajati zaokružite na cijeli broj veličina uzorka jest važna, ali ne znači ništa ako uzorak nije dobro odabran