Presentation is loading. Please wait.

Presentation is loading. Please wait.

Opis podataka Doc. dr. sc. Ana Jerončić

Similar presentations


Presentation on theme: "Opis podataka Doc. dr. sc. Ana Jerončić"— Presentation transcript:

1 Opis podataka Doc. dr. sc. Ana Jerončić
Katedra za istraživanja u biomedicini i zdravstvu

2 Opis kvantitativnih (brojčanih) podataka ?
Mjere srednje vrijednosti (centralne tendencije) Mjere raspršenja

3 Mjere srednje vrijednosti (centralne tendencije)
Kojoj vrijednosti teže moji podatci?

4 Mjere raspršenja (varijabilnosti)
Koliko su moji podatci različiti?

5 Mjere srednje vrijednosti (centralne tendencije)
Aritmetička sredina (prosječna vrijednost) Medijan Mod

6 Aritmetička sredina, Koristi se isključivo za kvantitativne (brojčane) podatke - intervalne i omjerne varijable Izračuna se tako da se zbroje sve vrijednosti jedne varijable u uzorku i taj broj se podijeli s brojem mjerenja. Primjer: Porođajne mase beba su: 3, 4, 2, 3 i 3 kg Ukupni zbroj = 15 kg Broj mjerenja (beba) = 5 Aritmetička sredina (prosječna vrijednost) = 15/ 5 = 3 kg

7 Medijan, Md Koristi se uvijek za ordinalne podatke, te
za brojčane podatke kada su “asimetrično raspodijeljeni” Aritmetička sredina

8 Medijan, Md Poredaj brojeve po veličini: 2,3,5,6,7 Srednji broj je 5
Kada se sve vrijednosti varijable poredaju po veličini, srednji broj po položaju je medijan Dijeli donjih 50% podataka od gornjih 50%. Primjer: Broj prethodnih trudnoća je 3,6,2,5,7. Koliki je medijan? Poredaj brojeve po veličini: 2,3,5,6,7 Srednji broj je 5 Medijan je 5

9 Medijan, Md Medijan za paran broj ispitanika Primjer:
Odredi medijan za broj prethodnih trudnoća u slijedećih šest ispitanica: 2,7,1,6,6,3 Poredaj brojeve po veličini: 1,2,3,6,6,7 Srednji brojevi su: 3 i 6 Medijan je

10 Mod, Mo Koristi se uglavnom za nominalne podatke, rjeđe za ordinalne i brojčane podatke Vrijednost (broj) koji se pojavljuje najveći broj puta u uzorku Primjer: Podatci o 2,2,2,4,5,6,7,7,7,7,8 7 je broj koji se pojavljuje najučestalije (najveći broj puta) Mod je 7

11 Mjere srednje vrijednosti na primjeru

12 Mjere raspršenja (varijabilnosti)
Raspon Interkvartilni raspon Varijanca Standardna devijacija

13 Raspon, R Koristi se kao mjera raspršenja uz medijan ili mod
Razlika najviše i najniže vrijednosti u podatcima R=maxpodatak-minpodatak Greške pri mjerenju utječu na njega

14 Raspon, R u literaturi RAD: Merewood A et al. Vitamin D status among 4-month-old infants in New England: a prospective cohort study. J Hum Lact :159-66 CILJ: Odrediti prediktore nedostatka vitamina D, 25(OH)D u skupini dojenčadi starih 4 mjeseca, testiranih nakon poroda. REZULTATI: At 4 months, 11.9% of the 177 infants were vitamin D deficient compared to 37.5% at birth (25(OH)D <20 ng/mL). Median 25(OH)D was 35.2 ng/mL (range, ). …

15 Interkvartilni raspon – umjesto raspona kada imamo veliki uzorak

16 Varijanca, s2 podatci za n ispitanika Koristi se kao mjera raspršenja uz aritmetičku sredinu Prosječno kvadratno odstupanje podataka od aritmetičke sredine Rijetko se koristi jer se izražava u mjernim jedinicama2 pa je praktično tumačenje problematično npr. ovisno o tome što mjerimo: ng2/mL2, g2/danu2, … s2 -1

17 Standardna devijacija, s (SD)
Standardna devijacija – uvijek uz aritmetičku sredinu! Korijen iz varijance => Prosječno odstupanje podataka od aritmetičke sredine Mjerne jedinice iste kao i u aritmetičke sredine: ng/mL, g/danu

18 Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici

19 Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici
Izmjerene su težine N=812 novorođenčadi. Izračunali smo da je aritmetička sredina 3624 g, a s (SD) 464 g. Razdioba težina je prikazana grafički (plavi histogram). 68% novorođenčadi ima težinu od =3160 g do =4088 g 95% novorođenčadi ima težinu od 3624-2*464=2696 g do *464=4552 g

20 Mjere raspršenja vrijednosti na primjeru
IQR

21 Opis podataka u literaturi - postoji li značajna razlika u regeneraciji jetre između vremena T1 i T2? Functional elements associated with hepatic regeneration in living donors after right hepatic lobectomy. “Twelve donors were studied at baseline; eight retested at (mean±SD) 11±3 days(T1), 10 at 91±9 days(T2), and 10 at 185±17 days(T3) after donation. Regeneration rates (mL liver per kg body weight per day) were 0.60±0.22 from baseline to T1, 0.05±0.02 from T1 to T2, 0.01±0.01 from T2 to T3 by CT, 0.54±0.20, 0.04±0.01 and 0.01±0.02 by SPECT. At T3, liver volume was 84±7% of baseline by CT and 92±13% by SPECT. “ 0.60 ± 0.22 => = 0.38 = 0.82 Najveći dio podataka u vremenu T1 nalazi se u rasponu od 0.38 do 0.82 ml jetre/kg tijela po danu Najveći dio podataka u vremenu T2 nalazi se u rasponu od 0.03 do 0.07 ml jetre/kg tijela po danu

22 Zašto se opisna statistika koristi?
Opis uzorka usporedba s populacijskim parametrima Opis uzorka u ograncima RCT kvaliteta randomizacije Procjena razdiobe podataka (odabir statističkog testa)

23 U tablici je (prema navodima autora) opisan reprezentativan uzorak hrvatske populacije. Slažete li se s tvrdnjom?

24 Je li u slijedećoj studiji rađenoj na ženama s PCOS sindromom randomizacija uspješno provedena?
Unilateralna N=49 Bilateralna N=47 Varijable Aritmetička sredina±SD /medijan (IQR) MD (95% CI)* Dob [godine] 29.3±3.31 29.3±3.05 0.08 (-1.23, 1.38) BMI [kg/m2] 25.1±1.94 25.0±2.10 0.02 (-0.81, 0.85) FSH [IU/L] 5.5±1.19 5.1±1.15 0.38 (-0.09, 0.86) LH [IU/L] 13.0±2.64 12.3±3.50 0.68 (-0.58, 1.95) Prosječna vrijednost ukupnog V [cm3] 11.3±1.79 11.4±2.74 -0.13 (-1.08, 0.82) Prosječna vrijednost AFC  15.0±2.37 14.8±3.20 0.21 (-0.94, 1.37) A [nmol/L]  15.2±4.62 11.9±4.18 3.13 (1.34, 4.93) ǂ SHBG [nmol/L] 35.0±9.32 39.0±10.45 -4.02 (-8.07, 0.03) Prolactin [µg/L] 294.0±96.27 284.4±78.08 9.78 (-26.20, 45.77) AMH [ng/ml] 5.9 (2.7) 6.5 (3.6) -0.7 (-1.6, 0.1) T [nmol/L] 2.7 (0.6) 3.0 (1.1) -0.2 (-0.5, -0.1) ǂ DHESO4 [μmol/L] 7.8 (4.3) 7 (2.7) 0.4 (-0.6, 1.5) FAI 7.8 (1.4) 8.0 (3.3) -0.4 (-1.4, 0.2) Klinički neznačajno

25 Razdioba brojčanih podataka
Opis preko mjera srednje vrijednosti i raspršenja ili Grafičkim prikazom (histogram)

26 Razdioba brojčanih podataka
Opis preko mjera srednje vrijednosti i raspršenja ili Grafičkim prikazom (histogram)

27 Grafički prikaz razdiobe brojčanih podataka - histogram
Ispitanici su podijeljeni prema veličini tumora u kategorije jednako širokih intervala 0-1, 1-2, … 8-9 cm Pobrojeno je koliko ispitanika ima u pojedinoj kategoriji Broj ispitanika po kategoriji je prikazan grafički.

28 Histogram – Razdioba veličine tumora u 13 bolesnika
Srednja vrijednost veličine tumora u ovoj skupini je 3-4 cm (3 bolesnika) Veličina tumora je raspršena – od >0 do 9 cm Najveći dio tumora ima veličinu od 1 do 6 cm (9 bolesnika) Računanjem iz aritmetičke sredine i SD =1.52 =6.02

29 Oblik histograma Krivulja normalne (Gaussove) razdiobe

30 Oblik histograma

31 Laž s prosječnom plaćom

32 Važnost normalne razdiobe, aritmetičke sredine i standardne devijacije u statistici

33 Opis kvalitativnih (nominalnih, ordinalnih) podataka
Kvalitativne varijable – vrijednost tih varijabli je kategorija: Spol (muško/žensko) Stupanj tumora (mali/ srednji/ veliki) Stupanj opeklina (1/ II/ III) Kvalitativne varijable pobrojavamo!

34 Opis kvalitativnih podataka
Nakon provedenoga istraživanja ispunili ste slijedeći obrazac za unos podataka. Što možete reći o razdiobi spola u vašem ispitivanju? apsolutna učestalost SPOL EEG nalaz muško patološki žensko uredan Nžena=12 Nmuškaraca=5 Je li vaše istraživanje dobro izbalansirano s obzirom na spol? relativna učestalost Postotak žena=12*100/17=71% Postotak mušk=5*100/17=29%

35 Zapamti! Apsolutna učestalost ili apsolutna frekvencija
3 bolesnika u uzorku od 10 Relativna učestalost ili relativna frekvencija 3/10=30% bolesnika Postotak 30% = Proporcija 0.3

36 Dvije varijable? Povezanost varijabli

37 Opis kvalitativnih podataka - 2 varijable
Tablica frekvencija (2X2) EKG nalaza prema spolu ispitanika EEG nalaz patološki uredan Ukupno SPOL muško 4 1 5 žensko 11 12 17 Tablice frekvencija (ili tablice kontigencija) s više varijabli služe: prikazu odnosa između odabranih varijabli (SPOL i EKG nalaz) ili kao podloga za primjenu statističkog testa koji ispituje postoji li povezanost između tih varijabli.

38 Opis kvalitativnih podataka - 2 varijable
Tablica 1. Broj (%) ispitanika prema EKG nalazu u odnosu na spol Patološki (n=5) Uredan (n=12) Ukupno (n=17)  Spol muškarci 4 (80) 1 (8) 5 žene 1 (20) 11 (92) 12 Slika 1. Razdioba ispitanika prema EKG nalazu u odnosu na spol

39 Opis kvalitativnih podataka – 2 varijable
Slika. Razdioba ispitanika prema EKG nalazu u odnosu na spol

40 Opis kvantitativnih (brojčanih) podataka za 2 varijable?
npr. interesira nas povezanost duljine bubrega s porastom životne dobi djece Za svako dijete imamo podatke za dvije varijable (obilježja) Dob djeteta [dani] Duljina bubrega [mm]

41 TOČKASTI GRAF Duljina bubrega [mmi] Starost djeteta [dani]
Na x osi je dob (dani)- NEOVISNA VARIJABLA, a na y je duljina bubrega (mm)-OVISNA VARIJABLA.

42 Hvala na pozornosti! Pitanja?

43


Download ppt "Opis podataka Doc. dr. sc. Ana Jerončić"

Similar presentations


Ads by Google