Download presentation
Presentation is loading. Please wait.
Published byThomas Lancastre Braga Modified over 6 years ago
1
Metode merenja i obrade podataka Dragan Mirkov
PRVI DEO Metode merenja i obrade podataka Dragan Mirkov
2
Sadržaj Šta je merenje Varijable i konstante
Dizajn istraživanja i statistička analiza Statističko zaključivanje Organizacija podataka Prikaz podataka 9/18/2018
3
Šta je merenje
4
Šta je merenje (osnovni pojmovi)
MERENJE: Upoređivanje određene vrednosti sa zadatim (definisanim) standardom PODATAK: Rezultat merenja STATISTIKA: Skup matematičkih “tehnika” kojima se podaci organizuju, “tretiraju” i prikazuju za dalju interpretaciju i evaluaciju EVALUACIJA: “Filozofski” koncept određivanja vrednosti, odnosno značaja dobijenih podataka Sva naučna istraživanja zasnovana su na preciznom i postojanom merenju Naučnici (fizička aktivnost) mere različite atribute ljudskih performansi u laboratorijama Nastavnici i treneri mere “postignuća” svojih učenika testirajući ih. Merenje je zasnovano na procenjivanju odgovarajućih kvantitativnih vrednosti fizičkih veličina Ali isto tako i prebrojavanju dešavanja pojednih događaja... 9/18/2018
5
Osobine merenja Svako merenje mora da bude precizno... Validnost:
Da li rezutat merenja u saglasnosti sa onim što bi trebalo da meri... Pouzdanost: Mera ponovljivosti Objektivnost: Uticaj različitih faktora izbegnut ili kontrolisan
6
Osobine merenja Više o validnosti i pouzdanosi možete saznati na:
“ A New View of Statistics”
9
Deseto poglavlje
10
Cela knjiga
11
Merni postupak
12
Merni postupak Identifikacija objekta koji treba izmeriti
Standard (jedinica mere) Proces upoređivanja (MERENJE!)... Kvantitativni zaključak... Merni postupak obuhvata četiri koraka
13
Merni postupak h = 1,85 m Rezultat merenja Oznaka merne jedinice
Oznaka veličine Brojna vrednost Nešto o mernom sistemu: SI sistem, prefiksi... Kada rezultat merenja pridodamo odgovarajućoj ljudskoj osobini koju smo merili (recimo visini čoveka) rezultat “postaje” varijabla (promenljiva) vidi nastavak...
14
Varijable i konstante
15
Varijable i konstante Varijabla je karakteristika osobe, mesta, stvari ili procesa (dešavanja) koja može da ima više različtih vrednosti (promenljive) Konstante (parametri) su karakteristike koje se vremenom ne menjaju (nepromenljive)
16
Vrste i klasifikacija podataka
Varijable: Kontinualne i diskretne Rezultati merenja odgovarajućih varijabli mogu se klasifikovati na više načina: Prema objektivnosti merenja: Kvantitativni rezultati (podaci) Kvalitativni rezultati (podaci) Prema skali merenja: Nominalni (koje se prebrojavaju) Ordinalni (redosled) Intervalni (mogu imati negativne vrednosti) Racionalni (ne mogu biti negativne)
17
Istraživački dizajn i statistička analiza
18
Testiranje hipoteze: Ukoliko je H0 tačna, Hn je netačna i obrnuto...
Istraživačka hipoteza (Hn) Nulta hipoteza (H0) Ukoliko je H0 tačna, Hn je netačna i obrnuto... Ovde ću samo pomenuti Deo koji se odnosi na testiranje hipoteza. Hipoteza obično pretpostavlja postojanje veze ili razlika između pojedinaca (ispitanika) ili grupa. Ove pretpostavke se dokazuju ili odbacuju testiranjaem tzv Nulte hipoteze: Ona ne pretpostavlja postojanje veze ili razlike između pojedinaca (ispitanika) ili grupa. Nulta hipoteza uopšeteno govoreći tvrdi da svaka veza ili razlika koja se može dobiti mernjem je rezultat slučajnog događaja. Statistička analiza nam obično “saopštava” verovatnoću sa kojom će se odgovarajući rezultat desiti ukoliko je nulta hipoteza tačna. AKo je verovatnoća velika da je Ho tačna onda prihvatamo nultu hipotezu... Nultu hipotezu odbacujemo i prihvatamo istraživačku hpotezu ukoliko su razlike ili veze između varijabli ostvarene sa prihvatljivim nivoom pouzdanosti. Pre prikupljanja podataka mora se definisati nivo pouzdanosti (verovatnoća da je nulta hipoteza tačna) Npr. Možemo odlučiti da odbacimo nultu hipotezu ukoliko je šanse protiv nje veće ili jednake 95 prema jedan. To znači da će broj očekivanih rezutata koji zadovoljavaju postavku od sto slučajno odabranih biti manji ili jednak 5. (p<= 0.05).
19
Nezavisne i zavisne promenljive
U zavisnosti od “mogućnosti” da na njih utičemo eksperimentalnim dizajnom... Nezavisne (prediktorske) Zavisne (kriterijumske) Masa je delimično zavisna od visine (sa rastom menja se i masa dok obrnuto ne mora da vazi)ali visina nije zavisna od mase...
20
Validnost eksperimenta
Eksperiment (kao deo istraživačkog dizajna) mora da poseduje i tzv. “unutrašnju” (internal) i tzv. “spoljašnju” (external) validnost. Interna validnost odnosi se na to da rezultati zaista predstavljaju meru onoga šta se meri. Na primer ukoliko ispitanicima merimo neku motoričku sposobnost može se desiti da poboljšaju svoje performanse jednostavno ponavljajući drugi put isti test. Ako je istraživanje takvo da ispitujemo efekte nekog “tretmana” kontrolni ispitanici mogu u ponovljenom merenju dobiti bolji rezultat samo zato što su se tokom prvog testiranja se “izveštili”. Ako ovo poboljšanje pripišemo “tretmanu” činimo grešku. Nedovoljna kontrola “remetućih” faktora takođe može uticati na unutrašnju validnost... Instrumetalna greška takođe može uticati na internu validnost (kalibracija, podešenost...) Greške usled lošeg merenja... Spoljašnja validnost se odnosi na sposobnost generalizovanja rezultata dobijenih na odabranom eksperimentalnom uzorku...
21
Zaključivanje u statistici
22
Zaključivanje u statistici
Populacija: ma koja grupa pojedinaca, mesta ili stvari koje imaju bar jednu zajedničku osobinu Uzorak: deo populacije, koji je predmet statističke “obrade” Najčešće se posao statističara sastoji u predviđanju veza, događaja, razlika između velikih grupa (POPULACIJA) (uobičajeno ispitanika...) na osnovu prikupljenih podataka na menjem delu grupe (UZORAK). ...Što je veći uzorak to bi on trebao da vernije predstavlja populaciju... ODNOSNO, Gre Greška predviđanja je obrnuto srazmerna veličini uzorka
23
Odabir uzorka Slučajnim odabirom: svaki član populacije ima jednake šanse da bude izabran Stratifikovano “uzorkovanje”: prethodno populaciju delimo u odgovarajuće grupe (koje imaju nešto zajedničko...) Od najvećeg značaja je pravilan odabir uzorka. Slučajni odabir: Ako od 1000 studenata vašeg univerziteta biramo 50 za potrebe našeg istraživanja biramo 50... Svaki studentu dodelimo ID pa formiramo tabelu slučajnih brojeva od 1 do 1000 i onda odgovarujućim sistemtskim redosledom odabermeo 50... Stratifikovani slučajni odabir: Populacija je podeljena prema odgovarajućoj karakteristici. Na primer ako želite da u prethodnom primeru birate studente tako a odabir odgovara procentualnom broju studenata po godinama studija (40% je studenata I godine, 25% druge godine, 20% treće godine, 15% četvrte godine) 50/1000=0.02
24
Odabir uzorka
25
Parametri i statistika
Parametar karakteristika čitave populacije Statistika Karakteristika uzorka
26
Parametri i statistika
Svaka procena parametra na osnovu statistike uzorka ima izvesnu “grešku” Vrednost “greške” se nikada na zna pouzdano ali se može proceniti na osnovu veličine i varijabiliteta uzorka
27
Prikaz podataka
28
Raspodele Prikaz po redosledu Raspodela po frekvencijama
Raspodela po grupnim frekvencijama
29
Organizovanje podataka
Opseg (R): Najveća vrednost (H) manje najmanja vrednost (L): * Ukoliko se uračunaju i vrednosti na “krajevima” R = H - L R = H – L+1*
30
Prikaz po redosledu Primer: Prikazani su rezultati testiranja 15 dečaka (zgibovi sa dlanovima okrenutim ka “spolja”): 12, 10, 9, 8, 2, 5, 18, 15, 14, 17, 13, 12, 8, 9, 16
31
Prikaz po redosledu
32
Raspodela frekvencijama
Broj ponavljanja u testu LS30 (478 ispitanika)
33
Raspodela frekvencija
Poligon frekvencija
34
Raspodela frekvencija
Primer: Visine 66 dečaka (fudbalera) Visine su “organizovane” u 13 razreda (klasnih intervala) “širine” 2 cm
35
Raspodela frekvencijama
36
Biće dopunjeno...
37
Deskriptivna statistika Dragan Mirkov
DRUGI DEO Deskriptivna statistika Dragan Mirkov
38
Sadržaj Mere centralne tendencije Mere disperzije
Deskriptivna statistika u Excel-u Kriva normalne raspodele Položaj pojedinačnog rezultata u grupi 9/18/2018
39
Mere centralne tendencije
40
Mere centralne tendencije
MEDIJANA (Centralna vrednost) MODUS (Najčešća vrednost) SREDNJA VREDNOST (Aritmetička sredina) 9/18/2018
41
Medijana Podatke poređaj po rastućem redosledu:
Odredi položaj (C) (koji je po redu) centralnog podatka: C = (N+1)/2 za neparan broj podataka na tom (“C-tom”) položaju se nalazi medijana. za paran broj podataka dva su rezutata u sredini pa je medijana srednja vrednost ta dva “centralna” podatka
42
Medijana (paran broj podataka)
5, , ,42 0, , ,10 0, , ,73 1, , ,40 0,73 + 1,10 MEDIJANA je 0,915 2
43
Medijana (neparan broj podataka)
5, , ,42 0, , ,10 0,66 0, , , , , , ,40 MEDIJANA je 0,73
44
Modus Modus je 1.10 Dvostruki modus - 27 & 55 Nema modusa
b c
45
Aritmetička sredina Zbir svih podataka podeli brojem podataka
x i - “i-ti” podatak, N-ukupan broj podataka
46
Aritmetička sredina (raspodela podataka prema učestanosti)
Sumu proizvoda učestanosti pojavljivanja i odgovarajućih vrednosti podeli ukupnim brojem podataka x i - “i-ti” podatak, fi -ukupan broj podataka N=∑ fi
47
Aritmetička sredina (grupna raspodela podataka prema učestanosti)
Sumu proizvoda učestanosti pojavljivanja i srednjih vrednosti odgovarajućeg intervala podeli ukupnim brojem podataka x mid - srednja vrednost “i-tog” intervala fi -ukupan broj podataka N=∑ fi
48
Zajednička aritmetička sredina
Zbir proizvoda srednjih vrednosti podataka i njihovog broja podeli ukupnim brojem svih podataka Ni x i - proizvod “i-te” srednje vrednosti i broja podataka iz kojeg je ta srednja vrednost izračunata
49
Aritmetička sredina (raspodela podataka prema učestanosti)
Sumu proizvoda učestanosti pojavljivanja i odgovarajućih vrednosti podeli ukupnim brojem podataka x i - “i-ti” podatak, fi -ukupan broj podataka N=∑ fi
50
Aritmetička sredina (grupna raspodela podataka prema učestanosti)
Sumu proizvoda učestanosti pojavljivanja i srednjih vrednosti odgovarajućeg intervala podeli ukupnim brojem podataka x mid - srednja vrednost “i-tog” intervala fi -ukupan broj podataka N=∑ fi
51
Mere disperzije
52
Opseg (raspon) Opseg (R): Najveća vrednost (H) manje najmanja vrednost (L): * Ukoliko se uračunaju i vrednosti na “krajevima” R = H - L R = H – L+1*
53
Kvartili KVARTILI Podaci se poređaju od najmanjeg do najvećeg.
Q1 - Određujemo kao medijanu prvih 50% podataka. Q3 - Određujemo kao medijanu drugih 50%podataka.
54
Kvartili Međukvartilni opseg: I = Q3-Q1
55
Srednje odstupanje Srednje odstupanje xi - “i-ti” podatak
x – aritmetička sredina N – broj podataka
56
Varijansa s2 – varijansa s – standardna devijacija xi - “i-ti” podatak
x – aritmetička sredina N – broj podataka
57
Varijansa (raspodela podataka prema učestanosti)
s2 – varijansa s – standardna devijacija xi - “i-ti” podatak x – aritmetička sredina fi – učestanost “i tog podatka
58
Standardna devijacija
Standardna devijacija: Kvadratni koren varijanse:
59
Deskriptivna statistika u Excelu
Može ovako, ako hoćete da računate korak po korak...
60
Deskriptivna statistika u Excelu
61
Deskriptivna statistika u Excelu
62
Deskriptivna statistika u Excelu
63
Deskriptivna statistika u Excelu
64
Kriva normalne raspodele
65
Kriva normalne raspodele
Crtanje standardne krive normalne raspodele u Excelu: normal_distribution/
66
Kriva normalne raspodele
Neke od mnogobrojnih lekcija na internetu: lesson36.htm cc_distri_normal.html Notes/Lesson431.htm
67
z vrednost (ili standardna vrednost)
Mere položaja z vrednost (ili standardna vrednost) koliko se standardnih devijacija dati rezultat razlikuje od srednje vrednosti page 85 of text
68
Mere položaja z vrednost Uzorak x - x z = s
69
z vrednost Uzorak Mere položaja Populacija x - µ x - x z = z = s
Z-scores will be used extensively in future chapters, but is appropriate for discussion here as they involve the concepts of mean, standard deviation, and descriptive statistics (in this case, measures of position).
70
Tumačenje Z vrednosti Z FIGURE 2-16 Neuobičajene Uobičajene
- 3 - 2 - 1 1 2 3 This concept of ‘unusual’ values will be revisited several times during the course, especially in Chapter 7 - Hypothesis Testing. page 86 of text Z
71
Mere položaja Kvartili, Decili, Percentili
72
Kvartili Q1, Q2, Q3 25% 25% 25% 25% Q1 Q2 Q3 Emphasize that Q1 separates the data into 25% below the Q1 value and 75% above the Q1 value. Whereas Q3 would separate the data into 75% below the Q3 value and 25% above the Q3 value.
73
Kvartili Q1 Q2 Q3 Kada se podaci poređaju po rastućem nizu
Kvartili taj niz dele na četiri (prema broju članova) jednakih delova 25% 25% 25% 25% These 5 numbers will be used in this text’s method for depicting boxplots. Q1 Q2 Q3 (minimum) (maksimum) (medijana)
74
Decili D1, D2, D3, D4, D5, D6, D7, D8, D9 Kada se podaci poređaju po rastućem nizu Kvartili taj niz dele na deset (prema broju članova) jednakih delova
75
Decili D1, D2, D3, D4, D5, D6, D7, D8, D9 Kada se podaci poređaju po rastućem nizu Kvartili taj niz dele na deset (prema broju članova) jednakih delova 10% D D D D D D D D D9
76
Percentili 99 Percentila
77
Deli skup podatak poređanih po rastućem nizu na jednak broj delova
Kvartili, Decili, Percentili Fraktili (Quantiles) Deli skup podatak poređanih po rastućem nizu na jednak broj delova
78
“Izračunavanje” percentila
Broj podataka manjih od x Percentil podatka x = • 100 Ukupan broj podatataka Formula to find what percentile a particular data value is. Data must be in ascending order. page 87 of text
79
“Izračunavanje” rezultata Kada je poznat percentil
n Ukupan broj podataka k dati percentil L Položaj na kome se nalazi tražena vrednost Pk Vrednost k-tog percentil L = • n k 100 To find the score that is a specific percentile, first determine the ‘L’ value. Then follow the flow chart on the next slide.
80
Slajdovi 68 do 83: Chapter 2. Section Triola, Elementary Statistics, Eighth Edition. Copyright Addison Wesley Longman
81
Kriva normalne raspodele
Poglavlje 6: (od 67 do 85 strane)
82
TREĆI DEO KORELACIJE
83
Smisao i princip korelacije
Brojna vrednost (koeficijent) koji predstavlja u kojoj meri su dve varijable međusobno povezane... Koeficijent korelacije Vrednosti od -1 do 1
84
Smisao i princip korelacije
85
Izračunavanje korelacionog koeficijenta
Zx i Zy predstavljaju Z vrednosti odgovarajućih varijabli Prvo izračunamo srednje vrednosti standardne devijacije za obe varijable. Zatim svaki pojedinačan rezultat (za obe varijable) pretvorimo u Z vrednost. Pomnožimo odgovarajuće Z vrednosti. Izračunamo sumu svih proizvoda pa je podelimo sa brojem parova. Vidi primer koji sledi...
86
Izračunavanje korelacionog koeficijenta
Da li su i u kojoj meri varijable x i y međusobno povezane ?
87
Izračunavanje korelacionog koeficijenta
88
Izračunavanje korelacionog koeficijenta
U slučaju većeg broja podataka u praksi se najčešće koristi sledeća formula (ko nema računar...):
89
Izračunavanje korelacionog koeficijenta
...Odnosno računar...
90
Značajnost korelacije
Određen je brojem parova Što je N manje to r mora biti veće da bi korelacija bila značajna (i obrnuto) Značajnost korelacija se određuje uz pomoć tablica ili upotrebom komjuterskih programa:
92
Značajnost korelacije
93
Značajnost korelacije
Korisna Web adresa: Dobar “udžbenik” statistike sa lepim ilustracijama (JAVA applets).
94
Rang-korelacija Ako su jedna ili obe varijable date u “rangu”
(neki poredak), računa se tzv. rang-korelacija Nije potrebno da varijable budu u linearnom odnosu. Rang korelaciija daje samo približnu Indikaciju “povezanosti” dve varijable
95
Bivarijantna regresija
96
Bivarijantna regresija
Kada je korelacija između dve varijable dovoljno “velika” (visoka), na osnovu rezultata varijable x (nezavisno promenljive) možemo predvideti rezultat varijable y (zavisno promenljive)...
97
Bivarijantna regresija
To je od posebnog značaja u slučajevima kada nam je merenje varijable x znatno lakše nego merenje varijable y (Npr. procena indirektne potrošnje kiseonika...).
98
Bivarijantna regresija
101
Multipla regresija Y = a + b1*X1 + b2*X2 + ... + bp*Xp
Ispituje uticaj dve ili više nezavisnih (prediktorskih) promenljivih na zavisno promenljivu... Y = a + b1*X1 + b2*X bp*Xp
102
Multipla regresija PRIMER*:
Posmatran je uticaj eksplozivne snage (x1) i brzine trčanja (x2) na skok u dalj iz zaleta y (10 studenata Fakulteta za fizičku kulturu...) * Primer preuzet iz: Perić D, Operacionalizacija 2, FINE Graf, 1996
103
Multipla regresija Y = *X1 – *X2
104
ČETVRTI DEO TESTIRANJE RAZLIKA
105
Sadržaj t test ANOVA Neparametrijski testovi
106
t test (dva nezavisna uzorka)
PRIMER: Upoređene su visine vertikalnog skoka (CMJ) sto studenata Medicnskog fakulteta i sto studenta DIF-a
107
t test (dva nezavisna uzorka)
108
t test (dva zavisna uzorka)
PRIMER: Daljina šuta iz mesta u pre i posttestu (18 fudbalera):
109
t test (dva zavisna uzorka)
110
Vidi dodatak (IV_deo_dodatak.pdf)
ANOVA Vidi dodatak (IV_deo_dodatak.pdf)
111
ANOVA
112
Ostali testovi biće prikazani direktno
(primena statističkog softvera...)... A slajdovi će vremenom biti dopunjavani, popravaljani...
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.