Presentation is loading. Please wait.

Presentation is loading. Please wait.

Metode merenja i obrade podataka Dragan Mirkov

Similar presentations


Presentation on theme: "Metode merenja i obrade podataka Dragan Mirkov"— Presentation transcript:

1 Metode merenja i obrade podataka Dragan Mirkov
PRVI DEO Metode merenja i obrade podataka Dragan Mirkov

2 Sadržaj Šta je merenje Varijable i konstante
Dizajn istraživanja i statistička analiza Statističko zaključivanje Organizacija podataka Prikaz podataka 9/18/2018

3 Šta je merenje

4 Šta je merenje (osnovni pojmovi)
MERENJE: Upoređivanje određene vrednosti sa zadatim (definisanim) standardom PODATAK: Rezultat merenja STATISTIKA: Skup matematičkih “tehnika” kojima se podaci organizuju, “tretiraju” i prikazuju za dalju interpretaciju i evaluaciju EVALUACIJA: “Filozofski” koncept određivanja vrednosti, odnosno značaja dobijenih podataka Sva naučna istraživanja zasnovana su na preciznom i postojanom merenju Naučnici (fizička aktivnost) mere različite atribute ljudskih performansi u laboratorijama Nastavnici i treneri mere “postignuća” svojih učenika testirajući ih. Merenje je zasnovano na procenjivanju odgovarajućih kvantitativnih vrednosti fizičkih veličina Ali isto tako i prebrojavanju dešavanja pojednih događaja... 9/18/2018

5 Osobine merenja Svako merenje mora da bude precizno... Validnost:
Da li rezutat merenja u saglasnosti sa onim što bi trebalo da meri... Pouzdanost: Mera ponovljivosti Objektivnost: Uticaj različitih faktora izbegnut ili kontrolisan

6 Osobine merenja Više o validnosti i pouzdanosi možete saznati na:
“ A New View of Statistics”

7

8

9 Deseto poglavlje

10 Cela knjiga

11 Merni postupak

12 Merni postupak Identifikacija objekta koji treba izmeriti
Standard (jedinica mere) Proces upoređivanja (MERENJE!)... Kvantitativni zaključak... Merni postupak obuhvata četiri koraka

13 Merni postupak h = 1,85 m Rezultat merenja Oznaka merne jedinice
Oznaka veličine Brojna vrednost Nešto o mernom sistemu: SI sistem, prefiksi... Kada rezultat merenja pridodamo odgovarajućoj ljudskoj osobini koju smo merili (recimo visini čoveka) rezultat “postaje” varijabla (promenljiva) vidi nastavak...

14 Varijable i konstante

15 Varijable i konstante Varijabla je karakteristika osobe, mesta, stvari ili procesa (dešavanja) koja može da ima više različtih vrednosti (promenljive) Konstante (parametri) su karakteristike koje se vremenom ne menjaju (nepromenljive)

16 Vrste i klasifikacija podataka
Varijable: Kontinualne i diskretne Rezultati merenja odgovarajućih varijabli mogu se klasifikovati na više načina: Prema objektivnosti merenja: Kvantitativni rezultati (podaci) Kvalitativni rezultati (podaci) Prema skali merenja: Nominalni (koje se prebrojavaju) Ordinalni (redosled) Intervalni (mogu imati negativne vrednosti) Racionalni (ne mogu biti negativne)

17 Istraživački dizajn i statistička analiza

18 Testiranje hipoteze: Ukoliko je H0 tačna, Hn je netačna i obrnuto...
Istraživačka hipoteza (Hn) Nulta hipoteza (H0) Ukoliko je H0 tačna, Hn je netačna i obrnuto... Ovde ću samo pomenuti Deo koji se odnosi na testiranje hipoteza. Hipoteza obično pretpostavlja postojanje veze ili razlika između pojedinaca (ispitanika) ili grupa. Ove pretpostavke se dokazuju ili odbacuju testiranjaem tzv Nulte hipoteze: Ona ne pretpostavlja postojanje veze ili razlike između pojedinaca (ispitanika) ili grupa. Nulta hipoteza uopšeteno govoreći tvrdi da svaka veza ili razlika koja se može dobiti mernjem je rezultat slučajnog događaja. Statistička analiza nam obično “saopštava” verovatnoću sa kojom će se odgovarajući rezultat desiti ukoliko je nulta hipoteza tačna. AKo je verovatnoća velika da je Ho tačna onda prihvatamo nultu hipotezu... Nultu hipotezu odbacujemo i prihvatamo istraživačku hpotezu ukoliko su razlike ili veze između varijabli ostvarene sa prihvatljivim nivoom pouzdanosti. Pre prikupljanja podataka mora se definisati nivo pouzdanosti (verovatnoća da je nulta hipoteza tačna) Npr. Možemo odlučiti da odbacimo nultu hipotezu ukoliko je šanse protiv nje veće ili jednake 95 prema jedan. To znači da će broj očekivanih rezutata koji zadovoljavaju postavku od sto slučajno odabranih biti manji ili jednak 5. (p<= 0.05).

19 Nezavisne i zavisne promenljive
U zavisnosti od “mogućnosti” da na njih utičemo eksperimentalnim dizajnom... Nezavisne (prediktorske) Zavisne (kriterijumske) Masa je delimično zavisna od visine (sa rastom menja se i masa dok obrnuto ne mora da vazi)ali visina nije zavisna od mase...

20 Validnost eksperimenta
Eksperiment (kao deo istraživačkog dizajna) mora da poseduje i tzv. “unutrašnju” (internal) i tzv. “spoljašnju” (external) validnost. Interna validnost odnosi se na to da rezultati zaista predstavljaju meru onoga šta se meri. Na primer ukoliko ispitanicima merimo neku motoričku sposobnost može se desiti da poboljšaju svoje performanse jednostavno ponavljajući drugi put isti test. Ako je istraživanje takvo da ispitujemo efekte nekog “tretmana” kontrolni ispitanici mogu u ponovljenom merenju dobiti bolji rezultat samo zato što su se tokom prvog testiranja se “izveštili”. Ako ovo poboljšanje pripišemo “tretmanu” činimo grešku. Nedovoljna kontrola “remetućih” faktora takođe može uticati na unutrašnju validnost... Instrumetalna greška takođe može uticati na internu validnost (kalibracija, podešenost...) Greške usled lošeg merenja... Spoljašnja validnost se odnosi na sposobnost generalizovanja rezultata dobijenih na odabranom eksperimentalnom uzorku...

21 Zaključivanje u statistici

22 Zaključivanje u statistici
Populacija: ma koja grupa pojedinaca, mesta ili stvari koje imaju bar jednu zajedničku osobinu Uzorak: deo populacije, koji je predmet statističke “obrade” Najčešće se posao statističara sastoji u predviđanju veza, događaja, razlika između velikih grupa (POPULACIJA) (uobičajeno ispitanika...) na osnovu prikupljenih podataka na menjem delu grupe (UZORAK). ...Što je veći uzorak to bi on trebao da vernije predstavlja populaciju... ODNOSNO, Gre Greška predviđanja je obrnuto srazmerna veličini uzorka

23 Odabir uzorka Slučajnim odabirom: svaki član populacije ima jednake šanse da bude izabran Stratifikovano “uzorkovanje”: prethodno populaciju delimo u odgovarajuće grupe (koje imaju nešto zajedničko...) Od najvećeg značaja je pravilan odabir uzorka. Slučajni odabir: Ako od 1000 studenata vašeg univerziteta biramo 50 za potrebe našeg istraživanja biramo 50... Svaki studentu dodelimo ID pa formiramo tabelu slučajnih brojeva od 1 do 1000 i onda odgovarujućim sistemtskim redosledom odabermeo 50... Stratifikovani slučajni odabir: Populacija je podeljena prema odgovarajućoj karakteristici. Na primer ako želite da u prethodnom primeru birate studente tako a odabir odgovara procentualnom broju studenata po godinama studija (40% je studenata I godine, 25% druge godine, 20% treće godine, 15% četvrte godine) 50/1000=0.02

24 Odabir uzorka

25 Parametri i statistika
Parametar karakteristika čitave populacije Statistika Karakteristika uzorka

26 Parametri i statistika
Svaka procena parametra na osnovu statistike uzorka ima izvesnu “grešku” Vrednost “greške” se nikada na zna pouzdano ali se može proceniti na osnovu veličine i varijabiliteta uzorka

27 Prikaz podataka

28 Raspodele Prikaz po redosledu Raspodela po frekvencijama
Raspodela po grupnim frekvencijama

29 Organizovanje podataka
Opseg (R): Najveća vrednost (H) manje najmanja vrednost (L): * Ukoliko se uračunaju i vrednosti na “krajevima” R = H - L R = H – L+1*

30 Prikaz po redosledu Primer: Prikazani su rezultati testiranja 15 dečaka (zgibovi sa dlanovima okrenutim ka “spolja”): 12, 10, 9, 8, 2, 5, 18, 15, 14, 17, 13, 12, 8, 9, 16

31 Prikaz po redosledu

32 Raspodela frekvencijama
Broj ponavljanja u testu LS30 (478 ispitanika)

33 Raspodela frekvencija
Poligon frekvencija

34 Raspodela frekvencija
Primer: Visine 66 dečaka (fudbalera) Visine su “organizovane” u 13 razreda (klasnih intervala) “širine” 2 cm

35 Raspodela frekvencijama

36 Biće dopunjeno...

37 Deskriptivna statistika Dragan Mirkov
DRUGI DEO Deskriptivna statistika Dragan Mirkov

38 Sadržaj Mere centralne tendencije Mere disperzije
Deskriptivna statistika u Excel-u Kriva normalne raspodele Položaj pojedinačnog rezultata u grupi 9/18/2018

39 Mere centralne tendencije

40 Mere centralne tendencije
MEDIJANA (Centralna vrednost) MODUS (Najčešća vrednost) SREDNJA VREDNOST (Aritmetička sredina) 9/18/2018

41 Medijana Podatke poređaj po rastućem redosledu:
Odredi položaj (C) (koji je po redu) centralnog podatka: C = (N+1)/2 za neparan broj podataka na tom (“C-tom”) položaju se nalazi medijana. za paran broj podataka dva su rezutata u sredini pa je medijana srednja vrednost ta dva “centralna” podatka

42 Medijana (paran broj podataka)
5, , ,42 0, , ,10 0, , ,73 1, , ,40 0,73 + 1,10 MEDIJANA je 0,915 2

43 Medijana (neparan broj podataka)
5, , ,42 0, , ,10 0,66 0, , , , , , ,40 MEDIJANA je 0,73

44 Modus Modus je 1.10 Dvostruki modus - 27 & 55 Nema modusa
b c

45 Aritmetička sredina Zbir svih podataka podeli brojem podataka
x i - “i-ti” podatak, N-ukupan broj podataka

46 Aritmetička sredina (raspodela podataka prema učestanosti)
Sumu proizvoda učestanosti pojavljivanja i odgovarajućih vrednosti podeli ukupnim brojem podataka x i - “i-ti” podatak, fi -ukupan broj podataka N=∑ fi

47 Aritmetička sredina (grupna raspodela podataka prema učestanosti)
Sumu proizvoda učestanosti pojavljivanja i srednjih vrednosti odgovarajućeg intervala podeli ukupnim brojem podataka x mid - srednja vrednost “i-tog” intervala fi -ukupan broj podataka N=∑ fi

48 Zajednička aritmetička sredina
Zbir proizvoda srednjih vrednosti podataka i njihovog broja podeli ukupnim brojem svih podataka Ni x i - proizvod “i-te” srednje vrednosti i broja podataka iz kojeg je ta srednja vrednost izračunata

49 Aritmetička sredina (raspodela podataka prema učestanosti)
Sumu proizvoda učestanosti pojavljivanja i odgovarajućih vrednosti podeli ukupnim brojem podataka x i - “i-ti” podatak, fi -ukupan broj podataka N=∑ fi

50 Aritmetička sredina (grupna raspodela podataka prema učestanosti)
Sumu proizvoda učestanosti pojavljivanja i srednjih vrednosti odgovarajućeg intervala podeli ukupnim brojem podataka x mid - srednja vrednost “i-tog” intervala fi -ukupan broj podataka N=∑ fi

51 Mere disperzije

52 Opseg (raspon) Opseg (R): Najveća vrednost (H) manje najmanja vrednost (L): * Ukoliko se uračunaju i vrednosti na “krajevima” R = H - L R = H – L+1*

53 Kvartili KVARTILI Podaci se poređaju od najmanjeg do najvećeg.
Q1 - Određujemo kao medijanu prvih 50% podataka. Q3 - Određujemo kao medijanu drugih 50%podataka.

54 Kvartili Međukvartilni opseg: I = Q3-Q1

55 Srednje odstupanje Srednje odstupanje xi - “i-ti” podatak
x – aritmetička sredina N – broj podataka

56 Varijansa s2 – varijansa s – standardna devijacija xi - “i-ti” podatak
x – aritmetička sredina N – broj podataka

57 Varijansa (raspodela podataka prema učestanosti)
s2 – varijansa s – standardna devijacija xi - “i-ti” podatak x – aritmetička sredina fi – učestanost “i tog podatka

58 Standardna devijacija
Standardna devijacija: Kvadratni koren varijanse:

59 Deskriptivna statistika u Excelu
Može ovako, ako hoćete da računate korak po korak...

60 Deskriptivna statistika u Excelu

61 Deskriptivna statistika u Excelu

62 Deskriptivna statistika u Excelu

63 Deskriptivna statistika u Excelu

64 Kriva normalne raspodele

65 Kriva normalne raspodele
Crtanje standardne krive normalne raspodele u Excelu: normal_distribution/

66 Kriva normalne raspodele
Neke od mnogobrojnih lekcija na internetu: lesson36.htm cc_distri_normal.html Notes/Lesson431.htm

67 z vrednost (ili standardna vrednost)
Mere položaja z vrednost (ili standardna vrednost) koliko se standardnih devijacija dati rezultat razlikuje od srednje vrednosti page 85 of text

68 Mere položaja z vrednost Uzorak x - x z = s

69 z vrednost Uzorak Mere položaja Populacija x - µ x - x z = z =  s
Z-scores will be used extensively in future chapters, but is appropriate for discussion here as they involve the concepts of mean, standard deviation, and descriptive statistics (in this case, measures of position).

70 Tumačenje Z vrednosti Z FIGURE 2-16 Neuobičajene Uobičajene
- 3 - 2 - 1 1 2 3 This concept of ‘unusual’ values will be revisited several times during the course, especially in Chapter 7 - Hypothesis Testing. page 86 of text Z

71 Mere položaja Kvartili, Decili, Percentili

72 Kvartili Q1, Q2, Q3 25% 25% 25% 25% Q1 Q2 Q3 Emphasize that Q1 separates the data into 25% below the Q1 value and 75% above the Q1 value. Whereas Q3 would separate the data into 75% below the Q3 value and 25% above the Q3 value.

73 Kvartili Q1 Q2 Q3 Kada se podaci poređaju po rastućem nizu
Kvartili taj niz dele na četiri (prema broju članova) jednakih delova 25% 25% 25% 25% These 5 numbers will be used in this text’s method for depicting boxplots. Q1 Q2 Q3 (minimum) (maksimum) (medijana)

74 Decili D1, D2, D3, D4, D5, D6, D7, D8, D9 Kada se podaci poređaju po rastućem nizu Kvartili taj niz dele na deset (prema broju članova) jednakih delova

75 Decili D1, D2, D3, D4, D5, D6, D7, D8, D9 Kada se podaci poređaju po rastućem nizu Kvartili taj niz dele na deset (prema broju članova) jednakih delova 10% D D D D D D D D D9

76 Percentili 99 Percentila

77 Deli skup podatak poređanih po rastućem nizu na jednak broj delova
Kvartili, Decili, Percentili Fraktili (Quantiles) Deli skup podatak poređanih po rastućem nizu na jednak broj delova

78 “Izračunavanje” percentila
Broj podataka manjih od x Percentil podatka x = • 100 Ukupan broj podatataka Formula to find what percentile a particular data value is. Data must be in ascending order. page 87 of text

79 “Izračunavanje” rezultata Kada je poznat percentil
n Ukupan broj podataka k dati percentil L Položaj na kome se nalazi tražena vrednost Pk Vrednost k-tog percentil L = • n k 100 To find the score that is a specific percentile, first determine the ‘L’ value. Then follow the flow chart on the next slide.

80 Slajdovi 68 do 83: Chapter 2. Section Triola, Elementary Statistics, Eighth Edition. Copyright Addison Wesley Longman

81 Kriva normalne raspodele
Poglavlje 6: (od 67 do 85 strane)

82 TREĆI DEO KORELACIJE

83 Smisao i princip korelacije
Brojna vrednost (koeficijent) koji predstavlja u kojoj meri su dve varijable međusobno povezane... Koeficijent korelacije Vrednosti od -1 do 1

84 Smisao i princip korelacije

85 Izračunavanje korelacionog koeficijenta
Zx i Zy predstavljaju Z vrednosti odgovarajućih varijabli Prvo izračunamo srednje vrednosti standardne devijacije za obe varijable. Zatim svaki pojedinačan rezultat (za obe varijable) pretvorimo u Z vrednost. Pomnožimo odgovarajuće Z vrednosti. Izračunamo sumu svih proizvoda pa je podelimo sa brojem parova. Vidi primer koji sledi...

86 Izračunavanje korelacionog koeficijenta
Da li su i u kojoj meri varijable x i y međusobno povezane ?

87 Izračunavanje korelacionog koeficijenta

88 Izračunavanje korelacionog koeficijenta
U slučaju većeg broja podataka u praksi se najčešće koristi sledeća formula (ko nema računar...):

89 Izračunavanje korelacionog koeficijenta
...Odnosno računar...

90 Značajnost korelacije
Određen je brojem parova Što je N manje to r mora biti veće da bi korelacija bila značajna (i obrnuto) Značajnost korelacija se određuje uz pomoć tablica ili upotrebom komjuterskih programa:

91

92 Značajnost korelacije

93 Značajnost korelacije
Korisna Web adresa: Dobar “udžbenik” statistike sa lepim ilustracijama (JAVA applets).

94 Rang-korelacija Ako su jedna ili obe varijable date u “rangu”
(neki poredak), računa se tzv. rang-korelacija Nije potrebno da varijable budu u linearnom odnosu. Rang korelaciija daje samo približnu Indikaciju “povezanosti” dve varijable

95 Bivarijantna regresija

96 Bivarijantna regresija
Kada je korelacija između dve varijable dovoljno “velika” (visoka), na osnovu rezultata varijable x (nezavisno promenljive) možemo predvideti rezultat varijable y (zavisno promenljive)...

97 Bivarijantna regresija
To je od posebnog značaja u slučajevima kada nam je merenje varijable x znatno lakše nego merenje varijable y (Npr. procena indirektne potrošnje kiseonika...).

98 Bivarijantna regresija

99

100

101 Multipla regresija Y = a + b1*X1 + b2*X2 + ... + bp*Xp
Ispituje uticaj dve ili više nezavisnih (prediktorskih) promenljivih na zavisno promenljivu... Y = a + b1*X1 + b2*X bp*Xp

102 Multipla regresija PRIMER*:
Posmatran je uticaj eksplozivne snage (x1) i brzine trčanja (x2) na skok u dalj iz zaleta y (10 studenata Fakulteta za fizičku kulturu...) * Primer preuzet iz: Perić D, Operacionalizacija 2, FINE Graf, 1996

103 Multipla regresija Y = *X1 – *X2

104 ČETVRTI DEO TESTIRANJE RAZLIKA

105 Sadržaj t test ANOVA Neparametrijski testovi

106 t test (dva nezavisna uzorka)
PRIMER: Upoređene su visine vertikalnog skoka (CMJ) sto studenata Medicnskog fakulteta i sto studenta DIF-a

107 t test (dva nezavisna uzorka)

108 t test (dva zavisna uzorka)
PRIMER: Daljina šuta iz mesta u pre i posttestu (18 fudbalera):

109 t test (dva zavisna uzorka)

110 Vidi dodatak (IV_deo_dodatak.pdf)
ANOVA Vidi dodatak (IV_deo_dodatak.pdf)

111 ANOVA

112 Ostali testovi biće prikazani direktno
(primena statističkog softvera...)... A slajdovi će vremenom biti dopunjavani, popravaljani...


Download ppt "Metode merenja i obrade podataka Dragan Mirkov"

Similar presentations


Ads by Google