Metode merenja i obrade podataka Dragan Mirkov

Metode merenja i obrade podataka Dragan Mirkov
PRVI DEO Metode merenja i obrade podataka Dragan Mirkov

Sadržaj Šta je merenje Varijable i konstante
Dizajn istraživanja i statistička analiza Statističko zaključivanje Organizacija podataka Prikaz podataka 9/18/2018

Šta je merenje

Šta je merenje (osnovni pojmovi)
MERENJE: Upoređivanje određene vrednosti sa zadatim (definisanim) standardom PODATAK: Rezultat merenja STATISTIKA: Skup matematičkih “tehnika” kojima se podaci organizuju, “tretiraju” i prikazuju za dalju interpretaciju i evaluaciju EVALUACIJA: “Filozofski” koncept određivanja vrednosti, odnosno značaja dobijenih podataka Sva naučna istraživanja zasnovana su na preciznom i postojanom merenju Naučnici (fizička aktivnost) mere različite atribute ljudskih performansi u laboratorijama Nastavnici i treneri mere “postignuća” svojih učenika testirajući ih. Merenje je zasnovano na procenjivanju odgovarajućih kvantitativnih vrednosti fizičkih veličina Ali isto tako i prebrojavanju dešavanja pojednih događaja... 9/18/2018

Osobine merenja Svako merenje mora da bude precizno... Validnost:
Da li rezutat merenja u saglasnosti sa onim što bi trebalo da meri... Pouzdanost: Mera ponovljivosti Objektivnost: Uticaj različitih faktora izbegnut ili kontrolisan

Osobine merenja Više o validnosti i pouzdanosi možete saznati na:
“ A New View of Statistics”

Deseto poglavlje

Cela knjiga

Merni postupak

Merni postupak Identifikacija objekta koji treba izmeriti
Standard (jedinica mere) Proces upoređivanja (MERENJE!)... Kvantitativni zaključak... Merni postupak obuhvata četiri koraka

Merni postupak h = 1,85 m Rezultat merenja Oznaka merne jedinice
Oznaka veličine Brojna vrednost Nešto o mernom sistemu: SI sistem, prefiksi... Kada rezultat merenja pridodamo odgovarajućoj ljudskoj osobini koju smo merili (recimo visini čoveka) rezultat “postaje” varijabla (promenljiva) vidi nastavak...

Varijable i konstante

Varijable i konstante Varijabla je karakteristika osobe, mesta, stvari ili procesa (dešavanja) koja može da ima više različtih vrednosti (promenljive) Konstante (parametri) su karakteristike koje se vremenom ne menjaju (nepromenljive)

Vrste i klasifikacija podataka
Varijable: Kontinualne i diskretne Rezultati merenja odgovarajućih varijabli mogu se klasifikovati na više načina: Prema objektivnosti merenja: Kvantitativni rezultati (podaci) Kvalitativni rezultati (podaci) Prema skali merenja: Nominalni (koje se prebrojavaju) Ordinalni (redosled) Intervalni (mogu imati negativne vrednosti) Racionalni (ne mogu biti negativne)

Istraživački dizajn i statistička analiza

Testiranje hipoteze: Ukoliko je H0 tačna, Hn je netačna i obrnuto...
Istraživačka hipoteza (Hn) Nulta hipoteza (H0) Ukoliko je H0 tačna, Hn je netačna i obrnuto... Ovde ću samo pomenuti Deo koji se odnosi na testiranje hipoteza. Hipoteza obično pretpostavlja postojanje veze ili razlika između pojedinaca (ispitanika) ili grupa. Ove pretpostavke se dokazuju ili odbacuju testiranjaem tzv Nulte hipoteze: Ona ne pretpostavlja postojanje veze ili razlike između pojedinaca (ispitanika) ili grupa. Nulta hipoteza uopšeteno govoreći tvrdi da svaka veza ili razlika koja se može dobiti mernjem je rezultat slučajnog događaja. Statistička analiza nam obično “saopštava” verovatnoću sa kojom će se odgovarajući rezultat desiti ukoliko je nulta hipoteza tačna. AKo je verovatnoća velika da je Ho tačna onda prihvatamo nultu hipotezu... Nultu hipotezu odbacujemo i prihvatamo istraživačku hpotezu ukoliko su razlike ili veze između varijabli ostvarene sa prihvatljivim nivoom pouzdanosti. Pre prikupljanja podataka mora se definisati nivo pouzdanosti (verovatnoća da je nulta hipoteza tačna) Npr. Možemo odlučiti da odbacimo nultu hipotezu ukoliko je šanse protiv nje veće ili jednake 95 prema jedan. To znači da će broj očekivanih rezutata koji zadovoljavaju postavku od sto slučajno odabranih biti manji ili jednak 5. (p<= 0.05).

Nezavisne i zavisne promenljive
U zavisnosti od “mogućnosti” da na njih utičemo eksperimentalnim dizajnom... Nezavisne (prediktorske) Zavisne (kriterijumske) Masa je delimično zavisna od visine (sa rastom menja se i masa dok obrnuto ne mora da vazi)ali visina nije zavisna od mase...

Validnost eksperimenta
Eksperiment (kao deo istraživačkog dizajna) mora da poseduje i tzv. “unutrašnju” (internal) i tzv. “spoljašnju” (external) validnost. Interna validnost odnosi se na to da rezultati zaista predstavljaju meru onoga šta se meri. Na primer ukoliko ispitanicima merimo neku motoričku sposobnost može se desiti da poboljšaju svoje performanse jednostavno ponavljajući drugi put isti test. Ako je istraživanje takvo da ispitujemo efekte nekog “tretmana” kontrolni ispitanici mogu u ponovljenom merenju dobiti bolji rezultat samo zato što su se tokom prvog testiranja se “izveštili”. Ako ovo poboljšanje pripišemo “tretmanu” činimo grešku. Nedovoljna kontrola “remetućih” faktora takođe može uticati na unutrašnju validnost... Instrumetalna greška takođe može uticati na internu validnost (kalibracija, podešenost...) Greške usled lošeg merenja... Spoljašnja validnost se odnosi na sposobnost generalizovanja rezultata dobijenih na odabranom eksperimentalnom uzorku...

Zaključivanje u statistici

Zaključivanje u statistici
Populacija: ma koja grupa pojedinaca, mesta ili stvari koje imaju bar jednu zajedničku osobinu Uzorak: deo populacije, koji je predmet statističke “obrade” Najčešće se posao statističara sastoji u predviđanju veza, događaja, razlika između velikih grupa (POPULACIJA) (uobičajeno ispitanika...) na osnovu prikupljenih podataka na menjem delu grupe (UZORAK). ...Što je veći uzorak to bi on trebao da vernije predstavlja populaciju... ODNOSNO, Gre Greška predviđanja je obrnuto srazmerna veličini uzorka

Odabir uzorka Slučajnim odabirom: svaki član populacije ima jednake šanse da bude izabran Stratifikovano “uzorkovanje”: prethodno populaciju delimo u odgovarajuće grupe (koje imaju nešto zajedničko...) Od najvećeg značaja je pravilan odabir uzorka. Slučajni odabir: Ako od 1000 studenata vašeg univerziteta biramo 50 za potrebe našeg istraživanja biramo 50... Svaki studentu dodelimo ID pa formiramo tabelu slučajnih brojeva od 1 do 1000 i onda odgovarujućim sistemtskim redosledom odabermeo 50... Stratifikovani slučajni odabir: Populacija je podeljena prema odgovarajućoj karakteristici. Na primer ako želite da u prethodnom primeru birate studente tako a odabir odgovara procentualnom broju studenata po godinama studija (40% je studenata I godine, 25% druge godine, 20% treće godine, 15% četvrte godine) 50/1000=0.02

Odabir uzorka

Parametri i statistika
Parametar karakteristika čitave populacije Statistika Karakteristika uzorka

Parametri i statistika
Svaka procena parametra na osnovu statistike uzorka ima izvesnu “grešku” Vrednost “greške” se nikada na zna pouzdano ali se može proceniti na osnovu veličine i varijabiliteta uzorka

Prikaz podataka

Raspodele Prikaz po redosledu Raspodela po frekvencijama
Raspodela po grupnim frekvencijama

Organizovanje podataka
Opseg (R): Najveća vrednost (H) manje najmanja vrednost (L): * Ukoliko se uračunaju i vrednosti na “krajevima” R = H - L R = H – L+1*

Prikaz po redosledu Primer: Prikazani su rezultati testiranja 15 dečaka (zgibovi sa dlanovima okrenutim ka “spolja”): 12, 10, 9, 8, 2, 5, 18, 15, 14, 17, 13, 12, 8, 9, 16

Prikaz po redosledu

Raspodela frekvencijama
Broj ponavljanja u testu LS30 (478 ispitanika)

Raspodela frekvencija
Poligon frekvencija

Raspodela frekvencija
Primer: Visine 66 dečaka (fudbalera) Visine su “organizovane” u 13 razreda (klasnih intervala) “širine” 2 cm

Raspodela frekvencijama

Biće dopunjeno...

Deskriptivna statistika Dragan Mirkov
DRUGI DEO Deskriptivna statistika Dragan Mirkov

Sadržaj Mere centralne tendencije Mere disperzije
Deskriptivna statistika u Excel-u Kriva normalne raspodele Položaj pojedinačnog rezultata u grupi 9/18/2018

Mere centralne tendencije

Mere centralne tendencije
MEDIJANA (Centralna vrednost) MODUS (Najčešća vrednost) SREDNJA VREDNOST (Aritmetička sredina) 9/18/2018

Medijana Podatke poređaj po rastućem redosledu:
Odredi položaj (C) (koji je po redu) centralnog podatka: C = (N+1)/2 za neparan broj podataka na tom (“C-tom”) položaju se nalazi medijana. za paran broj podataka dva su rezutata u sredini pa je medijana srednja vrednost ta dva “centralna” podatka

Medijana (paran broj podataka)
5, , ,42 0, , ,10 0, , ,73 1, , ,40 0,73 + 1,10 MEDIJANA je 0,915 2

Medijana (neparan broj podataka)
5, , ,42 0, , ,10 0,66 0, , , , , , ,40 MEDIJANA je 0,73

Modus Modus je 1.10 Dvostruki modus - 27 & 55 Nema modusa
b c

Aritmetička sredina Zbir svih podataka podeli brojem podataka
x i - “i-ti” podatak, N-ukupan broj podataka

Aritmetička sredina (raspodela podataka prema učestanosti)
Sumu proizvoda učestanosti pojavljivanja i odgovarajućih vrednosti podeli ukupnim brojem podataka x i - “i-ti” podatak, fi -ukupan broj podataka N=∑ fi

Aritmetička sredina (grupna raspodela podataka prema učestanosti)
Sumu proizvoda učestanosti pojavljivanja i srednjih vrednosti odgovarajućeg intervala podeli ukupnim brojem podataka x mid - srednja vrednost “i-tog” intervala fi -ukupan broj podataka N=∑ fi

Zajednička aritmetička sredina
Zbir proizvoda srednjih vrednosti podataka i njihovog broja podeli ukupnim brojem svih podataka Ni x i - proizvod “i-te” srednje vrednosti i broja podataka iz kojeg je ta srednja vrednost izračunata

Aritmetička sredina (raspodela podataka prema učestanosti)
Sumu proizvoda učestanosti pojavljivanja i odgovarajućih vrednosti podeli ukupnim brojem podataka x i - “i-ti” podatak, fi -ukupan broj podataka N=∑ fi

Aritmetička sredina (grupna raspodela podataka prema učestanosti)
Sumu proizvoda učestanosti pojavljivanja i srednjih vrednosti odgovarajućeg intervala podeli ukupnim brojem podataka x mid - srednja vrednost “i-tog” intervala fi -ukupan broj podataka N=∑ fi

Mere disperzije

Opseg (raspon) Opseg (R): Najveća vrednost (H) manje najmanja vrednost (L): * Ukoliko se uračunaju i vrednosti na “krajevima” R = H - L R = H – L+1*

Kvartili KVARTILI Podaci se poređaju od najmanjeg do najvećeg.
Q1 - Određujemo kao medijanu prvih 50% podataka. Q3 - Određujemo kao medijanu drugih 50%podataka.

Kvartili Međukvartilni opseg: I = Q3-Q1

Srednje odstupanje Srednje odstupanje xi - “i-ti” podatak
x – aritmetička sredina N – broj podataka

Varijansa s2 – varijansa s – standardna devijacija xi - “i-ti” podatak
x – aritmetička sredina N – broj podataka

Varijansa (raspodela podataka prema učestanosti)
s2 – varijansa s – standardna devijacija xi - “i-ti” podatak x – aritmetička sredina fi – učestanost “i tog podatka

Standardna devijacija
Standardna devijacija: Kvadratni koren varijanse:

Deskriptivna statistika u Excelu
Može ovako, ako hoćete da računate korak po korak...

Deskriptivna statistika u Excelu

Kriva normalne raspodele

Crtanje standardne krive normalne raspodele u Excelu: normal_distribution/

Neke od mnogobrojnih lekcija na internetu: lesson36.htm cc_distri_normal.html Notes/Lesson431.htm

z vrednost (ili standardna vrednost)
Mere položaja z vrednost (ili standardna vrednost) koliko se standardnih devijacija dati rezultat razlikuje od srednje vrednosti page 85 of text

Mere položaja z vrednost Uzorak x - x z = s

z vrednost Uzorak Mere položaja Populacija x - µ x - x z = z =  s
Z-scores will be used extensively in future chapters, but is appropriate for discussion here as they involve the concepts of mean, standard deviation, and descriptive statistics (in this case, measures of position).

Tumačenje Z vrednosti Z FIGURE 2-16 Neuobičajene Uobičajene
- 3 - 2 - 1 1 2 3 This concept of ‘unusual’ values will be revisited several times during the course, especially in Chapter 7 - Hypothesis Testing. page 86 of text Z

Mere položaja Kvartili, Decili, Percentili

Kvartili Q1, Q2, Q3 25% 25% 25% 25% Q1 Q2 Q3 Emphasize that Q1 separates the data into 25% below the Q1 value and 75% above the Q1 value. Whereas Q3 would separate the data into 75% below the Q3 value and 25% above the Q3 value.

Kvartili Q1 Q2 Q3 Kada se podaci poređaju po rastućem nizu
Kvartili taj niz dele na četiri (prema broju članova) jednakih delova 25% 25% 25% 25% These 5 numbers will be used in this text’s method for depicting boxplots. Q1 Q2 Q3 (minimum) (maksimum) (medijana)

Decili D1, D2, D3, D4, D5, D6, D7, D8, D9 Kada se podaci poređaju po rastućem nizu Kvartili taj niz dele na deset (prema broju članova) jednakih delova

Decili D1, D2, D3, D4, D5, D6, D7, D8, D9 Kada se podaci poređaju po rastućem nizu Kvartili taj niz dele na deset (prema broju članova) jednakih delova 10% D D D D D D D D D9

Percentili 99 Percentila

Deli skup podatak poređanih po rastućem nizu na jednak broj delova
Kvartili, Decili, Percentili Fraktili (Quantiles) Deli skup podatak poređanih po rastućem nizu na jednak broj delova

“Izračunavanje” percentila
Broj podataka manjih od x Percentil podatka x = • 100 Ukupan broj podatataka Formula to find what percentile a particular data value is. Data must be in ascending order. page 87 of text

“Izračunavanje” rezultata Kada je poznat percentil
n Ukupan broj podataka k dati percentil L Položaj na kome se nalazi tražena vrednost Pk Vrednost k-tog percentil L = • n k 100 To find the score that is a specific percentile, first determine the ‘L’ value. Then follow the flow chart on the next slide.

Slajdovi 68 do 83: Chapter 2. Section Triola, Elementary Statistics, Eighth Edition. Copyright Addison Wesley Longman

Poglavlje 6: (od 67 do 85 strane)

TREĆI DEO KORELACIJE

Smisao i princip korelacije
Brojna vrednost (koeficijent) koji predstavlja u kojoj meri su dve varijable međusobno povezane... Koeficijent korelacije Vrednosti od -1 do 1

Smisao i princip korelacije

Izračunavanje korelacionog koeficijenta
Zx i Zy predstavljaju Z vrednosti odgovarajućih varijabli Prvo izračunamo srednje vrednosti standardne devijacije za obe varijable. Zatim svaki pojedinačan rezultat (za obe varijable) pretvorimo u Z vrednost. Pomnožimo odgovarajuće Z vrednosti. Izračunamo sumu svih proizvoda pa je podelimo sa brojem parova. Vidi primer koji sledi...

Da li su i u kojoj meri varijable x i y međusobno povezane ?

U slučaju većeg broja podataka u praksi se najčešće koristi sledeća formula (ko nema računar...):

...Odnosno računar...

Značajnost korelacije
Određen je brojem parova Što je N manje to r mora biti veće da bi korelacija bila značajna (i obrnuto) Značajnost korelacija se određuje uz pomoć tablica ili upotrebom komjuterskih programa:

Korisna Web adresa: Dobar “udžbenik” statistike sa lepim ilustracijama (JAVA applets).

Rang-korelacija Ako su jedna ili obe varijable date u “rangu”
(neki poredak), računa se tzv. rang-korelacija Nije potrebno da varijable budu u linearnom odnosu. Rang korelaciija daje samo približnu Indikaciju “povezanosti” dve varijable

Bivarijantna regresija

Kada je korelacija između dve varijable dovoljno “velika” (visoka), na osnovu rezultata varijable x (nezavisno promenljive) možemo predvideti rezultat varijable y (zavisno promenljive)...

To je od posebnog značaja u slučajevima kada nam je merenje varijable x znatno lakše nego merenje varijable y (Npr. procena indirektne potrošnje kiseonika...).

Multipla regresija Y = a + b1*X1 + b2*X2 + ... + bp*Xp
Ispituje uticaj dve ili više nezavisnih (prediktorskih) promenljivih na zavisno promenljivu... Y = a + b1*X1 + b2*X bp*Xp

Multipla regresija PRIMER*:
Posmatran je uticaj eksplozivne snage (x1) i brzine trčanja (x2) na skok u dalj iz zaleta y (10 studenata Fakulteta za fizičku kulturu...) * Primer preuzet iz: Perić D, Operacionalizacija 2, FINE Graf, 1996

Multipla regresija Y = *X1 – *X2

ČETVRTI DEO TESTIRANJE RAZLIKA

Sadržaj t test ANOVA Neparametrijski testovi

t test (dva nezavisna uzorka)
PRIMER: Upoređene su visine vertikalnog skoka (CMJ) sto studenata Medicnskog fakulteta i sto studenta DIF-a

t test (dva nezavisna uzorka)

t test (dva zavisna uzorka)
PRIMER: Daljina šuta iz mesta u pre i posttestu (18 fudbalera):

t test (dva zavisna uzorka)

Vidi dodatak (IV_deo_dodatak.pdf)
ANOVA Vidi dodatak (IV_deo_dodatak.pdf)

Ostali testovi biće prikazani direktno
(primena statističkog softvera...)... A slajdovi će vremenom biti dopunjavani, popravaljani...

Metode merenja i obrade podataka Dragan Mirkov

Similar presentations

Presentation on theme: "Metode merenja i obrade podataka Dragan Mirkov"— Presentation transcript:

Similar presentations

About project

Feedback

Log in

Auth with social network:

Metode merenja i obrade podataka Dragan Mirkov

Similar presentations

Presentation on theme: "Metode merenja i obrade podataka Dragan Mirkov"— Presentation transcript:

Similar presentations

About project

Feedback