Download presentation
Presentation is loading. Please wait.
1
STATISTIKA Metoda uzoraka
2
Slučajna varijabla i distribucija vjerojatnosti
Statističke zakonitosti se očituju kada je broj mjerenja „dovoljno velik“, jer se tada relativne frekvencije stabiliziraju oko fiksnih brojeva – vjerojatnosti. Pri izgradnji matematičkih modela statističkih fenomena polazi se od pretpostavke da je broj mjerenja beskonačno velik. U modelu se umjesto relativnih frekvencija, veličina ovisnih o broju mjerenja, koriste vjerojatnosti. Stoga se u statističkoj teoriji koriste distribucije vjerojatnosti umjesto distribucija (relativnih) frekvencija, što je činjeno u deskriptivnoj statistici. Numerička veličina čiji oblik distribucije se analizira u deskriptivnoj statistici je statističko obilježje X, a u statističkoj teoriji slučajna varijabla X.
3
Slučajna varijabla i distribucija vjerojatnosti
Slučajna varijabla je kvantitativna veličina, rezultat statističkog pokusa, koja može poprimiti različite vrijednosti. Statistički ili slučajni pokus predstavlja proces promatranja ili prikupljanja podataka koji se može ponavljati u jednakim uvjetima, a rezultat se ne može sa sigurnošću predvidjeti. Vjerojatnost je brojčana mjera nastanka slučajnih (neizvjesnih) događaja. Imaju dvije vrste vjerojatnosti, objektivna i subjektivna vjerojatnost.
4
Slučajna varijabla i distribucija vjerojatnosti
Objektivna vjerojatnost se temelji na slučajnom uzorku koji se može ponavljati u jednakim uvjetima. Postoje dva pristupa utvrđivanja objektivnih vjerojatnosti, klasični pristup ili a priori vjerojatnost i statistička ili a posteriori vjerojatnost. Subjektivna vjerojatnost se temelji na osobnoj procjeni nastupanja slučajnog događaja.
5
Slučajna varijabla i distribucija vjerojatnosti
Slučajna varijabla može biti diskretna i kontinuirana. Diskretna varijabla poprima konačan broj izoliranih (cjelobrojnih) vrijednosti ili prebrojivo mnogo vrijednosti. Kontinuirana (neprekidna) varijabla poprima vrijednosti iz određenog intervala. Broj vrijednosti koje može uzeti kontinuirana varijabla je beskonačan.
6
Slučajna varijabla i distribucija vjerojatnosti
Distribucija vjerojatnosti diskretne slučajne varijable je skup uređenih parova vrijednosti, gdje prvi podatak u paru označava moguće vrijednosti slučajne varijable, a drugi podatak se odnosi na pripadajuću vjerojatnost Svaka distribucija vjerojatnosti diskretne slučajne varijable mora ispunjavati slijedeće uvjete: Vjerojatnosti u distribuciji vjerojatnosti ne mogu biti negativne, Zbroj vjerojatnosti koje pripadaju svim vrijednostima slučajne varijable X mora biti jednak 1.
7
Slučajna varijabla i distribucija vjerojatnosti
Funkcija distribucije pokazuje kolika je vjerojatnost da diskretna slučajna varijabla X poprimi neku određenu vrijednost ili manju od te vrijednosti. Dobiva se kumuliranjem vjerojatnosti iz distribucije vjerojatnosti, slično kao što se kumulativne frekvencije dobivaju postupnim zbrajanjem apsolutnih frekvencija.
8
Slučajna varijabla i distribucija vjerojatnosti
Funkcija distribucije ima sljedeća matematička svojstva: Za bilo koju vrijednost vrijedi; i ; Za vrijedi da je , što znači da je funkcija distribucije monotono neopadajuća funkcija.
9
Slučajna varijabla i distribucija vjerojatnosti
Očekivana vrijednost diskretne slučajne varijable predstavlja ponderiranu aritmetičku sredinu svih mogućih vrijednosti slučajne varijable X, gdje su ponderi odgovarajuće vjerojatnosti u distribuciji vjerojatnosti. Izračunava se pomoću izraza: Očekivana vrijednost slučajne varijable ima ista svojstva kao i aritmetička sredina numeričke varijable.U statističkim istraživanjima pojam očekivane vrijednosti slučajne varijable se poistovjećuje s aritmetičkom sredinom osnovnog skupa .
10
Slučajna varijabla i distribucija vjerojatnosti
Varijanca je mjera disperzije distribucije vjerojatnosti slučajne varijable. Za diskretnu varijablu X varijanca je dana izrazom: Varijanca distribucije vjerojatnosti kao i varijanca distribucije frekvencija izražena je u kvadratnim mjernim jedinicama varijable X. Da bi se disperzija mjerila u mjernim jedinicama varijable X vadi se drugi korijen, tako se dolazi do standardne devijacije slučajne varijable X. Relativna mjera disperzije je koeficijent varijacije, koji se dobiva kao omjer standardne devijacije i očekivane vrijednosti pomnožen sa 100
11
Slučajna varijabla i distribucija vjerojatnosti
Mjera asimetrije distribucije vjerojatnosti je omjer trećeg momenta oko sredine i standardne devijacije podignute na treću potenciju. Mjera zaobljenosti distribucije vjerojatnosti se dobiva kao omjer četvrtog momenta oko sredine i standardne devijacije podignute na četvrtu potenciju.
12
Modeli distribucije vjerojatnosti
Modeli distribucije vjerojatnosti su analitički izrazi kojima se opisuju varijacije slučajne varijable. Prikazuju se pomoću algebarskih izraza (formula) kojima se predstavlja povezanost između vrijednosti slučajne varijable i pripadajućih vjerojatnosti. Modeli distribucije vjerojatnosti se nazivaju teorijskim distribucijama vjerojatnosti Od teorijskih distribucija diskretne slučajne varijable u primijenjenoj statistici najčešće se koriste binomna i Poissonova distribucija.
13
Modeli distribucije vjerojatnosti
Kaže se da diskretna slučajna varijabla X ima binomnu razdiobu (distribuciju) s parametrima r i p i piše se X~B , ako je njezin skup vrijednosti , a pripadne vjerojatnosti mogu se odrediti pomoću formule:
14
Modeli distribucije vjerojatnosti
Binomna distribucija je određena sa dva parametra, a to su broj r koji predstavlja broj pokusa i p – vjerojatnost uspjeha u svakom pokusu. Pokus prema komu je definirana binomna distribucija naziva se Bernoullijev pokus, prema J. Bernoulli ( ) Slučajna varijabla X predstavlja broj uspjeha u nizu od r pokusa. Može uzeti cjelobrojne vrijednosti od nula (nijedan uspjeh u nizu od r pokusa) do r (uspjeh u svakom pokusu).
15
Modeli distribucije vjerojatnosti
Najvažniji pokazatelji oblika binomne distribucije mogu se odrediti pomoću formula: Očekivana vrijednost: Varijanca: Koeficijent asimetrije: Koeficijent zaobljenosti:
16
Modeli distribucije vjerojatnosti
Poissonova distribucija je granični oblik binomne distribucije. Kada se broj pokusa u Bernoullijevu procesu povećava, javlja se problem izračunavanja vjerojatnosti da varijabla X uzme određenu vrijednost prema formuli za binomnu distribuciju. Francuski matematičar S.D. Poisson je godine razvio formulu prema kojoj se sa zadovoljavajućom točnosti može aproksimirati vjerojatnost iz binomne formule. Poissonova formula je:
17
Modeli distribucije vjerojatnosti
Za binomnu distribuciju vjerojatnosti se mogu aproksimirati navedenom formulom ako je vjerojatnost mala i ako je r veliko S obzirom da je p malo, kaže se da se radi o rijetkim događajima. Slučajnu varijablu X se definira kao broj koliko puta se javio neki događaj u jedinici vremena ili prostora.
18
Modeli distribucije vjerojatnosti
Kažemo da slučajna varijabla X ima Poissonovu distribuciju (piše se ~ ) ako je njezin skup vrijednosti , a pripadne vjerojatnosti dane su formulom Poissonova distribucija ima samo jedan parametar, a to je . Brojčano predstavlja prosječan broj pojavljivanja nekog događaja u jedinici prostora ili vremena
19
Modeli distribucije vjerojatnosti
Najvažniji pokazatelji Poissonove distribucije mogu se odrediti pomoću formula: Očekivana vrijednost: Varijanca: Koeficijent asimetrije: Koeficijent zaobljenosti:
20
Distribucija vjerojatnosti kontinuirane slučajne varijable
Distribucija vjerojatnosti kontinuirane slučajne varijable opisuje razdiobu vjerojatnosti na interval vrijednosti slučajne varijable. Kod kontinuirane slučajne varijable broj mogućih vrijednosti je beskonačan, pa nema smisla govoriti o vjerojatnosti da slučajna varijabla X poprimi neku određenu vrijednost . Za kontinuiranu slučajnu varijablu može se odrediti vjerojatnost da ona poprimi vrijednosti iz određenog intervala.
21
Distribucija vjerojatnosti kontinuirane slučajne varijable
Distribucija vjerojatnosti kontinuirane varijable određena je matematičkom funkcijom koja ima slijedeća svojstva: Matematička funkcija kojom je određena distribucija nije nikada negativna, tj. Ukupna površina ispod krivulje navedene funkcije uvijek je jednaka 1,
22
Distribucija vjerojatnosti kontinuirane slučajne varijable
Funkcija distribucije kontinuirane varijable kao i kod diskretne varijable označava vjerojatnost da slučajna varijabla poprimi određenu vrijednost ili manju od te vrijednosti. Izračunava se prema izrazu: Vjerojatnost da slučajna varijabla bude iz intervala može se izračunati pomoću izraza:
23
Distribucija vjerojatnosti kontinuirane slučajne varijable
Očekivana vrijednost se određuje pomoću izraza: Disperzija se mjeri varijancom i standardnom devijacijom kao drugim korijenom iz varijance. Koeficijent asimetrije Koeficijent zaobljenosti
24
Modeli distribucije vjerojatnosti kontinuirane varijable
Najvažniji model teorijske distribucije vjerojatnosti uopće je normalna ili Gausssova distribucija. Značenje ovog oblika distribucije u statističkoj teoriji i statističkim istraživanjima se ogleda u tomu što se mnoge empirijske pojave modeliraju normalnom distribucijom. Normalni raspored je prvi otkrio godine A. de Moivre kao granični oblik binomne distribucije, tj. promatrajući što se događa sa binomnom distribucijom kada broj pokusa raste u beskonačnost. U drugoj polovici XVIII. stoljeća ovaj oblik distribucije je proučavao i P. Laplace. Godine C. Gauss i P. Laplace su potpuno opisali ovaj oblik distribucije i izveli matematičku funkciju normalne distribucije. Ovaj oblik distribucije je poznat kao Gaussova ili Gauss-Laplaceova distribucija.
25
Modeli distribucije vjerojatnosti kontinuirane varijable
Za kontinuiranu slučajnu varijablu X kaže se da ima normalnu distribuciju s parametrima i (piše se X~N ), ako je njezina funkcija vjerojatnosti zadana formulom:
26
Modeli distribucije vjerojatnosti kontinuirane varijable
U navedenoj formuli veličine e i su konstante, što znači da je normalna distribucija određena parametrima - očekivana vrijednost ili aritmetička sredina i očekivana disperzija ili varijanca. Oblik i svojstva normalne distribucije, zbog složenosti njezine funkcije, mogu se bolje uočiti iz grafičkog prikaza.
27
Grafički prikaz normalne distribucije
28
Normalna distribucija
Najvažnija svojstva normalne distribucije su: Normalna kriva je zvonolikog oblika, unimodalna je i simetrična u odnosu na pravac Aritmetička sredina, mod i medijan imaju istu vrijednost. Definirana je od do , asimptotski se približava x-osi, pa je njezin raspon varijacija beskonačan. Relativna mjera asimetrije je nula, a relativna mjera zaobljenosti ima vrijednost tri.
29
Normalna distribucija
Ukupna površina ispod krive je jednaka jedan, kao kod svake funkcije distribucije. Vjerojatnost da slučajna varijabla, koja ima normalan oblik distribucije, poprimi vrijednost iz intervala ( , ) jednaka je: gdje je
30
Metoda uzoraka Metoda uzoraka je dio statistike kojoj je glavni zadatak da na temelju konačnog niza podataka otkriva statističke zakonitosti i pripadne parametre promatranih statističkih fenomena. Metoda uzoraka polazi od proučavanja odnosa između konačnog niza podataka (uzorka) i modela distribucije vjerojatnosti slučajne varijable. Zaključci doneseni na temelju uzorka nemaju apsolutnu sigurnost, već se govori o određenoj pouzdanosti izvedenog zaključka.
31
Metoda uzoraka Osnovne zadaće statističkog zaključivanja pomoću metode uzoraka se odnose na procjenjivanje nepoznatih parametara osnovnog skupa (populacije) i na ispitivanje pretpostavki (testiranje hipoteza) o parametrima. Da bi zaključci o karakteristikama osnovnog skupa doneseni na temelju uzorka bili valjani, uzorak mora biti reprezentativan. Reprezentativnost uzorka se postiže odabirom odgovarajućeg načina izbora elemenata u uzorak.
32
Metoda uzoraka S obzirom na način izbora jedinica, razlikuju se slučajni i namjerni uzorci. Namjerni uzorak se dobiva izborom jedinica za koje istraživač, prema svom osobnom uvjerenju, smatra da su tipične i reprezentativne za dani osnovni skup. Za slučajni uzorak imamo slučajan izbor jedinica, nekom od metoda slučajnog izbora
33
Metoda uzoraka Reprezentativnost uzorka izabranog na temelju prosudbe istraživača zavisi isključivo od njegove osobne prosudbe i stručnosti. U namjerne uzorke pored uzoraka koje istraživač bira isključivo prema subjektivnoj prosudbi, spadaju prigodni i kvotni uzorak. Prigodni uzorak se bira ispitivanjem jednostavno dostupnih članova osnovnog skupa. Kod kvotnog uzorka izbor jedinica određuju istraživači (anketari), ali u sklopu dodijeljene kvote.
34
Metoda uzoraka Reprezentativnost uzorka se postiže slučajnim izborom jedinica. Za slučajne uzorke u statističkoj teoriji su razvijene metode za statističko zaključivanje o osnovnom skupu uz objektivnu procjenu prihvatljivosti takvih zaključaka. Među slučajnim uzorcima najpoznatiji je jednostavan slučajan uzorak, a još se koriste stratificirani uzorak i uzorak skupina.
35
Metoda uzoraka Ako se iz osnovnog skupa veličine N izabire n elemenata u uzorak tako da svaki mogući uzorak ima jednaku vjerojatnost da bude izabran, onda se takav uzorak naziva jednostavan slučajan uzorak. Jednostavan slučajan uzorak može biti uzorak s ponavljanjem ili bez ponavljanja. Izbor jedinica u uzorak iz konačnog skupa provodi se pomoću tablice slučajnih brojeva. Tablica slučajnih brojeva predstavlja niz znamenki (ili skupina znamenki) u kojem svaka znamenka ima jednaku vjerojatnost pojavljivanja.
36
Metoda uzoraka Kod slučajnog izbora jedinica u uzorak može se primijeniti sistemski izbor. Za sistemski izbor mora postojati uređen popis svih statističkih jedinica. U tablici slučajnih brojeva bira se samo početak izbora, a dalje se biraju jedinice prema koraku izbora. Ako se iz skupa od N elemenata bira uzorak veličine n članova, korak izbora predstavlja odnos N/n.
37
Metoda uzoraka Slučajan izbor jedinica u uzorak se koristi kada su jedinice osnovnog skupa relativno homogene s obzirom na karakteristike koje su predmet istraživanja. Ako postoji značajna varijabilnost elemenata statističkog skupa, koristi se stratificirani uzorak. Prvo se osnovni skup podijeli na homogene skupine elemenata koji se nazivaju stratumi. Iz svakog stratuma se slučajnim izborom bira određeni broj jedinica u uzorak, proporcionalno veličini stratuma.
38
Metoda uzoraka Kada je osnovni skup velik i ne raspolaže se popisom svih jedinica, može se koristiti uzorak skupina. Osnovni skup se podijeli na skupine koje na neki način predstavljaju cjeline. Skupine se obično razlikuju po veličini, a sadrže heterogene jedinice čiji varijabilitet je sličan onom u osnovnom skupu. U uzorak se bira određeni broj skupina i to slučajnim izborom.
39
Sampling distribucije
Deskriptivne mjere koje se izračunavaju pomoću vrijednosti obilježja kod svih jedinica osnovnog skupa nazivaju se parametri skupa. Najčešće korišteni parametri su aritmetička sredina , standardna devijacija i proporcija dijela statističkih jedinica koje imaju određeno svojstvo. Deskriptivne mjere koje se izračunavaju pomoću podataka u uzorku se nazivaju statistika uzorka. S obzirom da služe za procjenu parametara osnovnog skupa nazivaju se procjenitelj.
40
Sampling distribucije
Statistika uzorka je varijabla koja se naziva sampling-varijabla. Najznačajnije sampling-varijable su aritmetička sredina uzoraka , standardna devijacija uzoraka (S) i proporcija uzoraka (P). Kod procjene parametara osnovnog skupa pomoću uzorka bitno je poznavanje oblika distribucije vjerojatnosti sampling-varijable ili kraće sampling-distribucije.
41
Sampling distribucije
Za sampling-distribuciju aritmetičkih sredina uzoraka vrijede pravila: Ako je slučajni uzorak veličine n izabran iz normalno distribuiranog osnovnog skupa s aritmetičkom sredinom i standardnom devijacijom , aritmetička sredina uzoraka je slučajna varijabla s normalnim zakonom distribucije i parametrima (očekivana vrijednost) i (standardna devijacija ili standardna greška procjene aritmetičke sredine.
42
Sampling distribucije
Ako je slučajni uzorak dovoljno velik i izabran iz osnovnog skupa bilo kojeg oblika distribucije promatranog obilježja s aritmetičkom sredinom i standardnom devijacijom , aritmetička sredina uzoraka teži normalnom obliku distribucije sa parametrima (očekivana vrijednost) i (standardna devijacija ili standardna greška procjene aritmetičke sredine).
43
Sampling distribucije
Ako se napravi k mogućih uzoraka veličine n iz osnovnog skupa od N elemenata, zatim se izračuna aritmetička sredina za svaki uzorak čije vrijednosti su , onda je aritmetička sredina aritmetičkih sredina svih mogućih uzoraka jednaka aritmetičkoj sredini osnovnog skupa:
44
Sampling distribucije
Za odnos standardne devijacije osnovnog skupa i standardne devijacije sampling-distribucije vrijedi izraz: Navedena relacija o odnosu standardne devijacije sampling-distribucije i standardne devijacije osnovnog skupa vrijedi za beskonačne osnovne skupove i za konačne skupove s ponavljanjem. Izraz za standardnu grešku procjene aritmetičke sredine za konačne skupove je:
45
Sampling distribucije
Drugi važan pokazatelj osnovnog skupa je proporcija elemenata koji imaju određeno svojstvo. Proporcija elemenata osnovnog skupa s određenim svojstvom se označava sa i predstavlja relativnu frekvenciju. Ako se elementi osnovnog skupa razvrstaju na one koji imaju traženo svojstvo i preostale elemente, onda se proporcija izračunava prema izrazu , gdje je N ukupan broj elemenata osnovnog skupa, a M broj elemenata sa zadanim svojstvom.
46
Sampling distribucije
Proporcija osnovnog skupa se procjenjuje pomoću uzorka. Procjenitelj je proporcija uzorka. Proporcije uzoraka se razlikuju i predstavljaju slučajnu varijablu koja se označava sa . Za korištenje proporcije uzorka kao procjenitelja proporcije osnovnog skupa nužno je poznavanje oblika distribucije slučajne varijable
47
Sampling distribucije
Sampling-distribucija proporcija za dovoljno velike uzorke približno je normalnog oblika, s očekivanom vrijednosti koja je jednaka proporciji osnovnog skupa, tj , i standardnom devijacijom Standardna devijacija sampling-distribucije proporcija se određuje pomoću izraza:
48
Sampling distribucije
Sampling-distribuciju proporcija uzorka opravdano je aproksimirati normalnom distribucijom za velike uzorke. Praktično pravilo za definiciju velikog uzorka je ispunjavanje uvjeta: i
49
Procjena parametara osnovnog skupa
Procjenjivanje nepoznatih parametara osnovnog skupa temelji se na podacima koji predstavljaju slučajan uzorak i na izračunu odgovarajuće statistike uzorka ili procjenitelja. Parametri se mogu procijeniti brojem i intervalom. Izračunata vrijednost statistike uzorka je procjena parametra brojem, a procjena intervalom se sastoji u određivanju granica raspona varijacije u kojem se prema nekom kriteriju očekuje da će biti vrijednost nepoznatog parametra.
50
Procjena parametara osnovnog skupa
Interval procjene aritmetičke sredine se određuje kao interval vrijednosti oko aritmetičke sredine uzorka. Širina ovog intervala zavisi od pouzdanosti procjene i oblika sampling distribucije aritmetičkih sredina uzoraka. Sampling-distribucija aritmetičkih sredina uzoraka određene veličine ima normalan oblik.
51
Procjena parametara osnovnog skupa
Standardna greška procjene aritmetičke sredine je funkcija veličine uzorka. Za poznatu vrijednost standardne devijacije osnovnog skupa iznosi Međutim u praksi uglavnom nije poznata standardna devijacija osnovnog skupa, već se ona procjenjuje pomoću standardne devijacije uzorka. Izraz za nepristranu procjenu varijance je:
52
Procjena parametara osnovnog skupa
Procijenjena vrijednost standardne greške je Standardizirana varijabla T ima oblik tzv. Studentove ili T-distribucije sa stupnjeva slobode Za velike uzorke sampling distribucija se može aproksimirati normalnom distribucijom
53
Procjena totala Total T je zbroj vrijednosti numeričke varijable konačnog osnovnog skupa, Total se može prikazati kao umnožak aritmetičke sredine i broja jedinica u statističkom skupu, Postupak procjenjivanja totala osnovnog skupa pomoću uzorka temelji se na istim pravilima kao i procjena aritmetičke sredine. Procjena totala brojem dobiva se množenjem broja jedinica osnovnog skupa i aritmetičke sredine uzorka,
54
Procjena totala Intervalna procjena totala uz pouzdanost se dobiva pomoću izraza: Standardna greška procjene totala se dobiva kao umnožak standardne greške procjene aritmetičke sredine i opsega osnovnog skupa, Za male uzorke interval procjene je
55
Procjena proporcije Proporcija konačnog osnovnog skupa je odnos broja članova skupa koji imaju određeno svojstvo M i ukupnog broja članova skupa N, Proporcija osnovnog skupa na temelju podataka iz uzorka procjenjuje se brojem i intervalom. Procjena brojem se dobiva kao omjer broja statističkih jedinica u uzorku koje imaju traženo svojstvo m i veličine uzorka n,
56
Procjena proporcije Za intervalnu procjenu proporcije nužno je poznavanje oblika distribucije proporcije uzoraka . Sampling distribucija proporcija može se aproksimirati normalnom distribucijom ako je uzorak dovoljno velik. Kao praktično pravilo koristi se da je aproksimacija zadovoljavajuća ako je
57
Procjena proporcije Koristeći svojstva normalne distribucije interval procjene proporcije osnovnog skupa pomoću proporcije uzorka je: Standardna greška proporcije je jednaka:
58
Procjena proporcije Vrijednost standardne greške se ne može izračunati jer nije poznata proporcija osnovnog skupa , pa se vrši njezina procjena na temelju uzorka. Procijenjena standardna greška je: Navedeni izraz vrijedi za uzorke s frakcijom izbora manjom od 5%, a za frakciju izbora veću od 5% koristi se faktor korekcije, pa je izraz za procijenjenu standardnu grešku:
59
Procjena proporcije Zamjenom standardne greške proporcije njezinom procijenjenom vrijednosti dobiva se interval procjene proporcije osnovnog skupa uz pouzdanost Interval je:
60
Procjena ukupnog broja jedinica koje imaju traženo svojstvo
Procjena ukupnog broja jedinica koje imaju traženo svojstvo pomoću proporcije uzorka je Procjena intervala u kojem će se kretati ukupan broj jedinica s traženim svojstvom uz pouzdanost je:
61
Testiranje hipoteza Postupak testiranja hipoteza o vrijednosti nekog parametra osnovnog skupa provodi se prema precizno definiranoj proceduri. Koraci u tom postupku su: formulacija statističke hipoteze; izbor statistike testa i određivanje njezina oblika distribucije; određivanje razine značajnosti testa; definiranje pravila na osnovu kojeg se odlučuje o prihvaćanju ili odbacivanju hipoteze; izbor slučajnog uzorka određene veličine i izračunavanje statistike testa; donošenje odluke o prihvaćanju ili odbacivanju hipoteze.
62
Testiranje hipoteza Statistička hipoteza se uvijek formulira kao nulta i alternativna. Nulta i alternativna hipoteza predstavljaju dvije precizne, međusobno isključive tvrdnje o vrijednosti nekog parametra osnovnog skupa. dvosmjerni test jednosmjerni, test na gornju granicu jednosmjerni, test na donju granicu
63
Testiranje hipoteza Statistika testa ili test-statistika je kriterij na osnovu kojeg se provodi testiranje. Kod testiranja pretpostavki o vrijednosti parametara osnovnog skupa , statistika testa je nepristrana procjena parametra ili neka transformacija te procjene. Statistika testa je slučajna varijabla koja poprima određeni oblik distribucije vjerojatnosti. Za primjer sampling-varijable aritmetičke sredine vrijedi pravilo o normalnom obliku distribucije ~ N,
64
Testiranje hipoteza Njezina standardizirana vrijednost
za velike uzorke ima oblik jedinične normalne distribucije Z ~ N , a za male uzorke standardizirana varijabla ima oblik T-distribucije za stupnjeva slobode.
65
Testiranje hipoteza Kod testiranja pretpostavki o proporciji osnovnog skupa, koristi se sampling-varijabla proporcija i to za velike uzorke kada su ispunjeni uvjeti o približno normalnom obliku distribucije, približno N Njezina standardizirana varijabla aproksimira se jediničnom normalnom distribucijom Z ~ N
66
Testiranje hipoteza Vjerojatnost da se odbaci istinita nulta hipoteza naziva se razina značajnosti testa ili razina signifikantnosti testa i obilježava se sa . Veličina se naziva snaga testa i izračunava se za susjedne vrijednosti testiranog parametra , za sve veće i manje vrijednosti dok postoji preklapanje površina ispod normalne krive.
67
Testiranje hipoteza Kad se definira oblik distribucije statistike testa i odredi razina značajnosti testa, može se odrediti područje prihvaćanja nulte hipoteze. Područje prihvaćanja nulte hipoteze može se odrediti u jedinicama obilježja X (u istim jedinicama je i sampling-varijabla), ili u standardiziranim jedinicama. Kod dvostranih testova o vrijednosti parametra gdje statistika testa ima normalni oblik, kritične granice prihvaćanja nulte hipoteze izražene u jedinicama obilježja i standardnim jedinicama su:
68
Testiranje hipoteza
69
Testiranje hipoteza
70
Testiranje hipoteza Naredni korak kod testiranja hipoteze jest izbor slučajnog uzorka odgovarajuće veličine. Za uzorak se vrše potrebni obračuni i izračunava vrijednost statistike testa. Donošenje odluke - Ako je statistika testa iz područja prihvaćanja nulte hipoteze, nulta hipoteza se prihvaća kao moguća, a alternativna hipoteza se odbacuje. U protivnom, kada je vrijednost statistike testa iz područja odbacivanja hipoteze, prihvatit će se alternativna hipoteza.
71
Testiranje hipoteza o aritmetičkoj sredini osnovnog skupa
Testiranje hipoteze o pretpostavljenoj vrijednosti aritmetičke sredine osnovnog skupa provodi se na osnovu slučajnog uzorka veličine n jedinica. Statistika testa je aritmetička sredina uzoraka koja predstavlja slučajnu varijablu. Sampling-varijable aritmetičkih sredina uzoraka, odnosno njezina standardizirana vrijednost, može imati oblik normalne distribucije ili T-distribucije. U zavisnosti od oblika sampling-distribucije testiranje hipoteza o aritmetičkoj sredini osnovnog skupa provodi se pomoću z-testa ili t-testa. Postupak testiranja hipoteze počinje postavljanjem nulte i alternativne hipoteze.
72
Testiranje hipoteza o aritmetičkoj sredini osnovnog skupa
Postavka hipoteze za dvosmjerni test Postavka hipoteze za jednosmjerni test na gornju granicu Postavka hipoteze za jednosmjerni test na donju granicu
73
Testiranje hipoteza o aritmetičkoj sredini osnovnog skupa
Statistika testa ili test veličina je sampling-varijabla aritmetičkih sredina koja ima normalni zakon distribucije, ~ N , ili standardizirana sampling-varijabla koja ima jedinični normalni oblik distribucije, Z ~ N . Pravilo odlučivanja o prihvaćanju ili odbacivanju nulte hipoteze se postavlja u zavisnosti od oblika hipoteze i razine značajnosti testa .
74
Testiranje hipoteza o aritmetičkoj sredini osnovnog skupa
Pravila odlučivanja kada je područje prihvaćanja nulte hipoteze dano u mjernim jedinicama obilježja su: Kod dvostranog testa nulta hipoteza se prihvaća, na razini značajnosti , ako je aritmetička sredina uzorka iz intervala , gdje je Kod jednostranog testa na gornju granicu nulta hipoteza se prihvaća kada je aritmetička sredina uzorka iz intervala , gdje je Kod jednostranog testa na donju granicu nulta hipoteza se prihvaća kada je aritmetička sredina uzorka iz intervala , gdje je
75
Testiranje hipoteza o aritmetičkoj sredini osnovnog skupa
Pravila odlučivanja o prihvaćanju ili odbacivanju nulte hipoteze kada je područje prihvaćanja dano u standardiziranim jedinicama su: Kod dvostranog testa nulta hipoteza se prihvaća, na razini značajnosti ,kada je empirijski z-omjer po apsolutnoj vrijednosti manji od tablične z vrijednosti za vrijednost funkcije distribucije Nulta hipoteza kod jednostranih testova na gornju granicu se prihvaća kada je Nulta hipoteza kod jednostranih testova na donju granicu se prihvaća kada je .
76
Testiranje hipoteza o proporciji jedinica osnovnog skupa koje imaju određeno svojstvo
Hipoteza o proporciji jedinica osnovnog skupa koje imaju određeno svojstvo se testira na osnovu slučajnog uzorka veličine n statističkih jedinica. Testiranje se provodi uobičajenim postupkom koji počinje postavljanjem hipoteza, nulte i alternativne. Formulacija hipoteza zavisi od oblika testa koji odgovara polaznoj pretpostavci o proporciji osnovnog skupa.
77
Testiranje hipoteza o proporciji jedinica osnovnog skupa koje imaju određeno svojstvo
Dvosmjerni Jednosmjerni, test na gornju granicu Jednosmjerni, test na donju granicu
78
Testiranje hipoteza o proporciji jedinica osnovnog skupa koje imaju određeno svojstvo
Kod testiranja hipoteze o proporciji osnovnog skupa, odgovarajuća statistika testa je proporcija uzorka. Proporcija uzorka je slučajna varijabla čiji oblik distribucije je potrebno poznavati. Kod testiranja hipoteza koristi se standardizirana vrijednost sampling varijable , koja se dobiva pomoću izraza: Statistika Z, pod uvjetom da je istinita, ima jedinični normalni oblik distribucije, ~ N Znači, kada se radi o velikom uzorku, hipoteza o proporciji se testira pomoću Z-testa.
79
Testiranje hipoteza o proporciji jedinica osnovnog skupa koje imaju određeno svojstvo
Postupak testiranja se provodi izborom slučajnog uzorka veličine n statističkih jedinica. Za izabrani uzorak izračunava se proporcija uzorka kao omjer broja jedinica koje imaju određeno svojstvo i veličine uzorka, U narednom koraku se u zavisnosti od prihvaćene razine značajnosti testa određuje područje prihvaćanja nulte hipoteze. Područje prihvaćanja nulte hipoteze je:
80
Testiranje hipoteza o proporciji jedinica osnovnog skupa koje imaju određeno svojstvo
kod dvostranog testa interval , gdje je kod jednostranog testa na gornju granicu interval , gdje je kod jednostranog testa na donju granicu interval , gdje je
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.