Jednorozmerný a dvojrozmerný chí-kvadrát test (krížové tabuľky)

Slides:



Advertisements
Similar presentations
Contingency Table Analysis Mary Whiteside, Ph.D..
Advertisements

Lecture (11,12) Parameter Estimation of PDF and Fitting a Distribution Function.
Contingency Tables Chapters Seven, Sixteen, and Eighteen Chapter Seven –Definition of Contingency Tables –Basic Statistics –SPSS program (Crosstabulation)
Statistical Inference for Frequency Data Chapter 16.
Chapter 13: The Chi-Square Test
PSY 340 Statistics for the Social Sciences Chi-Squared Test of Independence Statistics for the Social Sciences Psychology 340 Spring 2010.
CJ 526 Statistical Analysis in Criminal Justice
Copyright (c) 2004 Brooks/Cole, a division of Thomson Learning, Inc. Chapter 14 Goodness-of-Fit Tests and Categorical Data Analysis.
1 Nominal Data Greg C Elvers. 2 Parametric Statistics The inferential statistics that we have discussed, such as t and ANOVA, are parametric statistics.
AM Recitation 2/10/11.
Chapter 9: Non-parametric Tests n Parametric vs Non-parametric n Chi-Square –1 way –2 way.
Social Science Research Design and Statistics, 2/e Alfred P. Rovai, Jason D. Baker, and Michael K. Ponton Pearson Chi-Square Contingency Table Analysis.
Nonparametric Tests: Chi Square   Lesson 16. Parametric vs. Nonparametric Tests n Parametric hypothesis test about population parameter (  or  2.
HYPOTHESIS TESTING BETWEEN TWO OR MORE CATEGORICAL VARIABLES The Chi-Square Distribution and Test for Independence.
Section 10.2 Independence. Section 10.2 Objectives Use a chi-square distribution to test whether two variables are independent Use a contingency table.
Chapter 11: Chi-Square  Chi-Square as a Statistical Test  Statistical Independence  Hypothesis Testing with Chi-Square The Assumptions Stating the Research.
Chapter 14 – 1 Chi-Square Chi-Square as a Statistical Test Statistical Independence Hypothesis Testing with Chi-Square The Assumptions Stating the Research.
1 1 Slide © 2008 Thomson South-Western. All Rights Reserved Chapter 12 Tests of Goodness of Fit and Independence n Goodness of Fit Test: A Multinomial.
Chapter 11: Categorical Data n Chi-square goodness of fit test allows us to examine a single distribution of a categorical variable in a population. n.
Section 10.2 Objectives Use a contingency table to find expected frequencies Use a chi-square distribution to test whether two variables are independent.
Dostupné z Metodického portálu ISSN: , financovaného z ESF a státního rozpočtu ČR. Provozováno Výzkumným ústavem pedagogickým v Praze.
I. ANOVA revisited & reviewed
The Chi Square Test A statistical method used to determine goodness of fit Chi-square requires no assumptions about the shape of the population distribution.
Chapter 11 – Test of Independence - Hypothesis Test for Proportions of a Multinomial Population In this case, each element of a population is assigned.
Chapter 9: Non-parametric Tests
The binomial applied: absolute and relative risks, chi-square
John Loucks St. Edward’s University . SLIDES . BY.
Qualitative data – tests of association
Jednorozmerný a dvojrozmerný chí-kvadrát test (krížové tabuľky)
Fakulta matematiky, fyziky a informatiky UK
Hodnotenie dopadov na rovnosť v zdraví použitie HEAT nástroja v praxi.
RIZIKÁ PRI REALIZOVANÍ PROJEKTU
DATABÁZOVÉ JAZYKY.
Yulia Šurinová "There is always a better way; it should be found."
Makrá v PowerPointe Joshua Lajčiak.
Vytvorenie bázy športových motívov, priestorov a hodnôt ich expozície.
Človek vo sfére peňazí ročník.
Statistics for Business and Economics (13e)
Regresia a korelácia Iveta Waczulíková Peter Slezák
7. prednáška 3. november 2003.
Mgr. Valentína Gunišová
Využitie IKT na hodinách anglického jazyka
Ako sme pristúpili k citlivej téme migrácie v našej škole
Skrutkovica na rotačnej ploche
Vlastnosti kvantitatívnych dát
The Chi-Square Distribution and Test for Independence
Ako manažovať smartfóny z cloudu TechDays East 2014
Dvojrozmerné polia Kód ITMS projektu:
PRACOVNÉ PROSTREDIE PRI PRÁCI S POČÍTAČMI Z HĽADISKA ERGONÓMIE
Vysoko subjektívna prezentácia o používaní podcastov
Chi Square Two-way Tables
Heuristické optimalizačné procesy
Econ 3790: Business and Economics Statistics
Seminár č. 9 - osnova Metódy sieťového plánovania a riadenia:
Hypothesis testing. Chi-square test
Interaktívna kniha a e-learningový systém pre deti - Opera nehryzie
8. prednáška 10. november 2003.
If we can reduce our desire,
Statistical Inference
STAT 312 Introduction Z-Tests and Confidence Intervals for a
Lecture 41 Section 14.1 – 14.3 Wed, Nov 14, 2007
Analyzing the Association Between Categorical Variables
Minhaz Fahim Zibran 31st October 2007
Exact Test Fisher’s Statistics
UNIT V CHISQUARE DISTRIBUTION
Applied Statistics Using SPSS
S.M.JOSHI COLLEGE, HADAPSAR
Applied Statistics Using SPSS
Chapter Outline Goodness of Fit test Test of Independence.
Hypothesis Testing - Chi Square
Presentation transcript:

Jednorozmerný a dvojrozmerný chí-kvadrát test (krížové tabuľky) Iveta Waczulíková Peter Slezák Fakulta matematiky, fyziky a informatiky UK Ústav normálnej a patologickej fyziológie SAV

Frekvenčná tabuľka Jednoduchá (frekvenčná) tabuľka zodpovedá jednostupňovému triedeniu. Obsahuje triedne početnosti podľa kategórií (tried) jednej premennej. Zostrojenie frekvenčných tabuliek z údajov sa nazýva tabelácia. Prezentácia: koláčový graf, stĺpcový graf, kumulatívny stĺpcový graf

Kedy použiť jednorozmerný chí2 test dobrej zhody? “Goodness of fit” Keď je premenná kategorická (nominálna alebo ordinálna) Testuje jeden typ otázky (napr. otázka na pacienta): Čo považujete za najväčší nedostatok v zdravotnej starostlivosti? (Pearsonov) chí2 test dobrej zhody testuje nulovú štatistickú hypotézu, ktorá tvrdí, že aktuálne (pozorované) početnosti v jednotlivých kategóriách (presnejšie hodnotách/úrovniach kategorickej premennej) sa rovnajú očakávaným (teoretickým) početnostiam (univariačná analýza toho, či distribúcia frekvencií “fituje” predpokladané populačné proporcie).

Štatistická otázka Predpokladáme, že v odpovediach budú v jednotlivých stanovených triedach (hodnotách kategórie) rozdiely 43% odpovedí “kvalita” 34% odpovedí “dostupnosť” 23% odpovedí “neviem” Ale sú tieto rozdiely štatisticky signifikantné? Inými slovami, nakoľko “veľký” je veľký rozdiel medzi týmito percentami? Výskumná otázka na vzorke 105 pacientov: Sú jednotlivé typy odpovedí pacientmi ROVNAKO PREFEROVANÉ? (excelovský príklad, list 1). Poznámka: triedy odpovedí sú pre naše potreby zjednodušené – v takejto podobe nevyhovujú kritériám pre „closed-ended question“

Testovanie hypotézy Ho: p1 = p2 = p3 Ha: p1 = p2 = p3 to znamená, že ak sú preferencie rovnaké, očakávané hodnoty by mali byť 35/105 resp. 33,3% pre každú úroveň kategorickej premennej (typ odpovede) Ha: p1 = p2 = p3 Uvažujeme chybu typu I. druhu maximálne vo výške 5% (alfa = 0,05)

Podmienky použitia testu dobrej zhody Analýza nízkych očakávaných početností je kontroverzná (Koehler a Larnz 1980). Použitie aproximačného chí2 testu vyžaduje splnenie všetkých (!) nasledujúcich podmienok: Celkový počet pozorovaných početností n ≥ 10 Počet tried/úrovní kategórie c ≥ 3 Všetky očakávané hodnoty Eij ≥ 0,25

Excel pre test dobrej zhody Pripraviť si frekvenčnú tabuľku aktuálnych a očakávaných početností Bunka (fx) > kategória štatistické (funkcie) > CHITEST Zadať stĺpec aktuálnych počtov a stĺpec očakávaných počtov Existuje rozdiel medzi tým, koľko pacientov skutočne preferovalo daný typ odpovede (úroveň kategorickej premennej) a tým, koľko sme očakávali, pri rovnakej preferencii (35)? Je tento rozdiel dosť veľký na to, aby sme urobili štatistický záver (inference), alebo mohol byť tento rozdiel spôsobený náhodnou chybou výberu (random sampling error)? Testová štatistika: chí2 = 6,34, df = 3(triedy)-1 =2 Výstup je hodnota pravdepodobnosti P=0,042

Záver príkladu Pre danú hodnotu chí2 = 6,34, a df = 2, pri alfa = 0,05, by mala byť pravdepodobnosť získania takejto hodnoty chí2 rovná alebo menšia než 0,05 na to, aby sme to považovali za významný rozdiel (significant difference). p = 0,042 .... aký je záver? Zamietame nulovú hypotézu, že pozorované rozdiely v preferenciách mohli byť spôsobené náhodnou chybou a prijímame alternatívnu hypotézu, že medzi preferenciami (triedy kategórie=typ odpovede) je signifikantný rozdiel. Preferencie sú rôzne.

Kedy použiť dvojrozmerný chí2 test nezávislosti Kedy použiť dvojrozmerný chí2 test nezávislosti? “The r (rows) by c (columns) chi-square tests of independence of the categories in a table ” Keď analyzujeme v skutočnosti dve premenné, skupinovú (grupujúcu) premennú a akúkoľvek premennú, v ktorej chceme dané podskupiny porovnať (bivariačná analýza) Keď obe premenné sú kategorické, t.j., nominálne alebo ordinálne. Keď testujeme, či existuje medzi týmito premennými vzťah (sú asociované) alebo nie (sú nezávislé). (Pearsonov) chí2 test nezávislosti predstavuje rozšírenie chí2 testu dobrej zhody na analýzu kontingenčnej tabuľky. Príklad: Lekár má podozrenie na neštandardné rozdelenie krvných skupín u pacientov, ktorí majú pooperačné komplikácie. Percentuálny výskyt krvných skupín u nás: krvná skupina A: 43 %, 0: 42 %, B: 11 %, AB: 4 %. Porovnaním populačného rozdelenia krvných skupín s rozdelením u náhodnej vzorky pacientov možno podozrenie lekára potvrdiť (excelovský príklad, list 2).

Podmienky použitia testu nezávislosti Náhodný výber Každé pozorovanie je klasifikované do jednej bunky tabuľky r x c (resp. 2 x 2) Analýza nízkych očakávaných početností je kontroverzná. Použitie aproximačného chí2 testu pre tabuľku 2 x 2 vyžaduje splnenie nasledujúcich podmienok: Celkový počet pozorovaných početností n ≥ 20 Všetky očakávané hodnoty Eij ≥ 5 Nulová hypotéza je nezávislosť riadkových a stĺpcových kategórií (tried). Tests of independence of the categories in a table are the chi-square test, the G-square (likelihood-ratio chi-square) test and the generalised Fisher exact (Fisher-Freeman-Halton) test. All three tests indicate the degree of independence between the variables that make up the table.   The generalised Fisher exact test is difficult to compute (Mehta and Patel, 1983, 1986a); it may take a long time and it may not be computed for the table that you enter. If the Fisher exact method cannot be computed practically then a hybrid method based upon Cochrane rules is used (Mehta and Patel, 1986b); this may also fail with large tables and/or numbers. The Fisher-Freeman-Halton result is quoted with just one P value as it is implicitly two-sided. Relating the Fisher-Freeman-Halton statistic to the Pearson Chi-square statistic: The null hypothesis is independence between row and column categories. Let t denote a table from the set of all tables with the same row and column margins. Let D(t) be the measure of discrepancy. The exact two sided P value = P [D(t) >= D(t observed)] = sum of hypergeometric probabilities of those tables where D(t) is larger than or equal to the observed table. In large samples the distribution of D(t) conditional on fixed row and column margins converges to the chi-square distribution with (r-1)(c-1) degrees of freedom. The G-square statistic is less reliable than the chi-square statistic when you have small numbers. In general, you should use the chi-square statistic if the Fisher exact test is not computable. Yates' continuity correction improves the approximation of the discrete sample chi-square statistic to a continuous chi-square distribution (Armitage and Berry, 1994): If you consult a statistician then it would be useful to provide the G-square statistic also.  These tests of independence are suitable for nominal data. If your data are ordinal then you should use the more powerful tests for trend (Armitage and Berry, 1994; Agresti, 2002, 1996).

Ďalšie chí2 testy Pre párové proporcie použijeme McNemarov chí2 test Mantel-Haenszelov test pre stratifikované 2 x 2 tabuľky pri fixných efektoch Zovšeobecnený (generalised) Cochran-Mantel-Haenszelov test – pre stratifikované r x c tabuľky Three generalised tests for association between row and column classes are offered for stratified r by c tables produced in the crosstabs function when you specify a third (stratum, controlling for) classifier (Agresti, 2002; Landis et al., 1978, 1979).   The first test (ordinal association) assumes that there is meaningful order to both the columns and rows of each r by c table. The second test (ordinal columns vs. nominal rows) assumes that there is meaningful order in the columns of each r by c table. The third test (nominal association) does not assume any order in rows or columns; it provides a general test of association between the row and column classifiers.

Exaktné testy Binomické rozdelenie využívame pre testovanie pravdepodobnosti, že „r“ pozorovaní z celkového počtu „n“ (r/n) prevýši očakávanú hodnotu Pre 0,5 (t.j. šanca 50:50) použijeme znamienkový test (Exact sign test). Nulová hypotéza znie: pozorovaná proporcia nie je odlišná od 0,5. Pre očakávanú hodnotu inú než 0,5 použijeme binomický test – inak tiež test jednej proporcie (The single proportion test (binomial test)). Fisherov exaktný test použijeme, ak v tabuľke 2 x 2: keď je ktorákoľvek očakávaná hodnota menšia ako 1 alebo 20% všetkých očakávaných hodnôt je menších alebo rovných 5. Podmienka: riadkové a stĺpcové súčty sú fixné (často kontroverzné) Zovšeobecnený Fisherov test (The generalised Fisher exact test - The Fisher-Freeman-Halton test) použijeme pre tabuľku r x c. Pre párované proporcie použijeme Liddellov test

Príklad pre chí2 test nezávislosti Výskumná otázka: Sú preferencie odpovedí pacientov rovnaké u mužov aj u žien? Inými slovami, sú preferencie závislé na pohlaví? Otázka v dotazníku: Čo považujete za najväčší nedostatok v zdravotnej starostlivosti? Kvalitu, dostupnosť alebo je odpoveď „neviem“? (zvoľte jednu odpoveď) Druhá kategória je Pohlavie: Muž Žena Vzorka: 105 náhodne vybraných pacientov po hospitalizácii v zvolenom zdravotníckom zariadení

Excel pre test nezávislosti Pripraviť si frekvenčnú tabuľku aktuálnych početností typov odpovedí pre obe pohlavia. Zistiť súčty pre riadky a stĺpce. Dopočítať očakávané početnosti pre obe pohlavia podľa vzorca (excelovský príklad, list 3). kde: Aij = aktuálna početnost v i-tom riadku a j-tom stĺpci Eij = očakávaná početnost v i-tom riadku a j-tom stĺpci r = počet riadkov c = počet stĺpcov Yatesova korekcia na spojitosť: odpočíta 0,5 z absolútnej hodnoty každej dvojice v čitateli ( ‌‌Aij- Eij‌ )-0,5)2

Bunka (fx) > kategória štatistické (funkcie) > CHITEST Zadať pole aktuálnych počtov a pole očakávaných počtov Existuje rozdiel medzi mužmi a ženami v skutočnom (aktuálnom) rozložení preferencií (úrovní kategorickej premennej) a tým, koľko by sme očakávali pri podobných preferenciách? Je tento rozdiel dosť veľký na to, aby sme urobili štatistický záver o závislosti preferencií na pohlaví, alebo mohol byť tento rozdiel spôsobený náhodnou chybou? Testová štatistika: chí2 = 4,85, df = (3-1)*(2-1) =2 Výstup je hodnota pravdepodobnosti P=0,088

Nominálna nezávislosť: Chi2 = 4,851, DF = 2, P = 0,0884 Fisher-Freeman-Haltonov exaktný test: P = 0,0884

Testovanie hypotézy Ho: Muži a ženy majú rovnaké rozdelenie „preferencií“ t.j. početností odpovedí v kategórii „Hodnotenie nedostatkov v zdravotnej starostlivosti“. Ha: Muži a ženy nemajú rovnaké rozdelenie „preferencií“ t.j. početností odpovedí v kategórii „Hodnotenie nedostatkov v zdravotnej starostlivosti“. Testujeme na hladine významnosti alfa = 0,01

Interpretácia výsledku testovania Pozrieť na hodnotu pravdepodobnosti, ktorá je „prepojená“ s hodnotou testovej štatistiky (chí2 = 4,85) p = 0,088 Záver: Zamietame alebo akceptujeme nulovú hypotézu na hladine významnosti alfa = 0,01? Akceptujeme nulovú hypotézu a zamietame alternatívnu. Medzi mužmi a ženami nie je významný rozdiel v termínoch preferencií t.j. početností odpovedí v kategórii „Hodnotenie nedostatkov v zdravotnej starostlivosti“. Stačí? Nestačí! (Štatistická významnosť nie je klinická/praktická významnosť). Interpretujeme ďalej...preštudovaním konkrétnych početností v bunkách tabuľky. Rozhodnite, ktorou cestou „čítate“ tabuľku (podľa usporiadania oboch kategórií: stĺpce vs. riadky) a popíšte charakter rozdielov medzi podskupinami (pohlaviami). Všímajte si bunky s veľkými rozdielmi medzi aktuálnymi (pozorovanými) a očakávanými hodnotami (percentami).

Interpretácia výsledku z popisnej štatistiky Záver začíname “spomedzi…/z” a doplníme názov „riadkovej“ kategorickej premennej (typ odpovede) alebo stĺpcovej (pohlavie). Keď čítame po riadkoch, čítame pozdĺž “vnútri-riadkovej” premennej. Keď čítame po stĺpcoch, čítame nadol “vnútri-stĺpcovej“ premennej. Záver: zdá sa, že muži najviac volili „dostupnosť“ a ženy „kvalitu“ (Čítanie nadol stĺpcami) Ďalej, z pacientov, ktorí preferovali kvalitu bolo 40% mužov a 60% žien. Z pacientov, ktorí preferovali dostupnosť bolo 61% mužov a 39% žien. Nerozhodnutých mužov bolo viac (27%) ako nerozhodnutých žien (18%) (Čítanie pozdĺž riadkov) Celkovo sme náhodným výberom pacientov „zabezpečili“ približne rovnaké zastúpenie žien (47,6%) aj mužov (52,4) (pozn. možno overiť znamienkovým testom )