Jednorozmerný a dvojrozmerný chí-kvadrát test (krížové tabuľky)

Slides:



Advertisements
Similar presentations
Contingency Table Analysis Mary Whiteside, Ph.D..
Advertisements

What is Chi-Square? Used to examine differences in the distributions of nominal data A mathematical comparison between expected frequencies and observed.
CHI-SQUARE(X2) DISTRIBUTION
Lecture (11,12) Parameter Estimation of PDF and Fitting a Distribution Function.
Contingency Tables Chapters Seven, Sixteen, and Eighteen Chapter Seven –Definition of Contingency Tables –Basic Statistics –SPSS program (Crosstabulation)
Hypothesis: It is an assumption of population parameter ( mean, proportion, variance) There are two types of hypothesis : 1) Simple hypothesis :A statistical.
Inference about the Difference Between the
Hypothesis Testing IV Chi Square.
Statistical Inference for Frequency Data Chapter 16.
Chapter 13: The Chi-Square Test
PSY 340 Statistics for the Social Sciences Chi-Squared Test of Independence Statistics for the Social Sciences Psychology 340 Spring 2010.
1 Nominal Data Greg C Elvers. 2 Parametric Statistics The inferential statistics that we have discussed, such as t and ANOVA, are parametric statistics.
AM Recitation 2/10/11.
For testing significance of patterns in qualitative data Test statistic is based on counts that represent the number of items that fall in each category.
Chi-square (χ 2 ) Fenster Chi-Square Chi-Square χ 2 Chi-Square χ 2 Tests of Statistical Significance for Nominal Level Data (Note: can also be used for.
Chapter 9: Non-parametric Tests n Parametric vs Non-parametric n Chi-Square –1 way –2 way.
Social Science Research Design and Statistics, 2/e Alfred P. Rovai, Jason D. Baker, and Michael K. Ponton Pearson Chi-Square Contingency Table Analysis.
1 In this case, each element of a population is assigned to one and only one of several classes or categories. Chapter 11 – Test of Independence - Hypothesis.
AP STATS EXAM REVIEW Chapter 8 Chapter 13 and 14 Chapter 11 and 12 Chapter 9 and Chapter 10 Chapter 7.
Nonparametric Tests: Chi Square   Lesson 16. Parametric vs. Nonparametric Tests n Parametric hypothesis test about population parameter (  or  2.
Fitting probability models to frequency data. Review - proportions Data: discrete nominal variable with two states (“success” and “failure”) You can do.
HYPOTHESIS TESTING BETWEEN TWO OR MORE CATEGORICAL VARIABLES The Chi-Square Distribution and Test for Independence.
Section 10.2 Independence. Section 10.2 Objectives Use a chi-square distribution to test whether two variables are independent Use a contingency table.
Chapter 11: Chi-Square  Chi-Square as a Statistical Test  Statistical Independence  Hypothesis Testing with Chi-Square The Assumptions Stating the Research.
July, 2000Guang Jin Statistics in Applied Science and Technology Chapter 12. The Chi-Square Test.
Copyright © 2013, 2009, and 2007, Pearson Education, Inc. Chapter 11 Analyzing the Association Between Categorical Variables Section 11.2 Testing Categorical.
Chapter 14 – 1 Chi-Square Chi-Square as a Statistical Test Statistical Independence Hypothesis Testing with Chi-Square The Assumptions Stating the Research.
1 1 Slide © 2008 Thomson South-Western. All Rights Reserved Chapter 12 Tests of Goodness of Fit and Independence n Goodness of Fit Test: A Multinomial.
Chapter 13 Understanding research results: statistical inference.
Chapter 11: Categorical Data n Chi-square goodness of fit test allows us to examine a single distribution of a categorical variable in a population. n.
Section 10.2 Objectives Use a contingency table to find expected frequencies Use a chi-square distribution to test whether two variables are independent.
Chi Square Chi square is employed to test the difference between an actual sample and another hypothetical or previously established distribution such.
I. ANOVA revisited & reviewed
Chapter 11 – Test of Independence - Hypothesis Test for Proportions of a Multinomial Population In this case, each element of a population is assigned.
Chapter 9: Non-parametric Tests
Analyzing dichotomous dummy variables
The binomial applied: absolute and relative risks, chi-square
Active Learning Lecture Slides
Hypothesis testing. Chi-square test
John Loucks St. Edward’s University . SLIDES . BY.
Qualitative data – tests of association
Fakulta matematiky, fyziky a informatiky UK
Data Analysis for Two-Way Tables
Statistics for Business and Economics (13e)
Jednorozmerný a dvojrozmerný chí-kvadrát test (krížové tabuľky)
SA3202 Statistical Methods for Social Sciences
Integritné obmedzenia v SQL
Goodness-of-Fit Tests
The Chi-Square Distribution and Test for Independence
ROC - Receiver Operating Characteristic
Testing for Independence
Chi Square Two-way Tables
Inferential Statistics and Probability a Holistic Approach
AP Stats Check In Where we’ve been… Chapter 7…Chapter 8…
Econ 3790: Business and Economics Statistics
Hypothesis testing. Chi-square test
If we can reduce our desire,
Chapter 10 Analyzing the Association Between Categorical Variables
Statistical Inference
STAT 312 Introduction Z-Tests and Confidence Intervals for a
Lecture 41 Section 14.1 – 14.3 Wed, Nov 14, 2007
Analyzing the Association Between Categorical Variables
Minhaz Fahim Zibran 31st October 2007
Exact Test Fisher’s Statistics
UNIT V CHISQUARE DISTRIBUTION
Applied Statistics Using SPSS
S.M.JOSHI COLLEGE, HADAPSAR
Applied Statistics Using SPSS
Chapter Outline Goodness of Fit test Test of Independence.
Hypothesis Testing - Chi Square
Presentation transcript:

Jednorozmerný a dvojrozmerný chí-kvadrát test (krížové tabuľky) Iveta Waczulíková Peter Slezák Fakulta matematiky, fyziky a informatiky UK Lekárska fakulta UK

Frekvenčná tabuľka Jednoduchá (frekvenčná) tabuľka zodpovedá jednostupňovému triedeniu. Obsahuje triedne početnosti podľa kategórií (tried) jednej premennej. Zostrojenie frekvenčných tabuliek z údajov sa nazýva tabelácia. Prezentácia: koláčový graf, stĺpcový graf, kumulatívny stĺpcový graf Príklad vzdelanie:

Kedy použiť jednorozmerný chí2 test dobrej zhody? “Goodness of fit” Keď je premenná kategorická (nominálna alebo ordinálna) Testuje jeden typ otázky (napr. otázka na pacienta): Čo považujete za najväčší nedostatok v zdravotnej starostlivosti? (Pearsonov) chí2 test dobrej zhody testuje nulovú štatistickú hypotézu, ktorá tvrdí, že aktuálne (pozorované) početnosti v jednotlivých kategóriách (presnejšie hodnotách/úrovniach kategorickej premennej) sa rovnajú očakávaným (teoretickým) početnostiam (univariačná analýza toho, či distribúcia frekvencií “fituje” predpokladané populačné proporcie).

Štatistická otázka Predpokladáme, že v odpovediach budú v jednotlivých stanovených triedach (hodnotách kategórie) rozdiely Príklad dotazník: 43% odpovedí “kvalita” 34% odpovedí “dostupnosť” 23% odpovedí “neviem” Ale sú tieto rozdiely štatisticky signifikantné? Inými slovami, nakoľko “veľký” je veľký rozdiel medzi týmito percentami? Výskumná otázka na vzorke 105 pacientov: Sú jednotlivé typy odpovedí pacientmi ROVNAKO PREFEROVANÉ? (excel Chi2 príklady, list 1). Poznámka: triedy odpovedí sú pre naše potreby zjednodušené – v takejto podobe nevyhovujú kritériám pre „closed-ended question“

Testovanie hypotézy Ho: p1 = p2 = p3 Ha: p1 = p2 = p3 to znamená, že ak sú preferencie rovnaké, očakávané hodnoty by mali byť 35/105 resp. 33,3% pre každú úroveň kategorickej premennej (typ odpovede) Ha: p1 = p2 = p3 Uvažujeme chybu typu I. druhu maximálne vo výške 5% (alfa = 0,05)

Podmienky použitia testu dobrej zhody Analýza nízkych očakávaných početností je kontroverzná (Koehler a Larnz 1980). Použitie aproximačného chí2 testu vyžaduje splnenie všetkých (!) nasledujúcich podmienok: Celkový počet pozorovaných početností n ≥ 10 Počet tried/úrovní kategórie c ≥ 3 Všetky očakávané hodnoty Eij ≥ 0,25

Excel pre test dobrej zhody Pripraviť si frekvenčnú tabuľku aktuálnych a očakávaných početností Bunka (fx) > kategória štatistické (funkcie) > CHITEST Zadať stĺpec aktuálnych počtov a stĺpec očakávaných počtov Existuje rozdiel medzi tým, koľko pacientov skutočne preferovalo daný typ odpovede (úroveň kategorickej premennej) a tým, koľko sme očakávali, pri rovnakej preferencii (35)? Je tento rozdiel dosť veľký na to, aby sme urobili štatistický záver (inference), alebo mohol byť tento rozdiel spôsobený náhodnou chybou výberu (random sampling error)? Testová štatistika: chí2 = 6,34, df = 3(triedy)-1 =2 Výstup je hodnota pravdepodobnosti P=0,042

Záver príkladu Pre danú hodnotu chí2 = 6,34, a df = 2, pri alfa = 0,05, by mala byť pravdepodobnosť získania takejto hodnoty chí2 rovná alebo menšia než 0,05 na to, aby sme to považovali za významný rozdiel (significant difference). p = 0,042 .... aký je záver? Zamietame nulovú hypotézu, že pozorované rozdiely v preferenciách mohli byť spôsobené náhodnou chybou a prijímame alternatívnu hypotézu, že medzi preferenciami (triedy kategórie=typ odpovede) je signifikantný rozdiel. Preferencie sú rôzne.

Príklad krvné skupiny-pacienti: Lekár má podozrenie na neštandardné rozdelenie krvných skupín u pacientov, ktorí majú pooperačné komplikácie. Percentuálny výskyt krvných skupín u nás: krvná skupina A: 43 %, 0: 42 %, B: 11 %, AB: 4 %. Porovnaním populačného rozdelenia krvných skupín s rozdelením u náhodnej vzorky pacientov možno podozrenie lekára potvrdiť ("pacientské" dáta nefitujú dobre populačné proporcie... významne sa od nich líšia ) alebo vyvrátiť (dáta pacientov nedokazujú, že je podozrenie oprávnené, pretože pozorované dáta fitujú populačné údaje (t.j. sú na ne dobre alebo aspoň akceptovateľne "napasované"). (Chi2 príklady, list 2).

Kedy použiť dvojrozmerný chí2 test nezávislosti Kedy použiť dvojrozmerný chí2 test nezávislosti? “The r (rows) by c (columns) chi-square tests of independence of the categories in a table ” Keď analyzujeme v skutočnosti dve premenné, skupinovú (grupujúcu) premennú a akúkoľvek premennú, v ktorej chceme dané podskupiny porovnať (bivariačná analýza) Keď obe premenné sú kategorické, t.j., nominálne alebo ordinálne. Keď testujeme, či existuje medzi týmito premennými vzťah (sú asociované) alebo nie (sú nezávislé). (Pearsonov) chí2 test nezávislosti predstavuje rozšírenie chí2 testu dobrej zhody na analýzu kontingenčnej tabuľky. Každá zo štyroch (obecne r krát c) buniek predstavuje jednoznačnú kombináciu špecifických hodnôt (tzv. kategórií) krížovo tabelovaných premenných. Príklad krvné skupiny-miesta: Výskum chce dokázať hypotézu, že populačné rozdelenie krvných skupín u osôb závisí od geografickej lokalizácie. Porovnáme dáta na výberoch z dvoch miest EU. (Chi2 príklady, list 2).

Podmienky použitia testu nezávislosti Náhodný výber Každé pozorovanie je klasifikované do jednej bunky tabuľky r x c (resp. 2 x 2) Analýza nízkych očakávaných početností je kontroverzná. Použitie aproximačného chí2 testu pre tabuľku 2 x 2 vyžaduje splnenie nasledujúcich podmienok: Celkový počet pozorovaných početností n ≥ 20 Všetky očakávané hodnoty Eij ≥ 5 Nulová hypotéza je nezávislosť riadkových a stĺpcových kategórií (tried). Tests of independence of the categories in a table are the chi-square test, the G-square (likelihood-ratio chi-square) test and the generalised Fisher exact (Fisher-Freeman-Halton) test. All three tests indicate the degree of independence between the variables that make up the table.   The generalised Fisher exact test is difficult to compute (Mehta and Patel, 1983, 1986a); it may take a long time and it may not be computed for the table that you enter. If the Fisher exact method cannot be computed practically then a hybrid method based upon Cochrane rules is used (Mehta and Patel, 1986b); this may also fail with large tables and/or numbers. The Fisher-Freeman-Halton result is quoted with just one P value as it is implicitly two-sided. Relating the Fisher-Freeman-Halton statistic to the Pearson Chi-square statistic: The null hypothesis is independence between row and column categories. Let t denote a table from the set of all tables with the same row and column margins. Let D(t) be the measure of discrepancy. The exact two sided P value = P [D(t) >= D(t observed)] = sum of hypergeometric probabilities of those tables where D(t) is larger than or equal to the observed table. In large samples the distribution of D(t) conditional on fixed row and column margins converges to the chi-square distribution with (r-1)(c-1) degrees of freedom. The G-square statistic is less reliable than the chi-square statistic when you have small numbers. In general, you should use the chi-square statistic if the Fisher exact test is not computable. Yates' continuity correction improves the approximation of the discrete sample chi-square statistic to a continuous chi-square distribution (Armitage and Berry, 1994): If you consult a statistician then it would be useful to provide the G-square statistic also.  These tests of independence are suitable for nominal data. If your data are ordinal then you should use the more powerful tests for trend (Armitage and Berry, 1994; Agresti, 2002, 1996).

Ďalšie chí2 testy Pre párové proporcie použijeme McNemarov chí2 test Mantel-Haenszelov test pre stratifikované 2 x 2 tabuľky pri fixných efektoch (napr. chceme porovnať výsledky klinických štúdií rovnakého typu ale publikovaných rôznymi autormi/tímami) Zovšeobecnený (generalised) Cochran-Mantel-Haenszelov test – pre stratifikované r x c tabuľky Three generalised tests for association between row and column classes are offered for stratified r by c tables produced in the crosstabs function when you specify a third (stratum, controlling for) classifier (Agresti, 2002; Landis et al., 1978, 1979).   The first test (ordinal association) assumes that there is meaningful order to both the columns and rows of each r by c table. The second test (ordinal columns vs. nominal rows) assumes that there is meaningful order in the columns of each r by c table. The third test (nominal association) does not assume any order in rows or columns; it provides a general test of association between the row and column classifiers.

Exaktné testy Binomické rozdelenie využívame pre testovanie pravdepodobnosti, že „r“ pozorovaní z celkového počtu „n“ (r/n) prevýši očakávanú hodnotu Pre 0,5 (t.j. šanca 50:50) použijeme znamienkový test (Exact sign test). Nulová hypotéza znie: pozorovaná proporcia nie je odlišná od 0,5. Pre očakávanú hodnotu inú než 0,5 použijeme binomický test – inak tiež test jednej proporcie (The single proportion test (binomial test)). Fisherov exaktný test použijeme, ak v tabuľke 2 x 2: je ktorákoľvek očakávaná hodnota menšia ako 1 alebo 20% všetkých očakávaných hodnôt je menších alebo rovných 5. Podmienka: riadkové a stĺpcové súčty sú fixné (často kontroverzné) Zovšeobecnený Fisherov test (The generalised Fisher exact test - The Fisher-Freeman-Halton test) použijeme pre tabuľku r x c. Pre párované proporcie použijeme Liddellov test

Príklad pre chí2 test nezávislosti (Chi2 príklady, list 3). Výskumná otázka: Sú preferencie odpovedí pacientov rovnaké u mužov aj u žien? Inými slovami, sú preferencie závislé na pohlaví? Otázka v dotazníku: Čo považujete za najväčší nedostatok v zdravotnej starostlivosti? Kvalitu, dostupnosť alebo je odpoveď „neviem“? (zvoľte jednu odpoveď) Druhá kategória je Pohlavie: Muž Žena Vzorka: 105 náhodne vybraných pacientov po hospitalizácii v zvolenom zdravotníckom zariadení

Excel pre test nezávislosti Pripraviť si frekvenčnú tabuľku aktuálnych početností typov odpovedí pre obe pohlavia. Zistiť súčty pre riadky a stĺpce. Dopočítať očakávané početnosti pre obe pohlavia podľa vzorca (excelovský príklad, list 3). kde: Aij = aktuálna početnost v i-tom riadku a j-tom stĺpci Eij = očakávaná početnost v i-tom riadku a j-tom stĺpci r = počet riadkov c = počet stĺpcov Yatesova korekcia na spojitosť : odpočíta 0,5 z absolútnej hodnoty každej dvojice v čitateli ( ‌‌Aij- Eij‌ -0,5)2 Kritické hodnoty štatistiky chí2 určujeme z tabuliek rozdelenia chí2, čo je spojité rozdelenie. Vzhľadom na to, že pracujeme s celočíselnými hodnotami, rozdelenie pravdepodobnosti štatistiky chí2 je v skutočnosti diskrétne a kritické hodnoty za určitých okolností nebudú správne. Tento efekt je dôležitý predovšetkým pre df =1, pri vyšších počtoch stupňov voľnosti je zanedbateľný.

Bunka (fx) > kategória štatistické (funkcie) > CHITEST Zadať pole aktuálnych počtov a pole očakávaných počtov Existuje rozdiel medzi mužmi a ženami v skutočnom (aktuálnom) rozložení preferencií (úrovní kategorickej premennej) a tým, koľko by sme očakávali pri podobných preferenciách? Je tento rozdiel dosť veľký na to, aby sme urobili štatistický záver o závislosti preferencií na pohlaví, alebo mohol byť tento rozdiel spôsobený náhodnou chybou? Testová štatistika: chí2 = 4,85, df = (3-1)*(2-1) =2 Výstup je hodnota pravdepodobnosti P=0,088

Nominálna nezávislosť: Chi2 = 4,851, DF = 2, P = 0,0884 Fisher-Freeman-Haltonov exaktný test: P = 0,0884

Testovanie hypotézy Ho: Muži a ženy majú rovnaké rozdelenie „preferencií“ t.j. početností odpovedí v kategórii „Hodnotenie nedostatkov v zdravotnej starostlivosti“. Ha: Muži a ženy nemajú rovnaké rozdelenie „preferencií“ t.j. početností odpovedí v kategórii „Hodnotenie nedostatkov v zdravotnej starostlivosti“. Testujeme na hladine významnosti alfa = 0,01

Interpretácia výsledku testovania Pozrieť na hodnotu pravdepodobnosti, ktorá je „prepojená“ s hodnotou testovej štatistiky (chí2 = 4,85) p = 0,088 Záver: Zamietame alebo akceptujeme nulovú hypotézu na hladine významnosti alfa = 0,01? Akceptujeme nulovú hypotézu a zamietame alternatívnu. Medzi mužmi a ženami nie je významný rozdiel v termínoch preferencií t.j. početností odpovedí v kategórii „Hodnotenie nedostatkov v zdravotnej starostlivosti“. Stačí? Nestačí! (Štatistická významnosť nie je klinická/praktická významnosť). Interpretujeme ďalej...preštudovaním konkrétnych početností v bunkách tabuľky. Rozhodnite, ktorou cestou „čítate“ tabuľku (podľa usporiadania oboch kategórií: stĺpce vs. riadky) a popíšte charakter rozdielov medzi podskupinami (pohlaviami). Všímajte si bunky s veľkými rozdielmi medzi aktuálnymi (pozorovanými) a očakávanými hodnotami (percentami).

Interpretácia výsledku z popisnej štatistiky Záver začíname “spomedzi…/z” a doplníme názov „riadkovej“ kategorickej premennej (typ odpovede) alebo stĺpcovej (pohlavie). Keď čítame po riadkoch, čítame pozdĺž “vnútri-riadkovej” premennej. Keď čítame po stĺpcoch, čítame nadol “vnútri-stĺpcovej“ premennej. Záver: zdá sa, že muži najviac volili „dostupnosť“ a ženy „kvalitu“ (Čítanie nadol stĺpcami) Ďalej, z pacientov, ktorí preferovali kvalitu bolo 40% mužov a 60% žien. Z pacientov, ktorí preferovali dostupnosť bolo 61% mužov a 39% žien. Nerozhodnutých mužov bolo viac (27%) ako nerozhodnutých žien (18%) (Čítanie pozdĺž riadkov) Celkovo sme náhodným výberom pacientov „zabezpečili“ približne rovnaké zastúpenie žien (47,6%) aj mužov (52,4) (pozn. možno overiť znamienkovým testom )