ANalysis Of VAriance (ANOVA)

Slides:



Advertisements
Similar presentations
Dr. AJIT SAHAI Director – Professor Biometrics JIPMER, Pondicherry
Advertisements

ANOVA Two Factor Models Two Factor Models. 2 Factor Experiments Two factors can either independently or together interact to affect the average response.
Design of Experiments and Analysis of Variance
N-way ANOVA. Two-factor ANOVA with equal replications Experimental design: 2  2 (or 2 2 ) factorial with n = 5 replicate Total number of observations:
Statistics for Managers Using Microsoft® Excel 5th Edition
Chapter 11 Analysis of Variance
Statistics for Business and Economics
Statistics for Managers Using Microsoft® Excel 5th Edition
Chapter 14 Conducting & Reading Research Baumgartner et al Chapter 14 Inferential Data Analysis.
Experimental Design Terminology  An Experimental Unit is the entity on which measurement or an observation is made. For example, subjects are experimental.
ANOVA  Used to test difference of means between 3 or more groups. Assumptions: Independent samples Normal distribution Equal Variance.
Copyright ©2011 Pearson Education 11-1 Chapter 11 Analysis of Variance Statistics for Managers using Microsoft Excel 6 th Global Edition.
Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-1 Chapter 10 Analysis of Variance Statistics for Managers Using Microsoft.
Chap 10-1 Analysis of Variance. Chap 10-2 Overview Analysis of Variance (ANOVA) F-test Tukey- Kramer test One-Way ANOVA Two-Way ANOVA Interaction Effects.
Copyright ©2011 Pearson Education, Inc. publishing as Prentice Hall 11-1 Chapter 11 Analysis of Variance Statistics for Managers using Microsoft Excel.
Chapter 12: Analysis of Variance
Statistics for Business and Economics Chapter 8 Design of Experiments and Analysis of Variance.
QNT 531 Advanced Problems in Statistics and Research Methods
1 1 Slide © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole.
© 2003 Prentice-Hall, Inc.Chap 11-1 Analysis of Variance IE 340/440 PROCESS IMPROVEMENT THROUGH PLANNED EXPERIMENTATION Dr. Xueping Li University of Tennessee.
© 2002 Prentice-Hall, Inc.Chap 9-1 Statistics for Managers Using Microsoft Excel 3 rd Edition Chapter 9 Analysis of Variance.
1 1 Slide © 2008 Thomson South-Western. All Rights Reserved Slides by JOHN LOUCKS St. Edward’s University.
CHAPTER 12 Analysis of Variance Tests
Chapter 10 Analysis of Variance.
ANOVA (Analysis of Variance) by Aziza Munir
Chapter 4 analysis of variance (ANOVA). Section 1 the basic idea and condition of application.
ENGR 610 Applied Statistics Fall Week 9
TOPIC 11 Analysis of Variance. Draw Sample Populations μ 1 = μ 2 = μ 3 = μ 4 = ….. μ n Evidence to accept/reject our claim Sample mean each group, grand.
Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-1 Chapter 10 Analysis of Variance Statistics for Managers Using Microsoft.
Inferential Statistics
Chapter 10: Analysis of Variance: Comparing More Than Two Means.
1 ANALYSIS OF VARIANCE (ANOVA) Heibatollah Baghi, and Mastee Badii.
Chapter 11 Analysis of Variance. 11.1: The Completely Randomized Design: One-Way Analysis of Variance vocabulary –completely randomized –groups –factors.
Chapter 4 Analysis of Variance
CHAPTER 10 ANOVA - One way ANOVa.
Chapter 9 More Complicated Experimental Designs. Randomized Block Design (RBD) t > 2 Treatments (groups) to be compared b Blocks of homogeneous units.
Experimental Statistics - week 9
CHAPTER 3 Analysis of Variance (ANOVA) PART 3 = TWO-WAY ANOVA WITH REPLICATION (FACTORIAL EXPERIMENT) MADAM SITI AISYAH ZAKARIA EQT 271 SEM /2015.
ENGR 610 Applied Statistics Fall Week 8 Marshall University CITE Jack Smith.
CHAPTER 3 Analysis of Variance (ANOVA) PART 3 = TWO-WAY ANOVA WITH REPLICATION (FACTORIAL EXPERIMENT)
Chapter 11 Analysis of Variance
Copyright © 2008 by Hawkes Learning Systems/Quant Systems, Inc.
Keller: Stats for Mgmt & Econ, 7th Ed Analysis of Variance
CHAPTER 4 Analysis of Variance (ANOVA)
MADAM SITI AISYAH ZAKARIA
Statistics for Managers Using Microsoft Excel 3rd Edition
Two-Way Analysis of Variance Chapter 11.
Factorial Experiments
ANOVA Econ201 HSTS212.
i) Two way ANOVA without replication
Applied Business Statistics, 7th ed. by Ken Black
Comparing Three or More Means
CHAPTER 4 Analysis of Variance (ANOVA)
Chapter 10: Analysis of Variance: Comparing More Than Two Means
Statistics for Business and Economics (13e)
Post Hoc Tests on One-Way ANOVA
Differences Among Group Means: One-Way Analysis of Variance
More Complicated Experimental Designs
Chapter 11 Analysis of Variance
Other Analysis of Variance Designs
Chapter 11: The ANalysis Of Variance (ANOVA)
Analysis of Variance (ANOVA)
Introduction to ANOVA.
More Complicated Experimental Designs
Analysis of Variance Compare k Quant Populations k ≥ 2
More Complicated Experimental Designs
One way ANOVA One way Analysis of Variance (ANOVA) is used to test the significance difference of mean of one dependent variable across more than two.
Chapter 12 A Priori and Post Hoc Comparisons Multiple t-tests Linear Contrasts Orthogonal Contrasts Trend Analysis Bonferroni t Fisher Least Significance.
Analysis of Variance: repeated measures
Presentation transcript:

ANalysis Of VAriance (ANOVA) آناليز واريانس ANalysis Of VAriance (ANOVA)

Definition Analysis of Variance (ANOVA) a method of testing the equality of three or more population means by analyzing sample variations page 615 of text

آناليز واريانس ANalysis of VAriance (ANOVA) روش درماني I II III 1 4 5 2 8 3 6 مثال : جهت مقايسه اثرسه روش درماني III,II,I روي زمان لخته شدن Clotting time)) پلاسما مطالعه اي انجام شده است. تعداد 12 بيمار انتخاب و بطور كاملا تصادفي به 3 گروه چهار نفره تقسيم شده و هر گروه تحت يكي از روشهاي درماني فوق قرار گرفته است . نتايج (بر حسب دقيقه ) بصورت زير ثبت شده است. I

What will happen if we use multiple t test instead of ANOVA? The rate of error increases exponentially by the number of tests conducted

The calculation of the rate of type I errors is determined by: c = number of t-tests

ميانگين هر سه روش درماني يكسان است آناليز واريانس ANalysis of VAriance (ANOVA) روش درماني I II III 1 4 5 2 8 3 6 مثال : جهت مقايسه اثرسه روش درماني III,II,I روي زمان لخته شدن Clotting time)) پلاسما مطالعه اي انجام شده است. تعداد 12 بيمار انتخاب و بطور كاملا تصادفي به 3 گروه 4 نفره تقسيم شده و هر گروه تحت يكي از روشهاي درماني فوق قرار گرفته است . نتايج (بر حسب دقيقه ) بصورت زير ثبت شده است. ميانگين هر سه روش درماني يكسان است I حداقل دوتا از ميانگينها متفاوت از يكديگر هستند

Assumptions 1. The populations have normal distributions. 2. The populations have the same variance 2 (or standard deviation  ). 3. The samples are independent of each other. 4. The different samples are from populations that are categorized in only one way. page 617 of text The requirements of normality and equal variances are somewhat relaxed, because the methods in this section work reasonably well unless a population has a distribution that is very nonnormal or the population variances differ by large amounts.

Source of variance Within group variance Between group variance Total variance

Total sum of squares 2 2-4=-2 4 3 3-4=-1 1 2 2-4=-2 4 4 4-4=0 0 Raw scores Deviation from grand mean Squared deviation 1 1-4=-3 9 2 2-4=-2 4 3 3-4=-1 1 2 2-4=-2 4 4 4-4=0 0 5 5-4 =1 1 3 3-4=-1 1 4 4-4=0 0 5 5-4=1 1 8 8-4=4 16 5 5-4=1 1 6 6-4=2 4       Grand mean = 4 Sum=0 42 = Total SS

Between sum of squares   Deviations of group means Squared deviation Number in group From grand means Group 1: 2-4=-2 4 4 Group 2: 4-4=0 0 4 Group 3: 6-4=2 4 4 Between sum of squares = (4)(4)+(4)(0)+(4)(4)=32

جدول ANOVA F محاسبه شده نتيجه منبع تغييراتS.O.V بين گروهها مجموع مربعات SS درجه آزادي df ميانگين مربعات F محاسبه شده نتيجه بين گروهها K-1=2 P<0.002 Between groups داخل گروهها N-K=9 Within groups كل N-1=11 ‏Total جدول ANOVA

SPSS output

مقايسات چند گانه Multiple Comparisons مقايسات چند گانه

مقايسات چند گانه آزمون حداقل اختلاف معني دار Least Significant Difference (LSD) مقايسات چند گانه

SE Mean

SPSS output

Homogeneous Subsets

طرحهای آزمايشی Experimental Designs طرح کاملا تصادفی Completely Randomized design طرح بلوکهای کامل تصادفی Complete Randomized Block Design طرح فاکتوريل Factorial Design ساير طرحهای آزمايشی Nested Design, Latin Square Design, ……

مقایسه های چند گانه Multiple Comparisons اگر در تحلیل واریانس فرضیه صفر رد شود، باید بین همه زوج های میانگین ها آزمون هایی انجام شود تا معلوم گردد کدام یک با هم اختلاف معنا دار دارند. با توجه به فرضیات تحلیل واریانس یک طرفه اگر فرضیه H0 رد شود، حداقل دو میانگین با هم اختلاف معنا دار خواهند داشت. 10

مقایسه های چند گانه Multiple Comparisons رایج ترین روش های مقایسه های چند گانه عبارتند از: روش بونفرونی Bonferroni Procedure روش توکی Tukey’s Procedure روش شفه Scheffe’s Procedure روش نیومن-کلز Newman-Keuls Procedure روش دانت Dunnett’s Procedure نکته 1 : روش دانت هنگامی استفاده می شود که یکی از گروه ها، گروه شاهد (Control) باشد. نکته 2 : به کار گیری این روش ها، غالبا به نتایج مشابهی ختم می شود. 11

تحلیل واریانس دو طرفه Two-Way ANOVA تحلیل واریانس دو طرفه هم مانند تحلیل واریانس یک طرفه است، با این تفاوت که به جای میانگین های یک عامل، میانگین های دو عامل با هم مقایسه می شود. اگر با جای یک تحلیل واریانس دو طرفه از تحلیل واریانس یک طرفه استفاده شود، دو اشکال مطرح می شود: 1- خطای آزمون افزایش می یابد. 2- امکان آزمون اثر متقابل دو عامل (Interaction effect) وجود نخواهد داشت. 12

تحلیل واریانس دو طرفه Two-Way ANOVA مثال:به منظور بررسی تاثیر عوامل پرکاری تیروئید و چاقی بر فعالیت انسولین، 14 نفر از زنان با پرکاری تیروئید انتخاب شدند که 6 نفر از آنان دارای اضافه وزن بوده اند. همچنین 19 نفر از زنان داوطلب با تیروئید نرمال بعد از جور شدن (matching) از نظر سن و وزن به عنوان گروه شاهد در نظر گرفته شدند. پرسش های پژوهش عبارتند از: 1- آیا پرکاری تیروئید تاثیری در فعالیت انسولین دارد؟ (اثر عامل اول) 2- آیا چاقی تاثیری در فعالیت انسولین دارد؟ (اثر عامل دوم) 1- آیا پرکاری تیروئید و چاقی تواما تاثیری در فعالیت انسولین دارد؟ (اثر متقابل هردو عامل) 13

تحلیل واریانس دو طرفه Two-Way ANOVA تعداد نمونه، میانگین و انحراف معیار حساسیت انسولین در زنان مورد مطالعه 2↓ 1→ Normal Thyroid Hyperthyroid All Normal Weight N=11 Mean=0.68 SD=0.25 N=8 Mean=0.55 SD=0.26 N=19 Mean=0.63 Overweight Mean=0.47 SD=0.32 N=6 Mean=0.16 SD=0.10 N=14 Mean=0.34 SD=0.29 Mean=0.59 Mean=0.38 SD=0.28 N=33 Mean=0.50 SD=0.30 14

تحلیل واریانس دو طرفه Two-Way ANOVA جدول تحلیل واریانس دوطرفه Source of Variation Sum of Squares df Mean Squares F Ratio P-value A: Hyperthyroid B: Overweight A*B E: Error Total SSA=0.374 SSB=0.711 SSAB=0.06 SSE=1.845 SST=2.916 dfA=1 dfB=1 dfAB=1 dfE=32 MSA= 0.374 MSB= 0.711 MSAB=0.061 MSE= 0.064 F=5.883 F=11.180 F=0.958 P=0.022 P=0.002 P=0.336 15

اثر متقابلInteraction Effect Hyperthyroid Hyperthyroid Normal Insulin Sensitivity Insulin Sensitivity Normal Over Weight Normal Weight Over Weight Normal Weight Insulin Sensitivity Insulin Sensitivity Normal Hyperthyroid Hyperthyroid Normal Over Weight Over Weight Normal Weight Normal Weight 16

تحلیل واریانس n طرفه N-Way ANOVA در حالت کلی که مقایسه میانگین های n عامل در نظر باشد، تحلیل واریانس n طرفه (N-Way ANOVA)خواهیم داشت. حالت هایی که میانگین های دو یا چند عامل بررسی می شوند، طرح عاملی (Factorial Design) نامیده می شود. 17

تحلیل واریانس با اندازه گیری های مکرر Repeated Measurements ANOVA اگر گروه های مورد بررسی مستقل از هم نباشند، از تحلیل واریانس با اندازه گیری های مکرر استفاده می شود. این روش تعمیم آزمون t زوجی است. دو نوع اندازه گیری های مکرر عبارتند از: 1- هنگامی که روش درمان یا موضوع مورد پژوهش (یا به طور کلی Treatment) ثابت بوده اما هر فرد به طور مکرر چند بار مورد مشاهده قرار می گیرد. 2- هنگامی که روش درمان یا موضوع مورد پژوهش متغیر است، یعنی هر فرد نمونه به چند Treatment پاسخ می دهد. 18

تحلیل واریانس با اندازه گیری های مکرر Repeated Measurements ANOVA در این نوع تحلیل واریانس، دو نوع مقایسه یا آزمون انجام می شود: 1- مقایسه روند زمان: آیا تاثیر درمان در طول زمان ثابت است؟ 2- مقایسه بین گروه ها: آیا تاثیر زمان در گروه های مختلف یکسان است؟ در این روش علاوه بر فرض نرمال بودن و یکسان بودن واریانس، فرض دیگری باید برقرار باشد که به آن فرض کرویت (Sphericity) گفته می شود. کنترل فرضیات لازم این روش و محاسبه آماره های آزمونF و مقادیر p به وسیله نرم افزار انجام می شود. 19

تحلیل واریانس ناپارامتری Nonparametric ANOVA در تحلیل واریانس اگر توزیع متغیر پاسخ نرمال نباشد، از تحلیل واریانس ناپارامتری استفاده می شود. این نوع تحلیل واریانس آزمون کروسکال- والیس (Kruskal-Wallis) نام دارد. تحلیل واریانس ناپارامتری در این حالت تعمیم آزمون ناپارامتری من ویتنی است. 20

تحلیل واریانس ناپارامتری Nonparametric ANOVA تحلیل واریانس ناپارامتری برای اندازه گیری های مکرر، آزمون فریدمن (Friedman) نام دارد. در روش ها ی ناپارامتری به جای مقادیر، از رتبه های آنها استفاده شده و به جای میانگین ها، میانه ها مقایسه می شوند. تنظیم جدول تحلیل واریانس ناپارامتری، محاسبه آماره های آزمون F و مقادیرp به کمک نرم افزار انجام می شود. 21