第十章 單變量變異數分析 10-1 變異數分析 10-2 單因子變異數分析的設計 10-3 變異數分析的基本假設條件 10-4 單變量變異數分析 10-5 單變量變異數分析範例 10-6 單變量變異數分析範例:One-Way ANOVA 10-7 重複量數Repeated Measures
10-1 變異數分析 變異數分析(Analysis of Variance)一般分為二大類,分別是ANOVA ( Analysis of Variance)和MANOVA(Multivariate Analysis of Variance),我們簡介如下: 單變量變異數分析 (ANOVA), 只有一個依變數(計量),一個或多個的自變數(非計量,名目),寫成數學式如下: Y1 = X1 + X2 + X3+……+Xn (計量) (非計量) MANOVA (多變量變異數分析)有多個依變數(計量),一個或多個的自變數(非計量),寫成數學式如下: Y1+ Y2+……..+ Yn = X1 + X2 + X3+……+Xn (計量) (非計量, 例如:名目)
10-2 單因子變異數分析的設計 自變數只有一個的變異數分析, 稱為單因子變異數分析, 也就是 y1+y2+…= x (y 可以是一個(含)以上, x 只有 1 個)。單因子變異數分析的2種設計方式: 1. 獨立樣本 2. 相依樣本 1.獨立樣本 受測者隨機分派至不同組別,各組別的受測者没有任何關係, 也稱為完全隨機化設計 (1)各組人數相同: HSD 法, Newman-Keals 法 (2)各組人數不同 (或每次比較2個以上平均數時): Scheffe法 2.相依樣本,有二種情形 (1)重複量數:同一組受測者, 重複接受多次(k)的測試以比較 之間的差異 (2)配對組法:選擇一個與依變數有關控制配對條件完全相同, 以比較k組受測者在依變數的差異
10-3 變異數分析的基本假設條件 變異數分析的基本假設條件有常態、線性、變異數同質性。我們介紹如下: 常態:直方圖, 偏度(skewness)和峰度(kcat osis), 檢定, 改正 (非常態可以透過資料轉型來改正) 線性:變數的散布圖, 檢定, 簡單廻歸+ residual 變異數同質性: 1y, 用Levene檢定 >= 2y時, 用Box’s M檢定
10-4 單變量變異數分析 單變量變異數分析(ANOVA)主要是看依變數(y)只有一個,當我們在比較平均數的不同時,若是我們透過自變數(x)將依變數(y)分成兩組來比較時,稱為t檢定,分成三組(含以上)來比較,稱為ANOVA,t檢定也是ANOVA的一種,我們分別介紹如下: t檢定 (Test) t Test 是用來檢定2 個獨立樣本的平均數差異是否達到顯著的水準。 這二個獨立樣本可以透過分組來達成,計算t檢定時,會需要2個變數,依變數(y)為觀察值,自變數x為分組之組別,其資料的排序如下:
檢定2個獨立樣本的平均數是否有差異(達顯著水準)得考慮從2個母體隨機抽樣本後,其平均數u和變異數σ的各種情形,分別有平均數u相同而變異數平方相同或不同時的情形,平均數u不同而變異數平方相同或不同的情形,我們整理如下表:
在計算2個母體的平均數有無差異時,若是母體的變異數為已知,則使用z檢定,一般很少用,在一般情形下,母體的變異數為未知的情形下,我們都會使用獨立樣本的t檢定,若是樣本小,母體不是常態分佈,則會使用無母數分析,我們整理t檢定於2個獨立母體平均數的比較時,使用時機如下表: 大樣本 (n ≥ 30) 變異數σ已知 ---- 使用z檢定 變異數σ 未知 ---- 使用t檢定 小樣本 (n< 30) , 母體常態分配 變異數σ 已知 ---- 使用z檢定 小樣本 (n< 30) , 母體非常態分配 無論變異數已知或未知 – 使用無母數分析
t檢定的程序 我們進行t檢定的目的是要用來拒絕或無法拒絕先前建立的虛無假設 (Null hypothesis),我們整理t檢定的程序如下: 計算t值 t值 = u1 (平均數) - u2 (平均數) / 組的平均數標準差 u1 是第一組的平均數 u2 是第二組的平均數 查t crit標準值 在研究者指定可接受t分配型態 I (type I) 錯誤機率a (例如: 0.05或0.01) 樣本1和樣本2的degree of freedm = (N1+N2) – 2 我們可以透過查表, 得到 t crit標準值
比較t值和t crit標準值 當t值>t crit值時,會拒絕 Null hypothesis (u1 = u2), 也就是u1 ≠ u2,兩群有顯著差異,接著,我們就可以 檢定平均數的大小或高低,來解釋管理上意義 當t值<tcrit值時,不會拒絕 (有些研究者視為接受) Null hypothesis,也就是 u1= u2,兩群蕪顯者差異,我們就 可以解釋管理上的意義。 F檢定 除了t檢定外,我們也常用F值來檢定單變量多組平均數 是否顥著
10-5 單變量變異數分析範例 我們想了解不同年齡層 A組20 ~29歲,B組30 ~39歲,C組40~49歲,對筆記型Bubble喜好程度是否有差異,隨機抽取年齡層各5個人,以1 – 10的分數請他們評分如下:
三種不同年齡層對筆記型電腦的喜好
F,05,2,12 = 3.89 F>F crit, 所以在5%水準下,顯著,拒絕接受Ho 表示三個階層年齡的人對於筆記型電腦的喜好有顯著的不同,這時候,尚需要進一步地檢定,平均數中的u,有幾個相等,有幾個不同或則是將排列大小,例如:本例題中,對於筆記型電腦的喜好程度是 30 ~ 39歲 >20 ~ 29歲>40 ~ 49歲
SPSS實務操作如下: 1. 開啟範例ANOVA.SAV 2. 按Analyze General Linear Model Univariate 3. 開啟Univariate視窗後, 點選得分score 4. 按,將得分score選入依變數Dependent Variable, 再選編碼code 5. 將編碼code選入自變數的固定因子Fixed Factor 6. 按Model模式 7. 按continue, 回到Univariate畫面 8. 按contrast (比對) 9. 按continue, 回到畫面Univariate 10. 按Plots 11. 按continue, 回到Univariate畫面 12. 按Post Hoc, 選取code 13. 按, 將code選入Post Hoc Test for:, 再選取Scheffe, Tukey 和Duncan 14. 按Continue, 回到畫面Univerate 15. 按Options選項, 選取想要顯示的統計量 16. 按Continue, 回到Univariate畫面 17. 按OK, 出現輸出報表
Univariate Analysis of Variance 報表分析結果如下: Univariate Analysis of Variance Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+code Levene’s Test 是用來判定”變異數同質性”的檢定, 我們需要的是不顯著, 才不會違反變異數同質性的條件 我們查看報表結果, F值 = 0.43, Sig顯著的, P值= 0.66 > 0.05, 是不顯著, 代表變異數是同質性, 可以繼續查看結果
Post Hoc Tests code Multiple Comparisons
Post Hoc 檢定, 從多重比較的表中, 可以看出Turkey和Scheffe的檢定結果是一樣的, 都是(I) code 2 和 (J) code 3, 此時(I-J)達正向顯著, 反之, code 3 - code 2時會呈現負向顯著, 代表著code 2 30 ~39歲和code 3 40 ~49歲, 對筆記型電腦的喜好是有顯著差異, 30 ~39歲對於筆記型電腦的平均數高於 40 ~ 49歲對於筆記型電腦的喜好程度 我們整理ANOVA分析的結果如下: 我們經由Levene檢定,結果為不顯著,代表變異數是同質性,經由多重比較後得到 30~39歲和40~49歲,對筆記型電腦的喜好是有顯著的差異,最後再經由敍述性統計分析結果加以判定 30~39歲對於筆記型電腦喜好的平均數高於40~49歲,對於筆記型電腦的喜好程度。
10-6單變量變異數分析範例: One-Way ANOVA 我們在電腦展中,訪問27位人員,經過參觀資訊展後,我們想了解根據適用(Fit)的特性而購買國內品牌,組裝電腦或國外品牌的程度是否有差異? Category 1國內品牌,Category 2組裝電腦,Category 3國外品牌 我們整理根據 適用(Fit)購買國內品牌、組裝電腦或國外品牌電腦的資料如下表:
我們將購買國內品牌、組裝電腦和國外品 牌的評分資料輸入至SPSS。 如下表:
實務操作: 開啟範例檔 ANOVA1. SAV 按Analyze→Compare Means→One-Way ANOVA 開啟One-Way ANOVA 視窗,選fit 入Dependent List,選Category入Factor 按Post Hoc,選Scheffe 和Tukey 按Continue 按Option,選Descriptive 和Homogeneity of variance test 按Continue, 按OK,出現報表結果
我們整理報表結果如下:
變異數分析摘要表有組間(Between Groups)、組內(Within Groups)及全體(Total)三部分。 組間(Between Groups)的離均差平方和(Sum of Squares)=20.222,自由度=2,均方(Mean Square)=10.111,F 值=3.445,顯著性值 p=0.048。 組內(Within Groups) 的離均差平方和(Sum of Squares)=70.444,自由度=24,均方(Mean Square)=2.935 。 全體(Total) 的離均差平方和(Sum of Squares)= 90.667,自由度=26。 對fit (適用) 依變項而言,F 達到顯著水準(F=3.445;p=.048<.05)。因此拒絕虛無假設,接受對立假設,表示不同產品(1 國內品牌,2 組裝電腦,3 國外品牌)的fit (適用)有顯著差異存在,而那些配對組別的差異達到顯著,須要進行事後比較。
Post Hoc Tests 事後比較
事後比較結果,採兩兩配對組別比較。從 Scheffe 方法作事後比較可以看出以適用度而言,國外品牌顯著高於國內品牌,國外品牌與組裝電腦沒有顯著差異,國內品牌與組裝電腦沒有顯著差異。 範例結果整理如下: 1.敘述性統計量
2.變異數分析統計表 *P<.05 事後比較: 事後比較結果,以適用度而言,國外品牌顯著高於國內品牌,國外品牌與組裝電腦沒有顯著差異,國內品牌與組裝電腦沒有顯著差異。
10-7 重複量數Repeated Measures 同一組受測者,重複接受多次(k)的測試以比較之間的差異。 重複量數Repeated Measures 範例: 在學習統計分析的學生中,我們想知道學生在學習前,學習中和學習後的評價情形,分別請15 位學生在學習前,學習中和學習後給予評分如下:
score1學習前、score2學習中、score3學習後
實務操作: 開啟範例檔 ANOVA2. SAV 按Analyze General Linear Model Repeated Measures 開啟Repeated Measures視窗,在Within-Subject Factor Name:輸入factor,Number of Levels:輸入 按Add 按Define 選score1,按,選score2,按,選score3,按 按Options,選factor,按,選Compare main effects,選Descriptive statistics 按Continue,回到Repeated Measures視窗 按OK,出現報表結果
我們整理報表結果如下: Measure: MEASURE_1 score1學習前、score2學習中、score3學習後 Descriptive Statistics敘述性統計量 score1學習前 的平均數=5.93,標準差=1.831。 score2學習中 的平均數=6.53,標準差=1.06。 score3學習後 的平均數=7.33,標準差=1.234。
Multivariate Tests(b) a Exact statistic b Design: Intercept Within Subjects Design: factor 在單因子相依樣本變異數分析中,無解釋意義,此部分的結果可以省略。
Mauchly's Test of Sphericity(b) Measure: MEASURE_1 球形檢定:檢定問卷填答的分數,兩兩成對相減而得到差異值的變異數是否相等,Mauchly‘s W 值需大於0.75,Greenhouse-Geisser 值需大於0.75,Huynh-Feldt 值需大於 0.75,未達顯著水準,表示未違反變異數分析之球形檢定,代表問卷填答的分數,兩兩成對相減而得到差異值的變異數是相等。 本範例的球形檢定Mauchly 檢定值為.822,卡方值等於2.55,df=2,顯著性p=.279>.05,未達顯著水準,應接受虛無假設,表示未違反變異數分析之球形檢定。
Tests of Within-Subjects Effects Measure: MEASURE_1 由於之前球面性檢定結果並未違反球面性假定,直接看「假設為球形」(Sphericity Assumed)之橫列資料,typeIII 之SS=14.8,df=2,MS=7.4,F=4.723,顯著性p=.017<.05,達到.05 顯著水準,表示自變項的效果顯著。
Tests of Between-Subjects Effects Measure: MEASURE_1 Transformed Variable: Average 填答問卷者間效果的檢定值 (Tests of Between-Subjects Effects ) 即相依樣本中,區塊(Block)間的差異,包括的離均差平方和=40.133、自由度=14、均方值=2.867。
Estimated Marginal Means factor Estimates Measure: MEASURE_1 估計邊緣平均數,其內容包括各水準的平均數、平均數的估計標準誤、平均數95%的信賴區間。
Pairwise Comparisons Measure: MEASURE_1 Based on estimated marginal means * The mean difference is significant at the .05 level. a Adjustment for multiple comparisons: Least Significant Difference(equivalent to no adjustments). 星號(*)代表平均數差異值(Mean Difference)達到.05 顯著水準。 相依樣本的事後比較: 由上表中我們可以發現:學習後之評價 (M=7.333)顯著的高於學習前之評價 (M=5.933),學習後之評價與學習中之評價沒有顯著差異,學習中之評價與學習前之評價沒有顯著差異。
範例結果整理如下: 敘述性統計量 變異數分析統計表 **P<.01 相依樣本的事後比較: 由上表中我們可以發現:學習後之評價(M=7.333)顯著的高於學習前之評 價(M=5.933),學習後之評價與學習中之評價沒有顯著差異,學習中之評 價與學習前之評價沒有顯著差異。