第二章 統計檢定 由資料統計值觀察到的現象,必須驗證,這就是統計中的假說檢定,藉由統計的科學方法,得到合理的評估。 第二章 統計檢定 第一節 基本說明 由資料統計值觀察到的現象,必須驗證,這就是統計中的假說檢定,藉由統計的科學方法,得到合理的評估。 例:台灣股市平均而言,第一季的平均報酬為最高,從統計理論的觀點,單純就平均報酬本身的大小來比較是不嚴謹的,較穩健的作法,是要建立假說,並運用統計方法加以檢定。 計量_2_test
若按季來看,各季的報酬率報、標準差並不一致。 十年台指報酬率結果 10年平均季報酬為1.89%,報酬率不高。 季標準差為18.8%,顯示台灣股市波動非常大。 若按季來看,各季的報酬率報、標準差並不一致。 N Mean Std Dev Minimum Maximum 40 0.0189318 0.1879646 -0.2740134 0.6858029 可由 excel 得到 計量_2_test
近十年台股大盤各季季報酬,那一季投資較好? 第一季 第二季 第三季 第四季 1991 0.2439 0.0594 -0.1344 -0.0505 1992 0.0137 0.0475 -0.1953 -0.0674 1993 0.4347 -0.1821 -0.0294 0.6858 1994 -0.1726 0.1312 0.1880 -0.0117 1995 -0.0670 -0.1917 -0.0503 0.0199 1996 -0.0036 0.2672 0.0024 0.0470 1997 0.1969 0.1020 -0.0335 -0.0616 1998 0.1081 -0.1354 -0.1426 -0.0820 1999 0.1407 0.2213 -0.1023 0.1379 2000 0.1477 -0.1743 -0.2740 -0.1807 平均數 .1042 .0050 -.0772 .0437 標準差 .1721 .1739 .1258 .2411 計量_2_test
十年台指各季報酬率結果 (sas 報表) ------------------------------------------ quarter1=1 ------------------------------------------- The MEANS Procedure Analysis Variable : return1 N Mean Std Dev Minimum Maximum 10 0.1042043 0.1721342 -0.1726660 0.4347432 ------------------------------------------ quarter1=2 ------------------------------------------- 10 0.0050176 0.1739437 -0.1917688 0.2672536 ------------------------------------------ quarter1=3 ------------------------------------------- 10 -0.0771558 0.1258225 -0.2740134 0.1880303 ------------------------------------------ quarter1=4 ------------------------------------------- 10 0.0436611 0.2411414 -0.1807399 0.6858029 計量_2_test
平均季報酬率為:1>4>2>3;投資風險所代表的標準差則為:4>2>1>3。與一般高風險高報酬的想法頗為吻合。 因此只以報酬平均來分析哪一季的投資較好,基本上不符合財務學理,因為高風險通常伴隨著高報酬。故從統計學上來看,只看平均報酬是有謬誤的,較嚴謹的方法是建立假說並運用統計方法加以檢定,看其是否具有統計上的顯著性。 計量_2_test
第二節 假說檢定 2.1.1 抽樣誤差 實際母體 推論 估計之母體 第二節 假說檢定 2.1.1 抽樣誤差 實際母體 樣 本 推論 估計之母體 統計推論必產生差異,稱為抽樣誤差;抽樣誤差的大小與樣本數、推論方法等有關,依據抽樣分配來估計。 例: 在 95%的信心水準下,抽樣錯誤差為正負3.1個百分點。 在α=0.05,支持率 22% 與 24% 在統計上差異不顯著。 計量_2_test
2.1.2 估計 點估計 分類資料:以樣本比例估計母體比例 數量資料:以樣本平均數估計母體平均數、 以樣本標準差估計標準差 估計之精確度 計量_2_test
2. 在 95% 的信心水準下,抽樣錯誤差為正負3.1個百分點: 資料支持的比例 = 24%,則估計支持率在 20.9% 到 27.1% 區間估計 以一區間估計參數可能落入的範圍。 例: 1. Gain mean = 20.06 , s.e. = 2.25 以 95% 的信心水準估計平均利潤 = 20.02 ± (2.78)(2.25) 2. 在 95% 的信心水準下,抽樣錯誤差為正負3.1個百分點: 資料支持的比例 = 24%,則估計支持率在 20.9% 到 27.1% 之間。 計量_2_test
2.1.3 檢定 檢定:將一研究主題作成假說(Hypothesis),根據資料來判斷是否接受此假說,或,將觀察到的現象作成假說,根據資料來驗証此假說。 Null hypothesis & Alternative hypothesis 計量_2_test
型Ⅰ錯誤 vs. 型Ⅱ錯誤 不論檢定後做的結論為何,都可能產生錯誤 事實 H0事實上為真 H1事實上為真 結論為H0 結論正確 型Ⅱ錯誤(此機率設為β) 結論為H1 型Ⅰ錯誤(此機率設為α) 註:在結論為 H1 時,犯錯的最大機率為α 計量_2_test
骰子10次,得到8次的6點,這是機運或是假骰子? 觀念: 骰子10次,得到8次的6點,這是機運或是假骰子? 設立虛無假說為:此骰子是一均勻骰子 如果是均勻骰子,計算得到超過 8 次 6 點的機率是 0.000019,即根據資料算出 p-值 = 0.000019 是均勻骰子的機率小於 0.000019 判斷此骰子顯然不是一均勻骰子。 計量_2_test
檢定的顯著p-值 不顯著的情況 顯著的情況 計量_2_test
在H0為真的情況下,計算出,相對於H1,資料落點的機率,此機率稱為 p-值 p-值 < α,結論為 H1,即研究主題顯著 (significant)。 p-值 大時,結論為資料不足以証實研究的主題。 主題不顯著。 檢定法 選擇適當的檢定量,依據檢定量的分布計算出p-值, 最後做出結論。 計量_2_test
實作:選擇適當的方法,利用統計軟體得到 p-值,做出結論 檢定步驟 敘述假說。 依據資料條件確定檢定方法。 找出檢定量及抽樣分布。 計算檢定量的值,及 p-值。 針對研究主題作決策。(顯著或不顯著) 實作:選擇適當的方法,利用統計軟體得到 p-值,做出結論 計量_2_test
100件記錄得到平均壽命為71.8年,假設母體σ= 8.9,是否表示平均壽命超過70歲? (α= 0.05) 例 解: H0 : μ= 70 , HA : μ>70 計量_2_test
理論上,對一常態資料,樣本平均數是一常態分布,樣本變異數屬於 χ2 分布。 常用於檢定的分布 理論上,對一常態資料,樣本平均數是一常態分布,樣本變異數屬於 χ2 分布。 由此推導出 t-分布與 F-分布,它們是統計推論上常用之分布。 用於平均數檢定或 兩組資料比較 用於兩組變異數比較、 多組資料比較、或變異數分析 計量_2_test
2.2 二組資料比較 二組資料比較例題 : 第一季與第三季的報酬率是否不同?(二獨立樣本) 電子股與金融股的報酬率是否不同?(二配對樣本) 2.2 二組資料比較 二組資料比較例題 : 第一季與第三季的報酬率是否不同?(二獨立樣本) 電子股與金融股的報酬率是否不同?(二配對樣本) 分析的方法分別為 : ( H0 : μ1 = μ2 ) 二獨立樣本 – 二組變異數相等時用 pooled t-test 二組變異數不等時用 Satterthwaite test (近似法) 二配對樣本 -- paired t-test ( H0 : μD = μ1 - μ2 = 0 ) 注意:上述檢定法使用的條件是資料為常態分布資料 計量_2_test
C.I. for μ1 –μ2: Pooled t-test 之原理 假設變異數相等 Test H0 : μ1 =μ2 vs. H1: μ1 ≠μ2 C.I. for μ1 –μ2: 計量_2_test
Satterthwaite test 之原理 不需假設變異數相等 Test H0 : μ1 =μ2 vs. H1: μ1 ≠μ2 p-value = 2P(Tν>|t|) C.I. for μ1 –μ2: 計量_2_test
檢定σ12與σ22是否相等,採用F 檢定。 H0: σ12 = σ22 , 何時可假設變異數相等? 當 p-值 > 0.05時,可假設二組變異數相等。 計量_2_test
【二組獨立資料比較的實作過程】 1、預覽資料 (作統計值與比較圖) (i) 資料是否有特殊分佈? (ii) 分散度是否有明顯差異? (iii) 均值是否有明顯差異? 2、資料是否可假設來自常態母體? (i) Normality test , (ii) 非常態時檢視 Normal probability plot 3、決定是否可假設二組的變異數相等。 用 F-test , p-value > 0.05時,設變異數相等 4、選擇平均數差異檢定法 Test H0: μ1 =μ2, 變異數相等時,用 pooled t-test 變異數不等時,用 Satterthwaite test 5、必要時計算差異的信賴區間 6、作結論 計量_2_test
由pooled t-test 得到p-value=0.015<α=0.05,故拒絕H0。(見下列sas報表) 例:檢定第一、第三季報酬是否不同 由pooled t-test 得到p-value=0.015<α=0.05,故拒絕H0。(見下列sas報表) 第一季的報酬率顯著異於第三季的報酬率。 Statistics Lower CL Upper CL Lower CL Upper CL Variable quarter1 N Mean Mean Mean Std Dev Std Dev Std Dev Std Err return1 1 10 -0.019 0.1042 0.2273 0.1184 0.1721 0.3142 0.0544 return1 3 10 -0.167 -0.077 0.0129 0.0865 0.1258 0.2297 0.0398 return1 Diff (1-2) 0.0397 0.1814 0.323 0.1139 0.1508 0.223 0.0674 T-Tests Variable Method Variances DF t Value Pr > |t| return1 Pooled Equal 18 2.69 0.0150 return1 Satterthwaite Unequal 16.5 2.69 0.0158 Equality of Variances Variable Method Num DF Den DF F Value Pr > F return1 Folded F 9 9 1.87 0.3642 計量_2_test
由F-test, p-value=0.033<α=0.05,故拒絕H0。 (見下列sas報表) 例:檢定第四季變異數是否高於第三季的 由F-test, p-value=0.033<α=0.05,故拒絕H0。 (見下列sas報表) 台股第四季的投資風險(標準差)顯著大於第三季。 Statistics Lower CL Upper CL Lower CL Upper CL Variable quarter1 N Mean Mean Mean Std Dev Std Dev Std Dev Std Err return1 3 10 -0.167 -0.077 0.0129 0.0865 0.1258 0.2297 0.0398 return1 4 10 -0.129 0.0437 0.2162 0.1659 0.2411 0.4402 0.0763 return1 Diff (1-2) -0.302 -0.121 0.0599 0.1453 0.1923 0.2844 0.086 T-Tests Variable Method Variances DF t Value Pr > |t| return1 Pooled Equal 18 -1.40 0.1771 return1 Satterthwaite Unequal 13.6 -1.40 0.1826 Equality of Variances Variable Method Num DF Den DF F Value Pr > F return1 Folded F 9 9 3.67 0.0660 計量_2_test
例:檢定第四季平均報酬率是否與第三季的不同 因為二季報酬率的變異數有顯著差異,使用Satterthwaite test, 得到 p-value=0.1826 >α=0.05 ,故不拒絕H0。 台股第四季的平均報酬率和第三季的無明顯差異。 說明:由於三、四季的變異數有顯著差異,當我們在檢定平均數差異時,無法得到顯著性;所以在實務問題上,二組的比較不該只比較平均數。 計量_2_test
二配對資料比較:輸入二欄資料→ 工具 →資料分析 → t-檢定:成對母體平均數差異檢定 excel 註:若工具中未出現 ”資料分析”,請在增益集中勾選 VBA分析工具箱 計量_2_test
二配對資料比較 excel 報表 計量_2_test
二組母體平均數差異檢定 1. 輸入資料 2. 工具 →資料分析 → F-檢定:兩個常態母體變異數差異的檢定 excel 二組母體平均數差異檢定 1. 輸入資料 2. 工具 →資料分析 → F-檢定:兩個常態母體變異數差異的檢定 工具 →資料分析 → 由F-檢定結果擇一 檢定之p-值>0.025時, t-檢定:母體平均數差異檢定,異數數相等 檢定之p-值<0.025時, t-檢定:母體平均數差異檢定,異數數不相等 計量_2_test
二獨立資料比較 excel 報表一 計量_2_test
二獨立資料比較 excel 報表二 計量_2_test
比較兩成對樣本: 1、輸入資料:將二組資料分別輸入二行 2、Analysis → ANOVA → t Test SAS guide 比較兩成對樣本: 1、輸入資料:將二組資料分別輸入二行 2、Analysis → ANOVA → t Test t Test Type:ˇ paired Column: paired variables Analysis: Plots:不需勾選 Titles: 計量_2_test
比較兩非成對樣本: 1、輸入資料:組別佔一行,資料佔一行 2、Analysis → ANOVA → t Test SAS guide 比較兩非成對樣本: 1、輸入資料:組別佔一行,資料佔一行 2、Analysis → ANOVA → t Test t Test Type:ˇ Two sample Column:Group by 組別,Analysis var. 測量資料 Analysis: Plots:平均數比較圖ˇbox and whisker 或 ˇ means Titles: 計量_2_test
Analysis → Descriptive → Distribution Analysis Columns :選擇欲檢定的變數 SAS guide 常態性檢定 輸入資料 Analysis → Descriptive → Distribution Analysis Columns :選擇欲檢定的變數 Distributions:ˇNormal Plots:ˇ Probability plot 計量_2_test