Download presentation
1
第二章 統計檢定 由資料統計值觀察到的現象,必須驗證,這就是統計中的假說檢定,藉由統計的科學方法,得到合理的評估。
第二章 統計檢定 第一節 基本說明 由資料統計值觀察到的現象,必須驗證,這就是統計中的假說檢定,藉由統計的科學方法,得到合理的評估。 例:台灣股市平均而言,第一季的平均報酬為最高,從統計理論的觀點,單純就平均報酬本身的大小來比較是不嚴謹的,較穩健的作法,是要建立假說,並運用統計方法加以檢定。 計量_2_test
2
若按季來看,各季的報酬率報、標準差並不一致。
十年台指報酬率結果 10年平均季報酬為1.89%,報酬率不高。 季標準差為18.8%,顯示台灣股市波動非常大。 若按季來看,各季的報酬率報、標準差並不一致。 N Mean Std Dev Minimum Maximum 可由 excel 得到 計量_2_test
3
近十年台股大盤各季季報酬,那一季投資較好?
第一季 第二季 第三季 第四季 1991 0.2439 0.0594 1992 0.0137 0.0475 1993 0.4347 0.6858 1994 0.1312 0.1880 1995 0.0199 1996 0.2672 0.0024 0.0470 1997 0.1969 0.1020 1998 0.1081 1999 0.1407 0.2213 0.1379 2000 0.1477 平均數 .1042 .0050 -.0772 .0437 標準差 .1721 .1739 .1258 .2411 計量_2_test
4
十年台指各季報酬率結果 (sas 報表) quarter1= The MEANS Procedure Analysis Variable : return1 N Mean Std Dev Minimum Maximum quarter1= quarter1= quarter1= 計量_2_test
5
平均季報酬率為:1>4>2>3;投資風險所代表的標準差則為:4>2>1>3。與一般高風險高報酬的想法頗為吻合。
因此只以報酬平均來分析哪一季的投資較好,基本上不符合財務學理,因為高風險通常伴隨著高報酬。故從統計學上來看,只看平均報酬是有謬誤的,較嚴謹的方法是建立假說並運用統計方法加以檢定,看其是否具有統計上的顯著性。 計量_2_test
6
第二節 假說檢定 2.1.1 抽樣誤差 實際母體 推論 估計之母體
第二節 假說檢定 抽樣誤差 實際母體 樣 本 推論 估計之母體 統計推論必產生差異,稱為抽樣誤差;抽樣誤差的大小與樣本數、推論方法等有關,依據抽樣分配來估計。 例: 在 95%的信心水準下,抽樣錯誤差為正負3.1個百分點。 在α=0.05,支持率 22% 與 24% 在統計上差異不顯著。 計量_2_test
7
2.1.2 估計 點估計 分類資料:以樣本比例估計母體比例 數量資料:以樣本平均數估計母體平均數、 以樣本標準差估計標準差 估計之精確度
計量_2_test
8
2. 在 95% 的信心水準下,抽樣錯誤差為正負3.1個百分點: 資料支持的比例 = 24%,則估計支持率在 20.9% 到 27.1%
區間估計 以一區間估計參數可能落入的範圍。 例: 1. Gain mean = , s.e. = 2.25 以 95% 的信心水準估計平均利潤 = ± (2.78)(2.25) 2. 在 95% 的信心水準下,抽樣錯誤差為正負3.1個百分點: 資料支持的比例 = 24%,則估計支持率在 20.9% 到 27.1% 之間。 計量_2_test
9
檢定 檢定:將一研究主題作成假說(Hypothesis),根據資料來判斷是否接受此假說,或,將觀察到的現象作成假說,根據資料來驗証此假說。 Null hypothesis & Alternative hypothesis 計量_2_test
10
型Ⅰ錯誤 vs. 型Ⅱ錯誤 不論檢定後做的結論為何,都可能產生錯誤 事實 H0事實上為真 H1事實上為真 結論為H0 結論正確
型Ⅱ錯誤(此機率設為β) 結論為H1 型Ⅰ錯誤(此機率設為α) 註:在結論為 H1 時,犯錯的最大機率為α 計量_2_test
11
骰子10次,得到8次的6點,這是機運或是假骰子?
觀念: 骰子10次,得到8次的6點,這是機運或是假骰子? 設立虛無假說為:此骰子是一均勻骰子 如果是均勻骰子,計算得到超過 8 次 6 點的機率是 ,即根據資料算出 p-值 = 是均勻骰子的機率小於 判斷此骰子顯然不是一均勻骰子。 計量_2_test
12
檢定的顯著p-值 不顯著的情況 顯著的情況 計量_2_test
13
在H0為真的情況下,計算出,相對於H1,資料落點的機率,此機率稱為 p-值
p-值 < α,結論為 H1,即研究主題顯著 (significant)。 p-值 大時,結論為資料不足以証實研究的主題。 主題不顯著。 檢定法 選擇適當的檢定量,依據檢定量的分布計算出p-值, 最後做出結論。 計量_2_test
14
實作:選擇適當的方法,利用統計軟體得到 p-值,做出結論
檢定步驟 敘述假說。 依據資料條件確定檢定方法。 找出檢定量及抽樣分布。 計算檢定量的值,及 p-值。 針對研究主題作決策。(顯著或不顯著) 實作:選擇適當的方法,利用統計軟體得到 p-值,做出結論 計量_2_test
15
100件記錄得到平均壽命為71.8年,假設母體σ= 8.9,是否表示平均壽命超過70歲? (α= 0.05)
例 解: H0 : μ= 70 , HA : μ>70 計量_2_test
16
理論上,對一常態資料,樣本平均數是一常態分布,樣本變異數屬於 χ2 分布。
常用於檢定的分布 理論上,對一常態資料,樣本平均數是一常態分布,樣本變異數屬於 χ2 分布。 由此推導出 t-分布與 F-分布,它們是統計推論上常用之分布。 用於平均數檢定或 兩組資料比較 用於兩組變異數比較、 多組資料比較、或變異數分析 計量_2_test
17
2.2 二組資料比較 二組資料比較例題 : 第一季與第三季的報酬率是否不同?(二獨立樣本) 電子股與金融股的報酬率是否不同?(二配對樣本)
2.2 二組資料比較 二組資料比較例題 : 第一季與第三季的報酬率是否不同?(二獨立樣本) 電子股與金融股的報酬率是否不同?(二配對樣本) 分析的方法分別為 : ( H0 : μ1 = μ2 ) 二獨立樣本 – 二組變異數相等時用 pooled t-test 二組變異數不等時用 Satterthwaite test (近似法) 二配對樣本 -- paired t-test ( H0 : μD = μ1 - μ2 = 0 ) 注意:上述檢定法使用的條件是資料為常態分布資料 計量_2_test
18
C.I. for μ1 –μ2: Pooled t-test 之原理 假設變異數相等
Test H0 : μ1 =μ2 vs. H1: μ1 ≠μ2 C.I. for μ1 –μ2: 計量_2_test
19
Satterthwaite test 之原理
不需假設變異數相等 Test H0 : μ1 =μ2 vs. H1: μ1 ≠μ2 p-value = 2P(Tν>|t|) C.I. for μ1 –μ2: 計量_2_test
20
檢定σ12與σ22是否相等,採用F 檢定。 H0: σ12 = σ22 , 何時可假設變異數相等?
當 p-值 > 0.05時,可假設二組變異數相等。 計量_2_test
21
【二組獨立資料比較的實作過程】 1、預覽資料 (作統計值與比較圖) (i) 資料是否有特殊分佈?
(ii) 分散度是否有明顯差異? (iii) 均值是否有明顯差異? 2、資料是否可假設來自常態母體? (i) Normality test , (ii) 非常態時檢視 Normal probability plot 3、決定是否可假設二組的變異數相等。 用 F-test , p-value > 0.05時,設變異數相等 4、選擇平均數差異檢定法 Test H0: μ1 =μ2, 變異數相等時,用 pooled t-test 變異數不等時,用 Satterthwaite test 5、必要時計算差異的信賴區間 6、作結論 計量_2_test
22
由pooled t-test 得到p-value=0.015<α=0.05,故拒絕H0。(見下列sas報表)
例:檢定第一、第三季報酬是否不同 由pooled t-test 得到p-value=0.015<α=0.05,故拒絕H0。(見下列sas報表) 第一季的報酬率顯著異於第三季的報酬率。 Statistics Lower CL Upper CL Lower CL Upper CL Variable quarter1 N Mean Mean Mean Std Dev Std Dev Std Dev Std Err return return return1 Diff (1-2) T-Tests Variable Method Variances DF t Value Pr > |t| return1 Pooled Equal return1 Satterthwaite Unequal Equality of Variances Variable Method Num DF Den DF F Value Pr > F return1 Folded F 計量_2_test
23
由F-test, p-value=0.033<α=0.05,故拒絕H0。 (見下列sas報表)
例:檢定第四季變異數是否高於第三季的 由F-test, p-value=0.033<α=0.05,故拒絕H0。 (見下列sas報表) 台股第四季的投資風險(標準差)顯著大於第三季。 Statistics Lower CL Upper CL Lower CL Upper CL Variable quarter1 N Mean Mean Mean Std Dev Std Dev Std Dev Std Err return return return1 Diff (1-2) T-Tests Variable Method Variances DF t Value Pr > |t| return1 Pooled Equal return1 Satterthwaite Unequal Equality of Variances Variable Method Num DF Den DF F Value Pr > F return1 Folded F 計量_2_test
24
例:檢定第四季平均報酬率是否與第三季的不同
因為二季報酬率的變異數有顯著差異,使用Satterthwaite test, 得到 p-value= >α=0.05 ,故不拒絕H0。 台股第四季的平均報酬率和第三季的無明顯差異。 說明:由於三、四季的變異數有顯著差異,當我們在檢定平均數差異時,無法得到顯著性;所以在實務問題上,二組的比較不該只比較平均數。 計量_2_test
25
二配對資料比較:輸入二欄資料→ 工具 →資料分析 → t-檢定:成對母體平均數差異檢定
excel 註:若工具中未出現 ”資料分析”,請在增益集中勾選 VBA分析工具箱 計量_2_test
26
二配對資料比較 excel 報表 計量_2_test
27
二組母體平均數差異檢定 1. 輸入資料 2. 工具 →資料分析 → F-檢定:兩個常態母體變異數差異的檢定
excel 二組母體平均數差異檢定 1. 輸入資料 2. 工具 →資料分析 → F-檢定:兩個常態母體變異數差異的檢定 工具 →資料分析 → 由F-檢定結果擇一 檢定之p-值>0.025時, t-檢定:母體平均數差異檢定,異數數相等 檢定之p-值<0.025時, t-檢定:母體平均數差異檢定,異數數不相等 計量_2_test
28
二獨立資料比較 excel 報表一 計量_2_test
29
二獨立資料比較 excel 報表二 計量_2_test
30
比較兩成對樣本: 1、輸入資料:將二組資料分別輸入二行 2、Analysis → ANOVA → t Test
SAS guide 比較兩成對樣本: 1、輸入資料:將二組資料分別輸入二行 2、Analysis → ANOVA → t Test t Test Type:ˇ paired Column: paired variables Analysis: Plots:不需勾選 Titles: 計量_2_test
31
比較兩非成對樣本: 1、輸入資料:組別佔一行,資料佔一行 2、Analysis → ANOVA → t Test
SAS guide 比較兩非成對樣本: 1、輸入資料:組別佔一行,資料佔一行 2、Analysis → ANOVA → t Test t Test Type:ˇ Two sample Column:Group by 組別,Analysis var. 測量資料 Analysis: Plots:平均數比較圖ˇbox and whisker 或 ˇ means Titles: 計量_2_test
32
Analysis → Descriptive → Distribution Analysis Columns :選擇欲檢定的變數
SAS guide 常態性檢定 輸入資料 Analysis → Descriptive → Distribution Analysis Columns :選擇欲檢定的變數 Distributions:ˇNormal Plots:ˇ Probability plot 計量_2_test
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.