Chapter 8 The logic of hypothesis testing
假設檢定 假設檢定 (hypothesis testing) 是利用對樣本 統計量 (sample statistics) 進行檢定已決定 對母體叁數 (population parameters) 的假設 是否成立
假設檢定邏輯 我們通常不了解母體參數 我們 “ 假設 ” 母體參數為何 ( 設立假設 state your hypothesis) 利用蒐集樣本所的的資料 (sample statistics) 來 “ 檢 定 ” 假設 (hypothesis testing) – 比較樣本資料與母體資料 – 決定樣本資料發生的機率大小 – 若資料結果 (data) 與假設 (hypothesis) 有很大差異,則 我們認為假設不成立
Example 小明發現旅館管理者 EQ 多半很高 設立假設 : EQ H >EQ N 蒐集 50 個 hotel GMs EQ 結果 (Sample data) 比較 EQ H 與 EQ N ,看是否有很大差距來決定 是否假設成立
EQ H = 110 EQ N = 100 是剛好抽樣 到高 EQ 的一群 hoteler? 或者是 hoteler 的 EQ 普 遍比常人高 ?
Hypothesis statement 虛無假設 Null Hypothesis –H 0 – 假定樣本與母體一致 – 研究者欲推翻之假設 ( 稻草人假設 ) 研究假設 Research hypothesis –H 1 – 假定樣本與母體不一致 – 研究者欲成立之假設 ( 與觀察一致 )
假設檢定步驟 Step 1: Making assumptions 確認資料符合假設前提的要求 –Random sampling –Independent observations –Normal sampling distribution –Interval/ratio scale Step 2: Stating the null hypothesis & research hypothesis 建立假設 –H0 & H1 Step 3: Establishing the critical region 決定關鍵區域 –Alpha level (1%, 5%, 10%) –Z critical=level of significance (Zc) – 關鍵區域決定你判讀檢定結果的寬鬆度 Step 4: Computing z-score (Zo or test statistic) Step 5: Making a decision of rejecting the H 0 or accepting the H 0 – 藉由 z-scor 是否落在關鍵區來決定你是否接受或拒絕虛無假設 在關鍵區內 : reject H 0 在關鍵區外 accept H 0 (Fail to reject H 0 )
Level of significance 65% 1S 95% 2S 97% 3S
EQ example 假設台灣人民 EQ 值為常態分佈,平均為 100 , 標準差為 3 。小明觀察飯店主管 EQ 都很高 , 為了證實他的觀察,小明抽樣調查 50 位國際 觀光飯店主管 EQ ,發現其平均值為 116 ,請 進行統計檢定了解小明的假設是否成立 ?
Hypothesis 類型 Directional hypothesis test 方向性假設檢定 Non-directional hypothesis test 無方向性假 設檢定
Example P216 & 217 questions : please determine the questions should be tested in directional or non-directional hypotheses
檢定結果,有沒有可能誤判 ? 你的假設檢定結果真的可以反應事實嗎 ? 未必喲 !!
假設檢定結果的幾種可能 檢定結果 Reject H 0 – 真的有差異 (hotelier 的 EQ 真的比常人高 ) 結果正確 – 沒有差異 (hotelerEQ 沒有比常人高,只是你剛好抽樣 到一群高 EQ 的 hotelier) 犯錯 (Type I error , ) 檢定結果 Fail to reject H 0 – 真的沒有差異 (hotelerEQ 沒有比常人高 ) 結果正確 – 有差異,但你沒發現 (hotelier 的 EQ 真的比常人高,而 你恰好抽樣到一群 EQ 比較低的 hotelier) 犯錯 (Type II error , )
H 0 trueH 1 true Reject H 0 Type I error Decision correct “power” Accept H 0 Decision correctType II error
=p( Type I error) =p( reject H 0 I H 0 true) = level of significance = critical region = p( Type II error) = p( Accept H 0 IH 1 ture) Power = p ( Reject H 0 I H 1 true) 檢定力
Type I vs. Type II 哪一種 error 比較糟糕 ? 如果你可選擇,那你要避免犯哪一種錯誤 ?
如何控制 type I & type II error? ; Power = 1- How to increase “power”? – – n – 進行單尾檢定