Chapter 8 Inference for Proportions 第八章 母體比率的推論

Slides:



Advertisements
Similar presentations
Chapter Four Parameter Estimation and Statistical Inference.
Advertisements

第五章 卡方檢定 5-1 卡方檢定 (X2 test) 5-2 適配度檢定 (good-of-fit test)
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
第三講 Recode、missing value、假設檢定與信賴區間
第07章 計量值管制圖.
Stata教學 第六講 變異數分析ANOVA ©Ming-chi Chen 社會統計.
布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
:Word Morphing ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 10508:word morphing 解題者:楊家豪 解題日期: 2006 年 5 月 21 日 題意: 第一行給你兩個正整數, 第一個代表下面會出現幾個字串,
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
指導教授:陳淑媛 學生:李宗叡 李卿輔.  利用下列三種方法 (Edge Detection 、 Local Binary Pattern 、 Structured Local Edge Pattern) 來判斷是否為場景變換,以方便使用者來 找出所要的片段。
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 實驗法.
第十三章 卡方檢定. 學 習 目 標學 習 目 標學 習 目 標學 習 目 標 1. 學習何謂多項試驗 。 2. 學習如何將一群觀測資料與其期望之分配相比較 與檢定。 3. 學習如何檢定兩變數間是否獨立 。
亂數產生器安全性評估 之統計測試 SEC HW7 姓名:翁玉芬 學號:
Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內, 例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料,通常用卡方檢定 類別資料分析 卡方檢定 卡方檢定基本理論 一個含有 k 項的試驗,設 p i.
消費者物價指數反映生活成本。當消費者物價指數上升時,一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹(inflation)來描述一般物價持續上升的現象,而物價膨脹率(inflation rate)為物價水準的變動百分比。
Section 2.3 Least-Squares Regression 最小平方迴歸
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
第 4 章 迴歸的同步推論與其他主題.
Chapter 7 Inference for Distributions 7.1 Inference for the Mean of a Population 7.2 Comparing Two Means 7.3 Inference for Population Spread.
STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性,以列聯表來表示  討論二連續隨機變數時,可以作 x-y 散佈圖觀察它 們的關係強度  以相關係數來代表二者關係的強度.
平均值檢定 假設 檢定 One Sample 平均值 是否為 u. One Sample—1 工廠甲過去向 A 公司購買原料, 平均交貨日約為 4.94 日, 標準差 現在 A 公司改組, 甲工廠繼續向 A 公司 購買, 隨機抽取 8 次採購, 平均日數為 4.29 日, 請問 A 公.
Section 2.2 Correlation 相關係數. 散佈圖 1 散佈圖 2 散佈圖的盲點 兩座標軸的刻度不同,散佈圖的外觀呈 現的相聯性強度,會有不同的感受。 散佈圖 2 相聯性看起來比散佈圖 1 來得強。 以統計數字相關係數做為客觀標準。
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
2-group1 第十一章 二組平均數的比較 【應用】 暴露在一氧化碳和暴露在一般空氣下,發生狹心 症情況是否有差異? 新藥的治療是否比較有效? 健康孩童與罹病孩童血清鐵濃度是否不同? 兩種測量儀器的準確性是否有差異? 洗腎病人透析前後體重比較.
Department of Air-conditioning and Refrigeration Engineering/ National Taipei University of Technology 模糊控制設計使用 MATLAB 李達生.
1 政治大學東亞所選修 -- 計量分析與中國大陸研究黃智聰 政治大學東亞所選修 課程名稱:計量分析與中國大陸研究 (量化分析) 授課老師:黃智聰 授課內容:時間序列與橫斷面資料的共用 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001),
1 Part IC. Descriptive Statistics Multivariate Statistics ( 多變量統計 ) Focus: Multiple Regression ( 多元迴歸、複迴歸 ) Spring 2007.
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
信度.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 貳 研究設計.
第三部分:研究設計 ( 二): 研究工具的信效度 與研究效度 (第九章之第 306 頁 -308 頁;第四章)
第二章 統計檢定 由資料統計值觀察到的現象,必須驗證,這就是統計中的假說檢定,藉由統計的科學方法,得到合理的評估。
: Fast and Easy Data Compressor ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 10043: Fast and Easy Data Compressor 解題者:葉貫中 解題日期: 2007 年 3.
選舉制度、政府結構與政 黨體系 Cox (1997) Electoral institutions, cleavage strucuters, and the number of parties.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
CH 15- 元件可靠度之驗證  驗證方法  指數模式之可靠度驗證  韋式模式之可靠度驗證  對數常態模式之可靠度驗證  失效數為零時之可靠度估算  各種失效模式之應用.
緒論 統計的範圍 敘述統計 推論統計 有母數統計 無母數統計 實驗設計 統計的本質 大量 數字 客觀.
: Multisets and Sequences ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11023: Multisets and Sequences 解題者:葉貫中 解題日期: 2007 年 4 月 24 日 題意:在這個題目中,我們要定義.
政治大學公企中心必修課-- 社會科學研究方法(量化分析)--黃智聰
: A-Sequence ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10930: A-Sequence 解題者:陳盈村 解題日期: 2008 年 5 月 30 日 題意: A-Sequence 需符合以下的條件, 1 ≤ a.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
JAVA 程式設計與資料結構 第二十章 Searching. Sequential Searching Sequential Searching 是最簡單的一種搜尋法,此演 算法可應用在 Array 或是 Linked List 此等資料結構。 Sequential Searching 的 worst-case.
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
: Expect the Expected ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11427: Expect the Expected 解題者:李重儀 解題日期: 2008 年 9 月 21 日 題意:玩一種遊戲 (a game.
845: Gas Station Numbers ★★★ 題組: Problem Set Archive with Online Judge 題號: 845: Gas Station Numbers. 解題者:張維珊 解題日期: 2006 年 2 月 題意: 將輸入的數字,經過重新排列組合或旋轉數字,得到比原先的數字大,
Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標,以減少 測量誤差並可建立問卷的構念效度 驗證性因素分析.
描述統計 描述統計(Descriptive Statistics)-將蒐集到的資料加以整理和記錄,並以數字和統計圖表的方式來分析及解釋資料所具有的特性. 基本統計值(平均數,中位數,標準差,變異量….) 相關性測量(卡方,相關係數,迴歸…)
Chapter 8 The logic of hypothesis testing. 假設檢定 假設檢定 (hypothesis testing) 是利用對樣本 統計量 (sample statistics) 進行檢定已決定 對母體叁數 (population parameters) 的假設 是否成立.
Unit 3 : 變異數分析 --ANOVA 3.1 範例說明 行銷研究方面, One-Way ANOVA 可 用以研擬市場區隔及目標選擇策略。 教育研究方面,此一模式可用以評估 教師之教學績效。 農業研究方面,此一模式則可用以挑 選使玉米收穫量極大化的肥料。
Probability Distribution 機率分配 汪群超 12/12. 目的:產生具均等分配的數值 (Data) ,並以 『直方圖』的功能計算出數值在不同範圍內出現 的頻率,及繪製數值的分配圖,以反應出該 機率分配的特性。
Chapter 7 Sampling Distribution
: Help My Brother ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 11033: Help My Brother 解題者: 呂明璁 解題日期: 2007 年 5 月 14 日.
第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data : k 組資料,樣本數為 n 1,…, n k. x ij --- 第 i 組的第 j 個觀察值 N =
Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense.
連續隨機變數 連續變數:時間、分數、重量、……
第八章 估計.
Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/30 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH7.1~CH /12/26.
: Wine trading in Gergovia ★★☆☆☆ 題組: Contest Volumes with Online Judge 題號: 11054: Wine trading in Gergovia 解題者:劉洙愷 解題日期: 2008 年 2 月 29 日 題意:在 Gergovia.
計數值抽樣計劃 使用 MIL-105D 表. 表 10-1 Sample Sizes Code Letters.
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
第十一章 卡方檢定 陳順宇 教授 成功大學統計系.
幼兒行為觀察與記錄 第八章 事件取樣法.
Chapter 12 Estimation 統計估計. Inferential statistics Parametric statistics 母數統計 ( 母體為常態或 大樣本 ) 假設檢定 hypothesis testing  對有關母體參數的假設,利用樣本資料,決定接受或 不接受該假設的方法.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
1 Slide Slide 第 9 章 假設檢定 Part B ( ). 2 Slide Slide 第 9 章 假設檢定 Part B  9.5 母體比例  9.6 假設檢定與決策  9.7 計算型 II 錯誤的機率  9.8 在檢定母體平均數時決定樣本大小 第 9 章假設檢定.
Presentation transcript:

Chapter 8 Inference for Proportions 第八章 母體比率的推論

Inference for Proportions 8.1 Inference for a Population Proportion 8.2 Comparing Two Proportions

例8.1:AIDS風險行為 全國性AIDS行為調查 隨機樣本2673成年異性戀者 其中170人過去一年間有兩位以上性伴侶,佔6.36% 據此資料如何推估所有成年異性戀者中多重性伴侶的比率? 單母體比率問題

例8.2:學齡前教育是否有效 學齡前教育計畫對貧窮小孩日後生活是否有不同? 1960年代後期,接受密西根學齡前教育的62位兒童與未接受學齡前教育的61位兒童比較 61%學齡前受教育組與80%控制組在過去十年曾要求社會救助 此資料是否是學齡前教育有助於減少日後使用社會救助的顯著性證據? 雙母體比率的比較問題

樣本比率的抽樣分配 推論的假設條件 z 程序 樣本數的選擇 Section 8.1 母體比率的推論 樣本比率的抽樣分配 推論的假設條件 z 程序 樣本數的選擇

樣本比率 (Sample Proportion) 成功的樣本數除以全體觀察數的值稱為樣本比率(sample proportion),記為 (念作 p-hat) 。 多重性伴侶的樣本比率為 兩組曾要求社會救助的樣本比率為

樣本比率的抽樣分配 由具有“成功”比率 p 的母體抽出樣本數為 n 的簡單隨機樣本。令樣本成功比率為 則 隨著樣本數 n 的增加 越接近常態 抽樣分配的標準差為

樣本比率的抽樣分配圖示 取很多組樣本數為 n 的隨機樣本,其樣本比率直方圖可呈現樣本比率的分配 SRS n SRS n 母體 SRS n 成功率 p

樣本比率 的抽樣分配圖形 的樣本分配 期望值 p 的值

範例8.3 假設雙性戀成人有6%過去一年有二位以上的性伴侶(且受詢問時會承認) 全國性AIDS行為調查由此母體選出2673位隨機樣本 此樣本中至少有5%會承認過去一年有多性伴侶的機率為何? 母體的多性伴侶比例為6%,n = 2673時 的期望值為 p = 0.06 ,標準差為 欲求 p(  5%)

範例8.3(續) 標準化後服從近似標準常態假設 標準常態曲線 機率 = 0.9854 機率=0.0146

推論的假設 樣本數不太小且只佔母體的少部份時, 標準化後服從近似標準常態 我們可在滿足下列二規則(rule of thumb)下安全的用z: 樣本數不太小且只佔母體的少部份時, 標準化後服從近似標準常態 我們可在滿足下列二規則(rule of thumb)下安全的用z: 母體數至少10倍於樣本數 樣本數至少大到足夠使 np 和 n (1-p)都在10以上

推論假設的實用性 p ~ 0.5時近似最正確, p ~ 0 或 1 時近似最不正確 p = 0 或 1 時, = 1或 0 ,近似一定不正確 上述二規則(rule of thumb)無法滿足時,仍可以更精緻的統計方法推論 在實用上,p 未知 檢定H0:p = p0時,以 p0 代入 z 統計量和規則2 信賴區間的推論,大樣本 接近 p。以 代入安全規則。以 的標準誤差 代替標準差而得信賴區間型式為

比率推論的假設 資料是由有興趣的母體取得的簡單隨機樣本 母體數至少10倍於樣本數 檢定H0:p = p0時,樣本數 n 至少大到足夠使 np0 和 n(1-p0)都在10以上 信賴區間時, n 至少大到使 n 和 n(1- )都在10以上

範例8.4:假設是否滿足? 母體的多性伴侶比率的信賴區間 資料是由複雜的分層抽樣設計取得,調查根據該設計推論程序進行,整體效果相當於簡單隨機樣本。 母體數遠大於樣本數 n = 2673的10倍。 條件2, 3 滿足,條件1大致滿足。

調查結論的詮釋 調查結果可能低估,理由為: 調查時只有家居人口可接受電話調查,電話普及率94%的母體代表性夠。但AIDS高危險群,如靜脈注射毒癮犯,多居無定所。電話調查的樣本代表低。 不合作比例過高 30% 。拒絕回答者與合作者或許有系統性偏差。該調查以統計方法將兩不同的回答率做調整。 以適當的訪員進行電訪以提高答案的真實性,但仍有可能因問題敏感而做不實回答。

z 程序-信賴區間 由未知比率 p 的母體抽取簡單隨機樣本樣本為 n p的C信賴度近似信賴區間為 其中 z*是標準常態(1-C)/2上尾臨界值

z 程序-檢定 檢定H0:p = p0時,z 統計量為 各對立假說下的 P-值為 Ha: p > p0 之 P-值為

範例8.5:風險行為的估計 多性伴侶比率的估計值為 。 信賴度99% , z* = 2.576近似信賴區間為 多性伴侶比率的估計值為 。 信賴度99% , z* = 2.576近似信賴區間為 過去一年有二位以上的性伴侶之比率, 99% 近似信賴區間為5.1%到7.6%之間。

範例8.6:銅板是否公正 Count Buffon (1707-1788)擲銅板4040次。 正面次數為2048 ,正面比率的估計值為 檢定銅板是否公正,即檢定 H0:p = 0.5 vs. Ha: p  0.5 檢定統計量為 p-值為

範例8.6:檢定圖示 p-值 = 0.3788 標準常態曲線 m = 0 -0.88 0.88

範例8.7:正面機率的估計 Buffon 所擲銅板正面比率的估計值為 信賴度95% , z* = 1.96近似信賴區間為

樣本數的選擇 p 之信賴區間的誤差域(margin of error)為 給定誤差域 m 及信賴水準,可查表求得臨界值 z* 。應用上,需以猜測值 p*代替 來計算所需要的樣本數 以試驗性研究(pilot study)的結果作為猜測值 p* 以 p* = 0.5作為猜測值。由於p* = 0.5時 m最大,此法最保守。 即此法算出的 n,所得的實際誤差域較所要求的小

給定誤差域(margin of error)求樣本數 當樣本數為 時, p 之信賴區間的誤差域接近給定值 m。其中p*為樣本比率的猜測值。 猜測值 p* = 0.5時,實際誤差域不大於給定值 m。

範例8.8:抽樣調查計畫 大城市中兩候選人得票率的調查計畫。 信賴水準95%下,誤差域m不超過0.03 一般預料得票率在30~70%之間 令猜測值 p* = 0.5,則所需樣本數為 (取 n =1068) 若 m = 0.025,則所需樣本數為 若 m = 0.02,則所需樣本數為