第七章 抽樣與抽樣分配.

Slides:



Advertisements
Similar presentations
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Advertisements

Chapter 10 馬可夫鏈 緒言 如果讀者仔細觀察日常生活中所發生的 諸多事件,必然會發現有些事件的未來 發展或演變與該事件現階段的狀況全然 無關,這種事件稱為獨立試行過程 (process of independent trials) ;而另一些 事件則會受到該事件現階段的狀況影響。
Ch 12 點估計與抽樣分配.
布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
Ch05 點估計與抽樣分配 授課老師 薛欣達. 學習目標 估計母體參數的樣本統計量 應用中央極限定理 根據估計式的需求性質判斷估計式的好壞 應用自由度的概念 利用樣板計算抽樣分配與相關的結果.
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
第三部分:研究設計 ( 一) 抽樣(研究對象). 一、研究設計 描述或計畫有關資料蒐集和分析的方法與 過程,以便解答研究問題或驗證研究假設, 最後檢核研究目的是否達成。 包括: 研究對象(抽樣) 研究工具 實施程序 資料處理.
Advanced Chemical Engineering Thermodynamics
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 實驗法.
亂數產生器安全性評估 之統計測試 SEC HW7 姓名:翁玉芬 學號:
Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內, 例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料,通常用卡方檢定 類別資料分析 卡方檢定 卡方檢定基本理論 一個含有 k 項的試驗,設 p i.
: OPENING DOORS ? 題組: Problem Set Archive with Online Judge 題號: 10606: OPENING DOORS 解題者:侯沛彣 解題日期: 2006 年 6 月 11 日 題意: - 某間學校有 N 個學生,每個學生都有自己的衣物櫃.
貨幣創造與控制 CHAPTER 27 學習本章後,您將能: C H A P T E R C H E C K L I S T 解釋銀行如何藉由放款而創造貨幣 1 解釋中央銀行如何影響貨幣數量 2.
消費者物價指數反映生活成本。當消費者物價指數上升時,一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹(inflation)來描述一般物價持續上升的現象,而物價膨脹率(inflation rate)為物價水準的變動百分比。
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
第 4 章 迴歸的同步推論與其他主題.
1 政大公企中心產業人才投資課程 -- 企業決策分析方法 -- 黃智聰 政大公企中心產業人才投資課程 課程名稱:企業決策分析方法 授課老師:黃智聰 授課內容:利用分公司之追蹤資料進行企業決策分析 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge,
1. 假設以下的敘述為一未提供 “ 捷徑計算 ” 能力的程式段,試用程 式設計的技巧,使此敘述經此改 寫的動作後,具有與 “ 捷徑計算 ” 之 處理方法相同之處理模式。 if and then E1 else E2 endif.
STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性,以列聯表來表示  討論二連續隨機變數時,可以作 x-y 散佈圖觀察它 們的關係強度  以相關係數來代表二者關係的強度.
Section 2.2 Correlation 相關係數. 散佈圖 1 散佈圖 2 散佈圖的盲點 兩座標軸的刻度不同,散佈圖的外觀呈 現的相聯性強度,會有不同的感受。 散佈圖 2 相聯性看起來比散佈圖 1 來得強。 以統計數字相關係數做為客觀標準。
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
1 政治大學東亞所選修 -- 計量分析與中國大陸研究黃智聰 政治大學東亞所選修 課程名稱:計量分析與中國大陸研究 (量化分析) 授課老師:黃智聰 授課內容:時間序列與橫斷面資料的共用 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001),
Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.
1 Part IC. Descriptive Statistics Multivariate Statistics ( 多變量統計 ) Focus: Multiple Regression ( 多元迴歸、複迴歸 ) Spring 2007.
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
信度.
© The McGraw-Hill Companies, Inc., 2008 第 6 章 製造流程的選擇與設計.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 貳 研究設計.
Chapter 13 塑模靜態觀點:物件圖 Static View : Object Diagram.
:Problem D: Bit-wise Sequence ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10232: Problem D: Bit-wise Sequence 解題者:李濟宇 解題日期: 2006 年 4 月 16.
第三部分:研究設計 ( 二): 研究工具的信效度 與研究效度 (第九章之第 306 頁 -308 頁;第四章)
1 Review II: Sampling & Quantitative Data Collection Social Research Methods Soc 2113 & 6501 Spring, 2007 March 5, 7, 2007.
選舉制度、政府結構與政 黨體系 Cox (1997) Electoral institutions, cleavage strucuters, and the number of parties.
CH 15- 元件可靠度之驗證  驗證方法  指數模式之可靠度驗證  韋式模式之可靠度驗證  對數常態模式之可靠度驗證  失效數為零時之可靠度估算  各種失效模式之應用.
緒論 統計的範圍 敘述統計 推論統計 有母數統計 無母數統計 實驗設計 統計的本質 大量 數字 客觀.
: Multisets and Sequences ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11023: Multisets and Sequences 解題者:葉貫中 解題日期: 2007 年 4 月 24 日 題意:在這個題目中,我們要定義.
公司加入市場的決定. 定義  平均成本 = 總成本 ÷ 生產數量 = 每一單位產量所耗的成本  平均固定成本 = 總固定成本 ÷ 生產數量  平均變動成本 = 總變動成本 ÷ 生產數量.
:Nuts for nuts..Nuts for nuts.. ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 10944:Nuts for nuts.. 解題者:楊家豪 解題日期: 2006 年 2 月 題意: 給定兩個正整數 x,y.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
政治大學公企中心必修課-- 社會科學研究方法(量化分析)--黃智聰
公用品.  該物品的數量不會因一人的消費而受到 影響,它可以同時地被多人享用。 角色分配  兩位同學當我的助手,負責:  其餘各人是投資者,每人擁有 $100 , 可以投資在兩種資產上。  記錄  計算  協助同學討論.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
函式 Function Part.2 東海大學物理系‧資訊教育 施奇廷. 遞迴( Recursion ) 函式可以「呼叫自己」,這種動作稱為 「遞迴」 此程式的執行結果相當於陷入無窮迴圈, 無法停止(只能按 Ctrl-C ) 這給我們一個暗示:函式的遞迴呼叫可以 達到部分迴圈的效果.
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
Chapter 3 Entropy : An Additional Balance Equation
845: Gas Station Numbers ★★★ 題組: Problem Set Archive with Online Judge 題號: 845: Gas Station Numbers. 解題者:張維珊 解題日期: 2006 年 2 月 題意: 將輸入的數字,經過重新排列組合或旋轉數字,得到比原先的數字大,
Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標,以減少 測量誤差並可建立問卷的構念效度 驗證性因素分析.
行銷研究 單元六 抽樣方法.
Chapter 10 m-way 搜尋樹與B-Tree
描述統計 描述統計(Descriptive Statistics)-將蒐集到的資料加以整理和記錄,並以數字和統計圖表的方式來分析及解釋資料所具有的特性. 基本統計值(平均數,中位數,標準差,變異量….) 相關性測量(卡方,相關係數,迴歸…)
Probability Distribution 機率分配 汪群超 12/12. 目的:產生具均等分配的數值 (Data) ,並以 『直方圖』的功能計算出數值在不同範圍內出現 的頻率,及繪製數值的分配圖,以反應出該 機率分配的特性。
Chapter 7 Sampling Distribution
Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense.
連續隨機變數 連續變數:時間、分數、重量、……
第八章 估計.
: Wine trading in Gergovia ★★☆☆☆ 題組: Contest Volumes with Online Judge 題號: 11054: Wine trading in Gergovia 解題者:劉洙愷 解題日期: 2008 年 2 月 29 日 題意:在 Gergovia.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
:Problem E.Stone Game ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10165: Problem E.Stone Game 解題者:李濟宇 解題日期: 2006 年 3 月 26 日 題意: Jack 與 Jim.
抽樣設計概論 抽樣(sampling)的本質 優點 優良樣本的特性 自母群體中選取部分元素為樣本,以得知母群體的特徵.
財務管理概論 劉亞秋‧薛立言 合著 (東華書局, 2007)
幼兒行為觀察與記錄 第八章 事件取樣法.
1 Chemical and Engineering Thermodynamics Chapter 1 Introduction Sandler.
CH 14-可靠度工程之數學基礎 探討重點 失效時間之機率分配 指數模式之可靠度工程.
Chapter 12 Estimation 統計估計. Inferential statistics Parametric statistics 母數統計 ( 母體為常態或 大樣本 ) 假設檢定 hypothesis testing  對有關母體參數的假設,利用樣本資料,決定接受或 不接受該假設的方法.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Presentation transcript:

第七章 抽樣與抽樣分配

機率抽樣之定義: 在完整定義的母體中,每一個個體都有一個不為零的中選機會。 非機率抽樣:凡不屬於這個定義的範圍

抽樣分配 樣本統計量為隨機樣本的函數,而隨機樣本是由n個隨機變數 所組成的,故樣本統計量亦為一隨機變數,其機率分配稱為抽樣分配。

抽樣誤差 抽樣誤差是樣本統計量與相對應的母體參數間的差異。此種差異來自抽樣過程的機遇(chance),抽樣方法及推論方法的不同。 非抽樣誤差 非抽樣誤差主要來自調查時的執行與事後在記錄、整理資料時所發生的錯誤。

常見的非抽樣誤差-Kish (1965) , Cochran (1977), 韋端(1990) 偶遇樣本 (Haphazard Sample) or 便利抽樣(Convenient Sample): 即碰到誰就選誰,研究者並不在乎調查對象是否有代表性. 立意選樣(Purposive Sampling) or 判斷抽樣(Judgment Sampling) : 經由專家主觀判斷,立意選定研究者認為 [有代表性] 的樣本來觀察. 樣本無法確認具代表性---是否為專家?? 自願樣本(Volunteer Subjects): 聽任自動送上門來的人組成樣本群. 無量的代表性,但有質的代表性

配額選樣(quota sampling): 一母體的人口特徵按比例分配樣本數,在配額之內進行非機率抽樣,調查對象依照特徵分類,根據各類別的百分比每類立意選樣至而滿為止. 雪球抽樣(snowballed sample) 先找到原始受訪者,然後再從受訪者所提供的資訊找到其他受訪者.

隨機數表

抽樣的結果:用來估計母體的某些特徵值 Ex:輪胎公司製造新的輪胎,實驗抽出120個測式結 果χ=36,500哩,用來當作新輪胎的哩程壽命 簡單隨機抽樣 分層抽樣 叢式抽樣 系統抽樣 便利抽樣 判斷抽樣 抽樣方法 機率性的抽樣方法,可用評估方法來評量其優良度 簡單隨機抽樣:抽取程序完全視母體大小為有限或無限

有限母體 CN: 從N中,抽出一樣本n的簡單隨機樣本,其 抽取方法必須滿足在n中,每一樣本被抽出機率皆相同。 Ex:利用“標籤”從2500主管中,抽出30個樣本,另可用 “隨機數表”。 ※ 利用隨機數表抽取樣本 6 3 2 7 1 5 9 9 8 6 每個數字6,3,2,7,1,都由0~9隨機選取,具有相同發生的機率,五個字一組是為方便查詢與閱讀。 Ex:資料名單、組織成員名冊、學生註冊名單、信用卡帳戶 、存貨數目

隨機抽樣 無限母體:元素無法進行編號,必從滿足 1.每個元素皆抽自相同母體 2.每個元素皆可獨立抽出 (ex:顧客抽出特優待卷,不會影響) Ex:持續不斷的程序:車流量、可能達成的顧客人數、銀行交易、CD製造。

分層抽樣方法-比例抽樣

分層隨機抽樣 母體先被區隔成數群,相性質放在一層中,即層內元素相異性較低。 資料層1 資料層2 資料層N ‧‧‧‧‧ 再抽出一元素來代表 若層內同質性高,則層內變異減少,只要“少量”的抽樣即可代表整層的性質

分層隨機抽樣的優點: 層內的資料一致而集中,標準差越小,則抽樣誤差也越小. Ex: 以台灣地區民眾為調查母體的抽樣設計,常見分層依據 台北市、高雄市、台灣省5個省轄市各為一層. 從抽樣的理論來看, 能有效降低推論的誤差. 以推論次母體(各縣市或公私立學校)可使抽樣調查目的易於達成. 有關工商業界或各行各業的抽樣調查更需要分層.

集群抽樣法

直接隨機抽出一叢體 叢式抽樣 Ex:地區抽樣:將地理區分成n個叢體,訪問者可在同一地區訪問,成本降低,時間減少。(利用增加樣本來補其缺失) 一叢體內的元素都是相異性質,所以一叢體都可代表整個母體。 Ex:地區抽樣:將地理區分成n個叢體,訪問者可在同一地區訪問,成本降低,時間減少。(利用增加樣本來補其缺失) 母體 叢體1 叢體2 叢體N ‧‧‧‧‧ 直接隨機抽出一叢體

系統抽樣法

先從第一個100元素中,隨機抽出一元素,再從另一個100個元素中,抽出第二個元素。 系統抽樣(等距抽樣) 先把全體總數N除以樣本數,得到K,即每間隔K個抽一個. Ex:從5000個元素的母體中,抽出50個樣本   -以100為單位 先從第一個100元素中,隨機抽出一元素,再從另一個100個元素中,抽出第二個元素。 ※比簡單隨機抽機容易,不必對照隨機數表

等距抽樣的中選樣本不但可以自動反應母體代表性,亦可降低抽樣誤差. 在大部分母體清冊都電腦化後,等距抽樣成為主流趨勢. 等距抽樣的優點: 快速方便,所以用的多.不需要N與k . Ex:以百貨公司顧客、汽車乘客或球場觀眾為對象,若決定每30人抽一人,即能馬上進行而不必事先知道全體有多少人?或樣本要多少等.

等距抽樣的缺點:最怕遇到週期性資料, 若此 週期和K成比例,則樣本會死守規則,完全失 去代表性. Ex: 每7天查一次帳,結果永遠查到一星期內 的同一天,後果必然不堪設想.

分段抽樣法

便利抽樣 非機率性的抽樣方法,其樣本隨其抽樣的方便而 決定。 判斷抽樣 非機率性的抽樣方法,其樣本隨測試者的判斷而 定。   非機率性的抽樣方法,其樣本隨其抽樣的方便而   決定。 判斷抽樣   非機率性的抽樣方法,其樣本隨測試者的判斷而   定。

σχ可用來計算μ與χ的距離,因為σχ扮演著 (errors)誤差角色,且被視為平均的標準差。 中央極限定理: 有平均數μ和標準差σ之母體抽出樣本大小為n的簡單隨機樣本,當樣本大小n夠大時,χ的抽樣分配將趨近常態分配。 n≧30,χ的抽樣分配趨近常態分配。 ※當母體是常態分配,則不管樣本的個數,其χ 的抽樣分配亦是常態分配。

母體分配: 母體資料的機率分配。 樣分平均數的抽樣分配

利用樣本平均數χ來推估母體平均μ是常見的統計方法 隨機變數:一個試驗結果的數值化描述,以抽樣的過程        當成試驗,χ為此一試驗結果的數值化。        -樣本平均數χ是一隨機變數。 利用樣本平均數χ來推估母體平均μ是常見的統計方法 母體μ=? 用χ推算 μ? 用樣本資料計算 樣本平均數χ 從母體抽取n個 簡單隨機樣本 在重覆這樣的過程,可以得不同的χ,而所有可能的χ所現成的機率分配稱χ的抽樣分配。

樣本平均數的平均數與變異數

χ的期望值: E(χ)=μ 母體平均數 χ的標準差: 有限母體 無限母體   E(χ)=μ 母體平均數 χ的標準差: 有限母體 無限母體 σχ= √ N-n N-1 √ n σ σχ= √ n σ ( ) n N 當母體無限或 ≦0.05 有限母體校正因數 當母體有限,且  >0.05 n N

樣本比例的抽樣分配

的抽樣分配

t分配(小樣本) 自常態母體X~N 隨機抽取樣本 ,則統計量 為自由度n-1的t分配。 母體為常態分配但變異數未知 t分配(小樣本) 自常態母體X~N   隨機抽取樣本     ,則統計量 為自由度n-1的t分配。

Ex:假設 df=9,求k值 p(-k<t<k)=0.9 Sol: (-k,k)之機率為0.9 故在k以左與右的機率為0.1 亦即在k以右的機率為0.05  當 df=9,查表pg719 可得 t0.05=1.833    

簡單隨機抽樣: 抽取樣本時,若所有可能抽出的樣本被抽出的機率均相等。 機率抽樣法 簡單隨機抽樣: 抽取樣本時,若所有可能抽出的樣本被抽出的機率均相等。 樣本平均數的平均數與變異數

樣本平均數的平均數與變異數

樣本平均數抽樣分配的形狀 常態母體的抽樣分配 若母體為常態分配,平均數為,標準差為 ,則不論樣本數為何,樣本平均數 的抽樣分配亦為常態分配,其平均數和標準差分別為:

母體比例與樣本比例 母體比例

樣本比例的平均數

樣本比例的變異數與標準差 無限母體

樣本比例的變異數與標準差 有限母體

√ √ 樣本比例p的標準差 σp= σp= N-n N-1 P(1-P) n ‧ P(1-P) n 無限母體 母體比例p=? 用p值來 來推算p值 用樣本資料計算 樣本比例p值 從母體抽出n個 簡單隨機樣本 樣本比例p的標準差 σp= √ N-n N-1 P(1-P) n ‧ σp= √ P(1-P) n 無限母體 當 ≦0.05時,即母體夠大而樣本夠小時,有無校正因子並無太大差別 有限母體 >0.05時,加上校正因子 N n N n

樣本比例(p)的抽樣型態 若樣本夠大,則p的抽樣分配趨近常態機率分配。 即當np≧5,n(1-p) ≧5時,樣本數可認定足夠形成大樣本。

圖8.1 等待看牙時間(母體)

圖8.2 等待看牙時間(樣本1) 圖8.3 等待看牙時間(樣本2) 圖8.2 等待看牙時間(樣本1) 圖8.3 等待看牙時間(樣本2)

估計誤差

資料搜集成本與抽樣誤差的關係

展示小姐的月薪的次數分配

展示小姐月薪的母體機率分配

展示小姐月薪的母體機率分配

樣本平均數的抽樣分配

樣本平均數的機率分配

展示接待小姐月薪的抽樣

展示小姐月薪的樣本平均數

展示小姐的月薪的抽樣分配

展示小姐的月薪抽樣分配圖

抽樣誤差: 不管χ、μ,χ-μ為抽樣誤差 n=100下,σχ=400 0.5036 n=30, σχ=730.30 0.7888 χ 51300 51800 52300 χ n=30, σχ=730.30 n=100下,σχ=400 當樣本數增加,標準誤差減少,χ的抽樣分配將有較低的變異,使得樣本平均數落於母體平均數之特定範圍內之機率增加。

(N:母體個數,k:母體中,某個類別的個數) Σχi i=1 n 樣本比例p: (N:母體個數,k:母體中,某個類別的個數) 樣本比例p的抽樣分配: 所有樣本比例p值的機率分配 E=(p)=p 即隨機變數p的期望值=母體比例

估計誤差

中央極限定理 母體分配 母體分配

中央極限定理(續) 抽樣分配 抽樣分配

中央極限定理(續) 抽樣分配 抽樣分配

營業額的抽樣分配

房屋價格的機率

點二項分配

贊成興建巨蛋球場比例的機率