Ch 12 點估計與抽樣分配.

Slides:



Advertisements
Similar presentations
Chapter Four Parameter Estimation and Statistical Inference.
Advertisements

第二章 研究主題(研究題 目)與研究問題.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
Ch05 點估計與抽樣分配 授課老師 薛欣達. 學習目標 估計母體參數的樣本統計量 應用中央極限定理 根據估計式的需求性質判斷估計式的好壞 應用自由度的概念 利用樣板計算抽樣分配與相關的結果.
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
第三部分:研究設計 ( 一) 抽樣(研究對象). 一、研究設計 描述或計畫有關資料蒐集和分析的方法與 過程,以便解答研究問題或驗證研究假設, 最後檢核研究目的是否達成。 包括: 研究對象(抽樣) 研究工具 實施程序 資料處理.
Event Sampling 事件取樣法. 關心重點為「事件」本身明確的焦點 行為 清楚掌握主題 - 當「事件」出現時才開 始記錄 記錄程序 等待目標事件的發生 開始記錄 事件結束,停止記錄.
第二章 太陽能電池的基本原理 及其結構 2-1 太陽能電池的基本原理 2-2 太陽能電池的基本結構 2-3 太陽能電池的製作.
Advanced Chemical Engineering Thermodynamics
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 實驗法.
亂數產生器安全性評估 之統計測試 SEC HW7 姓名:翁玉芬 學號:
第四章 評價股票選擇權的數值方法 蒙地卡羅模擬與二項式模型 財務工程 呂瑞秋著.
Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內, 例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料,通常用卡方檢定 類別資料分析 卡方檢定 卡方檢定基本理論 一個含有 k 項的試驗,設 p i.
消費者物價指數反映生活成本。當消費者物價指數上升時,一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹(inflation)來描述一般物價持續上升的現象,而物價膨脹率(inflation rate)為物價水準的變動百分比。
第7章 研究樣本的選擇.
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
第 4 章 迴歸的同步推論與其他主題.
1 政大公企中心產業人才投資課程 -- 企業決策分析方法 -- 黃智聰 政大公企中心產業人才投資課程 課程名稱:企業決策分析方法 授課老師:黃智聰 授課內容:利用分公司之追蹤資料進行企業決策分析 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge,
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性,以列聯表來表示  討論二連續隨機變數時,可以作 x-y 散佈圖觀察它 們的關係強度  以相關係數來代表二者關係的強度.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Department of Air-conditioning and Refrigeration Engineering/ National Taipei University of Technology 模糊控制設計使用 MATLAB 李達生.
1 政治大學東亞所選修 -- 計量分析與中國大陸研究黃智聰 政治大學東亞所選修 課程名稱:計量分析與中國大陸研究 (量化分析) 授課老師:黃智聰 授課內容:時間序列與橫斷面資料的共用 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001),
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
信度.
1 第四章 多變數函數的微分學 § 4.1 偏導數定義 定義 極限值 ■. 2 定理 極限值的基本定理 (1) 極限值的唯一性 : 若 存在,則 其值必為唯一。 (2) 若 且 ( 與 為常數 ) , 則 且 為常數且.
論文研討 2 學分 授課教師:吳俊概.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 貳 研究設計.
:Problem D: Bit-wise Sequence ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10232: Problem D: Bit-wise Sequence 解題者:李濟宇 解題日期: 2006 年 4 月 16.
第三部分:研究設計 ( 二): 研究工具的信效度 與研究效度 (第九章之第 306 頁 -308 頁;第四章)
選舉制度、政府結構與政 黨體系 Cox (1997) Electoral institutions, cleavage strucuters, and the number of parties.
實用管理科學 陳明德、陳武林 著 前程文化 Ch14 決策分析 14-1 本章結構 隨機模式導論 決策分析步驟 決策分析模式與符號 非機率性模式分析 機率性模式分析 貝氏決策分析技術 決策樹的建立 風險分析與敏感度分析.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
CH 15- 元件可靠度之驗證  驗證方法  指數模式之可靠度驗證  韋式模式之可靠度驗證  對數常態模式之可靠度驗證  失效數為零時之可靠度估算  各種失效模式之應用.
第二十一章 研究流程、論文結構        與研究範例 21-1  研究流程 21-2  論文結構 21-3  研究範例.
緒論 統計的範圍 敘述統計 推論統計 有母數統計 無母數統計 實驗設計 統計的本質 大量 數字 客觀.
: Multisets and Sequences ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11023: Multisets and Sequences 解題者:葉貫中 解題日期: 2007 年 4 月 24 日 題意:在這個題目中,我們要定義.
:Nuts for nuts..Nuts for nuts.. ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 10944:Nuts for nuts.. 解題者:楊家豪 解題日期: 2006 年 2 月 題意: 給定兩個正整數 x,y.
資料結構實習-一 參數傳遞.
政治大學公企中心必修課-- 社會科學研究方法(量化分析)--黃智聰
觀測量的權 權的觀念與計算.
公用品.  該物品的數量不會因一人的消費而受到 影響,它可以同時地被多人享用。 角色分配  兩位同學當我的助手,負責:  其餘各人是投資者,每人擁有 $100 , 可以投資在兩種資產上。  記錄  計算  協助同學討論.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
逆向選擇和市場失調. 定義  資料不對稱 在交易其中,其中一方較對方有多些資料。  逆向選擇 出現在這個情況下,就是當買賣雙方隨意在 市場上交易,與比較主動交易者作交易為佳 。
845: Gas Station Numbers ★★★ 題組: Problem Set Archive with Online Judge 題號: 845: Gas Station Numbers. 解題者:張維珊 解題日期: 2006 年 2 月 題意: 將輸入的數字,經過重新排列組合或旋轉數字,得到比原先的數字大,
Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標,以減少 測量誤差並可建立問卷的構念效度 驗證性因素分析.
廣電新聞播報品質電腦化 評估系統之研發 國立政治大學 資訊科學系 指導教授:廖文宏 學生:蘇以暄.
Learning Method in Multilingual Speech Recognition Author : Hui Lin, Li Deng, Jasha Droppo Professor: 陳嘉平 Reporter: 許峰閤.
行銷研究 單元六 抽樣方法.
Chapter 10 m-way 搜尋樹與B-Tree
描述統計 描述統計(Descriptive Statistics)-將蒐集到的資料加以整理和記錄,並以數字和統計圖表的方式來分析及解釋資料所具有的特性. 基本統計值(平均數,中位數,標準差,變異量….) 相關性測量(卡方,相關係數,迴歸…)
Probability Distribution 機率分配 汪群超 12/12. 目的:產生具均等分配的數值 (Data) ,並以 『直方圖』的功能計算出數值在不同範圍內出現 的頻率,及繪製數值的分配圖,以反應出該 機率分配的特性。
Chapter 7 Sampling Distribution
Cluster Analysis 目的 – 將資料分成幾個相異性最大的群組 基本問題 – 如何衡量事務之間的相似性 – 如何將相似的資料歸入同一群組 – 如何解釋群組的特性.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 壹 企業研究導論.
: Wine trading in Gergovia ★★☆☆☆ 題組: Contest Volumes with Online Judge 題號: 11054: Wine trading in Gergovia 解題者:劉洙愷 解題日期: 2008 年 2 月 29 日 題意:在 Gergovia.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
抽樣設計概論 抽樣(sampling)的本質 優點 優良樣本的特性 自母群體中選取部分元素為樣本,以得知母群體的特徵.
財務管理概論 劉亞秋‧薛立言 合著 (東華書局, 2007)
Ch 11 建立研究工具的效度與信度.
幼兒行為觀察與記錄 第八章 事件取樣法.
Chapter 12 Estimation 統計估計. Inferential statistics Parametric statistics 母數統計 ( 母體為常態或 大樣本 ) 假設檢定 hypothesis testing  對有關母體參數的假設,利用樣本資料,決定接受或 不接受該假設的方法.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Presentation transcript:

Ch 12 點估計與抽樣分配

本章大綱 抽樣的概念 抽樣的專有名詞 抽樣的原則 影響樣本推論的因素 選擇樣本的目標 抽樣的類型 樣本大小的計算 隨機 / 機率抽樣設計 非隨機 / 非機率抽樣設計 混合抽樣設計 樣本大小的計算

抽樣的概念 優點:節省時間、財力、及人力資源。 缺點:只能估計或預測,有誤差的存在。

抽樣的專有名詞 母群體(Population)或研究母群體(Study population) 樣本 (Sample) 樣本大小 (Sample size) 抽樣設計或策略 (Sampling design or strategy) 抽樣單位 (Sampling unit) 抽樣架構 (Sampling frame) 樣本的統計量 (Sample statistics) 母數 (Population parameters)

抽樣的原則:原則一 在樣本的統計量與母群體的真實母數間通常都有差異存在,而其主要的原因是由於樣本中所選擇的個體不同所造成。 例:A=18,B=20,C=23,D=25。(樣本大小=2) 樣本 樣本平均數(1) (樣本統計量) 母群體平均數(2) (母數) (1)與(2)間的差 AB 19.0 21.5 -2.5 AC 20.5 -1.5 AD 0.0 BC BD 22.5 +1.0 CD 24.0 +2.5

抽樣的原則:原則二 樣本的大小越大,則所估計的母群體母數便越正確。 例:A=18,B=20,C=23,D=25。(樣本大小=3) 樣本平均數(1) (樣本統計量) 母群體平均數(2) (母數) (1)與(2)間的差 ABC 20.67 21.5 -0.83 ABD 21.00 -0.5 ACD 22.00 +0.5 BCD 22.67 +1.17 樣本大小=2,樣本統計量與母數間的差在-2.5到+2.5。 樣本大小=3,樣本統計量與母數間的差在-0.83到+1.17。

抽樣的原則:原則三 所欲研究的母群體變項其差異越大,則樣本統計量與母群體平均數間的差異越大。 例:A=18,B=26,C=32,D=40。(樣本大小=3) 樣本 樣本平均數(1) (樣本統計量) 母群體平均數(2) (母數) (1)與(2)間的差 ABC 25.33 29.0 -3.67 ABD 28.0 -1.0 ACD 30.0 +1.0 BCD 32.67 +3.67 A=18,B=20,C=23,D=25,(1)與(2)間的差在-0.83到+1.17。 A=18,B=26,C=32,D=40,(1)與(2)間的差在-3.67到+3.67。

影響樣本推論的因素 樣本大小﹔ 抽樣母群體變異的範圍。

選擇樣本的目標 選擇樣本的目標: 樣本選擇時可能發生偏誤的情形: 一定的樣本大小,增加估計的精確性﹔ 樣本選擇時能避免偏誤。 以非隨機的方法抽樣﹔ 抽樣架構未正確且完整的涵蓋所有抽樣母體﹔ 抽樣母群體的某一部分無法掌握。

歷史故事 母體 母體 好的抽樣過程 樣本 樣本從整個母體 隨機選出 偏差 樣本 民主黨 共和黨 有電話且(或)有汽車且 (或)為該雜誌讀者的人 民主黨 共和黨 母體

抽樣分配 固定母體並且固定樣本數的條件下,統計量的抽樣分配 (sampling distribution) 是該統計量所有可能值的機率分配。

中央極限定理 從一個平均μ與標準差σ的母體抽樣。如果樣本數持續增加,樣本平均的抽樣分配會接近一個有著平均等於μ跟標準差 等於的常態分配。 從一個平均μ與標準差σ的母體抽樣。如果樣本數持續增加,樣本平均的抽樣分配會接近一個有著平均等於μ跟標準差 等於的常態分配。 對夠大的樣本數n

常態分配母體不同樣本數之樣本平均的抽樣分配 . 4 抽樣分配: n =16 . 3 抽樣分配: n = 4 ) X . 2 ( f 抽樣分配: n = 2 . 1 常態母體 . μ

當樣本數遞增下的抽樣分配 n = 5 Large n n = 20  0.25 0.20 0.15 P(x) 0.10 0.05 0.4 0.00 0.3 X P(x) 0.2 0.1 n = 20 0.0 0.20 -  X P(x) 0.10 0.00 X

中央極限定理 中央極限定理說明樣本平均 的抽樣分配會接近常態分配,無論樣本來自的母體是何種分配。 中央極限定理說明樣本平均 的抽樣分配會接近常態分配,無論樣本來自的母體是何種分配。 此定理讓我們有能力產生樣本平均可能存在區域的機率陳述,同時計算 與它所估計的母體平均離多遠的機率。

中央極限定理的效果:各種不同母體與各種不同樣本數之 的分配 中央極限定理的效果:各種不同母體與各種不同樣本數之 的分配 常態 均勻 右偏 不規則 母體 n = 2 n = 30  X  X  X  X

中央極限定理的三個面向 如果樣本數夠大, 的抽樣分配是常態的。 的期望值等於μ。 的標準差等於 。

抽樣的類型 抽樣的型態 隨機/機率抽樣 簡單隨機抽樣 分層隨機抽樣 分層比例抽樣 分層非比例抽樣 混合抽樣 非隨機/機率抽樣 叢集抽樣 單一階段 雙階段 多階段 定額抽樣 偶遇抽樣 立意抽樣 滾雪球抽樣 系統抽樣

隨機 / 機率抽樣設計 隨機/機率樣本須符合下列兩要件: 隨機/機率樣本主要的優點: 相等:被抽取的機率相同﹔ 獨立:不受其他因素影響。 可代表抽樣的母群體﹔ 可作為機率理論統計的資料。

抽選隨機樣本的方法 抽選隨機樣本的方法 籤筒﹔ 電腦程式抽樣﹔ 亂數表抽樣。 抽選隨機樣本的不同系統 不置回抽樣﹔ 置回抽樣。

亂數表抽樣程序 步驟一 確認母群體中所有抽樣單位的數量。 步驟二 將每一個抽樣單位予以編號,從1號開始。 步驟三 隨機選一個行與列的交會點為起始點。 步驟四 從亂數表中隨機選相同位數的數字。 步驟五 決定樣本大小。 步驟六 從亂數表中抽選所需數量的抽樣單位。

隨機 / 機率抽樣設計的種類 簡單隨機抽樣(Simple random sampling) 分層隨機抽樣(Stratified random sampling) 叢集抽樣(Cluster sampling)

簡單隨機抽樣的步驟 確認母群體中的每一個抽樣單位,並予以編號。 步驟一 步驟二 決定樣本大小(n)。 步驟三 以籤筒、亂數表、或電腦程式來抽選樣本。

分層隨機抽樣的步驟 步驟一 確認母群體中的每一個抽樣單位。 步驟二 決定母群體的分層數(K)。 步驟三 每個個體分到適當的分層中。 步驟四 將每個分層內的個體予以編號。 步驟五 決定樣本大小。 步驟六 決定使用比例或非比例分層抽樣。

分層隨機抽樣的步驟(續) 分層非比例抽樣 分層比例抽樣 步驟七 決定每一層要抽出的個數。 步驟八 以簡單隨機抽樣抽出每一層所需的個數。 決定每一層佔母體的比率(p)。 決定每一層需抽出的個數(樣本大小) × (p)。 步驟九

叢集抽樣 將抽樣母體分成若干團體,稱為“叢集”。 對每個叢集使用簡單隨機抽樣,抽出所需個數。 範例:

非隨機 / 非機率抽樣設計 定額抽樣(quota sampling)﹔ 偶遇抽樣(accidental sampling)﹔ 立意抽樣(judgemental or purpose sampling)﹔ 滾雪球抽樣(snowball sampling)。

定額抽樣 主要考量: 優點: 缺點: 很容易接近母群體的便利性﹔ 研究者受母群體一些顯而易見的特質所引導。 花費最少的抽樣方法﹔ 不需要母群體的相關資訊﹔ 保證所抽選的人確為研究所需的人。 缺點: 樣本非隨機樣本﹔ 抽選個體具有某特質,無法代表母體。

偶遇抽樣 主要考量: 很容易接近母群體的便利性。 優、缺點與定額抽樣相似。但是較無法獲得所想要的資訊。 應用面: 市場調查﹔ 新聞報導。

立意抽樣 研究者僅選擇具有所需資訊的人來訪問。 應用面: 建構歷史真相﹔ 描述現象﹔ 發展鮮為人知的事實。

滾雪球抽樣 使用網絡來選擇樣本的過程。 應用面: 缺點: 溝通型態﹔ 決策﹔ 團體中知識的傳播。 整體樣本的選擇依賴第一次所接觸的人。 母群體很大不適用。

混合抽樣設計(系統抽樣設計) 第一個體以簡單隨機抽樣產生,其餘個體以等距方式抽出。 範例: 抽選出樣本 Interval (k) 抽樣架構 1 14 26 39 2 15 27 40 3 16 28 41 4 17 29 42 5 18 30 43 6 19 31 44 7 20 32 45 8 21 33 46 9 22 34 47 10 23 35 48 11 24 36 49 12 25 37 50 13 38 3 8 13 18 23 28 33 38 43 48 Interval (k) Interval (k) Interval (k)

系統抽樣的步驟 步驟一 準備所有抽樣單位(N)的名冊。 步驟二 決定樣本大小(n)。 步驟三 決定等距的寬度= = (K)。 步驟四 以簡單隨機抽樣抽選第一個個體。 步驟五 相隔等距依序抽出其餘個體。

決定樣本大小的考慮因素 信心水準的範圍? 估計母群體參數的正確程度? 估計研究變項的變異程度? 研究預算?

決定信心範圍的公式 公式:  =母群體平均數的估計值  =樣本平均數  =95%的信心水準  =標準誤  =標準差  =樣本大小

範例 假設決定容忍0.5的誤差,表示: 換句話說,希望 或 信心水準 0.20 0.10 0.05 0.02 0.01 0.001 t值 換句話說,希望      或 信心水準 0.20 0.10 0.05 0.02 0.01 0.001 t值 1.282 1.645 1.96 2.326 2.576 3.291

 σ值的獲得方式 猜測﹔ 諮詢專家﹔ 由先前相似的研究中獲得﹔ 先以試測(pilot study)來計算。