第7章研究樣本的選擇.

Slides:

Advertisements

Similar presentations

第二章研究主題（研究題目）與研究問題.

Advertisements

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆資料分析與表達.

Ch 12 點估計與抽樣分配.

第三講 Recode、missing value、假設檢定與信賴區間

布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式

第七章抽樣與抽樣分配蒐集統計資料最常見的方式是抽查。這牽涉到兩個問題：抽出的樣本是否具有代表性?是否能反應出母體的特徵?

Ch05 點估計與抽樣分配授課老師薛欣達. 學習目標估計母體參數的樣本統計量應用中央極限定理根據估計式的需求性質判斷估計式的好壞應用自由度的概念利用樣板計算抽樣分配與相關的結果.

Section 1.2 Describing Distributions with Numbers 用數字描述分配.

第三部分：研究設計 ( 一）抽樣（研究對象）. 一、研究設計描述或計畫有關資料蒐集和分析的方法與過程，以便解答研究問題或驗證研究假設，最後檢核研究目的是否達成。包括：研究對象（抽樣）研究工具實施程序資料處理.

Event Sampling 事件取樣法. 關心重點為「事件」本身明確的焦點行為清楚掌握主題 - 當「事件」出現時才開始記錄記錄程序等待目標事件的發生開始記錄事件結束，停止記錄.

Advanced Chemical Engineering Thermodynamics

指導教授：陳淑媛學生：李宗叡李卿輔.  利用下列三種方法 (Edge Detection 、 Local Binary Pattern 、 Structured Local Edge Pattern) 來判斷是否為場景變換，以方便使用者來找出所要的片段。

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參實驗法.

亂數產生器安全性評估之統計測試 SEC HW7 姓名：翁玉芬學號：

Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內，例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料，通常用卡方檢定類別資料分析卡方檢定卡方檢定基本理論一個含有 k 項的試驗，設 p i.

: OPENING DOORS ? 題組： Problem Set Archive with Online Judge 題號： 10606: OPENING DOORS 解題者：侯沛彣解題日期： 2006 年 6 月 11 日題意： - 某間學校有 N 個學生，每個學生都有自己的衣物櫃.

消費者物價指數反映生活成本。當消費者物價指數上升時，一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹（inflation）來描述一般物價持續上升的現象，而物價膨脹率（inflation rate）為物價水準的變動百分比。

STAT0_sampling Random Sampling  母體： Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣本，若每一樣本被抽出的機率是一樣的，這樣本稱為隨機樣本 (random sample)

第 4 章迴歸的同步推論與其他主題.

1. 假設以下的敘述為一未提供 “ 捷徑計算 ” 能力的程式段，試用程式設計的技巧，使此敘述經此改寫的動作後，具有與 “ 捷徑計算 ” 之處理方法相同之處理模式。 if and then E1 else E2 endif.

Structural Equation Modeling Chapter 7 觀察變數路徑分析＝路徑分析觀察變數路徑分析.

STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性，以列聯表來表示  討論二連續隨機變數時，可以作 x-y 散佈圖觀察它們的關係強度  以相關係數來代表二者關係的強度.

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆資料分析與表達.

Department of Air-conditioning and Refrigeration Engineering/ National Taipei University of Technology 模糊控制設計使用 MATLAB 李達生.

Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.

1 單元三查詢結果的引用分析 Web of Science 利用指引查看出版及被引用情況在查詢結果的清單中，可以瀏覽近 20 年來查詢主題出版和被引用的情況。

2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ，才能代表母體 Sample mean 是一隨機變數，隨著每一次抽出來的樣本值不同，它的值也不同，但會有規律性為了要知道估計的精確性，必需要知道樣本平均數.

論文研討 2 學分授課教師：吳俊概.

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 貳研究設計.

Chapter 13 塑模靜態觀點：物件圖 Static View : Object Diagram.

:Problem D: Bit-wise Sequence ★★★☆☆ 題組： Problem Set Archive with Online Judge 題號： 10232: Problem D: Bit-wise Sequence 解題者：李濟宇解題日期： 2006 年 4 月 16.

第三部分：研究設計 ( 二）：研究工具的信效度與研究效度（第九章之第 306 頁 -308 頁；第四章）

: Happy Number ★ ? 題組： Problem Set Archive with Online Judge 題號： 10591: Happy Number 解題者：陳瀅文解題日期： 2006 年 6 月 6 日題意：判斷一個正整數 N 是否為 Happy Number.

選舉制度、政府結構與政黨體系 Cox (1997) Electoral institutions, cleavage strucuters, and the number of parties.

CH 15- 元件可靠度之驗證  驗證方法  指數模式之可靠度驗證  韋式模式之可靠度驗證  對數常態模式之可靠度驗證  失效數為零時之可靠度估算  各種失效模式之應用.

第二十一章研究流程、論文結構　　　　　　　與研究範例 21-1 　研究流程 21-2 　論文結構 21-3 　研究範例.

緒論統計的範圍敘述統計推論統計有母數統計無母數統計實驗設計統計的本質大量數字客觀.

: Multisets and Sequences ★★★★☆ 題組： Problem Set Archive with Online Judge 題號： 11023: Multisets and Sequences 解題者：葉貫中解題日期： 2007 年 4 月 24 日題意：在這個題目中，我們要定義.

公司加入市場的決定. 定義  平均成本 = 總成本 ÷ 生產數量 = 每一單位產量所耗的成本  平均固定成本 = 總固定成本 ÷ 生產數量  平均變動成本 = 總變動成本 ÷ 生產數量.

:Nuts for nuts..Nuts for nuts.. ★★★★☆ 題組： Problem Set Archive with Online Judge 題號： 10944:Nuts for nuts.. 解題者：楊家豪解題日期： 2006 年 2 月題意：給定兩個正整數 x,y.

Lecture 7 Sorting in Linear Time. Sorting in Linear Time2 7.1 Lower bounds for sorting 本節探討排序所耗用的時間複雜度下限。任何一個以比較為基礎排序的演算法，排序 n 個元素時至少耗用 Ω(nlogn) 次比較。

公用品.  該物品的數量不會因一人的消費而受到影響，它可以同時地被多人享用。角色分配  兩位同學當我的助手，負責：  其餘各人是投資者，每人擁有 $100 ，可以投資在兩種資產上。  記錄  計算  協助同學討論.

方案設計 —評估考核張紉.

Section 4.2 Probability Models 機率模式. 由實驗看機率實驗前先列出所有可能的實驗結果。 – 擲銅板：正面或反面。 – 擲骰子： 1~6 點。 – 擲骰子兩顆： (1,1),(1,2),(1,3),… 等 36 種。決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。

JAVA 程式設計與資料結構第二十章 Searching. Sequential Searching Sequential Searching 是最簡單的一種搜尋法，此演算法可應用在 Array 或是 Linked List 此等資料結構。 Sequential Searching 的 worst-case.

演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.

845: Gas Station Numbers ★★★ 題組： Problem Set Archive with Online Judge 題號： 845: Gas Station Numbers. 解題者：張維珊解題日期： 2006 年 2 月題意：將輸入的數字，經過重新排列組合或旋轉數字，得到比原先的數字大，

Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標，以減少測量誤差並可建立問卷的構念效度驗證性因素分析.

Learning Method in Multilingual Speech Recognition Author : Hui Lin, Li Deng, Jasha Droppo Professor: 陳嘉平 Reporter: 許峰閤.

行銷研究單元六抽樣方法.

Chapter 10 m-way 搜尋樹與B-Tree

描述統計描述統計(Descriptive Statistics)-將蒐集到的資料加以整理和記錄,並以數字和統計圖表的方式來分析及解釋資料所具有的特性. 基本統計值(平均數,中位數,標準差,變異量….) 相關性測量(卡方,相關係數,迴歸…)

Probability Distribution 機率分配汪群超 12/12. 目的：產生具均等分配的數值 (Data) ，並以『直方圖』的功能計算出數值在不同範圍內出現的頻率，及繪製數值的分配圖，以反應出該機率分配的特性。

Chapter 7 Sampling Distribution

論文研討 2 學分授課教師：吳俊概. 第一節論文發表的目的第二節論文發表的歷程第三節投稿過程第四節退稿處理學術期刊論文的製作與發表.

Cluster Analysis 目的 – 將資料分成幾個相異性最大的群組基本問題 – 如何衡量事務之間的相似性 – 如何將相似的資料歸入同一群組 – 如何解釋群組的特性.

連續隨機變數連續變數：時間、分數、重量、……

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 壹企業研究導論.

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 壹企業研究導論.

統計緒論 _ Chap2 資料整理 2.1 基本的資料整理  排序，例： length of 60 sea trouts ( 課本 p13 ) ( 可用 EXCEL)  長條圖，例 2.1 number of times of delay in a week for the 48 flights.

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參資料蒐集的方法.

: Finding Paths in Grid ★★★★☆ 題組： Contest Archive with Online Judge 題號： 11486: Finding Paths in Grid 解題者：李重儀解題日期： 2008 年 10 月 14 日題意：給一個 7 個 column.

抽樣設計概論抽樣(sampling)的本質優點優良樣本的特性自母群體中選取部分元素為樣本,以得知母群體的特徵.

財務管理概論劉亞秋‧薛立言合著（東華書局, 2007)

幼兒行為觀察與記錄第八章事件取樣法.

Chapter 12 Estimation 統計估計. Inferential statistics Parametric statistics 母數統計 ( 母體為常態或大樣本 ) 假設檢定 hypothesis testing  對有關母體參數的假設，利用樣本資料，決定接受或不接受該假設的方法.

: How many 0's? ★★★☆☆ 題組： Problem Set Archive with Online Judge 題號： 11038: How many 0’s? 解題者：楊鵬宇解題日期： 2007 年 5 月 15 日題意：寫下題目給的 m 與 n(m

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆資料分析與表達.

Presentation transcript:

第7章研究樣本的選擇

第一節選樣的基本概念母群體 (Populations) 第一節　選樣的基本概念母群體 (Populations) 所謂母群體是研究者想要探討的、具有某種共同特徵的個案集合，母群體有許多分類標準，茲分述如下：

Ⅰ、實際母群體 Ⅱ、假想母群體一、依母群體是否存在分類某校某年級學生年齡的全部觀察值都儲存於學校的記錄中，稱為實際母群體。例如：我國罹患高血壓的人數全部有多少，實際數目無從查起。

二、依觀察值的個數分類 Ⅰ、有限母群體 Ⅱ、無限母群體例如：一枚銅板可以想像它投擲無數次，投擲結果的數字為無限數字。

Ⅰ、目標母群體 Ⅱ、抽樣母群體三、依抽樣範圍大小分類指研究問題所包含的全部可能觀察值，也就是研究者想要做推論的整個特定個案族群。例如：台灣地區所有的乳癌患者。 Ⅱ、抽樣母群體

Ⅱ、抽樣母群體人數仍然十分龐大，必需進一步抽樣。例如：以1996年台灣地區罹患乳癌的患者為例，台灣地區該年度確定乳癌診斷者共有 2,952 人，目標母群體人數相當多且分布極廣，不太可能以此 2,952 人為抽樣母群體。此時可以將抽樣母群體設定於北部地區近千名的乳癌患者為可及母群體。

樣本與抽樣 Ⅰ、選樣單位(Sampling Unit) Ⅱ、選樣架構(Sampling Frame) 大多數的研究中，選樣單位以個人為單位。例如：調查家戶收入時，由於資料收集是以一個家庭為單位，因此選樣單位便是家庭。 Ⅱ、選樣架構(Sampling Frame) 例如：以台北市文山區興德里為可及母群體，則該里的里民名冊即為選樣架構。

抽樣方法與種類 Ⅰ、機率取樣(Probability Sampling) Ⅱ、非機率取樣(Nonprobability Sampling) 抽樣是否符合機率的原則，可分為 Ⅰ、機率取樣(Probability Sampling) 簡單隨機取樣(simple random sampling)、分層取樣(stratified sampling)、系統取樣(systematic sampling)以及集束取樣(cluster sampling)。 Ⅱ、非機率取樣(Nonprobability Sampling) 方便取樣、配額取樣及立意取樣。

決定選樣方法的因素如何選擇最適宜的選樣方法則有賴於以下幾個原則： 1. 研究者對母群體結構的認識。 2. 母群體中所欲研究的特質之變異情形。 3. 執行選樣過程的可行性。 4. 研究問題的本質。

執行選樣的步驟 1. 界定目標母群體，定出合乎研究要求的樣本條件。 2. 從母群體中找出一部分研究者易於接觸的可及母群體。 3. 決定樣本數及選樣方法。 4. 徵詢研究樣本的研究參與意願。 5. 撰寫研究結果時須闡明樣本代表性與結果的關聯。

第二節　機率取樣機率取樣的特徵是母群體中的每一個選樣單位都有機會被選為研究樣本，不過不見得每一個選樣單位入選的機率都一樣。

Ⅰ、定義 Ⅱ、過程簡單隨機取樣(Simple Random Sampling) 母群體中的所有選樣單位被選為研究樣本的的機率相等。 1. 界定母群體。 2. 設立選樣架構。 3. 編碼。 4. 隨機抽取序號。表7-1　隨機號碼表表7-2 　隨機號碼抽取示意圖

表7-1　隨機號碼表

表7-1　隨機號碼表（續）

表7-2 　隨機號碼抽取示意圖

Ⅲ、優點樣本的選擇不受研究者的喜好左右，所選的樣本特質與母群體特質的差異純粹來自機率。 2. 概念單純客觀，較容易理解、被人接受。

Ⅳ、缺點 1. 執行費力，須列出選樣架構、編碼後再一一隨機抽取樣本，相當費時且瑣碎。 2. 必須事先掌握選樣架構，一旦無法取得名單，則無法進行。

Ⅰ、定義 Ⅱ、過程分層取樣 (Stratified Sampling) 1. 依據母群體的特質加以分層，再從每一分層中隨機地選出適當的樣本。 2. 分層取樣法主要是用於母群體某些特質分布不均勻，有可能因此造成抽出樣本的代表性不強時。 Ⅱ、過程 1. 分層。 2. 依比例決定分層應取樣本數。

Ⅲ、優點 Ⅳ、缺點 1. 提高樣本的代表性。 2. 可同時分析分層資料及總和資料。 3. 變異性的估算較準確。 1. 相較於簡單隨機抽樣，較花費人力及時間。 2. 有時無法從族群中獲得重要變數之資料加以分層。 3. 需事先掌握選樣架構的資料。

Ⅰ、定義 Ⅱ、過程系統選樣(Systematic Sampling) 選樣架構中的選樣單位被選為研究樣本時，彼此於選樣架構內的距離是相等的。 Ⅱ、過程 1. 先訂出所需的樣本數(n) 。 2. 計算樣本間隔。 3. 抽取第一個研究樣本。 4. 系統抽樣。

Ⅲ、優點 Ⅳ、缺點 1. 相較於簡單隨機抽樣，方便省時。 2. 有時並不需要完整的選樣架構。 3. 如果選樣架構的排列，有由小至大的趨勢，則較易取得此一趨勢的比例代表。 Ⅳ、缺點若選樣架構含有周期變化的排列，則易出現選樣誤差。

Ⅰ、定義 Ⅱ、過程集束選樣(Cluster Sampling) 母群體中，樣本以集合方式聚集存在，選樣時以樣本集合為單位，從事隨機取樣，被選中的樣本集合內之所有選樣單位為研究樣本，適用於集合間同質性高的情境。 Ⅱ、過程 1. 定義集合單位。 2. 隨機抽取集合單位。

Ⅲ、優點 1. 不需要母群體之完整的選樣架構。 2. 較經濟省時。 Ⅳ、缺點如果集合間的異質性高，則易產生選樣誤差。

第三節非機率取樣 Ⅰ、方便取樣(Convenience Sampling) Ⅱ、配額選樣(Quota Sampling) 第三節　非機率取樣 Ⅰ、方便取樣(Convenience Sampling) Ⅱ、配額選樣(Quota Sampling) Ⅲ、立意取樣(Purposive Sampling)

第四節　樣本數的估算設計選樣計畫時，相當困難的一個環節是研究者應該招募多少研究樣本。理論上來說樣本數愈大愈接近母群體，研究結果愈不會造成偏差；但是所花費的時間和經費相對增加，不太符合經濟效益。因此在研究成本的考量上，研究者通常必須依統計結果的誤差容許度來推算研究最少樣本數。

一般而言並沒有一個簡單的公式可以計算樣本數需要多少，所使用的統計方法不同，樣本數的估算法也會隨之不同。 1. 第一類誤差的容許度，即α的大小，一般設定為0.05。 2. 檢定力的大小，一般設定為0.8以上。 3. 自變數與依變數間的強度關係，樣本數的估算原理是在控制第一類誤差在0.05時（設α＝ 0.05）需要多少樣本數才可能有80%的檢定力（設β＝0.2），證明自變數與依變數間有某種程度的強度關係。

作業請說明選擇選樣方法的決定因素有那些？