第7章 研究樣本的選擇
第一節 選樣的基本概念 母群體 (Populations) 第一節 選樣的基本概念 母群體 (Populations) 所謂母群體是研究者想要探討的、具有某種共同特徵的個案集合,母群體有許多分類標準,茲分述如下:
Ⅰ、實際母群體 Ⅱ、假想母群體 一、依母群體是否存在分類 某校某年級學生年齡的全部觀察值都儲存於學校的記錄中,稱為實際母群體。 例如:我國罹患高血壓的人數全部有多少,實際數目無從查起。
二、依觀察值的個數分類 Ⅰ、有限母群體 Ⅱ、無限母群體 例如:一枚銅板可以想像它投擲無數次,投擲結果的數字為無限數字。
Ⅰ、目標母群體 Ⅱ、抽樣母群體 三、依抽樣範圍大小分類 指研究問題所包含的全部可能觀察值,也就是研究者想要做推論的整個特定個案族群。例如:台灣地區所有的乳癌患者。 Ⅱ、抽樣母群體
Ⅱ、抽樣母群體 人數仍然十分龐大,必需進一步抽樣。例如:以1996年台灣地區罹患乳癌的患者為例,台灣地區該年度確定乳癌診斷者共有 2,952 人,目標母群體人數相當多且分布極廣,不太可能以此 2,952 人為抽樣母群體。此時可以將抽樣母群體設定於北部地區近千 名的乳癌患者為可及母群體。
樣本與抽樣 Ⅰ、選樣單位(Sampling Unit) Ⅱ、選樣架構(Sampling Frame) 大多數的研究中,選樣單位以個人為單位。例如:調查家戶收入時,由於資料收集是以一個家庭為單位,因此選樣單位便是家庭。 Ⅱ、選樣架構(Sampling Frame) 例如:以台北市文山區興德里為可及母群體,則該里的里民名冊即為選樣架構。
抽樣方法與種類 Ⅰ、機率取樣(Probability Sampling) Ⅱ、非機率取樣(Nonprobability Sampling) 抽樣是否符合機率的原則,可分為 Ⅰ、機率取樣(Probability Sampling) 簡單隨機取樣(simple random sampling)、分層取樣(stratified sampling)、系統取樣(systematic sampling)以及集束取樣(cluster sampling)。 Ⅱ、非機率取樣(Nonprobability Sampling) 方便取樣、配額取樣及立意取樣。
決定選樣方法的因素 如何選擇最適宜的選樣方法則有賴於以下幾 個原則: 1. 研究者對母群體結構的認識。 2. 母群體中所欲研究的特質之變異情形。 3. 執行選樣過程的可行性。 4. 研究問題的本質。
執行選樣的步驟 1. 界定目標母群體,定出合乎研究要求的樣本條件。 2. 從母群體中找出一部分研究者易於接觸的可及母群體。 3. 決定樣本數及選樣方法。 4. 徵詢研究樣本的研究參與意願。 5. 撰寫研究結果時須闡明樣本代表性與結果的關聯。
第二節 機率取樣 機率取樣的特徵是母群體中的每一個選樣單位都有機會被選為研究樣本,不過不見得每一個選樣單位入選的機率都一樣。
Ⅰ、定義 Ⅱ、過程 簡單隨機取樣(Simple Random Sampling) 母群體中的所有選樣單位被選為研究樣本的的機率相等。 1. 界定母群體。 2. 設立選樣架構。 3. 編碼。 4. 隨機抽取序號。 表7-1 隨機號碼表 表7-2 隨機號碼抽取示意圖
表7-1 隨機號碼表
表7-1 隨機號碼表(續)
表7-2 隨機號碼抽取示意圖
Ⅲ、優點 樣本的選擇不受研究者的喜好左右 ,所選的樣本特質與母群體特質的差異純粹來自機率。 2. 概念單純客觀,較容易理解、被人接受。
Ⅳ、缺點 1. 執行費力,須列出選樣架構、編碼後再一一隨機抽取樣本,相當費時且瑣碎。 2. 必須事先掌握選樣架構,一旦無法取得名單,則無法進行。
Ⅰ、定義 Ⅱ、過程 分層取樣 (Stratified Sampling) 1. 依據母群體的特質加以分層,再從每一分層中隨機地選出適當的樣本。 2. 分層取樣法主要是用於母群體某些特質分布不均勻,有可能因此造成抽出樣本的代表性不強時。 Ⅱ、過程 1. 分層。 2. 依比例決定分層應取樣本數。
Ⅲ、優點 Ⅳ、缺點 1. 提高樣本的代表性。 2. 可同時分析分層資料及總和資料。 3. 變異性的估算較準確。 1. 相較於簡單隨機抽樣,較花費人力及時間。 2. 有時無法從族群中獲得重要變數之資料加以分層。 3. 需事先掌握選樣架構的資料。
Ⅰ、定義 Ⅱ、過程 系統選樣(Systematic Sampling) 選樣架構中的選樣單位被選為研究樣本時,彼此於選樣架構內的距離是相等的。 Ⅱ、過程 1. 先訂出所需的樣本數(n) 。 2. 計算樣本間隔。 3. 抽取第一個研究樣本。 4. 系統抽樣。
Ⅲ、優點 Ⅳ、缺點 1. 相較於簡單隨機抽樣,方便省時。 2. 有時並不需要完整的選樣架構。 3. 如果選樣架構的排列,有由小至大的趨勢,則較易取得此一趨勢的比例代表。 Ⅳ、缺點 若選樣架構含有周期變化的排列, 則易出現選樣誤差。
Ⅰ、定義 Ⅱ、過程 集束選樣(Cluster Sampling) 母群體中,樣本以集合方式聚集存在,選樣時以樣本集合為單位,從事隨機取樣,被選中的樣本集合內之所有選樣單位為研究樣本,適用於集合間同質性高的情境。 Ⅱ、過程 1. 定義集合單位。 2. 隨機抽取集合單位。
Ⅲ、優點 1. 不需要母群體之完整的選樣架構。 2. 較經濟省時。 Ⅳ、缺點 如果集合間的異質性高, 則易產生選樣誤差。
第三節 非機率取樣 Ⅰ、方便取樣(Convenience Sampling) Ⅱ、配額選樣(Quota Sampling) 第三節 非機率取樣 Ⅰ、方便取樣(Convenience Sampling) Ⅱ、配額選樣(Quota Sampling) Ⅲ、立意取樣(Purposive Sampling)
第四節 樣本數的估算 設計選樣計畫時,相當困難的一個環節是研究者應該招募多少研究樣本。理論上來說樣本數愈大愈接近母群體,研究結果愈不會造成偏差 ;但是所花費的時間和經費相對增加,不太符合經濟效益。因此在研究成本的考量上,研究者通常必須依統計結果的誤差容許度來推算研究最少樣本數。
一般而言並沒有一個簡單的公式可以計算樣本數需要多少,所使用的統計方法不同,樣本數的估算法也會隨之不同。 1. 第一類誤差的容許度,即α的大小,一般設定 為0.05。 2. 檢定力的大小,一般設定為0.8以上。 3. 自變數與依變數間的強度關係,樣本數的估算 原理是在控制第一類誤差在0.05時(設α= 0.05)需要多少樣本數才可能有80%的檢定力 (設β=0.2),證明自變數與依變數間有某種 程度的強度關係。
作業 請說明選擇選樣方法的決定因素有那些?