第六章 衡量
6.1 衡量的定義 「衡量」(measurement,測量) 是針對某一特定對象、人或組織,有關某種特徵或行為 (消費、所得、人格特質……),賦予其一個值,使其數值能代表 (或符合) 構念中所代表的概念或狀況。
6.1.1 數值系統可分四大類 名義尺度 (nominal scale):係為了標示目的而指定之任意數值,例如,身分證號碼、性別、運動員之背號及學生的學號等。此種數值彼此間並無大小、順序及比率的關係,也就是說以1表示男性,2表示女性時 順序尺度 (ordinal scale):不僅可表示類別,也可表示出事物間之等級或順序。例如第一、二、三名來表示參賽者之優劣。故順序變數可比大小及前後,但前後距離不一定相等。例如,5 > 4,但5-41。例如,研究者常用Likert五點計分量表所得數據,可能是1~5分,亦可能是-2~+2分,這種資料屬於順序變數。
等距尺度 (interval scale):又稱為區間尺度,不僅可表示名稱和順序或等級,還可表示不同等級間之距離。例如 ,5-4=1,但4 2x2。例如溫度、明暗或音強等皆屬於此類尺度。 比率尺度 (ratio scale):具有前三者的資料特性,且可以做倍數比較。也有距離和絕對的零點。例如,4=2x2。
「衡量」可用「同形」(isomorphism) 觀念來衡量。所謂「同形」就是結構同形,大小比例沒有關係,只要同比例放大縮小即可。
6.2 數值指派的「規則」 牽涉到如何將衡量的結果,能推論到構念層次 (以A表示)。 有4種情況 (圖6-1),其中,情況二,衡量變數a與構念A最「同形」,變數a這個ECV最能同比例代表構念A。 「情況1」是有信度,但效度低;「情況3」是信度低,且效度低;「情況4」是沒有信度,且沒有效度。
6.3 誤差與信度 信度值愈接近1,表示信度愈高。 衡量誤差 (誤差分數) 的來源有2大類: (1) 系統性誤差:它會對衡量結果產生一致性固定的影響。 (2) 隨機性誤差:主要是來自受訪者身心狀況、情境因素,及衡量試題的干擾影響。
6.3.1 系統性誤差 只要使用衡量工具,系統性誤差 (systemtic errors) 就會產生。系統性誤差對個案間及研究間的影響方式都是「固定」不變的。
6.3.2 隨機性誤差 隨機性誤差:隨機性誤差 (又稱非系統性誤差) 及系統性誤差之主要來源,可分成下列6種因素 受測者誤差:因受測者本身特質 情境因素:訪談時任何外力的影響。街頭 (機場) 訪談比在家裡 (公司) 更易受情境因素的影響。 施測者誤差:訪談者的解釋、重述、語氣、態度和藹可親、肢體動作、草率的資料處理……等等。 量表的使用方式 資料的分析處理之影響 系統性誤差:(1) 衡量工具內容:混淆 (區別效度不佳)、語意不清 (信度不佳) (2) 衡量項目 (items) 不足(3) 有沒有引導作答 (leading) 的嫌疑
6.4 量表的設計 「量表化」(scaling),它是一種衡量的程序,旨在將衡量對象或欲衡量的特性指派某些數值,以便將衡量對象之特性數值化。 量表是用一個以上的指標 (indicant, item, manifested) 來衡量某個體∕事物的特性。
6.4.1 量表分類方法 量表建構的技術 (程序):可分為: (1) Likert量表,採用「評分加總」之計分方式。 (2) Thurstone量表,又稱共識量表。 (3) 語意差異法,是屬因素量表之一。 (4) Guttman量表,採用累計量表計分方式。 (5) 配對比較量表。
6.5 「量表」設計的技術 量表設計的技術,可分為下列5大類: Likert量表 李克特量表 (Likert scale) 是屬「評分加總式量表」最常用的一種,顧名思義,屬同一「構念」的「這些項目」是用「加總」方式來計分,單獨或個別項目是無意義的。
Thurstone量表 是由一群「專家」依據下列3個準則來篩選項目:(1) 與研究主題有關聯性。(2) 題意是否模糊 (即專家對該題去留意見不一致者)。(3) 項目所表達之態度層次。
語意差異量表 旨在瞭解受訪者對事物的認知 (形象、競爭優勢……)。
表6-6是一個典型語意差異量表
Guttman量表 用來檢定具有不同強弱程度之一組項目是否都屬「單一構面」
配對比較量表 利用配對比較的方法來衡量人們態度的一種量表。例如,某研究者想了解 ABCD 4種物品 (或規劃的四種準則) 的重要性,樣本選取100名受訪者進行成對 由以上成對比對的結果,可知B物品 (準則) 最受歡迎。
6.6 效度 量表會有信度 (reliability)、效度 (validity) 問題發生,主要是量表本身有「衡量誤差」存在。 兩者關係,可用數學式「若P則Q」或 (P → Q) 來表示,即「效度 → 信度」。 (1) 有信度不一定有效度 (逆定理「Q → P」不一定成立)。 (2) 無信度一定無效度 (~Q → ~P)。 (3) 有效度一定有信度 (P → Q)。 常見的效度,有下列3種: 內容效度 效標關聯效度 建構效度
6.6.1 內容效度 是指量表「內容的適切性」,即量表內容是否涵蓋所要衡量的構念。 可分成取樣 (sampling) 效度及表面 (face) 效度兩種,兩者都沒有應用到統計方法來計算,都只仰賴專家主觀的評判。 取樣效度:量表所包含的項目是否能代表母體構念的項目∕題目 (item)。 表面效度:是指量表項目和形式上,給人的主觀印象,可適切地衡量其欲測得的特質或行為。故表面效度是請專家來看看該量表有沒有效度。
6.6.2 效標關聯效度 效標關聯效度並不涉及構念的問題。 是指使用中的衡量工具與「其他衡量工具」(包括目前與未來之準則效標),比較兩者是否具有關聯性。 同時效標:是指衡量工具與效標同時出現。 預測效標:是指衡量工具出現在效標之前。
6.6.3 建構效度 「量表能衡量理論上某構念或特質的程度」 常見的建構效度有2類: 收歛 (convergent) 效度 區別 (discriminant) 效度
一、收歛效度 來自相同構念的這些項目,彼此之間相關要高。 收歛效度及區別效度常用的「統計檢定」有3種方法: 以「相關分析」來計算某一構念之這些項目的值,並將 值的顯著性 (值) 排列成二維矩陣若每一個r值彼此都達到顯著水準之個數愈多,則表示該量表建構效度愈佳。 以「因素分析」(factor analysis) 求量表各項目之因素結構 (structure) 矩陣。同一構念中,若因素負荷量的值愈大項目」,否則刪除後再重新執行一次因素分析),表示收歛效度愈高。 以「多特質多方法」(muti-traits multi-methods, MTMM) 來檢定:用同一個「異質的特質」(hetero-traits) 衡量工具,以不同的「方法」
6.6.4 MTMM之統計分析
二、區別效度 不同的兩個構面,能區別的程度。 以因素分析角度來看,就是各項目只能在其屬的因素中「因素負荷量」大於0.50 (要接近1),反之,各項目在其非屬的因素中「因素負荷量」要愈小愈好 (接近0)。
6.7 信度 一個衡量工具包含「變數誤差」(variable errors) 的程度。即在任何一次衡量中,觀察值之間呈現之不一致,或是採用相同衡量工具,然而對特定單位施測,每次所得結果都不一樣 信度是指衡量資料的可靠性,受測者在相同條件下,重複測量是否得相同結果 (穩定性),或相同構念 (性質相同、目的相同) 以不同題目測量所得結果的「一致性」程度
6.7.1 信度種類及算法 信度意指一種衡量工具的精確性或是正確性,其意義主要有二:(1) 穩定性 (stability),(2) 一致性 (consistency)。 常見信度可分為下列3大類: 等值性 (equivalence):又稱「複本法」,專門為檢定同一測驗中不同複本上分數的一致。 複本信度 (equicalent-forms):同時設計兩份問卷,每份問卷使用不同問項 (稱為複本),並讓同一受訪者問答,而此同一測驗中之兩種複本的相關程度 (相關係數) 折半信度 (split-half):將同一量表中「項目內容相似」,折成兩半 (一般分奇數題與偶數題),求這兩個「各半」測驗總分之相關。折半信度係數
穩定性 (stability):對同一批樣本,前後兩期測兩次 一致性 (consistency) 折半法:折半信度 Kuder-Richardson法 一致性法:例如,Cronbach’s 係數),特別適合衡量人格特質、態度……等等 (即Likert量表。一般0.7 α 0.8表可信,一般 0.8 α 1.0表非常可信。 :
6.7.3 信度與效度的關係 「效度→信度」(關係式若 p 則 q)。換句話說,有效度一定有信度;但有信度不一定有效度;無信度一定無效度。
Thank You !