Chapter Four 信度.

Slides:

Advertisements

Similar presentations

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆資料分析與表達.

Advertisements

第07章計量值管制圖.

Stata教學第六講變異數分析ANOVA ©Ming-chi Chen 社會統計.

第七章抽樣與抽樣分配蒐集統計資料最常見的方式是抽查。這牽涉到兩個問題：抽出的樣本是否具有代表性?是否能反應出母體的特徵?

零歲至六歲兒童發展篩檢量表編製者：黃惠玲.

Chapter Seven 項目分析.

:Word Morphing ★★☆☆☆ 題組： Problem Set Archive with Online Judge 題號： 10508:word morphing 解題者：楊家豪解題日期： 2006 年 5 月 21 日題意：第一行給你兩個正整數, 第一個代表下面會出現幾個字串,

Advanced Chemical Engineering Thermodynamics

Reference, primitive, call by XXX 必也正名乎誌謝 : 部份文字取於前輩 TAHO 的文章.

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參實驗法.

亂數產生器安全性評估之統計測試 SEC HW7 姓名：翁玉芬學號：

Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內，例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料，通常用卡方檢定類別資料分析卡方檢定卡方檢定基本理論一個含有 k 項的試驗，設 p i.

©Ming-chi Chen 社會統計 Page.1 社會統計第十講相關與共變. ©Ming-chi Chen 社會統計 Page.2 Covariance, 共變量當 X, Y 兩隨機變數不互為獨立時，表示兩者間有關連。其關連的形式有很多種，最常見的關連為線性的共變關係。隨機變數 X,Y.

消費者物價指數反映生活成本。當消費者物價指數上升時，一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹（inflation）來描述一般物價持續上升的現象，而物價膨脹率（inflation rate）為物價水準的變動百分比。

STAT0_sampling Random Sampling  母體： Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣本，若每一樣本被抽出的機率是一樣的，這樣本稱為隨機樣本 (random sample)

第 4 章迴歸的同步推論與其他主題.

1. 假設以下的敘述為一未提供 “ 捷徑計算 ” 能力的程式段，試用程式設計的技巧，使此敘述經此改寫的動作後，具有與 “ 捷徑計算 ” 之處理方法相同之處理模式。 if and then E1 else E2 endif.

STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性，以列聯表來表示  討論二連續隨機變數時，可以作 x-y 散佈圖觀察它們的關係強度  以相關係數來代表二者關係的強度.

Section 2.2 Correlation 相關係數. 散佈圖 1 散佈圖 2 散佈圖的盲點兩座標軸的刻度不同，散佈圖的外觀呈現的相聯性強度，會有不同的感受。散佈圖 2 相聯性看起來比散佈圖 1 來得強。以統計數字相關係數做為客觀標準。

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆資料分析與表達.

CH22 可靠性加速測試方法目的基本假設加速試驗模式 Inverse Power Model

Department of Air-conditioning and Refrigeration Engineering/ National Taipei University of Technology 模糊控制設計使用 MATLAB 李達生.

Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.

Chapter 8 Inference for Proportions 第八章母體比率的推論

1 Part IC. Descriptive Statistics Multivariate Statistics ( 多變量統計 ) Focus: Multiple Regression ( 多元迴歸、複迴歸 ) Spring 2007.

2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ，才能代表母體 Sample mean 是一隨機變數，隨著每一次抽出來的樣本值不同，它的值也不同，但會有規律性為了要知道估計的精確性，必需要知道樣本平均數.

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 貳研究設計.

Chapter 13 塑模靜態觀點：物件圖 Static View : Object Diagram.

: The largest Clique ★★★★☆ 題組： Contest Archive with Online Judge 題號： 11324: The largest Clique 解題者：李重儀解題日期： 2008 年 11 月 24 日題意：簡單來說，給你一個 directed.

第三部分：研究設計 ( 二）：研究工具的信效度與研究效度（第九章之第 306 頁 -308 頁；第四章）

第二章供給與需求中興大學會計學系授課老師：簡立賢.

選舉制度、政府結構與政黨體系 Cox (1997) Electoral institutions, cleavage strucuters, and the number of parties.

CH 15- 元件可靠度之驗證  驗證方法  指數模式之可靠度驗證  韋式模式之可靠度驗證  對數常態模式之可靠度驗證  失效數為零時之可靠度估算  各種失效模式之應用.

緒論統計的範圍敘述統計推論統計有母數統計無母數統計實驗設計統計的本質大量數字客觀.

: Multisets and Sequences ★★★★☆ 題組： Problem Set Archive with Online Judge 題號： 11023: Multisets and Sequences 解題者：葉貫中解題日期： 2007 年 4 月 24 日題意：在這個題目中，我們要定義.

:Nuts for nuts..Nuts for nuts.. ★★★★☆ 題組： Problem Set Archive with Online Judge 題號： 10944:Nuts for nuts.. 解題者：楊家豪解題日期： 2006 年 2 月題意：給定兩個正整數 x,y.

資料結構實習-一參數傳遞.

觀測量的權權的觀念與計算.

Section 4.2 Probability Models 機率模式. 由實驗看機率實驗前先列出所有可能的實驗結果。 – 擲銅板：正面或反面。 – 擲骰子： 1~6 點。 – 擲骰子兩顆： (1,1),(1,2),(1,3),… 等 36 種。決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。

演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.

Density and control Reproduction curve 劉耀仁. Density ：濃度、密度 ► 1 號區是 High-Density 區、 2 號是 Middle-density 區、 3 號區是 Low- Density 區。 ► 計算反射率（ R ）或透射率（ T ）

逆向選擇和市場失調. 定義  資料不對稱在交易其中，其中一方較對方有多些資料。  逆向選擇出現在這個情況下，就是當買賣雙方隨意在市場上交易，與比較主動交易者作交易為佳。

845: Gas Station Numbers ★★★ 題組： Problem Set Archive with Online Judge 題號： 845: Gas Station Numbers. 解題者：張維珊解題日期： 2006 年 2 月題意：將輸入的數字，經過重新排列組合或旋轉數字，得到比原先的數字大，

Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標，以減少測量誤差並可建立問卷的構念效度驗證性因素分析.

Learning Method in Multilingual Speech Recognition Author : Hui Lin, Li Deng, Jasha Droppo Professor: 陳嘉平 Reporter: 許峰閤.

描述統計描述統計(Descriptive Statistics)-將蒐集到的資料加以整理和記錄,並以數字和統計圖表的方式來分析及解釋資料所具有的特性. 基本統計值(平均數,中位數,標準差,變異量….) 相關性測量(卡方,相關係數,迴歸…)

概念性產品企劃書呂學儒李政翰.

Probability Distribution 機率分配汪群超 12/12. 目的：產生具均等分配的數值 (Data) ，並以『直方圖』的功能計算出數值在不同範圍內出現的頻率，及繪製數值的分配圖，以反應出該機率分配的特性。

Chapter 7 Sampling Distribution

Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense.

Structural Equation Modeling Chapter 8 潛伏變數路徑分析＝完全 SEM 潛伏變數路徑分析.

連續隨機變數連續變數：時間、分數、重量、……

第八章估計.

Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/30 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH7.1~CH /12/26.

: Wine trading in Gergovia ★★☆☆☆ 題組： Contest Volumes with Online Judge 題號： 11054: Wine trading in Gergovia 解題者：劉洙愷解題日期： 2008 年 2 月 29 日題意：在 Gergovia.

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 壹企業研究導論.

第五章 1 效度測試效度 (test validity) 可回答下列的問題：「此測試是否可以衡量出它所想要衡量的特質？」以員工的徵選來說，效度指的是測試的結果是否與工作相關。二種主要的測試效度，此即準則效度 (criterion validity) 與內容效度 (content validity)

: Finding Paths in Grid ★★★★☆ 題組： Contest Archive with Online Judge 題號： 11486: Finding Paths in Grid 解題者：李重儀解題日期： 2008 年 10 月 14 日題意：給一個 7 個 column.

:Problem E.Stone Game ★★★☆☆ 題組： Problem Set Archive with Online Judge 題號： 10165: Problem E.Stone Game 解題者：李濟宇解題日期： 2006 年 3 月 26 日題意： Jack 與 Jim.

第12章團體溝通情境中的領導者.

財務管理概論劉亞秋‧薛立言合著（東華書局, 2007)

Ch 11 建立研究工具的效度與信度.

幼兒行為觀察與記錄第八章事件取樣法.

1 Chemical and Engineering Thermodynamics Chapter 1 Introduction Sandler.

Chapter 12 Estimation 統計估計. Inferential statistics Parametric statistics 母數統計 ( 母體為常態或大樣本 ) 假設檢定 hypothesis testing  對有關母體參數的假設，利用樣本資料，決定接受或不接受該假設的方法.

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆資料分析與表達.

1 Slide Slide 第 9 章假設檢定 Part B ( ). 2 Slide Slide 第 9 章假設檢定 Part B  9.5 母體比例  9.6 假設檢定與決策  9.7 計算型 II 錯誤的機率  9.8 在檢定母體平均數時決定樣本大小第 9 章假設檢定.

Presentation transcript:

Chapter Four 信度

信度(reliability)ㄧ詞意指同一位受試者在不同場合、採用內容相當的不同題目或者在不同測試條件之下，重複接受測驗所獲得之分數的ㄧ致性。信度的概念強調個別分數之測量誤差的計算，我們可以藉此預測：單一個人的分數由於不相關或未知機率因素而波動的範圍。

廣義而言，測驗信度意指：測驗分數之個別差異可以歸因於所測量之特徵的「真實」差異以及隨機誤差的程度。用統計術語來說，測驗信度的指標可以用來估計誤差變異在測驗分數總變異之中所佔的比例。就本質來看，任何與測驗目的無關的條件都代表誤差變異。因此，當主試者嘗試控制施測環境、指導語、時間限制、投契關係，還有其他類似因素，以便維持一致的測驗條件時，他們正是在降低誤差變異，使得測驗更加可靠。

相關係數相關係數的意義相關係數表示兩組分數之間的對應或關連程度。圖4-1及圖4-2 相關係數的計算方式會因為數據的性質而有所不同。其中最常見的是皮爾森積差相關系數(Pearson Product-Moment Correlation Coefficient)

相關係數統計顯著性我們想知道某個相關系數是否顯著地大於0？換言之，如果母群的相關係數是0，則我們從樣本所得到的相關是否只是由抽樣誤差所造成？當我們說：相關「達到1%的顯著水準」時，真正的意思是指：母群之相關等於0的機率小於百分之ㄧ。因此，我們的結論是：這兩個變項確實有關連。顯著水準意指我們由數據中下結論時願意承擔錯誤的風險程度。

相關係數信度係數相關係數經常用於心理計量資料的分析。測驗信度指標代表這種係數的其中一種用途。圖4-3

信度的種類再測信度(test-retest reliability) 再測信度就是同一個人兩次施測所得分數的相關。誤差變異相當於兩次測驗表現的隨機波動。這些變異部分來自於未能控制的測驗條件，包括施測環境(天氣極端變化、噪音)及受測者本身條件的變化(疾病、疲倦等) 再測信度會隨著間隔時間拉長而逐漸降低，因此最好不要超過六個月。

信度的種類再測間隔期間太短，受測者便能夠回想起大多數先前的答案，因此，兩次施測的成績並非互相獨立，因此相關比實際上更高。測驗本身的性質也會因為重複施測而有所改變，尤其是關於推理或者有特殊訣竅的問題。通常較不受重複施測影響的測驗才會採用再測信度，例如感覺區辨和動作測驗。

信度的種類複本信度(alternate-form reliability) 兩次施測中，第二次使用複本，進而計算兩次測驗分數的相關程度，這種信度係數同時測量時間的穩定性以及不同題目樣本(或測驗版本)的反應一致性。計算複本信度時的誤差變異來源是「題目抽樣」或「內容抽樣」。這種誤差變異說明：測驗分數決定於選題之特殊因素的程度有多少？如果另一位獨立作業的研究者根據相同的內容說明另外編製一套測驗，則同一個人再這兩項測驗上的得分差異有多大？

信度的種類測驗的複本應該包含相等的題數、題目形式以及涵蓋的內容範圍也應該相同。題目的範圍和難度水準應該相等，指導語、時間限制、範例、格式，以及測驗的其他層面也應當確認是否等同。當複本信度受到練習效果的影響很大時，由於每個人進步的幅度可能不盡相同，因此信度會下降。另外，因為重複施測而改變測驗性質的程度也會影響信度。

信度的種類折半信度(split-half reliability) 測驗只施測ㄧ次，但將測驗分成相等的兩半，得到兩個分數，然後計算相關(或其它作法)。顯然，折半信度提供了有關內容抽樣一致性的指標。因為只施測ㄧ次，這種測驗不包含時間上的穩定性，有時候也被稱內部一致性(internal consistency)係數。

信度的種類折半後的相關係數會因題數的減少而下降，因此須用斯皮爾曼-布朗公式來校正

信度的種類另一種計算折半信度的方法(Rulon, 1939) 表兩個折半測驗之得分差異的變異數；表總分的變異數

信度的種類庫德-理查遜信度和alpha係數也是僅需進行ㄧ次施測，而且是以所有測驗題目的反應一致性為基礎。這種項目間一致性會受到兩種誤差變異的影響： 1.內容抽樣(例如複本信度和折半信度) 2.所抽樣之行為領域的異質性，同質性越高，項目間一致性也越高。

信度的種類庫德-理查遜20號公式(KR-20) 適用於是非題或非有即無的記分方式(二元計分)

信度的種類 alpha係數適用於多元計分

信度的種類計分者信度(scorer reliability) 計分者信度的建立是將同一份測驗樣本交給兩位檢驗者獨立計分，然後將每位受測者所獲得的兩個分數依照一般方式求取相關。

信度的種類總結表4-2根據所需要的測驗複本和施測數目來區分各種信度表4-3各種信度係數的誤差來源表4-4及圖4-4：範例計算信度指標：測驗分數與真實分數的相關，亦即信度係數的平方根。信度係數：真實分數變異占測驗分數變異的比例。

速度測驗的信度單一施測所得到的信度係數並不適合使用於速度測驗。例如單雙數的折半技術或庫德-理查遜公式。適合計算速度測驗的信度方法有再測信度、複本信度、根據時間而非題目折半的折半信度。

測驗樣本對信度係數的影響變異性團體的個別差異過於同質會降低信度係數，亦即團體的變異性太低會降低信度係數。比較300位大學生同質團體與300位從心智遲緩到大學畢業生都有的異質團體之信度係數。

測驗樣本對信度係數的影響能力水準各團體的平均能力水準不同可能會影響信度係數難度最高和最低的題目可能太少，不足以適當地區辨個人表現(天花板或地板效應)。有些測驗使用於較年輕及能力差之團體時，信度可能相當低，因為他們的分數很容易受到猜測因素的影響。

測量標準誤個別分數的解釋測驗信度可以藉由測量標準誤(standard error of measurement, SEM)來表達，這個指標尤其適用於個別分數的解釋。假定甲生在某份測驗上重複施測100次，由於隨機誤差的緣故，這100個分數會形成一個常態分配，該分配的平均數就是甲生的真實分數，該分配的標準差就是SEM

測量標準誤分數差異的解釋在同一份測驗上不同受測者分數的比較，或是同一個人在測驗組上不同能力分數的比較，可用如下的差異標準誤公式來判定差異分數受隨機誤差影響的程度。

信度在精熟測驗和臨界分數上的應用前述的信度計算方式較不適合精熟測驗或使用臨界分數的測驗。精熟測驗的主要統計涵意在於降低個別分數之間的變異性。理論上，如果所有人都持續接受訓練，直到完全精通該技能為止，則其表現的變異性會降至0。精熟測驗屬於領域參照測驗的ㄧ種，而領域參照測驗較適用於分類一致性的技術來表達信度。