Presentation is loading. Please wait.

Presentation is loading. Please wait.

信度.

Similar presentations


Presentation on theme: "信度."— Presentation transcript:

1 信度

2 真分數理論的假設 X=T+E 任何觀察分數是由真實分數與誤差分數,這兩個假設的成分所組成。

3 誤差的概念 誤差是指觀察分數與真實分數的差值,由於測量會產生誤差,所以每次測量所獲得的觀察分數會產生變動。
誤差的來源可分成系統性誤差(systematic errors)與隨機性誤差(random errors)。

4 誤差的來源 系統性誤差又可分成恆定誤差(constant errors)與偏誤(bias)兩種。
對所有測量者皆有影響的誤差即為恆定誤差;只對某些群體的人會產生影響的誤差即為偏誤。 隨機誤差是由隨機產生的,並無法事先預測。

5 信度的表示法 根據真分數理論,信度可以表示為:真實分數的變異數與觀察分數的變異數的比值。

6 信度的種類 測驗版本 測驗次數 一種 兩種 一次 折半信度、庫李20、α係數 複本信度(等同係數) 兩次 再測信度(穩定係數) 再測複本信度

7 再測信度(test-retest reliability)
再測信度是指將受試者在兩個不同的時間點,接受同一份測驗,然後以受試者在兩個不同時間點的兩個總分,求其相關係數,即可得到再測信度。 再測信度的兩次施測的間隔時間,不能太長也不能太短,可採2至4的星期。

8 複本信度(alternate-form reliability)
複本信度是指將受試者在同一個時間點,接受兩份測驗(一份為正本,另一份為複本),然後以受試者在正本與複本的兩個總分,求其相關係數,即可得到複本信度。 複本測驗必須在內容、題型、題數、難度、測試時間等均須相同,才能稱為複本測驗。

9 複本信度(alternate-form reliability)
複本測驗需滿足下列的 假定: 1.同一個人在兩個測驗具有相同的真分數。 T1=T2 2.兩個測驗的誤差分數彼此獨立(即兩者相關係數為0),且誤差分數的變異數相等。

10 再測複本信度 再測複本信度是指將受試者在兩個不同的時間點,接受兩份測驗(一份為正本,另一份為複本),然後以受試者在正本與複本的兩個總分,求其相關係數,即可得到再測複本信度。 再測複本信度可同時考量時間與內容兩個向度,是不錯的信度考驗方法。

11 內部一致性係數 內部一致性係數是由一次施測的結果,去估算信度的數值,主要關注於試題的同質性。內部一致性係數的主要限制是不能估計速度測驗的信度。 內部一致性係數主要包含 1.折半信度 2.庫李20公式或庫李21公式 3.α係數

12 折半信度(split-half reliability)
折半信度的求法是將一份測驗的試題分成兩個部分,然後求兩個部分總分的相關係數。 折半信度的折半方法有:1.奇偶折半;2.隨機折半。 由於試題的題數越多,所估計的信度值會越高,因此,採用折半信度必須以斯布(Spearman-Brown)校正公式,校正被低估的信度值。

13 斯布校正公式 n:測驗工具長度增長或縮短的倍數 rXX:測驗工具增長或縮短後的信度 rAA:測驗工具原本的信度

14 斯布校正公式的應用實例 例1:折半信度的數值大小為0.7,則則經斯布校 正公式的校正後,其信度為多少?

15 斯布校正公式的應用實例 例2:已知一份40道題目的測驗,其信度為0.8, 若打算將試題縮減為30道題目,則其信度 將變成多少?

16 斯布校正公式的應用實例 例3:已知一份40道題目的測驗,其信度為0.8, 若打算將信度增加至0.9,則測驗的題目將 變成多少題?

17 KR20 KR20是由Kuder & Richardson兩人所發展的第20號公式,但它僅適用在二分計分法,亦即答對得1分,答錯得0分。
K:題數 P:每題的答對率 Q :每題的答錯率 (σx)2 :測驗總分的變異數

18 α係數 α係數是由Cronbach所發展的,當測驗的評分方式不只二分計分時,例如likert五點量表,則不能採用KR20,而須採用α係數。
K:題數 (σi)2 :第 i 題的變異數 (σx)2 :測驗總分的變異數

19 1 2 3 4 5 6 7 8 9 10 A B C D E F G H I J Pi .6 .3 .7 .8 .2 .4 S=2.93 Qi PQ .24 .21 .16 S2 .267 .233 .178 1.822

20 KR20的計算實例

21 α係數的計算實例

22 評分者信度(scorer reliability)
評分者信度主要針對不同的評分者,對同一表現評分的一致性程度。 當評分者只有兩人時,可採用Spearman的等級相關;當評分者三人以上,則需採用肯德爾的和諧係數。

23 測量標準誤(standard error of measurement)
在測驗與評量中,假定對同一個人施測非常多次,則每次觀察分數與真實分數的誤差分數,會形成常態分配,而此常態分配的標準差,特別稱為測量標準誤。 測量標準誤的最大應用價值在於可用以推論真實分數的可信範圍。

24 測量標準誤(standard error of measurement)
σx:觀察分數的變異數 rxx:信度係數 由上述公式,可知SEM越小,則信度越高, SEM越大,則信度越低。

25 測量標準誤的應用實例 例1:某測驗的信度為0.84,標準差為10,則該 測驗的SEM為多少?

26 測量標準誤的應用實例 例2:承例1,若某生在該測驗考80分,則某生 真實分數的範圍是多少?
1.某生的真是分數有68.26%(即平均數上下一個標準差)落在80±1SEM 80-4≦某生的真實分數≦ 80+4 76≦某生的真實分數≦ 84

27 測量標準誤的應用實例 2.某生的真是分數有95.44%(即平均數上下兩個標準差)落在80±2SEM
80-2×4≦某生的真實分數≦ 80+2×4 72≦某生的真實分數≦ 88 3.某生的真是分數有99.74%(即平均數上下三個標準差)落在80±3SEM 80-3×4≦某生的真實分數≦ 80+3×4 68≦某生的真實分數≦ 92


Download ppt "信度."

Similar presentations


Ads by Google