Download presentation
Presentation is loading. Please wait.
1
Multi Regression 1 多元迴歸分析 【研究問題】 學生性別、數學焦慮、數學態度、數學投入動機 是否可有效預測學生的數學成就?其預測力如何? 學生性別、數學焦慮、數學態度、數學投入動機 是否可有效預測學生的數學成就?其預測力如何? 【方法分析】 研究問題中,由於預測變項包括「學生性別」、 「壓力懼怕」、「情緒擔憂」、「考試焦慮」、 「課堂焦慮」、「學習信心」、「有用性」、「成 功態度」、「探究動機」、「數學工作投入」、 「數學自我投入」等十一個; 研究問題中,由於預測變項包括「學生性別」、 「壓力懼怕」、「情緒擔憂」、「考試焦慮」、 「課堂焦慮」、「學習信心」、「有用性」、「成 功態度」、「探究動機」、「數學工作投入」、 「數學自我投入」等十一個; 而依變項為「數學成就」變項一個,因而可採用 「多元迴歸分析法」( multiple regression )或 稱「複迴歸法」。 而依變項為「數學成就」變項一個,因而可採用 「多元迴歸分析法」( multiple regression )或 稱「複迴歸法」。
2
Multi Regression 2 多元迴歸分析圖示 學生性別 壓力懼怕 情緒擔憂...... 自我投入 數學成就 依變項為連續變數 預測變項為 N 個連續變數
3
Multi Regression 3 依變數為類別變數之分析模型 進行多元迴歸時,如果依變數(效標變數) 不是連續變數,而是二分類別變數,應以 「區別分析」或「二元 logistic 迴歸分析」。 如果依變數是多分類別變數,則須進行 「區別分析」。
4
Multi Regression 4 迴歸分析的目的 找出一個線性方程式,用來說明一組預測 變數 (X i ) 與準則變數 (Y) 的關係。 瞭解這個方程式的預測能力如何。 整體關係是否達到顯著水準? 在解釋準則變數的變異時,是否只採用某 些預測變數即具有足夠的預測力?
5
Multi Regression 5 線性迴歸的基本假設 常態性與變異同質性 (normality and equality of variance) – 對任何一個自變數 X 而言,依變數 Y 為常態分配,平均數 為 μ Y|X ,變異數為 σ 2 。 殘差獨立性 (independence) – 每個殘差彼此之間是統計獨立的,觀察值之間彼此不會互 相影響。 直線性 (linearity) – 所有抽樣樣本分配的平均數,均在落母群迴歸線上。 e i ~N[0,1] 當迴歸方程式滿足上述迴歸基本假設,則此迴歸方 程式具有線性特性,並稱為線性迴歸否則稱為非線 性迴歸。
6
Multi Regression 6 簡單迴歸 ( 僅有一個預測變數 ) ― 模式 母體模式: 估計模式:
7
Multi Regression 7 簡單迴歸之係數估計 ― 最小平方法 1 (The ordinary least squares approach, OLS) 標準方程式 (normal equation)
8
Multi Regression 8 簡單迴歸之係數估計 ― 最小平方法 2
9
Multi Regression 9 例題 某 10 名高中畢業生高中成績和大學聯考成 績如下。試建立高中畢業成績相對於大學 聯考成績之迴歸模型。 學生12345678910 高中 (X) 111065373892 聯考 (Y) 129975566103
10
Multi Regression 10 SPSS ― 迴歸分析 Analyze → Regression → Linear
11
Multi Regression 11 多元迴歸 ― 模式 多元迴歸模式為: 或
12
Multi Regression 12 多元迴歸之係數估計 ― OLS 標準方程式 (normal equation)
13
Multi Regression 13 前例練習 1
14
Multi Regression 14 前例練習 2
15
Multi Regression 15 變數選擇 1 邏輯基礎: 理論基礎、實證基礎、邏輯推理、專家共識 理論基礎、實證基礎、邏輯推理、專家共識統計量基礎: 利用每一解釋變數對應之偏 F 統計量值之大小決 定刪去或留在模式中,其方法有 利用每一解釋變數對應之偏 F 統計量值之大小決 定刪去或留在模式中,其方法有 (a) 所有可能迴歸法 (All-Possible-Regression Procedure ) (b) 後退淘汰法 (Backward Elimination Procedure) (c) 前進選擇法 (Forward Selection Procedure) (d) 逐步迴歸法 (Stepwise Regression Procedure)
16
Multi Regression 16 變數選擇 2 後退淘汰法 (Backward Elimination Procedure) 後退淘汰法 (Backward Elimination Procedure) 先將所有的變數放入迴歸方程式中,然後根 據淘汰標準一一將不符合標準的變數加以淘 汰。 前進選擇法 (Forward Selection Procedure) 前進選擇法 (Forward Selection Procedure) 第一個進入迴歸方程式的變數是與依變數有 最大相關的變數,第一個變數進入模型之後, 再以判定係數值 (F) 檢查第二個變數該誰進入, 依此類推,直到沒有其他的變數符合選取的 標準為止。
17
Multi Regression 17 變數選擇 3 逐步迴歸法 (Stepwise Regression Procedure) 逐步迴歸法 (Stepwise Regression Procedure) 結合順向選擇法與反向淘汰法二種程序 。 首 先採用順向選擇法 , 選進與依變數有最大相關 的變數 , 接下來以反向淘汰法檢查此變數是否 須加以排除 。 為了避免相同的變數重複地被選 進或排除 , 選進的標準 (α 值 ) 必須小於淘汰的 標準 , 亦即選進變數的 F 值大於淘汰變數的 F 值 。
18
Multi Regression 18 迴歸分析 ― 變異數分析表 K 為預測變數個數 ( 不含 β 0 )
19
Multi Regression 19 模式檢定 (1) 迴歸分析之假說檢定包括總檢定與邊際檢定兩種。 總檢定: – 目的在探討迴歸模式中的所有斜率係數是否全部 為 0 。 – 當斜率係數不全為 0 時, Y 與 (X 1,X 2,…,X K ) 才具有 某種程度的函數關係 。 – 總檢定之虛無假說與對立假說可列示如下: H0: j =0 ,對所有 j H0: j =0 ,對所有 j H1: j 0 ,對某些 j (j=1,2,…,K) H1: j 0 ,對某些 j (j=1,2,…,K) – 檢定統計量 : F=MSR/MSE F=MSR/MSE
20
Multi Regression 20 邊際檢定 ― 一般判定 – 若總檢定顯著,即應進行邊際檢定 (Marginal Tests) ,探討個別迴歸係數 ( j, j=1,2,…,K) 是 否顯著異於某一特定數值,共包括 K 個檢定。 – 邊際檢定可分為雙尾檢定與單尾檢定,且大 多數屬於對 0 檢定。 – 對立假說設定為 H1: j j0 ,屬於雙尾檢定 。 – 對立假說設定為 H1: j > j0 或 H1: j j0 或 H1: j < j0 ,屬 於單尾檢定。 – 檢定統計量 : 模式檢定 (2)
21
Multi Regression 21 邊際檢定 ― 偏判定 若迴歸式為 Y=α+β 1 X 1 +β 2 X 2 +β 3 X 3 +ε 欲決定新變數 X 3 是否要加入模型 … 模式檢定 (3) F= SSR(X 3 |X 1,X 2 )/1 SSE(X 1,X 2,X 3 )/n-4 ,, 。, 則, 。 分子代表模型加入 X 3 變數後,解釋能力提高的部份, 分母代表加入 X 3 後仍無法解釋的部份。若 F 值顯著, 則代表 X 3 確實有明顯的解釋效果,可加入迴歸模型 中。
22
Multi Regression 22 判定係數 R 2 R 2 稱為多元判定係數( multiple determination coefficient ) : 0 R 2 1 R 2 相當於總變異中可被解釋之百分比例 R 2 亦是模式配適度 (Goodness of Fit) 之指標。
23
Multi Regression 23 Adjusted R 2 在迴歸分析中,如果自變項的個數很多,有時 候就要用調整後的判定係數代替原先的判定係 數,因為增加新的自變項後,均會使 R 2 變大。 「 Adjusted R 2 」為調整後的判定係數:
24
Multi Regression 24 殘差分析 (1) 基本概念: – 在探討誤差項 ( i ) 是否符合常態性、恆 常性、獨立性等三項假定。 – 迴歸分析乃以殘差值 (e i, Residual) 為 誤差項 ( i ) 之估計,等於樣本觀察值與 預測值之差,即:
25
Multi Regression 25 殘差分析 (2) 常態性: – 假說如下所示: H0: 誤差項遵循常態分配 H0: 誤差項遵循常態分配 H1: 誤差項未遵循常態分配 H1: 誤差項未遵循常態分配 – 常態性檢定方法 常態機率圖 (Normal Probability Plot) 常態機率圖 (Normal Probability Plot) 當 H 0 成立,則常態機率圖應呈 現近似 45 0 直線 當 H 0 成立,則常態機率圖應呈 現近似 45 0 直線 K-S 檢定 (Kolmogorov-Smirnov goodness-of-fit test) W 統計量 (W, Wilk-Shapiro Statistic) 檢定。
26
Multi Regression 26 殘差分析 恆常性:
27
Multi Regression 27 殘差分析 (3) 獨立性: – 指個案之誤差項 ( i ) 彼此之間獨立。 – 檢定方法: 1. 觀察 e i 對時間之序列圖,需無任何規則性 趨勢,則表示誤差項為隨機。 1. 觀察 e i 對時間之序列圖,需無任何規則性 趨勢,則表示誤差項為隨機。 2. Durbin-Watson (D-W) 的統計量來檢定有 無自我相關的問題,即殘差是否為獨立。 2. Durbin-Watson (D-W) 的統計量來檢定有 無自我相關的問題,即殘差是否為獨立。
28
Multi Regression 28 「共線性」 (collinarity) 問題 所謂共線性指的是由於自變項間的相關太高,由 於具共線性變數所供的訊息相似,將使我們無法 分辨個別變數的效果。 如果變項間有共線性問題,表示一個自變數是其 它自變項的線性組合。 – 以二個自變項 X 1 , X 2 為例: 完全共線性 → X 1 = a + bX 2 完全共線性 → X 1 = a + bX 2 如果一變項與其它自變項間有共線性問題,則這 個變項迴歸係數的估計值不夠穩定,而迴歸係數 的計算值也會有很大誤差。
29
Multi Regression 29 「共線性」的診斷 共線性問題,可由下面的數據加以判別: 2. 變異數膨脹因素( variance inflation factor ; VIF ) 變異數膨脹因素為容忍度的倒數, VIF 的值愈大,表 示自變項的容忍度愈小,愈有共線性問題。 1. 容忍度( tolerance ) 容忍度= 1-R 2 ,容忍度的值介於 0 至 1 間。 R 2 是此自變項與其它自變項間的多元相關係數的平方, 即模式中其它自變項對這個變項的有效解釋能力。 一自變項的 R 2 值太大,即容忍度太小,表示此變項與其 它自變項間有共線性問題。
30
Multi Regression 30 迴歸分析之流程
31
Multi Regression 31 虛擬變數轉換 (1) 間斷變數在投入迴歸分析時,必須轉換為虛擬變 數。 在虛擬變項的轉換方面,要以「 0 」、「 1 」的方 式表示,虛擬變項個數等於「水準」個數減一。 原變項虛擬變項 說明 : 1 表示「是」 1 表示「是」 學生性別sexd 0 表是「否」 0 表是「否」 男性 1 0 不是女生,是男生 女性 2 1是女生 如果是二分變項,便以一個虛擬變項表示,此虛擬變項的 二個水準數值直接以「 0 」、「 1 」表示即可。 以學生性別變項為例:
32
Multi Regression 32 虛擬變數轉換 (2) 如果是三分變項,表示此間斷變項有三個水準, 則應以二個虛擬變項表示。 以家庭狀況變項為例: 原變項虛擬變項 說明 :1 表示是 , 0 表是否 家庭狀況homd1homd2 單親家庭組 1 10 是單親家庭組,不是他人照顧組 他人照顧組 2 01 不是單親家庭組,是他人照顧組 雙親家庭組 3 00 不是單親家庭組,也不是他人照 顧組,即為雙親家庭組
33
Multi Regression 33 虛擬變數轉換 (3) 如果是四分變項,表此間斷變數有四個水準,則 投入迴歸分析時,會有三個虛擬變項。 例如地理位置變項中, 1 表示北部、 2 表示中部、 3 表示南部、 4 表示東部,三個虛擬變項的值如下: 原變項虛擬變項 說明 :1 表示是, 0 表是否 地理位置locd1locd2locd3 北部 1 100 是北部,而非中部,也非南部 中部 2 010 是中部,而非北部,也非南部 南部 3 001 是南部,而非北部,也非中部 東部 4 000 非北部,非中部,也非南部, 因而是東部
34
Multi Regression 34 虛擬變數轉換 操作說明
35
Multi Regression 35 轉換為虛擬變數
36
Multi Regression 36 已轉換為虛擬變數
37
Multi Regression 37 多元迴歸分析 操作說明
38
Multi Regression 38 問題:學生性別、數學焦慮 、數學態度、數學投入動機 是否可有效預測學生的數學 成就?其預測力如何?
39
Multi Regression 39 效標變項 預測變項 迴歸分析方法 模式適合度會列出已進入模式或 刪除之變數,並顯示迴歸分析相 關的統計量:多元相關係數 R 、 R 平方、調整後的 R 平方、估計 值的標準誤與變數數分析摘要表 。
40
Multi Regression 40 多元迴歸分析 報表說明
41
Multi Regression 41 選取變項的順序,最右邊一欄 進入與移除的標準。 進入模式的標準是 F 的顯著性 機率要小於或等於.050 ,而移 除的標準是 F 的顯著性機率大 於或等於.100 者。 迴歸模式的解釋量
42
Multi Regression 42 P 值小於 0.01 ,此迴歸模式顯著此迴歸模式所包含的預測變數
43
Multi Regression 43 B 為原始迴歸係數。數學成就 = -4.522+.309x 工作投入 +.382x 成功態度 -.401x 自我投入 +3.080x 學生性別 -.344x 壓力懼怕 +.610x 課堂焦慮 +.222x 學習信心 +.249x 有用性 迴歸係數 j 之 邊際檢定統計 量
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.