Presentation is loading. Please wait.

Presentation is loading. Please wait.

Multi Regression 1 多元迴歸分析 【研究問題】 學生性別、數學焦慮、數學態度、數學投入動機 是否可有效預測學生的數學成就?其預測力如何? 學生性別、數學焦慮、數學態度、數學投入動機 是否可有效預測學生的數學成就?其預測力如何? 【方法分析】 研究問題中,由於預測變項包括「學生性別」、

Similar presentations


Presentation on theme: "Multi Regression 1 多元迴歸分析 【研究問題】 學生性別、數學焦慮、數學態度、數學投入動機 是否可有效預測學生的數學成就?其預測力如何? 學生性別、數學焦慮、數學態度、數學投入動機 是否可有效預測學生的數學成就?其預測力如何? 【方法分析】 研究問題中,由於預測變項包括「學生性別」、"— Presentation transcript:

1 Multi Regression 1 多元迴歸分析 【研究問題】 學生性別、數學焦慮、數學態度、數學投入動機 是否可有效預測學生的數學成就?其預測力如何? 學生性別、數學焦慮、數學態度、數學投入動機 是否可有效預測學生的數學成就?其預測力如何? 【方法分析】 研究問題中,由於預測變項包括「學生性別」、 「壓力懼怕」、「情緒擔憂」、「考試焦慮」、 「課堂焦慮」、「學習信心」、「有用性」、「成 功態度」、「探究動機」、「數學工作投入」、 「數學自我投入」等十一個; 研究問題中,由於預測變項包括「學生性別」、 「壓力懼怕」、「情緒擔憂」、「考試焦慮」、 「課堂焦慮」、「學習信心」、「有用性」、「成 功態度」、「探究動機」、「數學工作投入」、 「數學自我投入」等十一個; 而依變項為「數學成就」變項一個,因而可採用 「多元迴歸分析法」( multiple regression )或 稱「複迴歸法」。 而依變項為「數學成就」變項一個,因而可採用 「多元迴歸分析法」( multiple regression )或 稱「複迴歸法」。

2 Multi Regression 2 多元迴歸分析圖示 學生性別 壓力懼怕 情緒擔憂...... 自我投入 數學成就 依變項為連續變數 預測變項為 N 個連續變數

3 Multi Regression 3 依變數為類別變數之分析模型 進行多元迴歸時,如果依變數(效標變數) 不是連續變數,而是二分類別變數,應以 「區別分析」或「二元 logistic 迴歸分析」。 如果依變數是多分類別變數,則須進行 「區別分析」。

4 Multi Regression 4 迴歸分析的目的 找出一個線性方程式,用來說明一組預測 變數 (X i ) 與準則變數 (Y) 的關係。 瞭解這個方程式的預測能力如何。 整體關係是否達到顯著水準? 在解釋準則變數的變異時,是否只採用某 些預測變數即具有足夠的預測力?

5 Multi Regression 5 線性迴歸的基本假設 常態性與變異同質性 (normality and equality of variance) – 對任何一個自變數 X 而言,依變數 Y 為常態分配,平均數 為 μ Y|X ,變異數為 σ 2 。 殘差獨立性 (independence) – 每個殘差彼此之間是統計獨立的,觀察值之間彼此不會互 相影響。 直線性 (linearity) – 所有抽樣樣本分配的平均數,均在落母群迴歸線上。 e i ~N[0,1] 當迴歸方程式滿足上述迴歸基本假設,則此迴歸方 程式具有線性特性,並稱為線性迴歸否則稱為非線 性迴歸。

6 Multi Regression 6 簡單迴歸 ( 僅有一個預測變數 ) ― 模式 母體模式: 估計模式:

7 Multi Regression 7 簡單迴歸之係數估計 ― 最小平方法 1 (The ordinary least squares approach, OLS) 標準方程式 (normal equation)

8 Multi Regression 8 簡單迴歸之係數估計 ― 最小平方法 2

9 Multi Regression 9 例題 某 10 名高中畢業生高中成績和大學聯考成 績如下。試建立高中畢業成績相對於大學 聯考成績之迴歸模型。 學生12345678910 高中 (X) 111065373892 聯考 (Y) 129975566103

10 Multi Regression 10 SPSS ― 迴歸分析 Analyze → Regression → Linear

11 Multi Regression 11 多元迴歸 ― 模式 多元迴歸模式為: 或

12 Multi Regression 12 多元迴歸之係數估計 ― OLS 標準方程式 (normal equation)

13 Multi Regression 13 前例練習 1

14 Multi Regression 14 前例練習 2

15 Multi Regression 15 變數選擇 1 邏輯基礎: 理論基礎、實證基礎、邏輯推理、專家共識 理論基礎、實證基礎、邏輯推理、專家共識統計量基礎: 利用每一解釋變數對應之偏 F 統計量值之大小決 定刪去或留在模式中,其方法有 利用每一解釋變數對應之偏 F 統計量值之大小決 定刪去或留在模式中,其方法有 (a) 所有可能迴歸法 (All-Possible-Regression Procedure ) (b) 後退淘汰法 (Backward Elimination Procedure) (c) 前進選擇法 (Forward Selection Procedure) (d) 逐步迴歸法 (Stepwise Regression Procedure)

16 Multi Regression 16 變數選擇 2 後退淘汰法 (Backward Elimination Procedure) 後退淘汰法 (Backward Elimination Procedure)  先將所有的變數放入迴歸方程式中,然後根 據淘汰標準一一將不符合標準的變數加以淘 汰。 前進選擇法 (Forward Selection Procedure) 前進選擇法 (Forward Selection Procedure)  第一個進入迴歸方程式的變數是與依變數有 最大相關的變數,第一個變數進入模型之後, 再以判定係數值 (F) 檢查第二個變數該誰進入, 依此類推,直到沒有其他的變數符合選取的 標準為止。

17 Multi Regression 17 變數選擇 3 逐步迴歸法 (Stepwise Regression Procedure) 逐步迴歸法 (Stepwise Regression Procedure)  結合順向選擇法與反向淘汰法二種程序 。 首 先採用順向選擇法 , 選進與依變數有最大相關 的變數 , 接下來以反向淘汰法檢查此變數是否 須加以排除 。 為了避免相同的變數重複地被選 進或排除 , 選進的標準 (α 值 ) 必須小於淘汰的 標準 , 亦即選進變數的 F 值大於淘汰變數的 F 值 。

18 Multi Regression 18 迴歸分析 ― 變異數分析表 K 為預測變數個數 ( 不含 β 0 )

19 Multi Regression 19 模式檢定 (1) 迴歸分析之假說檢定包括總檢定與邊際檢定兩種。 總檢定: – 目的在探討迴歸模式中的所有斜率係數是否全部 為 0 。 – 當斜率係數不全為 0 時, Y 與 (X 1,X 2,…,X K ) 才具有 某種程度的函數關係 。 – 總檢定之虛無假說與對立假說可列示如下: H0:  j =0 ,對所有 j H0:  j =0 ,對所有 j H1:  j  0 ,對某些 j (j=1,2,…,K) H1:  j  0 ,對某些 j (j=1,2,…,K) – 檢定統計量 : F=MSR/MSE F=MSR/MSE

20 Multi Regression 20 邊際檢定 ― 一般判定 – 若總檢定顯著,即應進行邊際檢定 (Marginal Tests) ,探討個別迴歸係數 (  j, j=1,2,…,K) 是 否顯著異於某一特定數值,共包括 K 個檢定。 – 邊際檢定可分為雙尾檢定與單尾檢定,且大 多數屬於對 0 檢定。 – 對立假說設定為 H1:  j   j0 ,屬於雙尾檢定 。 – 對立假說設定為 H1:  j >  j0 或 H1:  j  j0 或 H1:  j <  j0 ,屬 於單尾檢定。 – 檢定統計量 : 模式檢定 (2)

21 Multi Regression 21 邊際檢定 ― 偏判定 若迴歸式為 Y=α+β 1 X 1 +β 2 X 2 +β 3 X 3 +ε 欲決定新變數 X 3 是否要加入模型 … 模式檢定 (3) F= SSR(X 3 |X 1,X 2 )/1 SSE(X 1,X 2,X 3 )/n-4 ,, 。, 則, 。 分子代表模型加入 X 3 變數後,解釋能力提高的部份, 分母代表加入 X 3 後仍無法解釋的部份。若 F 值顯著, 則代表 X 3 確實有明顯的解釋效果,可加入迴歸模型 中。

22 Multi Regression 22 判定係數 R 2 R 2 稱為多元判定係數( multiple determination coefficient ) : 0  R 2  1 R 2 相當於總變異中可被解釋之百分比例 R 2 亦是模式配適度 (Goodness of Fit) 之指標。

23 Multi Regression 23 Adjusted R 2 在迴歸分析中,如果自變項的個數很多,有時 候就要用調整後的判定係數代替原先的判定係 數,因為增加新的自變項後,均會使 R 2 變大。 「 Adjusted R 2 」為調整後的判定係數:

24 Multi Regression 24 殘差分析 (1) 基本概念: – 在探討誤差項 (  i ) 是否符合常態性、恆 常性、獨立性等三項假定。 – 迴歸分析乃以殘差值 (e i, Residual) 為 誤差項 (  i ) 之估計,等於樣本觀察值與 預測值之差,即:

25 Multi Regression 25 殘差分析 (2) 常態性: – 假說如下所示: H0: 誤差項遵循常態分配 H0: 誤差項遵循常態分配 H1: 誤差項未遵循常態分配 H1: 誤差項未遵循常態分配 – 常態性檢定方法 常態機率圖 (Normal Probability Plot) 常態機率圖 (Normal Probability Plot)  當 H 0 成立,則常態機率圖應呈 現近似 45 0 直線  當 H 0 成立,則常態機率圖應呈 現近似 45 0 直線 K-S 檢定 (Kolmogorov-Smirnov goodness-of-fit test) W 統計量 (W, Wilk-Shapiro Statistic) 檢定。

26 Multi Regression 26 殘差分析 恆常性:

27 Multi Regression 27 殘差分析 (3) 獨立性: – 指個案之誤差項 (  i ) 彼此之間獨立。 – 檢定方法: 1. 觀察 e i 對時間之序列圖,需無任何規則性 趨勢,則表示誤差項為隨機。 1. 觀察 e i 對時間之序列圖,需無任何規則性 趨勢,則表示誤差項為隨機。 2. Durbin-Watson (D-W) 的統計量來檢定有 無自我相關的問題,即殘差是否為獨立。 2. Durbin-Watson (D-W) 的統計量來檢定有 無自我相關的問題,即殘差是否為獨立。

28 Multi Regression 28 「共線性」 (collinarity) 問題 所謂共線性指的是由於自變項間的相關太高,由 於具共線性變數所供的訊息相似,將使我們無法 分辨個別變數的效果。 如果變項間有共線性問題,表示一個自變數是其 它自變項的線性組合。 – 以二個自變項 X 1 , X 2 為例: 完全共線性 → X 1 = a + bX 2 完全共線性 → X 1 = a + bX 2 如果一變項與其它自變項間有共線性問題,則這 個變項迴歸係數的估計值不夠穩定,而迴歸係數 的計算值也會有很大誤差。

29 Multi Regression 29 「共線性」的診斷 共線性問題,可由下面的數據加以判別: 2. 變異數膨脹因素( variance inflation factor ; VIF ) 變異數膨脹因素為容忍度的倒數, VIF 的值愈大,表 示自變項的容忍度愈小,愈有共線性問題。 1. 容忍度( tolerance ) 容忍度= 1-R 2 ,容忍度的值介於 0 至 1 間。 R 2 是此自變項與其它自變項間的多元相關係數的平方, 即模式中其它自變項對這個變項的有效解釋能力。 一自變項的 R 2 值太大,即容忍度太小,表示此變項與其 它自變項間有共線性問題。

30 Multi Regression 30 迴歸分析之流程

31 Multi Regression 31 虛擬變數轉換 (1) 間斷變數在投入迴歸分析時,必須轉換為虛擬變 數。 在虛擬變項的轉換方面,要以「 0 」、「 1 」的方 式表示,虛擬變項個數等於「水準」個數減一。 原變項虛擬變項 說明 : 1 表示「是」 1 表示「是」 學生性別sexd 0 表是「否」 0 表是「否」 男性 1 0 不是女生,是男生 女性 2 1是女生 如果是二分變項,便以一個虛擬變項表示,此虛擬變項的 二個水準數值直接以「 0 」、「 1 」表示即可。 以學生性別變項為例:

32 Multi Regression 32 虛擬變數轉換 (2) 如果是三分變項,表示此間斷變項有三個水準, 則應以二個虛擬變項表示。 以家庭狀況變項為例: 原變項虛擬變項 說明 :1 表示是 , 0 表是否 家庭狀況homd1homd2 單親家庭組 1 10 是單親家庭組,不是他人照顧組 他人照顧組 2 01 不是單親家庭組,是他人照顧組 雙親家庭組 3 00 不是單親家庭組,也不是他人照 顧組,即為雙親家庭組

33 Multi Regression 33 虛擬變數轉換 (3) 如果是四分變項,表此間斷變數有四個水準,則 投入迴歸分析時,會有三個虛擬變項。 例如地理位置變項中, 1 表示北部、 2 表示中部、 3 表示南部、 4 表示東部,三個虛擬變項的值如下: 原變項虛擬變項 說明 :1 表示是, 0 表是否 地理位置locd1locd2locd3 北部 1 100 是北部,而非中部,也非南部 中部 2 010 是中部,而非北部,也非南部 南部 3 001 是南部,而非北部,也非中部 東部 4 000 非北部,非中部,也非南部, 因而是東部

34 Multi Regression 34 虛擬變數轉換 操作說明

35 Multi Regression 35 轉換為虛擬變數

36 Multi Regression 36 已轉換為虛擬變數

37 Multi Regression 37 多元迴歸分析 操作說明

38 Multi Regression 38 問題:學生性別、數學焦慮 、數學態度、數學投入動機 是否可有效預測學生的數學 成就?其預測力如何?

39 Multi Regression 39 效標變項 預測變項 迴歸分析方法 模式適合度會列出已進入模式或 刪除之變數,並顯示迴歸分析相 關的統計量:多元相關係數 R 、 R 平方、調整後的 R 平方、估計 值的標準誤與變數數分析摘要表 。

40 Multi Regression 40 多元迴歸分析 報表說明

41 Multi Regression 41 選取變項的順序,最右邊一欄 進入與移除的標準。 進入模式的標準是 F 的顯著性 機率要小於或等於.050 ,而移 除的標準是 F 的顯著性機率大 於或等於.100 者。 迴歸模式的解釋量

42 Multi Regression 42 P 值小於 0.01 ,此迴歸模式顯著此迴歸模式所包含的預測變數

43 Multi Regression 43 B 為原始迴歸係數。數學成就 = -4.522+.309x 工作投入 +.382x 成功態度 -.401x 自我投入 +3.080x 學生性別 -.344x 壓力懼怕 +.610x 課堂焦慮 +.222x 學習信心 +.249x 有用性 迴歸係數  j 之 邊際檢定統計 量


Download ppt "Multi Regression 1 多元迴歸分析 【研究問題】 學生性別、數學焦慮、數學態度、數學投入動機 是否可有效預測學生的數學成就?其預測力如何? 學生性別、數學焦慮、數學態度、數學投入動機 是否可有效預測學生的數學成就?其預測力如何? 【方法分析】 研究問題中,由於預測變項包括「學生性別」、"

Similar presentations


Ads by Google