Presentation is loading. Please wait.

Presentation is loading. Please wait.

拾壹 違反迴歸假設以及補救方法 主講人 陳陸輝 研究員 政治大學選舉研究中心. 講授主題 一、解釋變數之間的共線性問題 二、變異數不齊一性 三、誤差項自我迴歸(相關)

Similar presentations


Presentation on theme: "拾壹 違反迴歸假設以及補救方法 主講人 陳陸輝 研究員 政治大學選舉研究中心. 講授主題 一、解釋變數之間的共線性問題 二、變異數不齊一性 三、誤差項自我迴歸(相關)"— Presentation transcript:

1 拾壹 違反迴歸假設以及補救方法 主講人 陳陸輝 研究員 政治大學選舉研究中心

2 講授主題 一、解釋變數之間的共線性問題 二、變異數不齊一性 三、誤差項自我迴歸(相關)

3 一、解釋變數之間的共線性問題 1. 定義多重共線性 2. 各種偵測共線性的方法 3. 共線性對於估計的影響 4. 補救方法

4 1. 定義多重共線性

5 Perfect multicollinearity (完全多重共線性)

6 多重共線性的後果 當解釋變數間出現完全多重共線性的情況時: 解釋變數的係數無法估計 其標準誤出現無限大的情況

7 多重共線性的程度 實際上,共線性是「程度問題」 偶見高度多重共線性 以一個第 147 頁的( 11.2 )方程式為例

8 變異膨脹因子 (Variance-Inflating Factor, VIF)

9 相關程度與變異膨脹因子的效果

10 2. 各種偵測共線性的方法 (p.149) (1) High R 2 but few significant t ratios. (2) High pair-wise correlations among regressors. (3) Examination of partial correlations. (4) Auxiliary regressions. (5) Eigenvalue and condition index. (6) Tolerance and variance inflation factor.

11 (1) High R 2 but few significant t ratios 當你發現模型的 R 2 高,但是變數的 t 檢定卻 少有顯著時 可以拿掉一兩個變數,看看估計結果是否出 現重要變化

12 (2) 自變數間高度相關 放入模型中的解釋變數,本身即具有高度的 相關,相關程度超過 0.8 會是大問題 ( Gujarati 1995, 335 ) 不過,有時自變數間低相關也會出現共線性 解釋變數超過兩個,也難用此原則檢視 社會科學常見現象,選舉研究尤為常見: 政黨認同、統獨立場、候選人評價

13 (3) 檢視偏相關 當我們有超過兩個以上的解釋變數 需檢視變數之間的偏相關

14 (4) 輔助迴歸估計 檢視變數間是否高度相關 以一自變數為依變數,將其他變數放入模型 得到新的 R 2 用此新的 R 2 與原有模型的 R 2 做 F 檢定 或是 看新的 R 2 是否超過原統計模型的 R 2

15 (5) 特徵值與條件指標 條件指標小於 10 則沒有問題 介於 10 到 30 則為中度到高度的共線性 超過 30 則為嚴重的共線性

16 ( 6 )容忍度與變異膨脹因子 VIF 超過 10 表示相關達到 0.949 TOL=1/VIF 接近 1 表示獨立變數間無關聯性 接近 0 表示獨立變數間有高度相關

17 3. 共線性對於估計的影響 (1) Large Variances of OLS Estimators (2) Wider Confidence Intervals (3) Insignificant t Ratio (4) A High R 2 but Few Significant t Ratio (5) Sensitivity of OLS estimators and their standard errors to small changes in data

18 4. 補救方法 (1). A priori information (2). Combining cross-sectional and time series data (3). Dropping a variable(s) and specification bias (4). Transformation of variables (5). Additional or new data. (6). Reducing collinearity in polynomial regressions (7). Other methods—Factor analysis or principal components

19 ( 1 )事前資訊 當你知道自變數之間的關係時 先將部分自變數納入 再用估計結果 推估未納入計算自變數的估計值 ( Gujarati 1995, 340 )

20 ( 2 )納入跨時與剖面資料 此一目的在增加觀察值 不過,也增加解釋的困難 (中國不同地區經濟成長或是政府支出問題)

21 ( 3 )拿掉一個變數 拿掉一個你認為是「搗蛋」的變數 不過,也會出現模型設定不足 ( Model Under-specification )

22 ( 4 )轉換變數 在時間序列資料中 將自變數與依變數與前一時間點相減 自變數之間的相關將會消除,不過,誤差項也許 會出現問題

23 ( 5 )納入更多資料 與方法 2 類似,不過,通常不太「實際」

24 ( 6 ) polynomial regressions 將自變數與不同次方 取自變數的離差

25 ( 7 )其他方法 幾個變數如果高度相關,則可以用因素分析 或是指標建構的方式,將多個變數建立成一指標

26 二、變異數不齊一性 1. 定義 2. 成因 3. 對估計的影響 4. 檢驗方法 5. 補救措施

27 1. 定義 誤差項的變異數大小會隨著依變數大小而變化

28 1. 定義:變異數齊一性

29 1. 定義:變異數不齊一性

30 2. 變異數不齊一性的成因 As people learn The variances of error terms are positively correlated with the independent variables. When our data collecting techniques improve Heteroskedasticity can also arise as a result of outliers in our data. Another resource of heteroscedasticity arises from mis-specifying the regression model.

31 (1) 因為學習,減低錯誤

32 (2) 誤差項與自變數正相關 個人收入愈多,存款的選擇愈多 公司收入愈好,股利發放愈多樣

33 ( 3 )資料蒐集的技術改進

34 ( 4 )因為出現極端值

35 ( 5 )模型設定錯誤 忽略重要變數

36 3. 對估計的影響 1). Heteroskedasticity, Unbiasedness, and Consistency 2). Heteroskedasticity and Standard Errors of OLS Coefficients The consequences of heteroskedasticity are that b is still unbiased and consistent, but its variance will be incorrect. In other words, it is inefficient. Additionally, our conventional test statistics are invalid.

37 4. 檢驗方法 非正式:圖形檢驗 1) The White Test 2) The Breusch-Pagan-Godfrey Test

38 圖形檢驗:誤差平方與預測值

39 圖形檢驗:超過兩個自變數

40 正式檢定: The White Test 先估計原模型 取誤差項的平方 將自變數改為 原變數 原變數的平方 原變數之間的交互作用 ( Gujarati 1995,379-80 ) 統計檢定: n*R 2 ~X 2 df

41 5. 補救措施 對於變異數不齊一性的各種補救方法都不適當, 主要補救方法著重在對於特定解釋變數予以加 權處理,以降低其變異數的影響。最大概似法 有其他的方法,可以處理這個問題,此處並不 加以介紹。

42 三、誤差項自我迴歸(相關) 1. 定義 2. 成因 3. 對估計的影響 4. 檢驗方法 5. 補救措施

43 誤差項自我迴歸(相關)

44 1. 定義 The term autocorrelation (or serial correlation) may be defined as correlation between members of series of observations ordered in time [as in time series data] or space [as in cross-sectional data] (Gujarati 1995: 400-1).

45 2. 成因 However, serial correlation could indeed be error autocorrelation, but it could also be the result of dynamic misspecification, parameter nonconstancy, incorrect functional form, and so on (Granato 1991: 124).

46 2. 成因 According to Kennedy (1992: 119), there are several reasons why serial correlation arises: Spatial autocorrelation: Prolonged influence of shocks: Inertia: Data manipulation: Misspecification:

47 3. 對估計的影響 (1).No Lagged Endogenous Variable (2).Lagged Endogenous Variable

48 (1).No Lagged Endogenous Variable 係數仍然是無偏估計 係數的標準誤估計被低估 假設檢定犯下第一型錯誤的機率增高

49 (2).Lagged Endogenous Variable 讓 OLS 的估計變得 Inconsistent

50 4. 檢驗方法 參考課本內容以及所列書目

51 5. 補救措施 好好學統計

52 表 7 的說明 好好學統計


Download ppt "拾壹 違反迴歸假設以及補救方法 主講人 陳陸輝 研究員 政治大學選舉研究中心. 講授主題 一、解釋變數之間的共線性問題 二、變異數不齊一性 三、誤差項自我迴歸(相關)"

Similar presentations


Ads by Google