Quant_reg11 第三章 迴歸分析 如何估計一合理的股價? 影響股價的因素: 紅利 (dividend) 、報酬率、 營業額、公司利潤、 其它 ( 不確定因素 ) 每一因素的影響程度可能不一樣 以一數學式描述 股價 =β 1 ( 紅利 ) +β 2 ( 報酬率 ) +β 3 ( 營業額 ) +β 4 ( 利潤 ) + 不確定因素 此即為一線性迴歸模式
Quant_reg12 其中 Y t 為依變數 (dependent var.) X tj 為解釋變數 (explanatory var.), 或自變數 (dependent var.) β t 為參數 (parameter) β 0 為截距 (intercept) , 捕捉模式的解釋變數無法解釋平均效果 ε tj 為隨機誤差項 (error) ,個案的變異量 註解 : 1 、線性迴歸模型意指其對參數為線性的方程式 2 、此 k 個解釋變數, 可為量性或質性變數, E(Y) = β 0 + β 1 X 1 +…….+ β k X k ε t ~ NID( 0, σ 2 ) 第一節 線性迴歸模型
Quant_reg13 0 + 1 X 1 + 2 X 2 +…+ k X k 之意義 E(Y t |X 1t, …,X kt )= 0 + 1 X 1t + 2 X 2t + … + k X kt 在控制變數或條件下期望的觀察值 實際觀察到的值 Y t 為此條件期望值加上隨機誤 差項 (random error term) Y t =E(Y t |X 1t, …,X kt )+ t
Quant_reg14 模型假設 應變數 (Y t ) 可表達為若干個已知自變數 (X t ) 的線性 函數與一誤差項 ( t ) 之和。 誤差項 ( t ) 的期望值為零。 E( t )=0 誤差項 ( t ) 彼此不相關,且每一誤差項的變異數相 同(獨立,同值 homoskedasticity )。 自變數為固定變數,且為非隨機 (nonstochastic) 。 自變數間不存在線性相關,且觀察值的個數要大於 待估計的參數數目。
Quant_reg15 有關假設之常見問題 解釋變數選擇錯誤。 真實的模式非線性 線性關係是指被解釋變數為參數的線性函數,而非解 釋變數的線性函數,如 Y t =a+bX t 2 + t 可定義 Z t =X t 2 ,但 Y t =a+{(X t -b)/c} 則無法透過變數轉換 轉成線性模型。 估計參數不穩定: 會隨時間的改變而有不 同。
Quant_reg16 其他常見問題 假設 3 中,若誤差項不符合獨立同質的假說, 則可能產生的問題: 1. 異質變異 (heteroskedasticity ) 2. 自我相關 (autocorrelation) ,即誤差項 與前期的誤差相關 假設 5 中,若自變數間有高度相關的話,則可 能產生共線性( multicollineariity) 針對上列問題,使用特殊迴歸方法來解決。 ( 將在第四章介紹 )
Quant_reg17 第二節 參數估計: OLS 估計法 以簡單線性迴歸模型為例: Y t = 0 + 1 X 1t + t 找一組 ( 0 , 1 ) 的組合,將樣本誤差項 (e t =Y t - 0 - 1 X 1t ) 的平方和極小化,即 min (Y t - 0 - 1 X 1t ) 2
Quant_reg18 OLS 估計量
Quant_reg19 以矩陣表示
Quant_reg110 複迴歸模式的矩陣表示 矩陣 X 與 β 可表示為
Quant_reg111 複迴歸模式的 OLS 估計值 複迴歸模式參數 β 與變異數 σ 2 的 OLS 估計值 的矩陣表達如下: 其中, 為模式之殘差 殘差:觀察到未能被預測模式所解釋的部分。
Quant_reg112 估計量的期望值與變異數 參數 的 OLS 估計量的期望值與變異數為 亦即此 OLS 估計量是不偏的 根據高斯 — 馬可夫定理,可證明 的 OLS 估計量 是最佳線性不偏估計量 (BLUE) ,也就是在所有的 線性估計量中, OLS 估計量的變異數是最小的。
Quant_reg113 估計量的標準誤 上式中代 k=1 ,簡單線性迴歸模式中, 0 、 1 估計量 的變異數如下: 觀察上式得到:若解釋變數的變異或波動越大, 則 0 、 1 估計量的變異數越 ?,而精確度也就 越?。 標準誤:變異數開根號,是估計精度的測值。
Quant_reg114 迴歸係數的意義 例:兩個自變數的模式, Y =β 0 +β 1 X 1 +β 2 X 2 + ε b 1 表示 X 2 固定時,估計平均反應 (Y) 隨 X 1 之每一單位增加而改變的量 ( 估計 X 1 的改變對 Y 的影響 ) b 2 表示 X 1 固定時,估計平均反應 (Y) 隨 X 2 之每一單位增加而改變的量 迴歸式的意義
Quant_reg115 範例 : 研究一個社區相館的營業額 (Y ,千元 ) 是否 可用該社區 16 歲以下人口數 (X 1 ,千人 ) 和平均每人可 支配所得 (X 2 ,千元 ) 來預測? n=21 St. Err. B of B t(18) p-level Interpret X X 迴歸式: Y = X X 2 解釋:平均每人可支配所得固定時,估計社區 16 歲以下人口數增加 1 千元,相館的營業額增加 1.45 千元,估計標準誤 =.212 。 社區 16 歲以下人口數固定時,估計平均每人可支配所得 增加 1 千元, 相館的營業額增加 9.37 千元,估計標準誤 = 4.06 。
Quant_reg116 估計量的分配 若 ε~Normal ,可證明以矩陣表示的迴歸模式 中,估計量的分配為 因此,可得到
Quant_reg117 各係數的檢定 H 0 : i = i0 H 1 : i i0 在常態分配的假設下,參數的估計量遵循一常態分 配,故可以 t-test 來檢定參數的顯著性。 H 0 : i =0 H 1 : i 0 檢定第 i 個解釋變數的效力 若看 SAS 報表結果,當 p- 值小於 0.05 ,則拒絕 H 0 , 表示第 i 個解釋變數對 Y 的影響力顯著
Quant_reg118 雙尾檢定與單尾檢定 雙尾檢定: H 1 : i 0 用報表中的 p-value 單尾檢定: H 1 : i > 0 (或 H 1 : i < 0 ) 將報表中的 p-value / 2 ,為確實的 p- 值 係數的檢定目的是想知道 X i 對 Y 的影響是否顯著, 但此檢定是在其它解釋變數都已在模式內的情況下 做的檢定,屬於額外的影響,非 X i 對 Y 的單純影 響。
Quant_reg119 範例 : 研究一個社區相館的營業額 (Y ,千元 ) 是否 可用該社區 16 歲以下人口數 (X 1 ,千人 ) 和平均每人可 支配所得 (X 2 ,千元 ) 來預測? n=21 St. Err. B of B t(18) p-level Interpret X X 係數檢定結果: 已將平均每人可支配所得考慮後,社區 16 歲以下人口數對相館的營業 額的影響是顯著的 (t test p- 值 = ) 已將社區 16 歲以下人口數考慮後,平均每人可支配所得對相館的營業 額的影響是顯著的 (t test p- 值 = )
Quant_reg120 第三節 預測 考慮簡單線性迴歸模式 給一解釋變數的值, x 0 ,其最佳估計值(或預測值) 為 預測誤差為預測誤差為 期望值與變異數為
Quant_reg121 影響預測精確度的因素: 觀察上式得到影響預測值精確度的因素為: 樣本的大小 (N) 解釋變數的波動程度 ( ) X 0 偏離解釋變數樣本平均值 ( ) 的程度
Quant_reg122 模式的配適程度 迴歸是由分析資料者依據學理、資料的呈現來 設定模式,故檢測選擇的模式是否適合資料是 很重要的。配適度的檢測結果可幫助我們支持 迴歸的適用性,也可幫助我們選出一最佳的模 式。 常用的判定值:判定係數 (R 2 ), Cp, AIC, BIC
Quant_reg123 變異來源 SS df MS F p-value 迴 歸 SSR k P(F>F 0 ) 誤 差 SSE N-k-1 合 計 SSTO N-1 SSTO = SSR+SSE 變異數分析表( ANOVA table ) Analysis of Variance; DV: Y Sums of Mean Squares df Squares F p-level Regress Residual Total
Quant_reg124 判定係數 在統計上,我們常使用判定係數( R 2 )來說明 Y 之總變異由解釋變數解釋的能力 0 ≦ R 2 ≦ 1 只有一解釋變數時, R 2 = r 2 ,此處 r 是 Y 與 X 的 相關係數。 增加 X 變數個數,一定會使 R 2 值增加。 SSTO = SSR+SSE
Quant_reg125 高的 R 2 值並不一定表示配套的模式適合。 有些學者建議以 X 變數個數調整後的校正複判定係數 (Adjusted coef. of determination ) 為選擇模式的標準。 校正複判定係數 Regression Summary for Dependent Variable: Y R= R 2 = Adjusted R 2 = F(2,18)= p< Std.Error of estimate:
Quant_reg126 【例 】 研究某林區樹木之高度 (high) ,株數 (no) 對樹木 直徑的影響 迴歸式一 迴歸式二 R 2 = , R a 2 = R 2 = , R a 2 = Parameter Estimates VariableParameter Estimate Pr > |t| < Intercept high Parameter Estimates VariableParameter Estimate Pr > |t| Intercept no high 高的 R 2 值並不一定表示配套的模式適合
Quant_reg127 Information Criterior 目前常使用 AIC (Akaike information criterior) 及 SBC (Schwartz information criterior) 的值來選擇較適合資 料的模式: 觀念上, AIC 與 SBC 的值越小表示模式越適合 Model → R-squared selection → ˇAkaike ’ s information ˇ SBC
Quant_reg128 第五節 美、日股市對台股之影響 欲分析美、日的股市報酬對台灣股市的影響
Quant_reg129 第五節 美、日股市對台股之影響 觀察:美、日的股市前日報酬對台股的影 響明顯 設立模式: 今日台股 前一日美股 前一日日股
Quant_reg130 SAS 報表輸出 Analysis of Variance SourceDFSum of Squares Mean Square F ValuePr > F Model Error Corrected Total Root MSE R-Square Dependent Mean Adj R-Sq Coeff Var Parameter Estimates VariableLabelDFParameter Estimate Standard Error t ValuePr > |t| Intercept lagus lagjp 日股的額外影響 不顯著 截距不顯著
Quant_reg131 Root MSE R-Square Dependent Mean Adj R-Sq Coeff Var Parameter Estimates VariableLabelDFParameter Estimate Standard Error t ValuePr > |t| Intercept lagus 迴歸分析:刪去日股變數 注意: R-square 變小,但是 Adj R-sq 比較大
Quant_reg132 預測區間
Quant_reg133 迴歸分析無截距項 假設迴歸分析無截距項表示為 R tw,t =β 1 *r us,t-1 +β 2 *r jp,t-1 +ε t ( 即是少了一項 β 0 ) Model → no intercept Root MSE R-Square Dependent Mean Adj R-Sq Coeff Var Parameter Estimates VariableLabelDF Parameter Estimate Standard Error t ValuePr > |t| lagus lagjp 只有兩個參數 估計沒有截距 項的估計
Quant_reg134 一般而言,除非有很強力的理論或是證據認 為模型是無截距項,否則一般皆應引入截距 項,因為截距項為捕捉模型的解釋變數無法 解釋之變異的淨平均效果。
Quant_reg135 第六節 使用 EXCEL 進行迴歸分析 註: excel 資料分析中的迴歸限於簡易迴歸使用
Quant_reg136
Quant_reg137
Quant_reg138 美股對台股之影響分析 估計的迴歸直線為 台股報酬 = X, X 為美股前一日的報酬 迴歸線標準誤 = 此迴歸線之判定係數 = ,表示台股報酬的變化 可由美股前一日的報酬解釋 11.85% 由此迴歸線得到:美股前一日的報酬每增加 1 ,估計台 股報酬增加 若美股前一日的報酬為 5% ,預估台股報酬 2.29% 二變數的相關係數 = ,表示台股報酬與美股前 一日報酬是弱相關
Quant_reg139 斜率經 t- 檢定, p- 值 =0.343 ,斜率顯著不為 0 , 意指美股前一日的報酬對台股當日的影響顯著 估計斜率 =0.458 ,標準誤 = 95% 斜率的信賴區間為 0.458±(2.025)0.208
Quant_reg140 Task roles :指定 Explanatory variables 解釋變數 (t) Dependent variables 依變數 (Y) Model : 指定模式選擇法 Statistics :指定要列印的統計值 Plots :指定預測結果圖形 ■ Predicted ( 預測圖 ) ■ Residual ( 殘差圖 ) Predictions :儲存統計值,預測值,或殘差 Title : 標題指定 SAS Enterprise Guide : 簡易迴歸分析 迴歸分析: Analysis → Regression → Linear
Quant_reg141 Plots :指定預測結果圖形 ■ Predicted ˇobserved vs independents Show limits ⊙ prediction limits 指定殘差圖 ■ Residual ˇstudentized vs independents Predictions :儲存統計值,預測值,或殘差 ■ Data ˇoriginal sample ■ Additional statistics ˇResiduals ˇPrediction limits ■ Save ˇpreditions ■ Display output