Presentation is loading. Please wait.

Presentation is loading. Please wait.

Quant_reg11 第三章 迴歸分析  如何估計一合理的股價?  影響股價的因素: 紅利 (dividend) 、報酬率、 營業額、公司利潤、 其它 ( 不確定因素 )  每一因素的影響程度可能不一樣  以一數學式描述 股價 =β 1 ( 紅利 ) +β 2 ( 報酬率 ) +β 3 (

Similar presentations


Presentation on theme: "Quant_reg11 第三章 迴歸分析  如何估計一合理的股價?  影響股價的因素: 紅利 (dividend) 、報酬率、 營業額、公司利潤、 其它 ( 不確定因素 )  每一因素的影響程度可能不一樣  以一數學式描述 股價 =β 1 ( 紅利 ) +β 2 ( 報酬率 ) +β 3 ("— Presentation transcript:

1

2 Quant_reg11 第三章 迴歸分析  如何估計一合理的股價?  影響股價的因素: 紅利 (dividend) 、報酬率、 營業額、公司利潤、 其它 ( 不確定因素 )  每一因素的影響程度可能不一樣  以一數學式描述 股價 =β 1 ( 紅利 ) +β 2 ( 報酬率 ) +β 3 ( 營業額 ) +β 4 ( 利潤 ) + 不確定因素  此即為一線性迴歸模式

3 Quant_reg12 其中 Y t 為依變數 (dependent var.) X tj 為解釋變數 (explanatory var.), 或自變數 (dependent var.) β t 為參數 (parameter) β 0 為截距 (intercept) , 捕捉模式的解釋變數無法解釋平均效果 ε tj 為隨機誤差項 (error) ,個案的變異量 註解 : 1 、線性迴歸模型意指其對參數為線性的方程式 2 、此 k 個解釋變數, 可為量性或質性變數, E(Y) = β 0 + β 1 X 1 +…….+ β k X k ε t ~ NID( 0, σ 2 ) 第一節 線性迴歸模型

4 Quant_reg13  0 +  1 X 1 +  2 X 2 +…+  k X k 之意義 E(Y t |X 1t, …,X kt )= 0 + 1 X 1t + 2 X 2t + … +  k X kt 在控制變數或條件下期望的觀察值 實際觀察到的值 Y t 為此條件期望值加上隨機誤 差項 (random error term) Y t =E(Y t |X 1t, …,X kt )+ t

5 Quant_reg14 模型假設  應變數 (Y t ) 可表達為若干個已知自變數 (X t ) 的線性 函數與一誤差項 ( t ) 之和。  誤差項 ( t ) 的期望值為零。 E( t )=0  誤差項 ( t ) 彼此不相關,且每一誤差項的變異數相 同(獨立,同值 homoskedasticity )。  自變數為固定變數,且為非隨機 (nonstochastic) 。  自變數間不存在線性相關,且觀察值的個數要大於 待估計的參數數目。

6 Quant_reg15 有關假設之常見問題  解釋變數選擇錯誤。  真實的模式非線性 線性關係是指被解釋變數為參數的線性函數,而非解 釋變數的線性函數,如 Y t =a+bX t 2 +  t 可定義 Z t =X t 2 ,但 Y t =a+{(X t -b)/c} 則無法透過變數轉換 轉成線性模型。  估計參數不穩定:  會隨時間的改變而有不 同。

7 Quant_reg16 其他常見問題  假設 3 中,若誤差項不符合獨立同質的假說, 則可能產生的問題: 1. 異質變異 (heteroskedasticity ) 2. 自我相關 (autocorrelation) ,即誤差項 與前期的誤差相關  假設 5 中,若自變數間有高度相關的話,則可 能產生共線性( multicollineariity)  針對上列問題,使用特殊迴歸方法來解決。 ( 將在第四章介紹 )

8 Quant_reg17 第二節 參數估計: OLS 估計法  以簡單線性迴歸模型為例: Y t =  0 + 1 X 1t + t  找一組 ( 0 ,  1 ) 的組合,將樣本誤差項 (e t =Y t -  0 -  1 X 1t ) 的平方和極小化,即 min (Y t -  0 -  1 X 1t ) 2

9 Quant_reg18 OLS 估計量

10 Quant_reg19 以矩陣表示

11 Quant_reg110 複迴歸模式的矩陣表示  矩陣 X 與 β 可表示為

12 Quant_reg111 複迴歸模式的 OLS 估計值  複迴歸模式參數 β 與變異數 σ 2 的 OLS 估計值 的矩陣表達如下:  其中, 為模式之殘差  殘差:觀察到未能被預測模式所解釋的部分。

13 Quant_reg112 估計量的期望值與變異數  參數  的 OLS 估計量的期望值與變異數為 亦即此 OLS 估計量是不偏的 根據高斯 — 馬可夫定理,可證明  的 OLS 估計量 是最佳線性不偏估計量 (BLUE) ,也就是在所有的 線性估計量中, OLS 估計量的變異數是最小的。

14 Quant_reg113 估計量的標準誤  上式中代 k=1 ,簡單線性迴歸模式中,  0 、  1 估計量 的變異數如下: 觀察上式得到:若解釋變數的變異或波動越大, 則  0 、  1 估計量的變異數越 ?,而精確度也就 越?。 標準誤:變異數開根號,是估計精度的測值。

15 Quant_reg114 迴歸係數的意義 例:兩個自變數的模式, Y =β 0 +β 1 X 1 +β 2 X 2 + ε b 1 表示 X 2 固定時,估計平均反應 (Y) 隨 X 1 之每一單位增加而改變的量 ( 估計 X 1 的改變對 Y 的影響 ) b 2 表示 X 1 固定時,估計平均反應 (Y) 隨 X 2 之每一單位增加而改變的量 迴歸式的意義

16 Quant_reg115 範例 : 研究一個社區相館的營業額 (Y ,千元 ) 是否 可用該社區 16 歲以下人口數 (X 1 ,千人 ) 和平均每人可 支配所得 (X 2 ,千元 ) 來預測? n=21 St. Err. B of B t(18) p-level Interpret -68.8571 60.01695 -1.14729.266282 X1 1.4546.21178 6.86820.000002 X2 9.3655 4.06396 2.30453.033321 迴歸式: Y = - 68.9 + 1.45 X 1 +9.37 X 2 解釋:平均每人可支配所得固定時,估計社區 16 歲以下人口數增加 1 千元,相館的營業額增加 1.45 千元,估計標準誤 =.212 。 社區 16 歲以下人口數固定時,估計平均每人可支配所得 增加 1 千元, 相館的營業額增加 9.37 千元,估計標準誤 = 4.06 。

17 Quant_reg116 估計量的分配  若 ε~Normal ,可證明以矩陣表示的迴歸模式 中,估計量的分配為  因此,可得到

18 Quant_reg117 各係數的檢定  H 0 :  i =  i0 H 1 :  i   i0 在常態分配的假設下,參數的估計量遵循一常態分 配,故可以 t-test 來檢定參數的顯著性。  H 0 :  i =0 H 1 :  i  0 檢定第 i 個解釋變數的效力 若看 SAS 報表結果,當 p- 值小於 0.05 ,則拒絕 H 0 , 表示第 i 個解釋變數對 Y 的影響力顯著

19 Quant_reg118 雙尾檢定與單尾檢定  雙尾檢定: H 1 :  i  0 用報表中的 p-value  單尾檢定: H 1 :  i > 0 (或 H 1 : i < 0 ) 將報表中的 p-value / 2 ,為確實的 p- 值  係數的檢定目的是想知道 X i 對 Y 的影響是否顯著, 但此檢定是在其它解釋變數都已在模式內的情況下 做的檢定,屬於額外的影響,非 X i 對 Y 的單純影 響。

20 Quant_reg119 範例 : 研究一個社區相館的營業額 (Y ,千元 ) 是否 可用該社區 16 歲以下人口數 (X 1 ,千人 ) 和平均每人可 支配所得 (X 2 ,千元 ) 來預測? n=21 St. Err. B of B t(18) p-level Interpret -68.8571 60.01695 -1.14729.266282 X1 1.4546.21178 6.86820.000002 X2 9.3655 4.06396 2.30453.033321 係數檢定結果: 已將平均每人可支配所得考慮後,社區 16 歲以下人口數對相館的營業 額的影響是顯著的 (t test p- 值 = 0.000002) 已將社區 16 歲以下人口數考慮後,平均每人可支配所得對相館的營業 額的影響是顯著的 (t test p- 值 = 0.0333)

21 Quant_reg120 第三節 預測  考慮簡單線性迴歸模式  給一解釋變數的值, x 0 ,其最佳估計值(或預測值) 為  預測誤差為預測誤差為  期望值與變異數為

22 Quant_reg121 影響預測精確度的因素: 觀察上式得到影響預測值精確度的因素為:  樣本的大小 (N)  解釋變數的波動程度 ( )  X 0 偏離解釋變數樣本平均值 ( ) 的程度

23 Quant_reg122 模式的配適程度  迴歸是由分析資料者依據學理、資料的呈現來 設定模式,故檢測選擇的模式是否適合資料是 很重要的。配適度的檢測結果可幫助我們支持 迴歸的適用性,也可幫助我們選出一最佳的模 式。  常用的判定值:判定係數 (R 2 ), Cp, AIC, BIC

24 Quant_reg123 變異來源 SS df MS F p-value 迴 歸 SSR k P(F>F 0 ) 誤 差 SSE N-k-1 合 計 SSTO N-1 SSTO = SSR+SSE 變異數分析表( ANOVA table ) Analysis of Variance; DV: Y Sums of Mean Squares df Squares F p-level Regress. 24015.282 12007.64 99.1035.00 Residual 2180.93 18 121.16 Total 26196.21

25 Quant_reg124 判定係數  在統計上,我們常使用判定係數( R 2 )來說明 Y 之總變異由解釋變數解釋的能力  0 ≦ R 2 ≦ 1  只有一解釋變數時, R 2 = r 2 ,此處 r 是 Y 與 X 的 相關係數。  增加 X 變數個數,一定會使 R 2 值增加。 SSTO = SSR+SSE

26 Quant_reg125 高的 R 2 值並不一定表示配套的模式適合。 有些學者建議以 X 變數個數調整後的校正複判定係數 (Adjusted coef. of determination ) 為選擇模式的標準。 校正複判定係數 Regression Summary for Dependent Variable: Y R=.95746877 R 2 =.91674645 Adjusted R 2 =.90749606 F(2,18)=99.104 p<.00000 Std.Error of estimate: 11.007

27 Quant_reg126 【例 】 研究某林區樹木之高度 (high) ,株數 (no) 對樹木 直徑的影響 迴歸式一 迴歸式二 R 2 = 0.617 , R a 2 = 0.553 R 2 = 0.589 , R a 2 = 0.557 Parameter Estimates VariableParameter Estimate 3.59373 0.05350 Pr > |t| <.0001 0.0008 Intercept high Parameter Estimates VariableParameter Estimate 4.13434 -0.00090957 0.05561 Pr > |t| 0.0004 0.3662 0.0009 Intercept no high 高的 R 2 值並不一定表示配套的模式適合

28 Quant_reg127 Information Criterior  目前常使用 AIC (Akaike information criterior) 及 SBC (Schwartz information criterior) 的值來選擇較適合資 料的模式:  觀念上, AIC 與 SBC 的值越小表示模式越適合 Model → R-squared selection → ˇAkaike ’ s information ˇ SBC

29 Quant_reg128 第五節 美、日股市對台股之影響  欲分析美、日的股市報酬對台灣股市的影響

30 Quant_reg129 第五節 美、日股市對台股之影響  觀察:美、日的股市前日報酬對台股的影 響明顯  設立模式: 今日台股 前一日美股 前一日日股

31 Quant_reg130 SAS 報表輸出 Analysis of Variance SourceDFSum of Squares Mean Square F ValuePr > F Model20.001050.000524692.410.1043 Error350.007610.00021748 Corrected Total370.00866 Root MSE0.01475R-Square0.1212 Dependent Mean-0.00037539Adj R-Sq0.0709 Coeff Var-3928.41058 Parameter Estimates VariableLabelDFParameter Estimate Standard Error t ValuePr > |t| Intercept 1-0.000082830.00241-0.030.9728 lagus 10.457840.211082.170.0370 lagjp 10.049980.152560.330.7451 日股的額外影響 不顯著 截距不顯著

32 Quant_reg131 Root MSE0.01456R-Square0.1185 Dependent Mean-0.00037539Adj R-Sq0.0940 Coeff Var-3879.40005 Parameter Estimates VariableLabelDFParameter Estimate Standard Error t ValuePr > |t| Intercept 1-0.000167460.00236-0.070.9439 lagus 10.458470.208442.200.0343 迴歸分析:刪去日股變數 注意: R-square 變小,但是 Adj R-sq 比較大

33 Quant_reg132 預測區間

34 Quant_reg133 迴歸分析無截距項  假設迴歸分析無截距項表示為 R tw,t =β 1 *r us,t-1 +β 2 *r jp,t-1 +ε t ( 即是少了一項 β 0 ) Model → no intercept Root MSE0.01454R-Square0.1217 Dependent Mean -0.00037539Adj R-Sq0.0729 Coeff Var-3873.53054 Parameter Estimates VariableLabelDF Parameter Estimate Standard Error t ValuePr > |t| lagus 10.458120.207982.200.0341 lagjp 10.050550.149560.340.7374 只有兩個參數 估計沒有截距 項的估計

35 Quant_reg134  一般而言,除非有很強力的理論或是證據認 為模型是無截距項,否則一般皆應引入截距 項,因為截距項為捕捉模型的解釋變數無法 解釋之變異的淨平均效果。

36 Quant_reg135 第六節 使用 EXCEL 進行迴歸分析 註: excel 資料分析中的迴歸限於簡易迴歸使用

37 Quant_reg136

38 Quant_reg137

39 Quant_reg138 美股對台股之影響分析  估計的迴歸直線為 台股報酬 = 0.000167 + 0.458 X, X 為美股前一日的報酬 迴歸線標準誤 = 0.0146  此迴歸線之判定係數 =0.1185 ,表示台股報酬的變化 可由美股前一日的報酬解釋 11.85%  由此迴歸線得到:美股前一日的報酬每增加 1 ,估計台 股報酬增加 0.458  若美股前一日的報酬為 5% ,預估台股報酬 2.29%  二變數的相關係數 = 0.344 ,表示台股報酬與美股前 一日報酬是弱相關

40 Quant_reg139  斜率經 t- 檢定, p- 值 =0.343 ,斜率顯著不為 0 , 意指美股前一日的報酬對台股當日的影響顯著  估計斜率 =0.458 ,標準誤 = 0.208  95% 斜率的信賴區間為 0.458±(2.025)0.208

41 Quant_reg140 Task roles :指定 Explanatory variables 解釋變數 (t) Dependent variables 依變數 (Y) Model : 指定模式選擇法 Statistics :指定要列印的統計值 Plots :指定預測結果圖形 ■ Predicted ( 預測圖 ) ■ Residual ( 殘差圖 ) Predictions :儲存統計值,預測值,或殘差 Title : 標題指定 SAS Enterprise Guide : 簡易迴歸分析 迴歸分析: Analysis → Regression → Linear

42 Quant_reg141 Plots :指定預測結果圖形 ■ Predicted ˇobserved vs independents Show limits ⊙ prediction limits 指定殘差圖 ■ Residual ˇstudentized vs independents Predictions :儲存統計值,預測值,或殘差 ■ Data ˇoriginal sample ■ Additional statistics ˇResiduals ˇPrediction limits ■ Save ˇpreditions ■ Display output


Download ppt "Quant_reg11 第三章 迴歸分析  如何估計一合理的股價?  影響股價的因素: 紅利 (dividend) 、報酬率、 營業額、公司利潤、 其它 ( 不確定因素 )  每一因素的影響程度可能不一樣  以一數學式描述 股價 =β 1 ( 紅利 ) +β 2 ( 報酬率 ) +β 3 ("

Similar presentations


Ads by Google