Download presentation
Presentation is loading. Please wait.
1
1 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 政治大學公企中心必修課 課程名稱:社會科學研究方法(量化分析) 授課老師:黃智聰 授課內容: 最小平方估計式的性質、 簡單迴歸模型之推論 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001), Undergraduate Econometrics. New York: John Wiley & Sons 日期: 2012 年 11 月 5 日
2
2 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 Y: 迴歸模型裡的因變數 因變數 y 可以被分解成兩個部分: 1. 規律性的部分: E(y) 不是隨機的 2. 隨機部分 :y 與 E(y) 之間的差,稱為隨機誤差 項 e ( random error term ) e=y-E(y|x)=y- β 1 - β 2 x Y= β 1 + β 2 x +e X: 獨立變數 加入誤差項
3
3 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 1. 對於各個 x 值來說, y 值為 Y= β 1 + β 2 x +e 2. 隨機誤差 e 的平均值為 E(e)=0 ,因為我 們假設 E(y) = β 1 + β 2 x 3. 隨機誤差 e 的變異數為 Var(e)= 2 =Var(y) 因為 y 和 e 只相差一個常數,而此常數不 會改變其變異數。 由誤差項 e 來說明迴歸模型的假設
4
4 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 4. 任何一對隨機誤差 e i 和 e j 的共變數為 Cov (e i, e j ) =Cov (y i, y j )=0 5. 變數 X 並非隨機的,且必須至少有 2 個不同的值。 6.( 選擇性的 )e 值常態地分配於其平均值的附近 e~N(0, 2 ) 。 7.y 是可以觀察的, e 是無法觀察的。 8. 給予任一個 y 值,我們可以計算出 e=y - β 1 - β 2 x
5
5 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 e 表示除了 x 之外,會影響 y 的其他因素。 在食物支出的例子裡,什麼因素可能會導致支 出 y 與其平均值 E(y|x) 之間的不同呢 ? 1. 在任何經濟模型中,我們想把所有重要且相 關的解釋變數都包含在模型裡。 2. 誤差項 e 包含了任何可能出現的近似誤差,因 為我們假設的線性函數形式可能只是實際的近 似值而已。 對誤差項 e 的另一種解釋方式
6
6 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 3. 誤差項包括可能出現於個別隨機行為中的任 何情況。對於所有影響個人食物支出的變數之 瞭解可能不足以完全地預測支出。無法預測之 隨機行為的部分也有可能包含在 e 裡面。
7
7 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 1. 我們假設表 3.1 中的支出資料是隨機變數 y t, t=1, …,40 ,且滿足假設 SR1-SR5 。 2. 我們把 40 個資料點記為 (y t,, x t ), 其中 t=1, … 40 ,並畫出它們的位置,我們可以得到 圖 3.6 中的散佈圖( scatter diagram )。 估計支出關係的參數
8
8 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 3. 估計平均支出線 E(y)= β 1 + β 2 x 的位置。我們 期望這條線位於所有資料點的中間某處,因為 它代表平均的行為。 4. 要估計 β 1 與 β 2 , 我們可以簡單的畫出一條 通過資料中間的直線,然後用尺衡量其斜率和 截距。 問題 : 不同的人可能畫出不同的線,而因此缺 乏正式的準則。
9
9 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 方法 2: 從所得最小的那一個點畫到所得最大那一 點。 問題 : 忽略了其餘 38 個觀察值確實位置之資訊。
10
10 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 這個原理主張,為了找出一條適合資料值的直 線,我們應該找出一條直線,使得各點到此直 線垂直距離之平方和越小越好。 距離的平方可以避免正的距離被負的距離抵消。 最小平方原理( The Least Squares Principle )
11
11 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 估計值的解釋 b 2 =0.1283 當 x 上升 100,y 將會增加大約 12.83 b 1 =40.7676 當 x 為零時 y 的估計值 食物支出函數的估計值
12
12 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 彈性( elasticity ) Y=b X b2 logy=logb+ b 2 logX logy= b 1 + b 2 logX 彈性 : Y 變動的百分比 X 變動的百分比 =
13
13 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 預測( Prediction ) 估計的等式可以被用在預測或預言的目的上, 將 x 帶入估計的等式就可以得到 y 值。
14
14 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 b 1 和 b 2 是隨機變數,因為它們的值決定於隨機 變數 y ,而 y 的值在樣本被收集之前是未知的。 收集資料之後,最小平方估計值即為計算出來 的數值。由於它們並非隨機的量,所以不具有 統計的性質。 最小平方估計式為隨機變數
15
15 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 最小平方估計式 b 1 和 b 2 為隨機變數,而且它 們具有機率分配的特性,因此我們可以在收集 任何資料之前研究。 在本節中我們將決定最小平方估計式 b 1 與 b 2 的平均值及變異數。 真正的參數值, 未知 不偏的 估計式 and 兩個假設 !!! 最小平方估計式的抽樣性質
16
16 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 若 E(e t ) 0 且 E(b 2 ) 2 , b 2 並非不偏的 ! e t 包含了其他影響 y t 但卻被經濟模型所遺漏 的因素。如果我們忽略了任何重要的東西,則 我們將可預期 E(e t ) 0 並且 E(b 2 ) 2 。 b 2 為不偏的這個事實並未暗示任何一個樣本皆 可能有此特性。
17
17 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 Note: 個別的估計值(數值) b 2 可能會接近或 遠離 β 2 。 但是 E(b 2 )= 2 同樣地, 我們可以計算 var(b 2 ) 和 var(b 2 ) 具有 相同的平均值但不同的變異數。
18
18 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 抽樣精確度 ( Sampling Precision ) 估計式的變異數越小,該估計式的抽樣精確度越高。 1. 若 var(y) var(b 2 ) 精確度越小。 2. 若 var(x) var(b 2 ) 精確度越高。 3. 若 T var(b 2 ) 精確度越高。 4. ΣX 2 var (b 2 ) 精確度越小。 5. X > 0 Cov(b 1,b 2 ) < 0
19
19 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 X b 2 but b 1 X If X < 0
20
20 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 若 e ~ N(0, σ 2 ) 則 b 1 ~ N(β 1, σ 2 b1 ) b 2 ~ N(β 2, σ 2 b2 ) 假設 b 1, b 2 ~ N 如果假設 SR1~SR5 成立, 且樣本數 T 夠大, 則 最小平方估計式的分配會趨近常態分配。 例 : 食物支出的資料。 最小平方估計式的機率分配
21
21 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 b~N(β, σ b 2 ) ~N(0,1) 卡方隨機變數是在標準常態分配 N(0,1) 隨機 變數平方下所產生的。 未知 簡單迴歸模型的推論
22
22 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 若 Z~N(0,1) 而 V~x 2 (m) 且若 Z 和 V 為獨立, 則 P(t ≧ t c )=P(t ≦ - t c )=α/2 m 為自由度 i=1,2 我們預測的變異數 T 分配是對稱的!!
23
23 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 P(- t c ≦ t ≦ t c )=1-α P[- t c ≦ (b 2 - 2 )/SE(b 2 ) ≦ t c ]=1-α P[b 2 - t c Se (b 2 ) ≦ β 2 ≦ b 2 + t c Se(b 2 ) ]=1-α 在區間的兩個端點,和 b 2 與 Se(b 2 ) 皆為隨機變 數,因為它們的值在取得樣本資料之前都是未知 的。
24
24 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 b 2 ± t c Se(b 2 ) 稱為 β 2 的 (1-α) ×100% 的區間 估計值,或者相當於所謂的 (1-α) ×100% 信賴 區間。 所有建立出來的區間中,有 (1-α) ×100% 會包 含真正的參數 β 2 。而在任何資料確實收集到之 前,我們就已經知道這一點了。 若區間為 [0.0666,0.1900], 則 β 2 落在這個區間 嗎 ? 我們不知道,而且我們永遠都不會知道!! 我們知道的是,在得自同一母體的許多隨機樣 本資料時,所有建立的區間估計值中,有 95 % 將會包含真正的參數。
25
25 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 假設檢定( Hypothesis Testing ) 假設檢定的組成要素 1. 虛無假設 H 0 。 2. 對立假設 H 1 。 3. 檢定統計量。 4. 拒絕域。
26
26 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 1. H 0 : β 2 =c, c 為常數, 並且在迴歸模型中是一個 重要的值。 2. H 1 : β 2 ≠ c H 1 : β 2 > c 因為理論上 β 2 不能為負值。 H 1 : β 2 < c 當在 β 2 不可能大於 c 時。
27
27 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 3. 檢定統計量( The test statistic ) Ex: H 0 : β 2 =c H 1 : β 1 ≠ c 注意:若 β 2 =1 ,但是須無假設為 H 0 : β 2 =C , C 1 , 則 因為 不等於 0
28
28 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 因此, 並非標準常態分配。且在形 成一個隨機變數 t 時,標準常配分配是必要 的。
29
29 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 拒絕域( The rejection Region ) 拒絕域是一個導致虛無假設被拒絕的檢定統計 量之數值範圍。 也就是說,拒絕域是當虛無假設為真時,不太 可能或發生機率很低的檢定統計量之數的集合。
30
30 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 雙尾檢定( Two-tailed Test ) 若檢定統計量的值落在拒絕域當中(不論是 t 分 配的哪一端),我們拒絕虛無假設並接受對立假 設。 要避免說 “ 我們接受虛無假設 ” ,而應該以 “ 我們 無法拒絕虛無假設 ” 來替代。這樣的敘述意味著 我們正在推論說個虛無假設為真。
31
31 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 假設檢定的格式( Format for Testing Hypothesis ) 決定虛無假設與對立假設。 確立當虛無假設為真時的檢定統計量及它的分 配。 選擇 α 並決定拒絕域。 計算檢定統計量的樣本數值。 敘述你的結論。
32
32 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 型 I 與 型 II 錯誤 假設檢定的 P 值 1. 利用 P 值,與顯著水準 α 的比較,我們可以決 定是否該拒絕虛無假設。 2. 假設檢定的拒絕法則:若 P < α ,則檢定的 過程會拒絕虛無假設。 食物支出模型的顯著性檢定 1. 存在於 x 與 y 之間的統計的顯著關係。 2. 若 α 越有可能拒絕 H 0 如何決定 α ? 0.1, 0.05, 0.01
33
33 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 H 0 : β k =c H 1 : β k < c or β k > c 電腦是以雙尾來計算的 所以若兩尾算出 P=0.08 時, 單尾 P=0.04 。 所以在兩尾檢定 α=0.05 時 接受 H 0 。 但是單尾檢定時,拒絕 H 0 。 單尾檢定( One-tailed Test )
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.