©Ming-chi Chen 社會統計 Page.1 社會統計 第十講 相關與共變. ©Ming-chi Chen 社會統計 Page.2 Covariance, 共變量 當 X, Y 兩隨機變數不互為獨立時,表示 兩者間有關連。其關連的形式有很多種, 最常見的關連為線性的共變關係。 隨機變數 X,Y.

Slides:



Advertisements
Similar presentations
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Advertisements

Chapter 10 馬可夫鏈 緒言 如果讀者仔細觀察日常生活中所發生的 諸多事件,必然會發現有些事件的未來 發展或演變與該事件現階段的狀況全然 無關,這種事件稱為獨立試行過程 (process of independent trials) ;而另一些 事件則會受到該事件現階段的狀況影響。
第三講 Recode、missing value、假設檢定與信賴區間
本章結構 前言 符號介紹與立透法則 指數機率分配 基本無限來源模式 基本有限來源模式 等候系統的經濟分析-最佳化 進階等候模式 16-1.
1 Chemical and Engineering Thermodynamics Chapter 2 Conservation of mass and energy Sandler.
布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
Advanced Chemical Engineering Thermodynamics
1.1 線性方程式系統簡介 1.2 高斯消去法與高斯-喬登消去法 1.3 線性方程式系統的應用(-Skip-)
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 實驗法.
第十三章 卡方檢定. 學 習 目 標學 習 目 標學 習 目 標學 習 目 標 1. 學習何謂多項試驗 。 2. 學習如何將一群觀測資料與其期望之分配相比較 與檢定。 3. 學習如何檢定兩變數間是否獨立 。
1 政治大學財政所與東亞所選修 -- 應用計量分析 -- 中國財政研究 黃智聰 政治大學財政所與東亞所選修 課程名稱:應用計量分析 -- 中國財政研究 授課老師:黃智聰 授課內容: 簡單線性迴歸模型: 共線性與虛擬變數 參考書目: Hill, C. R., W. E. Griffiths, and G.
Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內, 例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料,通常用卡方檢定 類別資料分析 卡方檢定 卡方檢定基本理論 一個含有 k 項的試驗,設 p i.
消費者物價指數反映生活成本。當消費者物價指數上升時,一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹(inflation)來描述一般物價持續上升的現象,而物價膨脹率(inflation rate)為物價水準的變動百分比。
Chapter 2 聯立線性方程式與矩陣 緒言 線性方程式組 (systems of linear equations) 出現 在多數線性模式 (linear model) 中。根據以往解 題的經驗,讀者們也許已發現方程式的解僅與 該方程式的係數有關,求解的過程也僅與係數 的運算有關,只要係數間的相關位置不改變,
Section 2.3 Least-Squares Regression 最小平方迴歸
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
第 4 章 迴歸的同步推論與其他主題.
1 政大公企中心產業人才投資課程 -- 企業決策分析方法 -- 黃智聰 政大公企中心產業人才投資課程 課程名稱:企業決策分析方法 授課老師:黃智聰 授課內容:利用分公司之追蹤資料進行企業決策分析 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge,
STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性,以列聯表來表示  討論二連續隨機變數時,可以作 x-y 散佈圖觀察它 們的關係強度  以相關係數來代表二者關係的強度.
平均值檢定 假設 檢定 One Sample 平均值 是否為 u. One Sample—1 工廠甲過去向 A 公司購買原料, 平均交貨日約為 4.94 日, 標準差 現在 A 公司改組, 甲工廠繼續向 A 公司 購買, 隨機抽取 8 次採購, 平均日數為 4.29 日, 請問 A 公.
Section 2.2 Correlation 相關係數. 散佈圖 1 散佈圖 2 散佈圖的盲點 兩座標軸的刻度不同,散佈圖的外觀呈 現的相聯性強度,會有不同的感受。 散佈圖 2 相聯性看起來比散佈圖 1 來得強。 以統計數字相關係數做為客觀標準。
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
2-group1 第十一章 二組平均數的比較 【應用】 暴露在一氧化碳和暴露在一般空氣下,發生狹心 症情況是否有差異? 新藥的治療是否比較有效? 健康孩童與罹病孩童血清鐵濃度是否不同? 兩種測量儀器的準確性是否有差異? 洗腎病人透析前後體重比較.
1 政治大學東亞所選修 -- 計量分析與中國大陸研究黃智聰 政治大學東亞所選修 課程名稱:計量分析與中國大陸研究 (量化分析) 授課老師:黃智聰 授課內容:時間序列與橫斷面資料的共用 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001),
1 Part IC. Descriptive Statistics Multivariate Statistics ( 多變量統計 ) Focus: Multiple Regression ( 多元迴歸、複迴歸 ) Spring 2007.
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
信度.
1 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 政治大學公企中心必修課 課程名稱:社會科學研究方法(量化分析) 授課老師:黃智聰 授課內容: 簡單線性迴歸模型: 共線性與虛擬變數 參考書目: Hill, C. R., W. E. Griffiths, and G. G.
1 第四章 多變數函數的微分學 § 4.1 偏導數定義 定義 極限值 ■. 2 定理 極限值的基本定理 (1) 極限值的唯一性 : 若 存在,則 其值必為唯一。 (2) 若 且 ( 與 為常數 ) , 則 且 為常數且.
4 CHAPTER 需求與供給. 4 CHAPTER 需求與供給 C H A P T E R C H E C K L I S T 學習本章後,您將能: 區別需求量與需求的差異,瞭解需求的決定因素 1 區別供給量與供給的差異,瞭解供給的決定因素 2 解釋需求與供給如何決定市場價格與數量,以及需求與供.
1 開南大學公管所與國企所合開選修課 -- 量化分析與應用 -- 黃智聰 開南大學公管所與國企所合開選修課 課程名稱:量化分析與應用 授課老師:黃智聰 授課內容: 簡單線性迴歸模型: 共線性與虛擬變數 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge,
第二章 供給與需求 中興大學會計學系 授課老師:簡立賢.
Ch05 確定研究變項.
Chapter 8 消費可能性 偏好 選擇 Part 3 家庭的選擇
1 政大公企中心產業人才投資課程 -- 企業決策分析方法 -- 黃智聰 政大公企中心產業人才投資課程 課程名稱:企業決策分析方法 授課老師:黃智聰 授課內容: 質化因素在企業決策分析之重要性 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001),
3.1 矩陣的行列式 3.2 使用基本運算求行列式 3.3 行列式的性質 3.4 特徵值介紹 3.5 行列式的應用
選舉制度、政府結構與政 黨體系 Cox (1997) Electoral institutions, cleavage strucuters, and the number of parties.
CH 15- 元件可靠度之驗證  驗證方法  指數模式之可靠度驗證  韋式模式之可靠度驗證  對數常態模式之可靠度驗證  失效數為零時之可靠度估算  各種失效模式之應用.
: Multisets and Sequences ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11023: Multisets and Sequences 解題者:葉貫中 解題日期: 2007 年 4 月 24 日 題意:在這個題目中,我們要定義.
公司加入市場的決定. 定義  平均成本 = 總成本 ÷ 生產數量 = 每一單位產量所耗的成本  平均固定成本 = 總固定成本 ÷ 生產數量  平均變動成本 = 總變動成本 ÷ 生產數量.
Analysis of Variance (ANOVA) CH 13 變異數分析. What is ANOVA? n 檢定 3 個或 3 個以上的母體平均數是否相等的統計檢定 n 檢定多個母體平均數是否相同 n 比較大二、大三、大四學生實習滿意度是否一樣 ? ( 來 自相同的 population)
政治大學公企中心必修課-- 社會科學研究方法(量化分析)--黃智聰
生產與成本 CHAPTER 9 價格、利潤與產業表現 PART 3 學習本章後,您將能: C H A P T E R C H E C K L I S T 解釋經濟學中的成本與利潤 1 解釋廠商短期下的產量與勞動數量之關係 2 解釋廠商長期下的產量與勞動數量之關係 3 推衍與解釋廠商的長期平均成本曲線.
觀測量的權 權的觀念與計算.
公用品.  該物品的數量不會因一人的消費而受到 影響,它可以同時地被多人享用。 角色分配  兩位同學當我的助手,負責:  其餘各人是投資者,每人擁有 $100 , 可以投資在兩種資產上。  記錄  計算  協助同學討論.
1 政治大學國務院國安碩專班選修課 -- 社會科學研究方法(量化分析) -- 黃智聰 政治大學國務院國安碩專班選修課 課程名稱:社會科學研究方法(量化分析) 授課老師:黃智聰 授課內容: 簡單線性迴歸模型: 共線性與虛擬變數 參考書目: Hill, C. R., W. E. Griffiths, and.
經濟學 2000 (四版) 第 6 章 廠商與生產技術 熊秉元 ˙ 胡春田 ˙ 巫和懋 ˙ 霍德明合著 雙葉書廊發行 本章內容要點:  廠商的出現  經濟利潤與利潤極大化  短期的生產技術  邊際報酬遞減法則  長期的生產技術.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
Chapter 3 Entropy : An Additional Balance Equation
演算法課程 (Algorithms) 國立聯合大學 資訊管理學系 陳士杰老師 Course 7 貪婪法則 Greedy Approach.
描述統計 描述統計(Descriptive Statistics)-將蒐集到的資料加以整理和記錄,並以數字和統計圖表的方式來分析及解釋資料所具有的特性. 基本統計值(平均數,中位數,標準差,變異量….) 相關性測量(卡方,相關係數,迴歸…)
Chapter 7 Sampling Distribution
2005/7 Linear system-1 The Linear Equation System and Eliminations.
第五章 隨機利率下零息債券的評價 財務工程 呂瑞秋著.
連續隨機變數 連續變數:時間、分數、重量、……
Ch05 確定研究變項.
Regression 相關 –Cross table –Bivariate –Contingency Cofficient –Rank Correlation 簡單迴歸 多元迴歸.
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
PART 2 近觀市場 5 需求與供給彈性 CHAPTER. PART 2 近觀市場 5 需求與供給彈性 CHAPTER.
財務管理概論 劉亞秋‧薛立言 合著 (東華書局, 2007)
幼兒行為觀察與記錄 第八章 事件取樣法.
1 Chemical and Engineering Thermodynamics Chapter 1 Introduction Sandler.
CH 14-可靠度工程之數學基礎 探討重點 失效時間之機率分配 指數模式之可靠度工程.
Chapter 12 Estimation 統計估計. Inferential statistics Parametric statistics 母數統計 ( 母體為常態或 大樣本 ) 假設檢定 hypothesis testing  對有關母體參數的假設,利用樣本資料,決定接受或 不接受該假設的方法.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
1 Chapter 6 利率的風險 與期間結構. 2 前 言 本章將探討: 不同利率之間相互的關係以展現利率的全貌 影響利率波動的來源與導因 利率的風險結構 利率的期間結構.
Presentation transcript:

©Ming-chi Chen 社會統計 Page.1 社會統計 第十講 相關與共變

©Ming-chi Chen 社會統計 Page.2 Covariance, 共變量 當 X, Y 兩隨機變數不互為獨立時,表示 兩者間有關連。其關連的形式有很多種, 最常見的關連為線性的共變關係。 隨機變數 X,Y 間的線性關係可用兩個統計 量來測量 (1) 共變數 (covariance) (2) 相關 係數 (correlation coefficient) 。兩者都能 衡量兩變數之間是否有線性關係存在。 觀念觀念 觀念觀念

©Ming-chi Chen 社會統計 Page.3 Stochastic Relationships and Scatter Diagrams Scatter Plot 可以顯示兩連續變數 x, y 之間的關 聯 形式與 強度: 觀念觀念 觀念觀念 自變項 x 依變項y依變項y

©Ming-chi Chen 社會統計 Page.4 X Y (a) X 與 Y 之 間的關係 為線性還 是非線性?

©Ming-chi Chen 社會統計 Page.5 X Y (b) X 與 Y 之 間的關係 為線性還 是非線性?

©Ming-chi Chen 社會統計 Page.6 X Y (c) X 與 Y 之 間的關聯 強度為何?

©Ming-chi Chen 社會統計 Page.7 X Y (d) X 與 Y 之 間的關係 是正向還 是反向?

©Ming-chi Chen 社會統計 Page.8 Covariance, 共變量 我們用簡單圖形可以來瞭解兩變數 x 與 y 之間的關係。另一種分析兩變數關係的 統計技術為相關分析 (correlation analysis) 。 兩個隨機變數之間的共變關係為何? 觀念觀念 觀念觀念

©Ming-chi Chen 社會統計 Page.9 Covariance, 共變量 假設兩隨機變數 Y 與 X 之間具有某種關聯,母體 X 的平均值為 u x 、母體變異數 σ x 2 ,母體 Y 的平 均值為 u y 、母體變異數 σ y 2 , 觀念觀念 觀念觀念

©Ming-chi Chen 社會統計 Page.10 Covariance, 共變量 測量兩變數之間是否有關連的一個有效 指標為共變數 (covariance) 觀念觀念 觀念觀念

©Ming-chi Chen 社會統計 Page.11 Covariance, 共變量 先生的收入 (x) 與太太的收入 (y) 關係如下表, 請計算共變量 (covariance) 觀念觀念 觀念觀念

©Ming-chi Chen 社會統計 Page.12 Covariance, 共變量 觀念觀念 觀念觀念

©Ming-chi Chen 社會統計 Page.13 Covariance, 共變量 觀念觀念 觀念觀念

©Ming-chi Chen 社會統計 Page.14 例題 求 x 與 y 的 covariance?

©Ming-chi Chen 社會統計 Page.15 II III IV I ⊕ ⊕ (14-10)(8-5) =(4)(3) (6-10)(3-5)=(-4)(-2)

©Ming-chi Chen 社會統計 Page.16 II III IV I ⊕ (13-10)(8-5) =(-3)(3) (5-10)(8-5)=(-5)(3)   ⊕

©Ming-chi Chen 社會統計 Page.17 Covariance, 共變量 證明: 觀念觀念 觀念觀念

©Ming-chi Chen 社會統計 Page.18 Covariance, 共變量 證明: if X, Y are independent, 觀念觀念 觀念觀念

©Ming-chi Chen 社會統計 Page.19 The Population Correlation Coefficient, ρ 母體相關係數 用共變量來衡量兩變數的關係有一個缺點, 即 σ xy 及 s xy 的值會受到 x 與 y 衡量單位的影響。

©Ming-chi Chen 社會統計 Page.20 The Population Correlation Coefficient, ρ 母體相關係數

©Ming-chi Chen 社會統計 Page.21 The Population Correlation Coefficient, ρ 母體相關係數 因此,我們將 covariance 分別除上 x 與 y 的標準 差 σ x 、 σ y ,得到標準化後的指標稱之為相關係 數 :

©Ming-chi Chen 社會統計 Page.22 Sample Correlation Coefficient, r 樣本相關係數 樣本相關係數 :

©Ming-chi Chen 社會統計 Page.23 相關係數的特性 相關係數衡量兩變數之間是否有線性關係,相關係 數愈大,代表兩變數之間的線性關係愈強。相關係 數為零,代表兩變數沒有線性關係。 相關係數的值介於正負 1 之間,正 1 代表兩者呈完全 正相關,負 1 代表兩者呈現完全負相關。 如果 x 與 y 為獨立,則相關係數 ρ=0 。 如果 ρ=0 , x 與 y 不一定為獨立,因為他們可能具有非 線性關係。

©Ming-chi Chen 社會統計 Page.24 相關係數的特性 證明:若 x 為 y 之線性函數 y=a+bx ,則 x 與 y 的相關係數為 ±1 。

©Ming-chi Chen 社會統計 Page.25 X Y (a) r = 0.8

©Ming-chi Chen 社會統計 Page.26 X Y (b) r =.95

©Ming-chi Chen 社會統計 Page.27 X Y (c) r = 0

©Ming-chi Chen 社會統計 Page.28 X Y (a) r = 0

©Ming-chi Chen 社會統計 Page.29 X Y (d) r = -.90

©Ming-chi Chen 社會統計 Page.30 X Y (c) r = -0.5

©Ming-chi Chen 社會統計 Page.31 相關係數的強弱 r =  1 為完全相關 r = 0 為無相關

©Ming-chi Chen 社會統計 Page.32 例題 求 x 與 y 的 correlation?

©Ming-chi Chen 社會統計 Page.33 例題 求 x 與 y 的 correlation?

©Ming-chi Chen 社會統計 Page.34 母體相關係數的檢定 樣本相關係數 r 為母體相關係數  的估計式。 若 (x, y) 為一組具有雙邊常態分配 (bivariate normal distribution) 的隨機變數

©Ming-chi Chen 社會統計 Page.35 母體相關係數的檢定 利用檢定斜率的公式: 相當於檢證

©Ming-chi Chen 社會統計 Page.36 例題 續上例

©Ming-chi Chen 社會統計 Page.37 相關係數與因果關係 相關僅代表兩變數間有線性關係,不必然 隱含因果關係,下列情況皆有可能 z Two variables are said to be spuriously correlated when their correlations is nonzero and there is no reason to believe that the variables are related to one another.

©Ming-chi Chen 社會統計 Page.38 相關係數與因果關係 商品的價格愈高,需求愈低? 美國職業運動的票價每年都在增長,但需 求不減反增。 相關分析僅考慮兩個變數 x, y 之間的關係, 而忽略其他可能影響 y 的因素。 人口增加、收入增加、職業運動受歡迎的 程度增加等

©Ming-chi Chen 社會統計 Page.39 相關係數不受單位尺度變換的影 響

©Ming-chi Chen 社會統計 Page.40 例題 某校 MBA 畢業生的在學成績 (x) 與工作起薪 (y) 的資訊如下: 求 r 並檢定 H 0 :  =0

©Ming-chi Chen 社會統計 Page.41 例題