§4.3 多重共线性 Multi-Collinearity. 一、多重共线性的概念 二、实际经济问题中的多重共线性 三、多重共线性的后果 四、多重共线性的检验 五、克服多重共线性的方法 六、案例 * 七、分部回归与多重共线性 §4.3 多重共线性.

Slides:



Advertisements
Similar presentations
首 页 首 页 上一页 下一页 本讲内容 投影法概述三视图形成及其投影规律平面立体三视图、尺寸标注 本讲内容 复习: P25~P31 、 P84~P85 作业: P7, P8, P14[2-32(2) A3 (1:1)]
Advertisements

纺纱学. 2 绪 论 基本要求:了解纺纱系统的类别 重点掌握:棉纺系统的工艺流程 3 一、纺纱原理与设备 纺纱:用物理或机械的方法将纺织纤维纺成纱 线的过程。 纺纱原理:初加工、原料的选配、开松除杂、 混和、梳理、精梳、并合、牵伸、加捻、卷绕等。 纺纱方法:传统纺纱方法、新型纺纱方法。 纺纱设备:开清棉联合机、梳棉机、精梳机、
第十二章 常微分方程 返回. 一、主要内容 基本概念 一阶方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程.
概率统计( ZYH ) 节目录 3.1 二维随机变量的概率分布 3.2 边缘分布 3.4 随机变量的独立性 第三章 随机向量及其分布 3.3 条件分布.
第四章 犯罪概念与犯罪构成. 第一节 犯罪概念 一、犯罪概念的类型  (一)犯罪的形式概念  (二)犯罪的实质概念  (三)犯罪的混合概念.
Newsboy 模型简介 系统工程 裴英超.
一、拟合优度检验 二、变量的显著性检验 三、参数的置信区间
4 第四章 矩阵 学时:  18 学时。 教学手段:  讲授和讨论相结合,学生课堂练习,演练习题与辅导答疑相结合。 基本内容和教学目的:  基本内容: 矩阵的运算,可逆矩阵,初等矩阵及其性质和意义, 分块矩阵。  教学目的:  1 .使学生理解和掌握矩阵等价的相关理论  2 .能熟练地进行矩阵的各种运算.
第 4 章 抽象解释 内容概述 以一种独立于编程语言的方式,介绍抽象解释的 一些本质概念 – 将 “ 程序分析对语言语义是正确的 ” 这个概念公式 化 – 用 “ 加宽和收缩技术 ” 来获得最小不动点的较好的 近似,并使所需计算步数得到限制 – 用 “ 伽罗瓦连接和伽罗瓦插入 ” 来把代价较大的属 性空间用代价较小的属性空间来代替.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第六十二讲 ) 离散数学. 最后,我们构造能识别 A 的 Kleene 闭包 A* 的自动机 M A* =(S A* , I , f A* , s A* , F A* ) , 令 S A* 包括所有的 S A 的状态以及一个 附加的状态 s.
1 为了更好的揭示随机现象的规律性并 利用数学工具描述其规律, 有必要引入随 机变量来描述随机试验的不同结果 例 电话总机某段时间内接到的电话次数, 可用一个变量 X 来描述 例 检测一件产品可能出现的两个结果, 也可以用一个变量来描述 第五章 随机变量及其分布函数.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样 的一种手段。在实际中,数据不可避免的会有误差,插值函 数会将这些误差也包括在内。
11-8. 电解质溶液的 活度和活度系数 电解质是有能力形成可以 自由移动的离子的物质. 理想溶液体系 分子间相互作用 实际溶液体系 ( 非电解质 ) 部分电离学说 (1878 年 ) 弱电解质溶液体系 离子间相互作用 (1923 年 ) 强电解质溶液体系.
主讲教师:陈殿友 总课时: 124 第八讲 函数的极限. 第一章 机动 目录 上页 下页 返回 结束 § 3 函数的极限 在上一节我们学习数列的极限,数列 {x n } 可看作自变量 为 n 的函数: x n =f(n),n ∈ N +, 所以,数列 {x n } 的极限为 a, 就是 当自变量 n.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第三十八讲 ) 离散数学. 第八章 格与布尔代数 §8.1 引 言 在第一章中我们介绍了关于集 合的理论。如果将 ρ ( S )看做 是集合 S 的所有子集组成的集合, 于是, ρ ( S )中两个集合的并 集 A ∪ B ,两个集合的交集.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第四十八讲 ) 离散数学. 例 设 S 是一个非空集合, ρ ( s )是 S 的幂集合。 不难证明 :(ρ(S),∩, ∪,ˉ, ,S) 是一个布尔代数。 其中: A∩B 表示 A , B 的交集; A ∪ B 表示 A ,
第十一章 曲线回归 第一节 曲线的类型与特点 第二节 曲线方程的配置 第三节 多项式回归.
线性代数习题课 吉林大学 术洪亮 第一讲 行 列 式 前面我们已经学习了关 于行列式的概念和一些基本 理论,其主要内容可概括为:
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第二十五讲 ) 离散数学. 定理 群定义中的条件 ( 1 )和( 2 )可以减弱如下: ( 1 ) ’ G 中有一个元素左壹适合 1 · a=a; ( 2 ) ’ 对于任意 a ,有一个元素左逆 a -1 适 合 a -1 ·
第十章 企业价值评估 第一节 企业价值评估及其特点 企业价值评估及其特点 第二节 企业价值评估的范围界定 第三节 转型经济与企业价值评估 第四节 收益法在企业价值评估中的应用 第五节 市场法和成本法在企业价值评估中的应用.
1 应用计量分析在公共财政领域的应用黄智聪 厦门大学财政系研究生课程 课程名称:应用计量分析在公共财政领域的 应用 授课老师:黄智聪 授课内容: 简单线性回归模型: 共线性与虚拟变数 参考书目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001),
第二章 随机变量及其分布 第一节 随机变量及其分布函数 一、随机变量 用数量来表示试验的基本事件 定义 1 设试验 的基本空间为 , ,如果对试验 的每一个基 本事件 ,规定一个实数记作 与之对应,这样就得到一个定义在基本空 间 上的一个单值实函数 ,称变量 为随机变量. 随机变量常用字母 、 、 等表示.或用.
第 4 章 过程与变量的作用范围. 4.1 Visual Basic 的代码模块 Visual Basic 的应用程序是由过程组成的, 过程代码存放在模块中。 Visual Basic 提供了 三类模块,它们是窗体模块、标准模块和类 模块。 窗体模块 窗体模块是大多数 Visual Basic.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样的一种手段。 在实际中,数据不可避免的会有误差,插值函数会将这些误差也包括在内。
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第三十九讲 ) 离散数学. 例 设 S 是一个集合, ρ ( S )是 S 的幂集合,集合 的交( ∩ ),并(∪)是 ρ ( S )上的两个代数运算, 于是,( ρ ( S ), ∩ ,∪) 是一个格。而由例 知.
1 应用计量分析在公共财政领域的应用黄智聪 厦门大学财政系研究生课程 课程名称:应用计量分析在公共财政领域的 应用 授课老师:黄智聪 授课内容: 时间序列与横断面资料的共用 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001), Undergraduate.
实验三: 用双线性变换法设计 IIR 数字滤波器 一、实验目的 1 熟悉用双线性变换法设计 IIR 数字滤波器的原理与方法。 2 掌握数字滤波器的计算机仿真方法。 3 通过观察对实际心电图信号的滤波作用, 获得数字滤波的感性知 识。
1 第 7 章 专家控制系统 概述 专家系统的起源与发展 专家系统的一般结构 专家系统的知识表示和获取 专家系统的特点及分类.
第二章 贝叶斯决策理论 3学时.
非均相物系的分离 沉降速度 球形颗粒的 :一、自由沉降 二、沉降速度的计算 三、直径计算 1. 试差法 2. 摩擦数群法 四、非球形颗粒的自由沉降 1. 当量直径 de :与颗粒体积相等的圆球直径 V P — 颗粒的实际体积 2. 球形度  s : S—— 与颗粒实际体积相等的球形表面积.
量子化学 第四章 角动量与自旋 (Angular momentum and spin) 4.1 动量算符 4.2 角动量阶梯算符方法
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 5 章 解线性方程组的直接法 实际中,存在大量的解线性方程组的问题。很多数值方 法到最后也会涉及到线性方程组的求解问题:如样条插值的 M 和.
主讲教师:陈殿友 总课时: 124 第十一讲 极限的运算法则. 第一章 二、 极限的四则运算法则 三、 复合函数的极限运算法则 一 、无穷小运算法则 机动 目录 上页 下页 返回 结束 §5 极限运算法则.
在发明中学习 线性代数 概念的引入 李尚志 中国科学技术大学. 随风潜入夜 : 知识的引入 之一、线性方程组的解法 加减消去法  方程的线性组合  原方程组的解是新方程的解 是否有 “ 增根 ” ?  互为线性组合 : 等价变形  初等变换  高斯消去法.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 7 章 矩阵的特征值和特征向量 很多工程计算中,会遇到特征值和特征向量的计算,如: 机械、结构或电磁振动中的固有值问题;物理学中的各种临界 值等。这些特征值的计算往往意义重大。
§2.2 一元线性回归模型的参数估计 一、一元线性回归模型的基本假设 二、参数的普通最小二乘估计( OLS ) 三、参数估计的最大或然法 (ML) 四、最小二乘估计量的性质 五、参数估计量的概率分布及随机干 扰项方差的估计.
第一节 相图基本知识 1 三元相图的主要特点 (1)是立体图形,主要由曲面构成; (2)可发生四相平衡转变; (3)一、二、三相区为一空间。
9的乘法口诀 1 .把口诀说完全。 二八( ) 四六( ) 五八( ) 六八( ) 三七( ) 三八( ) 六七( ) 五七( ) 五六( ) 十六 四十八 四十二 二十四 二十一 三十五 四十 二十四 三十 2 .口算, 并说出用的是哪句口诀。 8×8= 4×6= 7×5= 6×8= 5×8=
量子力学教程 ( 第二版 ) 3.4 连 续 谱 本 征 函 数 的 归 一 化 连续谱本征函数是不能归一化的 一维粒子的动量本征值为的本征函数 ( 平面波 ) 为 可以取 中连续变化的一切实数值. 不难看出,只要则 在量子力学中, 坐标和动量的取值是连续变化 的 ; 角动量的取值是离散的.
导体  电子导体  R   L  i 离子导体  ( 平衡 ) mm   .
第 3 章 控制流分析 内容概述 – 定义一个函数式编程语言,变量可以指称函数 – 以 dynamic dispatch problem 为例(作为参数的 函数被调用时,究竟执行的是哪个函数) – 规范该控制流分析问题,定义什么是可接受的控 制流分析 – 定义可接受分析在语义模型上的可靠性 – 讨论分析算法.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第五十三讲 ) 离散数学. 定义 设 G= ( V , T , S , P ) 是一个语法结构,由 G 产生的语言 (或者说 G 的语言)是由初始状态 S 演绎出来的所有终止符的集合, 记为 L ( G ) ={w  T *
平行线的平行公理与判定 九年制义务教育七年级几何 制作者:赵宁睿. 平行线的平行公理与判定 要点回顾 课堂练习 例题解析 课业小结 平行公理 平行判定.
Relevance Theory Lecture 12. Relevance Theory 交际研究的对象是交际的概念、内容、 性质、功能、方法和交际行为、交际参 加者之间的关系等的认识和阐述。 20 世 纪 70 年代末以来, Sperber & Wilson 把认 知与交际结合起来,于 1986.
编译原理总结. 基本概念  编译器 、解释器  编译过程 、各过程的功能  编译器在程序执行过程中的作用  编译器的实现途径.
周期信号的傅里叶变换. 典型非周期信号 ( 如指数信号, 矩形信号等 ) 都是满足绝对可 积(或绝对可和)条件的能量信号,其傅里叶变换都存在, 但绝对可积(或绝对可和)条件仅是充分条件, 而不是必 要条件。引入了广义函数的概念,在允许傅里叶变换采用 冲激函数的前提下, 使许多并不满足绝对可积条件的功率.
卫生学(第 7 版) · 第十二章 直线相关与回归 1 直线相关与回归 第十一章. 卫生学(第 7 版) · 第十二章 直线相关与回归 2 主要内容 直线相关 直线回归 直线相关与回归的区别与联系 等级相关.
Department of Mathematics 第二章 解析函数 第一节 解析函数的概念 与 C-R 条件 第二节 初等解析函数 第三节 初等多值函数.
首 页 首 页 上一页 下一页 本讲内容本讲内容 视图,剖视图(Ⅰ) 复习: P107 ~ P115 作业: P48(6-2,6-4), P49( 去 6-6) P50, P51(6-13), P52 P50, P51(6-13), P52 P53 (6-18,6-20) P53 (6-18,6-20)
1-4 节习题课 山东省淄博第一中学 物理组 阚方海. 2 、位移公式: 1 、速度公式: v = v 0 +at 匀变速直线运动规律: 4 、平均速度: 匀变速直线运动 矢量式 要规定正方向 统一单位 五个量知道了三 个量,就能求出 其余两个量 3 、位移与速度关系:
《 UML 分析与设计》 交互概述图 授课人:唐一韬. 知 识 图 谱知 识 图 谱知 识 图 谱知 识 图 谱.
1 、如果 x + 5 > 4 ,那么两边都 可得 x >- 1 2 、在- 3y >- 4 的两边都乘以 7 可得 3 、在不等式 — x≤5 的两边都乘以- 1 可得 4 、将- 7x — 6 < 8 移项可得 。 5 、将 5 + a >- 2 a 移项可得 。 6 、将- 8x < 0.
第 7 章说明 经典的单方程计量经济学模型理论与方法,限于常参数、 线性、揭示变量之间因果关系的单方程模型,被解释变量 是连续的随机变量,其抽样是随机和不受限制的,在模型 估计过程中或者只利用时间序列样本,或者只利用截面数 据样本,主要依靠对经济理论和行为规律的理解确定模型 的结构形式。 本章中,将讨论几种扩展模型,主要包括将被解释变量抽.
§10.2 对偶空间 一、对偶空间与对偶基 二、对偶空间的有关结果 三、例题讲析.
请同学们仔细观察下列两幅图有什么共同特点? 如果两个图形不仅形状相同,而且每组对应点所在的直线 都经过同一点, 那么这样的两个图形叫做位似图形, 这个点叫做位 似中心.
表单自定义 “ 表单自定义 ” 功能是用于制作表单的 工具,用数飞 OA 提供的表单自定义 功能能够快速制作出内容丰富、格 式规范、美观的表单。
7 生产费用在完工产品与在产 品之间分配的核算. 2 第七章 生产费用在完工产品与在产品之 间的分配  知识点 :  理解在产品的概念  掌握生产费用在完工产品与在产品之间的分 配.
力的合成 力的合成 一、力的合成 二、力的平行四边形 上一页下一页 目 录 退 出. 一、力的合成 O. O. 1. 合力与分力 我们常常用 一个力来代替几个力。如果这个 力单独作用在物体上的效果与原 来几个力共同作用在物体上的效 果完全一样,那么,这一个力就 叫做那几个力的合力,而那几个 力就是这个力的分力。
8.1 二元一次方程组. 篮球联赛中,每场比赛都要分出胜负,每队 胜一场得 2 分,负一场得 1 分. 如果某队为了争取 较好名次,想在全部 22 场比赛中得 40 分,那么这 个队胜负场数应分别是多少 ? 引 言引 言 用学过的一元一次方 程能解决此问题吗? 这可是两个 未知数呀?
第四章 不定积分. 二、 第二类换元积分法 一、 第一类换元积分法 4.2 换元积分法 第二类换元法 第一类换元法 基本思路 设 可导, 则有.
个体 精子 卵细胞 父亲 受精卵 母亲 人类生活史 问题:人类产生配子(精、卵 细胞)是不是有丝分裂?
逻辑设计基础 1 第 7 章 多级与(或)非门电路 逻辑设计基础 多级门电路.
人 有 悲 欢 离 合, 月有阴晴圆缺。月有阴晴圆缺。 华师大版七年级数学第二册 海口市第十中学 数学组 吴锐.
§8.1 时间序列平稳性和单位根检验 Stationary Time Serial and Unit Root Test 一、时间序列的平稳性 二、单整序列 三、单位根检验.
1 第三章 数列 数列的概念 考点 搜索 ●数列的概念 ●数列通项公式的求解方法 ●用函数的观点理解数列 高考 猜想 以递推数列、新情境下的 数列为载体, 重点考查数列的通 项及性质, 是近年来高考的热点, 也是考题难点之所在.
相关分析 回归分析 案例 第八章 相关与回归 相关和回归分析是研究事物的相互关系,测定它们联 系的紧密程度,揭示其变化的具体形式和规律性的统 计方法,是构造各种经济模型、进行结构分析、政策 评价、预测和控制的重要工具。 主要内容.
协方差分析及 SPSS 统计软件包应用 临床流行病学应用研究室欧爱华. 为什么要进行协方差分析 影响效应指标的因素不可控性 (未控制或难以控制) 影响效应指标的因素不可控性 (未控制或难以控制) 组间基线的不均衡性等 组间基线的不均衡性等.
目录 上页 下页 返回 结束 二、无界函数反常积分的审敛法 * 第五节 反常积分 无穷限的反常积分 无界函数的反常积分 一、无穷限反常积分的审敛法 反常积分的审敛法  函数 第五章 第五章.
本章讨论有限自由度结构系统,在给定载荷和初始条件激励下的系统动力响应计算方法。 第 六 章
§7.2 估计量的评价标准 上一节我们看到,对于总体 X 的同一个 未知参数,由于采用的估计方法不同,可 能会产生多个不同的估计量.这就提出一 个问题,当总体的一个参数存在不同的估 计量时,究竟采用哪一个好呢?或者说怎 样评价一个估计量的统计性能呢?下面给 出几个常用的评价准则. 一.无偏性.
Presentation transcript:

§4.3 多重共线性 Multi-Collinearity

一、多重共线性的概念 二、实际经济问题中的多重共线性 三、多重共线性的后果 四、多重共线性的检验 五、克服多重共线性的方法 六、案例 * 七、分部回归与多重共线性 §4.3 多重共线性

一、多重共线性的概念 对于模型 Y i =  0 +  1 X 1i +  2 X 2i +  +  k X ki +  i i=1,2,…,n 其基本假设之一是解释变量是互相独立的。 如果某两个或多个解释变量之间出现了相 关性,则称为多重共线性 (Multicollinearity) 。

如果存在 c 1 X 1i +c 2 X 2i +…+c k X ki =0 i=1,2,…,n 其中 : c i 不全为 0 ,则称为解释变量间存在完全共线 性( perfect multicollinearity )。 如果存在 c 1 X 1i +c 2 X 2i +…+c k X ki +v i =0 i=1,2,…,n 其中 c i 不全为 0 , v i 为随机误差项,则称为 近似共线 性( approximate multicollinearity )或交互相关 (intercorrelated) 。

在矩阵表示的线性回归模型 Y=X  +  中,完全共线性指:秩 (X)<k+1 ,即 中,至少有一列向量可由其他列向量(不包括第 一列)线性表出。 如: X 2 = X 1 ,则 X 2 对 Y 的作用可由 X 1 代替。

注意: 完全共线性的情况并不多见,一般出现 的是在一定程度上的共线性,即近似共线 性。

二、实际经济问题中的多重共线性 一般地,产生多重共线性的主要原因有以下三 个方面: ( 1 )经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济 变量(收入、消费、投资、价格)都趋于增长; 衰退时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳动 力投入往往出现高度相关情况,大企业二者都大, 小企业都小。

( 2 )滞后变量的引入 在经济计量模型中,往往需要引入滞 后经济变量来反映真实的经济关系。 例如,消费 =f( 当期收入, 前期收入) 显然,两期收入间有较强的线性相关性。

( 3 )样本资料的限制 由于完全符合理论模型所要求的样本数据较难 收集,特定样本可能存在某种程度的多重共线性。 一般经验: 时间序列数据样本:简单线性模型,往往存在 多重共线性。 截面数据样本:问题不那么严重,但多重共线 性仍然是存在的。

二、多重共线性的后果 1 、完全共线性下参数估计量不存在 如果存在完全共线性,则 (X’X) -1 不存在,无法得 到参数的估计量。 的 OLS 估计量为:

例:对离差形式的二元回归模型 如果两个解释变量完全相关,如 x 2 = x 1 ,则 这时,只能确定综合参数  1 +  2 的估计值:

2 、近似共线性下 OLS 估计量非有效 近似共线性下,可以得到 OLS 参数估计量, 但参数估计量方差的表达式为 由于 |X’X|  0 ,引起 (X’X) -1 主对角线元素较大, 使参数估计值的方差增大, OLS 参数估计量非有 效。

仍以二元线性模型 y=  1 x 1 +  2 x 2 +  为例 : 恰为 X 1 与 X 2 的线性相关系数的平方 r 2 由于 r 2  1 ,故 1/(1- r 2 )  1

多重共线性使参数估计值的方差增大, 1/(1-r 2 ) 为 方差膨胀因子 (Variance Inflation Factor, VIF) 当完全不共线时, r 2 =0 当近似共线时, 0< r 2 <1 当完全共线时, r 2 =1 ,

3 、参数估计量经济含义不合理 如果模型中两个解释变量具有线性相关性, 例如 X 2 = X 1 , 这时, X 1 和 X 2 前的参数  1 、  2 并不反映各自与 被解释变量之间的结构关系,而是反映它们对被 解释变量的共同影响。  1 、  2 已经失去了应有的经济含义,于是经常 表现出似乎反常的现象:例如  1 本来应该是正的, 结果恰是负的。

4 、变量的显著性检验失去意义 存在多重共线性时 参数估计值的方差与标准差变大 容易使通过样本计算的 t 值小于临界值, 误导作出参数为 0 的推断 可能将重要的解释变量排除在模型之外

5 、模型的预测功能失效 变大的方差容易使区间预测的 “ 区间 ” 变大,使 预测失去意义。

注意: 除非是完全共线性,多重共线性并不意味 着任何基本假设的违背; 因此,即使出现较高程度的多重共线性, OLS 估计量仍具有线性性等良好的统计性质。 问题在于,即使 OLS 法仍是最好的估计方 法,它却不是 “ 完美的 ” ,尤其是在统计推断上 无法给出真正有用的信息。

多重共线性检验的任务是: ( 1 )检验多重共线性是否存在; ( 2 )估计多重共线性的范围,即判断哪些变量 之间存在共线性。 多重共线性表现为解释变量之间具有相关关系, 所以用于多重共线性的检验方法主要是统计方法: 如判定系数检验法、逐步回归检验法等。 三、多重共线性的检验

1 、检验多重共线性是否存在 (1) 对两个解释变量的模型,采用简单相关系数法 求出 X 1 与 X 2 的简单相关系数 r ,若 |r| 接近 1 ,则说 明两变量存在较强的多重共线性。 (2) 对多个解释变量的模型,采用综合统计检验法 若 在 OLS 法下: R 2 与 F 值较大,但 t 检验值较小, 说明各解释变量对 Y 的联合线性作用显著,但各解 释变量间存在共线性而使得它们对 Y 的独立作用不 能分辨,故 t 检验不显著。

2 、判明存在多重共线性的范围 如果存在多重共线性,需进一步确定究竟由哪 些变量引起。 (1) 判定系数检验法 使模型中每一个解释变量分别以其余解释变量 为解释变量进行回归,并计算相应的拟合优度。 如果某一种回归 X ji =  1 X 1i +  2 X 2i +  L X Li 的判定系数较大,说明 X j 与其他 X 间存在共线性。

具体可进一步对上述回归方程作 F 检验: 式中: R j 2 为第 j 个解释变量对其他解释变量的回 归方程的决定系数, 若存在较强的共线性,则 R j 2 较大且接近于 1 ,这 时( 1- R j 2 )较小,从而 F j 的值较大。 因此,给定显著性水平  ,计算 F 值,并与相应的 临界值比较,来判定是否存在相关性。 构造如下 F 统计量

在模型中排除某一个解释变量 X j ,估计 模型; 如果拟合优度与包含 X j 时十分接近, 则说明 X j 与其它解释变量之间存在共线性。 另一等价的检验是 :

(2) 逐步回归法 以 Y 为被解释变量,逐个引入解释变量,构 成回归模型,进行模型估计。 根据拟合优度的变化决定新引入的变量是否 独立。 如果拟合优度变化显著,则说明新引入的变 量是一个独立解释变量; 如果拟合优度变化很不显著,则说明新引入 的变量与其它变量之间存在共线性关系。

找出引起多重共线性的解释变量,将它排除出 去。 以逐步回归法得到最广泛的应用。 注意: 这时,剩余解释变量参数的经济含义和数值都 发生了变化。 如果模型被检验证明存在多重共线性,则需要 发展新的方法估计模型,最常用的方法有三类。 四、克服多重共线性的方法 1 、第一类方法:排除引起共线性的变量

2 、第二类方法:差分法 时间序列数据、线性模型:将原模型变 换为差分模型 :  Y i =  1  X 1i +  2  X 2i +  +  k  X ki +   i 可以有效地消除原模型中的多重共线性。 一般讲,增量之间的线性关系远比总量 之间的线性关系弱得多。

例如: 例如:

由表中的比值可以直观地看到,增量 的线性关系弱于总量之间的线性关系。 进一步分析: Y 与 C(-1) 之间的判定系数为 , △ Y 与△ C(-1) 之间的判定系数为

3 、第三类方法:减小参数估计量的方差 多重共线性的主要后果是参数估计量具 有较大的方差,所以 采取适当方法减小参数估计量的方差, 虽然没有消除模型中的多重共线性,但确 能消除多重共线性造成的后果。 例如: ①增加样本容量,可使参数估计量的方 差减小。

* ②岭回归法( Ridge Regression ) 70 年代发展的岭回归法,以引入偏误为代价减小 参数估计量的方差,受到人们的重视。 具体方法是:引入矩阵 D ,使参数估计量为 其中矩阵 D 一般选择为主对角阵,即 D=aI a 为大于 0 的常数。 (*)(*) 显然,与未含 D 的参数 B 的估计量相比, (*) 式的估 计量有较小的方差。

六、案例 —— 中国粮食生产函数 根据理论和经验分析,影响粮食生产( Y )的 主要因素有: 农业化肥施用量( X 1 );粮食播种面积 (X 2 ) 成灾面积 (X 3 ); 农业机械总动力 (X 4 ); 农业劳动力 (X 5 ) 已知中国粮食生产的相关数据,建立中国粮食 生产函数: Y=  0 +  1 X 1 +  2 X 2 +  3 X 3 +  4 X 4 +  4 X 5 + 

1 、用 OLS 法估计上述模型: R 2 接近于 1 ; 给定  =5% ,得 F 临界值 F 0.05 (5,12)=3.11 F=638.4 > , 故认上述粮食生产的总体线性关系显著成立。 但 X 4 、 X 5 的参数未通过 t 检验,且符号不正确, 故解释变量间可能存在多重共线性。 (-0.91) (8.39) (3.32) (-2.81) (-1.45) (-0.14)

2 、检验简单相关系数 发现: X 1 与 X 4 间存在高度相关性。 列出 X 1 , X 2 , X 3 , X 4 , X 5 的相关系数矩阵:

3 、找出最简单的回归形式 可见,应选第 1 个式子为初始的回归模型。 分别作 Y 与 X 1 , X 2 , X 4 , X 5 间的回归: (25.58) (11.49) R 2 = F=132.1 DW=1.56 (-0.49) (1.14) R 2 =0.075 F=1.30 DW=0.12 (17.45) (6.68) R 2 = F=48.7 DW=1.11 (-1.04) (2.66) R 2 = F=7.07 DW=0.36

4 、逐步回归 将其他解释变量分别导入上述初始回归模型,寻 找最佳回归方程。

回归方程以 Y=f( X 1 , X 2 , X 3 ) 为最优: 5 、结论

* 七、分部回归与多重共线性

1 、分部回归法 (Partitioned Regression) 对于模型 在满足解释变量与随机误差项不相关的情况下,可 以写出关于参数估计量的方程组: 将解释变量分为两部分,对应的参数也分为两部分:

如果存在 则有 同样有 这就是仅以 X 2 作为解释变量时的参数估计量。 这就是仅以 X 1 作为解释变量时的参数估计量

2 、由分部回归法导出 如果一个多元线性模型的解释变量之间完全正交, 可以将该多元模型分为多个一元模型、二元模 型、 … 进行估计,参数估计结果不变; 实际模型由于存在或轻或重的共线性,如果将它 们分为多个一元模型、二元模型、 … 进行估计, 参数估计结果将发生变化;

严格地说,实际模型由于总存在一定程 度的共线性,所以每个参数估计量并不 真正反映对应变量与被解释变量之间的 结构关系。 当模型存在共线性,将某个共线性变量去 掉,剩余变量的参数估计结果将发生变化, 而且经济含义有发生变化;