Download presentation
Presentation is loading. Please wait.
Published byAmos Burns Modified over 8 years ago
1
协方差分析及 SPSS 统计软件包应用 临床流行病学应用研究室欧爱华
2
为什么要进行协方差分析 影响效应指标的因素不可控性 (未控制或难以控制) 影响效应指标的因素不可控性 (未控制或难以控制) 组间基线的不均衡性等 组间基线的不均衡性等
3
例如:在营养研究中,不考虑动物食 量的差别,直接用方差分析来比较不 同饲料组动物的平均增重,来评价不 同饲料的营养价值是不恰当的。这是 因为动物体重的增加,除了与食物的 营养价值有关,还与各组动物的食量 有关,而动物的食量多少又未加以控 制。
4
若用直线回归的方法找出食量与所增体 重的关系,求得当食量都化为相等时 (即扣除食量的影响),各饲料组动物 所增体重的修正均数,然后再用方差分 析检验各修正均数间有无差别,这才比 较合理。 又如,比较各种职业人群的血压时, 也应把年龄化为相等,再作比较等等。
5
什么是协方差分析? 协方差分析是把线性回归与方 差分析结合起来,用于检验两个 或多个修正均数间有无差别的方 法,其目的是把与结果变量(因 变量) Y 呈直线关系的自变量 X (协变量)化成相等后,检验两 个或多个修正均数间有无差别。 协方差分析是把线性回归与方 差分析结合起来,用于检验两个 或多个修正均数间有无差别的方 法,其目的是把与结果变量(因 变量) Y 呈直线关系的自变量 X (协变量)化成相等后,检验两 个或多个修正均数间有无差别。
6
协方差分析按设计不同分为: 1 、完全随机设计的协方差分析 2 、配伍组设计协方差分析 3 、多元协方差分析 (多个协变量的协方差分析) 4 、拉丁方设计 5 、析因设计等
7
应用协方差分析的条件 理论上要求各组资料(样本)均来自方 差相同的正态总体,各观察变量相互独 立。 理论上要求各组资料(样本)均来自方 差相同的正态总体,各观察变量相互独 立。 各总体存在回归关系且各总体直线回归 系数 相等,且都不为 0 。 各总体存在回归关系且各总体直线回归 系数 相等,且都不为 0 。 各样本方差齐性。 各样本方差齐性。
8
注意问题: 如果不满足以上条件,建议进 行变量变换,符合上述条件后, 再进行协方差分析。
9
要求: 在进行协方差分析前,应 先进行方差齐性检验和回归系 数的检验。
10
协方差分析的基本步骤 确定协变量(即未加以控制或难以控制 的因素) 确定协变量(即未加以控制或难以控制 的因素) 建立因变量 Y 随协变量 X 变化的线性回归 关系 建立因变量 Y 随协变量 X 变化的线性回归 关系 利用回归关系把协变量 X 化为相等后再进 行各组 Y 的休整均数间比较的假设检验 利用回归关系把协变量 X 化为相等后再进 行各组 Y 的休整均数间比较的假设检验
11
(一)完全随机设计资料的协方差分析 方法步骤: 手工计算 电脑运算
12
方法步骤 数据准备 数据分布检验 方差齐性检验 电脑运算
13
完全随机设计资料 协方差分析
14
例 1 、研究镉作业工人暴露于烟尘的 年数与肺活量的关系,按暴露年数将 工人分为两组,甲组暴露 10 年, 乙组 暴露 10 年,两组年龄未经控制,问 该两组暴露于镉作业的工人肺活量是 否相同?
15
甲组年龄甲组肺活量乙组年龄乙组肺活量 x1 x1 2 y1 y1 2 x1*y1x2 x2 2 y2 y2 2 x2*y2 3915214.6221.3444180.184318494.6121.2521198.23 4016005.2927.9841211.603915214.7322.3729184.47 4116815.5230.4704226.323814444.5820.9764174.04 4116813.7113.7641152.114217645.1226.2144215.04 4520254.0216.1604180.904318493.8915.1321167.27 4924015.0925.9081249.414318494.6221.3444198.66 5227042.707.2900140.403713694.3018.4900159.10 4722094.3118.5761202.575025002.707.2900135.00 6137212.707.2900164.705025003.5012.2500175.00 6542253.039.1809196.954520253.069.3636137.70 5833642.737.4529158.344823044.0616.4836194.88 5934813.6713.4689216.535126014.5120.3401230.01 4621164.6621.7156214.36 5833642.888.2944167.04 3814443.6413.2496138.32 3814445.0925.9081193.42 5973061347.39198.8902280.017093194365.95280.67732882.54 协方差分析手工计算数据格式
16
分析步骤 1 、绘制原始资料散点图 2 、计算组间变异 3 、计算组间均方 4 、计算 F 值
17
分组的年龄与肺活量散点图
18
计算各相关数据:
19
计算甲组 ( 第一组 )x,y 的均数及 x 的离均差平方和
20
计算甲组 ( 第一组 )y 以及 x 和 y 的离均差平方和积和
21
计算乙组 ( 第二组 )x 和 y 的均数及 x 的离均差平方和
22
计算乙组 ( 第二组 ) y 以及 x 和 y 的离均差积和
23
计算两组合并的各相关数据:
24
将数据代入后,计算各合计的相关项:
25
计算合并的 x,y 的离均差平方和以及 x 与 y 的离均差积和
27
计算合并的各离均差平方和及离均差积和:
28
协方差分析计算表 变异来源自由度 l xx l xy l yy 1111 估计误差 自由度平方和均方 甲组11912.25-77.6411.74-0.0851105.13220.5132 乙组15525.44-39.878.84-0.0759145.81470.4153 组内2410.94690.4561 回归系数10.02840.0284 公共261437.69-117.5120.58-0.08172510.97530.4390 修正均数10.44910.4491 总计271640.43-123.9520.792611.4244
29
分别对两组的 x 与 y 的均数进 行统计学检验,以便对协方 差分析的结果作出较完善的 解释,分析结果见下表:
30
检验 x i, 间及 y i 间差别的方差分析表 x 的变异来源 自由度 L XX 均方FP 组间1202.74202.743.67>0.05 组内261437.6955.2958 总计271640.43 y 的变异来源 自由度 L YY 均方FP 组间10.210.210.27>0.05 组内2620.580.7915 总计2720.79 检验结果两组年龄均数差异无统计学意义 (P>0.05) ,两 组肺活量均数差异也无统计学意义 (P>0.05) 。
31
计算两组各自的直线回归方程和公共的回归方程
33
计算估计误差平方和
34
估计误差 自由度平方和均方 105.13220.5132 145.81470.4153 2410.94690.4561 10.02840.0284 2510.97530.4390 10.44910.4491 2611.4244变异来源甲组 乙组 组内 回归系数 公共 修正均数 总计 估计误差平方和分析表
35
为进一步了解研究各组所属总体回归线 的坡度是否相同,以及回归线的高度是否 相同,先检验各组的方差(估计误差的均 方)差别有无统计学意义。 经检验,差异无统计学意义,可以认 为甲组与乙组的估计误差均方没有差 异。
36
进一步发现两回归线的坡度差异有 无统计学意义,即检验两回归线是 否平行,如果 F 值无统计学意义, 则可以认为两回归线是平行的。
37
如果 F 检验有统计学意义, 提示两总体回归线不平行, 不必进行两回归线高度的比 较,分析停止。
38
进一步的分析只有在方差一 致,回归线平行的条件下,才进 行总体回归线高度的检验,回归 线高度常用 y 的均数大小表示, 所以在协方差分析中,以检验 y 的修正均数间的差异来代替检验 回归线高度间的差别。
39
修正均数平方和:从总计平方和减公共 平方和,即把与 y 值呈直线关系的 x 化为相等 后的 y 均数间的平方和,相当于回归线高度 方面的抽样误差,修正均数是否有统计学意 义,可用修正均方除以公共均方,即为 F 值, 根据 F 值判断有无统计学意义。
40
综上,两条回归线斜率差异无统 计学意义,回归线高度也无统计 学意义,因此,可以认为在对年 龄进行了校正后,两种工人的平 均肺活量没有差别。
41
完全随机设计协方差分析 SPSS 统计软件包数据库字段格式 年龄肺活量分组年龄肺活量分组 394.621384.582 405.291425.122 415.521433.892 413.711434.622 454.021374.302 495.091502.702 522.701503.502 474.311453.062 612.701484.062 653.031514.512 582.731464.662 593.671582.882 434.612383.642 394.732385.092
42
协方差分析 SPSS 统计软件包操作(一)
43
协方差分析 SPSS 统计软件包操作(二) 结果变量 分组变量 协变量
44
协方差分析 SPSS 统计软件包操作(三) 结果变量 分组变量 协变量
45
协方差分析 SPSS 统计软件包操作(四) 模型选择 常用模型 系统默认 选择项
46
协方差分析 SPSS 统计软件包操作(五) 系统默认
47
协方差分析 SPSS 统计软件包操作(六) 描述性分析 方差齐性检验
48
结果(一)描述性统计量
49
结果(二)方差齐性检验
50
结果(三)方差分析表
51
结果(四)修正年龄后两组肺活量的估计值
52
结果(五)修正年龄后两组肺活量的估计值
53
结果(六)修正年龄后两组肺活量的比较方差分析表
54
研究各条回归线坡度差别有无统 计学意义,即回归线是否平行: 可从散点图上的回归线作初步观 察。
55
绘制散点图 操作(一) 散点图
56
绘制散点图操作(二) 简单
57
绘制散点图操作(三)
58
绘制散点图
59
绘制回归直线 操作(一)
60
绘制回归直线 操作(二)
61
绘制回归直线 操作(三)
62
绘制回归直线 操作(四)
63
绘制回归直线结果
64
简化分析方法
65
简化的组间变异( x,y 各均数间的离均差平方 和)
66
x,y 的离均差积和
67
将数据代入运算式
69
计算误差平方和
70
变异来源自由度 估计误差 估计误差 自由度误差平方和 均方 总变异271640.4320.79 - 123.95 2611.4244 组间变异1202.740.20 - 6.44 组内变异261437.6920.58 - 117.51 2510.97530.4390 修正均数0.44910.4491 协方差分析计算表
71
计算 F 值
72
配伍组设计的协方差
73
配伍组设计的协方差 配伍组设计是配对设计的扩大,在 研究中是 将受试者按随机区组设计分 成多个区组,再将每个区组的受试 者随机分配到各组(即研究因素), 对那些在研究中未加限制的因素或 基线作为协变量。
74
根据方差分析的原理,即总的离均差平方和 可以分成处理组间(研究因素间)、区组间 (受试者间)和误差(组内)三部分。研究 的结果变量 Y 可能受处理因素(试验因素)的 影响,可能还受协变量和区组的影响,因此, 须将协变量和区组这两方面的影响扣除,才 能分析各处理(各因素)对结果的作用。对 协变量的影响仍然用线性回归分析方法来扣 除,对区组的影响扣除,可将处理项与误差 项相加得到处理加误差项(估计误差),估 计误差项减误差得到修正均数项的估计误差, 这样即同时扣除了协变量和区组的影响。
75
例:采用动物实验研究核黄素缺 乏对蛋白质利用的影响,将体重 相近,出生 3 周的大白鼠 36 只,按 窝别,性别等条件分成 12 窝,每 窝 3 只,随机分配到 3 个不同饲料 组进行喂养,问不同饲料对大白 鼠所增体重有无影响?
76
数据格式 核黄素缺乏组限食量组不限食量组 x1y1gcx2y2gcx3y3gc 256.927.011260.332.021544.7160.331 271.641.712271.147.722481.296.132 210.225.013214.736.723418.9114.633 300.152.014300.165.024556.6134.834 262.214.515269.739.025394.576.335 304.448.816307.537.926426.672.836 272.448.017278.951.527416.199.437 248.29.518256.226.728549.9133.738 242.837.019240.841.029580.5147.039 342.956.5110340.761.3210608.3165.8310 356.976.0111356.3102.1211559.6169.8311 198.29.2112199.28.1212371.954.3312
77
配伍组设计协方差分析 SPSS 统计软件包操作一
78
配伍组设计协方差分析 SPSS 统计软件包操作二 配伍组
79
配伍组设计协方差分析 SPSS 统计软件包操作三
80
配伍组设计协方差分析 SPSS 统计软件包操作四
81
配伍组设计协方差分析结果(一)
82
配伍组设计协方差分析结果(二)
83
配伍组设计协方差分析结果(三)
84
配伍组设计协方差分析结果(四)
85
配伍组设计协方差分析结果(五)
86
多元协方差分析
87
多元协方差分析 若试验中影响结果变量的因素不止一 个而是多个(两个或两个以上)协变量, 这就需要将多个因素(协变量)都化为相 等,然后再比较分析修正均数(结果变量) 间的差别,这些因素与修正变量呈线性相 关,因此可以用多元协方差分析。
88
例. 若将各组动物的食量与原始体重都化 为相等,然后比较各组所增体重的修正 均数间的差别,则先用多元线性回归的 方法,将食量、原始体重与所增体重的 关系找出来,求出当食量、原始体重与 所增体重的关系找出来,求出食量、原 始体重化为相等时,各饲料组所增体重 的修正均数,然后用方差分析检验各修 正均数间有无差异。
89
多元协方差分析 SPSS 统计软件包操作一
90
SPSS 统计软件包操作二
91
SPSS 统计软件包操作三
92
SPSS 统计软件包操作四
93
SPSS 软件包多变量协方差分析结果 ( 描述性分析 )
94
SPSS 软件包多变量协方差分析结果 ( 方差齐性检验 ) 方差齐性检验结果提示方差齐性.
95
SPSS 统计软件包多元协方差分析 ( 主要结果 ) 协变量 : 年龄 x1 与进食量 x2 差异均有统计学意义, 两协变量与所增体重 y 存在多元线性回归关系, 且有统计学意义 (P<0.05).
96
SPSS 软件包多变量协方差分析结果 ( 修正均数 ) 上表为校正两协变量以后, 所增体重的修正均数, 标准误及 95% 可信区间.
97
SPSS 软件包多变量协方差分析结果 ( 三组修正均数比较的 F 检验 ) 协方差分析结果, 提示三组修正均数间比较的 F 检验, 差异 有统计学意义,(P<0.001).
Similar presentations
© 2024 SlidePlayer.com. Inc.
All rights reserved.