多重共线性问题的岭回归实例 | 您所在的位置:网站首页 › 岭回归检验 › 多重共线性问题的岭回归实例 |
专题研究 ZHUANTI
YANJIU
•
• 多重共线 f 问题旳竣回归实例 ◎王飞 孙嘉聪 沈丹( 渤 海大学 , 辽宁 锦 P
121000 ) ! 摘要 】 在
线性
中 ,
之
共线性 的存在十分
,
危害
容
, 文章简述了回 中
共线性的一系列
,
过实
用 岭
分
析法对经
中的
共线性
进行了分析.所以研 究线性
中
之间的
共线性具有一定的实用 . ! 关键词 】 回归模型 ; 多重共线性 ; 岭回归分析 一 、 多重共线性 ( 一 )
多
性
义 由于模型设定和数据等各方面的问题 , 模型的解释变
量
能存在
程度的
关系 , 这时称多 , 性 回归模型存在多重 数学描述 : 对于模型 %
=% 0
+% 1
# 1 .
+% 2 # 2 .
+ … +%#
+
+
,,
=
1
, 2 , … , E.
(
1
-
1
) “ 其金亲.设之一是解释变量 ! 1 , ! , … , ! 是相互独立
的•如果
个或多个解释变量
现了相关性 , 则称为 多重
( Multicollinearity
) . 如果存在
9 1
# 1 .
+, 2 # 2 .
+
… +, # I
=0,i
= 1 , 2 , … , E (
1
-2 ) 其中 9 不全为 0 , 则称 ! , ! , ••• , ! 之间存在线性.如
果式 ( 1-2 ) 近似地对所有数据成立 , 则称 ! , ! , ••• , ! 之
在近似多重 ( 二 )
多
性
本 全多重
常因为在模型设定时把有
的 变量引进同一个模型 ,
为虚拟变量设置不当引起的. 近似多重
既与变量选择有关 , 也与数据有关 , 虽然 由于解释变量的选择不当 ,
在关
强的变量引进 同一个模型 , 是
近似多重
的重要原因 , 但近似多 重
更经常的原因是经济数据的共同趋势. ( 三 )
多
性 当-释变量余统中存在严重的多重
时 ,
用 最
乘法拟合回归模型 , 则模型的精确性 、
都不能 . 1 .
在解释变量完全相关的情况下 , 最
乘法的回归 系数完全无
计.最
乘
,
数的估计量是 %
=
( !!
T , 当 !中的量完全相关时 , ( !'! ) 是不可逆矩 .因此 ,
式无法求
数仅自然也得不到应有的 模型. 2 .
若解释变量
在着不完全的
,
数是 计的 ,
数的估计方差会随着解释变量
的相 关性的不断增强
.在高度相关条件下 ,
数 的方
, 往往只更换
中的个别数据所
的
I 数的
会有
异 , 这对于所
的
方程的可 难判断了. 3 .
存在严重的多重
时 ,
数的统计检验有 一定的
难.
在高度
关
件
,
数的方
不断增 , 相应的 t 检验值减小 ,
数的 t 检验不能
• 在应用过程中 , 由于解释变量
的多重
,
一些 重要的解释变量无
著性检验 ,
能一些重要 的解释变量作为无足轻重的因素
弃 ,
与客观 情
的结论. 4 .
在解释变量高度相关的条件下 , 用最小二乘法得到 的回归模型 , 其
数的物理
难解释.许多从专业 知识上看似乎十分重要的变量 , 其
数的取值变
: 不
, 甚至还会出现
数的符号与人们的实际概念 完全
的现象. 二 、 岭回归 法 :
经济分析数据 , 考察进口总额%与三个解释变
量 :
总
! ,
量 ! , 总
量 ! (
为十亿 法郎 ) , 现收集数据 ,
1 . 表 1 法国外贸 数 据 外贸数据 序号 国内总产值 ( ! 1 ) 量
(!) 总消费量 (!) 进 口 总 额
(% 1 149.3 4 .
2 108.
1 15.9 2 161.2 4 .
1 114 .
8 16.4 / 171.5 3 .
1 123.
2 19.0 4 175.5 3 .
1 126 .
9 19 .
1 5 180 .
8 1 . 1 132.
1 18 .
8 6 190.7 2 .
2 137.
7 20.4 7 202 .
1 2 .
1 146 .
0 22.7 8 212.4 5 .
6 154.
1 26.5 9 226 .
1 5 .
0 162 .
/ 28 .
1 10 231.9 5 .
1 164 .
/ 27.6 11 239.0 0 .
7 167.
6 26.3 对给定的原始数据进行中心化和标准化 , 得到如下
数据'
_
_
_ ! 二
194.
59 , !
= 3 .
30 , ! 二
139.74 , %
=
21.
89 , 11
_ q 2
=
#
( # 1 .
-! ) 2
=
8999.7 , *
-! ) 2
=
27.2 , ”
-!
) 2
=
4257.
78 , . - % 2
=
206 .
44 . = = = 以病狂计算得到它所有可能的最小二乘回归.如下
2
-2 . 进入回归的变量 回归系数的最小二乘估计 X1 X2 X3 Y 0.146 — — — — X 2 — — 0.691 — — X 3 — — — — 0.214 X 1
, X 2 0.145 0.622 — — X 1
, X 3 -0. 109 — — 0.372 X 2
, X 3 — — 0.596 0.212 X 1
, X 2
, X 3 -°.°51 0.581 0.287 ( 下转 134 页) 数学学习与研究 2019.
|
CopyRight 2018-2019 实验室设备网 版权所有 |