多重共线性问题的岭回归实例 您所在的位置:网站首页 岭回归检验 多重共线性问题的岭回归实例

多重共线性问题的岭回归实例

2023-03-29 00:49| 来源: 网络整理| 查看: 265

专题研究

ZHUANTI

 

YANJIU

 

 

多重共线

f

问题旳竣回归实例

◎王飞

孙嘉聪

沈丹(

海大学

辽宁

P

 

121000

)

!

摘要

 

线性

 

 

 

共线性

的存在十分

 

 

危害

 

 

文章简述了回

 

共线性的一系列

 

 

过实

 

 

 

析法对经

 

中的

 

共线性

 

进行了分析.所以研

究线性

 

 

之间的

 

共线性具有一定的实用

.

!

关键词

回归模型

多重共线性

岭回归分析

多重共线性

(

)

 

 

 

由于模型设定和数据等各方面的问题

模型的解释变

 

 

能存在

 

程度的

 

关系

这时称多

回归模型存在多重

数学描述

:

对于模型

 

=%

0

 

+%

1

 

#

1

.

 

+%

2

#

2

.

 

+

+%#

 

+

 

+

 

,,

 

=

 

1

 

,

2

E.

 

(

 

1

 

-

 

1

 

)

其金亲.设之一是解释变量

1

,

!

是相互独立

 

的•如果

 

个或多个解释变量

 

现了相关性

则称为

多重

 

(

Multicollinearity

 

)

.

如果存在

 

9

1

 

#

1

.

 

+,

2

#

2

.

 

+

 

+,

#

I

 

=0,i

 

=

1

,

2

,

E

(

 

1

 

-2

)

其中

9

不全为

0

,

则称

•••

之间存在线性.如

 

果式

(

1-2

)

近似地对所有数据成立

则称

•••

 

在近似多重

(

)

 

 

 

全多重

 

常因为在模型设定时把有

 

变量引进同一个模型

 

为虚拟变量设置不当引起的.

近似多重

 

既与变量选择有关

,

也与数据有关

虽然

由于解释变量的选择不当

 

在关

 

强的变量引进

同一个模型

 

近似多重

 

的重要原因

但近似多

 

更经常的原因是经济数据的共同趋势.

(

)

 

 

当-释变量余统中存在严重的多重

 

 

 

乘法拟合回归模型

则模型的精确性

 

都不能

.

1

.

 

在解释变量完全相关的情况下

 

乘法的回归

系数完全无

 

计.最

 

 

 

数的估计量是

%

 

=

 

(

!!

 

T

!中的量完全相关时

(

!'!

)

是不可逆矩

.因此

 

式无法求

 

数仅自然也得不到应有的

模型.

2

.

 

若解释变量

 

在着不完全的

 

 

数是

计的

 

数的估计方差会随着解释变量

 

的相

关性的不断增强

 

.在高度相关条件下

 

的方

 

往往只更换

 

中的个别数据所

 

 

I

数的

 

会有

 

这对于所

 

 

方程的可

难判断了.

3

.

 

存在严重的多重

 

 

数的统计检验有

一定的

 

难.

 

在高度

 

 

 

 

数的方

 

不断增

相应的

t

检验值减小

 

数的

t

检验不能

 

在应用过程中

由于解释变量

 

的多重

 

 

一些

重要的解释变量无

 

著性检验

 

能一些重要

的解释变量作为无足轻重的因素

 

 

与客观

 

的结论.

4

.

 

在解释变量高度相关的条件下

用最小二乘法得到

的回归模型

 

数的物理

 

难解释.许多从专业

知识上看似乎十分重要的变量

 

数的取值变

 

 

甚至还会出现

 

数的符号与人们的实际概念

完全

 

的现象.

岭回归

:

 

经济分析数据

考察进口总额%与三个解释变

 

 

 

,

 

 

(

 

为十亿

法郎

)

现收集数据

 

1

.

1

法国外贸

外贸数据

序号

国内总产值

(

!

1

)

 

(!)

总消费量

(!)

 

(%

1

149.3

4

.

 

2

108.

 

1

15.9

2

161.2

4

.

 

1

114

.

 

8

16.4

/

171.5

3

.

 

1

123.

 

2

19.0

4

175.5

3

.

 

1

126

.

 

9

19

.

 

1

5

180

.

 

8

1

.

1

132.

 

1

18

.

 

8

6

190.7

2

.

 

2

137.

 

7

20.4

7

202

.

 

1

2

.

 

1

146

.

 

0

22.7

8

212.4

5

.

 

6

154.

 

1

26.5

9

226

.

 

1

5

.

 

0

162

.

 

/

28

.

 

1

10

231.9

5

.

 

1

164

.

 

/

27.6

11

239.0

0

.

 

7

167.

 

6

26.3

对给定的原始数据进行中心化和标准化

得到如下

 

数据'

 

_

 

_

 

_

!

 

194.

 

59

,

!

 

=

3

.

 

30

,

!

 

139.74

,

%

 

=

 

21.

 

89

,

11

 

_

q

2

 

=

 

#

 

(

#

1

.

 

-!

)

2

 

=

 

8999.7

,

*

 

-!

)

2

 

=

 

27.2

,

 

-!

 

)

2

 

=

 

4257.

 

78

,

.

-

%

2

 

=

 

206

.

 

44

.

=

=

=

以病狂计算得到它所有可能的最小二乘回归.如下

 

2

 

-2

.

进入回归的变量

回归系数的最小二乘估计

X1

X2

X3

Y

0.146

X

2

0.691

X

3

0.214

X

1

 

,

X

2

0.145

0.622

X

1

 

,

X

3

-0.

109

0.372

X

2

 

,

X

3

0.596

0.212

X

1

 

,

X

2

 

,

X

3

-°.°51

0.581

0.287

(

下转

134

页)

数学学习与研究

2019.

 



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有