用R语言做回归分析 您所在的位置:网站首页 回归分析里面的r 用R语言做回归分析

用R语言做回归分析

2023-06-19 21:18| 来源: 网络整理| 查看: 265

机器学习课程2  回归分析 【题目1】

    使用R对内置鸢尾花数据集iris(在R提示符下输入iris回车可看到内容)进行回归分析,自行选择因变量和自变量,注意Species这个分类变量的处理方法。

 

解答:

1. iris数据集介绍

    鸢尾花(iris)是数据挖掘常用到的一个数据集,包含150种鸢尾花的信息,每50种取自三个鸢尾花种之一(setosa,versicolour或virginica)。每个花的特征用下面的5种属性描述萼片长度(Sepal.Length)、萼片宽度(Sepal.Width)、花瓣长度(Petal.Length)、花瓣宽度(Petal.Width)、类(Species)。

    观察这5个变量,我们发现Species是字符变量、非连续,难以直接进行线性分析。故首先应对定义哑变量处理离散变量Species。

    在这里了我参考了“练数成金”论坛数据分析与数据挖掘技术板块

“fjchenxd”的文章

http://www.dataguru.cn/forum.php?mod=viewthread&tid=265621

以及“夕阳无语”的文章

http://www.dataguru.cn/forum.php?mod=viewthread&tid=262887

 

2    样本多重线性检查

2.1  求方阵,并对其标准化、中心化

2.2  求方阵的条件数,即kappa值

    kappa = 291.2384,易知100kappa1000,多重共线性处于可忍受范围。

2.3  求解矩阵的特征值与相应的特征根

3.   一元线性回归分析 3.1         观察散点图

 

    通过plot(iris_demo)命令,我们目测得到Petal.Width与Petal.Length有很强的线性关系。

3.2   对Petal.Width与Petal.Length做一元线性回归分析

    我们发现回归系数中,截距与因变量都有3颗*,t值很大,Pr值很小,拒绝系数不正确的假设检验。

相关系数平方:0.9271,数据相当好。

3.3   对Petal.Width与Petal.Length做一元线性回归诊断

 

    P  = 1.68e-08 0.5接受了假设检验,符合正态分布;

    因变量GNP.deflator的 p值 = 0.4268



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有