PCA(principal component analysis,主成分分析) | 您所在的位置:网站首页 › pc的全称英语 › PCA(principal component analysis,主成分分析) |
1. 简介
PCA(Principal Components Analysis)即主成分分析,也称主分量分析或主成分回归分析法,是一种无监督的数据降维方法。首先利用线性变换,将数据变换到一个新的坐标系统中;然后再利用降维的思想,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上。这种降维的思想首先减少数据集的维数,同时还保持数据集的对方差贡献最大的特征,最终使数据直观呈现在二维坐标系。 R语言中可以进行PCA分析的主要有rda(){vegan}、prcomp(){stats}、princomp(){stats} 、PCA(){FactoMineR} 、dudi.pca() {ade4} 、epPCA() {ExPosition};对于分析结果可视化,factoextra包封装了包括分析结果提取和基于ggplot2的数据可视化的函数。 1.jpeg 2. 目标找到数据中的隐藏模式 通过减少数据中的噪声和冗余进行降维 找到相关变量 3. 实战解析 确认数据是否需要标准化,函数是否封装了标准化程序。 Supplementary variables and individuals:不用于判断主成分,在结果显示中,他们的坐标轴由参与主成分分析的参数预测得出。 PCA(X, ind.sup = NULL, quanti.sup = NULL, quali.sup = NULL, graph = TRUE)X :数据集,每一行是一个样例,列代表观测值。 ind.sup : 指定Supplementary individuals所在的列 quanti.sup, quali.sup : 指定定性和定量观测值所在的列 PCA模型构建 decathlon2.active |
CopyRight 2018-2019 实验室设备网 版权所有 |