单细胞数据降维可视化最新工具UMAP的介绍 | 您所在的位置:网站首页 › 轴测投影是什么意思 › 单细胞数据降维可视化最新工具UMAP的介绍 |
高通量单细胞组学数据的一个显著性特点就是数据量大,一次能反映的细胞数量多。因此,通过降维和可视化去展示细胞数据特征是一个非常重要的工作。翻开各类发表的单细胞组学文章,不管是CNS的还是其他,几乎所有的结果中,映入眼帘的第一张图片通常是数据结果的降维图形化展示。 图1 PBMC细胞单细胞转录组数据展示图 实现高维数据可视化的理论基础是基于降维算法。降维算法一般分为两类:那些寻求在数据中保存距离结构的,以及倾向于保存局部距离而不是全局距离的。PCA[1]、MDS[2]等算法属于前者,t-SNE[3,4]、diffusion maps[5]等算法都属于后者。对高维单细胞数据的可视化展示,以t-SNE为代表的非线性降维技术,由于其能够避免集群表示的过度拥挤,在重叠区域上能表示出不同的集群而被广泛运用。然而,任何技术方法都不是完美的,t-SNE也一样,它的局限性体现在丢失大规模信息(集群间关系)、计算时间较慢以及无法有效地表示非常大的数据集[6]等方面。 那么,有没有其它方法能在一定程度上克服这些弱点呢? UMAP就是这样一个能解决这些问题的降维和可视化的工具。 统一流形逼近与投影(UMAP,Uniform Manifold Approximation and Projection)是一种新的降维流形学习技术。UMAP是建立在黎曼几何和代数拓扑理论框架上的。UMAP是一种非常有效的可视化和可伸缩降维算法。在可视化质量方面,UMAP算法与t-SNE具有竞争优势,但是它保留了 |
CopyRight 2018-2019 实验室设备网 版权所有 |