R语言rhdf5读写hdf5文件(.h5)展示文件组织结构和数据索引 您所在的位置:网站首页 如何读取h5文件内容 R语言rhdf5读写hdf5文件(.h5)展示文件组织结构和数据索引

R语言rhdf5读写hdf5文件(.h5)展示文件组织结构和数据索引

2024-04-07 06:53| 来源: 网络整理| 查看: 265

h5只是一种简单的数据组织格式【层级数据存储格式(HierarchicalDataFormat:HDF)】,该格式被设计用以存储和组织大量数据。 h5数据存储结构.jpg 在一些单细胞文献中,作者通常会将分析的数据上传到GEO数据库保存为.h5格式文件,而不是我们常见的工程文件(rds文件,表格数据等),所以为了解析利用这些数据需要对hdf5格式的组织结构有一定的了解。(注:在Seurat包中有现成的函数Seurat::Read10X_h5()可以用来提取表达矩阵,但似乎此外无法从h5文件中提取更多的信息)。 GEO数据库

在R语言中对HDF5进行操作的软件包为rhdf5。 ###安装

install.packages("BiocManager");BiocManager::install("rhdf5");library(rhdf5)

###打开.h5文件 和 展示内容的组织结构

h5_file= H5Fopen("new.h5") ####如下所示,new.h5文件内创建了一个组(group1_mat) #组内又创建了df和matrix两个层级用以保存矩阵和数据框 > h5dump(h5_file,load=FALSE) $group1_mat $group1_mat$df group name otype dclass dim 1 / df H5I_DATASET COMPOUND 5 $group1_mat$matrix group name otype dclass dim 1 / matrix H5I_DATASET FLOAT 3 x 2

###数据索引通过“$”符进行

> h5_file$group1_mat$df C_1 C_2 C_3 name 1 3 5 69 xx 2 2 8 60 yy 3 8 4 92 gg 4 1 6 16 ll 5 7 4 25 mm

###关闭hdf5文件

H5Fclose(h5_file)#关闭当前打开的hdf5文件 h5closeAll()#关闭所有打开的hdf5文件

###构建自己的hdf5文件

###准备数据 mdat


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有