yobo体育(中国)官方网站

DISCO:深度整合人类单细胞组学数据的数据库

栏目:最新研究动态 发布时间:2022-03-14
近日,新加坡研究团队构建了一个新的单细胞测序数据库——DISCO,该数据库相关文章刊登在Nucleic Acids Research期刊......


单细胞 RNA 测序已成为剖析细胞异质性以发现稀有细胞类型和研究细胞水平基因调控的有力工具。在过去的十年中,单细胞转录组研究呈指数级增长,涵盖了广泛的组织类型和疾病。技术的进步不仅降低了测序成本,而且增加了每个实验测序的细胞数量,据报道覆盖了超过一百万个细胞。单细胞数据的日益普及为数据集成提供了机会,以创建全面的细胞图并增强下游分析的能力。

单细胞测序的飞速发展也给单细胞数据的管理和整合带来了挑战。目前,公共数据库中有超过400个单细胞 RNA-seq 数据集。当前的单细胞数据库具有三个主要缺点。首先,这些数据库中的大多数仅提供其各自研究中的处理数据;未进行数据集成或未提供批量校正值。具有针对特定组织或疾病的集成图集作为共识参考图和增强下游分析非常有用。其次,相关数据不协调,具有非标准格式和命名约定。特别是,细胞类型标签不遵循任何标准化的细胞类型本体。第三,它们提供有限的分析功能和可视化能力。例如,它们都不允许用户将自己的数据映射到数据上。

近日,新加坡研究团队构建了一个新的单细胞测序数据库——DISCO,该数据库相关文章刊登在Nucleic Acids Research期刊(IF=16.971),题名为DISCO: a database of Deeply Integrated human Single-Cell Omics dataDISCO网址为https://www.immunesinglecell.org/

DISCO是一个深度集成的单细胞组学数据数据库。DISCO 351个项目中整合了来自4593个样本的超过1800万个细胞,涵盖107个组织/细胞系/类器官、158种疾病和20个平台。DISCO上托管的所有数据都是使用标准化管道从原始 fastq文件处理的。利用大量的公共细胞类型注释,开发了CELLiD并将其应用于以自动和标准化的方式注释细胞类型。为了整合单细胞数据并创建共识参考图,还开发了FastIntegration,它可以整合超过400万个细胞。目前,DISCO23种组织、3种疾病(COVID-19、乳腺癌和结直肠癌)和B/浆细胞提供了1个全图谱27个子图谱。DISCO配备了三个在线工具,用于在线数据集成的FastIntegration、用于在线细胞类型识别的CELLiD和用于在线细胞投影的CellMapper。这些工具使用户能够执行自定义数据集成,并将他们自己的数据上传到细胞类型注释和映射到可用的图集上。集成的地图集和用于构建地图集的所有样本数据也可供下载。总之, DISCO 是探索不同健康和患病人体组织中的细胞类型和基因表达的宝贵数据资源,有助于加速发现新的细胞类型及其相关功能。