生物信息与智能医学中心团队在期刊《Briefings in Bioinformatics》发表论文
2022年09月07日 编辑:生物信息与智能医学中心
生物信息与智能医学中心团队在生物信息学领域期刊《Briefings in Bioinformatics》发表题为 SCDD: a novel single-cell RNA-seq
imputation method with diffusion and denoising ” 论文。
单细胞转录组测序是一种可以以细胞为精度测定转录组表达量的技术,随着单细胞转录组测序的广泛应用,相关数据分析技术得到了快速发展。由于现有单细胞转录组测序技术存在一定的局限性,如转录产物表达量相对较低、捕获效率不足或测序深度较低,可能会产生大量的低表达值,而这些低表达值实际上并不全是相关转录产物未表达的结果(称之为dropout事件)。
为了有效解决dropout问题,课题组提出了一种新的包含扩散和去噪阶段两阶段单细胞转录组补插方法SCDD。在扩散阶段,SCDD首先对每个基因建立伽玛分布和正态分布的混合模型,以确定潜在的dropout位点。同时,SCDD生成识别每个细胞的邻居的模糊矩阵。对于每个确定的潜在缺失位点,将其邻近位点的表达值扩散到该位点。然后将这些扩散的表达式值用作去噪阶段的神经网络的输入。另外,根据测序结果的表达值是否大于0生成0/1值矩阵。由此生成GCN中使用的图,其中每个细胞是一个点,每对细胞的Spearman相关性是与这对细胞相关联的边的权值。然后,在GCN的每一层,SCDD使用矩阵乘法生成一个叠加的表达量。最后,SCDD从神经网络的编码中恢复预处理后的扩散表达式´,并生成补插结果。