生物信息与智能医学团队最新研究工作在Nucleic Acids Research上发表
2024年11月06日 编辑:生物信息与智能医学中心
近日,生物信息与智能医学团队的研究工作Pairpot: a database with real-time lasso-based analysis
tailored for paired single-cell and spatial
transcriptomics目前已发表在Nucleic Acids Research上。
单细胞与空间转录组测序技术的兴起为探索更多癌症治疗靶点提供了全新的视角。单细胞技术能够揭示单个细胞的基因表达情况,而空间转录组技术则能够捕捉基因表达的空间分布。这两大技术的结合,使得深入探索细胞类型与空间关系成为可能,从而进一步挖掘潜在癌症治疗靶点,为靶向药研发提供关键的方向和依据。然而,现有的研究在单细胞—空间配对数据的收集及在线分析方法仍存在局限。例如,当用户需要进一步对单细胞数据中的细胞群进行细分时,用户需要下载原始数据并且重新进行细胞比例推断等分析。
为了克服上述挑战,课题组构建了迄今为止最大的单细胞—空间转录组配对数据库Pairpot(http://pairpot.bioxai.cn),收集了来自299个数据集的1,425,656个spot,形成了99个单细胞—空间配对数据。Pairpot还是首个提供实时启发式分析的空间转录组数据平台,支持针对同一研究中的多个组织切片进行同时分析。Pairpot开发了基于半监督学习的AI算法,其中Lasso-View能在毫秒级响应时间内识别用户感兴趣的细胞亚群,Pair-View能够根据用户手动圈选的细胞类型实时推断配对空转数据中的细胞比例。这两种工具使得用户实现在线的细胞亚群细分及其空间比例推断成为可能。此外,为了直观展示细胞类型特异性域,Pairpot还开发了Layer-View
工具,使得研究人员能够更直观地理解解剖学区域在多切片中的分布。
实验表明,Pairpot能够在约0.5s以内的响应时间对用户圈选对感兴趣区域进行修补和纠错。在小鼠脑切片的应用也表明,Pair-View能够根据手动圈选的细胞亚型精确识别对应的空间细胞比例。Pairpot还充分考虑了不同用户的需求,提供了多种分析方法和工具:对于需要下载数据并进行离线分析的用户,Pairpot可以生成相应的操作代码;对于没有编程能力的用户,Pairpot则提供在线分析工具和结果下载,简化分析流程。总之,Pairpot不仅提供了易于获取的配对数据集,它还基于配对数据库开发了启发式实时分析平台,能够有效地根据用户输入实时返回结果,简化了单细胞—空间转录组的整合分析,大大提高了生物信息学的分析效率。随着单细胞和空间转录组技术的不断发展,Pairpot还可以进一步应用于癌症研究、靶点预测、药物研发等多个领域,为研究人员提供有力的支持。