针对实现国家生物医学大数据战略和我国生物医学数据汇集管理与共享利用的重大需求,中心承担了国家“863”计划重大项目“生物大数据开发与利用关键技术研究”项目之大数据核心算法和系统平台建设任务。
该项目获得1.47亿元中央财政经费支持,旨在突破生物医学大数据标准化集成与融合技术;研发生物大数据索引、存储管理与搜索访问技术;开展针对心血管疾病、肿瘤疾病等重大疾病和区域医疗与健康的医疗大数据处理分析技术;建立国家组学大数据中心,保障国家生物数字主权;开创我国生物医学大数据组织管理与共享利用里程碑式新局面,提升我国生物医学大数据的国际竞争力。
针对实现国家致病微生物大数据管理的重大需求,中心承担了国家重点研发计划“国家致病微生物基因组数据库建设”项目之大数据平台核心算法与分析鉴定关键技术研发任务。
该项目获得2500万元中央财政经费支持,旨在依托中国疾病预防控制中心等国家级监测网络和国家级菌种保藏中心,整合国际微生物数据资源,构建国家级致病微生物基因组数据库,研发高效的基因组测序数据质控、比对、拼接、注释等生物信息学方法,建立国家致病微生物组学大数据分析挖掘平台。
面向人工智能技术与合成生物学交叉领域发展的迫切需求,中心承担了国家重点研发计划“面向合成生物系统的人工智能算法应用研究”项目之复杂合成生物系统设计、再造与优化任务。
该项目获得2000万元中央财政经费支持,旨在建立合成生物系统语义化、动态更新的共融知识库,构建基于强化学习等模型并具有持续学习能力的海量工程试错优化平台,结合高通量自动化构建、多谱学表征及深度学习技术,提升合成生物系统的预测及表征能力,在转录调控、酶催化、免疫信号传导等应用场景中进行“设计-构建-测试-学习”闭环设计与验证;促进合成生物学与人工智能技术的深度融合,奠定我国在合成生物学领域的国际引领地位。
个人基因组测序数据分析主要是通过高通量测序平台测定人类基因组的30亿个核苷酸序列,在分子水平上揭示人类基因组及基因的结构与功能,破译人类的全部遗传信息。人类表型组是生物体从微观组成到宏观、从胚胎发育到衰老死亡全过程中所有表型的集合,基因(内因)与环境(外因)共同决定了表型。多组学大数据分析主要是从多分子层次出发,通过对基因组、转录组、表型组等多组学层面整合分析,解析生命的构造、运行机理和疾病的分子起因,完成对生命物质的精准度量以及对个体表型、疾病和健康相关信息的系统解读。
面向我国生物制造和绿色低碳生物经济发展的重大需求,中心承担了国家重点研发计划“菌种基因重排技术”项目之基因组编译大数据处理与结构变异分析关键技术研发任务
该项目获得2500万元中央财政经费支持,旨在创新基因组重排技术体系,推动工业菌株的精准构建和快速进化,建立跨物种多基因的基因组重排多样性技术和高通量表征方法。
人体微生物由数百万个微生物基因与数万个人基因共同组成了一个丰富而活跃的微生态系统和代谢场所,伴随人类生物的微生物基因组也被称为“人类第二基因组”。
人体微生物组在代谢、免疫等重要生命过程的调解中发挥着重要作用,是人类健康、疾病和衰老的主导因素之一,更是药物代谢、微生物耐药的重要载体
中心承担了国家自然科学基金委人类微生物多组学整合分析技术项目支持,该项目从宏基因组、转录组、代谢组等多组学数据的大尺度融合与关联分析出发,深入探究了
人体微生物与人类健康与疾病的关联关系,为临床应用与健康管理提供新的思路。