密码:

从24小时到7分钟——社员于浩澎带领团队刷新基因分析“中国速度”


基因测序是一种新型基因检测技术,基因测序和分析技术现已应用于生育健康、肿瘤个体化诊断和治疗、遗传病、传染病检测、疫苗研发等领域。人类首次完成人类基因组测序耗费了13年,随着技术的不断发展,到了2019年,测序时间被缩短到了1天,但这些测序数据的分析却额外还需要1天。这样的分析速度仍不足以支撑基因测序真正广泛推广到临床应用上。想要提升分析效率,继续缩短该阶段的时间,这是一个世界级的难题。

近日,四川大学华西医院生物医学大数据中心将人类全基因组分析时间从24小时缩短至7分钟,刷新了基因分析的“中国速度”,具有跨时代的意义。这也意味着,该项研究成果直接加速了基因测序从科研到临床的进程,未来将有更多精准的基因数据辅助于医疗诊断及治疗。

九三学社成都市委社员、华西生物医学大数据中心于浩澎副研究员负责的这项突破性的研发成果发布后,引起了央视新闻的关注,并进行了专题报道。于浩澎在接受采访中分享了在基因分析领域追求极致的探索。

于浩澎介绍,按照传统方案,我们获取一个人的遗传变异信息,大概需要24小时。现在经过我们方案优化,在7分钟内就可以完成,因为我们进行了两个方面的突破,一个是计算算力的瓶颈打破,一个是存储性能的瓶颈打破。之所以能实现时间上质的突破,根本在于打破计算算力和储存性能的瓶颈。他将其形象地比喻为吃得快的“大嘴巴”和装得下的“大肚子”:“大嘴巴”实现了大文件的直通读取和小文件的聚合读取,数据读取的效率更高,“大肚子“可以对数据分析的各个作业流程进行融合调度的优化,I/O流更加顺畅,从而实现了“吃得更多、消化更快”。

研发团队在全基因组数据分析加速上,以GATK流程为基础,经过不断的流程拆分与重组改写、不断的分布式存储软硬优化打磨,最终完成了速度的飞跃,实现了30X人类全基因组测序胚系变异分析时间从24小时到7分钟的极限压缩,同时保证了分析结果的准确性:和GATK结果高度一致。

于浩澎是九三学社成都市社员,四川大学华西医院副研究员,华西生物医学大数据中心数据科学家,主要从事生物信息学、医疗大数据和肾脏疾病相关研究。先后主持国家自然科学基金青年基金、四川省重点研发面上项目,骨干参研国家重点研发计划、国家自然科学基金重点项目等国家、省、部级重大科技项目6项。近十年在Cell Stem Cell, Nature Communication, Nucleic Acids Research等国际著名学术期刊上发表SCI论著20余篇,其中以第一及通讯作者发表论文5篇,平均影响因子10.7。任四川省生物信息学会委员,Frontiers in Genetics、Genomics Protomeics Bioinformatics等SCI期刊审稿编辑。

于浩澎表示,将继续努力做好科学研究,揭开基因的神秘面纱,用更精准的基因数据辅助医疗诊断及治疗,为医学进步发展做出更大的贡献,促进人类的健康福祉。