Dayhoff Health 携手 AMD 将基因组分析速度提升高达 330 倍

Apr 10, 2026

在过去 18 年里,基因测序领域发生了一场根本性的变革。2008 年,随着高度并行的新一代测序系统得到采用,基因测序领域进入了成本迅速下降、性能持续提升的新时代。随着时间的推移,各大实验室面临的瓶颈也随之改变。

如今,基因测序仪已不再是整个流程中效率最慢的环节。序列比对、分类和矩阵构建等二级数据分析,反而成为制约性能的主要因素。这类工作负载虽可依托 CPU 实现并行处理与规模扩展,但它们对内存和计算资源的需求极高,且扩展效果并不理想。

考虑到基于 CPU 进行扩展所带来的成本、内存和算力需求压力,遗传学家开始评估将特定任务迁移到 GPU 的可行性。然而,想要摆脱沿用数十年的 CPU 处理模式,必须满足特定条件,包括成熟的软件平台、经过验证的分析准确性(与传统分析相比)、广泛的库支持以及强大的硬件架构。尽管 GPU 非常适合高度并行的处理任务,但它们分发和执行代码的方式与 CPU 截然不同,并且有其自身的性能局限。

Dayhoff Health 近期发布的一份白皮书对比了在基因组工作负载下 CPU 与 GPU 的处理时间,并测量了仅使用 CPU 进行分析相比在 GPU 上运行相同分析任务需要多花费多少时间。Dayhoff Health 运营着一个临床微生物组和基因组学专业平台,负责为医疗系统和企业项目处理海量健康相关数据。该白皮书评估的工作负载包含实际投产的业务流水线,可支持大规模微生物组批量检测。该公司对比分析了三种类型的测试:全基因组测序 (WGS)、单细胞测序 (SCS) 和微生物组样本分析。

对于非专业科研人员,这份报告清晰解释了这三种基因测试的用途以及加速这些测试所能带来的好处。全基因组测序可读取生物体基因组中的所有 DNA,可用于检测某些罕见疾病和遗传性疾病,并帮助肿瘤学家更加精准地为患者量身制定癌症治疗方案。单细胞测序能够精细化地识别和绘制单个细胞之间的差异,广泛应用于癌症研究、免疫学、发育生物学、神经科学和药物研发等领域。

根据 Dayhoff 给出的定义,微生物组分析就是“对临床、环境及研究样本中存在的微生物群落进行特征解析”。微生物组是指在同一环境中共生的微生物群落,但在日常语境中有时用来指代常见于人体胃肠道内的微生物菌群。微生物组分析可以帮助医生评估整体肠道健康状况、检测病原体,并为各类诊断和治疗相关决策提供数据支撑。

如果能够大幅缩短处理时间,对于上述所有分析任务都大有裨益。消除基因分析瓶颈,对个人患者和服务提供商都有所帮助。个人患者可以更快地获得结果,避免可能出现的关键诊疗延误;而基因测试公司可以在相同时间内处理更多数据,提高吞吐量。根据 Genome.gov 数据,提高基因测试的速度和准确性是降低成本的关键,而 GPU 加速顺理成章地成为发展进程中的下一步。

在 CPU 与 GPU 的对比实验中,Dayhoff Health 评估了一块配备 32GB 显存的 AMD Radeon AI PRO R9700 显卡,并将其与一块配备 64GB 主内存的 16 核 AMD 锐龙 7950X CPU 进行了对比。该 AMD Radeon GPU 利用 AMD ROCm 7.0.2 软件平台和基于 HIP 优化的基因测序专用内核(编译标志可在报告第 4 页找到)。

所有三项分析的测试结果都令人吃惊,尤其是微生物组样本分析。在此测试中,AMD Radeon AI PRO R9700 的速度至少是未经优化的 CPU 版本的 330 倍,如下图所示:

Dayhoff Health 发布的图表,显示微生物组分析性能相较 CPU 基准性能提升高达 330 倍

微生物组流水线处理速度提升 330 倍,显著缩短了生成和交付报告结果所需的时间,使周转时间接近实时。更快的处理速度可提高整体吞吐量,并使大型项目在现有基础设施承载能力内服务更多参与者。缩短每个样本的计算时间,不仅可提高运营效率,还可帮助高通量检测机构降低每次测试的成本。对于大规模的微生物组分析和群体健康项目,这种程度的性能提升可帮助实现一种响应速度更快且经济上可持续的运营模式。

经过优化的 CPU 代码虽然可以缩小 CPU 和 GPU 之间的性能差距,但不足以消除差距。Dayhoff Health 报告称,GPU 的速度大约是经过优化的最快 CPU 运行速度的 62.5 倍。内存压力甚至会让差距更大;在此场景下,AMD Radeon AI PRO R9700 的速度至少是 AMD 锐龙 7950X 的 968 倍1

虽然全基因组测序 (WGS) 与单细胞测序 (SCS) 的加速幅度相对温和,但在 99% 准确度标准下,针对这两类工作负载,GPU 相比 CPU 仍分别实现了 15 倍和 21 倍的处理性能提升1。在现代计算系统中,这种幅度的性能提升非常罕见,这也充分证明了 AMD ROCm 软件平台、HIP 加速计算技术以及 AMD Radeon AI PRO R9700 所依赖的底层 AMD RDNA 4 GPU 微架构的强悍实力。

在高度并行的基因组分析工作负载中,现代 GPU 相较于传统 CPU 架构具有显著结构优势,因为它们拥有高吞吐专用显存池,并且配备数千个核心,这些核心专门针对在整个芯片上执行相同操作而优化。Dayhoff Health 的研究结果表明,随着 DNA 测序应用日益普及、成本持续下降,GPU 加速技术将变得越来越重要,AMD 成熟可靠的软硬件一体化技术栈的价值也会随之凸显。

1:GD-181a:性能提升数据由本文提及的第三方组织提供,未经 AMD 独立验证。性能表现和成本效益受到各种因素所影响。此处的结果仅针对该第三方组织,不一定广泛适用。GD-181a。

Share:

Article By


Related Blogs