AMD x ComfyUI:在 AI PC 上推进专业级生成式 AI

Jan 06, 2026

这张缩略图展示了在 AMD 平台上使用 ComfyUI 生成的一只龙瞳。

随着模型规模不断增长,许多创作者的工作流程逐渐迁移到远程云服务。借助 AMD ROCm 7.1.1 及全新的 AMD 一键式 ComfyUI 体验,创作者可以将算力密集型工作迁回到本地设备上,从而更好地掌控成本、数据和迭代速度。阅读更多:ComfyUI 官方发布的 AMD ROCm 支持博客。 

基于 AMD ROCm 7.1.1 的 ComfyUI 集成

ComfyUI 已成为高级扩散模型工作流程的控制中心。高阶用户可以设计基于节点的工作流程,尝试前沿模型,并分享能在社区中快速传播的模板。

适用于 Windows 的 ComfyUI 安装程序消除了设置 ComfyUI 时的大部分障碍。它预装了 AMD ROCm 7.1.1,并提供针对主流模型优化的流水线,使用户能够在受支持的 AMD Ryzen AI 系统或基于 AMD Radeon AI 的工作站上,仅需几步即可完成安装并生成首张图像。  

ComfyUI 桌面应用下载按钮。

在 AMD 平台上安装 ComfyUI 的三种方法

我们很高兴宣布,AMD ROCm 支持现已原生集成到 ComfyUI 中(包括桌面应用)。为满足不同用户的需求,目前在 AMD 硬件上支持三种 ComfyUI 安装方式

  1. 官方 Windows .exe 安装程序
    基于图形用户界面的简易 Windows 安装程序,可自动处理依赖项与配置,由 AMD ROCm 7.1.1 提供支持。单击此处下载。为获得最佳体验,AMD 推荐使用 AMD 锐龙 AI Max+ 128GB 系统(设置为 64GB VGM)或 AMD Radeon AI Pro R9700(搭配 64GB RAM)。

  2. 来自 ComfyUI GitHub 库的官方便携版 (Windows)
     可下载并解压的便携式归档文件,同样由 AMD ROCm 7.1.1 提供支持,适合需要在不同系统间移动整套文件夹的用户。最新便携版本可直接从 ComfyUI Github 库下载。

  3. 通过 git 手动设置
     对于希望完全掌控安装过程的开发者,仍可选择手动安装 ComfyUI,并搭配 AMD ROCm 每日构建版本,以抢先体验即将发布的功能、更全面的支持与优化。详细说明可在此处找到。

无论选择哪种方式,目标都是一致的:让用户在不牺牲 AMD 平台性能的前提下,自由选择所需的控制级别。 

幻灯片展示了在 ComfyUI 中从 ROCm 6.4 升级到 ROCm 7.1.1 后实现的性能提升

AMD ROCm 7.1.1 为高级模型带来高达 5.4 倍的性能提升

AMD ROCm 7.1.1 在 ROCm 6.4 基础上进一步优化,为 Windows 上的 ComfyUI 带来高达 5.4 倍的性能提升。

除性能提升外,搭配 AMD ROCm 7.1.1 驱动程序(将于后续版本纳入 AMD Software: Adrenalin Edition 驱动程序)时,还带来了全方位的稳定性提升:在采用 AMD Ryzen AI 技术的设备、AMD Radeon 及 Radeon AI PRO GPU 上实现更一致的使用体验,持续优化对 FP16、BF16、FP8 等混合精度格式的支持,并改进了内存管理机制。

对用户而言,这些技术改进体现为更快的渲染速度、更少的崩溃,以及在不同设备间更加轻松顺畅的工作流程迁移。此次发布标志着 AMD x ComfyUI 体验(Beta 版)首次上线,未来还将推出更多性能和稳定性改进。 

幻灯片展示了从 SD 1.5 过渡到现代图像模型后实现的视觉质量提升。

现代出色画质需要前沿模型的支撑

视觉效果本身,就在讲述一段重要的技术演进历程。早期(如今已过时)的扩散模型,如约 9 亿参数的 Stable Diffusion 1.5,虽然在 AMD 锐龙 AI Max+ 系统上只需几秒即可生成图像,但图像质量难以满足专业场景的需求。人脸常常扭曲变形,手部、文字或结构等精细细节也模糊不清。这些模型在当时令人印象深刻,但远未达到真正的照片级画质。

如今,创作者的期望更高。新一代模型(如约 60 亿参数的 Z Image Turbo),能够生成光影真实、纹理清晰、结构自然、文字清晰准确的画面。天空富有层次,肤色自然真实,反光或织物褶皱等微小细节都经得起细看推敲。 

幻灯片展示了在 ROCm 7.1.1 和不同 AMD 硬件上,不同图像模型的生成时间。

在高端应用领域,Flux 2 在 FP8 精度下参数规模可达约 320 亿。AMD 锐龙 AI Max+ 系统在必要时能够处理这一规模的模型,而 AMD Radeon AI PRO 显卡则能提供显著更快的加速效果。同样,像 WAN 2.2 这样的大型视频模型(约 140 亿 FP8 参数)能够呈现卓越的视觉保真度与动态效果,但渲染时间较长。

由于 ComfyUI 在这两种硬件环境下均运行于 AMD ROCm 7.1.1 之上,团队可以先在便携硬件上进行原型设计,然后再扩展到高性能硬件,而无需更改工具或调整工作流程。 

幻灯片展示了在 ROCm 7.1.1 和不同 AMD 硬件上,不同视频模型的生成时间。

依托 AMD ROCm 7.1.1,ComfyUI 可充分发挥其优势,使创作者根据需求在快速出图和精细打磨之间自由取舍。对工作室和企业而言,这意味着初稿制作、产品演示与视觉创意实验等任务通常可在本地完成,而将工作站的算力资源留给最终的高强度制作任务。

SHO-40:测试数据截至 2025 年 12 月。测试配置包括:集成 ROCm 6.4 的 ComfyUI 便携版 + AMD Software: Adrenalin Edition 驱动程序 25.20.01.14;集成 ROCm 7.1.1 的 ComfyUI 便携版 + AMD Software: Adrenalin Edition 驱动程序 25.20.01.17。所有测试均采用 ComfyUI 提供的官方模板和默认设置。测试平台为 ASUS ROG Flow Z13,配备 AMD 锐龙 AI Max+ 395 处理器、128GB 内存,VGM 设为 64GB。性能可能会有所不同。SHO-40

RPW-507:测试数据截至 2025 年 12 月。测试配置包括:集成 ROCm 6.4 的 ComfyUI 便携版 + AMD Software: Adrenalin Edition 驱动程序 25.20.01.14;集成 ROCm 7.1.1 的 ComfyUI 便携版 + AMD Software: Adrenalin Edition 驱动程序 25.20.01.17。所有测试均采用 ComfyUI 提供的官方模板和默认设置。测试平台为 AMD Radeon AI Pro R9700 + AMD 锐龙 9950X3D,64GB DDR5 RAM,Windows 11 Pro 25H2。性能可能会有所不同。RPW-507

Share:

Article By


Related Blogs