AMD x ComfyUI:在 AI PC 上推进专业级生成式 AI
Jan 06, 2026
随着模型规模不断增长,许多创作者的工作流程逐渐迁移到远程云服务。借助 AMD ROCm 7.1.1 及全新的 AMD 一键式 ComfyUI 体验,创作者可以将算力密集型工作迁回到本地设备上,从而更好地掌控成本、数据和迭代速度。阅读更多:ComfyUI 官方发布的 AMD ROCm 支持博客。
基于 AMD ROCm 7.1.1 的 ComfyUI 集成
ComfyUI 已成为高级扩散模型工作流程的控制中心。高阶用户可以设计基于节点的工作流程,尝试前沿模型,并分享能在社区中快速传播的模板。
适用于 Windows 的 ComfyUI 安装程序消除了设置 ComfyUI 时的大部分障碍。它预装了 AMD ROCm 7.1.1,并提供针对主流模型优化的流水线,使用户能够在受支持的 AMD Ryzen AI 系统或基于 AMD Radeon AI 的工作站上,仅需几步即可完成安装并生成首张图像。
在 AMD 平台上安装 ComfyUI 的三种方法
我们很高兴宣布,AMD ROCm 支持现已原生集成到 ComfyUI 中(包括桌面应用)。为满足不同用户的需求,目前在 AMD 硬件上支持三种 ComfyUI 安装方式:
- 官方 Windows .exe 安装程序
基于图形用户界面的简易 Windows 安装程序,可自动处理依赖项与配置,由 AMD ROCm 7.1.1 提供支持。单击此处下载。为获得最佳体验,AMD 推荐使用 AMD 锐龙 AI Max+ 128GB 系统(设置为 64GB VGM)或 AMD Radeon AI Pro R9700(搭配 64GB RAM)。
- 来自 ComfyUI GitHub 库的官方便携版 (Windows)
可下载并解压的便携式归档文件,同样由 AMD ROCm 7.1.1 提供支持,适合需要在不同系统间移动整套文件夹的用户。最新便携版本可直接从 ComfyUI Github 库下载。
- 通过 git 手动设置
对于希望完全掌控安装过程的开发者,仍可选择手动安装 ComfyUI,并搭配 AMD ROCm 每日构建版本,以抢先体验即将发布的功能、更全面的支持与优化。详细说明可在此处找到。
无论选择哪种方式,目标都是一致的:让用户在不牺牲 AMD 平台性能的前提下,自由选择所需的控制级别。
AMD ROCm 7.1.1 为高级模型带来高达 5.4 倍的性能提升
AMD ROCm 7.1.1 在 ROCm 6.4 基础上进一步优化,为 Windows 上的 ComfyUI 带来高达 5.4 倍的性能提升。
除性能提升外,搭配 AMD ROCm 7.1.1 驱动程序(将于后续版本纳入 AMD Software: Adrenalin Edition 驱动程序)时,还带来了全方位的稳定性提升:在采用 AMD Ryzen AI 技术的设备、AMD Radeon 及 Radeon AI PRO GPU 上实现更一致的使用体验,持续优化对 FP16、BF16、FP8 等混合精度格式的支持,并改进了内存管理机制。
对用户而言,这些技术改进体现为更快的渲染速度、更少的崩溃,以及在不同设备间更加轻松顺畅的工作流程迁移。此次发布标志着 AMD x ComfyUI 体验(Beta 版)首次上线,未来还将推出更多性能和稳定性改进。
现代出色画质需要前沿模型的支撑
视觉效果本身,就在讲述一段重要的技术演进历程。早期(如今已过时)的扩散模型,如约 9 亿参数的 Stable Diffusion 1.5,虽然在 AMD 锐龙 AI Max+ 系统上只需几秒即可生成图像,但图像质量难以满足专业场景的需求。人脸常常扭曲变形,手部、文字或结构等精细细节也模糊不清。这些模型在当时令人印象深刻,但远未达到真正的照片级画质。
如今,创作者的期望更高。新一代模型(如约 60 亿参数的 Z Image Turbo),能够生成光影真实、纹理清晰、结构自然、文字清晰准确的画面。天空富有层次,肤色自然真实,反光或织物褶皱等微小细节都经得起细看推敲。
在高端应用领域,Flux 2 在 FP8 精度下参数规模可达约 320 亿。AMD 锐龙 AI Max+ 系统在必要时能够处理这一规模的模型,而 AMD Radeon AI PRO 显卡则能提供显著更快的加速效果。同样,像 WAN 2.2 这样的大型视频模型(约 140 亿 FP8 参数)能够呈现卓越的视觉保真度与动态效果,但渲染时间较长。
由于 ComfyUI 在这两种硬件环境下均运行于 AMD ROCm 7.1.1 之上,团队可以先在便携硬件上进行原型设计,然后再扩展到高性能硬件,而无需更改工具或调整工作流程。
依托 AMD ROCm 7.1.1,ComfyUI 可充分发挥其优势,使创作者根据需求在快速出图和精细打磨之间自由取舍。对工作室和企业而言,这意味着初稿制作、产品演示与视觉创意实验等任务通常可在本地完成,而将工作站的算力资源留给最终的高强度制作任务。
SHO-40:测试数据截至 2025 年 12 月。测试配置包括:集成 ROCm 6.4 的 ComfyUI 便携版 + AMD Software: Adrenalin Edition 驱动程序 25.20.01.14;集成 ROCm 7.1.1 的 ComfyUI 便携版 + AMD Software: Adrenalin Edition 驱动程序 25.20.01.17。所有测试均采用 ComfyUI 提供的官方模板和默认设置。测试平台为 ASUS ROG Flow Z13,配备 AMD 锐龙 AI Max+ 395 处理器、128GB 内存,VGM 设为 64GB。性能可能会有所不同。SHO-40
RPW-507:测试数据截至 2025 年 12 月。测试配置包括:集成 ROCm 6.4 的 ComfyUI 便携版 + AMD Software: Adrenalin Edition 驱动程序 25.20.01.14;集成 ROCm 7.1.1 的 ComfyUI 便携版 + AMD Software: Adrenalin Edition 驱动程序 25.20.01.17。所有测试均采用 ComfyUI 提供的官方模板和默认设置。测试平台为 AMD Radeon AI Pro R9700 + AMD 锐龙 9950X3D,64GB DDR5 RAM,Windows 11 Pro 25H2。性能可能会有所不同。RPW-507