一、ROCm 加持出图效率翻倍!AMD RX 7900 XT Linux 系统 AI 性能体验
ROCm:一个可移植 、高性能的 GPU 计算平台
随着 AI 时代的来临,显卡的作用不再仅仅只局限于游戏 ,特别是在 Stable Diffusion 火爆全网之后,越来越多的玩家将显卡当成 AIGC 生产力工具。
只不过,Stable Diffusion 的早期版本对 AMD 显卡支持不太友好,给大家造成了只有 N 卡才适合玩 AI 的错觉 。
可能很多同学不知道的是 ,AMD 的 Radeon GPU 也是能够做深度学习的,而且性能也并不差。
去年 12 月份,AMD 推出的 ROCm 6.0 开发平台进一步优化了 RX 7000 系列显卡的 AI 性能 ,特别是 Stable Diffusion 的出图效率更是获得了翻倍提升。
这里先解释一下什么是 AMD ROCm!
ROCm (Radeon Open Compute Platform )是 AMD 基于开源项目的 GPU 计算生态系统,类似于 NVIDIA 的 CUDA。
ROCm 支持多种编程语言、编译器、库和工具,以加速科学计算、自动驾驶 、人工智能和机器学习等领域的应用 。
ROCm 还支持多种加速器厂商和架构 ,提供了开放的可移植性和互操作性。
目前深度学习开发一般都是使用 Python 的,而大数据平台往往都会部署在 Linux 操作系统之上,因此 ,AMD ROCm 目前主要精力放在 Linux 系统上,Windows 端则还有待完善。
得益于双发射设计的流处理器单元,RX 7900 XT 仅凭 5376 个流处理器就达到了 55.4TFOPS 的单精度浮点运算性能 ,而拥有 10240 个流处理器的 RTX 4080 Super 浮点性能同样也是 55TFOPS 。
至于 RX 7900 XTX,其单精度浮点性能则接近 60TFOPS。
Stable Diffusion 主要依赖 GPU 的单精度浮点性能以及显存容量与带宽,这两方面 RX 7900 XT 都不逊于 RTX 4080 SUPER,甚至显存容量还更大一些。
现在有了 AMD ROCm 6.0 的加持 ,终于可以发挥出这张顶级显卡的强大的 AI 算力 。
二、Stable Diffusion 出图速度对比:Linux 系统下出图效率近乎翻倍
测试平台如下:
本次我们主要对比 RX 7900 XT/XTX 在 Ubuntu 与 windows 系统下的出图效率,看看 AMD ROCm 到底能带来多大提升。
1、RX 7900 XT 对比测试
首先是 Windows 11 系统,打开 Stable Diffusion 之后 ,我们设置 DPN++ 2M Karras 采样 、迭代步数 50、Euler a 采样、1024x768 分辨率 、CFG 为 7、总批次 10,单批数量 1。
在 Windows 系统下,RX 7900 XT 基于 DirectML 加速模式生成 10 张图共计耗时 9 分 51 秒 ,也就是 591 秒 。
进入 Ubuntu 22.04.3 LTS 系统,设置好 ROCm 之后,同样的参数与模型生成 10 张图只用掉了 5 分 05 秒 ,即 305 秒。
对比之下,在 Ubuntu 22.04.3 LTS 系统下,RX 7900 XT 的出图效率相比 Windows 系统高了足足 94%。
2、RX 7900 XTX 对比测试
使用同样的参数来测试 RX 7900 XTX 显卡 。
在 Windows 系统下 ,RX 7900 XTX 基于 DirectML 加速模式生成 10 张图总计耗时 9 分 18 秒,也就是 558 秒。
进入 Ubuntu 22.04.3 LTS 系统,设置好 ROCm 之后,同样的参数与模型生成 10 张图只用掉了 4 分 45 秒 ,即 285 秒。
在 Ubuntu 22.04.3 LTS 系统下,RX 7900 XTX 的出图效率相比 Windows 系统领先了 96%,也就是近乎翻倍的性能提升。
三 、小结:高性价比的 AIGC 显卡
目前一张非公 RX 7900 XT 售价在 5299 元左右 ,对位的非公 RTX 4080 Super 售价则是 8599 元,N 卡贵了 60% 。其实在游戏性能方面,这两款显卡并没有太大差距。
现在 AMD 也意识到了 AI 应用对于 GPU 的重要性 ,加大了对 AMD ROCm 平台的投入,经过不断的更新,如今 AMD ROCm 6.0 在 AI 算力方面的提升早已超出了大多数玩家的预知。
在我们的测试中 ,RX 7900 XT 在 Linux 系统下使用 Stable Diffusion ROCm 6.0 版时,其出图效率几乎是 Windows 系统的 2 倍 。再加上 55TFOPS 的单精度浮点运算性能以及 20GB GDDR6X 超大容量显存,对于有较高专业 AIGC 应用需求的专业用户而言 ,在有限的预算下,RX 7900 XT 可以说是非常适合的选择。
当然,也希望 AMD 能够继续优化 ROCm 在 Windows 系统下的性能表现,让更多的 AMD 用户能拥有自己的高性价比 AIGC 显卡。
【本文结束】如需转载请务必注明出处:快科技
责任编辑:流云
评论列表
内容丰富,引人深思,值得一读。
内容丰富,引人深思。
这部作品,实至名归。
内容深刻,引人深思。
内容丰富,值得一读。
内容丰富,引人深思,值得一读。