使用AMD显卡搭建深度学习环境

总结 在 linux 系统下基于 ROCm 底层,基本可用,最大的影响是少部分算子性能有问题,其次是现在很多开源项目的量化方案完全基于 CUDA api,比如chatglm-6b,量化层必须在 CUDA 环境下使用。 在 windows 下基于 DirectML 底层,Pytorch 框架下涉及到 **.cuda(),**.to('cuda')等方式写的代码都需要修改 。tensorflow 则没有这个问题,不过现在开源模型用 tensorflow 比较少了。 ROCm 机器学习/深度学习框架的加速实现一般都高度依赖于硬件对应的底层加速方案,英伟达的 CUDA,英特尔的 OpenVINO,各家 NPU 以及加速卡的闭源库,AMD 官方的底层加速框架是 ROCm, 首先尝试了此方案。 打开官网文档,查看 Prerequisite Actions 页面,很遗憾发现我的 6600XT 没在文档里写的确定支持的硬件列表内,不过感觉放弃太快有些不甘心,搜索引擎搜了些关键词,有成功有失败,研究一番后按下面步骤安装(ROCm 只支持linux,我使用了 Ubuntu 20.04,内核版本5.13.0-30-generic): 准备步骤 sudo apt update sudo apt-get install wget gnupg2 sudo usermod -a -G video $LOGNAME sudo usermod -a -G render $LOGNAME echo 'ADD_EXTRA_GROUPS=1' | sudo tee -a /etc/adduser.conf echo 'EXTRA_GROUPS=video' | sudo tee -a /etc/adduser....

2023-04-25 · 390 字 · luokai