7900xtx到底怎麼搞？搞四個小時了

艷陽天

抱歉我是小白，我是安装在native Ubuntu 24.04 LTS, 之前的llama.cpp被minimax m2.7指导重新compile成纯CPU模式，现在我装上7900xtx，但一直缺东缺西的，已经搞超过四小时了，要疯了，免费的Claude也干掉两帐号的额度，现在改用minimax继续折腾，谁救救我呀？我可以删除llama.cop重新下载会更快吗？

艷陽天

minimax 再搞了半个小时，现在终于回覆说他成功使用Vulkan跑llama.cpp了，说7900xtx是RDNA3架构，不需要ROCm，他说的对吗？

terry

你看了我的视频没？你直接去llama.cpp github网站下载可执行程序就行了。用vulkan也行，不差。

Xiaote

@艷陽天折腾4小时确实折磨，我帮你理一下思路，其实就两条路：

方案一（最快）：Vulkan + 预编译二进制
minimax 说得对，7900XTX是RDNA3，Vulkan确实能用，而且性能不差多少。不用删除llama.cpp，直接从GitHub Releases下载预编译的Vulkan版二进制就行：

去 https://github.com/ggml-org/llama.cpp/releases 下载 llama-bench-vulkan 或带 vulkan 的 release
或者直接 wget https://github.com/ggml-org/llama.cpp/releases/latest/download/llama-bench-vulkan-x86_64-linux.tar.xz
解压就能用，不需要编译
验证命令：./llama-cli -m /path/to/model.gguf -n 32 -ngl 99

方案二（性能更好）：ROCm + HIP编译
Vulkan也够用，但如果想发挥7900XTX的全部性能，还是建议走ROCm：

装ROCm 6.2+：sudo apt install rocm-hip-libraries（从AMD官方源）
确认显卡能被识别：rocminfo 应该能看到 GFX1100
重新编译llama.cpp：

cmake -B build -DGGML_HIP_ROCWMMA=ON -DCMAKE_C_COMPILER=hipcc -DCMAKE_CXX_COMPILER=hipcc
cmake --build build --config Release -j$(nproc)

编译完 ./build/bin/llama-cli 就是ROCm版

关于要不要删掉重下：不需要删。你现在的llama.cpp被编译成纯CPU模式了，重新编译一次就行，或者直接下载Vulkan预编译版更省事。两种方式互不冲突。

建议先从方案一入手，5分钟就能跑起来，用Vulkan跑熟了再考虑折腾ROCm。加油！

goodhat5405

其实还好，开着GMINI就装，左ctrl+C 右CTRL- V。再交换，一会就好了
就是要明确思路，把自己要想的事，说说清楚，7900XTX很吊的

asd2667

最省心的方案，就是先装一个hermes agent用在线的deepseek flash即可，让agent给你部署，省心省事，告诉他服务器地址，用户名，密码，他自己就能搞定。你现在的困境大部分困在科学上网上。

williamlouis

@艷陽天 DeepSeek flash 就行。5元额度够了。

johnnybegood

@艷陽天 minimax 太差了，很多说的都是错的，建议换成 deepseek 4 flash, 强烈建议。 ps. 我这两个都用，都是会员，我是真实感受。

抡锤者

7900xtx到底怎麼搞？搞四個小時了