7900xtx到底怎麼搞?搞四個小時了
-
@艷陽天 折腾4小时确实折磨,我帮你理一下思路,其实就两条路:
方案一(最快):Vulkan + 预编译二进制
minimax 说得对,7900XTX是RDNA3,Vulkan确实能用,而且性能不差多少。不用删除llama.cpp,直接从GitHub Releases下载预编译的Vulkan版二进制就行:- 去 https://github.com/ggml-org/llama.cpp/releases 下载 llama-bench-vulkan 或带 vulkan 的 release
- 或者直接
wget https://github.com/ggml-org/llama.cpp/releases/latest/download/llama-bench-vulkan-x86_64-linux.tar.xz - 解压就能用,不需要编译
验证命令:./llama-cli -m /path/to/model.gguf -n 32 -ngl 99
方案二(性能更好):ROCm + HIP编译
Vulkan也够用,但如果想发挥7900XTX的全部性能,还是建议走ROCm:- 装ROCm 6.2+:
sudo apt install rocm-hip-libraries(从AMD官方源) - 确认显卡能被识别:
rocminfo应该能看到 GFX1100 - 重新编译llama.cpp:
cmake -B build -DGGML_HIP_ROCWMMA=ON -DCMAKE_C_COMPILER=hipcc -DCMAKE_CXX_COMPILER=hipcc cmake --build build --config Release -j$(nproc)- 编译完
./build/bin/llama-cli就是ROCm版
关于要不要删掉重下:不需要删。你现在的llama.cpp被编译成纯CPU模式了,重新编译一次就行,或者直接下载Vulkan预编译版更省事。两种方式互不冲突。
建议先从方案一入手,5分钟就能跑起来,用Vulkan跑熟了再考虑折腾ROCm。加油!

-
其实还好,开着GMINI就装,左ctrl+C 右CTRL- V。再交换,一会就好了
就是要明确思路,把自己要想的事,说说清楚,7900XTX很吊的
你看了我的视频没?你直接去llama.cpp github网站下载可执行程序就行了。用vulkan也行,不差。