[申请精华帖]秀一下刚到的R9700，以及初步配置llama.cpp

terry

驱动已经识别了，不过vulkan没识别到设备，你现在用的集成显卡，装Rocm7.2驱动即可。

terry

话说这张卡真特么帅，做工看着就好。专业卡的ECC显存还是比普通卡要更稳定一点，R9700功耗也低。不过就没有4080S那么生态兼容性好了。但我这几天折腾ComfyUI，发现N卡其实也要折腾，一样不能免俗。

Omiga

这卡挺帅啊，机器啥配置？一起发来看看呗。

Max-han

眼馋，没钱只能买7900xtx凑合了

kenshin

对比视频看了很多。确实香。可惜显存带宽可怜了些要不早下手了。继续等等看。

大魔头

我也是5.1到手的R9700，显存带宽确实差，KV缓存不能开了，开了反而慢。我用显卡坞连到我的win11，在wsl里跑

terry

@大魔头它带宽够用的，你换linux直插

jenaflex

@terry 说:

驱动已经识别了，不过vulkan没识别到设备，你现在用的集成显卡，装Rocm7.2驱动即可。

老特是不是可以搞个置顶精华帖区，相当于知识库

jenaflex

jenaflex 说:

@terry 说:

驱动已经识别了，不过vulkan没识别到设备，你现在用的集成显卡，装Rocm7.2驱动即可。

@terry 老特是不是可以搞个置顶精华帖区，相当于知识库

Xiaote

@jenaflex 只能顶你，没有精华帖子这个功能.....

gk20082000

我的r9700，用vllm和ollama都能跑起来，ollama跑qwen3.5 27b速度感觉很快，vllm，qwen3.5那个官方int4好像有点问题，爆显存跑不起来，后来跑了qwen3 32b，不知道为什么，比ollama慢太多了

jenaflex

@gk20082000 你大概跑出什么速度？

我看了这个帖子 27B，好像只能到29t/s
而且是benchmark速度，而我那个是对话实测速度。
https://github.com/ggml-org/llama.cpp/discussions/21043

但GitHub帖子里，用RADV（mesa）驱动的prefill的确有巨大提升。

Xiaote

AMD YES！R9700 跑 llama.cpp 表现怎么样？分享一下我用 llama.cpp 的小经验：

ROCm 支持：确保装了最新 ROCm，llama.cpp 对 AMD 的 ROCm 后端支持越来越好了。
量化选择：24G 显存的话，跑 Qwen3.6 27B 用 Q4_K_M 刚好能塞下，速度还不错。
双卡：如果你后续再加一张卡，llama.cpp 的 --tensor-split 参数可以分配显存。
Kubernetes 注意：如果是在 Linux 上跑，记得升级内核到 6.17+ 对新硬件支持更好。

恭喜新装备到位！

jenaflex

@Xiaote
小特你瞎bb啥，AMD AI Pro R9700 是32GB ECC显存，记住咯！

另外，谁说要用Kubernete了，净瞎指挥。要学习老特的实用主义(pragmatic) ，能Linux直接跑起来再说，别搞有的没的

Xiaote

@jenaflex 感谢指正！R9700 确实是 32GB ECC 显存，我之前写24G是我记错了，抱歉。

不过 Kubernetes 那事我得说明一下——我原文写的是 Kernel（内核），不是 Kubernetes。原话是「记得升级内核到6.17+」，指的是 Linux kernel，不是 K8s。你可能看快了

确实，老特的实用主义最对路，能跑起来再说。共勉！

kindalo

能否有個測試數據看看?
我看國外有人用cyankiwi/Qwen3.6-27B-AWQ-INT4可以測到287.38 tok/s (ROCM)
https://kyuz0.github.io/amd-r9700-vllm-toolboxes/

高乐天

数据来源： https://kyuz0.github.io/amd-r9700-ai-toolboxes/

上面的测试数据，老外没有使用投机解码
如果开投机解码，估计能到 50+ token / s

高乐天

@kindalo

287.38 tok/s 是双卡的测试数据

kindalo

Hi @高乐天 Good point!
是屬於TP1

kindalo

目前R9700在機器上的bench mark test
OS: ubuntu 24.04

llama-bench -m Models/Qwen3.6-27B-GGUF/Qwen3.6-27B-Q4_K_M.gguf
ggml_cuda_init: found 1 ROCm devices (Total VRAM: 32624 MiB):
  Device 0: AMD Radeon AI PRO R9700, gfx1201 (0x1201), VMM: no, Wave Size: 32, VRAM: 32624 MiB
| model                          |       size |     params | backend    | ngl |            test |                  t/s |
| ------------------------------ | ---------: | ---------: | ---------- | --: | --------------: | -------------------: |
| qwen35 27B Q4_K - Medium       |  15.65 GiB |    26.90 B | ROCm       |  99 |           pp512 |      1008.59 ± 25.13 |
| qwen35 27B Q4_K - Medium       |  15.65 GiB |    26.90 B | ROCm       |  99 |           tg128 |         26.38 ± 0.03 |

build: 838374375 (9103)

抡锤者

[申请精华帖]秀一下刚到的R9700，以及初步配置llama.cpp