請益 : 7900xtx llama.cpp 用 vulkan 還是 ROCm
-
如題,版主yt幾次提到 7900xtx跑 llamacpp 好像都是用 ROCm,想知道 vulkan 是否更好?
用途 : hermess agent 跑 qwen 3.6。原本都用 claude code ,但之後 20美訂閱好像要拿掉 claude code 了想找 opencode hermess agent 或是 open claude code做替代,目前還只做簡單測試,因為開發虛擬機在win11 pro 的 hyper-v上。目前只有用windwos 的 ollama跑 qwen 3.6:27n 跑起來也有 30tk/s。後續想知道有沒有需要換到 linux server。 -
如題,版主yt幾次提到 7900xtx跑 llamacpp 好像都是用 ROCm,想知道 vulkan 是否更好?
用途 : hermess agent 跑 qwen 3.6。原本都用 claude code ,但之後 20美訂閱好像要拿掉 claude code 了想找 opencode hermess agent 或是 open claude code做替代,目前還只做簡單測試,因為開發虛擬機在win11 pro 的 hyper-v上。目前只有用windwos 的 ollama跑 qwen 3.6:27n 跑起來也有 30tk/s。後續想知道有沒有需要換到 linux server。 -
同主題,想問 我也是7900XTX 24G因為放家裡電腦使用win11, wsl2 ,llama.cpp跑起來26t/s請問這樣速度算還可以嗎?
-
同主題,想問 我也是7900XTX 24G因為放家裡電腦使用win11, wsl2 ,llama.cpp跑起來26t/s請問這樣速度算還可以嗎?
@CHIA-AN-YANG 差不多,没问题,ubuntu下也就是25-30
-
同主題,想問 我也是7900XTX 24G因為放家裡電腦使用win11, wsl2 ,llama.cpp跑起來26t/s請問這樣速度算還可以嗎?
@CHIA-AN-YANG 我 7900xt 20G,Windows11 下直接lm studio,rcom,qwen 3.5 或3.6 27b q4km,20k上下文,kv缓存q8,大约23-24 tokens/s
-
謝謝兩位大神回復