@fenky0304 純粹為了興趣
Chan Ivan
-
雙 RX 7900 XTX + Ubuntu 24.04 + ROCm 6.3 實戰報告 -
雙 RX 7900 XTX + Ubuntu 24.04 + ROCm 6.3 實戰報告@David-Zhang 謝謝,這個我做吓研究
-
雙 RX 7900 XTX + Ubuntu 24.04 + ROCm 6.3 實戰報告 -
雙 RX 7900 XTX + Ubuntu 24.04 + ROCm 6.3 實戰報告@terry 遲些會補充的

-
雙 RX 7900 XTX + Ubuntu 24.04 + ROCm 6.3 實戰報告

硬件:
- 主板:HUANANZHI X99-CD3 GAMING(X99)
- CPU:Xeon E5-2666 v3(10C/20T)
- RAM:128GB DDR3 ECC @ 1600
- GPU:2× RX 7900 XTX(PULSE,各 24GB)
- 儲存:NVMe 1.9TB(Win + Ubuntu + Shared)
- OS:Ubuntu 24.04.4 / kernel 6.17.0
軟件:
- ROCm 6.3 / Python 3.12.3
- llama.cpp b9198(自編譯 ROCm)
- ComfyUI + ComfyUI-Manager
- Shell scripts 管理全部操作(~/bin/)
LLM Benchmark(Qwen3.6-27B Q4_K_M):
單卡
• 配置: 單卡
• Context: 8K
• Token Gen: 27.2 t/s
單卡
• 配置: 單卡
• Context: 128K
• Token Gen: 27.0 t/s
雙卡 tensor-split
• 配置: 雙卡 tensor-split
• Context: 8K
• Token Gen: 19.8 t/s
雙卡 tensor-split
• 配置: 雙卡 tensor-split
• Context: 128K
• Token Gen: 21.4 t/s
→ 單卡打贏雙卡 tensor-split!27B Q4_K_M fit 入 24GB VRAM 單卡已經最快。雙卡只係 >64K context 先用得著。
投機解碼:
Qwen3.6 用 M-RoPE,同 llama.cpp 投機解碼唔相容(全部 spec type 失敗,accept rate < 13%)。Skip,27 t/s 已經夠快。ComfyUI 雙 Instance:
兩張卡各一個獨立 ComfyUI(port 8188/8189),systemd 管理自動開機。Flux.1 dev:78.9s(雙 instance)vs 73.4s(tensor-split)
LTX Video:13.5s(雙 instance)vs 22.9s(tensor-split)→ 雙 instance 整體完勝,尤其 LTX 快接近一倍,仲可以同時跑兩個 workflow。
ROCm 6.3 tips:
- 記得 delete blacklist-amdgpu.conf
- 唔使 HSA_OVERRIDE_GFX_VERSION(gfx1100 原生支援)
- tensor-split 用 --tensor-split 24,24(absolute GiB)
- ROCm 6.3 對 RX 7900 XTX 支援完善
-
TERRY 介紹的X99主板搭双7900XTX卡可以嗎? 想先用來跑QWEN跟ComfyUI
-
TERRY 介紹的X99主板搭双7900XTX卡可以嗎? 想先用來跑QWEN跟ComfyUI
AI 據說可以跑70B模型
-
TERRY 介紹的X99主板搭双7900XTX卡可以嗎? 想先用來跑QWEN跟ComfyUI
-
TERRY 介紹的X99主板搭双7900XTX卡可以嗎? 想先用來跑QWEN跟ComfyUI
讓Hermès Agent + deepseek v4 flash 線上版幫我裝
-
TERRY 介紹的X99主板搭双7900XTX卡可以嗎? 想先用來跑QWEN跟ComfyUI
謝謝, 我在弄了
-
TERRY 介紹的X99主板搭双7900XTX卡可以嗎? 想先用來跑QWEN跟ComfyUI打算双7900XTX卡, 128GB DDR3 RAM, 双OS系統 LINUX(搞AI) + WINDOWS (打机, 雖然很少打机). X99主板 1350W电源. 用來跑QWEN跟ComfyUI (LTX2好嗎), 用SG Lang / vLLM / llama.cpp 哪个較好? ROCm 哪個版本 7.X /0 6.X OK?
我一星期前閑魚南山区入了 Mac Mini M4 16GB 用 Hermes, 現在想試用本地模型, 保留 Mac Mini+ Hermes 接去双7900XTX組合用模型可取嗎.技術配置上有啥要注意?