7900XTX + llama.cpp Qwen3.6 27B TurboQuant + MTP 测试结果分享
-
-
@Leon-Y ollama是个玩具不是工具,换llama.cpp或者 vllm
-
@Leon-Y ollama是个玩具不是工具,换llama.cpp或者 vllm
-
系统 取消固定了该主题
-
T terry 固定了该主题
-
感謝大神分享!好人一生平安
-
张 张鑫磊 被引用 于这个主题
-
此配置经测试(Hermes跑大任务),24G的显存 容易爆OOM
所以改为了
--ctx-size 65536
--batch-size 512
--ubatch-size 128 \ -
@david-zhang Qwen3.6-27B-Q4_K_M-mtp.gguf这个是不是只有huggingface上有modelscope上找不到
-

有,但是huggingface会更多 -
系统 取消固定了该主题