京东自营上了5090、6000pro,应该怎么选。
-
@terry 锤兄 你说的Q4KM 是这个https://huggingface.co/unsloth/Qwen3.6-27B-MTP-GGUF/blob/main/Qwen3.6-27B-Q4_K_M.gguf 版本吗?
apex版本 又是哪个版本? 是这个吗 Huihui-Qwen3.6-27B-abliterated-NVFP4-MTP ?
小白 还不太懂

-
@Tony-Wang 是的Q8 KV,可以跑满256k上下文,优化下能跑几个会话,实际上都用128k上下文,多开更合理,hermes 128k体验已经不错了。