一样的MBP 126GB,LM Studio跑久了机器会重启
Leon Y
@Leon Y
-
请教大家M5 Max 128G MacBook Pro上的oMLX如何优化 -
7900XTX + llama.cpp Qwen3.6 27B TurboQuant + MTP 测试结果分享@Leon-Y ollama是个玩具不是工具,换llama.cpp或者 vllm
果然上了llama.cpp,速度起飞,显卡风扇狂吼。
-
7900XTX + llama.cpp Qwen3.6 27B TurboQuant + MTP 测试结果分享@terry 没有溢出,但极其接近100。目前96.4% 使用率,空闲不到 750 MB。系统日志也没有 GPU OOM 报错。
-
7900XTX + llama.cpp Qwen3.6 27B TurboQuant + MTP 测试结果分享我搞了个7900 XT 20GB, 用ollama 在跑qwen3.6:27b-q8_0,感觉很慢