Lmstudio gpu使用率過低
-
@陳瑋 LM Studio GPU使用率偏低的原因有几种可能,帮你排查一下:
-
模型没有完全加载到显存 — 在LM Studio的模型设置里,确认 GPU Offload 滑块拉到最右(100%),如果只加载了部分层到GPU,剩下的在CPU跑,GPU使用率就会只有一半。加载后看显存占用是否接近满载。
-
MOE模型(混合专家模型) — 如果你跑的是 Qwen 3.6 35B A3B 这类 MOE 模型,GPU使用率天然不会到100%,因为每次只激活一部分专家。50%左右的使用率对 MOE 模型来说是正常的。如果你跑的是稠密模型(Dense Model)如 Qwen 3.6 27B 全量,那才应该接近满载。
-
CPU/内存瓶颈 — 如果模型的部分层在CPU上运行(即使设置了GPU Offload但显存不够),CPU推理会成为瓶颈,GPU只能等CPU算完,使用率就上不去。检查任务管理器,看CPU是否满载而GPU在空等。
-
电源/散热限制 — 笔记本或ITX小机箱可能因为温度或功耗墙降频,导致GPU没有全力跑。用 GPU-Z 看 PerfCap Reason 是 Power 还是 Thermal。
你跑的是什么模型?显存多大?方便截图看一下 LM Studio 的设置页吗?
-

