<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[Lmstudio gpu使用率過低]]></title><description><![CDATA[<p dir="auto"><img src="https://upload.lcz.me/uploads/f80ee90d-2c78-416e-9f51-d3c53cf7c47c.jpeg" alt="IMG_4975.jpeg" class=" img-fluid img-markdown" /></p>
<p dir="auto">想請教下原因，不知道為什麼運行模型的時候you使用率總是只有一半上下</p>
]]></description><link>https://lcz.me/topic/222/lmstudio-gpu使用率過低</link><generator>RSS for Node</generator><lastBuildDate>Wed, 20 May 2026 05:59:49 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/222.rss" rel="self" type="application/rss+xml"/><pubDate>Tue, 19 May 2026 14:55:31 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to Lmstudio gpu使用率過低 on Tue, 19 May 2026 19:06:29 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E9%99%B3%E7%91%8B" aria-label="Profile: 陳瑋">@<bdi>陳瑋</bdi></a> LM Studio GPU使用率偏低的原因有几种可能，帮你排查一下：</p>
<ol>
<li>
<p dir="auto"><strong>模型没有完全加载到显存</strong> — 在LM Studio的模型设置里，确认 GPU Offload 滑块拉到最右（100%），如果只加载了部分层到GPU，剩下的在CPU跑，GPU使用率就会只有一半。加载后看显存占用是否接近满载。</p>
</li>
<li>
<p dir="auto"><strong>MOE模型（混合专家模型）</strong> — 如果你跑的是 Qwen 3.6 35B A3B 这类 MOE 模型，GPU使用率天然不会到100%，因为每次只激活一部分专家。50%左右的使用率对 MOE 模型来说是正常的。如果你跑的是稠密模型（Dense Model）如 Qwen 3.6 27B 全量，那才应该接近满载。</p>
</li>
<li>
<p dir="auto"><strong>CPU/内存瓶颈</strong> — 如果模型的部分层在CPU上运行（即使设置了GPU Offload但显存不够），CPU推理会成为瓶颈，GPU只能等CPU算完，使用率就上不去。检查任务管理器，看CPU是否满载而GPU在空等。</p>
</li>
<li>
<p dir="auto"><strong>电源/散热限制</strong> — 笔记本或ITX小机箱可能因为温度或功耗墙降频，导致GPU没有全力跑。用 GPU-Z 看 PerfCap Reason 是 Power 还是 Thermal。</p>
</li>
</ol>
<p dir="auto">你跑的是什么模型？显存多大？方便截图看一下 LM Studio 的设置页吗？</p>
]]></description><link>https://lcz.me/post/2683</link><guid isPermaLink="true">https://lcz.me/post/2683</guid><dc:creator><![CDATA[Xiaote]]></dc:creator><pubDate>Tue, 19 May 2026 19:06:29 GMT</pubDate></item><item><title><![CDATA[Reply to Lmstudio gpu使用率過低 on Tue, 19 May 2026 15:08:25 GMT]]></title><description><![CDATA[<p dir="auto">你问下Gemini或者豆包，LM Studio里可以设置设备，你的设备选择Cuda驱动，会刷出设备列表的，默认就是了。</p>
]]></description><link>https://lcz.me/post/2643</link><guid isPermaLink="true">https://lcz.me/post/2643</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Tue, 19 May 2026 15:08:25 GMT</pubDate></item><item><title><![CDATA[Reply to Lmstudio gpu使用率過低 on Tue, 19 May 2026 15:00:07 GMT]]></title><description><![CDATA[<p dir="auto"><img src="https://upload.lcz.me/uploads/0d315599-2cdf-436c-b26b-a09fc420c449.jpeg" alt="0a72e728-d00e-4180-985e-08c2794e54a2-image.jpeg" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/post/2642</link><guid isPermaLink="true">https://lcz.me/post/2642</guid><dc:creator><![CDATA[mark]]></dc:creator><pubDate>Tue, 19 May 2026 15:00:07 GMT</pubDate></item><item><title><![CDATA[Reply to Lmstudio gpu使用率過低 on Tue, 19 May 2026 14:58:27 GMT]]></title><description><![CDATA[<p dir="auto">你跑什么模型?~~~~~ 我也用 LM Studio</p>
]]></description><link>https://lcz.me/post/2639</link><guid isPermaLink="true">https://lcz.me/post/2639</guid><dc:creator><![CDATA[mark]]></dc:creator><pubDate>Tue, 19 May 2026 14:58:27 GMT</pubDate></item></channel></rss>