<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s]]></title><description><![CDATA[<p dir="auto">看着兄弟的3090 生产力 丝滑起飞，我的在地上爬，心中满是羡慕，求大佬指点！</p>
<hr />
<p dir="auto">先介绍环境：<br />
CPU 5700X<br />
GPU 3090 24G<br />
内存64G<br />
win10系统</p>
<hr />
<p dir="auto">本地模型相关</p>
<hr />
<p dir="auto">model:Qwen3.6-27B-NEO-CODE-HERE-2T-OT-Q4_K_M.gguf</p>
<hr />
<p dir="auto">@echo off<br />
chcp 65001 &gt;nul<br />
title Qwen3.6-27B-UD RTX3090 Optimized Launcher</p>
<p dir="auto">:: ================= 配置区 =================<br />
:: 请将下方路径修改为你电脑上实际的模型文件路径<br />
set MODEL_PATH=J:\llama-b9370-bin-win-cuda-12.4-x64\models\1\Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved-Q4_K_M.gguf</p>
<p dir="auto">:: 如果你有对应的多模态视觉文件(mmproj)，可以在下方取消注释并填写路径；没有则保持注释<br />
set MMPROJ_PATH=J:\llama-b9370-bin-win-cuda-12.4-x64\models\1\Qwen3.6-27B-mmproj-BF16.gguf<br />
:: ==========================================</p>
<p dir="auto">echo ========================================<br />
echo   Qwen3.6-27B-UD  RTX 3090 启动中...<br />
echo ========================================</p>
<p dir="auto">:: 启动 llama.cpp (假设 llama-server.exe 或 main.exe 在当前目录下，如果不在请写绝对路径)<br />
.\llama-server.exe ^<br />
--model "%MODEL_PATH%" ^<br />
-ngl 99 ^<br />
-c 131072 ^<br />
-n 8192 ^<br />
-fa on^<br />
--port 8080 ^<br />
--host 0.0.0.0  ^<br />
--image-min-tokens 1024 ^<br />
--batch-size 512 ^<br />
--ubatch-size 256 ^<br />
--spec-type draft-mtp ^<br />
--spec-draft-n-max 2<br />
--cache-type-k q4_0 ^<br />
--cache-type-v q4_0 ^<br />
--jinja --chat-template-file chat_template.jinja ^<br />
--timeout 3600 ^<br />
--jinja  ^<br />
--temp 0.6 ^<br />
--top-p 0.95 ^<br />
--top-k 20 ^<br />
--min-p 0.05 ^<br />
--repeat-penalty 1.05</p>
<hr />
<p dir="auto">终端测是codex桌面版</p>
<hr />
<p dir="auto">使用codex编制一个小程序，实际速率如截图<br />
<img src="https://upload.lcz.me/uploads/09377e25-89b1-4327-b599-2bdb31b50851.jpeg" alt="4a3ee1f6-3478-4846-b623-bcd01eee268b-image.jpeg" class=" img-fluid img-markdown" /><br />
<img src="https://upload.lcz.me/uploads/448deae7-21ea-4cdf-a12c-99e4c737ce83.jpeg" alt="d0c642bc-2195-40b7-8b5e-eab9c3c817fc-image.jpeg" class=" img-fluid img-markdown" /><br />
<img src="https://upload.lcz.me/uploads/ce5f5d5b-d549-4376-a869-95929230e1de.jpeg" alt="8ce4138b-0978-4934-bf52-fce5b2ff78b3-image.jpeg" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/topic/451/求教-为什么我的3090跑qwen3.6-27b-没有丝滑感-搭配codex编程只有不到30tokey-s</link><generator>RSS for Node</generator><lastBuildDate>Thu, 11 Jun 2026 14:59:25 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/451.rss" rel="self" type="application/rss+xml"/><pubDate>Sat, 06 Jun 2026 12:29:28 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sun, 07 Jun 2026 12:31:54 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/stxpnet" aria-label="Profile: stxpnet">@<bdi>stxpnet</bdi></a> 感谢提醒。马上设置</p>
]]></description><link>https://lcz.me/post/5498</link><guid isPermaLink="true">https://lcz.me/post/5498</guid><dc:creator><![CDATA[毅袁]]></dc:creator><pubDate>Sun, 07 Jun 2026 12:31:54 GMT</pubDate></item><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sun, 07 Jun 2026 11:12:03 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/566656661" aria-label="Profile: 566656661">@<bdi>566656661</bdi></a> <a href="/post/5477">说</a>:</p>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/stxpnet" aria-label="Profile: stxpnet">@<bdi>stxpnet</bdi></a></p>
<p dir="auto">你可以進取點限制到250w</p>
<p dir="auto">Reddit上很多人都是250w, 大約有原功耗92%的效能</p>
<p dir="auto">原文</p>
<pre><code>so i actually benchmarked it. qwen 27B q5_k_n via llama.cpp, same prompt 10x at each PL setting, took the median. got this:

350W stock: 38.4 t/s
300W: 37.1 t/s
280W: 36.2 t/s
250W: 35.4 t/s
220W: 32.8 t/s
</code></pre>
<p dir="auto">真正開始出現斷崖下跌只有在220w之後</p>
<p dir="auto"><a href="https://www.reddit.com/r/LocalLLM/s/3Wzgbgx5vn" rel="nofollow ugc">原文連結</a></p>
</blockquote>
<p dir="auto">我限制了230-240 因为240 可以压在70度上下</p>
]]></description><link>https://lcz.me/post/5482</link><guid isPermaLink="true">https://lcz.me/post/5482</guid><dc:creator><![CDATA[applejuice]]></dc:creator><pubDate>Sun, 07 Jun 2026 11:12:03 GMT</pubDate></item><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sun, 07 Jun 2026 10:47:24 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/stxpnet" aria-label="Profile: stxpnet">@<bdi>stxpnet</bdi></a></p>
<p dir="auto">你可以進取點限制到250w</p>
<p dir="auto">Reddit上很多人都是250w, 大約有原功耗92%的效能</p>
<p dir="auto">原文</p>
<pre><code>so i actually benchmarked it. qwen 27B q5_k_n via llama.cpp, same prompt 10x at each PL setting, took the median. got this:

350W stock: 38.4 t/s
300W: 37.1 t/s
280W: 36.2 t/s
250W: 35.4 t/s
220W: 32.8 t/s
</code></pre>
<p dir="auto">真正開始出現斷崖下跌只有在220w之後</p>
<p dir="auto"><a href="https://www.reddit.com/r/LocalLLM/s/3Wzgbgx5vn" rel="nofollow ugc">原文連結</a></p>
]]></description><link>https://lcz.me/post/5477</link><guid isPermaLink="true">https://lcz.me/post/5477</guid><dc:creator><![CDATA[566656661]]></dc:creator><pubDate>Sun, 07 Jun 2026 10:47:24 GMT</pubDate></item><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sun, 07 Jun 2026 10:34:15 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E6%AF%85%E8%A2%81" aria-label="Profile: 毅袁">@<bdi>毅袁</bdi></a> 对了，两个点，1. 你的功率设置可能有点高，注意安全，我的卡也是最大390W，但我现在都是习惯开机后使用 sudo nvidia-smi -pl 320 将最大功率限制在320瓦，并且我在UBUNTU内安装了风扇调节软件，空载的时候就是60%左右的风速，风扇坏了大不了换，核芯烧了就麻烦了。  2.温度可能过高我满载推理的时候也不会超过65度。 你的都75度。  根据 我的经验,NV的卡，在接近80的时候，推理速度会暴降，因为核心为了保存自身，会将计算频率或显存频率都压到最低。 好多地方都提到温度长期高于 80可能对核心造成物理损害。</p>
]]></description><link>https://lcz.me/post/5474</link><guid isPermaLink="true">https://lcz.me/post/5474</guid><dc:creator><![CDATA[stxpnet]]></dc:creator><pubDate>Sun, 07 Jun 2026 10:34:15 GMT</pubDate></item><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sun, 07 Jun 2026 10:18:09 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/john8686" aria-label="Profile: John8686">@<bdi>John8686</bdi></a></p>
<p dir="auto">可是一論編程實戰, 35BA3B在大約60到80K長度就會開始很容易偏離計畫跟出幻覺, 27B至少還能跟著繼續下去跑到120K左右, 個人覺得能到150K才會出現注意力潰散</p>
<p dir="auto">注意這只是我自己習慣的模型上下文長度, 我個人用模型習慣只會用到總長度的一半</p>
<p dir="auto">不過日常Agent應該也不會跑到這麼長就是了, 編程等專業用途的話就算是家常便飯吧</p>
]]></description><link>https://lcz.me/post/5470</link><guid isPermaLink="true">https://lcz.me/post/5470</guid><dc:creator><![CDATA[566656661]]></dc:creator><pubDate>Sun, 07 Jun 2026 10:18:09 GMT</pubDate></item><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sun, 07 Jun 2026 09:39:40 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/566656661" aria-label="Profile: 566656661">@<bdi>566656661</bdi></a> 实测35BA3B不弱，安排他写打砖块游戏，一次就通，表现比27b还要好，27b需要debug之后才通。</p>
]]></description><link>https://lcz.me/post/5466</link><guid isPermaLink="true">https://lcz.me/post/5466</guid><dc:creator><![CDATA[John8686]]></dc:creator><pubDate>Sun, 07 Jun 2026 09:39:40 GMT</pubDate></item><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sat, 06 Jun 2026 23:57:06 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/stxpnet" aria-label="Profile: stxpnet">@<bdi>stxpnet</bdi></a></p>
<p dir="auto">Qwen3.6 35BA3B不適合拿來編程, 只能拿來日常對話跟RAG的</p>
<p dir="auto">3B的Activation還是比不過27B的dense模型啊</p>
]]></description><link>https://lcz.me/post/5410</link><guid isPermaLink="true">https://lcz.me/post/5410</guid><dc:creator><![CDATA[566656661]]></dc:creator><pubDate>Sat, 06 Jun 2026 23:57:06 GMT</pubDate></item><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sat, 06 Jun 2026 16:47:15 GMT]]></title><description><![CDATA[<p dir="auto">要用带MTP的，参数也要开启MTP草稿，温度适当调低，编程可以到60T/S左右。我的也是3090 24G，Q4的模型和KV CACHE对智商和精度都有伤害，但是没有办法，REDDIT上有大神测过，他说写代码最好的是UNSLOTH的UD4 那个模型。 大概200K上下文吧。我是按 <a href="http://github.com/noonghunna/club-3090" rel="nofollow ugc">github.com/noonghunna/club-3090</a> 这个大神的菜谱直接弄的。  一般简单的代码要改2-3遍才可以到基本能用的地步。  我目前在转投QWEN 35B A3B了。 我想使用QWEN 35B A3B Q6的试试。 千问这些模型 好是好，但是我总觉得体积大都用在文学上面了。问它名著它倒背如流，结果编程就弱了。。。 唉。</p>
]]></description><link>https://lcz.me/post/5401</link><guid isPermaLink="true">https://lcz.me/post/5401</guid><dc:creator><![CDATA[stxpnet]]></dc:creator><pubDate>Sat, 06 Jun 2026 16:47:15 GMT</pubDate></item><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sat, 06 Jun 2026 16:14:27 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E6%AF%85%E8%A2%81" aria-label="Profile: 毅袁">@<bdi>毅袁</bdi></a> 31 T/s 已经很不错了，从之前个位数翻上来了！还有几个优化空间可以再提一提：</p>
<ol>
<li>
<p dir="auto"><strong>Flash Attention（--flash-attn）</strong>：这是最有效的优化之一，对于 Qwen3.6 27B 在 3090 上可以再提升 5-10% 的生成速度。加上后 KV cache 占用也会小一些。</p>
</li>
<li>
<p dir="auto"><strong>KV cache 量化（-ctk q8_0 -ctv q8_0）</strong>：如果你不需要超高精度，把 key/value cache 降到 q8_0 可以节省约 2GB 显存，给 context 留更多空间。</p>
</li>
<li>
<p dir="auto"><strong>线程数（-t）</strong>：5700X 是 8C16T，可以试 --threads 8 或 --threads 12，不需要全给 16，有时候线程太多反而有调度开销。</p>
</li>
<li>
<p dir="auto"><strong>如果还想进一步压低显存</strong>：试试 Q4_K_S 甚至 IQ4_XS 量化。27B Q4_K_S ≈ 16GB，比 Q4_K_M 省 1-2GB，速度还能快一丁点，质量差异基本看不出。</p>
</li>
<li>
<p dir="auto"><strong>--no-mmap</strong>：如果内存紧张，开这个让模型完全常驻显存，避免 CPU-GPU 反复换页。</p>
</li>
</ol>
<p dir="auto">总结：最推荐的组合是先加 --flash-attn，然后把 kv cache 量化到 q8_0，应该能到 35 T/s+，同时在 24G 显存里跑 32K context 压力更小。</p>
]]></description><link>https://lcz.me/post/5399</link><guid isPermaLink="true">https://lcz.me/post/5399</guid><dc:creator><![CDATA[Xiaote]]></dc:creator><pubDate>Sat, 06 Jun 2026 16:14:27 GMT</pubDate></item><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sat, 06 Jun 2026 13:40:16 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E6%AF%85%E8%A2%81" aria-label="Profile: 毅袁">@<bdi>毅袁</bdi></a>  看我的帖子了解一下速度：  <a href="https://lcz.me/topic/273/%E7%BB%8F%E9%AA%8C%E5%88%86%E4%BA%AB-%E6%B1%82%E5%8A%A9-%E5%8F%8C%E5%8D%A1-3090-3070-%E6%B7%B7%E6%8F%92-windows-vs-ubuntu-%E8%B7%91-qwen-ltx-video-%E6%80%A7%E8%83%BD%E5%AE%9E%E6%B5%8B/16">https://lcz.me/topic/273/经验分享-求助-双卡-3090-3070-混插-windows-vs-ubuntu-跑-qwen-ltx-video-性能实测/16</a></p>
]]></description><link>https://lcz.me/post/5372</link><guid isPermaLink="true">https://lcz.me/post/5372</guid><dc:creator><![CDATA[johnnybegood]]></dc:creator><pubDate>Sat, 06 Jun 2026 13:40:16 GMT</pubDate></item><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sat, 06 Jun 2026 13:23:58 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/xiaote" aria-label="Profile: Xiaote">@<bdi>Xiaote</bdi></a> 提升到31 T/s左右了，还有提升潜力吗？<br />
<img src="https://upload.lcz.me/uploads/1512bca4-4345-4c50-af00-66bc2929a0f5.jpeg" alt="b384ebcd-f2d4-43eb-8759-6c1ee620c400-image.jpeg" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/post/5371</link><guid isPermaLink="true">https://lcz.me/post/5371</guid><dc:creator><![CDATA[毅袁]]></dc:creator><pubDate>Sat, 06 Jun 2026 13:23:58 GMT</pubDate></item><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sat, 06 Jun 2026 13:15:15 GMT]]></title><description><![CDATA[<p dir="auto">我使用128K时，看gpu内存好像还挺稳定的，以为显存没有压力呢<br />
<img src="https://upload.lcz.me/uploads/2f3ca4f7-c1b8-47a6-a518-32155df5f19e.jpeg" alt="1ebb9ffd-fbcb-4bcb-8307-d054c3eaeb24-image.jpeg" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/post/5370</link><guid isPermaLink="true">https://lcz.me/post/5370</guid><dc:creator><![CDATA[毅袁]]></dc:creator><pubDate>Sat, 06 Jun 2026 13:15:15 GMT</pubDate></item><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sat, 06 Jun 2026 13:12:50 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/xiaote" aria-label="Profile: Xiaote">@<bdi>Xiaote</bdi></a> 好，我马上试一下</p>
]]></description><link>https://lcz.me/post/5368</link><guid isPermaLink="true">https://lcz.me/post/5368</guid><dc:creator><![CDATA[毅袁]]></dc:creator><pubDate>Sat, 06 Jun 2026 13:12:50 GMT</pubDate></item><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sat, 06 Jun 2026 13:04:39 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E6%AF%85%E8%A2%81" aria-label="Profile: 毅袁">@<bdi>毅袁</bdi></a> 看了你的启动参数，问题出在 context size 上。你用 <code>--ctx-size 131072</code>（128K）跑 Qwen3.6 27B Q4_K_M，这个搭配在 24GB 的 3090 上是跑不动的：</p>
<ul>
<li>模型本身（27B Q4_K_M）≈ 17-18GB</li>
<li>128K context 的 KV cache（Q4_0量化）≈ 7-8GB</li>
<li>合计 ~25-26GB，超过 24GB 显存</li>
</ul>
<p dir="auto">超出的部分会回落到系统内存，速度会掉到个位数 tok/s，这就是你感觉不丝滑的原因。</p>
<p dir="auto"><strong>建议试试：</strong></p>
<ol>
<li>先降 context size 到 <code>--ctx-size 32768</code>（32K），对 Codex 编程来说完全够用了</li>
<li>如果还想保留 128K，考虑换成 Q3_K_M 或者 IQ4_NL 量化，模型体积能再省 2-3GB</li>
<li>或者换 14B/15B 的模型（比如 Qwen3.6 15B Q4_K_M），在 3090 上跑 128K 毫无压力</li>
</ol>
<p dir="auto">贴一下我的 3090 推荐启动参数：</p>
<pre><code>--ctx-size 32768 -ngl 99 --flash-attn on
--cache-type-k q4_0 --cache-type-v q4_0
--batch-size 512 --ubatch-size 256
</code></pre>
<p dir="auto">这个配置下 27B Q4_K_M 可以全在显存里，编程助手体验很流畅。</p>
]]></description><link>https://lcz.me/post/5363</link><guid isPermaLink="true">https://lcz.me/post/5363</guid><dc:creator><![CDATA[Xiaote]]></dc:creator><pubDate>Sat, 06 Jun 2026 13:04:39 GMT</pubDate></item><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sat, 06 Jun 2026 12:50:36 GMT]]></title><description><![CDATA[<p dir="auto">不好意思，一着急，启动参数贴错了<br />
@echo off<br />
chcp 65001 &gt;nul<br />
title Qwen3.6-27B-UD RTX3090 Optimized Launcher</p>
<p dir="auto">:: ================= 配置区 =================<br />
:: 请将下方路径修改为你电脑上实际的模型文件路径<br />
set MODEL_PATH=J:\llama-b9370-bin-win-cuda-12.4-x64\models\2\Qwen3.6-27B-NEO-CODE-HERE-2T-OT-Q4_K_M.gguf</p>
<p dir="auto">:: 如果你有对应的多模态视觉文件(mmproj)，可以在下方取消注释并填写路径；没有则保持注释<br />
set MMPROJ_PATH=J:\llama-b9370-bin-win-cuda-12.4-x64\models\2\mmproj-F16.gguf<br />
:: ==========================================</p>
<p dir="auto">echo ========================================<br />
echo   Qwen3.6-27B-UD  RTX 3090 启动中...<br />
echo ==========================================</p>
<p dir="auto">:: 启动 llama.cpp (假设 llama-server.exe 或 main.exe 在当前目录下，如果不在请写绝对路径)<br />
.\llama-server.exe ^<br />
--model "%MODEL_PATH%" ^<br />
--ctx-size 131072 ^<br />
--gpu-layers 99 ^<br />
--parallel 1 ^<br />
--temp 0.8 ^<br />
--top-p 0.95 ^<br />
--top-k 20 ^<br />
--cache-type-k q4_0 ^<br />
--cache-type-v q4_0 ^<br />
--flash-attn on ^<br />
--timeout 3600 ^<br />
--repeat-penalty 1.2 ^<br />
--jinja --chat-template-file chat_template.jinja ^<br />
--port 8080 ^<br />
--host 0.0.0.0</p>
<p dir="auto">pause</p>
]]></description><link>https://lcz.me/post/5358</link><guid isPermaLink="true">https://lcz.me/post/5358</guid><dc:creator><![CDATA[毅袁]]></dc:creator><pubDate>Sat, 06 Jun 2026 12:50:36 GMT</pubDate></item><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sat, 06 Jun 2026 12:40:44 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 收到，下次一定注意。感谢老大帮忙斧正。</p>
]]></description><link>https://lcz.me/post/5357</link><guid isPermaLink="true">https://lcz.me/post/5357</guid><dc:creator><![CDATA[毅袁]]></dc:creator><pubDate>Sat, 06 Jun 2026 12:40:44 GMT</pubDate></item><item><title><![CDATA[Reply to 求教，为什么我的3090跑Qwen3.6 27B，没有丝滑感，搭配codex编程只有不到30tokey&#x2F;s on Sat, 06 Jun 2026 12:37:03 GMT]]></title><description><![CDATA[<p dir="auto">下次发帖检查下格式，发给AI整理成Markdown格式，不然字体粗大，不好阅读，也会影响其他人为你解答的热情。</p>
]]></description><link>https://lcz.me/post/5356</link><guid isPermaLink="true">https://lcz.me/post/5356</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sat, 06 Jun 2026 12:37:03 GMT</pubDate></item></channel></rss>