<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[实测Hermes + Qwen3.6 27B 使用Qwen-Fixed-Chat-Templates大幅提高缓存命中率]]></title><description><![CDATA[<h3>主机：</h3>
<ul>
<li>AMD 7900XTX 24G （Vulkan驱动）</li>
<li>AMD 9600x + 32G内存</li>
<li>llama.cpp version: 9293 (1acee6bf8) + Hermes Agent v0.14.0 (2026.5.16)</li>
</ul>
<h3>llama.cpp 启动参数：</h3>
<pre><code>~/llama.cpp/build/bin/llama-server -m models/Qwen/MTP/Qwen3.6-27B-Q4_K_M.gguf \
--spec-type draft-mtp --spec-draft-n-max 3 \
--flash-attn --n-gpu-layers 99 on --threads 6 --parallel 1 \
-ctk q8_0 -ctv q4_0 --ctx-size 96000 \
-b 3072 -ub 1024 --no-warmup --no-mmap \
--host 0.0.0.0 --port 8080 \
--reasoning off --jinja --chat-template-file models/Qwen/chat_template.jinja
</code></pre>
<p dir="auto">MTP加持下，本地跑 Qwen3.6-27B-Q4_K_M 速度50+tokens/s，搭配hermes很够用。但是每聊那么几句，控制台总是输出上下文缓存不命中的信息，类似：</p>
<pre><code>17.27.663.317 W slot update_slots: id  0 | task 2894 | forcing full prompt re-processing due to lack of cache data (likely due to SWA or hybrid/recurrent memory, see https://github.com/ggm-org/llama.cpp/pull/13194#issuecomment-2868343055)                                                                                                                                         
17.27.663.319 W slot update_slots: id  0 | task 2894 | erased invalidated context checkpoint (pos_min = 51198, pos_max = 51198, n_tokens = 51199, n_swa = 0, pos_next = 0, size = 231.851 MiB)
......
</code></pre>
<p dir="auto">然后就是缓慢的 prompt processing 和 created context checkpoint 过程。持续几十秒到几分钟不等，显卡风扇呼呼转。 聊得越久，context越大，出现得越频繁。这种情况非常影响思路连贯性，乃至情绪。研究了几个晚上，问遍国内外AI模型，尝试了各种参数组合，都不得其果。</p>
<p dir="auto">昨天意外刷到了 Qwen-Fixed-Chat-Templates 的介绍，一番试用后，发现效果明显，聊了近一个小时，反复网络搜索+工具调用，缓存不命中的情况只出现个位数次数。感觉流畅很多，不敢独享，记录下来，希望对遇到类似问题的朋友有用。</p>
<p dir="auto">特别感谢 <a href="https://huggingface.co/froggeric/Qwen-Fixed-Chat-Templates" rel="nofollow ugc">https://huggingface.co/froggeric/Qwen-Fixed-Chat-Templates</a> 作者。下载方式：</p>
<pre><code>hf download froggeric/Qwen-Fixed-Chat-Templates chat_template.jinja --local-dir models/Qwen
</code></pre>
<p dir="auto">至于它的原理，Huggingface 页面上有详细介绍。我偷懒让Gemini去总结，回复如下：</p>
<p dir="auto"><img src="https://upload.lcz.me/uploads/cecd74db-be28-4fa1-885a-f91c0072dbc8.jpeg" alt="7776a8d3-9629-4059-a1e9-c93671bb5521-image.jpeg" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/topic/298/实测hermes-qwen3.6-27b-使用qwen-fixed-chat-templates大幅提高缓存命中率</link><generator>RSS for Node</generator><lastBuildDate>Sat, 06 Jun 2026 07:04:30 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/298.rss" rel="self" type="application/rss+xml"/><pubDate>Sun, 24 May 2026 21:03:05 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 实测Hermes + Qwen3.6 27B 使用Qwen-Fixed-Chat-Templates大幅提高缓存命中率 on Sat, 06 Jun 2026 04:31:21 GMT]]></title><description><![CDATA[<p dir="auto">感謝~先準備抄作業</p>
]]></description><link>https://lcz.me/post/5309</link><guid isPermaLink="true">https://lcz.me/post/5309</guid><dc:creator><![CDATA[sil041]]></dc:creator><pubDate>Sat, 06 Jun 2026 04:31:21 GMT</pubDate></item><item><title><![CDATA[Reply to 实测Hermes + Qwen3.6 27B 使用Qwen-Fixed-Chat-Templates大幅提高缓存命中率 on Sat, 06 Jun 2026 02:55:57 GMT]]></title><description><![CDATA[<p dir="auto">感谢楼主的付出，测试有效!</p>
]]></description><link>https://lcz.me/post/5294</link><guid isPermaLink="true">https://lcz.me/post/5294</guid><dc:creator><![CDATA[whjwyc]]></dc:creator><pubDate>Sat, 06 Jun 2026 02:55:57 GMT</pubDate></item><item><title><![CDATA[Reply to 实测Hermes + Qwen3.6 27B 使用Qwen-Fixed-Chat-Templates大幅提高缓存命中率 on Tue, 02 Jun 2026 13:11:24 GMT]]></title><description><![CDATA[<p dir="auto">复制收藏了。劲爆。有效。</p>
]]></description><link>https://lcz.me/post/4669</link><guid isPermaLink="true">https://lcz.me/post/4669</guid><dc:creator><![CDATA[williamlouis]]></dc:creator><pubDate>Tue, 02 Jun 2026 13:11:24 GMT</pubDate></item><item><title><![CDATA[Reply to 实测Hermes + Qwen3.6 27B 使用Qwen-Fixed-Chat-Templates大幅提高缓存命中率 on Tue, 02 Jun 2026 10:50:28 GMT]]></title><description><![CDATA[<p dir="auto">感谢楼主的分享，经过几天测试，发现使用后确实kv缓存被prefill的次数明显减少，这点非常到位，同时也发现在hermes中agent调用工具时频繁出现只说不做的情况，不知大家是否也有这样的情况？我准备试着结合Qwen原版和Fix版本合成一个新的版本来测试一下，有相同情况的朋友可以来指导探讨下。</p>
]]></description><link>https://lcz.me/post/4649</link><guid isPermaLink="true">https://lcz.me/post/4649</guid><dc:creator><![CDATA[neo]]></dc:creator><pubDate>Tue, 02 Jun 2026 10:50:28 GMT</pubDate></item><item><title><![CDATA[Reply to 实测Hermes + Qwen3.6 27B 使用Qwen-Fixed-Chat-Templates大幅提高缓存命中率 on Mon, 01 Jun 2026 11:59:12 GMT]]></title><description><![CDATA[<p dir="auto">看來是個很重要的東西 先收藏了 留著之後注意研究 感謝樓主分享 ; 動態省略 &lt;think&gt;...&lt;/think&gt; 推理過程 是合理操作 但是也造成 緩存命中率的問題</p>
]]></description><link>https://lcz.me/post/4533</link><guid isPermaLink="true">https://lcz.me/post/4533</guid><dc:creator><![CDATA[kos or]]></dc:creator><pubDate>Mon, 01 Jun 2026 11:59:12 GMT</pubDate></item><item><title><![CDATA[Reply to 实测Hermes + Qwen3.6 27B 使用Qwen-Fixed-Chat-Templates大幅提高缓存命中率 on Mon, 01 Jun 2026 09:13:11 GMT]]></title><description><![CDATA[<p dir="auto">这个必须去了解一下。。。谢谢楼主分享</p>
]]></description><link>https://lcz.me/post/4521</link><guid isPermaLink="true">https://lcz.me/post/4521</guid><dc:creator><![CDATA[Tide]]></dc:creator><pubDate>Mon, 01 Jun 2026 09:13:11 GMT</pubDate></item><item><title><![CDATA[Reply to 实测Hermes + Qwen3.6 27B 使用Qwen-Fixed-Chat-Templates大幅提高缓存命中率 on Fri, 29 May 2026 21:21:14 GMT]]></title><description><![CDATA[<p dir="auto">牛牛牛，加了Qwen-Fixed-Chat-Templates之后，测试了下，缓存果然没有不命中了，没毛病</p>
]]></description><link>https://lcz.me/post/4273</link><guid isPermaLink="true">https://lcz.me/post/4273</guid><dc:creator><![CDATA[neo]]></dc:creator><pubDate>Fri, 29 May 2026 21:21:14 GMT</pubDate></item><item><title><![CDATA[Reply to 实测Hermes + Qwen3.6 27B 使用Qwen-Fixed-Chat-Templates大幅提高缓存命中率 on Mon, 25 May 2026 23:15:13 GMT]]></title><description><![CDATA[<p dir="auto">我试了下，效果不如我hack的Hermes好啊。</p>
<p dir="auto">以下是我详细的测试结果。<br />
在当前这套本地栈里，<code>froggeric/Qwen-Fixed-Chat-Templates</code> 没有带来更好的 KV 复用，反而比我现在用的 <code>Qwen3-stable-reasoning.jinja</code> 更差。</p>
<p dir="auto">关键结论：</p>
<ul>
<li>两组都没有出现 <code>forcing full prompt re-processing due to lack of cache data</code></li>
<li>两组都能稳定走完 8 轮真实工具调用</li>
<li>但 <code>froggeric</code> 模板每轮需要重算的 token 明显更多</li>
<li>受控重跑里，现有模板的 cache hit 更高，uncached token 更少</li>
</ul>
<p dir="auto">所以社区帖子里“fixed chat template 大幅提高 Hermes + Qwen3.6 cache 命中率”这件事，至少不能直接外推到我当前这套：</p>
<ul>
<li><code>custom-agent-stack/hermes</code> 本地定制</li>
<li><code>ik_llama.cpp/build-mmq/bin/llama-server</code></li>
<li>单槽 MMQ + MTP + 128k ctx</li>
<li>本地 replay / save-restore / diagnostics 改造后的工作流</li>
</ul>
<p dir="auto">更像是：</p>
<ul>
<li>对方原始模板或运行栈本来就更容易漂</li>
<li>而我当前本地模板已经处在一个相对稳定的状态</li>
</ul>
<h2>测试目的</h2>
<p dir="auto">验证这篇帖子里的说法，是否适用于我当前本地工作流：</p>
<ul>
<li><code>https://lcz.me/topic/298/...</code></li>
<li>主题：<code>Qwen-Fixed-Chat-Templates</code> 是否能显著降低 Hermes 长会话下的 cache miss / forcing full</li>
</ul>
<p dir="auto">测试原则：</p>
<ul>
<li>同一个 <code>llama-server</code> 二进制</li>
<li>同一个模型</li>
<li>同一套 MMQ / MTP / 128k 参数</li>
<li>同一个 Hermes 启动链</li>
<li>只换 <code>chat template</code></li>
</ul>
<h2>模板 A / B</h2>
<h3>A 组：当前本地模板</h3>
<ul>
<li>文件：<code>~/custom-agent-stack/local-agent-setup/templates/Qwen3-stable-reasoning.jinja</code></li>
</ul>
<h3>B 组：froggeric 模板</h3>
<ul>
<li>来源：<code>https://huggingface.co/froggeric/Qwen-Fixed-Chat-Templates</code></li>
<li>本地文件：<code>~/.cache/local-agent-setup/templates/froggeric/chat_template.jinja</code></li>
<li><code>sha256</code>：<code>4649b3fa3db3fda4d51173ed4ff0175fde7ece8bbceb9d595d04d862020c9746</code></li>
</ul>
<h2>运行环境</h2>
<ul>
<li>模型：<code>~/models/Qwen3.6-27B-MTP-IQ4_KS.gguf</code></li>
<li>server：<code>~/src/ik_llama.cpp/build-mmq/bin/llama-server</code></li>
<li>launcher：<code>~/custom-agent-stack/local-agent-setup/start-llama-server-ik-mmq.sh</code></li>
<li>Hermes：<code>~/custom-agent-stack/local-agent-setup/start-hermes-mmq.sh</code></li>
</ul>
<p dir="auto">共用参数：</p>
<ul>
<li><code>CTX_SIZE=128000</code></li>
<li><code>ENABLE_VISION=off</code></li>
<li><code>--parallel 1</code></li>
<li><code>-ngl 999</code></li>
<li><code>--cache-type-k q8_0</code></li>
<li><code>--cache-type-v q8_0</code></li>
<li><code>--flash-attn on</code></li>
<li><code>--multi-token-prediction</code></li>
<li><code>--draft-max 2</code></li>
<li><code>--draft-p-min 0.0</code></li>
<li><code>--merge-qkv</code></li>
<li><code>--merge-up-gate-experts</code></li>
<li><code>--cache-ram 32768</code></li>
<li><code>--ctx-checkpoints 32</code></li>
<li><code>--jinja</code></li>
<li><code>--reasoning off</code></li>
</ul>
<h2>对照方法</h2>
<p dir="auto">这次实际做了两轮测试。</p>
<h3>第一轮：普通多轮工具请求</h3>
<p dir="auto">目录：</p>
<ul>
<li><code>~/.cache/local-agent-setup/ab-qwen-fixed-template-iq4ks-20260526-060644</code></li>
</ul>
<p dir="auto">这一轮能看出大方向，但有一个污染点：</p>
<ul>
<li>A 组首轮没有调用工具，模型直接答出了 <code>alpha beta gamma</code></li>
<li>B 组首轮走了真实 <code>terminal</code></li>
</ul>
<p dir="auto">所以这轮只能算：</p>
<ul>
<li>初筛结论</li>
<li>不能作为最终严肃证据</li>
</ul>
<h3>第二轮：受控随机文件重跑</h3>
<p dir="auto">目录：</p>
<ul>
<li><code>~/.cache/local-agent-setup/ab-qwen-fixed-template-iq4ks-controlled-20260526-061256</code></li>
</ul>
<p dir="auto">这轮才是有效结论。</p>
<p dir="auto">控制方式：</p>
<ul>
<li>预先生成 8 个随机文件</li>
<li>每轮都要求模型必须用 <code>terminal</code> 执行 <code>cat &lt;file&gt;</code></li>
<li>文件内容是模型不可能预知的随机 UUID</li>
<li>两组都达成 <code>8/8</code> 真实工具调用</li>
</ul>
<p dir="auto">这保证了：</p>
<ul>
<li>不是“模型猜中了输出”</li>
<li>不是“某组首轮偷答绕过工具”</li>
<li>两边历史链条的结构尽量一致</li>
</ul>
<h2>受控重跑结果</h2>
<h3>总结指标</h3>
<h4>A 组：当前本地模板</h4>
<ul>
<li><code>tool_preview_count = 8</code></li>
<li><code>forced_full_reprocess_count = 0</code></li>
<li><code>avg_cache_hit_pct = 96.81</code></li>
<li><code>avg_uncached_tokens = 87.38</code></li>
<li><code>post_t1_avg_cache_hit_pct = 97.29</code></li>
<li><code>post_t1_avg_uncached_tokens = 80.43</code></li>
</ul>
<h4>B 组：froggeric 模板</h4>
<ul>
<li><code>tool_preview_count = 8</code></li>
<li><code>forced_full_reprocess_count = 0</code></li>
<li><code>avg_cache_hit_pct = 94.74</code></li>
<li><code>avg_uncached_tokens = 168.38</code></li>
<li><code>post_t1_avg_cache_hit_pct = 95.00</code></li>
<li><code>post_t1_avg_uncached_tokens = 168.71</code></li>
</ul>
<h3>turn-by-turn</h3>
<h4>A 组：当前本地模板</h4>
<table class="table table-bordered table-striped">
<thead>
<tr>
<th>turn</th>
<th style="text-align:right">prompt_tokens</th>
<th style="text-align:right">cached_tokens</th>
<th style="text-align:right">uncached_tokens</th>
<th style="text-align:right">cache_hit_pct</th>
</tr>
</thead>
<tbody>
<tr>
<td>1</td>
<td style="text-align:right">2089</td>
<td style="text-align:right">1953</td>
<td style="text-align:right">136</td>
<td style="text-align:right">93.49</td>
</tr>
<tr>
<td>2</td>
<td style="text-align:right">2338</td>
<td style="text-align:right">2270</td>
<td style="text-align:right">68</td>
<td style="text-align:right">97.09</td>
</tr>
<tr>
<td>3</td>
<td style="text-align:right">2590</td>
<td style="text-align:right">2451</td>
<td style="text-align:right">139</td>
<td style="text-align:right">94.63</td>
</tr>
<tr>
<td>4</td>
<td style="text-align:right">2844</td>
<td style="text-align:right">2774</td>
<td style="text-align:right">70</td>
<td style="text-align:right">97.54</td>
</tr>
<tr>
<td>5</td>
<td style="text-align:right">3098</td>
<td style="text-align:right">3027</td>
<td style="text-align:right">71</td>
<td style="text-align:right">97.71</td>
</tr>
<tr>
<td>6</td>
<td style="text-align:right">3353</td>
<td style="text-align:right">3282</td>
<td style="text-align:right">71</td>
<td style="text-align:right">97.88</td>
</tr>
<tr>
<td>7</td>
<td style="text-align:right">3609</td>
<td style="text-align:right">3537</td>
<td style="text-align:right">72</td>
<td style="text-align:right">98.00</td>
</tr>
<tr>
<td>8</td>
<td style="text-align:right">3866</td>
<td style="text-align:right">3794</td>
<td style="text-align:right">72</td>
<td style="text-align:right">98.14</td>
</tr>
</tbody>
</table>
<h4>B 组：froggeric 模板</h4>
<table class="table table-bordered table-striped">
<thead>
<tr>
<th>turn</th>
<th style="text-align:right">prompt_tokens</th>
<th style="text-align:right">cached_tokens</th>
<th style="text-align:right">uncached_tokens</th>
<th style="text-align:right">cache_hit_pct</th>
</tr>
</thead>
<tbody>
<tr>
<td>1</td>
<td style="text-align:right">2348</td>
<td style="text-align:right">2182</td>
<td style="text-align:right">166</td>
<td style="text-align:right">92.93</td>
</tr>
<tr>
<td>2</td>
<td style="text-align:right">2623</td>
<td style="text-align:right">2457</td>
<td style="text-align:right">166</td>
<td style="text-align:right">93.67</td>
</tr>
<tr>
<td>3</td>
<td style="text-align:right">2901</td>
<td style="text-align:right">2732</td>
<td style="text-align:right">169</td>
<td style="text-align:right">94.17</td>
</tr>
<tr>
<td>4</td>
<td style="text-align:right">3181</td>
<td style="text-align:right">3013</td>
<td style="text-align:right">168</td>
<td style="text-align:right">94.72</td>
</tr>
<tr>
<td>5</td>
<td style="text-align:right">3461</td>
<td style="text-align:right">3292</td>
<td style="text-align:right">169</td>
<td style="text-align:right">95.12</td>
</tr>
<tr>
<td>6</td>
<td style="text-align:right">3742</td>
<td style="text-align:right">3573</td>
<td style="text-align:right">169</td>
<td style="text-align:right">95.48</td>
</tr>
<tr>
<td>7</td>
<td style="text-align:right">4024</td>
<td style="text-align:right">3854</td>
<td style="text-align:right">170</td>
<td style="text-align:right">95.78</td>
</tr>
<tr>
<td>8</td>
<td style="text-align:right">4307</td>
<td style="text-align:right">4137</td>
<td style="text-align:right">170</td>
<td style="text-align:right">96.05</td>
</tr>
</tbody>
</table>
<h2>结果怎么解读</h2>
<h3>1. 这不是 forcing full 级问题</h3>
<p dir="auto">两边都没有出现：</p>
<ul>
<li><code>forcing full prompt re-processing due to lack of cache data</code></li>
</ul>
<p dir="auto">说明当前本地链路已经比较稳定。</p>
<p dir="auto">也就是说，这次 A/B 主要比较的是：</p>
<ul>
<li>谁的共享前缀更长</li>
<li>谁每轮需要补算的 token 更少</li>
</ul>
<p dir="auto">而不是比较“谁会炸、谁不会炸”。</p>
<h3>2. froggeric 模板在我这里更重</h3>
<p dir="auto">受控重跑里，<code>froggeric</code> 模板几乎每轮都比本地模板多重算接近一倍的 token：</p>
<ul>
<li>本地模板后 7 轮平均 uncached：<code>80.43</code></li>
<li><code>froggeric</code> 后 7 轮平均 uncached：<code>168.71</code></li>
</ul>
<p dir="auto">这不是小抖动，而是明显更差。</p>
<h3>3. 社区帖子和我这里不矛盾，但条件不同</h3>
<p dir="auto">更合理的解释不是“帖子错了”，而是：</p>
<ol>
<li>对方的原始模板更容易在 <code>tool_call / tool_response / think</code> 边界上漂</li>
<li>我本地模板和 Hermes replay 链路已经被专门收拾过</li>
<li><code>froggeric</code> 模板在我这套本地定制栈里没有形成更短、更稳的共享前缀，反而引入了更多稳定额外 token</li>
</ol>
<p dir="auto">所以它在我这里没有收益，甚至有负收益。</p>
]]></description><link>https://lcz.me/post/3673</link><guid isPermaLink="true">https://lcz.me/post/3673</guid><dc:creator><![CDATA[blackjack]]></dc:creator><pubDate>Mon, 25 May 2026 23:15:13 GMT</pubDate></item><item><title><![CDATA[Reply to 实测Hermes + Qwen3.6 27B 使用Qwen-Fixed-Chat-Templates大幅提高缓存命中率 on Mon, 25 May 2026 02:27:09 GMT]]></title><description><![CDATA[<p dir="auto">@刘海彬 哦. 好的, 我再试试. 谢谢</p>
]]></description><link>https://lcz.me/post/3495</link><guid isPermaLink="true">https://lcz.me/post/3495</guid><dc:creator><![CDATA[laobenxiong]]></dc:creator><pubDate>Mon, 25 May 2026 02:27:09 GMT</pubDate></item><item><title><![CDATA[Reply to 实测Hermes + Qwen3.6 27B 使用Qwen-Fixed-Chat-Templates大幅提高缓存命中率 on Mon, 25 May 2026 01:42:40 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/laobenxiong" aria-label="Profile: laobenxiong">@<bdi>laobenxiong</bdi></a> 可以啊,我用llama.cpp跑的qwen3.6 27B 配合--mmproj参数，vision 能力正常</p>
]]></description><link>https://lcz.me/post/3489</link><guid isPermaLink="true">https://lcz.me/post/3489</guid><dc:creator><![CDATA[[[global:former-user]]]]></dc:creator><pubDate>Mon, 25 May 2026 01:42:40 GMT</pubDate></item><item><title><![CDATA[Reply to 实测Hermes + Qwen3.6 27B 使用Qwen-Fixed-Chat-Templates大幅提高缓存命中率 on Mon, 25 May 2026 01:34:49 GMT]]></title><description><![CDATA[<p dir="auto">目前 hermes 好像还不能使用到 qwen3.6-27b 的 vision 功能, 它能够识别到 multimodal 的 capability, 但是尝试发送图片到 llm 好像不太成功...</p>
]]></description><link>https://lcz.me/post/3488</link><guid isPermaLink="true">https://lcz.me/post/3488</guid><dc:creator><![CDATA[laobenxiong]]></dc:creator><pubDate>Mon, 25 May 2026 01:34:49 GMT</pubDate></item><item><title><![CDATA[Reply to 实测Hermes + Qwen3.6 27B 使用Qwen-Fixed-Chat-Templates大幅提高缓存命中率 on Mon, 25 May 2026 01:32:25 GMT]]></title><description><![CDATA[<p dir="auto">关注. 有空也试一下.</p>
]]></description><link>https://lcz.me/post/3487</link><guid isPermaLink="true">https://lcz.me/post/3487</guid><dc:creator><![CDATA[laobenxiong]]></dc:creator><pubDate>Mon, 25 May 2026 01:32:25 GMT</pubDate></item><item><title><![CDATA[Reply to 实测Hermes + Qwen3.6 27B 使用Qwen-Fixed-Chat-Templates大幅提高缓存命中率 on Mon, 25 May 2026 01:07:04 GMT]]></title><description><![CDATA[<p dir="auto">很强很强，晚点我也回去测试下</p>
]]></description><link>https://lcz.me/post/3486</link><guid isPermaLink="true">https://lcz.me/post/3486</guid><dc:creator><![CDATA[[[global:former-user]]]]></dc:creator><pubDate>Mon, 25 May 2026 01:07:04 GMT</pubDate></item><item><title><![CDATA[Reply to 实测Hermes + Qwen3.6 27B 使用Qwen-Fixed-Chat-Templates大幅提高缓存命中率 on Sun, 24 May 2026 22:17:37 GMT]]></title><description><![CDATA[<p dir="auto">我靠，这个绝对是意义重大，有没有屌丝们抄作业验证下？我先置顶！</p>
]]></description><link>https://lcz.me/post/3462</link><guid isPermaLink="true">https://lcz.me/post/3462</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sun, 24 May 2026 22:17:37 GMT</pubDate></item></channel></rss>