<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享]]></title><description><![CDATA[<p dir="auto">先交代下背景，本人本职搬砖（物理意义上的）的攻城狮，纯小白，没有编程经验，不懂代码，好折腾，多年来有折腾nas，折腾docker一类，对硬件有一点点了解。然后同时关注的数码博主比较多，慢慢有被被动的灌输到ai的东西，然后开始用在线的ai，觉得很好玩。所以，从openclaw到hermes都有在尝试，在macmini上用deepseek的api帮我整理一些工作上的资料，处理下本地的影音文件等等。也经常在油管上看一些up主的折腾视频，一个月前偶然推给我特哥的频道，看了一期，果断关注，觉得老哥讲的纯纯干货，尤其很多关于硬件选择的，小白的我来说，很有意思。</p>
<p dir="auto">因为早些年折腾nas，手里有闲置的主板/cpu/内存/电源/风冷/ssd，就差个显卡，就可以撺一台机器了。心痒难耐，一直在看特哥关于硬件的视频，也自己ai问各种显卡的对比，直到社区建立起来，看到各位大神们的分享的帖子。加之特哥在视频里说的，先折腾起来，先从0到1，遂促使我下定决心折腾折腾。随后京东入手7900xtx蓝宝石丐版，闲鱼淘了个机箱，电源也换了，机器撺起来到安装系统折腾环境一周左右的时间吧。</p>
<p dir="auto">刚开始都是手动问deepseek 然后复制黏贴到终端里反复试错。到大前天突然想到，我可以让hermes ssh到机器上帮我折腾调试。目前，本地api接入hermes，日常对话是没问题，其他类型的任务，没有测试，基于到目前为止的经验，先交个作业。</p>
<p dir="auto">以下都是hermes根据折腾的记录，整理出来的，请大佬们指导。</p>
<hr />
<h2>硬件环境</h2>
<table class="table table-bordered table-striped">
<thead>
<tr>
<th>项目</th>
<th>配置</th>
</tr>
</thead>
<tbody>
<tr>
<td>GPU</td>
<td>AMD Radeon RX 7900 XTX 24GB (Navi 31, gfx1100)</td>
<td></td>
</tr>
<tr>
<td>内存</td>
<td>三星 32g*4 DDR4</td>
</tr>
<tr>
<td>CPU</td>
<td>Intel Xeon W-1290P @ 3.70GHz (20核)</td>
</tr>
<tr>
<td>主板</td>
<td>超微X12SCA-F</td>
</tr>
<tr>
<td>SSD</td>
<td>三星 2t * 2</td>
</tr>
<tr>
<td>系统</td>
<td colspan="2">Ubuntu 22.04 (headless 推理服务器)</td>
<td>ROCm</td>
<td>7.2.2</td>
</tr>
</tbody>
</table>
<h2>用途</h2>
<p dir="auto">主要是结合hermes折腾玩，同时希望能学习一点点相关的技能和知识：</p>
<ul>
<li>Agent 任务执行（工具调用、文件操作）</li>
<li>日常对话</li>
</ul>
<h2>模型</h2>
<ul>
<li><strong>Qwen3.6-27B</strong></li>
<li>测试了两个量化版本：
<ul>
<li><code>Qwen3.6-27B-UD-Q4_K_XL-mtp.gguf</code>（17 GB）</li>
<li><code>Qwen3.6-27B-IQ4_XS-mtp.gguf</code>（15 GB）</li>
</ul>
</li>
</ul>
<h2>推理框架</h2>
<p dir="auto">llama.cpp ROCm (HIP) 构建，从源码编译。</p>
<h2>调优过程</h2>
<h3>初始状态</h3>
<pre><code>llama-server \
  -m Qwen3.6-27B-UD-Q4_K_XL-mtp.gguf \
  -c 32768 \
  --spec-type draft-mtp --spec-draft-n-max 2 \
  --chat-template-file chatml.jinja
</code></pre>
<ul>
<li>VRAM: 22.4/24 GB (几乎爆满)</li>
<li>上下文: 32K</li>
<li>TG: ~55 t/s</li>
<li>MTP 接受率: 95%</li>
<li>问题：上下文太小，Hermes Agent 的系统提示词就有 ~70K tokens，根本放不下</li>
</ul>
<h3>第一步：换 IQ4_XS + 优化 KV Cache</h3>
<p dir="auto">参考坛友经验，做了两个关键改动：</p>
<ol>
<li><strong>换 IQ4_XS 量化</strong>（15 GB vs 17 GB，省 2 GB）</li>
<li><strong>KV Cache 从默认 f16 降到 q4_0</strong>（<code>--cache-type-k q4_0 --cache-type-v q4_0</code>）</li>
</ol>
<p dir="auto"><strong>效果对比（Hermes 实际使用场景）：</strong></p>
<table class="table table-bordered table-striped">
<thead>
<tr>
<th>测试项</th>
<th>32K UD-Q4_K_XL (f16 KV)</th>
<th>128K IQ4_XS (q4_0 KV)</th>
</tr>
</thead>
<tbody>
<tr>
<td>VRAM</td>
<td>22.4 GB（爆满）</td>
<td><strong>17.6 GB</strong>（余 6.4 GB）</td>
</tr>
<tr>
<td>上下文</td>
<td>32K <img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/274c.png?v=d348ca29232" class="not-responsive emoji emoji-android emoji--x" style="height:23px;width:auto;vertical-align:middle" title="❌" alt="❌" /></td>
<td><strong>128K <img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/2705.png?v=d348ca29232" class="not-responsive emoji emoji-android emoji--white_check_mark" style="height:23px;width:auto;vertical-align:middle" title="✅" alt="✅" /></strong></td>
</tr>
</tbody>
</table>
<h3>第二步：解决 Thinking 标签问题</h3>
<p dir="auto"><code>--reasoning off</code> 参数可以禁止模型输出 <code>&lt;think&gt;</code> 标签。</p>
<h3>第三步：MTP 的取舍</h3>
<p dir="auto"><strong>IQ4_XS 量化下 MTP 表现不佳：</strong></p>
<ul>
<li>MTP 接受率仅 ~34%（UD-Q4_K_XL 时 95%）</li>
<li>TG 速度反而从无 MTP 的 45 t/s 降到 28 t/s</li>
<li>结论：IQ4_XS + MTP 不如无 MTP 快</li>
</ul>
<p dir="auto"><strong>最终结论：无 MTP 更优</strong></p>
<h3>第四步：Prompt Cache 验证</h3>
<p dir="auto">实测 prompt caching 完美工作：</p>
<ul>
<li>首次请求（18K prompt 预填）：21 秒</li>
<li>后续请求（缓存命中 99.9%）：&lt; 1 秒</li>
</ul>
<h2>最终配置</h2>
<pre><code class="language-bash">llama-server \
  -m Qwen3.6-27B-IQ4_XS-mtp.gguf \
  --host 0.0.0.0 --port 8080 \
  -ngl 999 -fa 1 \
  -c 131072 \
  --cache-type-k q4_0 --cache-type-v q4_0 \
  --reasoning off \
  --cont-batching --cache-prompt
</code></pre>
<h2>最终性能</h2>
<table class="table table-bordered table-striped">
<thead>
<tr>
<th>指标</th>
<th>数值</th>
</tr>
</thead>
<tbody>
<tr>
<td>VRAM 占用</td>
<td>17.6 / 24 GB</td>
</tr>
<tr>
<td>Context</td>
<td>128K</td>
</tr>
<tr>
<td>TG 速度</td>
<td>45 t/s</td>
</tr>
<tr>
<td>Prefill 速度（小 prompt）</td>
<td>160 t/s</td>
</tr>
<tr>
<td>Prefill 速度（70K Hermes 系统提示词）</td>
<td>555 t/s</td>
</tr>
<tr>
<td>冷启动（首次请求）</td>
<td>~2 分钟（Hermes 70K 系统提示词预填）</td>
</tr>
<tr>
<td>热请求（cache 命中后）</td>
<td>&lt; 1 秒</td>
</tr>
<tr>
<td>输出质量</td>
<td>干净，无 thinking 标签</td>
</tr>
</tbody>
</table>
<h2>遗留问题</h2>
<ol>
<li><strong>冷启动太慢</strong>：Hermes Agent 有 ~70K tokens 的系统提示词，首次请求需要约 2 分钟预填。能否加速首次 prefill？</li>
<li><strong>IQ4_XS 下 MTP 接受率低</strong>（34% vs UD-Q4_K_XL 的 95%），是 IQ4_XS 量化的精度的原因吗？</li>
<li><strong>ROCm vs Vulkan</strong>：坛友发帖 Vulkan + MTP 能到 67 t/s，我只有 45 t/s（ROCm + 无 MTP）。是否应该切 Vulkan？ROCm 的 MTP 有 VRAM 泄漏问题有解吗？</li>
<li><strong>Hermes 系统提示词太大</strong>：如果能把 70K 压下去，冷启动能快很多。有没有好的减负策略？</li>
<li><strong>256K 上下文</strong>：IQ4_XS 下 256K 也能跑（VRAM 约 22.9 GB），但余量太少。有没有推荐的内存/显存优化手段？</li>
</ol>
<p dir="auto">补充更新设备图片和最新测试的结果</p>
<ol>
<li>设备图片 （机箱是闲鱼300元淘的海盗船airflow7000D，为以后上双卡准备）<br />
<img src="https://upload.lcz.me/uploads/916d40a1-7813-426b-ab44-3baefa02b8de.jpeg" alt="9bcdda2f-9000-4d41-bfa9-027defdc8c44-image.jpeg" class=" img-fluid img-markdown" /><br />
<img src="https://upload.lcz.me/uploads/9a83b39f-2d85-46da-bd5f-201d9d451c49.jpeg" alt="9ffa8081-c633-4d89-8a24-47f96988ee62-image.jpeg" class=" img-fluid img-markdown" /></li>
</ol>
<p dir="auto">2.不同模型的测试结果<br />
<img src="https://upload.lcz.me/uploads/0737083e-f353-43d0-9421-7426d45104a5.jpeg" alt="7df81caa-0c1a-47a5-b234-c6b61e332923-image.jpeg" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/topic/373/交作业-7900xtx-hermes-agent-qwen3.6-27b-调优过程分享</link><generator>RSS for Node</generator><lastBuildDate>Sat, 06 Jun 2026 04:41:52 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/373.rss" rel="self" type="application/rss+xml"/><pubDate>Sun, 31 May 2026 11:47:55 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Fri, 05 Jun 2026 05:56:35 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/jamesphlao" aria-label="Profile: JamesPhlao">@<bdi>JamesPhlao</bdi></a> <a href="/post/5103">说</a>:</p>
<p dir="auto">Q4_K_M</p>
</blockquote>
<p dir="auto">目前是27B Q4_K_M MTP， 可以到50t/s左右</p>
]]></description><link>https://lcz.me/post/5149</link><guid isPermaLink="true">https://lcz.me/post/5149</guid><dc:creator><![CDATA[kylin_Zaki]]></dc:creator><pubDate>Fri, 05 Jun 2026 05:56:35 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Fri, 05 Jun 2026 03:38:21 GMT]]></title><description><![CDATA[<p dir="auto">看了你的7900xtx，如果纯跑27B，我还是不入坑了。保持两张16G的羊垃圾，27B-IQ4_NL(理论上比Q4_K_M小一些，智力稳一些)， q8_0的kv-cache  256k可以跑，保险一些224k 240k 加mtp一次吐出8k左右能稳定40-50 t/s。 楼主的单卡24可以考虑折腾dflash，据说速度最高可以10倍。</p>
]]></description><link>https://lcz.me/post/5103</link><guid isPermaLink="true">https://lcz.me/post/5103</guid><dc:creator><![CDATA[JamesPhlao]]></dc:creator><pubDate>Fri, 05 Jun 2026 03:38:21 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Wed, 03 Jun 2026 04:33:10 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/kylin_zaki" aria-label="Profile: kylin_Zaki">@<bdi>kylin_Zaki</bdi></a> 來了 我把文回到主文章</p>
]]></description><link>https://lcz.me/post/4749</link><guid isPermaLink="true">https://lcz.me/post/4749</guid><dc:creator><![CDATA[CHIA AN YANG]]></dc:creator><pubDate>Wed, 03 Jun 2026 04:33:10 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Tue, 02 Jun 2026 23:55:57 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/chia-an-yang" aria-label="Profile: CHIA-AN-YANG">@<bdi>CHIA-AN-YANG</bdi></a> 分享一下详细的过程呀</p>
]]></description><link>https://lcz.me/post/4709</link><guid isPermaLink="true">https://lcz.me/post/4709</guid><dc:creator><![CDATA[kylin_Zaki]]></dc:creator><pubDate>Tue, 02 Jun 2026 23:55:57 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Tue, 02 Jun 2026 16:19:33 GMT]]></title><description><![CDATA[<p dir="auto">我接了codex cli進ubuntu ,讓他檢查hermes提示詞跟skill tools載入過大優化,優化完,目前玩得分起,我在查詢幣價分析幾乎秒等級的回應,然後裝了一張3060/12g 跑一個小模型9b 設定壓縮讓他跑,速度挺快的,給大家參考</p>
]]></description><link>https://lcz.me/post/4694</link><guid isPermaLink="true">https://lcz.me/post/4694</guid><dc:creator><![CDATA[CHIA AN YANG]]></dc:creator><pubDate>Tue, 02 Jun 2026 16:19:33 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Tue, 02 Jun 2026 16:10:14 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E8%89%B7%E9%99%BD%E5%A4%A9" aria-label="Profile: 艷陽天">@<bdi>艷陽天</bdi></a> 台灣人+1 舉手</p>
]]></description><link>https://lcz.me/post/4693</link><guid isPermaLink="true">https://lcz.me/post/4693</guid><dc:creator><![CDATA[CHIA AN YANG]]></dc:creator><pubDate>Tue, 02 Jun 2026 16:10:14 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Tue, 02 Jun 2026 02:34:42 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/5ccccc" aria-label="Profile: 5ccccc">@<bdi>5ccccc</bdi></a> 未必啊，很多人不愿意折腾AMD，你要买来插上就干活，那还得3090。性价比要看你的需求和现有条件的。价格上涨说明供不应求，但是如果你懂技术，现在XTX确实是神卡。</p>
]]></description><link>https://lcz.me/post/4622</link><guid isPermaLink="true">https://lcz.me/post/4622</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Tue, 02 Jun 2026 02:34:42 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Tue, 02 Jun 2026 02:24:35 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> <a href="/post/4596">说</a>:</p>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/kylin_zaki" aria-label="Profile: kylin_Zaki">@<bdi>kylin_Zaki</bdi></a> 我说实话，这张卡我倒是没想到这么多人买，因为大陆人一半都倾向于N卡，但境外的似乎都很看重保修。文化差异大，大陆人要求立刻能干活，干活快，不太在乎保修。淘宝上六七万买RTX Pro6000的大有人在，这和大陆维修方便低价也有关系。</p>
</blockquote>
<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> <a href="/post/4596">说</a>:</p>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/kylin_zaki" aria-label="Profile: kylin_Zaki">@<bdi>kylin_Zaki</bdi></a> 我说实话，这张卡我倒是没想到这么多人买，因为大陆人一半都倾向于N卡，但境外的似乎都很看重保修。文化差异大，大陆人要求立刻能干活，干活快，不太在乎保修。淘宝上六七万买RTX Pro6000的大有人在，这和大陆维修方便低价也有关系。</p>
</blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 主要是现在3090涨价了，涨完之后性价比不如7900xtx了</p>
]]></description><link>https://lcz.me/post/4621</link><guid isPermaLink="true">https://lcz.me/post/4621</guid><dc:creator><![CDATA[5ccccc]]></dc:creator><pubDate>Tue, 02 Jun 2026 02:24:35 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Mon, 01 Jun 2026 19:42:06 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/kylin_zaki" aria-label="Profile: kylin_Zaki">@<bdi>kylin_Zaki</bdi></a> 我说实话，这张卡我倒是没想到这么多人买，因为大陆人一半都倾向于N卡，但境外的似乎都很看重保修。文化差异大，大陆人要求立刻能干活，干活快，不太在乎保修。淘宝上六七万买RTX Pro6000的大有人在，这和大陆维修方便低价也有关系。</p>
]]></description><link>https://lcz.me/post/4596</link><guid isPermaLink="true">https://lcz.me/post/4596</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Mon, 01 Jun 2026 19:42:06 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Mon, 01 Jun 2026 14:01:28 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/kylin_zaki" aria-label="Profile: kylin_Zaki">@<bdi>kylin_Zaki</bdi></a> <a href="/post/4551">说</a>:</p>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 可以有，太多小伙伴是因为特哥的引路，入手的<img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f604.png?v=d348ca29232" class="not-responsive emoji emoji-android emoji--smile" style="height:23px;width:auto;vertical-align:middle" title=":smile:" alt="😄" /></p>
</blockquote>
<p dir="auto">可惜主板插不下了 不然整一块7900xtx玩 <img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f606.png?v=d348ca29232" class="not-responsive emoji emoji-android emoji--laughing" style="height:23px;width:auto;vertical-align:middle" title=":laughing:" alt="😆" /></p>
]]></description><link>https://lcz.me/post/4568</link><guid isPermaLink="true">https://lcz.me/post/4568</guid><dc:creator><![CDATA[applejuice]]></dc:creator><pubDate>Mon, 01 Jun 2026 14:01:28 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Mon, 01 Jun 2026 13:27:20 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 可以有，太多小伙伴是因为特哥的引路，入手的<img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f604.png?v=d348ca29232" class="not-responsive emoji emoji-android emoji--smile" style="height:23px;width:auto;vertical-align:middle" title=":smile:" alt="😄" /></p>
]]></description><link>https://lcz.me/post/4551</link><guid isPermaLink="true">https://lcz.me/post/4551</guid><dc:creator><![CDATA[kylin_Zaki]]></dc:creator><pubDate>Mon, 01 Jun 2026 13:27:20 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Mon, 01 Jun 2026 13:25:22 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/tide" aria-label="Profile: Tide">@<bdi>Tide</bdi></a> 一切折腾，折腾才有意思</p>
]]></description><link>https://lcz.me/post/4550</link><guid isPermaLink="true">https://lcz.me/post/4550</guid><dc:creator><![CDATA[kylin_Zaki]]></dc:creator><pubDate>Mon, 01 Jun 2026 13:25:22 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Mon, 01 Jun 2026 13:24:54 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E8%89%B7%E9%99%BD%E5%A4%A9" aria-label="Profile: 艷陽天">@<bdi>艷陽天</bdi></a> 我一直是用hermes调用deepseek v4 flash用的，性价比极高，相对试错成本来说，容忍度可太高了</p>
]]></description><link>https://lcz.me/post/4549</link><guid isPermaLink="true">https://lcz.me/post/4549</guid><dc:creator><![CDATA[kylin_Zaki]]></dc:creator><pubDate>Mon, 01 Jun 2026 13:24:54 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Mon, 01 Jun 2026 13:23:25 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/applejuice" aria-label="Profile: applejuice">@<bdi>applejuice</bdi></a> 是的，后来问了ai也是这么答复的，hermes的提示词过大</p>
]]></description><link>https://lcz.me/post/4548</link><guid isPermaLink="true">https://lcz.me/post/4548</guid><dc:creator><![CDATA[kylin_Zaki]]></dc:creator><pubDate>Mon, 01 Jun 2026 13:23:25 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Mon, 01 Jun 2026 09:45:26 GMT]]></title><description><![CDATA[<p dir="auto">笑死我了<br />
我翻回去看了一下，第一眼看过去 真的像酸<br />
但是说是台湾人又觉得没问题了  <img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f606.png?v=d348ca29232" class="not-responsive emoji emoji-android emoji--laughing" style="height:23px;width:auto;vertical-align:middle" title=":laughing:" alt="😆" /></p>
]]></description><link>https://lcz.me/post/4524</link><guid isPermaLink="true">https://lcz.me/post/4524</guid><dc:creator><![CDATA[applejuice]]></dc:creator><pubDate>Mon, 01 Jun 2026 09:45:26 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Mon, 01 Jun 2026 09:14:51 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 哈哈哈，没事没事，也许是我这个台湾人在词语表达和理解上跟你们有点差距，我也在思考为什么会有差距？明明都是一样github上下载的。也许差距瓶颈在其他硬体，例如主机版、SSD，我的是5-6年前的SATA 256GB老古董了，这应该也是因素之一吧，老特别再推我坑啦，没钱啦</p>
]]></description><link>https://lcz.me/post/4522</link><guid isPermaLink="true">https://lcz.me/post/4522</guid><dc:creator><![CDATA[艷陽天]]></dc:creator><pubDate>Mon, 01 Jun 2026 09:14:51 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Mon, 01 Jun 2026 09:06:36 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E8%89%B7%E9%99%BD%E5%A4%A9" aria-label="Profile: 艷陽天">@<bdi>艷陽天</bdi></a> 我重新看了一遍，这个回复可以理解为酸，也可以理解为真实感受。不过你的20t/s确实让我立刻联想到酸，我不知道你怎么跑出来的数据。难以理解。无论如何我骂你你不对，你也可以骂我傻逼，因为我看不得那些不尊重别人发帖的人。这一轮我输了，向你道歉，对不起！</p>
]]></description><link>https://lcz.me/post/4520</link><guid isPermaLink="true">https://lcz.me/post/4520</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Mon, 01 Jun 2026 09:06:36 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Mon, 01 Jun 2026 08:57:55 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 老特啊，这我不怼你我怼谁？你干嘛火气这么大呢？我完完全全没有酸他的意思呀？还是我写的内容让你误会了？我也是看了你油管的建议买了7900xtx（不得不说，你推广的很棒），我就是个小白，影片看了也是一知半解，对我们这些小白宽容点嘛。我是真的佩服他能搞好，我也希望有一天我学起来了，也可以在这儿分享我踩坑的经验，大哥，消消火啊。  有一说一，还是感谢老特的推荐，买了这张好卡，真的很安静</p>
]]></description><link>https://lcz.me/post/4518</link><guid isPermaLink="true">https://lcz.me/post/4518</guid><dc:creator><![CDATA[艷陽天]]></dc:creator><pubDate>Mon, 01 Jun 2026 08:57:55 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Mon, 01 Jun 2026 08:42:01 GMT]]></title><description><![CDATA[<p dir="auto">给爱折腾的楼主点赞</p>
]]></description><link>https://lcz.me/post/4516</link><guid isPermaLink="true">https://lcz.me/post/4516</guid><dc:creator><![CDATA[Tide]]></dc:creator><pubDate>Mon, 01 Jun 2026 08:42:01 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Mon, 01 Jun 2026 10:48:33 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E8%89%B7%E9%99%BD%E5%A4%A9" aria-label="Profile: 艷陽天">@<bdi>艷陽天</bdi></a> 你蠢就认真学下，不是挺好的吗？人家能搞定，你搞不定，不就是蠢吗？你酸什么呢？7900xtx不需要任何优化就能跑到30t/s，你跑到20t/s就不是模型问题了，你不需要来论坛发言，你应该首选去医院，检查下你的脑子。minimax你用得起，别人用不起吗？</p>
<p dir="auto">人家分享自己的真实经验，又没收你一毛钱，你可以捧个人场，点个赞，或者你不喜欢就走开，你酸什么呢？人家有必要骗你？</p>
]]></description><link>https://lcz.me/post/4515</link><guid isPermaLink="true">https://lcz.me/post/4515</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Mon, 01 Jun 2026 10:48:33 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Mon, 01 Jun 2026 08:22:42 GMT]]></title><description><![CDATA[<p dir="auto">好厉害呀，一样的配置，差在我的记忆体是32GB，我的只有20 t/s，我昨天刚搞好，在努力让它更完善中。用过云端，这智力还真不习惯啊，一个问题来来回回十几次搞不定，切换到minimax，一次搞定</p>
]]></description><link>https://lcz.me/post/4512</link><guid isPermaLink="true">https://lcz.me/post/4512</guid><dc:creator><![CDATA[艷陽天]]></dc:creator><pubDate>Mon, 01 Jun 2026 08:22:42 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Mon, 01 Jun 2026 02:45:25 GMT]]></title><description><![CDATA[<p dir="auto">Hermes 系统提示词太大</p>
<p dir="auto">应该很多技能可以关掉 不需要预先放进context<br />
但是比较奇怪的是我的第一句话才20k</p>
]]></description><link>https://lcz.me/post/4492</link><guid isPermaLink="true">https://lcz.me/post/4492</guid><dc:creator><![CDATA[applejuice]]></dc:creator><pubDate>Mon, 01 Jun 2026 02:45:25 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Mon, 01 Jun 2026 02:06:21 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 必须要，我也买了7900xtx，还在路上</p>
]]></description><link>https://lcz.me/post/4490</link><guid isPermaLink="true">https://lcz.me/post/4490</guid><dc:creator><![CDATA[5ccccc]]></dc:creator><pubDate>Mon, 01 Jun 2026 02:06:21 GMT</pubDate></item><item><title><![CDATA[Reply to 交作业， 7900XTX + Hermes Agent + Qwen3.6-27B 调优过程分享 on Sun, 31 May 2026 16:36:03 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/kylin_zaki" aria-label="Profile: kylin_Zaki">@<bdi>kylin_Zaki</bdi></a> 再补充电电脑实拍，运行截图。帖子非常不错，很有参考价值，我感觉我要找AMD领点广告费。</p>
]]></description><link>https://lcz.me/post/4470</link><guid isPermaLink="true">https://lcz.me/post/4470</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sun, 31 May 2026 16:36:03 GMT</pubDate></item></channel></rss>