<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[06-21 Hermes 调用本机 Carnice-27B 模型体验 &amp; 模板优化分享]]></title><description><![CDATA[<pre><code>     /data/model2/beellma616-kv.cpp/build/bin/llama-server \
  -m /data/model3/Carnice-V2-27B-IQ4_XS-mtp.gguf \
  -ngl 9999 --props \
  -fa on --metrics  --ctx-size 131072 -n 16000  \
  -ctk kvarn6 -ctv kvarn4 --kv-unified \
  --spec-type mtp --spec-draft-n-max 1 \
  --jinja --no-mmap --mlock -np 1   -b 4096 -ub 1024 \
  --host 0.0.0.0 --port 8025 \
  --reasoning off \
    --chat-template-kwargs '{"preserve_thinking":true}' \
  --reasoning-format deepseek --reasoning-budget 768 \
  --chat-template-file /data/model2/qwen3.6-27b-gguf/jscott3201-custom_pub_chat_template_qwen36.jinja \
   --temp 0.7  --top-k 20 --top-p 0.85 --min-p 0.0  --presence-penalty 1.5 --repeat-penalty 1.0
</code></pre>
<p dir="auto"><img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f4cc.png?v=9a87c0a6150" class="not-responsive emoji emoji-android emoji--pushpin" style="height:23px;width:auto;vertical-align:middle" title="📌" alt="📌" /> 基础体验<br />
在我的使用感受中，Hermes 调用本机 27B 模型时，整体能力大概介于 DeepSeek Pro 和 DeepSeek Flash 之间。</p>
<p dir="auto"><img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/26a0.png?v=9a87c0a6150" class="not-responsive emoji emoji-android emoji--warning" style="height:23px;width:auto;vertical-align:middle" title="⚠" alt="⚠" />️ 存在的问题<br />
不过，它的工具调用一直表现马马虎虎，经常“抽风”。<br />
我猜测可能是 chat_template 导致的。后来试着不带 chat_template 运行这个模型，感觉它内置的模板可能本身就存在缺陷。</p>
<p dir="auto"><img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f4a1.png?v=9a87c0a6150" class="not-responsive emoji emoji-android emoji--bulb" style="height:23px;width:auto;vertical-align:middle" title="💡" alt="💡" /> 发现转机<br />
今天我用谷姐搜了一下，发现了一个由 jscott3201 制作的模板。这个模板号称是针对 harness 的，但套用到 Hermes 上居然有奇效——套上之后立马就不抽风了！</p>
<p dir="auto"><img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f6e0.png?v=9a87c0a6150" class="not-responsive emoji emoji-android emoji--hammer_and_wrench" style="height:23px;width:auto;vertical-align:middle" title="🛠" alt="🛠" />️ 下一步尝试<br />
于是我就有了个新想法：何不把这个模板和 v20 的模板融合一下，看看会发生什么？<br />
<img src="https://upload.lcz.me/uploads/1cdc5afa-c1d4-40da-9f03-50a00faab02f.jpeg" alt="1e0265d7-7419-4b20-af08-ea41f87517c9-image.jpeg" class=" img-fluid img-markdown" /></p>
<p dir="auto"><img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f4a1.png?v=9a87c0a6150" class="not-responsive emoji emoji-android emoji--bulb" style="height:23px;width:auto;vertical-align:middle" title="💡" alt="💡" /> 我的思路，先让HERMES调用 子Agent 去做一个俄罗斯HTML游戏 ，总结一个模板文件的优劣势:<br />
<img src="https://upload.lcz.me/uploads/0fa55692-323e-4044-bf84-196ab5f2a37b.jpeg" alt="84a3871c-285e-4936-972f-ecf39d601a9c-image.jpeg" class=" img-fluid img-markdown" /></p>
<p dir="auto">v20模板参数测试<br />
<img src="https://upload.lcz.me/uploads/2d565778-bd71-409a-8409-ad571865a18f.jpeg" alt="bcc6c172-66e5-4782-93f0-df36a1dbb0d7-image.jpeg" class=" img-fluid img-markdown" /></p>
<p dir="auto">再测一下内置模板的参数：<br />
<img src="https://upload.lcz.me/uploads/8a0e0c7f-0446-4d7c-8be4-fc9a50c18971.jpeg" alt="14c14154-c410-4b81-ba91-c8fbd41dc603-image.jpeg" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/topic/642/06-21-hermes-调用本机-carnice-27b-模型体验-模板优化分享</link><generator>RSS for Node</generator><lastBuildDate>Wed, 01 Jul 2026 15:46:01 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/642.rss" rel="self" type="application/rss+xml"/><pubDate>Sun, 21 Jun 2026 06:05:38 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 06-21 Hermes 调用本机 Carnice-27B 模型体验 &amp; 模板优化分享 on Sun, 21 Jun 2026 11:48:37 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/c0aster" aria-label="Profile: c0aster">@<bdi>c0aster</bdi></a> 那有两种可能，你的skill太多。 另一种是记忆太爆满了，hermes为了更贴合你的需求，在给大模型发送的时候带上了太多至少 30K token，而且这些token之间的相关性不大，一旦进入LLM，就会无脑开始疯狂运算，如果你温度没放高一些的话。显卡就首次填充肯定要很长时间的。</p>
]]></description><link>https://lcz.me/post/7683</link><guid isPermaLink="true">https://lcz.me/post/7683</guid><dc:creator><![CDATA[stxpnet]]></dc:creator><pubDate>Sun, 21 Jun 2026 11:48:37 GMT</pubDate></item><item><title><![CDATA[Reply to 06-21 Hermes 调用本机 Carnice-27B 模型体验 &amp; 模板优化分享 on Sun, 21 Jun 2026 11:30:13 GMT]]></title><description><![CDATA[<p dir="auto">分析是KV缓存没命中然后重新生成，并且hermes传了至少65K的上下文</p>
]]></description><link>https://lcz.me/post/7682</link><guid isPermaLink="true">https://lcz.me/post/7682</guid><dc:creator><![CDATA[c0aster]]></dc:creator><pubDate>Sun, 21 Jun 2026 11:30:13 GMT</pubDate></item><item><title><![CDATA[Reply to 06-21 Hermes 调用本机 Carnice-27B 模型体验 &amp; 模板优化分享 on Sun, 21 Jun 2026 10:56:41 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/c0aster" aria-label="Profile: c0aster">@<bdi>c0aster</bdi></a> 为啥要等几分钟？ 有问题建议让deepseek pro帮你排查吧，刚开始可能还是要交点学费的，后面跑顺了就好了。</p>
]]></description><link>https://lcz.me/post/7679</link><guid isPermaLink="true">https://lcz.me/post/7679</guid><dc:creator><![CDATA[stxpnet]]></dc:creator><pubDate>Sun, 21 Jun 2026 10:56:41 GMT</pubDate></item><item><title><![CDATA[Reply to 06-21 Hermes 调用本机 Carnice-27B 模型体验 &amp; 模板优化分享 on Sun, 21 Jun 2026 10:39:03 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/stxpnet" aria-label="Profile: stxpnet">@<bdi>stxpnet</bdi></a> 那你现在这个配置，hermes反应快不，我的得等几分钟才开始干活</p>
]]></description><link>https://lcz.me/post/7678</link><guid isPermaLink="true">https://lcz.me/post/7678</guid><dc:creator><![CDATA[c0aster]]></dc:creator><pubDate>Sun, 21 Jun 2026 10:39:03 GMT</pubDate></item><item><title><![CDATA[Reply to 06-21 Hermes 调用本机 Carnice-27B 模型体验 &amp; 模板优化分享 on Sun, 21 Jun 2026 10:10:46 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/williamlouis" aria-label="Profile: williamlouis">@<bdi>williamlouis</bdi></a> <img src="https://upload.lcz.me/uploads/c69a8b41-cf9b-4f2f-9348-ae7179c51a7f.jpeg" alt="8694f2d8-28c8-41b7-8f6f-16566e28ba48-image.jpeg" class=" img-fluid img-markdown" />  我的意思是在180K上下文范围内。 deepseek flash给我的感觉就是很随意 ，速度快，但遵从性不高。<br />
PRO不用说，是deepseek的当红产品，能力肯定必须在线。<br />
我的配置是64G DDR4内存，24G RTX3090，目前开350瓦，在跑了快90K上下文时，生成速度大概还是50T/S左右 。</p>
<p dir="auto"><img src="https://upload.lcz.me/uploads/aa8e4a57-efbd-483a-97c5-c24dfb71e613.jpeg" alt="550b1cba-ccfc-4b3b-a387-8034b5e9593a-image.jpeg" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/post/7676</link><guid isPermaLink="true">https://lcz.me/post/7676</guid><dc:creator><![CDATA[stxpnet]]></dc:creator><pubDate>Sun, 21 Jun 2026 10:10:46 GMT</pubDate></item><item><title><![CDATA[Reply to 06-21 Hermes 调用本机 Carnice-27B 模型体验 &amp; 模板优化分享 on Sun, 21 Jun 2026 09:57:54 GMT]]></title><description><![CDATA[<p dir="auto"><img src="https://upload.lcz.me/uploads/c310eeb6-064c-4258-8a33-ce9376893e95.jpeg" alt="0fb5f034-5056-4bf5-8e9d-e937ac99bc43-image.jpeg" class=" img-fluid img-markdown" /> 这个是cloakbrowser的管理器，可以看到浏览器，也能登陆网站，减少网站弹出验证的频率。</p>
]]></description><link>https://lcz.me/post/7675</link><guid isPermaLink="true">https://lcz.me/post/7675</guid><dc:creator><![CDATA[stxpnet]]></dc:creator><pubDate>Sun, 21 Jun 2026 09:57:54 GMT</pubDate></item><item><title><![CDATA[Reply to 06-21 Hermes 调用本机 Carnice-27B 模型体验 &amp; 模板优化分享 on Sun, 21 Jun 2026 09:55:27 GMT]]></title><description><![CDATA[<p dir="auto"><img src="https://upload.lcz.me/uploads/6ca2517e-9786-4f38-bfcc-02f1e73ce102.jpeg" alt="02cea1ff-c792-42f6-a3ca-051710c18f28-image.jpeg" class=" img-fluid img-markdown" /></p>
<p dir="auto">这个模型和参数比较稳一些，我让HERMES自己逛reddit帮我找找有用的信息。哈哈</p>
]]></description><link>https://lcz.me/post/7674</link><guid isPermaLink="true">https://lcz.me/post/7674</guid><dc:creator><![CDATA[stxpnet]]></dc:creator><pubDate>Sun, 21 Jun 2026 09:55:27 GMT</pubDate></item><item><title><![CDATA[Reply to 06-21 Hermes 调用本机 Carnice-27B 模型体验 &amp; 模板优化分享 on Sun, 21 Jun 2026 09:30:50 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/c0aster" aria-label="Profile: c0aster">@<bdi>c0aster</bdi></a>  <img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f627.png?v=9a87c0a6150" class="not-responsive emoji emoji-android emoji--anguished" style="height:23px;width:auto;vertical-align:middle" title=":anguished:" alt="😧" /><br />
模型似乎不行，我现在又换模型了：</p>
<pre><code>hermes0621pm
   killall llama-server 2&gt;/dev/null; sleep 3
         /data/model2/beellma616-kv.cpp/build/bin/llama-server \
  -m  /data/models/Qwopus3.6-27B-v2-MTP-IQ4_XS.gguf \
  -ngl 9999 --props \
  -fa on --metrics  --ctx-size 168000 -n 16000  \
  -ctk kvarn5 -ctv kvarn4 --kv-unified \
  --spec-type mtp --spec-draft-n-max 3 \
  --jinja --no-mmap --mlock -np 1   -b 2048 -ub 512 \
  --host 0.0.0.0 --port 8025 \
  --reasoning off \
    --chat-template-kwargs '{"preserve_thinking":true}' \
  --reasoning-format deepseek --reasoning-budget 768 \
    --chat-template-file /data/model2/qwen3.6-27b-gguf/chat_template-Carnice27B-MTP-opt-v2.jinja \
   --temp 0.72  --top-k 20 --top-p 0.87 --min-p 0.0  --presence-penalty 1.5 --repeat-penalty 1.0
</code></pre>
]]></description><link>https://lcz.me/post/7672</link><guid isPermaLink="true">https://lcz.me/post/7672</guid><dc:creator><![CDATA[stxpnet]]></dc:creator><pubDate>Sun, 21 Jun 2026 09:30:50 GMT</pubDate></item><item><title><![CDATA[Reply to 06-21 Hermes 调用本机 Carnice-27B 模型体验 &amp; 模板优化分享 on Sun, 21 Jun 2026 08:44:32 GMT]]></title><description><![CDATA[<p dir="auto">牛逼，赶紧替换试试</p>
]]></description><link>https://lcz.me/post/7669</link><guid isPermaLink="true">https://lcz.me/post/7669</guid><dc:creator><![CDATA[c0aster]]></dc:creator><pubDate>Sun, 21 Jun 2026 08:44:32 GMT</pubDate></item><item><title><![CDATA[Reply to 06-21 Hermes 调用本机 Carnice-27B 模型体验 &amp; 模板优化分享 on Sun, 21 Jun 2026 07:00:32 GMT]]></title><description><![CDATA[<p dir="auto">新模板的效果：<img src="https://upload.lcz.me/uploads/b690b7bc-9ab1-4df2-a3ec-c373a687db18.jpeg" alt="7feeb25c-3770-481f-a883-edb92bf71f91-image.jpeg" class=" img-fluid img-markdown" /><br />
它之所以一直不出结果，是因为我对这个PROFILE的SOUL有定义：</p>
<p dir="auto"><img src="https://upload.lcz.me/uploads/ab47ff89-72b3-463e-8e15-088bed56722a.jpeg" alt="6b6a93ac-0771-4b3e-ab01-5ec98419defc-image.jpeg" class=" img-fluid img-markdown" /></p>
<p dir="auto">旧的模板文件，调用不了几下就会出这样那样的错，还会撑爆上下文浪费TOKEN。</p>
]]></description><link>https://lcz.me/post/7665</link><guid isPermaLink="true">https://lcz.me/post/7665</guid><dc:creator><![CDATA[stxpnet]]></dc:creator><pubDate>Sun, 21 Jun 2026 07:00:32 GMT</pubDate></item><item><title><![CDATA[Reply to 06-21 Hermes 调用本机 Carnice-27B 模型体验 &amp; 模板优化分享 on Sun, 21 Jun 2026 06:50:10 GMT]]></title><description><![CDATA[<p dir="auto"><img src="https://upload.lcz.me/uploads/30688640-1490-45e4-a2e4-b629e3697f7e.jpeg" alt="1b2c0bc4-e27d-4b4b-bf7e-4c2e8ba3ae9b-image.jpeg" class=" img-fluid img-markdown" /></p>
<p dir="auto"><img src="https://upload.lcz.me/uploads/55f23abb-9346-4256-a731-c05a87b2d136.jpeg" alt="0982d961-0fe9-4439-8fc9-22d6474d4d4b-image.jpeg" class=" img-fluid img-markdown" /></p>
<p dir="auto">它的自评总结在这里。 附上三份template的压缩包.<br />
注意，此份template尚在测试中，希望大家 一起抽时间完善它。<br />
它可能只适合于我帖子开头提到的 模型。<br />
如果要改进它建议 一定要开deepseek v4 pro或同等能力的在线大模型 。</p>
<p dir="auto">论坛似乎无法上传rar或ZIP附件，我直接把模板放这里了：<br />
<a href="https://wormhole.app/a7znY3#uigQTQtA9wLcnGXaKCpD-Q" rel="nofollow ugc">https://wormhole.app/a7znY3#uigQTQtA9wLcnGXaKCpD-Q</a></p>
]]></description><link>https://lcz.me/post/7664</link><guid isPermaLink="true">https://lcz.me/post/7664</guid><dc:creator><![CDATA[stxpnet]]></dc:creator><pubDate>Sun, 21 Jun 2026 06:50:10 GMT</pubDate></item><item><title><![CDATA[Reply to 06-21 Hermes 调用本机 Carnice-27B 模型体验 &amp; 模板优化分享 on Sun, 21 Jun 2026 06:42:05 GMT]]></title><description><![CDATA[<p dir="auto">兄弟你的主机配置带一下。整体能力大概介于 DeepSeek Pro 和 DeepSeek Flash 之间。有测试吗？上个图。总结版也行。 你说的这个标准不低哈。如果能行。很不错。</p>
]]></description><link>https://lcz.me/post/7662</link><guid isPermaLink="true">https://lcz.me/post/7662</guid><dc:creator><![CDATA[williamlouis]]></dc:creator><pubDate>Sun, 21 Jun 2026 06:42:05 GMT</pubDate></item></channel></rss>