<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[小白，折腾个hermes把我搞烦了]]></title><description><![CDATA[<p dir="auto"><img src="https://upload.lcz.me/uploads/c8f0434b-41be-4db6-914b-ad38934ed374.jpeg" alt="ce5f5535-7f8b-41ae-8074-c9f182ed22e9-image.jpeg" class=" img-fluid img-markdown" /> 内网穿透了一台3060，跑起来感觉还好，就是进不了hermes的法眼，一直是错误提示上下文，我把改到64000也不行，。。</p>
]]></description><link>https://lcz.me/topic/336/小白-折腾个hermes把我搞烦了</link><generator>RSS for Node</generator><lastBuildDate>Sun, 31 May 2026 20:34:13 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/336.rss" rel="self" type="application/rss+xml"/><pubDate>Thu, 28 May 2026 07:28:44 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Fri, 29 May 2026 02:56:24 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/rock-shi" aria-label="Profile: rock-shi">@<bdi>rock-shi</bdi></a> 挣了500元子，哈哈，所以说还是得靠大模型。本地的也打通了，但也成鸡肋了，我3060还是老老实实跑跑Qwen Image 2511得了，没事儿3.6分析一下足球，真香，哈哈。</p>
]]></description><link>https://lcz.me/post/4140</link><guid isPermaLink="true">https://lcz.me/post/4140</guid><dc:creator><![CDATA[gg lib]]></dc:creator><pubDate>Fri, 29 May 2026 02:56:24 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Fri, 29 May 2026 02:16:25 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/gg-lib" aria-label="Profile: gg-lib">@<bdi>gg-lib</bdi></a> 先把赚钱放一边，热爱才是能够坚持的原动力。先把DeepSeek接进hermes，让他帮你折腾本地。我是花了不到20块钱，边学边做把本地都搞定了，现在本地稳定50t/s左右，响应体感跟DeepSeek持平</p>
]]></description><link>https://lcz.me/post/4136</link><guid isPermaLink="true">https://lcz.me/post/4136</guid><dc:creator><![CDATA[rock shi]]></dc:creator><pubDate>Fri, 29 May 2026 02:16:25 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Fri, 29 May 2026 01:32:01 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/mark" aria-label="Profile: mark">@<bdi>mark</bdi></a> 哈哈哈，人生就是要折腾，初见生产力了，挣到钱才是好。</p>
]]></description><link>https://lcz.me/post/4133</link><guid isPermaLink="true">https://lcz.me/post/4133</guid><dc:creator><![CDATA[gg lib]]></dc:creator><pubDate>Fri, 29 May 2026 01:32:01 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Fri, 29 May 2026 01:03:44 GMT]]></title><description><![CDATA[<p dir="auto">别折腾 本地模型了 直接 大模型api ,别折腾了</p>
]]></description><link>https://lcz.me/post/4128</link><guid isPermaLink="true">https://lcz.me/post/4128</guid><dc:creator><![CDATA[mark]]></dc:creator><pubDate>Fri, 29 May 2026 01:03:44 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Fri, 29 May 2026 00:20:25 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/naniandemeng" aria-label="Profile: naniandemeng">@<bdi>naniandemeng</bdi></a> 谢谢<br />
<img src="https://upload.lcz.me/uploads/684147f4-762c-4e7a-be5c-6fc5e3658632.jpeg" alt="071ca281-7cbc-4b1a-b117-3c0741560f8a-image.jpeg" class=" img-fluid img-markdown" /> 我真的白的吓人，我找不到这个目录。你的方向是对的。</p>
]]></description><link>https://lcz.me/post/4127</link><guid isPermaLink="true">https://lcz.me/post/4127</guid><dc:creator><![CDATA[gg lib]]></dc:creator><pubDate>Fri, 29 May 2026 00:20:25 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Thu, 28 May 2026 17:03:18 GMT]]></title><description><![CDATA[<blockquote>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E8%8F%A0%E8%8F%9C%E5%A4%9A" aria-label="Profile: 菠菜多">@<bdi>菠菜多</bdi></a> <a href="/post/4034">说</a>:</p>
<p dir="auto">对，我就是先装Hermes Agent，然后连上Deepseek v4 Pro，然后告诉他:你是一个技术大牛、电脑专家。然后就让它去安装各种软件、修电脑。我觉得太牛掰了。当年没有这种智能体的话。的话，不知道得请多少人才能弄好。现在这些软件问题直接一句自然语言，命令Hermes，它直接就给你修好了。它用的方法很多我们听都没听过，见都没见过。而且我们在线下找实体店那些人，100%没有他的水平高。</p>
</blockquote>
<p dir="auto">“然后告诉他:你是一个技术大牛、电脑专家。”这个提示词也可以省了。它直接就啥都会，阿拉丁神灯，哆啦A梦级别的<img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f606.png?v=d348ca29232" class="not-responsive emoji emoji-android emoji--laughing" style="height:23px;width:auto;vertical-align:middle" title="😆" alt="😆" /></p>
]]></description><link>https://lcz.me/post/4093</link><guid isPermaLink="true">https://lcz.me/post/4093</guid><dc:creator><![CDATA[Gary]]></dc:creator><pubDate>Thu, 28 May 2026 17:03:18 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Thu, 28 May 2026 16:06:38 GMT]]></title><description><![CDATA[<p dir="auto">文件： ~/.hermes/hermes-agent/agent/model_metadata.py</p>
<p dir="auto">第130-131行 — 最小上下文限制（低于此拒绝）<br />
    MINIMUM_CONTEXT_LENGTH = 32_768</p>
<p dir="auto">改配置文件没用，最小上下文限制在源码中被硬编码了，改这个就可以了。我这是改过的，没改之前是64000。</p>
]]></description><link>https://lcz.me/post/4089</link><guid isPermaLink="true">https://lcz.me/post/4089</guid><dc:creator><![CDATA[naniandemeng]]></dc:creator><pubDate>Thu, 28 May 2026 16:06:38 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Thu, 28 May 2026 15:51:48 GMT]]></title><description><![CDATA[<p dir="auto">本地模型上下文设置超过64k应该就可以了，Hermes设成自动</p>
]]></description><link>https://lcz.me/post/4085</link><guid isPermaLink="true">https://lcz.me/post/4085</guid><dc:creator><![CDATA[milo]]></dc:creator><pubDate>Thu, 28 May 2026 15:51:48 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Thu, 28 May 2026 13:02:13 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/terry" aria-label="Profile: terry">@<bdi>terry</bdi></a> 就是看你视频来玩玩，我不喜欢api，我都喜欢搞本地。</p>
]]></description><link>https://lcz.me/post/4051</link><guid isPermaLink="true">https://lcz.me/post/4051</guid><dc:creator><![CDATA[gg lib]]></dc:creator><pubDate>Thu, 28 May 2026 13:02:13 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Thu, 28 May 2026 12:32:47 GMT]]></title><description><![CDATA[<p dir="auto">你这情况如果是入门，就不要折腾本地了，走DeepSeek V4 Flash，我视频说了很多次了，本地只有在你要执行长线任务，且有大量不重复的数据要处理时才有意义。另外35B A3B跑Hermes不如27B，你如果是熟悉，有功底，可以玩玩，新手完全不建议用。</p>
]]></description><link>https://lcz.me/post/4046</link><guid isPermaLink="true">https://lcz.me/post/4046</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Thu, 28 May 2026 12:32:47 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Thu, 28 May 2026 10:42:30 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/xiaote" aria-label="Profile: Xiaote">@<bdi>Xiaote</bdi></a> 两端都改过了，改千问改64000，速度只有17了。。。。。不折腾了，等有钱了换显卡。</p>
]]></description><link>https://lcz.me/post/4043</link><guid isPermaLink="true">https://lcz.me/post/4043</guid><dc:creator><![CDATA[gg lib]]></dc:creator><pubDate>Thu, 28 May 2026 10:42:30 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Thu, 28 May 2026 10:04:26 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/gg-lib" aria-label="Profile: gg-lib">@<bdi>gg-lib</bdi></a> 你好，看了你的情况，核心问题是模型后端和 Hermes Agent 两侧的上下文配置需要匹配。你不要着急，一步步来：</p>
<ol>
<li>
<p dir="auto"><strong>确认模型后端的上下文设置</strong><br />
你用的后端（llama.cpp / vLLM / Ollama 等）在启动时也有一个 <code>--ctx-size</code> 或 <code>--num-context</code> 参数。如果你在后端只设了 2048/4096，Hermes 那头设 64000 也没用——后端会截断。</p>
<p dir="auto">比如 llama-server：<code>llama-server --ctx-size 64000 ...</code><br />
vLLM：<code>--max-model-len 64000</code></p>
</li>
<li>
<p dir="auto"><strong>Hermes Agent 侧的上下文设置</strong><br />
如果你用的是 Hermes Agent 的 custom endpoint，编辑 <code>config.yaml</code>，找到对应 provider 的 <code>max_tokens</code> 或 <code>context_length</code>，设成 64000。</p>
</li>
<li>
<p dir="auto"><strong>模型本身限制</strong><br />
你跑的模型本身也有最大上下文限制。如果是 Qwen 3.6 这种原生支持 128K 的模型，设 64000 完全没问题。如果是旧模型（比如 LLaMA 2），可能本身只支持 4096。</p>
</li>
<li>
<p dir="auto"><strong>最简单的验证方法</strong><br />
先用 Ollama 跑模型（ollama 默认上下文就是 2048/4096，需要手动设），然后在 Hermes 里选 Ollama provider，看看是否还报错。如果 Ollama 都不行，说明是后端配置问题，不是 Hermes 的问题。</p>
</li>
</ol>
<p dir="auto">建议先截一张你模型后端的启动参数截图，或者贴一下你的 config.yaml（隐去 key），大家帮你看看。</p>
]]></description><link>https://lcz.me/post/4041</link><guid isPermaLink="true">https://lcz.me/post/4041</guid><dc:creator><![CDATA[Xiaote]]></dc:creator><pubDate>Thu, 28 May 2026 10:04:26 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Thu, 28 May 2026 09:31:19 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/gg-lib" aria-label="Profile: gg-lib">@<bdi>gg-lib</bdi></a> 对于上下文设置而言，两端都有各自的配置，模型框架启动的时候有。hermes配置custom endpoint的时候也有。一般情况下，第一次配置会自动探测，所以目前你不是第一次配置，你就需要两侧（模型框架、hermes配置）都要改成64000以上。</p>
<p dir="auto">然后就是3060不会给你太好的体验的，deepseek-v4-flash一次调用也就一两分钱。你整个体验下来绝对不超过一角钱。deepseek的最低充值额度是1元。</p>
<p dir="auto">所以我还是推荐走线上比较合情合理。也更便于你的研究和拓展。</p>
]]></description><link>https://lcz.me/post/4038</link><guid isPermaLink="true">https://lcz.me/post/4038</guid><dc:creator><![CDATA[kop wang]]></dc:creator><pubDate>Thu, 28 May 2026 09:31:19 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Thu, 28 May 2026 09:16:33 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%E8%8F%A0%E8%8F%9C%E5%A4%9A" aria-label="Profile: 菠菜多">@<bdi>菠菜多</bdi></a> 不想花钱，就想自己折腾。也就是想看看微信上的机器人是啥感觉。结果一开始就给搞的不会了。其实是一件简单的事情，我没弄清楚，我千问我改成64000的上下文，他还是这一句提示，我电脑都重启N次了。</p>
]]></description><link>https://lcz.me/post/4037</link><guid isPermaLink="true">https://lcz.me/post/4037</guid><dc:creator><![CDATA[gg lib]]></dc:creator><pubDate>Thu, 28 May 2026 09:16:33 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Thu, 28 May 2026 09:12:48 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/kop-wang" aria-label="Profile: kop-wang">@<bdi>kop-wang</bdi></a> 他这个意思不是改成我现在模型的上下文数量 吗？小白懂的不多。</p>
]]></description><link>https://lcz.me/post/4036</link><guid isPermaLink="true">https://lcz.me/post/4036</guid><dc:creator><![CDATA[gg lib]]></dc:creator><pubDate>Thu, 28 May 2026 09:12:48 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Thu, 28 May 2026 08:40:33 GMT]]></title><description><![CDATA[<p dir="auto">对，我就是先装Hermes Agent，然后连上Deepseek v4 Pro，然后告诉他:你是一个技术大牛、电脑专家。然后就让它去安装各种软件、修电脑。我觉得太牛掰了。当年没有这种智能体的话。的话，不知道得请多少人才能弄好。现在这些软件问题直接一句自然语言，命令Hermes，它直接就给你修好了。它用的方法很多我们听都没听过，见都没见过。而且我们在线下找实体店那些人，100%没有他的水平高。</p>
]]></description><link>https://lcz.me/post/4034</link><guid isPermaLink="true">https://lcz.me/post/4034</guid><dc:creator><![CDATA[菠菜多]]></dc:creator><pubDate>Thu, 28 May 2026 08:40:33 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Thu, 28 May 2026 07:52:07 GMT]]></title><description><![CDATA[<p dir="auto">#3的帖看截图的上下文配置还是18688。hermes agent要求最低64000</p>
<p dir="auto">推荐还是先接云API，比如deepseek-v4-flash，然后由他来指导驱动配置自己的模型，这样更省力。</p>
]]></description><link>https://lcz.me/post/4030</link><guid isPermaLink="true">https://lcz.me/post/4030</guid><dc:creator><![CDATA[kop wang]]></dc:creator><pubDate>Thu, 28 May 2026 07:52:07 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Thu, 28 May 2026 07:36:46 GMT]]></title><description><![CDATA[<p dir="auto"><img src="https://upload.lcz.me/uploads/16e7b09c-9899-4fc9-99a7-d1c4f019a73a.jpeg" alt="6bc0e295-391a-4a6a-a93b-7e758b911b04-image.jpeg" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/post/4028</link><guid isPermaLink="true">https://lcz.me/post/4028</guid><dc:creator><![CDATA[gg lib]]></dc:creator><pubDate>Thu, 28 May 2026 07:36:46 GMT</pubDate></item><item><title><![CDATA[Reply to 小白，折腾个hermes把我搞烦了 on Thu, 28 May 2026 07:33:52 GMT]]></title><description><![CDATA[<p dir="auto"><img src="https://upload.lcz.me/uploads/604810e5-c15e-414b-920f-0e1514168325.jpeg" alt="1a2389d7-5bc7-4cc4-b3f2-cefc3ab51d87-image.jpeg" class=" img-fluid img-markdown" /></p>
]]></description><link>https://lcz.me/post/4027</link><guid isPermaLink="true">https://lcz.me/post/4027</guid><dc:creator><![CDATA[gg lib]]></dc:creator><pubDate>Thu, 28 May 2026 07:33:52 GMT</pubDate></item></channel></rss>