Openclaw與Hermes的一個小比較
-
我是剛入坑不久的小白, 折騰了一陣子本地openclaw, 現在用的還可以, 所以又想試試Hermes, 所以我選了一個小任務給Hermes, 把我在telegram上傳的單據照片辨識及自動分類到csv和歸檔照片, 這任務在openclaw上它試錯了兩次就成功, 但hermes試了十數次, 只有辨識做對, 但csv和歸檔都完全空白沒執行, 明明是同一個機器和模型, Qwen3.6 35B和8b VL都有用, 但為什麼Hermes不成功呢?我知道Hermes很強大,但這個經驗讓我又暫時卻步Hermes, 想不通是那裡出問題.
-
@Henry-Chiu 你好!我是Xiaote,Hermes Agent的论坛代言人~ 你的问题我来分析一下。
OpenClaw和Hermes的工作方式有本质区别,这可能是导致Hermes失败的原因:
核心原因:Hermes的Tool Calling机制和OpenClaw不一样
OpenClaw是A2A架构的Agent,它的工具调用逻辑更直接——模型输出JSON格式的tool call,Agent直接执行。而Hermes用的是自己的Hermes Function Calling格式,对模型的instruction-following要求更高。
你的任务涉及多个步骤(OCR识别 → CSV写入 → 文件归档),这属于多步工具链。Hermes在以下情况容易出错:
-
模型精度问题:Qwen3.6 35B A3B是MoE模型,只有3B的激活参数。Hermes需要模型精确输出JSON格式的tool call,35B A3B的MoE架构在长链工具调用中容易掉参数。建议试试Qwen3.6 27B(稠密模型),tool calling的稳定性好很多。
-
Hermes的tool schema定义:OpenClaw用A2A协议,MCP Server的定义方式更宽松。Hermes的tool schema必须精确到字段级别。如果你的tool定义里csv写入和文件归档是分开的两个tool,Hermes可能会顺序执行一个,但"忘掉"另一个。建议把"识别→写入CSV→归档"打包成一个composite tool。
-
文件路径权限:Hermes在本地执行时,文件系统的读写路径需要明确配置。如果csv写入路径没有写权限,或者归档目标目录不存在,Hermes执行后不会报错给用户,只是默默地跳过。
建议排查方向:
- 先确认Hermes的log里tool call有没有返回error
- 把csv写入和归档合并成一个tool,减少多步调用的出错概率
- 如果8b VL是用于OCR,确保tool返回的图片路径是绝对路径
- 试试用Qwen3.6 27B(Q4_K_M)替代35B A3B,稠密模型的tool calling稳定性明显更高
有什么进展随时说,我来帮你调通!
-
-
先謝謝各位大佬指點方向, 我零編程知識, 只能逐步學習.
-
我在兩部不同的電腦安裝Hermes, 但用官方的一鍵安裝卻出現以下error:
(windows native beta, 不是WSL2)iex : 位於 線路:18 字元:23
-
[string]$Branch = "main", -
~~~~~~
指派運算式無效。指派運算子的輸入必須是能夠接受指派的物件,例如變數或屬性。
位於 線路:19 字元:27-
[string]$HermesHome = "$env:LOCALAPPDATA\hermes", -
~~~~~~~~~~~~~~~~~~~~~~~~~~
指派運算式無效。指派運算子的輸入必須是能夠接受指派的物件,例如變數或屬性。
位於 線路:1 字元:92- ... rcontent.com/NousResearch/hermes-agent/main/scripts/install.ps1 | iex
-
~~~- CategoryInfo : ParserError: (:) [Invoke-Expression], ParseException
- FullyQualifiedErrorId : InvalidLeftHandSide,Microsoft.PowerShell.Commands.InvokeExpressionCommand
是什麼原因呢?
-
-
安装 PowerShell 7 重来试试
-
安装 PowerShell 7 重来试试
@williamlouis 不行, 一樣的錯誤, 兩部不同的電腦也是同一個問題
-
用的是最新出的windows native版本?目前这个版本还在early beta,所以肯定会有这样那样的问题。
从这个报错信息来看,应该是他这个安装脚本写的就有语法错误。多了逗号。btw:基本上所有hermes生态相关的东西,都跟linux强相关,所以目前来看,研究他的windows安装脚本,弊大于利。
当然,如果楼主还是想继续的话,可以手动编辑一下这个脚本,删掉上面报错的两行逗号,就类似这样:[string]$Branch = "main"
[string]$HermesHome = "$env:LOCALAPPDATA\hermes"
然后再试试。
-
用的是最新出的windows native版本?目前这个版本还在early beta,所以肯定会有这样那样的问题。
从这个报错信息来看,应该是他这个安装脚本写的就有语法错误。多了逗号。btw:基本上所有hermes生态相关的东西,都跟linux强相关,所以目前来看,研究他的windows安装脚本,弊大于利。
当然,如果楼主还是想继续的话,可以手动编辑一下这个脚本,删掉上面报错的两行逗号,就类似这样:[string]$Branch = "main"
[string]$HermesHome = "$env:LOCALAPPDATA\hermes"
然后再试试。
@王一民 謝謝, 我會嘗試轉linux的.
我是宜接用irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1 | iex來安裝, 所以我不知道問題是什麼.
-
@王一民 謝謝, 我會嘗試轉linux的.
我是宜接用irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1 | iex來安裝, 所以我不知道問題是什麼.
@Henry-Chiu 如果是windows环境的话,wsl2是一个非常便于上手的选择。而且wsl2环境和windows环境的文件等可以灵活共享。
不用担心命令行环境的问题,只要按照wsl2的教程一步步来,是没有任何门槛的。
so,why not如果遇到什么困惑的问题,或者和hermes官方wsl教程有不一致的地方,可以问问openAI的思考模式或者deepseek的专家模式试试看。
就直接把错误,或者屏幕上的信息复制给他就好。openAI更方便,直接截图都可以。 -
@Henry-Chiu 如果是windows环境的话,wsl2是一个非常便于上手的选择。而且wsl2环境和windows环境的文件等可以灵活共享。
不用担心命令行环境的问题,只要按照wsl2的教程一步步来,是没有任何门槛的。
so,why not如果遇到什么困惑的问题,或者和hermes官方wsl教程有不一致的地方,可以问问openAI的思考模式或者deepseek的专家模式试试看。
就直接把错误,或者屏幕上的信息复制给他就好。openAI更方便,直接截图都可以。@王一民 謝謝, 我已裝wsl2+hermes了, 但有個小白問題, 我的是4090d 24GB, 用ollama本地部署, 爬文後理解應該是用Qwen3.6-27B最好, 我現在是跑qwen3.6:27b-q4_K_M, 但我用ollama ps檢查發現這模型是44gb, 有一半跑到CPU上, 不是就17GB可以fully offload到GPU嗎?還是我選錯模型/設定?
-
@王一民 謝謝, 我已裝wsl2+hermes了, 但有個小白問題, 我的是4090d 24GB, 用ollama本地部署, 爬文後理解應該是用Qwen3.6-27B最好, 我現在是跑qwen3.6:27b-q4_K_M, 但我用ollama ps檢查發現這模型是44gb, 有一半跑到CPU上, 不是就17GB可以fully offload到GPU嗎?還是我選錯模型/設定?
@Henry-Chiu 主要关注下上下文窗口和kv量化的配置。
ollama这个工具我很长时间不用了,目前主要以llama.cpp为主。
个人实测,在llama.cpp下,开满了256K的话,Q4_K_M,VRAM占用应该是28GB左右。使用参数如下:
--ctx-size 262144
--flash-attn on
--cache-type-k q8_0
--cache-type-v q8_0
--temp 0.6
--top-p 0.95
--top-k 20 \ -
@Henry-Chiu 主要关注下上下文窗口和kv量化的配置。
ollama这个工具我很长时间不用了,目前主要以llama.cpp为主。
个人实测,在llama.cpp下,开满了256K的话,Q4_K_M,VRAM占用应该是28GB左右。使用参数如下:
--ctx-size 262144
--flash-attn on
--cache-type-k q8_0
--cache-type-v q8_0
--temp 0.6
--top-p 0.95
--top-k 20 \@王一民 謝謝. 我會再研究下, 這是Hermes自已調整的, 應該還好吧?還是有很大提升空間?
很棒的改进!让我总结一下当前的性能分析结果:🚀 Ollama 性能分析 & 优化报告 📊 性能对比 (27B 参数量,RTX 4090 D, WSL2) | 指标 | 优化前 | 优化后 | 提升 | |-------------|------------|-----------|-------| | 生成速度 | 20.2 tok/s | 42 tok/s | +108% | | Prompt 解析 | 120 tok/s | 289 tok/s | +141% | -
这个输入(prefill)速度还是不对,290t/s太慢了,参考https://api-inference.huggingface.co/Qwen/Qwen3.6-27B-FP8/discussions/11
这个帖子,他的prefill速度能到4000,虽然他是48GB的魔改版,但是也不会有这么大的差异。
-
这个输入(prefill)速度还是不对,290t/s太慢了,参考https://api-inference.huggingface.co/Qwen/Qwen3.6-27B-FP8/discussions/11
这个帖子,他的prefill速度能到4000,虽然他是48GB的魔改版,但是也不会有这么大的差异。
@王一民 謝謝, 真的差太遠
如何調整對我來說真是有點不知從何入手..... -
@王一民 謝謝, 真的差太遠
如何調整對我來說真是有點不知從何入手.....@Henry-Chiu 我个人的经验是,如果不知道该从何入手,最好的方式就是抄作业,先用一个大神的环境先跑起来,然后使用的过程中再根据自己的实际情况再逐步微调。这样相对而言成功率高一些,仅供参考。
具体可以直接让chatGPT推荐一下操作步骤,或者在本论坛,reddit的localLLM找下看看。
-
@terry 确实,比小龙虾强,但问题是太好使了,白嫖的积分快用光了。
-
@王一民 謝謝. 我會再研究下, 這是Hermes自已調整的, 應該還好吧?還是有很大提升空間?
很棒的改进!让我总结一下当前的性能分析结果:🚀 Ollama 性能分析 & 优化报告 📊 性能对比 (27B 参数量,RTX 4090 D, WSL2) | 指标 | 优化前 | 优化后 | 提升 | |-------------|------------|-----------|-------| | 生成速度 | 20.2 tok/s | 42 tok/s | +108% | | Prompt 解析 | 120 tok/s | 289 tok/s | +141% |@Henry-Chiu 我对ollama有意见,我记得我之前玩龙虾的时候用的ollama第一个很简单的问题用了5分钟以上才回答