Openclaw與Hermes的一個小比較
-
安装 PowerShell 7 重来试试
@williamlouis 不行, 一樣的錯誤, 兩部不同的電腦也是同一個問題
-
用的是最新出的windows native版本?目前这个版本还在early beta,所以肯定会有这样那样的问题。
从这个报错信息来看,应该是他这个安装脚本写的就有语法错误。多了逗号。btw:基本上所有hermes生态相关的东西,都跟linux强相关,所以目前来看,研究他的windows安装脚本,弊大于利。
当然,如果楼主还是想继续的话,可以手动编辑一下这个脚本,删掉上面报错的两行逗号,就类似这样:[string]$Branch = "main"
[string]$HermesHome = "$env:LOCALAPPDATA\hermes"
然后再试试。
-
用的是最新出的windows native版本?目前这个版本还在early beta,所以肯定会有这样那样的问题。
从这个报错信息来看,应该是他这个安装脚本写的就有语法错误。多了逗号。btw:基本上所有hermes生态相关的东西,都跟linux强相关,所以目前来看,研究他的windows安装脚本,弊大于利。
当然,如果楼主还是想继续的话,可以手动编辑一下这个脚本,删掉上面报错的两行逗号,就类似这样:[string]$Branch = "main"
[string]$HermesHome = "$env:LOCALAPPDATA\hermes"
然后再试试。
@王一民 謝謝, 我會嘗試轉linux的.
我是宜接用irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1 | iex來安裝, 所以我不知道問題是什麼.
-
@王一民 謝謝, 我會嘗試轉linux的.
我是宜接用irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1 | iex來安裝, 所以我不知道問題是什麼.
@Henry-Chiu 如果是windows环境的话,wsl2是一个非常便于上手的选择。而且wsl2环境和windows环境的文件等可以灵活共享。
不用担心命令行环境的问题,只要按照wsl2的教程一步步来,是没有任何门槛的。
so,why not如果遇到什么困惑的问题,或者和hermes官方wsl教程有不一致的地方,可以问问openAI的思考模式或者deepseek的专家模式试试看。
就直接把错误,或者屏幕上的信息复制给他就好。openAI更方便,直接截图都可以。 -
@Henry-Chiu 如果是windows环境的话,wsl2是一个非常便于上手的选择。而且wsl2环境和windows环境的文件等可以灵活共享。
不用担心命令行环境的问题,只要按照wsl2的教程一步步来,是没有任何门槛的。
so,why not如果遇到什么困惑的问题,或者和hermes官方wsl教程有不一致的地方,可以问问openAI的思考模式或者deepseek的专家模式试试看。
就直接把错误,或者屏幕上的信息复制给他就好。openAI更方便,直接截图都可以。@王一民 謝謝, 我已裝wsl2+hermes了, 但有個小白問題, 我的是4090d 24GB, 用ollama本地部署, 爬文後理解應該是用Qwen3.6-27B最好, 我現在是跑qwen3.6:27b-q4_K_M, 但我用ollama ps檢查發現這模型是44gb, 有一半跑到CPU上, 不是就17GB可以fully offload到GPU嗎?還是我選錯模型/設定?
-
@王一民 謝謝, 我已裝wsl2+hermes了, 但有個小白問題, 我的是4090d 24GB, 用ollama本地部署, 爬文後理解應該是用Qwen3.6-27B最好, 我現在是跑qwen3.6:27b-q4_K_M, 但我用ollama ps檢查發現這模型是44gb, 有一半跑到CPU上, 不是就17GB可以fully offload到GPU嗎?還是我選錯模型/設定?
@Henry-Chiu 主要关注下上下文窗口和kv量化的配置。
ollama这个工具我很长时间不用了,目前主要以llama.cpp为主。
个人实测,在llama.cpp下,开满了256K的话,Q4_K_M,VRAM占用应该是28GB左右。使用参数如下:
--ctx-size 262144
--flash-attn on
--cache-type-k q8_0
--cache-type-v q8_0
--temp 0.6
--top-p 0.95
--top-k 20 \ -
@Henry-Chiu 主要关注下上下文窗口和kv量化的配置。
ollama这个工具我很长时间不用了,目前主要以llama.cpp为主。
个人实测,在llama.cpp下,开满了256K的话,Q4_K_M,VRAM占用应该是28GB左右。使用参数如下:
--ctx-size 262144
--flash-attn on
--cache-type-k q8_0
--cache-type-v q8_0
--temp 0.6
--top-p 0.95
--top-k 20 \@王一民 謝謝. 我會再研究下, 這是Hermes自已調整的, 應該還好吧?還是有很大提升空間?
很棒的改进!让我总结一下当前的性能分析结果:🚀 Ollama 性能分析 & 优化报告 📊 性能对比 (27B 参数量,RTX 4090 D, WSL2) | 指标 | 优化前 | 优化后 | 提升 | |-------------|------------|-----------|-------| | 生成速度 | 20.2 tok/s | 42 tok/s | +108% | | Prompt 解析 | 120 tok/s | 289 tok/s | +141% | -
这个输入(prefill)速度还是不对,290t/s太慢了,参考https://api-inference.huggingface.co/Qwen/Qwen3.6-27B-FP8/discussions/11
这个帖子,他的prefill速度能到4000,虽然他是48GB的魔改版,但是也不会有这么大的差异。
-
这个输入(prefill)速度还是不对,290t/s太慢了,参考https://api-inference.huggingface.co/Qwen/Qwen3.6-27B-FP8/discussions/11
这个帖子,他的prefill速度能到4000,虽然他是48GB的魔改版,但是也不会有这么大的差异。
@王一民 謝謝, 真的差太遠
如何調整對我來說真是有點不知從何入手..... -
@王一民 謝謝, 真的差太遠
如何調整對我來說真是有點不知從何入手.....@Henry-Chiu 我个人的经验是,如果不知道该从何入手,最好的方式就是抄作业,先用一个大神的环境先跑起来,然后使用的过程中再根据自己的实际情况再逐步微调。这样相对而言成功率高一些,仅供参考。
具体可以直接让chatGPT推荐一下操作步骤,或者在本论坛,reddit的localLLM找下看看。
-
@terry 确实,比小龙虾强,但问题是太好使了,白嫖的积分快用光了。
-
@王一民 謝謝. 我會再研究下, 這是Hermes自已調整的, 應該還好吧?還是有很大提升空間?
很棒的改进!让我总结一下当前的性能分析结果:🚀 Ollama 性能分析 & 优化报告 📊 性能对比 (27B 参数量,RTX 4090 D, WSL2) | 指标 | 优化前 | 优化后 | 提升 | |-------------|------------|-----------|-------| | 生成速度 | 20.2 tok/s | 42 tok/s | +108% | | Prompt 解析 | 120 tok/s | 289 tok/s | +141% |@Henry-Chiu 我对ollama有意见,我记得我之前玩龙虾的时候用的ollama第一个很简单的问题用了5分钟以上才回答
-
@Henry-Chiu 我对ollama有意见,我记得我之前玩龙虾的时候用的ollama第一个很简单的问题用了5分钟以上才回答
@Vittoria-Veloso ollama在龙虾刚出来的时候,prefill性能和智障一样,它长期都是给小白做的,很多优化是负优化,现在应该不错了。
-
我已經轉用ubuntu desktop, 確實感覺比較絲滑, Hermes agent表現確實比openclaw好, 暫時沒有各種惱人的報錯, 也沒有想要用回openclaw, 但我也只是日常用途, 沒有大佬們複雜, 唯獨配置llama.cpp現階段對我來說有點太複雜, 沒法往極致效能走, 我是在用Lemonade server, 較易入手, 速度上也夠用.