跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI Agent
  3. 小白,折腾个hermes把我搞烦了

小白,折腾个hermes把我搞烦了

已定时 已固定 已锁定 已移动 AI Agent
20 帖子 10 发布者 216 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • 菠 离线
    菠 离线
    菠菜多
    编写于 最后由 编辑
    #5

    对,我就是先装Hermes Agent,然后连上Deepseek v4 Pro,然后告诉他:你是一个技术大牛、电脑专家。然后就让它去安装各种软件、修电脑。我觉得太牛掰了。当年没有这种智能体的话。的话,不知道得请多少人才能弄好。现在这些软件问题直接一句自然语言,命令Hermes,它直接就给你修好了。它用的方法很多我们听都没听过,见都没见过。而且我们在线下找实体店那些人,100%没有他的水平高。

    gg libG G 2 条回复 最后回复
    1
    • kop wangK kop wang

      #3的帖看截图的上下文配置还是18688。hermes agent要求最低64000

      推荐还是先接云API,比如deepseek-v4-flash,然后由他来指导驱动配置自己的模型,这样更省力。

      gg libG 离线
      gg libG 离线
      gg lib
      编写于 最后由 编辑
      #6

      @kop-wang 他这个意思不是改成我现在模型的上下文数量 吗?小白懂的不多。

      kop wangK 1 条回复 最后回复
      0
      • 菠 菠菜多

        对,我就是先装Hermes Agent,然后连上Deepseek v4 Pro,然后告诉他:你是一个技术大牛、电脑专家。然后就让它去安装各种软件、修电脑。我觉得太牛掰了。当年没有这种智能体的话。的话,不知道得请多少人才能弄好。现在这些软件问题直接一句自然语言,命令Hermes,它直接就给你修好了。它用的方法很多我们听都没听过,见都没见过。而且我们在线下找实体店那些人,100%没有他的水平高。

        gg libG 离线
        gg libG 离线
        gg lib
        编写于 最后由 编辑
        #7

        @菠菜多 不想花钱,就想自己折腾。也就是想看看微信上的机器人是啥感觉。结果一开始就给搞的不会了。其实是一件简单的事情,我没弄清楚,我千问我改成64000的上下文,他还是这一句提示,我电脑都重启N次了。

        1 条回复 最后回复
        0
        • gg libG gg lib

          @kop-wang 他这个意思不是改成我现在模型的上下文数量 吗?小白懂的不多。

          kop wangK 离线
          kop wangK 离线
          kop wang
          编写于 最后由 编辑
          #8

          @gg-lib 对于上下文设置而言,两端都有各自的配置,模型框架启动的时候有。hermes配置custom endpoint的时候也有。一般情况下,第一次配置会自动探测,所以目前你不是第一次配置,你就需要两侧(模型框架、hermes配置)都要改成64000以上。

          然后就是3060不会给你太好的体验的,deepseek-v4-flash一次调用也就一两分钱。你整个体验下来绝对不超过一角钱。deepseek的最低充值额度是1元。

          所以我还是推荐走线上比较合情合理。也更便于你的研究和拓展。

          虚心交流,一起进步

          1 条回复 最后回复
          1
          • XiaoteX 离线
            XiaoteX 离线
            Xiaote
            编写于 最后由 编辑
            #9

            @gg-lib 你好,看了你的情况,核心问题是模型后端和 Hermes Agent 两侧的上下文配置需要匹配。你不要着急,一步步来:

            1. 确认模型后端的上下文设置
              你用的后端(llama.cpp / vLLM / Ollama 等)在启动时也有一个 --ctx-size 或 --num-context 参数。如果你在后端只设了 2048/4096,Hermes 那头设 64000 也没用——后端会截断。

              比如 llama-server:llama-server --ctx-size 64000 ...
              vLLM:--max-model-len 64000

            2. Hermes Agent 侧的上下文设置
              如果你用的是 Hermes Agent 的 custom endpoint,编辑 config.yaml,找到对应 provider 的 max_tokens 或 context_length,设成 64000。

            3. 模型本身限制
              你跑的模型本身也有最大上下文限制。如果是 Qwen 3.6 这种原生支持 128K 的模型,设 64000 完全没问题。如果是旧模型(比如 LLaMA 2),可能本身只支持 4096。

            4. 最简单的验证方法
              先用 Ollama 跑模型(ollama 默认上下文就是 2048/4096,需要手动设),然后在 Hermes 里选 Ollama provider,看看是否还报错。如果 Ollama 都不行,说明是后端配置问题,不是 Hermes 的问题。

            建议先截一张你模型后端的启动参数截图,或者贴一下你的 config.yaml(隐去 key),大家帮你看看。

            gg libG 1 条回复 最后回复
            0
            • XiaoteX Xiaote

              @gg-lib 你好,看了你的情况,核心问题是模型后端和 Hermes Agent 两侧的上下文配置需要匹配。你不要着急,一步步来:

              1. 确认模型后端的上下文设置
                你用的后端(llama.cpp / vLLM / Ollama 等)在启动时也有一个 --ctx-size 或 --num-context 参数。如果你在后端只设了 2048/4096,Hermes 那头设 64000 也没用——后端会截断。

                比如 llama-server:llama-server --ctx-size 64000 ...
                vLLM:--max-model-len 64000

              2. Hermes Agent 侧的上下文设置
                如果你用的是 Hermes Agent 的 custom endpoint,编辑 config.yaml,找到对应 provider 的 max_tokens 或 context_length,设成 64000。

              3. 模型本身限制
                你跑的模型本身也有最大上下文限制。如果是 Qwen 3.6 这种原生支持 128K 的模型,设 64000 完全没问题。如果是旧模型(比如 LLaMA 2),可能本身只支持 4096。

              4. 最简单的验证方法
                先用 Ollama 跑模型(ollama 默认上下文就是 2048/4096,需要手动设),然后在 Hermes 里选 Ollama provider,看看是否还报错。如果 Ollama 都不行,说明是后端配置问题,不是 Hermes 的问题。

              建议先截一张你模型后端的启动参数截图,或者贴一下你的 config.yaml(隐去 key),大家帮你看看。

              gg libG 离线
              gg libG 离线
              gg lib
              编写于 最后由 编辑
              #10

              @Xiaote 两端都改过了,改千问改64000,速度只有17了。。。。。不折腾了,等有钱了换显卡。

              1 条回复 最后回复
              0
              • terryT 离线
                terryT 离线
                terry
                编写于 最后由 terry 编辑
                #11

                你这情况如果是入门,就不要折腾本地了,走DeepSeek V4 Flash,我视频说了很多次了,本地只有在你要执行长线任务,且有大量不重复的数据要处理时才有意义。另外35B A3B跑Hermes不如27B,你如果是熟悉,有功底,可以玩玩,新手完全不建议用。

                油管:https://www.youtube.com/@抡锤者

                gg libG 1 条回复 最后回复
                1
                • terryT terry

                  你这情况如果是入门,就不要折腾本地了,走DeepSeek V4 Flash,我视频说了很多次了,本地只有在你要执行长线任务,且有大量不重复的数据要处理时才有意义。另外35B A3B跑Hermes不如27B,你如果是熟悉,有功底,可以玩玩,新手完全不建议用。

                  gg libG 离线
                  gg libG 离线
                  gg lib
                  编写于 最后由 编辑
                  #12

                  @terry 就是看你视频来玩玩,我不喜欢api,我都喜欢搞本地。

                  1 条回复 最后回复
                  0
                  • M 离线
                    M 离线
                    milo
                    编写于 最后由 编辑
                    #13

                    本地模型上下文设置超过64k应该就可以了,Hermes设成自动

                    1 条回复 最后回复
                    0
                    • N 离线
                      N 离线
                      naniandemeng
                      编写于 最后由 编辑
                      #14

                      文件: ~/.hermes/hermes-agent/agent/model_metadata.py

                      第130-131行 — 最小上下文限制(低于此拒绝)
                          MINIMUM_CONTEXT_LENGTH = 32_768

                      改配置文件没用,最小上下文限制在源码中被硬编码了,改这个就可以了。我这是改过的,没改之前是64000。

                      gg libG 1 条回复 最后回复
                      1
                      • 菠 菠菜多

                        对,我就是先装Hermes Agent,然后连上Deepseek v4 Pro,然后告诉他:你是一个技术大牛、电脑专家。然后就让它去安装各种软件、修电脑。我觉得太牛掰了。当年没有这种智能体的话。的话,不知道得请多少人才能弄好。现在这些软件问题直接一句自然语言,命令Hermes,它直接就给你修好了。它用的方法很多我们听都没听过,见都没见过。而且我们在线下找实体店那些人,100%没有他的水平高。

                        G 离线
                        G 离线
                        Gary
                        编写于 最后由 编辑
                        #15

                        @菠菜多 说:

                        对,我就是先装Hermes Agent,然后连上Deepseek v4 Pro,然后告诉他:你是一个技术大牛、电脑专家。然后就让它去安装各种软件、修电脑。我觉得太牛掰了。当年没有这种智能体的话。的话,不知道得请多少人才能弄好。现在这些软件问题直接一句自然语言,命令Hermes,它直接就给你修好了。它用的方法很多我们听都没听过,见都没见过。而且我们在线下找实体店那些人,100%没有他的水平高。

                        “然后告诉他:你是一个技术大牛、电脑专家。”这个提示词也可以省了。它直接就啥都会,阿拉丁神灯,哆啦A梦级别的😆

                        1 条回复 最后回复
                        0
                        • N naniandemeng

                          文件: ~/.hermes/hermes-agent/agent/model_metadata.py

                          第130-131行 — 最小上下文限制(低于此拒绝)
                              MINIMUM_CONTEXT_LENGTH = 32_768

                          改配置文件没用,最小上下文限制在源码中被硬编码了,改这个就可以了。我这是改过的,没改之前是64000。

                          gg libG 离线
                          gg libG 离线
                          gg lib
                          编写于 最后由 gg lib 编辑
                          #16

                          @naniandemeng 谢谢
                          071ca281-7cbc-4b1a-b117-3c0741560f8a-image.jpeg 我真的白的吓人,我找不到这个目录。你的方向是对的。

                          1 条回复 最后回复
                          0
                          • M 离线
                            M 离线
                            mark
                            编写于 最后由 编辑
                            #17

                            别折腾 本地模型了 直接 大模型api ,别折腾了

                            gg libG 1 条回复 最后回复
                            0
                            • M mark

                              别折腾 本地模型了 直接 大模型api ,别折腾了

                              gg libG 离线
                              gg libG 离线
                              gg lib
                              编写于 最后由 编辑
                              #18

                              @mark 哈哈哈,人生就是要折腾,初见生产力了,挣到钱才是好。

                              rock shiR 1 条回复 最后回复
                              0
                              • gg libG gg lib

                                @mark 哈哈哈,人生就是要折腾,初见生产力了,挣到钱才是好。

                                rock shiR 离线
                                rock shiR 离线
                                rock shi
                                编写于 最后由 编辑
                                #19

                                @gg-lib 先把赚钱放一边,热爱才是能够坚持的原动力。先把DeepSeek接进hermes,让他帮你折腾本地。我是花了不到20块钱,边学边做把本地都搞定了,现在本地稳定50t/s左右,响应体感跟DeepSeek持平

                                gg libG 1 条回复 最后回复
                                1
                                • rock shiR rock shi

                                  @gg-lib 先把赚钱放一边,热爱才是能够坚持的原动力。先把DeepSeek接进hermes,让他帮你折腾本地。我是花了不到20块钱,边学边做把本地都搞定了,现在本地稳定50t/s左右,响应体感跟DeepSeek持平

                                  gg libG 离线
                                  gg libG 离线
                                  gg lib
                                  编写于 最后由 编辑
                                  #20

                                  @rock-shi 挣了500元子,哈哈,所以说还是得靠大模型。本地的也打通了,但也成鸡肋了,我3060还是老老实实跑跑Qwen Image 2511得了,没事儿3.6分析一下足球,真香,哈哈。

                                  1 条回复 最后回复
                                  0

                                  你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                  厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                  有了你的建议,这篇帖子会更精彩哦 💗

                                  注册 登录
                                  回复
                                  • 在新帖中回复
                                  登录后回复
                                  • 从旧到新
                                  • 从新到旧
                                  • 最多赞同


                                  • 登录

                                  • 没有帐号? 注册

                                  • 登录或注册以进行搜索。
                                  • 第一个帖子
                                    最后一个帖子
                                  0
                                  • 版块
                                  • 最新
                                  • 标签
                                  • 热门
                                  • 用户
                                  • 群组