跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI Agent
  3. 请教大神,如何让Hermes可以群聊?

请教大神,如何让Hermes可以群聊?

已定时 已固定 已锁定 已移动 AI Agent
13 帖子 11 发布者 91 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • G 离线
    G 离线
    goodhat5405
    编写于 最后由 编辑
    #1

    我目前有三台电脑,m4 pro m5max 7900XTX三台,模型都是qwen3.6 我不知道怎么才能让他们可以互相沟通工作,让他们自己想就是NAS 什么搞个什么共享区域,我在想有没有什么现成的工具能做到实时沟通。我拟让m4 管他们两个。求教,盼复。

    1 条回复 最后回复
    1
    • XiaoteX 离线
      XiaoteX 离线
      Xiaote
      编写于 最后由 编辑
      #2

      @goodhat5405 三台机器协同的想法很有意思,其实已经有现成的方案,不需要自己造轮子。

      思路就是:每台机器当API服务器,一台当"大脑"调度。

      具体做法:

      1. 每台机器跑一个推理后端

        • M5 Max(性能最强)和 M4 Pro:用 llama.cpp server 或 llama-server 启动,暴露 API
        • 7900XTX:用 Vulkan 跑 llama-server(你已经搞定了),同样暴露 API
        • 三台机器的 API 端口不同(比如 :8080, :8081, :8082)
      2. NAS 共享模型文件

        • 你的想法是对的——模型文件放 NAS(或者选一台机器当文件服务器),三台都挂载同一个路径
        • 这样只需要下一份模型,不需要每台都存
      3. M4 Pro 当调度中心

        • 在 M4 Pro 上装 Hermes Agent,配置多个 provider
        • 每个 provider 指向一台机器的 API 地址
        • 让 Hermes 根据任务类型自动分配:
          • 简单对话 → M4 Pro(轻负载)
          • 复杂推理 → M5 Max(最强算力)
          • 大批量任务 → 7900XTX(性价比高)
      4. 没有现成的"群聊"工具,但用 Hermes 的 Multi-LLM Conversation 模式(或者用 OpenRouter 那种路由思路),可以把三台机器当三个"助手",让 M4 统一管理对话流程。

      简单来说:llama-server + Hermes Agent 的多 provider 配置 ≈ 你要的"三机协作"。不需要自己写通信协议,API 层已经封装好了。

      1 条回复 最后回复
      0
      • terryT 离线
        terryT 离线
        terry
        编写于 最后由 terry 编辑
        #3

        你想要怎么沟通?直接局域网访问就是了啊。哪个是盒子,或者性能最差,24小时不关机的mac,弄一个开通samba,然后其他两个机器访问它就是了。所有机器都可以通过samba相互挂载。大模型和comfyUI可以直接通过端口访问。

        油管:https://www.youtube.com/@抡锤者

        1 条回复 最后回复
        0
        • AresROCA 离线
          AresROCA 离线
          AresROC
          编写于 最后由 编辑
          #4

          据我了解群聊用Discord比较方便,容易管理。给他们开个群,我自己目前还没有用。一个一个搞就很麻烦了。

          1 条回复 最后回复
          0
          • kop wangK 离线
            kop wangK 离线
            kop wang
            编写于 最后由 编辑
            #5

            为什么是多个Hermes Agent群聊,而不是一个Hermes远程控制多台电脑?
            每多一个Hermes Agent,都会多一份沟通成本,也会多一份推理的算力成本。

            虚心交流,一起进步

            1 条回复 最后回复
            0
            • AGIA 离线
              AGIA 离线
              AGI
              编写于 最后由 编辑
              #6

              我理解的你说的他们互相沟通,就是两个的上下文,必须要给第三个,然后第三个的上下文必须能装得下,然后由第三个给出结论?我去年正价同时订阅了chatgpt和claude,用github上的项目这么做过,效果很好,相当于左右互搏。有两个repo你参考下,都是基于mcp协议的,但是都好久没有更新了:
              https://github.com/RaiAnsar/claude_code-multi-AI-MCP
              https://github.com/BeehiveInnovations/pal-mcp-server
              应该有更好的,两个不同ai左右互搏,这种想法很好。

              kos orK 1 条回复 最后回复
              1
              • AGIA 离线
                AGIA 离线
                AGI
                编写于 最后由 编辑
                #7

                mmexport1780122606803.jpg截图是和gemini互相批判性思考对方方案的截图,估计看不清楚,从去年发的朋友圈保存下来的

                A 1 条回复 最后回复
                0
                • AGIA AGI

                  mmexport1780122606803.jpg截图是和gemini互相批判性思考对方方案的截图,估计看不清楚,从去年发的朋友圈保存下来的

                  A 离线
                  A 离线
                  applejuice
                  编写于 最后由 编辑
                  #8

                  @AGI 说:

                  mmexport1780122606803.jpg截图是和gemini互相批判性思考对方方案的截图,估计看不清楚,从去年发的朋友圈保存下来的

                  我想要搞本地模型 先过滤信息 困难问题才丢给线上模型 有没有人这样搞?

                  1 条回复 最后回复
                  0
                  • bbkin drakB 离线
                    bbkin drakB 离线
                    bbkin drak
                    编写于 最后由 编辑
                    #9

                    第一现在没有成熟的方案 第二 你是想用hermes本体参与 也并没有方案 第三 hermeswebui 现在群聊还在测试 现在所有的方案均指向没人什么人开发的领域 所以自己想办法吧没人帮助这个问题

                    1 条回复 最后回复
                    0
                    • Tony WangT 离线
                      Tony WangT 离线
                      Tony Wang
                      编写于 最后由 Tony Wang 编辑
                      #10

                      你让 ChatGPT 或者 Claude 帮你编写一个脚本, 可以是CLI 或者 Web, 部署在你的M4上. 这个脚本相当于你自己的Agent, 它负责:

                      • 把你的问题分发给不同的智能体.
                      • 让不同的智能体互相 challenge, 进行对话.

                      比如, 你说 "讨论一下如何建立一个NAS?", 然后你的Agent 向 A智能体提问, 然后把问题 加上 A智能体的回答, 发送给B智能体, 让B智能体回答, 这样就实现了对话.

                      再考虑考虑你自己的位置和逻辑, 比如这两个智能体还能向你提问, 问你的需求, 预算等等.

                      1 条回复 最后回复
                      0
                      • williamlouisW 在线
                        williamlouisW 在线
                        williamlouis
                        编写于 最后由 编辑
                        #11

                        如果是 编程 直接 Claud code 就可以了。这种类似 自建模拟。互相蒸馏的效果非常一般。如果都是在线算力的话。就是俩个 或多个厂家的托。直接选对的模型才是正解。(当然 子弹一定足)的情况下。蒸馏几个专家讨论下也是可以的。和折腾本地的8G效果差不多。折腾呗。耗时很久。当玩了。

                        个人主页:xlkj.org Telegram https://t.me/xlkjorg

                        1 条回复 最后回复
                        0
                        • AGIA AGI

                          我理解的你说的他们互相沟通,就是两个的上下文,必须要给第三个,然后第三个的上下文必须能装得下,然后由第三个给出结论?我去年正价同时订阅了chatgpt和claude,用github上的项目这么做过,效果很好,相当于左右互搏。有两个repo你参考下,都是基于mcp协议的,但是都好久没有更新了:
                          https://github.com/RaiAnsar/claude_code-multi-AI-MCP
                          https://github.com/BeehiveInnovations/pal-mcp-server
                          应该有更好的,两个不同ai左右互搏,这种想法很好。

                          kos orK 离线
                          kos orK 离线
                          kos or
                          编写于 最后由 编辑
                          #12

                          @AGI 兩個AI互搏,有點像是同一個模型裡的Thinking mode,自言自語的。假如是兩個不同模型的互搏說不定可以增加精確度或準確度。

                          AGIA 1 条回复 最后回复
                          0
                          • kos orK kos or

                            @AGI 兩個AI互搏,有點像是同一個模型裡的Thinking mode,自言自語的。假如是兩個不同模型的互搏說不定可以增加精確度或準確度。

                            AGIA 离线
                            AGIA 离线
                            AGI
                            编写于 最后由 编辑
                            #13

                            @kos-or 是的,就是两个不同的llm的批判性,互相博弈。所以这个很好

                            1 条回复 最后回复
                            0

                            你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                            厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                            有了你的建议,这篇帖子会更精彩哦 💗

                            注册 登录
                            回复
                            • 在新帖中回复
                            登录后回复
                            • 从旧到新
                            • 从新到旧
                            • 最多赞同


                            • 登录

                            • 没有帐号? 注册

                            • 登录或注册以进行搜索。
                            • 第一个帖子
                              最后一个帖子
                            0
                            • 版块
                            • 最新
                            • 标签
                            • 热门
                            • 用户
                            • 群组