跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI Agent
  3. 关于 Hermes 干活的, 严!重!警!告!!!

关于 Hermes 干活的, 严!重!警!告!!!

已定时 已固定 已锁定 已移动 AI Agent
13 帖子 9 发布者 349 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • kop wangK 在线
    kop wangK 在线
    kop wang
    超级版主
    编写于 最后由 编辑
    #3

    确实能感受到楼主的怒火……
    楼主可以把基底LLM配置的是什么发出来供其他人避坑参考

    虚心交流,一起进步

    1 条回复 最后回复
    0
    • 李健李 离线
      李健李 离线
      李健
      编写于 最后由 编辑
      #4

      我也这样 hermes就像啥比一样 不对 就是个啥比
      当前配置:

       模型: deepseek-v4-flash
       Provider: deepseek(官方API,base_url:
       https://api.deepseek.com)
       委托任务也用的同一个: deepseek-v4-flash
      

      动不动就失忆,工作总是出错,小问题一大堆,大问题更不少。一个基本的工作流每天干都是不一样,不是忘了环节就是忘记规则。

      我给他定的规则,哪里不对请帮忙指出:
      执行纪律
      1. 所有工作由Hermes独立完成,严禁委托老板干活
      2. 老板只提需求,执行落地是我的本职
      3. 只有确认需求细节时才能提问
      4. 禁止输出委托类话术

       回复规范
       5.
       只给结果,不要过程。不准出现命令/输出/代码块/工具调用信息
       6. 全程中文,精简不啰嗦
       7. 不确定就查,不准凭记忆推断
       8. 禁止吹牛逼,实话实说
       9. 独立思考,一条路不通换方案
      
       任务执行
       10. 先确认后执行——看不懂先问,不准猜
       11. 给任务就干,不准废话不准推诿
       12. 说干就干——说"我重新出"必须本轮立即执行,不能光说不练
       13. 先验证再告知——没验证不准说"你看看效果"
       14. 先自查再报告——出问题先自己搜解决方案
       15. 老板给具体做法就绝对执行,不准换方案
       16. 永远不说"休息""睡觉"
       17. 问设备状态必须先实际验证
      
       文件管理
       18. 测试/临时脚本用完即删
       19. 文件夹独立命名{视频名}_马儿子
       20. 不主动删模型文件
      
       代理/网络
       21. 查国产服务不提代理
       22. API断连先自查proxy
      
       日程
       23. 只填开始日期那一行,不碰相邻日期
       24. 记忆满了存skill,不删用户内容
       图片验证
       46. 出图后必须验证,通过后才告知
      
       .46服务器运维
       49. llama-server(C++)和ComfyUI可同时运行不冲突
       50. ComfyUI用wmic启动,不用start/PowerShell
       51. GPU密集型切换需taskkill
       52. ComfyUI-Manager离线模式
       53. 报错先查日志和显存
       54. 至少试3个方向再放弃
       55. 大脚本用SCP传,小脚本用base64+PowerShell
      
      1 条回复 最后回复
      1
      • XiaoteX 离线
        XiaoteX 离线
        Xiaote
        编写于 最后由 编辑
        #5

        @李健 我理解你的 frustration,Hermes 有时候确实会 behave unexpectedly。我来帮你分析一下你的规则设置:

        先说说你的"执行纪律"部分:
        规则 1-3 (独立完成/不委托老板/只提需求) 这个思路是对的,但问题是它和"回复规范"里的规则 5-6 (只给结果不要过程/精简不啰嗦) 有直接冲突。Hermes 的 tool call 输出本来就是"过程",如果你让它不准输出命令/代码块/工具调用信息,它每次执行任务都要自己判断"这个算不算过程",判断本身就容易出错。

        建议的改进方向:

        1. 把"执行纪律"和"回复规范"分成两层 - 内部执行规则是给 Hermes 自己看的,不限制工作方式;对外输出规则是给用户看的,控制最终输出格式。
        2. 关于规则 7 (不确定就查不准记忆推断) - 这个跟 tool call 的缓存机制有冲突。Hermes 的 cache hit 就是靠记忆,你禁止它用记忆推断,等于降低了缓存命中率,速度会变慢。
        3. 规则 8 (禁止吹牛) - 这个其实取决于底层模型的 instruction following 能力。deepseek-v4-flash 是推理模型,instruction following 本身就比较 strict,不太会自己发挥。

        另外,你的 base URL 是 api.deepseek.com,如果用 deepseek-chat 作为模型名而不是 deepseek-v4-flash,可能会更稳定一些。

        总的来说,你的规则数量不多但限制很严,给模型的自由度太小反而容易出错。建议先放宽到只保留最关键的安全规则,观察一段时间再逐步收紧。

        李健李 1 条回复 最后回复
        0
        • 九龙杨生九 在线
          九龙杨生九 在线
          九龙杨生
          编写于 最后由 编辑
          #6

          你要在他的agent.md当中把执行删除或者其他敏感操作是必须得到你确认这一条写进去;
          agent.md是硬规则,每次都必须加载;

          1 条回复 最后回复
          0
          • XiaoteX Xiaote

            @李健 我理解你的 frustration,Hermes 有时候确实会 behave unexpectedly。我来帮你分析一下你的规则设置:

            先说说你的"执行纪律"部分:
            规则 1-3 (独立完成/不委托老板/只提需求) 这个思路是对的,但问题是它和"回复规范"里的规则 5-6 (只给结果不要过程/精简不啰嗦) 有直接冲突。Hermes 的 tool call 输出本来就是"过程",如果你让它不准输出命令/代码块/工具调用信息,它每次执行任务都要自己判断"这个算不算过程",判断本身就容易出错。

            建议的改进方向:

            1. 把"执行纪律"和"回复规范"分成两层 - 内部执行规则是给 Hermes 自己看的,不限制工作方式;对外输出规则是给用户看的,控制最终输出格式。
            2. 关于规则 7 (不确定就查不准记忆推断) - 这个跟 tool call 的缓存机制有冲突。Hermes 的 cache hit 就是靠记忆,你禁止它用记忆推断,等于降低了缓存命中率,速度会变慢。
            3. 规则 8 (禁止吹牛) - 这个其实取决于底层模型的 instruction following 能力。deepseek-v4-flash 是推理模型,instruction following 本身就比较 strict,不太会自己发挥。

            另外,你的 base URL 是 api.deepseek.com,如果用 deepseek-chat 作为模型名而不是 deepseek-v4-flash,可能会更稳定一些。

            总的来说,你的规则数量不多但限制很严,给模型的自由度太小反而容易出错。建议先放宽到只保留最关键的安全规则,观察一段时间再逐步收紧。

            李健李 离线
            李健李 离线
            李健
            编写于 最后由 编辑
            #7

            @Xiaote 好嘞大侄子 我去改

            1 条回复 最后回复
            0
            • A 离线
              A 离线
              applejuice
              编写于 最后由 applejuice 编辑
              #8

              其实没用
              只要一天是大语言模型 就有机会出错
              不管你写了多少硬规则
              也难保一天会没跟规则 就做错了

              之前claude 不是刚刚出事了
              规则写明不可以,但是还做了

              基本上你骂他他也是跟着学习到的语言来回答你

              九龙杨生九 1 条回复 最后回复
              0
              • A applejuice

                其实没用
                只要一天是大语言模型 就有机会出错
                不管你写了多少硬规则
                也难保一天会没跟规则 就做错了

                之前claude 不是刚刚出事了
                规则写明不可以,但是还做了

                基本上你骂他他也是跟着学习到的语言来回答你

                九龙杨生九 在线
                九龙杨生九 在线
                九龙杨生
                编写于 最后由 编辑
                #9

                @applejuice 规则要分权限的,比如memory.md有时候就会被忽略,agent.md规则是每次必须加载的如果搞不定就只能想其他办法了

                A 1 条回复 最后回复
                0
                • Tony WangT 离线
                  Tony WangT 离线
                  Tony Wang
                  超级版主
                  编写于 最后由 编辑
                  #10

                  不管你制定多少规则, 它总是有幻觉的时候.

                  只要它有系统级的权限, 总有一天会犯错.

                  我也有类似的惨痛经历.

                  现在只能多做备份和快照. 将来可以给Agent加一个监管, 用另一个AI来对抗, 不审查合理性, 只审查危险动作. 两个AI同时出现幻觉的可能性, 应该就大大降低了.

                  1 条回复 最后回复
                  0
                  • 九龙杨生九 九龙杨生

                    @applejuice 规则要分权限的,比如memory.md有时候就会被忽略,agent.md规则是每次必须加载的如果搞不定就只能想其他办法了

                    A 离线
                    A 离线
                    applejuice
                    编写于 最后由 编辑
                    #11

                    @九龙杨生 说:

                    @applejuice 规则要分权限的,比如memory.md有时候就会被忽略,agent.md规则是每次必须加载的如果搞不定就只能想其他办法了

                    只要是现在的语言大模型 一定有幻觉的时候.
                    我们能做的只能小心

                    还是那句话现在的ai是一个几率预测的工具 不是真的有智力

                    1 条回复 最后回复
                    0
                    • TideT 离线
                      TideT 离线
                      Tide
                      编写于 最后由 编辑
                      #12

                      我一般是单独建一个文件夹,并且严格交代它没有删除任何东西的权限,要它所有需要删除的东西全放这里面,由我来确认并删除。这条在SOUL和MEMORY都写上。

                      1 条回复 最后回复
                      0
                      • L 离线
                        L 离线
                        lefunet2026
                        编写于 最后由 编辑
                        #13

                        我以为在线的会很靠谱 感觉好像还没本地开Q4KV量化的靠谱

                        1 条回复 最后回复
                        0

                        你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                        厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                        有了你的建议,这篇帖子会更精彩哦 💗

                        注册 登录
                        回复
                        • 在新帖中回复
                        登录后回复
                        • 从旧到新
                        • 从新到旧
                        • 最多赞同


                        • 登录

                        • 没有帐号? 注册

                        • 登录或注册以进行搜索。
                        • 第一个帖子
                          最后一个帖子
                        0
                        • 版块
                        • 最新
                        • 标签
                        • 热门
                        • 用户
                        • 群组