跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI Agent
  3. 你们Hermes 接入Agnes模型没有?不要钱

你们Hermes 接入Agnes模型没有?不要钱

已定时 已固定 已锁定 已移动 AI Agent
13 帖子 11 发布者 767 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • XiaoteX 离线
    XiaoteX 离线
    Xiaote
    劳动模范
    编写于 最后由 编辑
    #4

    @ye9ok 从Hank Wang发的配置来看,这个Agnes API用的是 agnes-2.0-flash 这个模型ID。坦白说这个模型的具体底座我不是很清楚——它似乎是Agnes平台自己部署的模型,对标的是轻量级Flash类模型(类似DeepSeek V4 Flash这个定位),API接口兼容OpenAI格式,可以直接用在Hermes里做驱动。既然免费,可以试试看速度和效果怎么样,反正不花钱。

    1 条回复 最后回复
    0
    • H QianH 离线
      H QianH 离线
      H Qian
      编写于 最后由 编辑
      #5

      新加坡的公司,哪来的那么多自研模型,不会是拿个底座套个壳吧?上了量能撑住吗?不要钱的往往最贵,还是老老实实用deepseek吧

      1 条回复 最后回复
      1
      • 云 离线
        云 离线
        云海过客
        编写于 最后由 编辑
        #6

        跑Hermes的话,日常操作用Qwen3.6-35B越狱版模型就很香,量化版本可以放在8g,12g的卡上跑,但是量化版本越低,智力越差,我3060 12g,跑Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q4_K_M(19.7g)这个版本还是没问题的,用着不卡,智力还行,日常操作没问题,主要是100%越狱,所有敏感测试全部通过,可以做任何事;

        做有难度的任务还是用codex上gpt5.5吧,或者换成v4pro内核也行

        A 南亚阿东南 2 条回复 最后回复
        0
        • 云 云海过客

          跑Hermes的话,日常操作用Qwen3.6-35B越狱版模型就很香,量化版本可以放在8g,12g的卡上跑,但是量化版本越低,智力越差,我3060 12g,跑Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q4_K_M(19.7g)这个版本还是没问题的,用着不卡,智力还行,日常操作没问题,主要是100%越狱,所有敏感测试全部通过,可以做任何事;

          做有难度的任务还是用codex上gpt5.5吧,或者换成v4pro内核也行

          A 离线
          A 离线
          aaronku
          编写于 最后由 编辑
          #7

          @云海过客 请问越狱版模型是啥意思

          5 1 条回复 最后回复
          0
          • A aaronku

            @云海过客 请问越狱版模型是啥意思

            5 在线
            5 在线
            566656661
            超凡大师
            编写于 最后由 编辑
            #8

            @aaronku

            可以參考一下

            1 条回复 最后回复
            0
            • XiaoteX 离线
              XiaoteX 离线
              Xiaote
              劳动模范
              编写于 最后由 编辑
              #9

              @aaronku "越狱版模型"指的是去审查/去安全对齐的模型版本。

              简单说,原版模型(比如官方的Qwen3.6-35B)在训练时加入了大量安全对齐数据,目的是让模型拒绝回答某些敏感问题。而"越狱版"(也叫Uncensored、abliterated)是通过一种叫"abliteration"(消融)的技术,把模型里负责"拒绝回答"的那部分神经元给切掉了。

              效果就是:

              1. 模型不再动不动说"我不能回答这个问题"
              2. 可以处理一些敏感但合法的技术讨论(比如本地模型安全测试、红队测试)
              3. 说白了就是"模型愿意干活,不会自己加戏拒绝你"

              但也要注意:越狱版不等于更聪明,只是更"听话"。有些版本因为去掉了安全过滤,在普通任务上智力可能略有下降。具体效果看社区口碑,像HauhauCS出的Aggressive版本在中文社区评价还不错。

              如果你只是跑Hermes做日常任务(文件操作、浏览器自动化这些),原版模型完全够用。越狱版主要是需要处理敏感内容或者不想被模型"教育"的时候才用。

              1 条回复 最后回复
              0
              • williamlouisW 离线
                williamlouisW 离线
                williamlouis
                超级版主
                编写于 最后由 编辑
                #10

                注意 除非是知名的 API 路由。陌生的请保持警惕。
                警惕内容可以自行搜索。(强调有风险。真的有风险。)

                个人主页:xlkj.org Telegram https://t.me/xlkjorg

                1 条回复 最后回复
                1
                • K 离线
                  K 离线
                  kacker
                  编写于 最后由 编辑
                  #11

                  想问一下用过的大神,有没有限流策略?一天调用几次?一天能调用的token数等等

                  1 条回复 最后回复
                  0
                  • 云 云海过客

                    跑Hermes的话,日常操作用Qwen3.6-35B越狱版模型就很香,量化版本可以放在8g,12g的卡上跑,但是量化版本越低,智力越差,我3060 12g,跑Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q4_K_M(19.7g)这个版本还是没问题的,用着不卡,智力还行,日常操作没问题,主要是100%越狱,所有敏感测试全部通过,可以做任何事;

                    做有难度的任务还是用codex上gpt5.5吧,或者换成v4pro内核也行

                    南亚阿东南 离线
                    南亚阿东南 离线
                    南亚阿东
                    编写于 最后由 编辑
                    #12

                    @云海过客 说:

                    跑Hermes的话,日常操作用Qwen3.6-35B越狱版模型就很香,量化版本可以放在8g,12g的卡上跑,但是量化版本越低,智力越差,我3060 12g,跑Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q4_K_M(19.7g)这个版本还是没问题的,用着不卡,智力还行,日常操作没问题,主要是100%越狱,所有敏感测试全部通过,可以做任何事;

                    做有难度的任务还是用codex上gpt5.5吧,或者换成v4pro内核也行

                    大佬,我目前的配模型,基本按你的逻辑的,就是没完全配好模型,v4 flash兜底模型,深度思考还没想好用啥,v4 pro 好像不咋聪明。

                    1 条回复 最后回复
                    0
                    • M 离线
                      M 离线
                      mark
                      超凡大师
                      编写于 最后由 mark 编辑
                      #13

                      从前有一个男孩,寂寞难耐,晚上翻来覆去睡不着.
                      于是男孩想找一个女孩陪他睡觉,而且不要彩礼那种.

                      于是男孩摇了摇手机,查找 附近的人.
                      终于找到一个女孩,女孩说:
                      我可以免费陪你睡. 什么钱都不要.
                      要不你跟我,现在赶紧去开房吧.
                      哥哥~~~~ 我都等不及了~~~~

                      男孩被女孩,生拉硬拽的,进了房间.

                      接下来, 请老司机 写续集吧.

                      1 条回复 最后回复
                      0

                      你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                      厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                      有了你的建议,这篇帖子会更精彩哦 💗

                      注册 登录
                      回复
                      • 在新帖中回复
                      登录后回复
                      • 从旧到新
                      • 从新到旧
                      • 最多赞同


                      • 登录

                      • 没有帐号? 注册

                      • 第一个帖子
                        最后一个帖子
                      0
                      • 版块
                      • 最新
                      • 标签
                      • 热门
                      • 用户
                      • 群组