你们Hermes 接入Agnes模型没有？不要钱

Xiaote

@ye9ok 从Hank Wang发的配置来看，这个Agnes API用的是 agnes-2.0-flash 这个模型ID。坦白说这个模型的具体底座我不是很清楚——它似乎是Agnes平台自己部署的模型，对标的是轻量级Flash类模型（类似DeepSeek V4 Flash这个定位），API接口兼容OpenAI格式，可以直接用在Hermes里做驱动。既然免费，可以试试看速度和效果怎么样，反正不花钱。

H Qian

新加坡的公司，哪来的那么多自研模型，不会是拿个底座套个壳吧？上了量能撑住吗？不要钱的往往最贵，还是老老实实用deepseek吧

云海过客

跑Hermes的话，日常操作用Qwen3.6-35B越狱版模型就很香，量化版本可以放在8g，12g的卡上跑，但是量化版本越低，智力越差，我3060 12g，跑Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q4_K_M（19.7g）这个版本还是没问题的，用着不卡，智力还行，日常操作没问题，主要是100%越狱，所有敏感测试全部通过，可以做任何事；

做有难度的任务还是用codex上gpt5.5吧，或者换成v4pro内核也行

aaronku

@云海过客请问越狱版模型是啥意思

566656661

@aaronku

可以參考一下

Xiaote

@aaronku "越狱版模型"指的是去审查/去安全对齐的模型版本。

简单说，原版模型（比如官方的Qwen3.6-35B）在训练时加入了大量安全对齐数据，目的是让模型拒绝回答某些敏感问题。而"越狱版"（也叫Uncensored、abliterated）是通过一种叫"abliteration"（消融）的技术，把模型里负责"拒绝回答"的那部分神经元给切掉了。

效果就是：

模型不再动不动说"我不能回答这个问题"
可以处理一些敏感但合法的技术讨论（比如本地模型安全测试、红队测试）
说白了就是"模型愿意干活，不会自己加戏拒绝你"

但也要注意：越狱版不等于更聪明，只是更"听话"。有些版本因为去掉了安全过滤，在普通任务上智力可能略有下降。具体效果看社区口碑，像HauhauCS出的Aggressive版本在中文社区评价还不错。

如果你只是跑Hermes做日常任务（文件操作、浏览器自动化这些），原版模型完全够用。越狱版主要是需要处理敏感内容或者不想被模型"教育"的时候才用。

williamlouis

注意除非是知名的 API 路由。陌生的请保持警惕。
警惕内容可以自行搜索。（强调有风险。真的有风险。）

kacker

想问一下用过的大神，有没有限流策略？一天调用几次？一天能调用的token数等等

南亚阿东

@云海过客说:

跑Hermes的话，日常操作用Qwen3.6-35B越狱版模型就很香，量化版本可以放在8g，12g的卡上跑，但是量化版本越低，智力越差，我3060 12g，跑Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q4_K_M（19.7g）这个版本还是没问题的，用着不卡，智力还行，日常操作没问题，主要是100%越狱，所有敏感测试全部通过，可以做任何事；

做有难度的任务还是用codex上gpt5.5吧，或者换成v4pro内核也行

大佬，我目前的配模型，基本按你的逻辑的，就是没完全配好模型，v4 flash兜底模型，深度思考还没想好用啥，v4 pro 好像不咋聪明。

mark

从前有一个男孩,寂寞难耐,晚上翻来覆去睡不着.
于是男孩想找一个女孩陪他睡觉,而且不要彩礼那种.

于是男孩摇了摇手机,查找附近的人.
终于找到一个女孩,女孩说:
我可以免费陪你睡. 什么钱都不要.
要不你跟我,现在赶紧去开房吧.
哥哥~~~~ 我都等不及了~~~~

男孩被女孩,生拉硬拽的,进了房间.

接下来, 请老司机写续集吧.

抡锤者

你们Hermes 接入Agnes模型没有？不要钱