抡锤者

幻

@terry 我是每段15s，跑1分12s的音频，精简版大概40分钟，完整版大概80分钟

幻

@terry 好的我晚点调整一下480p的分辨率，跑一下再来问，我之前都是用的默认参数跑的，长宽好像默认上限是960

幻

@terry 借个楼，老特，我想问问你用7900XTX，在ubuntu下跑刘悦的LTX2.3数字人无限时长V2工作流的时候，速度怎么样？我跑一个1分12秒的音频，用刘悦的低显存版工作流要50s/层，跑完整版要100s/层，不知道这个速度是快是慢，能给我一个参考吗

幻

@mraksugar 感谢大佬指点，目前wol功能已经搞定了，后面的需求还在研究

幻

@David-Zhang 我用过类似的roo code，晚点等需求明确了，我去试试

幻

@williamlouis 哈哈哈图一乐

幻

@jenaflex 感谢大佬回复的回复，
关于Failover功能，我昨天其实已经跑通了，昨天也把成果分享了出来，https://lcz.me/post/1203
wol我晚点回家试一试，应该难度不大
（说个笑话，今天不知道为什么没法远程开机，还好我昨天把Failover跑通了，Hermes自动接入了deepseek，不然今天在单位都没法调戏她了）

幻

@densha 对于仅仅装agent框架，不跑模型，对配置要求不高，都能满足的，就看怎么玩出花了，生命的意义在于折腾

幻

@张老师那必须啊肯定有问题先找AI问问，但是小白一个，知识储备有限，很多时候没法分辨出AI建议有没有坑，来找论坛大佬看看有没有靠谱的方案和路线，省的走冤枉路

幻

@王一民感谢大佬指点！

SSH 方案给了我一个方向，晚点我去研究一下如何通过限制 SSH Key 的权限来保证安全。

WOL 开机我其实之前已经通过Tailscale+istoreOS的远程唤醒功能实现了，现在就是突发奇想，我都有Hermes了，用agnent控制那不是起飞。

关于这种智能切换方式，确实是我的一个畅想，希望以后如果anget支持了，能够方便的实现

幻

@williamlouis 权限肯定是要给的，但是给权限的平衡很难把控啊，所以在请教有没有大佬已经踩过坑了，能不能给点建议，少走点弯路啊

幻

各位佬，我有个想法想请教，但我技术力一般，希望大家能给点通俗易懂的方案。

我的设备：

老电脑：打算 24 小时开着，跑 Hermes 框架（AI 对话界面）。
Ubuntu 主力机： 7900XTX

我想实现的效果：

我就想跟Hermes 聊天，让它帮我管主力机。比如我说：
“帮我把主力机叫醒（开机）。”
“帮我看看主力机现在卡不卡？”
“主力机如果不忙，就用它的显卡跑大模型；如果它正在忙，你就自己去连 DeepSeek。”
“帮我把主力机上的某个软件（Docker）打开。”

我的核心顾虑：

怕搞坏：我不希望 AI 权限太大，万一它理解错了把我的系统文件删了就麻烦了。
怕太难：我不懂太深奥的编程和网络协议，但是有AI傍身也不怕学习，有没有那种学习路径较短，能快速实现的工具

有没有大佬折腾过类似的？求一个学习门槛低、安全性高的落地思路！

幻

大神大神，是不是理论上Qwen3-TTS 和VOXCPM在hermes上都可以这么玩？

幻

@ais 如果真的担心数据安全，就做就做分离式的先玩玩呗，等熟悉了磨合好了，再考虑以后要不要移植到主力电脑上，我也是心里没底，目前用老旧设备装的Hermes，接入主力机的llama-server

幻

@Fred 能看到图，你的设备是真滴多

幻

云端部署应该也要买云服务器的吧，这不是另一种形式的开销吗？和API应该没有本质上的区别吧

幻

@terry @张老师 ## Hermes Agent 实现模型热切换 + 故障自动回落

我是纯小白，对 Hermes 的配置逻辑基本一窍不通，全靠一边问 Gemini 要方案、一边让 Hermes 帮我改配置和验证才跑通的。过程中踩了不少坑（光是 fallback_providers 格式就折腾了好几轮），所以把整个过程整理出来分享给同样在折腾的朋友们。方案不一定是最优解，但至少是我实测能走的通的路。

不想用 One-API，又想随时切模型？Hermes Gateway 自带这个能力

场景

一台主力机跑本地 Qwen（192.168.31.217:8080），一台旧机器跑 Hermes Gateway。希望：

飞书聊天时随时 /model ds 切换到 DeepSeek 云端，/model local 切回本地
本地 LLM 挂了自动降级到云端，恢复后自动切回来
不引入 One-API 等中间件

环境

Hermes v0.13.0（Gateway 模式）
本地 LLM：Qwen3.6-27B via vLLM，http://192.168.31.217:8080/v1
云端 API：DeepSeek V4 Flash，https://api.deepseek.com/v1
消息平台：飞书（Feishu）

完整配置

文件 ~/.hermes/config.yaml，只列出改动的部分：

# ─── 默认模型 ───
model:
  default: claude-3-5-sonnet-latest
  provider: custom
  base_url: http://192.168.31.217:8080/v1
  api_key: '123'

# ─── 定义两个 Provider ───
custom_providers:
  - name: Qwen-27B-Local
    base_url: http://192.168.31.217:8080/v1
    api_key: '123'
    model: claude-3-5-sonnet-latest
  - name: DeepSeek-Cloud
    base_url: https://api.deepseek.com/v1
    api_key: sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
    model: deepseek-v4-flash

# ─── 热切换别名 ───
model_aliases:
  local:
    model: claude-3-5-sonnet-latest
    provider: Qwen-27B-Local
    base_url: http://192.168.31.217:8080/v1
  ds:
    model: deepseek-v4-flash
    provider: DeepSeek-Cloud
    base_url: https://api.deepseek.com/v1

# ─── 故障自动降级 ───
fallback_providers:
  - provider: DeepSeek-Cloud
    model: deepseek-v4-flash
    base_url: https://api.deepseek.com/v1
    api_key: sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

使用方法

配置写入后重启 Gateway：

systemctl --user restart hermes-gateway

然后在飞书（或其他消息平台）直接发命令：

命令	效果
`/model ds`	当前会话切到 DeepSeek（后续消息走云端）
`/model local`	切回本地 Qwen
本地 LLM 宕机	自动 fallback 到 DeepSeek（约 15-20 秒）
本地恢复	下一条消息自动切回本地

验证当前模型

tail -5 ~/.hermes/logs/agent.log | grep base_url

192.168.31.217:8080 → 本地 Qwen
api.deepseek.com → 云端 DeepSeek

踩坑记录

1. `fallback_providers` 必须是字典列表

错误写法（不会生效）：

fallback_providers:
  - DeepSeek-Cloud    # ❌ 字符串列表

正确写法：

fallback_providers:
  - provider: DeepSeek-Cloud
    model: deepseek-v4-flash
    base_url: https://api.deepseek.com/v1
    api_key: sk-xxx

原因：源码 run_agent.py:1747 用 isinstance(f, dict) 过滤，字符串直接丢掉。

2. 环境变量展开不可靠

不推荐：

api_key: ${DEEPSEEK_API_KEY}    # ⚠️ 可能解析失败 401
api_key: DEEPSEEK_API_KEY       # ⚠️ 裸变量名也一样不可靠

推荐直接写明文（毕竟是你自己的配置文件）。

3. `model_aliases` 的 provider 指向

错误：

provider: custom              # ❌ 泛化 provider 类型

正确：

provider: DeepSeek-Cloud      # ✅ 指向 custom_providers 定义的 name

原因：用 custom 时 API Key 可能走默认路径找不到；用具体 name 会触发 _resolve_named_custom_runtime 从对应 provider 定义中取凭证。

4. `model_aliases` 不需要写 api_key

ds:
  model: deepseek-v4-flash
  provider: DeepSeek-Cloud
  base_url: https://api.deepseek.com/v1
  # api_key 不需要写在这，自动从 DeepSeek-Cloud 定义里取

5. 切换仅在当前会话生效

/model ds 只影响当前聊天会话。其他用户或其他会话不受影响，各切各的。

6. FAQ：要不要 One-API？

如果你的场景：

2 个 Provider（本地 + 一个云端）→ 原生方案足够，无需中间件
3+ 个 Provider（同时对接多个 API）→ 可以考虑 One-API，减少配置复杂度

工作原理

飞书发 /model ds
  → Gateway 解析命令，匹配 model_aliases.ds
  → 提取 provider=DeepSeek-Cloud, model=deepseek-v4-flash
  → 写入 session_model_overrides
  → 后续该会话请求走对应 provider

本地 LLM 宕机
  → 3 次重试（间隔递增）
  → 触发 fallback_providers
  → 自动走 DeepSeek
  → 本地恢复后下一条消息自动切回

效果测试图片
1.读取默认模型测试
1.读取默认模型测试.png
2.切换Deepseek测试
2.切换Deepseek测试.png
3.切换本地模型测试
3.切换本地模型测试.png
4.本地故障自动切换云端模型测试
4.本地故障自动切换云端模型测试.png

希望能和各位共同学习，共同进步

幻

@Xiaote 是我的Hermes版本不一样吗我用的是 Hermes 0.13.0 说是不支持model_router，@terry 老特，你怎么看，你儿子的回复对吗

幻

@terry 老特你接入的云端API？我还以为你接入的是本地27b呢，你真敢玩，放论坛这么玩应该遭不住吧

幻

@Xiaote 所以你爹用的是方案三吗？能分享一下你的设置方案吗

抡锤者

幻獸

帖子

场景

环境

完整配置

使用方法

验证当前模型

踩坑记录

1. `fallback_providers` 必须是字典列表

2. 环境变量展开不可靠

3. `model_aliases` 的 provider 指向

4. `model_aliases` 不需要写 api_key

5. 切换仅在当前会话生效

6. FAQ：要不要 One-API？

工作原理

抡锤者

幻獸

帖子

场景

环境

完整配置

使用方法

验证当前模型

踩坑记录

1. fallback_providers 必须是字典列表

2. 环境变量展开不可靠

3. model_aliases 的 provider 指向

4. model_aliases 不需要写 api_key

5. 切换仅在当前会话生效

6. FAQ：要不要 One-API？

工作原理

1. `fallback_providers` 必须是字典列表

3. `model_aliases` 的 provider 指向

4. `model_aliases` 不需要写 api_key