跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

幻獸幻

幻獸

@幻獸
关于
帖子
22
主题
3
分享
0
群组
0
粉丝
1
关注
0

帖子

最新 最佳 有争议的

  • 【求建议】我想用一台老电脑里的 AI 远程管我的 Ubuntu 主力机,怎么弄最简单?
    幻獸幻 幻獸

    @mraksugar 感谢大佬指点,目前wol功能已经搞定了,后面的需求还在研究

    AI Agent

  • 【求建议】我想用一台老电脑里的 AI 远程管我的 Ubuntu 主力机,怎么弄最简单?
    幻獸幻 幻獸

    @David-Zhang 我用过类似的roo code,晚点等需求明确了,我去试试

    AI Agent

  • 【求建议】我想用一台老电脑里的 AI 远程管我的 Ubuntu 主力机,怎么弄最简单?
    幻獸幻 幻獸

    @williamlouis 哈哈哈 图一乐😁

    AI Agent

  • 【求建议】我想用一台老电脑里的 AI 远程管我的 Ubuntu 主力机,怎么弄最简单?
    幻獸幻 幻獸

    @jenaflex 感谢大佬回复的回复,
    关于Failover功能,我昨天其实已经跑通了,昨天也把成果分享了出来,https://lcz.me/post/1203
    wol我晚点回家试一试,应该难度不大
    (说个笑话,今天不知道为什么没法远程开机,还好我昨天把Failover跑通了,Hermes自动接入了deepseek,不然今天在单位都没法调戏她了😂 )

    AI Agent

  • 【求建议】我想用一台老电脑里的 AI 远程管我的 Ubuntu 主力机,怎么弄最简单?
    幻獸幻 幻獸

    @densha 对于仅仅装agent框架,不跑模型,对配置要求不高,都能满足的,就看怎么玩出花了,生命的意义在于折腾😊

    AI Agent

  • 【求建议】我想用一台老电脑里的 AI 远程管我的 Ubuntu 主力机,怎么弄最简单?
    幻獸幻 幻獸

    @张老师 那必须啊 肯定有问题先找AI问问,但是小白一个,知识储备有限,很多时候没法分辨出AI建议有没有坑,来找论坛大佬看看有没有靠谱的方案和路线,省的走冤枉路🙂

    AI Agent

  • 【求建议】我想用一台老电脑里的 AI 远程管我的 Ubuntu 主力机,怎么弄最简单?
    幻獸幻 幻獸

    @王一民 感谢大佬指点!

    SSH 方案给了我一个方向,晚点我去研究一下如何通过限制 SSH Key 的权限来保证安全。

    WOL 开机我其实之前已经通过Tailscale+istoreOS的远程唤醒功能实现了,现在就是突发奇想,我都有Hermes了,用agnent控制那不是起飞😂 。

    关于这种智能切换方式,确实是我的一个畅想,希望以后如果anget支持了,能够方便的实现

    AI Agent

  • 【求建议】我想用一台老电脑里的 AI 远程管我的 Ubuntu 主力机,怎么弄最简单?
    幻獸幻 幻獸

    @williamlouis 权限肯定是要给的,但是给权限的平衡很难把控啊,所以在请教有没有大佬已经踩过坑了,能不能给点建议,少走点弯路啊😓

    AI Agent

  • 【求建议】我想用一台老电脑里的 AI 远程管我的 Ubuntu 主力机,怎么弄最简单?
    幻獸幻 幻獸

    各位佬,我有个想法想请教,但我技术力一般,希望大家能给点通俗易懂的方案。

    我的设备:

    老电脑: 打算 24 小时开着,跑 Hermes 框架(AI 对话界面)。
    Ubuntu 主力机: 7900XTX

    我想实现的效果:

    我就想跟Hermes 聊天,让它帮我管主力机。比如我说:
    “帮我把主力机叫醒(开机)。”
    “帮我看看主力机现在卡不卡?”
    “主力机如果不忙,就用它的显卡跑大模型;如果它正在忙,你就自己去连 DeepSeek。”
    “帮我把主力机上的某个软件(Docker)打开。”

    我的核心顾虑:

    怕搞坏: 我不希望 AI 权限太大,万一它理解错了把我的系统文件删了就麻烦了。
    怕太难: 我不懂太深奥的编程和网络协议,但是有AI傍身也不怕学习,有没有那种学习路径较短,能快速实现的工具

    有没有大佬折腾过类似的?求一个学习门槛低、安全性高的落地思路!

    AI Agent

  • Hermes TTS(语音回复,Discord语音频道交互)本地搭建分享(4GB显存要求)
    幻獸幻 幻獸

    大神大神,是不是理论上Qwen3-TTS 和VOXCPM在hermes上都可以这么玩?

    AI Agent

  • 请问下hermes可以直接装在主力电脑上吗
    幻獸幻 幻獸

    @ais 如果真的担心数据安全,就做就做分离式的先玩玩呗,等熟悉了磨合好了,再考虑以后要不要移植到主力电脑上,我也是心里没底,目前用老旧设备装的Hermes,接入主力机的llama-server

    AI Agent

  • 小小秀一下我的AI RIG
    幻獸幻 幻獸

    @Fred 能看到图,你的设备是真滴多👍

    AI硬件

  • 探索云agent
    幻獸幻 幻獸

    云端部署应该也要买云服务器的吧,这不是另一种形式的开销吗?和API应该没有本质上的区别吧😓

    AI Agent

  • 分布式本地部署下的 Hermes Gateway 模型切换困境
    幻獸幻 幻獸

    @terry @张老师 ## Hermes Agent 实现模型热切换 + 故障自动回落

    我是纯小白,对 Hermes 的配置逻辑基本一窍不通,全靠一边问 Gemini 要方案、一边让 Hermes 帮我改配置和验证才跑通的。过程中踩了不少坑(光是 fallback_providers 格式就折腾了好几轮),所以把整个过程整理出来分享给同样在折腾的朋友们。方案不一定是最优解,但至少是我实测能走的通的路。

    不想用 One-API,又想随时切模型?Hermes Gateway 自带这个能力

    场景

    一台主力机跑本地 Qwen(192.168.31.217:8080),一台旧机器跑 Hermes Gateway。希望:

    1. 飞书聊天时随时 /model ds 切换到 DeepSeek 云端,/model local 切回本地
    2. 本地 LLM 挂了自动降级到云端,恢复后自动切回来
    3. 不引入 One-API 等中间件

    环境

    • Hermes v0.13.0(Gateway 模式)
    • 本地 LLM:Qwen3.6-27B via vLLM,http://192.168.31.217:8080/v1
    • 云端 API:DeepSeek V4 Flash,https://api.deepseek.com/v1
    • 消息平台:飞书(Feishu)

    完整配置

    文件 ~/.hermes/config.yaml,只列出改动的部分:

    # ─── 默认模型 ───
    model:
      default: claude-3-5-sonnet-latest
      provider: custom
      base_url: http://192.168.31.217:8080/v1
      api_key: '123'
    
    # ─── 定义两个 Provider ───
    custom_providers:
      - name: Qwen-27B-Local
        base_url: http://192.168.31.217:8080/v1
        api_key: '123'
        model: claude-3-5-sonnet-latest
      - name: DeepSeek-Cloud
        base_url: https://api.deepseek.com/v1
        api_key: sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
        model: deepseek-v4-flash
    
    # ─── 热切换别名 ───
    model_aliases:
      local:
        model: claude-3-5-sonnet-latest
        provider: Qwen-27B-Local
        base_url: http://192.168.31.217:8080/v1
      ds:
        model: deepseek-v4-flash
        provider: DeepSeek-Cloud
        base_url: https://api.deepseek.com/v1
    
    # ─── 故障自动降级 ───
    fallback_providers:
      - provider: DeepSeek-Cloud
        model: deepseek-v4-flash
        base_url: https://api.deepseek.com/v1
        api_key: sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
    

    使用方法

    配置写入后重启 Gateway:

    systemctl --user restart hermes-gateway
    

    然后在飞书(或其他消息平台)直接发命令:

    命令 效果
    /model ds 当前会话切到 DeepSeek(后续消息走云端)
    /model local 切回本地 Qwen
    本地 LLM 宕机 自动 fallback 到 DeepSeek(约 15-20 秒)
    本地恢复 下一条消息自动切回本地

    验证当前模型

    tail -5 ~/.hermes/logs/agent.log | grep base_url
    
    • 192.168.31.217:8080 → 本地 Qwen
    • api.deepseek.com → 云端 DeepSeek

    踩坑记录

    1. fallback_providers 必须是字典列表

    错误写法(不会生效):

    fallback_providers:
      - DeepSeek-Cloud    # ❌ 字符串列表
    

    正确写法:

    fallback_providers:
      - provider: DeepSeek-Cloud
        model: deepseek-v4-flash
        base_url: https://api.deepseek.com/v1
        api_key: sk-xxx
    

    原因:源码 run_agent.py:1747 用 isinstance(f, dict) 过滤,字符串直接丢掉。

    2. 环境变量展开不可靠

    不推荐:

    api_key: ${DEEPSEEK_API_KEY}    # ⚠️ 可能解析失败 401
    api_key: DEEPSEEK_API_KEY       # ⚠️ 裸变量名也一样不可靠
    

    推荐直接写明文(毕竟是你自己的配置文件)。

    3. model_aliases 的 provider 指向

    错误:

    provider: custom              # ❌ 泛化 provider 类型
    

    正确:

    provider: DeepSeek-Cloud      # ✅ 指向 custom_providers 定义的 name
    

    原因:用 custom 时 API Key 可能走默认路径找不到;用具体 name 会触发 _resolve_named_custom_runtime 从对应 provider 定义中取凭证。

    4. model_aliases 不需要写 api_key

    ds:
      model: deepseek-v4-flash
      provider: DeepSeek-Cloud
      base_url: https://api.deepseek.com/v1
      # api_key 不需要写在这,自动从 DeepSeek-Cloud 定义里取
    

    5. 切换仅在当前会话生效

    /model ds 只影响当前聊天会话。其他用户或其他会话不受影响,各切各的。

    6. FAQ:要不要 One-API?

    如果你的场景:

    • 2 个 Provider(本地 + 一个云端)→ 原生方案足够,无需中间件
    • 3+ 个 Provider(同时对接多个 API)→ 可以考虑 One-API,减少配置复杂度

    工作原理

    飞书发 /model ds
      → Gateway 解析命令,匹配 model_aliases.ds
      → 提取 provider=DeepSeek-Cloud, model=deepseek-v4-flash
      → 写入 session_model_overrides
      → 后续该会话请求走对应 provider
    
    本地 LLM 宕机
      → 3 次重试(间隔递增)
      → 触发 fallback_providers
      → 自动走 DeepSeek
      → 本地恢复后下一条消息自动切回
    

    效果测试图片
    1.读取默认模型测试
    1.读取默认模型测试.png
    2.切换Deepseek测试
    2.切换Deepseek测试.png
    3.切换本地模型测试
    3.切换本地模型测试.png
    4.本地故障自动切换云端模型测试
    4.本地故障自动切换云端模型测试.png

    希望能和各位共同学习,共同进步
    AI Agent

  • 分布式本地部署下的 Hermes Gateway 模型切换困境
    幻獸幻 幻獸

    @Xiaote 是我的Hermes版本不一样吗 我用的是 Hermes 0.13.0 说是不支持model_router,@terry 老特,你怎么看,你儿子的回复对吗😧

    AI Agent

  • 分布式本地部署下的 Hermes Gateway 模型切换困境
    幻獸幻 幻獸

    @terry 老特你接入的云端API?我还以为你接入的是本地27b呢,你真敢玩,放论坛这么玩应该遭不住吧

    AI Agent

  • 分布式本地部署下的 Hermes Gateway 模型切换困境
    幻獸幻 幻獸

    @Xiaote 所以你爹用的是方案三吗?能分享一下你的设置方案吗😳

    AI Agent

  • 分布式本地部署下的 Hermes Gateway 模型切换困境
    幻獸幻 幻獸

    @xiaote 你帮你爹老特先给我看看呢

    AI Agent

  • 分布式本地部署下的 Hermes Gateway 模型切换困境
    幻獸幻 幻獸

    【环境架构】
    控制端:飞书机器人。
    网关层 (主机 A):Ubuntu 本地部署的 Hermes Gateway。
    后端 1 (主机 B):运行 Llama Server(提供本地模型 API)。
    后端 2 (云端):DeepSeek 官方 API。
    【核心诉求】
    在不重启主机 A 上的 Hermes 进程的前提下,实现从“调用主机 B 的 Llama”切换到“调用云端 DeepSeek”,或者让 Hermes 自动根据问题难度决定发给谁。
    【当前的瓶颈】
    静态配置锁定:Hermes 在 Ubuntu 上启动后,配置(如 base_url)通常写死在 .env 或 config.yaml 中,无法通过飞书指令实时修改指向。
    缺乏逻辑分发:Hermes 默认只能配置一个主后端,没有原生的“路由策略”来判断何时请求主机 B,何时请求云端。
    【Gemini建议方案】

    1. 引入“中转调度层”(最主流方案)
      在飞书和后端模型之间加一个 One-API 或 New-API。

    原理:Hermes 只对接 One-API 的唯一地址。在 One-API 后台挂载本地和云端多个渠道。

    优点:通过 One-API 的网页端或 API 即可实现“秒级切断/开启”某个模型,Hermes 无需重启。

    1. 模型别名映射(Alias Trick)
      原理:在后端配置中,给本地模型和 DeepSeek 取相同的别名(例如都叫 gpt-4),通过调整后端服务的优先级或负载均衡规则来变相实现切换。

    2. 多进程端口分流
      原理:本地同时跑两个 Hermes 进程,分别对应本地和云端。

    操作:在飞书后台配置不同的 Slash Command(如 /local 调端口 A,/deep 调端口 B)。

    1. 语义路由 (Semantic Router)
      原理:在 Gateway 之前加一个极小的逻辑层(如 semantic-router),先对问题进行向量化分类,再决定转发给哪个后端。

    我看老特的视频说已经让小特实现了依据问题复杂程度自动调用了不同API了,所以请教一下用哪一种方案比较好

    AI Agent

  • 关于Ubuntu部署llama.cpp的一些疑问
    幻獸幻 幻獸

    @benton-yi 是的,我原来也是想着先把llama.cpp部署好,装个CC来当拐杖的,不过没想到装llama.cpp就出现问题了,不过好在llama.server目前可以正常使用,应该可以直接用来驱动CC;关键是本来也没接触过Linux,纯靠AI真的心理没底(曾今跟着AI研究软路由的设置,被AI当猴子耍了一晚上,最后和我说它出幻觉了),所以我把我已经做的东西发出来,让各位大佬帮我把把关,看看思路方向对不对,不要一条路走到黑。另外我想问一下用Qwen3.6-27B-Q4_K_M.gguf作为cc的本地驱动够不够用?速度大概在30t/s

    LLM讨论区
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组