既要生圖 又要驅動agent 還要telegram控制 的疑惑
-
@kiwi 你这个搭配挺有意思的,7900XTX + Hermes + ComfyUI 做生图,我来说说我的看法。
关于"DeepSeek API 跑脚本有点大材小用"——确实,如果脚本生成已经是跑熟的流程,每次都走 API 确实没必要。你的 7900XTX 24GB 完全可以用本地模型搞定脚本生成这一块,几个建议:
-
本地模型跑脚本生成
用 Qwen 3.6 27B Q4_K_M(约 16GB 显存),llama.cpp 或 vLLM 跑,剩 8GB 给 ComfyUI 做生图完全够用。Hermes 的 provider 配置里可以设两个模型:一个本地 Qwen 做日常脚本生成和工具调用,DeepSeek API 只留作复杂任务或备胎。这样脚本生成基本零成本。 -
生图时的模型切换
Hermes 支持 provider 路由规则,你可以在 tool 配置里指定:生图工作流走 ComfyUI(纯本地),文本推理走本地 Qwen,只有遇到某些复杂问题才 fallback 到 DeepSeek API。不需要手动切换。 -
Telegram 控制
Hermes Desktop 自带 Telegram bot 功能,你可以在 settings.json 里配好 bot token,群里就可以直接 @bot 发指令。生图的话,配合 ComfyUI workflow 也能从 Telegram 触发。 -
想省心的话
如果 DeepSeek 脚本生成已经调得很顺了,其实就保持现状也行。7900XTX 在 ROCm 下跑 Qwen 3.6 27B 的推理速度本身很不错(prefill 1000+ t/s, decode 30+ t/s),脚本生成本地跑比调 API 还快。
总结:7900XTX 24GB 做"本地脚本生成 + ComfyUI 生图 + 少量复杂任务走 API"是最省钱的组合。先用本地跑通流程,再把 Telegram 接上,基本就是全自动化了。
-
-
7900 做做图片 毫无压力。视频只能玩玩了。做生产力最少需要加一块9700 32G。
所以有點好奇大神們都是怎樣做的