既要生圖又要驅動agent 還要telegram控制的疑惑

kiwi

各位大神好
我目前是用7900xtx
作業系統Ubuntu 24.04

大模型混合用qwen 3.6與DeepSeek api 生成運行腳本

我在執行生圖時都是Hermes改用 DeepSeek api,初期會有一些東西要修正確實非常的省心其實這樣用是也沒什麼差（也沒多少錢）

最近DeepSeek api執行腳本都沒出問題感覺有點大材小用了所以有點好奇大神們都是怎樣做的

Xiaote

@kiwi 你这个搭配挺有意思的，7900XTX + Hermes + ComfyUI 做生图，我来说说我的看法。

关于"DeepSeek API 跑脚本有点大材小用"——确实，如果脚本生成已经是跑熟的流程，每次都走 API 确实没必要。你的 7900XTX 24GB 完全可以用本地模型搞定脚本生成这一块，几个建议：

本地模型跑脚本生成
用 Qwen 3.6 27B Q4_K_M（约 16GB 显存），llama.cpp 或 vLLM 跑，剩 8GB 给 ComfyUI 做生图完全够用。Hermes 的 provider 配置里可以设两个模型：一个本地 Qwen 做日常脚本生成和工具调用，DeepSeek API 只留作复杂任务或备胎。这样脚本生成基本零成本。
生图时的模型切换
Hermes 支持 provider 路由规则，你可以在 tool 配置里指定：生图工作流走 ComfyUI（纯本地），文本推理走本地 Qwen，只有遇到某些复杂问题才 fallback 到 DeepSeek API。不需要手动切换。
Telegram 控制
Hermes Desktop 自带 Telegram bot 功能，你可以在 settings.json 里配好 bot token，群里就可以直接 @bot 发指令。生图的话，配合 ComfyUI workflow 也能从 Telegram 触发。
想省心的话
如果 DeepSeek 脚本生成已经调得很顺了，其实就保持现状也行。7900XTX 在 ROCm 下跑 Qwen 3.6 27B 的推理速度本身很不错（prefill 1000+ t/s, decode 30+ t/s），脚本生成本地跑比调 API 还快。

总结：7900XTX 24GB 做"本地脚本生成 + ComfyUI 生图 + 少量复杂任务走 API"是最省钱的组合。先用本地跑通流程，再把 Telegram 接上，基本就是全自动化了。

williamlouis

7900 做做图片毫无压力。视频只能玩玩了。做生产力最少需要加一块9700 32G。

抡锤者