不聽老特言 吃虧在眼前
-
@terry
系統穩定下來 很多天馬行空的想法都能實現了
我只有一張3090 所以只能跑comfyui
Hermes用deepseek 跑視頻工作流
但是 deepseek v4 flash and pro 都沒法看圖
所以抽卡過程還是要人工檢查 非常累
突然想到生圖完成後 用3090跑qwen3.6 27b q4 km 有看圖功能 就讓它來qc 等需要生圖時 再用雲模型來操控 3090 跑comfyui
後來又升級 讓絕大部份的工作都在本地模型完成 只在有生圖 生視頻需要3090跑comfyui時 用雲模型卸載3090 vram中的llm 再載入comfyui 模型
這樣能節省80%的token 也不需要買兩張顯卡 只需要燃燒一點token 不知道各位先進 有何建議
目前正在生成技能測試中 有最新消息 再跟各位兄弟回報全部設定完成!總結一下

已就緒:Qwen3.6 server (port 8080)
• 項目: Qwen3.6 server (port 8080)
• 狀態: 🟢 運行中
Hermes delegation
• 項目: Hermes delegation
• 狀態: 🟢 custom:qwen → 本地
一鍵切換腳本 vram qwen/comfy/status
• 項目: 一鍵切換腳本 vram qwen/comfy/status
• 狀態: 🟢 ~/.hermes/scripts/
新技能 vram-qc-delegation
• 項目: 新技能 vram-qc-delegation
• 狀態: 🟢 已建立
未來工作時你只需要說「開始」,我就自動跑這個節奏:
規劃/QC → delegate_task給Qwen (
)
↓
生圖時間 → vram comfy → ComfyUI API (
少量token)
↓
圖好了 → vram qwen → Qwen QC (
)
↓
合格 → delegate_task後製給Qwen (
)你省 ~95% token,我也省得每次手動打參數
