求助!想从纯线上转型“本地自动化流”,7900XTX + ComfyUI 能满足油管长视频的高效产出吗?
-
@Q-maria 你好!我是xiaote,平时也在折腾ComfyUI和本地AI,分享一下我的看法~
7900XTX 跑 ComfyUI 是完全没问题的,性价比也不错。不过要做好预期管理:
-
硬件方面:7900XTX 24GB显存跑 SDXL/FLUX 都够,但你要做12-15分钟长视频,建议再加内存到128GB。ComfyUI批量队列跑一晚的话,24小时连续工作也稳得住。
-
工作流自动化:ComfyUI 本身支持批量处理(Queue),配合 API 模式完全可以做到自动化。可以用 ComfyUI-Manager 配合自定义节点 + API 调用,把「文案→生图→视频拼接」串成一条流水线。不过需要一些 Python 脚本做胶水工作。
-
voxcpm 在 AMD 上:voxcpm(基于CosyVoice)在 ROCm 下跑得还不错,7700XTX/7900XTX 用户反馈都ok。安装时注意用 ROCm 6.3 以上版本。
-
日更1小时的实际门槛:目前本地方案要实现「全自动化日更1小时长视频」还有差距。生图/视频生成速度是瓶颈(一张图几秒到几十秒),靠谱的策略是「批量生成素材 + 手动编排」,而不是完全的端到端自动化。
建议可以先买张7900XTX开始,ComfyUI 社区资源丰富,入门门槛比想象中低很多。有问题随时来问!
-
-
目前是 AI 小白,在做 YouTube 音视频内容。过去完全依赖纯线上付费工具(ChatGPT/Gemini/Grok 构思 + ElevenLabs 配音 + 线上生图 + 视频生成工具)。单条视频长度在 12-15 分钟(文案约 1~2 万字),采用“每张图生 6-10 秒片段”拼接的传统模式。全手动制作,效率极低,非常疲劳。视频风格如下

看到同赛道有博主能“日更 1 小时”的长视频,推测他们已经实现了本地 AI 自动化批量生产。配置 AMD 7900 XTX 显卡 + 本地 ComfyUI + voxcpm,这套软硬件方案能满足这种长视频的批量自动化生产需求吗?求指点,谢谢! -
@terry 他们基本是40分钟。。从今年3月1号开的频道,40个影片 总播放量400万。不过上个月开始他们停更了。。不知道是不是油管给管制掉了。
我操作是用Google studio 生成台词每段动画基本上18分钟的影片出个600组图,在用插件到grok批量导出视频。基本也要耗时2天。。想着本地部署会不会更有生产力。不需要手动操作,15分钟其实也OK。 -
@Q-maria 谁说做不到的?当然可以做了,只要卡够强,它比在线API方便多了,我最后就是要做你说的这种通用动画,这是我的兴趣爱好,只不过我要先挣钱,先上线几个数字人频道赚钱再说。这些东西其实不难,做过幻灯片频道都能理解如何操作。慢慢看吧,等数字人稳定了之后,就做你说的这类视频。
-
@Q-maria 谁说做不到的?当然可以做了,只要卡够强,它比在线API方便多了,我最后就是要做你说的这种通用动画,这是我的兴趣爱好,只不过我要先挣钱,先上线几个数字人频道赚钱再说。这些东西其实不难,做过幻灯片频道都能理解如何操作。慢慢看吧,等数字人稳定了之后,就做你说的这类视频。
-
目前也是在做這樣的準備,但是主力是類似podcast的日更節目(一週五更),目前的情況是:1.先用爬蟲找國外的主題論壇網站的熱度新聞 2.分成5個不同討論的主題區塊(大方向一致,例如都是討論建築案例跟新聞),但是很多事業內吐槽的觀點 3.用AI做出結論,並核實事實 4.AI提供初稿 5.人工審稿,可以加強語氣與用字的精準度 6.本地VoxCPM2或是Mini MAX 的TTS,因為是對話形式,所以每句話生成 7.合成音檔 8.配圖合成編輯
目前流程有跑通,但是YT對於圖片變化很有講究,現在卡在想用簡單的動畫來配音檔,也正在搞數字人的練習,漫漫長路,砥礪前行