求助!想从纯线上转型“本地自动化流”,7900XTX + ComfyUI 能满足油管长视频的高效产出吗?
-
目前是 AI 小白,在做 YouTube 音视频内容。过去完全依赖纯线上付费工具(ChatGPT/Gemini/Grok 构思 + ElevenLabs 配音 + 线上生图 + 视频生成工具)。单条视频长度在 12-15 分钟(文案约 1~2 万字),采用“每张图生 6-10 秒片段”拼接的传统模式。全手动制作,效率极低,非常疲劳。视频风格如下

看到同赛道有博主能“日更 1 小时”的长视频,推测他们已经实现了本地 AI 自动化批量生产。配置 AMD 7900 XTX 显卡 + 本地 ComfyUI + voxcpm,这套软硬件方案能满足这种长视频的批量自动化生产需求吗?求指点,谢谢! -
@terry 他们基本是40分钟。。从今年3月1号开的频道,40个影片 总播放量400万。不过上个月开始他们停更了。。不知道是不是油管给管制掉了。
我操作是用Google studio 生成台词每段动画基本上18分钟的影片出个600组图,在用插件到grok批量导出视频。基本也要耗时2天。。想着本地部署会不会更有生产力。不需要手动操作,15分钟其实也OK。 -
@Q-maria 谁说做不到的?当然可以做了,只要卡够强,它比在线API方便多了,我最后就是要做你说的这种通用动画,这是我的兴趣爱好,只不过我要先挣钱,先上线几个数字人频道赚钱再说。这些东西其实不难,做过幻灯片频道都能理解如何操作。慢慢看吧,等数字人稳定了之后,就做你说的这类视频。
-
@Q-maria 谁说做不到的?当然可以做了,只要卡够强,它比在线API方便多了,我最后就是要做你说的这种通用动画,这是我的兴趣爱好,只不过我要先挣钱,先上线几个数字人频道赚钱再说。这些东西其实不难,做过幻灯片频道都能理解如何操作。慢慢看吧,等数字人稳定了之后,就做你说的这类视频。
-
目前也是在做這樣的準備,但是主力是類似podcast的日更節目(一週五更),目前的情況是:1.先用爬蟲找國外的主題論壇網站的熱度新聞 2.分成5個不同討論的主題區塊(大方向一致,例如都是討論建築案例跟新聞),但是很多事業內吐槽的觀點 3.用AI做出結論,並核實事實 4.AI提供初稿 5.人工審稿,可以加強語氣與用字的精準度 6.本地VoxCPM2或是Mini MAX 的TTS,因為是對話形式,所以每句話生成 7.合成音檔 8.配圖合成編輯
目前流程有跑通,但是YT對於圖片變化很有講究,現在卡在想用簡單的動畫來配音檔,也正在搞數字人的練習,漫漫長路,砥礪前行