數字人視頻生成感想
-
@Sam-Hsu 老哥,1,Wan就是慢,慢到离谱,你应该换LTX2.3,工作流很多,刘悦的整合包下载下来,点开就能跑,你立刻就能感受到生产力,它除了提供CmfyUI原版入口,还提供WebUI。
2,你最终还是要装Linux,直接在Ubuntu下安装CUDA 12.x,ComfyUI,让Gemini教你,然后把Win整合包下的Custom_nodes, models文件夹覆盖到Linux上对应的目录,然后尝试运行ComfyUI,会让你安装依赖的,把错误贴给Gemini即可。
3,移植完毕之后你就能自由创作了,别再折腾Wan了,你的显存不够,大概率是部分场景比如CLIP调用了CPU。 -
@terry 借个楼,老特,我想问问你用7900XTX,在ubuntu下跑刘悦的LTX2.3数字人无限时长V2工作流的时候,速度怎么样?我跑一个1分12秒的音频,用刘悦的低显存版工作流要50s/层,跑完整版要100s/层,不知道这个速度是快是慢,能给我一个参考吗
-
@Sam-Hsu 同样3090, 我生成10秒视频要用三分半, 那可不可以理解成 30秒视频只要 10分钟多点呢? LTX 2.3
-
@Sam-Hsu 同样3090, 我生成10秒视频要用三分半, 那可不可以理解成 30秒视频只要 10分钟多点呢? LTX 2.3
@johnnybegood 是的 可以提供一下 你用什麼方式生成視頻嗎?3090 10秒視頻只要3.5分鐘
-
@johnnybegood 是的 可以提供一下 你用什麼方式生成視頻嗎?3090 10秒視頻只要3.5分鐘
@Sam-Hsu windows11, comfyui最新版, ltx 2.3 导演版工作流, ltx 22b 模型,gemma, 八步加速 lora , 960x544 , 10秒, 240帧。 但是我从来没生成过 30秒视频,10秒对于我来说最快, 因为时间太长我这边就进虚拟内存了, 进了虚拟内存, 15秒视频就要 30分钟以上。
-
@Sam-Hsu windows11, comfyui最新版, ltx 2.3 导演版工作流, ltx 22b 模型,gemma, 八步加速 lora , 960x544 , 10秒, 240帧。 但是我从来没生成过 30秒视频,10秒对于我来说最快, 因为时间太长我这边就进虚拟内存了, 进了虚拟内存, 15秒视频就要 30分钟以上。
@johnnybegood 可以用Hermes agent
30秒視頻 生成3個10秒視頻 自動拼接成最終視頻 -
@johnnybegood 可以用Hermes agent
30秒視頻 生成3個10秒視頻 自動拼接成最終視頻@Sam-Hsu 如果想拼接的话, ltx 也有自动拼接无限时长的工作流,最后会自动拼接, 也挺好用。 只是转场、前后一致性这些我还在学习。现在效果不是太好。 当然他们都说要抽卡。
-
@c0aster 当然能了, 但是回1%血还是回10000% 血那差距可大了
-
@c0aster 当然能了, 但是回1%血还是回10000% 血那差距可大了
@johnnybegood 那我还是多学习下,卡过两天到货2张3090涡轮卡,1%也行啊,我还没入门呢,反正有收益后面都是白嫖的