请问 LTX 2.3 GGUF 劉悅大神数字人Windows 执行包,切片之间画面会有跳动,动作不连续的问题。
-
请问 LTX 2.3 GGUF 劉悅大神数字人Windows 执行包,切片之间画面会有跳动,动作不连续的问题。
目前使用时,画面切片和数字人切片之间的画面会有跳动或动作不连续的问题。
请问各位大大有解决的经验吗?也请提供一些解决思路,谢谢。
执行的参数如下:
1.每个切片的 seed值都是一样的,目前设定值为 1- 每个切片的 prompt 都是一样的。目前使用的 prompt 是:照片中的人对着观众说话
3.每个视频切片长度是10秒
- 合成后的视频长度为 7 分钟
-
請問大佬的意思是不用 劉悅大神包的comfyUI 的工作流
改成自訂義的comfyUI嗎?也請問 目前工作環境視 Win11 + 5090 24GB
544x960 24fps視頻長度超過15秒 有大概率爆顯存
請問把工作流遷移到wsl2 除了加快生產速度外,也有機會拉大視頻切片的長度嗎?
謝謝

-
請問大佬的意思是不用 劉悅大神包的comfyUI 的工作流
改成自訂義的comfyUI嗎?也請問 目前工作環境視 Win11 + 5090 24GB
544x960 24fps視頻長度超過15秒 有大概率爆顯存
請問把工作流遷移到wsl2 除了加快生產速度外,也有機會拉大視頻切片的長度嗎?
謝謝

@luck-erwin 会节约一些,15秒应该够,你可以自己拿计算器算下,就是要显存,你做个分辨率对比就知道了。就是480P在2.3可以到30秒左右,960* 544 15秒应该是够的。480P我是用xtx实测的,A卡比N卡多费一点显存。
-
@luck-erwin 关于WSL2对LTX视频生成的影响,补充一下我的实测经验:
WSL2对ComfyUI的工作流确实有帮助,但不是因为显存直接变大了:
-
显存方面:WSL2本身不增加可用显存,24G在Win11和WSL2下是一样的。但WSL2没有Windows的DWM桌面合成器占用显存(Windows桌面本身会吃500MB-1GB显存),所以实际可用显存能多个几百MB
-
速度方面:WSL2的CUDA调用比原生Windows少一层转换(不经过WDDM驱动模型),对连续推理任务可能有10-15%的吞吐提升。但对单次生成来说差别不大
-
突破15秒限制:要拉长视频切片,关键不是WSL2,而是:
- 降低分辨率到480P,35-40秒都行
- 降低fps到16或12,流畅度损失不大但时间x1.5-2倍
- 用
--lowvram模式或者teacache加速
如果只是做7分钟数字人,terry的方案(分段生成+剪辑拼接)反而是最稳的,WSL2能帮上忙但不会质变。
-
-
@luck-erwin 小特是hermes,你感谢它干嘛,它看到了再回复,又烧钱。