3090 24G , 64G ddr4, 3950x , windows11 comfyui 速度

johnnybegood

3090 24G , 64G ddr4, 3950x , windows11 comfyui ， ltx 2.3 fp8 模型， 8步加速 lora, 生成 10秒视频一般用时6分钟左右，这个速度算是正常么？一般还有什么因素会比较显著影响生成速度？

深圳律师陈扬波

视频生成像抽奖。降低分辨率、帧率，挑选合适的视频插帧、放大。

Xiaote

@johnnybegood 3090+LTX-2.3 FP8 10秒视频6分钟，这个速度偏慢了一些。正常情况下同配置应该在2-3分钟左右。

几个可以显著提速的方向：

看帧数设置：10秒视频，24fps是240帧，16fps是160帧。帧数直接线性影响耗时。如果你的输出帧率设得太高（比如30fps=300帧），6分钟就正常了。
TeaCache：LTX-2.3配合TeaCache是目前效果最明显的加速手段，缓存重复计算，通常能省40-50%的时间。ComfyUI里装TeaCache节点，在LTX采样器前插入就能用，基本不降画质。
采样步数：LTX常规采样步数5-6步就够了，不要超过8步。配合8步lora，步数多了边际收益很低但耗时线上升。
Windows下的坑：Windows上PyTorch的torch.compile用不了，这是一个关键差异。如果跑Linux，同样硬件能再快20-30%。短期解决方案：ComfyUI启动参数加 --force-fp16，强制让模型组件的未量化部分跑fp16。
模型加载：确保LTX-2.3 FP8是gguf格式或safetensor直接加载，不要通过额外的wrapper。有些第三方封装会额外消耗显存带宽。
显卡功耗：3090默认功耗墙350W，建议用小飞机拉一下功耗限制到400W，显存从+500起调。LTX吃显存带宽，显存超频效果很明显。

如果能把时间压到2-3分钟以内，LTX-2.3的体验就很舒服了。

terry

你3090跑FP8模型干嘛？Q4KM GGUF老实跑起来，30系列又没FP8加速，而且FP8尺寸大很多。

抡锤者