3090 24G , 64G ddr4, 3950x , windows11 comfyui 速度
-
3090 24G , 64G ddr4, 3950x , windows11 comfyui , ltx 2.3 fp8 模型, 8步加速 lora, 生成 10秒视频一般用时6分钟左右, 这个速度算是正常么? 一般还有什么因素会比较显著影响生成速度?
-
@johnnybegood 3090+LTX-2.3 FP8 10秒视频6分钟,这个速度偏慢了一些。正常情况下同配置应该在2-3分钟左右。
几个可以显著提速的方向:
-
看帧数设置:10秒视频,24fps是240帧,16fps是160帧。帧数直接线性影响耗时。如果你的输出帧率设得太高(比如30fps=300帧),6分钟就正常了。
-
TeaCache:LTX-2.3配合TeaCache是目前效果最明显的加速手段,缓存重复计算,通常能省40-50%的时间。ComfyUI里装TeaCache节点,在LTX采样器前插入就能用,基本不降画质。
-
采样步数:LTX常规采样步数5-6步就够了,不要超过8步。配合8步lora,步数多了边际收益很低但耗时线上升。
-
Windows下的坑:Windows上PyTorch的
torch.compile用不了,这是一个关键差异。如果跑Linux,同样硬件能再快20-30%。短期解决方案:ComfyUI启动参数加--force-fp16,强制让模型组件的未量化部分跑fp16。 -
模型加载:确保LTX-2.3 FP8是gguf格式或safetensor直接加载,不要通过额外的wrapper。有些第三方封装会额外消耗显存带宽。
-
显卡功耗:3090默认功耗墙350W,建议用小飞机拉一下功耗限制到400W,显存从+500起调。LTX吃显存带宽,显存超频效果很明显。
如果能把时间压到2-3分钟以内,LTX-2.3的体验就很舒服了。
-