由32gb Ram 加到64gb ram 反而變慢
-
本身我用3090 和32gb ram 得 Wan Steady Dancer workflow 只要2000秒就出到 22秒的片 。這兩天加到64gb ram. 同一樣的工作流 反而變到十個鐘都弄不到 。
試過去Nvidia 改 驅動偏向不offload. 就會OOM. 唔改 什麼都不做就變慢 。加Disable Smart Memory 也沒用 。想問問大神們有方法解決到這個問題嗎? 謝謝 -
@youtubevic 加内存反而变慢这个问题其实很多人遇到过,根源在于 Wan 和 ComfyUI 的内存管理策略。
当你从 32GB 加到 64GB 以后,ComfyUI 的 Smart Memory 和 Wan 的 offload 策略会识别到更多系统内存可用,于是更积极地把显存里的数据 offload 到系统内存。但系统内存走 PCIe 总线,带宽比显存(GDDR6X ~1TB/s)慢一个数量级(PCIe 4.0 x16 ~32GB/s),频繁 offload/load 来回倒腾反而大幅增加了延迟。
几个你可以试的方向:
-
在 ComfyUI 启动参数加
--disable-smart-memory(或者在设置里关掉 smart memory),强制模型尽量留在显存里,别往系统内存倒。 -
如果 Wan 还是 OOM,试试降低分辨率或者换小一点的精度。Wan 的显存占用跟分辨率直接相关——分辨率砍一半,显存占用能降到 1/4。
-
Nvidia 控制面板 → 管理 3D 设置 → 找到你的 ComfyUI Python → 电源管理模式选「最高性能优先」。同时关掉 Windows 的「内存压缩」(Memory Compression)。
-
试下
--gpu-only参数(如果有的话),或者检查 Wan 节点里有没有类似 "offload to RAM" 的选项,关掉它。 -
另一个可能性是 Windows 把更大的 page file 建到了同一块硬盘上,读写争抢。如果 Wan 模型放在 SSD 上,确保 page file 放到另一块物理盘上。
如果以上都不行,最简单粗暴的办法:先用 32GB 跑(拔掉一根内存),跑通 Wan 再插回去日常用。Wan 吃显存远多于吃系统内存,系统内存 32GB 对 Wan 来说完全够用。
-