由32gb Ram 加到64gb ram 反而變慢

youtubevic

本身我用3090 和32gb ram 得 Wan Steady Dancer workflow 只要2000秒就出到 22秒的片。這兩天加到64gb ram. 同一樣的工作流反而變到十個鐘都弄不到。
試過去Nvidia 改驅動偏向不offload. 就會OOM. 唔改什麼都不做就變慢。加Disable Smart Memory 也沒用。想問問大神們有方法解決到這個問題嗎？謝謝

terry

你的分辨率什么也不谈，wan本来就慢，windows下很多工作流选择用内存缓存，慢的更是和狗屎一样。你用什么模型我们也不知道，3090就24G显存，不用用内存缓存基本跑不了Wan。没啥好优化的，换LTX吧。

Xiaote

@youtubevic 加内存反而变慢这个问题其实很多人遇到过，根源在于 Wan 和 ComfyUI 的内存管理策略。

当你从 32GB 加到 64GB 以后，ComfyUI 的 Smart Memory 和 Wan 的 offload 策略会识别到更多系统内存可用，于是更积极地把显存里的数据 offload 到系统内存。但系统内存走 PCIe 总线，带宽比显存（GDDR6X ~1TB/s）慢一个数量级（PCIe 4.0 x16 ~32GB/s），频繁 offload/load 来回倒腾反而大幅增加了延迟。

几个你可以试的方向：

在 ComfyUI 启动参数加 --disable-smart-memory（或者在设置里关掉 smart memory），强制模型尽量留在显存里，别往系统内存倒。
如果 Wan 还是 OOM，试试降低分辨率或者换小一点的精度。Wan 的显存占用跟分辨率直接相关——分辨率砍一半，显存占用能降到 1/4。
Nvidia 控制面板 → 管理 3D 设置 → 找到你的 ComfyUI Python → 电源管理模式选「最高性能优先」。同时关掉 Windows 的「内存压缩」(Memory Compression)。
试下 --gpu-only 参数（如果有的话），或者检查 Wan 节点里有没有类似 "offload to RAM" 的选项，关掉它。
另一个可能性是 Windows 把更大的 page file 建到了同一块硬盘上，读写争抢。如果 Wan 模型放在 SSD 上，确保 page file 放到另一块物理盘上。

如果以上都不行，最简单粗暴的办法：先用 32GB 跑（拔掉一根内存），跑通 Wan 再插回去日常用。Wan 吃显存远多于吃系统内存，系统内存 32GB 对 Wan 来说完全够用。

youtubevic

@terry @xiaote 原來是我忘了解象度調大了平時用544x960 改了 756x1080. 現在30分鐘左右出22秒的跳舞模仿片。謝謝兩位大神

terry

那特么也太慢了，肯定有问题啊🤨

? 离线

以我的感觉应该是显存不够offload到内存里面去了，所以才这么慢

Zj Li

用低分后面再超分上来

抡锤者

由32gb Ram 加到64gb ram 反而變慢