抡锤者

liuchx

硬件：
AMD Radeon RX 7900 XTX 24GB

系统/环境：
ubuntu2604 服务器，ComfyUI 跑刘悦 LTX 2.3 IA2V 工作流。
主要模型是 LTX 2.3 22B GGUF：
ltx-2.3-22b-distilled-1.1-UD-Q4_K_M.gguf
搭配：
LTX23_video_vae_bf16.safetensors
LTX23_audio_vae_bf16.safetensors
LTX-2.3-22b-AV-LoRA-talking-head-v1.safetensors
ltx2.3-transition.safetensors
ComfyUI 节点主要用 KJNodes / LTXVideo / GGUF 相关节点。

目标：
想在 7900 XTX 上跑 LTX 2.3 IA2V 口型视频生成，最好能做 720P 视频。

目前问题：

ROCm 7.2 / PyTorch 对应环境下，VideoVAE 放 GPU 容易报错：
hipErrorIllegalAddress
或者 HIP illegal memory access。
如果把 VideoVAE 放 CPU，流程可以跑，但是速度非常慢。
LTX2_NAG 节点在 AMD/ROCm 上会遇到 query/key/value 设备不一致：
Expected query, key, and value to have the same device type,
but got query.device: cpu key.device: cuda:0 and value.device: cuda:0 instead.

这个错误出现在 KJNodes 的 LTX2_NAG cross-attention 相关逻辑里。
大概位置是：
ComfyUI-KJNodes/nodes/ltxv_nodes.py
_compute_attention(...)
ltxv_crossattn_forward_nag(...)
LTX2_NAG.execute(...)

看起来 nag_cond 已经被移动到 main device，但采样时 query 可能因为 ComfyUI/ROCm 内存管理或 offload 被留在 CPU，而 key/value 在 GPU。

尝试过保留系统 ROCm/driver 不变，只换 pip 包到 torch ROCm 6.3：
torch 2.9.1+rocm6.3
torchvision 0.24.1+rocm6.3
torchaudio 2.9.1+rocm6.3

这个方向下，VideoVAE 放 GPU 可以成功跑通低分辨率测试：
384x224 / 1s / no-NAG 成功
512x288 / 2s / no-NAG 成功
640x352 / 1s / no-NAG 成功

但速度很慢：
512x288 / 2s，大约 20 分 50 秒
640x352 / 1s，大约 20 分 18 秒

和 RTX 4090 对比：
4090 跑 720P LTX IA2V 正式生成，大约 25 秒机器时间生成 1 秒视频。
7900 XTX 目前 512x288 约 625 秒机器时间生成 1 秒视频，640x352 约 1218 秒机器时间生成 1 秒视频。
按这个速度外推，7900 XTX 原生 720P 会非常慢，可能达到几十分钟到一小时以上生成 1 秒视频。

已尝试：

--cpu-vae：能绕过 VideoVAE GPU crash，但太慢
--disable-async-offload
HSA_OVERRIDE_GFX_VERSION=11.0.0
ROCm 6.3 pip torch 环境
关闭 LTX2_NAG 后 no-NAG 可以跑通低分辨率
VideoVAE 使用 main_device + bf16 在 ROCm 6.3 pip 环境可跑通低分辨率

想请教：

7900 XTX + ROCm 跑 LTX 2.3 22B GGUF，有没有已知的高性能配置？
ROCm 7.2 下 VideoVAE GPU 的 hipErrorIllegalAddress 有没有 workaround？
LTX2_NAG 的 query CPU / key CUDA 设备不一致，是否应该改 KJNodes 代码强制 query/context 同设备？有没有人修过？
ROCm 6.3 pip 能跑但极慢，是 GGUF kernel 在 ROCm 上性能差，还是 ComfyUI/torch 配置问题？
对 7900 XTX 来说，是否更建议低分辨率生成后超分，而不是原生 720P？

liuchx

请问在7900xtx上对嘴形和手部动作用的什么方案。@terry

抡锤者

liuchx

帖子