跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

L

liuchx

@liuchx
取消关注 关注
关于
帖子
3
主题
2
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • 求助,ubuntu 2604 / 7900xtx 跑 刘悦大神的LTX 2.3 IA2V 工作流问题。
    L liuchx

    硬件:
    AMD Radeon RX 7900 XTX 24GB

    系统/环境:
    ubuntu2604 服务器,ComfyUI 跑刘悦 LTX 2.3 IA2V 工作流。
    主要模型是 LTX 2.3 22B GGUF:
    ltx-2.3-22b-distilled-1.1-UD-Q4_K_M.gguf
    搭配:
    LTX23_video_vae_bf16.safetensors
    LTX23_audio_vae_bf16.safetensors
    LTX-2.3-22b-AV-LoRA-talking-head-v1.safetensors
    ltx2.3-transition.safetensors
    ComfyUI 节点主要用 KJNodes / LTXVideo / GGUF 相关节点。

    目标:
    想在 7900 XTX 上跑 LTX 2.3 IA2V 口型视频生成,最好能做 720P 视频。

    目前问题:

    1. ROCm 7.2 / PyTorch 对应环境下,VideoVAE 放 GPU 容易报错:
      hipErrorIllegalAddress
      或者 HIP illegal memory access。
      如果把 VideoVAE 放 CPU,流程可以跑,但是速度非常慢。

    2. LTX2_NAG 节点在 AMD/ROCm 上会遇到 query/key/value 设备不一致:
      Expected query, key, and value to have the same device type,
      but got query.device: cpu key.device: cuda:0 and value.device: cuda:0 instead.

    这个错误出现在 KJNodes 的 LTX2_NAG cross-attention 相关逻辑里。
    大概位置是:
    ComfyUI-KJNodes/nodes/ltxv_nodes.py
    _compute_attention(...)
    ltxv_crossattn_forward_nag(...)
    LTX2_NAG.execute(...)

    看起来 nag_cond 已经被移动到 main device,但采样时 query 可能因为 ComfyUI/ROCm 内存管理或 offload 被留在 CPU,而 key/value 在 GPU。

    1. 尝试过保留系统 ROCm/driver 不变,只换 pip 包到 torch ROCm 6.3:
      torch 2.9.1+rocm6.3
      torchvision 0.24.1+rocm6.3
      torchaudio 2.9.1+rocm6.3

    这个方向下,VideoVAE 放 GPU 可以成功跑通低分辨率测试:
    384x224 / 1s / no-NAG 成功
    512x288 / 2s / no-NAG 成功
    640x352 / 1s / no-NAG 成功

    但速度很慢:
    512x288 / 2s,大约 20 分 50 秒
    640x352 / 1s,大约 20 分 18 秒

    1. 和 RTX 4090 对比:
      4090 跑 720P LTX IA2V 正式生成,大约 25 秒机器时间生成 1 秒视频。
      7900 XTX 目前 512x288 约 625 秒机器时间生成 1 秒视频,640x352 约 1218 秒机器时间生成 1 秒视频。
      按这个速度外推,7900 XTX 原生 720P 会非常慢,可能达到几十分钟到一小时以上生成 1 秒视频。

    已尝试:

    • --cpu-vae:能绕过 VideoVAE GPU crash,但太慢
    • --disable-async-offload
    • HSA_OVERRIDE_GFX_VERSION=11.0.0
    • ROCm 6.3 pip torch 环境
    • 关闭 LTX2_NAG 后 no-NAG 可以跑通低分辨率
    • VideoVAE 使用 main_device + bf16 在 ROCm 6.3 pip 环境可跑通低分辨率

    想请教:

    1. 7900 XTX + ROCm 跑 LTX 2.3 22B GGUF,有没有已知的高性能配置?
    2. ROCm 7.2 下 VideoVAE GPU 的 hipErrorIllegalAddress 有没有 workaround?
    3. LTX2_NAG 的 query CPU / key CUDA 设备不一致,是否应该改 KJNodes 代码强制 query/context 同设备?有没有人修过?
    4. ROCm 6.3 pip 能跑但极慢,是 GGUF kernel 在 ROCm 上性能差,还是 ComfyUI/torch 配置问题?
    5. 对 7900 XTX 来说,是否更建议低分辨率生成后超分,而不是原生 720P?
    AI音视频画图

  • 【A卡/ROCm】7900 XTX 跑 ComfyUI ,你们跑完视频以后如何放大
    L liuchx

    请问在7900xtx上 对嘴形 和手部动作 用的 什么方案。@terry

    AI音视频画图
  • 登录

  • 没有帐号? 注册

  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组