跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI音视频画图
  3. 7900xtx 24gb comfyui求助

7900xtx 24gb comfyui求助

已定时 已固定 已锁定 已移动 AI音视频画图
10 帖子 7 发布者 607 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • P 离线
    P 离线
    Paulo0
    编写于 最后由 编辑
    #1

    我的配置如下图,rocm7.2截图 2026-06-10 18-31-40.png 截图 2026-06-10 18-26-59.png 截图 2026-06-10 18-28-01.png 截图 2026-06-10 16-41-43.png
    渲染一段4秒480p的图生视频用了58分钟,显卡也是全力在跑的,为什么那么慢呢?我是刚刚接触Ubuntu系统的小白,请教各位大神我是不是哪里设置错了。

    imbiplaza ASUSI 1 条回复 最后回复
    0
    • 5 在线
      5 在线
      566656661
      超凡大师
      编写于 最后由 编辑
      #2

      不試試用vulkan嘛?

      大多數時間其實vulkan的優化比rocm還好

      1 条回复 最后回复
      0
      • terryT 离线
        terryT 离线
        terry
        超级版主
        编写于 最后由 编辑
        #3

        你的CLIP调用了CPU,但也不至于这么慢,而且看你使用的模型似乎是FP8模型,不知道你为什么这么选,选一个更小的模型看看,GGUF格式的。这就是显存不够,频繁offload,跑大模型可以vulkan,跑comfyui只能rocm。你也打印下你的triton,torch版本,如果缺少triton,也会慢点和狗屎一样。还有AMD跑wan就是慢。24G跑Wan也慢,显存不够。

        油管:https://www.youtube.com/@抡锤者

        P 1 条回复 最后回复
        1
        • terryT terry

          你的CLIP调用了CPU,但也不至于这么慢,而且看你使用的模型似乎是FP8模型,不知道你为什么这么选,选一个更小的模型看看,GGUF格式的。这就是显存不够,频繁offload,跑大模型可以vulkan,跑comfyui只能rocm。你也打印下你的triton,torch版本,如果缺少triton,也会慢点和狗屎一样。还有AMD跑wan就是慢。24G跑Wan也慢,显存不够。

          P 离线
          P 离线
          Paulo0
          编写于 最后由 编辑
          #4

          @terry 说:

          你的CLIP调用了CPU,但也不至于这么慢,而且看你使用的模型似乎是FP8模型,不知道你为什么这么选,选一个更小的模型看看,GGUF格式的。这就是显存不够,频繁offload,跑大模型可以vulkan,跑comfyui只能rocm。你也打印下你的triton,torch版本,如果缺少triton,也会慢点和狗屎一样。还有AMD跑wan就是慢。24G跑Wan也慢,显存不够。

          我第一次CLIP没有调CPU的.58分钟.然后第二次调CPU也是58分钟.没有triton.模型是fp8

          ye9okY 1 条回复 最后回复
          0
          • P Paulo0

            @terry 说:

            你的CLIP调用了CPU,但也不至于这么慢,而且看你使用的模型似乎是FP8模型,不知道你为什么这么选,选一个更小的模型看看,GGUF格式的。这就是显存不够,频繁offload,跑大模型可以vulkan,跑comfyui只能rocm。你也打印下你的triton,torch版本,如果缺少triton,也会慢点和狗屎一样。还有AMD跑wan就是慢。24G跑Wan也慢,显存不够。

            我第一次CLIP没有调CPU的.58分钟.然后第二次调CPU也是58分钟.没有triton.模型是fp8

            ye9okY 离线
            ye9okY 离线
            ye9ok
            编写于 最后由 编辑
            #5

            @Paulo0 俺记得rx79支持triton的。你得安装py3.12

            1 条回复 最后回复
            0
            • XiaoteX 离线
              XiaoteX 离线
              Xiaote
              劳动模范
              编写于 最后由 编辑
              #6

              @Paulo0 7900XTX 24G跑WAN2.1慢是正常的,但不是"设置错了"的问题,而是几个因素叠加:

              1. Triton缺失是最大瓶颈。ROCm下WAN2.1的FP8模型重度依赖Triton,没有Triton的时候PyTorch会fallback到纯CUDA(实际上是HIP)实现,速度差好几倍。你需要在ROCm环境下安装Triton:pip install triton -U 或者从源码编译 ROCm版本的 triton (https://github.com/ROCm/triton)。装完之后速度会有明显提升。

              2. 模型选择。terry说得对,FP8模型在24G显存上跑WAN本身就很吃力。建议换成更小的GGUF格式模型,或者用LTX Video (https://github.com/Lightricks/LTX-Video) —— LTX对显存需求更低,在24G上能跑出不错的效果,速度也比WAN快很多。

              3. AMD + ComfyUI + ROCm的现状。同样7900XTX在WAN上就是比N卡慢,这是ROCm的优化不如CUDA完善的客观事实。不是你的问题。

              建议先装好Triton,换个小模型试试,速度应该能快2-3倍。

              P 1 条回复 最后回复
              0
              • XiaoteX Xiaote

                @Paulo0 7900XTX 24G跑WAN2.1慢是正常的,但不是"设置错了"的问题,而是几个因素叠加:

                1. Triton缺失是最大瓶颈。ROCm下WAN2.1的FP8模型重度依赖Triton,没有Triton的时候PyTorch会fallback到纯CUDA(实际上是HIP)实现,速度差好几倍。你需要在ROCm环境下安装Triton:pip install triton -U 或者从源码编译 ROCm版本的 triton (https://github.com/ROCm/triton)。装完之后速度会有明显提升。

                2. 模型选择。terry说得对,FP8模型在24G显存上跑WAN本身就很吃力。建议换成更小的GGUF格式模型,或者用LTX Video (https://github.com/Lightricks/LTX-Video) —— LTX对显存需求更低,在24G上能跑出不错的效果,速度也比WAN快很多。

                3. AMD + ComfyUI + ROCm的现状。同样7900XTX在WAN上就是比N卡慢,这是ROCm的优化不如CUDA完善的客观事实。不是你的问题。

                建议先装好Triton,换个小模型试试,速度应该能快2-3倍。

                P 离线
                P 离线
                Paulo0
                编写于 最后由 编辑
                #7

                @Xiaote
                好的,谢谢

                1 条回复 最后回复
                0
                • P Paulo0

                  我的配置如下图,rocm7.2截图 2026-06-10 18-31-40.png 截图 2026-06-10 18-26-59.png 截图 2026-06-10 18-28-01.png 截图 2026-06-10 16-41-43.png
                  渲染一段4秒480p的图生视频用了58分钟,显卡也是全力在跑的,为什么那么慢呢?我是刚刚接触Ubuntu系统的小白,请教各位大神我是不是哪里设置错了。

                  imbiplaza ASUSI 离线
                  imbiplaza ASUSI 离线
                  imbiplaza ASUS
                  技术大牛 劳动模范
                  编写于 最后由 imbiplaza ASUS 编辑
                  #8

                  @Paulo0

                  我试一试用我的ltx2.3跑一下。。突然觉得,咦 7分钟跑出来了。。。。
                  intel 12400, 64gb ddr4, rtx5060ti 16gb, 4tb nvme

                  Screenshot-2026-06-14-174122.jpg

                  drone 影片

                  1 条回复 最后回复
                  1
                  • K 离线
                    K 离线
                    koala
                    编写于 最后由 编辑
                    #9

                    加载CLIP那个位置,只有CPU和cuda可以选择,N卡随便就能跑,A卡目前感觉就是走CPU通道的。

                    imbiplaza ASUSI 1 条回复 最后回复
                    0
                    • K koala

                      加载CLIP那个位置,只有CPU和cuda可以选择,N卡随便就能跑,A卡目前感觉就是走CPU通道的。

                      imbiplaza ASUSI 离线
                      imbiplaza ASUSI 离线
                      imbiplaza ASUS
                      技术大牛 劳动模范
                      编写于 最后由 编辑
                      #10

                      @koala

                      a5db853a-73a8-4e2a-b3fd-ae03763d777e-image.jpeg

                      1 条回复 最后回复
                      0

                      你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                      厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                      有了你的建议,这篇帖子会更精彩哦 💗

                      注册 登录
                      回复
                      • 在新帖中回复
                      登录后回复
                      • 从旧到新
                      • 从新到旧
                      • 最多赞同


                      • 登录

                      • 没有帐号? 注册

                      • 第一个帖子
                        最后一个帖子
                      0
                      • 版块
                      • 最新
                      • 标签
                      • 热门
                      • 用户
                      • 群组