跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. RTX PRO6000 现货价格 10w,该不该卖,换 3 张 r9700

RTX PRO6000 现货价格 10w,该不该卖,换 3 张 r9700

已定时 已固定 已锁定 已移动 AI硬件
19 帖子 9 发布者 130 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • 5 566656661

    @Dalu-Fama

    ComfyUI最近支持了Parallel Processing nightly應該能並行加速, 不過A卡估計也要等優化?

    以前我記得ComfyUI的並行是兩種偽並行, 一種是一張卡在VAE幹活然後另外一張在Sampler幹活, 另外一種就是單純把VRAM共用, 但是其中一張卡的核心不幹活

    Dalu FamaD 离线
    Dalu FamaD 离线
    Dalu Fama
    编写于 最后由 编辑
    #8

    @566656661 是的 我了解到也是这样的,如果显存叠加的话,就只有一个核心干活!

    5 1 条回复 最后回复
    0
    • Dalu FamaD Dalu Fama

      @566656661 是的 我了解到也是这样的,如果显存叠加的话,就只有一个核心干活!

      5 在线
      5 在线
      566656661
      编写于 最后由 编辑
      #9

      @Dalu-Fama

      那你的運氣很好, 上面的Pull Request前幾天進Main branch了, nightly應該能夠用到

      1 条回复 最后回复
      0
      • Dalu FamaD Dalu Fama

        @kop-wang 3 张卡并行跑 comfyui,显存应该算叠加吧,叠加后和 pro6000 一样 96gb,就是不知道性能能不能叠加算;其他硬件 都是小问题。

        Tony WangT 离线
        Tony WangT 离线
        Tony Wang
        编写于 最后由 编辑
        #10

        @Dalu-Fama

        显存可以叠加, 但性能不能叠加.

        LLM prefill 阶段性能差不多可以叠加.
        LLM decode阶段和ComfyUI 性能都无法叠加.

        和 pro 6000 差异还是挺大的, pro 6000 跑comfyui 估计是3张R9700 的两到3倍. llm decode 估计也是 2-3倍.

        另外, 3张卡, 对主板和电源都有要求.

        所以, 慎重.

        terryT 5 Dalu FamaD 3 条回复 最后回复
        0
        • Tony WangT Tony Wang

          @Dalu-Fama

          显存可以叠加, 但性能不能叠加.

          LLM prefill 阶段性能差不多可以叠加.
          LLM decode阶段和ComfyUI 性能都无法叠加.

          和 pro 6000 差异还是挺大的, pro 6000 跑comfyui 估计是3张R9700 的两到3倍. llm decode 估计也是 2-3倍.

          另外, 3张卡, 对主板和电源都有要求.

          所以, 慎重.

          terryT 离线
          terryT 离线
          terry
          编写于 最后由 编辑
          #11

          @Tony-Wang Pro 6000comfy队R9700可能是5倍以上的优势,5倍保底。

          油管:https://www.youtube.com/@抡锤者

          Dalu FamaD 1 条回复 最后回复
          0
          • Tony WangT Tony Wang

            @Dalu-Fama

            显存可以叠加, 但性能不能叠加.

            LLM prefill 阶段性能差不多可以叠加.
            LLM decode阶段和ComfyUI 性能都无法叠加.

            和 pro 6000 差异还是挺大的, pro 6000 跑comfyui 估计是3张R9700 的两到3倍. llm decode 估计也是 2-3倍.

            另外, 3张卡, 对主板和电源都有要求.

            所以, 慎重.

            5 在线
            5 在线
            566656661
            编写于 最后由 编辑
            #12

            @Tony-Wang

            Prefill是Compute intensive, 核心的相對應tflops越高越好

            Decode是Memory intensive, VRAM帶寬越高越好

            很遺憾的是R9700兩個都比不上, 更缺乏生態優化

            1 条回复 最后回复
            0
            • 5 566656661

              @Dalu-Fama

              ComfyUI最近支持了Parallel Processing nightly應該能並行加速, 不過A卡估計也要等優化?

              以前我記得ComfyUI的並行是兩種偽並行, 一種是一張卡在VAE幹活然後另外一張在Sampler幹活, 另外一種就是單純把VRAM共用, 但是其中一張卡的核心不幹活

              Tony WangT 离线
              Tony WangT 离线
              Tony Wang
              编写于 最后由 编辑
              #13

              @566656661 说:

              @Dalu-Fama

              ComfyUI最近支持了Parallel Processing nightly應該能並行加速, 不過A卡估計也要等優化?

              以前我記得ComfyUI的並行是兩種偽並行, 一種是一張卡在VAE幹活然後另外一張在Sampler幹活, 另外一種就是單純把VRAM共用, 但是其中一張卡的核心不幹活

              我的理解是:

              Diffusion 模型是一个不断降噪的过程, 它依靠时序, 所以只能串行计算.

              如果每一步都并行计算的话, 就意味着大量数据要通过pcie通道搬运, 速度会严重拖慢.

              这个并行计算的意思, 是三张卡跑三个模型, 同时干活. 时长变短, 但是抽卡速度变为三倍.

              5 1 条回复 最后回复
              0
              • kos orK 离线
                kos orK 离线
                kos or
                编写于 最后由 kos or 编辑
                #14

                3張 R9700 要同時放進同一台電腦中嗎?
                支援多卡 PCIe 4.0/5.0 x 16 lines (32GB/s, 64GB/s 傳輸速度)的主機板會比較貴

                1 条回复 最后回复
                0
                • A 在线
                  A 在线
                  applejuice
                  编写于 最后由 编辑
                  #15

                  把显卡算力租出去然后赚钱买r9700

                  1 条回复 最后回复
                  0
                  • Tony WangT Tony Wang

                    @566656661 说:

                    @Dalu-Fama

                    ComfyUI最近支持了Parallel Processing nightly應該能並行加速, 不過A卡估計也要等優化?

                    以前我記得ComfyUI的並行是兩種偽並行, 一種是一張卡在VAE幹活然後另外一張在Sampler幹活, 另外一種就是單純把VRAM共用, 但是其中一張卡的核心不幹活

                    我的理解是:

                    Diffusion 模型是一个不断降噪的过程, 它依靠时序, 所以只能串行计算.

                    如果每一步都并行计算的话, 就意味着大量数据要通过pcie通道搬运, 速度会严重拖慢.

                    这个并行计算的意思, 是三张卡跑三个模型, 同时干活. 时长变短, 但是抽卡速度变为三倍.

                    5 在线
                    5 在线
                    566656661
                    编写于 最后由 编辑
                    #16

                    @Tony-Wang

                    我理解也是這樣, 所以也好奇剛才那個PR是用什麼觀念設計的, 有時間的話研究一下

                    不過我看到這個帖子的並行以為是tensor parallel那個並行, 沒想到是3個服務

                    1 条回复 最后回复
                    0
                    • Dalu FamaD Dalu Fama

                      前一段时间买了RTX PRO6000 ,6.5W,昨天看了下价格,都涨到 10W了,有点想出掉,换 3 张 r9700 来跑,感觉也不会差很多,主要是跑qwen3.6模型和 comfyui, 现在 单卡同时跑 comfyui 和模型,同时输出的话还是不行,如果换 3 张r9700 ,2 张卡跑模型,1 张跑 comfyui,这个计划行不行?大佬给个建议

                      benton yiB 离线
                      benton yiB 离线
                      benton yi
                      编写于 最后由 编辑
                      #17

                      @Dalu-Fama 不缺钱就别卖了,真的想卖的话还可以再等等。这个10w多的价格我了解了一下,基本上能成交的也都是对公含税价,卖家是要能开出票的。个人的话其实涨得没那么多,你2手收的话七八万也能收到。对个人来说如果对公价格把这个单品炒高了,就去买6000D版,D版也高了就选pro5000 72G版。毕竟是自己的钱,总有替代品。

                      1 条回复 最后回复
                      0
                      • terryT terry

                        @Tony-Wang Pro 6000comfy队R9700可能是5倍以上的优势,5倍保底。

                        Dalu FamaD 离线
                        Dalu FamaD 离线
                        Dalu Fama
                        编写于 最后由 编辑
                        #18

                        @terry 性能有这么大差距?看来我还是高估r9700了

                        1 条回复 最后回复
                        0
                        • Tony WangT Tony Wang

                          @Dalu-Fama

                          显存可以叠加, 但性能不能叠加.

                          LLM prefill 阶段性能差不多可以叠加.
                          LLM decode阶段和ComfyUI 性能都无法叠加.

                          和 pro 6000 差异还是挺大的, pro 6000 跑comfyui 估计是3张R9700 的两到3倍. llm decode 估计也是 2-3倍.

                          另外, 3张卡, 对主板和电源都有要求.

                          所以, 慎重.

                          Dalu FamaD 离线
                          Dalu FamaD 离线
                          Dalu Fama
                          编写于 最后由 编辑
                          #19

                          @Tony-Wang 嗯,综合考虑还是不换了,一分钱一分货肯定是有道理的!

                          1 条回复 最后回复
                          0

                          你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                          厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                          有了你的建议,这篇帖子会更精彩哦 💗

                          注册 登录
                          回复
                          • 在新帖中回复
                          登录后回复
                          • 从旧到新
                          • 从新到旧
                          • 最多赞同


                          • 登录

                          • 没有帐号? 注册

                          • 登录或注册以进行搜索。
                          • 第一个帖子
                            最后一个帖子
                          0
                          • 版块
                          • 最新
                          • 标签
                          • 热门
                          • 用户
                          • 群组