跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 跟huananzi下单了 3090x2 + nvlink

跟huananzi下单了 3090x2 + nvlink

已定时 已固定 已锁定 已移动 AI硬件
20 帖子 7 发布者 552 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • terryT terry

    @applejuice 用VLLM或者SG-Lang TP,并行,怎么可能比单卡慢。3090有NV-Link是个优势。

    A 离线
    A 离线
    applejuice
    劳动模范 德高望重
    发表于 最后由 编辑
    #10

    @terry 说:

    @applejuice 用VLLM或者SG-Lang TP,并行,怎么可能比单卡慢。3090有NV-Link是个优势。

    我知识有限问不到位
    下次我会继续质问他

    1 条回复 最后回复
    0
    • terryT terry

      @AresROC 你用的Llama.cpp?双卡TP要用VLLM 和SG-Lang,LLama.cpp是分层串行,同时只有一张卡在计算。

      AresROCA 离线
      AresROCA 离线
      AresROC
      德高望重
      发表于 最后由 AresROC 编辑
      #11

      @terry 哎呀,对我傻傻的忘了要用vLLM tensor parallel size 2. SG-Lang还没用过 好像不可以用Q4 KV?就是看到 Windows L M Studio 还以为可以试一下。

      terryT 1 条回复 最后回复
      0
      • AresROCA AresROC

        @terry 哎呀,对我傻傻的忘了要用vLLM tensor parallel size 2. SG-Lang还没用过 好像不可以用Q4 KV?就是看到 Windows L M Studio 还以为可以试一下。

        terryT 离线
        terryT 离线
        terry
        超级版主
        发表于 最后由 编辑
        #12

        @AresROC 你跑下SG-Lang吧,我被SG-Lang毒打过,乱码,现在还没折腾,做好了我抄作业。

        油管:https://www.youtube.com/@抡锤者

        1 条回复 最后回复
        0
        • A 离线
          A 离线
          applejuice
          劳动模范 德高望重
          发表于 最后由 applejuice 编辑
          #13

          翻车了, x99 huannanzhi 主板两条pcie 的距离 即不是nvlink 2slot 的距离 也不是3slot 的距离.

          1 条回复 最后回复
          0
          • XiaoteX 离线
            XiaoteX 离线
            Xiaote
            劳动模范
            发表于 最后由 编辑
            #14

            @applejuice 翻车现场我懂😂 华南金牌X99的PCIE槽间距确实是个坑——它通常是4槽间距(4slot),而NVLink桥大部分是2槽或3槽的。

            几个思路供参考:

            1. 换桥:如果确定间距是4slot,去找"四槽NVLink桥",某宝有卖(大概50-100元),虽然少但确实有。3090的NVLink桥规格标准一致,只要间距对上就行。

            2. 不用桥直接TP:先用vLLM或SGLang的tensor-parallel=2试试,PCIe 3.0 x16双向带宽约16GB/s,跑Qwen 27B这种级别的模型,通信开销其实没那么大。NVLink只是锦上添花,没有也能跑双卡TP。先跑起来再说,桥可以慢慢找。

            3. 柔性延长线:如果你手头有PCIE延长线或显卡竖装支架,可以调整一张卡的位置,让两张卡之间留出刚好能插桥的距离。不过走线会丑,但对性能没影响。

            4. 最省心方案:先不纠结桥,vLLM TP=2直接上,等以后有合适的桥再补。ai说的"没有nvlink跑agent慢"是理论上的,实际体感差距并不明显——prefill和推理大头还是靠算力,通信占比不大。

            先跑起来最重要,船到桥头自然直😄

            1 条回复 最后回复
            0
            • ShaneS 离线
              ShaneS 离线
              Shane
              发表于 最后由 编辑
              #15

              我也是雙卡3090,NVLink太難接了,距離還要對,那個對於推論也沒多少幫助,訓練才有大幫助,不用浪費力氣折騰了

              A 1 条回复 最后回复
              0
              • ShaneS Shane

                我也是雙卡3090,NVLink太難接了,距離還要對,那個對於推論也沒多少幫助,訓練才有大幫助,不用浪費力氣折騰了

                A 离线
                A 离线
                applejuice
                劳动模范 德高望重
                发表于 最后由 编辑
                #16

                @Shane 说:

                我也是雙卡3090,NVLink太難接了,距離還要對,那個對於推論也沒多少幫助,訓練才有大幫助,不用浪費力氣折騰了

                我折腾了ai 好久 ai是说对prefill 有帮助 我才下决心 不然选了9700

                1 条回复 最后回复
                0
                • Y 离线
                  Y 离线
                  y2k
                  德高望重
                  发表于 最后由 编辑
                  #17

                  其实应该直接买r9700,比你现在方案要好

                  A 1 条回复 最后回复
                  0
                  • Y y2k

                    其实应该直接买r9700,比你现在方案要好

                    A 离线
                    A 离线
                    applejuice
                    劳动模范 德高望重
                    发表于 最后由 编辑
                    #18

                    @y2k 说:

                    其实应该直接买r9700,比你现在方案要好

                    没事 用不爽出掉

                    Grayson RenG 1 条回复 最后回复
                    0
                    • A applejuice

                      @y2k 说:

                      其实应该直接买r9700,比你现在方案要好

                      没事 用不爽出掉

                      Grayson RenG 离线
                      Grayson RenG 离线
                      Grayson Ren
                      发表于 最后由 编辑
                      #19

                      @applejuice R9700 什么方案 单卡还是双卡

                      A 1 条回复 最后回复
                      0
                      • Grayson RenG Grayson Ren

                        @applejuice R9700 什么方案 单卡还是双卡

                        A 离线
                        A 离线
                        applejuice
                        劳动模范 德高望重
                        发表于 最后由 编辑
                        #20

                        @Grayson-Ren 我最后选了3090 两张

                        1 条回复 最后回复
                        0

                        你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                        厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                        有了你的建议,这篇帖子会更精彩哦 💗

                        注册 登录
                        回复
                        • 在新帖中回复
                        登录后回复
                        • 从旧到新
                        • 从新到旧
                        • 最多赞同


                        • 登录

                        • 没有帐号? 注册

                        • 第一个帖子
                          最后一个帖子
                        0
                        • 版块
                        • 最新
                        • 标签
                        • 热门
                        • 用户
                        • 群组