跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 比较流畅的跑Qwen 3.6 27B 模型本地部署,使用AI PRO R9700,主机怎么配置

比较流畅的跑Qwen 3.6 27B 模型本地部署,使用AI PRO R9700,主机怎么配置

已定时 已固定 已锁定 已移动 AI硬件
31 帖子 16 发布者 1.2k 浏览 1 关注中
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • B 离线
    B 离线
    Brian
    发表于 最后由 编辑
    #17

    我刚配好,拼多多2800元, 2686v4*2,x99,1T,64g,不带显卡,显卡京东1.1万,电源700w,我自己换了1200w,长城750元。预装win10,本来想玩玩游戏再搞模型,win弹窗弹的难受,赶紧装了ubuntu,还在摸索,洋垃圾太强了

    A 1 条回复 最后回复
    1
    • B 离线
      B 离线
      Brian
      发表于 最后由 编辑
      #18

      安装了hermes,配了ds V4 pro,太省事了,不用怎么折腾

      1 条回复 最后回复
      1
      • B Brian

        我刚配好,拼多多2800元, 2686v4*2,x99,1T,64g,不带显卡,显卡京东1.1万,电源700w,我自己换了1200w,长城750元。预装win10,本来想玩玩游戏再搞模型,win弹窗弹的难受,赶紧装了ubuntu,还在摸索,洋垃圾太强了

        A 离线
        A 离线
        andyfay
        发表于 最后由 编辑
        #19

        @Brian 配置方便分享下,多谢!

        1 条回复 最后回复
        0
        • Kiner LiuK 离线
          Kiner LiuK 离线
          Kiner Liu
          发表于 最后由 Kiner Liu 编辑
          #20

          雙卡am5主板可以考慮 gigabyte b850 ai top, asrock x870e creator, asus x870e proart,都是原生兩根pcie 5.0 x8。四卡sTR5主板就要上TRX50/WRX90系列了。

          1 条回复 最后回复
          1
          • terryT terry

            一张卡1.1万,两张卡就2.2,所以搞不定。如果要便宜,x99+64G DDR3 1866内存+这张卡,抄作业就是了,1.5w左右搞定整机。

            tmp tmpT 离线
            tmp tmpT 离线
            tmp tmp
            编写于 最后由 编辑
            #21

            @terry 老特,请教一下,一张r9700 32g,配你说的主板和64G内存,可以同时运行hermes,qwen3.6-27b和comfyui吗?

            • 列表
            terryT 1 条回复 最后回复
            0
            • tmp tmpT tmp tmp

              @terry 老特,请教一下,一张r9700 32g,配你说的主板和64G内存,可以同时运行hermes,qwen3.6-27b和comfyui吗?

              • 列表
              terryT 离线
              terryT 离线
              terry
              超级版主
              编写于 最后由 编辑
              #22

              @tmp-tmp 一张不行。

              油管:https://www.youtube.com/@抡锤者

              1 条回复 最后回复
              0
              • kos orK 离线
                kos orK 离线
                kos or
                劳动模范 德高望重
                编写于 最后由 编辑
                #23

                AI Pro R9700的显卡 32GB 未來有需求可以擴增 x2 = 64GB 應該可以應付下一個3~5年 先選一個主板可以提供 x8/x8的PCIe配置
                目前的模型好像...小模型也能有過去大模型的智商 64GB應該都夠用

                1 条回复 最后回复
                1
                • J 离线
                  J 离线
                  jatwu
                  编写于 最后由 编辑
                  #24

                  我买了讯景的卡,满载跟开飞机一样大声,楼主你买的蓝宝石会吗?

                  terryT 1 条回复 最后回复
                  0
                  • W 离线
                    W 离线
                    wml-ai
                    编写于 最后由 编辑
                    #25

                    @jatwu 我也是蓝宝石R9700,满载时声音确实大,但是比起电水壶烧开水时还是差远了,时间长了就习惯了。

                    1 条回复 最后回复
                    0
                    • J jatwu

                      我买了讯景的卡,满载跟开飞机一样大声,楼主你买的蓝宝石会吗?

                      terryT 离线
                      terryT 离线
                      terry
                      超级版主
                      编写于 最后由 terry 编辑
                      #26

                      @jatwu 一线品牌差距不大,蓝宝石做工稍好。

                      油管:https://www.youtube.com/@抡锤者

                      1 条回复 最后回复
                      0
                      • W 离线
                        W 离线
                        wml-ai
                        编写于 最后由 编辑
                        #27

                        @kiner-liu AM5还有一款支持双卡的主板,铭瑄iCraft B850,1500RMB,也有两个PCIex16插槽,可以PCIe5.0 x8,性价比之选。

                        1 条回复 最后回复
                        1
                        • ken chanK 离线
                          ken chanK 离线
                          ken chan
                          编写于 最后由 ken chan 编辑
                          #28

                          本来还想提问相同的问题的,看来可以抄作业了

                          1 条回复 最后回复
                          0
                          • ken chanK 离线
                            ken chanK 离线
                            ken chan
                            编写于 最后由 ken chan 编辑
                            #29

                            如果以后出了一个40b的稠密大模型,两个R9700=64g,可以顺利运行吗?显存可以叠加使用的吧?还是说只能: a软件跑一个R9700, b软件跑一个R9700,

                            V 1 条回复 最后回复
                            0
                            • ken chanK 离线
                              ken chanK 离线
                              ken chan
                              编写于 最后由 ken chan 编辑
                              #30

                              diy主机,配件都是自己分别买,然后自己组装吗?
                              问了几家店,都说,没有R9700。感觉都是要自己组装的样子

                              1 条回复 最后回复
                              0
                              • ken chanK ken chan

                                如果以后出了一个40b的稠密大模型,两个R9700=64g,可以顺利运行吗?显存可以叠加使用的吧?还是说只能: a软件跑一个R9700, b软件跑一个R9700,

                                V 离线
                                V 离线
                                Vincent Chen
                                编写于 最后由 编辑
                                #31

                                @ken-chan
                                根據我的觀測。
                                用於語言大模型的話
                                一般的話,vram是會疊加。
                                例如,40gb的大模型
                                可以選擇平均分配到兩張gpu
                                Pipeline parallel
                                就是20放在1號卡
                                另外,20放在2號卡。
                                運算的時候會先跑1號,跟住跑2號
                                不斷重複。
                                根據我的觀察,這樣gpu不會太熱。因為有一定的休息時間。
                                速度會比單卡慢少少。

                                另外,可以設定為tensor parallel
                                同樣都是1號卡20gb 2號卡20gb
                                但兩張卡同時間運行。
                                每一個token計算完都會聚合在一起。
                                不斷重複。
                                好處是你可以同時間用到兩張gpu的 memory bandwidth
                                如果你的gpu 是800gb/s
                                兩張卡跑tp 就是800 x 2
                                不過要扣除每一token計算輸出時所用的時間
                                根據我的理解是,大約單卡是速度的1.5倍左右。

                                但是,如果跑圖片或視頻就應該不能了
                                只能夠一張一張卡跑。記憶體不能疊加。

                                1 条回复 最后回复
                                0

                                你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                有了你的建议,这篇帖子会更精彩哦 💗

                                注册 登录
                                回复
                                • 在新帖中回复
                                登录后回复
                                • 从旧到新
                                • 从新到旧
                                • 最多赞同


                                • 登录

                                • 没有帐号? 注册

                                • 第一个帖子
                                  最后一个帖子
                                0
                                • 版块
                                • 最新
                                • 标签
                                • 热门
                                • 用户
                                • 群组