跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 华南金牌H12D-8D/16D双路主板cpu套装

华南金牌H12D-8D/16D双路主板cpu套装

已定时 已固定 已锁定 已移动 AI硬件
13 帖子 8 发布者 538 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • F 离线
    F 离线
    fanwen1974
    编写于 最后由 编辑
    #1

    问下,为何没有人想要这个组合? 有 4个 PCIE 4.0 X 16 这个不香吗?还是价格的问题。最近一直想买个 X99 或 这个来组多显卡 2-4张,如果有群友有的话可以分享一下使用感想,谢谢!

    A 1 条回复 最后回复
    0
    • F fanwen1974

      问下,为何没有人想要这个组合? 有 4个 PCIE 4.0 X 16 这个不香吗?还是价格的问题。最近一直想买个 X99 或 这个来组多显卡 2-4张,如果有群友有的话可以分享一下使用感想,谢谢!

      A 离线
      A 离线
      applejuice
      劳动模范 德高望重
      编写于 最后由 编辑
      #2

      @fanwen1974 说:

      问下,为何没有人想要这个组合? 有 4个 PCIE 4.0 X 16 这个不香吗?还是价格的问题。最近一直想买个 X99 或 这个来组多显卡 2-4张,如果有群友有的话可以分享一下使用感想,谢谢!

      考虑过 但是太贵了.

      1 条回复 最后回复
      0
      • K 离线
        K 离线
        koala
        编写于 最后由 编辑
        #3

        你有多张卡的话,这当然是更好的组合,我目前的想法是7900XTX *2,或者7900XTX+AI PRO 9700,看后续赚不赚到钱来决定要不要买下一张卡

        1 条回复 最后回复
        0
        • XiaoteX 离线
          XiaoteX 离线
          Xiaote
          劳动模范
          编写于 最后由 编辑
          #4

          @fanwen1974 关于为什么H12D这种双路EPYC平台在AI领域不流行的原因,除了价格外还有几个实际考量:

          1. 性价比问题
            H12D-8D双路板+两颗EPYC(哪怕是便宜的7R32/7C92)+DDR4 REG ECC,一套下来至少3000-4000,够买两张二手3090了。对于纯AI推理来说,GPU才是算力核心,主板CPU上花太多预算会挤压显卡预算。

          2. PCIe通道分配尴尬
            4个PCIe 4.0 x16看似很美,但双路EPYC的128条PCIe通道是分配在两个CPU上的——插4张卡时,卡1和卡3在CPU0,卡2和卡4在CPU1。跨CPU访问GPU内存需要走IF总线,延迟增加。而且实际AI推理场景,2-3张卡完全够用,X99平台(40条PCIe 3.0)+两张卡的成本只有H12D的1/3。

          3. 功耗和散热
            双路EPYC待机功耗就100W+,满载300W+。加上4张显卡(4x 300W=1200W),总功耗1500W+,家用需要改电路、上机柜,不是普通玩家能搞定的。

          4. 内存带宽利用率
            EPYC确实有8通道DDR4,但在纯推理场景,模型权重已经在GPU显存里了,CPU内存主要是做prefill和KV cache offload。4张3090(96G显存)大部分模型显存放得下,根本用不到CPU内存的大带宽。

          总结:H12D适合需要大量CPU核心+多GPU做科学计算的场景(比如分子模拟、CFD),但纯AI推理/微调的话,X99双卡方案或者直接上单卡大显存(5090/PRO 4500)的性价比高得多。

          1 条回复 最后回复
          0
          • F 离线
            F 离线
            fanwen1974
            编写于 最后由 编辑
            #5

            最后,我还是买了一块+7K62+ 64G DDR4 ,来玩玩,预计是要 AI R9700 x N 。 N 随时间增加。先组一台A 卡方案,下次再来组N卡,因为N卡比较贵。

            Capri SwicordC 1 条回复 最后回复
            0
            • terryT 离线
              terryT 离线
              terry
              超级版主
              编写于 最后由 编辑
              #6

              多卡7k系列更好,单卡,或者两张卡不搞TP,用x99CD3足够,其实多卡TP7k系列也不够,带宽还是略有吃紧,但比CD3的PICE3好多了。

              油管:https://www.youtube.com/@抡锤者

              1 条回复 最后回复
              0
              • song samuelS 离线
                song samuelS 离线
                song samuel
                编写于 最后由 编辑
                #7

                超微和浪潮有一款这样的服务器,可以插4卡,1000块就能买到,带2000w电源,我认为比什么华南金牌稳定。

                1 条回复 最后回复
                0
                • F fanwen1974

                  最后,我还是买了一块+7K62+ 64G DDR4 ,来玩玩,预计是要 AI R9700 x N 。 N 随时间增加。先组一台A 卡方案,下次再来组N卡,因为N卡比较贵。

                  Capri SwicordC 离线
                  Capri SwicordC 离线
                  Capri Swicord
                  编写于 最后由 编辑
                  #8

                  @fanwen1974 大佬效果咋样,我也在看这个主板,有点贵,内存条现在也不便宜。还有cpu咋不用7003系列,不是说这一代比7002好嘛

                  1 条回复 最后回复
                  0
                  • T 离线
                    T 离线
                    topgun2000
                    编写于 最后由 topgun2000 编辑
                    #9

                    H12D-8D不是单路版吗?我买了一个配7443,挺不错,是atx,普通pc机箱就能用,做工实在

                    不过只有8个ddr4内存槽。其他一些华硕技嘉的二手版有16个内存槽,一般都是e-atx大版,需要大机箱或者服务器

                    装了256GB DDR4,直接用CPU推理,八个通道可以达到200GB/s,肯定比GPU慢,但是可以装大模型测试

                    A 1 条回复 最后回复
                    0
                    • T topgun2000

                      H12D-8D不是单路版吗?我买了一个配7443,挺不错,是atx,普通pc机箱就能用,做工实在

                      不过只有8个ddr4内存槽。其他一些华硕技嘉的二手版有16个内存槽,一般都是e-atx大版,需要大机箱或者服务器

                      装了256GB DDR4,直接用CPU推理,八个通道可以达到200GB/s,肯定比GPU慢,但是可以装大模型测试

                      A 离线
                      A 离线
                      applejuice
                      劳动模范 德高望重
                      编写于 最后由 编辑
                      #10

                      @topgun2000 ddr4 好像不够快,ddr5 又太贵

                      T 1 条回复 最后回复
                      0
                      • A applejuice

                        @topgun2000 ddr4 好像不够快,ddr5 又太贵

                        T 离线
                        T 离线
                        topgun2000
                        编写于 最后由 topgun2000 编辑
                        #11

                        @applejuice 对,我跑233GB的MOE大模型Qwen3.5-397B-A17B-UD-Q4_K_XL,CPU+DDR4只能5TPS。12通道DDR5大概能到460 GB/s ~ 614 GB/s,加上新的9005 Epyc,估计能到15TPS。但是DDR5太贵了,我的DDR4是以前买的,现在也涨价三倍了

                        H12D-16D双路应该用不上,两个CPU管理不同的内存卡槽,垮桥通信是个瓶颈

                        A 1 条回复 最后回复
                        0
                        • T topgun2000

                          @applejuice 对,我跑233GB的MOE大模型Qwen3.5-397B-A17B-UD-Q4_K_XL,CPU+DDR4只能5TPS。12通道DDR5大概能到460 GB/s ~ 614 GB/s,加上新的9005 Epyc,估计能到15TPS。但是DDR5太贵了,我的DDR4是以前买的,现在也涨价三倍了

                          H12D-16D双路应该用不上,两个CPU管理不同的内存卡槽,垮桥通信是个瓶颈

                          A 离线
                          A 离线
                          applejuice
                          劳动模范 德高望重
                          编写于 最后由 编辑
                          #12

                          @topgun2000 希望以后有机会搞个512gb 内存来玩. 但是我觉得跌价的时候也是大模型崩的时候了

                          T 1 条回复 最后回复
                          0
                          • A applejuice

                            @topgun2000 希望以后有机会搞个512gb 内存来玩. 但是我觉得跌价的时候也是大模型崩的时候了

                            T 离线
                            T 离线
                            topgun2000
                            编写于 最后由 编辑
                            #13

                            @applejuice 我还有个技嘉的板子16个内存槽512GB+7K62,跑Qwen3.5-397B-A17B-UD-Q4_K_XL也差不多5TPS,比7443稍微慢点。AI说7K62应该比7443快点,因为是8CCD,7443只有4个CCD。但是实际内存是2666 vs 2933,所以内存速度更重要

                            1 条回复 最后回复
                            1

                            你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                            厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                            有了你的建议,这篇帖子会更精彩哦 💗

                            注册 登录
                            回复
                            • 在新帖中回复
                            登录后回复
                            • 从旧到新
                            • 从新到旧
                            • 最多赞同


                            • 登录

                            • 没有帐号? 注册

                            • 第一个帖子
                              最后一个帖子
                            0
                            • 版块
                            • 最新
                            • 标签
                            • 热门
                            • 用户
                            • 群组