跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. 随便聊聊
  3. 八張 RTX Pro 6000 總共768GB VRAM - the little Monster

八張 RTX Pro 6000 總共768GB VRAM - the little Monster

已定时 已固定 已锁定 已移动 随便聊聊
15 帖子 5 发布者 82 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • terryT terry

    这是自己的服务器?弥漫着金钱的味道。这玩意怎么高速互联的?

    kos orK 在线
    kos orK 在线
    kos or
    编写于 最后由 编辑
    #3

    @terry 那個是 影片截圖
    Source : https://www.youtube.com/watch?v=m81djC-xnt8

    Supermicro SYS-422GL-NR(或 SYS-422GL-FNR2)是企業級 4U MGX 雙路伺服器,專為大規模人工智慧、深度學習和高效能運算 (HPC) 工作負載而設計。它支援最多 8 個雙寬 PCIe 5.0/6.0 GPU,並配備第六代英特爾® Xeon® 處理器。

    J 1 条回复 最后回复
    0
    • kos orK kos or

      @terry 那個是 影片截圖
      Source : https://www.youtube.com/watch?v=m81djC-xnt8

      Supermicro SYS-422GL-NR(或 SYS-422GL-FNR2)是企業級 4U MGX 雙路伺服器,專為大規模人工智慧、深度學習和高效能運算 (HPC) 工作負載而設計。它支援最多 8 個雙寬 PCIe 5.0/6.0 GPU,並配備第六代英特爾® Xeon® 處理器。

      J 在线
      J 在线
      johnnybegood
      编写于 最后由 编辑
      #4

      @kos-or 说:

      https://www.youtube.com/watch?v=m81djC-xnt8

      买得起也没地方放啊,。。。

      kos orK 1 条回复 最后回复
      0
      • J johnnybegood

        @kos-or 说:

        https://www.youtube.com/watch?v=m81djC-xnt8

        买得起也没地方放啊,。。。

        kos orK 在线
        kos orK 在线
        kos or
        编写于 最后由 编辑
        #5

        @johnnybegood 大哥好呀 ~ 開個玩笑 假如您不介意可以放我工作室旁邊的小房間, 你自己遠程開關機 電費自付; Deepseek-V4-Pro 862B params 偶爾借我用一下 電費我按照token使用量分擔

        說到這邊 相較之下說不定DSV4 API成本更低??

        J 1 条回复 最后回复
        0
        • kos orK kos or

          @johnnybegood 大哥好呀 ~ 開個玩笑 假如您不介意可以放我工作室旁邊的小房間, 你自己遠程開關機 電費自付; Deepseek-V4-Pro 862B params 偶爾借我用一下 電費我按照token使用量分擔

          說到這邊 相較之下說不定DSV4 API成本更低??

          J 在线
          J 在线
          johnnybegood
          编写于 最后由 编辑
          #6

          @kos-or 看了视频, 电耗果然恐怖如斯

          1 条回复 最后回复
          0
          • Tony WangT 在线
            Tony WangT 在线
            Tony Wang
            编写于 最后由 编辑
            #7

            下一座AI数据中心,可能就挂在你家墙上
            5 月 5 日,加州创业公司 Span 和英伟达(Nvidia)公布了一项合作:把一个名叫 XFRA 的白色金属箱挂在美国普通住宅外墙上,紧挨着空调外机和电表。每个箱子里塞着 16 块 Nvidia Blackwell GPU、4 个 AMD EPYC CPU 和 3TB 内存,是企业级 AI 推理服务器的标准配置。

            要是能白嫖这个的算力, 那就理想了. 它给钱, 但是不知道能不能覆盖住电费.

            kos orK 1 条回复 最后回复
            0
            • Tony WangT Tony Wang

              下一座AI数据中心,可能就挂在你家墙上
              5 月 5 日,加州创业公司 Span 和英伟达(Nvidia)公布了一项合作:把一个名叫 XFRA 的白色金属箱挂在美国普通住宅外墙上,紧挨着空调外机和电表。每个箱子里塞着 16 块 Nvidia Blackwell GPU、4 个 AMD EPYC CPU 和 3TB 内存,是企业级 AI 推理服务器的标准配置。

              要是能白嫖这个的算力, 那就理想了. 它给钱, 但是不知道能不能覆盖住电费.

              kos orK 在线
              kos orK 在线
              kos or
              编写于 最后由 编辑
              #8

              @Tony-Wang 謝謝分享 這做法很有創意

              可能是電力網路暫時無法提供compute center 電力, 才會出現這種做法, 假如法規上沒有嚴格限制, 可能會比建造一個 compute center快許多, 能暫時滿足一個街區block的算力需求.

              這系統大概需要OAuth, 我猜白嫖的話最後還是要按照tokens計算價格, 除非美國零元購社團成員把16 GPUs RTX Pro 6000拔走拿到黑市銷售

              當然也可能透過hacking 繞過OAuth和機器上的Secucrity Agent的監視系統 使用算力 我們到時候看看hackers 怎麼做的 哈

              1 条回复 最后回复
              0
              • kos orK 在线
                kos orK 在线
                kos or
                编写于 最后由 编辑
                #9

                以廠商來說 需要保護 RTX Pro 6000 資產 有辦法從硬體端 hardware lock 鎖定嗎?
                我知道 CPU 可以鎖定 只能在某些特殊主機板上使用 - locked and unlocked CPUs
                假如Nvdidia 在RTX Pro 6000 加上一個MAC address 那應該可以追蹤被偷走的GPUs 假如上線的話

                cb6918f3-6193-44c8-9a86-d2440f5c4b91-image.jpeg

                1 条回复 最后回复
                0
                • kos orK 在线
                  kos orK 在线
                  kos or
                  编写于 最后由 编辑
                  #10

                  假如使用 RTX Pro 6000 Max-Q 版本 TDP 300 W, 300W x 16 GPUs = 4800 W 這數字還行
                  只要住戶有錢可拿 噪音方面能有效控制好 (不能吵到 住家晚上睡覺)
                  這有大量部署可行性 只要整體收入能承擔這些額外增加的營運成本(相比於compute center的規模經濟)

                  1 条回复 最后回复
                  0
                  • terryT terry

                    这是自己的服务器?弥漫着金钱的味道。这玩意怎么高速互联的?

                    kos orK 在线
                    kos orK 在线
                    kos or
                    编写于 最后由 编辑
                    #11

                    @terry 我也好奇這八張要怎麼連接在一起 ?
                    能跑八張 TP張量運算嗎? 還是八張PP在一起?也有可能是8個獨立的GPUs 服務

                    5 1 条回复 最后回复
                    0
                    • kos orK kos or

                      @terry 我也好奇這八張要怎麼連接在一起 ?
                      能跑八張 TP張量運算嗎? 還是八張PP在一起?也有可能是8個獨立的GPUs 服務

                      5 在线
                      5 在线
                      566656661
                      编写于 最后由 编辑
                      #12

                      @kos-or

                      應該是依靠PCIe跑TP8 (2, 4, 8, 16這樣上去)

                      kos orK 1 条回复 最后回复
                      0
                      • 5 566656661

                        @kos-or

                        應該是依靠PCIe跑TP8 (2, 4, 8, 16這樣上去)

                        kos orK 在线
                        kos orK 在线
                        kos or
                        编写于 最后由 kos or 编辑
                        #13

                        @566656661 因為我目前的主板 PCIe 提供的速度不一致 還無法使用TP2, 等新的主板到了 提供一致的PCIe 速度 再玩看看PP/TG的效果如何 我看相關論文效能上是有增加的

                        5 1 条回复 最后回复
                        0
                        • kos orK kos or

                          @566656661 因為我目前的主板 PCIe 提供的速度不一致 還無法使用TP2, 等新的主板到了 提供一致的PCIe 速度 再玩看看PP/TG的效果如何 我看相關論文效能上是有增加的

                          5 在线
                          5 在线
                          566656661
                          编写于 最后由 编辑
                          #14

                          @kos-or

                          是有增加, 但並不是1 + 1 等於2那種 (因爲需要Nvidia的NCCL), 越加上去邊緣效應估計會越嚴重,

                          kos orK 1 条回复 最后回复
                          0
                          • 5 566656661

                            @kos-or

                            是有增加, 但並不是1 + 1 等於2那種 (因爲需要Nvidia的NCCL), 越加上去邊緣效應估計會越嚴重,

                            kos orK 在线
                            kos orK 在线
                            kos or
                            编写于 最后由 编辑
                            #15

                            @566656661 對呀 TP2 目前看來好像是最佳TP配置
                            等先把TP2 建置完成 後續再看看有什麼可以疊加的軟硬體 再接著調整

                            因為預算有限 目前被單卡16GB 卡住了硬體框架 先這樣玩
                            最近要到貨的主機板有 6 x PCIe 4.0 x 16 lines 提供相同通訊速度
                            我再看看有沒有什麼有趣的玩法

                            1 条回复 最后回复
                            0

                            你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                            厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                            有了你的建议,这篇帖子会更精彩哦 💗

                            注册 登录
                            回复
                            • 在新帖中回复
                            登录后回复
                            • 从旧到新
                            • 从新到旧
                            • 最多赞同


                            • 登录

                            • 没有帐号? 注册

                            • 登录或注册以进行搜索。
                            • 第一个帖子
                              最后一个帖子
                            0
                            • 版块
                            • 最新
                            • 标签
                            • 热门
                            • 用户
                            • 群组