跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. 随便聊聊
  3. 八張 RTX Pro 6000 總共768GB VRAM - the little Monster

八張 RTX Pro 6000 總共768GB VRAM - the little Monster

已定时 已固定 已锁定 已移动 随便聊聊
14 帖子 5 发布者 79 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • J johnnybegood

    @kos-or 说:

    https://www.youtube.com/watch?v=m81djC-xnt8

    买得起也没地方放啊,。。。

    kos orK 离线
    kos orK 离线
    kos or
    编写于 最后由 编辑
    #5

    @johnnybegood 大哥好呀 ~ 開個玩笑 假如您不介意可以放我工作室旁邊的小房間, 你自己遠程開關機 電費自付; Deepseek-V4-Pro 862B params 偶爾借我用一下 電費我按照token使用量分擔

    說到這邊 相較之下說不定DSV4 API成本更低??

    J 1 条回复 最后回复
    0
    • kos orK kos or

      @johnnybegood 大哥好呀 ~ 開個玩笑 假如您不介意可以放我工作室旁邊的小房間, 你自己遠程開關機 電費自付; Deepseek-V4-Pro 862B params 偶爾借我用一下 電費我按照token使用量分擔

      說到這邊 相較之下說不定DSV4 API成本更低??

      J 离线
      J 离线
      johnnybegood
      编写于 最后由 编辑
      #6

      @kos-or 看了视频, 电耗果然恐怖如斯

      1 条回复 最后回复
      0
      • Tony WangT 离线
        Tony WangT 离线
        Tony Wang
        编写于 最后由 编辑
        #7

        下一座AI数据中心,可能就挂在你家墙上
        5 月 5 日,加州创业公司 Span 和英伟达(Nvidia)公布了一项合作:把一个名叫 XFRA 的白色金属箱挂在美国普通住宅外墙上,紧挨着空调外机和电表。每个箱子里塞着 16 块 Nvidia Blackwell GPU、4 个 AMD EPYC CPU 和 3TB 内存,是企业级 AI 推理服务器的标准配置。

        要是能白嫖这个的算力, 那就理想了. 它给钱, 但是不知道能不能覆盖住电费.

        kos orK 1 条回复 最后回复
        0
        • Tony WangT Tony Wang

          下一座AI数据中心,可能就挂在你家墙上
          5 月 5 日,加州创业公司 Span 和英伟达(Nvidia)公布了一项合作:把一个名叫 XFRA 的白色金属箱挂在美国普通住宅外墙上,紧挨着空调外机和电表。每个箱子里塞着 16 块 Nvidia Blackwell GPU、4 个 AMD EPYC CPU 和 3TB 内存,是企业级 AI 推理服务器的标准配置。

          要是能白嫖这个的算力, 那就理想了. 它给钱, 但是不知道能不能覆盖住电费.

          kos orK 离线
          kos orK 离线
          kos or
          编写于 最后由 编辑
          #8

          @Tony-Wang 謝謝分享 這做法很有創意

          可能是電力網路暫時無法提供compute center 電力, 才會出現這種做法, 假如法規上沒有嚴格限制, 可能會比建造一個 compute center快許多, 能暫時滿足一個街區block的算力需求.

          這系統大概需要OAuth, 我猜白嫖的話最後還是要按照tokens計算價格, 除非美國零元購社團成員把16 GPUs RTX Pro 6000拔走拿到黑市銷售

          當然也可能透過hacking 繞過OAuth和機器上的Secucrity Agent的監視系統 使用算力 我們到時候看看hackers 怎麼做的 哈

          1 条回复 最后回复
          0
          • kos orK 离线
            kos orK 离线
            kos or
            编写于 最后由 编辑
            #9

            以廠商來說 需要保護 RTX Pro 6000 資產 有辦法從硬體端 hardware lock 鎖定嗎?
            我知道 CPU 可以鎖定 只能在某些特殊主機板上使用 - locked and unlocked CPUs
            假如Nvdidia 在RTX Pro 6000 加上一個MAC address 那應該可以追蹤被偷走的GPUs 假如上線的話

            cb6918f3-6193-44c8-9a86-d2440f5c4b91-image.jpeg

            1 条回复 最后回复
            0
            • kos orK 离线
              kos orK 离线
              kos or
              编写于 最后由 编辑
              #10

              假如使用 RTX Pro 6000 Max-Q 版本 TDP 300 W, 300W x 16 GPUs = 4800 W 這數字還行
              只要住戶有錢可拿 噪音方面能有效控制好 (不能吵到 住家晚上睡覺)
              這有大量部署可行性 只要整體收入能承擔這些額外增加的營運成本(相比於compute center的規模經濟)

              1 条回复 最后回复
              0
              • terryT terry

                这是自己的服务器?弥漫着金钱的味道。这玩意怎么高速互联的?

                kos orK 离线
                kos orK 离线
                kos or
                编写于 最后由 编辑
                #11

                @terry 我也好奇這八張要怎麼連接在一起 ?
                能跑八張 TP張量運算嗎? 還是八張PP在一起?也有可能是8個獨立的GPUs 服務

                5 1 条回复 最后回复
                0
                • kos orK kos or

                  @terry 我也好奇這八張要怎麼連接在一起 ?
                  能跑八張 TP張量運算嗎? 還是八張PP在一起?也有可能是8個獨立的GPUs 服務

                  5 在线
                  5 在线
                  566656661
                  编写于 最后由 编辑
                  #12

                  @kos-or

                  應該是依靠PCIe跑TP8 (2, 4, 8, 16這樣上去)

                  kos orK 1 条回复 最后回复
                  0
                  • 5 566656661

                    @kos-or

                    應該是依靠PCIe跑TP8 (2, 4, 8, 16這樣上去)

                    kos orK 离线
                    kos orK 离线
                    kos or
                    编写于 最后由 kos or 编辑
                    #13

                    @566656661 因為我目前的主板 PCIe 提供的速度不一致 還無法使用TP2, 等新的主板到了 提供一致的PCIe 速度 再玩看看PP/TG的效果如何 我看相關論文效能上是有增加的

                    5 1 条回复 最后回复
                    0
                    • kos orK kos or

                      @566656661 因為我目前的主板 PCIe 提供的速度不一致 還無法使用TP2, 等新的主板到了 提供一致的PCIe 速度 再玩看看PP/TG的效果如何 我看相關論文效能上是有增加的

                      5 在线
                      5 在线
                      566656661
                      编写于 最后由 编辑
                      #14

                      @kos-or

                      是有增加, 但並不是1 + 1 等於2那種 (因爲需要Nvidia的NCCL), 越加上去邊緣效應估計會越嚴重,

                      1 条回复 最后回复
                      0

                      你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                      厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                      有了你的建议,这篇帖子会更精彩哦 💗

                      注册 登录
                      回复
                      • 在新帖中回复
                      登录后回复
                      • 从旧到新
                      • 从新到旧
                      • 最多赞同


                      • 登录

                      • 没有帐号? 注册

                      • 登录或注册以进行搜索。
                      • 第一个帖子
                        最后一个帖子
                      0
                      • 版块
                      • 最新
                      • 标签
                      • 热门
                      • 用户
                      • 群组