84gb的6000d和72gb的pro5000 差不多价格
-
@Tony-Wang 感谢回复,我看到评测说标称是功耗600w,但是实际满载400w,比pro5000也就多100吧,散热噪音确实是个问题,要好好想想怎么弄。
-
@566656661 多人在線聊.....聊天
-
@566656661 多人在線聊.....聊天
-
grok给的结论:RTX PRO 6000D 在 FP4/FP8/FP16/FP32 等精度下的官方/可靠规格数据确实远低于完整 PRO 6000,基本符合你说的“约 15%”水平(具体 14-15% 左右)。 以下是基于 NVIDIA 官方文档、HPE QuickSpecs 等可靠来源的准确数据(非推算),重点对比三款卡。
官方 Tensor 性能对比(峰值,含 sparsity 等优化时)RTX PRO 6000 Blackwell(完整版,96GB,工作站/服务器版):
FP4 Tensor:~4 PFLOPS(4000 TOPS/AI TOPS)
FP8 Tensor:~2 PFLOPS(2000 TOPS)
FP16 / BF16 Tensor:~1 PFLOP(1000+ TFLOPS 范围,不同来源略有 1001 等)
FP32:125 TFLOPS(单精度)RTX PRO 6000D(中国特供/84GB 版):
FP4 Tensor:593 TFLOPS(约完整 6000 的 14.8%)
FP8 Tensor:296 TFLOPS(约 14.8%)
FP16 / BF16 Tensor:148 TFLOPS(约 14.8%)
TF32:~74 TFLOPS
FP32:约 110 TFLOPS 或更低(Max-Q 版类似,完整版 125 TFLOPS 对应砍幅一致)RTX PRO 5000 Blackwell(72GB 版典型):
Tensor 核心数 ~440(完整 6000 的 ~58%)
FP32:~65-74 TFLOPS
FP4/FP8/FP16 等低精度:大致按核心/规格比例 ~50-60% 于完整 6000(具体 FP4 预计 2000+ TOPS 级别,但无 6000D 那么极端砍削)。实际推理中 5000 72GB 在中型负载下接近或略优于 6000D 的低精度算力。数据来源说明:完整 6000 来自 NVIDIA 官方 datasheet(FP4 4 PFLOPS 等);6000D 来自 HPE 等 OEM QuickSpecs 的明确列出性能值;5000 来自 Exxact/NVIDIA 系列对比。Blackwell Tensor Core 低精度高度依赖核心数、时钟和带宽,6000D 的砍削主要体现在这些硬件规格上(CUDA/Tensor 核心 -17%,带宽/时钟下调,导致整体低精度算力大幅缩水)。
