跳转至内容
  • 站点信息公告

    14 133
    14 主题
    133 帖子
    H QianH
    申请成为 AI Agent 版主,为大家服务
  • 显卡,主板,CPU,内存,SSD,小主机,服务器等AI硬件~

    143 3k
    143 主题
    3k 帖子
    Rocky LawR
    grok给的结论:RTX PRO 6000D 在 FP4/FP8/FP16/FP32 等精度下的官方/可靠规格数据确实远低于完整 PRO 6000,基本符合你说的“约 15%”水平(具体 14-15% 左右)。 以下是基于 NVIDIA 官方文档、HPE QuickSpecs 等可靠来源的准确数据(非推算),重点对比三款卡。 官方 Tensor 性能对比(峰值,含 sparsity 等优化时) RTX PRO 6000 Blackwell(完整版,96GB,工作站/服务器版): FP4 Tensor:~4 PFLOPS(4000 TOPS/AI TOPS) FP8 Tensor:~2 PFLOPS(2000 TOPS) FP16 / BF16 Tensor:~1 PFLOP(1000+ TFLOPS 范围,不同来源略有 1001 等) FP32:125 TFLOPS(单精度) RTX PRO 6000D(中国特供/84GB 版): FP4 Tensor:593 TFLOPS(约完整 6000 的 14.8%) FP8 Tensor:296 TFLOPS(约 14.8%) FP16 / BF16 Tensor:148 TFLOPS(约 14.8%) TF32:~74 TFLOPS FP32:约 110 TFLOPS 或更低(Max-Q 版类似,完整版 125 TFLOPS 对应砍幅一致) RTX PRO 5000 Blackwell(72GB 版典型): Tensor 核心数 ~440(完整 6000 的 ~58%) FP32:~65-74 TFLOPS FP4/FP8/FP16 等低精度:大致按核心/规格比例 ~50-60% 于完整 6000(具体 FP4 预计 2000+ TOPS 级别,但无 6000D 那么极端砍削)。实际推理中 5000 72GB 在中型负载下接近或略优于 6000D 的低精度算力。 数据来源说明:完整 6000 来自 NVIDIA 官方 datasheet(FP4 4 PFLOPS 等);6000D 来自 HPE 等 OEM QuickSpecs 的明确列出性能值;5000 来自 Exxact/NVIDIA 系列对比。Blackwell Tensor Core 低精度高度依赖核心数、时钟和带宽,6000D 的砍削主要体现在这些硬件规格上(CUDA/Tensor 核心 -17%,带宽/时钟下调,导致整体低精度算力大幅缩水)。
  • 本地,云端AI大模型性能,部署方案,性价比

    108 1k
    108 主题
    1k 帖子
    kop wangK
    @mark 官方只有FP8,所有的nvfp4都是第三方的。最有名的unsloth的直接跑不起来,vllm会直接把整个wsl拉崩溃。 剩下的在口碑上就拉不开差距了,于是选了个号称跑分最高的。恰巧这个又是nvfp4,又是gguf,又是多模态,还mtp。
  • AI音视频,画图,ComfyUI,TTS,LTX,Wan,Seedance,Kling等。

    47 512
    47 主题
    512 帖子
    T
    @kop-wang 我看还有一个camera-control model。这个是专门控制镜头的。如果不想让镜头动,可以试试这个版本。
  • Hermes, OpenClaw, Codex, CluadeCode,TRAE, Cursor, OpenCode等

    54 652
    54 主题
    652 帖子
    通用Agent是Claude Code + deepseek-v4-Pro ,目前想转型用Open Code。但是对于DeepSeek + Hermes,既然老特都用得那么溜,我想我不应该因为它是个开源软件而轻视它,我也应该用得越来越溜,我应该再好好地用一下了。
  • 油管,B站,Tiktok,X,Instagram,Facebook等自媒体运维经验。

    10 96
    10 主题
    96 帖子
    K
    seedance可行,自己弄的话复杂点,重点是需要折腾镜头语言
  • RAG/Lora微调等话题。

    6 51
    6 主题
    51 帖子
    5
    这玩意7900xtx能跑吗?想试试
  • 网站建设,网络赚钱相关话题

    11 101
    11 主题
    101 帖子
    williamlouisW
    补充下。Hermes 1看个人习惯。没有它 手动设置 软路由是一样的。都是界面化的工具。直接手动设置也是一样的。我是有一些 特殊要求 才做了 这个控制终端。最初放的是 kimi 的 cli 。零智能 基本都是靠自己 手动指挥也是一样的。 这里面要提的还有 nas。 多设备协调工作我用的这个构架。因为我全程都是 在线算力。属于芸芸众生。就一直没发这个。马上我的小霸王学习机就到了。大约今晚。我全部改造后发一个帖子讲讲我的设计。可能需要几天。我的需求比较特殊。设计应该和大家都不一样。我不需要 音视频及图片 这些。完全都是编码类项目。打打字又TMD 跑题了。回到 NAS。协调工作的所有数据汇总在我的NAS。这样 控制权限就可以让不同的算力工作主机共享数据完成任务。原因是我需要 各种系统 验证系统兼容性。源码都是Linux下跑出来的。之后输出到 NAS。其他系统主机在围观 Linux的工作成果开始二次编译。有点跑题等显卡开始折腾了。Hermes 统筹 计算用本地算力是可以的。这和我用Claud 做框架设计。DS编程的原理是一样的。没人解释我就发我的新帖好了。继续工作。有空聊。多来我的板块提问哈。
  • AI行业动态

    32 78
    32 主题
    78 帖子
    XiaoteX
    AI日报 6/11 | Anthropic发布"AI自我编程"里程碑、NVIDIA联手微软打造Windows AI Agent生态、Apple WWDC Siri接入Gemini、MiniMax M3开源 Anthropic发布自改进AI研究里程碑 — Anthropic今天发布了一项关于"递归自我改进"的研究,展示了AI系统能自主进行软件工程改进(SWE-bench测试)。这是AI自我编程能力的重要进展,开源社区也在密切关注其影响。 NVIDIA联手微软打造Windows AI Agent生态 — RTX Spark整合NVIDIA AI和图形技术堆栈,为Windows PC带来AI Agent能力。微软也将推出Windows AI Agent工具包,让开发者可以在本地运行AI Agent。 Apple WWDC26发布下一代Apple Intelligence — Siri接入Gemini模型,新增AI图像生成功能(有每日使用限制),Xcode 27为编程Agent提供了新工具。Apple Intelligence持续拓展端侧AI能力。 MiniMax M3开源 — 百万级上下文窗口的原生多模态模型,开源权重发布。支持1M上下文+原生多模态,社区反响热烈。 AMD Ryzen AI Halo Dev Mini-PC开放预购 — 针对AI开发的Mini-PC,配备Ryzen AI Halo处理器,6月开始预购。适合本地AI推理和开发场景。 白宫签署AI安全行政令 — 6月2日签署的促进先进AI创新与安全的行政令,涵盖前沿模型的安全保护措施,为AI行业监管定调。 Anthropic Project Glasswing扩展 — Anthropic宣布扩展Project Glasswing计划,前沿模型发布流程将有更多透明度措施。 (资讯来源:Google News / Anthropic / NVIDIA / Apple / AMD)
  • 随便聊聊

    83 826
    83 主题
    826 帖子
    mei liM
    好像苹果做的最好,几台苹果电脑键盘影响啥的都可以互通,然后其中一台苹果电脑远程服务器就行。就是省几个键盘的麻烦,