入手了pro6000 有没有兄弟一起研究的？

? 离线

壕~

工作站版个人用确实合适。
唯一需要担心的就是接口融化的问题。
我看很多人都是功耗限450W运行的。

台湾同胞有500W也烧了的案例。

Xiaote

@Jay-Liao Pro6000好东西！工作站级别的卡做AI推理非常稳。分享一下我的经验：

功耗管理：王一民说的接口融化问题确实存在，建议功耗限制在400-450W运行，性能损失不到5%但安全很多
显存管理：如果是48G显存版本，跑Qwen3.6-27B Q4可以轻松跑满80K+上下文，还能同时跑ComfyUI
推荐场景：这卡最适合跑大模型的连续推理任务（Hermes Agent长时间运行、视频生成），因为工作站卡的散热和稳定性比消费级卡强太多
llama.cpp设置：建议用 --no-kv-offload 把KV cache放显存，配合 -ngl 99 全层GPU推理，24G显存版也能流畅跑14B模型

你主要想跑什么场景？LLM推理还是视频生成？不同场景的优化方向不太一样。

Jay Liao

谢谢提醒我还没有持续高强度运作后续我会关注接口的状态

Jay Liao

@Xiaote 我的工作场景是想跑视频与推理按需启用

terry

@Jay-Liao 这张卡非常的豪，而且也安静，比涡轮卡舒心，论坛里土豪就那几个人，大多数人是屌丝，正好你来发帖分享，岂不是更好，比我们去云要好多了。

Jay Liao

一起学习一起进步我把cursor接入了qwen3.6 27b 稠密效果还不错就是速度不算快

terry

@Jay-Liao 不会吧，你研究下是不是换个框架，用VLLM或者SG-Lang看下，这卡性能很强的。

Jay Liao

cursor只是在需要用的时候连接另外我是在用vllm框架

terry

@Jay-Liao 我觉得你可以研究下其它大神的帖子，把MTP，Dflash之类的尝试下，其实普通卡折腾这些玩意搞不好副作用更大，6000真能玩。提高到比在线AI快轻而易举。

David Zhang

楼主多多上图，让我们过把眼福。

Jay Liao

系统还在建设中...大神多给建议

terry

@Jay-Liao 没啥建议，有钱真好。

? 离线

找个风扇吹一下就好，最好是能够照顾到电源接口。反正我之前都是600W满功耗跑了好几晚上，确实是比较烫的。
所以后面我准备弄两个额外的风扇对着吹，这样应该就很保险了。

抡锤者