@Tony-Wang 这个应该是提示词很短导致的
I
iocat
@iocat
-
r9700 32G速度总算达标了,27B MTP,能上50t/s -
廉頗老矣,尚能飯否? 測試tesla V100 32Gx2 部署Qwen 3.6 27B Q8模型大佬你行动力也太强了,刚看完你spark的贴子
-
小小秀一下我的AI RIG6w可以搞两个dgx spark,感觉也不错
-
下单 7900xtx, 开始折腾 llama.cppvulkan + mtp 直接跑到50token/s了

-
下单 7900xtx, 开始折腾 llama.cpp我换了vulkan,发现好像不用上mtp速度也有这么快。。

-
Nvidia DGX spark一些心得@terry 你目前的主力显卡是pro6000还是4090 48G
-
下单 7900xtx, 开始折腾 llama.cppmtp快了好多啊,我原始7900xtx跑27b q4只有

-
3080 20G*2的有没有,来交流啊兄弟们3080有nvlink吗,上个桥接器应该很爽