另类16GB+12GB配置

Reply to 另类16GB+12GB配置 on Thu, 07 May 2026 02:55:19 GMT

stakira — Thu, 07 May 2026 02:55:19 GMT

@tomcatzh 1000上下

tomcatzh — Thu, 07 May 2026 01:10:35 GMT

prefill速度呢？如果用来跑agent 30-40K，甚至70k - 100k的prefill都是很常见的

虽然cache命中就无所谓，但总有冷启动的时候

terry — Wed, 06 May 2026 14:18:42 GMT

@CHIA-AN-YANG 换卡是对的，它这5070Ti的算力很强了，被3060拖累了。这卡又贵，效果还不如单卡3090.

CHIA AN YANG — Wed, 06 May 2026 14:14:33 GMT

我之前搞rtx3060 12g x3 搞不出來,,後來換7900XTX 24G 體驗好多了

terry — Tue, 05 May 2026 18:15:05 GMT

@stakira 厉害！我也正想折腾下这个玩意，你做的很有意义啊，兄弟，这为我提供了一个素材，我可以测试下A卡和N卡一起分层跑Vulkan。说到分层，你说的对，如果主力卡算力足够，只是显存不够，用一张副卡来offload绝对比降级到CPU内存划算得多，这是个很好的思路。感谢分享，好贴！