3090还是3090 *2+NVLink
-
@starryskyknight 你买4080S 32G,或加几千买RTX Pro4500 32G。如果想便宜3090 24G。
@terry 感谢提供意见,在海外买不到4080S 32G 我找另外两张 再次感谢
-
這個技術可以把整個qwen 3.6 35bA3B Q8量化+256k上下文塞進去24g vram~有點想跑看看
-
這個技術可以把整個qwen 3.6 35bA3B Q8量化+256k上下文塞進去24g vram~有點想跑看看
-
我不用Deepseek V4 Pro,我都是用的Flash,跑Agent不需要那么大参数,280b都超标了,事实上Qwen3.6 27b可以完成绝大多数工作。它的问题是本地模型的工具链没有云端丰富。但是可以用V4 Flash作为fallback参数,本地不行就调用它。它执行完毕之后形成skills,本地模型再跑就可以了。你换成Qwen3.6 27b+Deepseek V4 Flash不会有多大差距。Hermes不太吃模型自身能力,它的harness做的不错。
关于显卡,一张卡和两张卡+NVLink差距当然大,两张TP算力和显存都翻倍,减去框架开销也有1.8倍左右。3090单卡就够了,你多研究下Turboquant mtp dflash等技术,就一个turboquant搞定就够你玩了。
现在不建议味了跑AI买5090,太贵了,你可以买个RTX Pro 4500 32G就够你用, 5000 48G, 6000 96G都是很好的选择。性能都够了,不会有啥便秘的感觉。5090烧接口,功耗太高这是基本无解的。它的溢价来自于游戏能力。
@terry
5090 的溢價 , 來自於將來能改 64G , 甚至 96G .

-
@terry
5090 的溢價 , 來自於將來能改 64G , 甚至 96G .

@Peace-Love 那何必呢,为什么不直接用Pro6000,性价比不是更高?
-
@Peace-Love 那何必呢,为什么不直接用Pro6000,性价比不是更高?
@terry
能買三張 5090. -
@terry
能買三張 5090.@Peace-Love 好吧,以后还真能改,这是隐藏福利。