求教,顯卡的選擇
-
@陳瑋 3万预算的话,关键看你的demo是什么类型:
如果是跑大语言模型(LLM):
- 5090D 32G 显存虽然大,但一张卡跑不了多大的模型
- 两张9700 32G(共64G显存)通过vLLM tensor-parallel,能跑Qwen 3.6 70B甚至更大模型
- 显存容量比单卡算力重要得多
如果是跑ComfyUI/视频生成:
- 5090D的单卡算力很强,Wan2.2、LTX这些吃算力比吃显存多
- 但32G显存跑长视频可能会爆
- 双9700 32G在ComfyUI里支持多卡分摊
个人建议:如果金主要看demo效果且后续有扩展空间,两张9700 32G更战未来。如果只是短时间demo交差,5090D省心省事。
David Zhang问的"软妹币"就是人民币啦

-
如果你demo打游戏,那就5090D -_-;;;
小特瞎说,Qwen3.6哪里来的70B,只有27B和35B MoE。这两个5090D都能跑。
如果跑LLM,确实是显存大就可以为所欲为,R9700配合llama.cpp的分层功能,不算慢。也可以尝试vLLM的双卡TP,但我试了,A卡vLLM对Qwen3.6支持不行,一些旧模型可以,但上下文非常有限,性能不如N卡。真要尝试,用linux,用这位老哥的toolbox:https://github.com/kyuz0/amd-r9700-vllm-toolboxes/你要是demo视频生成啥的,那就问老特,这方面我没经验了。
-
如果你demo打游戏,那就5090D -_-;;;
小特瞎说,Qwen3.6哪里来的70B,只有27B和35B MoE。这两个5090D都能跑。
如果跑LLM,确实是显存大就可以为所欲为,R9700配合llama.cpp的分层功能,不算慢。也可以尝试vLLM的双卡TP,但我试了,A卡vLLM对Qwen3.6支持不行,一些旧模型可以,但上下文非常有限,性能不如N卡。真要尝试,用linux,用这位老哥的toolbox:https://github.com/kyuz0/amd-r9700-vllm-toolboxes/你要是demo视频生成啥的,那就问老特,这方面我没经验了。
-
Demo是啥?软妹币?
就是三萬人民幣讓我上京東自己挑我要的東西
-
不差钱上RTX Pro5000 或者 6000, 大显存是王道。小特瞎说你别管,多卡能跑多个ComfyUI实例,但是不能叠加显存。如果只有3万闭眼入4090 48G,5090要3.3万以上。 不过5090快很多,这是个问题。AMD是给懂的人用的,不懂的人别买。凡是纠结的,都不适合用AMD。
-
@terry 感謝各位大佬回覆,我左思右想想出了一個可能比較適合我的方向,如果我用兩台電腦,一台3080 +6600xt oclink 顯卡塢跑分層模型、一台5090d跑comfyui,我好像就只需要買一張5090d就可以了
會這樣搭配是因為我體感上6600跟3080的模型運行速度相差不多,並且期待有天5090d也能改顯存
-
@陳瑋 AN不要混合分层,没必要,你再弄一个3080跑模型,也不会多花几个钱,这个卡才3000不到。双3080跑LLM很强大,5090D如果是32G的,可以。我记得5090D V2是24G的。