双 3090（NVLink）跑 Qwen3.6-27B，128K 上下文实测

Leon Y

Qwen3.6-27B我也是上不了多模态，只能退回到Qwen3-VL

Leon Y

我的也是3090x2+NVLink，vLLM跑Qwen3.6-27B 性能
Narrative
• 吞吐: 92.4 tok/s

Code
• 吞吐: 99.0 tok/s

applejuice

@Leon-Y prefill 呢？

Larry Wang

@Leon-Y 3090的nvlink在哪里买？多少钱呀？

Leon Y

@Larry-Wang 说:

@Leon-Y 3090的nvlink在哪里买？多少钱呀？

taobao, RMB2500

Leon Y

@applejuice 说:

@Leon-Y prefill 呢？

忘了看了

applejuice

@Leon-Y 说:

@Larry-Wang 说:

@Leon-Y 3090的nvlink在哪里买？多少钱呀？

taobao, RMB2500

3槽的吧？那么贵

topgun2000

@applejuice 我和你试了几乎完全一样的设置Qwen3.6-27B-UD-Q4_K_XL，不过是单卡4090 24GB，所以上下文只能装120000。MTP开了以后大概能85~90tps，不开大概45tps，vram用了23GB

topgun2000

@applejuice 我觉得结果很不错，NVlink通信损失小，TP是算力叠加，所以2x3090在这种情况下tps能接近或者等同单卡4090算力，而且上下文能更多

@Leon-Y 为什么你的数据比 @applejuice 的好很多？

applejuice

@topgun2000 模型不一样
如果用那个模型开mtp 结果差不多

topgun2000

@applejuice 了解了，他用的是int4的文字模型，所以TP更快一些

qw er

@applejuice 兄弟哪个主板可以插双3090啊这个卡台厚了论坛洋垃圾的主板行吗

applejuice

@qw-er 说:

@applejuice 兄弟哪个主板可以插双3090啊这个卡台厚了论坛洋垃圾的主板行吗

我的是涡轮卡
一张卡占 2 条正常间距的pcie16

我用的是x10-x99-8d
只有双路的pcie 16间距才能插nvlink

ezios

@qw-er
不如买个架子

潘旭高

有没有配置清单，我都纠结几天了，是买两个3090还是买1个4080S

mei li

@ezios 牛逼但是木板不导热

applejuice

@潘旭高说:

有没有配置清单，我都纠结几天了，是买两个3090还是买1个4080S

不怕吵不怕热 3090

applejuice

@ezios 说:

@qw-er
不如买个架子

我的nvlink 好像有问题寄给卖家一个星期多还没消息
你买这个多少钱

箱子颜值高点

ezios

@applejuice 架子65,延长线贵延长线要¥69，30厘米的

nvlink是卖显卡那个二手店套餐送的

抡锤者