标签为“multi-gpu”的主题

S

(双卡指南) 最丐 Qwen3.6-27b - 3000 元双 RTX 3060 - 50t/s
关注中忽略中已定时已固定已锁定已移动 AI硬件 nvidia rtx3060 multi-gpu
23

9 赞同

23 帖子

595 浏览

S

@joker_chang 这个真不懂，没有玩过 x99
A

双 3090（NVLink）跑 Qwen3.6-27B，128K 上下文实测
关注中忽略中已定时已固定已锁定已移动 AI硬件 nvidia rtx3090 multi-gpu
21

3 赞同

21 帖子

422 浏览

R

@vosrock 有条件还可以研究一下API的跑图，也都不贵，解放本地算力哈哈。
F

4 X L20 部署本地模型，求大神指点
关注中忽略中已定时已固定已锁定已移动 LLM讨论区 nvidia l20 multi-gpu
17

1 赞同

17 帖子

157 浏览

T

大佬，你的卡算力比4090弱一点，带宽稍差一点，但是也足够了，显存很大，如果没有NVLink，我建议直接跑Qwen3.6 27b q4km量化模型，上LLamal.cpp，每个卡跑一个实例，不要跑什么INT8之类的。Q4量化足够了，推理时会返回BF16计算，这是目前最成熟的生态，KV量化方案你是N卡，建议上Turoquant Turbo3，既然是AI在操作，可以和它说明你的需求，AI不是一直很聪明的，你要坚持自己的意见，否则无限制折腾。记得把MTP加上，一步到位。VLLM的AQW量化模型没有不稳定的说法，我亲测过，完全没问题。你的单卡跑AI视频或者任何其他应用都够，大模型你可以选择2张卡，3张卡，空出一张卡做ComfyUI。我认为这样比较有性价比，调度也自由，不用考虑互联带宽问题。
J

来交作业了，华南金牌X99套装+RTX3090Ti+RTX3060双卡装机完毕
关注中忽略中已定时已固定已锁定已移动 AI硬件 nvidia multi-gpu
25

2 赞同

25 帖子

724 浏览

T

@janebo 肯定是单卡好
Z

3080ti这速度不错啊
关注中忽略中已定时已固定已锁定已移动 AI硬件 nvidia rtx3080ti multi-gpu
14

1 赞同

14 帖子

244 浏览

R

@coin1860 我是两张3080 20g，一共5800好像。hermes跑27b多模态，子代理最高飙到70t/s就极限了。平时就是40-55t/s，主要看MTP猜不猜的中

抡锤者

(双卡指南) 最丐 Qwen3.6-27b - 3000 元双 RTX 3060 - 50t/s

双 3090（NVLink）跑 Qwen3.6-27B，128K 上下文实测

4 X L20 部署本地模型 ，求大神指点

来交作业了，华南金牌X99套装+RTX3090Ti+RTX3060双卡装机完毕

3080ti这速度不错啊

4 X L20 部署本地模型，求大神指点