小白求助：2*2080Ti 22G还是2*3080 20G

李明

4080S 32魔改有没有三风扇，或者水冷版本的？涡轮板的担心声音太大。还是用AMD 7900xtx，虽然性能差些，但是勉强能用

terry

@李明第一这个节点我知道，不好用。第二原理上来讲，生成latent文件的过程是对随机噪点进行降噪，这个过程无法切割到多显卡上，因为显存地址空间不一样，需要对软件层面进行深度定制，一般只有大企业能做。

李明

想用AI，但是原则是必须严格控制投入。AI硬件的投入是无底洞，最终必然会买6000 Pro，只是希望这天越晚来越好。
AI技术一直在进步，在几个月之前，5080能跑的大模型还都是弱智，现在A3B已经基本可用了。
谁也不知道，未来几个月又会有什么新的发展。总是认为，大模型被显存容量限制，是一个非常弱智的技术Bug。
权重的可无损压缩性是很高的，更何况可控的有损压缩。可预测的未来，大模型的显存容量需求，必然会大幅度下降。

terry

并不会，5080一直可以跑MOE模型，跑稠密模型它一直是个弱智，它没取得什么本质进步，MTP DFlash等可以改善，但是无法让它跑得动稠密模型。它以前跑不了comfyUI视频，以后也跑不了。在可以预见到未来，显存要求只会越来越高。

applejuice

@李明说:

想用AI，但是原则是必须严格控制投入。AI硬件的投入是无底洞，最终必然会买6000 Pro，只是希望这天越晚来越好。
AI技术一直在进步，在几个月之前，5080能跑的大模型还都是弱智，现在A3B已经基本可用了。
谁也不知道，未来几个月又会有什么新的发展。总是认为，大模型被显存容量限制，是一个非常弱智的技术Bug。
权重的可无损压缩性是很高的，更何况可控的有损压缩。可预测的未来，大模型的显存容量需求，必然会大幅度下降。

我个人现阶段27b 稠密模型 200k 上下文就很好了
我觉得以后可能有更强的硬件然我们跑更强大的AI 但是最强ai应该都是云AI
结论全都是钱堆出来的

不懂我的了解有没有错误
如果模型没有的知识我们还可以叫他上网找
至少智力在线

Xiaote

@李明补充一下关于4080S 32G魔改的问题。

32G魔改卡基本都是涡轮散热方案，因为是用专业卡PCB+消费级核心改的，很少有三风扇或水冷版本。涡轮扇满载声音确实不小，大概40-45分贝，放桌边会明显听到。

两个替代思路供参考：

如果机箱条件允许（有足够风道），涡轮卡放远一点（桌下/机房）其实能接受，盖上机箱侧板声音会小很多。关键词搜"4080S 32G涡轮"或者直接找RTX 4500 Pro 32G（原厂卡，做工好，也是涡轮但温控策略更成熟）。
7900XTX跑ComfyUI文生图没问题，性能大概在4070Ti Super到4080之间。但跑Qwen 3.6 27B的话ROCm生态不如N卡省心（llama.cpp/lm studio没问题，vLLM/SGLang需要折腾）。如果主要目标是LLM+预算有限，两张2080Ti 22G用llama.cpp并行也是性价比方案——两张合计44G显存，跑27B Q4_K_M+长上下文很宽松。

说到底，关键看你更侧重生图还是LLM，两个方向最优方案不一样。

李明

目前倾向4080s 32G，3080 20G双卡估计声音也不会小多少。有挖矿的经验，知道多卡的噪音和热浪有多恐怖

comeN

3080 20G双卡非涡轮的声音还是比涡轮的小，我现有用的就是一直3卡槽和2卡槽的3080-20G。我也挖过矿留下的那张矿卡用到现在也没坏，跑大模型对显卡负担比挖矿小不用一直跑。

rock shi

@李明 32g跑27b的128k上下文基本上就满了，看视频、打游戏、剪辑都得等着。3080 40g就很有富裕，llama.cpp开mtp速度在35t-60t/s，已经非常能打了，还便宜，而且魔改技术成熟基本没有售后问题

neo

劝你3080 20G，架构比2080新一代，有代差的，而且估计一年以后2080很多框架新版本不会再兼容2080了，显存带宽差不多翻一倍，这个很重要啊。
唯一缺点：魔改卡，散热必须做好，还有质保很重要。
有一句话：花3090一半的钱，买3090百分之80的性能说的就是它。

抡锤者

小白求助：22080Ti 22G还是23080 20G