小白求助:2*2080Ti 22G还是2*3080 20G
-
35B对帖子的总结:
该实现本质是 “切分时间轴 → 多卡并行计算 → 按序拼接” 的数据并行范式。在 ComfyUI 中通过自定义节点封装设备分配、异步推理与结果聚合,使 LTX-Video 2.x 突破单卡显存限制,实现“多 GPU = 支持更长帧序列”的扩展能力。若需针对具体节点参数或工作流 JSON 示例进行适配,可提供您的显卡型号与目标帧数,我可输出精确的设备映射配置。结论:LTX的确多卡的意义不大。
-
想用AI,但是原则是必须严格控制投入。AI硬件的投入是无底洞,最终必然会买6000 Pro,只是希望这天越晚来越好。
AI技术一直在进步,在几个月之前,5080能跑的大模型还都是弱智,现在A3B已经基本可用了。
谁也不知道,未来几个月又会有什么新的发展。总是认为,大模型被显存容量限制,是一个非常弱智的技术Bug。
权重的可无损压缩性是很高的,更何况可控的有损压缩。可预测的未来,大模型的显存容量需求,必然会大幅度下降。想用AI,但是原则是必须严格控制投入。AI硬件的投入是无底洞,最终必然会买6000 Pro,只是希望这天越晚来越好。
AI技术一直在进步,在几个月之前,5080能跑的大模型还都是弱智,现在A3B已经基本可用了。
谁也不知道,未来几个月又会有什么新的发展。总是认为,大模型被显存容量限制,是一个非常弱智的技术Bug。
权重的可无损压缩性是很高的,更何况可控的有损压缩。可预测的未来,大模型的显存容量需求,必然会大幅度下降。我个人现阶段27b 稠密模型 200k 上下文 就很好了
我觉得以后可能有更强的硬件然我们跑更强大的AI 但是最强ai应该都是云AI
结论全都是钱堆出来的不懂我的了解有没有错误
如果模型没有的知识我们还可以叫他上网找
至少智力在线 -
@李明 补充一下关于4080S 32G魔改的问题。
32G魔改卡基本都是涡轮散热方案,因为是用专业卡PCB+消费级核心改的,很少有三风扇或水冷版本。涡轮扇满载声音确实不小,大概40-45分贝,放桌边会明显听到。
两个替代思路供参考:
-
如果机箱条件允许(有足够风道),涡轮卡放远一点(桌下/机房)其实能接受,盖上机箱侧板声音会小很多。关键词搜"4080S 32G涡轮"或者直接找RTX 4500 Pro 32G(原厂卡,做工好,也是涡轮但温控策略更成熟)。
-
7900XTX跑ComfyUI文生图没问题,性能大概在4070Ti Super到4080之间。但跑Qwen 3.6 27B的话ROCm生态不如N卡省心(llama.cpp/lm studio没问题,vLLM/SGLang需要折腾)。如果主要目标是LLM+预算有限,两张2080Ti 22G用llama.cpp并行也是性价比方案——两张合计44G显存,跑27B Q4_K_M+长上下文很宽松。
说到底,关键看你更侧重生图还是LLM,两个方向最优方案不一样。
-