跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 小白求助:2*2080Ti 22G还是2*3080 20G

小白求助:2*2080Ti 22G还是2*3080 20G

已定时 已固定 已锁定 已移动 AI硬件
20 帖子 7 发布者 330 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • 李明李 离线
    李明李 离线
    李明
    编写于 最后由 编辑
    #7

    和预想的不太一样。单卡32G及以上的显卡,还得重新选。
    已经有5080,Qwen3.6 35b a3b跑的挺好的。

    terryT 1 条回复 最后回复
    0
    • 李明李 李明

      和预想的不太一样。单卡32G及以上的显卡,还得重新选。
      已经有5080,Qwen3.6 35b a3b跑的挺好的。

      terryT 离线
      terryT 离线
      terry
      编写于 最后由 编辑
      #8

      35b是玩具,你跑hermes就知道了,入门玩家的,和27b差距明显。你有了5080,不差钱的话上4080S 32魔改,或者RTX Pro4500 32G。想玩comfyUI必须单卡大显存。UNET节点生成潜在空间文件,必须单卡连续显存。

      油管:https://www.youtube.com/@抡锤者

      1 条回复 最后回复
      0
      • 李明李 离线
        李明李 离线
        李明
        编写于 最后由 编辑
        #9

        https://www.reddit.com/r/StableDiffusion/comments/1qicpug/ltx2_multigpu_comfyui_node_more_gpus_more_frames/
        这个reddit帖子提到的多GPU Ltx是已实现的吗?

        1 条回复 最后回复
        0
        • 李明李 离线
          李明李 离线
          李明
          编写于 最后由 编辑
          #10

          35B对帖子的总结:
          该实现本质是 “切分时间轴 → 多卡并行计算 → 按序拼接” 的数据并行范式。在 ComfyUI 中通过自定义节点封装设备分配、异步推理与结果聚合,使 LTX-Video 2.x 突破单卡显存限制,实现“多 GPU = 支持更长帧序列”的扩展能力。若需针对具体节点参数或工作流 JSON 示例进行适配,可提供您的显卡型号与目标帧数,我可输出精确的设备映射配置。

          结论:LTX的确多卡的意义不大。

          terryT 1 条回复 最后回复
          0
          • 李明李 离线
            李明李 离线
            李明
            编写于 最后由 编辑
            #11

            4080S 32魔改有没有三风扇,或者水冷版本的?涡轮板的担心声音太大。还是用AMD 7900xtx,虽然性能差些,但是勉强能用

            1 条回复 最后回复
            0
            • 李明李 李明

              35B对帖子的总结:
              该实现本质是 “切分时间轴 → 多卡并行计算 → 按序拼接” 的数据并行范式。在 ComfyUI 中通过自定义节点封装设备分配、异步推理与结果聚合,使 LTX-Video 2.x 突破单卡显存限制,实现“多 GPU = 支持更长帧序列”的扩展能力。若需针对具体节点参数或工作流 JSON 示例进行适配,可提供您的显卡型号与目标帧数,我可输出精确的设备映射配置。

              结论:LTX的确多卡的意义不大。

              terryT 离线
              terryT 离线
              terry
              编写于 最后由 编辑
              #12

              @李明 第一这个节点我知道,不好用。第二原理上来讲,生成latent文件的过程是对随机噪点进行降噪,这个过程无法切割到多显卡上,因为显存地址空间不一样,需要对软件层面进行深度定制,一般只有大企业能做。

              油管:https://www.youtube.com/@抡锤者

              1 条回复 最后回复
              0
              • 李明李 离线
                李明李 离线
                李明
                编写于 最后由 编辑
                #13

                想用AI,但是原则是必须严格控制投入。AI硬件的投入是无底洞,最终必然会买6000 Pro,只是希望这天越晚来越好。
                AI技术一直在进步,在几个月之前,5080能跑的大模型还都是弱智,现在A3B已经基本可用了。
                谁也不知道,未来几个月又会有什么新的发展。总是认为,大模型被显存容量限制,是一个非常弱智的技术Bug。
                权重的可无损压缩性是很高的,更何况可控的有损压缩。可预测的未来,大模型的显存容量需求,必然会大幅度下降。

                A 1 条回复 最后回复
                0
                • terryT 离线
                  terryT 离线
                  terry
                  编写于 最后由 编辑
                  #14

                  并不会,5080一直可以跑MOE模型,跑稠密模型它一直是个弱智,它没取得什么本质进步,MTP DFlash等可以改善,但是无法让它跑得动稠密模型。它以前跑不了comfyUI视频,以后也跑不了。在可以预见到未来,显存要求只会越来越高。

                  油管:https://www.youtube.com/@抡锤者

                  1 条回复 最后回复
                  0
                  • 李明李 李明

                    想用AI,但是原则是必须严格控制投入。AI硬件的投入是无底洞,最终必然会买6000 Pro,只是希望这天越晚来越好。
                    AI技术一直在进步,在几个月之前,5080能跑的大模型还都是弱智,现在A3B已经基本可用了。
                    谁也不知道,未来几个月又会有什么新的发展。总是认为,大模型被显存容量限制,是一个非常弱智的技术Bug。
                    权重的可无损压缩性是很高的,更何况可控的有损压缩。可预测的未来,大模型的显存容量需求,必然会大幅度下降。

                    A 离线
                    A 离线
                    applejuice
                    编写于 最后由 applejuice 编辑
                    #15

                    @李明 说:

                    想用AI,但是原则是必须严格控制投入。AI硬件的投入是无底洞,最终必然会买6000 Pro,只是希望这天越晚来越好。
                    AI技术一直在进步,在几个月之前,5080能跑的大模型还都是弱智,现在A3B已经基本可用了。
                    谁也不知道,未来几个月又会有什么新的发展。总是认为,大模型被显存容量限制,是一个非常弱智的技术Bug。
                    权重的可无损压缩性是很高的,更何况可控的有损压缩。可预测的未来,大模型的显存容量需求,必然会大幅度下降。

                    我个人现阶段27b 稠密模型 200k 上下文 就很好了
                    我觉得以后可能有更强的硬件然我们跑更强大的AI 但是最强ai应该都是云AI
                    结论全都是钱堆出来的

                    不懂我的了解有没有错误
                    如果模型没有的知识我们还可以叫他上网找
                    至少智力在线

                    1 条回复 最后回复
                    0
                    • XiaoteX 离线
                      XiaoteX 离线
                      Xiaote
                      编写于 最后由 编辑
                      #16

                      @李明 补充一下关于4080S 32G魔改的问题。

                      32G魔改卡基本都是涡轮散热方案,因为是用专业卡PCB+消费级核心改的,很少有三风扇或水冷版本。涡轮扇满载声音确实不小,大概40-45分贝,放桌边会明显听到。

                      两个替代思路供参考:

                      1. 如果机箱条件允许(有足够风道),涡轮卡放远一点(桌下/机房)其实能接受,盖上机箱侧板声音会小很多。关键词搜"4080S 32G涡轮"或者直接找RTX 4500 Pro 32G(原厂卡,做工好,也是涡轮但温控策略更成熟)。

                      2. 7900XTX跑ComfyUI文生图没问题,性能大概在4070Ti Super到4080之间。但跑Qwen 3.6 27B的话ROCm生态不如N卡省心(llama.cpp/lm studio没问题,vLLM/SGLang需要折腾)。如果主要目标是LLM+预算有限,两张2080Ti 22G用llama.cpp并行也是性价比方案——两张合计44G显存,跑27B Q4_K_M+长上下文很宽松。

                      说到底,关键看你更侧重生图还是LLM,两个方向最优方案不一样。

                      1 条回复 最后回复
                      0
                      • 李明李 离线
                        李明李 离线
                        李明
                        编写于 最后由 编辑
                        #17

                        目前倾向4080s 32G,3080 20G双卡估计声音也不会小多少。有挖矿的经验,知道多卡的噪音和热浪有多恐怖

                        rock shiR 1 条回复 最后回复
                        0
                        • C 离线
                          C 离线
                          comeN
                          编写于 最后由 编辑
                          #18

                          3080 20G双卡非涡轮的声音还是比涡轮的小,我现有用的就是一直3卡槽和2卡槽的3080-20G。我也挖过矿留下的那张矿卡用到现在也没坏,跑大模型对显卡负担比挖矿小不用一直跑。

                          1 条回复 最后回复
                          0
                          • 李明李 李明

                            目前倾向4080s 32G,3080 20G双卡估计声音也不会小多少。有挖矿的经验,知道多卡的噪音和热浪有多恐怖

                            rock shiR 离线
                            rock shiR 离线
                            rock shi
                            编写于 最后由 编辑
                            #19

                            @李明 32g跑27b的128k上下文基本上就满了,看视频、打游戏、剪辑都得等着。3080 40g就很有富裕,llama.cpp开mtp速度在35t-60t/s,已经非常能打了,还便宜,而且魔改技术成熟基本没有售后问题

                            1 条回复 最后回复
                            0
                            • N 离线
                              N 离线
                              neo
                              编写于 最后由 编辑
                              #20

                              劝你3080 20G,架构比2080新一代,有代差的,而且估计一年以后2080很多框架新版本不会再兼容2080了,显存带宽差不多翻一倍,这个很重要啊。
                              唯一缺点:魔改卡,散热必须做好,还有质保很重要。
                              有一句话:花3090一半的钱,买3090百分之80的性能说的就是它。

                              1 条回复 最后回复
                              0

                              你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                              厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                              有了你的建议,这篇帖子会更精彩哦 💗

                              注册 登录
                              回复
                              • 在新帖中回复
                              登录后回复
                              • 从旧到新
                              • 从新到旧
                              • 最多赞同


                              • 登录

                              • 没有帐号? 注册

                              • 登录或注册以进行搜索。
                              • 第一个帖子
                                最后一个帖子
                              0
                              • 版块
                              • 最新
                              • 标签
                              • 热门
                              • 用户
                              • 群组