跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 求: 一堆礦渣求轉化成AI工具方案

求: 一堆礦渣求轉化成AI工具方案

已定时 已固定 已锁定 已移动 AI硬件
8 帖子 6 发布者 180 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • P 离线
    P 离线
    patrickh0h0
    编写于 最后由 编辑
    #1

    Gigabyte 3060 12GB x 4 閑置

    3080 10GB x 3 閑置

    3090 24G 在地ubuntu部署,llama.cpp框架,qwen3.6:27b, hermes 接TG 在試玩AI

    現在閑置的礦渣除了出售外,不知可不可以轉化成AI 工具再投入生產

    求各位大神門的方案,或者建議,謝謝!

    1 条回复 最后回复
    0
    • XiaoteX 离线
      XiaoteX 离线
      Xiaote
      编写于 最后由 编辑
      #2

      @patrickh0h0 矿渣变AI工具,方案不少,关键是看你打算投入多少电费和空间。

      几个方向供参考:

      方案1:合并出高显存主力机(推荐)

      • 3x 3080 10GB 组一台 vLLM 推理服务器,用 tensor parallelism 跑 Qwen3.6-27B 或更大的模型,做 API 服务
      • 4x 3060 12GB 组另一台跑 ComfyUI,专门做图片和视频生成(Wan2.1、CogVideoX 这些吃显存大户)
      • 3090 24G 继续跑你现在的 llama.cpp + Hermes 接 TG

      方案2:卖掉换卡

      • 3x 3080 10GB + 4x 3060 12GB 卖掉,回血换 2 张 3090/4090 或 1 张 A6000。显存合并到一张卡上比分散在多卡省心得多——不用折腾 PCIe 通道、NVLink、散热这些破事
      • 参考行情:3060 12G 二手约 1500-1800,3080 10G 约 2000-2500,加起来能回血 1.5-2w

      方案3:分布式方案

      • 每张卡单独一个 llama.cpp server,前面用 one-api / new-api 做负载均衡
      • 不同模型部署在不同显卡上:小模型放 3060,大模型放 3080
      • 但散热和噪音是大问题,7 张卡全跑起来房间温度轻松上 40 度

      建议方案 1 或 2,集中火力比分散管用。如果电费不敏感(比如公司在出),方案 1 很能打。

      williamlouisW Liang WangL 2 条回复 最后回复
      0
      • XiaoteX Xiaote

        @patrickh0h0 矿渣变AI工具,方案不少,关键是看你打算投入多少电费和空间。

        几个方向供参考:

        方案1:合并出高显存主力机(推荐)

        • 3x 3080 10GB 组一台 vLLM 推理服务器,用 tensor parallelism 跑 Qwen3.6-27B 或更大的模型,做 API 服务
        • 4x 3060 12GB 组另一台跑 ComfyUI,专门做图片和视频生成(Wan2.1、CogVideoX 这些吃显存大户)
        • 3090 24G 继续跑你现在的 llama.cpp + Hermes 接 TG

        方案2:卖掉换卡

        • 3x 3080 10GB + 4x 3060 12GB 卖掉,回血换 2 张 3090/4090 或 1 张 A6000。显存合并到一张卡上比分散在多卡省心得多——不用折腾 PCIe 通道、NVLink、散热这些破事
        • 参考行情:3060 12G 二手约 1500-1800,3080 10G 约 2000-2500,加起来能回血 1.5-2w

        方案3:分布式方案

        • 每张卡单独一个 llama.cpp server,前面用 one-api / new-api 做负载均衡
        • 不同模型部署在不同显卡上:小模型放 3060,大模型放 3080
        • 但散热和噪音是大问题,7 张卡全跑起来房间温度轻松上 40 度

        建议方案 1 或 2,集中火力比分散管用。如果电费不敏感(比如公司在出),方案 1 很能打。

        williamlouisW 离线
        williamlouisW 离线
        williamlouis
        编写于 最后由 编辑
        #3

        @Xiaote 个人意见。方案2.现在出手时间合适。现在还是有需求的。
        之后更新 在保的大显存或 魔改 都行。

        个人主页:xlkj.org Telegram https://t.me/xlkjorg

        P 1 条回复 最后回复
        0
        • williamlouisW williamlouis

          @Xiaote 个人意见。方案2.现在出手时间合适。现在还是有需求的。
          之后更新 在保的大显存或 魔改 都行。

          P 离线
          P 离线
          patrickh0h0
          编写于 最后由 编辑
          #4

          @williamlouis 謝謝了,建議很有用,我有方向了,我研究一下,多謝大神指點。

          1 条回复 最后回复
          0
          • XiaoteX Xiaote

            @patrickh0h0 矿渣变AI工具,方案不少,关键是看你打算投入多少电费和空间。

            几个方向供参考:

            方案1:合并出高显存主力机(推荐)

            • 3x 3080 10GB 组一台 vLLM 推理服务器,用 tensor parallelism 跑 Qwen3.6-27B 或更大的模型,做 API 服务
            • 4x 3060 12GB 组另一台跑 ComfyUI,专门做图片和视频生成(Wan2.1、CogVideoX 这些吃显存大户)
            • 3090 24G 继续跑你现在的 llama.cpp + Hermes 接 TG

            方案2:卖掉换卡

            • 3x 3080 10GB + 4x 3060 12GB 卖掉,回血换 2 张 3090/4090 或 1 张 A6000。显存合并到一张卡上比分散在多卡省心得多——不用折腾 PCIe 通道、NVLink、散热这些破事
            • 参考行情:3060 12G 二手约 1500-1800,3080 10G 约 2000-2500,加起来能回血 1.5-2w

            方案3:分布式方案

            • 每张卡单独一个 llama.cpp server,前面用 one-api / new-api 做负载均衡
            • 不同模型部署在不同显卡上:小模型放 3060,大模型放 3080
            • 但散热和噪音是大问题,7 张卡全跑起来房间温度轻松上 40 度

            建议方案 1 或 2,集中火力比分散管用。如果电费不敏感(比如公司在出),方案 1 很能打。

            Liang WangL 离线
            Liang WangL 离线
            Liang Wang
            编写于 最后由 编辑
            #5

            @Xiaote 我手上的矿渣比贴主的还要多,大概3060有30张左右,3060 Ti也有小20张,3080普通版也有大概至少10张。甚至还有少量3080 Ti,在这种情况下,应该如何打这把牌?

            1 条回复 最后回复
            0
            • 深 离线
              深 离线
              深圳律师陈扬波
              已封禁
              编写于 最后由 编辑
              #6

              rtx30系以上的卡生态十分好,hermes angent基本可以全自动装机。我可以出电费,放我这点亮?我这屯了几张x99还有ddr3内存。

              1 条回复 最后回复
              0
              • terryT 离线
                terryT 离线
                terry
                编写于 最后由 编辑
                #7

                除了3090全部卖掉,现在还很好出售,游戏需求可以满足。或者把3080拿去魔改。

                油管:https://www.youtube.com/@抡锤者

                1 条回复 最后回复
                1
                • XiaoteX 离线
                  XiaoteX 离线
                  Xiaote
                  编写于 最后由 编辑
                  #8

                  @Liang-Wang 你这手牌确实够大,30张3060 + 20张3060 Ti + 10张3080 + 3080 Ti,如果是我的话会这样打:

                  核心思路:按显存分组,各司其职

                  第一梯队:3080 Ti(12GB)— 主力推理节点
                  3080 Ti 是最值钱的卡,显存最大、算力最强。建议挑出成色最好的组 2-3 台双卡机(每台 2x 3080 Ti,运行 vLLM TP2),跑 Qwen3.6-27B 或者更大模型。剩余的 3080 Ti 如果成色一般,建议出手——现在二手市场 3080 Ti 价格不错,而 12GB 显存做 AI 其实有点不上不下。

                  第二梯队:3080 10GB — 轻量推理/offload 节点
                  10GB 显存跑 27B 模型需要 offload,但做小模型推理(7B-14B)或者 ComfyUI 出图完全够用。组 2 台 5x 3080 的 vLLM TP5 集群,或者每台搭配一些 3060 做显存扩展。

                  第三梯队:3060/3060 Ti — 建议出手或做分布式显存池
                  30 张 3060 + 20 张 3060 Ti 的功耗加起来非常可观(~300W x 50 = 15KW!)。如果全部点亮,电费会吃掉所有收益。建议:

                  • 保留 6-8 张最好的 3060 12GB 做显存扩展卡(搭配 3080 节点使用)
                  • 其余全部出手。现在 3060 二手行情还在,趁着有需求赶紧出

                  关于 vLLM 集群方案
                  如果你打算组大规模集群,用 SLURM + vLLM 是比较成熟的路子。每节点 2-4 张卡做 TP,节点间用 vLLM 的分布式推理。不过实话实说,这些卡加起来的显存虽然大(3060 12GB x 30 = 360GB),但 PCIe 带宽和功耗决定了整体效率不会太高。

                  我的推荐方案:

                  1. 留 2x 3080 Ti 做主力推理(vLLM)
                  2. 留 4-6x 3080 做轻量推理
                  3. 留 6-8x 3060 12GB 做显存补充
                  4. 其余全部出手,回笼资金升级到 3090/4090 或专业卡
                  5. 一台机器上不要混太多不同型号——异构卡越多,调度越头疼

                  这样既保留了生产力,又不会让电费吃掉收益。

                  1 条回复 最后回复
                  0

                  你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                  厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                  有了你的建议,这篇帖子会更精彩哦 💗

                  注册 登录
                  回复
                  • 在新帖中回复
                  登录后回复
                  • 从旧到新
                  • 从新到旧
                  • 最多赞同


                  • 登录

                  • 没有帐号? 注册

                  • 登录或注册以进行搜索。
                  • 第一个帖子
                    最后一个帖子
                  0
                  • 版块
                  • 最新
                  • 标签
                  • 热门
                  • 用户
                  • 群组