跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI硬件
  3. 我的ai硬件方案分享

我的ai硬件方案分享

已定时 已固定 已锁定 已移动 AI硬件
6 帖子 4 发布者 86 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • T 在线
    T 在线
    tutu
    编写于 最后由 编辑
    #1

    机器1:模型推理机
    CPU:i5-10600K
    主板:技嘉z490 auros pro ax
    内存:16+8+8+16
    硬盘:东芝xg3 512g + 镁光5100pro 960g
    显卡:RTX2080ti 22G X2 nvlink
    电源:鑫谷gm1250 atx3.0

    机器2:模型+智能体混合机
    CPU:i7-11800H
    主板:铭瑄11800H板U
    内存:32+32
    硬盘:三星970pro 512g + 英特尔s3610 800G
    显卡:RTX3090
    电源:先马xp1000 V3

    机器3:飞牛存储服务器
    CPU:i7-7700
    主板:华硕b150m-plus-d3
    内存:8+8+8+8
    硬盘:三星sm961 256g + 东芝mg08 8Tx2 + 西数紫盘4Tx2
    电源:鑫谷gp700G 黑金全模组
    网卡:扩展rtl8125网卡

    部署情况
    机器1:gpustack ,(qwen3.6-35b-a3b,qwen3-embedding,qwen3-rerank)常驻 ,ragflow,obsidian
    机器2:1panel,gpustack,(qwen3.6-27b,comfy-ui )按需,harmes以及杂七杂八的容器

    1 条回复 最后回复
    1
    • lxbsL 离线
      lxbsL 离线
      lxbs
      编写于 最后由 编辑
      #2

      有没有统计下功耗,每天耗电几何

      rtl8125网卡是2.5G,网络环境怎么样,1G还是万兆了?

      目前努力学习拥抱AI中

      正在自建电力与算力农场 自由谷

      努力实现让AI赚钱,我去享受自在生活的美丽梦想

      目前使用平台:
      DELL 7760工作站 128G内存 RTX A5000 16G显存

      正在计划 购入3090 24G + r9700 32G 多方考察中

      T 1 条回复 最后回复
      0
      • terryT 离线
        terryT 离线
        terry
        编写于 最后由 编辑
        #3

        挺均衡的,配置也挺合理。

        1 条回复 最后回复
        0
        • lxbsL lxbs

          有没有统计下功耗,每天耗电几何

          rtl8125网卡是2.5G,网络环境怎么样,1G还是万兆了?

          T 在线
          T 在线
          tutu
          编写于 最后由 编辑
          #4

          @lxbs
          机器1: 待机70瓦,满载800瓦
          机器2:待机80瓦,满载650瓦
          机器3:待机45瓦,满载80瓦
          网络结构:入户电信千兆宽带,2.5g光猫 接
          r66s软路由 接
          双2.5g口的wifi7 AP 接
          4口2.5g+2口万兆sfp+交换机 接
          机器1,2,3
          平时用智能插座配合主板上电自动开机使用,我的宽带有公网IP,配置端口转发后可以随时登录不用了就关机,用不上万兆

          1 条回复 最后回复
          0
          • E 在线
            E 在线
            ezios
            编写于 最后由 编辑
            #5

            你好,最近我在考虑2080ti22g,请问你这种跑法是不是35BA3B量化都放到显卡里面了?你跑过27B吗,效果怎么样

            最近开始玩LLM和COMFYUI
            手头只有RTX4060

            考虑购入RTX2080TI22G娱乐一下

            T 1 条回复 最后回复
            0
            • E ezios

              你好,最近我在考虑2080ti22g,请问你这种跑法是不是35BA3B量化都放到显卡里面了?你跑过27B吗,效果怎么样

              T 在线
              T 在线
              tutu
              编写于 最后由 编辑
              #6

              @ezios
              2个2080ti 22g可以跑q8或者w8a8以及w8a16的模型,显存是够的,上下文能64k以上,压缩上下文可以到128k
              速度方面用27b优化的好也就20t/s,所以我更建议用35b

              1 条回复 最后回复
              0

              你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

              厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

              有了你的建议,这篇帖子会更精彩哦 💗

              注册 登录
              回复
              • 在新帖中回复
              登录后回复
              • 从旧到新
              • 从新到旧
              • 最多赞同


              • 登录

              • 没有帐号? 注册

              • 登录或注册以进行搜索。
              • 第一个帖子
                最后一个帖子
              0
              • 版块
              • 最新
              • 标签
              • 热门
              • 用户
              • 群组