跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI Agent
  3. 纯外行用ai agent之路

纯外行用ai agent之路

已定时 已固定 已锁定 已移动 AI Agent
14 帖子 9 发布者 266 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • 活 离线
    活 离线
    活着就是折腾
    编写于 最后由 编辑
    #3

    已经在组装了,7402cpu 256G内存,现在内存真贵!就等7900xtx到位了

    1 条回复 最后回复
    0
    • terryT terry

      @Max-han 然后我就网上套了一套3代epyc的主板配个便宜u,8通道内存啊,128pcie通道啊,5个满速的pcie4x16,太牛逼了。
      这个操作很神奇,是的,我也在考虑购入那玩意,下半年折腾,现在x99完全够用。

      A 在线
      A 在线
      applejuice
      编写于 最后由 编辑
      #4

      @terry 说:

      @Max-han 然后我就网上套了一套3代epyc的主板配个便宜u,8通道内存啊,128pcie通道啊,5个满速的pcie4x16,太牛逼了。
      这个操作很神奇,是的,我也在考虑购入那玩意,下半年折腾,现在x99完全够用。

      epyc 真的贵啊
      那个huananzhi 给我的价钱 epyc7502 + 主板 3150.. 贵两千...

      陳瑋陳 1 条回复 最后回复
      0
      • terryT 离线
        terryT 离线
        terry
        编写于 最后由 编辑
        #5

        可以,看来x99之后就是epyc+华南 精粤的寨板,生态延续,后继有人,😂

        油管:https://www.youtube.com/@抡锤者

        1 条回复 最后回复
        0
        • 菠 离线
          菠 离线
          菠菜多
          编写于 最后由 编辑
          #6

          我现在主要是用在线的API,先把Hermes Agent它的边界摸清楚,尤其是要把它这个事情跟这个现在工作中进行工作流进行结合。如果在实际工作中不能应用的话,那就像拿着锤子找不到钉子一样,特别难受,而且没有动力。所以希望大家都找到自己的钉子,我们已经拥有了威力无穷的锤子,就差钉子了。

          ? 1 条回复 最后回复
          2
          • M Max-han

            我业余爱好打打游戏,在2008年那会盗版光碟泛滥的情况下天天研究怎么装游戏玩游戏,把最基本的电脑操作学会了。今年年初才关注到ai agent 小龙虾自己装没装成功,放弃了。然后hermes在mac上装成功了,看老特视频我就开了deepseekv4pro的api给hermes,我屁都不懂问Gemini学会了装Ubuntu24,给我的主力机5700x3d64g7900xtx装上了,然后问Gemini怎么配置llamacpp,这软件安装不像lms那样简洁明了,我又晕了。后来灵机一动,我把mac上的hermes远程ssh连接主力机,我让hermes给我配置环境运行llamacpp,结果非常好,本地配的27b开tubro3能跑30多。然后我就网上套了一套3代epyc的主板配个便宜u,8通道内存啊,128pcie通道啊,5个满速的pcie4x16,太牛逼了。把我淘汰的3070和4070s装上,准备让hermes给我再配置一个llama服务器跑27b35b,最近在配置,还缺点配件,等好了交作业给大家参考。现在我已经能用主力机上配好的27b api提供给hermes了,不用事事都问v4pro了,让他在给我调新的epyc服务器。最后我想说一句ai agent真牛逼,让我这种普通人都可以编程写脚本了,脑洞多大,舞台多大。

            陳瑋陳 离线
            陳瑋陳 离线
            陳瑋
            编写于 最后由 编辑
            #7

            @Max-han 剛拼多多搜了一下epyc, 牛是真牛啊,家裡報廢主機或者回收站隨便掏個八條ddr4內存出來,不敢想像那個內存時脈有多高啊,而且又不貴

            1 条回复 最后回复
            0
            • A applejuice

              @terry 说:

              @Max-han 然后我就网上套了一套3代epyc的主板配个便宜u,8通道内存啊,128pcie通道啊,5个满速的pcie4x16,太牛逼了。
              这个操作很神奇,是的,我也在考虑购入那玩意,下半年折腾,现在x99完全够用。

              epyc 真的贵啊
              那个huananzhi 给我的价钱 epyc7502 + 主板 3150.. 贵两千...

              陳瑋陳 离线
              陳瑋陳 离线
              陳瑋
              编写于 最后由 编辑
              #8

              @applejuice 我看拼多多上版u分開買好像兩千多人民幣就搞定了

              A 1 条回复 最后回复
              0
              • 菠 菠菜多

                我现在主要是用在线的API,先把Hermes Agent它的边界摸清楚,尤其是要把它这个事情跟这个现在工作中进行工作流进行结合。如果在实际工作中不能应用的话,那就像拿着锤子找不到钉子一样,特别难受,而且没有动力。所以希望大家都找到自己的钉子,我们已经拥有了威力无穷的锤子,就差钉子了。

                ? 离线
                ? 离线
                老用户
                编写于 最后由 编辑
                #9

                @菠菜多 是这样的,而且即便是有本地算力的朋友,也可以利用在线API高prefill、decode的性能,先跑通自己需要的工作流以及需求。固定skill之后,利用本地算力再介入负责执行。

                这样既能高效的搭建工作流,又可以保障实际运行时的隐私与信息安全。

                LocalLLM的优势是能提供稳定的基座算力,跟头部在线API比,无论是智力、上下文长度、还是性能,还是有不小的差距。

                我预测,支持开源自部署的模型,一定会一直维持现在这种接近顶级模型85%~90%左右的能力。无论过高还是过低,开源模型这个产业逻辑都成立不了。

                V 1 条回复 最后回复
                2
                • 陳瑋陳 陳瑋

                  @applejuice 我看拼多多上版u分開買好像兩千多人民幣就搞定了

                  A 在线
                  A 在线
                  applejuice
                  编写于 最后由 编辑
                  #10

                  @陳瑋 说:

                  @applejuice 我看拼多多上版u分開買好像兩千多人民幣就搞定了

                  其实我算过
                  那家店给的总价钱跟分开买差不多,但是我都对比淘宝

                  1 条回复 最后回复
                  0
                  • M 离线
                    M 离线
                    Max-han
                    编写于 最后由 编辑
                    #11

                    汇报作业,最近终于调试好新配的epyc了,主要是2张老显卡加起来才20g显存,真的是太捉襟见肘了,加载完27b真剩不下多少空间了,而且最操蛋的是模型流水线分层,单层的显存占用在218mb左右,最后就卡在是40:24还是39:25 ,27b总层数64。我后来一咬牙把Ubuntu的图形界面关了,省了200mb。现在极限可以单并发跑256k,想要稳定提供api给hermes,我还是降到了128g然后b512 ub128,现在非常稳定,pp在800-1000 生成速度在23k/s,mtp一直没尝试成功

                    1 条回复 最后回复
                    1
                    • M 离线
                      M 离线
                      Max-han
                      编写于 最后由 编辑
                      #12

                      35b-q8量化的能跑24t/s

                      1 条回复 最后回复
                      0
                      • williamlouisW 离线
                        williamlouisW 离线
                        williamlouis
                        编写于 最后由 编辑
                        #13

                        可以学习的重点:我把mac上的hermes远程ssh连接主力机,我让hermes给我配置环境运行llamacpp,结果非常好。
                        很多有问题的朋友可以借鉴。当然 Mac 可以是 Windows 可以是Linux。

                        个人主页:xlkj.org Telegram https://t.me/xlkjorg

                        1 条回复 最后回复
                        0
                        • ? 老用户

                          @菠菜多 是这样的,而且即便是有本地算力的朋友,也可以利用在线API高prefill、decode的性能,先跑通自己需要的工作流以及需求。固定skill之后,利用本地算力再介入负责执行。

                          这样既能高效的搭建工作流,又可以保障实际运行时的隐私与信息安全。

                          LocalLLM的优势是能提供稳定的基座算力,跟头部在线API比,无论是智力、上下文长度、还是性能,还是有不小的差距。

                          我预测,支持开源自部署的模型,一定会一直维持现在这种接近顶级模型85%~90%左右的能力。无论过高还是过低,开源模型这个产业逻辑都成立不了。

                          V 离线
                          V 离线
                          vosrock
                          编写于 最后由 编辑
                          #14

                          是个好办法,跑一两个项目将HERMES的工作习惯整好,然后回到本地跑自己的隐私项目,谢谢指点了

                          1 条回复 最后回复
                          0

                          你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                          厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                          有了你的建议,这篇帖子会更精彩哦 💗

                          注册 登录
                          回复
                          • 在新帖中回复
                          登录后回复
                          • 从旧到新
                          • 从新到旧
                          • 最多赞同


                          • 登录

                          • 没有帐号? 注册

                          • 登录或注册以进行搜索。
                          • 第一个帖子
                            最后一个帖子
                          0
                          • 版块
                          • 最新
                          • 标签
                          • 热门
                          • 用户
                          • 群组