跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI Agent
  3. 纯外行用ai agent之路

纯外行用ai agent之路

已定时 已固定 已锁定 已移动 AI Agent
14 帖子 9 发布者 266 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • terryT 离线
    terryT 离线
    terry
    编写于 最后由 编辑
    #5

    可以,看来x99之后就是epyc+华南 精粤的寨板,生态延续,后继有人,😂

    油管:https://www.youtube.com/@抡锤者

    1 条回复 最后回复
    0
    • 菠 离线
      菠 离线
      菠菜多
      编写于 最后由 编辑
      #6

      我现在主要是用在线的API,先把Hermes Agent它的边界摸清楚,尤其是要把它这个事情跟这个现在工作中进行工作流进行结合。如果在实际工作中不能应用的话,那就像拿着锤子找不到钉子一样,特别难受,而且没有动力。所以希望大家都找到自己的钉子,我们已经拥有了威力无穷的锤子,就差钉子了。

      ? 1 条回复 最后回复
      2
      • M Max-han

        我业余爱好打打游戏,在2008年那会盗版光碟泛滥的情况下天天研究怎么装游戏玩游戏,把最基本的电脑操作学会了。今年年初才关注到ai agent 小龙虾自己装没装成功,放弃了。然后hermes在mac上装成功了,看老特视频我就开了deepseekv4pro的api给hermes,我屁都不懂问Gemini学会了装Ubuntu24,给我的主力机5700x3d64g7900xtx装上了,然后问Gemini怎么配置llamacpp,这软件安装不像lms那样简洁明了,我又晕了。后来灵机一动,我把mac上的hermes远程ssh连接主力机,我让hermes给我配置环境运行llamacpp,结果非常好,本地配的27b开tubro3能跑30多。然后我就网上套了一套3代epyc的主板配个便宜u,8通道内存啊,128pcie通道啊,5个满速的pcie4x16,太牛逼了。把我淘汰的3070和4070s装上,准备让hermes给我再配置一个llama服务器跑27b35b,最近在配置,还缺点配件,等好了交作业给大家参考。现在我已经能用主力机上配好的27b api提供给hermes了,不用事事都问v4pro了,让他在给我调新的epyc服务器。最后我想说一句ai agent真牛逼,让我这种普通人都可以编程写脚本了,脑洞多大,舞台多大。

        陳瑋陳 离线
        陳瑋陳 离线
        陳瑋
        编写于 最后由 编辑
        #7

        @Max-han 剛拼多多搜了一下epyc, 牛是真牛啊,家裡報廢主機或者回收站隨便掏個八條ddr4內存出來,不敢想像那個內存時脈有多高啊,而且又不貴

        1 条回复 最后回复
        0
        • A applejuice

          @terry 说:

          @Max-han 然后我就网上套了一套3代epyc的主板配个便宜u,8通道内存啊,128pcie通道啊,5个满速的pcie4x16,太牛逼了。
          这个操作很神奇,是的,我也在考虑购入那玩意,下半年折腾,现在x99完全够用。

          epyc 真的贵啊
          那个huananzhi 给我的价钱 epyc7502 + 主板 3150.. 贵两千...

          陳瑋陳 离线
          陳瑋陳 离线
          陳瑋
          编写于 最后由 编辑
          #8

          @applejuice 我看拼多多上版u分開買好像兩千多人民幣就搞定了

          A 1 条回复 最后回复
          0
          • 菠 菠菜多

            我现在主要是用在线的API,先把Hermes Agent它的边界摸清楚,尤其是要把它这个事情跟这个现在工作中进行工作流进行结合。如果在实际工作中不能应用的话,那就像拿着锤子找不到钉子一样,特别难受,而且没有动力。所以希望大家都找到自己的钉子,我们已经拥有了威力无穷的锤子,就差钉子了。

            ? 离线
            ? 离线
            老用户
            编写于 最后由 编辑
            #9

            @菠菜多 是这样的,而且即便是有本地算力的朋友,也可以利用在线API高prefill、decode的性能,先跑通自己需要的工作流以及需求。固定skill之后,利用本地算力再介入负责执行。

            这样既能高效的搭建工作流,又可以保障实际运行时的隐私与信息安全。

            LocalLLM的优势是能提供稳定的基座算力,跟头部在线API比,无论是智力、上下文长度、还是性能,还是有不小的差距。

            我预测,支持开源自部署的模型,一定会一直维持现在这种接近顶级模型85%~90%左右的能力。无论过高还是过低,开源模型这个产业逻辑都成立不了。

            V 1 条回复 最后回复
            2
            • 陳瑋陳 陳瑋

              @applejuice 我看拼多多上版u分開買好像兩千多人民幣就搞定了

              A 在线
              A 在线
              applejuice
              编写于 最后由 编辑
              #10

              @陳瑋 说:

              @applejuice 我看拼多多上版u分開買好像兩千多人民幣就搞定了

              其实我算过
              那家店给的总价钱跟分开买差不多,但是我都对比淘宝

              1 条回复 最后回复
              0
              • M 离线
                M 离线
                Max-han
                编写于 最后由 编辑
                #11

                汇报作业,最近终于调试好新配的epyc了,主要是2张老显卡加起来才20g显存,真的是太捉襟见肘了,加载完27b真剩不下多少空间了,而且最操蛋的是模型流水线分层,单层的显存占用在218mb左右,最后就卡在是40:24还是39:25 ,27b总层数64。我后来一咬牙把Ubuntu的图形界面关了,省了200mb。现在极限可以单并发跑256k,想要稳定提供api给hermes,我还是降到了128g然后b512 ub128,现在非常稳定,pp在800-1000 生成速度在23k/s,mtp一直没尝试成功

                1 条回复 最后回复
                1
                • M 离线
                  M 离线
                  Max-han
                  编写于 最后由 编辑
                  #12

                  35b-q8量化的能跑24t/s

                  1 条回复 最后回复
                  0
                  • williamlouisW 离线
                    williamlouisW 离线
                    williamlouis
                    编写于 最后由 编辑
                    #13

                    可以学习的重点:我把mac上的hermes远程ssh连接主力机,我让hermes给我配置环境运行llamacpp,结果非常好。
                    很多有问题的朋友可以借鉴。当然 Mac 可以是 Windows 可以是Linux。

                    个人主页:xlkj.org Telegram https://t.me/xlkjorg

                    1 条回复 最后回复
                    0
                    • ? 老用户

                      @菠菜多 是这样的,而且即便是有本地算力的朋友,也可以利用在线API高prefill、decode的性能,先跑通自己需要的工作流以及需求。固定skill之后,利用本地算力再介入负责执行。

                      这样既能高效的搭建工作流,又可以保障实际运行时的隐私与信息安全。

                      LocalLLM的优势是能提供稳定的基座算力,跟头部在线API比,无论是智力、上下文长度、还是性能,还是有不小的差距。

                      我预测,支持开源自部署的模型,一定会一直维持现在这种接近顶级模型85%~90%左右的能力。无论过高还是过低,开源模型这个产业逻辑都成立不了。

                      V 离线
                      V 离线
                      vosrock
                      编写于 最后由 编辑
                      #14

                      是个好办法,跑一两个项目将HERMES的工作习惯整好,然后回到本地跑自己的隐私项目,谢谢指点了

                      1 条回复 最后回复
                      0

                      你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                      厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                      有了你的建议,这篇帖子会更精彩哦 💗

                      注册 登录
                      回复
                      • 在新帖中回复
                      登录后回复
                      • 从旧到新
                      • 从新到旧
                      • 最多赞同


                      • 登录

                      • 没有帐号? 注册

                      • 登录或注册以进行搜索。
                      • 第一个帖子
                        最后一个帖子
                      0
                      • 版块
                      • 最新
                      • 标签
                      • 热门
                      • 用户
                      • 群组