跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI Agent
  3. 纯外行用ai agent之路

纯外行用ai agent之路

已定时 已固定 已锁定 已移动 AI Agent
14 帖子 9 发布者 266 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • M Max-han

    我业余爱好打打游戏,在2008年那会盗版光碟泛滥的情况下天天研究怎么装游戏玩游戏,把最基本的电脑操作学会了。今年年初才关注到ai agent 小龙虾自己装没装成功,放弃了。然后hermes在mac上装成功了,看老特视频我就开了deepseekv4pro的api给hermes,我屁都不懂问Gemini学会了装Ubuntu24,给我的主力机5700x3d64g7900xtx装上了,然后问Gemini怎么配置llamacpp,这软件安装不像lms那样简洁明了,我又晕了。后来灵机一动,我把mac上的hermes远程ssh连接主力机,我让hermes给我配置环境运行llamacpp,结果非常好,本地配的27b开tubro3能跑30多。然后我就网上套了一套3代epyc的主板配个便宜u,8通道内存啊,128pcie通道啊,5个满速的pcie4x16,太牛逼了。把我淘汰的3070和4070s装上,准备让hermes给我再配置一个llama服务器跑27b35b,最近在配置,还缺点配件,等好了交作业给大家参考。现在我已经能用主力机上配好的27b api提供给hermes了,不用事事都问v4pro了,让他在给我调新的epyc服务器。最后我想说一句ai agent真牛逼,让我这种普通人都可以编程写脚本了,脑洞多大,舞台多大。

    terryT 离线
    terryT 离线
    terry
    编写于 最后由 编辑
    #2

    @Max-han 然后我就网上套了一套3代epyc的主板配个便宜u,8通道内存啊,128pcie通道啊,5个满速的pcie4x16,太牛逼了。
    这个操作很神奇,是的,我也在考虑购入那玩意,下半年折腾,现在x99完全够用。

    油管:https://www.youtube.com/@抡锤者

    A 1 条回复 最后回复
    0
    • 活 离线
      活 离线
      活着就是折腾
      编写于 最后由 编辑
      #3

      已经在组装了,7402cpu 256G内存,现在内存真贵!就等7900xtx到位了

      1 条回复 最后回复
      0
      • terryT terry

        @Max-han 然后我就网上套了一套3代epyc的主板配个便宜u,8通道内存啊,128pcie通道啊,5个满速的pcie4x16,太牛逼了。
        这个操作很神奇,是的,我也在考虑购入那玩意,下半年折腾,现在x99完全够用。

        A 在线
        A 在线
        applejuice
        编写于 最后由 编辑
        #4

        @terry 说:

        @Max-han 然后我就网上套了一套3代epyc的主板配个便宜u,8通道内存啊,128pcie通道啊,5个满速的pcie4x16,太牛逼了。
        这个操作很神奇,是的,我也在考虑购入那玩意,下半年折腾,现在x99完全够用。

        epyc 真的贵啊
        那个huananzhi 给我的价钱 epyc7502 + 主板 3150.. 贵两千...

        陳瑋陳 1 条回复 最后回复
        0
        • terryT 离线
          terryT 离线
          terry
          编写于 最后由 编辑
          #5

          可以,看来x99之后就是epyc+华南 精粤的寨板,生态延续,后继有人,😂

          油管:https://www.youtube.com/@抡锤者

          1 条回复 最后回复
          0
          • 菠 离线
            菠 离线
            菠菜多
            编写于 最后由 编辑
            #6

            我现在主要是用在线的API,先把Hermes Agent它的边界摸清楚,尤其是要把它这个事情跟这个现在工作中进行工作流进行结合。如果在实际工作中不能应用的话,那就像拿着锤子找不到钉子一样,特别难受,而且没有动力。所以希望大家都找到自己的钉子,我们已经拥有了威力无穷的锤子,就差钉子了。

            ? 1 条回复 最后回复
            2
            • M Max-han

              我业余爱好打打游戏,在2008年那会盗版光碟泛滥的情况下天天研究怎么装游戏玩游戏,把最基本的电脑操作学会了。今年年初才关注到ai agent 小龙虾自己装没装成功,放弃了。然后hermes在mac上装成功了,看老特视频我就开了deepseekv4pro的api给hermes,我屁都不懂问Gemini学会了装Ubuntu24,给我的主力机5700x3d64g7900xtx装上了,然后问Gemini怎么配置llamacpp,这软件安装不像lms那样简洁明了,我又晕了。后来灵机一动,我把mac上的hermes远程ssh连接主力机,我让hermes给我配置环境运行llamacpp,结果非常好,本地配的27b开tubro3能跑30多。然后我就网上套了一套3代epyc的主板配个便宜u,8通道内存啊,128pcie通道啊,5个满速的pcie4x16,太牛逼了。把我淘汰的3070和4070s装上,准备让hermes给我再配置一个llama服务器跑27b35b,最近在配置,还缺点配件,等好了交作业给大家参考。现在我已经能用主力机上配好的27b api提供给hermes了,不用事事都问v4pro了,让他在给我调新的epyc服务器。最后我想说一句ai agent真牛逼,让我这种普通人都可以编程写脚本了,脑洞多大,舞台多大。

              陳瑋陳 离线
              陳瑋陳 离线
              陳瑋
              编写于 最后由 编辑
              #7

              @Max-han 剛拼多多搜了一下epyc, 牛是真牛啊,家裡報廢主機或者回收站隨便掏個八條ddr4內存出來,不敢想像那個內存時脈有多高啊,而且又不貴

              1 条回复 最后回复
              0
              • A applejuice

                @terry 说:

                @Max-han 然后我就网上套了一套3代epyc的主板配个便宜u,8通道内存啊,128pcie通道啊,5个满速的pcie4x16,太牛逼了。
                这个操作很神奇,是的,我也在考虑购入那玩意,下半年折腾,现在x99完全够用。

                epyc 真的贵啊
                那个huananzhi 给我的价钱 epyc7502 + 主板 3150.. 贵两千...

                陳瑋陳 离线
                陳瑋陳 离线
                陳瑋
                编写于 最后由 编辑
                #8

                @applejuice 我看拼多多上版u分開買好像兩千多人民幣就搞定了

                A 1 条回复 最后回复
                0
                • 菠 菠菜多

                  我现在主要是用在线的API,先把Hermes Agent它的边界摸清楚,尤其是要把它这个事情跟这个现在工作中进行工作流进行结合。如果在实际工作中不能应用的话,那就像拿着锤子找不到钉子一样,特别难受,而且没有动力。所以希望大家都找到自己的钉子,我们已经拥有了威力无穷的锤子,就差钉子了。

                  ? 离线
                  ? 离线
                  老用户
                  编写于 最后由 编辑
                  #9

                  @菠菜多 是这样的,而且即便是有本地算力的朋友,也可以利用在线API高prefill、decode的性能,先跑通自己需要的工作流以及需求。固定skill之后,利用本地算力再介入负责执行。

                  这样既能高效的搭建工作流,又可以保障实际运行时的隐私与信息安全。

                  LocalLLM的优势是能提供稳定的基座算力,跟头部在线API比,无论是智力、上下文长度、还是性能,还是有不小的差距。

                  我预测,支持开源自部署的模型,一定会一直维持现在这种接近顶级模型85%~90%左右的能力。无论过高还是过低,开源模型这个产业逻辑都成立不了。

                  V 1 条回复 最后回复
                  2
                  • 陳瑋陳 陳瑋

                    @applejuice 我看拼多多上版u分開買好像兩千多人民幣就搞定了

                    A 在线
                    A 在线
                    applejuice
                    编写于 最后由 编辑
                    #10

                    @陳瑋 说:

                    @applejuice 我看拼多多上版u分開買好像兩千多人民幣就搞定了

                    其实我算过
                    那家店给的总价钱跟分开买差不多,但是我都对比淘宝

                    1 条回复 最后回复
                    0
                    • M 离线
                      M 离线
                      Max-han
                      编写于 最后由 编辑
                      #11

                      汇报作业,最近终于调试好新配的epyc了,主要是2张老显卡加起来才20g显存,真的是太捉襟见肘了,加载完27b真剩不下多少空间了,而且最操蛋的是模型流水线分层,单层的显存占用在218mb左右,最后就卡在是40:24还是39:25 ,27b总层数64。我后来一咬牙把Ubuntu的图形界面关了,省了200mb。现在极限可以单并发跑256k,想要稳定提供api给hermes,我还是降到了128g然后b512 ub128,现在非常稳定,pp在800-1000 生成速度在23k/s,mtp一直没尝试成功

                      1 条回复 最后回复
                      1
                      • M 离线
                        M 离线
                        Max-han
                        编写于 最后由 编辑
                        #12

                        35b-q8量化的能跑24t/s

                        1 条回复 最后回复
                        0
                        • williamlouisW 离线
                          williamlouisW 离线
                          williamlouis
                          编写于 最后由 编辑
                          #13

                          可以学习的重点:我把mac上的hermes远程ssh连接主力机,我让hermes给我配置环境运行llamacpp,结果非常好。
                          很多有问题的朋友可以借鉴。当然 Mac 可以是 Windows 可以是Linux。

                          个人主页:xlkj.org Telegram https://t.me/xlkjorg

                          1 条回复 最后回复
                          0
                          • ? 老用户

                            @菠菜多 是这样的,而且即便是有本地算力的朋友,也可以利用在线API高prefill、decode的性能,先跑通自己需要的工作流以及需求。固定skill之后,利用本地算力再介入负责执行。

                            这样既能高效的搭建工作流,又可以保障实际运行时的隐私与信息安全。

                            LocalLLM的优势是能提供稳定的基座算力,跟头部在线API比,无论是智力、上下文长度、还是性能,还是有不小的差距。

                            我预测,支持开源自部署的模型,一定会一直维持现在这种接近顶级模型85%~90%左右的能力。无论过高还是过低,开源模型这个产业逻辑都成立不了。

                            V 离线
                            V 离线
                            vosrock
                            编写于 最后由 编辑
                            #14

                            是个好办法,跑一两个项目将HERMES的工作习惯整好,然后回到本地跑自己的隐私项目,谢谢指点了

                            1 条回复 最后回复
                            0

                            你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                            厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                            有了你的建议,这篇帖子会更精彩哦 💗

                            注册 登录
                            回复
                            • 在新帖中回复
                            登录后回复
                            • 从旧到新
                            • 从新到旧
                            • 最多赞同


                            • 登录

                            • 没有帐号? 注册

                            • 登录或注册以进行搜索。
                            • 第一个帖子
                              最后一个帖子
                            0
                            • 版块
                            • 最新
                            • 标签
                            • 热门
                            • 用户
                            • 群组