跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI Agent
  3. 纯外行用ai agent之路

纯外行用ai agent之路

已定时 已固定 已锁定 已移动 AI Agent
14 帖子 9 发布者 266 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • terryT terry

    @Max-han 然后我就网上套了一套3代epyc的主板配个便宜u,8通道内存啊,128pcie通道啊,5个满速的pcie4x16,太牛逼了。
    这个操作很神奇,是的,我也在考虑购入那玩意,下半年折腾,现在x99完全够用。

    A 在线
    A 在线
    applejuice
    编写于 最后由 编辑
    #4

    @terry 说:

    @Max-han 然后我就网上套了一套3代epyc的主板配个便宜u,8通道内存啊,128pcie通道啊,5个满速的pcie4x16,太牛逼了。
    这个操作很神奇,是的,我也在考虑购入那玩意,下半年折腾,现在x99完全够用。

    epyc 真的贵啊
    那个huananzhi 给我的价钱 epyc7502 + 主板 3150.. 贵两千...

    陳瑋陳 1 条回复 最后回复
    0
    • terryT 离线
      terryT 离线
      terry
      编写于 最后由 编辑
      #5

      可以,看来x99之后就是epyc+华南 精粤的寨板,生态延续,后继有人,😂

      油管:https://www.youtube.com/@抡锤者

      1 条回复 最后回复
      0
      • 菠 离线
        菠 离线
        菠菜多
        编写于 最后由 编辑
        #6

        我现在主要是用在线的API,先把Hermes Agent它的边界摸清楚,尤其是要把它这个事情跟这个现在工作中进行工作流进行结合。如果在实际工作中不能应用的话,那就像拿着锤子找不到钉子一样,特别难受,而且没有动力。所以希望大家都找到自己的钉子,我们已经拥有了威力无穷的锤子,就差钉子了。

        ? 1 条回复 最后回复
        2
        • M Max-han

          我业余爱好打打游戏,在2008年那会盗版光碟泛滥的情况下天天研究怎么装游戏玩游戏,把最基本的电脑操作学会了。今年年初才关注到ai agent 小龙虾自己装没装成功,放弃了。然后hermes在mac上装成功了,看老特视频我就开了deepseekv4pro的api给hermes,我屁都不懂问Gemini学会了装Ubuntu24,给我的主力机5700x3d64g7900xtx装上了,然后问Gemini怎么配置llamacpp,这软件安装不像lms那样简洁明了,我又晕了。后来灵机一动,我把mac上的hermes远程ssh连接主力机,我让hermes给我配置环境运行llamacpp,结果非常好,本地配的27b开tubro3能跑30多。然后我就网上套了一套3代epyc的主板配个便宜u,8通道内存啊,128pcie通道啊,5个满速的pcie4x16,太牛逼了。把我淘汰的3070和4070s装上,准备让hermes给我再配置一个llama服务器跑27b35b,最近在配置,还缺点配件,等好了交作业给大家参考。现在我已经能用主力机上配好的27b api提供给hermes了,不用事事都问v4pro了,让他在给我调新的epyc服务器。最后我想说一句ai agent真牛逼,让我这种普通人都可以编程写脚本了,脑洞多大,舞台多大。

          陳瑋陳 离线
          陳瑋陳 离线
          陳瑋
          编写于 最后由 编辑
          #7

          @Max-han 剛拼多多搜了一下epyc, 牛是真牛啊,家裡報廢主機或者回收站隨便掏個八條ddr4內存出來,不敢想像那個內存時脈有多高啊,而且又不貴

          1 条回复 最后回复
          0
          • A applejuice

            @terry 说:

            @Max-han 然后我就网上套了一套3代epyc的主板配个便宜u,8通道内存啊,128pcie通道啊,5个满速的pcie4x16,太牛逼了。
            这个操作很神奇,是的,我也在考虑购入那玩意,下半年折腾,现在x99完全够用。

            epyc 真的贵啊
            那个huananzhi 给我的价钱 epyc7502 + 主板 3150.. 贵两千...

            陳瑋陳 离线
            陳瑋陳 离线
            陳瑋
            编写于 最后由 编辑
            #8

            @applejuice 我看拼多多上版u分開買好像兩千多人民幣就搞定了

            A 1 条回复 最后回复
            0
            • 菠 菠菜多

              我现在主要是用在线的API,先把Hermes Agent它的边界摸清楚,尤其是要把它这个事情跟这个现在工作中进行工作流进行结合。如果在实际工作中不能应用的话,那就像拿着锤子找不到钉子一样,特别难受,而且没有动力。所以希望大家都找到自己的钉子,我们已经拥有了威力无穷的锤子,就差钉子了。

              ? 离线
              ? 离线
              老用户
              编写于 最后由 编辑
              #9

              @菠菜多 是这样的,而且即便是有本地算力的朋友,也可以利用在线API高prefill、decode的性能,先跑通自己需要的工作流以及需求。固定skill之后,利用本地算力再介入负责执行。

              这样既能高效的搭建工作流,又可以保障实际运行时的隐私与信息安全。

              LocalLLM的优势是能提供稳定的基座算力,跟头部在线API比,无论是智力、上下文长度、还是性能,还是有不小的差距。

              我预测,支持开源自部署的模型,一定会一直维持现在这种接近顶级模型85%~90%左右的能力。无论过高还是过低,开源模型这个产业逻辑都成立不了。

              V 1 条回复 最后回复
              2
              • 陳瑋陳 陳瑋

                @applejuice 我看拼多多上版u分開買好像兩千多人民幣就搞定了

                A 在线
                A 在线
                applejuice
                编写于 最后由 编辑
                #10

                @陳瑋 说:

                @applejuice 我看拼多多上版u分開買好像兩千多人民幣就搞定了

                其实我算过
                那家店给的总价钱跟分开买差不多,但是我都对比淘宝

                1 条回复 最后回复
                0
                • M 离线
                  M 离线
                  Max-han
                  编写于 最后由 编辑
                  #11

                  汇报作业,最近终于调试好新配的epyc了,主要是2张老显卡加起来才20g显存,真的是太捉襟见肘了,加载完27b真剩不下多少空间了,而且最操蛋的是模型流水线分层,单层的显存占用在218mb左右,最后就卡在是40:24还是39:25 ,27b总层数64。我后来一咬牙把Ubuntu的图形界面关了,省了200mb。现在极限可以单并发跑256k,想要稳定提供api给hermes,我还是降到了128g然后b512 ub128,现在非常稳定,pp在800-1000 生成速度在23k/s,mtp一直没尝试成功

                  1 条回复 最后回复
                  1
                  • M 离线
                    M 离线
                    Max-han
                    编写于 最后由 编辑
                    #12

                    35b-q8量化的能跑24t/s

                    1 条回复 最后回复
                    0
                    • williamlouisW 离线
                      williamlouisW 离线
                      williamlouis
                      编写于 最后由 编辑
                      #13

                      可以学习的重点:我把mac上的hermes远程ssh连接主力机,我让hermes给我配置环境运行llamacpp,结果非常好。
                      很多有问题的朋友可以借鉴。当然 Mac 可以是 Windows 可以是Linux。

                      个人主页:xlkj.org Telegram https://t.me/xlkjorg

                      1 条回复 最后回复
                      0
                      • ? 老用户

                        @菠菜多 是这样的,而且即便是有本地算力的朋友,也可以利用在线API高prefill、decode的性能,先跑通自己需要的工作流以及需求。固定skill之后,利用本地算力再介入负责执行。

                        这样既能高效的搭建工作流,又可以保障实际运行时的隐私与信息安全。

                        LocalLLM的优势是能提供稳定的基座算力,跟头部在线API比,无论是智力、上下文长度、还是性能,还是有不小的差距。

                        我预测,支持开源自部署的模型,一定会一直维持现在这种接近顶级模型85%~90%左右的能力。无论过高还是过低,开源模型这个产业逻辑都成立不了。

                        V 离线
                        V 离线
                        vosrock
                        编写于 最后由 编辑
                        #14

                        是个好办法,跑一两个项目将HERMES的工作习惯整好,然后回到本地跑自己的隐私项目,谢谢指点了

                        1 条回复 最后回复
                        0

                        你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                        厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                        有了你的建议,这篇帖子会更精彩哦 💗

                        注册 登录
                        回复
                        • 在新帖中回复
                        登录后回复
                        • 从旧到新
                        • 从新到旧
                        • 最多赞同


                        • 登录

                        • 没有帐号? 注册

                        • 登录或注册以进行搜索。
                        • 第一个帖子
                          最后一个帖子
                        0
                        • 版块
                        • 最新
                        • 标签
                        • 热门
                        • 用户
                        • 群组