纯外行用ai agent之路

terry

可以，看来x99之后就是epyc+华南精粤的寨板，生态延续，后继有人，

菠菜多

我现在主要是用在线的API，先把Hermes Agent它的边界摸清楚，尤其是要把它这个事情跟这个现在工作中进行工作流进行结合。如果在实际工作中不能应用的话，那就像拿着锤子找不到钉子一样，特别难受，而且没有动力。所以希望大家都找到自己的钉子，我们已经拥有了威力无穷的锤子，就差钉子了。

陳瑋

@Max-han 剛拼多多搜了一下epyc, 牛是真牛啊，家裡報廢主機或者回收站隨便掏個八條ddr4內存出來，不敢想像那個內存時脈有多高啊，而且又不貴

陳瑋

@applejuice 我看拼多多上版u分開買好像兩千多人民幣就搞定了

? 离线

@菠菜多是这样的，而且即便是有本地算力的朋友，也可以利用在线API高prefill、decode的性能，先跑通自己需要的工作流以及需求。固定skill之后，利用本地算力再介入负责执行。

这样既能高效的搭建工作流，又可以保障实际运行时的隐私与信息安全。

LocalLLM的优势是能提供稳定的基座算力，跟头部在线API比，无论是智力、上下文长度、还是性能，还是有不小的差距。

我预测，支持开源自部署的模型，一定会一直维持现在这种接近顶级模型85%~90%左右的能力。无论过高还是过低，开源模型这个产业逻辑都成立不了。

applejuice

@陳瑋说:

@applejuice 我看拼多多上版u分開買好像兩千多人民幣就搞定了

其实我算过
那家店给的总价钱跟分开买差不多，但是我都对比淘宝

Max-han

汇报作业，最近终于调试好新配的epyc了，主要是2张老显卡加起来才20g显存，真的是太捉襟见肘了，加载完27b真剩不下多少空间了，而且最操蛋的是模型流水线分层，单层的显存占用在218mb左右，最后就卡在是40：24还是39：25 ，27b总层数64。我后来一咬牙把Ubuntu的图形界面关了，省了200mb。现在极限可以单并发跑256k，想要稳定提供api给hermes，我还是降到了128g然后b512 ub128，现在非常稳定，pp在800-1000 生成速度在23k/s，mtp一直没尝试成功

Max-han

35b-q8量化的能跑24t/s

williamlouis

可以学习的重点：我把mac上的hermes远程ssh连接主力机，我让hermes给我配置环境运行llamacpp，结果非常好。
很多有问题的朋友可以借鉴。当然 Mac 可以是 Windows 可以是Linux。

vosrock

是个好办法，跑一两个项目将HERMES的工作习惯整好，然后回到本地跑自己的隐私项目，谢谢指点了

抡锤者

纯外行用ai agent之路