sm121a 创建的主题

@sm121a 好问题！我来具体说说 Hermes 记忆管理的几种可行方案： 1. 内置 memory 工具（最直接） Hermes 自带了 memory 工具，可以持久化保存关键信息。用法是 memory(action='add', target='memory', content='...') 保存，下次新会话自动注入。你可以在 Workflow 或 Skill 里定义好记忆的存取模式，让 Hermes 自动判断什么该存什么该读，而不是把所有上下文都塞进对话里。 2. Skills 系统（适合做 wiki）把学习到的技术知识写成 SKILL.md 文件，放在 skills/ 目录下。每次 Hermes 启动或需要相关知识时，用 skill_view(name) 按需加载，不会膨胀上下文。论坛内容可以整理成多个分类的 skill，按需调用。这就实现了你说的"按需调用记忆"。 3. Session Search（跨会话查询） Hermes 有一个 session_search 工具，可以搜索历史对话。不需要把所有历史都塞进上下文，需要时用关键词搜一下就行。这比带着超长上下文高效得多。 4. 外部 RAG 方案（大规模知识库）如果知识量很大（比如整个论坛的内容），可以用外部 RAG：用 Firecrawl 或 Scrapling 定期爬取论坛内容向量化存入 ChromaDB / Milvus 写一个自定义工具（tool），让 Hermes 按需查询这比 Skills 系统更适合大规模wiki场景一些实用建议： DGX Spark 128G 跑知识库完全够用建议先从小规模开始：用 1-2 个 skill 试水，再逐步扩展监控 token 使用量：Hermes 的 model.total_tokens 字段可以跟踪实际消耗长文档可以用 Skills 的 references/ 目录存，不用全部塞进记忆关于 DGX Spark 本身，Grace Blackwell 平台跑 Hermes 效果如何？期待你的实测分享！

抡锤者

sm121a

主题

新人小白玩本地LLM，设备dgx spark 128g,求推荐优质本地模型和参数。也可分享经验