-
目前的瓶颈还是“RAG输出的内容到底比正则、关键词检索强多少”这个话题。
目前行业通用开源的Agent,用RAG的属于少数。更多的还是坚守关键词、正则匹配。
RAG很难证明比正则+关键词强,尤其是在目前LLM在卷上下文最大长度这个情况下。如果正如LLM大厂吹的,26年内无限上下文实现,RAG瞬间就没有价值了。
-
@566656661 RAG的是有门槛的,不是个人随便玩得转的,无限上下文不太可能,但是可以通过构建只是文本数据库,而不是用RAG的方式来完成增强。就是RAG的性价比还不如本地文本检索增强。
在Document RAG上認同, 但是Code RAG上應該各有千秋?
工具 核心表示 索引位置 給 Agent 的介面 主要場景 CodeGraph tree-sitter AST → SQLite 圖 + FTS5 本地 MCP(10 個工具) Claude Code/Cursor/Codex 等 Agent 的探索加速 Aider repo map tree-sitter tags + PageRank 本地 拼接至 prompt 中 Aider 終端 pair programming Cursor 內建索引 檔案分塊 → embedding 遠端 Turbopuffer + Merkle 樹同步 @Codebase Cursor IDE 內 Continue.dev tree-sitter 分塊 + embedding + FTS 本地 ~/.continue/index@Codebase / @Folder Continue IDE 外掛程式 Sourcegraph Cody SCIP(LSIF 後繼)+ embedding 遠端 Sourcegraph 實例 內建 + MCP server 企業程式碼搜尋 Augment Code 語意索引(專有 Context Engine) 遠端 MCP(遠端 HTTPS) 企業級 Agent,跨程式碼庫 Potpie.ai Neo4j 屬性圖 伺服器端(自行託管或 SaaS) FastAPI + 專用 Agent 企業 spec-driven 大型程式碼庫 Greptile 程式碼庫相依圖 遠端 SaaS PR review Agent AI code review Bloop 語意搜尋 桌面/遠端 桌面 UI 自然語言程式碼搜尋 Repomix / Code2Prompt / yek 整庫拼接為長文本 本地 複製貼上 / MCP 供長上下文 LLM 進行一次性匯出 CodeQL 資料流 + 控制流 facts → Datalog 本地 QL 查詢 安全性分析/變異分析 Glean (Meta) 通用程式碼事實資料庫 + SCIP 輸入 伺服器端 Glass API Meta 內部 IDE/RAG -
在Document RAG上認同, 但是Code RAG上應該各有千秋?
工具 核心表示 索引位置 給 Agent 的介面 主要場景 CodeGraph tree-sitter AST → SQLite 圖 + FTS5 本地 MCP(10 個工具) Claude Code/Cursor/Codex 等 Agent 的探索加速 Aider repo map tree-sitter tags + PageRank 本地 拼接至 prompt 中 Aider 終端 pair programming Cursor 內建索引 檔案分塊 → embedding 遠端 Turbopuffer + Merkle 樹同步 @Codebase Cursor IDE 內 Continue.dev tree-sitter 分塊 + embedding + FTS 本地 ~/.continue/index@Codebase / @Folder Continue IDE 外掛程式 Sourcegraph Cody SCIP(LSIF 後繼)+ embedding 遠端 Sourcegraph 實例 內建 + MCP server 企業程式碼搜尋 Augment Code 語意索引(專有 Context Engine) 遠端 MCP(遠端 HTTPS) 企業級 Agent,跨程式碼庫 Potpie.ai Neo4j 屬性圖 伺服器端(自行託管或 SaaS) FastAPI + 專用 Agent 企業 spec-driven 大型程式碼庫 Greptile 程式碼庫相依圖 遠端 SaaS PR review Agent AI code review Bloop 語意搜尋 桌面/遠端 桌面 UI 自然語言程式碼搜尋 Repomix / Code2Prompt / yek 整庫拼接為長文本 本地 複製貼上 / MCP 供長上下文 LLM 進行一次性匯出 CodeQL 資料流 + 控制流 facts → Datalog 本地 QL 查詢 安全性分析/變異分析 Glean (Meta) 通用程式碼事實資料庫 + SCIP 輸入 伺服器端 Glass API Meta 內部 IDE/RAG -
rag 有什么测试方法吗?
我搞了一下基本上能用.
但是你们说的我都不明白 -
rag 有什么测试方法吗?
我搞了一下基本上能用.
但是你们说的我都不明白 -
目前的瓶颈还是“RAG输出的内容到底比正则、关键词检索强多少”这个话题。
目前行业通用开源的Agent,用RAG的属于少数。更多的还是坚守关键词、正则匹配。
RAG很难证明比正则+关键词强,尤其是在目前LLM在卷上下文最大长度这个情况下。如果正如LLM大厂吹的,26年内无限上下文实现,RAG瞬间就没有价值了。
-
-
@ueli 关于法律相关这块,有没有可能是因为很大权重的影响因素其实都不在整个法律体系和流程框架内,导致其实LLM的上下文本来就是不完整的。从而导致统计学结果的失真。
Coding之所以效果比较好,除了可以做0成本验证回溯迭代以外,我个人理解,很大程度上是因为Coding的信息量是明牌的,而且收束在极其窄的区间以内。一个project,本质上所有的上下文都在这个文件夹下。外部都是知识,不决定整个project的执行结果和执行走向。
法律在我的理解来看恰恰相反。法条和整个司法流程的文书,反而是信息量最小的部分。有大量看似解耦,但实际又起决定性作用的信息量在外围。他们之间从文字本身上很难有统计学关系。
而这其实RAG也无法彻底解决。毕竟RAG是以为了LLM有限的上下文窗口而“精炼上下文”为本质目的的技术。它并不能解决"信息视野缺失"的问题。还有一点,就是LLM本身后训练的审查和拒绝模块,对于法律这种相对敏感的内容也会起到很大的负面作用。
我认为这是法律领域Agent,乃至LLM失真的最本质因素。
-
@ueli 关于法律相关这块,有没有可能是因为很大权重的影响因素其实都不在整个法律体系和流程框架内,导致其实LLM的上下文本来就是不完整的。从而导致统计学结果的失真。
Coding之所以效果比较好,除了可以做0成本验证回溯迭代以外,我个人理解,很大程度上是因为Coding的信息量是明牌的,而且收束在极其窄的区间以内。一个project,本质上所有的上下文都在这个文件夹下。外部都是知识,不决定整个project的执行结果和执行走向。
法律在我的理解来看恰恰相反。法条和整个司法流程的文书,反而是信息量最小的部分。有大量看似解耦,但实际又起决定性作用的信息量在外围。他们之间从文字本身上很难有统计学关系。
而这其实RAG也无法彻底解决。毕竟RAG是以为了LLM有限的上下文窗口而“精炼上下文”为本质目的的技术。它并不能解决"信息视野缺失"的问题。还有一点,就是LLM本身后训练的审查和拒绝模块,对于法律这种相对敏感的内容也会起到很大的负面作用。
我认为这是法律领域Agent,乃至LLM失真的最本质因素。
-
@566656661 人也会有幻觉,大脑天生就会欺骗,多一个求证的环节,就会排除幻觉。
-
@ueli 关于法律相关这块,有没有可能是因为很大权重的影响因素其实都不在整个法律体系和流程框架内,导致其实LLM的上下文本来就是不完整的。从而导致统计学结果的失真。
Coding之所以效果比较好,除了可以做0成本验证回溯迭代以外,我个人理解,很大程度上是因为Coding的信息量是明牌的,而且收束在极其窄的区间以内。一个project,本质上所有的上下文都在这个文件夹下。外部都是知识,不决定整个project的执行结果和执行走向。
法律在我的理解来看恰恰相反。法条和整个司法流程的文书,反而是信息量最小的部分。有大量看似解耦,但实际又起决定性作用的信息量在外围。他们之间从文字本身上很难有统计学关系。
而这其实RAG也无法彻底解决。毕竟RAG是以为了LLM有限的上下文窗口而“精炼上下文”为本质目的的技术。它并不能解决"信息视野缺失"的问题。还有一点,就是LLM本身后训练的审查和拒绝模块,对于法律这种相对敏感的内容也会起到很大的负面作用。
我认为这是法律领域Agent,乃至LLM失真的最本质因素。