基于RAG-WIKI 理论,我做了一套本地知识库,用于客服机器人.

mark

@Tony-Wang - 主要技术栈:

词法索引
BM25 召回
规则型 reranker 重排
组装答案

mark

这个RAG ,就不是一次性成型的. 我尝试过.
每一套知识库,必须配置一套评估规则.
只有当知识密度够我的阈值,才能出来,否则再召回.

以下是我为 wms 配置的评估规则:

运行时评估

Supported：true
Rule：WMS 生成评估规则 v1
Passed：true
Score：7
Answer OK：true
Answer Terms OK：true
Source Count OK：true
Citation OK：true
Grounded OK：true
Actual Sources：5
Citation Count：1
Required Terms：盘点, 库存, 差异
Hit Terms：盘点
Missing Source Titles：(none)
Forbidden Terms：(none)

Tony Wang

我理解了，你这套系统已经做得很完善了。我觉得还可以继续往通用性方向拓展一些。

比如，Rule 是人工配置的，还是 AI 也能够协助生成或维护？

再比如，语义相关性的处理。像 “美签”、“美国签证”、“美国学生签”、“美国工签” 这些词，我觉得 Embedding 这种语义检索会比较容易命中。而传统关键词搜索，可能还需要配置同义词规则，或者结合一些语义相关性的搜索策略。

另外, 就是整篇文档召回, 我觉得会有浪费显存的状况.

我个人还是觉得，不同的检索方式各有优缺点，最终更可能还是一种混合策略。

mark

@Tony-Wang 你说的我理解了. 我可以用双路,一个是index+search ,一个是chunk+embedding.

我尝试下, 应该不难. 我想想怎么接线.

但是我想提升,文档的输入的质量和提示词优化.

如果还不行,我尝试下双路, 我就怕,双路之后, 我自己都不知道哪里错了.

Tony Wang

@mark

我其实对个人知识库(或者说个人知识图谱) 是非常感兴趣的. 但我没有什么开发能力.

所以期待大神能有更多地探索和分享.

566656661

認同GIGO的概念, 如果沒理解錯的話提到應該就是Naive RAG在應對錯誤資訊的痛處: 大學生在開書考試帶錯書了 ~~希望這個比喻沒錯~~

但不太認同一棍子打掉所有RAG, 先不說RAG有分很多類型, 這裏說幾個比較常見的: FLARE, DRAGIN, Adaptive, Probing

Naive RAG自己也有不同的變種來增加搜索準確率吧, RRR (Rewrite-Retrieve-Read) 跟 RRF (Reciprocal Rank Fusion), 上面kop大提到的語意搜尋應該就是RRF中的語意搜尋 (Semantic Search) + 關鍵字搜索 (Lexical Search, BM25)吧?

我在目前測量公司弄的就是RRR

Naive RAG永遠只適合在陳述事實的場合, 也就是媽媽是女人, 或者沒什麽人知道的冷知識

因爲之前在幫忙架構RAGFlow, 所以有跑去研究了一下幾個不同設計方向的RAG, 基本上也是針對著Naive RAG不同方面進行改進 (何時檢索, 如何查)

框架	思路	優勝點
FLARE	按需觸發＋預測性查詢：僅在低置信度 token 時檢索，以「預測下一句」構造查詢	避免長生成過程中的無效檢索
DRAGIN	全域智慧決策：RIND 綜合評估不確定性／語義／上下文影響；QFS 基於完整歷史自注意力權重構建查詢	打破靜態規則與窄上下文限制
Adaptive	難度分級路由：分類器預判複雜度，動態分配「免檢索／單次／多步迭代」策略	解決「一刀切」帶來的計算浪費
Probing	內省式知識評估：隱藏狀態探針直讀 LLM 內部認知，判斷「是否已知情」	消除冗餘檢索與知識覆蓋衝突

最近好像也出了個Skill RAG, 不過我還沒去看Paper所以也不知道設計思路是什麽, 只在Twitter上知道是關於失敗後如何修復

無意引戰, 單純抛磚引玉 + 避免一刀切XXX沒用這種説法
技術 + 設計思路是需要時間成熟, 慢慢進步的

要知道Naive RAG已經是2023年的產物了, 當時還單純叫RR, Retrieve-Read ~~突然覺得時間飛得有點快~~

williamlouis

学习中。知识增长了些许。我主要还是对这个技术了解太少。拜读。

mark

@566656661 谢谢评价. 没事, 人总是成长的.

我有空也研究其他RAG的技术方向, 我这个比较难的技术方向都研究明白了.

成熟的RAG技术,AI Coding的时候更容易.

真正的 RAG技术, 不是一种方向,而是混合方向. 在不同的领域.

lukun ge

技术从来都不是护城河，common sense才是，所有的问题的根源都来自common sense不common

mark

哈哈, 英雄所见略同,

以后普通程序员,就是很廉价. 就是一般打字员的工资, 也就8k.

但是顶级资深程序员,就很贵, 核心就是判断力和经验.

抡锤者

基于RAG-WIKI 理论,我做了一套本地知识库,用于客服机器人.

运行时评估