跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. LLM讨论区
  3. 基于RAG-WIKI 理论,我做了一套本地知识库,用于客服机器人.

基于RAG-WIKI 理论,我做了一套本地知识库,用于客服机器人.

已定时 已固定 已锁定 已移动 LLM讨论区
15 帖子 6 发布者 174 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • Tony WangT Tony Wang

    吃了垃圾,发给LLM ,吐出来垃圾.

    这句话极其赞同. 但整个结论我不能完全同意.

    我现在也在用LLM Wiki, 配合我的Obsidian一起工作, 效果非常好. 但是前提是我一样要给它高质量的内容. 而且它比较适合做专题的分析.

    我不知道你具体用什么方法做索引, 好像是BM25 + composite(?)+ quality rank. 除了关键词, 向量检索肯定也是搜索相关内容的很好的方法. 用多种方法混合做检索, 效果应该更好. 比如我搜索 "车险" , BM25很可能不能命中 "车辆保险", "机动车保险" ..., 而向量检索应该更容易命中这种语义相近的内容.

    我的Obsidian里面有5500篇笔记, 大部分是 .md, 还有相当一部分 pdf, ppt, word, 少量图片. 这些内容如果全部放在 LLM wiki 里, 上下文是撑不住的.

    还有一种情况, 我这里没有, 但是企业知识库里往往有, 就是一个文档包含了多方面的内容. Chunk 不准确肯定是垃圾, 但是不相关内容一样是垃圾, 它会占用你宝贵的显存.

    其实我觉得, 你这套系统, 就是一个自研的RAG, 只是你没有用传统的embedding和固定长度chunk. 或者说, 你的chunk变成了一个个完整文档.

    所以, 我觉得不要轻易全面否定RAG的价值. 从经济性和效果的平衡出发, 还有很长的路要走. 包括RAG, 长上下文LLM, 知识图谱等技术应该长期共存,逐步融合, 更可能是一种混合策略.

    个人浅见, 欢迎拍砖 🙂

    M 离线
    M 离线
    mark
    超凡大师
    编写于 最后由 mark 编辑
    #6

    @Tony-Wang - 主要技术栈:

    • 词法索引
    • BM25 召回
    • 规则型 reranker 重排
    • 组装答案
    1 条回复 最后回复
    0
    • M 离线
      M 离线
      mark
      超凡大师
      编写于 最后由 mark 编辑
      #7

      这个RAG ,就不是 一次性成型的. 我尝试过.
      每一套知识库,必须配置 一套评估规则.
      只有当知识密度够我的阈值,才能出来,否则再召回.

      以下是我为 wms 配置的评估规则:

      运行时评估

      • Supported:true
      • Rule:WMS 生成评估规则 v1
      • Passed:true
      • Score:7
      • Answer OK:true
      • Answer Terms OK:true
      • Source Count OK:true
      • Citation OK:true
      • Grounded OK:true
      • Actual Sources:5
      • Citation Count:1
      • Required Terms:盘点, 库存, 差异
      • Hit Terms:盘点
      • Missing Source Titles:(none)
      • Forbidden Terms:(none)
      1 条回复 最后回复
      0
      • Tony WangT 离线
        Tony WangT 离线
        Tony Wang
        超级版主
        编写于 最后由 Tony Wang 编辑
        #8

        我理解了,你这套系统已经做得很完善了。我觉得还可以继续往通用性方向拓展一些。 👍 👍 👍

        比如,Rule 是人工配置的,还是 AI 也能够协助生成或维护?

        再比如,语义相关性的处理。像 “美签”、“美国签证”、“美国学生签”、“美国工签” 这些词,我觉得 Embedding 这种语义检索会比较容易命中。而传统关键词搜索,可能还需要配置同义词规则,或者结合一些语义相关性的搜索策略。

        另外, 就是整篇文档召回, 我觉得会有浪费显存的状况.

        我个人还是觉得,不同的检索方式各有优缺点,最终更可能还是一种混合策略。

        M 1 条回复 最后回复
        0
        • Tony WangT Tony Wang

          我理解了,你这套系统已经做得很完善了。我觉得还可以继续往通用性方向拓展一些。 👍 👍 👍

          比如,Rule 是人工配置的,还是 AI 也能够协助生成或维护?

          再比如,语义相关性的处理。像 “美签”、“美国签证”、“美国学生签”、“美国工签” 这些词,我觉得 Embedding 这种语义检索会比较容易命中。而传统关键词搜索,可能还需要配置同义词规则,或者结合一些语义相关性的搜索策略。

          另外, 就是整篇文档召回, 我觉得会有浪费显存的状况.

          我个人还是觉得,不同的检索方式各有优缺点,最终更可能还是一种混合策略。

          M 离线
          M 离线
          mark
          超凡大师
          编写于 最后由 mark 编辑
          #9

          @Tony-Wang 你说的我理解了. 我可以用 双路,一个是index+search ,一个是chunk+embedding.

          我尝试下, 应该不难. 我想想 怎么接线.

          但是我想提升,文档的输入的质量 和 提示词优化.

          如果还不行,我尝试下双路, 我就怕,双路之后, 我自己都不知道哪里错了.

          Tony WangT 1 条回复 最后回复
          1
          • M mark

            @Tony-Wang 你说的我理解了. 我可以用 双路,一个是index+search ,一个是chunk+embedding.

            我尝试下, 应该不难. 我想想 怎么接线.

            但是我想提升,文档的输入的质量 和 提示词优化.

            如果还不行,我尝试下双路, 我就怕,双路之后, 我自己都不知道哪里错了.

            Tony WangT 离线
            Tony WangT 离线
            Tony Wang
            超级版主
            编写于 最后由 编辑
            #10

            @mark

            我其实对个人知识库(或者说个人知识图谱) 是非常感兴趣的. 但我没有什么开发能力.

            所以期待大神能有更多地探索和分享. 👍 👍 👍

            1 条回复 最后回复
            0
            • 5 在线
              5 在线
              566656661
              超凡大师
              编写于 最后由 566656661 编辑
              #11

              認同GIGO的概念, 如果沒理解錯的話提到應該就是Naive RAG在應對錯誤資訊的痛處: 大學生在開書考試帶錯書了 希望這個比喻沒錯

              但不太認同一棍子打掉所有RAG, 先不說RAG有分很多類型, 這裏說幾個比較常見的: FLARE, DRAGIN, Adaptive, Probing

              Naive RAG自己也有不同的變種來增加搜索準確率吧, RRR (Rewrite-Retrieve-Read) 跟 RRF (Reciprocal Rank Fusion), 上面kop大提到的語意搜尋應該就是RRF中的語意搜尋 (Semantic Search) + 關鍵字搜索 (Lexical Search, BM25)吧?

              我在目前測量公司弄的就是RRR

              Naive RAG永遠只適合在陳述事實的場合, 也就是媽媽是女人, 或者沒什麽人知道的冷知識

              因爲之前在幫忙架構RAGFlow, 所以有跑去研究了一下幾個不同設計方向的RAG, 基本上也是針對著Naive RAG不同方面進行改進 (何時檢索, 如何查)

              框架 思路 優勝點
              FLARE 按需觸發 + 預測性查詢:僅在低置信度 token 時檢索,以「預測下一句」構造查詢 避免長生成過程中的無效檢索
              DRAGIN 全域智慧決策:RIND 綜合評估不確定性/語義/上下文影響;QFS 基於完整歷史自注意力權重構建查詢 打破靜態規則與窄上下文限制
              Adaptive 難度分級路由:分類器預判複雜度,動態分配「免檢索/單次/多步迭代」策略 解決「一刀切」帶來的計算浪費
              Probing 內省式知識評估:隱藏狀態探針直讀 LLM 內部認知,判斷「是否已知情」 消除冗餘檢索與知識覆蓋衝突

              最近好像也出了個Skill RAG, 不過我還沒去看Paper所以也不知道設計思路是什麽, 只在Twitter上知道是關於失敗後如何修復


              無意引戰, 單純抛磚引玉 + 避免一刀切XXX沒用這種説法
              技術 + 設計思路是需要時間成熟, 慢慢進步的

              要知道Naive RAG已經是2023年的產物了, 當時還單純叫RR, Retrieve-Read 突然覺得時間飛得有點快

              M 1 条回复 最后回复
              2
              • williamlouisW 在线
                williamlouisW 在线
                williamlouis
                超级版主
                编写于 最后由 编辑
                #12

                学习中。知识增长了些许。我主要还是对 这个技术了解太少。拜读。

                个人主页:xlkj.org Telegram https://t.me/xlkjorg

                1 条回复 最后回复
                0
                • 5 566656661

                  認同GIGO的概念, 如果沒理解錯的話提到應該就是Naive RAG在應對錯誤資訊的痛處: 大學生在開書考試帶錯書了 希望這個比喻沒錯

                  但不太認同一棍子打掉所有RAG, 先不說RAG有分很多類型, 這裏說幾個比較常見的: FLARE, DRAGIN, Adaptive, Probing

                  Naive RAG自己也有不同的變種來增加搜索準確率吧, RRR (Rewrite-Retrieve-Read) 跟 RRF (Reciprocal Rank Fusion), 上面kop大提到的語意搜尋應該就是RRF中的語意搜尋 (Semantic Search) + 關鍵字搜索 (Lexical Search, BM25)吧?

                  我在目前測量公司弄的就是RRR

                  Naive RAG永遠只適合在陳述事實的場合, 也就是媽媽是女人, 或者沒什麽人知道的冷知識

                  因爲之前在幫忙架構RAGFlow, 所以有跑去研究了一下幾個不同設計方向的RAG, 基本上也是針對著Naive RAG不同方面進行改進 (何時檢索, 如何查)

                  框架 思路 優勝點
                  FLARE 按需觸發 + 預測性查詢:僅在低置信度 token 時檢索,以「預測下一句」構造查詢 避免長生成過程中的無效檢索
                  DRAGIN 全域智慧決策:RIND 綜合評估不確定性/語義/上下文影響;QFS 基於完整歷史自注意力權重構建查詢 打破靜態規則與窄上下文限制
                  Adaptive 難度分級路由:分類器預判複雜度,動態分配「免檢索/單次/多步迭代」策略 解決「一刀切」帶來的計算浪費
                  Probing 內省式知識評估:隱藏狀態探針直讀 LLM 內部認知,判斷「是否已知情」 消除冗餘檢索與知識覆蓋衝突

                  最近好像也出了個Skill RAG, 不過我還沒去看Paper所以也不知道設計思路是什麽, 只在Twitter上知道是關於失敗後如何修復


                  無意引戰, 單純抛磚引玉 + 避免一刀切XXX沒用這種説法
                  技術 + 設計思路是需要時間成熟, 慢慢進步的

                  要知道Naive RAG已經是2023年的產物了, 當時還單純叫RR, Retrieve-Read 突然覺得時間飛得有點快

                  M 离线
                  M 离线
                  mark
                  超凡大师
                  编写于 最后由 编辑
                  #13

                  @566656661 谢谢评价. 没事, 人总是成长的.

                  我有空也研究其他RAG的技术方向, 我这个比较难的 技术方向都研究明白了.

                  成熟的RAG技术,AI Coding的时候更容易.

                  真正的 RAG技术, 不是一种方向,而是混合方向. 在不同的领域.

                  1 条回复 最后回复
                  1
                  • lukun geL 离线
                    lukun geL 离线
                    lukun ge
                    编写于 最后由 编辑
                    #14

                    技术从来都不是护城河,common sense才是,所有的问题的根源都来自common sense不common

                    1 条回复 最后回复
                    0
                    • M 离线
                      M 离线
                      mark
                      超凡大师
                      编写于 最后由 mark 编辑
                      #15

                      哈哈, 英雄所见略同,

                      以后普通程序员,就是很廉价. 就是一般打字员的工资, 也就8k.

                      但是顶级资深程序员,就很贵, 核心就是判断力和经验.

                      1 条回复 最后回复
                      1
                      • ,M mark 引用了 此主题

                      你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                      厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                      有了你的建议,这篇帖子会更精彩哦 💗

                      注册 登录
                      回复
                      • 在新帖中回复
                      登录后回复
                      • 从旧到新
                      • 从新到旧
                      • 最多赞同


                      • 登录

                      • 没有帐号? 注册

                      • 第一个帖子
                        最后一个帖子
                      0
                      • 版块
                      • 最新
                      • 标签
                      • 热门
                      • 用户
                      • 群组