跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI进阶话题
  3. RAG LoRA和大模型的关系以及应用场景

RAG LoRA和大模型的关系以及应用场景

已定时 已固定 已锁定 已移动 AI进阶话题
19 帖子 8 发布者 352 浏览 1 关注中
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • kop wangK 在线
    kop wangK 在线
    kop wang
    超级版主
    发表于 最后由 编辑
    #4

    对于RAG有很多唱衰的声音,主要是语义检索即便是采纳率到95%,依然是拼不过LLM直接迭代的关键词检索。语料语义化的价值在被质疑。或者说语义化引入的噪声大于其“压缩上下文”的收益。

    虚心交流,一起进步

    Tony WangT 1 条回复 最后回复
    0
    • AGIA AGI

      x上有很多关于RAG的质疑声音,模型的不同,检索出来的效果也不同,所以很多人开始质疑了,随着上下文越来越大,很多时候,把材料全放到上下文,比rag的向量化检索更精准。感觉说的有道理,但是谁知道呢,毕竟模型月来月聪明(有利于rag),上下文越来越大(直接把文档塞到上下文)。

      Tony WangT 离线
      Tony WangT 离线
      Tony Wang
      超级版主
      发表于 最后由 编辑
      #5

      @AGI

      qwen3.6 27b 本地上下文只有256k, 云端各个服务商也就 1M 或者更多些. 但一部<天龙八部> 要2M多, 一部<罗马帝国衰亡史> 要5M多. llm 一次吞不下, 即使吞下, 效率也是很低的.

      对一个大的知识库进行分析, 无论从容量到效率, 仅仅依靠 llm 肯定是不行的, 起码是不经济的.

      我的理解是, 肯定要想办法切片检索, 要么用RAG, 要么用分步滑动总结等等方法.

      AGIA 1 条回复 最后回复
      0
      • kop wangK kop wang

        对于RAG有很多唱衰的声音,主要是语义检索即便是采纳率到95%,依然是拼不过LLM直接迭代的关键词检索。语料语义化的价值在被质疑。或者说语义化引入的噪声大于其“压缩上下文”的收益。

        Tony WangT 离线
        Tony WangT 离线
        Tony Wang
        超级版主
        发表于 最后由 编辑
        #6

        @kop-wang

        RAG也在不断优化中, 加入 混合检索, rerank, 知识图谱, 再加上越来越长的上下文llm, 短期内应该还是主流解决方案.

        长期来看, 全部上下文的分析, 从效率和经济性上都是硬伤, 只能算是 大力出奇迹, 市场应该承受不起.

        1 条回复 最后回复
        0
        • Tony WangT Tony Wang

          @AGI

          qwen3.6 27b 本地上下文只有256k, 云端各个服务商也就 1M 或者更多些. 但一部<天龙八部> 要2M多, 一部<罗马帝国衰亡史> 要5M多. llm 一次吞不下, 即使吞下, 效率也是很低的.

          对一个大的知识库进行分析, 无论从容量到效率, 仅仅依靠 llm 肯定是不行的, 起码是不经济的.

          我的理解是, 肯定要想办法切片检索, 要么用RAG, 要么用分步滑动总结等等方法.

          AGIA 离线
          AGIA 离线
          AGI
          技术大牛 劳动模范
          发表于 最后由 AGI 编辑
          #7

          @Tony-Wang 你说的很对,如果AGI是以后习以为常的生活,那么,咱们现在还活在农耕时代!所有东西都在发展,有质疑不怕,能做的更好才牛逼!我的第一台电脑64MB内存,硬盘10G。

          https://agi.cd

          Tony WangT 1 条回复 最后回复
          0
          • AGIA AGI

            @Tony-Wang 你说的很对,如果AGI是以后习以为常的生活,那么,咱们现在还活在农耕时代!所有东西都在发展,有质疑不怕,能做的更好才牛逼!我的第一台电脑64MB内存,硬盘10G。

            Tony WangT 离线
            Tony WangT 离线
            Tony Wang
            超级版主
            发表于 最后由 编辑
            #8

            @AGI

            我的第一台电脑是 Ti的486, 4M 内存, 10M的 全高5寸硬盘(从单位顺来的) 🙂

            那个4M内存条, 当年的价格是1030元, 我现在还记得 😞

            AGIA 1 条回复 最后回复
            0
            • Tony WangT Tony Wang

              @AGI

              我的第一台电脑是 Ti的486, 4M 内存, 10M的 全高5寸硬盘(从单位顺来的) 🙂

              那个4M内存条, 当年的价格是1030元, 我现在还记得 😞

              AGIA 离线
              AGIA 离线
              AGI
              技术大牛 劳动模范
              发表于 最后由 AGI 编辑
              #9

              @Tony-Wang 哈哈,都是老玩家啊。这个社区平均年龄块能领退休工资了。话说回来,愿意折腾的,还是那些人。

              https://agi.cd

              1 条回复 最后回复
              0
              • Tony WangT 离线
                Tony WangT 离线
                Tony Wang
                超级版主
                发表于 最后由 编辑
                #10

                保持好奇心, 大家共勉 🙂

                1 条回复 最后回复
                0
                • terryT 在线
                  terryT 在线
                  terry
                  超级版主
                  发表于 最后由 编辑
                  #11

                  我频道的观众年龄从18-25到55-65都有,中年人最多,年轻人其实也不少。我说实话,老年人折腾下AI挺好的,防止老年痴呆。以后我们活到100岁应该不是难事,当然了,遇到意外噶了也正常。医疗在进步,60岁之后干嘛呢?还有几十年的时间呢。各种辅助工具也会越来越多,不如多思考下,AI就是最好的玩具。

                  油管:https://www.youtube.com/@抡锤者

                  1 条回复 最后回复
                  1
                  • terryT terry 于 将此主题从 AI进阶话题 移至此处
                  • terryT terry 于 将此主题从 LLM讨论区 移至此处
                  • H QianH 离线
                    H QianH 离线
                    H Qian
                    编写于 最后由 编辑
                    #12

                    NotebookLM就是典型的RAG应用范例,LoRA才是小企业们的战场,可以各显神通搞出各自有特色的垂直行业模型。本人就尝试做这方面研究,包括模型生成后的安全防护话题,有兴趣可以一起探讨。

                    ? 1 条回复 最后回复
                    1
                    • H QianH H Qian

                      NotebookLM就是典型的RAG应用范例,LoRA才是小企业们的战场,可以各显神通搞出各自有特色的垂直行业模型。本人就尝试做这方面研究,包括模型生成后的安全防护话题,有兴趣可以一起探讨。

                      ? 离线
                      ? 离线
                      老用户
                      编写于 最后由 编辑
                      #13

                      @H-Qian 這我有興趣, 最近我也在弄anythingllm 希望能類似notebookllm,目前不知道是llm模型還是embedding 的模型不夠好,總覺得回答得很保守......

                      1 条回复 最后回复
                      0
                      • K 离线
                        K 离线
                        kenshin
                        编写于 最后由 编辑
                        #14

                        做了中医某体系的rag系统,资料切片,1400+文件耗时8小时+。还要+rerank。多维度交叉。结果:不同模型辅助诊断出来的方子不一样。重新诊断也不一定一样。现在开始新的概念:rag+agent,但是无论怎么折腾。还是不如人脑。但是如果用来总结概述。对比。这些意义还是有的。原因很简单,喂的料做出了的rag系统和使用者的语言语义不一致。还有大模型要出唯一答案,最好机械一点。temp=0, Prompt 里强制约束。现在来说,rag系统只能用来学习。不能结合llm用来搞生产。 最起码严谨的工作领域还不能作为生产力。

                        terryT Tony WangT 5 3 条回复 最后回复
                        1
                        • K kenshin

                          做了中医某体系的rag系统,资料切片,1400+文件耗时8小时+。还要+rerank。多维度交叉。结果:不同模型辅助诊断出来的方子不一样。重新诊断也不一定一样。现在开始新的概念:rag+agent,但是无论怎么折腾。还是不如人脑。但是如果用来总结概述。对比。这些意义还是有的。原因很简单,喂的料做出了的rag系统和使用者的语言语义不一致。还有大模型要出唯一答案,最好机械一点。temp=0, Prompt 里强制约束。现在来说,rag系统只能用来学习。不能结合llm用来搞生产。 最起码严谨的工作领域还不能作为生产力。

                          terryT 在线
                          terryT 在线
                          terry
                          超级版主
                          编写于 最后由 编辑
                          #15

                          @kenshin 挺有意义的实践参考,这不仅需要RAG技术范式的进步,也需要模型在训练时就要提供类似接口。

                          油管:https://www.youtube.com/@抡锤者

                          1 条回复 最后回复
                          0
                          • K kenshin

                            做了中医某体系的rag系统,资料切片,1400+文件耗时8小时+。还要+rerank。多维度交叉。结果:不同模型辅助诊断出来的方子不一样。重新诊断也不一定一样。现在开始新的概念:rag+agent,但是无论怎么折腾。还是不如人脑。但是如果用来总结概述。对比。这些意义还是有的。原因很简单,喂的料做出了的rag系统和使用者的语言语义不一致。还有大模型要出唯一答案,最好机械一点。temp=0, Prompt 里强制约束。现在来说,rag系统只能用来学习。不能结合llm用来搞生产。 最起码严谨的工作领域还不能作为生产力。

                            Tony WangT 离线
                            Tony WangT 离线
                            Tony Wang
                            超级版主
                            编写于 最后由 编辑
                            #16

                            @kenshin

                            会不会是中医的判断本身就很模糊? 缺乏明确的指标判断? 知识库中的内容很可能就存在了冲突, 模糊, 交叉等现象.

                            K terryT 2 条回复 最后回复
                            0
                            • K kenshin

                              做了中医某体系的rag系统,资料切片,1400+文件耗时8小时+。还要+rerank。多维度交叉。结果:不同模型辅助诊断出来的方子不一样。重新诊断也不一定一样。现在开始新的概念:rag+agent,但是无论怎么折腾。还是不如人脑。但是如果用来总结概述。对比。这些意义还是有的。原因很简单,喂的料做出了的rag系统和使用者的语言语义不一致。还有大模型要出唯一答案,最好机械一点。temp=0, Prompt 里强制约束。现在来说,rag系统只能用来学习。不能结合llm用来搞生产。 最起码严谨的工作领域还不能作为生产力。

                              5 离线
                              5 离线
                              566656661
                              超凡大师
                              编写于 最后由 566656661 编辑
                              #17

                              @kenshin

                              我是屬於公司内部文件 (~500頁精細操作) + 助手 + 提供其他應用程式API作爲Agentic Control Tool Call

                              只能説連POC都舉步維艱, 最後還被老闆刹停了...

                              儘管有API可以呼叫但是Agentic Workflow和General Chat的邊界選用這個真的很讓人頭痛

                              Tool Call至少可以用Structured Output來限制但是模型選擇延續Workflow跟Chat這個基本無解

                              1 条回复 最后回复
                              0
                              • Tony WangT Tony Wang

                                @kenshin

                                会不会是中医的判断本身就很模糊? 缺乏明确的指标判断? 知识库中的内容很可能就存在了冲突, 模糊, 交叉等现象.

                                K 离线
                                K 离线
                                kenshin
                                编写于 最后由 编辑
                                #18

                                @Tony-Wang 某系体系是比较规范的。问诊单也可以机械到细化。大方向不应该错的。六经辨证,总能分出哪一经或多经合病并病。表里同病。水火气血,单一病还是两者三者四个都出现,还出现权重比例不一样。证据链越长,指向月明确。但是通用LLM还是只是通用。个人使用,没硬件没能力微调。现在使用中只作参考。大多数辅助诊断和选方都不采用。原因是病史采集语言不一定是向量库中一致。还有交叉重组,意义不一定和资料中一样。所以任重而道远。只能作为小学生做题目参考。换句话说:题目还没读懂,就写答案。九成九是错的。

                                1 条回复 最后回复
                                0
                                • Tony WangT Tony Wang

                                  @kenshin

                                  会不会是中医的判断本身就很模糊? 缺乏明确的指标判断? 知识库中的内容很可能就存在了冲突, 模糊, 交叉等现象.

                                  terryT 在线
                                  terryT 在线
                                  terry
                                  超级版主
                                  编写于 最后由 编辑
                                  #19

                                  @Tony-Wang 😂,中医确实比较玄学,这事还得靠老师傅望闻问切吗,别说AI,就是你专门学中医的,也搞不准。

                                  油管:https://www.youtube.com/@抡锤者

                                  1 条回复 最后回复
                                  0

                                  你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                                  厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                                  有了你的建议,这篇帖子会更精彩哦 💗

                                  注册 登录
                                  回复
                                  • 在新帖中回复
                                  登录后回复
                                  • 从旧到新
                                  • 从新到旧
                                  • 最多赞同


                                  • 登录

                                  • 没有帐号? 注册

                                  • 第一个帖子
                                    最后一个帖子
                                  0
                                  • 版块
                                  • 最新
                                  • 标签
                                  • 热门
                                  • 用户
                                  • 群组