跳转至内容
  • 版块
  • 最新
  • 标签
  • 热门
  • 用户
  • 群组
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
品牌标识

抡锤者

  1. 主页
  2. AI进阶话题
  3. RAG LoRA和大模型的关系以及应用场景

RAG LoRA和大模型的关系以及应用场景

已定时 已固定 已锁定 已移动 AI进阶话题
11 帖子 4 发布者 67 浏览
  • 从旧到新
  • 从新到旧
  • 最多赞同
回复
  • 在新帖中回复
登录后回复
此主题已被删除。只有拥有主题管理权限的用户可以查看。
  • terryT 离线
    terryT 离线
    terry
    编写于 最后由 terry 编辑
    #1

    一、基础定义

    1. LoRA

    全称低秩适配,是轻量级模型微调技术。不改动主模型核心权重,仅新增并挂载少量低秩矩阵参数,内嵌于模型内部。属于模型层补充,用于固定、约束主模型的生成特征与行为。

    2. RAG

    全称检索增强生成,是外挂式知识库体系。完全不修改主模型权重,依靠向量数据库存储文本、图像等资料,通过语义检索调取外部信息并输入主模型。属于信息层补充,用于补齐主模型缺失内容、约束生成内容准确性。

    3. 共性

    二者均作为主模型的补充方案,核心目的是约束主模型,让输出结果符合使用预期。

    二、通用大模型领域应用

    1. LoRA

    可用于文本、图像等全品类大模型。通过少量数据训练后,让模型固化专属能力、风格、人设、输出格式等,长期改变模型生成倾向。

    2. RAG

    适用于所有生成类大模型。为主模型补充训练集之外的新知识、专业细节、客观事实,解决模型知识老旧、生成内容出现幻觉的问题,不会改变模型本身能力。

    三、实用举例

    案例1:RAG(通用文本大模型示例)

    使用本地文本大模型搭配RAG。提前将企业规章制度、产品参数文档存入向量数据库。用户向大模型提问“查询这款设备的售后保修规则”,大模型自身训练数据无相关内容,RAG先检索数据库内对应的保修条款,将检索到的原文信息拼接后一同传给大模型。大模型依托这份外部资料作答,输出内容准确贴合实际规则,避免编造信息。

    案例2:LoRA(ComfyUI 图像生成示例)

    基于ComfyUI与Flux图像模型使用LoRA。加载Flux主模型后,接入专门训练的人物LoRA节点。输入简单提示词“人物半身肖像”,LoRA会持续约束模型生成逻辑,固定目标人物的五官、脸型与神态,保证多次出图人物特征统一,不会出现面部变形、人物样貌错乱的情况。

    油管:https://www.youtube.com/@抡锤者

    1 条回复 最后回复
    1
    • terryT 离线
      terryT 离线
      terry
      编写于 最后由 编辑
      #2

      因为这个区Tony提议开设,我以为大神们颇有涉猎,但是开通后发现没人发帖,为了缓解尴尬的气氛,我发个基础概念。如果说未来行业应用垂直落地,RAG和Lora就是必修课。我用不到那么深,以后如果尝试做动画,可能会实践下。

      油管:https://www.youtube.com/@抡锤者

      1 条回复 最后回复
      0
      • AGIA 在线
        AGIA 在线
        AGI
        编写于 最后由 编辑
        #3

        x上有很多关于RAG的质疑声音,模型的不同,检索出来的效果也不同,所以很多人开始质疑了,随着上下文越来越大,很多时候,把材料全放到上下文,比rag的向量化检索更精准。感觉说的有道理,但是谁知道呢,毕竟模型月来月聪明(有利于rag),上下文越来越大(直接把文档塞到上下文)。

        Tony WangT 1 条回复 最后回复
        0
        • kop wangK 在线
          kop wangK 在线
          kop wang
          编写于 最后由 编辑
          #4

          对于RAG有很多唱衰的声音,主要是语义检索即便是采纳率到95%,依然是拼不过LLM直接迭代的关键词检索。语料语义化的价值在被质疑。或者说语义化引入的噪声大于其“压缩上下文”的收益。

          虚心交流,一起进步

          Tony WangT 1 条回复 最后回复
          0
          • AGIA AGI

            x上有很多关于RAG的质疑声音,模型的不同,检索出来的效果也不同,所以很多人开始质疑了,随着上下文越来越大,很多时候,把材料全放到上下文,比rag的向量化检索更精准。感觉说的有道理,但是谁知道呢,毕竟模型月来月聪明(有利于rag),上下文越来越大(直接把文档塞到上下文)。

            Tony WangT 离线
            Tony WangT 离线
            Tony Wang
            编写于 最后由 编辑
            #5

            @AGI

            qwen3.6 27b 本地上下文只有256k, 云端各个服务商也就 1M 或者更多些. 但一部<天龙八部> 要2M多, 一部<罗马帝国衰亡史> 要5M多. llm 一次吞不下, 即使吞下, 效率也是很低的.

            对一个大的知识库进行分析, 无论从容量到效率, 仅仅依靠 llm 肯定是不行的, 起码是不经济的.

            我的理解是, 肯定要想办法切片检索, 要么用RAG, 要么用分步滑动总结等等方法.

            AGIA 1 条回复 最后回复
            0
            • kop wangK kop wang

              对于RAG有很多唱衰的声音,主要是语义检索即便是采纳率到95%,依然是拼不过LLM直接迭代的关键词检索。语料语义化的价值在被质疑。或者说语义化引入的噪声大于其“压缩上下文”的收益。

              Tony WangT 离线
              Tony WangT 离线
              Tony Wang
              编写于 最后由 编辑
              #6

              @kop-wang

              RAG也在不断优化中, 加入 混合检索, rerank, 知识图谱, 再加上越来越长的上下文llm, 短期内应该还是主流解决方案.

              长期来看, 全部上下文的分析, 从效率和经济性上都是硬伤, 只能算是 大力出奇迹, 市场应该承受不起.

              1 条回复 最后回复
              0
              • Tony WangT Tony Wang

                @AGI

                qwen3.6 27b 本地上下文只有256k, 云端各个服务商也就 1M 或者更多些. 但一部<天龙八部> 要2M多, 一部<罗马帝国衰亡史> 要5M多. llm 一次吞不下, 即使吞下, 效率也是很低的.

                对一个大的知识库进行分析, 无论从容量到效率, 仅仅依靠 llm 肯定是不行的, 起码是不经济的.

                我的理解是, 肯定要想办法切片检索, 要么用RAG, 要么用分步滑动总结等等方法.

                AGIA 在线
                AGIA 在线
                AGI
                编写于 最后由 AGI 编辑
                #7

                @Tony-Wang 你说的很对,如果AGI是以后习以为常的生活,那么,咱们现在还活在农耕时代!所有东西都在发展,有质疑不怕,能做的更好才牛逼!我的第一台电脑64MB内存,硬盘10G。

                Tony WangT 1 条回复 最后回复
                0
                • AGIA AGI

                  @Tony-Wang 你说的很对,如果AGI是以后习以为常的生活,那么,咱们现在还活在农耕时代!所有东西都在发展,有质疑不怕,能做的更好才牛逼!我的第一台电脑64MB内存,硬盘10G。

                  Tony WangT 离线
                  Tony WangT 离线
                  Tony Wang
                  编写于 最后由 编辑
                  #8

                  @AGI

                  我的第一台电脑是 Ti的486, 4M 内存, 10M的 全高5寸硬盘(从单位顺来的) 🙂

                  那个4M内存条, 当年的价格是1030元, 我现在还记得 😞

                  AGIA 1 条回复 最后回复
                  0
                  • Tony WangT Tony Wang

                    @AGI

                    我的第一台电脑是 Ti的486, 4M 内存, 10M的 全高5寸硬盘(从单位顺来的) 🙂

                    那个4M内存条, 当年的价格是1030元, 我现在还记得 😞

                    AGIA 在线
                    AGIA 在线
                    AGI
                    编写于 最后由 AGI 编辑
                    #9

                    @Tony-Wang 哈哈,都是老玩家啊。这个社区平均年龄块能领退休工资了。话说回来,愿意折腾的,还是那些人。

                    1 条回复 最后回复
                    0
                    • Tony WangT 离线
                      Tony WangT 离线
                      Tony Wang
                      编写于 最后由 编辑
                      #10

                      保持好奇心, 大家共勉 🙂

                      1 条回复 最后回复
                      0
                      • terryT 离线
                        terryT 离线
                        terry
                        编写于 最后由 编辑
                        #11

                        我频道的观众年龄从18-25到55-65都有,中年人最多,年轻人其实也不少。我说实话,老年人折腾下AI挺好的,防止老年痴呆。以后我们活到100岁应该不是难事,当然了,遇到意外噶了也正常。医疗在进步,60岁之后干嘛呢?还有几十年的时间呢。各种辅助工具也会越来越多,不如多思考下,AI就是最好的玩具。

                        油管:https://www.youtube.com/@抡锤者

                        1 条回复 最后回复
                        0
                        • terryT terry 从 AI进阶话题 移动了该主题
                        • terryT terry 从 LLM讨论区 移动了该主题

                        你好!看起来您对这段对话很感兴趣,但您还没有一个账号。

                        厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。

                        有了你的建议,这篇帖子会更精彩哦 💗

                        注册 登录
                        回复
                        • 在新帖中回复
                        登录后回复
                        • 从旧到新
                        • 从新到旧
                        • 最多赞同


                        • 登录

                        • 没有帐号? 注册

                        • 登录或注册以进行搜索。
                        • 第一个帖子
                          最后一个帖子
                        0
                        • 版块
                        • 最新
                        • 标签
                        • 热门
                        • 用户
                        • 群组