<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[RAG LoRA和大模型的关系以及应用场景]]></title><description><![CDATA[<h2>一、基础定义</h2>
<h3>1. LoRA</h3>
<p dir="auto">全称低秩适配，是<strong>轻量级模型微调技术</strong>。不改动主模型核心权重，仅新增并挂载少量低秩矩阵参数，内嵌于模型内部。属于模型层补充，用于固定、约束主模型的生成特征与行为。</p>
<h3>2. RAG</h3>
<p dir="auto">全称检索增强生成，是<strong>外挂式知识库体系</strong>。完全不修改主模型权重，依靠向量数据库存储文本、图像等资料，通过语义检索调取外部信息并输入主模型。属于信息层补充，用于补齐主模型缺失内容、约束生成内容准确性。</p>
<h3>3. 共性</h3>
<p dir="auto">二者均作为主模型的补充方案，核心目的是约束主模型，让输出结果符合使用预期。</p>
<h2>二、通用大模型领域应用</h2>
<h3>1. LoRA</h3>
<p dir="auto">可用于文本、图像等全品类大模型。通过少量数据训练后，让模型固化专属能力、风格、人设、输出格式等，长期改变模型生成倾向。</p>
<h3>2. RAG</h3>
<p dir="auto">适用于所有生成类大模型。为主模型补充训练集之外的新知识、专业细节、客观事实，解决模型知识老旧、生成内容出现幻觉的问题，不会改变模型本身能力。</p>
<h2>三、实用举例</h2>
<h3>案例1：RAG（通用文本大模型示例）</h3>
<p dir="auto">使用本地文本大模型搭配RAG。提前将企业规章制度、产品参数文档存入向量数据库。用户向大模型提问“查询这款设备的售后保修规则”，大模型自身训练数据无相关内容，RAG先检索数据库内对应的保修条款，将检索到的原文信息拼接后一同传给大模型。大模型依托这份外部资料作答，输出内容准确贴合实际规则，避免编造信息。</p>
<h3>案例2：LoRA（ComfyUI 图像生成示例）</h3>
<p dir="auto">基于ComfyUI与Flux图像模型使用LoRA。加载Flux主模型后，接入专门训练的人物LoRA节点。输入简单提示词“人物半身肖像”，LoRA会持续约束模型生成逻辑，固定目标人物的五官、脸型与神态，保证多次出图人物特征统一，不会出现面部变形、人物样貌错乱的情况。</p>
]]></description><link>https://lcz.me/topic/361/rag-lora和大模型的关系以及应用场景</link><generator>RSS for Node</generator><lastBuildDate>Sun, 31 May 2026 03:13:32 GMT</lastBuildDate><atom:link href="https://lcz.me/topic/361.rss" rel="self" type="application/rss+xml"/><pubDate>Sat, 30 May 2026 05:04:46 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to RAG LoRA和大模型的关系以及应用场景 on Sat, 30 May 2026 17:34:25 GMT]]></title><description><![CDATA[<p dir="auto">我频道的观众年龄从18-25到55-65都有，中年人最多，年轻人其实也不少。我说实话，老年人折腾下AI挺好的，防止老年痴呆。以后我们活到100岁应该不是难事，当然了，遇到意外噶了也正常。医疗在进步，60岁之后干嘛呢？还有几十年的时间呢。各种辅助工具也会越来越多，不如多思考下，AI就是最好的玩具。</p>
]]></description><link>https://lcz.me/post/4395</link><guid isPermaLink="true">https://lcz.me/post/4395</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sat, 30 May 2026 17:34:25 GMT</pubDate></item><item><title><![CDATA[Reply to RAG LoRA和大模型的关系以及应用场景 on Sat, 30 May 2026 12:45:31 GMT]]></title><description><![CDATA[<p dir="auto">保持好奇心, 大家共勉 <img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f642.png?v=d348ca29232" class="not-responsive emoji emoji-android emoji--slightly_smiling_face" style="height:23px;width:auto;vertical-align:middle" title=":)" alt="🙂" /></p>
]]></description><link>https://lcz.me/post/4357</link><guid isPermaLink="true">https://lcz.me/post/4357</guid><dc:creator><![CDATA[Tony Wang]]></dc:creator><pubDate>Sat, 30 May 2026 12:45:31 GMT</pubDate></item><item><title><![CDATA[Reply to RAG LoRA和大模型的关系以及应用场景 on Sat, 30 May 2026 12:41:34 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/tony-wang" aria-label="Profile: Tony-Wang">@<bdi>Tony-Wang</bdi></a> 哈哈，都是老玩家啊。这个社区平均年龄块能领退休工资了。话说回来，愿意折腾的，还是那些人。</p>
]]></description><link>https://lcz.me/post/4356</link><guid isPermaLink="true">https://lcz.me/post/4356</guid><dc:creator><![CDATA[AGI]]></dc:creator><pubDate>Sat, 30 May 2026 12:41:34 GMT</pubDate></item><item><title><![CDATA[Reply to RAG LoRA和大模型的关系以及应用场景 on Sat, 30 May 2026 12:25:42 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/agi" aria-label="Profile: AGI">@<bdi>AGI</bdi></a></p>
<p dir="auto">我的第一台电脑是 Ti的486, 4M 内存, 10M的 全高5寸硬盘(从单位顺来的)  <img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f642.png?v=d348ca29232" class="not-responsive emoji emoji-android emoji--slightly_smiling_face" style="height:23px;width:auto;vertical-align:middle" title=":)" alt="🙂" /></p>
<p dir="auto">那个4M内存条, 当年的价格是1030元, 我现在还记得 <img src="https://lcz.me/assets/plugins/nodebb-plugin-emoji/emoji/android/1f61e.png?v=d348ca29232" class="not-responsive emoji emoji-android emoji--disappointed" style="height:23px;width:auto;vertical-align:middle" title=":(" alt="😞" /></p>
]]></description><link>https://lcz.me/post/4353</link><guid isPermaLink="true">https://lcz.me/post/4353</guid><dc:creator><![CDATA[Tony Wang]]></dc:creator><pubDate>Sat, 30 May 2026 12:25:42 GMT</pubDate></item><item><title><![CDATA[Reply to RAG LoRA和大模型的关系以及应用场景 on Sat, 30 May 2026 11:49:50 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/tony-wang" aria-label="Profile: Tony-Wang">@<bdi>Tony-Wang</bdi></a> 你说的很对，如果AGI是以后习以为常的生活，那么，咱们现在还活在农耕时代！所有东西都在发展，有质疑不怕，能做的更好才牛逼！我的第一台电脑64MB内存，硬盘10G。</p>
]]></description><link>https://lcz.me/post/4347</link><guid isPermaLink="true">https://lcz.me/post/4347</guid><dc:creator><![CDATA[AGI]]></dc:creator><pubDate>Sat, 30 May 2026 11:49:50 GMT</pubDate></item><item><title><![CDATA[Reply to RAG LoRA和大模型的关系以及应用场景 on Sat, 30 May 2026 11:41:02 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/kop-wang" aria-label="Profile: kop-wang">@<bdi>kop-wang</bdi></a></p>
<p dir="auto">RAG也在不断优化中, 加入 混合检索, rerank, 知识图谱, 再加上越来越长的上下文llm, 短期内应该还是主流解决方案.</p>
<p dir="auto">长期来看, 全部上下文的分析, 从效率和经济性上都是硬伤, 只能算是 大力出奇迹, 市场应该承受不起.</p>
]]></description><link>https://lcz.me/post/4345</link><guid isPermaLink="true">https://lcz.me/post/4345</guid><dc:creator><![CDATA[Tony Wang]]></dc:creator><pubDate>Sat, 30 May 2026 11:41:02 GMT</pubDate></item><item><title><![CDATA[Reply to RAG LoRA和大模型的关系以及应用场景 on Sat, 30 May 2026 11:34:55 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/agi" aria-label="Profile: AGI">@<bdi>AGI</bdi></a></p>
<p dir="auto">qwen3.6 27b 本地上下文只有256k, 云端各个服务商也就 1M 或者更多些. 但一部&lt;天龙八部&gt; 要2M多,  一部&lt;罗马帝国衰亡史&gt; 要5M多.  llm 一次吞不下, 即使吞下, 效率也是很低的.</p>
<p dir="auto">对一个大的知识库进行分析, 无论从容量到效率, 仅仅依靠 llm 肯定是不行的, 起码是不经济的.</p>
<p dir="auto">我的理解是, 肯定要想办法切片检索, 要么用RAG, 要么用分步滑动总结等等方法.</p>
]]></description><link>https://lcz.me/post/4344</link><guid isPermaLink="true">https://lcz.me/post/4344</guid><dc:creator><![CDATA[Tony Wang]]></dc:creator><pubDate>Sat, 30 May 2026 11:34:55 GMT</pubDate></item><item><title><![CDATA[Reply to RAG LoRA和大模型的关系以及应用场景 on Sat, 30 May 2026 06:18:39 GMT]]></title><description><![CDATA[<p dir="auto">对于RAG有很多唱衰的声音，主要是语义检索即便是采纳率到95%，依然是拼不过LLM直接迭代的关键词检索。语料语义化的价值在被质疑。或者说语义化引入的噪声大于其“压缩上下文”的收益。</p>
]]></description><link>https://lcz.me/post/4318</link><guid isPermaLink="true">https://lcz.me/post/4318</guid><dc:creator><![CDATA[kop wang]]></dc:creator><pubDate>Sat, 30 May 2026 06:18:39 GMT</pubDate></item><item><title><![CDATA[Reply to RAG LoRA和大模型的关系以及应用场景 on Sat, 30 May 2026 06:01:03 GMT]]></title><description><![CDATA[<p dir="auto">x上有很多关于RAG的质疑声音，模型的不同，检索出来的效果也不同，所以很多人开始质疑了，随着上下文越来越大，很多时候，把材料全放到上下文，比rag的向量化检索更精准。感觉说的有道理，但是谁知道呢，毕竟模型月来月聪明（有利于rag），上下文越来越大（直接把文档塞到上下文）。</p>
]]></description><link>https://lcz.me/post/4314</link><guid isPermaLink="true">https://lcz.me/post/4314</guid><dc:creator><![CDATA[AGI]]></dc:creator><pubDate>Sat, 30 May 2026 06:01:03 GMT</pubDate></item><item><title><![CDATA[Reply to RAG LoRA和大模型的关系以及应用场景 on Sat, 30 May 2026 05:08:24 GMT]]></title><description><![CDATA[<p dir="auto">因为这个区Tony提议开设，我以为大神们颇有涉猎，但是开通后发现没人发帖，为了缓解尴尬的气氛，我发个基础概念。如果说未来行业应用垂直落地，RAG和Lora就是必修课。我用不到那么深，以后如果尝试做动画，可能会实践下。</p>
]]></description><link>https://lcz.me/post/4313</link><guid isPermaLink="true">https://lcz.me/post/4313</guid><dc:creator><![CDATA[terry]]></dc:creator><pubDate>Sat, 30 May 2026 05:08:24 GMT</pubDate></item></channel></rss>