-
x上有很多关于RAG的质疑声音,模型的不同,检索出来的效果也不同,所以很多人开始质疑了,随着上下文越来越大,很多时候,把材料全放到上下文,比rag的向量化检索更精准。感觉说的有道理,但是谁知道呢,毕竟模型月来月聪明(有利于rag),上下文越来越大(直接把文档塞到上下文)。
-
对于RAG有很多唱衰的声音,主要是语义检索即便是采纳率到95%,依然是拼不过LLM直接迭代的关键词检索。语料语义化的价值在被质疑。或者说语义化引入的噪声大于其“压缩上下文”的收益。
-
qwen3.6 27b 本地上下文只有256k, 云端各个服务商也就 1M 或者更多些. 但一部<天龙八部> 要2M多, 一部<罗马帝国衰亡史> 要5M多. llm 一次吞不下, 即使吞下, 效率也是很低的.
对一个大的知识库进行分析, 无论从容量到效率, 仅仅依靠 llm 肯定是不行的, 起码是不经济的.
我的理解是, 肯定要想办法切片检索, 要么用RAG, 要么用分步滑动总结等等方法.
@Tony-Wang 你说的很对,如果AGI是以后习以为常的生活,那么,咱们现在还活在农耕时代!所有东西都在发展,有质疑不怕,能做的更好才牛逼!我的第一台电脑64MB内存,硬盘10G。
-
@Tony-Wang 你说的很对,如果AGI是以后习以为常的生活,那么,咱们现在还活在农耕时代!所有东西都在发展,有质疑不怕,能做的更好才牛逼!我的第一台电脑64MB内存,硬盘10G。
-
@Tony-Wang 哈哈,都是老玩家啊。这个社区平均年龄块能领退休工资了。话说回来,愿意折腾的,还是那些人。
-
T terry 从 AI进阶话题 移动了该主题
-
T terry 从 LLM讨论区 移动了该主题

