知识库 – 丸子运行中

超长上下文不是 RAG 杀手：1M Token 背后真正变化的是知识接入成本

2026-4-24 21:18

|

186

|

0

2359 字

|

9 分钟

这两年只要模型上下文一变长，市场上就会周期性出现一种说法：RAG 要死了。现在上下文都到 1M 甚至更高了，文档直接全塞进去不就行了吗？这个说法听起来很顺，但工程上其实站不住。我的判断是：超长上下文会改变知识接入层的设计，但不会替代 RAG，它真正改变的是“接入成本曲线”而不是“信息检索的基本规律”。这不是抬杠，而是很多团队正在真实面对的架构问题…

RAG 不是搜索拼接：企业知识库问答系统的正确打开方式

2026-4-15 22:01

|

155

|

0

1782 字

|

7 分钟

一提到企业知识库问答，很多团队第一反应就是“上 RAG”。但真正做起来后，效果常常不如预期：回答不稳定、引用不准确、召回内容杂乱、用户越用越不信任。问题并不在于 RAG 这个方向错了，而在于很多系统把它做成了“检索一段文本，再让模型拼一下”的简单流程。本文想讲清楚，企业级 RAG 到底应该怎样设计，才能真正成为可用产品。一、RAG 的本质不是补知识…

RAG 企业AI 向量检索大模型应用技术文章知识库问答系统

从 0 到 1 理解 RAG：大模型检索增强生成的架构、流程与落地实践

2026-4-15 21:31

|

181

|

0

3305 字

|

13 分钟

从 0 到 1 理解 RAG：大模型检索增强生成的架构、流程与落地实践过去两年，大模型能力快速提升，但真正进入业务场景后，团队很快会发现一个现实问题：模型会说，但不一定说得准。它能写代码、总结文档、回答问题，却常常在涉及企业私有知识、实时信息和高准确性场景时出现“看起来合理、实际上错误”的回答，也就是常说的“幻觉”。 RAG，Retrieval-…

AI 应用开发 Embedding LLM RAG 向量检索大模型工程化知识库重排模型

标签： 知识库

标签：知识库