tianjiyao-wiki

AI知识库召回失误案例

很多人一说到 AI 命理知识库，就默认只要做了 RAG、能检索古籍和站内文档，答案就会更可靠。但真实情况没这么简单。检索到内容，不等于检索对了内容；检索对了部分内容，也不等于模型最后真的按它来回答。

这页专门用反面案例训练知识库和 RAG 流程里最常见的召回失误。

用户问“事业转轨”，系统检索到了多段带有“事业”“官禄”“跳槽”的内容。

这些片段可能来自不同体系、不同问题层级，关键词看似相关，但并不真正回答当前问题。

检索相关性不是关键词重合，而是问题场景、任务层级和知识用途是否匹配。

模型检索到了十神、宫位、六亲的核心解释。

没有同时检索到“误判边界”或“风险提示”时，模型会把局部正确知识拼成过满结论。

知识库设计不能只存“正向规则”，还要存边界和反例。

系统返回了多段上下文，看起来信息充足。

生成阶段如果没有足够约束，模型可能抓住次要片段展开，反而忽略最关键的主规则。

RAG 失败不只发生在检索层，也发生在“检索后怎么用上下文”的阶段。

系统同时召回古籍原文、现代解释、站内专题页和案例页。

如果没有区分知识层级，模型容易把规则、解释、案例和建议混在一起，最后输出看似丰富、实际逻辑混乱的回答。

知识库不仅要能检索，还要有层级和来源标记。

系统已经补了新文档，但回答质量没有明显提升。

如果索引、提示词、排序逻辑和评估集没有一起更新，新内容常常进库但没真正进系统能力。

知识库不是静态仓库，而是一条持续维护的工作流。

This site is open source. Improve this page.