很多人一说到 AI 命理知识库,就默认只要做了 RAG、能检索古籍和站内文档,答案就会更可靠。但真实情况没这么简单。检索到内容,不等于检索对了内容;检索对了部分内容,也不等于模型最后真的按它来回答。
这页专门用反面案例训练知识库和 RAG 流程里最常见的召回失误。
用户问“事业转轨”,系统检索到了多段带有“事业”“官禄”“跳槽”的内容。
这些片段可能来自不同体系、不同问题层级,关键词看似相关,但并不真正回答当前问题。
检索相关性不是关键词重合,而是问题场景、任务层级和知识用途是否匹配。
模型检索到了十神、宫位、六亲的核心解释。
没有同时检索到“误判边界”或“风险提示”时,模型会把局部正确知识拼成过满结论。
知识库设计不能只存“正向规则”,还要存边界和反例。
系统返回了多段上下文,看起来信息充足。
生成阶段如果没有足够约束,模型可能抓住次要片段展开,反而忽略最关键的主规则。
RAG 失败不只发生在检索层,也发生在“检索后怎么用上下文”的阶段。
系统同时召回古籍原文、现代解释、站内专题页和案例页。
如果没有区分知识层级,模型容易把规则、解释、案例和建议混在一起,最后输出看似丰富、实际逻辑混乱的回答。
知识库不仅要能检索,还要有层级和来源标记。
系统已经补了新文档,但回答质量没有明显提升。
如果索引、提示词、排序逻辑和评估集没有一起更新,新内容常常进库但没真正进系统能力。
知识库不是静态仓库,而是一条持续维护的工作流。