AI命理知识库工作流
很多 AI 命理项目会提到知识图谱、RAG、知识库、古籍数字化,但真正落地时,经常只停留在概念展示。真正可用的 AI 命理系统,不是把几本书丢进向量库就结束,而是需要一条完整的知识库工作流。
这条工作流回答的是:传统命理知识怎样从散乱文本,变成可查询、可约束、可复核的系统输出。
一、为什么 AI 命理离不开知识库工作流
因为命理知识有三个特点:
- 术语密集,概念间关系复杂
- 同一词在不同体系或语境中含义可能变化
- 仅靠大模型参数记忆,容易出现混淆和编造
所以只靠模型“背书”不够,需要把知识整理成可检索、可约束的外部结构。
二、一条完整工作流通常包含什么
可以拆成六步:
- 资料收集
- 文本清洗
- 结构化抽取
- 建索引和知识库
- 检索增强问答
- 人工复核与持续迭代
三、第一步:资料收集与分层
资料来源通常包括:
- 古籍原文
- 现代整理版教材
- 站内结构化知识页
- 经过标注的案例数据
这一步最关键的不是资料越多越好,而是来源要分层。原典、解释、案例、规则,最好不要混成一锅。
四、第二步:文本清洗与切分
很多命理文本不是现代标准表达,直接投入模型会带来大量噪声。因此通常要做:
- 去除无关标记和错误换行
- 统一术语写法
- 按主题、条目、规则和案例切分
- 给每段加来源信息
没有这一步,后面的检索结果会很乱。
五、第三步:结构化抽取
这是把文本变成知识对象的关键步骤。常见抽取对象包括:
- 概念实体,如天干、地支、星曜、宫位、十神
- 关系规则,如生克、冲合、刑害、四化、宫位组合
- 场景标签,如婚姻、财富、健康、事业、应期
- 风险边界,如高风险问题、非结论型建议、需要人工复核的部分
这一步通常会连接到 命理知识图谱:本体建模、关系抽取与知识推理。
六、第四步:索引与知识库构建
知识库不一定只有一种形式,常见会混合使用:
- 向量索引,用于相似文本检索
- 结构化数据库,用于规则和字段化查询
- 图数据库,用于关系推理和实体关联
真正稳定的系统,通常不是只选一种,而是按任务混合设计。
七、第五步:检索增强问答
RAG 的重点不是“先搜再答”这么简单,而是要控制三件事:
- 检索到的内容是否相关
- 检索结果是否足够覆盖问题
- 最终生成时是否引用了正确上下文
如果这三件事做不好,就会出现“看似有来源,实际还是在胡编”的问题。
八、第六步:人工复核与反馈闭环
AI 命理知识库最难也最重要的一步,是把人保留在系统里。
建议至少保留三层人工介入:
- 术语和规则的初始标注
- 高风险输出的人工复核
- 用户反馈后的修订与回灌
这一步直接关系到 AI命理效果评估:准确性、数据集与验证框架 是否能真正落地。
九、最常见的落地误区
1. 只有向量库,没有知识约束
这样更像文档搜索,不像真正可控的命理知识系统。
2. 只有规则库,没有检索层
这样能做规则匹配,但难以处理复杂问答和文本解释。
3. 没有人工复核闭环
没有反馈回路,系统很难持续稳定。
十、推荐联读
- 命理知识图谱:本体建模、关系抽取与知识推理
- NLP 文本分析
- AI命理效果评估:准确性、数据集与验证框架
- AI命理协作流程:人工判断与模型辅助如何分工