tianjiyao-wiki

AI命理知识库工作流

很多 AI 命理项目会提到知识图谱、RAG、知识库、古籍数字化,但真正落地时,经常只停留在概念展示。真正可用的 AI 命理系统,不是把几本书丢进向量库就结束,而是需要一条完整的知识库工作流。

这条工作流回答的是:传统命理知识怎样从散乱文本,变成可查询、可约束、可复核的系统输出。

一、为什么 AI 命理离不开知识库工作流

因为命理知识有三个特点:

  1. 术语密集,概念间关系复杂
  2. 同一词在不同体系或语境中含义可能变化
  3. 仅靠大模型参数记忆,容易出现混淆和编造

所以只靠模型“背书”不够,需要把知识整理成可检索、可约束的外部结构。

二、一条完整工作流通常包含什么

可以拆成六步:

  1. 资料收集
  2. 文本清洗
  3. 结构化抽取
  4. 建索引和知识库
  5. 检索增强问答
  6. 人工复核与持续迭代

三、第一步:资料收集与分层

资料来源通常包括:

  1. 古籍原文
  2. 现代整理版教材
  3. 站内结构化知识页
  4. 经过标注的案例数据

这一步最关键的不是资料越多越好,而是来源要分层。原典、解释、案例、规则,最好不要混成一锅。

四、第二步:文本清洗与切分

很多命理文本不是现代标准表达,直接投入模型会带来大量噪声。因此通常要做:

  1. 去除无关标记和错误换行
  2. 统一术语写法
  3. 按主题、条目、规则和案例切分
  4. 给每段加来源信息

没有这一步,后面的检索结果会很乱。

五、第三步:结构化抽取

这是把文本变成知识对象的关键步骤。常见抽取对象包括:

  1. 概念实体,如天干、地支、星曜、宫位、十神
  2. 关系规则,如生克、冲合、刑害、四化、宫位组合
  3. 场景标签,如婚姻、财富、健康、事业、应期
  4. 风险边界,如高风险问题、非结论型建议、需要人工复核的部分

这一步通常会连接到 命理知识图谱:本体建模、关系抽取与知识推理

六、第四步:索引与知识库构建

知识库不一定只有一种形式,常见会混合使用:

  1. 向量索引,用于相似文本检索
  2. 结构化数据库,用于规则和字段化查询
  3. 图数据库,用于关系推理和实体关联

真正稳定的系统,通常不是只选一种,而是按任务混合设计。

七、第五步:检索增强问答

RAG 的重点不是“先搜再答”这么简单,而是要控制三件事:

  1. 检索到的内容是否相关
  2. 检索结果是否足够覆盖问题
  3. 最终生成时是否引用了正确上下文

如果这三件事做不好,就会出现“看似有来源,实际还是在胡编”的问题。

八、第六步:人工复核与反馈闭环

AI 命理知识库最难也最重要的一步,是把人保留在系统里。

建议至少保留三层人工介入:

  1. 术语和规则的初始标注
  2. 高风险输出的人工复核
  3. 用户反馈后的修订与回灌

这一步直接关系到 AI命理效果评估:准确性、数据集与验证框架 是否能真正落地。

九、最常见的落地误区

1. 只有向量库,没有知识约束

这样更像文档搜索,不像真正可控的命理知识系统。

2. 只有规则库,没有检索层

这样能做规则匹配,但难以处理复杂问答和文本解释。

3. 没有人工复核闭环

没有反馈回路,系统很难持续稳定。

十、推荐联读

  1. 命理知识图谱:本体建模、关系抽取与知识推理
  2. NLP 文本分析
  3. AI命理效果评估:准确性、数据集与验证框架
  4. AI命理协作流程:人工判断与模型辅助如何分工