tianjiyao-wiki

AI知识源元数据模板

AI 命理知识库最容易出问题的，不是文档没有进库，而是文档进库时没有足够元数据。没有元数据，系统就很难知道这篇文档属于规则层还是案例层、适合回答什么问题、在高风险场景里该不该优先召回。

这页提供一套可复用的知识源元数据模板，目标是让“文档入库”从简单收录变成受控治理。

一、元数据模板为什么重要

因为元数据决定三件事：

这篇文档属于哪一层
这篇文档更适合被什么问题召回
这篇文档在什么场景下应被降权或升权

二、建议至少保留的核心字段

建议至少保留以下字段：

文档标题
来源类型
分层级别
体系归属
场景标签
风险标签
适用任务
是否适合高风险场景

三、模板字段示例

基础识别字段

title: 文档标题
source_id: 唯一标识
source_path: 文档路径或来源位置

分层字段

layer: 原典层 / 解释层 / 规则层 / 案例层 / 边界层
source_type: 古籍 / 现代整理 / 规则文档 / 案例文档 / 风险文档

任务字段

system_family: 八字 / 紫微 / 六爻 / 跨体系 / AI工程
task_type: 规则计算 / 术语解释 / 结构分析 / 问答支持 / 高风险边界
topic_tags: 婚姻 / 财富 / 健康 / 事业 / 应期 / 伦理 / 评估

风险字段

risk_level: 低 / 中 / 高
needs_human_review: true / false
high_risk_allowed: true / false

四、一个简化模板示例

title: AI命理效果评估：准确性、数据集与验证框架
source_id: ai-evaluation-001
source_path: docs/ai/ai-mingli-evaluation.md
layer: 边界层
source_type: 风险文档
system_family: AI工程
task_type: 高风险边界
topic_tags: [评估, 风险控制, 高风险场景]
risk_level: 中
needs_human_review: true
high_risk_allowed: false

五、元数据最常见的缺口

只记录标题和路径，不记录层级
不区分规则文档和案例文档
没有风险字段，导致高风险问题也会误召普通文档

六、怎么把模板真正用起来

文档入库前先补齐字段
检索排序时优先读取层级和风险字段
高风险问题单独检查 high_risk_allowed 和 needs_human_review
新增文档时先做元数据审核，再进入主索引

七、推荐联读

This site is open source. Improve this page.