来源:PRD-个人AI知识库系统.html

个人 AI 知识库系统 PRD

1. 产品定位

本产品是基于 Memos 的个人私有 AI 知识库 Sidecar 系统。Memos 负责知识采集、原始资料保存和日常阅读;旁路 AI 服务负责内容整理、标签审核、附件解析、自动文档生成、问答检索、备份恢复等智能能力。

v1 优先服务个人使用场景,部署目标为 NAS 与 Linux 服务器。系统设计需要预留多人、多工作区、更多存储目标和独立管理页面的扩展空间。

2. 产品目标

  1. 保留 Memos 的轻量、隐私、低成本优势,不魔改 Memos 主体。
  2. 将零散 memo、附件和结构化文件整理成可复用的知识资产。
  3. 通过受控标签树避免标签无限膨胀,AI 可建议新标签,但必须经过审核。
  4. 支持按标签、层级和全局范围自动生成知识文档。
  5. 支持轻量问答检索,第一版采用最简单入口。
  6. 支持本地整体备份恢复,确保 NAS/Linux 私有部署可长期维护。

3. 用户与场景

3.1 目标用户

3.2 核心场景

  1. 用户在 Memos 中写下一段原始想法、会议记录、学习笔记或任务线索。
  2. 用户上传 Markdown、Word、Excel、PDF、drawio、Mind Elixir JSON 等附件。
  3. AI 自动生成整理版 memo,并关联原始 memo。
  4. AI 根据已有标签树匹配标签;无法匹配时提交候选标签等待审核。
  5. 标签审核通过后,触发相关标签文档自动生成或更新。
  6. 用户通过简单入口提出问题,系统基于已整理知识回答并附来源。
  7. 系统定期将 Memos 数据、附件、Sidecar 数据、配置和索引打包备份。

4. 已确认产品决策

决策项 结论
初始使用范围 个人使用,后续考虑多人
部署目标 NAS、Linux
AI 整理结果 新建 memo,并与原始 memo 建立关联
原始内容处理 保留原始 memo,不覆盖原文
内容区分方式 使用系统标签区分原始、AI 整理、AI 文档、待审核等类型
标签策略 AI 可自动提出新标签,但进入待审核
标签审核入口 第一版使用配置文件或简单管理接口,后续可做 Web 页面
模型供应商 支持 OpenRouter、Qwen、DeepSeek、自定义 OpenAI-compatible endpoint
问答入口 暂时搁置复杂页面,第一版采用最简单实现
附件解析 纯文本、Markdown、Word、Excel、PDF、drawio、Mind Elixir JSON
OCR 暂不实现
其他附件 只保存,不解析
自动文档触发 标签确认后、定期、手动全局、手动指定标签、手动指定层级以下
文档版本 保留最近 N 个版本,默认 N=5
备份目标 本地目录

5. 标签体系

5.1 系统标签

系统标签用于标识处理状态和内容类型,建议统一放在 #系统/ 命名空间下。

标签 含义
#系统/原始记录 用户原始输入或原始附件说明
#系统/AI整理 AI 生成的结构化整理 memo
#系统/AI文档 AI 生成的聚合文档
#系统/待澄清 需要用户补充上下文
#系统/标签待审核 包含 AI 候选新标签,等待审核
#系统/问答 简单问答入口
#系统/处理失败 自动处理失败,需要排查

5.2 业务标签

业务标签采用多级路径,例如:

#项目/个人AI知识库/需求
#项目/个人AI知识库/架构
#技术/Python/FastAPI
#技术/知识库/RAG

业务标签由受控标签树管理。AI 只能直接使用已审核标签;当需要新增标签时,必须创建候选记录,等待人工审核。

5.3 标签审核规则

  1. AI 输出标签前必须读取当前标签树、别名和禁用词。
  2. 命中别名时自动映射到正式标签。
  3. 命中禁用词或近似重复标签时不允许创建。
  4. 新标签候选需要包含名称、父标签、创建理由、相似现有标签、置信度。
  5. 审核通过后才进入正式标签树。
  6. 审核拒绝后需要记录原因,可选择映射到已有标签。

6. 功能需求

6.1 Memos Webhook 接入

6.2 AI 整理 memo

6.3 人机澄清

6.4 待审核标签

6.5 附件解析

第一版解析以下格式:

格式 处理策略
.txt 读取文本
.md 保留 Markdown 结构
.docx 转 Markdown
.xlsx 表格转 Markdown
.pdf 文本层提取,暂不 OCR
.drawio / .drawio.svg 提取 XML/文本节点,保留源文件链接
Mind Elixir .json 解析节点树,转 Markdown 大纲

其他格式只保存附件信息,不进入解析和向量化。

6.6 自动文档生成

系统支持以下触发模式:

  1. 标签审核通过后自动生成。
  2. 定时生成,例如每日、每周。
  3. 手动生成全局文档。
  4. 手动生成某一个标签文档。
  5. 手动生成某一级标签以下全部文档。

生成文档以新 memo 形式写入 Memos,并标记 #系统/AI文档。同一文档保留最近 N 个版本,默认 N=5。

6.7 简单问答

第一版不做独立问答页面。建议支持以下最小闭环:

  1. 用户创建包含 #系统/问答 的 memo。
  2. Sidecar 识别问题。
  3. 系统基于向量索引和标签上下文检索资料。
  4. AI 生成回答。
  5. 系统新建回答 memo 或在原 memo 评论中回复。

默认建议新建回答 memo,并关联问题 memo,保持与 AI 整理结果一致。

6.8 备份恢复

第一版支持本地目录备份。备份内容包括:

恢复流程需要支持校验备份包完整性,并提供恢复前检查。

7. 非功能需求

7.1 隐私与安全

7.2 可维护性

7.3 可扩展性

7.4 性能要求

8. 验收标准摘要

  1. 能部署 Memos 与 Sidecar,并完成 webhook 联调。
  2. 创建原始 memo 后,系统能新建 AI 整理 memo 并关联来源。
  3. AI 使用已有标签时不产生待审核标签。
  4. AI 提出新标签时进入待审核流程。
  5. 审核通过后,新标签进入正式标签树。
  6. 支持指定格式附件解析。
  7. 支持至少一种自动文档触发方式和一种手动触发方式。
  8. 支持简单问答闭环。
  9. 支持本地备份与恢复演练。
  10. 所有核心功能通过真实 Memos 实例测试。