你可能已经遇到过这种尴尬

你让 AI 回答一个很具体的问题:

CAP 患者经验性抗感染方案怎么选?

AI 回答得挺像那么回事,还提到了常见指南推荐。

但问题是,你们科室今年刚更新过自己的分级用药规范:

  • 三级抗菌药物必须满足什么条件才能上
  • 哪些患者要先报备再用
  • 哪些本院常见菌的经验性覆盖策略和教科书不一样

这些内容,通用 AI 不知道。

你再换个问法,它还是不知道。你让它"请基于我们科室规范回答",它也不知道,因为你根本没把规范给它。

这就是 L3 这一节要解决的问题:不是让 AI 去外面查,而是让 AI 先翻你自己的资料。


为什么 MCP 还不够?

上一节我们学了 MCP。它解决的是一个很重要的问题:让 AI 能查外部的权威数据库。

但医疗工作里,还有很多知识并不在公开数据库里:

  • 你们科室自己的操作规范
  • 医院内部的会诊流程
  • 本地化的抗菌药物管理制度
  • 某个课题组自己积累的研究资料
  • 你给规培生上课时常用的一套内部讲义

这些内容不是 PubMed,也不是公开指南。MCP 再强,也查不到。

所以到了这里,你会发现:

你要解决的问题 靠什么更合适
最新指南、最新论文、公开数据库信息 MCP
科室内部规范、自己整理的资料、私有文档 知识库(RAG)

一句话记往外查用 MCP,翻自己的资料用知识库(技术实现上常叫 RAG,见下文)。两者互补,不是二选一。

MCP 与知识库分工
外面查权威公开信息用 MCP;科室规范、内部资料用知识库——互补而非二选一

什么是知识库?

知识库(RAG)像开卷考试
回答前先从你提供的资料里检索相关片段,再组织语言——重点在「先翻自己的资料」

先用最直白的话说

在 AI 场景里,知识库的意思不是一个多高深的数据库系统。它更像是:

你先把一批指定资料交给 AI,AI 回答问题之前,先从这批资料里找相关内容,再基于找到的内容回答。

重点不在"存进去",重点在"回答前先翻资料"。

和你平时工作的类比

想象一下你带规培生查房。

规培生问:"主任,我们科室对中性粒细胞减少合并发热的经验性抗感染怎么处理?"

你不会只凭记忆随口讲。你很可能会说:

  1. 去把科室今年更新的《发热性中性粒细胞减少管理规范》拿来
  2. 翻到抗感染那一节
  3. 看看高危、低危患者的分层
  4. 再结合病人的具体情况给出建议

知识库对 AI 做的事情,就是这个流程。

所以它和普通上传文件有什么区别?

知识库工作流(示意)
上传 → 解析切块 → 索引 → 提问时检索 → 结合片段生成回答(不同产品细节不同,但逻辑类似)

很多 AI 工具也支持你"上传一个 PDF 然后提问"。这当然有用,但那更像是临时带一本书来问问题

知识库的意义在于:

  • 资料是提前准备好的
  • 可以长期反复用
  • 可以让多个同事共用
  • 可以接到智能体里,变成一个固定能力

上传一个 PDF 是一次性使用,知识库是把这件事做成长期能力。

下面要说的 RAG,就是对「先检索、再回答」这套做法的技术称呼——和上一段讲的是同一件事,只是换了一个你在外文资料里常见的名字。


RAG 是什么?为什么大家老提这个词?

一句话解释

RAG = Retrieval-Augmented Generation,中文常翻译成"检索增强生成"。

不用背英文。你就记一句:

RAG 的意思就是:先检索,再回答。

它到底在干什么

RAG 背后其实只有两步:

  1. 检索(Retrieval):先从你给它的资料里找到最相关的几段
  2. 生成(Generation):再基于这些段落组织成一段自然语言回答

如果只看本质,它和你自己干活很像:

你自己回答问题时 RAG 回答问题时
先翻资料 先检索资料
找到相关段落 找到相关片段
用自己的话总结 用模型生成回答

所以不要把 RAG 想得太神秘。它不是"让 AI 突然记住了你的所有文档",而是让 AI 每次回答前都先查一下你给它的资料。

为什么它不是"真的记住了"

这是零基础学员最容易误解的地方。

很多人会说:"我把 20 份指南丢进去,AI 就学会了。"

不准确。

更准确的说法是:

  • 这些资料没有重新训练模型
  • 模型本身并没有被"改造"
  • 只是你提问时,系统会先从资料里找相关内容,临时喂给模型

这就像考试时老师允许你带一本书进考场。不是你把整本书背会了,而是你考试时可以翻书

这也是为什么大多数课程会把 RAG 叫做"开卷考试"。


再往前一步:AI 是怎么"找到那几段"的?

这一段是整节课里最偏理论的地方,但你不需要怕。我们只讲到够用为止。

不是按关键词死搜

如果你电脑里有 10 份文档,你用 Word 的搜索功能搜"肾功能不全",它只能找到字面上出现"肾功能不全"的地方。

但 AI 知识库更厉害一点。它经常能理解:

  • "慢性肾病 3b 期"
  • "eGFR 38"
  • "肾功能下降"

这些说法虽然不完全一样,但语义上可能是相关的。

向量化:把文字变成"语义坐标"

你不需要懂数学,只需要理解这个类比:

系统会把每一段文字都变成一个"语义坐标点"。语义接近的内容,会被放在比较近的位置;语义差很远的内容,会离得比较远。

比如:

  • "糖尿病饮食管理"
  • "血糖控制目标"
  • "胰岛素起始方案"

这些内容在语义空间里会比较近。

而:

  • "糖尿病饮食管理"
  • "医院设备采购流程"

就会离得很远。

所以当你问一个问题时,系统不是只看有没有一模一样的关键词,而是会找语义上最接近的那几段内容

这就是为什么你明明问的是"肾功能下降时二甲双胍怎么处理",它也能找到文档里写着"eGFR 下降时 metformin 减量/停用建议"的段落。

你要记住的只有一句话

知识库不是在背全文,而是在帮 AI 更聪明地翻资料。


搭一个知识库,到底要准备什么?

什么时候更需要知识库
院内制度、科室规范、非公开流程、长期复用的内部讲义——这些往往最适合放进知识库

零基础用户最容易犯的错误,是觉得知识库就是"把一堆 PDF 扔进去"。这当然能跑,但效果常常很差。

知识库效果好不好,70% 取决于你喂进去的资料质量

第一步:先想清楚这个知识库是给谁用的

不要一上来就建一个"全科室万能知识库"。那通常会变成一个大杂烩,什么都有,什么都答不准。

更好的做法是先回答三个问题:

  1. 谁来用? - 自己用 - 科室同事用 - 规培生用 - 患者教育用

  2. 主要解决什么问题? - 值班查药 - 科室流程问答 - 教学答疑 - 科研资料检索

  3. 希望它回答到什么边界? - 只回答科室内部规范 - 只回答某个病种相关问题 - 不回答诊断决策,只回答流程和资料类问题

这一步很像你做课题设计时先定研究问题。范围不清,后面一定乱。

第二步:选 3-5 份最核心的资料,不要贪多

新手第一版知识库,不建议超过 5 份文档。原因很简单:资料越多,噪音越多;你越难排查到底哪里出了问题。

优先选这几类:

资料类型 适合放进知识库吗 原因
科室最新版操作规范 非常适合 权威、固定、问得多
常见问题 FAQ 非常适合 问法多,但答案相对固定
讲义/培训资料 适合 便于教学和答疑
历年会议纪要 一般 信息杂,容易冲突
旧版指南 不建议 容易和新版冲突
扫描质量很差的图片 PDF 不建议 提取质量差,容易误检索

第一版最好的组合通常是:

  • 1 份最新版核心规范
  • 1 份常见问题整理
  • 1 份关键流程文档

先把这三份跑通,比你一开始塞 30 份资料强得多。


文档准备:最容易被忽略,但最影响效果

不是所有 PDF 都一样

对人来说,PDF 都是"能打开就行"。但对知识库来说,PDF 的质量差别非常大。

效果从好到差大致是这样:

文档形态 对知识库友好程度 为什么
纯文本 Markdown / Word 导出的规范 PDF 很好 文字结构清晰,容易切分
排版规整的电子 PDF 还可以 大多数时候可用
含大量表格的 PDF 一般 表格结构容易乱
扫描版 PDF / 照片 PDF 较差 本质上是图片,OCR 后容易错字
手写扫描件 很差 识别误差高,不适合做知识库底稿

一个原则:能用文本,就别用图片

如果你手头既有 Word 版规范,又有打印扫描版 PDF,优先用 Word 导出的文本版。

因为知识库不是给人看版式的,它要的是可被机器稳定读取的文字内容

分段要清楚

知识库系统通常会把文档切成很多小段,再去检索。对机器来说,这些小段越清晰越好。

所以在准备文档时,尽量满足这些特征:

  • 标题层级明确
  • 每一小节只讲一个主题
  • 表格尽量有清晰表头
  • 不要把多个完全不同的主题混在一个长段里

比如这两种写法:

不太好:

发热处理、抗菌药物使用、出院评估、病人宣教、随访安排全部写在一大段里,没有小标题。

更好:

发热处理流程

抗菌药物升级标准

出院前评估清单

出院宣教要点

对人更清楚,对知识库也更友好。


动手搭一个最小可用知识库

这一节不追求搭一个很大的系统,我们只追求:做出第一个能稳定回答问题的小知识库。

场景示例:做一个科室值班知识库

假设你想做一个给科室值班医生用的小知识库,回答以下类型的问题:

  • 发热性中性粒细胞减少怎么分层
  • 肾功能不全时某些药怎么调整
  • 住院总夜班常见会诊流程怎么走

第 1 步:准备资料

选 3 份文档:

  1. 《发热性中性粒细胞减少管理规范(2025 版)》
  2. 《常用抗菌药物肾功能调整表》
  3. 《夜班常见会诊与上报流程》

注意三个要求:

  • 只用最新版
  • 去掉重复和冲突版本
  • 尽量使用电子文本版

第 2 步:选一个平台

零基础新手用下面两个就够了:

平台 适合谁 特点
扣子(Coze) 想快点跑通 中文界面,搭建门槛低
Dify 想更系统一点 知识库和工作流能力更完整

你不需要纠结哪个最好。先用一个把流程跑通,比研究平台差异重要得多。

第 3 步:上传资料

把这 3 份文档上传到知识库模块里。大多数平台会自动完成:

  • 文本提取
  • 分段切块
  • 建立检索索引

这里你不需要懂背后的技术参数,先让系统跑起来。

第 4 步:写清楚使用边界

很多人一建好知识库就直接开始问问题,但更好的做法是先加一句系统说明,比如:

你是科室值班辅助助手。回答问题时,优先基于知识库中的科室规范和流程文件。若知识库中没有明确依据,请直接说明「知识库中未找到明确依据」,不要自行编造。

这一步很关键,因为它决定了 AI 是不是会老老实实按你的资料回答。

第 5 步:用标准问题测试

不要随便问一个问题试试就算了。你需要设计 3 类测试题:

测试类型 示例问题 你在看什么
命中题 发热性中性粒细胞减少高危患者经验性抗感染怎么选? 能不能准确找到对应段落
边界题 你们科室对 CAR-T 不良反应处理流程是什么? 知识库里没有的内容,它会不会乱编
对比题 肾功能不全时左氧氟沙星和头孢哌酮舒巴坦怎么调整? 能不能综合两段资料回答

一个知识库好不好,不是看它答对了一个简单问题,而是看:

  • 有的内容能不能答准
  • 没有的内容会不会乱答
  • 多份资料能不能整合得清楚

测试时,你到底要看什么?

很多人测试知识库,只看一句:"嗯,回答看着还可以。"

这不够。

你至少要看四件事:

1. 它引用的是不是对的那份资料

如果你明明问的是 2025 版规范,它却引用了 2023 年的旧文件,那就说明资料管理有问题,或者旧版没删干净。

2. 它抓到的段落是不是关键段落

有时候资料是对的,但它抓到的是边角信息,没有抓到真正决定答案的那一段。这会导致回答"方向没错,但不够准"。

3. 它会不会把不同文档混着说

如果两份文档的口径不一致,AI 可能会把它们拼在一起,形成一个谁也没写过的"混合答案"。这在医疗场景里很危险。

4. 资料里没有时,它会不会诚实说不知道

这是最重要的底线之一。

好的知识库不是"什么都答",而是:

  • 有依据时答得清楚
  • 没依据时老老实实说没有

常见翻车点

1. 把旧版和新版同时扔进去

结果:AI 一会儿引用 2023 版,一会儿引用 2025 版,答案前后不一致。

解决办法:只保留最新版。 旧版要么删掉,要么单独归档,不要混在同一个知识库里。

2. 文档太杂,主题不清

结果:一个知识库里既有抗菌药物规范,又有教学安排,又有行政通知,AI 检索时噪音极大。

解决办法:按用途拆知识库。

比如:

  • 值班知识库
  • 教学知识库
  • 科研知识库

比一个大杂烩知识库强得多。

3. 扫描 PDF 质量太差

结果:本来文档里写的是"eGFR < 30 停用",OCR 识别成了别的数字,后果可想而知。

解决办法:关键规范尽量用电子文本原件,不要偷懒。

4. 以为上传完就结束了

结果:知识库上线第一天还挺准,三个月后指南更新了,内容已经悄悄过时。

解决办法:知识库不是一次性工程,是要维护的。


知识库怎么维护?

维护的本质不是"经常加资料"

很多人一上来就疯狂往里塞东西。实际上,知识库维护更重要的是三件事:

  1. 更新旧资料
  2. 删除冲突资料
  3. 定期抽查回答

最简单的维护节奏

如果你是个人或小团队使用,一个非常实用的节奏是:

时间 要做什么
每月一次 抽查 3-5 个标准问题,看回答是否稳定
每次规范更新时 替换旧文档,重新索引
每次发现回答异常时 回头查是哪份资料出了问题

指定责任人

哪怕只是科室内部用,也最好有人负责:

  • 谁能上传新资料
  • 谁能删除旧资料
  • 谁来确认更新后的回答是否正常

如果没人管,知识库很快就会变成一个"资料越积越多、答案越来越乱"的垃圾场。


MCP 和知识库,什么时候用哪个?

这一节最重要的一张表,就是这张:

场景 更适合用 MCP 更适合用知识库
查最新 ADA / ESC / KDIGO 指南
查 PubMed 最新论文
查你们科室夜班上报流程
查内部培训讲义里的固定内容
回答一个既要参考最新指南、又要结合科室规范的问题 ✅ 配合使用 ✅ 配合使用

如果要用一句最容易记住的话来概括:

  • MCP = 往外查
  • 知识库 = 往里翻

而一个真正好用的智能体,往往两者都要有。


动手试一试

  1. 先别贪大,选 3 份最核心的资料
  2. 用扣子或 Dify 建一个最小可用知识库
  3. 设计 3 类测试题:命中题、边界题、对比题
  4. 重点观察两件事: - 该答的时候答得准不准 - 不该答的时候会不会乱编

如果你只做完这四步,这节课就已经学到位了。


本节小结

概念 一句话
知识库 把指定资料交给 AI,让它回答前先翻这些资料
RAG 先检索,再生成,本质上就是"开卷回答"
它不是训练模型 不是让 AI 真记住所有文档,而是每次回答时临时翻资料
效果关键 不在平台多高级,而在你喂进去的资料是不是干净、权威、最新
测试重点 有依据时答得准,没依据时别乱答

本节带走

  • 一个包含 3-5 份核心文档的最小可用知识库
  • 一套知识库测试方法:命中题、边界题、对比题
  • 一个核心认知:知识库不是把资料堆进去,而是把你们的工作规范变成 AI 能调用的"内部参考书"。

下一节,我们就把前面三节学到的东西拼起来:自定义指令和 Skill 负责"怎么说",MCP 负责"去外面查",知识库负责"翻内部资料",然后一起封装成一个真正能给同事用的智能体。