知识库:让 AI 用你的资料回答
你可能已经遇到过这种尴尬
你让 AI 回答一个很具体的问题:
CAP 患者经验性抗感染方案怎么选?
AI 回答得挺像那么回事,还提到了常见指南推荐。
但问题是,你们科室今年刚更新过自己的分级用药规范:
- 三级抗菌药物必须满足什么条件才能上
- 哪些患者要先报备再用
- 哪些本院常见菌的经验性覆盖策略和教科书不一样
这些内容,通用 AI 不知道。
你再换个问法,它还是不知道。你让它"请基于我们科室规范回答",它也不知道,因为你根本没把规范给它。
这就是 L3 这一节要解决的问题:不是让 AI 去外面查,而是让 AI 先翻你自己的资料。
为什么 MCP 还不够?
上一节我们学了 MCP。它解决的是一个很重要的问题:让 AI 能查外部的权威数据库。
但医疗工作里,还有很多知识并不在公开数据库里:
- 你们科室自己的操作规范
- 医院内部的会诊流程
- 本地化的抗菌药物管理制度
- 某个课题组自己积累的研究资料
- 你给规培生上课时常用的一套内部讲义
这些内容不是 PubMed,也不是公开指南。MCP 再强,也查不到。
所以到了这里,你会发现:
| 你要解决的问题 | 靠什么更合适 |
|---|---|
| 最新指南、最新论文、公开数据库信息 | MCP |
| 科室内部规范、自己整理的资料、私有文档 | 知识库(RAG) |
一句话记:往外查用 MCP,翻自己的资料用知识库(技术实现上常叫 RAG,见下文)。两者互补,不是二选一。

什么是知识库?

先用最直白的话说
在 AI 场景里,知识库的意思不是一个多高深的数据库系统。它更像是:
你先把一批指定资料交给 AI,AI 回答问题之前,先从这批资料里找相关内容,再基于找到的内容回答。
重点不在"存进去",重点在"回答前先翻资料"。
和你平时工作的类比
想象一下你带规培生查房。
规培生问:"主任,我们科室对中性粒细胞减少合并发热的经验性抗感染怎么处理?"
你不会只凭记忆随口讲。你很可能会说:
- 去把科室今年更新的《发热性中性粒细胞减少管理规范》拿来
- 翻到抗感染那一节
- 看看高危、低危患者的分层
- 再结合病人的具体情况给出建议
知识库对 AI 做的事情,就是这个流程。
所以它和普通上传文件有什么区别?

很多 AI 工具也支持你"上传一个 PDF 然后提问"。这当然有用,但那更像是临时带一本书来问问题。
知识库的意义在于:
- 资料是提前准备好的
- 可以长期反复用
- 可以让多个同事共用
- 可以接到智能体里,变成一个固定能力
上传一个 PDF 是一次性使用,知识库是把这件事做成长期能力。
下面要说的 RAG,就是对「先检索、再回答」这套做法的技术称呼——和上一段讲的是同一件事,只是换了一个你在外文资料里常见的名字。
RAG 是什么?为什么大家老提这个词?
一句话解释
RAG = Retrieval-Augmented Generation,中文常翻译成"检索增强生成"。
不用背英文。你就记一句:
RAG 的意思就是:先检索,再回答。
它到底在干什么
RAG 背后其实只有两步:
- 检索(Retrieval):先从你给它的资料里找到最相关的几段
- 生成(Generation):再基于这些段落组织成一段自然语言回答
如果只看本质,它和你自己干活很像:
| 你自己回答问题时 | RAG 回答问题时 |
|---|---|
| 先翻资料 | 先检索资料 |
| 找到相关段落 | 找到相关片段 |
| 用自己的话总结 | 用模型生成回答 |
所以不要把 RAG 想得太神秘。它不是"让 AI 突然记住了你的所有文档",而是让 AI 每次回答前都先查一下你给它的资料。
为什么它不是"真的记住了"
这是零基础学员最容易误解的地方。
很多人会说:"我把 20 份指南丢进去,AI 就学会了。"
不准确。
更准确的说法是:
- 这些资料没有重新训练模型
- 模型本身并没有被"改造"
- 只是你提问时,系统会先从资料里找相关内容,临时喂给模型
这就像考试时老师允许你带一本书进考场。不是你把整本书背会了,而是你考试时可以翻书。
这也是为什么大多数课程会把 RAG 叫做"开卷考试"。
再往前一步:AI 是怎么"找到那几段"的?
这一段是整节课里最偏理论的地方,但你不需要怕。我们只讲到够用为止。
不是按关键词死搜
如果你电脑里有 10 份文档,你用 Word 的搜索功能搜"肾功能不全",它只能找到字面上出现"肾功能不全"的地方。
但 AI 知识库更厉害一点。它经常能理解:
- "慢性肾病 3b 期"
- "eGFR 38"
- "肾功能下降"
这些说法虽然不完全一样,但语义上可能是相关的。
向量化:把文字变成"语义坐标"
你不需要懂数学,只需要理解这个类比:
系统会把每一段文字都变成一个"语义坐标点"。语义接近的内容,会被放在比较近的位置;语义差很远的内容,会离得比较远。
比如:
- "糖尿病饮食管理"
- "血糖控制目标"
- "胰岛素起始方案"
这些内容在语义空间里会比较近。
而:
- "糖尿病饮食管理"
- "医院设备采购流程"
就会离得很远。
所以当你问一个问题时,系统不是只看有没有一模一样的关键词,而是会找语义上最接近的那几段内容。
这就是为什么你明明问的是"肾功能下降时二甲双胍怎么处理",它也能找到文档里写着"eGFR 下降时 metformin 减量/停用建议"的段落。
你要记住的只有一句话
知识库不是在背全文,而是在帮 AI 更聪明地翻资料。
搭一个知识库,到底要准备什么?

零基础用户最容易犯的错误,是觉得知识库就是"把一堆 PDF 扔进去"。这当然能跑,但效果常常很差。
知识库效果好不好,70% 取决于你喂进去的资料质量。
第一步:先想清楚这个知识库是给谁用的
不要一上来就建一个"全科室万能知识库"。那通常会变成一个大杂烩,什么都有,什么都答不准。
更好的做法是先回答三个问题:
-
谁来用? - 自己用 - 科室同事用 - 规培生用 - 患者教育用
-
主要解决什么问题? - 值班查药 - 科室流程问答 - 教学答疑 - 科研资料检索
-
希望它回答到什么边界? - 只回答科室内部规范 - 只回答某个病种相关问题 - 不回答诊断决策,只回答流程和资料类问题
这一步很像你做课题设计时先定研究问题。范围不清,后面一定乱。
第二步:选 3-5 份最核心的资料,不要贪多
新手第一版知识库,不建议超过 5 份文档。原因很简单:资料越多,噪音越多;你越难排查到底哪里出了问题。
优先选这几类:
| 资料类型 | 适合放进知识库吗 | 原因 |
|---|---|---|
| 科室最新版操作规范 | 非常适合 | 权威、固定、问得多 |
| 常见问题 FAQ | 非常适合 | 问法多,但答案相对固定 |
| 讲义/培训资料 | 适合 | 便于教学和答疑 |
| 历年会议纪要 | 一般 | 信息杂,容易冲突 |
| 旧版指南 | 不建议 | 容易和新版冲突 |
| 扫描质量很差的图片 PDF | 不建议 | 提取质量差,容易误检索 |
第一版最好的组合通常是:
- 1 份最新版核心规范
- 1 份常见问题整理
- 1 份关键流程文档
先把这三份跑通,比你一开始塞 30 份资料强得多。
文档准备:最容易被忽略,但最影响效果
不是所有 PDF 都一样
对人来说,PDF 都是"能打开就行"。但对知识库来说,PDF 的质量差别非常大。
效果从好到差大致是这样:
| 文档形态 | 对知识库友好程度 | 为什么 |
|---|---|---|
| 纯文本 Markdown / Word 导出的规范 PDF | 很好 | 文字结构清晰,容易切分 |
| 排版规整的电子 PDF | 还可以 | 大多数时候可用 |
| 含大量表格的 PDF | 一般 | 表格结构容易乱 |
| 扫描版 PDF / 照片 PDF | 较差 | 本质上是图片,OCR 后容易错字 |
| 手写扫描件 | 很差 | 识别误差高,不适合做知识库底稿 |
一个原则:能用文本,就别用图片
如果你手头既有 Word 版规范,又有打印扫描版 PDF,优先用 Word 导出的文本版。
因为知识库不是给人看版式的,它要的是可被机器稳定读取的文字内容。
分段要清楚
知识库系统通常会把文档切成很多小段,再去检索。对机器来说,这些小段越清晰越好。
所以在准备文档时,尽量满足这些特征:
- 标题层级明确
- 每一小节只讲一个主题
- 表格尽量有清晰表头
- 不要把多个完全不同的主题混在一个长段里
比如这两种写法:
不太好:
发热处理、抗菌药物使用、出院评估、病人宣教、随访安排全部写在一大段里,没有小标题。
更好:
发热处理流程
抗菌药物升级标准
出院前评估清单
出院宣教要点
对人更清楚,对知识库也更友好。
动手搭一个最小可用知识库
这一节不追求搭一个很大的系统,我们只追求:做出第一个能稳定回答问题的小知识库。
场景示例:做一个科室值班知识库
假设你想做一个给科室值班医生用的小知识库,回答以下类型的问题:
- 发热性中性粒细胞减少怎么分层
- 肾功能不全时某些药怎么调整
- 住院总夜班常见会诊流程怎么走
第 1 步:准备资料
选 3 份文档:
- 《发热性中性粒细胞减少管理规范(2025 版)》
- 《常用抗菌药物肾功能调整表》
- 《夜班常见会诊与上报流程》
注意三个要求:
- 只用最新版
- 去掉重复和冲突版本
- 尽量使用电子文本版
第 2 步:选一个平台
零基础新手用下面两个就够了:
| 平台 | 适合谁 | 特点 |
|---|---|---|
| 扣子(Coze) | 想快点跑通 | 中文界面,搭建门槛低 |
| Dify | 想更系统一点 | 知识库和工作流能力更完整 |
你不需要纠结哪个最好。先用一个把流程跑通,比研究平台差异重要得多。
第 3 步:上传资料
把这 3 份文档上传到知识库模块里。大多数平台会自动完成:
- 文本提取
- 分段切块
- 建立检索索引
这里你不需要懂背后的技术参数,先让系统跑起来。
第 4 步:写清楚使用边界
很多人一建好知识库就直接开始问问题,但更好的做法是先加一句系统说明,比如:
你是科室值班辅助助手。回答问题时,优先基于知识库中的科室规范和流程文件。若知识库中没有明确依据,请直接说明「知识库中未找到明确依据」,不要自行编造。
这一步很关键,因为它决定了 AI 是不是会老老实实按你的资料回答。
第 5 步:用标准问题测试
不要随便问一个问题试试就算了。你需要设计 3 类测试题:
| 测试类型 | 示例问题 | 你在看什么 |
|---|---|---|
| 命中题 | 发热性中性粒细胞减少高危患者经验性抗感染怎么选? | 能不能准确找到对应段落 |
| 边界题 | 你们科室对 CAR-T 不良反应处理流程是什么? | 知识库里没有的内容,它会不会乱编 |
| 对比题 | 肾功能不全时左氧氟沙星和头孢哌酮舒巴坦怎么调整? | 能不能综合两段资料回答 |
一个知识库好不好,不是看它答对了一个简单问题,而是看:
- 有的内容能不能答准
- 没有的内容会不会乱答
- 多份资料能不能整合得清楚
测试时,你到底要看什么?
很多人测试知识库,只看一句:"嗯,回答看着还可以。"
这不够。
你至少要看四件事:
1. 它引用的是不是对的那份资料
如果你明明问的是 2025 版规范,它却引用了 2023 年的旧文件,那就说明资料管理有问题,或者旧版没删干净。
2. 它抓到的段落是不是关键段落
有时候资料是对的,但它抓到的是边角信息,没有抓到真正决定答案的那一段。这会导致回答"方向没错,但不够准"。
3. 它会不会把不同文档混着说
如果两份文档的口径不一致,AI 可能会把它们拼在一起,形成一个谁也没写过的"混合答案"。这在医疗场景里很危险。
4. 资料里没有时,它会不会诚实说不知道
这是最重要的底线之一。
好的知识库不是"什么都答",而是:
- 有依据时答得清楚
- 没依据时老老实实说没有
常见翻车点
1. 把旧版和新版同时扔进去
结果:AI 一会儿引用 2023 版,一会儿引用 2025 版,答案前后不一致。
解决办法:只保留最新版。 旧版要么删掉,要么单独归档,不要混在同一个知识库里。
2. 文档太杂,主题不清
结果:一个知识库里既有抗菌药物规范,又有教学安排,又有行政通知,AI 检索时噪音极大。
解决办法:按用途拆知识库。
比如:
- 值班知识库
- 教学知识库
- 科研知识库
比一个大杂烩知识库强得多。
3. 扫描 PDF 质量太差
结果:本来文档里写的是"eGFR < 30 停用",OCR 识别成了别的数字,后果可想而知。
解决办法:关键规范尽量用电子文本原件,不要偷懒。
4. 以为上传完就结束了
结果:知识库上线第一天还挺准,三个月后指南更新了,内容已经悄悄过时。
解决办法:知识库不是一次性工程,是要维护的。
知识库怎么维护?
维护的本质不是"经常加资料"
很多人一上来就疯狂往里塞东西。实际上,知识库维护更重要的是三件事:
- 更新旧资料
- 删除冲突资料
- 定期抽查回答
最简单的维护节奏
如果你是个人或小团队使用,一个非常实用的节奏是:
| 时间 | 要做什么 |
|---|---|
| 每月一次 | 抽查 3-5 个标准问题,看回答是否稳定 |
| 每次规范更新时 | 替换旧文档,重新索引 |
| 每次发现回答异常时 | 回头查是哪份资料出了问题 |
指定责任人
哪怕只是科室内部用,也最好有人负责:
- 谁能上传新资料
- 谁能删除旧资料
- 谁来确认更新后的回答是否正常
如果没人管,知识库很快就会变成一个"资料越积越多、答案越来越乱"的垃圾场。
MCP 和知识库,什么时候用哪个?
这一节最重要的一张表,就是这张:
| 场景 | 更适合用 MCP | 更适合用知识库 |
|---|---|---|
| 查最新 ADA / ESC / KDIGO 指南 | ✅ | ❌ |
| 查 PubMed 最新论文 | ✅ | ❌ |
| 查你们科室夜班上报流程 | ❌ | ✅ |
| 查内部培训讲义里的固定内容 | ❌ | ✅ |
| 回答一个既要参考最新指南、又要结合科室规范的问题 | ✅ 配合使用 | ✅ 配合使用 |
如果要用一句最容易记住的话来概括:
- MCP = 往外查
- 知识库 = 往里翻
而一个真正好用的智能体,往往两者都要有。
动手试一试
- 先别贪大,选 3 份最核心的资料
- 用扣子或 Dify 建一个最小可用知识库
- 设计 3 类测试题:命中题、边界题、对比题
- 重点观察两件事: - 该答的时候答得准不准 - 不该答的时候会不会乱编
如果你只做完这四步,这节课就已经学到位了。
本节小结
| 概念 | 一句话 |
|---|---|
| 知识库 | 把指定资料交给 AI,让它回答前先翻这些资料 |
| RAG | 先检索,再生成,本质上就是"开卷回答" |
| 它不是训练模型 | 不是让 AI 真记住所有文档,而是每次回答时临时翻资料 |
| 效果关键 | 不在平台多高级,而在你喂进去的资料是不是干净、权威、最新 |
| 测试重点 | 有依据时答得准,没依据时别乱答 |
本节带走:
- 一个包含 3-5 份核心文档的最小可用知识库
- 一套知识库测试方法:命中题、边界题、对比题
- 一个核心认知:知识库不是把资料堆进去,而是把你们的工作规范变成 AI 能调用的"内部参考书"。
下一节,我们就把前面三节学到的东西拼起来:自定义指令和 Skill 负责"怎么说",MCP 负责"去外面查",知识库负责"翻内部资料",然后一起封装成一个真正能给同事用的智能体。