RAG与知识库入门
来源:AI知识库第二批专题整理。
一句话理解
RAG 是“检索增强生成”:先从可信资料库里找相关内容,再让大模型基于这些内容回答,从而减少幻觉。
为什么知识库需要 RAG
- 大模型自己的知识可能过期。
- 大模型可能编造事实。
- 网站资料、社群资料、项目文档需要可追溯来源。
- 回答需要贴近本网站的分类、术语和边界。
一个简单流程
- 用户提出问题。
- 系统把问题转成关键词或向量。
- 从文档、知识卡、网页中检索相关片段。
- 把片段和问题一起交给模型整理。
- 输出回答,并显示来源。
- 弱命中或缺口进入审核队列。
适合场景
- 网站知识库问答。
- 客服手册问答。
- 企业内部制度检索。
- 课程资料问答。
- 社群共建资料沉淀。
风险边界
RAG 不是万能保险。检索到错误资料时,模型也可能基于错误资料回答。因此必须保留来源、审核和人工纠偏机制。