RAG实践

RAG实践教程

AI知识库第三批专题页面。

RAG实践教程

来源:AI知识库第三批专题整理。

第一步:准备资料

把资料整理成可检索的文件,例如 Markdown、HTML、PDF 转文本、数据库记录。每条资料最好保留标题、来源、时间和分类。

第二步:切分内容

将长文切分成较小片段。片段太短会缺上下文,太长会降低检索精度。常见做法是按标题、段落或固定字数切分。

第三步:建立索引

可以先用关键词检索,后续再加入向量检索。关键词适合小型知识库,向量检索适合语义相似问题。

第四步:回答时带来源

回答不应只给结论,还要显示来自哪些资料。来源可以是页面、文件、章节或知识卡编号。

第五步:处理弱命中

如果没有强相关资料,不要硬回答。应提示用户补充问题,并把缺口进入社群共建审核。

第六步:持续优化

通过用户问题发现缺口,审核后补充知识卡、关键词、同义词和专题页面。