Skip to content

RAG 工程与检索系统设计

一本系统讲解 RAG 从 demo 到生产的工程专著。

RAG 不是"向量数据库 + 大模型"这么简单。真正的生产级 RAG 系统要处理文档解析、分块、Embedding、索引构建、权限过滤、混合召回、重排序、上下文压缩、引用溯源、增量更新、质量评估、成本延迟控制,以及 Agent 长期记忆。任何一环做错,最终都会表现为同一个症状:模型看似会回答,实际不可信。

本书从一次用户提问的完整生命周期出发,拆解 RAG 系统的每个工程边界:知识如何进入系统、问题如何变成检索请求、候选证据如何被筛选、上下文如何被打包、答案如何被验证、系统如何被评估和运营。目标不是教你调一个框架 API,而是建立一套能迁移到企业知识库、代码检索、客服问答、研究助手、Agent Memory 的工程心智模型。

适合谁读

有一定编程经验的 AI 应用开发者、RAG 系统架构师、搜索与推荐工程师、Agent 框架设计者,以及所有想把"知识库问答 demo"推进到生产环境的技术人。

目录

开篇

第一部分:RAG 系统全景

第二部分:知识进入系统

第三部分:表示与索引

第四部分:召回、排序与上下文

第五部分:Agent Memory 与 GraphRAG

第六部分:生产化

版权声明

本书采用 CC BY-NC 4.0 许可协议。转载或引用请署名 杨艺韬 并附原文链接,禁止商业用途。

基于 VitePress 构建