📚
RAG 全栈开发
本课程面向具备一定 AI 与编程基础的开发者,聚焦在 Retrieval-Augmented Generation(RAG)的原理、系统组成、安全考量及落地实现。你将系统学习 LLM 与 RAG 的工作机制,掌握完整的 E2E 项目搭建方法,包括索引构建、查询优化、权限控制等关键模块。课程采用理论 + 实战相结合方式,帮助你具备独立开发和部署企业级智能问答系统的能力。
第1天: RAG 理论与核心流程
从概念到技术架构的系统理解
🔍
📚 今日学习内容
•
1.1 RAG 概述
什么是 RAG?(What)
为什么需要 RAG?(Why)
典型应用场景解析
结合 LangChain/LangGraph,介绍 RAG 的整体技术架构
•
1.2 RAG 的两阶段工作流
RAG 系统核心工作机制概述
两阶段协作模式解析
📥 Indexing 阶段
• 文档加载与分块(Chunking)- LangChain / LCEL 的加载与分块能力
• 向量化与 Embedding 模型 - 主流开源与商用 embedding 模型选型
• 向量数据库接入 - 集成 pgvector、FAISS 等向量存储方案
🔎 Retrieving 阶段
• 检索技术原理:向量检索、相似度排序
• Prompt template 设计与上下游链路集成
• 高级检索策略:混合检索(Hybrid Search)、结果重排序(Reranking)
• LangChain/LangGraph 中的检索链路构建
•
1.4 工具实操演示
使用 LangChain/LCEL 演示完整 RAG 流程:文档加载 → Embedding → 检索
操作向量数据库(以 pgvector 为例)
💡 学习目标
- ✓ 深入理解 RAG 系统的工作原理与价值
- ✓ 掌握完整的文档处理与向量化流程
- ✓ 熟练使用主流向量数据库与检索组件
- ✓ 具备 RAG 系统架构设计能力
📦 附录资料
📋LangChain 官方文档
📋LCEL 使用指南
📋向量数据库实用手册(pgvector、FAISS 等)
📋示例项目地址
📋GitHub 推荐仓库
📋常用组件库与模板集合