📚

RAG 全栈开发

本课程面向具备一定 AI 与编程基础的开发者,聚焦在 Retrieval-Augmented Generation(RAG)的原理、系统组成、安全考量及落地实现。你将系统学习 LLM 与 RAG 的工作机制,掌握完整的 E2E 项目搭建方法,包括索引构建、查询优化、权限控制等关键模块。课程采用理论 + 实战相结合方式,帮助你具备独立开发和部署企业级智能问答系统的能力。

第1天: RAG 理论与核心流程

从概念到技术架构的系统理解

🔍

📚 今日学习内容

+

1.1 RAG 概述

什么是 RAG?(What)

为什么需要 RAG?(Why)

典型应用场景解析

结合 LangChain/LangGraph,介绍 RAG 的整体技术架构

1.2 RAG 的两阶段工作流

RAG 系统核心工作机制概述

两阶段协作模式解析

📥 Indexing 阶段
文档加载与分块(Chunking)- LangChain / LCEL 的加载与分块能力
向量化与 Embedding 模型 - 主流开源与商用 embedding 模型选型
向量数据库接入 - 集成 pgvector、FAISS 等向量存储方案
🔎 Retrieving 阶段
检索技术原理:向量检索、相似度排序
Prompt template 设计与上下游链路集成
高级检索策略:混合检索(Hybrid Search)、结果重排序(Reranking)
LangChain/LangGraph 中的检索链路构建

1.4 工具实操演示

使用 LangChain/LCEL 演示完整 RAG 流程:文档加载 → Embedding → 检索

操作向量数据库(以 pgvector 为例)

💡 学习目标

+

📦 附录资料

+