检索增强生成RAG（Retrieval-Augmented Generation）

一、RAG 是什么?

RAG（Retrieval Augmented Generation，检索增强生成）是一种结合信息检索和文本生成的技术，旨在提升大语言模型（LLM）生成内容的准确性和时效性。

核心思想：先检索相关数据，再基于检索结果让大模型生成回答。

RAG

第一阶段（数据处理）：

从文档中读取非结构化数据、对其进行切片、然后将其写入向量数据库。

第二阶段（RAG）：

当用户的问题需要由 AI 模型回答时，先将问题向量化后去向量数据库中搜索“相似”的文档片段，最后将问题和所有“相似”的文档片段都会被发送给 AI 模型。