Skip to content

检索增强生成RAG(Retrieval-Augmented Generation)

一、RAG 是什么?

RAG(Retrieval Augmented Generation,检索增强生成)是一种结合信息检索和文本生成的技术,旨在提升大语言模型(LLM)生成内容的准确性和时效性。

核心思想:先检索相关数据,再基于检索结果让大模型生成回答

RAG

第一阶段(数据处理):

  • 从文档中读取非结构化数据、对其进行切片、然后将其写入向量数据库。

第二阶段(RAG):

  • 当用户的问题需要由 AI 模型回答时,先将问题向量化后去向量数据库中搜索“相似”的文档片段,最后将问题和所有“相似”的文档片段都会被发送给 AI 模型。