检索增强生成RAG(Retrieval-Augmented Generation)
一、RAG 是什么?
RAG(Retrieval Augmented Generation,检索增强生成)是一种结合信息检索和文本生成的技术,旨在提升大语言模型(LLM)生成内容的准确性和时效性。
核心思想:先检索相关数据,再基于检索结果让大模型生成回答。
第一阶段(数据处理):
- 从文档中读取非结构化数据、对其进行切片、然后将其写入向量数据库。
第二阶段(RAG):
- 当用户的问题需要由 AI 模型回答时,先将问题向量化后去向量数据库中搜索“相似”的文档片段,最后将问题和所有“相似”的文档片段都会被发送给 AI 模型。