news 2026/4/3 1:25:51

RAG介绍及工作流程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RAG介绍及工作流程

一、RAG 是什么?

RAG(Retrieval-Augmented Generation),即检索增强生成,是一种结合信息检索大模型生成的技术框架,核心目标是让大模型在生成回答时,能够引用外部权威、实时、精准的知识,从而解决大模型自身的固有缺陷。

二、为什么要用 RAG?

主要解决传统大模型的痛点

  • 缓解“幻觉”问题

    大模型可能生成虚构或错误信息,而RAG让模型基于检索到的真实数据资料生成答案,大幅减少幻觉,同时可追溯信息来源

  • 突破模型知识时效限制

    大模型的训练数据往往滞后,无法获取最新信息。RAG可实时检索最新资料(如新闻、行业报告),保证答案的时效性。
  • 扩展模型的专业领域能力

    通用大模型缺乏特定领域的深度知识(如企业内部的规章制度、专业文献)。RAG可构建领域专属知识库,让大模型成为垂直领域的专家。

  • 增强答案的可解释性与可信度

    RAG生成的答案可附带来源引用(如参考的文档段落),让用户验证信息可靠性,提升信任感。
  • 隐私与安全

    很多公司不希望把内部文件拿去训练模型。用 RAG,只需把文档存到自己的检索系统中,推理时临时读取,不必参与模型训练。

三、RAG的工作流程

准备阶段:分片(Chunking)、索引(Indexing)

分片(Chunking):将长文本拆分为大小适中、语义完整的短文本片段

  1. 数据加载:对各种非结构化数据( PDF、DOCX、Markdown、HTML等)进行处理,处理方式可以把各种数据源转换成统一的纯文本格式;或是对非结构化数据按文件类型归类,路由给不同加载器来处理这些文件。

  2. 数据分割:将它们分割成更小、更易于管理的文本块(Chunks)。常见做法:按固定字数 / Token 切重叠分块,按结构切,语义切分。若是通过OCR提取出的文本,还需先进行去噪后再进行文本块分割。

索引(Indexing):将拆分后的 Chunk 转换为向量格式,并构建索引库

  1. 向量化:使用嵌入模型(Embedding模型)将每个文本块转换为一个高维向量(Vector)。语义相近的文本,其向量在空间中也更接近。

  2. 索引:将这些向量及其对应的原始文本、元数据(来源、页码等)存入专门的向量数据库方便溯源,构建向量索引常用向量数据库:开源(Milvus、Chroma、FAISS),再选择适合的索引算法(如 HNSW、IVF_FLAT)。

检索阶段:召回(Retrieval)、重排(Re-ranking)

召回(Retrieval):从海量数据中 “粗筛”

  1. 使用与准备阶段相同的嵌入模型,将用户查询的原始问题也转换为向量。

  2. 在向量数据库中,执行近似最近邻搜索,计算查询向量与所有存储向量之间的相似度(常用余弦相似度、欧氏距离、点积)。

  3. 根据相似度排序,返回相似度最高的K个文本块Top-K及其元数据。

重排(Re-ranking):对召回结果 “精筛”

  1. 向量相似度(召回)有时不够精确,需进行更精细重排,选出最相近的几个

  2. 选用一个更强大的重排模型,更深入地理解查询和文档块之间的语义关系,并直接输出一个相关性分数,得分高的被选为最终上下文。

  3. 根据这个分数对所有候选文档进行重新排序,并选取Top-N

生成阶段:生成(Generation)

生成(Generation)

  1. 构造提示:将重排后的 Top-N 个 Chunk与用户原始问题,按照预定的模板组装成新的提示词。

  2. 模型推理:将构造好的提示词输入给LLM,LLM 会利用检索到的信息,结合模型的语言生成能力,来生成准确且相关的最终答案。

  3. 生成与约束:LLM在生成时,会被要求严格依据上下文和数据来源来生成,并按照指定格式生成准确且可追溯的答案。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/28 16:52:22

SketchUp STL插件:从3D设计到实体打印的完整解决方案

还在为SketchUp模型无法直接用于3D打印而困扰吗?SketchUp STL插件正是你需要的专业工具!这个功能强大的Ruby扩展为SketchUp添加了完整的STL文件格式支持,让你的创意能够轻松从虚拟设计转变为实体模型。 【免费下载链接】sketchup-stl A Sketc…

作者头像 李华
网站建设 2026/3/27 19:57:44

RimWorld模组管理革命:告别加载混乱的智能解决方案

你是否有过这样的经历?深夜好不容易抽出时间想玩《RimWorld》,却在模组加载界面卡了整整一小时——模组A需要B,B又依赖C,最后发现D与E冲突。这种令人抓狂的场景,正是RimSort要彻底解决的问题。 【免费下载链接】RimSor…

作者头像 李华
网站建设 2026/3/23 15:32:22

罗技PUBG鼠标宏完整配置教程:从零开始掌握压枪技巧

罗技PUBG鼠标宏是专为绝地求生玩家设计的智能辅助工具,通过精准的Lua脚本技术实现自动压枪功能。无论你是FPS游戏新手还是经验丰富的老玩家,这款工具都能显著提升你的射击稳定性,在激烈对抗中占据明显优势。 【免费下载链接】logitech-pubg P…

作者头像 李华
网站建设 2026/3/30 15:06:22

原神帧率解放终极指南:告别60帧限制,开启丝滑游戏新体验

还在忍受原神默认的60帧限制吗?这款强大的帧率解锁工具将彻底改变你的游戏感受,让每一帧画面都流畅如丝。 【免费下载链接】genshin-fps-unlock unlocks the 60 fps cap 项目地址: https://gitcode.com/gh_mirrors/ge/genshin-fps-unlock &#x…

作者头像 李华
网站建设 2026/3/27 16:54:38

视频PPT提取终极指南:智能算法让课件整理变得如此简单

视频PPT提取终极指南:智能算法让课件整理变得如此简单 【免费下载链接】extract-video-ppt extract the ppt in the video 项目地址: https://gitcode.com/gh_mirrors/ex/extract-video-ppt 还在为繁琐的视频截图工作头疼吗?每次观看教学视频都要…

作者头像 李华
网站建设 2026/3/31 0:12:35

5分钟掌握百度网盘直链提取:告别龟速下载的终极方案

你是否曾经在紧急时刻被百度网盘的下载速度折磨得焦头烂额?当毕业设计资料、团队项目文件、设计素材包在网盘客户端中缓慢爬行时,那种无力感足以让人崩溃。今天,我将为你介绍一款能够彻底改变这种局面的开源工具——baidu-wangpan-parse&…

作者头像 李华