news 2026/4/3 2:34:07

AI开发者的“救命稻草“:RAG、知识库和Embedding,让大模型无所不知!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI开发者的“救命稻草“:RAG、知识库和Embedding,让大模型无所不知!

今年以来,AI 技术已经融入了我们的工作和生活中。我们通过 AI 问答逐渐取代了之前传统的搜索,有了 AI 的加持,我们的工作效率和生活便捷度确实提高了不少。今天,我们就一起来了解下 AI 技术中 RAG、知识库和 Embedding 这三门技术的使用背景和技术原理。

现在的主流 AI 仍基于通用数据训练,存在诸多局限:当你想问一些特定场景和垂直领域的知识,比如你在 AI 工具中问 “张佳是谁?”,大模型就显得有点力不从心,甚至答非所问。因为大模型可能真的不知道答案,它需要你提供更多的知识 —— 它没有我们特定场景需要的一些知识资料,流程如下图:

那如何解决特定场景或垂直领域的知识需求呢?答案就是给它 “外挂” 一个知识库。这样一来,如果我们有问题询问 AI 工具,AI 工具不会直接去调用大模型,而是先在我们的知识库或数据库中进行一轮查询,搜集与该问题相关的资料。找到资料以后,它会把所有查询到的资料和用户原本的问题一起打包,变成一个新的提示词传递给大模型。这时,大模型收到的就不只是一个问题了,而是包含用户提问和知识库检索结果的完整信息,大模型只需根据问题将答案二次编辑后返回给用户,如下图:

Embedding 是大模型技术中最基础、最核心的概念之一,它就像一把 “翻译钥匙”,能把现实世界中五花八门的对象(文字、图片、音频、用户行为、知识图谱节点……)统一转换成模型能看懂、能计算的 “向量语言”。

大家还记得我们在[大模型(AI)生成原理]理中的 “向量化” 时提到的内容吗?我们说大模型所用的向量化技术,核心优势在于通过 “向量夹角” 的形式,快速匹配出相似或相关的内容。所以,如果我们把用户的问题拆解为关键词,再去知识库中以关键词形式检索,之后返回结果,这个过程效率会很低;但如果我们将所有知识资料全部进行嵌入向量化处理,使其与大模型所需的向量格式保持一致,那么检索效率就会大幅提升。

那 RAG 又是什么呢?RAG 是 Retrieval(检索)、Augmentation(增强)、Generation(生成)的缩写。简单来说,如果我们直接询问大模型,而大模型无法回答某个问题,那么在调用大模型之前,我们会先让机器人去网络或知识库上搜索相关资料,搜索完成后,将搜索结果与用户问题整合,再调用大模型生成最终答案 —— 这个过程就是 RAG 的核心逻辑。

大家看到的所谓 RAG、所谓知识库,其实本质是让大模型变成了一个帮我们完成 “编辑任务” 的工具。这时,我们并没有真正用到大模型所谓的 “认知”“理解知识” 的能力,也没有依赖大模型自身的知识储备,只是让它帮我们对信息进行了一次编辑整合,这就是 RAG 和知识库最基础的应用逻辑。

伙伴们,今天只是对 RAG、知识库和 Embedding 做了简单介绍。接下来的三篇文章,我会分别通过《1-1 RAG 的核心原理和主流架构》《1-2 文档处理和 Embedding》以及《1-3 RAG 的检索召回、混合增强和提示词兜底》,深入分享它们的技术原理和业务场景。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包

  • ✅ 从零到一的 AI 学习路径图
  • ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
  • ✅ 百度/阿里专家闭门录播课
  • ✅ 大模型当下最新行业报告
  • ✅ 真实大厂面试真题
  • ✅ 2025 最新岗位需求图谱

所有资料 ⚡️ ,朋友们如果有需要《AI大模型入门+进阶学习资源包》下方扫码获取~

① 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档

学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余

以上资料如何领取?

为什么大家都在学大模型?

最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。

风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

以上全套大模型资料如何领取?

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/31 20:55:28

ReAct、FC、MCP、Skills 一路演进,Agent 到底是不是垃圾?

这篇文章源于我近半年关于Agent(去除敏感信息)的生产实践,也源于近一年和各个团队关于Agent的一些交流,包括我对类Manus项目的一些困惑。 就当前来说,存在两个截然相反的声音:Agent就是未来,其他…

作者头像 李华
网站建设 2026/4/2 5:06:59

2025年,自由职业者如何平衡创意副业、在职备考与技能学习?

在当今快速变化的职业环境中,越来越多的职场人不再满足于单一的职业身份。 自由职业者、创意服务提供者、副业探索者、在职备考者、技能学习者……这些标签可能同时出现在一个人身上。这种多元身份并存的模式,在2025年已成为新常态。 如何在有限的时间内平衡这些角色,实现…

作者头像 李华
网站建设 2026/4/1 11:02:36

最大数max(x,y,z)(信息学奥赛一本通- P1152)

【题目描述】已知:mmax(a,b,c)max(ab,b,c)max(a,b,bc)输入a,b,c,求m。把求三个数的最大数max(x,y,z)分别定义成函数和过程来做。【输入】输入a,b,c。【输出】求m,保留到小数点后三位。【输入样例】1 2 3【输出样例】0.200【题目简述】题目要求计算包含多…

作者头像 李华
网站建设 2026/3/31 9:29:37

告别“感觉选人”:AI重构招聘的效率、精准与体验闭环

告别“感觉选人”:AI重构招聘的效率、精准与体验闭环AI得贤招聘官“AIHR到底有什么价值?”这是很多HR的困惑。但真正值得警惕的,不是对AI价值的迷茫,而是招聘中的主观判断正带来失控风险——简历越收越多、面试轮次越长&#xff0…

作者头像 李华
网站建设 2026/3/28 17:02:56

java基础-HashMap

基本概念HashMap 是 Java 中最常用的 Map 实现类&#xff0c;它基于哈希表实现&#xff0c;提供了快速的查找、插入和删除操作。核心特性1. 数据结构&#xff08;Java 8 之前 vs Java 8&#xff09;Java 8 之前&#xff1a;数组 链表// 内部结构示意 table: Entry<K,V>[…

作者头像 李华
网站建设 2026/3/27 19:33:10

Check Point 156-215.81 認證考試介紹|Fortinet FortiGate 管理員認證

最新新闻 背景概述 隨著企業網路架構日益複雜且雲端化&#xff0c;網路安全管理者的專業技能需求不斷提升。Check Point Certified Security Administrator&#xff08;CCSA&#xff09;作為業界極具權威性的初中級認證&#xff0c;長期以來一直是網路安全專業人士的核心敲門…

作者头像 李华