、
为什么 Gemini 会发疯,为什么它会坚持认为2024年末才是真实世界,而其它都是虚构。不久之后,我甚至发现,自己的这点经历完全不是偶然。不仅仅是我,从 Andrej Karpathy[1] 这样的 AI 界大神,到身边试图用 Gemini CLI 管理自己知识笔记的前同事,都会一再遭遇类似的问题。
显然这不是一次 AI 偶然的失误。难道,这背后隐藏着什么 AI 的根本缺陷吗?
我一遍又一遍地和 Gemini,和 DeepSeek,和各种 AI 讨论这个问题,用 Google 搜索,一次又一次地启动「深度调研」,积累了几十篇的资料和文档。我依旧不满意,再把它们扔进 NotebookLM 。我一遍又一遍的问,不明白就让 AI 给我重新再讲一遍,终于,我发现了这背后的奥秘。
想要理解这件奇怪的事情,首先需要你发挥一下想象力。
AI 背后的双重人格
你每天使用的 AI 背后,不管是 Gemini 还是 ChatGPT,或者 DeepSeek 和豆包,躲在屏幕后和你对话的,其实是两位专家的合体:
image-20260101082058820
「图书管理员」代表的大模型的参数化记忆(Parametric Memory)。这是大模型在训练时,通过海量的(通常是整个互联网),动用成千上万张 GPU 卡,经年累月学习,凝固下来的知识。这些知识,就像一本又一本厚厚的百科全书,存储在大模型的前馈网络层(Feed-Forward Networks,FFN)的参数中。
训练大模型的所有信息,本质上就是人类知识的图书馆。而这个训练过程,造就了这位「图书管理员」,让他能够以一种神奇的方式,在你需要的时候,迅速地找到这图书馆里的任何一本书架上的任何一本书。
但训练一旦完成,这个图书馆就不会再放入任何新的藏书了。这广博浩瀚的图书馆,其实从建成的那天起就开始过时了。
而「思考者」代表的是大模型的上下文处理(Contextual Processing)能力。他只关注你的问题——也就是提示词(Prompt)。他极其专注,通过注意力机制(Attention Mechanism)来判断上下文中哪些词语最重要,并且根据这些信息来组织语言和进行推理。
「思考者」就像一位「做题家」,你只管给他问题,他负责给你答案。
它们俩通力合作,造就了我们现在每天都会使用的 AI。
为了让图书馆里尽可能都是最新的知识,并且让「图书管理员」更高效准确地工作,每次训练新的模型,都会尽可能采用当下最新、最全、最权威正确的全人类知识库——比如我之前遇到时空错乱问题 Gemini Pro 3,他的知识库就是截至2024年底的。
而为了让「思考者」能够回答更复杂的问题,上下文长度也越来越长。比如,现在免费版的 Gemini 上下文长度是 3.2 万 Token,而收费版则是 100 万 Token。Kimi 甚至有 200 万 Token的版本。
100 万 Token 什么概念呢?大约相当于 72 万汉字,也就是大约一整套《红楼梦》的长度。
于是,这 100 万 Token 不仅仅可以把你前前后后的对话细节都扔进去,也可以开展搜索,把互联网上相关的最新信息也都放进去,就像我使用 DeepResearch 和生成信息快报时那样。
是不是有一种双剑合璧,天下无敌的感觉?
然而,问题的根源就在这里!
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包:
- ✅ 从零到一的 AI 学习路径图
- ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
- ✅ 百度/阿里专家闭门录播课
- ✅ 大模型当下最新行业报告
- ✅ 真实大厂面试真题
- ✅ 2025 最新岗位需求图谱
所有资料 ⚡️ ,朋友们如果有需要《AI大模型入门+进阶学习资源包》,下方扫码获取~
① 全套AI大模型应用开发视频教程
(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)
② 大模型系统化学习路线
作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!
③ 大模型学习书籍&文档
学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。
④ AI大模型最新行业报告
2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。
⑤ 大模型项目实战&配套源码
学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。
⑥ 大模型大厂面试真题
面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。
以上资料如何领取?
为什么大家都在学大模型?
最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!
不出1年,“有AI项目经验”将成为投递简历的门槛。
风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!
这些资料真的有用吗?
这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。