news 2026/4/3 3:35:09

2025:从 CV和KG到大模型落地,我的转身之年与平衡之道

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
2025:从 CV和KG到大模型落地,我的转身之年与平衡之道

年初 3 月的某个深夜,我还盯着OCR模型的准确率指标 —— 从 98.2% 卡到 98.5% 的瓶颈,已经耗了我整整两周。而到了年末的今天,我的屏幕上是 TTS 模型的demo界面,旁边开着的文档是《RAG+知识图谱召回》。这一年于我而言,是转身的一年:从计算机视觉、OCR、知识图谱的旧战场,跳到了大模型、TTS、RAG 的新赛道;也是扎根的一年:旧技能的根系,悄悄撑住了新方向的枝桠。

一、技术:旧基础的新用法,是我转身的底气

决定转方向的契机很偶然 —— 年初部门接了个大模型辅助客服的项目,需要把历史工单的非结构化文本做语义检索。我本以为是全新的领域,直到打开需求文档看到向量检索,实体关联这几个词,突然反应过来:我之前做 CV 时的特征向量匹配,不就是 RAG 里的向量搜索?之前搭建的知识图谱实体召回逻辑,刚好能补上大模型的失忆短板。这成了我转身的第一个支点:旧技能不是沉没成本,是新方向的适配插件

  • 我把 OCR 模型的文本输出,改成了大模型的结构化输入模块 —— 比如把手写工单的 OCR 结果做纠错后喂给大模型,解决了非规范文本无法被理解的问题,尝试使用多模态进行文本识别,只需要写提示词就能从图像中识别出想要的信息,比之前的文字检测,文字识别,文字后处理简洁太多了;
  • 知识图谱的实体关联逻辑,被我改成了 RAG 的前置召回器—— 在向量检索前先用知识图谱过滤无关实体,检索准确率大幅提升,降低和减少幻觉问题的出现概率;。

当然也有全新的学习:啃 NLP 基础时,基于李宏毅老师的教学视频整理成博客系列;第一次用 Dify 搭大模型应用,完整的整理了dify项目的系统架构等,写成dify系列文章;AI Coding 工具帮我节省了写重复代码的时间,但我也在博客里提醒大家别丢了手写基础逻辑的能力。

二、创作:博客是我的成长台账,也是和同路人的暗号

今年在 CSDN 写了70多篇文章,几乎每一篇都和我的转身同步:

  • 第一次成功对接大模型时,连夜写了《ChatGPT大模型极简及应用开发系列》;
  • 调 TTS 模型时,调研了多种tts算法,比如melotts,voiceziptts,flashtts等,从单流到双流服务的开发与部署;
  • 甚至学宏观经济时,也写了《从 PMI 数据看 AI 行业的 2025:普通开发者该关注什么》—— 毕竟年初的房贷压力,让我不得不从只看技术变成看技术 + 看趋势。

写博客的时间,是从生活里挤出来的,这不是负担—— 有读者在博客下面留言 “我也在做类似项目,博客帮我少走了一周弯路”,还有刚转 AI 的后端同学问 “CV 转大模型需要补哪些 NLP 基础”,这些互动让我觉得:博客不只是我的成长台账,更是和同路人的暗号—— 你踩过的坑,我刚好也踩过;你需要的经验,我刚好攒了点。

三、生活:在不确定性里,找平衡的笨办法

今年的变化不止在技术:房贷的压力、行业的波动,让我不得不把平衡从口号变成日常计算。

  • 学宏观经济是为了看懂AI 行业的钱从哪来—— 毕竟年初公司缩招时,通过2025 AI 岗位趋势:哪些方向更抗风险,提前调整了自己的学习重点;
  • 学理财是为了对冲不确定性—— 把工资分成应急金 + 学习基金 + 定投,哪怕项目节奏变了,至少学习的钱不会断;
  • 平衡工作和生活也比较的简单——目前也没有小孩,个人的时间还是比较多的,好记性不如烂笔头,尽可能的多记录,在方便自己的同时如果能帮助他人就更好了。

我很清楚,自己能顺利转方向,是因为有之前的 AI 基础托底;但和我同是期的前端同事,想转 AI 时连向量是什么都要从头学 —— 这让我提醒大家先找自己技能里能迁移的部分,别盲目从零开始。毕竟行业变化这么快,被替代的危机感不是某个人的焦虑,是我们都要面对的命题。

结尾:博客是我的锚点,也是下一段路的起点

今年能参与博客之星评选,对我来说更像意外之喜—— 我写博客从来不是为了获奖,而是为了把自己的转身经验记下来,能帮到一两个同路人就够了。

从 CV 调参到大模型落地,从盯着准确率曲线到算房贷和理财,这一年的成长,不是学会了多少新技能,而是学会了在变化里找延续,在压力里找平衡。

明年我想写更多技能迁移的内容,比如如何把 OCR 经验用到多模态大模型里,也想写更多普通人的 AI 生存指南—— 毕竟,我们不是在和 AI 竞争,是在和不成长的自己赛跑。

感谢 CSDN 这个平台,也感谢每一个看过我文章、留过言的读者 —— 你们的互动,是我深夜写文时最亮的光。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/2 8:51:41

HEIF Utility:彻底解决Windows用户HEIC图片兼容性难题

HEIF Utility:彻底解决Windows用户HEIC图片兼容性难题 【免费下载链接】HEIF-Utility HEIF Utility - View/Convert Apple HEIF images on Windows. 项目地址: https://gitcode.com/gh_mirrors/he/HEIF-Utility 还在为iPhone拍摄的照片在Windows电脑上无法正…

作者头像 李华
网站建设 2026/3/26 14:25:23

PlugY插件:暗黑破坏神2单机玩家的终极生存指南

PlugY插件:暗黑破坏神2单机玩家的终极生存指南 【免费下载链接】PlugY PlugY, The Survival Kit - Plug-in for Diablo II Lord of Destruction 项目地址: https://gitcode.com/gh_mirrors/pl/PlugY 还在为暗黑破坏神2单机模式的种种限制而烦恼吗&#xff1f…

作者头像 李华
网站建设 2026/4/3 3:27:28

PyTorch-CUDA-v2.9镜像是否支持分布式训练?支持!

PyTorch-CUDA-v2.9镜像是否支持分布式训练?支持! 在当前大模型时代,单卡训练早已无法满足日益增长的算力需求。从百亿参数的语言模型到高分辨率图像生成系统,研究人员和工程师们正越来越多地依赖多GPU甚至多机集群进行并行训练。然…

作者头像 李华
网站建设 2026/3/30 14:39:02

TEKLauncher:重新定义ARK游戏启动体验的完整解决方案

TEKLauncher:重新定义ARK游戏启动体验的完整解决方案 【免费下载链接】TEKLauncher Launcher for ARK: Survival Evolved 项目地址: https://gitcode.com/gh_mirrors/te/TEKLauncher 你是否曾经为ARK: Survival Evolved复杂的MOD管理和繁琐的服务器配置而烦恼…

作者头像 李华
网站建设 2026/3/27 9:50:57

华为光猫配置深度解析:从加密文件到网络运维实战

华为光猫配置深度解析:从加密文件到网络运维实战 【免费下载链接】HuaWei-Optical-Network-Terminal-Decoder 项目地址: https://gitcode.com/gh_mirrors/hu/HuaWei-Optical-Network-Terminal-Decoder 在当今数字化时代,家庭和企业网络的稳定性直…

作者头像 李华
网站建设 2026/3/24 5:32:16

LinkSwift网盘下载助手:重新定义文件传输新体验

在数字化信息爆炸的时代,网盘已成为我们日常工作和学习中不可或缺的工具。然而,面对各大网盘平台复杂的下载流程和令人困扰的限速问题,你是否渴望找到一种更高效、更便捷的解决方案?LinkSwift网盘下载助手正是为此而生&#xff0c…

作者头像 李华