AI全景之第五章第一节：深度学习（卷积神经网络CNN）-智慧文博士

第五章：卷积神经网络(CNN)：从LeNet到ConvNeXt的演进

深入理解卷积神经网络的基本原理与核心设计思想，掌握CNN架构演进的关键突破点，能够分析不同CNN变体的适用场景，并具备根据任务需求选择或设计合适CNN架构的能力。

局部连接（局部感受野）
- 每个神经元仅连接输入区域的局部
- 生物启发：视觉皮层神经元仅处理视野的局部区域
- 数学表达：yi,j=∑m=0k−1∑n=0k−1wm,n⋅xi+m,j+n+by_{i,j} = \sum_{m=0}^{k-1} \sum_{n=0}^{k-1} w_{m,n} \cdot x_{i+m,j+n} + byi,j=∑m=0k−1∑n=0k−1wm,n⋅xi+m,j+n+b
权值共享（卷积核）
- 同一卷积核在输入的不同位置使用相同的权重
- 显著减少参数：从百万级降至百级
- 实现平移等变性：无论特征出现在何处，使用相同检测器
多通道设计
- 输入：彩色图像有RGB三个通道
- 输出：每个卷积核生成一个特征图，多个卷积核形成多通道特征
- 三维卷积核：处理多通道输入，融合跨通道信息

# 卷积操作的核心参数kernel_size=3# 卷积核大小，常用3×3, 5×5, 7×7stride=1# 滑动步长，控制输出尺寸padding='same'# 填充方式，保持空间尺寸或减小filters=64# 卷积核数量，决定输出通道数

ReLU（Rectified Linear Unit）：f(x)=max(0,x)f(x) = max(0, x)f(x)=max(0,x)
- 优点：计算简单，缓解梯度消失，加速收敛
- 缺点：神经元"死亡"问题（负值完全抑制）
变种：LeakyReLU、PReLU、ELU、GELU

第一章：AutoGLM-Phone-9B端侧推理的技术背景与意义随着人工智能模型规模的持续扩大，将大型语言模型部署至终端设备进行本地推理成为推动AI普惠化的重要方向。AutoGLM-Phone-9B作为专为移动端优化的90亿参数级大模型，标志着自然语言处理能力在…

李华

FaceFusion镜像中的操作行为审计追踪：从技术实现到企业级应用在AI生成内容（AIGC）迅猛发展的今天，人脸替换技术已不再局限于实验室或极客玩具。随着深度学习模型的成熟与算力成本的下降，像FaceFusion这样的开源工具正被…

李华

2025 热门 AI 论文工具哪个好？6 款适配 LaTeX 模板与论文格式规范六款热门 AI 论文工具对比总结以下是2025年热门AI论文工具的快速对比，帮助您在写作论文时选择合适工具。这六款工具均支持LaTeX模板和论文格式规范，适配性强。总结基于核心功能…

$作者头像$ 李华

第一章：Open-AutoGLM 二次开发灵活性横向测评在当前大模型生态快速演进的背景下，Open-AutoGLM 作为一款支持多模态任务自动调度与生成的开源框架，其二次开发能力成为开发者关注的核心。该框架通过模块化解耦设计，允许开发者灵活替…

李华

第一章：Open-AutoGLM AutoGLM-Phone-9B 工作机制Open-AutoGLM 的 AutoGLM-Phone-9B 是一款专为移动设备优化的轻量化大语言模型，基于 GLM 架构进行深度压缩与硬件适配，能够在资源受限的智能手机上实现高效的自然语言理解与生成。该模型通过知…

李华

FaceFusion人脸融合在影视剧补拍中的成本节约分析在一部电视剧进入后期制作的最后阶段时，导演突然发现某个关键情节缺少一个特写镜头——而主演因档期冲突已远赴海外拍摄新剧。传统做法是协调场地、灯光、摄影团队重新搭建场景，请替身演员补拍&#xff…

李华