news 2026/4/3 5:10:42

day42

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
day42

1. 过拟合的判断
过拟合是模型 “记住” 训练数据但泛化能力差的现象,核心判断方式是同步打印训练集和测试集的指标:
正常情况:训练集、测试集的损失(Loss)同步下降,准确率(或其他指标)同步上升;
过拟合情况:训练集损失持续下降、准确率持续上升,但测试集损失停止下降甚至上升、准确率停止提升。
2. 模型的保存和加载
PyTorch 中模型保存 / 加载有 3 种常见方式:
a. 仅保存权重(最常用)
保存:仅保存模型的参数(state_dict),文件小、灵活;

加载:需先初始化模型结构,再加载权重;

b. 保存权重和模型
保存:直接保存整个模型对象(包含结构 + 权重)

加载:直接加载模型

c. 保存全部信息(checkpoint)
保存:包含模型权重、优化器状态、训练轮数、损失等训练状态,支持 “断点续训”

加载:恢复模型 + 优化器状态,继续训练

3. 早停策略
早停是防止过拟合的常用方法:当测试集损失连续 N 轮不再下降时,提前停止训练。
核心逻辑:
记录当前最优测试集损失;
每轮训练后对比新的测试集损失;
若连续patience轮损失未下降,则停止训练。

作业:

@浙大疏锦行

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/3 5:00:00

Qwen3-VL识别Mathtype公式编号引用

Qwen3-VL如何精准识别MathType公式与编号引用 在科研论文、工程文档和数学教材中,公式的排版与引用构成了知识传递的核心骨架。一个典型的场景是:作者在正文中写道“由公式(2)可得”,而读者需要迅速定位到那个被编号为“(2)”的表达式。对于人…

作者头像 李华
网站建设 2026/3/31 12:04:21

3分钟解锁视频PPT提取神器:告别手动截图的烦恼时代

3分钟解锁视频PPT提取神器:告别手动截图的烦恼时代 【免费下载链接】extract-video-ppt extract the ppt in the video 项目地址: https://gitcode.com/gh_mirrors/ex/extract-video-ppt 还在为在线课程、会议录像中手动截图PPT而耗费大量时间吗?…

作者头像 李华
网站建设 2026/3/28 10:05:30

ComfyUI Manager:AI绘画工作流的智能管家

ComfyUI Manager:AI绘画工作流的智能管家 【免费下载链接】ComfyUI-Manager 项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI-Manager 想要在ComfyUI中高效管理各类插件和模型?ComfyUI Manager正是你需要的智能管家。这个强大的工具让AI绘…

作者头像 李华
网站建设 2026/4/3 3:49:29

第七史诗助手:告别重复操作,体验智能游戏伴侣

第七史诗助手:告别重复操作,体验智能游戏伴侣 【免费下载链接】e7Helper 【EPIC】第七史诗多功能覆盖脚本(刷书签🍃,挂讨伐、后记、祭坛✌️,挂JJC等📛,多服务器支持📺,q…

作者头像 李华
网站建设 2026/4/3 3:26:22

DeepSeek-R1-0528升级:推理深度与能力显著提升

深度求索(DeepSeek)近日发布了DeepSeek R1系列的重要更新版本——DeepSeek-R1-0528,通过计算资源扩充与后训练算法优化,该版本在推理深度与综合能力上实现显著进步,整体性能已接近OpenAI o3、Gemini 2.5 Pro等行业领先…

作者头像 李华
网站建设 2026/3/27 23:29:49

一键解锁音乐自由:ncmdump实现NCM转MP3格式转换神器

一键解锁音乐自由:ncmdump实现NCM转MP3格式转换神器 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 还在为网易云音乐的NCM格式文件无法在其他设备播放而烦恼吗?音乐格式转换从此变得简单!ncmdump…

作者头像 李华