ResNet18迁移学习实战：云端GPU 1小时搞定毕业设计-智慧文博士

ResNet18迁移学习实战：云端GPU 1小时搞定毕业设计

引言：毕业设计遇到GPU荒怎么办？

每年毕业季，计算机视觉方向的学生总会遇到一个经典难题：实验室GPU资源被学长学姐占满，自己的模型训练迟迟无法推进。特别是当你选择了图像分类这类需要大量计算资源的课题时，网吧的普通电脑根本无法安装CUDA环境，论文进度严重滞后。

本文将以花卉识别毕设为案例，教你如何用ResNet18迁移学习在云端GPU上快速完成模型训练。不需要自己搭建环境，不需要排队等实验室资源，1小时就能跑完整个训练流程。我会用最通俗的语言解释每个步骤，即使你刚接触深度学习也能轻松上手。

1. 为什么选择ResNet18做迁移学习？

ResNet18是深度学习领域最经典的图像分类模型之一，它就像乐高积木里的基础模块，虽然结构简单但足够强大。对于花卉识别这类常见任务，ResNet18有三大优势：

预训练模型丰富：PyTorch官方提供了在ImageNet上预训练好的权重，包含1000类常见物体的特征提取能力
计算资源友好：相比ResNet50/101等大型模型，ResNet18在保持不错精度的同时，训练速度更快
迁移学习效果好：只需要替换最后的全连接层，就能快速适配新的分类任务

想象一下，这就像你要学做川菜，但不用从切菜开始，而是直接拿到一位川菜大师预处理好的食材（预训练权重），你只需要完成最后的调味步骤（微调全连接层）就能做出美味菜肴。

2. 云端GPU环境准备

既然本地没有GPU资源，我们可以使用云端GPU服务。这里以CSDN星图镜像广场提供的PyTorch环境为例：

选择镜像：搜索并选择预装PyTorch 1.12 + CUDA 11.3的镜像
配置实例：建议选择至少8GB显存的GPU（如NVIDIA T4）
启动环境：点击"一键部署"等待实例准备就绪

💡 提示
如果找不到合适镜像，可以直接搜索"PyTorch"或"ResNet"，平台会显示所有兼容的预置镜像。

启动成功后，通过Jupyter Lab或SSH连接到实例。我们先检查GPU是否可用：

import torch print(torch.cuda.is_available()) # 应该输出True print(torch.__version__) # 确认PyTorch版本

3. 准备花卉数据集

我们使用公开的Oxford 102 Flowers数据集，包含102类常见花卉的图片。在云端环境中执行以下命令下载并解压数据：

wget https://www.robots.ox.ac.uk/~vgg/data/flowers/102/102flowers.tgz tar -xzf 102flowers.tgz

数据集解压后会得到一个jpg文件夹，包含8189张图片。我们需要按照PyTorch的要求整理成以下结构：

flowers/ ├── train/ │ ├── class1/ │ ├── class2/ │ └── ... ├── val/ │ ├── class1/ │ ├── class2/ │ └── ... └── test/ ├── class1/ ├── class2/ └── ...

可以使用以下Python脚本快速划分训练集（70%）、验证集（15%）和测试集（15%）：

import os import random from shutil import copyfile # 创建目录结构 os.makedirs('flowers/train', exist_ok=True) os.makedirs('flowers/val', exist_ok=True) os.makedirs('flowers/test', exist_ok=True) # 读取所有图片并随机打乱 all_images = [] for root, dirs, files in os.walk('jpg'): for file in files: if file.endswith('.jpg'): all_images.append(os.path.join(root, file)) random.shuffle(all_images) # 按比例划分数据集 total = len(all_images) train_split = int(0.7 * total) val_split = int(0.15 * total) for i, img_path in enumerate(all_images): class_name = img_path.split('/')[-1].split('_')[1] os.makedirs(f'flowers/train/{class_name}', exist_ok=True) os.makedirs(f'flowers/val/{class_name}', exist_ok=True) os.makedirs(f'flowers/test/{class_name}', exist_ok=True) if i < train_split: copyfile(img_path, f'flowers/train/{class_name}/{os.path.basename(img_path)}') elif i < train_split + val_split: copyfile(img_path, f'flowers/val/{class_name}/{os.path.basename(img_path)}') else: copyfile(img_path, f'flowers/test/{class_name}/{os.path.basename(img_path)}')

4. ResNet18迁移学习实战

现在进入核心环节：加载预训练模型并进行微调。完整代码如下：

import torch import torch.nn as nn import torch.optim as optim from torchvision import datasets, models, transforms from torch.utils.data import DataLoader # 数据增强和归一化 train_transforms = transforms.Compose([ transforms.RandomResizedCrop(224), transforms.RandomHorizontalFlip(), transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ]) val_transforms = transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ]) # 加载数据集 train_dataset = datasets.ImageFolder('flowers/train', train_transforms) val_dataset = datasets.ImageFolder('flowers/val', val_transforms) train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True) val_loader = DataLoader(val_dataset, batch_size=32, shuffle=False) # 加载预训练模型 model = models.resnet18(pretrained=True) # 冻结所有卷积层参数 for param in model.parameters(): param.requires_grad = False # 替换最后的全连接层 num_features = model.fc.in_features model.fc = nn.Linear(num_features, 102) # 102个花卉类别 # 定义损失函数和优化器 criterion = nn.CrossEntropyLoss() optimizer = optim.Adam(model.fc.parameters(), lr=0.001) # 训练模型 device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") model = model.to(device) for epoch in range(10): # 训练10个epoch model.train() running_loss = 0.0 for inputs, labels in train_loader: inputs, labels = inputs.to(device), labels.to(device) optimizer.zero_grad() outputs = model(inputs) loss = criterion(outputs, labels) loss.backward() optimizer.step() running_loss += loss.item() # 验证集评估 model.eval() correct = 0 total = 0 with torch.no_grad(): for inputs, labels in val_loader: inputs, labels = inputs.to(device), labels.to(device) outputs = model(inputs) _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() print(f'Epoch {epoch+1}, Loss: {running_loss/len(train_loader):.4f}, Val Acc: {100*correct/total:.2f}%') # 保存模型 torch.save(model.state_dict(), 'flower_resnet18.pth')

5. 关键参数解析与调优技巧

为了让你的模型表现更好，这里分享几个实战经验：

学习率选择：
初始学习率建议0.001（Adam优化器）
如果验证集准确率波动大，尝试降低到0.0005
使用学习率调度器：scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=5, gamma=0.1)
数据增强技巧：
增加transforms.RandomRotation(30)让模型适应不同角度的花卉
使用transforms.ColorJitter()增强对颜色变化的鲁棒性
模型微调策略：
如果准确率不够，可以解冻部分卷积层（如最后两个残差块）python for name, param in model.named_parameters(): if "layer4" in name or "layer3" in name: param.requires_grad = True
早停机制： ```python best_acc = 0.0 patience = 3 no_improve = 0

# 在验证循环后添加 current_acc = 100 * correct / total if current_acc > best_acc: best_acc = current_acc torch.save(model.state_dict(), 'best_model.pth') no_improve = 0 else: no_improve += 1 if no_improve >= patience: print("Early stopping") break ```

6. 模型测试与结果分析

训练完成后，我们可以在测试集上评估模型表现：

test_dataset = datasets.ImageFolder('flowers/test', val_transforms) test_loader = DataLoader(test_dataset, batch_size=32, shuffle=False) model.load_state_dict(torch.load('best_model.pth')) model.eval() correct = 0 total = 0 with torch.no_grad(): for inputs, labels in test_loader: inputs, labels = inputs.to(device), labels.to(device) outputs = model(inputs) _, predicted = torch.max(outputs.data, 1) total += labels.size(0) correct += (predicted == labels).sum().item() print(f'Test Accuracy: {100 * correct / total:.2f}%')

典型结果应该在85%-92%之间。如果准确率偏低，可以尝试： - 增加训练epoch（15-20个） - 使用更大的batch size（64或128） - 调整数据增强策略

7. 常见问题与解决方案

Q1: 运行时报CUDA out of memory错误怎么办？- 降低batch size（从32降到16） - 使用torch.cuda.empty_cache()清理缓存 - 尝试更小的模型（如ResNet9）

Q2: 验证准确率一直不提升可能是什么原因？- 检查数据集划分是否正确（某些类别可能没有训练样本） - 尝试解冻更多卷积层 - 调整学习率（可能太大或太小）

Q3: 如何将训练好的模型应用到新图片？

from PIL import Image def predict(image_path): img = Image.open(image_path) img = val_transforms(img).unsqueeze(0).to(device) model.eval() with torch.no_grad(): output = model(img) _, predicted = torch.max(output, 1) return predicted.item() # 示例：预测单张图片 class_idx = predict('test_flower.jpg') print(f'预测类别: {train_dataset.classes[class_idx]}')