小白必看！Qwen2.5-7B-Instruct保姆级微调教学-智慧文博士

小白必看！Qwen2.5-7B-Instruct保姆级微调教学

想用大模型但不知道怎么训练？这篇教程手把手教你用LLaMA-Factory微调Qwen2.5-7B-Instruct，从零开始打造专属AI助手！

1. 前言：为什么需要微调大模型？

你有没有遇到过这样的情况：用现成的大模型聊天，但它总是不太懂你的需求？或者回答的风格不是你想要的？这就是我们需要微调的原因。

微调就像是给大模型"开小灶"，让它专门学习你的数据和需求。比如你想让模型成为专业的客服助手，或者学会特定的写作风格，微调就能帮你实现。

今天我要教大家用LLaMA-Factory这个工具，来微调阿里通义千问的Qwen2.5-7B-Instruct模型。这个模型有70亿参数，能力很强，但通过微调，我们可以让它变得更懂你！

2. 准备工作：环境和数据准备

2.1 硬件要求

首先看看你的电脑配置够不够：

GPU：至少需要一张显存16GB以上的显卡（教程用的是V100 32GB）
内存：建议32GB以上
硬盘：至少需要50GB空闲空间（模型文件很大）

2.2 软件环境安装

我们来一步步搭建环境：

# 创建Python虚拟环境 conda create -n llama_factory python=3.10 conda activate llama_factory # 下载LLaMA-Factory git clone https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory # 安装依赖包 pip install -e ".[torch,metrics]" -i https://pypi.tuna.tsinghua.edu.cn/simple pip install flash-attn==2.6.3 bitsandbytes==0.43.1 deepspeed==0.14.4

2.3 准备训练数据

训练数据就像给模型的"教材"，质量很重要。我们准备一个简单的聊天数据集：

[ { "system": "你是一名优秀的陪聊大师，你的名字叫小蜜。", "conversations": [ {"from": "user", "value": "您和模型关系?"}, {"from": "assistant", "value": "其实我也不是无所不知，但如果能和你多聊几句，我情愿绞尽脑汁。"} ] }, { "system": "你是一名优秀的陪聊大师，你的名字叫小蜜。", "conversations": [ {"from": "user", "value": "请问一下您身份是啥?"}, {"from": "assistant", "value": "我是小蜜，任何时间！任何地点！不论什么事，只要你有疑问都可以来问我哦~"} ] } ]

把数据文件保存为qwen_zh_demo.json，放在LLaMA-Factory/data/目录下。

3. 配置训练参数

3.1 创建配置文件

在LLaMA-Factory/examples/train_lora/目录下创建配置文件qwen2.5_lora_sft.yaml：

### 模型设置 model_name_or_path: /你的/模型/路径/qwen2.5-7b-instruct ### 训练方法 stage: sft do_train: true finetuning_type: lora lora_target: all ### 数据集设置 dataset: qwen_zh_demo template: qwen cutoff_len: 4096 max_samples: 4019 overwrite_cache: true preprocessing_num_workers: 16 ### 输出设置 output_dir: /你的/输出/路径/sft/qwen2.5-7b-instruct logging_steps: 10 save_steps: 500 plot_loss: true overwrite_output_dir: true ### 训练参数 per_device_train_batch_size: 1 gradient_accumulation_steps: 8 learning_rate: 1.0e-4 num_train_epochs: 2.0 lr_scheduler_type: cosine warmup_ratio: 0.1 bf16: true ### 评估设置 val_size: 0.1 per_device_eval_batch_size: 1 eval_strategy: steps eval_steps: 500

3.2 重要参数说明

batch_size: 每次训练用的数据量，显存小就设小一点
learning_rate: 学习率，太大容易学歪，太小学得慢
num_train_epochs: 训练轮数，一般2-3轮就够了

4. 开始训练！

一切准备就绪，现在开始训练：

conda activate llama_factory cd LLaMA-Factory llamafactory-cli train examples/train_lora/qwen2.5_lora_sft.yaml

训练开始后，你会看到这样的输出：

Loading checkpoint shards: 100%|██████████| 4/4 [01:44<00:00, 26.14s/it] trainable params: 20,185,088 || all params: 7,635,801,600 || trainable%: 0.2643

这说明模型加载成功，只有0.26%的参数需要训练（这就是LoRA的高效之处！）。

训练过程中会显示进度条和损失值变化：

22%|██▏ | 100/452 [1:01:02<3:36:40, 36.93s/it] {'loss': 2.3396, 'learning_rate': 9.56e-05, 'epoch': 0.22}

看到损失值在不断下降，说明模型正在学习！

5. 训练结果分析

训练完成后，我们来看看效果：

5.1 损失曲线

训练完成后会生成损失曲线图，你可以看到：

训练损失从2.34下降到1.48
验证损失从2.26下降到1.54

这说明模型确实学到了东西，而且没有过拟合。

5.2 模型输出对比

微调前：用户：你好，你是谁？模型：我是一个AI助手...

微调后：用户：你好，你是谁？模型：我是小蜜，任何时间！任何地点！不论什么事，只要你有疑问都可以来问我哦~

看到区别了吗？微调后的回答更有个性了！

6. 常见问题解答

6.1 训练太慢了怎么办？

如果训练速度慢，可以：

减小batch_size
减小gradient_accumulation_steps
使用更小的模型（如Qwen2.5-3B）

6.2 显存不够怎么办？

如果出现显存不足（OOM）错误：

减小batch_size
使用梯度检查点（gradient checkpointing）
尝试使用4bit或8bit量化

6.3 模型效果不好怎么办？

如果微调效果不理想：

检查数据质量，确保数据准确且有代表性
调整学习率，试试更小或更大的值
增加训练数据量
多训练几轮

7. 总结

通过这篇教程，我们学会了：

环境搭建：准备好了训练需要的软件环境
数据准备：制作了高质量的训练数据
参数配置：设置了合适的训练参数
模型训练：成功微调了Qwen2.5-7B模型
结果验证：确认模型学到了我们想要的能力

微调大模型听起来很高大上，但其实并不难。关键是准备好质量高的数据，设置合适的参数，然后耐心等待训练完成。

现在你已经掌握了微调的基本技能，可以尝试用自己的数据来训练专属AI助手了！无论是客服机器人、写作助手还是专业顾问，都可以通过微调来实现。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

小白必看！Qwen2.5-7B-Instruct保姆级微调教学