17 Pytorch小白从零学教程：模型评估与调优之过拟合与正则化

Q: Pytorch小白从零学教程：模型评估与调优之过拟合与正则化适合谁读？

这是 PyTorch 入门 系列第 17 / 20 篇，适合正在学习PyTorch 入门，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-10

最近更新: 2026-06-04

分类: Pytorch小白

预计阅读: 4 分钟

阅读次数: 0

系列进度

PyTorch 入门 · 第 17 / 20 篇

上一篇PyTorch小白从零学教程系列：模型评估与调优之评估模型性能下一篇模型超参数调优

预计阅读4 分钟

结构重点9 个

图文要点6 张

正文规模1.5k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 9 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步什么是过拟合？02第 2 步如何识别过拟合？03第 3 步过拟合的解决方案与正则化 04第 4 步小结

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线过拟合与正则化流程图跳到对应正文位置

图 02 · 步骤过拟合与正则化核对图跳到对应正文位置

图 03 · 配置PyTorch过拟合正则化判断卡跳到对应正文位置

图 04 · 判断PyTorch阅读地图卡跳到对应正文位置

图 05 · 复盘Pytorch小白从零学教程：模型评估与调优之过拟合与正则化应用复盘卡跳到对应正文位置

图 06 · 细节Pytorch小白从零学教程：模型评估与调优之过拟合与正则化应用检查卡跳到对应正文位置

过拟合通常表现为训练集越来越好，验证集开始变差。正则化、数据增强、早停和更好的划分都可以帮助模型泛化。

我会画训练 loss 和验证 loss 两条线。两条线之间的距离，比单个最终分数更能说明问题。

在上一篇中，我们讨论了如何评估模型性能，对于深度学习任务而言，模型的性能不仅要评估它在训练集上的表现，同时也要关注其在验证集和测试集上的表现。然而，在评估模型性能时，我们常常会遇到一个问题：过拟合。本篇将深入探讨过拟合的原因，并介绍一些有效的正则化技术，以帮助你构建更具泛化能力的模型。

什么是过拟合？

过拟合是指模型在训练集上表现优异，但在验证集或测试集上表现较差的现象。简单来说，就是模型“记住”了训练样本的细节，却未能学到更具普遍性的特征。

排查 PyTorch 过拟合时，先比较训练验证曲线，再调整权重衰减、Dropout、数据增强和早停策略。

过拟合的例子

假设我们在进行手写数字识别的问题，我们有一个包含大量数字图像的数据集。如果我们构建一个太复杂的模型（例如，层数过多、神经元过多的深度神经网络），它得到了极低的训练误差，但在一个新的测试集上，即使是对一些简单数字的识别，它的表现却很糟糕。这就是过拟合——模型“学习”了训练集中的噪声和偶然性，而未能理解数据的本质。

我们可以通过以下图示理解过拟合和欠拟合：

欠拟合: 模型复杂度不足，未能捕捉数据的趋势。
适应良好: 模型能够在训练和验证集上都表现良好。
过拟合: 模型复杂度过高，训练集上表现极好，但验证集上表现不佳。

如何识别过拟合？

我们可以通过观察训练和验证误差来识别过拟合。当训练误差持续下降而验证误差开始上升时，模型很可能已经出现了过拟合。

读《Pytorch小白从零学教程：模型评估与调优之过拟合与正则化》时，可以先看配图里的任务、概念、练习和判断点，再回到正文补细节。这样更容易判断这篇内容能放到哪个真实场景里。

import matplotlib.pyplot as plt

# 假设你有训练和验证历史
train_losses = [...]  # 训练损失
val_losses = [...]    # 验证损失

plt.plot(train_losses, label='训练损失')
plt.plot(val_losses, label='验证损失')
plt.xlabel('epoch')
plt.ylabel('损失')
plt.legend()
plt.title('训练与验证损失')
plt.show()

过拟合的解决方案与正则化

1. 使用更多的数据

最简单而有效的解决方法就是增加训练数据量，给模型提供更多样的样本，以减少对特定训练样本的依赖。

2. 数据增强

当获取更多数据不切实际时，可以使用数据增强来对现有数据进行变换，增加样本多样性。例如，翻转、缩放、旋转等操作。

from torchvision import transforms

# 假设你在处理图像数据
augmentation_transforms = transforms.Compose([
    transforms.RandomHorizontalFlip(),
    transforms.RandomRotation(10),
    transforms.ToTensor(),
])

# 应用变换到你的数据集中

3. 正则化技术

正则化是防止过拟合的重要手段，常用的正则化技术有：

L2 正则化（权重衰减）

通过在损失函数中加入权重的L2范数来限制模型复杂度，通常在优化器中添加weight_decay参数。

import torch.optim as optim

model = ...  # Your model
optimizer = optim.Adam(model.parameters(), lr=0.001, weight_decay=1e-5)  # 添加L2正则化

Dropout

Dropout 是一种随机失活神经元的技术，用于减少神经网络的过拟合。

import torch.nn as nn

class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        self.fc1 = nn.Linear(784, 128)
        self.dropout = nn.Dropout(0.5)  # 50%的失活

    def forward(self, x):
        x = torch.relu(self.fc1(x))
        x = self.dropout(x)  # 在训练时进行Dropout
        return x

4. 提前停止（Early Stopping）

在验证集上监控模型性能，当性能不再提高时，可以停止训练以避免过拟合。

best_val_loss = float('inf')
patience = 5  # 容忍的epoch数
counter = 0

for epoch in range(num_epochs):
    train(...)
    val_loss = validate(...)

    if val_loss < best_val_loss:
        best_val_loss = val_loss
        counter = 0  # 重置计数器
        # 保存模型
    else:
        counter += 1
        if counter >= patience:
            print("提前停止训练")
            break

复习《Pytorch小白从零学教程：模型评估与调优之过拟合与正则化》时，建议把关键概念、操作步骤和可见结果放在同一页里回看。

练习《Pytorch小白从零学教程：模型评估与调优之过拟合与正则化》时，建议把输入条件、处理动作和可见结果写在一起，方便下次复查。

小结

这篇文章讨论了过拟合的概念及其识别方法，并介绍了几种常用的正则化技巧，如L2正则化、Dropout和提前停止技术。通过这些策略，可以有效地提高模型的泛化能力，为后续的超参数调优奠定基础。

在下一篇中，我们将深入探讨模型超参数的调优，帮助你更好地优化模型性能。如果你有任何疑问或想法，欢迎留言讨论！

继续阅读

从这篇继续找到相关教程

AI 教程总索引

PyTorch 入门教程目录20 篇按顺序阅读本系列图文节点6 个位置可直达 AI 图文教程索引按主题继续找可复现教程 AI 图文教程全量清单浏览全部已整理教程跨领域 AI 文章入口继续找其它技术系列里的 AI 章节 AI 教程图片索引6 张图文节点

常见问题

读前先确认这三点

Pytorch小白从零学教程：模型评估与调优之过拟合与正则化适合谁读？

这是 PyTorch 入门系列第 17 / 20 篇，适合正在学习PyTorch 入门，并且需要把概念落到操作步骤或判断标准里的读者。

读这篇PyTorch 入门教程要多久？

按中文技术文章阅读速度估算，通读大约 4 分钟；如果要跟着复现，建议把命令、配置和结果检查分开做。

这篇文章里的图文节点怎么用？

正文里有 6 个图文节点，可以先用它们抓住流程、配置和判断点，再回到对应段落细读。

分享文章

微信/朋友圈可先复制链接

微博 X LinkedIn Facebook Telegram 邮件

继续找到相关 AI 教程

返回栏目

继续学习模型超参数调优PyTorch 入门 · 第 18 篇 · 6 张图 · 1.4k 字

图文补读PyTorch小白从零学教程系列：模型训练之选择优化器PyTorch 入门 · 6 张图 · 1.9k 字，适合回看流程和判断点。AI 教程总索引全部 AI 教程文章按大模型、Agent、本地部署、机器学习和工程实践继续查找相关文章。AI 图文教程索引按流程和判断点找教程先看每篇文章里的流程、配置和复盘节点，再回到原文细读。跨领域 AI 入口其它技术系列里的 AI 章节从大数据、爬虫、量子计算和 Spark 章节继续找 AI 内容。AI 教程图片索引按图查找教程文章从流程图、配置图和判断卡片直接定位对应文章。PyTorch 入门目录PyTorch 入门完整目录按顺序查看全部小节、图文密度和后续阅读路线。

17 Pytorch小白从零学教程：模型评估与调优之过拟合与正则化

PyTorch 入门 · 第 17 / 20 篇

这篇内容怎么整理

先按这条路线读

先看本文图文节点

什么是过拟合？

过拟合的例子

如何识别过拟合？

过拟合的解决方案与正则化

1. 使用更多的数据

2. 数据增强

3. 正则化技术

L2 正则化（权重衰减）

Dropout

4. 提前停止（Early Stopping）

小结

从这篇继续找到相关教程

读前先确认这三点

Pytorch小白从零学教程：模型评估与调优之过拟合与正则化适合谁读？

读这篇PyTorch 入门教程要多久？

这篇文章里的图文节点怎么用？

继续找到相关 AI 教程

读者留言

留言列表

17 Pytorch小白从零学教程：模型评估与调优之过拟合与正则化

PyTorch 入门 · 第 17 / 20 篇

这篇内容怎么整理

先按这条路线读

先看本文图文节点

什么是过拟合？

过拟合的例子

如何识别过拟合？

过拟合的解决方案与正则化

1. 使用更多的数据

2. 数据增强

3. 正则化技术

L2 正则化（权重衰减）

Dropout

4. 提前停止（Early Stopping）

小结

从这篇继续找到相关教程

读前先确认这三点

Pytorch小白从零学教程：模型评估与调优之过拟合与正则化适合谁读？

读这篇PyTorch 入门教程要多久？

这篇文章里的图文节点怎么用？

转发到常用平台

从相近问题继续读

继续找到相关 AI 教程

读者留言

留言列表