15 机器学习小白教程系列：模型评估之过拟合与欠拟合

Q: 机器学习小白教程系列：模型评估之过拟合与欠拟合适合谁读？

这是 机器学习入门 系列第 15 / 21 篇，适合正在学习机器学习入门，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-10

最近更新: 2026-06-04

分类: 机器学习小白

预计阅读: 4 分钟

阅读次数: 0

系列进度

机器学习入门 · 第 15 / 21 篇

上一篇机器学习小白教程系列：模型评估之交叉验证下一篇机器学习项目实战之实践项目介绍

预计阅读4 分钟

结构重点8 个

图文要点6 张

正文规模1.7k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 8 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步过拟合与欠拟合的定义 02第 2 步过拟合与欠拟合的图示 03第 3 步如何检测过拟合与欠拟合 04第 4 步解决过拟合与欠拟合的方法 05第 5 步代码示例：过拟合与欠拟合实例

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线过拟合与欠拟合流程图跳到对应正文位置

图 02 · 步骤过拟合与欠拟合核对图跳到对应正文位置

图 03 · 配置机器学习过拟合欠拟合判断卡跳到对应正文位置

图 04 · 判断机器学习阅读地图卡跳到对应正文位置

图 05 · 复盘机器学习小白教程系列：模型评估之过拟合与欠拟合应用复盘卡跳到对应正文位置

图 06 · 细节机器学习小白教程系列：模型评估之过拟合与欠拟合应用检查卡跳到对应正文位置

过拟合是模型把训练集记得太细，欠拟合是模型连基本规律都没学到。判断时要同时看训练集和验证集表现。

我会画训练分数和验证分数曲线。两条线之间的距离，往往比单个准确率更能说明问题。

在上一篇教程中，我们讨论了模型评估的重要性，以及如何使用交叉验证来确保我们的模型具有良好的泛化能力。在本篇中，我们将深入探讨两个关键概念：过拟合(Overfitting)和欠拟合(Underfitting)。这两者的问题会直接影响我们的模型在未知数据上的表现，因此理解它们是每一个机器学习小白必须掌握的技能。

过拟合与欠拟合的定义

过拟合（Overfitting）：当模型在训练数据上表现得非常好，但在测试数据上表现不佳时，就发生了过拟合。过拟合通常是由于模型复杂度过高，或者训练数据量不足，导致模型学习到了训练数据中的噪声和细节。
欠拟合（Underfitting）：当模型在训练数据和测试数据上都表现不佳时，就发生了欠拟合。欠拟合通常是由于模型复杂度过低，无法捕捉数据中的潜在模式。

过拟合与欠拟合的图示

通常，我们可以通过模型的学习曲线来观察过拟合和欠拟合的现象：

过拟合：在训练曲线中，训练损失迅速降低，但验证损失在某一点后开始上升。
欠拟合：在训练和验证损失都很高且处于相近的水平。

这里是一个简单的示意图，以帮助理解这两个概念：

损失
|
|      .                .
|     .                 .
|    .                  .
|   .                   .
|  .                    .
| .                     .
|.                      .
|--------------------------> 训练轮次

过拟合：训练损失急剧下降，而验证损失在某一阶段开始上升。
欠拟合：训练损失和验证损失都保持在高水平。

如何检测过拟合与欠拟合

要检测模型的过拟合或欠拟合，可以采用以下几种方法：

交叉验证：如上一篇中提到的，交叉验证可以帮助我们更好地理解模型在不同数据子集上的表现。
学习曲线：通过绘制学习曲线，我们可以观察到模型的训练损失与验证损失之间的关系，从而判断模型是否过拟合或欠拟合。
评估指标：使用如精度、召回率、F1分数等指标来评估模型的性能。

解决过拟合与欠拟合的方法

解决过拟合的方法

减少模型复杂度：选择一个更简单的模型，或者使用正则化技术，如L1或L2正则化。

排查机器学习过拟合与欠拟合时，先比较训练误差、验证误差、特征数量、正则化和学习曲线。

from sklearn.linear_model import Ridge

model = Ridge(alpha=1.0)  # 使用L2正则化

增加训练数据：获取更多的训练数据，可以帮助模型更好地泛化。
使用Dropout：在神经网络中，可以使用Dropout层来随机丢弃部分神经元，从而减少过拟合风险。
提早停止：在训练过程中监控验证损失并提早停止训练。

解决欠拟合的方法

增加模型复杂度：选择更复杂的模型，或者增加特征数量。

from sklearn.tree import DecisionTreeRegressor

model = DecisionTreeRegressor(max_depth=None)  # 不限制树的深度

相应的数据预处理：确保特征经过适当的预处理，如标准化或归一化。
特征工程：创造新的特征，或者尝试非线性模型（如多项式回归）。

代码示例：过拟合与欠拟合实例

下面是一个简单的例子，通过使用sklearn库来展示过拟合和欠拟合的概念。我们将使用决策树回归模型来拟合数据：

《机器学习小白教程系列：模型评估之过拟合与欠拟合》可以按“场景、概念、动作、结果”来读。先把这四件事对齐，再回到正文里的参数、代码或流程。

import numpy as np
import matplotlib.pyplot as plt
from sklearn.tree import DecisionTreeRegressor
from sklearn.model_selection import train_test_split

# 生成数据
X = np.sort(np.random.rand(100))
y = np.sin(2 * np.pi * X) + np.random.normal(0, 0.1, X.shape)

# 切分数据
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 训练一个过拟合模型
model_overfit = DecisionTreeRegressor(max_depth=5)
model_overfit.fit(X_train.reshape(-1, 1), y_train)

# 训练一个欠拟合模型
model_underfit = DecisionTreeRegressor(max_depth=1)
model_underfit.fit(X_train.reshape(-1, 1), y_train)

# 预测
y_pred_overfit = model_overfit.predict(X_test.reshape(-1, 1))
y_pred_underfit = model_underfit.predict(X_test.reshape(-1, 1))

# 绘制结果
plt.figure(figsize=(12, 6))

plt.subplot(1, 2, 1)
plt.scatter(X_test, y_test, color='black')
plt.scatter(X_test, y_pred_overfit, color='red')
plt.title('Overfitting Model')

plt.subplot(1, 2, 2)
plt.scatter(X_test, y_test, color='black')
plt.scatter(X_test, y_pred_underfit, color='blue')
plt.title('Underfitting Model')

plt.show()