21 调优技巧

Q: 调优技巧适合谁读？

这是 TensorFlow 入门 系列第 21 / 25 篇，适合正在学习TensorFlow 入门，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-10

最近更新: 2026-06-04

分类: Tensorflow小白

预计阅读: 3 分钟

阅读次数: 0

系列进度

TensorFlow 入门 · 第 21 / 25 篇

预计阅读3 分钟

结构重点8 个

图文要点6 张

正文规模1.3k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 8 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步1. 超参数调优 02第 2 步2. 正则化 03第 3 步3. 提前停止 04第 4 步4. 数据增强 05第 5 步5. 集成学习

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线调优技巧结构图跳到对应正文位置

图 02 · 步骤调优技巧核对图跳到对应正文位置

图 03 · 配置TensorFlow调优技巧判断卡跳到对应正文位置

图 04 · 判断TensorFlow阅读地图卡跳到对应正文位置

图 05 · 复盘调优技巧应用复盘卡跳到对应正文位置

图 06 · 细节调优技巧应用检查卡跳到对应正文位置

TensorFlow 学习要把张量、模型、训练和部署放在一条线上，而不是只看单段代码。阅读时可以按「超参数调优 -> 网格搜索 -> 随机搜索 -> 正则化」建立结构，再回到正文里的代码、案例或指标做验证。

读完后，用一个真实小任务复查：输入是什么，处理环节在哪里，输出是否可验收；失败时先查「超参数调优」，再查「网格搜索」。

在上一章中，我们讨论了模型评估方法，了解了如何通过各种指标来衡量模型的性能。在这一章，我们将探索模型的调优技巧，以进一步提高模型的准确性和鲁棒性。模型调优可以帮助我们更好地利用数据，改善模型在未知数据上的表现。让我们深入研究一些常用的调优技巧。

1. 超参数调优

超参数是指在训练过程开始之前设置的参数，例如学习率、批量大小和网络结构等。超参数的选择对模型的最终性能有很大影响。以下是一些常用的超参数调优策略：

调优 TensorFlow 模型时，先看学习率、batch size、正则化、数据增强、回调监控和验证曲线。

网格搜索

网格搜索是一种常用的超参数调优方法，它通过指定超参数的范围并遍历所有可能的组合来寻找最佳超参数。下面是一个简单的示例：

from sklearn.model_selection import GridSearchCV
from sklearn.ensemble import RandomForestClassifier

# 指定超参数范围
param_grid = {
    'n_estimators': [50, 100, 200],
    'max_depth': [None, 10, 20, 30]
}

# 创建随机森林分类器
rf = RandomForestClassifier()

# 进行网格搜索
grid_search = GridSearchCV(estimator=rf, param_grid=param_grid, cv=5)
grid_search.fit(X_train, y_train)

# 输出最佳超参数
print("Best parameters: ", grid_search.best_params_)

随机搜索

随机搜索通过随机选择超参数组合进行评估，相较于网格搜索，它可能更加高效。下面是一个使用 RandomizedSearchCV 的示例：

from sklearn.model_selection import RandomizedSearchCV
from scipy.stats import uniform

# 定义超参数范围
param_distributions = {
    'n_estimators': [50, 100, 200],
    'max_depth': [None, 10, 20, 30],
    'min_samples_split': uniform(0.01, 0.2)
}

# 创建随机森林分类器
rf = RandomForestClassifier()

# 进行随机搜索
random_search = RandomizedSearchCV(estimator=rf, param_distributions=param_distributions, n_iter=100, cv=5, random_state=42)
random_search.fit(X_train, y_train)

# 输出最佳超参数
print("Best parameters: ", random_search.best_params_)

2. 正则化

正则化是防止模型过拟合的重要技术。典型的正则化方法包括 L1 正则化（Lasso）和 L2 正则化（Ridge）。我们可以通过增加正则化项来控制模型复杂度。以下是 L2 正则化的示例代码：

读完《调优技巧》不要只停在“看懂了”。回头挑一个步骤动手做一遍，再记录哪里卡住，后面的学习会更稳。

from tensorflow import keras
from tensorflow.keras import layers

# 构建模型
model = keras.Sequential([
    layers.Dense(64, activation='relu', kernel_regularizer=keras.regularizers.l2(0.01), input_shape=(input_dim,)),
    layers.Dense(1)
])

model.compile(optimizer='adam', loss='mean_squared_error')
model.fit(X_train, y_train, epochs=10, batch_size=32)

3. 提前停止

提前停止是一种有效的防止过拟合的方法。当验证集的性能不再提高时，我们可以停止训练。下面是一个使用 ModelCheckpoint 和 EarlyStopping 回调的示例：

from tensorflow.keras.callbacks import EarlyStopping

# 定义提前停止
early_stopping = EarlyStopping(monitor='val_loss', patience=5)

# 训练模型
model.fit(X_train, y_train, validation_data=(X_val, y_val), epochs=50, batch_size=32, callbacks=[early_stopping])

4. 数据增强

在计算机视觉领域，数据增强是一种生成更多样本的有效方法，可以减轻过拟合问题。通过对训练图像进行随机旋转、缩放或翻转等操作，我们可以扩展训练集。以下是 Keras 中数据增强的示例：

from tensorflow.keras.preprocessing.image import ImageDataGenerator

# 创建数据增强实例
datagen = ImageDataGenerator(rotation_range=40, width_shift_range=0.2, height_shift_range=0.2, shear_range=0.2,
                             zoom_range=0.2, horizontal_flip=True, fill_mode='nearest')

# 生成增强后的图像
datagen.fit(X_train)

# 在训练模型时使用数据生成器
model.fit(datagen.flow(X_train, y_train, batch_size=32), epochs=50)

5. 集成学习

集成学习的思想是将多个模型的预测结果组合起来，以提高性能。例如，我们可以使用 bagging 或 boosting 方法。下面是一个使用 VotingClassifier 的示例：

from sklearn.ensemble import VotingClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier

# 创建基学习器
log_clf = LogisticRegression()
tree_clf = DecisionTreeClassifier()

# 创建投票分类器
voting_clf = VotingClassifier(estimators=[('lr', log_clf), ('dt', tree_clf)], voting='soft')
voting_clf.fit(X_train, y_train)