13 Keras框架从零教程系列：模型编译

Q: Keras框架从零教程系列：模型编译适合谁读？

这是 Keras 入门 系列第 13 / 28 篇，适合正在学习Keras 入门，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-15

最近更新: 2026-06-04

分类: Keras

预计阅读: 4 分钟

阅读次数: 0

系列进度

Keras 入门 · 第 13 / 28 篇

上一篇Keras框架从零教程系列：建立自定义模型下一篇Keras框架从零教程：训练模型

预计阅读4 分钟

结构重点9 个

图文要点6 张

正文规模1.6k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 9 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步1. 模型编译的过程 02第 2 步2. 优化器的选择 03第 3 步3. 常见损失函数 04第 4 步4. 评估指标 05第 5 步5. 小结

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线模型编译流程图跳到对应正文位置

图 02 · 步骤模型编译实操核对图跳到对应正文位置

图 03 · 配置Keras模型编译判断卡跳到对应正文位置

图 04 · 判断Keras阅读地图卡跳到对应正文位置

图 05 · 复盘Keras框架从零教程系列：模型编译应用复盘卡跳到对应正文位置

图 06 · 细节Keras框架从零教程系列：模型编译应用检查卡跳到对应正文位置

compile 是把训练目标说清楚：用什么优化器，优化哪个 loss，用哪些指标观察表现。

我会检查 loss 是否匹配任务。分类、回归、多标签和多输出任务，编译配置不能混用。

在上一篇中，我们讨论了如何建立自定义模型，现在我们将介绍Keras框架中“模型编译”的过程。编译模型是训练深度学习网络之前的重要步骤，它涉及到选择优化器、损失函数和评估指标。

1. 模型编译的过程

在Keras中，模型的编译是通过调用模型对象的compile方法来完成的。该方法接受以下几个主要参数：

编译 Keras 模型时，先确认任务类型、损失函数、优化器、学习率、评估指标和输出层形状。

optimizer：指定要使用的优化器，例如'adam'或'sgd'。
loss：用于计算训练过程中损失的函数，通常根据任务类型选择（如binary_crossentropy用于二分类，categorical_crossentropy用于多分类）。
metrics：评估模型性能的指标，常用的指标有accuracy。

1.1 示例代码

假设我们已经定义了一个简单的神经网络模型，下面是如何编译它的示例：

from keras.models import Sequential
from keras.layers import Dense

# 构建一个简单的神经网络模型
model = Sequential()
model.add(Dense(64, activation='relu', input_shape=(32,))) # 输入层
model.add(Dense(1, activation='sigmoid'))  # 输出层 (二分类)

# 编译模型
model.compile(optimizer='adam',
              loss='binary_crossentropy',
              metrics=['accuracy'])

在上述代码中，我们使用了以下内容：

优化器：使用'adam'优化器，它是一种自适应学习率优化器，通常效果良好。
损失函数：对于二分类问题，我们使用了'binary_crossentropy'，它能够有效衡量预测值与真实值之间的差异。
评估指标：选择了'accuracy'作为评估指标，便于我们在训练和验证过程中了解模型的性能。

2. 优化器的选择

选择合适的优化器对于模型的训练至关重要。Keras提供了多种优化器，以下是几种常用的优化器及其说明：

《Keras框架从零教程系列：模型编译》这类内容容易被细节带偏。先看图里的主线，再回到正文核对环境、输入、输出和判断标准。

SGD（随机梯度下降）：经典的优化方法，适用于许多任务。可以结合动量使用。
Adam：结合了动量和自适应学习率的方法，通常是推荐的默认选择。
RMSprop：在RNN中表现良好，对衰减梯度尤为有效。

2.1 优化器的参数

优化器通常可以接受一些参数，例如学习率（learning_rate）等。我们可以通过以下方式自定义优化器：

from keras.optimizers import Adam

# 自定义学习率
adam_optimizer = Adam(learning_rate=0.001)

# 编译模型时使用自定义优化器
model.compile(optimizer=adam_optimizer,
              loss='binary_crossentropy',
              metrics=['accuracy'])

3. 常见损失函数

选择合适的损失函数是确保模型准确性的关键。以下是一些常见损失函数及其适用场景：

二分类：binary_crossentropy
多分类：categorical_crossentropy
回归问题：mean_squared_error

3.1 示例：多分类损失函数

如果我们用的是多分类模型（例如分类10种不同的图片），我们可以选择categorical_crossentropy来编译模型：

# 假设输出层有10个神经元，表示10个分类
model.add(Dense(10, activation='softmax'))

# 使用categorical_crossentropy损失函数
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

4. 评估指标

除了accuracy之外，Keras还支持多种评估指标，例如precision、recall和F1-score。选择合适的评估指标可以提供更全面的模型性能视图。

4.1 自定义评估指标

我们可以定义自定义评估指标并在编译时使用它们：

def precision(y_true, y_pred):
    true_pos = K.sum(K.round(K.clip(y_true * y_pred, 0, 1)))
    predicted_pos = K.sum(K.round(K.clip(y_pred, 0, 1)))
    return true_pos / (predicted_pos + K.epsilon())

# 编译模型时使用自定义评估指标
model.compile(optimizer='adam',
              loss='binary_crossentropy',
              metrics=[precision])