12 Keras框架从零教程系列：建立自定义模型

Q: Keras框架从零教程系列：建立自定义模型适合谁读？

这是 Keras 入门 系列第 12 / 28 篇，适合正在学习Keras 入门，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-15

最近更新: 2026-06-04

分类: Keras

预计阅读: 4 分钟

阅读次数: 0

系列进度

Keras 入门 · 第 12 / 28 篇

上一篇Keras框架从零教程：构建模型之功能API 下一篇Keras框架从零教程系列：模型编译

预计阅读4 分钟

结构重点6 个

图文要点6 张

正文规模1.5k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 6 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步1. 自定义模型的基础 02第 2 步2. 创建自定义模型 03第 3 步3. 实例化和使用自定义模型 04第 4 步4. 自定义损失函数和指标（可选）05第 5 步5. 与功能API的区别

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线建立自定义模型流程图跳到对应正文位置

图 02 · 步骤建立自定义模型实操核对图跳到对应正文位置

图 03 · 配置Keras自定义模型判断卡跳到对应正文位置

图 04 · 判断Keras阅读地图卡跳到对应正文位置

图 05 · 复盘Keras框架从零教程系列：建立自定义模型应用复盘卡跳到对应正文位置

图 06 · 细节Keras框架从零教程系列：建立自定义模型应用检查卡跳到对应正文位置

自定义模型给了最大灵活性，也把更多责任交给开发者。越自由，越要写清楚输入输出和测试样例。

我会先用一小批假数据调用 call()。自定义逻辑如果没有最小测试，后续训练很难排错。

在本篇教程中，我们将学习如何在Keras框架中建立一个自定义模型。也就是说，我们会创建一个模型类，以便灵活定义神经网络的结构、前向传播逻辑，以及如何计算损失和更新权重。这为我们提供了更大的自由度，可以精确控制模型的每一个细节。

1. 自定义模型的基础

Keras提供了一个名为tf.keras.Model的基类，我们可以通过继承这个类来创建自己的模型。在自定义模型中，我们需要实现两个主要的方法：__init__()和call()。

建立 Keras 自定义模型时，先确认继承结构、层初始化、调用流程、损失计算和训练接口。

__init__(): 初始化模型的各个层。
call(): 定义前向传播的逻辑。

2. 创建自定义模型

下面是一个示例，我们将创建一个简单的神经网络，包含一个输入层、一个隐藏层和一个输出层。

《Keras框架从零教程系列：建立自定义模型》适合边看图边读正文。先确认问题和判断标准，再看概念解释与练习步骤，信息会更容易连成一条线。

import tensorflow as tf

class CustomModel(tf.keras.Model):
    def __init__(self):
        super(CustomModel, self).__init__()
        self.dense1 = tf.keras.layers.Dense(64, activation='relu')
        self.dense2 = tf.keras.layers.Dense(10, activation='softmax')

    def call(self, inputs):
        x = self.dense1(inputs)
        return self.dense2(x)

在上述代码中，我们构建了一个名为CustomModel的自定义模型。其中，dense1是一个具有64个神经元的全连接层，激活函数使用ReLU；而dense2是一个具有10个神经元的全连接层，激活函数使用softmax。这个模型可以用于多分类任务。

3. 实例化和使用自定义模型

要使用我们刚刚创建的自定义模型，我们需要实例化它并提供输入数据。注意，模型的输入应该符合我们定义的层的输入形状。

# 实例化模型
model = CustomModel()

# 创建随机输入，假设输入数据的形状是(32, 20)
input_data = tf.random.normal((32, 20))

# 进行前向传播
output = model(input_data)

print(output.shape)  # 输出的形状应该是(32, 10)

在这个例子中，我们生成了一个具有32个样本、20个特征的随机输入，并通过自定义模型进行前向传播，最终输出的结果形状为(32, 10)，这代表32个样本的10个类的预测概率。

4. 自定义损失函数和指标（可选）

在一些情况下，我们需要自定义损失函数或者指标来符合特定的需求。可以在模型的call()方法中计算损失。在Keras中，损失函数通常接受预测值和真实标签作为输入。

下面是一个简单的自定义损失函数示例：

class CustomModel(tf.keras.Model):
    def __init__(self):
        super(CustomModel, self).__init__()
        self.dense1 = tf.keras.layers.Dense(64, activation='relu')
        self.dense2 = tf.keras.layers.Dense(10, activation='softmax')

    def call(self, inputs):
        x = self.dense1(inputs)
        return self.dense2(x)

    def compute_loss(self, y_true, y_pred):
        return tf.reduce_mean(tf.keras.losses.sparse_categorical_crossentropy(y_true, y_pred))