18 训练模型的基本步骤

Q: 训练模型的基本步骤适合谁读？

这是 TensorFlow 入门 系列第 18 / 25 篇，适合正在学习TensorFlow 入门，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-10

最近更新: 2026-06-04

分类: Tensorflow小白

预计阅读: 3 分钟

阅读次数: 0

系列进度

TensorFlow 入门 · 第 18 / 25 篇

上一篇使用Keras构建简单模型下一篇优化算法的选择

预计阅读3 分钟

结构重点6 个

图文要点6 张

正文规模1.3k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 6 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步1. 准备数据 02第 2 步2. 定义损失函数 03第 3 步3. 选择优化器 04第 4 步4. 训练模型 05第 5 步5. 评估模型

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线训练模型的基本步骤结构图跳到对应正文位置

图 02 · 步骤训练模型的基本步骤核对图跳到对应正文位置

图 03 · 配置训练模型基本步骤判断卡跳到对应正文位置

图 04 · 判断TensorFlow阅读地图卡跳到对应正文位置

图 05 · 复盘训练模型的基本步骤应用复盘卡跳到对应正文位置

图 06 · 细节训练模型的基本步骤应用检查卡跳到对应正文位置

TensorFlow 学习要把张量、模型、训练和部署放在一条线上，而不是只看单段代码。阅读时可以按「准备数据 -> 定义损失函数 -> 选择优化器 -> 训练模型」建立结构，再回到正文里的代码、案例或指标做验证。

读完后，用一个真实小任务复查：输入是什么，处理环节在哪里，输出是否可验收；失败时先查「准备数据」，再查「定义损失函数」。

在上一章中，我们详细探讨了如何使用 Keras 构建一个简单的模型。这一章将重点阐述训练模型的基本步骤。当你构建了模型之后，接下来就需要让模型学习从数据中提取特征并进行预测。训练模型的过程主要包括以下几个步骤：

准备数据
定义损失函数
选择优化器
训练模型
评估模型

接下来，我们将逐步展开这些步骤，并结合一些代码示例。

1. 准备数据

在开始训练之前，需要准备好数据集。数据集可以是图像、文本或任何其他类型的数据。通常，数据集会被分为训练集、验证集和测试集。这里我们以一个简单的图像分类任务为例，使用 MNIST 数据集。

理解 TensorFlow 训练步骤时，先看数据加载、模型定义、compile、fit、验证指标、保存和复测。

import tensorflow as tf
from tensorflow.keras.datasets import mnist

# 加载 MNIST 数据集
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 数据预处理
x_train = x_train.astype('float32') / 255.0  # 归一化到 [0, 1]
x_test = x_test.astype('float32') / 255.0

# 变形
x_train = x_train.reshape(-1, 28, 28, 1)  # 添加通道维
x_test = x_test.reshape(-1, 28, 28, 1)

2. 定义损失函数

损失函数用于度量预测值与真实值之间的差距。在分类任务中，通常选择 sparse_categorical_crossentropy 作为损失函数。

看《训练模型的基本步骤》时，先把图中的问题、关键词、操作和验收标准对上，再读正文会更省力。读完后，最好能用自己的项目重新讲一遍。

定义损失函数的代码如下：

loss_function = 'sparse_categorical_crossentropy'

3. 选择优化器

优化器用于更新模型的权重，以最小化损失函数。在 Keras 中，常见的优化器包括 SGD、Adam 等。我们通常推荐从 Adam 开始，因为它在大多数情况下表现优越。

选择优化器的代码示例：

optimizer = tf.keras.optimizers.Adam()

4. 训练模型

整合以上步骤并训练模型。使用 fit 方法，我们将训练数据传递给模型，并指定训练的轮数和批次大小。

# 定义模型
model = tf.keras.models.Sequential([
    tf.keras.layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    tf.keras.layers.MaxPooling2D(pool_size=(2, 2)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

# 编译模型
model.compile(optimizer=optimizer, loss=loss_function, metrics=['accuracy'])

# 训练模型
history = model.fit(x_train, y_train, validation_split=0.2, epochs=5, batch_size=64)

在上面的代码中，我们定义了一个简单的卷积神经网络，并使用训练数据进行模型训练。validation_split 用于在训练时从训练集分出一部分数据进行验证。

5. 评估模型

训练完成后，我们需要对模型进行评估，通常使用测试集来验证模型的性能：

test_loss, test_accuracy = model.evaluate(x_test, y_test)
print(f'测试损失: {test_loss}, 测试准确度: {test_accuracy}')

这一过程将输出模型在测试集上的损失和准确度，帮助我们了解模型的泛化能力。

学完《训练模型的基本步骤》后，不妨换一个自己的场景试一次，重点观察输入、处理和输出是否能对应起来。

如果想把《训练模型的基本步骤》用到自己的任务里，可以先缩小场景，只验证一个最关键的判断点。

总结

在本章中，我们介绍了训练模型的基本步骤，包括准备数据、定义损失函数、选择优化器、训练模型和评估模型。掌握这些步骤是使用 Keras 进行深度学习的基础。通过不断的实践，你将能够更好地理解和应用这些概念。

随着对模型训练过程的理解加深，下一章我们将探讨优化算法的选择，帮助你更深入地掌握模型训练的细节和技术。

继续阅读

从这篇继续找到相关教程

AI 教程总索引

TensorFlow 入门教程目录25 篇按顺序阅读本系列图文节点6 个位置可直达 AI 图文教程索引按主题继续找可复现教程 AI 图文教程全量清单浏览全部已整理教程跨领域 AI 文章入口继续找其它技术系列里的 AI 章节 AI 教程图片索引6 张图文节点

常见问题

读前先确认这三点

训练模型的基本步骤适合谁读？

这是 TensorFlow 入门系列第 18 / 25 篇，适合正在学习TensorFlow 入门，并且需要把概念落到操作步骤或判断标准里的读者。

读这篇TensorFlow 入门教程要多久？

按中文技术文章阅读速度估算，通读大约 3 分钟；如果要跟着复现，建议把命令、配置和结果检查分开做。

这篇文章里的图文节点怎么用？

正文里有 6 个图文节点，可以先用它们抓住流程、配置和判断点，再回到对应段落细读。

分享文章

微信/朋友圈可先复制链接

微博 X LinkedIn Facebook Telegram 邮件

继续找到相关 AI 教程

返回栏目

继续学习优化算法的选择TensorFlow 入门 · 第 19 篇 · 6 张图 · 1.7k 字

图文补读Keras简介TensorFlow 入门 · 6 张图 · 1.9k 字，适合回看流程和判断点。AI 教程总索引全部 AI 教程文章按大模型、Agent、本地部署、机器学习和工程实践继续查找相关文章。AI 图文教程索引按流程和判断点找教程先看每篇文章里的流程、配置和复盘节点，再回到原文细读。跨领域 AI 入口其它技术系列里的 AI 章节从大数据、爬虫、量子计算和 Spark 章节继续找 AI 内容。AI 教程图片索引按图查找教程文章从流程图、配置图和判断卡片直接定位对应文章。TensorFlow 入门目录TensorFlow 入门完整目录按顺序查看全部小节、图文密度和后续阅读路线。

18 训练模型的基本步骤

TensorFlow 入门 · 第 18 / 25 篇

这篇内容怎么整理

先按这条路线读

先看本文图文节点

1. 准备数据

2. 定义损失函数

3. 选择优化器

4. 训练模型

5. 评估模型

总结

从这篇继续找到相关教程

读前先确认这三点

训练模型的基本步骤适合谁读？

读这篇TensorFlow 入门教程要多久？

这篇文章里的图文节点怎么用？

继续找到相关 AI 教程

读者留言

留言列表

18 训练模型的基本步骤

TensorFlow 入门 · 第 18 / 25 篇

这篇内容怎么整理

先按这条路线读

先看本文图文节点

1. 准备数据

2. 定义损失函数

3. 选择优化器

4. 训练模型

5. 评估模型

总结

从这篇继续找到相关教程

读前先确认这三点

训练模型的基本步骤适合谁读？

读这篇TensorFlow 入门教程要多久？

这篇文章里的图文节点怎么用？

转发到常用平台

从相近问题继续读

继续找到相关 AI 教程

读者留言

留言列表