10 GAN网络训练过程中的数据准备与预处理

Q: GAN网络训练过程中的数据准备与预处理适合谁读？

这是 GAN 网络教程 系列第 10 / 21 篇，适合正在学习GAN 网络教程，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-10

最近更新: 2026-06-04

分类: GAN网络从零教程

预计阅读: 3 分钟

阅读次数: 0

系列进度

GAN 网络教程 · 第 10 / 21 篇

上一篇只生成构建第一个GAN之编写判别器模型下一篇GAN的训练过程之训练循环的实现

预计阅读3 分钟

结构重点8 个

图文要点6 张

正文规模1.4k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 8 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步1. 数据集选择 02第 2 步2. 数据加载 03第 3 步3. 数据预处理 04第 4 步4. 数据集拆分（可选）05第 5 步5. 小结

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线GAN网络训练过程中的数据准备与预处理结构图跳到对应正文位置

图 02 · 步骤GAN网络训练过程中的数据准备与预处理核对图跳到对应正文位置

图 03 · 配置GAN数据准备判断卡跳到对应正文位置

图 04 · 判断生成对抗网络阅读地图卡跳到对应正文位置

图 05 · 复盘GAN网络训练过程中的数据准备与预处理应用复盘卡跳到对应正文位置

图 06 · 细节GAN网络训练过程中的数据准备与预处理应用检查卡跳到对应正文位置

GAN 的关键是生成器和判别器互相推动，学习时要同时看结构、训练和样本质量。阅读时可以按「数据集选择 -> 数据加载 -> 数据预处理 -> 标准化」建立结构，再回到正文里的代码、案例或指标做验证。

读完后，用一个真实小任务复查：输入是什么，处理环节在哪里，输出是否可验收；失败时先查「数据集选择」，再查「数据加载」。

在上一篇中，我们讨论了如何构建一个简单的判别器模型，它是生成对抗网络（GAN）中的一个重要组成部分。而在构建了判别器后，下一步是为我们训练该模型准备数据。数据准备与预处理不仅能提高训练效率，还能有助于获得更好的生成效果。本文将深入探讨GAN的训练过程中的数据准备与预处理步骤，确保您的数据集能有效驱动网络学习。

1. 数据集选择

首先，我们需要选择一个合适的数据集。常用的图像数据集包括：

训练 GAN 前，先核对图像尺寸、归一化方式、数据数量、类别分布、增强策略和输出目录。

MNIST：手写数字数据集，非常适合于初学者实验GAN。
CIFAR-10：包含十类物体的小图像数据集，适合用于生成彩色图像的模型。
CelebA：包含数万张名人面孔的图片，适合高质量人脸生成。

在本教程中，我们将以MNIST数据集为例，展示如何准备和预处理数据。

2. 数据加载

我们可以利用深度学习框架（如 TensorFlow 或 PyTorch）中的数据加载功能来加载数据集。以下是使用PyTorch加载MNIST数据集的代码示例：

读完《GAN网络训练过程中的数据准备与预处理》后，可以回头问三件事：它解决什么问题，哪一步最容易出错，自己能否拿一个小例子跑通。

import torch
from torchvision import datasets, transforms

# 数据预处理的转换流程
transform = transforms.Compose([
    transforms.ToTensor(),  # 将图像转换为Tensor
    transforms.Normalize((0.5,), (0.5,))  # 归一化，将数据标准化到[-1, 1]
])

# 加载MNIST数据集
train_dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=64, shuffle=True)

在上面的代码中，transforms.ToTensor() 将PIL图像转换为PyTorch的Tensor格式，transforms.Normalize 则对图像进行归一化，使其在训练中更稳定。

3. 数据预处理

对于GAN来说，数据的分布特征极其重要。我们通常需要进行以下几个步骤：

3.1 标准化

为了加速收敛，建议将输入图像中的像素值标准化。MNIST图像的像素值范围在0到255之间，通过标准化到 $[-1, 1]$ 区间可以使网络更快收敛。

3.2 增强

数据增强可以帮助模型学习到更加鲁棒的特征。在GAN的训练过程中，使用随机旋转、平移等变换可以有效提高生成样本的多样性。示例代码：

transform = transforms.Compose([
    transforms.RandomRotation(10),  # 随机旋转
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])

4. 数据集拆分（可选）

在一些情况下，您可能需要将数据集分为训练集和验证集。这可以帮助我们评估生成样本的质量。

4.1 拆分方法

您可以简单地通过选择数据集中一部分来形成验证集，以下是一个简单的例子：

# 使用train_test_split将数据划分为训练集和验证集
from sklearn.model_selection import train_test_split

train_data, val_data = train_test_split(train_dataset, test_size=0.2, random_state=42)
train_loader = torch.utils.data.DataLoader(dataset=train_data, batch_size=64, shuffle=True)
val_loader = torch.utils.data.DataLoader(dataset=val_data, batch_size=64, shuffle=False)