11 超分辨率生成对抗网络（SRGAN）之超分辨率的实现

Q: 超分辨率生成对抗网络（SRGAN）之超分辨率的实现适合谁读？

这是 生成对抗网络高级 系列第 11 / 21 篇，适合正在学习生成对抗网络高级，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-15

最近更新: 2026-06-04

分类: GANs进阶

预计阅读: 3 分钟

阅读次数: 0

系列进度

生成对抗网络高级 · 第 11 / 21 篇

上一篇超分辨率生成对抗网络（SRGAN）之SRGAN的架构下一篇超分辨率生成对抗网络(SRGAN)之SRGAN的评估指标

预计阅读3 分钟

结构重点6 个

图文要点6 张

正文规模1.2k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 6 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步数据准备 02第 2 步训练模型 03第 3 步实现超分辨率图像的生成 04第 4 步结论

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线超分辨率生成对抗网络（SRGAN）之超分辨率的实现结构图跳到对应正文位置

图 02 · 步骤超分辨率生成对抗网络（SRGAN）之超分辨率的实现核对图跳到对应正文位置

图 03 · 配置SRGAN超分实现判断卡跳到对应正文位置

图 04 · 判断GAN 进阶阅读地图卡跳到对应正文位置

图 05 · 复盘超分辨率生成对抗网络（SRGAN）之超分辨率的实现应用复盘卡跳到对应正文位置

图 06 · 细节超分辨率生成对抗网络（SRGAN）之超分辨率的实现应用检查卡跳到对应正文位置

GAN 进阶内容要围绕稳定性、条件控制、架构变化和评估方法建立判断框架。阅读时可以按「数据准备 -> 数据集加载与预处理 -> 训练模型 -> GAN 训练步骤」建立结构，再回到正文里的代码、案例或指标做验证。

读完后，用一个真实小任务复查：输入是什么，处理环节在哪里，输出是否可验收；失败时先查「数据准备」，再查「数据集加载与预处理」。

在上一篇中，我们深入探讨了超分辨率生成对抗网络（SRGAN）的架构，了解了其生成器和判别器的设计理念和结构。今天，我们将关注于如何实际实现超分辨率。这一过程涉及到真实数据的预处理、模型的训练过程以及如何使用训练好的模型进行图像超分辨率重建。

数据准备

在进行超分辨率任务之前，首先需要准备数据集。一个常用的数据集是 DIV2K，它包括高分辨率图像，这是训练超分辨率模型的重要基础。

实现 SRGAN 超分辨率时，先看低清输入、高清目标、生成器输出、判别器反馈和感知损失。

数据集加载与预处理

import os
import numpy as np
from PIL import Image
import torch
from torchvision import transforms

def load_images_from_folder(folder, scale_factor=4):
    images = []
    for filename in os.listdir(folder):
        img = Image.open(os.path.join(folder, filename)).convert('RGB')
        img = img.resize((img.width // scale_factor, img.height // scale_factor), Image.BICUBIC)
        images.append(img)
    return images

# 设定数据集目录与缩放因子
train_folder = 'path/to/DIV2K/train'
images = load_images_from_folder(train_folder)

在上述代码中，我们将每个高分辨率图像减少到其尺寸的四分之一，这样就得到了低分辨率（LR）图像。随后的处理我们会使用这些 LR 图像作为输入，同时使用原图作为目标（HR）图像。

训练模型

在 SRGAN 的实现中，训练过程分为若干个步骤：准备 GAN 的组成部分（生成器和判别器），设置损失函数，然后迭代训练模型。

读《超分辨率生成对抗网络（SRGAN）之超分辨率的实现》时，可以把配图当成路线卡：先看整体顺序，再看每一步为什么这样做，最后再检查边界条件。

GAN 训练步骤

训练环节的关键是调整生成器和判别器的参数，使得生成器能够生成高质量的超分辨率图像，而判别器则要能够辨别生成的图像与真实图像的区别。

import torch.optim as optim
from model import Generator, Discriminator  # 假设你有一个模块 model 包含这两个类

# 初始化生成器和判别器
generator = Generator()
discriminator = Discriminator()

criterion_GAN = torch.nn.BCELoss()
criterion_content = torch.nn.MSELoss()
optimizer_G = optim.Adam(generator.parameters(), lr=0.0001)
optimizer_D = optim.Adam(discriminator.parameters(), lr=0.0001)

# 训练过程
for epoch in range(num_epochs):
    for i, (lr_images, hr_images) in enumerate(data_loader):
        # 更新判别器
        optimizer_D.zero_grad()
        
        # 真实和生成的标签
        real_labels = torch.ones((batch_size, 1), requires_grad=False)
        fake_labels = torch.zeros((batch_size, 1), requires_grad=False)

        # 判别器的损失 
        outputs = discriminator(hr_images)
        d_loss_real = criterion_GAN(outputs, real_labels)

        fake_images = generator(lr_images)
        outputs = discriminator(fake_images.detach())
        d_loss_fake = criterion_GAN(outputs, fake_labels)

        d_loss = d_loss_real + d_loss_fake
        d_loss.backward()
        optimizer_D.step()

        # 更新生成器
        optimizer_G.zero_grad()
        
        outputs = discriminator(fake_images)
        g_loss_GAN = criterion_GAN(outputs, real_labels)
        g_loss_content = criterion_content(fake_images, hr_images)
        g_loss = g_loss_GAN + lambda_content * g_loss_content  # lambda_content 是超参数
        g_loss.backward()
        optimizer_G.step()

在上述代码中，我们通过交替更新判别器和生成器的参数来优化 GAN 模型。对于判别器的损失，主要采取应用于真实图像与生成图像的对比。对于生成器的损失，则包含了内容损失和对抗损失。

实现超分辨率图像的生成

一旦我们的模型训练完成，就可以使用它来生成超分辨率图像。将低分辨率图像输入到生成器中，即可获得高分辨率图像。

# 生成超分辨率图像
def generate_super_resolution(generator, lr_image):
    with torch.no_grad():
        sr_image = generator(lr_image.unsqueeze(0))  # 添加批量维度
    return sr_image.squeeze(0)  # 移除批量维度

# 使用训练好的生成器生成超分辨率图像
lr_test_image = load_images_from_folder('path/to/test/image')[0]  # 加载测试图像
sr_image = generate_super_resolution(generator, lr_test_image)