13 生成对抗网络中的模型评估指标

Q: 生成对抗网络中的模型评估指标适合谁读？

这是 生成对抗网络高级 系列第 13 / 21 篇，适合正在学习生成对抗网络高级，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-15

最近更新: 2026-06-04

分类: GANs进阶

预计阅读: 4 分钟

阅读次数: 0

系列进度

生成对抗网络高级 · 第 13 / 21 篇

上一篇超分辨率生成对抗网络(SRGAN)之SRGAN的评估指标下一篇生成对抗网络中的模型评估：模型选择与调优

预计阅读4 分钟

结构重点5 个

图文要点6 张

正文规模1.6k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 5 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步常见的评估指标 02第 2 步小结

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线生成对抗网络中的模型评估指标结构图跳到对应正文位置

图 02 · 步骤生成对抗网络中的模型评估指标核对图跳到对应正文位置

图 03 · 配置GAN评估指标判断卡跳到对应正文位置

图 04 · 判断生成对抗网络中的模型评估指标应用复盘卡跳到对应正文位置

图 05 · 复盘生成对抗网络中的模型评估指标应用检查卡跳到对应正文位置

图 06 · 细节GAN 进阶阅读地图卡跳到对应正文位置

GAN 进阶内容要围绕稳定性、条件控制、架构变化和评估方法建立判断框架。阅读时可以按「常见的评估指标 -> Inception Score -> Fréchet Inception Distance -> 视觉评估」建立结构，再回到正文里的代码、案例或指标做验证。

读完后，用一个真实小任务复查：输入是什么，处理环节在哪里，输出是否可验收；失败时先查「常见的评估指标」，再查「Inception Score」。

在上一篇文章《超分辨率生成对抗网络（SRGAN）之SRGAN的评估指标》中，我们探讨了 SRGAN 模型中评估图像超分辨率质量的几种常用指标。这一篇，我们将重点关注生成对抗网络（GANs）中的模型评估方法及其常见指标。这些指标对于比较不同 GAN 模型的生成性能、选择最佳模型、以及优化模型参数至关重要。

常见的评估指标

1. Inception Score (IS)

评估 GAN 模型时，先看 FID、IS、样本多样性、失败样例、训练稳定性和业务可用性。

Inception Score 是一种评估 GAN 生成图片质量的常用指标。它旨在通过评估生成图像的多样性和图像的识别度来反映生成模型的表现。

Inception Score 的定义为：

IS = \exp\left(\mathbb{E}_{\mathbf{x} \sim G} \left[ D_{KL}(p(y|\mathbf{x}) || p(y)) \right]\right)

其中：

$G$ 是生成模型。
$p(y|\mathbf{x})$ 是给定图像 $\mathbf{x}$ 时的条件概率分布，表示图像的类别。
$p(y)$ 是生成图像的边际概率分布。

在实际操作中，我们可以使用预训练的 Inception 网络来计算这个分数。假设我们已经有了 GAN 生成的图像，我们可以按照以下步骤计算 IS：

from keras.applications.inception_v3 import InceptionV3
from keras.preprocessing.image import img_to_array, load_img
import numpy as np
from scipy.special import kl_div

def calculate_inception_score(images):
    model = InceptionV3(weights='imagenet')
    # 预处理图像
    images = [img_to_array(load_img(image, target_size=(299, 299))) for image in images]
    images = np.array(images)
    predictions = model.predict(images)
    # 计算 KL 散度
    kl_divs = [kl_div(pred, np.mean(predictions, axis=0)) for pred in predictions]
    inception_score = np.exp(np.mean(kl_divs))
    return inception_score

2. Fréchet Inception Distance (FID)

Fréchet Inception Distance 是另一种重要的评估指标，用于衡量生成图像与真实图像之间的距离。FID 通过在特征空间中比较生成图像和真实图像的分布来评估模型性能。

FID 的公式为：

FID = ||\mu_r - \mu_g||^2 + \text{Tr}(\Sigma_r + \Sigma_g - 2(\Sigma_r \Sigma_g)^{1/2})

在上述公式中：

$\mu_r$ 和 $\mu_g$ 是真实图像和生成图像在特征空间中的均值。
$\Sigma_r$ 和 $\Sigma_g$ 是真实图像和生成图像的协方差矩阵。

使用 FID 进行评估的步骤如下：

from keras.applications.inception_v3 import InceptionV3
from keras.preprocessing.image import img_to_array, load_img
from scipy.linalg import sqrtm

def calculate_fid(real_images, generated_images):
    model = InceptionV3(weights='imagenet', include_top=False, pooling='avg')
    
    # 特征提取
    real_images = [img_to_array(load_img(image, target_size=(299, 299))) for image in real_images]
    generated_images = [img_to_array(load_img(image, target_size=(299, 299))) for image in generated_images]
    
    real_features = model.predict(np.array(real_images))
    generated_features = model.predict(np.array(generated_images))
    
    mu_r, sigma_r = real_features.mean(axis=0), np.cov(real_features, rowvar=False)
    mu_g, sigma_g = generated_features.mean(axis=0), np.cov(generated_features, rowvar=False)
    
    fid = np.sum((mu_r - mu_g)**2) + np.trace(sigma_r + sigma_g - 2 * sqrtm(np.dot(sigma_r, sigma_g)))
    return fid