19 卷积神经网络(CNN)之迁移学习与预训练模型

Q: 卷积神经网络(CNN)之迁移学习与预训练模型适合谁读？

这是 计算机视觉网络教程 系列第 19 / 31 篇，适合正在学习计算机视觉网络教程，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-10

最近更新: 2026-06-04

分类: 计算机视觉

预计阅读: 3 分钟

阅读次数: 0

系列进度

计算机视觉网络教程 · 第 19 / 31 篇

上一篇卷积神经网络(CNN)之CNN架构与模型设计下一篇目标检测与识别之对象检测算法概述

预计阅读3 分钟

结构重点6 个

图文要点6 张

正文规模1.3k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 6 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步迁移学习：概述 02第 2 步预训练模型 03第 3 步迁移学习的注意事项

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线迁移学习与预训练模型流程图跳到对应正文位置

图 02 · 步骤迁移学习与预训练模型实操核对图跳到对应正文位置

图 03 · 配置迁移学习预训练判断卡跳到对应正文位置

图 04 · 判断计算机视觉阅读地图卡跳到对应正文位置

图 05 · 复盘卷积神经网络(CNN)之迁移学习与预训练模型应用检查卡跳到对应正文位置

图 06 · 细节卷积神经网络(CNN)之迁移学习与预训练模型应用复盘卡跳到对应正文位置

迁移学习适合数据不多但任务相近的视觉场景。先复用通用特征，再训练自己的任务头，通常比从零训练稳定。

我会确认冻结了哪些层、训练了哪些层、学习率是否分组设置。微调不清楚，预训练模型很容易被破坏。

在前一篇我们探讨了卷积神经网络(CNN)的架构与模型设计，为后续深入的目标检测与识别打下了良好的基础。本篇将重点讨论迁移学习和预训练模型，它们是提高模型性能与减少训练时间的重要手段。

迁移学习：概述

迁移学习是一种社会化学习方法，旨在利用在一个任务上学到的知识来改善在另一个相关但不同任务上的学习效果。在计算机视觉中，迁移学习尤其常用，因为许多视觉任务具有相似特征，例如从动物图像中学习的特征可以帮助识别植物图像。

使用迁移学习与预训练模型时，先看源任务、目标数据规模、特征层冻结、学习率、验证指标和过拟合风险。

为什么使用迁移学习？

数据不足：当目标任务的数据量相对少时，使用已经在大量数据上训练好的模型可以显著提高性能。
较短的训练时间：使用预训练的模型可以减少从头训练的时间。
普遍有效的特征：许多视觉特征是通用的，因此迁移学习可以有效地提取和利用这些特征。

预训练模型

预训练模型是指在大型数据集（如ImageNet）上训练的模型，这些模型可以被用于其他相似的视觉任务。常见的预训练模型有：

《卷积神经网络(CNN)之迁移学习与预训练模型》读到最后，可以把图里的流程当成检查表：问题是否明确，操作是否落地，判断标准是否能复用。

VGG16：由于其简单的架构和较强的表现，被广泛作为基础模型。
ResNet：通过引入残差连接来解决深层网络的退化问题，提升了模型的性能。
Inception：引入了多尺度卷积操作，提高了网络的表达能力。

下面是如何使用一个预训练模型（例如VGG16）进行迁移学习的示例。

实践案例：使用VGG16进行迁移学习

我们将使用Keras库和TensorFlow后端完成这个案例。

import tensorflow as tf
from tensorflow.keras.applications import VGG16
from tensorflow.keras.layers import Dense, Flatten
from tensorflow.keras.models import Model
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# 加载VGG16模型，去掉顶层
base_model = VGG16(weights='imagenet', include_top=False, input_shape=(224, 224, 3))

# 冻结卷积基
for layer in base_model.layers:
    layer.trainable = False

# 自定义顶部模型
x = Flatten()(base_model.output)
x = Dense(256, activation='relu')(x)
predictions = Dense(10, activation='softmax')(x)  # 假设我们有10个类别

# 创建最终模型
model = Model(inputs=base_model.input, outputs=predictions)

# 编译模型
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# 数据预处理
train_datagen = ImageDataGenerator(rescale=1.0/255)
train_generator = train_datagen.flow_from_directory(
    'data/train',
    target_size=(224, 224),
    batch_size=32,
    class_mode='categorical'
)

# 训练模型
model.fit(train_generator, epochs=10)