19 深度学习应用案例：图像识别

Q: 深度学习应用案例：图像识别适合谁读？

这是 深度学习入门 系列第 19 / 24 篇，适合正在学习深度学习入门，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-10

最近更新: 2026-06-04

分类: 深度学习小白

预计阅读: 3 分钟

阅读次数: 0

系列进度

深度学习入门 · 第 19 / 24 篇

上一篇深度学习模型评估与调优之避免过拟合下一篇深度学习在自然语言处理中的应用

预计阅读3 分钟

结构重点9 个

图文要点6 张

正文规模1.2k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 9 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步图像识别的基础 02第 2 步图像识别案例：手写数字识别 03第 3 步小结

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线深度学习应用案例：图像识别结构图跳到对应正文位置

图 02 · 步骤从像素到类别核对图跳到对应正文位置

图 03 · 配置图像识别应用案例判断卡跳到对应正文位置

图 04 · 判断深度学习阅读地图卡跳到对应正文位置

图 05 · 复盘深度学习应用案例：图像识别应用复盘卡跳到对应正文位置

图 06 · 细节深度学习应用案例：图像识别应用检查卡跳到对应正文位置

图像识别的核心是让网络从像素中逐层提取边缘、纹理、形状和语义。真正上线时，光看准确率不够，还要看错例集中在哪些场景。

评估图像模型时，单独整理一批错例图。错例比平均指标更能告诉你下一步该补数据还是改模型。

在前一篇中，我们讨论了深度学习模型的评估与调优，重点讲解了如何避免过拟合。在这一篇中，我们将深入探讨深度学习在图像识别中的应用。图像识别是深度学习最为经典和广泛的应用之一，它已经在很多领域得到了成功的应用，如医疗影像分析、安全监控以及自动驾驶等。

图像识别的基础

图像识别的目标是从图像中识别和分类对象。在深度学习中，卷积神经网络（CNN）是最常用的模型之一。CNN能够自动从图像中提取特征，减少了手动特征提取的需求。

分析图像识别案例时，先看类别定义、图片质量、标注一致性、模型结构、混淆类别和部署场景。

CNN模型的基本结构

CNN模型通常由多个层组成，包括：

卷积层：用于提取图像特征。
池化层：用于下采样，减少特征图的维度。
全连接层：用于将特征映射到具体的类别。

以下是CNN模型的一个简单架构示例：

输入图像 -> 卷积层 -> 激活层 -> 池化层 -> 卷积层 -> 激活层 -> 池化层 -> 全连接层 -> 输出

图像识别案例：手写数字识别

为了更好地理解图像识别，我们将以手写数字识别为例进行演示。我们将使用著名的MNIST手写数字数据集，数据集中包含60000个训练图像和10000个测试图像，每个图像为28x28像素的单通道灰度图像。

看《深度学习应用案例：图像识别》时，先把图中的问题、关键词、操作和验收标准对上，再读正文会更省力。读完后，最好能用自己的项目重新讲一遍。

数据准备

首先，我们需要下载并准备数据。使用Keras库可以方便地加载MNIST数据集。

import numpy as np
import matplotlib.pyplot as plt
from keras.datasets import mnist

# 加载MNIST数据集
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 数据预处理
x_train = x_train.astype('float32') / 255.0
x_test = x_test.astype('float32') / 255.0

# 打印数据集形状
print("训练数据形状:", x_train.shape, y_train.shape)
print("测试数据形状:", x_test.shape, y_test.shape)

构建CNN模型

接下来，我们构建一个简单的CNN模型来进行手写数字识别。

from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense

# 构建CNN模型
model = Sequential()
model.add(Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(28, 28, 1)))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Conv2D(64, kernel_size=(3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dense(10, activation='softmax'))  # 10个分类

# 编译模型
model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# 打印模型概述
model.summary()

训练模型

现在，我们可以开始训练模型了。

# 训练CNN模型
model.fit(x_train.reshape(-1, 28, 28, 1), y_train, epochs=10, batch_size=128, validation_split=0.2)

模型评估

训练完成后，我们可以评估模型在测试集上的性能。

# 评估模型
test_loss, test_accuracy = model.evaluate(x_test.reshape(-1, 28, 28, 1), y_test)
print("测试损失:", test_loss)
print("测试准确率:", test_accuracy)

结果可视化

可以用需要的可视化技术来展示模型的预测效果。

# 随机选择一些测试图像进行预测
predictions = model.predict(x_test.reshape(-1, 28, 28, 1))

# 绘制结果
for i in range(8):
    plt.subplot(2, 4, i + 1)
    plt.imshow(x_test[i], cmap='gray')
    plt.title(f'预测: {np.argmax(predictions[i])}, 真实: {y_test[i]}')
    plt.axis('off')
plt.show()

在这个案例中，我们实现了一个基本的图像识别任务，使用CNN模型对手写数字进行分类。你可以看到，网络通过学习训练数据中的特征来准确预测测试数据的类别。

如果《深度学习应用案例：图像识别》还没完全消化，可以从这张卡片的四个动作重新走一遍。

回看《深度学习应用案例：图像识别》时，不必一次做大项目，先用一条简单样例确认主线是否清楚。

小结

本篇内容介绍了图像识别的基本概念，并通过手写数字识别的案例展示了如何使用深度学习模型进行图像分类。在下篇中，我们将继续探讨深度学习在自然语言处理中的应用，打开新的应用领域。

希望本篇教程能帮助你理解深度学习在图像识别中的应用案例。以下代码示例和图像展示将为你提供进一步的学习和实践机会。请继续关注我们的系列教程，探索深度学习的更多可能性！

继续阅读

从这篇继续找到相关教程

AI 教程总索引

深度学习入门教程目录24 篇按顺序阅读本系列图文节点6 个位置可直达 AI 图文教程索引按主题继续找可复现教程 AI 图文教程全量清单浏览全部已整理教程跨领域 AI 文章入口继续找其它技术系列里的 AI 章节 AI 教程图片索引6 张图文节点

常见问题

读前先确认这三点

深度学习应用案例：图像识别适合谁读？

这是深度学习入门系列第 19 / 24 篇，适合正在学习深度学习入门，并且需要把概念落到操作步骤或判断标准里的读者。

读这篇深度学习入门教程要多久？

按中文技术文章阅读速度估算，通读大约 3 分钟；如果要跟着复现，建议把命令、配置和结果检查分开做。

这篇文章里的图文节点怎么用？

正文里有 6 个图文节点，可以先用它们抓住流程、配置和判断点，再回到对应段落细读。

分享文章

微信/朋友圈可先复制链接

微博 X LinkedIn Facebook Telegram 邮件

继续找到相关 AI 教程

返回栏目

继续学习深度学习在自然语言处理中的应用深度学习入门 · 第 20 篇 · 6 张图 · 1.4k 字

图文补读深度学习的工作原理之梯度下降与优化算法深度学习入门 · 6 张图 · 2.1k 字，适合回看流程和判断点。AI 教程总索引全部 AI 教程文章按大模型、Agent、本地部署、机器学习和工程实践继续查找相关文章。AI 图文教程索引按流程和判断点找教程先看每篇文章里的流程、配置和复盘节点，再回到原文细读。跨领域 AI 入口其它技术系列里的 AI 章节从大数据、爬虫、量子计算和 Spark 章节继续找 AI 内容。AI 教程图片索引按图查找教程文章从流程图、配置图和判断卡片直接定位对应文章。深度学习入门目录深度学习入门完整目录按顺序查看全部小节、图文密度和后续阅读路线。

19 深度学习应用案例：图像识别

深度学习入门 · 第 19 / 24 篇

这篇内容怎么整理

先按这条路线读

先看本文图文节点

图像识别的基础

CNN模型的基本结构

图像识别案例：手写数字识别

数据准备

构建CNN模型

训练模型

模型评估

结果可视化

小结

从这篇继续找到相关教程

读前先确认这三点

深度学习应用案例：图像识别适合谁读？

读这篇深度学习入门教程要多久？

这篇文章里的图文节点怎么用？

继续找到相关 AI 教程

读者留言

留言列表

19 深度学习应用案例：图像识别

深度学习入门 · 第 19 / 24 篇

这篇内容怎么整理

先按这条路线读

先看本文图文节点

图像识别的基础

CNN模型的基本结构

图像识别案例：手写数字识别

数据准备

构建CNN模型

训练模型

模型评估

结果可视化

小结

从这篇继续找到相关教程

读前先确认这三点

深度学习应用案例：图像识别适合谁读？

读这篇深度学习入门教程要多久？

这篇文章里的图文节点怎么用？

转发到常用平台

从相近问题继续读

继续找到相关 AI 教程

读者留言

留言列表