20 深度学习与OpenCV之使用深度学习模型进行推断

Q: 深度学习与OpenCV之使用深度学习模型进行推断适合谁读？

这是 OpenCV 教程 系列第 20 / 24 篇，适合正在学习OpenCV 教程，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-13

最近更新: 2026-06-04

分类: Opencv教程

预计阅读: 4 分钟

阅读次数: 0

系列进度

OpenCV 教程 · 第 20 / 24 篇

上一篇深度学习与OpenCV之深度学习框架集成下一篇深度学习与 OpenCV 之训练自定义模型

预计阅读4 分钟

结构重点7 个

图文要点6 张

正文规模1.5k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 7 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步知识准备 02第 2 步加载深度学习模型 03第 3 步总结

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线深度学习与OpenCV之使用深度学习模型进行推断结构图跳到对应正文位置

图 02 · 步骤深度学习与OpenCV之使用深度学习模型进行推断核对图跳到对应正文位置

图 03 · 配置OpenCV深度模型推断判断卡跳到对应正文位置

图 04 · 判断OpenCV阅读地图卡跳到对应正文位置

图 05 · 复盘深度学习与OpenCV之使用深度学习模型进行推断应用复盘卡跳到对应正文位置

图 06 · 细节深度学习与OpenCV之使用深度学习模型进行推断应用检查卡跳到对应正文位置

OpenCV 学习要把图像输入、处理步骤、检测结果和工程性能放在一起验证。阅读时可以按「知识准备 -> 加载深度学习模型 -> 输入数据的预处理 -> 进行推断」建立结构，再回到正文里的代码、案例或指标做验证。

读完后，用一个真实小任务复查：输入是什么，处理环节在哪里，输出是否可验收；失败时先查「知识准备」，再查「加载深度学习模型」。

在上一篇中，我们探讨了如何将深度学习框架与OpenCV进行集成，以便利用深度学习模型的强大能力。而在本篇中，我们将专注于如何使用已经训练好的深度学习模型进行推断，具体来说，就是如何利用OpenCV加载并进行推理，处理输入数据，并获取输出结果。

知识准备

在开始之前，确保你已经掌握以下内容：

深度学习的基本概念
OpenCV库的基本使用
深度学习模型的训练与保存

用 OpenCV 进行深度模型推断时，先看模型加载、blob 预处理、后端选择、前向推理、结果解码和可视化。

在实际应用中，常见的深度学习框架如TensorFlow、PyTorch等都可以导出一个可供OpenCV使用的格式，比如.onnx或.pb文件。

加载深度学习模型

在OpenCV中，我们可以使用cv2.dnn模块来加载和推断深度学习模型。以下是加载模型的基本步骤：

读完《深度学习与OpenCV之使用深度学习模型进行推断》不要只停在“看懂了”。回头挑一个步骤动手做一遍，再记录哪里卡住，后面的学习会更稳。

import cv2

# 加载模型
model = cv2.dnn.readNetFromONNX('your_model.onnx')

在这个例子中，我们使用readNetFromONNX方法来加载一个ONNX格式的模型。类似地，OpenCV还支持从Caffe、TensorFlow和Torch等格式加载模型。

输入数据的预处理

在推断之前，我们需要对输入数据进行适当的预处理。这通常包括缩放、归一化和调换通道顺序等。以下是一个常见的图像输入预处理过程：

image = cv2.imread('input_image.jpg')
blob = cv2.dnn.blobFromImage(image, scalefactor=1/255.0, size=(640, 640), swapRB=True)

# 设置输入
model.setInput(blob)

在上面的代码中：

使用cv2.dnn.blobFromImage将输入图像转换为Blob对象。
scalefactor参数用于将图像像素值归一化到0到1之间。
size参数指定输入大小，需与模型的输入要求相匹配。
swapRB参数用于交换红色和蓝色通道，因为深度学习模型通常接受BGR顺序的图像。

进行推断

一旦输入数据准备好，我们就可以进行推断。使用forward方法来获取模型的输出：

output = model.forward()

output将包含模型的推理结果，通常是一些特征图或预测结果，具体取决于训练时的目标。

处理推理结果

根据模型的类型，处理输出的方式也会有所不同。假设我们正在进行一个目标检测任务，output可能是一个包含边框和类别信息的张量。接下来是一个简单的后处理过程，以提取检测结果：

for detection in output[0, 0]:
    confidence = detection[2]
    if confidence > 0.5:
        x1 = int(detection[3] * image.shape[1])
        y1 = int(detection[4] * image.shape[0])
        x2 = int(detection[5] * image.shape[1])
        y2 = int(detection[6] * image.shape[0])
        cv2.rectangle(image, (x1, y1), (x2, y2), (255, 0, 0), 2)

在此代码块中，我们遍历推理结果，提取检测到的对象的置信度和边框坐标，并在原始图像上绘制矩形框。

示例完整代码

下面是一个完整的示例，包括加载模型、处理输入、运行推断和显示输出：

import cv2

# 加载模型
model = cv2.dnn.readNetFromONNX('your_model.onnx')

# 读取并处理图像
image = cv2.imread('input_image.jpg')
blob = cv2.dnn.blobFromImage(image, scalefactor=1/255.0, size=(640, 640), swapRB=True)

# 推断
model.setInput(blob)
output = model.forward()

# 处理输出
for detection in output[0, 0]:
    confidence = detection[2]
    if confidence > 0.5:
        x1 = int(detection[3] * image.shape[1])
        y1 = int(detection[4] * image.shape[0])
        x2 = int(detection[5] * image.shape[1])
        y2 = int(detection[6] * image.shape[0])
        cv2.rectangle(image, (x1, y1), (x2, y2), (255, 0, 0), 2)

# 显示结果
cv2.imshow('Output', image)
cv2.waitKey(0)
cv2.destroyAllWindows()