20 深度学习与OpenCV之使用深度学习模型进行推断
系列进度
OpenCV 教程 · 第 20 / 24 篇
整理说明
这篇内容怎么整理
郭震 · 2026-06-04
阅读路线
先按这条路线读
先抓住主线,再回到代码、配置和图文细节,读起来会更稳。
OpenCV 学习要把图像输入、处理步骤、检测结果和工程性能放在一起验证。阅读时可以按「知识准备 -> 加载深度学习模型 -> 输入数据的预处理 -> 进行推断」建立结构,再回到正文里的代码、案例或指标做验证。
读完后,用一个真实小任务复查:输入是什么,处理环节在哪里,输出是否可验收;失败时先查「知识准备」,再查「加载深度学习模型」。
在上一篇中,我们探讨了如何将深度学习框架与OpenCV进行集成,以便利用深度学习模型的强大能力。而在本篇中,我们将专注于如何使用已经训练好的深度学习模型进行推断,具体来说,就是如何利用OpenCV加载并进行推理,处理输入数据,并获取输出结果。
知识准备
在开始之前,确保你已经掌握以下内容:
- 深度学习的基本概念
- OpenCV库的基本使用
- 深度学习模型的训练与保存
用 OpenCV 进行深度模型推断时,先看模型加载、blob 预处理、后端选择、前向推理、结果解码和可视化。
在实际应用中,常见的深度学习框架如TensorFlow、PyTorch等都可以导出一个可供OpenCV使用的格式,比如.onnx或.pb文件。
加载深度学习模型
在OpenCV中,我们可以使用cv2.dnn模块来加载和推断深度学习模型。以下是加载模型的基本步骤:
读完《深度学习与OpenCV之使用深度学习模型进行推断》不要只停在“看懂了”。回头挑一个步骤动手做一遍,再记录哪里卡住,后面的学习会更稳。
import cv2
# 加载模型
model = cv2.dnn.readNetFromONNX('your_model.onnx')
在这个例子中,我们使用readNetFromONNX方法来加载一个ONNX格式的模型。类似地,OpenCV还支持从Caffe、TensorFlow和Torch等格式加载模型。
输入数据的预处理
在推断之前,我们需要对输入数据进行适当的预处理。这通常包括缩放、归一化和调换通道顺序等。以下是一个常见的图像输入预处理过程:
image = cv2.imread('input_image.jpg')
blob = cv2.dnn.blobFromImage(image, scalefactor=1/255.0, size=(640, 640), swapRB=True)
# 设置输入
model.setInput(blob)
在上面的代码中:
- 使用
cv2.dnn.blobFromImage将输入图像转换为Blob对象。 scalefactor参数用于将图像像素值归一化到0到1之间。size参数指定输入大小,需与模型的输入要求相匹配。swapRB参数用于交换红色和蓝色通道,因为深度学习模型通常接受BGR顺序的图像。
进行推断
一旦输入数据准备好,我们就可以进行推断。使用forward方法来获取模型的输出:
output = model.forward()
output将包含模型的推理结果,通常是一些特征图或预测结果,具体取决于训练时的目标。
处理推理结果
根据模型的类型,处理输出的方式也会有所不同。假设我们正在进行一个目标检测任务,output可能是一个包含边框和类别信息的张量。接下来是一个简单的后处理过程,以提取检测结果:
for detection in output[0, 0]:
confidence = detection[2]
if confidence > 0.5:
x1 = int(detection[3] * image.shape[1])
y1 = int(detection[4] * image.shape[0])
x2 = int(detection[5] * image.shape[1])
y2 = int(detection[6] * image.shape[0])
cv2.rectangle(image, (x1, y1), (x2, y2), (255, 0, 0), 2)
在此代码块中,我们遍历推理结果,提取检测到的对象的置信度和边框坐标,并在原始图像上绘制矩形框。
示例完整代码
下面是一个完整的示例,包括加载模型、处理输入、运行推断和显示输出:
import cv2
# 加载模型
model = cv2.dnn.readNetFromONNX('your_model.onnx')
# 读取并处理图像
image = cv2.imread('input_image.jpg')
blob = cv2.dnn.blobFromImage(image, scalefactor=1/255.0, size=(640, 640), swapRB=True)
# 推断
model.setInput(blob)
output = model.forward()
# 处理输出
for detection in output[0, 0]:
confidence = detection[2]
if confidence > 0.5:
x1 = int(detection[3] * image.shape[1])
y1 = int(detection[4] * image.shape[0])
x2 = int(detection[5] * image.shape[1])
y2 = int(detection[6] * image.shape[0])
cv2.rectangle(image, (x1, y1), (x2, y2), (255, 0, 0), 2)
# 显示结果
cv2.imshow('Output', image)
cv2.waitKey(0)
cv2.destroyAllWindows()
读到这里,可以把《深度学习与OpenCV之使用深度学习模型进行推断》整理成一张复盘表:先说清主线,再拿一个小任务检查结果。
读完《深度学习与OpenCV之使用深度学习模型进行推断》后,可以先挑一个小样例走完整流程,再判断哪些步骤已经能独立完成。
总结
在本篇中,我们学习了如何使用OpenCV进行深度学习模型的推断,包括如何加载模型、处理输入数据、执行推断并分析输出结果。这些步骤对于在实际应用中高效利用深度学习模型至关重要。
下一篇将深入探讨如何根据特定需求训练自定义深度学习模型,以更好地满足实际应用场景的要求。请继续关注!
继续阅读
从这篇继续找到相关教程
常见问题
读前先确认这三点
深度学习与OpenCV之使用深度学习模型进行推断适合谁读?
这是 OpenCV 教程 系列第 20 / 24 篇,适合正在学习OpenCV 教程,并且需要把概念落到操作步骤或判断标准里的读者。
读这篇OpenCV教程要多久?
按中文技术文章阅读速度估算,通读大约 4 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。
这篇文章里的图文节点怎么用?
正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。
分享文章
转发到常用平台
微信/朋友圈可先复制链接
相关教程
从相近问题继续读
继续阅读