4 图像处理基础之图像的表示与存储
系列进度
计算机视觉网络教程 · 第 4 / 31 篇
整理说明
这篇内容怎么整理
郭震 · 2026-06-04
阅读路线
先按这条路线读
先抓住主线,再回到代码、配置和图文细节,读起来会更稳。
图像在程序里本质上是矩阵。理解宽高、通道、dtype 和压缩格式,是后面所有图像处理和模型输入的基础。
我会读取一张图后立刻打印 shape、dtype、取值范围和通道顺序。很多视觉 bug 都藏在 RGB/BGR 和数值范围里。
在计算机视觉领域,图像的表示与存储是理解后续图像处理技术的基本前提。无论是图像的输入、处理还是输出,图像如何在计算机中存储和表示都是至关重要的。本文将详细探讨图像的表示方式、数据结构、存储格式,以及相关的实际案例。
一、图像的表示
图像可以被视作一个二维数组,其中每个元素代表一个像素(Pixel)。在计算机中,图像通常通过以下几种方式进行表示:
学习图像表示与存储时,先确认宽高、通道、像素值范围和文件格式。输入细节不清,后面的视觉模型很容易出错。
1. 灰度图像
灰度图像是每个像素只有一个灰度值,通常范围在0到255之间,0表示黑色,255表示白色,其余值表示不同的灰色调。灰度图像的表示通常可以用一个二维矩阵表示,例如:
[
[0, 50, 100],
[150, 200, 255]
]
在这个矩阵中,0 表示黑色,255 表示白色,而中间的值表示不同的灰度级别。
2. 彩色图像
相较于灰度图像,彩色图像通常使用三种颜色通道表示:红色(R)、绿色(G)和蓝色(B)。每个像素由三个值组成,分别代表这三个颜色通道的强度。彩色图像通常以三维数组的形式表示:
[
[
[255, 0, 0], # 红色
[0, 255, 0] # 绿色
],
[
[0, 0, 255], # 蓝色
[255, 255, 0] # 黄色
]
]
在这个示例中,表示了一幅包含红色、绿色、蓝色和黄色像素的小图像。
二、图像的存储格式
常见的图像存储格式有多种,每种格式都有其适用场景和特点。以下是几种主要的图像格式:
读《图像处理基础之图像的表示与存储》时,可以把配图当成路线卡:先看整体顺序,再看每一步为什么这样做,最后再检查边界条件。
1. BMP(位图)
位图格式是未经压缩的图像格式,其优点是简单易实现,适合快速加载。但是,由于文件较大,不适合网络传输。
2. JPEG(联合图像专家组)
JPEG格式通过有损压缩算法显著减小文件大小,是一种广泛使用的图像格式,特别适合照片及复杂色彩的图像。使用JPEG格式时,图像可能会失去一些细节,但其压缩比高。
3. PNG(便携式网络图形)
PNG格式是一种无损压缩的图像格式,支持透明通道。它通常用于需要保持图像质量且具有透明性需求的场合,例如网页中的图标。
4. TIFF(标记图像文件格式)
TIFF格式常用于高质量图像的保存,广泛应用于印刷领域。TIFF文件可以是无损的,但文件通常较大。
三、图像读取与写入
在进行图像处理时,读取和写入图像文件是最基本的操作。使用Python的PIL库(Pillow),我们可以轻松实现图像的读取和写入。
读取图像
下面是用Pillow库读取图像的示例代码:
from PIL import Image
# 读取图像
image = Image.open('image.jpg')
image.show()
写入图像
将处理后的图像保存为新的文件格式:
# 保存为png格式
image.save('output.png')
四、案例分析
让我们来看一个简单的案例,使用Python和Pillow库读取一幅图像,并将其转换为灰度图像。
from PIL import Image
# 读取彩色图像
color_image = Image.open('color_image.jpg')
# 转换为灰度图像
gray_image = color_image.convert('L')
# 保存灰度图像
gray_image.save('gray_image.jpg')
gray_image.show()
在这个案例中,我们通过调用convert('L')方法将彩色图像转换为灰度图像,这展示了图像在表示和存储方面的重要性。
读到这里,可以把《图像处理基础之图像的表示与存储》整理成一张复盘表:先说清主线,再拿一个小任务检查结果。
读完《图像处理基础之图像的表示与存储》后,可以先挑一个小样例走完整流程,再判断哪些步骤已经能独立完成。
结论
图像的表示与存储是图像处理和计算机视觉的基础。选择合适的图像格式可以确保图像质量和存储效率的最佳平衡。理解图像在计算机中的表示方式,能够帮助我们更好地应用后续的图像处理技术。
在下一篇中,我们将深入探讨基本的图像处理技术,包括图像增强、滤波等,继续我们的计算机视觉从零教程系列。
继续阅读
从这篇继续找到相关教程
常见问题
读前先确认这三点
图像处理基础之图像的表示与存储适合谁读?
这是 计算机视觉网络教程 系列第 4 / 31 篇,适合正在学习计算机视觉网络教程,并且需要把概念落到操作步骤或判断标准里的读者。
读这篇计算机视觉网络教程要多久?
按中文技术文章阅读速度估算,通读大约 4 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。
这篇文章里的图文节点怎么用?
正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。
分享文章
转发到常用平台
微信/朋友圈可先复制链接
相关教程
从相近问题继续读
继续阅读