🧠计算机视觉网络教程
AI 教程网络
从这个系列继续发现相关教程
当前专题已经接入 AI 教程总索引,读者可以从这里回到完整目录,也可以继续查看模型、Agent 和工具实测入口。
专题导读
计算机视觉网络教程学习地图
先按顺序读前几篇建立框架,再用图文要点回看流程、配置和判断点;遇到工具类内容,可以直接跳到对应小节做复现。
阅读路径
按这三段读更顺
每个系列都可以先抓主线,再挑重点文章复现,最后回到问题边界和检查表。
先建立框架
第 1 - 9 篇 · 9 个小节
适合先读概念、环境和整体流程,避免一上来就被细节打散。
再动手复现
第 10 - 23 篇 · 14 个小节
集中看配置、命令、调用链和结果判断,把正文里的图文要点串起来。
最后复盘扩展
第 24 - 31 篇 · 8 个小节
回看问题边界、替代方案和后续练习,形成自己的检查清单。
图文优先
重点图文入口
想先判断这套内容是否值得继续读,可以从图文信息更密的几篇开始。
1 计算机视觉概述:计算机视觉的定义与应用
第 1 篇6 张图1.3k 字计算机视觉不是简单处理图片,而是让机器从图像和视频里抽取可用信息。阅读时,可以先把任务分成“看见什么、在哪里、属于哪一类、下一步做什么”。
AI计算机视觉2 计算机视觉的发展历程
第 2 篇6 张图1.3k 字这条发展线能帮你理解为什么今天很多视觉任务都用深度学习。早期方法强调人工设计特征,后来的神经网络开始直接从数据里学习表示。
AI计算机视觉3 计算机视觉的主要任务与挑战
第 3 篇6 张图1.5k 字计算机视觉的任务看起来很多,但核心差别是输出形式不同:分类输出类别,检测输出框,分割输出像素级区域,匹配输出对应关系。
AI计算机视觉4 图像处理基础之图像的表示与存储
第 4 篇6 张图1.6k 字图像在程序里本质上是矩阵。理解宽高、通道、dtype 和压缩格式,是后面所有图像处理和模型输入的基础。
AI计算机视觉5 图像处理基础之基本图像处理技术
第 5 篇6 张图1.3k 字基础图像处理不是装饰,它会直接改变模型看到的数据。尤其是裁剪、缩放和旋转,如果标注没有同步更新,训练数据会变脏。
AI计算机视觉6 图像处理基础之颜色空间转换与直方图均衡
第 6 篇6 张图1.4k 字颜色空间转换让你用更适合任务的方式看图。直方图均衡能增强对比度,但也可能放大噪声,所以要结合任务判断。
AI计算机视觉7 图像处理基础之图像滤波与边缘检测
第 7 篇6 张图1.4k 字滤波和边缘检测是很多视觉任务的前置工具。先减少噪声,再找边缘,效果通常比直接在脏图上检测稳定。
AI计算机视觉8 特征提取与描述之特征的定义与重要性
第 8 篇6 张图1.3k 字特征是图像里能帮助模型做判断的线索。传统视觉靠人工特征,深度学习靠网络自己学特征,但目标都是让相似内容更接近、不同内容更可分。
AI计算机视觉9 特征提取与描述之传统特征提取方法
第 9 篇6 张图1.4k 字传统特征方法在很多小任务里仍然有用,尤其是图像拼接、特征匹配和低算力场景。它们的优势是可解释、依赖少。
AI计算机视觉10 特征描述子与匹配
第 10 篇6 张图1.5k 字描述子把局部图像变成可以比较的向量。匹配不是越多越好,错误匹配会直接拖垮拼接、定位和识别。
AI计算机视觉11 机器学习基础:监督学习与非监督学习
第 11 篇6 张图1.4k 字监督学习和非监督学习的区别,核心是有没有明确标签。视觉任务里,标签类型会决定你是在做分类、检测、分割还是探索数据结构。
AI计算机视觉12 机器学习基础之模型评估与选择
第 12 篇6 张图2.0k 字视觉模型不能只看训练集表现。验证集、测试集和真实场景样本要分开,否则很容易把过拟合当成进步。
AI计算机视觉13 过拟合与正则化
第 13 篇6 张图1.4k 字过拟合在视觉任务里很常见,尤其是样本少、模型大、场景单一时。正则化不是为了让训练慢,而是为了让模型在新图上更稳。
AI计算机视觉14 深度学习与神经网络之神经元模型与激活函数
第 14 篇6 张图1.5k 字神经元模型可以看成一个可学习的计算单元。激活函数让网络有非线性表达能力,否则多层线性叠加仍然只是线性模型。
AI计算机视觉15 深度学习与神经网络之前向传播与反向传播
第 15 篇6 张图2.2k 字前向传播回答模型怎么算,反向传播回答参数怎么改。两者合起来,才是一个完整训练闭环。
AI计算机视觉16 深度学习与神经网络之梯度下降与优化算法
第 16 篇6 张图2.3k 字优化算法决定模型如何沿着梯度调整参数。学习率太大容易震荡,太小会很慢,优化器选择要结合数据和模型观察。
AI计算机视觉17 卷积神经网络(CNN)之卷积与池化操作
第 17 篇6 张图1.6k 字CNN 的卷积负责提局部特征,池化负责压缩空间尺寸。理解特征图怎么变小、通道怎么变多,是读 CNN 架构的基础。
AI计算机视觉18 卷积神经网络(CNN)之CNN架构与模型设计
第 18 篇6 张图1.9k 字CNN 设计不是层数越多越好。深度、通道数、输入分辨率和任务难度要匹配,否则不是过拟合就是跑不动。
AI计算机视觉19 卷积神经网络(CNN)之迁移学习与预训练模型
第 19 篇6 张图1.3k 字迁移学习适合数据不多但任务相近的视觉场景。先复用通用特征,再训练自己的任务头,通常比从零训练稳定。
AI计算机视觉20 目标检测与识别之对象检测算法概述
第 20 篇6 张图1.6k 字目标检测比分类多了位置输出。阅读时,要把“是什么”和“在哪里”分开看,再理解两阶段和单阶段算法的取舍。
AI计算机视觉21 目标检测与识别之YOLO与SSD算法详解
第 21 篇6 张图1.4k 字YOLO 和 SSD 都强调一次前向完成检测,适合实时场景。差别要从预测尺度、框设计和速度精度折中来看。
AI计算机视觉22 目标检测与识别之目标跟踪技术
第 22 篇6 张图1.7k 字目标跟踪关心的是同一个目标在视频中如何持续被认出来。它不是每帧检测完就结束,还要维护轨迹和身份。
AI计算机视觉23 图像分割任务与技术概述
第 23 篇6 张图1.4k 字图像分割把判断细化到像素级。它适合医学、遥感、工业缺陷这类需要知道精确区域的场景。
AI计算机视觉24 语义分割与实例分割
第 24 篇6 张图1.3k 字语义分割回答每个像素属于哪一类,实例分割还要区分同类里的不同个体。两者输出不同,训练数据也不同。
AI计算机视觉25 图像分割之常用分割模型与评估指标
第 25 篇6 张图1.8k 字分割模型不能只看整体准确率。小目标、边界和类别不均衡都会让普通准确率显得过于乐观。
AI计算机视觉26 计算机视觉应用之图像识别与分类
第 26 篇6 张图1.5k 字图像分类看似最简单,但类别定义会直接决定上限。类别太粗无法解决业务问题,类别太细又需要更多数据。
AI计算机视觉27 计算机视觉应用之视频分析与关键帧提取
第 27 篇6 张图1.3k 字视频分析多了时间维度。关键帧提取的价值,是用更少的帧保留主要信息,降低后续识别和存储成本。
AI计算机视觉28 计算机视觉应用之自动驾驶与人脸识别
第 28 篇6 张图1.3k 字自动驾驶和人脸识别都属于高影响场景。模型准确率之外,还要关注误判代价、隐私边界和合规要求。
AI计算机视觉29 计算机视觉的未来趋势与挑战:当前研究热点
第 29 篇6 张图1.6k 字视觉研究热点不是孤立名词,它们都在回应真实问题:为什么模型这样判断,换场景会不会失效,生成内容怎么管,隐私如何保护。
AI计算机视觉30 计算机视觉面临的挑战
第 30 篇6 张图1.7k 字计算机视觉落地的难点常常不在模型 demo,而在真实数据变化、算力成本、解释要求和异常环境。
AI计算机视觉31 未来趋势与挑战:计算机视觉的研究方向
第 31 篇6 张图1.4k 字未来方向可以从两个问题理解:怎样让模型更可信,怎样让模型更便宜地跑在真实设备上。效率、泛化、解释和少标注会长期存在。
AI计算机视觉