3 引言之机器学习的发展历程
系列进度
机器学习入门 · 第 3 / 21 篇
整理说明
这篇内容怎么整理
郭震 · 2026-06-04
阅读路线
先按这条路线读
先抓住主线,再回到代码、配置和图文细节,读起来会更稳。
机器学习的发展不是一条单纯追求复杂模型的线。每个阶段都在回答同一个问题:怎样从有限数据里学到可泛化的规律。
读历史时,不要只记年份。把每种方法放进一个问题里:当时缺数据、缺算力、缺特征,还是缺表达能力。
机器学习作为人工智能领域的重要分支,近年来引起了广泛关注。从最初的理论探索到面对现实问题的实际应用,机器学习经历了悠久而曲折的发展历程。在本篇引言中,我们将回顾机器学习的重大里程碑和技术进步,以帮助初学者更好地理解这门充满活力的学科,并为即将到来的监督学习和非监督学习的基础知识打下坚实的基础。
初创时期:探索与理论
机器学习的起源可以追溯到20世纪50年代。当时,研究人员主要集中在模式识别和统计学习上。1956年,达特茅斯会议被认为是人工智能的正式开端,此次会议探讨了机器如何模拟人类的学习和思考能力。早期的工作如感知机模型(Perceptron)是构建神经网络的基础。
阅读发展历程时,可以看数据规模、计算能力、算法思想和评估方法如何变化。历史线索能帮助理解为什么今天的流程这样设计。
案例:感知机模型
感知机是一个简单的线性分类器,可以用来解决二分类问题。假设我们有一些数据点,我们希望通过一条直线将它们分开。感知机的计算过程可以表达为:
其中,是权重向量,是输入特征,是偏置。这个模型与实际区分图像中猫和狗的情况相似。通过适当调整权重,感知机可以成功地将这些图像分类。
发展阶段:算法的多样化
1970年代和1980年代,机器学习算法逐渐丰富。此时,决策树、K均值聚类等基本算法开始被人们发现并应用于实际问题。同时,神经网络作为一种新的学习方法,开始受到更多关注,虽然当时仍面临计算能力不足的挑战。
阅读《引言之机器学习的发展历程》前,可以先用配图确认主线;读完后再检查哪些步骤能直接操作,哪些还需要补资料。
案例:K均值聚类
K均值聚类是一种简单而高效的非监督学习算法,用于将数据集分成K个簇。假设我们有一些客户数据,我们希望将客户根据消费行为进行聚类。这种聚类可以用以下步骤实现:
- 随机选择K个初始中心。
- 分配每个数据点到最近的中心,从而形成K个簇。
- 更新每个簇的中心点。
- 重复步骤2和3,直到中心点不再变化。
K均值算法的简单性和有效性,使其成为许多应用场景中的首选,如市场细分和图像压缩。
崛起时期:大数据与深度学习
进入21世纪,随着互联网的快速发展和计算能力的提升,数据量急剧增加,这为机器学习的快速发展提供了良好的土壤。深度学习的兴起,使得机器学习在处理复杂问题时取得了巨大成功,尤其是在图像识别、自然语言处理等领域。2012年,AlexNet模型在ImageNet竞赛中取得显著成果,正式启发了深度学习的广泛应用。
深度学习示例:卷积神经网络(CNN)
卷积神经网络(CNN)是深度学习中用于图像处理的强大工具。一个简单的CNN模型通常包括多个卷积层、激活层和池化层。其基本的卷积操作可以表示为:
其中,是卷积核,是输入图像,是偏置,是激活函数。利用CNN处理手写数字识别的数据集MNIST,可以极大地提高准确率,与传统方法相比,表现出强大的性能。
如果《引言之机器学习的发展历程》还没完全消化,可以从这张卡片的四个动作重新走一遍。
回看《引言之机器学习的发展历程》时,不必一次做大项目,先用一条简单样例确认主线是否清楚。
结语
经过几十年的发展,机器学习已经从一个理论基础逐步演变为一个应用广泛、技术成熟的领域。虽然前面的章节提到的案例只是冰山一角,但它们展示了机器学习如何利用不同的算法解决实际问题。下一篇中,我们将深入探讨监督学习和非监督学习的基本概念和相应的技术实施,为大家即将进入的学习旅程奠定基础。
继续阅读
从这篇继续找到相关教程
常见问题
读前先确认这三点
引言之机器学习的发展历程适合谁读?
这是 机器学习入门 系列第 3 / 21 篇,适合正在学习机器学习入门,并且需要把概念落到操作步骤或判断标准里的读者。
读这篇机器学习入门教程要多久?
按中文技术文章阅读速度估算,通读大约 4 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。
这篇文章里的图文节点怎么用?
正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。
分享文章
转发到常用平台
微信/朋友圈可先复制链接
相关教程
从相近问题继续读
继续阅读