8 常见概率分布之正态分布
系列进度
AI 概率必备 · 第 8 / 21 篇
整理说明
这篇内容怎么整理
郭震 · 2026-06-04
阅读路线
先按这条路线读
先抓住主线,再回到代码、配置和图文细节,读起来会更稳。
正态分布用均值定位中心,用标准差描述分散。许多误差和样本均值会近似呈现这种形状。
我会先看均值和标准差,再谈概率区间。只说正态,不给参数,信息是不完整的。
在概率论和统计学中,正态分布是一种极其重要的概率分布,其重要性部分来源于中央极限定理。本文将带您深入理解正态分布的性质、公式以及它在实际中的应用。
什么是正态分布?
正态分布,又称为高斯分布,是一种连续概率分布,其概率密度函数(PDF)呈钟形曲线。正态分布的公式为:
学习正态分布时,先看均值、标准差、对称性和标准化。很多概率判断都要先转成标准正态。
- 其中, 是均值(期望值)。
- 是标准差,表示数据的离散程度。
正态分布的性质
-
对称性:正态分布关于均值对称。
-
68-95-99.7法则:
- 约68%的数据落在均值+/-1个标准差范围内。
- 约95%的数据落在均值+/-2个标准差范围内。
- 约99.7%的数据落在均值+/-3个标准差范围内。
-
线性组合的正态性:如果是独立同分布的正态随机变量,则它们的线性组合也是正态分布。
正态分布的案例
假设我们对某个城市的居民身高进行研究,已知身高服从正态分布,均值为,标准差为。我们可以计算出在该城市中身高范围内的一些概率。
计算身高在165到185 cm之间的概率
首先,我们需要计算标准化值(Z值):
我们可以使用Z表查找对应的概率,或者使用Python代码进行计算:
import scipy.stats as stats
# 设置均值和标准差
mu = 175
sigma = 10
# 计算概率
prob = stats.norm.cdf(185, mu, sigma) - stats.norm.cdf(165, mu, sigma)
print(f"身高在165到185 cm之间的概率是: {prob:.4f}")
运行结果:
身高在165到185 cm之间的概率是: 0.6827
这意味着,在这个城镇中,约68.27%的人身高在165到185 cm之间,验证了68-95-99.7法则。
正态分布的应用
正态分布在多个领域都有广泛的应用,包括:
- 自然和社会科学:许多自然现象和社会数据(如身高、体重、智商等)都近似服从正态分布。
- 质量控制:在制造业中,产品的特性(如长度、重量)常常会被假设为正态分布,以便进行质量控制。
- 其他统计分析:正态分布是许多统计分析的基础,例如t检验、ANOVA分析等。
读到这里,可以把《常见概率分布之正态分布》整理成一张复盘表:先说清主线,再拿一个小任务检查结果。
读完《常见概率分布之正态分布》后,可以先挑一个小样例走完整流程,再判断哪些步骤已经能独立完成。
小结
本文简要介绍了正态分布的基本概念、性质以及实际应用,并通过一个实际案例进行了演示。正态分布是概率论中的重要组成部分,理解和掌握正态分布对于进行更复杂的统计分析至关重要。
读完《常见概率分布之正态分布》后,可以回头问三件事:它解决什么问题,哪一步最容易出错,自己能否拿一个小例子跑通。
在下篇文章中,我们将继续探讨泊松分布,一种用于描述事件在固定时间间隔内发生次数的离散概率分布。请继续关注!
继续阅读
从这篇继续找到相关教程
常见问题
读前先确认这三点
常见概率分布之正态分布适合谁读?
这是 AI 概率必备 系列第 8 / 21 篇,适合正在学习AI 概率必备,并且需要把概念落到操作步骤或判断标准里的读者。
读这篇AI 概率必备教程要多久?
按中文技术文章阅读速度估算,通读大约 3 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。
这篇文章里的图文节点怎么用?
正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。
分享文章
转发到常用平台
微信/朋友圈可先复制链接
相关教程
从相近问题继续读
继续阅读