8 描述性统计之离散程度的度量
系列进度
统计学入门 · 第 8 / 24 篇
整理说明
这篇内容怎么整理
郭震 · 2026-06-04
阅读路线
先按这条路线读
先抓住主线,再回到代码、配置和图文细节,读起来会更稳。
统计学的价值在于用有限样本做有边界的判断,学习时要同时看数据、假设和结论。阅读时可以按「离散程度的度量 -> 全距 -> 四分位差 -> 方差」建立结构,再回到正文里的代码、案例或指标做验证。
读完后,用一个真实小任务复查:输入是什么,处理环节在哪里,输出是否可验收;失败时先查「离散程度的度量」,再查「全距」。
在上一篇中,我们探讨了描述性统计中的中心趋势度量,如均值、中位数和众数等。这些度量提供了关于数据集中趋势的重要信息,但仅靠它们并不能全面了解数据的分布特征。为了深入了解数据集,我们需要引入离散程度的度量,帮助我们理解数据的变异性和分散性。
离散程度的度量
离散程度度量用于描述数据值相对于其中心趋势的分布情况。常用的离散程度度量包括:
学习离散程度时,先看数据范围、异常值、方差、标准差和四分位距。只看平均数会丢掉波动信息。
- 全距(Range)
- 四分位差(Interquartile Range, IQR)
- 方差(Variance)
- 标准差(Standard Deviation)
- 变异系数(Coefficient of Variation, CV)
1. 全距
全距是数据集中最大值和最小值之间的差距,用于表示数据值的范围。公式为:
案例:假设我们有一组学生的考试成绩:[75, 82, 90, 68, 88]。
计算全距:
- 最大值 = 90
- 最小值 = 68
全距 = 。
这意味着该组数据的分布范围是22分。
2. 四分位差(IQR)
四分位差是数据中上四分位数(Q3)与下四分位数(Q1)之间的差距,体现了中间50%数据的变异程度。公式为:
案例:使用上面的成绩数据,可以先计算四分位数:
- Q1 = 75
- Q3 = 90
四分位差 = 。
这表明中间50%的成绩分布范围是15分。
3. 方差
方差是数据集中每个值与均值之间差异的平方的平均值。它的计算公式为:
其中,是数据点的个数,是每个数据点,是数据的均值。
案例:对上述成绩数据进行方差计算:
- 均值 。
计算每个数据点与均值的差的平方:
方差 = 。
4. 标准差
标准差是方差的平方根,表示数据的离散程度。计算公式为:
案例:从上面的方差计算得到的结果:
标准差 = 。
这意味着成绩的散布度大约是8.14分。
5. 变异系数(CV)
变异系数是标准差与均值的比率,通常表示为百分比。公式为:
案例:使用上面的结果:
- 均值 ,标准差 。
变异系数 = 。
这表示成绩的相对变异程度是10.1%。
Python 示例代码
以下是一个简单的Python代码示例,用于计算上述离散程度的度量:
《描述性统计之离散程度的度量》可以按“场景、概念、动作、结果”来读。先把这四件事对齐,再回到正文里的参数、代码或流程。
import numpy as np
scores = np.array([75, 82, 90, 68, 88])
# 计算全距
range_ = np.max(scores) - np.min(scores)
# 计算四分位差
Q1 = np.percentile(scores, 25)
Q3 = np.percentile(scores, 75)
IQR = Q3 - Q1
# 计算方差与标准差
variance = np.var(scores)
std_dev = np.std(scores)
# 计算变异系数
mean = np.mean(scores)
CV = (std_dev / mean) * 100
print(f"全距: {range_}")
print(f"四分位差: {IQR}")
print(f"方差: {variance}")
print(f"标准差: {std_dev}")
print(f"变异系数: {CV:.2f}%")
读到这里,可以把《描述性统计之离散程度的度量》整理成一张复盘表:先说清主线,再拿一个小任务检查结果。
读完《描述性统计之离散程度的度量》后,可以先挑一个小样例走完整流程,再判断哪些步骤已经能独立完成。
小结
在本篇中,我们探讨了描述性统计中离散程度的度量,这些度量帮助我们理解数据的变异性。在实际应用中,结合中心趋势与离散程度的度量,可以更全面地分析数据特征。接下来的文章中,我们将进一步讨论如何通过可视化手段来直观呈现数据的各种统计信息。
继续阅读
从这篇继续找到相关教程
常见问题
读前先确认这三点
描述性统计之离散程度的度量适合谁读?
这是 统计学入门 系列第 8 / 24 篇,适合正在学习统计学入门,并且需要把概念落到操作步骤或判断标准里的读者。
读这篇统计学入门教程要多久?
按中文技术文章阅读速度估算,通读大约 5 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。
这篇文章里的图文节点怎么用?
正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。
分享文章
转发到常用平台
微信/朋友圈可先复制链接
相关教程
从相近问题继续读
继续阅读