郭震 AI公众号:郭震AI

8 描述性统计之离散程度的度量

发布日期:

最近更新:

分类: 统计学小白

预计阅读: 5 分钟

阅读次数: 0

预计阅读5 分钟
结构重点8 个
图文要点6 张
正文规模2.0k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 8 个结构重点拆成环境、步骤、验证点和常见误区,尽量让读者能照着复现。
图文对照保留 6 张和配置、流程、判断结果有关的图片,方便快速定位正文重点。
持续校对工具、模型和命令变化较快,后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线,再回到代码、配置和图文细节,读起来会更稳。

图文要点

先看本文图文节点

按图先建立主线,再跳回正文核对步骤、配置和判断标准。

描述性统计之离散程度的度量结构图查看大图
描述性统计之离散程度的度量结构图

统计学的价值在于用有限样本做有边界的判断,学习时要同时看数据、假设和结论。阅读时可以按「离散程度的度量 -> 全距 -> 四分位差 -> 方差」建立结构,再回到正文里的代码、案例或指标做验证。

描述性统计之离散程度的度量核对图查看大图
描述性统计之离散程度的度量核对图

读完后,用一个真实小任务复查:输入是什么,处理环节在哪里,输出是否可验收;失败时先查「离散程度的度量」,再查「全距」。

在上一篇中,我们探讨了描述性统计中的中心趋势度量,如均值、中位数和众数等。这些度量提供了关于数据集中趋势的重要信息,但仅靠它们并不能全面了解数据的分布特征。为了深入了解数据集,我们需要引入离散程度的度量,帮助我们理解数据的变异性和分散性。

离散程度的度量

离散程度度量用于描述数据值相对于其中心趋势的分布情况。常用的离散程度度量包括:

离散程度度量判断卡查看大图
离散程度度量判断卡

学习离散程度时,先看数据范围、异常值、方差、标准差和四分位距。只看平均数会丢掉波动信息。

  1. 全距(Range)
  2. 四分位差(Interquartile Range, IQR)
  3. 方差(Variance)
  4. 标准差(Standard Deviation)
  5. 变异系数(Coefficient of Variation, CV)

1. 全距

全距是数据集中最大值和最小值之间的差距,用于表示数据值的范围。公式为:

全距=最大值最小值\text{全距} = \text{最大值} - \text{最小值}

案例:假设我们有一组学生的考试成绩:[75, 82, 90, 68, 88]

计算全距:

  • 最大值 = 90
  • 最小值 = 68

全距 = 9068=2290 - 68 = 22

这意味着该组数据的分布范围是22分。

2. 四分位差(IQR)

四分位差是数据中上四分位数(Q3)与下四分位数(Q1)之间的差距,体现了中间50%数据的变异程度。公式为:

四分位差=Q3Q1\text{四分位差} = Q3 - Q1

案例:使用上面的成绩数据,可以先计算四分位数:

  • Q1 = 75
  • Q3 = 90

四分位差 = 9075=1590 - 75 = 15

这表明中间50%的成绩分布范围是15分。

3. 方差

方差是数据集中每个值与均值之间差异的平方的平均值。它的计算公式为:

方差=1ni=1n(xixˉ)2\text{方差} = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2

其中,nn是数据点的个数,xix_i是每个数据点,xˉ\bar{x}是数据的均值。

案例:对上述成绩数据进行方差计算:

  • 均值 xˉ=75+82+90+68+885=80.6\bar{x} = \frac{75 + 82 + 90 + 68 + 88}{5} = 80.6

计算每个数据点与均值的差的平方:

  • (7580.6)2=30.76(75 - 80.6)^2 = 30.76
  • (8280.6)2=1.96(82 - 80.6)^2 = 1.96
  • (9080.6)2=87.36(90 - 80.6)^2 = 87.36
  • (6880.6)2=156.96(68 - 80.6)^2 = 156.96
  • (8880.6)2=54.76(88 - 80.6)^2 = 54.76

方差 = 30.76+1.96+87.36+156.96+54.765=66.36\frac{30.76 + 1.96 + 87.36 + 156.96 + 54.76}{5} = 66.36

4. 标准差

标准差是方差的平方根,表示数据的离散程度。计算公式为:

标准差=方差\text{标准差} = \sqrt{\text{方差}}

案例:从上面的方差计算得到的结果:

标准差 = 66.368.14\sqrt{66.36} \approx 8.14

这意味着成绩的散布度大约是8.14分。

5. 变异系数(CV)

变异系数是标准差与均值的比率,通常表示为百分比。公式为:

变异系数=标准差均值×100%\text{变异系数} = \frac{\text{标准差}}{\text{均值}} \times 100\%

案例:使用上面的结果:

  • 均值 xˉ=80.6\bar{x} = 80.6,标准差 8.14\approx 8.14

变异系数 = 8.1480.6×100%10.1%\frac{8.14}{80.6} \times 100\% \approx 10.1\%

这表示成绩的相对变异程度是10.1%。

Python 示例代码

以下是一个简单的Python代码示例,用于计算上述离散程度的度量:

统计学阅读地图卡查看大图
统计学阅读地图卡

《描述性统计之离散程度的度量》可以按“场景、概念、动作、结果”来读。先把这四件事对齐,再回到正文里的参数、代码或流程。

import numpy as np

scores = np.array([75, 82, 90, 68, 88])

# 计算全距
range_ = np.max(scores) - np.min(scores)

# 计算四分位差
Q1 = np.percentile(scores, 25)
Q3 = np.percentile(scores, 75)
IQR = Q3 - Q1

# 计算方差与标准差
variance = np.var(scores)
std_dev = np.std(scores)

# 计算变异系数
mean = np.mean(scores)
CV = (std_dev / mean) * 100

print(f"全距: {range_}")
print(f"四分位差: {IQR}")
print(f"方差: {variance}")
print(f"标准差: {std_dev}")
print(f"变异系数: {CV:.2f}%")
描述性统计之离散程度的度量应用复盘卡查看大图
描述性统计之离散程度的度量应用复盘卡

读到这里,可以把《描述性统计之离散程度的度量》整理成一张复盘表:先说清主线,再拿一个小任务检查结果。

描述性统计之离散程度的度量应用检查卡查看大图
描述性统计之离散程度的度量应用检查卡

读完《描述性统计之离散程度的度量》后,可以先挑一个小样例走完整流程,再判断哪些步骤已经能独立完成。

小结

在本篇中,我们探讨了描述性统计中离散程度的度量,这些度量帮助我们理解数据的变异性。在实际应用中,结合中心趋势与离散程度的度量,可以更全面地分析数据特征。接下来的文章中,我们将进一步讨论如何通过可视化手段来直观呈现数据的各种统计信息。

继续阅读

从这篇继续找到相关教程

AI 教程总索引

常见问题

读前先确认这三点

描述性统计之离散程度的度量适合谁读?

这是 统计学入门 系列第 8 / 24 篇,适合正在学习统计学入门,并且需要把概念落到操作步骤或判断标准里的读者。

读这篇统计学入门教程要多久?

按中文技术文章阅读速度估算,通读大约 5 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。

这篇文章里的图文节点怎么用?

正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。

分享文章

转发到常用平台

微信/朋友圈可先复制链接

相关教程

AI 教程总索引

继续阅读

继续找到相关 AI 教程

返回栏目

Reader Messages

读者留言

有问题、补充资料或实测结果,可以直接留下。这里不需要登录。

最多 800 字

为了防刷,每条留言会做长度、链接数量和提交频率限制。

0/800

留言列表

0
正在加载留言...