8 描述性统计之离散程度的度量

Q: 描述性统计之离散程度的度量适合谁读？

这是 统计学入门 系列第 8 / 24 篇，适合正在学习统计学入门，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-10

最近更新: 2026-06-04

分类: 统计学小白

预计阅读: 5 分钟

阅读次数: 0

系列进度

统计学入门 · 第 8 / 24 篇

上一篇描述性统计之中心趋势的度量下一篇描述性统计之数据的可视化

预计阅读5 分钟

结构重点8 个

图文要点6 张

正文规模2.0k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 8 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步离散程度的度量 02第 2 步Python 示例代码 03第 3 步小结

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线描述性统计之离散程度的度量结构图跳到对应正文位置

图 02 · 步骤描述性统计之离散程度的度量核对图跳到对应正文位置

图 03 · 配置离散程度度量判断卡跳到对应正文位置

图 04 · 判断统计学阅读地图卡跳到对应正文位置

图 05 · 复盘描述性统计之离散程度的度量应用复盘卡跳到对应正文位置

图 06 · 细节描述性统计之离散程度的度量应用检查卡跳到对应正文位置

统计学的价值在于用有限样本做有边界的判断，学习时要同时看数据、假设和结论。阅读时可以按「离散程度的度量 -> 全距 -> 四分位差 -> 方差」建立结构，再回到正文里的代码、案例或指标做验证。

读完后，用一个真实小任务复查：输入是什么，处理环节在哪里，输出是否可验收；失败时先查「离散程度的度量」，再查「全距」。

在上一篇中，我们探讨了描述性统计中的中心趋势度量，如均值、中位数和众数等。这些度量提供了关于数据集中趋势的重要信息，但仅靠它们并不能全面了解数据的分布特征。为了深入了解数据集，我们需要引入离散程度的度量，帮助我们理解数据的变异性和分散性。

离散程度的度量

离散程度度量用于描述数据值相对于其中心趋势的分布情况。常用的离散程度度量包括：

学习离散程度时，先看数据范围、异常值、方差、标准差和四分位距。只看平均数会丢掉波动信息。

全距（Range）
四分位差（Interquartile Range, IQR）
方差（Variance）
标准差（Standard Deviation）
变异系数（Coefficient of Variation, CV）

1. 全距

全距是数据集中最大值和最小值之间的差距，用于表示数据值的范围。公式为：

\text{全距} = \text{最大值} - \text{最小值}

案例：假设我们有一组学生的考试成绩：[75, 82, 90, 68, 88]。

计算全距：

最大值 = 90
最小值 = 68

全距 = $90 - 68 = 22$ 。

这意味着该组数据的分布范围是22分。

2. 四分位差（IQR）

四分位差是数据中上四分位数（Q3）与下四分位数（Q1）之间的差距，体现了中间50%数据的变异程度。公式为：

\text{四分位差} = Q3 - Q1

案例：使用上面的成绩数据，可以先计算四分位数：

Q1 = 75
Q3 = 90

四分位差 = $90 - 75 = 15$ 。

这表明中间50%的成绩分布范围是15分。

3. 方差

方差是数据集中每个值与均值之间差异的平方的平均值。它的计算公式为：

\text{方差} = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2

其中， $n$ 是数据点的个数， $x_i$ 是每个数据点， $\bar{x}$ 是数据的均值。

案例：对上述成绩数据进行方差计算：

均值 $\bar{x} = \frac{75 + 82 + 90 + 68 + 88}{5} = 80.6$ 。

计算每个数据点与均值的差的平方：

$(75 - 80.6)^2 = 30.76$
$(82 - 80.6)^2 = 1.96$
$(90 - 80.6)^2 = 87.36$
$(68 - 80.6)^2 = 156.96$
$(88 - 80.6)^2 = 54.76$

方差 = $\frac{30.76 + 1.96 + 87.36 + 156.96 + 54.76}{5} = 66.36$ 。

4. 标准差

标准差是方差的平方根，表示数据的离散程度。计算公式为：

\text{标准差} = \sqrt{\text{方差}}

案例：从上面的方差计算得到的结果：

标准差 = $\sqrt{66.36} \approx 8.14$ 。

这意味着成绩的散布度大约是8.14分。

5. 变异系数（CV）

变异系数是标准差与均值的比率，通常表示为百分比。公式为：

\text{变异系数} = \frac{\text{标准差}}{\text{均值}} \times 100\%

案例：使用上面的结果：

均值 $\bar{x} = 80.6$ ，标准差 $\approx 8.14$ 。

变异系数 = $\frac{8.14}{80.6} \times 100\% \approx 10.1\%$ 。

这表示成绩的相对变异程度是10.1%。

Python 示例代码

以下是一个简单的Python代码示例，用于计算上述离散程度的度量：

《描述性统计之离散程度的度量》可以按“场景、概念、动作、结果”来读。先把这四件事对齐，再回到正文里的参数、代码或流程。

import numpy as np

scores = np.array([75, 82, 90, 68, 88])

# 计算全距
range_ = np.max(scores) - np.min(scores)

# 计算四分位差
Q1 = np.percentile(scores, 25)
Q3 = np.percentile(scores, 75)
IQR = Q3 - Q1

# 计算方差与标准差
variance = np.var(scores)
std_dev = np.std(scores)

# 计算变异系数
mean = np.mean(scores)
CV = (std_dev / mean) * 100

print(f"全距: {range_}")
print(f"四分位差: {IQR}")
print(f"方差: {variance}")
print(f"标准差: {std_dev}")
print(f"变异系数: {CV:.2f}%")