郭震 AI公众号:郭震AI

7 描述性统计之中心趋势的度量

发布日期:

最近更新:

分类: 统计学小白

预计阅读: 3 分钟

阅读次数: 0

预计阅读3 分钟
结构重点5 个
图文要点6 张
正文规模1.4k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 5 个结构重点拆成环境、步骤、验证点和常见误区,尽量让读者能照着复现。
图文对照保留 6 张和配置、流程、判断结果有关的图片,方便快速定位正文重点。
持续校对工具、模型和命令变化较快,后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线,再回到代码、配置和图文细节,读起来会更稳。

图文要点

先看本文图文节点

按图先建立主线,再跳回正文核对步骤、配置和判断标准。

描述性统计之中心趋势的度量结构图查看大图
描述性统计之中心趋势的度量结构图

统计学的价值在于用有限样本做有边界的判断,学习时要同时看数据、假设和结论。阅读时可以按「什么是中心趋势? -> 均值 -> 中位数 -> 众数」建立结构,再回到正文里的代码、案例或指标做验证。

描述性统计之中心趋势的度量核对图查看大图
描述性统计之中心趋势的度量核对图

读完后,用一个真实小任务复查:输入是什么,处理环节在哪里,输出是否可验收;失败时先查「什么是中心趋势?」,再查「均值」。

在上一节中,我们讨论了数据的类型以及如何进行数据的收集,了解了样本总体的区别。在进行统计分析之前,我们需要先了解数据的特征,而中心趋势的度量是描述性统计中的一个核心概念。它帮助我们理解数据的集中位置,从而为后续的分析奠定基础。

什么是中心趋势?

中心趋势是用于描述数据集的“中心”或“典型值”的统计度量。通过中心趋势,我们可以了解数据的普遍状态,通常包括以下三种主要度量:

中心趋势度量判断卡查看大图
中心趋势度量判断卡

学习中心趋势时,先看数据是否偏斜、是否有异常值、是否是分类数据。不同分布要选不同指标。

  1. 均值(Mean)
  2. 中位数(Median)
  3. 众数(Mode)

1. 均值(Mean)

均值是数据集中的所有数值的总和除以数值的数量。用公式表示为:

均值(xˉ)=i=1nxin\text{均值} \,(\bar{x}) = \frac{\sum_{i=1}^{n} x_i}{n}

其中,xix_i表示数据集中第ii个数值,nn是数据的总数。

案例:

假设我们有一组学生的考试成绩:[85, 90, 78, 92, 88]

计算均值的过程如下:

  1. 总和 = 85+90+78+92+88=43385 + 90 + 78 + 92 + 88 = 433
  2. 数据数量 = 5
  3. 均值 = 433/5=86.6433 / 5 = 86.6
# Python代码示例
scores = [85, 90, 78, 92, 88]
mean = sum(scores) / len(scores)
print("均值:", mean)  # 输出: 均值: 86.6

2. 中位数(Median)

中位数是将一组数值进行排序后,处于中间位置的数值。对于奇数个数值,中位数就是中间那个数;对于偶数个数值,中位数是中间两个数的均值。

案例:

考虑第二组数据:[85, 90, 78, 92, 88]

  1. 排序后:[78, 85, 88, 90, 92]
  2. 中间数(3rd)= 88

对于偶数的数据集,例如[85, 90, 78, 92](排序后[78, 85, 90, 92]),中位数为:

中位数=85+902=87.5\text{中位数} = \frac{85 + 90}{2} = 87.5
# Python代码示例
import numpy as np

scores_even = [85, 90, 78, 92]
median_even = np.median(scores_even)
print("偶数数据集的中位数:", median_even)  # 输出: 偶数数据集的中位数: 87.5

scores_odd = [85, 90, 78, 92, 88]
median_odd = np.median(scores_odd)
print("奇数数据集的中位数:", median_odd)  # 输出: 奇数数据集的中位数: 88.0

3. 众数(Mode)

众数是指在数据集中的出现频率最高的数值。可以有一个众数、多个众数,或没有众数的情况。

案例:

考虑数据集[1, 2, 2, 3, 4, 4, 4, 5]

在此数据集中,数字4出现的次数最多,因此众数是4

# Python代码示例
from scipy import stats

data = [1, 2, 2, 3, 4, 4, 4, 5]
mode = stats.mode(data)
print("众数:", mode.mode[0])  # 输出: 众数: 4
描述性统计之中心趋势的度量应用复盘卡查看大图
描述性统计之中心趋势的度量应用复盘卡

如果《描述性统计之中心趋势的度量》还没完全消化,可以从这张卡片的四个动作重新走一遍。

描述性统计之中心趋势的度量应用检查卡查看大图
描述性统计之中心趋势的度量应用检查卡

回看《描述性统计之中心趋势的度量》时,不必一次做大项目,先用一条简单样例确认主线是否清楚。

小结

在这一节中,我们详细讨论了描述性统计中三个主要的中心趋势度量:均值、中位数和众数。理解这些的计算方法及其适用场景对于我们后续的统计分析至关重要。中心趋势提供了数据的整体概貌,但不同的度量在面对不同的数据特征时,其适用性也各不相同。

统计学阅读地图卡查看大图
统计学阅读地图卡

开始读《描述性统计之中心趋势的度量》前,可以先看图中从问题到结果的路径。读完后再对照正文,确认自己能不能照着复现。

在下一节,我们将探讨描述性统计中的离散程度度量,这将帮助我们理解数据的分散性和变异性。

继续阅读

从这篇继续找到相关教程

AI 教程总索引

常见问题

读前先确认这三点

描述性统计之中心趋势的度量适合谁读?

这是 统计学入门 系列第 7 / 24 篇,适合正在学习统计学入门,并且需要把概念落到操作步骤或判断标准里的读者。

读这篇统计学入门教程要多久?

按中文技术文章阅读速度估算,通读大约 3 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。

这篇文章里的图文节点怎么用?

正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。

分享文章

转发到常用平台

微信/朋友圈可先复制链接

相关教程

AI 教程总索引

继续阅读

继续找到相关 AI 教程

返回栏目

Reader Messages

读者留言

有问题、补充资料或实测结果,可以直接留下。这里不需要登录。

最多 800 字

为了防刷,每条留言会做长度、链接数量和提交频率限制。

0/800

留言列表

0
正在加载留言...