郭震 AI公众号:郭震AI

9 描述性统计之数据的可视化

发布日期:

最近更新:

分类: 统计学小白

预计阅读: 3 分钟

阅读次数: 0

预计阅读3 分钟
结构重点8 个
图文要点6 张
正文规模1.2k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 8 个结构重点拆成环境、步骤、验证点和常见误区,尽量让读者能照着复现。
图文对照保留 6 张和配置、流程、判断结果有关的图片,方便快速定位正文重点。
持续校对工具、模型和命令变化较快,后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线,再回到代码、配置和图文细节,读起来会更稳。

图文要点

先看本文图文节点

按图先建立主线,再跳回正文核对步骤、配置和判断标准。

描述性统计之数据的可视化结构图查看大图
描述性统计之数据的可视化结构图

统计学的价值在于用有限样本做有边界的判断,学习时要同时看数据、假设和结论。阅读时可以按「描述性统计回顾 -> 数据可视化的基本图形 -> 直方图 -> 箱线图」建立结构,再回到正文里的代码、案例或指标做验证。

描述性统计之数据的可视化核对图查看大图
描述性统计之数据的可视化核对图

读完后,用一个真实小任务复查:输入是什么,处理环节在哪里,输出是否可验收;失败时先查「描述性统计回顾」,再查「数据可视化的基本图形」。

在统计学中,数据的可视化是理解和传达统计信息的重要工具。通过可视化,我们能够更直观地看到数据的整体趋势,以及各个变量之间的关系。本篇文章将重点讨论如何通过可视化手段来展示描述性统计数据,让我们能够更清晰地理解数据的特征。

1. 描述性统计回顾

在我们讨论可视化之前,先回顾一下上篇文章关于描述性统计之离散程度的度量。我们了解了几种离散程度的度量方法,如方差标准差四分位差。这些度量能描述数据分布的基本状态,接下来要解决的问题是:如何把分布特征以可视化的方式呈现出来?

统计数据可视化判断卡查看大图
统计数据可视化判断卡

做统计可视化时,先判断要展示分布、比较、趋势还是相关关系,再选择合适图表。

2. 数据可视化的基本图形

2.1 直方图

统计学阅读地图卡查看大图
统计学阅读地图卡

读完《描述性统计之数据的可视化》不要只停在“看懂了”。回头挑一个步骤动手做一遍,再记录哪里卡住,后面的学习会更稳。

直方图是展示数据分布的常用图形,能够清晰地显示数据的频率分布。通过对数据进行分组,可以查看到数据的整体形态,包括是否呈现出正态分布偏态分布等特征。

import matplotlib.pyplot as plt
import numpy as np

# 生成一些随机数据
data = np.random.normal(loc=0, scale=1, size=1000)

# 绘制直方图
plt.hist(data, bins=30, alpha=0.7, color='blue', edgecolor='black')
plt.title('直方图示例')
plt.xlabel('数值范围')
plt.ylabel('频次')
plt.grid()
plt.show()

2.2 箱线图

箱线图(Boxplot)是显示数据的集中趋势离散程度的一个有效图形。在箱线图中,中位数四分位数以及潜在的异常值都可以清晰地显示出来。

# 生成多组随机数据
data1 = np.random.normal(0, 1, 100)
data2 = np.random.normal(1, 1.5, 100)
data3 = np.random.normal(2, 0.5, 100)

# 绘制箱线图
plt.boxplot([data1, data2, data3], labels=['组1', '组2', '组3'])
plt.title('箱线图示例')
plt.ylabel('数值')
plt.grid()
plt.show()

2.3 散点图

如果我们有多维数据,散点图是一种理想的可视化方法。它可以帮助我们查看两个变量之间的关系,判断是否存在相关性。

# 生成两组相关数据
x = np.random.rand(100)
y = x + np.random.normal(0, 0.1, 100)

# 绘制散点图
plt.scatter(x, y, alpha=0.5, color='orange')
plt.title('散点图示例')
plt.xlabel('变量X')
plt.ylabel('变量Y')
plt.grid()
plt.show()

2.4 条形图

条形图适合于比较不同类别的数据,展示类别之间的差异。

# 准备类别数据
categories = ['A', 'B', 'C']
values = [10, 20, 15]

# 绘制条形图
plt.bar(categories, values, color='green', alpha=0.7)
plt.title('条形图示例')
plt.ylabel('值')
plt.grid()
plt.show()

3. 数据可视化的注意事项

在进行数据可视化时,几个要点需要注意:

  • 清晰性:确保图形中的信息尽量简明清楚,避免过多的技术细节干扰信息传达。
  • 一致性:使用统一的颜色和风格,保持风格的一致性,便于观察者理解。
  • 适当选择图形:根据数据的特点合理选择可视化的图形,直方图适合展示分布情况,而散点图适合展示多变量之间的关系。
描述性统计之数据的可视化应用复盘卡查看大图
描述性统计之数据的可视化应用复盘卡

复习《描述性统计之数据的可视化》时,建议把关键概念、操作步骤和可见结果放在同一页里回看。

描述性统计之数据的可视化应用检查卡查看大图
描述性统计之数据的可视化应用检查卡

练习《描述性统计之数据的可视化》时,建议把输入条件、处理动作和可见结果写在一起,方便下次复查。

4. 总结

通过本篇文章,我们在描述性统计的框架下,学习了几种常见的数据可视化方法。这些方法可以帮助我们更直观地看到数据的趋势和特征,为后续的概率基础和其他统计分析打下良好的基础。在下一篇中,我们将进一步探索概率的基本概念,为更深入的统计分析做好准备。

继续阅读

从这篇继续找到相关教程

AI 教程总索引

常见问题

读前先确认这三点

描述性统计之数据的可视化适合谁读?

这是 统计学入门 系列第 9 / 24 篇,适合正在学习统计学入门,并且需要把概念落到操作步骤或判断标准里的读者。

读这篇统计学入门教程要多久?

按中文技术文章阅读速度估算,通读大约 3 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。

这篇文章里的图文节点怎么用?

正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。

分享文章

转发到常用平台

微信/朋友圈可先复制链接

相关教程

AI 教程总索引

继续阅读

继续找到相关 AI 教程

返回栏目

Reader Messages

读者留言

有问题、补充资料或实测结果,可以直接留下。这里不需要登录。

最多 800 字

为了防刷,每条留言会做长度、链接数量和提交频率限制。

0/800

留言列表

0
正在加载留言...