4 数据类型与数据收集之定量与定性数据
系列进度
统计学入门 · 第 4 / 24 篇
整理说明
这篇内容怎么整理
郭震 · 2026-06-04
阅读路线
先按这条路线读
先抓住主线,再回到代码、配置和图文细节,读起来会更稳。
统计学的价值在于用有限样本做有边界的判断,学习时要同时看数据、假设和结论。阅读时可以按「什么是数据类型? -> 定量数据 -> 定性数据 -> 数据收集的基本重要性」建立结构,再回到正文里的代码、案例或指标做验证。
读完后,用一个真实小任务复查:输入是什么,处理环节在哪里,输出是否可验收;失败时先查「什么是数据类型?」,再查「定量数据」。
在上篇中,我们讨论了统计学的重要性,了解了统计学在科研、商业决策及政策制定等各个领域中的作用。本篇将进一步深入到数据的类型与数据收集,特别是定量数据与定性数据的区别与应用。
什么是数据类型?
在统计学中,数据通常可以被分为两大类:定量数据和定性数据。这两种数据类型在研究和分析过程中具有不同的特点和应用场景。
学习数据类型时,先判断字段是定量还是定性、离散还是连续、是否有顺序。数据类型选错,统计方法也会跟着错。
定量数据
定量数据是指能够用数字表示的数据,这类数据可以进行数学运算,通常用于测量或计数。定量数据又可以细分为两种类型:
-
离散数值数据:这类数据只取有限的数值,例如:家庭中的孩子数量、投票选出的候选人数等。离散数据通常是整数值。
例子:一个班级里有25名学生,学生的数量就是离散数据。
-
连续数值数据:这类数据可以在一个范围内取无限的值,如身高、体重、温度等。这些数据可以是小数,且在特定范围内可取任意值。
例子:一个人的体重可能是66.5公斤或者72.3公斤,这种测量的结果就是连续数据。
例子与代码实例
在实际应用中,我们可以使用Python统计一组样本的体重数据:
import numpy as np
# 假设我们收集到的体重数据(单位:公斤)
weights = np.array([60.5, 70.2, 80.3, 65.0, 75.5])
mean_weight = np.mean(weights)
print(f"样本的平均体重:{mean_weight:.2f} 公斤")
在这个例子中,我们通过计算数组中体重的平均值来展示了对连续数值数据的简单分析。
定性数据
定性数据是指不能用数字来表示的数据,这类数据通常用于描述类别或特征。定性数据也可以分为以下两种类型:
-
名义数据:这类数据用于表示类别之间的区别,没有内在的顺序。例如:性别(男或女)、血型(A型、B型等)等。
例子:调查中,受访者的性别标记为“男”或“女”。
-
序数数据:这类数据表示类别之间有顺序或等级关系,但仍然不能进行数学运算。例如:教育程度(小学、中学、大学)、满意度(非常满意、满意、不满意)。
例子:顾客对产品的满意度调查,可能的选项为“非常满意”、“满意”、“一般”、“不满意”。
例子与代码实例
同样,我们也可以用Python来统计一组满意度调查的结果:
from collections import Counter
# 假设我们收集到的满意度调查结果
satisfaction = ["满意", "非常满意", "一般", "不满意", "满意", "满意", "非常满意"]
# 统计各个满意度的出现次数
counter = Counter(satisfaction)
print("满意度统计:")
for level, count in counter.items():
print(f"{level}: {count} 次")
在该代码中,我们对不同的满意度记录进行了统计,展示了名义数据分类统计的实际操作。
数据收集的基本重要性
在收集数据的时候,选择合适的数据类型是非常关键的,这能够影响到最终数据的分析结果和研究结论。定量数据适合于利用统计模型进行数量分析,而定性数据更适合进行描述性分析或使用分类技术。
读完《数据类型与数据收集之定量与定性数据》后,可以先挑一个小样例走完整流程,再判断哪些步骤已经能独立完成。
读到这里,可以把《数据类型与数据收集之定量与定性数据》整理成一张复盘表:先说清主线,再拿一个小任务检查结果。
读完《数据类型与数据收集之定量与定性数据》不要只停在“看懂了”。回头挑一个步骤动手做一遍,再记录哪里卡住,后面的学习会更稳。
本文介绍的定量数据和定性数据在后续的数据收集方法中将会有更深入的应用讨论。在接下来的篇章中,我们将重点关注如何有效地收集这些不同类型的数据,以确保研究结果的有效性与可靠性。
请继续关注下篇:数据收集方法的重要性与实践。
继续阅读
从这篇继续找到相关教程
常见问题
读前先确认这三点
数据类型与数据收集之定量与定性数据适合谁读?
这是 统计学入门 系列第 4 / 24 篇,适合正在学习统计学入门,并且需要把概念落到操作步骤或判断标准里的读者。
读这篇统计学入门教程要多久?
按中文技术文章阅读速度估算,通读大约 4 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。
这篇文章里的图文节点怎么用?
正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。
分享文章
转发到常用平台
微信/朋友圈可先复制链接
相关教程
从相近问题继续读
继续阅读