19 假设检验之假设的构建与检验
系列进度
统计学入门 · 第 19 / 24 篇
整理说明
这篇内容怎么整理
郭震 · 2026-06-04
阅读路线
先按这条路线读
先抓住主线,再回到代码、配置和图文细节,读起来会更稳。
统计学的价值在于用有限样本做有边界的判断,学习时要同时看数据、假设和结论。阅读时可以按「什么是假设? -> 示例 -> 假设的构建 -> 案例分析:药物效果的假设检验」建立结构,再回到正文里的代码、案例或指标做验证。
读完后,用一个真实小任务复查:输入是什么,处理环节在哪里,输出是否可验收;失败时先查「什么是假设?」,再查「示例」。
在统计学中,假设检验是一种重要的推断方法,用于判断某个假设是否成立。前一篇中,我们探讨了回归分析的应用,这为我们理解数据中的关系提供了依据。而在本篇中,我们将深入学习如何构建和检验假设,这将在后续讨论中引入P值与显著性的讨论。
什么是假设?
在统计学中,假设是对某种现象或关系的初步猜测或声明。假设通常分为两种:
学习假设检验时,先看原假设、备择假设、检验统计量、p 值、显著性水平和结论边界。
- 零假设():这是一种保守的声明,表示没有变化或没有效应。通常是我们希望通过数据来“否定”的假设。
- 备择假设( 或 ):这是我们希望支持或证明的假设,表示存在某种变化或效应。
示例
假设我们想要研究某种药物是否能有效降低血压。我们可以构建以下假设:
- :药物对血压没有影响(即药物组和对照组的平均血压相同)。
- :药物有效降低血压(即药物组的平均血压低于对照组)。
假设的构建
构建假设时,我们需要明确以下几个要素:
阅读《假设检验之假设的构建与检验》前,可以先用配图确认主线;读完后再检查哪些步骤能直接操作,哪些还需要补资料。
- 研究问题的定义:确定你要研究的主题,并思考如何用假设来表达这个主题。
- 变量的选择:明确要比较的变量(例如,药物的效果、不同人群的平均值等)。
- 统计模型的选择:根据研究问题选择合适的统计检验方法,例如 t 检验、卡方检验等。
案例分析:药物效果的假设检验
假设我们在一项临床试验中收集了两组患者的数据:一组使用新药,另一组使用安慰剂(对照组)。我们希望检验新药是否有效降低血压。假设我们有如下数据:
- 药物组:
- 对照组:
我们需要构建相应的假设。
import numpy as np
from scipy import stats
# 数据
drug_group = np.array([85, 88, 80, 92, 86])
control_group = np.array([90, 93, 95, 91, 94])
# 计算均值
mean_drug = np.mean(drug_group)
mean_control = np.mean(control_group)
print(f"药物组平均血压: {mean_drug}")
print(f"对照组平均血压: {mean_control}")
运行结果会给出两个组的均值,我们可以利用这些均值来分析是否存在显著差异。
假设的检验
完成假设的构建后,我们需要使用统计方法来检验假设。假设检验的过程通常包括以下几个步骤:
- 选择显著性水平():通常取值为0.05,表示有5%的概率拒绝正确的零假设。
- 选择检验方法:根据数据类型和分布选择合适的统计检验方法。
- 计算检验统计量:使用样本数据计算检验统计量,如t值、z值等。
- 作出决策:根据检验统计量和相应的临界值来拒绝或接受零假设。
示例
在我们关于药物效果的案例中,我们可以使用独立样本 t 检验来检验两个组的均值差异是否显著。
# 使用独立样本t检验
t_stat, p_value = stats.ttest_ind(drug_group, control_group)
print(f"t统计量: {t_stat}, p值: {p_value}")
在运行此代码后,我们将会获得t统计量和p值。如果p值小于0.05,我们将拒绝零假设,认为药物组和对照组之间的差异具有统计学显著性。
如果《假设检验之假设的构建与检验》还没完全消化,可以从这张卡片的四个动作重新走一遍。
回看《假设检验之假设的构建与检验》时,不必一次做大项目,先用一条简单样例确认主线是否清楚。
结论
在本篇中,我们学习了如何构建和检验假设。通过明确零假设和备择假设,我们可以使用适当的统计方法来检验假设的有效性。这样的过程对科学研究至关重要,能够帮助我们基于数据做出更有力的结论。
在接下来的篇章中,我们将深入探讨假设检验中的关键概念——P值与显著性。通过这些内容,我们将进一步理解如何合理解释检验结果,并有效地应用于研究中。
继续阅读
从这篇继续找到相关教程
常见问题
读前先确认这三点
假设检验之假设的构建与检验适合谁读?
这是 统计学入门 系列第 19 / 24 篇,适合正在学习统计学入门,并且需要把概念落到操作步骤或判断标准里的读者。
读这篇统计学入门教程要多久?
按中文技术文章阅读速度估算,通读大约 4 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。
这篇文章里的图文节点怎么用?
正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。
分享文章
转发到常用平台
微信/朋友圈可先复制链接
相关教程
从相近问题继续读
继续阅读