20 假设检验之P值与显著性
系列进度
统计学入门 · 第 20 / 24 篇
整理说明
这篇内容怎么整理
郭震 · 2026-06-04
阅读路线
先按这条路线读
先抓住主线,再回到代码、配置和图文细节,读起来会更稳。
统计学的价值在于用有限样本做有边界的判断,学习时要同时看数据、假设和结论。阅读时可以按「什么是P值? -> P值的计算 -> 如何解释P值 -> 实例」建立结构,再回到正文里的代码、案例或指标做验证。
读完后,用一个真实小任务复查:输入是什么,处理环节在哪里,输出是否可验收;失败时先查「什么是P值?」,再查「P值的计算」。
理解 P 值与显著性时,先看原假设、检验统计量、显著性水平、样本量、效应大小和结论边界。
在上一篇中,我们讨论了假设检验中如何构建和检验假设。在这一篇中,我们将深入探讨“P值”及其在判断结果显著性中的角色。此外,我们还会结合一些实例来讲解如何计算并解释P值。
什么是P值?
P值(概率值)是用于衡量观察到的结果在零假设为真的情况下,出现的概率。在进行假设检验时,我们通常有两个假设:
- 零假设():通常表示没有效应或没有差异。
- 备择假设():表示存在效应或差异。
读完《假设检验之P值与显著性》后,可以先挑一个小样例走完整流程,再判断哪些步骤已经能独立完成。
读到这里,可以把《假设检验之P值与显著性》整理成一张复盘表:先说清主线,再拿一个小任务检查结果。
学习《假设检验之P值与显著性》不必一口气吃完所有细节。先挑一个能动手验证的小问题,再顺着图和正文补齐概念。
P值越小,表示观察到的结果在零假设下发生的可能性越小,从而我们越倾向于拒绝零假设。
P值的计算
假设我们进行一项新的药物疗效的研究,希望验证新药对血压的影响。我们设置如下假设:
- : 新药对血压没有影响()
- : 新药对血压有影响()
我们收集了样本数据,并计算得到样本均值和标准误。假设我们计算得到的统计量为,根据的分布,我们可以计算相应的P值。一般情况下,我们使用以下公式:
其中,是对应的概率分布(如t分布)。
如何解释P值
在假设检验中,我们设定一个显著性水平(),通常为0.05。这意味着我们愿意接受5%的错误拒绝零假设的风险。
- 如果
$P \leq \alpha$,我们拒绝零假设,认为结果显著。 - 如果
$P > \alpha$,我们不能拒绝零假设,认为结果不显著。
实例
以Python为例,我们将演示如何通过scipy.stats库进行一次简单的假设检验,并计算P值。
import numpy as np
from scipy import stats
# 假设样本数据
data = np.random.normal(loc=5, scale=2, size=30) # 均值为5,标准差为2的正态分布
mu_h0 = 5 # 零假设的均值
# 进行单样本t检验
t_statistic, p_value = stats.ttest_1samp(data, mu_h0)
print(f"t统计量: {t_statistic:.4f}, P值: {p_value:.4f}")
在这个代码中,我们生成了一个样本数据,进行单样本t检验,并计算P值。结果中,如果P值低于0.05,我们可以认为新药的效果显著,反之则不显著。
不同显著性水平
值得注意的是,显著性水平的选择并非唯一。科研领域的不同,可以采用不同的显著性水平。例如在生命科学中,研究者可能会选择更为严格的0.01作为显著性水平。
综上所述,P值的计算和解释是在假设检验中至关重要的步骤。它不仅帮助我们判断数据结果的显著性,还能引导后续的研究和决策。
小结
本篇文章中,我们详细探讨了P值及其与显著性之间的关系。这为我们的下一篇内容——“假设检验之常见的假设检验方法”做好了铺垫。在进行各种假设检验时,了解和正确使用P值是至关重要的,这将帮助我们更好地理解数据背后的信息。
继续阅读
从这篇继续找到相关教程
常见问题
读前先确认这三点
假设检验之P值与显著性适合谁读?
这是 统计学入门 系列第 20 / 24 篇,适合正在学习统计学入门,并且需要把概念落到操作步骤或判断标准里的读者。
读这篇统计学入门教程要多久?
按中文技术文章阅读速度估算,通读大约 3 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。
这篇文章里的图文节点怎么用?
正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。
分享文章
转发到常用平台
微信/朋友圈可先复制链接
相关教程
从相近问题继续读
继续阅读