20 假设检验之P值与显著性

Q: 假设检验之P值与显著性适合谁读？

这是 统计学入门 系列第 20 / 24 篇，适合正在学习统计学入门，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-10

最近更新: 2026-06-04

分类: 统计学小白

预计阅读: 3 分钟

阅读次数: 0

系列进度

统计学入门 · 第 20 / 24 篇

上一篇假设检验之假设的构建与检验下一篇假设检验中的常见假设检验方法

预计阅读3 分钟

结构重点6 个

图文要点6 张

正文规模1.4k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 6 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步什么是P值？02第 2 步P值的计算 03第 3 步如何解释P值 04第 4 步实例 05第 5 步不同显著性水平

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线假设检验之P值与显著性结构图跳到对应正文位置

图 02 · 步骤假设检验之P值与显著性核对图跳到对应正文位置

图 03 · 配置P值显著性判断卡跳到对应正文位置

图 04 · 判断假设检验之P值与显著性应用检查卡跳到对应正文位置

图 05 · 复盘假设检验之P值与显著性应用复盘卡跳到对应正文位置

图 06 · 细节统计学阅读地图卡跳到对应正文位置

统计学的价值在于用有限样本做有边界的判断，学习时要同时看数据、假设和结论。阅读时可以按「什么是P值？ -> P值的计算 -> 如何解释P值 -> 实例」建立结构，再回到正文里的代码、案例或指标做验证。

读完后，用一个真实小任务复查：输入是什么，处理环节在哪里，输出是否可验收；失败时先查「什么是P值？」，再查「P值的计算」。

理解 P 值与显著性时，先看原假设、检验统计量、显著性水平、样本量、效应大小和结论边界。

在上一篇中，我们讨论了假设检验中如何构建和检验假设。在这一篇中，我们将深入探讨“P值”及其在判断结果显著性中的角色。此外，我们还会结合一些实例来讲解如何计算并解释P值。

什么是P值？

P值（概率值）是用于衡量观察到的结果在零假设为真的情况下，出现的概率。在进行假设检验时，我们通常有两个假设：

零假设（ $H_0$ ）：通常表示没有效应或没有差异。
备择假设（ $H_1$ ）：表示存在效应或差异。

读完《假设检验之P值与显著性》后，可以先挑一个小样例走完整流程，再判断哪些步骤已经能独立完成。

读到这里，可以把《假设检验之P值与显著性》整理成一张复盘表：先说清主线，再拿一个小任务检查结果。

学习《假设检验之P值与显著性》不必一口气吃完所有细节。先挑一个能动手验证的小问题，再顺着图和正文补齐概念。

P值越小，表示观察到的结果在零假设下发生的可能性越小，从而我们越倾向于拒绝零假设。

P值的计算

假设我们进行一项新的药物疗效的研究，希望验证新药对血压的影响。我们设置如下假设：

$H_0$ : 新药对血压没有影响（ $\mu = \mu_0$ ）
$H_1$ : 新药对血压有影响（ $\mu \neq \mu_0$ ）

我们收集了样本数据，并计算得到样本均值和标准误。假设我们计算得到的统计量为 $t$ ，根据 $t$ 的分布，我们可以计算相应的P值。一般情况下，我们使用以下公式：

P\text{-value} = P(T \geq |t_{observation}|)

其中， $T$ 是对应的概率分布（如t分布）。

如何解释P值

在假设检验中，我们设定一个显著性水平（ $\alpha$ ），通常为0.05。这意味着我们愿意接受5%的错误拒绝零假设的风险。

如果 $P \leq \alpha$ ，我们拒绝零假设，认为结果显著。
如果 $P > \alpha$ ，我们不能拒绝零假设，认为结果不显著。

实例

以Python为例，我们将演示如何通过scipy.stats库进行一次简单的假设检验，并计算P值。

import numpy as np
from scipy import stats

# 假设样本数据
data = np.random.normal(loc=5, scale=2, size=30)  # 均值为5，标准差为2的正态分布
mu_h0 = 5  # 零假设的均值

# 进行单样本t检验
t_statistic, p_value = stats.ttest_1samp(data, mu_h0)

print(f"t统计量: {t_statistic:.4f}, P值: {p_value:.4f}")