3 统计推断的基本概念

Q: 统计推断的基本概念适合谁读？

这是 贝叶斯学习入门 系列第 3 / 24 篇，适合正在学习贝叶斯学习入门，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-15

最近更新: 2026-06-04

分类: 贝叶斯学习

预计阅读: 4 分钟

阅读次数: 0

系列进度

贝叶斯学习入门 · 第 3 / 24 篇

上一篇引言：贝叶斯学习的背景下一篇贝叶斯定理基础之贝叶斯定理的推导

预计阅读4 分钟

结构重点5 个

图文要点6 张

正文规模1.8k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 5 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步统计推断的核心目标 02第 2 步贝叶斯统计与经典统计的对比 03第 3 步小结

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线统计推断的基本概念结构图跳到对应正文位置

图 02 · 步骤统计推断的基本概念核对图跳到对应正文位置

图 03 · 配置统计推断基本概念判断卡跳到对应正文位置

图 04 · 判断贝叶斯学习应用拆解卡跳到对应正文位置

图 05 · 复盘统计推断的基本概念应用复盘卡跳到对应正文位置

图 06 · 细节统计推断的基本概念应用检查卡跳到对应正文位置

贝叶斯学习的重点是把已有判断和新证据合在一起，并明确表达不确定性。阅读时可以按「统计推断的核心目标 -> 例子：均值的点估计与区间估计 -> 贝叶斯统计与经典统计的对比 -> 案例代码：贝叶斯更新」建立结构，再回到正文里的代码、案例或指标做验证。

读完后，用一个真实小任务复查：输入是什么，处理环节在哪里，输出是否可验收；失败时先查「统计推断的核心目标」，再查「例子：均值的点估计与区间估计」。

在上一篇中，我们探讨了贝叶斯学习的背景，强调了在实际应用中，如何将不确定性纳入我们的决策过程。接下来，我们将进入统计推断的基本概念，这是贝叶斯学习的重要组成部分，尤其在我们应用贝叶斯定理时需要深入理解的部分。

统计推断的核心目标

统计推断的核心目标是基于样本数据来推断关于总体（母体）的一些特征或参数。我们通常希望从有限的观测数据中推断出更为普遍的规律。因此，统计推断可以分为两类：点估计和区间估计。

学习统计推断时，重点看样本、总体、估计和置信程度之间的关系。只给一个数字不够，还要说明这个判断有多稳。

点估计：使用样本数据计算出总体参数的单一值来作为估计。例如，我们可以使用样本均值来估计总体均值。设样本为 $x_1, x_2, \ldots, x_n$ ，则样本均值 $\bar{x}$ 为：
$\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i$
区间估计：给出一个区间范围，该范围内可能包含总体参数的值。例如，我们使用信赖区间来提供总体均值的可能范围，通常以样本均值和标准误差构造。对于95%的置信区间，我们可以表示为：
$\bar{x} \pm z_{\alpha/2} \cdot \frac{s}{\sqrt{n}}$
其中， $z_{\alpha/2}$ 是标准正态分布的临界值， $s$ 是样本标准差， $n$ 是样本大小。

例子：均值的点估计与区间估计

假设我们对一所大学的学生的考试成绩感兴趣，我们随机抽取了10名学生的成绩如下：

68, 72, 75, 70, 64, 80, 82, 77, 60, 74

首先，计算样本均值：
$\bar{x} = \frac{68 + 72 + 75 + 70 + 64 + 80 + 82 + 77 + 60 + 74}{10} = 72$
然后，计算样本标准差 $s$ ，如下：

s = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1}}

若计算得到 $s \approx 6.53$ ，则95%的置信区间为：

72 \pm 1.96 \cdot \frac{6.53}{\sqrt{10}} \approx [68.30, 75.70]

这表明我们有95%的信心认为总体均值会落在68.30到75.70之间。

贝叶斯统计与经典统计的对比

传统的统计推断方法通常采用频率派（frequentist）观点，而贝叶斯统计则采用主观概率的观点。经典统计推断关注的是通过重复取样来获得参数的分布，而贝叶斯统计则关注于更新先验知识与观察数据整合后的后验分布。

《统计推断的基本概念》可以按“场景、概念、动作、结果”来读。先把这四件事对齐，再回到正文里的参数、代码或流程。

在经典统计中，对于总体均值的点估计，我们仅仅得到一个值，而忽略了我们的不确定性。
但在贝叶斯框架下，我们会结合先验分布来推断，使得每一个估计值都有相应的后验分布。这种方式让我们能够更好地刻画不确定性。

案例代码：贝叶斯更新

以下是一个简单的Python代码示例，展示了如何使用贝叶斯方法进行均值的推断：

import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats

# 先验分布参数
mu_prior = 70
sigma_prior = 10

# 观察数据
data = [68, 72, 75, 70, 64, 80, 82, 77, 60, 74]
n = len(data)
mu_sample = np.mean(data)
sigma_sample = np.std(data, ddof=1)

# 后验分布的均值与方差
mu_posterior = (sigma_prior**2 * mu_sample + sigma_sample**2 * mu_prior) / (sigma_prior**2 + sigma_sample**2)
sigma_posterior = np.sqrt(1 / (1/sigma_prior**2 + 1/sigma_sample**2))

# 绘制先验和后验分布
x = np.linspace(50, 90, 100)
prior = stats.norm(mu_prior, sigma_prior).pdf(x)
posterior = stats.norm(mu_posterior, sigma_posterior).pdf(x)

plt.plot(x, prior, label='Prior Distribution', color='blue')
plt.plot(x, posterior, label='Posterior Distribution', color='red')
plt.legend()
plt.title('Prior vs Posterior Distribution')
plt.xlabel('Test Scores')
plt.ylabel('Density')
plt.show()