14 贝叶斯回归之先验选择与后验分析

Q: 贝叶斯回归之先验选择与后验分析适合谁读？

这是 贝叶斯学习入门 系列第 14 / 24 篇，适合正在学习贝叶斯学习入门，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-15

最近更新: 2026-06-04

分类: 贝叶斯学习

预计阅读: 4 分钟

阅读次数: 0

系列进度

贝叶斯学习入门 · 第 14 / 24 篇

上一篇贝叶斯回归之线性回归模型下一篇贝叶斯回归之预测与不确定性量化

预计阅读4 分钟

结构重点8 个

图文要点6 张

正文规模1.7k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 8 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步先验选择 02第 2 步后验分析 03第 3 步总结

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线贝叶斯回归之先验选择与后验分析结构图跳到对应正文位置

图 02 · 步骤贝叶斯回归之先验选择与后验分析核对图跳到对应正文位置

图 03 · 配置先验后验分析判断卡跳到对应正文位置

图 04 · 判断贝叶斯学习阅读地图卡跳到对应正文位置

图 05 · 复盘贝叶斯回归之先验选择与后验分析应用复盘卡跳到对应正文位置

图 06 · 细节贝叶斯回归之先验选择与后验分析应用检查卡跳到对应正文位置

贝叶斯学习的重点是把已有判断和新证据合在一起，并明确表达不确定性。阅读时可以按「先验选择 -> 非信息性先验 -> 信息性先验 -> 后验分析」建立结构，再回到正文里的代码、案例或指标做验证。

读完后，用一个真实小任务复查：输入是什么，处理环节在哪里，输出是否可验收；失败时先查「先验选择」，再查「非信息性先验」。

在上一篇中，我们探讨了贝叶斯回归的线性回归模型，了解了线性回归在贝叶斯框架下的理论基础与应用。在本篇中，我们将聚焦于贝叶斯回归中的先验选择与后验分析，帮助您更好地理解模型在不同先验下的行为，以及如何进行后验推断。

先验选择

在贝叶斯统计中，选择合适的先验分布是至关重要的一步。先验反映了我们在观察数据之前对模型参数的不确定性或假设。我们将通过两个基本的先验进行比较：非信息性先验和信息性先验。

做贝叶斯回归先验与后验分析时，先看先验假设、似然、后验分布、可信区间和敏感性比较。

非信息性先验

非信息性先验，或称为“扩散先验”，用于表示对参数的最大无偏见态度。例如，对于线性回归模型的参数，我们可以选择以下形式的先验：

\beta \sim \mathcal{N}(0, \tau^2)

其中， $\tau$ 表示较大的方差，即使得先验对后续数据的影响较小，常见于理论上对参数的“无信息”假设。

信息性先验

信息性先验用于表示对某些参数的先验知识。比如，如果我们认为某个变量的回归系数可能在某个特定值附近，我们可以选择较小的方差，例如：

\beta \sim \mathcal{N}(\mu, \sigma^2)

在这里， $\mu$ 是我们的信念，而 $\sigma$ 是对此信念的确定性程度。

案例分析

假设我们有一组经济数据，试图通过线性回归来估计某个经济指标（如消费支出）与多个自变量（如收入、教育程度等）之间的关系。使用非信息性先验对参数进行贝叶斯回归，可能会产生宽广的后验分布，鼎盛的展示对数据的依赖性。

而采用信息性先验，假如我们对收入影响消费支出的系数形成了先前的看法（例如，相信这一系数应该超过0.5），后验将更具方向性，快速收敛至我们认为合适的范围。

下面是一个简单的Python示例，展示如何使用PyMC3进行贝叶斯回归并选择不同的先验：

import numpy as np
import pymc3 as pm
import matplotlib.pyplot as plt

# 生成示例数据
np.random.seed(42)
X = np.random.rand(100, 1) * 10
y = 2.5 * X.squeeze() + np.random.randn(100) * 2

# 使用非信息性先验进行贝叶斯回归
with pm.Model() as model_noninformative:
    # 先验设置
    alpha = pm.Normal('alpha', mu=0, sigma=10)
    beta = pm.Normal('beta', mu=0, sigma=10)
    sigma = pm.HalfNormal('sigma', sigma=1)

    # 线性模型
    y_obs = pm.Normal('y_obs', mu=alpha + beta * X.flatten(), sigma=sigma, observed=y)

    # 后验抽样
    trace_noninformative = pm.sample(2000, tune=1000)

# 使用信息性先验进行贝叶斯回归
with pm.Model() as model_informative:
    # 先验设置
    alpha = pm.Normal('alpha', mu=0, sigma=1)
    beta = pm.Normal('beta', mu=0.5, sigma=0.1) # 信息性先验
    sigma = pm.HalfNormal('sigma', sigma=1)

    # 线性模型
    y_obs = pm.Normal('y_obs', mu=alpha + beta * X.flatten(), sigma=sigma, observed=y)

    # 后验抽样
    trace_informative = pm.sample(2000, tune=1000)

# 绘制后验分布比较
pm.plot_posterior(trace_noninformative, fig=plt.figure(figsize=(12, 6)), color='blue')
pm.plot_posterior(trace_informative, fig=myfig, color='orange')
plt.title('Posterior Distributions Comparison')
plt.show()

在上面的代码中，我们分别使用非信息性和信息性先验对相同数据进行贝叶斯回归。通过结果的后验分布的可视化比较，我们可以观察到两种先验对参数估计的影响。

后验分析

在获取了先验和数据的结合后，我们通过贝叶斯定理得到后验分布：

读《贝叶斯回归之先验选择与后验分析》时，可以把配图当成路线卡：先看整体顺序，再看每一步为什么这样做，最后再检查边界条件。

p(\theta | D) = \frac{p(D | \theta) p(\theta)}{p(D)}

其中， $p(D | \theta)$ 是似然函数， $p(\theta)$ 是先验分布，而 $p(D)$ 是证据（常数）。

后验推断

一旦得到了后验分布，我们可以通过后验分析来进行推断。重要的推断包括：

点估计：常见的是后验均值、众数或中位数。
可信区间：例如计算95%可信区间以量化不确定性。
模型评估：通过计算后验预测分布与真实数据的拟合程度进行模型比较。

示例分析

假设我们想了解回归系数 $\beta$ 的可信区间。我们可以用以下代码计算并绘制95%可信区间：

import arviz as az

# 提取回归系数的后验样本
beta_samples = trace_noninformative['beta']
pm.plot_posterior(trace_noninformative, var_names=['beta'])

# 计算95%可信区间
ci = np.percentile(beta_samples, [2.5, 97.5])
print(f'95% 可信区间: {ci}')