郭震 AI公众号:郭震AI

11 概率基础之常见概率分布

发布日期:

最近更新:

分类: 统计学小白

预计阅读: 6 分钟

阅读次数: 0

系列进度

统计学入门 · 第 11 / 24

预计阅读6 分钟
结构重点10 个
图文要点6 张
正文规模2.8k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 10 个结构重点拆成环境、步骤、验证点和常见误区,尽量让读者能照着复现。
图文对照保留 6 张和配置、流程、判断结果有关的图片,方便快速定位正文重点。
持续校对工具、模型和命令变化较快,后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线,再回到代码、配置和图文细节,读起来会更稳。

图文要点

先看本文图文节点

按图先建立主线,再跳回正文核对步骤、配置和判断标准。

概率基础之常见概率分布结构图查看大图
概率基础之常见概率分布结构图

统计学的价值在于用有限样本做有边界的判断,学习时要同时看数据、假设和结论。阅读时可以按「概率分布的基本概念 -> 离散概率分布 -> 伯努利分布 -> 二项分布」建立结构,再回到正文里的代码、案例或指标做验证。

概率基础之常见概率分布核对图查看大图
概率基础之常见概率分布核对图

读完后,用一个真实小任务复查:输入是什么,处理环节在哪里,输出是否可验收;失败时先查「概率分布的基本概念」,再查「离散概率分布」。

在上一篇教程中,我们讨论了概率的基本概念,包括事件、样本空间、概率的定义等。这一篇,我们将进一步探讨常见的概率分布,这些分布是理解统计学中概率模型的基础。概率分布为我们提供了随机变量的可能值及其对应的概率。

概率分布的基本概念

首先,让我们理解一下概率分布。概率分布是一种描述随机变量的可能取值及其对应概率的函数。随机变量可以是离散的也可以是连续的,因此我们有两种主要的概率分布类型:

常见概率分布判断卡查看大图
常见概率分布判断卡

学习常见概率分布时,先判断问题是计数、连续误差、等待次数还是区间内事件数量。

  1. 离散概率分布:描述离散随机变量的分布。常见的离散分布有:

    • 伯努利分布
    • 二项分布
    • 泊松分布
  2. 连续概率分布:描述连续随机变量的分布。常见的连续分布有:

    • 正态分布
    • 指数分布
    • 均匀分布

接下来,我们将详细讨论每一种分布。

离散概率分布

伯努利分布

统计学阅读地图卡查看大图
统计学阅读地图卡

阅读《概率基础之常见概率分布》前,可以先用配图确认主线;读完后再检查哪些步骤能直接操作,哪些还需要补资料。

伯努利分布是最简单的离散分布,它描述两种结果(如成功与失败)的随机试验。一个随机变量 XX 服从伯努利分布表示为 XBernoulli(p)X \sim \text{Bernoulli}(p),其中 pp 是成功的概率。

  • 概率质量函数(PMF)为:

    P(X=1)=p,P(X=0)=1pP(X = 1) = p, \quad P(X = 0) = 1 - p

示例:抛一次硬币,正面朝上的概率(成功)为 p=0.5p = 0.5

二项分布

二项分布是多个独立伯努利实验结果的总和。如果一个随机变量 XX 服从二项分布,表示为 XBinomial(n,p)X \sim \text{Binomial}(n, p),其中 nn 是实验次数,pp 是每次实验成功的概率。

  • 概率质量函数(PMF)为:

    P(X=k)=(nk)pk(1p)nk,k=0,1,,nP(X = k) = \binom{n}{k} p^k (1-p)^{n-k}, \quad k = 0, 1, \ldots, n

示例:掷 n=10n = 10 次硬币,正面朝上的次数 XX 服从 Binomial(10,0.5)\text{Binomial}(10, 0.5)

泊松分布

泊松分布用于描述单位时间或单位面积内某事件发生次数的概率。一个随机变量 XX 服从泊松分布表示为 XPoisson(λ)X \sim \text{Poisson}(\lambda),其中 λ\lambda 是在给定区间内的事件平均发生次数。

  • 概率质量函数(PMF)为:

    P(X=k)=λkeλk!,k=0,1,2,P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \ldots

示例:假设一个电话接线员平均每小时接到 5 个电话,则接到 kk 个电话的概率为 XPoisson(5)X \sim \text{Poisson}(5)

连续概率分布

正态分布

正态分布是最常见的连续分布之一,许多自然现象结合中央极限定理,趋于正态分布。一个随机变量 XX 服从正态分布表示为 XN(μ,σ2)X \sim \mathcal{N}(\mu, \sigma^2),其中 μ\mu 是均值,σ2\sigma^2 是方差。

  • 概率密度函数(PDF)为:

    f(x)=12πσ2e(xμ)22σ2f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}}

示例:人的身高一般可以用正态分布建模,假设均值为 170 cm,标准差为 10 cm。则身高 XN(170,102)X \sim \mathcal{N}(170, 10^2)

指数分布

指数分布通常用于描述某事件发生的时间间隔,特别是在泊松过程中。如果一个随机变量 XX 服从指数分布,表示为 XExponential(λ)X \sim \text{Exponential}(\lambda),其中 λ\lambda 是事件的发生率。

  • 概率密度函数(PDF)为:

    f(x)=λeλx,x0f(x) = \lambda e^{-\lambda x}, \quad x \geq 0

示例:假设某个机器的故障时间服从指数分布,发生率为 0.1 次/小时,则 XExponential(0.1)X \sim \text{Exponential}(0.1)

均匀分布

均匀分布表示在某个区间内所有结果的可能性相等。如果一个随机变量 XX 在区间 [a,b][a, b] 上均匀分布,表示为 XUniform(a,b)X \sim \text{Uniform}(a, b)

  • 概率密度函数(PDF)为:

    f(x)=1ba,axbf(x) = \frac{1}{b - a}, \quad a \leq x \leq b

示例:从 0 到 1 的均匀分布 XUniform(0,1)X \sim \text{Uniform}(0, 1) 表示所有值在这个区间内都是等可能的。

代码示例

以下是使用 Python 的 numpymatplotlib 库生成不同概率分布的示例代码。

概率基础之常见概率分布应用检查卡查看大图
概率基础之常见概率分布应用检查卡

回看《概率基础之常见概率分布》时,不必一次做大项目,先用一条简单样例确认主线是否清楚。

概率基础之常见概率分布应用复盘卡查看大图
概率基础之常见概率分布应用复盘卡

如果《概率基础之常见概率分布》还没完全消化,可以从这张卡片的四个动作重新走一遍。

import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# 伯努利分布
p = 0.5
bern = np.random.binomial(1, p, 1000)
sns.histplot(bern, bins=2, kde=False, color='blue')
plt.title('Bernoulli Distribution (p=0.5)')
plt.show()

# 二项分布
n = 10
binom = np.random.binomial(n, p, 1000)
sns.histplot(binom, bins=11, kde=False, color='green')
plt.title('Binomial Distribution (n=10, p=0.5)')
plt.show()

# 正态分布
mu, sigma = 170, 10
normal = np.random.normal(mu, sigma, 1000)
sns.histplot(normal, bins=30,

继续阅读

从这篇继续找到相关教程

AI 教程总索引

常见问题

读前先确认这三点

概率基础之常见概率分布适合谁读?

这是 统计学入门 系列第 11 / 24 篇,适合正在学习统计学入门,并且需要把概念落到操作步骤或判断标准里的读者。

读这篇统计学入门教程要多久?

按中文技术文章阅读速度估算,通读大约 6 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。

这篇文章里的图文节点怎么用?

正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。

分享文章

转发到常用平台

微信/朋友圈可先复制链接

相关教程

AI 教程总索引

继续阅读

继续找到相关 AI 教程

返回栏目

Reader Messages

读者留言

有问题、补充资料或实测结果,可以直接留下。这里不需要登录。

最多 800 字

为了防刷,每条留言会做长度、链接数量和提交频率限制。

0/800

留言列表

0
正在加载留言...