郭震 AI公众号:郭震AI

7 二项分布详解

发布日期:

最近更新:

分类: AI概率论小白

预计阅读: 3 分钟

阅读次数: 0

预计阅读3 分钟
结构重点7 个
图文要点6 张
正文规模1.5k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 7 个结构重点拆成环境、步骤、验证点和常见误区,尽量让读者能照着复现。
图文对照保留 6 张和配置、流程、判断结果有关的图片,方便快速定位正文重点。
持续校对工具、模型和命令变化较快,后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线,再回到代码、配置和图文细节,读起来会更稳。

图文要点

先看本文图文节点

按图先建立主线,再跳回正文核对步骤、配置和判断标准。

二项分布概念图查看大图
二项分布概念图

二项分布适合固定次数的重复试验,关心其中成功了多少次。关键条件是次数固定、试验独立、成功概率相同。

二项分布核对图查看大图
二项分布核对图

我会先检查是否满足固定 n 和相同 p。不满足时,不要硬套二项分布。

在上一篇的教程中,我们讨论了随机变量以及对应的累积分布函数与概率密度函数。本篇将深入到常见的概率分布之一——二项分布。理解二项分布不仅对基础统计学的重要性不言而喻,也对我们在数据科学与人工智能领域中的应用至关重要。

什么是二项分布?

二项分布是指在进行一系列独立的伯努利实验(即每次实验只有两个可能的结果,例如“成功”与“失败”)后,成功次数的分布。其核心思想是通过多个相同实验结果的重复,来分析成功事件的概率。

二项分布判断卡查看大图
二项分布判断卡

判断是否使用二项分布时,先看试验次数是否固定、每次是否只有两种结果、成功概率是否一致、各次是否独立。

二项分布的参数

二项分布由两个参数决定:

  • nn:实验的总次数。
  • pp:每次实验成功的概率。

我们用随机变量 XX 来表示在 nn 次实验中成功的次数。XX 服从参数为 nnpp 的二项分布,记作 XB(n,p)X \sim B(n, p)

二项分布的概率质量函数

二项分布的概率质量函数(PMF)定义为:

P(X=k)=(nk)pk(1p)nkP(X = k) = \binom{n}{k} p^k (1-p)^{n-k}

这里,(nk)\binom{n}{k} 是组合数,表示从 nn 次实验中选择 kk 次成功的方式。

期望和方差

对于二项分布,期望和方差的公式为:

  • 期望:E(X)=npE(X) = n \cdot p
  • 方差:Var(X)=np(1p)Var(X) = n \cdot p \cdot (1 - p)

实际案例

我们以一个简单的抛硬币为例来说明二项分布的应用。假设我们抛一枚均匀的硬币 10 次,每次出现正面的概率为 p=0.5p = 0.5

概率阅读地图卡查看大图
概率阅读地图卡

学《二项分布详解》时,可以先找一个自己能复现的小场景,再看相关概念和练习步骤,读完后用自己的例子复述一遍。

  • 实验设置n=10n = 10p=0.5p = 0.5
  • 我们想知道:在 10 次抛掷中,得到正面(成功)次数为 3 的概率。

根据二项分布的概率质量函数,我们可以计算:

P(X=3)=(103)(0.5)3(0.5)103=(103)(0.5)10P(X = 3) = \binom{10}{3} (0.5)^3 (0.5)^{10-3} = \binom{10}{3} (0.5)^{10}

计算组合数:

(103)=10!3!7!=1098321=120\binom{10}{3} = \frac{10!}{3! \cdot 7!} = \frac{10 \cdot 9 \cdot 8}{3 \cdot 2 \cdot 1} = 120

所以,

P(X=3)=120(0.5)10=120110240.1172P(X = 3) = 120 \cdot (0.5)^{10} = 120 \cdot \frac{1}{1024} \approx 0.1172

这个结果表明,在 10 次抛掷中得到 3 次正面的概率为约 11.72%。

代码示例

我们可以用 Python 来计算不同成功次数的概率:

import scipy.stats as stats
import matplotlib.pyplot as plt
import numpy as np

n = 10  # 实验次数
p = 0.5  # 成功概率

# 可视化二项分布的概率质量函数
x = np.arange(0, n+1)
pmf = stats.binom.pmf(x, n, p)

plt.bar(x, pmf, color='blue', alpha=0.7)
plt.title(f'Binomial Distribution PMF (n={n}, p={p})')
plt.xlabel('Number of Successes')
plt.ylabel('Probability')
plt.xticks(x)
plt.show()

运行上面的代码可以生成一个条形图,展示在 n=10n=10 次实验中获得不同成功次数的概率分布情况。

二项分布详解应用复盘卡查看大图
二项分布详解应用复盘卡

如果《二项分布详解》还没完全消化,可以从这张卡片的四个动作重新走一遍。

二项分布详解应用检查卡查看大图
二项分布详解应用检查卡

回看《二项分布详解》时,不必一次做大项目,先用一条简单样例确认主线是否清楚。

小结

在本篇中,我们详细探讨了二项分布的定义、公式以及如何通过实际案例来计算概率。下一篇教程我们将讨论正态分布,这是概率与统计中一个更为复杂且重要的概念。在深入了解正态分布之前,确保对本篇的内容理解透彻,这是非常关键的基础知识。

继续阅读

从这篇继续找到相关教程

AI 教程总索引

常见问题

读前先确认这三点

二项分布详解适合谁读?

这是 AI 概率必备 系列第 7 / 21 篇,适合正在学习AI 概率必备,并且需要把概念落到操作步骤或判断标准里的读者。

读这篇AI 概率必备教程要多久?

按中文技术文章阅读速度估算,通读大约 3 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。

这篇文章里的图文节点怎么用?

正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。

分享文章

转发到常用平台

微信/朋友圈可先复制链接

相关教程

AI 教程总索引

继续阅读

继续找到相关 AI 教程

返回栏目

Reader Messages

读者留言

有问题、补充资料或实测结果,可以直接留下。这里不需要登录。

最多 800 字

为了防刷,每条留言会做长度、链接数量和提交频率限制。

0/800

留言列表

0
正在加载留言...