6 随机变量与分布之累积分布函数与概率密度函数
系列进度
AI 概率必备 · 第 6 / 21 篇
整理说明
这篇内容怎么整理
郭震 · 2026-06-04
阅读路线
先按这条路线读
先抓住主线,再回到代码、配置和图文细节,读起来会更稳。
PDF 描述密度,CDF 描述累计概率。连续分布中,一个点的密度值不等于这个点的概率。
我会用区间面积解释概率。看到 PDF 数值大于 1,不要立刻判断错误。
在上一篇文章中,我们讨论了随机变量的基本概念及其分类,即离散随机变量和连续随机变量。在本篇中,我们将深入了解与这些随机变量相关的重要工具:累积分布函数(CDF)和概率密度函数(PDF)。这些概念为我们进一步探讨概率分布打下了基础,这是我们下篇讨论常见概率分布(如二项分布)的前提。
1. 累积分布函数(Cumulative Distribution Function, CDF)
累积分布函数用于描述一个随机变量取值的概率,表示随机变量 小于或等于某个特定值 的概率。换句话说,CDF 是随机变量 的值不超过 的概率。
学习累积分布函数和概率密度函数时,先看一个回答区间内累计概率,一个描述连续取值附近的密度。
对于离散随机变量 ,其CDF定义为:
对于连续随机变量 ,CDF定义为:
其中, 为随机变量 的概率密度函数(PDF)。
1.1 示例:离散随机变量的CDF
考虑一个简单的例子,一个掷骰子的实验。我们定义随机变量 为掷出的点数。 的可能取值为 ,对应的概率为 。我们可以计算 :
1.2 示例:连续随机变量的CDF
设 是一个连续随机变量,具有均匀分布 。其概率密度函数 为:
则CDF为:
2. 概率密度函数(Probability Density Function, PDF)
概率密度函数是用于描述连续随机变量在各个取值处概率分布的函数。对于离散随机变量,我们使用概率质量函数(PMF),而对于连续随机变量,我们使用PDF。
开始读《随机变量与分布之累积分布函数与概率密度函数》前,可以先看图中从问题到结果的路径。读完后再对照正文,确认自己能不能照着复现。
2.1 PDF的定义
对于随机变量 ,如果 的概率密度函数为 ,则对于任意区间 , 落在该区间内的概率为:
PDF 具有以下性质:
- 对于所有 。
- 整个定义域上的积分为1:
2.2 示例:均匀分布的PDF
延续前面讨论的均匀分布 ,其 PDF 为:
这表示在区间 内每个值出现的概率是均等的。
3. CDF与PDF之间的关系
对于连续随机变量,CDF和PDF之间存在密切的关系。实际上,PDF是CDF的导数:
如果想把《随机变量与分布之累积分布函数与概率密度函数》用到自己的任务里,可以先缩小场景,只验证一个最关键的判断点。
学完《随机变量与分布之累积分布函数与概率密度函数》后,不妨换一个自己的场景试一次,重点观察输入、处理和输出是否能对应起来。
反之,如果已知PDF,可以通过积分求得CDF:
3.1 示例:从PDF到CDF
考虑上面的均匀分布,我们知道其 PDF 为 。那么,CDF为:
这种 分段函数 表达了均匀分布的特性。
3.2 Python 实例:计算CDF和PDF
下面是一个简单的Python示例,使用scipy库来计算均匀分布的CDF和PDF。
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import uniform
# 设置参数
a, b = 0, 1 # 均匀分布的区间
# 生成 x 值
x = np.linspace(-0.5, 1.5, 100)
# 计算 PDF 和 CDF
pdf = uniform.pdf(x, loc=a, scale=b)
cdf = uniform.cdf(x, loc=a, scale=b)
# 绘图
plt.figure(figsize=(10, 5))
# 绘制 PDF
plt.subplot(1, 2, 1)
plt.title('Probability Density Function (PDF)')
plt.plot(x, pdf, label='PDF', color='blue')
plt.fill_between(x, pdf, alpha=0.2)
plt.xlim(-0.5, 1.5)
plt.xlabel('x')
plt.ylabel('Density')
plt.axhline(0, color='black', lw=1)
plt.axvline(0, color='black', lw=1)
# 绘制 CDF
plt.subplot(1, 2, 2)
plt.title('Cumulative Distribution Function (CDF)')
plt.plot(x, cdf, label='CDF', color='orange')
plt.axhline(1, color='black', lw=1)
plt.axvline(1, color='black', lw=1)
plt.xlim(-0.5, 1.5)
plt.xlabel('x')
plt.ylabel('Probability')
plt.axhline(0, color='black
继续阅读
从这篇继续找到相关教程
常见问题
读前先确认这三点
随机变量与分布之累积分布函数与概率密度函数适合谁读?
这是 AI 概率必备 系列第 6 / 21 篇,适合正在学习AI 概率必备,并且需要把概念落到操作步骤或判断标准里的读者。
读这篇AI 概率必备教程要多久?
按中文技术文章阅读速度估算,通读大约 5 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。
这篇文章里的图文节点怎么用?
正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。
分享文章
转发到常用平台
微信/朋友圈可先复制链接
相关教程
从相近问题继续读
继续阅读