5 AI必备概率论小白教程:生成随机变量与分布之离散随机变量与连续随机变量
系列进度
AI 概率必备 · 第 5 / 21 篇
整理说明
这篇内容怎么整理
郭震 · 2026-06-04
阅读路线
先按这条路线读
先抓住主线,再回到代码、配置和图文细节,读起来会更稳。
离散变量看每个点的概率,连续变量看区间面积。两类变量的计算方式不同,不能混用。
我会先判断变量是否可数。可数用求和,连续用密度和面积。
在上一讲中,我们探讨了随机变量的定义。随机变量是从某个随机试验中获取的一种量化结果。现在,我们将讨论的主题是离散随机变量与连续随机变量,这两者是理解概率分布和随机过程的重要基础。
离散随机变量
定义
学习离散和连续随机变量时,先看取值是可数集合还是连续区间。取值方式不同,概率表示和期望计算都会变化。
离散随机变量是指其取值为可数(有限或无限可数)的随机变量。也就是说,离散随机变量的可能取值可以列表列出。例如,掷一枚公平的六面骰子时,随机变量 表示骰子上显示的点数, 的可能取值为 {1, 2, 3, 4, 5, 6}。
概率分布
离散随机变量的概率分布常用概率质量函数(PMF)来描述。对于离散随机变量 ,其概率质量函数定义为:
其中, 表示 取值为 的概率。
案例:掷骰子
假设我们进行一次掷骰子实验,定义随机变量 为掷出的点数。我们有:
这些概率满足 ,并且所有可能的概率之和等于1,即:
代码示例
下面的代码使用Python中的numpy库模拟掷骰子的过程,并生成对应的概率分布。
import numpy as np
import matplotlib.pyplot as plt
# 模拟掷骰子1000次
np.random.seed(0)
dice_rolls = np.random.randint(1, 7, size=1000)
# 计算概率分布
values, counts = np.unique(dice_rolls, return_counts=True)
probabilities = counts / len(dice_rolls)
# 绘图
plt.bar(values, probabilities)
plt.xticks(values)
plt.xlabel('点数')
plt.ylabel('概率')
plt.title('掷骰子的概率分布')
plt.show()
连续随机变量
定义
读完《AI必备概率论小白教程:生成随机变量与分布之离散随机变量与连续随机变...》后,可以回头问三件事:它解决什么问题,哪一步最容易出错,自己能否拿一个小例子跑通。
连续随机变量是指其取值为所有实数的随机变量。由于连续随机变量可以取无限多个值,因此其概率用概率密度函数(PDF)来描述,而不是简单的概率值。
概率密度函数
对于连续随机变量 ,其概率密度函数 定义为:
这里, 表示随机变量 取值在区间 内的概率。
案例:正态分布
考虑一个典型的连续随机变量——正态分布(也称为高斯分布)。它的概率密度函数形式为:
其中, 是均值, 是标准差。
代码示例
下面的代码展示了如何绘制正态分布的概率密度函数。
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
# 均值和标准差
mu, sigma = 0, 1
# x值范围
x = np.linspace(-5, 5, 1000)
# 计算概率密度
y = norm.pdf(x, mu, sigma)
# 绘图
plt.plot(x, y)
plt.title('标准正态分布的概率密度函数')
plt.xlabel('x')
plt.ylabel('f(x)')
plt.grid()
plt.show()
复习《AI必备概率论小白教程:生成随机变量与分布之离散随机变量与连续随机变量》时,建议把关键概念、操作步骤和可见结果放在同一页里回看。
练习《AI必备概率论小白教程:生成随机变量与分布之离散随机变量与连续随机变量》时,建议把输入条件、处理动作和可见结果写在一起,方便下次复查。
总结
在今天的教程中,我们了解了离散随机变量和连续随机变量的定义、特点及它们各自的概率分布形式。在下一篇中,我们将进一步讨论累积分布函数(CDF)与概率密度函数(PDF)之间的联系与区别。这将帮助我们更好地理解随机变量的性质及其在实际问题中的应用。
希望这一讲能帮助你在概率论的学习中更进一步!
继续阅读
从这篇继续找到相关教程
常见问题
读前先确认这三点
AI必备概率论小白教程:生成随机变量与分布之离散随机变量与连续随机变量适合谁读?
这是 AI 概率必备 系列第 5 / 21 篇,适合正在学习AI 概率必备,并且需要把概念落到操作步骤或判断标准里的读者。
读这篇AI 概率必备教程要多久?
按中文技术文章阅读速度估算,通读大约 4 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。
这篇文章里的图文节点怎么用?
正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。
分享文章
转发到常用平台
微信/朋友圈可先复制链接
相关教程
从相近问题继续读
继续阅读