郭震 AI公众号:郭震AI

5 AI必备概率论小白教程:生成随机变量与分布之离散随机变量与连续随机变量

发布日期:

最近更新:

分类: AI概率论小白

预计阅读: 4 分钟

阅读次数: 0

预计阅读4 分钟
结构重点11 个
图文要点6 张
正文规模1.6k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 11 个结构重点拆成环境、步骤、验证点和常见误区,尽量让读者能照着复现。
图文对照保留 6 张和配置、流程、判断结果有关的图片,方便快速定位正文重点。
持续校对工具、模型和命令变化较快,后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线,再回到代码、配置和图文细节,读起来会更稳。

图文要点

先看本文图文节点

按图先建立主线,再跳回正文核对步骤、配置和判断标准。

离散与连续随机变量概念图查看大图
离散与连续随机变量概念图

离散变量看每个点的概率,连续变量看区间面积。两类变量的计算方式不同,不能混用。

离散与连续随机变量核对图查看大图
离散与连续随机变量核对图

我会先判断变量是否可数。可数用求和,连续用密度和面积。

在上一讲中,我们探讨了随机变量的定义。随机变量是从某个随机试验中获取的一种量化结果。现在,我们将讨论的主题是离散随机变量连续随机变量,这两者是理解概率分布和随机过程的重要基础。

离散随机变量

定义

离散连续随机变量判断卡查看大图
离散连续随机变量判断卡

学习离散和连续随机变量时,先看取值是可数集合还是连续区间。取值方式不同,概率表示和期望计算都会变化。

离散随机变量是指其取值为可数(有限或无限可数)的随机变量。也就是说,离散随机变量的可能取值可以列表列出。例如,掷一枚公平的六面骰子时,随机变量 XX 表示骰子上显示的点数,XX 的可能取值为 {1, 2, 3, 4, 5, 6}。

概率分布

离散随机变量的概率分布常用概率质量函数(PMF)来描述。对于离散随机变量 XX,其概率质量函数定义为:

P(X=x)=p(x)P(X = x) = p(x)

其中,p(x)p(x) 表示 XX 取值为 xx 的概率。

案例:掷骰子

假设我们进行一次掷骰子实验,定义随机变量 XX 为掷出的点数。我们有:

  • P(X=1)=16P(X = 1) = \frac{1}{6}
  • P(X=2)=16P(X = 2) = \frac{1}{6}
  • P(X=3)=16P(X = 3) = \frac{1}{6}
  • P(X=4)=16P(X = 4) = \frac{1}{6}
  • P(X=5)=16P(X = 5) = \frac{1}{6}
  • P(X=6)=16P(X = 6) = \frac{1}{6}

这些概率满足 0p(x)10 \leq p(x) \leq 1,并且所有可能的概率之和等于1,即:

x=16p(x)=1\sum_{x=1}^{6} p(x) = 1

代码示例

下面的代码使用Python中的numpy库模拟掷骰子的过程,并生成对应的概率分布。

import numpy as np
import matplotlib.pyplot as plt

# 模拟掷骰子1000次
np.random.seed(0)
dice_rolls = np.random.randint(1, 7, size=1000)

# 计算概率分布
values, counts = np.unique(dice_rolls, return_counts=True)
probabilities = counts / len(dice_rolls)

# 绘图
plt.bar(values, probabilities)
plt.xticks(values)
plt.xlabel('点数')
plt.ylabel('概率')
plt.title('掷骰子的概率分布')
plt.show()

连续随机变量

定义

概率实践复盘卡查看大图
概率实践复盘卡

读完《AI必备概率论小白教程:生成随机变量与分布之离散随机变量与连续随机变...》后,可以回头问三件事:它解决什么问题,哪一步最容易出错,自己能否拿一个小例子跑通。

连续随机变量是指其取值为所有实数的随机变量。由于连续随机变量可以取无限多个值,因此其概率用概率密度函数(PDF)来描述,而不是简单的概率值。

概率密度函数

对于连续随机变量 YY,其概率密度函数 f(y)f(y) 定义为:

P(a<Y<b)=abf(y)dyP(a < Y < b) = \int_a^b f(y) \, dy

这里,P(a<Y<b)P(a < Y < b) 表示随机变量 YY 取值在区间 (a,b)(a, b) 内的概率。

案例:正态分布

考虑一个典型的连续随机变量——正态分布(也称为高斯分布)。它的概率密度函数形式为:

f(y)=1σ2πe(yμ)22σ2f(y) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(y - \mu)^2}{2\sigma^2}}

其中,μ\mu 是均值,σ\sigma 是标准差。

代码示例

下面的代码展示了如何绘制正态分布的概率密度函数。

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# 均值和标准差
mu, sigma = 0, 1

# x值范围
x = np.linspace(-5, 5, 1000)

# 计算概率密度
y = norm.pdf(x, mu, sigma)

# 绘图
plt.plot(x, y)
plt.title('标准正态分布的概率密度函数')
plt.xlabel('x')
plt.ylabel('f(x)')
plt.grid()
plt.show()
AI必备概率论小白教程:生成随机变量与分布之离散随机变量与连续随机变量应用复盘卡查看大图
AI必备概率论小白教程:生成随机变量与分布之离散随机变量与连续随机变量应用复盘卡

复习《AI必备概率论小白教程:生成随机变量与分布之离散随机变量与连续随机变量》时,建议把关键概念、操作步骤和可见结果放在同一页里回看。

AI必备概率论小白教程:生成随机变量与分布之离散随机变量与连续随机变量应用检查卡查看大图
AI必备概率论小白教程:生成随机变量与分布之离散随机变量与连续随机变量应用检查卡

练习《AI必备概率论小白教程:生成随机变量与分布之离散随机变量与连续随机变量》时,建议把输入条件、处理动作和可见结果写在一起,方便下次复查。

总结

在今天的教程中,我们了解了离散随机变量连续随机变量的定义、特点及它们各自的概率分布形式。在下一篇中,我们将进一步讨论累积分布函数(CDF)与概率密度函数(PDF)之间的联系与区别。这将帮助我们更好地理解随机变量的性质及其在实际问题中的应用。

希望这一讲能帮助你在概率论的学习中更进一步!

继续阅读

从这篇继续找到相关教程

AI 教程总索引

常见问题

读前先确认这三点

AI必备概率论小白教程:生成随机变量与分布之离散随机变量与连续随机变量适合谁读?

这是 AI 概率必备 系列第 5 / 21 篇,适合正在学习AI 概率必备,并且需要把概念落到操作步骤或判断标准里的读者。

读这篇AI 概率必备教程要多久?

按中文技术文章阅读速度估算,通读大约 4 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。

这篇文章里的图文节点怎么用?

正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。

分享文章

转发到常用平台

微信/朋友圈可先复制链接

相关教程

AI 教程总索引

继续阅读

继续找到相关 AI 教程

返回栏目

Reader Messages

读者留言

有问题、补充资料或实测结果,可以直接留下。这里不需要登录。

最多 800 字

为了防刷,每条留言会做长度、链接数量和提交频率限制。

0/800

留言列表

0
正在加载留言...