4 AI必备概率论小白教程系列：随机变量与分布之随机变量的定义

Q: AI必备概率论小白教程系列：随机变量与分布之随机变量的定义适合谁读？

这是 AI 概率必备 系列第 4 / 21 篇，适合正在学习AI 概率必备，并且需要把概念落到操作步骤或判断标准里的读者。

发布日期: 2024-08-10

最近更新: 2026-06-04

分类: AI概率论小白

预计阅读: 4 分钟

阅读次数: 0

系列进度

AI 概率必备 · 第 4 / 21 篇

上一篇概率论基础概念之条件概率与独立性下一篇AI必备概率论小白教程：生成随机变量与分布之离散随机变量与连续随机变量

预计阅读4 分钟

结构重点8 个

图文要点6 张

正文规模1.9k 字

整理说明

这篇内容怎么整理

郭震 · 2026-06-04

独立整理围绕 8 个结构重点拆成环境、步骤、验证点和常见误区，尽量让读者能照着复现。

图文对照保留 6 张和配置、流程、判断结果有关的图片，方便快速定位正文重点。

持续校对工具、模型和命令变化较快，后续优先修正入口、参数和风险提醒。

阅读路线

先按这条路线读

先抓住主线，再回到代码、配置和图文细节，读起来会更稳。

01第 1 步随机变量的定义 02第 2 步随机变量的分类 03第 3 步随机变量与分布的关系 04第 4 步小结

图文要点

先看本文图文节点

按图先建立主线，再跳回正文核对步骤、配置和判断标准。

6 张图 · 可跳转本系列图文节点更多图解入口

图 01 · 主线随机变量的定义概念图跳到对应正文位置

图 02 · 步骤随机变量的定义核对图跳到对应正文位置

图 03 · 配置随机变量定义判断卡跳到对应正文位置

图 04 · 判断概率方法落地卡跳到对应正文位置

图 05 · 复盘AI必备概率论小白教程系列：随机变量与分布之随机变量的定义应用复盘卡跳到对应正文位置

图 06 · 细节AI必备概率论小白教程系列：随机变量与分布之随机变量的定义应用检查卡跳到对应正文位置

随机变量把随机结果转成可以计算的数字。它是从事件走向分布、期望和模型评估的桥梁。

我会先写清随机变量代表什么。变量含义不清，后面的分布和期望都没有解释力。

在上一篇文章中，我们讨论了概率论的基础概念，包括条件概率与独立性。这些概念是理解随机事件之间关系的基础。在本篇文章中，我们将深入探讨一个非常重要的主题——随机变量。

随机变量的定义

在概率论中，随机变量是一个从随机实验中获得结果的函数。更准确地说，给定一个样本空间 $\Omega$ （即所有可能的实验结果的集合），一个随机变量 $X$ 是一个到实数集 $\mathbb{R}$ 的可测函数，即

理解随机变量时，先看它如何把随机结果映射成数值，再判断取值是离散还是连续。分布、期望和方差都从这里开始。

X: \Omega \longrightarrow \mathbb{R}

例子

假设我们进行一个掷骰子的实验，样本空间可以表示为：

\Omega = \{1, 2, 3, 4, 5, 6\}

我们可以定义一个随机变量 $X$ ，表示掷得的点数。这时， $X$ 的定义如下：

如果结果是 1，则 $X = 1$
如果结果是 2，则 $X = 2$
如果结果是 3，则 $X = 3$
如果结果是 4，则 $X = 4$
如果结果是 5，则 $X = 5$
如果结果是 6，则 $X = 6$

在这个例子中，随机变量 $X$ 映射了所有可能的骰子结果到具体的点数，这使得我们能够对其进行更进一步的分析。

随机变量的分类

随机变量一般可以分为两类：离散随机变量和连续随机变量。在本篇文章中，我们主要集中在 随机变量的定义 上，因此我们将简单介绍这两种类型，并在下一篇文章中深入探讨。

看完《AI必备概率论小白教程系列：随机变量与分布之随机变量的定义》后，建议用一分钟复盘：关键概念是否分清、练习步骤是否可复现、结论能不能换成自己的话。

离散随机变量：其取值是有限或可数无限的。例如，掷骰子得出的点数 $X$ ，只可能是 1 到 6 中的某一个值。
连续随机变量：其取值是一个区间内的所有实数。例如，测量一个人的身高 $Y$ ，可以为任何在该区间内的实数值。

反思随机变量的实际应用

假设我们正在开发一个AI系统来预测用户的购买行为，我们可能会将用户过去的购买次数作为一个随机变量 $X$ 。在这里， $X$ 可以是一个离散随机变量，取值可能为 0、1、2、……，表示用户在过去一段时间内的购买次数。

我们还可以考虑另一个随机变量 $Y$ ，它表示用户在网上购物的总花费，这个变量可能是一个连续随机变量，因为用户的花费可以是任意的实数值。

随机变量与分布的关系

随机变量不仅仅是概率模型中的一个简单映射，它们与概率分布密切相关。每个随机变量都有其对应的概率分布，该分布描述了随机变量取值的可能性。

概率分布的定义

概率分布定义了随机变量在每一个可能取值上的概率。对于离散随机变量 $X$ ，其概率分布可以用概率质量函数（PMF）来表示，记为 $P(X=x)$ ，其值为：

P(X=x) = P(\{ \omega \in \Omega : X(\omega) = x \})

而对于连续随机变量 $Y$ ，我们使用概率密度函数（PDF）来描述，记为 $f_Y(y)$ ，满足：

P(Y \in [a, b]) = \int_a^b f_Y(y) \, dy

案例演示

让我们通过一个简单的 Python 代码示例来计算一个离散随机变量的概率分布。例如，我们再次考虑掷骰子的随机变量 $X$ ，其所有可能的值为 1 到 6。

import numpy as np
import matplotlib.pyplot as plt

# 定义随机变量 X 的值
values = np.array([1, 2, 3, 4, 5, 6])

# 计算每个值出现的概率
probabilities = np.array([1/6] * 6)  # 每个值的概率都是 1/6

# 可视化概率分布
plt.bar(values, probabilities)
plt.xlabel('点数')
plt.ylabel('概率')
plt.title('掷骰子的概率分布')
plt.xticks(values)
plt.ylim(0, 1)
plt.show()