12 概率基础之随机变量
系列进度
统计学入门 · 第 12 / 24 篇
整理说明
这篇内容怎么整理
郭震 · 2026-06-04
阅读路线
先按这条路线读
先抓住主线,再回到代码、配置和图文细节,读起来会更稳。
统计学的价值在于用有限样本做有边界的判断,学习时要同时看数据、假设和结论。阅读时可以按「随机变量的定义 -> 例子: -> 随机变量的类型 -> 离散随机变量」建立结构,再回到正文里的代码、案例或指标做验证。
读完后,用一个真实小任务复查:输入是什么,处理环节在哪里,输出是否可验收;失败时先查「随机变量的定义」,再查「例子:」。
在我们了解了常见概率分布的基础上,接下来将深入探讨一个核心概念:随机变量。随机变量是统计学中用于描述不确定性的工具,它将随机实验的结果与数值对应起来。本文将详细介绍随机变量的定义、类型、性质、以及一些实际案例,以便读者能够更好地理解这一重要概念。
1. 随机变量的定义
随机变量是一个函数,它将每一个可能的实验结果映射为一个数值。可以理解为,随机变量通过特定的方式对不确定性进行量化。用数学语言来表达:
学习随机变量时,先看样本空间、取值范围、概率分布、期望和方差。
- 如果 是样本空间,则随机变量 是一个从 映射到实数集 的函数:
例子:
考虑一次掷骰子的实验。设 是掷出结果的随机变量。那么:
- 如果掷出的是 1,;
- 如果掷出的是 2,;
- ...
- 如果掷出的是 6,。
对此我们可以计算出 的概率分布,每个结果的概率都是 。
2. 随机变量的类型
随机变量主要分为两大类:离散随机变量和连续随机变量。
学《概率基础之随机变量》时,可以先找一个自己能复现的小场景,再看相关概念和练习步骤,读完后用自己的例子复述一遍。
2.1 离散随机变量
离散随机变量是指其取值为可数的,通常是整数。它可以取有限个或可数无限个值。例如:
- 投掷一枚硬币,记录正面朝上的次数。
- 参加考试的学生人数。
离散随机变量的概率分布可以用概率质量函数(PMF)来表示,记作 。
例子:
在掷骰子的例子中,(掷出的点数)是离散随机变量,其概率质量函数为:
2.2 连续随机变量
连续随机变量是指其取值为不可数的,通常是在某个区间内的实数。它的每个可能的取值对应的“概率”实际上是一个区间,因此使用概率密度函数(PDF)来描述,记作 。
例子:
假设我们测量一个人的身高, 是身高的随机变量。 可以在某个范围内(如 150 cm 到 200 cm)取任何值,其概率密度函数可能是:
其中 是一个常数,用于确保整体面积为 1。
3. 随机变量的性质
随机变量有几个重要的性质,包括期望值 (期望) 和方差 (方差)。
3.1 期望值
期望值是对随机变量取值的加权平均,反映了随机变量的中心位置。
- 离散随机变量的期望值定义为:
- 连续随机变量的期望值定义为:
Var(X) = E[(X - \mu)^2] = E(X^2) - [E(X)]^2
Var(X) = \int_{-\infty}^{\infty} (x - \mu)^2 f_X(x) , dx
其中 $\mu = E(X)$。 ### 例子: 对于掷骰子的随机变量 $X$,其期望值和方差可以计算如下: - 期望值:E(X) = \sum_{k=1}^{6} k \cdot P(X = k) = \sum_{k=1}^{6} k \cdot \frac{1}{6} = \frac{1 + 2 + 3 + 4 + 5 + 6}{6} = 3.5
Var(X) = E(X^2) - (E(X))^2 = \frac{1^2 + 2^2 + 3^2 + 4^2 + 5^2 + 6^2}{6} - (3.5)^2 = \frac{91}{6} - 12.25 \approx 2.9167
## 4. 代码示例 下面是一个使用 Python 计算离散随机变量期望值和方差的简单代码示例: ```python import numpy as np # 定义概率质量函数 values = np.array([1, 2, 3, 4, 5, 6]) probabilities = np.array([1/6] * 6) # 计算期望 expected_value = np.sum(values * probabilities) print("期望值 E(X):", expected_value) # 计算方差 expected_value_sq = np.sum(values**2 * probabilities) variance = expected_value_sq - expected_value**2 print("方差 Var(X):", variance) ``` 运行以上代码将输出掷骰子的期望值和方差。  读到这里,可以把《概率基础之随机变量》整理成一张复盘表:先说清主线,再拿一个小任务检查结果。  读完《概率基础之随机变量》后,可以先挑一个小样例走完整流程,再判断哪些步骤已经能独立完成。 ## 总结 在本文中,我们探讨了`随机变量`的定义、类型及其性质。理解随机变量的概念是理解更复杂的统计推断的基础。在下一篇中,我们将更深入地探讨`推断统计`中的点估计与区间估计,这将为分析随机数据提供更具体的方法和工具。希望您继续关注我们系列教程!继续阅读
从这篇继续找到相关教程
常见问题
读前先确认这三点
概率基础之随机变量适合谁读?
这是 统计学入门 系列第 12 / 24 篇,适合正在学习统计学入门,并且需要把概念落到操作步骤或判断标准里的读者。
读这篇统计学入门教程要多久?
按中文技术文章阅读速度估算,通读大约 5 分钟;如果要跟着复现,建议把命令、配置和结果检查分开做。
这篇文章里的图文节点怎么用?
正文里有 6 个图文节点,可以先用它们抓住流程、配置和判断点,再回到对应段落细读。
分享文章
转发到常用平台
微信/朋友圈可先复制链接
相关教程
从相近问题继续读
继续阅读