第四章 - 随机变量的数字特征
约 1767 个字 预计阅读时间 6 分钟
数学期望
数学期望的定义
设离散型随机变量 \(X\) 的概率分布律为 \(P \{ X = x_{i} \} = p_{i}, i = 1, 2, \cdots\),若级数 \(\sum_{i = 1}^{+\infty} x_{i} p_{i}\) 绝对收敛,即 \(\sum_{i = 1}^{+\infty} |x_{i}| p_{i} < +\infty\),则称级数 \(\sum_{i = 1}^{+\infty} x_{i} p_{i}\) 为随机变量 \(X\) 的数学期望 (mathematical expectation) 或均值 (mean),简称期望,记作 \(E(X)\),即
若 \(\sum_{i = 1}^{+\infty} |x_{i}| p_{i} = +\infty\),则称随机变量 \(X\) 的数学期望不存在。
设连续型随机变量 \(X\) 的密度函数为 \(f(x)\)。若 \(\int_{-\infty}^{+\infty} |x| f_{x} \mathrm{d} x < +\infty\),则称积分 \(\int_{-\infty}^{+\infty} x f(x) \mathrm{d} x\) 为 \(X\) 的数学期望或均值,简称期望,记作 \(E(X)\),即
若 \(\int_{-\infty}^{+\infty} |x| f_{x} \mathrm{d} x = +\infty\),则称随机变量 \(X\) 的数学期望不存在。
泊松分布的数学期望
设随机变量 \(X\) 服从泊松分布 \(P(\lambda), \lambda > 0\),则
指数分布的数学期望
设随机变量 \(X\) 服从指数分布 \(E(\lambda), \lambda > 0\),则
标准正态分布的数学期望
设随机变量 \(X\) 服从标准正态分布 \(N(0, 1)\),则
随机变量函数的数学期望
当 \(X\) 为离散型随机变量时,若 \(\sum_{i = 1}^{+\infty} |g(x_{i})| p_{i} < +\infty\),则 \(g(X)\) 的数学期望 \(E(g(X))\) 存在,且
其中 \(P \{ X = x_{i} \} = p_{i}, i = 1, 2, \cdots\) 为 \(X\) 的概率分布律。
当 \(X\) 为连续型随机变量时,若 \(\int_{-\infty}^{+\infty} |g(x)| f(x) \mathrm{d} x < +\infty\),则 \(g(X)\) 的数学期望 \(E(g(X))\) 存在,且
其中 \(f(x)\) 为 \(X\) 的密度函数。
当 \((X, Y)\) 为二维离散型随机变量时,若实函数 \(h(x, y)\) 满足 \(\sum_{i = 1}^{+\infty} \sum_{j = 1}^{+\infty} |h(x_{i}, y_{j})| P \{ X = x_{i}, Y = y_{j} \} < +\infty\),则 \(h(X, Y)\) 的数学期望 \(E(h(X, Y))\) 存在,且
其中 \(P \{ X = x_{i}, Y = y_{j} \} = p_{ij}, i = 1, 2, \cdots, j = 1, 2, \cdots\) 为 \((X, Y)\) 的联合分布律。
当 \((X, Y)\) 为二维连续型随机变量时,若实函数 \(h(x, y)\) 满足 \(\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} |h(x, y)| f(x, y) \mathrm{d} x \mathrm{d} y < +\infty\),则 \(h(X, Y)\) 的数学期望 \(E(h(X, Y))\) 存在,且
其中 \(f(x, y)\) 为 \((X, Y)\) 的联合密度函数。
数学期望的性质
数学期望的线性性
若 \(n\) 个随机变量 \(X_{1}, X_{2}, \cdots, X_{n}, n \geq 1\) 的数学期望都存在,则对任意 \(n + 1\) 个实数 \(c_{0}, c_{1}, c_{2}, \cdots, c_{n}\),\(c_{0} + \sum_{i = 1}^{n} c_{i} X_{i}\) 的数学期望也存在,且
正态分布的数学期望
设随机变量 \(X\) 服从正态分布 \(N(\mu, \sinma^{2}), -\infty < \mu < +\infty, \sigma > 0\)。由于 \(Z = \frac{X - \mu}{\sigma} \sim N(0, 1)\),故 \(X = \sigma Z + \mu\),则
二项分布的数学期望
设随机变量 \(X\) 服从二项分布 \(B(n, p), 0 < p < 1\),则
独立随机变量的期望乘法性质
\(n\) 个相互独立的随机变量乘积的数学期望等于它们的数学期望的乘积。即若随机变量 \(X_{1}, X_{2}, \cdots, X_{n}, n \geq 1\) 相互独立,且它们的数学期望都存在,则 \(\prod_{i = 1}^{n} X_{i}\) 的数学期望也存在,且
条件数学期望
条件分布函数的数学期望称作条件数学期望 (conditional mathematical expectation),简称为条件期望。
若 \((X, Y)\) 为二维离散型随机变量,在给定 \(\{ X = x \}, f_{X} (x) > 0\) 的条件下,\(Y\) 的条件分布律为 \(P \{ Y = y_{j} | X = x \} = p_{j} (x), j = 1, 2, \cdots\),则在给定 \(\{ X = x \}\) 的条件下,\(Y\) 的条件期望为
若 \((X, Y)\) 为二维连续型随机变量,在给定 \(\{ X = x \}, f_{X} (x) > 0\) 的条件下,\(Y\) 的条件密度函数为 \(f_{Y | X} (y | x)\),则在给定 \(\{ X = x \}\) 的条件下,\(Y\) 的条件期望为
\(E(Y | X = x)\) 有时也简记为 \(E(Y | x)\)。
设 \((X, Y)\) 为二维随机变量,若 \(E(Y)\) 存在,则
这称作全期望公式 (total expectation formula)。
当 \((X, Y)\) 为二维离散型随机变量时,即有
当 \((X, Y)\) 为二维连续型随机变量时,即有
方差、变异系数
方差的定义
设随机变量 \(X\) 的数学期望 \(E(X)\) 存在,若 \(E[(X - E(X))^{2}]\) 存在,则称
为 \(X\) 的方差 (variance),记作 \(\text{Var}(X)\) 或 \(D(X)\)。
方差的平方根 \(\sqrt{\text{Var}(X)}\) 称作随机变量 \(X\) 的标准差 (standard deviation) 或均方差,记作 \(\sigma(X)\) 或 \(SD(X)\)。
若离散型随机变量 \(X\) 的概率分布律为 \(P \{ X = x_{i} \} = p_{i}, i = 1, 2, \cdots\),则 \(X\) 的方差为
若连续型随机变量 \(X\) 的密度函数为 \(f(x)\),则 \(X\) 的方差为
若随机变量 \(X\) 的方差存在,则
泊松分布的方差
设随机变量 \(X\) 服从泊松分布 \(P(\lambda), \lambda > 0\),则
指数分布的方差
设随机变量 \(X\) 服从指数分布 \(E(\lambda), \lambda > 0\),则
标准正态分布的方差
设随机变量 \(X\) 服从标准正态分布 \(N(0, 1)\),则
方差的性质
设随机变量 \(X\) 的方差存在,\(c\) 为某一常数,则
- \(\text{Var}(c X) = c^{2} \text{Var}(X)\)
- \(\text{Var}(X + c) = \text{Var}(X)\)
- \(\text{Var} \leq E[(X - c)^{2}]\),当且仅当 \(E(X) = c\) 时取等
- \(\text{Var}(X) = 0\) 当且仅当 \(P \{ X = c \} = 1\),其中 \(c = E(X)\)
设 \(X_{1}, X_{2}, \cdots, X_{n}, n \geq 2\) 为两两不相关的随机变量,方差都存在,则 \(X_{1} + X_{2} + \cdots + X_{n}\) 的方差也存在,且
进一步地,对任意的有限实数 \(c_{0}, c_{1}, \cdots, c_{n}\),\(c_{0} + \sum_{i = 1}^{n} c_{i} X_{i}\) 的方差也存在,且
二项分布的方差
设随机变量 \(X\) 服从二项分布 \(B(n, p), 0 < p < 1\),则
正态分布的方差
设随机变量 \(X\) 服从正态分布 \(N(\mu, \sigma^{2}), -\infty < \mu < +\infty, \sigma > 0\)。由于 \(Z = \frac{X - \mu}{\sigma} \sim N(0, 1)\),故 \(X = \sigma Z + \mu\),则
标准化随机变量与变异系数
若随机变量 \(X\) 的方差存在,则称
为 \(X\) 的标准化随机变量,简称标准化变量。
显然,\(E(X^{*}) = 0, \text{Var}(X^{*}) = 1\),而且此类变量是无量纲的。
进一步地,我们称
为变异系数 (coefficient of variation)。其反应了随机变量 \(X\) 在以它的中心位置为标准时,其值的离散程度。
协方差与相关系数
协方差
对于数学期望都存在的随机变量 \(X\) 和 \(Y\),当 \((X - E(X))(Y - E(Y))\) 的数学期望存在时,称
为 \(X\) 与 \(Y\) 的协方差 (covariance)。
在实际应用中,我们常将其变形为
以方便计算。
设 \(X_{1}, X_{2}, \cdots, X_{n}, n \geq 2\) 为方差存在的随机变量,则 \(X_{1} + X_{2} + \cdots + X_{n}\) 的方差也存在,且
若随机变量 \(X\) 和 \(Y\) 的协方差存在,则
- \(\text{Cov}(X, Y) = \text{Cov}(Y, X)\)
- \(\text{Cov}(X, X) = \text{Var}(X)\)
- \(\text{Cov}(aX, bY) = a b \text{Cov}(X, Y), a, b \in \mathbb{R}\)
- 若 \(\text{Cov}(X_{i}, Y), i = 1, 2\) 存在,则 \(\text{Cov}(X_{1} + X_{2}, Y) = \text{Cov}(X_{1}, Y) + \text{Cov}(X_{2}, Y)\)
- 若 \(X\) 和 \(Y\) 相互独立,则 \(\text{Cov}(X, Y) = 0\),但反之不然
- 当 \(\text{Var}(X) \cdot \text{Var}(Y) \neq 0\) 时,有 \((\text{Cov}(X, Y))^{2} \leq \text{Var}(X) \text{Var}(Y)\),当且仅当存在常数 \(c_{1}, c_{2}\) 使得 \(P \{ Y = c_{1} + c_{2} X \} = 1\),即 \(X\) 和 \(Y\) 之间有严格的线性关系时取等
相关系数
对于随机变量 \(X\) 和 \(Y\),当 \(E(X^{2})\) 与 \(E(X^{2})\) 今年存在且 \(\text{Var}(X), \text{Var}(Y)\) 均为非零实数时,称
为 \(X\) 与 \(Y\) 的相关系数 (correlation coefficient),有时也简记为 \(\rho\)。
根据标准化变量的定义,可知
其中 \(X^{*} = \frac{X - E(X)}{\sqrt{\text{Var}(X)}}, Y^{*} = \frac{Y - E{Y}}{\sqrt{\text{Var}(Y)}}\)
对于随机变量 \(X\) 和 \(Y\),当相关系数 \(\rho_{XY}\) 存在时,有
- 若 \(X\) 和 \(Y\) 相互独立,则 \(\rho_{XY} = 0\),但反之不然
- \(|\rho_{XY}| \leq 1\),当且仅当存在常数 \(c_{1}, c_{2}\) 使得 \(P \{ Y = c_{1} + c_{2} X \} = 1\),即 \(X\) 和 \(Y\) 之间有严格的线性关系时取等
由上可知,相关系数和协方差反映的是变量间「线性」关系的密切程度,因此相关系数有时也称作「线性相关系数」。\(|\rho_{XY}|\) 越接近 \(1\),则 \(X\) 与 \(Y\) 之间线性关系的程度就越强;反之两者的线性关系就越弱。
当 \(\rho_{XY} > 0\),即 \(\text{Cov}(X, Y) > 0\) 时,称 \(X\) 与 \(Y\) 正相关;反之,当 \(\rho_{XY} < 0\) 时,称 \(X\) 与 \(Y\) 负相关。
不相关的定义
当随机变量 \(X\) 和 \(Y\) 的相关系数
时,称 \(X\) 和 \(Y\) 不相关 (uncorrelated) 或零相关。
\(X\) 和 \(Y\) 不相关的等价定义还有
- \(\text{Cov}(X, Y) = 0\)
- \(E(XY) = E(X) E(Y)\)
- \(\text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y)\)
需要说明的是,这里的「不相关」同样指的是「不线性相关」,表示两个随机变量之间不存在线性关系,但可以存在非线性的函数关系。
对于两个相互独立的随机变量,若其方差存在,则一定不相关;但是如果它们不想管,却未必相互独立。反之,若两随机变量相关,则它们一定不独立。
二维正态变量的相关系数
设二维随机变量 \((X, Y)\) 服从二元正态分布 \(N(\mu_{1}, \mu_{2}; \sigma_{1}^{2}, \sigma_{2}^{2}; \rho)\),则 \(X\) 与 \(Y\) 的相关系数
当 \(\rho = 0\),即 \(X\) 与 \(Y\) 不相关时,有
即 \(X\) 和 \(Y\) 相互独立。因此对于二维正态变量,两变量不想管等价于两变量相互独立。