第五章 - 大数定律及中心极限定理
约 1226 个字 预计阅读时间 4 分钟
大数定律
依概率收敛
设 \(\{ Y_{n}, n \geq 1 \}\) 为一随机变量序列,\(c\) 为一常数。若对任意的 \(\epsilon > 0\),都有
成立,则称 \(\{ Y_{n}, n \geq 1 \}\) 依概率收敛 (convergence in probability) 于 \(c\),记作 \(Y_{n} \stackrel{P}{\longrightarrow} c, n \to +\infty\)。
一个等价表示是
依概率收敛的一个重要性质是,设 \(X_{n} \stackrel{P}{\longrightarrow} a, Y_{n} \stackrel{P}{\longrightarrow} b, n \to +\infty\),其中 \(a, b\) 为两个常数。若二元函数 \(g(x, y)\) 在点 \((a, b)\) 处连续,则有
两个重要不等式
马尔可夫不等式
若随机变量 \(Y\) 的 \(k\) 阶(原点)矩存在,\(k \geq 1\),则对任意的 \(\epsilon > 0\),有
或等价表示为
这一定理被称作马尔可夫不等式 (Markov inequality)。
Proof
令
则 \(Z^{k} \leq |Y|^{k}\),故 \(E(Z^{k}) \leq E(|Y|^{k})\)。对任意的 \(k \geq 1\),注意到 \(E(Z^{k}) = \epsilon^{k} P \{ |Y| \geq \epsilon \}\),所以
特别地,当 \(Y\) 为取非负值的随机变量且其 \(k\) 阶矩存在时,则有
切比雪夫不等式
设随机变量 \(X\) 的数学期望和方差存在,分别记作 \(\mu, \sigma^{2}\),则对任意的 \(\epsilon > 0\),有
或等价表示为
这一定理被称作切比雪夫不等式 (Chebyshev inequality)。
Proof
在马尔可夫不等式中取 \(Y = X - \mu, k = 2\) 即可。
两个大数定律
设 \(\{ X_{i}, i \geq 1 \}\) 为一随机变量序列,若存在常数序列 \(\{ c_{n}, n \geq 1 \}\),使得对任意的 \(\epsilon > 0\),有
或等价表示为
成立,即当 \(n \to +\infty\) 时,有 \(\frac{1}{n} \sum_{i = 1}^{n} X_{i} - c_{n} \stackrel{P}{\longrightarrow} 0\),则称堆积变量序列 \(\{ X_{i}, i \geq 1 \}\) 服从弱大数定律 (weak law of large numbers),简称服从大数定律。
特别地,当 \(c_{n} = c, n = 1, 2, \cdots\) 时,可记作
伯努利大数定律
设 \(n_{A}\) 为 \(n\) 重伯努利试验中事件 \(A\) 发生的次数,\(p, 0< p < 1\) 为事件 \(A\) 在每次试验中发生的概率,即 \(P(A) = p\),则对任意的 \(\epsilon > 0\),有
即 \(\frac{n_{A}}{n} \stackrel{P}{\longrightarrow} p, n \to +\infty\)。这一定理被称作伯努利大数定律 (Bernoulli law of large numbers)。
Proof
引入随机变量
易见 \(n_{A} = \sum_{i = 1}^{n} X_{i}\),且 \(X_{1}, X_{2}, \cdots, X_{n}\) 相互独立,均服从参数为 \(p\) 的 0-1 分布。从而
故 \(E \left( \frac{n_{A}}{n} \right) = p, \text{Var} \left( \frac{n_{A}}{n} \right) = \frac{p (1 - p)}{n}\)。利用切比雪夫不等式,可得
再结合 \(P \left\{ \left| \frac{n_{A}}{n} - p \right| \geq \epsilon \right\} \geq 0\),即证。
辛钦大数定律
设 \(\{ X_{i}, i \geq 1 \}\) 为独立同分布的随机变量序列,且数学期望存在,记为 \(\mu\),则对任意的 \(\epsilon > 0\),有
即 \(\frac{1}{n} \sum_{i = 1}^{n} X_{i} \stackrel{P}{\longrightarrow} \mu, n \to +\infty\)。这一定理被称作辛钦大数定律 (Khinchin law of large numbers)。
辛钦大数定律不要求随机变量的方差存在。
注意到当 \(\{ X_{i}, i \geq 1 \}\) 为独立同分布的随机变量序列时,若 \(h(x)\) 为一连续函数,则 \(\{ h(X_{i}), i \geq 1 \}\) 也是独立同分布的。因此辛钦大数定律可以得到以下推论:
设 \(\{ X_{i}, i \geq 1 \}\) 为独立同分布的随机变量序列,若 \(h(x)\) 为一连续函数,且记 \(a = E(|h(X_{1}|) < +\infty\),则对任意的 \(\epsilon > 0\),有
即 \(\frac{1}{n} \sum_{i = 1}^{n} h(X_{i}) \stackrel{P}{\longrightarrow} a, n \to +\infty\)。
中心极限定理
独立同分布情形
林德伯格-莱维中心极限定理
设 \(\{ X_{i}, i \geq 1 \}\) 为独立同分布的随机变量序列,且数学期望 \(E(X_{i}) = \mu\) 和方差 \(\text{Var}(X_{i}) = \sigma^{2}, \sigma > 0\) 均存在,则对任意的 \(x \in \mathbb{R}\),有
这一定理被称作林德伯格-莱维中心极限定理 (Lindeberg - Lévy central limit theorem),也称作独立同分布的中心极限定理 (central limit theorem for independent identically)。
该定理表明,数学期望为 \(\mu\),方差为 \(\sigma^{2}\) 的独立同分布的随机变量的部分和 \(\sum_{i = 1}^{n} X_{i}\) 的标准化变量 \(\frac{\sum_{i = 1}^{n} X_{i} - n \mu}{\sigma \sqrt{n}}\),在当 \(n\) 充分大时,近似地服从标准正态分布 \(N(0, 1)\),即
棣莫弗-拉普拉斯中心极限定理
将林德伯格-莱维中心极限定理应用到 \(n\) 重伯努利试验中,可得如下推论。
设 \(n_{A}\) 为在 \(n\) 重伯努利试验中事件 \(A\) 发生的次数,\(p\) 为事件 \(A\) 在每次试验中发生的概率,即 \(P(A) = p, 0 < p < 1\),则对任意的 \(x \in \mathbb{R}\),有
这一定理被称作棣莫弗-拉普拉斯中心极限定理 (De Moivre - Laplace central limit theorem)。
Proof
引入随机变量
易见 \(n_{A} = \sum_{i = 1}^{n} X_{i}\),且 \(X_{1}, X_{2}, \cdots, X_{n}\) 相互独立,均服从参数为 \(p\) 的 0-1 分布。从而
由林德伯格-莱维中心极限定理即证。
该定理表明,当 \(n\) 充分大时,二项分布 \(B(n, p)\) 可以用正态分布 \(N(np, np(1 - p))\) 来逼近。
独立不同分布情形
设 \(\{ X_{i}, i \geq 1 \}\) 为相互独立的随机变量序列,其数学期望 \(E(X_{i}) = \mu_{i}\),方差 \(\text{Var}(X_{i}) = \sigma^{2}, \sigma_{i} > 0, i = 1, 2, \cdots\),如果存在 \(\epsilon > 0\),使得
其中 \(B_{n}^{2} = \sum_{i = 1}^{n} \sigma_{i}^{2}\),那么对于任意的 \(x \in \mathbb{R}\),有
这一定理被称作李雅普诺夫中心极限定理 (Lyapunov central limit theorem)。