4.1 数学期望 (cont’d)

二维随机变量的数学期望

  • 离散型随机变量:若 $(X,Y)$ 的联合概率分布为 $P\{X = x_i, Y = y_j\} = p_{ij},\ i, j = 1, 2, \cdots$,则 $$E(X) = \sum_{i}\sum_{j} x_i p_{ij}\qquad E(Y) = \sum_{i}\sum_{j} y_i p_{ij}$$
  • 连续性随机变量:若 $(X,Y)$ 的概率密度函数为 $f(x,y)$,则 $$E(X) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xf(x,y) \mathrm dx \mathrm dy\qquad E(Y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} yf(x,y) \mathrm dx \mathrm dy$$

二维随机变量函数的数学期望

  • 离散型随机变量:若 $(X,Y)$ 的联合概率分布为 $P\{X = x_i, Y = y_j\} = p_{ij},\ i, j = 1, 2, \cdots$,且有 $$\sum_{i}\sum_{j} |g(x_i,y_j)|p_{ij} < +\infty$$则 $Z = g(x,y)$ 的数学期望为 $$E(Z) = \sum_{i}\sum_{j} g(x_i, y_j) p_{ij}$$
  • 连续性随机变量:若 $(X,Y)$ 的概率密度函数为 $f(x,y)$,且有 $$\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} |g(x, y)|f(x,y) \mathrm dx \mathrm dy$$ 收敛,则 $Z = g(X,Y)$ 的数学期望为 $$E(Z) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} g(x, y)f(x,y) \mathrm dx \mathrm dy$$

数学期望的性质

  • 常数:$E(C) = C$
  • 线性性:$\displaystyle E(kX) = kE(X),\quad E(X+Y) = E(X)+E(Y),\quad E\left(\sum_{i}c_iX_i\right)=\sum_i c_iE(X_i)$
  • 乘积
    • 若 $X,Y$ 独立,则 $E(XY)=E(X)E(Y)$
    • 若 $X_1,X_2,\cdots,X_n$ 相互独立,则 $\displaystyle E\left(\prod_i X_i\right) = \prod_i E(X_i)$

4.2 方差

一维随机变量的方差:对于随机变量 $X$,若 $E[(X - E(X))^2]$ 存在,则称其为 $X$ 的方差,记为 $D(X)$ 或 $Var(X)$,该数值刻画了随机变量的取值对于数学期望的离散程度

标准差 / 均方差:$\sigma(X) = \sqrt{D(X)}$.

方差计算

  • 离散型随机变量:$\displaystyle D(X) = \sum_{k}[x_k - E(X)]^2p_k$
  • 连续性随机变量:$\displaystyle D(X) = \int_{-\infty}^{+\infty} [x - E(X)]^2 f(x) \mathrm dx$
  • 方差简化公式:(几乎任何情况都能用)$$\begin{aligned}D(X) &= E[(X - E(X))^2] \\&= E[X^2 - 2XE(X) + E^2(X)] \\&= E(X^2) - 2E^2(X) + E^2(X) \\&= E(X^2)-E^2(X)\end{aligned}$$ 常见一维随机变量的期望和方差
分布分布律 / 概率密度函数期望方差
0-1 分布$$\displaystyle P\{X = i\} = \begin{cases}p,& i = 1\\1-p, & i=0\end{cases}$$$$E(X) = p$$$$D(X) = p(1-p)$$
二项分布
$X \sim b(n, p)$
$$\displaystyle P\{X = k\} = \binom{n}{k} p^k (1 - p)^{n - k},\quad k = 0, 1, \cdots, n$$$$E(X) = np$$$$D(X) = np(1-p)$$
泊松分布
$X \sim \pi(\lambda)$
$$P\{X = k\} = e^{-\lambda} \frac{\lambda^k}{k!},\quad k = 0 , 1, 2,\cdots$$$$E(X) = \lambda$$$$D(X) = \lambda$$
均匀分布
$X \sim U(a,b)$
$$f(x) = \begin{cases}\dfrac{1}{b -a},& a < x < b \\ 0,& \text{otherwise}\end{cases}$$$$E(X) = \frac{a+b}{2}$$$$D(X) = \frac{(b-a)^2}{12}$$
指数分布$$f(x) = \begin{cases}\dfrac{e^{-x/\theta}}{\theta},& x > 0 \\ 0,& x \le 0\end{cases}$$$$E(X) = \theta$$$$D(X) = \theta^2$$
正态分布
$X = N(\mu,\sigma^2)$
$$f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{ -\frac{(x - \mu)^2}{2\sigma^2} }$$$$E(X) = \mu$$$$D(X) = \sigma^2$$

方差的性质

  • 常数:$D(C) = 0$
  • 线性变换:$D(CX) = C^2D(X),\quad D(X+ C) = D(X)$
  • 随机变量相加:$$\begin{aligned} D(X+Y)&=E[(X+Y-E(X+Y))^2]\\ &=E\{[(X - E(X) ) + (Y - E(Y))]^2\} \\ &=E[(X - E(X))^2] + E[(Y - E(Y))^2] + 2E[(X - E(X))(Y - E(Y))] \\ &= D(X) + D(Y) + 2Cov (X, Y)\end{aligned}$$ 其中 $Cov(X,Y)$ 指两变量的协方差。 当 $X, Y$ 相互独立,协方差为零,则 $D(X+Y) = D(X)+D(Y)$
  • $D(X) = 0 \Leftrightarrow P\{X = E(X)\} = 1$
  • 切比雪夫不等式:$$P\left\{|X - E(X)| \ge \epsilon\right\} \le \frac{D(X)}{\epsilon^2}$$ 当方差越小,则随机变量取值在期望附近的概率越大。

4.3 协方差和相关系数

协方差 (Covariance):随机变量 $X,Y$ 的协方差为 $$Cov(X,Y) = E\{[X - E(X)][Y - E(Y)]\}$$

协方差的性质

  • 交换律:$Cov(X,Y) = Cov(Y,X)$
  • 线性性:$Cov(aX,bY) = abCov(X,Y),\quad Cov(X_1+X_2, Y) = Cov(X_1,Y)+Cov(X_2,Y)$
  • $Cov(X,X) = E(X^2) - E^2(X) = D(X)$

协方差计算公式: $$\begin{aligned} Cov(X,Y)&=E\{[X - E(X)][Y - E(Y)]\}\\&=E(XY) - E(X)E(Y)-E(Y)E(X) + E(X)E(Y)\\&=E(XY)-E(X)E(Y)\end{aligned}$$ 因此若 $X,Y$ 独立,则 $Cov(X,Y) = 0$

相关系数:假设随机变量 $X,Y$ 的 $D(X) > 0, D(Y) >0$,则 $$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}$$ 相关系数与线性拟合的关系:$$\begin{aligned}\min_{a, b} E\{[Y - (aX + b)]^2\} &= (1 - \rho_{XY}^2)D(Y) \\&=D[Y - (aX+b)] + E^2[Y - (aX+ b)]\end{aligned}$$ 相关系数的性质

  • $|\rho_{XY}| \le 1$
  • $|\rho_{XY}| = 1 \Leftrightarrow \exists a, b,\ P\{Y = aX+b\} = 1$
    • $\rho_{XY} = 1 \Leftrightarrow a > 0$
    • $\rho_{XY} = -1 \Leftrightarrow a < 0$
  • $X, Y$ 相互独立 $\Rightarrow \rho_{XY} = 0$

对于二维正态分布随机变量 $X,Y$,相互独立 $\Leftrightarrow \rho = 0$

4.4 矩、协方差矩阵

定义公式
$k$ 阶(原点)矩$E(X^k)$
$k$ 阶中心矩$E\{[X - E(X)]^k\}$
$k + l$ 阶混合(原点)矩$E\{X^kY^l\}$
$k + l$ 阶混合中心距$E\{[X - E(X)]^k [Y - E(Y)]^l\}$
$(X_1, X_2)$ 的协方差矩阵$\begin{bmatrix}D(X_1)&Cov(X_1,X_2)\\Cov(X_1,X_2)&D(X_2)\end{bmatrix}$
$(X_1,X_2,\ldots,X_n)$ 的协方差矩阵$$\begin{bmatrix}D(X_1) & \mathrm{Cov}(X_1,X_2) & \cdots & \mathrm{Cov}(X_1,X_n)\\\mathrm{Cov}(X_2,X_1) & D(X_2) & \cdots & \mathrm{Cov}(X_2,X_n)\\\vdots & \vdots & \ddots & \vdots\\\mathrm{Cov}(X_n,X_1) & \mathrm{Cov}(X_n,X_2) & \cdots & D(X_n)\end{bmatrix}$$
协方差矩阵是对称矩阵