4.1 数学期望 (cont’d)

二维随机变量的数学期望：

离散型随机变量：若 $(X,Y)$ 的联合概率分布为 $P\{X = x_i, Y = y_j\} = p_{ij},\ i, j = 1, 2, \cdots$，则 $$E(X) = \sum_{i}\sum_{j} x_i p_{ij}\qquad E(Y) = \sum_{i}\sum_{j} y_i p_{ij}$$
连续性随机变量：若 $(X,Y)$ 的概率密度函数为 $f(x,y)$，则 $$E(X) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} xf(x,y) \mathrm dx \mathrm dy\qquad E(Y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} yf(x,y) \mathrm dx \mathrm dy$$

二维随机变量函数的数学期望：

离散型随机变量：若 $(X,Y)$ 的联合概率分布为 $P\{X = x_i, Y = y_j\} = p_{ij},\ i, j = 1, 2, \cdots$，且有 $$\sum_{i}\sum_{j} |g(x_i,y_j)|p_{ij} < +\infty$$则 $Z = g(x,y)$ 的数学期望为 $$E(Z) = \sum_{i}\sum_{j} g(x_i, y_j) p_{ij}$$
连续性随机变量：若 $(X,Y)$ 的概率密度函数为 $f(x,y)$，且有 $$\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} |g(x, y)|f(x,y) \mathrm dx \mathrm dy$$ 收敛，则 $Z = g(X,Y)$ 的数学期望为 $$E(Z) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} g(x, y)f(x,y) \mathrm dx \mathrm dy$$

数学期望的性质：

常数：$E(C) = C$
线性性：$\displaystyle E(kX) = kE(X),\quad E(X+Y) = E(X)+E(Y),\quad E\left(\sum_{i}c_iX_i\right)=\sum_i c_iE(X_i)$
乘积：
- 若 $X,Y$ 独立，则 $E(XY)=E(X)E(Y)$
- 若 $X_1,X_2,\cdots,X_n$ 相互独立，则 $\displaystyle E\left(\prod_i X_i\right) = \prod_i E(X_i)$

4.2 方差

一维随机变量的方差：对于随机变量 $X$，若 $E[(X - E(X))^2]$ 存在，则称其为 $X$ 的方差，记为 $D(X)$ 或 $Var(X)$，该数值刻画了随机变量的取值对于数学期望的离散程度。

标准差 / 均方差：$\sigma(X) = \sqrt{D(X)}$.

方差计算：

离散型随机变量：$\displaystyle D(X) = \sum_{k}[x_k - E(X)]^2p_k$
连续性随机变量：$\displaystyle D(X) = \int_{-\infty}^{+\infty} [x - E(X)]^2 f(x) \mathrm dx$
方差简化公式：（几乎任何情况都能用）$$\begin{aligned}D(X) &= E[(X - E(X))^2] \\&= E[X^2 - 2XE(X) + E^2(X)] \\&= E(X^2) - 2E^2(X) + E^2(X) \\&= E(X^2)-E^2(X)\end{aligned}$$ 常见一维随机变量的期望和方差：

分布	分布律 / 概率密度函数	期望	方差
0-1 分布	$$\displaystyle P\{X = i\} = \begin{cases}p,& i = 1\\1-p, & i=0\end{cases}$$	$$E(X) = p$$	$$D(X) = p(1-p)$$
二项分布 $X \sim b(n, p)$	$$\displaystyle P\{X = k\} = \binom{n}{k} p^k (1 - p)^{n - k},\quad k = 0, 1, \cdots, n$$	$$E(X) = np$$	$$D(X) = np(1-p)$$
泊松分布 $X \sim \pi(\lambda)$	$$P\{X = k\} = e^{-\lambda} \frac{\lambda^k}{k!},\quad k = 0 , 1, 2,\cdots$$	$$E(X) = \lambda$$	$$D(X) = \lambda$$
均匀分布 $X \sim U(a,b)$	$$f(x) = \begin{cases}\dfrac{1}{b -a},& a < x < b \\ 0,& \text{otherwise}\end{cases}$$	$$E(X) = \frac{a+b}{2}$$	$$D(X) = \frac{(b-a)^2}{12}$$
指数分布	$$f(x) = \begin{cases}\dfrac{e^{-x/\theta}}{\theta},& x > 0 \\ 0,& x \le 0\end{cases}$$	$$E(X) = \theta$$	$$D(X) = \theta^2$$
正态分布 $X = N(\mu,\sigma^2)$	$$f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{ -\frac{(x - \mu)^2}{2\sigma^2} }$$	$$E(X) = \mu$$	$$D(X) = \sigma^2$$

方差的性质：

常数：$D(C) = 0$
线性变换：$D(CX) = C^2D(X),\quad D(X+ C) = D(X)$
随机变量相加：$$\begin{aligned} D(X+Y)&=E[(X+Y-E(X+Y))^2]\\ &=E\{[(X - E(X) ) + (Y - E(Y))]^2\} \\ &=E[(X - E(X))^2] + E[(Y - E(Y))^2] + 2E[(X - E(X))(Y - E(Y))] \\ &= D(X) + D(Y) + 2Cov (X, Y)\end{aligned}$$ 其中 $Cov(X,Y)$ 指两变量的协方差。当 $X, Y$ 相互独立，协方差为零，则 $D(X+Y) = D(X)+D(Y)$
$D(X) = 0 \Leftrightarrow P\{X = E(X)\} = 1$
切比雪夫不等式：$$P\left\{|X - E(X)| \ge \epsilon\right\} \le \frac{D(X)}{\epsilon^2}$$ 当方差越小，则随机变量取值在期望附近的概率越大。

4.3 协方差和相关系数

协方差 (Covariance)：随机变量 $X,Y$ 的协方差为 $$Cov(X,Y) = E\{[X - E(X)][Y - E(Y)]\}$$

协方差的性质：

交换律：$Cov(X,Y) = Cov(Y,X)$
线性性：$Cov(aX,bY) = abCov(X,Y),\quad Cov(X_1+X_2, Y) = Cov(X_1,Y)+Cov(X_2,Y)$
$Cov(X,X) = E(X^2) - E^2(X) = D(X)$

协方差计算公式： $$\begin{aligned} Cov(X,Y)&=E\{[X - E(X)][Y - E(Y)]\}\\&=E(XY) - E(X)E(Y)-E(Y)E(X) + E(X)E(Y)\\&=E(XY)-E(X)E(Y)\end{aligned}$$ 因此若 $X,Y$ 独立，则 $Cov(X,Y) = 0$

相关系数：假设随机变量 $X,Y$ 的 $D(X) > 0, D(Y) >0$，则 $$\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}$$ 相关系数与线性拟合的关系：$$\begin{aligned}\min_{a, b} E\{[Y - (aX + b)]^2\} &= (1 - \rho_{XY}^2)D(Y) \\&=D[Y - (aX+b)] + E^2[Y - (aX+ b)]\end{aligned}$$ 相关系数的性质：

$|\rho_{XY}| \le 1$
$|\rho_{XY}| = 1 \Leftrightarrow \exists a, b,\ P\{Y = aX+b\} = 1$
- $\rho_{XY} = 1 \Leftrightarrow a > 0$
- $\rho_{XY} = -1 \Leftrightarrow a < 0$
$X, Y$ 相互独立 $\Rightarrow \rho_{XY} = 0$

对于二维正态分布随机变量 $X,Y$，相互独立 $\Leftrightarrow \rho = 0$

4.4 矩、协方差矩阵

定义	公式
$k$ 阶（原点）矩	$E(X^k)$
$k$ 阶中心矩	$E\{[X - E(X)]^k\}$
$k + l$ 阶混合（原点）矩	$E\{X^kY^l\}$
$k + l$ 阶混合中心距	$E\{[X - E(X)]^k [Y - E(Y)]^l\}$
$(X_1, X_2)$ 的协方差矩阵	$\begin{bmatrix}D(X_1)&Cov(X_1,X_2)\\Cov(X_1,X_2)&D(X_2)\end{bmatrix}$
$(X_1,X_2,\ldots,X_n)$ 的协方差矩阵	$$\begin{bmatrix}D(X_1) & \mathrm{Cov}(X_1,X_2) & \cdots & \mathrm{Cov}(X_1,X_n)\\\mathrm{Cov}(X_2,X_1) & D(X_2) & \cdots & \mathrm{Cov}(X_2,X_n)\\\vdots & \vdots & \ddots & \vdots\\\mathrm{Cov}(X_n,X_1) & \mathrm{Cov}(X_n,X_2) & \cdots & D(X_n)\end{bmatrix}$$ 协方差矩阵是对称矩阵。

4.1 数学期望 (cont’d)#

4.2 方差#

4.3 协方差和相关系数#

4.4 矩、协方差矩阵#

4.1 数学期望 (cont’d)

4.2 方差

4.3 协方差和相关系数

4.4 矩、协方差矩阵