3.1 多维随机变量 (cont’d)

二维连续型随机变量:令 $(X, Y)$ 为二维随机变量,且 $\displaystyle P\{(X, Y) \in G\} = \iint_G f(x, y) \mathrm dx \mathrm dy$,且有特点:

  • $f(x, y) \ge 0$
  • $\iint f(x, y) \mathrm dx \mathrm dy = 1$,即 $f$ 与 $xOy$ 平面之间的体积为 $1$

则 $(X, Y)$ 是二维连续型随机变量,$f(x, y)$ 是其联合概率密度函数。

分布函数:$\displaystyle F(x, y) = \int_{-\infty}^ y \int_{-\infty}^x f(u, v) \mathrm du \mathrm dv$

那么有 $\displaystyle f(x, y) = \frac{\partial^2 F(x, y)}{\partial x \partial y}$

【常见的二维分布】

均匀分布:若平面 $G$ 的面积为 $S$,且 $(X, Y)$ 的联合概率密度函数为 $$f(x, y) = \begin{cases} \frac{1}{S}, & (x, y) \in G \\ 0, & otherwise\end{cases} $$ 则称 $(X, Y)$ 在 $G$ 上服从均匀分布。

正态分布:若 $(X, Y)$ 的联合概率密度函数为 $$f(x, y) = \frac{1}{2\pi \sigma _1 \sigma_2 \sqrt{1 - \rho^2}} \exp \left( - \frac{(\frac{x - \mu_1}{\sigma_1})^2 - 2\rho (\frac{x - \mu_1}{\sigma_1})(\frac{y - \mu_2}{\sigma_2}) + (\frac{y - \mu_2}{\sigma_2})^2}{2(1 - \rho^2)} \right)$$ 其中 $\sigma_1, \sigma_2 > 0,\ |\rho| < 1$,则 $(X, Y)$ 服从参数为 $\mu_1, \mu_2, \sigma_1, \sigma_2, \rho$ 的二维正态分布,即 $(X, Y) \sim N(\mu_1, \mu_2, \sigma_1, \sigma_2, \rho)$.

3.2 边缘分布函数

边缘分布:对于二维随机变量 $(X, Y)$,$X, Y$ 各自的单随机变量分布称为边缘分布。

$$F_X(x) = P\{X \le x\} = F(x, +\infty) = \lim_{y \to + \infty} F(x, y)$$ $$F_Y(y) = P\{Y \le y\} = F(+\infty, y) = \lim_{x \to + \infty} F(x, y)$$ 由联合分布可以确定边缘分布;但由边缘分布一般不能确定联合分布(因为丢失了 $x, y$ 之间的关系)。

离散型随机变量的边缘分布: $$F_X(x) = \sum_{x_i \le x} \sum_{j = 1}^\infty p_{ij} = \sum_{x_i \le x} p_{i\cdot}$$ $$F_Y(y) = \sum_{i = 1}^{\infty} \sum_{y_j \le y} p_{ij} = \sum_{y_j \le y} p_{\cdot j}$$ 若将联合分布律列表,则关于 $X$ 的边缘分布 $p_{i·}$ 是对应行总和,关于 $Y$ 的边缘分布 $p_{·j}$ 是对应列总和

连续型随机变量的边缘分布: $$\displaystyle F_X(x) = F(x, +\infty) = \int_{-\infty}^ x \int_{-\infty}^{+\infty} f(u, y) \mathrm dy \mathrm du = \int_{-\infty}^ x f_X(u) \mathrm du$$ $$\displaystyle F_Y(y) = F(+\infty, y) = \int_{-\infty}^ y \int_{-\infty}^{+\infty} f(x, v) \mathrm dx \mathrm dv = \int_{-\infty}^ y f_Y(v) \mathrm dv$$从二维正态分布推边缘分布: 关键是使用高斯积分:$\displaystyle \int_{-\infty}^{+\infty} e^{-\frac{x^2}{2}} = \sqrt{2\pi}$

3.3 条件分布

条件分布律

  • 随机变量 $X$ 的条件分布律:$\displaystyle P\\\{ X = x_i | Y = y_j\\\} = \frac{p_{ij}}{p_{·j}},\ i = 1, 2, \cdots$
  • 随机变量 $Y$ 的条件分布律:$\displaystyle P\\\{ Y = y_i | X = x_i\\\} = \frac{p_{ij}}{p_{i·}},\ j = 1, 2, \cdots$

条件分布函数

  • 离散情形:$\displaystyle F_{X|Y}(x|y) = P\\\{X \le x | Y = y\\\} = \frac{P\\\{X\le x, Y = y\\\}}{P\\\{Y = y\\\}}$
  • 连续情形:

条件概率密度:$\displaystyle f_{X|Y}(x|y) = \frac{f(x, y)}{f_Y(y)}$ 为 $Y = y$ 的条件下, $X$ 的条件概率密度。

3.4 相互独立的随机变量

相互独立:对于两个随机变量 $X, Y$,$\forall a < b, c < d$,有 $$P\\\{a < X \le b,\ c < Y \le d\\\} = P\\\{a < X \le b\\\}·P\\\{c < X \le d\\\}$$则随机变量 $X, Y$ 相互独立。

相互独立的性质

  • $X, Y$ 相互独立 $\Leftrightarrow$ $\forall x, y,\ F(x, y) = F_X(x) F_Y(y)$
  • 对于离散型随机变量 $(X, Y)$:$X, Y$ 相互独立 $\Leftrightarrow$ $\forall i, j,\ P\\\{X = x_i,\ Y = y_j\\\} = P\\\{X = x_i\\\} · P\\\{Y = y_j\\\}$
  • 对于连续型随机变量 $(X, Y)$:$X, Y$ 相互独立 $\Leftrightarrow$ $\forall x, y,\ f(x, y) = f_X(x) f_Y(y)$ 几乎处处成立

我们允许在平面上面积为零的集合(如一条曲线、有限个点等),使得等式 $f(x, y) = f_X(x) f_Y(y)$ 不成立。

多变量相互独立:若对于所有的 $( x_1, x_2, \cdots, x_n )$,有: $$F(x_1, x_2, \cdots, x_n) = F_{X_1}(x_1) F_{X_2}(x_2) \cdots F_{X_n}(x_n)$$

则称 $( X_1, X_2, \cdots, X_n )$ 相互独立

设 $(X_1, X_2, \cdots, X_m)$ 的分布函数为 $F_1(x_1, x_2, \cdots, x_m)$,
$(Y_1, Y_2, \cdots, Y_n)$ 的分布函数为 $F_2(y_1, y_2, \cdots, y_n)$。

若它们的联合分布函数 $F(x_1, \cdots, x_m, y_1, \cdots, y_n)$ 满足:$$F(x_1, \cdots, x_m, y_1, \cdots, y_n) = F_1(x_1, \cdots, x_m) F_2(y_1, \cdots, y_n)$$ 则称 $(X_1, X_2, \cdots, X_m)$ 与 $(Y_1, Y_2, \cdots, Y_n)$ 相互独立