2.4 连续型随机变量及其概率密度 (cont’d)

均匀分布

均匀分布：$X \sim U(a, b)$ 表示 $X$ 在 $(a, b)$ 上服从均匀分布 $$f(x) = \begin{cases}\dfrac{1}{b -a},& a < x < b \\ 0,& otherwise\end{cases}$$ 和离散型的古典概型是类似的。

均匀分布的性质：

$\displaystyle P\{c \le X \le d\} = \frac{d - c}{b - a}$，等长区间的概率相同，概率与区间长度成正比。
$\displaystyle F(x) = \begin{cases}0,&x \le a\\\dfrac{x - a}{b - a},&a < x< b\\1,&x \ge b\end{cases}$

指数分布

指数分布：称 $X$ 服从参数为 $\theta\ (\theta > 0)$ 的指数分布，当 $$f(x) = \begin{cases}\dfrac{e^{-x/\theta}}{\theta},& x > 0 \\ 0,& x \le 0\end{cases}$$ 与离散型随机变量的几何分布类似。

指数分布的性质：

$P\{X > x\} = e^{-x/\theta}$
无记忆性：$P\{X > s + t \mid X > s\} = P\{X > t\} = e^{-t/\theta}$

正态分布 / 高斯分布

正态分布：$X \sim N (\mu, \sigma^2)$ 称 $X$ 服从参数为 $\mu, \sigma\ (\sigma > 0)$ 的正态分布，当其中 $\mu$ 是位置参数（对称轴位置），$\sigma$ 是形状参数（$\sigma$ 越大则越矮）

正态分布概率密度函数的几何特征：

区间关于 $x = \mu$ 对称，且取得最大值 $\dfrac{1}{\sqrt{2\pi} \sigma}$
$\displaystyle \lim_{x \to \infty} f(x)= 0$
曲线在 $x = \mu \pm \sigma$ 处存在拐点

标准正态分布：$X \sim N(0, 1)$ 标准正态分布的性质：

$\varphi(-x) = \varphi(x)$
$\Phi (0) = \frac{1}{2}$
$\Phi(-x) = 1 - \Phi(x)$

上 $\mathbf \alpha$ 分位点：在 $X \sim N(0, 1)$ 中，若 $P\{X > z_\alpha\} = \alpha\ (0 < \alpha < 1)$，则称 $z_\alpha$ 为标准正态分布的上 $\alpha$ 分位点。

正态分布的标准化：若 $X \sim N(\mu, \sigma^2)$，则 $\displaystyle Z = \frac{X - \mu}{\sigma} \sim N(0, 1)$

任何一个一般的正态分布都可以通过线性变换转化为标准正态分布。

$\displaystyle P\{a < X < b\} = P\left\{ \frac{a - \mu}{\sigma} < Z < \frac{b - \mu}{\sigma} \right\} = \Phi\left( \frac{b - \mu}{\sigma} \right) - \Phi\left( \frac{a - \mu}{\sigma} \right)$

$\displaystyle \int_{0}^{+\infty} e^{-u^2} \mathrm du = \frac{\sqrt{\pi}}{2}$
$\displaystyle \int_0^{+\infty} e^{-\frac{x^2}{b}} \mathrm dx = \frac{\sqrt \pi}{2} · \sqrt{b}$
遇到 $\displaystyle \int x^n e^{-\frac{x^2}{b}} \mathrm dx$ 的形式，拆成 $x^{n - 1} · \left( x e^{-\frac{x^2}{b}}\right)$ 的形式，后面可以积分 $\displaystyle \int x e^{-\frac{x^2}{b}} \mathrm dx = -\frac{b}{2} e^{-\frac{x^2}{b}}$ 所以用分部积分来降次，直到降为 $n = 0$，再用高斯公式。

$3\sigma$ 准则：推广到一般的正态分布中，$X$ 的取值绝大多数集中在 $[\mu - 3 \sigma, \mu + 3 \sigma]$ 区间内。

2.5 随机变量的函数的分布

对于离散型随机变量 $X$，有另一离散型随机变量 $Y = f(X)$，那么 $Y$ 的分布律为 $$P\{Y = y_i\} = \sum_{f(x_j) = y_i} P\{ X = x_j \}$$ 对于连续型随机变量 $X$，概率密度为 $f_X(x)$。另一连续型随机变量 $Y = h(X)$，那么 $Y$ 的概率密度为 $$g(y) = \frac{\mathrm d}{\mathrm dy} \int_{h(x) \le y} f(x) \mathrm dx$$ 如果 $h(x) \le y$ 的解是区间 $x \in [\psi(y), \varphi(y)]$，那么可以用以下公式 $$\frac{\mathrm d}{\mathrm dy} \int_{\psi(y)}^{\varphi(y)} f(x) \mathrm dx = f(\varphi(y)) \varphi’(y) - f(\psi(y))\psi’(y)$$

难点理解： 连续型随机变量函数变换（最一般情形）

设 $X$ 为连续型随机变量，概率密度为 $f_X(x)$；$Y = g(X)$，其中 $g:\mathbb{R}\to\mathbb{R}$ 在其定义域上可导；对给定的 $y$，方程 $g(x)=y$ 的所有解为 $x_1(y),x_2(y),\dots,x_n(y),$ 且在这些解点处 $g’(x_i(y))\neq 0$。则 $Y$ 的概率密度函数为

$$f_Y(y)=\sum_{i=1}^{n}f_X\big(x_i(y)\big),\left|\frac{dx_i(y)}{dy}\right|.$$ 由于 $$\frac{dx_i(y)}{dy}=\frac{1}{g’(x_i(y))}$$ 上式等价为 $$f_Y(y)=\sum_{x:,g(x)=y}\frac{f_X(x)}{|g’(x)|}.$$

注意点（可行条件）：

对每个 $y$，方程 $g(x)=y$ 只有有限个解；
在所有解点处 $g’(x)\neq 0$；
求和只对存在解的 $y$ 进行；
若 $g$ 在 $X$ 的支持集上严格单调，则求和项只有一项。

如果导数 $g’(x)$ 为零（只是有限个），那么可以不用管，因为 有限个点的概率函数不影响整体的概率分布。

除了有概率密度的区间，还要注意写那些 平凡情况 ！

3.1 多维随机变量

$n$ 维随机变量 / 随机向量：$n$ 个随机变量的整体 $X = (X_1, X_2, \cdots, X_n)$

二维随机变量：对于一个随机试验 $E$，样本空间 $S$，则两个随机变量 $X : S \mapsto \mathbb R, Y: S \mapsto \mathbb R$ 构成的向量 $(X, Y)$ 叫做二维随机变量。

(联合)分布函数：$F(x, y) = P\{X \le x, Y \le y\}$ 则 $P\{x_1 \le X \le x_2,\ y_1 \le Y \le y_2\} = F(x_2, y_2) - F(x_2, y_1) - F(x_1, y_2) + F(x_1, y_1)$

分布函数的性质：

$0 \le F(x, y) \le 1$
$F(-\infty, y) = F(x, -\infty) = F(-\infty, -\infty) = 0$，$F(+\infty, +\infty) = 1$
（？）$F(x, y) = F(x + 0, y) = F(x , y + 0)$
$F(x, y)$ 关于 $x, y$ 都不减

二维离散型随机变量：$(X, Y)$ 的(联合)分布律为 $$P\{X = x_i, Y = y_j\} = p_{ij},\quad i, j = 1, 2, \cdots$$ 分布律的性质：

$p_{ij} \ge 0$
$\displaystyle \sum_i \sum_j p_{ij} = 1$

分布函数：$\displaystyle F(x, y) = \displaystyle \sum_{x_i \le x} \sum_{y_i \le y} p_{ij}$

2.4 连续型随机变量及其概率密度 (cont’d)#

均匀分布#

指数分布#

正态分布 / 高斯分布#

2.5 随机变量的函数的分布#

3.1 多维随机变量#