whu特供概率论前3章复习

概率论前两章复习

brief

本博文收集《概率论与数理统计第五版习题全解指南（浙大第5版） (盛骤、谢式千、潘承毅)》前两章随机事件与概率和随机变量及其概率分布的基础概念，典型例题及求解。

例题索引

课时1

P25: 2, 3, 4,
P 26: 8, 12

课时2

P 26: 14,
P27: 22, 23，26, 28, 29
P28：34
P29：36，37

课时3

P56: 2， 4， 6， 9
P57: 12, 15，16, 18

课时4

P58: 20，23，
P59: 24, 25，29, 30，
P60: 34，36

1.随机事件与概率

常见符号

$\mathscr E 随机试验\\ \Omega 样本空间\\ \mathscr F 子集组成的集合\\ \omega 样本点$

1.1随机事件

随机事件简称事件

基本运算和运算规律
事件的并——>和事件
事件的交——>积事件
事件的差 $A - B \Leftrightarrow w \in A 但 w \notin B \Leftrightarrow A发生但B不发生$
不相容 $AB = \varnothing$
交换律，结合律(相同符号)，分配律(不同符号，理解成互相做加号和乘号)
德摩根律
不相容分解 $A \cup B = A \cup \bar A B, A = AB \cup A \bar B$

例题

注意这种换算方法就行

事件域和事件的关系

有限样本空间和可列无穷样本空间的每个子集均为事件。

1.2 频率和概率

频率

非负性，规范性，可列可加性

概率

定义设 E是随机试验,S 是它的样本空间对于 E的每一事件 A 赋予一个实数，记为 P(A),称为事件 A 的概率如果集合函数 P(·)满足下列条件

另外有不可能事件的概率为0
有限可加

可减性

逆事件的概率 $P(\bar A) = 1 - P(A)$

加法公式

1.3古典概型

古典概型

试验中只有有限个可能的结果
试验的每个基本事件发生的可能性相同

$P(A) = \frac {A中元素个数} {\Omega中元素的个数} = \frac {A中元素个数} n$
有限等可能概型 $(\Omega,\mathscr F, P)$

如随机试验，将一枚硬币指头三次，恰好几次正面的情况

注意这里A中元素个数的定义

几何概型

两个特征

试验所有可能的结果形成 $\bold R^n的一个有界区域\Omega$
对子集A $\subset$ $\Omega $，试验的结果落入A的概率与A的测读S(A)而和A的位置和形状无关
$P(A) =\frac {S(A)} {S(\Omega)}$

1.4 条件概率

如文两个小孩一男一女的概率，现在已知至少有一位女孩
$P(A|B)$ 已知事件B发生条件下，事件A发生的概率
$P(A|B) = \frac {P(AB)} {P(B)}$

additionally
$P(B|B) = 1, P(\bar B | B) = 0 \\ P(A) = P(A|\Omega)$

乘法公式

$P(AB) = P(B)P(A|B)\\ P(ABC) = P(C|AB)P(B|A)P(A)\\ P(A_1A_2...A_n) = P(A_1)P(A_2|A_1)P(A_3|A_1A_2)\cdots P(A_n|A_1\cdots A_{n-1})$

全概率公式

完备事件组

$B_1,B_2\cdots B_n$ 为完备事件组

设 $(\Omega,\mathscr F, P)$ 为概率空间, $B_1,B_2\cdots B_n$ 为完整事件组，则对任何事件 $A\in\mathscr F$ ,
$P(A) = \sum_{t=1}^{n}P(B_i)P(A|B_i)\\ 若B_1\dots B_n \dots为完备事件组\\ P(A) = \sum_{t=1}^{\infty}P(B_i)P(A|B_i)\\$
理解：已知各个事件产生结果事件的概率，求结果事件发生的总概率
更常用的有
$P(A)=P(B)P(A|B)+P(\bar B)P(A|\bar B)$

贝叶斯公式

$P(B_i|A) = \frac {P(B_i)P(A|B_i)} {\sum_{j=1}^{n}P(B_j)P(A|B_j)} ,i=1,\cdots,n\\ 同时若B_1 ... B_n ...为完备事件组,P(A) >0 则\\ P(B_i|A) = \frac {P(B_i)P(A|B_i)} {\sum_{j=1}^{\infty}P(B_j)P(A|B_j)} ,i=1,\cdots,n, \cdots$
理解：已知结果事件发生了，问一种可能导致其发生的事件的概率。

$P(B_i)$ 是在试验前就知道的（如 $B_i$ 病的发病率）称为先验概率。
$P(B_i|A)$ 为观察到事件A发生的条件下 $B_i$ 的概率，称为后验概率

常用， $B\cup \bar B = \Omega$ 情况下
$P(B|A)=\frac {P(B)P(A|B)} {P(B)P(A|B) + P(\bar B)P(A|\bar B)}$

后验概率的大小很受先验概率选取的影响。

1.5 事件的独立性

两个事件的独立性

A 和 B 相互独立
简单定义
$P(A|B) = P(A) 且P(B|A) = P(B) \\ P(A),P(B) > 0$
或
$P(AB) = P(A)P(B)$

A与B相互独立

零事件与任何事件都独立
互不相容：事件纵向互不发生

相互独立事件，一定相容
互不相容事件，一定不独立
相容事件，不一定独立
https://zhuanlan.zhihu.com/p/36607363

三个事件独立
$\begin{cases} P(AB) = P(A)P(B)\\ P(BC) = P(B)P(C)\\ P(AC) = P(A)P(C) \end{cases}\\ P(ABC) = P(A)P(B)P(C)$
由此推出n个事件独立性的定义

推论

若把n个相互的卢的事件分为互不重叠的k组(k $\le n$ )，则每组中的事件进行事件运算后所得的k个事件相互独立。

例如
$若A_1,...,A_n相互独立\\ \bar {A_1},...\bar A_n相互独立, A_1 \cup A_2, A_3 - A_4,\bar A_5,A_7,...,A_n相互独立$

再由德摩根律
$P(\cup_{i=1}^n A_i) = 1 - P(\cap_{i=1}^n \bar A_i) = 1- \prod_{i=1}^n P(\bar A_i) = \prod_{i=1}^n (1-P(A_i))$

伯努利概型（试验）

pic21
示例，每个同学去图书馆只有两种结果：结借书和不借书，借书的概率为p，每个同学是否借书相互独立，那么观察n个同学到图书馆的借书情况就构成一个n重伯努利的试验。

设 $w=(w_1,w_2,\cdots,w_n)$ 为N重伯努利试验的一个样本点，如果其中有k个A，n-k个 $\bar A$ ，则有试验独立性知
$P((w_1,w_2\cdot ,w_n)) = p^k q^{n-k}$
记 $B_K$ = “在n重伯努利试验中事件A恰好发生k次” $\binom {3}{1}$
所有属于 $B_k$ 的基本事件的概率均为 $p^kq^{n-k}$ ,又因为 $B_k$ 共有 $\tbinom nk$ 个样本点，由概率的有限可加性，
$P(B_k) = \dbinom n k p^k q ^{n-k}$

二项分布，直接由二项式定理得
$\sum_{k=0} n \dbinom n k p^kq^{n-k} = (p+q)^n = |p+(1-q)|^n = 1$

2.随机变量及其概率分布

很多随机试验的结果都与数值发生自然的联系，

名词定义一览

一般地，设A为随机事件，则一定可以通过下述方法使他与数值发生联系
$I_A(w) = \begin{cases} 1,w\in A\\ 0,w\notin A \end{cases}$
称 $I_A$ 为A的示性函数。

随机变量random variable

$(\Omega,\mathscr F, P)$ 是一个概率基本功华北，X是定义在 $\Omega$ 上的实质函数，如果对任意实数 $x$ ， $\{X \le x\}$ 是随机事件,即 $\{w:X(w) \le x\} \in \mathscr F$ ，则称X为随机变量。
设X为随机变量，由事件域的性质，有一下极限表达

分布律

有些随机变量,它全部可能取到的值是有限个或可列无限多个,这种随机变量称为离散型随机变量，例如S1例1中的随机变量 X,它只可能取 0,1,2,3四个值,它是一个离散型随机变量。又如某城市的 120 急救电话台一昼夜收到的呼唤次数也是离散型随机变量。若以 T 记某元的寿命,它所可能取的值充满一个区间,是无法按一定次序一一列举出来的,因而它是一个非离散型的随机变量.本节只讨论离散型随机变量
$\begin{aligned}\text{设离散型随机变量 }&\text{X 所有可能取的值为 }x_k\left(k=1,2,\cdots\right),X\text{ 取各个可能值}\\\text{的概率,即事件}\left<X-x_k\right>&\text{的概率,为}\\P\left<X=x_k\right>&=p_k,k=1,2,\cdots.&\text{(2.1)}\end{aligned}$
称该式为离散性随机变量X的分布律，分布律也可用表格表示

X	$x_1$	$x_2$
$p_k$	$p_1$	$p_2$

分布函数（简称分布）

设X是 $(\Omega,\mathscr F, P)$ 上的随机变量，称实变实值函数
$F(x) = P(X\le x),-\infty < x < \infty$
为X的分布函数，如果X的分布函数为F(x)，则称X服从分布F(x)，记为X~F(x)

对于任意实数 $x_1,x_2(x_1{<}x_2),$ 有
$P\{x_1<X\leqslant x_2\}=P\{X\leqslant x_2\}-P\langle X\leqslant x_1\rangle=F(x_2)-F(x_1),\quad(3.1)$ 因此,若已知 X 的分布函数,我们就知道 X 落在任一区间( $x_1,x_2$ ]上的概率,从
这个意义上说,分布函数完整地描述了随机变量的统计规律性.
推论
对任意x，有$0\le F(x)\le 1 $，此外对任意实数a<b
有
$P(a<X\le b) = P(X\le b) - P(X\le a) = F(b) - F(a)$
类似可证 $\Omega = \{X < \infty\}$
$P(X>x) = P(X < \infty ) - P(X\le x) = 1 - F(x)$
基本性质
设随机变量X的分布函数为F(x)，则

F(x)是x的单调增函数
F(x)是x的右连续函数 F(x+0) = F(x)
渐进性 $F(\infty) := lim_{x\to \infty} F(x) = 1, $$F(-\infty) := lim_{x\to -\infty} F(x) = 0, $

即使随机变量X和Y的分布函数相同，称X与Y同分布，不能认为X=Y

跳跃值

如
$F(x)=\begin{cases}0,&x<-1,\\\dfrac{1}{4},&-1\leqslant x<2,\\\dfrac{3}{4},&2\leqslant x<3,\\[2ex]1,&x\geqslant3.\end{cases}$
跳跃值分别为1/4,1/2,1/4

离散性随机变量

0-1分布

退化分布（单点分布）,X是 $\Omega$ 上恒为常值的随机变量，即存在常数a使得对任何 $w \in \Omega$ ，有 $X(w) = a$ ，则X的分布函数为
$F(x)=\begin{cases} 0,x<a\\ 1,x\ge a \end{cases}$
分布律
$P\left\{X{=}k\right\}=p^{k}\left(1-p\right)^{1-k},\quad k{=}0,1\quad(0{<}p{<}1)$

两点分布(伯努利分布)

二项分布

$P\{X=k\}=\binom{n}{k}p^kq^{n-k},\quad k=0,1,2,\cdots,n.$
并记为 X~b(n,p)
当n=1时，二项分布即为伯努利分布，
注意
$\binom n k = \binom n {n-k} \\ b(k;n,p) = b(n-k;n,1-p)$

泊松分布

$\begin{gathered}\text{设随机变量 }X\text{ 所有可能取的值为 }_0,1,2,\cdotp\cdotp\cdotp,\text{而取各个值的概率为}\\P\langle X=k\rangle=\frac{\lambda^k}{k!}{\mathrm{e}^{-\lambda}} ,{_k}=0,1,2,\cdotp\cdotp\cdotp,\\\text{其中 }\lambda>0\text{ 是常数. 则称 }X\text{ 服从参数为}\lambda\text{ 的泊松分布},\text{记为}X\sim\pi(\lambda).\end{gathered}$
这段可以省掉
$lim_{n\to\infty} \binom n k p^k_n(1-p_n)^{n-k} = \frac{\lambda^k}{k!}{\mathrm{e}^{-\lambda}}$

当p很小 <= 0.05 n较大 >= 20
使用近似公式。
$\binom{n}{k}p^{k}(1-p)^{n-k}\approx\frac{\lambda^{k}\mathrm{e}^{-\lambda}}{k!}\quad(\text{其中}\lambda=np).$
也就是说以 n,p为参数的二项分布的概率值可以由参数为 $\lambda=$ np 的泊松分布的概率值近似.上式也能用来作二项分布概率的近似计算.

一道纯离散性

连续性随机变量

概率密度

一般,如上节例 2 中的随机变量那样,如果对于随机变量 X 的分布函数 $F(x),$ 存在非负可积函数 $f(x)$ ,使对于任意实数 $x$ 有
$F(x)=\int_{-\infty}^{x}f(t)\mathrm{d}t,$
则称 X 为连续型随机变量, $f(x)$ 称为 X 的概率密度函数,简称概率密度.

均匀分布

若连续型随机变量 X 具有概率密度

$f(x)=\begin{cases}\dfrac{1}{b-a},&a<x<b,\\\\0,&\text{其他,}\end{cases}$

则称 X 在区间( $a,b$ )上服从均匀分布,记为 $X{\sim}U(a,b).$

$易知f(x)\geqslant0,{\text{且}}{\int}_{-\infty}^{\infty}f(x)\:{\mathrm{d}}x=1.$

分布函数
$F(x) = \begin{cases} 0, x \le a\\ \frac {x-a} {b-a},a < x <b\\ 1,x\ge b \end{cases}$

指数分布

若连续型随机变量 $X$ 的概率密度为

$f(x)=\begin{cases}\dfrac{1}{\theta}\mathrm{e}^{-x/\theta},&x>0,\\[2ex]0,&\text{其他,}\end{cases}$
其中 $\theta$ >0 为常数,则称 X 服从参数为 $\theta$ 的指数分布 .

$X \sim \mathscr E(\lambda)$
分布函数
$F(x) = \begin{cases} 1 - e^{-\frac x \theta} , x \ge 0\\ 0, x < 0 \end{cases}$
无记忆性，例如解释某元件的工作寿命，在已知元件已工作sh的条件下,再工作th以上的概率与已工作的事件s无关。
$P(X>s+t|X>s) = e^{-\lambda t} = P(X > t)$

正态分布

概率密度
$f(x)=\frac{1}{\sqrt{2\pi}\sigma}\mathrm{e}^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}},\quad-\infty<x<\infty$

$\sigma$ 读作 \sigma

其中 ${\mu,\sigma(\sigma>0)}$ 为常数,则称 X 服从参数为 $\mu,\sigma$ 的正态分布或高斯(Gauss)分布,记为 $X{\sim}N(\mu,\sigma^{2}).$
分布函数
$F\left(x\right)=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{x}e^{-\frac{\left(y-\mu\right)^{2}}{2\sigma^{2}}}\mathrm{d}y,-\infty<x<\infty$
性质

标准正态函数
给定不同的 $\mu, \sigma$ 只需N(0,1)的分布表就行
而标准正态函数的概率密度、分布函数分别记作 $\varphi(x),\Phi(x)$
$\begin{gathered} \varphi(x)=\frac{1}{\sqrt{2\pi}}\mathrm{e}^{\frac {-x^{2}} 2}, \\ \Phi(x)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x}\mathrm{e}^{\frac {-t^{2}} 2}\mathrm{d}t. \\ \Phi(-x) = 1 - \Phi(x) \end{gathered}$
转化？

$P(a<X\le b) = \Phi(\frac {b - \mu} \sigma) - \Phi(\frac {a - \mu} \sigma)$
若 $X \sim N(\mu,\sigma^2)$ ，则 $Y = \frac {X-\mu} \sigma \sim N(0,1)$
正态随机变量的线性函数仍为正态随机变量。

标准正态函数分布函数制表请见最后
例题

随机变量函数及其分布

离散性随机变量函数的分布，他的分布律可直接从X的分布律求得

连续型随机变量

积分转化法

reference

/**
 * @description: 制表 - 标准正态分布 0.00 ~ 3.99
 * @author: 杨夕璃
 * @data: 2023/10/12 18:00
 * @strategy: 自适应辛普森积分
 */
#include <bits/stdc++.h>
using namespace std;

const double eps = 1e-10;
const double pi = acos(-1);

double f(double x)
{
    return exp(-pow(x, 2) / 2) / sqrt(2 * pi);
}
double simpson(double l, double r)
{
    return (r - l) * (f(l) + f(r) + 4 * f((l + r) / 2)) / 6;
}
double solve(double l, double r, double ans)
{
    double m = (l + r) / 2, a = simpson(l, m), b = simpson(m, r);
    if (fabs(a + b - ans) < eps)
        return ans;
    return solve(l, m, a) + solve(m, r, b);
}
signed main()
{
    ios::sync_with_stdio(0), cin.tie(0);
    cout.setf(ios::fixed);
    double L = -7, R = 0;
    freopen("out_with_estimator", "w", stdout);
    cout << " x  ";
    cout << left << setprecision(2);
    for (double col = 0.0; col <= 0.09; col += 0.01) {
        cout << setw(6) << col << ' ';
    }
    cout << endl;

    for (double row = 0.0; fabs(row - 4.0) > eps; row += 0.1) {
        cout << setw(3) << setprecision(1);
        cout << row << " ";

        cout << setw(6) << setprecision(4);
        for (double col = row; fabs(col - row - 0.1) > eps; col += 0.01) {
            cout << solve(L, col, simpson(L, col)) << ' ';
        }
        cout << endl;
    }

    return 0;
}

绯境之外~Outside of Scarlet

2023年10月15日星期日