2023年10月15日星期日

whu特供概率论前3章复习

whu特供概率论前3章复习

概率论前两章复习

brief

本博文收集《概率论与数理统计 第五版 习题全解指南(浙大 第5版) (盛骤、谢式千、潘承毅)》前两章随机事件与概率随机变量及其概率分布的基础概念,典型例题及求解。

例题索引

课时1

P25: 2, 3, 4,
P 26: 8, 12

课时2

P 26: 14,
P27: 22, 23,26, 28, 29
P28:34
P29:36,37

课时3

P56: 2, 4, 6, 9
P57: 12, 15,16, 18

课时4

P58: 20,23,
P59: 24, 25,29, 30,
P60: 34,36

1.随机事件与概率

常见符号

E随机试验Ω样本空间F子集组成的集合ω样本点 \mathscr E 随机试验\\ \Omega 样本空间\\ \mathscr F 子集组成的集合\\ \omega 样本点

1.1随机事件

随机事件简称事件

基本运算和运算规律
事件的并——>和事件
事件的交——>积事件
事件的差 ABwAwBA发生但B不发生A - B \Leftrightarrow w \in A 但 w \notin B \Leftrightarrow A发生但B不发生
不相容 AB=AB = \varnothing
交换律,结合律(相同符号),分配律(不同符号,理解成互相做加号和乘号)
德摩根律
不相容分解 AB=AAˉB,A=ABABˉA \cup B = A \cup \bar A B, A = AB \cup A \bar B

例题

3.png
4.png

注意这种换算方法就行
5.png

事件域和事件的关系
22.jpg
有限样本空间和可列无穷样本空间的每个子集均为事件。

1.2 频率和概率

频率

非负性,规范性,可列可加性
1.png

2.png

概率

定义 设 E是随机试验,S 是它的样本空间对于 E的每一事件 A 赋予一个实数,记为 P(A),称为事件 A 的概率如果集合函数 P(·)满足下列条件
6.png

另外有不可能事件的概率为0
有限可加
7.png

可减性
8.png

逆事件的概率 P(Aˉ)=1P(A)P(\bar A) = 1 - P(A)

加法公式
9.png

1.3古典概型

古典概型

  1. 试验中只有有限个可能的结果
  2. 试验的每个基本事件发生的可能性相同

P(A)=A中元素个数Ω中元素的个数=A中元素个数n P(A) = \frac {A中元素个数} {\Omega中元素的个数} = \frac {A中元素个数} n
有限等可能概型(Ω,F,P)(\Omega,\mathscr F, P)

如随机试验,将一枚硬币指头三次,恰好几次正面的情况

注意这里A中元素个数的定义
10.png

11.png

几何概型

两个特征

  1. 试验所有可能的结果形成Rn的一个有界区域Ω\bold R^n的一个有界区域\Omega
  2. 对子集A \subset $\Omega $,试验的结果落入A的概率与A的测读S(A)而和A的位置和形状无关
    P(A)=S(A)S(Ω) P(A) =\frac {S(A)} {S(\Omega)}

1.4 条件概率

如文两个小孩一男一女的概率,现在已知至少有一位女孩
P(AB)P(A|B)已知事件B发生条件下,事件A发生的概率
P(AB)=P(AB)P(B) P(A|B) = \frac {P(AB)} {P(B)}
12.png

additionally
P(BB)=1,P(BˉB)=0P(A)=P(AΩ) P(B|B) = 1, P(\bar B | B) = 0 \\ P(A) = P(A|\Omega)

13.png

乘法公式

P(AB)=P(B)P(AB)P(ABC)=P(CAB)P(BA)P(A)P(A1A2...An)=P(A1)P(A2A1)P(A3A1A2)P(AnA1An1) P(AB) = P(B)P(A|B)\\ P(ABC) = P(C|AB)P(B|A)P(A)\\ P(A_1A_2...A_n) = P(A_1)P(A_2|A_1)P(A_3|A_1A_2)\cdots P(A_n|A_1\cdots A_{n-1})

全概率公式

完备事件组
15.png

B1,B2BnB_1,B_2\cdots B_n为完备事件组

(Ω,F,P)(\Omega,\mathscr F, P)为概率空间,B1,B2BnB_1,B_2\cdots B_n为完整事件组,则对任何事件AFA\in\mathscr F,
P(A)=t=1nP(Bi)P(ABi)B1Bn为完备事件组P(A)=t=1P(Bi)P(ABi) P(A) = \sum_{t=1}^{n}P(B_i)P(A|B_i)\\ 若B_1\dots B_n \dots为完备事件组\\ P(A) = \sum_{t=1}^{\infty}P(B_i)P(A|B_i)\\
理解:已知各个事件产生结果事件的概率,求结果事件发生的总概率
更常用的有
P(A)=P(B)P(AB)+P(Bˉ)P(ABˉ) P(A)=P(B)P(A|B)+P(\bar B)P(A|\bar B)

贝叶斯公式

P(BiA)=P(Bi)P(ABi)j=1nP(Bj)P(ABj),i=1,,n同时若B1...Bn...为完备事件组,P(A)>0P(BiA)=P(Bi)P(ABi)j=1P(Bj)P(ABj),i=1,,n, P(B_i|A) = \frac {P(B_i)P(A|B_i)} {\sum_{j=1}^{n}P(B_j)P(A|B_j)} ,i=1,\cdots,n\\ 同时若B_1 ... B_n ...为完备事件组,P(A) >0 则\\ P(B_i|A) = \frac {P(B_i)P(A|B_i)} {\sum_{j=1}^{\infty}P(B_j)P(A|B_j)} ,i=1,\cdots,n, \cdots
理解:已知结果事件发生了,问一种可能导致其发生的事件的概率。

P(Bi)P(B_i)是在试验前就知道的(如BiB_i病的发病率)称为先验概率。
P(BiA)P(B_i|A)为观察到事件A发生的条件下BiB_i的概率,称为后验概率

常用,BBˉ=ΩB\cup \bar B = \Omega情况下
P(BA)=P(B)P(AB)P(B)P(AB)+P(Bˉ)P(ABˉ) P(B|A)=\frac {P(B)P(A|B)} {P(B)P(A|B) + P(\bar B)P(A|\bar B)}
14.png

后验概率的大小很受先验概率选取的影响。
17.jpg
18.jpg

1.5 事件的独立性

两个事件的独立性

A 和 B 相互独立
简单定义
P(AB)=P(A)P(BA)=P(B)P(A),P(B)>0 P(A|B) = P(A) 且P(B|A) = P(B) \\ P(A),P(B) > 0

P(AB)=P(A)P(B) P(AB) = P(A)P(B)

A与B相互独立

零事件与任何事件都独立
互不相容:事件纵向互不发生

相互独立事件,一定相容
互不相容事件,一定不独立
相容事件,不一定独立
https://zhuanlan.zhihu.com/p/36607363

三个事件独立
{P(AB)=P(A)P(B)P(BC)=P(B)P(C)P(AC)=P(A)P(C)P(ABC)=P(A)P(B)P(C) \begin{cases} P(AB) = P(A)P(B)\\ P(BC) = P(B)P(C)\\ P(AC) = P(A)P(C) \end{cases}\\ P(ABC) = P(A)P(B)P(C)
由此推出n个事件独立性的定义

推论
19.png

若把n个相互的卢的事件分为互不重叠的k组(kn\le n),则每组中的事件进行事件运算后所得的k个事件相互独立。

例如
A1,...,An相互独立A1ˉ,...Aˉn相互独立,A1A2,A3A4,Aˉ5,A7,...,An相互独立 若A_1,...,A_n相互独立\\ \bar {A_1},...\bar A_n相互独立, A_1 \cup A_2, A_3 - A_4,\bar A_5,A_7,...,A_n相互独立

再由德摩根律
P(i=1nAi)=1P(i=1nAˉi)=1i=1nP(Aˉi)=i=1n(1P(Ai)) P(\cup_{i=1}^n A_i) = 1 - P(\cap_{i=1}^n \bar A_i) = 1- \prod_{i=1}^n P(\bar A_i) = \prod_{i=1}^n (1-P(A_i))
20.png

伯努利概型(试验)

pic21
示例,每个同学去图书馆只有两种结果:结借书和不借书,借书的概率为p,每个同学是否借书相互独立,那么观察n个同学到图书馆的借书情况就构成一个n重伯努利的试验。

w=(w1,w2,,wn)w=(w_1,w_2,\cdots,w_n)为N重伯努利试验的一个样本点,如果其中有k个A,n-k个Aˉ\bar A,则有试验独立性知
P((w1,w2,wn))=pkqnk P((w_1,w_2\cdot ,w_n)) = p^k q^{n-k}
BKB_K = “在n重伯努利试验中事件A恰好发生k次”(31)\binom {3}{1}
所有属于BkB_k的基本事件的概率均为pkqnkp^kq^{n-k},又因为 BkB_k共有(nk)\tbinom nk个样本点,由概率的有限可加性,
P(Bk)=(nk)pkqnk P(B_k) = \dbinom n k p^k q ^{n-k}

二项分布,直接由二项式定理得
k=0n(nk)pkqnk=(p+q)n=p+(1q)n=1 \sum_{k=0} n \dbinom n k p^kq^{n-k} = (p+q)^n = |p+(1-q)|^n = 1

2.随机变量及其概率分布

很多随机试验的结果都与数值发生自然的联系,

名词定义一览

一般地,设A为随机事件,则一定可以通过下述方法使他与数值发生联系
IA(w)={1,wA0,wA I_A(w) = \begin{cases} 1,w\in A\\ 0,w\notin A \end{cases}
IAI_A为A的示性函数

随机变量random variable

(Ω,F,P)(\Omega,\mathscr F, P)是一个概率基本功华北,X是定义在Ω\Omega上的实质函数,如果对任意实数xx{Xx}\{X \le x\}是随机事件,即{w:X(w)x}F\{w:X(w) \le x\} \in \mathscr F,则称X为随机变量。
设X为随机变量,由事件域的性质,有一下极限表达
23.jpg

分布律

有些随机变量,它全部可能取到的值是有限个或可列无限多个,这种随机变量称为离散型随机变量,例如S1例1中的随机变量 X,它只可能取 0,1,2,3四个值,它是一个离散型随机变量。又如某城市的 120 急救电话台一昼夜收到的呼唤次数也是离散型随机变量。若以 T 记某元的寿命,它所可能取的值充满一个区间,是无法按一定次序一一列举出来的,因而它是一个非离散型的随机变量.本节只讨论离散型随机变量
设离散型随机变量 X 所有可能取的值为 xk(k=1,2,),X 取各个可能值的概率,即事件<Xxk>的概率,为P<X=xk>=pk,k=1,2,.(2.1) \begin{aligned}\text{设离散型随机变量 }&\text{X 所有可能取的值为 }x_k\left(k=1,2,\cdots\right),X\text{ 取各个可能值}\\\text{的概率,即事件}\left<X-x_k\right>&\text{的概率,为}\\P\left<X=x_k\right>&=p_k,k=1,2,\cdots.&\text{(2.1)}\end{aligned}
称该式为离散性随机变量X的分布律,分布律也可用表格表示

X x1x_1 x2x_2
pkp_k p1p_1 p2p_2

分布函数(简称分布)

设X是(Ω,F,P)(\Omega,\mathscr F, P)上的随机变量,称实变实值函数
F(x)=P(Xx),<x< F(x) = P(X\le x),-\infty < x < \infty
X的分布函数,如果X的分布函数为F(x),则称X服从分布F(x),记为X~F(x)

对于任意实数x1,x2(x1<x2),x_1,x_2(x_1{<}x_2),
P{x1<Xx2}=P{Xx2}PXx1=F(x2)F(x1),(3.1)P\{x_1<X\leqslant x_2\}=P\{X\leqslant x_2\}-P\langle X\leqslant x_1\rangle=F(x_2)-F(x_1),\quad(3.1) 因此,若已知 X 的分布函数,我们就知道 X 落在任一区间(x1,x2x_1,x_2]上的概率,从
这个意义上说,分布函数完整地描述了随机变量的统计规律性.
推论
对任意x,有$0\le F(x)\le 1 $,此外对任意实数a<b

P(a<Xb)=P(Xb)P(Xa)=F(b)F(a) P(a<X\le b) = P(X\le b) - P(X\le a) = F(b) - F(a)
类似可证 Ω={X<}\Omega = \{X < \infty\}
P(X>x)=P(X<)P(Xx)=1F(x) P(X>x) = P(X < \infty ) - P(X\le x) = 1 - F(x)
基本性质
设随机变量X的分布函数为F(x),则

  1. F(x)是x的单调增函数
  2. F(x)是x的右连续函数 F(x+0) = F(x)
  3. 渐进性 $F(\infty) := lim_{x\to \infty} F(x) = 1, $$F(-\infty) := lim_{x\to -\infty} F(x) = 0, $

即使随机变量X和Y的分布函数相同,称X与Y同分布,不能认为X=Y

跳跃值


F(x)={0,x<1,14,1x<2,34,2x<3,1,x3. F(x)=\begin{cases}0,&x<-1,\\\dfrac{1}{4},&-1\leqslant x<2,\\\dfrac{3}{4},&2\leqslant x<3,\\[2ex]1,&x\geqslant3.\end{cases}
跳跃值分别为1/4,1/2,1/4

离散性随机变量

0-1分布

退化分布(单点分布),X是Ω\Omega上恒为常值的随机变量,即存在常数a使得对任何wΩw \in \Omega,有X(w)=aX(w) = a,则X的分布函数为
F(x)={0,x<a1,xa F(x)=\begin{cases} 0,x<a\\ 1,x\ge a \end{cases}
分布律
P{X=k}=pk(1p)1k,k=0,1(0<p<1)P\left\{X{=}k\right\}=p^{k}\left(1-p\right)^{1-k},\quad k{=}0,1\quad(0{<}p{<}1)

两点分布(伯努利分布)

24.jpg

二项分布

P{X=k}=(nk)pkqnk,k=0,1,2,,n.P\{X=k\}=\binom{n}{k}p^kq^{n-k},\quad k=0,1,2,\cdots,n.
并记为 X~b(n,p)
当n=1时,二项分布即为伯努利分布,
注意
(nk)=(nnk)b(k;n,p)=b(nk;n,1p) \binom n k = \binom n {n-k} \\ b(k;n,p) = b(n-k;n,1-p)
25.png
26.png

泊松分布

设随机变量 X 所有可能取的值为 0,1,2,,而取各个值的概率为PX=k=λkk!eλ,k=0,1,2,,其中 λ>0 是常数. 则称 X 服从参数为λ 的泊松分布,记为Xπ(λ). \begin{gathered}\text{设随机变量 }X\text{ 所有可能取的值为 }_0,1,2,\cdotp\cdotp\cdotp,\text{而取各个值的概率为}\\P\langle X=k\rangle=\frac{\lambda^k}{k!}{\mathrm{e}^{-\lambda}} ,{_k}=0,1,2,\cdotp\cdotp\cdotp,\\\text{其中 }\lambda>0\text{ 是常数. 则称 }X\text{ 服从参数为}\lambda\text{ 的泊松分布},\text{记为}X\sim\pi(\lambda).\end{gathered}
这段可以省掉
limn(nk)pnk(1pn)nk=λkk!eλ lim_{n\to\infty} \binom n k p^k_n(1-p_n)^{n-k} = \frac{\lambda^k}{k!}{\mathrm{e}^{-\lambda}}
27.png

当p很小 <= 0.05 n较大 >= 20
使用近似公式。
(nk)pk(1p)nkλkeλk!(其中λ=np). \binom{n}{k}p^{k}(1-p)^{n-k}\approx\frac{\lambda^{k}\mathrm{e}^{-\lambda}}{k!}\quad(\text{其中}\lambda=np).
也就是说以 n,p为参数的二项分布的概率值可以由参数为λ=\lambda=np 的泊松分布的概率值近似.上式也能用来作二项分布概率的近似计算.

28.png

一道纯离散性
30.png

连续性随机变量

概率密度

一般,如上节例 2 中的随机变量那样,如果对于随机变量 X 的分布函数F(x),F(x),存在非负可积函数 f(x)f(x) ,使对于任意实数 xx
F(x)=xf(t)dt,F(x)=\int_{-\infty}^{x}f(t)\mathrm{d}t,
则称 X 为连续型随机变量,f(x)f(x)称为 X 的概率密度函数,简称概率密度.
29.png

均匀分布

若连续型随机变量 X 具有概率密度

f(x)={1ba,a<x<b,0,其他, f(x)=\begin{cases}\dfrac{1}{b-a},&a<x<b,\\\\0,&\text{其他,}\end{cases}

则称 X 在区间(a,ba,b)上服从均匀分布,记为XU(a,b).X{\sim}U(a,b).

易知f(x)0,f(x)dx=1. 易知f(x)\geqslant0,{\text{且}}{\int}_{-\infty}^{\infty}f(x)\:{\mathrm{d}}x=1.

分布函数
F(x)={0,xaxaba,a<x<b1,xb F(x) = \begin{cases} 0, x \le a\\ \frac {x-a} {b-a},a < x <b\\ 1,x\ge b \end{cases}

31.png

指数分布

若连续型随机变量XX概率密度

f(x)={1θex/θ,x>0,0,其他, f(x)=\begin{cases}\dfrac{1}{\theta}\mathrm{e}^{-x/\theta},&x>0,\\[2ex]0,&\text{其他,}\end{cases}
其中 θ\theta>0 为常数,则称 X 服从参数为θ\theta 的指数分布 .

XE(λ)X \sim \mathscr E(\lambda)
分布函数
F(x)={1exθ,x00,x<0 F(x) = \begin{cases} 1 - e^{-\frac x \theta} , x \ge 0\\ 0, x < 0 \end{cases}
无记忆性,例如解释某元件的工作寿命,在已知元件已工作sh的条件下,再工作th以上的概率与已工作的事件s无关。
P(X>s+tX>s)=eλt=P(X>t) P(X>s+t|X>s) = e^{-\lambda t} = P(X > t)

正态分布

概率密度
f(x)=12πσe(xμ)22σ2,<x< f(x)=\frac{1}{\sqrt{2\pi}\sigma}\mathrm{e}^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}},\quad-\infty<x<\infty

σ\sigma读作 \sigma

其中μ,σ(σ>0){\mu,\sigma(\sigma>0)}为常数,则称 X 服从参数为μ,σ\mu,\sigma 的正态分布或高斯(Gauss)分布,记为XN(μ,σ2).X{\sim}N(\mu,\sigma^{2}).
分布函数
F(x)=12πσxe(yμ)22σ2dy,<x< F\left(x\right)=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{x}e^{-\frac{\left(y-\mu\right)^{2}}{2\sigma^{2}}}\mathrm{d}y,-\infty<x<\infty
性质
32.png

标准正态函数
给定不同的μ,σ\mu, \sigma只需N(0,1)的分布表就行
而标准正态函数的概率密度、分布函数分别记作φ(x),Φ(x)\varphi(x),\Phi(x)
φ(x)=12πex22,Φ(x)=12πxet22dt.Φ(x)=1Φ(x) \begin{gathered} \varphi(x)=\frac{1}{\sqrt{2\pi}}\mathrm{e}^{\frac {-x^{2}} 2}, \\ \Phi(x)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x}\mathrm{e}^{\frac {-t^{2}} 2}\mathrm{d}t. \\ \Phi(-x) = 1 - \Phi(x) \end{gathered}
转化?

P(a<Xb)=Φ(bμσ)Φ(aμσ) P(a<X\le b) = \Phi(\frac {b - \mu} \sigma) - \Phi(\frac {a - \mu} \sigma)
XN(μ,σ2)X \sim N(\mu,\sigma^2),则Y=XμσN(0,1)Y = \frac {X-\mu} \sigma \sim N(0,1)
正态随机变量的线性函数仍为正态随机变量。

标准正态函数分布函数制表请见最后
例题
33.png
34.png

随机变量函数及其分布

离散性随机变量函数的分布,他的分布律可直接从X的分布律求得

35.png

连续型随机变量
36.jpg

38.png
39.png

积分转化法

37.jpg
40.png

41.png

42.png
43.png

reference

/**
 * @description: 制表 - 标准正态分布 0.00 ~ 3.99
 * @author: 杨夕璃
 * @data: 2023/10/12 18:00
 * @strategy: 自适应辛普森积分
 */
#include <bits/stdc++.h>
using namespace std;

const double eps = 1e-10;
const double pi = acos(-1);

double f(double x)
{
    return exp(-pow(x, 2) / 2) / sqrt(2 * pi);
}
double simpson(double l, double r)
{
    return (r - l) * (f(l) + f(r) + 4 * f((l + r) / 2)) / 6;
}
double solve(double l, double r, double ans)
{
    double m = (l + r) / 2, a = simpson(l, m), b = simpson(m, r);
    if (fabs(a + b - ans) < eps)
        return ans;
    return solve(l, m, a) + solve(m, r, b);
}
signed main()
{
    ios::sync_with_stdio(0), cin.tie(0);
    cout.setf(ios::fixed);
    double L = -7, R = 0;
    freopen("out_with_estimator", "w", stdout);
    cout << " x  ";
    cout << left << setprecision(2);
    for (double col = 0.0; col <= 0.09; col += 0.01) {
        cout << setw(6) << col << ' ';
    }
    cout << endl;

    for (double row = 0.0; fabs(row - 4.0) > eps; row += 0.1) {
        cout << setw(3) << setprecision(1);
        cout << row << " ";

        cout << setw(6) << setprecision(4);
        for (double col = row; fabs(col - row - 0.1) > eps; col += 0.01) {
            cout << solve(L, col, simpson(L, col)) << ' ';
        }
        cout << endl;
    }

    return 0;
}

2 条评论: