CS70Disc12A
CS70 Disc 12A
1 Continuous Intro
连续概率分布基础
- 概率密度函数(PDF):描述随机变量在某个取值区间内的概率密度。有效的PDF必须满足:
- 非负性:$ f(x) $ 对所有 $ x $ 都成立。
- 归一性:整体积分为1,即 $ _{-}^{+} f(x) , dx = 1 $。
- 累积分布函数(CDF):描述随机变量小于等于某个值的概率。有效的CDF必须满足:
- 单调非减性:随着 $ x $ 的增加,CDF不减小。
- 边界条件:当 $ x $ 趋向于负无穷时,CDF趋向于0;当 $ x $ 趋向于正无穷时,CDF趋向于1。
问题分析
(a) 检查密度函数与CDF
给定的函数: $ f(x) =
\[\begin{cases} 2x, & 0 \leq x \leq 1 \\ 0, & \text{otherwise} \end{cases}\]$
密度函数的有效性:
- 非负性:在区间 $ [0, 1] $ 内,$ f(x) = 2x $,在其他地方 $ f(x) = 0 $。
- 归一性: $ {-}^{+} f(x) , dx = {0}^{1} 2x , dx = [x^2]_{0}^{1} = 1 $ 因此,这是一个有效的密度函数。
CDF的有效性: $ F(x) =
\[\begin{cases} 0, & x < 0 \\ x^2, & 0 \leq x < 1 \\ 1, & x \geq 1 \end{cases}\]$ CDF不满足边界条件(当 $ x +$ 时,应该趋向于1),因此它不是一个有效的CDF。
(b) 计算CDF,PDF,期望值与方差
给定CDF: $ F_X(x) =
\[\begin{cases} 0, & x \leq 0 \\ \frac{x}{\ell}, & 0 < x < \ell \\ 1, & x \geq \ell \end{cases}\]$
PDF的计算: $ f_X(x) = F_X(x) =
\[\begin{cases} 0, & x \leq 0 \\ \frac{1}{\ell}, & 0 < x < \ell \\ 0, & x \geq \ell \end{cases}\]$
**期望值 $ E[X] \(**:\) E[X] = {0}^{} x f_X(x) , dx = {0}^{} x , dx = _{0}^{} = $
**计算 $ E[X^2] \(**:\) E[X^2] = {0}^{} x^2 f_X(x) , dx = {0}^{} x^2 , dx = _{0}^{} = $
**方差 $ Var(X) \(**:\) Var(X) = E[X^2] - (E[X])^2 = - ()^2 = - = $ 这个分布被称为在区间 \([0, \ell]\) 上的连续均匀分布,记为 $ [0, ] $。
(c) 联合分布
给定独立随机变量的密度函数: $ f_X(x) =
\[\begin{cases} 2x, & 0 \leq x \leq 1 \\ 0, & \text{otherwise} \end{cases}\]$ $ f_Y(y) =
\[\begin{cases} 1, & 0 \leq y \leq 1 \\ 0, & \text{otherwise} \end{cases}\]$
联合密度函数: 由于 $ X $ 和 $ Y $ 是独立的,其联合分布为: $ f_{X,Y}(x, y) = f_X(x) f_Y(y) = (2x) (1) = 2x [0, 1] $
(d) 计算 $ E[XY] $
计算: $ E[XY] = {0}^{1} {0}^{1} xy f_{X,Y}(x,y) , dy , dx = {0}^{1} {0}^{1} xy 2x , dy , dx $ 计算内层积分: $ = {0}^{1} 2x^2 ( {0}^{1} y , dy ) dx = {0}^{1} 2x^2 dx = {0}^{1} x^2 , dx = _{0}^{1} = $
替代方法(利用独立性): $ E[XY] = E[X]E[Y] $
计算 $ E[X] \(:\) E[X] = {0}^{1} x 2x , dx = 2 {0}^{1} x^2 , dx = 2 = $
计算 $ E[Y] \(:\) E[Y] = {0}^{1} y , dy = {0}^{1} = $
最终: $ E[XY] = E[X]E[Y] = = $
2 Darts Again
爱德华和卡里尔在一个半径为10英寸的圆形飞镖板上进行投掷。
- 爱德华的投掷是均匀分布在整个飞镖板上。
- 卡里尔的投掷距离飞镖板中心的距离服从参数为 $ $ 的指数分布。
设 $ X $ 为爱德华的飞镖距离中心的距离,$ Y $ 为卡里尔的飞镖距离中心的距离。我们需要计算 $ P[X < Y] $,即爱德华的投掷比卡里尔的投掷离中心更近的概率。
1. 计算 $ X $ 的累积分布函数 (CDF)
为了计算 $ P[X < x] $,我们需要先求出 $ X $ 的CDF。可以通过计算面积的比率来得到:
$ P[X < x] = = = $
- 对于 $ x (0, 10) $:
- $ P[X < x] = $
- 对于 $ x < 0 $:
- $ P[X < x] = 0 $
- 对于 $ x > 10 $:
- $ P[X < x] = 1 $
2. 计算 $ X $ 的概率密度函数 (PDF)
对CDF进行求导得到 $ X $ 的PDF:
$ f_X(x) = P[X < x] = = , 0 < x < 10 $
其他地方的PDF为0。
3. 计算 $ P[X < Y] $
接下来,我们使用全概率公式来计算 $ P[X < Y] $:
$ P[X < Y] = _0^{10} P[Y > x | X = x] f_X(x) , dx $
已知 $ Y $ 服从参数为 $ $ 的指数分布,因此其CDF为:
$ P[Y x] = 1 - e^{-x} P[Y > x] = e^{-x} $
将其代入上述公式中:
$ P[X < Y] = _0^{10} e^{-x} , dx $
4. 计算积分
这个积分可以通过数值计算或特定的积分方法得到。最终结果为:
$ P[X < Y] $
5. 解释积分的结构
该积分表达了条件概率的全概率法则。在离散情况下,我们可以写作:
$ P[X < Y] = P[X = x] P[Y > x] $
而在连续情况下则采用积分形式。
6. 替代计算方法
另一种计算 $ X $ 的PDF的方法是注意到PDF对应于落在半径 $ x $ 的点的可能性。由于与半径相关,PDF应该是线性的,即:
$ f_X(x) = cx, 0 < x < 10 $
为了使PDF积分为1,需满足:
$ _0^{10} cx , dx = 1 50c = 1 c = $
7. 另一种积分设置
如果条件在 $ Y $ 上而不是 $ X $,则可将积分拆分成两部分:
$ P[X < Y] = 0^{10} P[X < Y | Y = y] f_Y(y) , dy + {10}^{} P[X < Y | Y = y] f_Y(y) , dy $
这导致了更复杂的表达式,但有助于深入理解条件概率的应用。
3 Lunch Meeting
爱丽丝和鲍勃约定在中午12点到1点之间的某个时间在他们最喜欢的寿司餐厅见面。由于他们非常忙碌,无法准确指定到达时间,因此他们只能说,每个人将在均匀分布的时间内到达。
为了避免浪费时间,他们约定如果另一方未到达,他们会等待15分钟后再离开。
1. (a) 联合分布的可视化
设随机变量 $ A $ 表示爱丽丝到达的时间,随机变量 $ B $ 表示鲍勃到达的时间。由于 $ A $ 和 $ B $ 都是均匀分布的,我们可以通过绘制联合概率分布的图形来帮助可视化。
1.1 绘制图形
- 坐标轴:横轴表示爱丽丝到达的时间 $ A $,范围从0到1(表示12:00 PM到1:00 PM),纵轴表示鲍勃到达的时间 $ B $,同样范围从0到1。
- 区域:整个单位正方形(边长为1)表示所有可能的到达时间组合 \((a, b)\)。
1.2 实际见面的区域
在这个正方形中,爱丽丝和鲍勃会见面的区域为:
- $ |A - B| $
- 具体来说,如果爱丽丝在时间 $ A $ 到达,那么鲍勃的到达时间 $ B $ 必须在 $ [A - , A + ] $ 范围内。
2. (b) 计算相遇的概率
由于正方形的每一点都是同样可能的,我们可以通过计算相遇区域的面积来确定他们见面的概率。
2.1 计算相遇区域的面积
- 总面积:
- 整个正方形的面积为 $ 1 $(边长为1)。
- 相遇区域的计算:
- 相遇区域的上下边界为 $ A + $ 和 $ A - $,因此可以确定两个白色三角形的面积。
- 白色三角形的面积:
- 在正方形的左上角和右下角形成的两个白色三角形的面积分别为: $ = = ( ) ( ) = $
- 相遇区域的面积:
- 相遇区域的面积为正方形的面积减去两个白色三角形的面积: $ = 1 - 2 = 1 - = $
2.2 计算相遇概率
- 因此,爱丽丝和鲍勃实际见面的概率为: $ P() = = $