几种常见的连续型随机变量的分布

上周,一位客户问我连续随机变量的分布之间有什么区别。
我跟他解释了一下,觉得还是需要用例子来说话。

我们来谈谈均匀分布。
去年我在杭州举办了一次抽奖。
奖品是随机抽取的,从1 到1 00个,每个数字被选中的概率是相同的。
这只是均匀分布的完美表示,a=1 ,b=1 00,f(x)=1 /9 9 ,其他均为 0。
您所绘制的是一条横跨 9 9 个长度单位的平坦线段,每个长度单位的概率密度为 1 /9 9 这种分配特别简单,是“机会均等”的直观体现。

但是指数分布很有趣。
去年,我的同事进行了医疗数据分析并研究了患者的等待时间。
他发现,病人到达越晚,等待时间就越长,并且呈现指数增长趋势。
他测得λ=0.05 ,这意味着平均每2 0分钟就有一个人到达,但第2 1 个人可能需要半个小时,第4 0个人可能只需要5 分钟。
反正就是像指数分布一样存在着“暴击”和“慢热”的交替现象。
最神奇的是它的无记忆性,就像你在玩游戏的时候,你的角色已经达到了1 00级,突然有一件装备爆炸了,它再次开始打怪的速度就和你刚开服时爆炸装备的效果一样。
这个函数在医学上表明,如果一个病人活了很长时间,他再活5 年的概率等于一个新人再活5 年的概率。

最后我们来谈谈正态分布。
这东西简直就是统计世界里的“万能钥匙”。
上个月,我帮公司分析了销售数据,发现产品尺寸分布、客户年龄分布、甚至员工薪资分布都是钟形的。
这类分布由于其中心对称性而显得特别“友好”,因此正态分布有很多统计方法,包括t检验和方差分析。
而且它还有一个独特的技能。
标准化后可以变成N(0,1 )。
就像所有学生参加完考试后,他们的成绩都会被标准化为满分1 00分,这样,谁强谁弱就一目了然了。

但是说到陷阱,我认为指数分布是最令人困惑的。
有一次在计算设备故障率时,我把均匀分布和指数分布搞混了。
结果我把λ计算为1 /平均寿命,导致整个模型的预测结果偏差了1 00倍。
这是一个惨痛的教训。
因此,在使用分布之前,首先要想清楚真实场景遇到什么特征。
不要像我一开始那样看到“平均”就盲目使用指数分布。
无论如何,分配方式的选择必须根据具体情况而定,不能想当然。

如何证明随机变量的分布函数右连续

分布函数按概率连续性是右连续的。

构造单调递减序列:取$x_n \downairo x$,事件$X \leq x_n$也是单调递减的。

等效事件限制:$\h3cap_{n=1 }^\infty X \leq x_n = X \leq x$。

概率连续性应用:$\lim_{n \to \infty} F(x_n) = F(x)$。

正确的极限定义:$F(x+0) = \lim_{x_n \downero x} F(x_n)$。

完美连续结论:$F(x+0) = F(x)$,处处完美连续。

定义方法的效果:$F(x)=P(X \leq x)$表示右连续,$F(x)=P(X < x>
自己掂量一下。

怎样理解连续型随机变量的分布函数“右连续性”?

连续分布函数是连续函数。

F(x) 是素函数,表示 P(X=x)。

重点是属性x,F(X<=x)考虑X<=x的所有值。

始终站在x的右侧并对x进行更改。

理解适当的连续性有助于理解 PDF 和 CDF 之间的关系。

PDF表示x附近的概率密度,CDF是累积概率。

精确连续性证明PDF的积分是连续单调递增函数。

为了计算一段时间内的概率,必须满足正确的连续性。
在实际应用中,PDF的积分必须完全连续。

称一下体重。