一直不理解一些分布是干什么用的,怎么来的,看了马同学高数才有了一些了解,目前的感觉是,似乎常见的分布都来自于二项分布。此处加以记录。
从二项分布到泊松分布
- 已知:馒头老板统计了一周内每天卖的馒头数量
- 问题:一个馒头店每天需要准备多少馒头?
最简单的办法是求平均值,每天就准备这么多馒头就行了,但是问题是如果每天卖出馒头数量方差较大,很容易有好几天准备不足或准备过剩。 - 分析:将一天销售时间均分为$n$个阶段,似的每一阶段只卖出一个馒头,那么,每一阶段卖出与不卖出馒头就是一个伯努利分布,$n$个阶段就是二项分布。设每天卖出馒头为随机变量X,则一天销售时间卖出$k$个馒头的概率为:很显然,时间是连续的,不能这样分,但是当$n \to+\infty$的时候,可以认为是连续的。
上诉二项分布$p$怎么求呢?由$np=\mu$得$p=\frac{\mu}{p}$,$\mu$可由一周内均值近似,则有:其中$\frac{n}{n} \frac{n-1}{n}…\frac{n-k+1}{n}$和$(1-\frac{\mu}{n})^{-k}$在$n \to +\infty$下都是1,对于最后一个因式:故而原式可化为$P(X=k)=\frac{\mu^k}{k!}e^{-\mu}$,即泊松分布的公式。
因此,可以认为,泊松分布是描述某段时间内,卖出多少馒头的分布,其中$\mu$代表这段时间内卖出馒头的期望。从泊松分布到指数分布
上诉泊松分布只告诉了我们确定时间段内的分布,改造该公式如下:称之为波松过程,可以看出,当$t=1$时就是普通的泊松分布,当$t=n$的时候表示时间间隔为$n$内卖出馒头的分布。
对于馒头店老板而言,不仅仅需要知道每天要准备多少馒头,还需要知道卖出馒头的时间间隔,好以此适时调整服务员人数。
设随机变量X表示两次卖出馒头之间的间隔,则有:$P(X=k,t)$表示时间段t内卖出k个馒头的概率,P(Y>t)表示两次卖出馒头时间间隔大于t的概率,则就是时间t内卖出0个馒头的概率。
则:即指数分布