概率分布
概率分布(Probability Distribution)
什么是概率分布
概率分布是指随机变量X小于任何已知实数x的事件可以表示成的函数。用以表述随机变量取值的概率规律。描述不同类型的随机变量有不同的概率分布形式。是概率论的基本概念之一。
概率分布的概述
离散型随机变量的分布列只取有限个或可列个实数值的随机变量称为离散型随机变量。例如,100件产品中有10件次品,从中随意抽取5件,则其中的次品数X就是一个只取0,1,2,3,4,5的离散型随机变量。描述离散型随机变量的概率分布使用分布列,即给出离散型随机变量的全部取值,及取每个值的概率。例如上面例子中次品数X的分布列为:其中,表示从n个不同事物中取m个的组合数:
概率分布第一行写出随机变量X的取值,第二行列出取相应值的概率。这就是X的分布列。常见的离散型随机变量的分布有单点分布、两点分布、正态分布、二项分布、几何分布、负二项分布、超几何分布、泊松分布等。
概率分布的概念
概率分布(probabilitydistribution)或简称分布(distribution),是概率论的一个概念。使用时可以有以下两种含义:
广义地,概率分布是指称随机变量的概率性质:当我们说概率空间
中的两个随机变量X和Y具有同样的分布(或同分布)时,我们是无法用概率
来区别他们的。换言之:称X和Y为同分布的随机变量,当且仅当对任意事件
,有
成立。
但是,不能认为同分布的随机变量是相同的随机变量。事实上即使X与Y同分布,也可以没有任何点ω使得X(ω)=Y(ω)。在这个意义下,可以把随机变量分类,每一类称作一个分布,其中的所有随机变量都同分布。用更简要的语言来说,同分布是一种等价关係,每一个等价类就是一个分布。需注意的是,通常谈到的离散分布、均匀分布、伯努利分布、正态分布、泊松分布等,都是指各种类型的分布,而不能视作一个分布。
狭义地,它是指随机变量的概率分布函数。设X是样本空间
上的随机变量,
为概率测度,则称如下定义的函数是X的分布函数(distribution function),或称累积分布函数(cumulative distribution function,简称CDF):
,对任意实数a定义。
具有相同分布函数的随机变量一定是同分布的,因此可以用分布函数来描述一个分布,但更常用的描述手段是概率密度函数(probability density function,pdf)。
分布函数的性质刻划
对于特定的随机变量X,其分布函数FX是单调不减及右连续,而且
,
。这些性质反过来也描述了所有可能成为分布函数的函数数:
设
且单调不减、右连续,则存在概率空间
及其上的随机变量X,使得F是X的分布函数,即FX = F
随机变量的分布
设P为概率测度,X为随机变量则函数
(
)
称为X的概率分布函数.如果将X看成是数轴上的随机点的坐标,那么,分布函数F(x)在x处的函数值就表示X落在区间(-∞,x]上的概率。
例如,设随机变量X为掷两次骰子所得的点数差,而整个样本空间由36个元素组成,
其分布函数是:
离散分布
上面所列举的例子都属于离散分布,即分布函数的值域是离散的,比如只取整数值的随机变量就是属于离散分布的。F(x)表示随机变量
的概率值。如果X的取值只有x1 < x2 < ... < xn,则:
二项分布
二项分布是最重要的离散概率分布之一,由瑞士数学家雅各布·伯努利(Jokab Bernoulli)所发展,一般用二项分布来计算概率的前提是,每次抽出样品后再放回去,并且只能有两种试验结果,比如黑球或红球,正品或次品等。二项分布指出,随机一次试验出现的概率如果为p,那么在n次试验中出现k次的概率为:
例如,在掷3次骰子中,不出现6点的概率是:
在连续两次的轮盘游戏中,至少出现一次红色的概率为:
二项分布在p = 0.5时表现出图像的对称性,而在p取其它值时是非对称的。另外二项分布的期望值
,以及方差
正态分布和二项分布
在离散分布中如果试验次数n值非常大,而且单次试验的概率p值又不是很小的情况下,正态分布可以用来近似的代替二项分布。一个粗略的使用正态分布的近似规则是:
。
从二项分布中获得μ和σ值的方法是
期望值
标准差
如果σ > 3,则必须采用下面的近似修正方法:




请先 登录后发表评论 ~