研究中心

对正态分布应该如何理解和应用

正态分布是一个在工程、医学、数学、物理等很多领域都非常重要的概率分布。一般来说,如果一个量是许多微小的独立随机因素影响的结果,那么这个量就应服从或近似地服从正态分布。

关于正态分布的一些有用的概念

  • 正态分布的概率密度函数曲线呈钟形,因此又经常称之为钟形曲线。
  • 正态分布有两个重要的参数:期望值(均值)μ决定了其分布的位置;标准差σ和方差σ2用于衡量波动大小(对应于钟型开口的大小)
  • 若X服从正态分布,记为X~N(μ,σ);若μ=0且σ=1则为标准正态分布
正态分布normal distribution

质量管理中的正态分布

生产与科学实验中很多随机变量的分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的大多数属性和质量指标,如强力、抗压强度、口径、长度、光洁度、导电率等,都可以近似地用正态分布来描述;或者换句话说,如果生产条件没有出现变异,那么这些属性和质量指标的分布应该是正太分布或者是近似的正太分布。由此,我们就可以抽取一些样品(样本),基于样品的实际数据,用统计方法来推断所有产品(总体)的属性或质量指标是否服从正态分布。如果不是,则很可能是流程中出现了由特殊原因引起的变异;在进行很多质量分析之前,我们往往也需要对质量数据进行检验,看其是否服从正态分布。

对正态分布而言,离均值μ的距离为-3σ~3σ区域包含了全部数值的99.7%,因此常用6σ来代表较高的质量水平。

生活中的正态分布

实践和研究表明,在正常情况下,很多数据都应该服从正太分布,例如:

  • 同一种生物体的身长、体重等指标
  • 同一种种子的重量
  • 测量同一物体时产生的误差
  • 射击点沿某一方向的偏差
  • 某个地区的年降水量
  • 理想气体分子的速度分量
  • 很多医学现象,如同质群体的身高、红细胞数、血红蛋白量

其他常用分布

除正态分布外,常见的分布还有均匀分布、二项分布、几何分布、泊松分布、Weibull分布、指数分布等等。这里不做讨论。