正态分布,也称“常态分布”或“高斯分布”,是一种在自然界和人类社会中广泛应用的连续概率分布。正态分布由两个主要参数决定: 期望(μ)和方差(σ²)。
期望(μ)
期望是数据集中趋势的度量,表示数据点的平均值。
对于离散随机变量,期望的计算公式为:
$$
\mu = E(\xi) = \sum_{i=1}^{n} x_i p_i
$$
其中,$x_i$ 是随机变量 $X$ 的取值,$p_i$ 是 $x_i$ 出现的概率。
方差(σ²)
方差是数据离散程度的度量,表示数据点与其期望值之间的平均偏离程度。
对于离散随机变量,方差的计算公式为:
$$
\sigma^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2
$$
其中,$n$ 是数据点的数量,$x_i$ 是随机变量 $X$ 的取值,$\mu$ 是期望值。
对于连续随机变量,正态分布的概率密度函数(PDF)为:
$$
f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}
$$
其中,$\mu$ 是期望值,$\sigma^2$ 是方差。
正态分布的性质包括:
期望值 $\mu$ 决定了分布的中心位置。
标准差 $\sigma$ 决定了分布的宽度或幅度。
正态分布曲线呈钟形,对称于其期望值 $\mu$。
样本均值 $\bar{X}$ 和样本方差 $S^2$ 分别是总体均值 $\mu$ 和总体方差 $\sigma^2$ 的无偏估计。
在实际应用中,正态分布的期望和方差常用于数据分析、金融风险评估、质量控制等领域,帮助人们理解和预测数据的分布情况。