置信区间(Confidence Interval, CI)是一个估计值的区间,用于表示参数的可能范围和估计的可靠性。以样本均值为例,置信区间的计算公式如下:
\[ \text{CI} = \bar{x} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} \]
其中:
\(\bar{x}\) 是样本均值。
\(z_{\alpha/2}\) 是标准正态分布的临界值,与置信水平相关(如95%时 \(z_{\alpha/2} = 1.96\))。
\(\sigma\) 是总体标准差。
\(n\) 是样本容量。
对于总体标准差未知且样本容量较小(通常 \(n \leq 30\))的情况,可以使用t分布来计算置信区间:
\[ \text{CI} = \bar{x} \pm t_{\alpha/2, n-1} \cdot \frac{s}{\sqrt{n}} \]
其中:
\(t_{\alpha/2, n-1}\) 是t分布的临界值。
\(s\) 是样本标准差。
置信区间的计算公式也可以表示为概率形式:
\[ \text{CI} = \{c_1, c_2\} \]
其中:
\(Pr(c_1 \leq \mu \leq c_2) = 1 - \alpha \]
\(\alpha\) 是显著性水平(如0.05)。
这些公式可以帮助我们确定一个参数的可信区间,从而评估估计的可靠性和精确度。