置信区间的计算公式取决于所用到的统计量以及所给定的置信水平。以下是几种常见的置信区间计算公式:
z分布下的置信区间
当总体标准差已知,且样本容量较大(通常n>30)时,可以使用z分布来计算置信区间。其公式为:
$$
CI = \left\{ \bar{x} - z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}, \bar{x} + z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} \right\}
$$
其中,CI代表置信区间,$\bar{x}$ 是样本均值,$z_{\alpha/2}$ 是z分布的临界值,$\sigma$ 是总体标准差,n是样本容量。
t分布下的置信区间
当总体标准差未知,且样本容量较小时(通常n<=30),我们使用t分布来计算置信区间。其公式为:
$$
CI = \left\{ \bar{x} - t_{\alpha/2, n-1} \cdot \frac{s}{\sqrt{n}}, \bar{x} + t_{\alpha/2, n-1} \cdot \frac{s}{\sqrt{n}} \right\}
$$
其中,$t_{\alpha/2, n-1}$ 是t分布的临界值,s是样本标准差。
正态分布下的置信区间(总体标准差未知,样本容量较小)
当总体标准差未知,且样本容量较小时,可以使用正态分布近似计算置信区间。其公式为:
$$
CI = \bar{x} \pm t_{\alpha/2, n-1} \cdot \frac{s}{\sqrt{n}}
$$
其中,$\bar{x}$ 是样本均值,$t_{\alpha/2, n-1}$ 是t分布的临界值,s是样本标准差,n是样本容量。
比例置信区间
对于比例或概率的置信区间,其公式为:
$$
CI = \hat{p} \pm z_{\alpha/2} \cdot \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}
$$
其中,$\hat{p}$ 是样本比例,$z_{\alpha/2}$ 是z分布的临界值,n是样本容量。
建议
选择合适的分布:根据样本容量和总体标准差是否已知来选择z分布或t分布。
确定置信水平:常见的置信水平为95%,对应的显著性水平α为0.05。
计算临界值:根据所选分布和置信水平查找相应的临界值(如z_{\alpha/2}或t_{\alpha/2, n-1})。
代入公式计算:将样本均值、标准差、样本容量等参数代入相应的公式计算置信区间。
通过以上步骤和公式,可以有效地计算出总体参数的置信区间。