科学合理地选取样本量是确保统计结果可靠性和有效性的关键步骤。以下是综合多个权威来源的指导原则与方法:
一、样本量确定的核心要素
研究目的与目标 明确研究是探索性、描述性还是验证性研究,不同类型研究对样本量的要求差异较大。例如,探索性研究样本量较小,验证性研究需更大样本提升可靠性。
置信水平
常见为90%、95%、99%,置信水平越高,所需样本量越大。例如,95%置信水平比90%需多约43%的样本量。
允许误差
允许误差越小,样本量越大。通常以总体均值的±5%作为常见标准。
总体变异
总体标准差或变异系数越大,样本量需增加以捕捉差异。例如,收入分布差异大的群体需比收入均衡群体多4倍样本量。
抽样方法
- 简单随机抽样: 适用于样本量较小且总体特征已知的情况。 - 分层抽样
- 系统抽样:按固定间隔抽取样本,适用于均匀分布的总体。
二、样本量计算方法
公式法 根据效应大小、显著性水平(如α=0.05)计算,常用公式为:
$$n = \frac{Z^2 \cdot \sigma^2}{E^2}$$
其中,$Z$为标准正态分布的分位数(如95%置信水平对应1.96),$\sigma$为总体标准差,$E$为允许误差。
经验法则
- 总体较大时,样本量按比例增加(如每增加10倍总体,样本量增加1倍)。
- 预调查可帮助调整样本量,通常建议最终样本量比预调查多20%-30%。
三、样本选择的实践原则
代表性原则
样本需全面反映目标人群特征,包括年龄、性别、地域等多维度,确保结果可推广至总体。
随机性原则
采用随机抽样方法(如抽签、随机数表或计算机生成),避免人为偏差。
可获取性原则
优先选择易接触且愿意参与的样本,提高调研效率。
分层与配额
根据关键变量(如地区、收入)分层,或按配额确保各组样本量(如每组≥20个)。
四、注意事项
伦理与合规: 需获得知情同意,保护隐私数据,避免歧视性抽样。 资源限制
动态调整:预调查结果可优化最终样本量,例如发现某层响应率低时增加该层样本。
通过综合考量上述因素,并结合专业统计工具(如SPSS、R语言),可科学确定样本量,提升研究质量。