数据质量的衡量标准通常包括以下 六个属性:
准确性:
指数据真实、客观地反映现实世界实体或事件的程度,即数据与其描述的客观事实的特征是否一致。准确性高意味着数据采集值或观测值与真实值之间的接近程度高,误差小。
完整性:
指数据是否包含了所有必要的信息,是否存在缺失。数据缺失的情况可能是整个数据记录缺失,也可能是数据中某个字段信息的记录缺失。
一致性:
指数据是否遵循了统一的规范,数据集合是否保持了统一的格式。数据一致性主要体现在数据记录的规范和数据是否符合逻辑。
及时性:
指数据从产生到可以查看的时间间隔,也称为数据的延时时长。某些实时分析和决策需要用到小时或者分钟级的数据,因此及时性也是数据质量的组成要素之一。
唯一性:
指数据项或数据组中是否存在重复的数据值。唯一性要求数据值必须是唯一的,例如ID类数据。
有效性:
指数据是否有效可用,以及数据的授权与安全性等。有效性强调数据在业务应用中的可用性和合规性。
这些属性共同构成了评估数据质量的基础框架,不同组织和应用场景可能会根据具体需求对某些属性进行更细致的考量和权衡。
声明:
本站内容均来自网络,如有侵权,请联系我们。