数据管理知识体系将数据质量 (DQ) 定义为“将质量管理技术应用于数据的活动的规划、实施和控制,以确保其适合消费并满足数据消费者的需求。”
由于对 DQ 的期望并不总是口头表达和为人所知,因此需要进行持续的讨论。DQ 取决于上下文和数据消费者的要求。实施有效的 DQ 管理使用 DQ 工具可帮助组织将 DQ 维持和改进到可接受的水平。业务领导者使用数据质量维度来衡量 DQ 并建立对数据的更多信任。
- 准确性
- 完整性
- 一致性
- 正直
- 合理性
- 及时性
- 唯一性/重复数据删除
- 有效性
- 辅助功能
其他定义包括:
- “适合一个目的。满足其作者、用户和管理员的要求。” (Peter Aiken 博士,改编自 Martin Eppler)
- “依赖数据的准确性、一致性和完整性才能在整个企业中发挥作用。” (米歇尔奈特)
- 用于解析和标准化、广义“清理”、匹配、分析、监控和丰富的工具和过程(高德纳)
- Strong-Wang框架:(麻省理工学院的 Wang 和 Strong和大马DMBoK)
辅助功能
访问安全
可解释性
易于理解
表征一致性
简明表示
附加值
关联
完整性
适当的数据量
准确性
客观性
可信度
名声
内在的 DQ:
上下文 DQ:
代表性 DQ:
辅助功能 DQ:
一些用途包括:
- 增加的价值组织数据 以及使用它的机会
- 减少风险和成本与低质量数据相关
- 改善组织效率 和生产力
- 保护和提高组织的声誉
- 数据剖析(建立趋势并发现数据中的不一致)
- 数据标准化(确保数据使用相同、一致的格式)
- 数据监控(当未达到 DQ 阈值时提醒数据管理员)
- 数据解析(发现数据是否符合可识别的模式)
- 数据清理