其乐融融的IT技术小站

什么是数据质量?你知道吗?

数据管理知识体系将数据质量 (DQ) 定义为“将质量管理技术应用于数据的活动的规划、实施和控制,以确保其适合消费并满足数据消费者的需求。”

由于对 DQ 的期望并不总是口头表达和为人所知,因此需要进行持续的讨论。DQ 取决于上下文和数据消费者的要求。实施有效的 DQ 管理使用 DQ 工具可帮助组织将 DQ 维持和改进到可接受的水平。业务领导者使用数据质量维度来衡量 DQ 并建立对数据的更多信任。

数据质量维度的简短列表:
  • 准确性
  • 完整性
  • 一致性
  • 正直
  • 合理性
  • 及时性
  • 唯一性/重复数据删除
  • 有效性
  • 辅助功能

其他定义包括:

  • “适合一个目的。满足其作者、用户和管理员的要求。” (Peter Aiken 博士,改编自 Martin Eppler)
  • “依赖数据的准确性、一致性和完整性才能在整个企业中发挥作用。” (米歇尔奈特)
  • 用于解析和标准化、广义“清理”、匹配、分析、监控和丰富的工具和过程(高德纳)
  • Strong-Wang框架:(麻省理工学院的 Wang 和 Strong和大马DMBoK)

辅助功能

访问安全

可解释性

易于理解

表征一致性

简明表示

附加值

关联

完整性

适当的数据量

准确性

客观性

可信度

名声

内在的 DQ:

上下文 DQ:

代表性 DQ:

辅助功能 DQ:

一些用途包括:

  • 增加的价值组织数据 以及使用它的机会
  • 减少风险和成本与低质量数据相关
  • 改善组织效率 和生产力
  • 保护和提高组织的声誉
  • 数据剖析(建立趋势并发现数据中的不一致)
  • 数据标准化(确保数据使用相同、一致的格式)
  • 数据监控(当未达到 DQ 阈值时提醒数据管理员)
  • 数据解析(发现数据是否符合可识别的模式)
  • 数据清理
赞 ()
分享到:更多 ()

相关推荐

内容页底部广告位3
留言与评论(共有 0 条评论)
   
验证码: