# 度量指标

# 数据治理的度量指标

为了数据管理所需的行为变化,要着重衡量数据治理的推广进展、与治理需求的符合程度以及数据治理为组织带来的价值。重点是充实和强化治理价值的指标,数据治理推出后,要验证组织是否拥有支持数据治理所需资源的指标。数据治理指标主要包括价值、有效性和可持续性三个方面

价值指标

  1. 对业务目标贡献的价值。
  2. 降低预计风险的价值。
  3. 提高的运营效率。

有效性指标

  1. 数据治理目标的实现程度。
  2. 数据治理使用相关工具的有效性。
  3. 数据治理工作中沟通的有效性。
  4. 数据治理工作中培训的有效性。
  5. 数据治理推动业务变革的有效速率。

可持续性指标

  1. 制度和流程的执行情况。
  2. 标准和规程的遵从情况。

# 数据架构的度量指标

企业数据架构衡量指标反映了架构目标:架构接受度、实施趋势、业务价值等。数据架构衡量工作通常作为项目总体业务客户满意度的一部分,可以结合如下方向进行度量:

架构标准接受率 可以衡量项目与已建立的数据架构的紧密程度及项目与企业架构参与流程的遵循度。追踪项目预期的衡量指标也有助于理解和采纳执行过程中出现的问题。

实施趋势 对跟踪企业架构改善组织实施项目能力的程度,至少沿两个方向进行改善:

  1. 使用/重用/代替/废弃测量。决定使用新架构构件与重用、代替或废弃构件比例。
  2. 项目执行效率测量。测量项目的交付时间和可重用构件及指导构件的交付改进版本。

业务价值度量指标 追踪向期待业务效果和利益方向的发展过程:

  1. 业务敏捷性改进。解释生命周期改进或改变的好处,改进延误成本的测量方法。
  2. 业务质量。测量业务案例是否按期完成,基于新创建或集成的数据导致业务发生了改变,测量项目是否实际交付了这些变更。
  3. 业务操作质量。测量改进效率的方法,示例包括准确性改进、时间减少,由于数据错误而导致的纠错成本。
  4. 业务环境改进。示例包括由于数据错误减少而改变客户留存率和负面评价减少率的改进。

# 数据建模的度量指标

可以用数据模型积分卡来测量数据模型的质量,其提供了10个数据模型质量指标,如下图:

序号 类别 总分数 模型分数
1 模型多大程度反映了业务需求 15 -
2 模型的完整性 15 -
3 模型与模式的匹配度 10 -
4 模型的结构是否符合标准 15 -
5 模型的通用性 10 -
6 模型遵循的命名是否标准 5 -
7 模型的可读性 5 -
8 模型的定义是否清晰 10 -
9 模型与企业架构是否一致 5 -
10 模型与元数据的匹配程度 10 -

各个类别的简要描述如下:

  • 模型多大程度反映了业务需求:要确保数据模型是否可以代表需求。例如,如果要获取订单信息,则在评审该项指标时应检查模型中是否包含订单信息,如果需求要求看不同的维度查看订单详情,则应检查模型中是否支持不同维度的业务查询功能。
  • 模型的完整性。这里完整性有两个方面的要求,其分别是需求的完整性和元数据的完整性。需求完整性意味着已经提出的每个需求都应在模型中得到满足,元数据完整性是指模型周围的所有描述性信息也要完整。
  • 模型与模式的匹配度。确保正在审查模型的具象级别(概念模型、逻辑模型或物理模型)和模式(关系、维度、NoSQL)与该类型模型的定义相匹配。
  • 模型的结构。验证用于构建模型的设计实践,以确保可以从数据模型构建数据库,这包括避免一些设计问题,如在同一实体中有两个具有相同名称的属性或者在主键中有一个空属性。
  • 模型的通用性。评审模型的扩展性或者抽象程度。例如,从客户位置转到更通用的位置,可以使设计更容易地处理其他类型的位置,如仓库和配送中心。
  • 模型遵循的命名标准。该项指标用来确保数据模型采用正确且一致的命名标准,主要关注命名标准的结构、术语和风格,以及命名标准被正确的应用于实体、关系和属性上。例如,一个属性构造块选用”客户“或”产品“等属性主题,术语意味着为属性或实体被赋予专有名称。此外,术语还包括正确的拼写和缩写要求,风格意味着外观,如大写规则或驼峰拼写等。
  • 模型的可读性。确保数据模型易于阅读,如果模型难以阅读,则可能无法准确地评估记分卡上其他重要类别,将父实体放置在其子实体上方,相关实体显示在一起,并最小化关系线长度都可以提高模型的可读性。
  • 模型的定义。确保定义清晰、完整和准确。
  • 模型和企业架构的一致性。确认数据模型中的结构能否在更加广泛和一致的环境中应用,以便在组织中可以使用一套统一的术语和模型结构。
  • 模型与元数据的匹配程度。确认存储在模型结构中的数据和实际数据是否一致。例如,客户姓氏(Customer Last Name)这一列中是否真的存储的是客户的姓氏数据,会不会连客户的名字也存进来了?数据类别旨在减少这些以外,并有助确保模型上的结构与这些结构将保存的数据相匹配。

# 数据存储的度量指标

数据存储的度量指标

  1. 数据库类型的数量。
  2. 汇总交易量统计。
  3. 容量指标。
  4. 已使用存储的数量。
  5. 存储容器的数量。
  6. 数据对象中已提交和未提交块的数量。
  7. 数据队列的使用情况。
  8. 存储服务的使用情况。
  9. 对存储服务请求的数量。
  10. 对使用服务应用程序的性能改进。

存储性能度量指标

  1. 事务频率金额数量。
  2. 查询性能。
  3. API服务性能。

操作度量指标

  1. 有关数据检索时间的汇总统计。
  2. 备份的大小。
  3. 数据质量评估。
  4. 可用性。

服务度量指标

  1. 按类型的问题提交、解决和升级数量。
  2. 故障响应及问题解决时间。

# 数据安全的度量指标

安全实施指标 常见的安全指标可以设定为正值百分比:

  1. 安装了最新安全补丁程序的计算机百分比。
  2. 安装并运行最近反恶意软件的计算机百分比。
  3. 在年度安全实践测验中得分超过80%的员工百分比。
  4. 已完成正式风险评估分析的部门或单位的百分比。
  5. 成功通过灾难恢复测试的业务流程百分比。
  6. 已成功解决审计发现问题的百分比。

安全意识指标

  1. 风险评估结果。评估结果提供可定性数据,需要反馈给相关业务单位,以增强其责任意识。
  2. 风险事件和配置文件质量。通过这些事件和文件确定需要纠正的未管理风险敞口。
  3. 补丁有效性审计情况。涉及使用机密和受控信息的计算机,以评估安全补丁的有效性。

数据保护指标

  1. 特定数据类型和信息系统的关键性排名。
  2. 与数据丢失、危害或损坏相关的事故、攻击、盗窃或灾难的年损失预期。
  3. 对某些具有价值的数据资源及其传播媒介遭受攻击可能性的威胁评估。
  4. 对可能意外或有意泄露敏感信息的业务流程中特定部分的漏洞评估。

安全事件指标

  1. 检测到并阻止了入侵尝试事件的数量。
  2. 通过防止入侵节省的安全成本的投资回报。

# 数据集成的度量指标

要衡量实现数据集成解决方案的规模和收益,可以从可用性、数量、速度、成本和使用几个方面进行度量:

  1. 数据可用性。请求数据的可获得性。
  2. 数据量和速度。它包括传送和转换的数据量,分析数据量,传送速度,数据更新与可用性之间的时延,事件与触发动作之间的时延,新数据源的可用时间等。
  3. 解决方案成本和复杂度。它包括,解决方案开发和管理成本,获取新数据的便利性,解决方案和运营的复杂度,使用数据集成方案的系统数量。

# 参考数据和主数据的度量指标

以下指标可以作为参考数据和主数据的度量标准:

  • 数据质量和遵从性。数据质量仪表盘可以描述参考数据和主数据的质量,这些指标应该遂宁主题域实体或相关属性的置信度,以及它在整个组织中符合实际需求的使用价值。
  • 数据变更活动变化率。审核可信数据血缘对于提高数据共享环境中的数据质量是必要的。指标应该展示数据值的变化率,它能够帮助人们深入理解为共享环境提供数据的系统,并可被用于调整主数据管理进程中的算法。
  • 数据获取和消费数据。数据由上游系统供应,由下游系统和流程使用。这些指标应该显示和追踪那些系统在贡献数据,哪些业务区域在共享环境中订阅数据。
  • 数据管理覆盖率。这个指标关注对数据内容负责的人或团队,并展示数据管理评估频率,同时识别支持方面的差距。
  • 数据共享量和使用情况。需要跟踪纳入主数据的数据量和使用情况,以确定数据共享环境的有效性。这些指标应该展示数据共享环境中流入和流出数据的定义、纳入和订阅的数量和速率。

# 数据仓库的度量指标

使用指标 数据仓库中使用的度量指标通常包括注册用户数、连接用户数或并发用户数。这些度量指标表示组织内有多少人正在使用数据仓库。为每个工具授权多少个用户账户是一个很好的开始,特别是对于审计员来说,实际有多少用户连接到该工具是一个很好的度量指标,并且每个时间段由用户的查询数量对于容量规划也是一个很好的技术指标参考。

主题域覆盖率 主题域覆盖百分比衡量每个部门访问仓库的程度,它强调哪些数据可供跨部门共享,将操作源映射到目标是另一种自然扩展,它强制和验证已经收集的血缘关系和元数据,并可以提供渗透分析,确定哪些部门在使用哪些源系统进行分析。

响应时间和性能指标 多数查询工具会测量响应时间,可以通过工具检索响应或性能指标。大多数工具将日志或存储库中为提供给用户的对象保留查询和刷新记录,可以将数据划分为计划执行的对象和已执行的对象,并将其表示为尝试和已成功访问的原始计数,需要关注受欢迎和查询表现不佳的对象,如果一组对象定期出现故障,可以进行缺陷分析,并制定维护计划。

# 元数据的度量指标

想测量元数据的影响,需要验证缺少元数据导致的隐患。作为风险评估的一部分,将数据使用者探索信息所花费的时间作为评估指标,以便在实施元数据解决方案之后体现改进程度。元数据管理环境的建议指标包括:

  1. 元数据存储库完整性。将企业元数据的理想覆盖率与实际覆盖率进行比较。
  2. 元数据的管理成熟度。根据能力成熟度模型的评估方法,开发用于判断企业元数据成熟度的指标。
  3. 元数据的使用情况。可以通过存储库的访问次数衡量用户对元数据存储库的使用情况和接受程度。在业务实践中,用户引用元数据是一个很难跟踪的指标,可能需要定性的调研措施获取评估结果。
  4. 业务术语活动执行程度。包括术语使用、更新、定义解析、覆盖范围等。
  5. 元数据文档质量。一个质量指标是通过自动和手动两种方式评估元数据文档的质量。自动评估方式包括对两个源执行冲突逻辑的比对、测量二者匹配的程度以及岁时间推移的变化趋势,另一个度量指标是度量具有定义的百分比,以及随着时间推移而发生变化的趋势。手动评估方式包括基于企业质量定义进行随机或完整的调查,质量度量表名存储库中元数据的完整性、可靠性和通用性。