内容:
前言
第一部分:导论:
1:数据治量简介
定义
案例分析
数据治理的支柱
摘要
2:企业数据管理参考架构
EDM类别
大数据
数据治理工具
摘要
第二部分:数据管理工具的数据
3:商业词汇表
Excel,CSV或XML格式的批量加载业务术语
创建业务术语类别
促进社会协作
自动超链接嵌入式商业条款
将自定义属性添加到业务术语和其他数据工件
将自定义关系添加到业务术语和其他数据工件
将自定义角色添加到业务术语和其他数据工件
将业务术语和列名称链接到关联的参考数据
将业务术语链接到技术元数据
支持创建自定义资产类型
标记关键数据元素
提供OOTB和自定义工作流来管理业务条款和其他数据工件
查看业务术语和其他数据工件的更改历史记录
允许业务用户直接从报告工具链接到词汇表
搜索商业条款
将业务术语与关联的非结构化数据集成
摘要
4:元数据管理
从数据建模工具中提取逻辑模型
从数据建模工具中提取物理模型
从关系数据库中提取元数据
从数据仓库设备中提取元数据
集成传统数据源中的元数据
从ETL工具中提取元数据
从报告工具中提取元数据
在元数据工具中反映自定义代码
从分析工具中提取元数据
将业务术语与列名相关联
从数据质量工具中提取元数据
从大数据源中提取元数据
提供有关数据沿袭的详细视图
自定义数据沿袭报告
管理元数据存储库中的权限
支持在元数据存储库中搜索资产
摘要
5:数据分析
进行柱分析
发现列的值分布
发现列的模式分布
发现列的长度频率
发现隐藏的敏感数据
发现列中具有相似声音的值
同意数据治理计划的数据质量维度
制定与数据质量维度相关的业务规则
与数据质量完整性维度相关的配置文件数据
与数据质量一致性维度相关的配置文件数据
与数据质量一致性维度相关的概况数据
与数据质量同步维度相关的配置文件数据
与数据质量唯一性维度相关的配置文件数据
与数据质量的及时性维度相关的概况数据
发现跨列的数据重叠
发现列之间的隐藏关系
发现依赖关系
发现数据转换
创建可以分析的虚拟联接或逻辑数据对象
摘要
6:数据质量管理
将数据转换为标准格式
提高地址数据的质量
匹配并合并重复记录
创建数据质量记分卡
选择数据域或实体
定义数据质量的可接受阈值
选择要为特定数据域或实体测量的数据质量维度
选择每个数据质量维度的权重
选择每个数据质量维度的业务规则
为给定数据质量维度中的每个业务规则分配权重
将业务规则绑定到相关列
查看数据质量记分卡
突出显示与较差数据质量相关的财务影响
进行时间序列分析
管理数据质量例外
摘要
7:主数据管理
定义MDM Hub消耗的业务术语
管理实体关系管理
主数据丰富规则
管理主数据验证规则
管理记录匹配规则
管理记录合并规则
查看杰出数据管理任务列表
管理重复项
查看数据管理仪表板
管理层次结构
提高主数据质量
将社交媒体与MDM集成
管理主数据工作流程
比较主数据的快照
提供主数据更改历史记录
将MDM任务卸载到Hadoop以加快处理速度
摘要
8:参考数据管理
建立代码表清单
同意每个代码表的主值列表
在主值和相关CodeTable之间构建简单映射
在代码值之间构建复杂映射
管理代码值的层次结构
构建和比较参考数据的快照
可视化参考数据快照之间的跨时间交叉验证
摘要
9:信息政策管理
管理业务术语表中的信息策略,标准和流程
管理业务规则
利用数据治理工具监控和报告合规性
管理数据问题
摘要
第三部分:企业数据管理与数据工具之间的整合
10����,�Ƴ�:数据建模:将逻辑和物理数据模型与元数据存储库集成
在元数据存储库中公开本体
使用数据发现工具对跨数据域的统一模式进行原型设计
建立数据模型以支持主数据管理摘要
11:数据集成:使用数据集成以集成方式部署数据质量作业
在MDM或参考数据中心与源系统之间移动数据
利用数据集成工具使用的参考数据
将数据集成工具集成到元数据存储库中
通过利用元数据存储库自动生成数据集成作业
摘要
12:分析和报告
将数据分析结果导出到报告工具以进行进一步的可视化分析
将数据工件导出到报表工具以实现数据治理指标的可视化
将分析和报告工具与语义上下文的业务术语表集成
摘要
13:业务流程管理
数据治理工作流应该利用BPM功能
主数据工作流应该利用BPM功能
数据治理工具应映射到BPM工具
摘要
14:数据安全和隐私
确定隐私义务
使用数据发现工具发现敏感数据
标记元数据存储库中的敏感数据
在生产环境中屏蔽敏感数据
掩盖非生产环境中的敏感数据
监视特权用户的数据库访问
文档信息策略由数据屏蔽和数据库监视工具实现
使用数据屏蔽工具可以执行的数据发现工具创建完整的业务对象
摘要
15:信息生命周期管理
ILM工具实现的业务术语表中的文档信息策略
发现可以通过ILM工具高效执行的完整业务对象
摘要
第四部分:大数据治理工具
16:Hadoop和NoSQL
在Hadoop中执行数据清单
在Hadoop中分配数据的所有权
在Hadoop中为Analytics提供语义层
查看Hadoop内外数据的沿袭
管理Hadoop的参考数据
在Hadoop中本地配置数据
在Hadoop中本地发现数据
在Hadoop中本地执行数据质量规则
将Hadoop与主数据管理集成
Hadoop的端口数据治理工具可提高性能
管理NoSQL数据库中的数据
在Hadoop中屏蔽敏感数据
摘要
17:流计算
使用数据分析工具来理解输入数据的样本集
管理流计算应用程序使用的参考数据
管理流计算应用程序使用的业务术语
摘要
18:文本分析
大数据治理降低充血性心力衰竭患者的再入院率
利用非结构化数据提高稀疏性质量
填充结构化数据
提取结构化数据中不可用的其他相关预测变量
为关键业务术语定义一致的定义
确保设施中患者主数据的一致性
遵守隐私要求
管理参考数据
摘要
第五部分 - 评估标准和供应商景观
19:数据治理平台的评估标准
总拥有成本
数据管理
审批工作流程
数据工件的层次结构
数据治理指标
云端
摘要
20:ASG
ASG- metaGlossary
ASG-Rochade
ASG-becubic
21:Collibra
商业词汇表
参考数据管理
数据管理
工作流程
元数据
数据分析
22:全球ID
数据分析
数据质量
元数据
23:IBM
元数据
信息集成
数据质量
主数据管理
数据生命周期管理
隐私和安全
24:Informatica
数据分析和数据质量
元数据和业务术语表
主数据管理
信息生命周期管理
安全和隐私云
25:Orchestra Networks
工作流数据建模
主数据管理
参考数据管理
商业词汇表
26:SAP
内存数据库数据
质量和元数据管理
主数据管理
内容管理
信息生命周期管理
企业建模
数据集成
27:Talend
扩展生态系统
大数据
数据集成
数据质量
主数据管理
企业服务总线(ESB)
业务流程管理(BPM)
28: 着名的供应商
Adaptive
BackOffice Associates
Data Advantage Group
Diaku
Embarcadero Technologies
Global Data Excellence
Harte-Hanks Trillium
Oracle
SAS
附录A:缩略语列表
附录B:术语表
附录C:使用工具自动执行的潜在数据治理任务
商业词汇表
元数据管理
数据分析
数据质量管理
主数据管理
参考数据管理
信息政策管理
数据建模数据集成
分析和报告
业务流程管理
数据安全和隐私
信息生命周期管理
Hadoop和NoSQL
流计算
文本分析
索引