设计数据管理体系结构的方式您的数据和分析(d和a)团队组织、共享和分析数据。
设计数据管理体系结构的方式您的数据和分析(d和a)团队组织、共享和分析数据。
利用集体智慧的d和a同行。下载这张资讯图像,得到一个快速的视觉指南150 d和a高管如何看待:
现代组织需要一个模块化的数据架构,支持复杂的企业环境,同时为业务用户提供数据访问。这里有一些关键的考虑因素。
数据分析架构最佳实践已通过大量的时代在过去的几十年中,随着数字转换活动强调了需要现代化数据策略和杠杆使用数据的机会。这些阶段包括:
pre - 2000年期间,企业数据仓库的时代:数据架构为中心的成功企业数据仓库(仓库)。
2000 - 2010 Post-EDW时代:这一时期是由分散的数据分析,定义,数据集市是依赖于数据仓库。取决于你问谁,你有一个不同的版本的真实数据,每个数据集市的整合导致了另一个数据竖井导致分散和不一致的分析。
2010 - 2020逻辑数据仓库(LDW)时代:这段时间看到更多统一的数据分析通过一个共同的语义层,使访问数据仓库、数据集市和数据湖泊。这是目前的最佳实践。
2020 -未来活跃元数据时代:未来会看到增强使用所有相关的数据源,分析数据访问和通过先进的分析、推荐引擎、数据和人工智能编排,适应实践和元数据分析。
民主化数据访问和自助分析激励当前进化正在从LDW时代活跃元数据的时代。数据和分析总监(CDAOs)同样希望扩展用例数据超出长春可以处理。interenterprise数据共享,这些包括主数据管理B2B数据集成,合作伙伴数据共享、应用数据集成等。
但什么是元数据,在这个进化它又扮演了什么角色?
元数据描述不同方面的数据,如数据的上下文。它的副产品数据移动到企业系统。有四种类型的元数据:技术、运营、业务和社会。这些类型可以是“被动”的元数据组织收集但不积极分析,或“活跃”元数据标识的行为在两个或两个以上的系统使用相同的数据。
数据结构是一个新兴的数据管理和数据集成设计理念(参阅“数据管理的现代化,以提高价值和降低成本”)。它的目标是实现灵活、可重用和增广数据集成来支持整个业务数据访问。
数据结构是许多组织的自然进化的逻辑数据仓库模型,因为它利用现有技术和元数据在一个现代化的数据架构。没有“拆开,替换”的数据结构设计。相反,它利用沉没成本,同时提供优先级为新数据管理开支和成本控制指导。
数据不同观点:面料带来的好处
业务的角度来看:使更少的技术业务用户(包括分析师)快速找到,集成、分析和共享数据
数据管理团队的角度:生产力优势从自动化的数据访问和集成数据工程师,并增加灵活性导致更多闭包的数据请求每天/周/年
整体组织的角度来看:更快的从数据和分析投资时间洞察力;提高了组织数据的利用率;降低成本通过分析跨所有参与系统的元数据,并提供洞察有效数据设计、交付和利用率
数据网格是一种体系结构方法,允许分散的数据管理。它的目标是支持定义、实现、维护和管理数据产品的方式让他们容易找到和使用数据消费者。数据网格体系结构是基于分权的概念和分发数据责任最接近的人作为服务数据和共享数据。
数据网格是最常见的司机:更多的数据自治业务线(lob),更少依赖中央,利用分散的数据打破竖井(尽管一些数据集中在一个网格的体系结构可以保证)。尽管它的吸引力,注意以下先决条件和挑战。
术语与不同的方法组织模型不同,管理的数据和技术实现。组织驾驶员也有所不同。包括删除它作为一个瓶颈和合理化LOB-led产生的孤立的数据集的数据管道创造,或由cloud-modernization触发数据管理计划。
数据分析领导人不应采用数据网格架构作为一个看似简单的解决他们数据管理的挑战。虽然正式通用实践,退位数据LOB专家责任,风险激增孤立的数据使用。
如果数据读写,自治和数据跨部门技能差异很大,如果组织没有能力实施数据管理活动,中央将需要提供更多的支持——至少在一开始。lob数据网格环境中可以演变走向更大的自治权通过创建新的角色,比如数据产品负责人,管理的定义、创建和管理的数据产品。缺乏技能,致力于构建分布式数据的组织,应避免数据网格。
数据网格体系结构实现通常是基于云计算和使用共享存储和处理。然而,工具使用每个LOB的交付、维护和管理基于用例的数据差异很大,生产者和消费者之间的合同。这些合同定义范围,sla和数据的操作成本产品,如可用性、计算成本,并发的访问,治理和质量策略、上下文和语义。没有明确的合同进行的组织经常面临shareability和可重用性的限制,不利于开发数据网格体系结构的目标。
数据网格变化数据治理的责任领域应用程序设计者和用户。一个LOB自主构建和公开的数据产品,它必须定义本地数据管理和数据管理,符合中央的指导首席信息安全官(CISO)和首席数据官(CDO)或中央治理委员会。在成熟的数据网格组织、企业组织实施自己的治理策略和中央的支持,而不是相反。
数据网格是一个可行的选择与不完整的元数据组织。只要他们有数据架构师的专业技能,他们可以从数据网格和建立积极的元数据存储并行。
数据领导人与本地操作,云,multicloud intercloud和混合部署需要修改现有的数据架构策略来支持他们的现在和未来的复杂性。精心策划和健壮的数据架构确保新技术符合现有的基础设施,可以支持未来的需求——包括在云供应商集成和互操作性,SaaS解决方案和本地资源部署,等等。把你的计划在以下活动:
制定一个战略,解决整个数据系统。通常即使对于组织最初的云部署成长为一个混合和multicloud环境随着时间的推移。建立了一个全面的云战略,重视提供者可以支配更多的云部署。这将减轻风险,未经批准的云部署可以对你的数据架构。
调整数据需求用例。分布式和复杂的用例驱动更新交付业务价值的创新,特别是通过使用自助服务数据访问。云中的成功取决于能力满足消费者业务用例,这是最有可能分布在自然界中,接近数据源和边缘网络和设备上操作。
评估集成模式。数据的快速增长和自助服务数据访问加剧了移动数据在不同云的挑战和本地系统的带宽,延迟和吞吐量。评估你的集成模式来识别一个可靠和有效的数据结构,符合不断发展的业务用例,满足数据的合规和主权的需要。
拥抱开源和开放标准的投资不会过时的数据。熟悉开源云中的定价模型,包括费用计算和存储资源。使用开放标准或与提供,并理解开源数据存储的选项,以及开源的元数据标准,使元数据跨平台共享在企业环境中。最后,有一个支持计划与开源解决方案解决问题。
加入你的同行在Gartner会议上公布的最新见解。
Gartner的客户:登录完整的一套可行的见解和工具在数据管理体系结构。
数据结构是一个新兴的数据管理设计实现灵活、可重用和增强数据管理(即。更好的语义,通过元数据集成和组织的数据)。
数据网格是一个数据管理方法(尽管不是一个确定的最佳实践)支持domain-led实践定义、交付、维护和管理的数据产品。
元数据是描述数据资产的各个方面。它提供了数据的背景下,提高我们对数据在整个生命周期的理解。
数据结构和数据网格是独立开发的概念,通常是可互换的。当他们方便地访问数据的共享相同的目标,它们是不同的。
数据结构是一种技术模式由元数据驱动自动化数据管理任务通过统一的数据访问。
数据网格是一种体系结构方法的联合数据管理通过分布式控制的责任。
在适当的情况下,织物和网格可以互补的。网格的目标是,织物是手段。