未来的数据架构

设计数据管理体系结构的方式您的数据和分析(d和a)团队组织、共享和分析数据。

下载2023 d和a技术采用路线图

使用这个简单的视觉对150 d和a d和a技术基准计划同行。

通过单击“继续”按钮,你同意Gartner的使用条款隐私政策。

联系信息

所有字段是必需的。

公司信息

所有字段是必需的。

公司类型和位置
可选 可选
现在登录< / >。< / br > < / br > < / br > < / br >" class="eloqua-text"> 成为客户团队。< / > < br > < br >如果你是Gartner客户你已经获得进一步的研究和工具在你的客户门户。< a href = " //www.kmllpx.com/account/signin " >现在登录< / >。< / br > < / br > < / br > < / br >" class="optin-text">

基准你d和a技术采用的计划

利用集体智慧的d和a同行。下载这张资讯图像,得到一个快速的视觉指南150 d和a高管如何看待:

  • 38个主要新兴d和a技术——一些战略;其他人更关注核心d和a函数功能
  • 企业价值的程度和风险相关的技术
  • 部署的范围——从计划和采用驾驶

设计你的数据架构为现代的业务需求

现代组织需要一个模块化的数据架构,支持复杂的企业环境,同时为业务用户提供数据访问。这里有一些关键的考虑因素。

数据架构演进提供自助服务启用的数据元数据

数据分析架构最佳实践已通过大量的时代在过去的几十年中,随着数字转换活动强调了需要现代化数据策略和杠杆使用数据的机会。这些阶段包括:

  • pre - 2000年期间,企业数据仓库的时代:数据架构为中心的成功企业数据仓库(仓库)。

  • 2000 - 2010 Post-EDW时代:这一时期是由分散的数据分析,定义,数据集市是依赖于数据仓库。取决于你问谁,你有一个不同的版本的真实数据,每个数据集市的整合导致了另一个数据竖井导致分散和不一致的分析。

  • 2010 - 2020逻辑数据仓库(LDW)时代:这段时间看到更多统一的数据分析通过一个共同的语义层,使访问数据仓库、数据集市和数据湖泊。这是目前的最佳实践。

  • 2020 -未来活跃元数据时代:未来会看到增强使用所有相关的数据源,分析数据访问和通过先进的分析、推荐引擎、数据和人工智能编排,适应实践和元数据分析。

民主化数据访问和自助分析激励当前进化正在从LDW时代活跃元数据的时代。数据和分析总监(CDAOs)同样希望扩展用例数据超出长春可以处理。interenterprise数据共享,这些包括主数据管理B2B数据集成,合作伙伴数据共享、应用数据集成等。

什么是元数据,在这个进化它又扮演了什么角色?

元数据描述不同方面的数据,如数据的上下文。它的副产品数据移动到企业系统。有四种类型的元数据:技术、运营、业务和社会。这些类型可以是“被动”的元数据组织收集但不积极分析,或“活跃”元数据标识的行为在两个或两个以上的系统使用相同的数据。

活跃的元数据可以实现自动化,提供见解和优化的用户接触,和自助分析是一个关键的推动者。意识到它的潜力,然而,需要一个平衡要求重复性数据架构,可重用性,治理、权威、起源和优化交货。

数据分析领导人看到两个选择进化的数据架构LDW时代,今天大多数操作,向积极的元数据的时代。这些选项的数据结构或数据网格。这些单独的概念分享的目标为每个人都提供轻松访问数据,使用它——包括数据科学家,数据分析师和工程师,以及数据消费者。尽管许多领导人讨论数据结构和数据网格作为竞争数据架构方法,他们更准确地看作是互补的。

数据结构利用现有资产从逻辑数据仓库的时代

数据结构是一个新兴的数据管理和数据集成设计理念(参阅“数据管理的现代化,以提高价值和降低成本”)。它的目标是实现灵活、可重用和增广数据集成来支持整个业务数据访问。

数据结构是许多组织的自然进化的逻辑数据仓库模型,因为它利用现有技术和元数据在一个现代化的数据架构。没有“拆开,替换”的数据结构设计。相反,它利用沉没成本,同时提供优先级为新数据管理开支和成本控制指导。

数据不同观点:面料带来的好处

  • 业务的角度来看:使更少的技术业务用户(包括分析师)快速找到,集成、分析和共享数据

  • 数据管理团队的角度:生产力优势从自动化的数据访问和集成数据工程师,并增加灵活性导致更多闭包的数据请求每天/周/年

  • 整体组织的角度来看:更快的从数据和分析投资时间洞察力;提高了组织数据的利用率;降低成本通过分析跨所有参与系统的元数据,并提供洞察有效数据设计、交付和利用率

确定一个数据结构设计的两个因素是正确的对于一个给定的组织是:元数据完整性和数据组织织物的专业技能。具体地说,组织元数据太少不会看到数据结构的好处。缺少元数据也会增加依赖主题专家(sme)可以帮助发现,推断甚至编辑元数据——可以否定相对low-SME需求数据结构的设计。

数据网格,而吸引人,需要一个严格的方法

数据网格是一种体系结构方法,允许分散的数据管理。它的目标是支持定义、实现、维护和管理数据产品的方式让他们容易找到和使用数据消费者。数据网格体系结构是基于分权的概念和分发数据责任最接近的人作为服务数据和共享数据。

数据网格是最常见的司机:更多的数据自治业务线(lob),更少依赖中央,利用分散的数据打破竖井(尽管一些数据集中在一个网格的体系结构可以保证)。尽管它的吸引力,注意以下先决条件和挑战。

数据网格体系结构还没有一个确定的最佳实践。

术语与不同的方法组织模型不同,管理的数据和技术实现。组织驾驶员也有所不同。包括删除它作为一个瓶颈和合理化LOB-led产生的孤立的数据集的数据管道创造,或由cloud-modernization触发数据管理计划。

数据分析领导人不应采用数据网格架构作为一个看似简单的解决他们数据管理的挑战。虽然正式通用实践,退位数据LOB专家责任,风险激增孤立的数据使用。

数据网格的成功取决于lob的组织模型和数据能力。

如果数据读写,自治和数据跨部门技能差异很大,如果组织没有能力实施数据管理活动,中央将需要提供更多的支持——至少在一开始。lob数据网格环境中可以演变走向更大的自治权通过创建新的角色,比如数据产品负责人,管理的定义、创建和管理的数据产品。缺乏技能,致力于构建分布式数据的组织,应避免数据网格。

数据网格体系结构、设计和技术实现千差万别。

数据网格体系结构实现通常是基于云计算和使用共享存储和处理。然而,工具使用每个LOB的交付、维护和管理基于用例的数据差异很大,生产者和消费者之间的合同。这些合同定义范围,sla和数据的操作成本产品,如可用性、计算成本,并发的访问,治理和质量策略、上下文和语义。没有明确的合同进行的组织经常面临shareability和可重用性的限制,不利于开发数据网格体系结构的目标。

组织需要一个联合治理模型。

数据网格变化数据治理的责任领域应用程序设计者和用户。一个LOB自主构建和公开的数据产品,它必须定义本地数据管理和数据管理,符合中央的指导首席信息安全官(CISO)和首席数据官(CDO)或中央治理委员会。在成熟的数据网格组织、企业组织实施自己的治理策略和中央的支持,而不是相反。

数据网格是一个可行的选择与不完整的元数据组织。只要他们有数据架构师的专业技能,他们可以从数据网格和建立积极的元数据存储并行。

现代环境的复杂性要求灵活的数据架构

数据领导人与本地操作,云,multicloud intercloud和混合部署需要修改现有的数据架构策略来支持他们的现在和未来的复杂性。精心策划和健壮的数据架构确保新技术符合现有的基础设施,可以支持未来的需求——包括在云供应商集成和互操作性,SaaS解决方案和本地资源部署,等等。把你的计划在以下活动:

  • 制定一个战略,解决整个数据系统。通常即使对于组织最初的云部署成长为一个混合和multicloud环境随着时间的推移。建立了一个全面的云战略,重视提供者可以支配更多的云部署。这将减轻风险,未经批准的云部署可以对你的数据架构。

  • 调整数据需求用例。分布式和复杂的用例驱动更新交付业务价值的创新,特别是通过使用自助服务数据访问。云中的成功取决于能力满足消费者业务用例,这是最有可能分布在自然界中,接近数据源和边缘网络和设备上操作。

  • 评估集成模式。数据的快速增长和自助服务数据访问加剧了移动数据在不同云的挑战和本地系统的带宽,延迟和吞吐量。评估你的集成模式来识别一个可靠和有效的数据结构,符合不断发展的业务用例,满足数据的合规和主权的需要。

  • 拥抱开源和开放标准的投资不会过时的数据。熟悉开源云中的定价模型,包括费用计算和存储资源。使用开放标准或与提供,并理解开源数据存储的选项,以及开源的元数据标准,使元数据跨平台共享在企业环境中。最后,有一个支持计划与开源解决方案解决问题。

Gartner会议经验

加入你的同行在Gartner会议上公布的最新见解。

数据架构的常见问题

数据结构是一个新兴的数据管理设计实现灵活、可重用和增强数据管理(即。更好的语义,通过元数据集成和组织的数据)。

数据网格是一个数据管理方法(尽管不是一个确定的最佳实践)支持domain-led实践定义、交付、维护和管理的数据产品。

元数据是描述数据资产的各个方面。它提供了数据的背景下,提高我们对数据在整个生命周期的理解。

数据结构和数据网格是独立开发的概念,通常是可互换的。当他们方便地访问数据的共享相同的目标,它们是不同的。

  • 数据结构是一种技术模式由元数据驱动自动化数据管理任务通过统一的数据访问。

  • 数据网格是一种体系结构方法的联合数据管理通过分布式控制的责任。

在适当的情况下,织物和网格可以互补的。网格的目标是,织物是手段。

关键任务优先级驱动更强的性能。

Baidu