2020年6月17日
2020年6月17日
贡献:劳伦斯Goasduff
数据中心之间的区别,湖泊和数据仓库,在您的组织如何有效地使用它们。
数据中心、数据的湖泊和数据仓库所有重要领域的投资数据和分析领导人支持日益复杂,各种分布式数据的工作量。Gartner的研究发现,57%的数据和分析领导人正在投资于数据仓库中,46%是使用数据中心,39%是使用数据湖泊。
虽然数据和分析领导人熟悉这些术语和听到他们从技术提供商,很多不理解的差异。“数据中心、数据湖泊和数据仓库不是可互换的替代方案,”说泰德·弗里德曼尊敬的副总裁分析师,Gartner。
弗里德曼补充说,数据和分析领导人必须理解这三种类型的数据结构的目的,和他们可以一起扮演的角色在现代数据管理基础设施最好的支持特定的业务需求。
数据仓库存储知名和结构化数据。他们支持预定义的和可重复的分析需求,可以跨许多用户规模的组织。数据仓库是适合复杂的查询,高水平的并发访问和严格的性能要求。
湖泊收集未经提炼的数据(即数据在本土形式,转换和有限质量保证)和事件捕获从一个不同的源系统。湖泊通常支持数据准备、探索性数据分析和科学活动。
数据中心概念、逻辑和物理“中心”调解语义(支持治理和共享数据)之间(即集中管理。广泛使用)和本地管理的数据(通常是一次性的数据)。它们使数据的无缝流动和治理。
数据仓库和数据湖泊有共同的焦点——支持组织的分析需求。相反,数据中心不专注于分析使用的数据。他们不长时间存储的详细数据。
它们使数据共享和应用治理控制跨组织的数据流动的各种应用程序和过程。例如,数据和分析领导人可以使用一个数据中心来改善交付的数据表单业务应用数据仓库或数据。
而重要的是要理解他们的不同的角色在体系结构中,数据和分析领导人必须认识到这些结构为组织带来价值,当结合使用。
例如,数据可以传递给解析结构(数据仓库和数据湖泊)通过一个数据中心,它充当一个中介点,治理。越来越多的组织正在应用的数据中心架构作为共享的焦点和治理的关键数据在业务;例如,用更集中架构取代点对点集成同步关键数据之间的各种业务应用程序和流程。
湖”的选择数据仓库、数据和数据中心不是一个”或者,”弗里德曼说。“现代数据管理基础设施需要动态——发展架构模式随着时间的推移,使新的连接和支持不同的用例。”
加入世界上最重要的收集的数据和分析领导人Gartner专家和适应不断变化的数据和分析的作用。
Gartner的客户推荐资源*:
数据中心,湖泊和数据仓库:它们是不同的和为什么他们是如何更好的在一起泰德·弗里德曼和尼克Heudecker。
*请注意,某些文件可能不会Gartner提供给所有客户。