数据仓库的未来:6个专家分享了他们的预测(下)
预测:数据仓库将成为一个综合性的企业处理引擎,融合多种数据结构的数据与分析,同时结合多个程序和脚本语言来保证多用户快速访问相关的洞察力。
数据仓库过去用的是单一的平台,而今天,它是由多个系统组成的有逻辑的数据仓库,每个有他们自己的分析优势,一起来解决业务问题。数据仓库,通常由主要业务的用户用SQL访问,但现在也支持Java,Perl,Python,Ruby等语言来运行并行数据库,不仅业务人员使用,数据科学家和应用程序开发者也在使用它。
过去的数据仓库只包含列式存储的结构化数据。今天它还存储多结构化数据,如XML,JSON,网络日志,以及这个数据以及其他数据在仓库中的所有操作方法。数据也可以被存储在一个组合的行和列的格式,从而提高公司的灵活性,性能,效率和存储效率。
所以今天的数据仓库给了公司部署的灵活性,且可以让公司选择数据仓库是在本地还是在云端,是公有化还是私有化。
Imad Birouty
Director of Product Marketing
Teradata
预测:在云中的数据处理和分析将成为一个要求。
云已经从一个实验沙盒中出来并且成为企业基础设施的一个关键部分。越来越难找到一个企业不使用云应用或云基础设施。如果没有关于如何利用云的策略,几乎是不可能成为一个可信的CIO的。这导致了越来越多的数据在云端产生以及存储——大部分人估计同意云上存储的数据份额将将迅速超越(或已经超越)内部的数据。
我们正在接近一个转折点,在数据和云服务驱动演变,这将使它有一个基于云的数据仓库和分析解决方案的必要性。基于云的解决方案将帮助企业扩大对数据的访问和分析,而且也提高了他们的数据敏捷性。利用云计算的灵活性和成本模型,这些解决方案将提供需求的性能以及对不同数据的自然理解来支持大范围的分析,且无物业管理费用和传统产品成本。
Jon Bock
Vice President of Products and Marketing
Snowflake
预测:大数据项目将启动数据仓库优化,最终导致管理数据作为一种资产。
数据仓库达到其容量的速度太快,更多的数据和更多类型的数据的需求迫使IT进行非常昂贵的升级。进一步使问题复杂化的是,许多组织没有一个管理他们的数据生命周期策略。许多数据仓库中的数据被闲置或不经常使用的的情况并不少见,或者说太多的计算能力是被ELT过程消耗的。因此,我们看到许多组织采用新的大数据技术,如Hadoop,从传统的数据库和仓库中卸载数据。
衡量大数据项目资源技能的最佳方式是利用现有的开发者和分析师已经熟悉和使用新技术的工具,如Hadoop。这就是为什么Informatica的数据集成和数据质量工具运行在Hadoop以及为什么我们看到其他供应商提供基于hadoop的SQL(结构化查询语言)能力。大多数的数据分析和数据工程师熟悉SQL,世界上大约有100000多名训练有素的Informatica开发者在用Hadoop建立数据管道。
一旦组织有Hadoop,他们可以建立一个“数据湖泊”来管理和处理新的数据类型,如机器的日志文件,社会媒体或更长的时间范围(例如,年、月)的交易数据。然后,问题转移到将数据作为公司资产进行治理和管理。这,反过来,需要数据安全,数据沿袭,主数据管理,搜索和更多的自助服务工具,企业用户可以用更敏捷的方式访问和分析数据。这就是为什么我们还看到首席数据官(CDO)的出现,使公司有纪律,管理他们的数据和使业务增长。
John Haddad
Senior Director, Big Data Product Marketing
Informatica
转载请注明:数据分析 » 数据仓库的未来:6个专家分享了他们的预测(下)