数据湖泊和网络优化:电信和大数据下一步做什么
关系型数据仓库服务的通信服务供应商以及在过去,但现在是时候开始考虑以后的行和列。非结构化数据将是燃料,在不久的将来,权力的风险管理和决策。并利用各种数据,以充分发挥其潜力,我们需要存储,访问和分析数据的新方式。
数据湖泊和沙箱
一个数据湖(企业数据中心) -通常基于一个庞大的数据存储库的Hadoop架构,并装在一个商用硬件集群上-不仅可以解决数据存储,集成和可访问性的问题,而且还可以更好的实时分析和决策-making。信息(结构化,半结构化和非结构化)存储在数据湖边保留其原始格式和原始的属性中,以确保妥善保存以备将来使用。
您还可以创建一个更明确的数据湖 – 通常被称为一个数据沙盒 – 用于定义的范围的项目。
一个潜在的陷阱要知道你潜入创建数据湖前的是,这些部署中,可以最好地使用数据分析专家。一个巨大的量与狂野不羁的元数据的非结构化数据可以为普通用户是一个挑战。沙箱是测试数据湖泊环境的好方法,并且也可以使用以获得许多的数据湖的优点,而无需大规模迁移项目。
安全,也可以在一个数据湖的问题。随着IT和数据隐私的团队讲,以确定哪些数据可以进入湖泊和如何可以防止未经授权的用户的信息。法规遵从性问题也可能出现。你需要制定一个过程,保持个人控制和保护身份数据,或运行数据泄露的风险。企业级解决方案,可提供您需要确保数据湖工具,但每家公司都需要确定自己的可接受的暴露风险,并相应地管理其数据。
响应网络管理
一个初始数据湖项目的CSP考虑的是一个负责任的网络管理措施。你的公司可能已经这样做是为了一个或大或小的程度,但数据湖将使分析师巨额通过交换机,路由器和其他基础设施产生的历史和实时数据的工作,了解大的网络图片当时和现在。
该信息可以被关联到发现趋势,并确定以斜坡上升整体效率全线模式和可预测的行为。你可能会选择以一个测试项目,例如确定是否和在何处添加基础设施满足SLA,在实时分配带宽,以质量的服务(QoS)的问题,如延迟和可靠性或预测网络组件故障它们之前发生。
数据,你可以信任
很显然,当你正在根据你的数据告诉你的业务的变化,你要知道,你可以相信data.You可能还想说话谁在做多的数据分析,在你们公司来衡量人他们有多么确定数据质量了。难道他们有些依赖于数据的血统?难道他们发现在审查其他如何分析师与同一数据集工作的价值?询问你的分析人员需要或者可能不需要在元数据方面是应该考虑的一个关键要求。
数据湖泊适合那些谁可以从信息结构化,半结构化和非结构化数据源理清从多种来源获取的数据的上下文偏见和舒适融合和协调的需要。
选择正确的架构
Apache的Hadoop的是非常适合于数据湖泊或沙的场景。它运行在商品硬件,它提供了最佳的存储邦换了降压并处理海量数据-任何类型的-非常有效。
Hadoop的企业分布增加更有效的备份选项和关键任务的鲁棒性。
Hadoop的还提供了可以建立在一个平台上。当我们从打折驱动的竞争,搬走,电信运营商将越来越多地依赖于利用大数据来紧紧目标客户的产品。当我们走向所有通信服务之间的更加无缝集成,来自所有这些来源流动的数据将作为一个很好的基础。
转载请注明:数据分析 » 数据湖泊和网络优化:电信和大数据下一步做什么