大数据是各地目前最大的流行词汇,我想这是有道理的,开始我新的’大数据宗师“列有一个帖子可以追溯到基础知识和建立什么大数据真的是,什么是不和为什么它关系到每一个人。
有一件事是肯定的:大数据将影响每个人的生活。话虽如此,我也觉得术语“大数据”是不是非常明确,并且,事实上,没有得到很好的选择。我也觉得这个词完全是过度炒作,但这只是与领土(软件供应商和咨询公司需要这些流行语产生兴趣并销售新产品和服务)。让我用这篇文章来解释什么是大量的’大数据’嗡嗡声的背后,希望神秘化一些炒作。
介绍大数据
基本上,大数据是指我们收集和分析大量数据,我们现在在生成的世界的能力。驾驭数据的不断扩大量的能力完全改变我们理解其中的世界,一切的能力。在捕获和分析大数据的进步使我们能够如解码人类DNA在几分钟内,找到治愈癌症,准确地预测人类行为,箔恐怖袭击,找准营销力度,预防疾病和这么多。
也许你会问:那么,什么是新来的?没有公司和组织捕获和分析数据很长一段时间?是的,但有三件事情正在发生变化的时刻,正在对“大数据”真正的现象:
- 在此,我们生成新的数据速率是可怕的 – 我称之为我们的世界的“datafication”。
- 我们产生更复杂的数据
- 我们来分析数据的能力已转变在最近几年。
我们这个世界的完整Datafication
一天,我们的世界又一天充满了越来越多的数据和数据增长的步伐正在按周周加速。目前正在发生在我们生活的各个方面的数据。这里只是一些例子,说明我的意思是我们这个世界的datafication:
- 我们越来越多地离开了我们的谈话数字记录:电子邮件存储在企业系统中,我们的社交媒体了,日期和申请电话交谈是数字化和存储。
- 我们越来越多的活动都数字记录:大部分事情由我们来做一个数字世界留下痕迹的数据。例如,我们的库巴记录了我们正在寻找什么,我们的网站访问,网站日志,我们如何通过他们点击,以及什么时候我们买,分享或类似的东西。当我们读电子书或听数字音乐设备将收集(和共享)对我们正在阅读和收听的时间和频率,我们这样做的数据。或者当我们使用如信用卡进行支付的交易都被记录。
- 大量的照片和视频,现在数字捕获和储存。试想想的数百万每天捕获小时闭路电视录像。此外,我们采取我们的智能手机更多的视频和数码相机,导致大约100个小时的视频往上加载到YouTube每分钟又像200000照片添加到Facebook的每60秒什么的。
- 公司和组织正在创造庞大的数据储存库,保持一切是怎么回事的数字记录:试想每天都在我们的财务系统,库存管理系统,订单系统,销售交易系统和人力资源系统生成的数据。这些数据存储库是按分钟增长。
- 我们使用产生日益增长的智能设备和传感器的数据:我们的智能手机跟踪我们在哪里以及我们怎么快速移动时,也有在我们的海洋跟踪温度和电流传感器的位置,也有我们的汽车传感器监视我们的驱动,有包装上的传感器和跟踪物品,因为它们是沿供应链的运托盘。智能手表,谷歌玻璃和计步器收集数据。比如我穿的最多的乐队,告诉我,我有多少采取的步骤,我已经烧毁的每一天,以及如何以及我睡每天晚上,等热量很多设备都是现在互联网功能,使他们的自我生成和共享数据。智能电视和机顶盒盒,例如,能够跟踪你正在看,多长时间,甚至发现有多少人在电视机前坐。
我相信,你所得到的点。的数据量正在以一个货运方面速率。谷歌执行董事长埃里克·施密特把它给一个观点:“从文明的曙光,直到2003年,人类产生的数据五个艾字节。现在我们设计出五个艾字节每两天…的步伐正在加快。“
不仅更加的数据,但更复杂的数据
所以,是的,我们正在生成的数据量难以想象的。这种情况已经改变的另一件事是,我们产生新的和更复杂的数据类型,如使用社交媒体说话(#标签,LOL等)在“大数据世界的对话,视频和照片图像,对话的数字电话记录“我们谈了4 VS表征大数据:
- 音量 -产生每秒的海量数据
- 速度 -在这新的数据,并且围绕移动速度(信用卡欺诈检测是一个很好的例子,数以百万计的交易将在几乎实时检查不寻常的图案)
- 品种 -日益不同类型的数据(从财务数据到社交媒体的饲料,从照片到传感器的数据,从视频采集到录音)
- 准确性 -数据的混乱(只是觉得Twitter的职位与哈希标签,缩写,错字和口语语音)
因此,我们比以往任何时候都更多的数据,在更复杂的格式,即经常快速移动的质量参差不齐 – 为什么会改变世界?原因是,我们现在有技术带来的所有这些数据一起分析它,这是我们永远不会做了。
我们现在可以分析并提出“大数据”的意识
在过去,我们有传统的数据库和分析工具无法处理非常大的,凌乱的,非结构化和快速移动的数据。我们现在有新的工具,让我们打破分析成不同的部分,其中个人电脑和处理器进行宏观分析的一小部分来分析海量的数据。在并行使用电脑的一大簇运行更小的任务进行处理大型数据集的任务。在我的下一个职位,我将进入更多的细节,并讨论为什么“大数据分析”,而不是“大数据”这样才是真正的游戏规则改变者。在此期间,让我离开你的今天是怎么大数据中使用的一些现实生活中的例子:
- 美国联邦调查局从社交媒体,CCTV摄像机,电话和文本追查罪犯和预测下一个恐怖袭击合并数据。
- Facebook正在使用面部识别工具来比较你了装载了他人的找到你的潜在的朋友(见我的照片后利用大数据工具如何Facebook正利用你的私人信息)。
- 政客们利用社交媒体分析,以确定他们有竞选最难赢得下次选举。
- 视频分析和棒球或足球比赛的传感器数据被用来改善的球员和球队的表现。例如,你现在可以买一个棒球有超过200个传感器在里面,这将使你如何提高你的游戏的详细反馈。
- 像Lady Gaga的艺术家都在使用我们的聆听喜好和序列数据,以确定最流行的播放列表为她现场演出。
- 谷歌的自驾车车正在分析来自传感器的数据和照相机的一个巨大量实时地留在道路上安全。
- 在那里我们的手机和如何快速移动的GPS信息现在用于提供实时的交通向上日期。
- 公司使用的是Facebook和Twitter的职位情感分析来判断和预测销量和品牌资产。
- 超市正在将他们的忠诚卡数据与社交媒体信息来检测和利用不断变化的购买模式。例如,很容易让零售商预测,一个女人怀孕只是根据不断变化的购买模式。这使他们瞄准孕妇促销婴儿相关的商品。
- 某医院设备,看起来早产儿和患病婴儿后产生每一次心跳的新鲜蒸汽。然后,它分析数据,识别模式。基于该分析系统现在可以检测感染24小时前的婴儿会显示出任何可见的症状,这使得早期干预和治疗。
最后的思考
最后,关于大数据没有讨论可能是不完整的提日益关注隐私。许多忧虑已表达了对零售商,信用卡公司,搜索引擎提供商和电子邮件或社交媒体公司如何使用我们的私人信息。然而,围绕大数据的隐私问题开始爆发与美国国家安全局(NSA)是如何收集和分析大数据,包括电话记录,并以百万计的美国人的社交媒体活动的启示由爱德华·斯诺登。但因为这是另一个巨大的问题,在自己的权利,我会解决这个问题在我的第三个职位。
转载请注明:数据分析 » 大数据到底是什么?为什么大数据会改变世界