数据分析的陷阱_大数据分析陷阱
到目前为止,有很多案例显示了因为不正确的统计数据分析而使人们对风险产生了误解,体现出商业决策不能完全由数据驱动的结论。它提醒企业对互联网时代的数据分析有清醒的认识,不能盲目迷信大数据,否则就会迷失其中。
大数据分析的倡导者竭尽全力倡导“数据驱动”,理智的人应该在正确理解两个问题的基础上理性面对。首先,业务人员在具体决策时是不是真正了解了相关数据,并且用切实可行的方式对这些数据向管理人员进行展示了?其次,所有决策都应该在收集所有数据后自动完成吗?
那么,我们就来看一个例子。它解释了大多数人只能得到一小部分的数据,但很容易因为误用产生错误的结论。
由于美国发生了9·11事件,导致很多美国人选择不再乘坐飞机,而是用驾车的方式完成长途旅行,因为他们害怕类似的事件在自己身上重演。公路行驶距离从而提高了5%,然而,他们忘记了,因为道路交通事故而导致的死亡人数也在急剧攀升,在9·11时间发生以后的这一年中,这个人数甚至超过以往五年的平均水平。根据有关机构的数据分析计算,由于道路交通事故死亡的人数约是空难的7倍之多,当然,这其中已经包括了9·11事件造成伤亡的人数。
由于对伤亡事件产生的主观反应,美国人完全忽视了有效的统计风险数据分析结果,那就是乘坐飞机比汽车的安全系数要高得多。
上面的例子表明了很多人无法掌握正确的数据分析方法。事实上,即使经过科学训练,只有极少数人在这方面能得到正确的理解。因此,很多人其实对不同的风险的表达和不确定性缺乏正确的认识,同时也缺乏一定的数据分析方法培训。所以无法正确利用数据分析,就很可能会在对一些概念的理解上,轻易就会落入“偏见“或”先入为主“的陷阱之中。
当我们从掌握简单计算就足够应付的移动小数据量世界中过渡到一个完整的大数据分析的世界时,对数据产生误解的几率就会迅速增长。无论多么强大的自助式商业智能,都不是能很容易就能扩展到自助服务的业务分析中去。企业用户需要加强在理解和表述数据分析结果方面的能力。
在当今世界,充满了不确定性,有一些事件是无法预测的,以数据分析为基础得出的结果只能帮助人们进行一个决定。2008年的全球金融风暴表明了过度依赖风险预测模型是具有毁灭性的,因为有一些突发状况并不在模型参数的覆盖范围内,这样就使原本的数据分析毫无价值。
在决策过程中,完全依靠数据分析工具本身是极其危险的。决策者的价值在于他能够自主了解业务环境。这些“了解“的内容并不能完全被参数所描述,它们大多是基于计算机处理的模型所无法了解的和进行模拟的”思维“,这是人类最具价值的东西,需要充分利用和珍惜。
转载请注明:数据分析 » 数据分析的陷阱_大数据分析陷阱