本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

数据分析需谨慎,小心别被数据分析图表表忽悠了

数据分析 cdadata 3588℃

数据分析需谨慎,小心别被数据分析图表表忽悠了

文章开头,先展示三张图表,你只要大致看看就行。
数据分析需谨慎,小心别被数据分析图表表忽悠了 

2008年美国总统大选,奥巴马(民主党,蓝色)VS.麦凯恩(共和党,红色)

数据分析需谨慎,小心别被数据分析图表表忽悠了 

休假一周员工比例的变化趋势。X轴代表年份,Y轴代表休够一周假期的员工比例。

数据分析需谨慎,小心别被数据分析图表表忽悠了 

累计增长柱状图。X轴代表年份,Y轴代表收入金额。

接下来进入正题。相比于密密麻麻的表格,相信大多数人都更喜欢图表,因为图表可以把密密麻麻的数据更加直观清晰地展现在你面前,而且通过使用不同类型的图表可以展现不同方面的数据特点,比如用饼状图来看占比,用折线图来看趋势,用双条形图来看对比,用甘特图来看指标达成……

图表以其清晰直观,甚至生动有趣的展现形式受到了数据分析以及查看人员的喜爱与信任。但是小心了,就是因为这份信任,长久以来在人们脑海中形成了“直观,第一眼判断”等思维定势,总觉得一眼看上去是这样,就不会错了,殊不知,图表即使是按照真实数据展示的,但是它所传达的信息却并不是“你看上去,以为”的那样。

不敢相信吗?那现在请你回顾一下文章开头的那三张图。

首先是第一张显示奥巴马和麦凯恩PK的图,第一眼看过去代表共和党麦凯恩的红色远超过蓝色占据了地图的大部分位置。但是所有人都知道2008年是奥巴马赢得了选举的胜利。你以为这个颜色标反了? 并没有。颜色占据的是面积,但却不代表人口密度和权重。就像非洲的一大片沙漠占地面积非常大,但是却荒无人烟。某些跨国公司经常用这样的手段制作图表来夸大其海外业务范围(只在某国几个城市有客户但是却把那一整个国家涂上了颜色)。正确的表示方法应如下图:

数据分析需谨慎,小心别被数据分析图表表忽悠了

接下来回顾第二张图。第二张图展现的是休假天数达到一周的员工人数。第一眼看到这个下降趋势,不小心就会判断为现在已经没有人需要休假一周了。很显然,这不科学。仔细看这张图,会发现这个Y轴是被截断的。增大斜率或者扩大数据之间的距离就是用数据分析忽悠迷惑人的另一类常见手段。正确的表示方法应如下图:

数据分析需谨慎,小心别被数据分析图表表忽悠了

最后看第三张图。或许你可以识破它的把戏。这是一张累计增长柱状图。第一眼看过去,柱状图的高度逐年升高,应该是每年都是增长的吧?但你注意到图表标题的“累积”二字了吗?累积,也就代表着每个柱状图的数据都是本年增长加上前年算出的前几年的总增长。这样说是不是有点拗口?看看下面这张正确的图表你就明白是什么意思了。

当每年增长被单独表示,业绩下滑的趋势就清晰浮现出来。

数据分析需谨慎,小心别被数据分析图表表忽悠了

看完这三个案例,有没有一点心有余悸的感觉?有没有在反思以往根据图表做出决策的时候是否被图表误导做出来错误的判断?那么下次你在查看图表数据分析的时候,就切记不可以再掉以轻心,被图表中的颜色和趋势的“直观”展现所误导。

转载请注明:数据分析 » 数据分析需谨慎,小心别被数据分析图表表忽悠了

喜欢 (1)or分享 (0)