驱动分析的价值来自于新数据
其中,以提高您的分析的能力的最佳途径是包括一些全新的信息。利用新的信息可以使巨大飞跃的成效,预测能力,和你的分析精度。大部分时间,精力花在试图通过使用以更有效的方式存在的数据和信息增量改进结果。这是没有那么多,因为专业人士的分析并没有意识到新数据可以是强大,因为它是因为新数据只是偶尔可用。当一个新的和不同的数据源是可用的,但是,你会好得多到你的注意力马上转移到新的数据。
对我来说,这得到以为什么大数据是如此强大的心脏,并得到这么多的关注。我相信量,大数据,这得到这么多的关注,对种类和速度方面都是次要的。正如我在之前已经讨论的博客和文章,最重要的’V’与大数据相关联的价值。其他’V的“只在相关的价值存在。那么是什么推动了对大数据的价值?请继续阅读。
事实是,许多大的数据源包含要么没有提供,在过去,还是只提供给需要通过更努力的手段程度要小得多信息。例如,从您的网络浏览活动的信息很容易捕获和分析今天。在过去,得到类似数据的唯一途径是通过在一个非常小规模的执行非常昂贵的研究项目。在实践中,信息只是没有用,因为它太昂贵。
让我们快进到专业的分析试图解决一个共同的业务问题的今天,如客户流失或下一个最好的报价。当可用的数据源是固定的,最努力的进入尝试新的建模方法,新的变量定义和新的方法来处理稀疏或丢失的数据。这些努力可能会导致增加的动力,但通常只提供很小,增量收益。在与上线了很多钱的情况下,这样的收益是没有什么不可小觑。然而,事实是,你吹最后结果出来的水的可能性是相当低的。
现在让我们想象一下,同样的分析专业使用完全相同的建模方法,变量定义和数据准备今天为他或她用昨天。但是,加入到分析是从包含完全新的信息的新的数据源的新变量。假设浏览历史记录现在可帮助识别客户的下一个最好的报价,例如。由于浏览历史记录提供不可用传统的数据源的喜好和未来的购买意向信息,解析专业可以实现巨大收益的分析能力。使用相同的老方法,即使,但随着新的数据,这是真的。
我的观点是,所有关于什么是最好的分析方法是小题大做,以及如何最好地处理缺失和脏数据,真正的大的收益来自于寻找新的信息包括。回想统计101和主成分分析和正交向量的概念。虽然几十个变量可以提供给分析,该变量通常包含广泛重叠的信息。大致相同的信息已经知道会不会增加多少价值的新变量。但是,任何时候你可以添加完全或大部分不同的包含的信息方面的变量,有一个很大的价值的潜力。
我建议读者的作用是不断找出新的数据源。而不是把所有的精力投入到调整现有的建模方法与现有的数据,重点精力放在一个新的数据源每次你得到机会。这就是你会发现大的收益。当你意识到你的新数据的初始收益,你可以回去调整,但我相信,让只有当你用尽你的能力,包括额外的数据源的意义。
这是价值主张大数据的核心。许多组织突然有多个新的,未经测试的套可用于数据整合到他们的分析过程。正确使用,这个数据可以提供一个巨大的竞争优势和真正的金矿价值。不要错过你的机会获得成功。
让我们近距离用思想实验。假设我给你一个世界级的分析专业人士访问所有可用的工具,但谁将会被限制为只使用现有的数据。另一种选择是固体,但不是世界级的,专业的分析与获得公正的标准工具。这个人,但是,将被允许将出现保存价值的一些新的数据源。
我希望你能参加2 次在1选项ST。理想情况下,你将有一个世界级的专业分析与工作的新数据,当然,但是思想实验说明了这一点。无论是专业解析如何好,以及如何花哨的工具,在新的和不同的数据的内在价值将赢得在大多数情况下。
转载请注明:数据分析 » 驱动分析的价值来自于新数据