本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

数据挖掘基本面:数据挖掘Khabaza的9大定律

数据挖掘 cdadata 3215℃

数据挖掘基本面:数据挖掘Khabaza的9大定律

有一次,术语“数据挖掘”只用于描述使用揭示有用的数据模式的创新方法商务人士的特定新文化。数据矿工的工具是不同于传统培训的分析师截然不同。当你听到“数据挖掘”,你可以肯定知道是什么意思了。

今天,术语“数据挖掘”抛出周围很随意地,它可以被用来描述使用现代模式识别方法到数据库分析师作出的SQL查询的业务人员任何东西。由于数据挖掘的兴趣的增长,很多人开始宣称,“我们也一样!我们已经得到了数据挖掘,太!“这一改革已带动谁不想被排除在数据挖掘党的厂商,但又不想投资于新的工具和流程,无论是。

很多今天所传递的数据挖掘是不超过报告更多 -描述已经发生的事,但不是在某种程度上被揭示什么是可能发生的下一个。

它的时间来恢复和接受数据挖掘的真谛 -让人们业务知识发现数据有用的模式,提取的信息,他们可以用它来 ​​了解,影响和改善业务流程。数据挖掘哲学的心脏已经表现最好的数据挖掘,汤姆Khabaza,在他现在的经典之作先锋“数据挖掘的9法律。”

最近,我已经看到了其中的一些贴在点点滴滴的讨论,没有提及谁规定他们如此简洁,使他们在数据挖掘界知名的人。这是一个耻辱,因为我们有很多来自审查9法律全套学习,因为汤姆Khabaza是一个创新者,你应该知道。他是最早的一个数据矿工的克莱门汀数据的开发者之一挖掘工作平台。当你听到今天的电信和执法广泛使用数据挖掘的,知道这是汤姆Khabaza谁第一个打破了地面。

这里是汤姆Khabaza的概述“数据挖掘的9法律。”

数据挖掘的第一定律,即“企业目标法”:企业的目标是每一个数据挖掘解决方案的由来

我们探索数据查找信息,帮助我们经营业务的更好。如果不是这是所有的业务数据分析的口头禅?

这是显著,这项法律是第一位的。每个人都应该明白,数据挖掘是有目的的过程。真正的矿工没有在泥土玩,他们遵循有条不紊的过程,揭示特定的有价值的材料。数据挖掘也遵循寻找什么是有价值的他们有条不紊的过程。

引用汤姆Khabaza:“ 数据挖掘主要不是技术,它是一个过程,它在其心脏的一个或多个业务目标。如果没有商业目的没有数据挖掘。 “

数据挖掘的第二定律,即“商业知识法”:企业知识是中央的数据挖掘过程中的每一步

有一个可怕的误解左右浮动 – 数据挖掘不需要调查者知道。这是数据挖掘的真正的哲学的误解,即发现有用的模式数据可以而且应该放在业务的人谁不经过正式培训的统计人员的手。数据挖掘是为了让电于民 – 商务人士 – 谁使用他们的商业知识,经验和见解,以及数据挖掘方法,寻找意义的数据。

数据挖掘的第三定律或“数据准备法”:数据准备是有一半以上的每一个数据挖掘过程

这应该是毫不奇怪的人有经验处理数据,无论是作为一个数据挖掘,传统的分析,或在另一个角色。然而,这是另一个领域,有神话周围的数据挖掘,这意味着数据挖掘克服数据质量和完整性的所有问题。这个神话是由一些长期被遗忘的数据挖掘产品的供应商传播,但数据挖掘社会仍在努力正视听。数据挖掘需要良好的数据。

但还有更给它不仅仅是需要良好的数据。数据处理是数据挖掘的过程中的一个重要组成部分。以下是汤姆Khabaza如何解释它:

“之所以比数据的状态更深:数据准备过程中,数据挖掘定制问题的空间。有两个方面这种“问题空间塑造”。首先,数据挖掘,必须把数据以适当的形式进行算法在所有使用-对于很多算法,这意味着每个实例一行。其次,数据矿工可以更容易的算法来寻找通过加强与有用的信息数据或通过将信息转换成有用形式的溶液。例子包括计算领域,分档和计算日期和时间差。“

数据挖掘的第四定律,“NFL-DM”:正确的模式对于一个给定的应用程序只能通过实验发现,

(NFL-DM =“天下没有免费的午餐的数据挖掘”)

在这里,我们可以开始了一些非常丰富多彩的讨论。在这篇文章的末尾,我会领你到一些地方,你可以阅读和参加这种讨论。现在,重要的是,你只需明白,实验的核心是数据挖掘的理念和实践。

数据挖掘的第五定律,或“金丝”法“:总有一些模式

数据挖掘的实践经验是有用的模式是一致发现,当数据进行了探索。

[这里所说的“金丝”指的是大卫·沃特金斯,也是一个著名的数据挖掘和克莱门汀的开发商之一。]

数据挖掘的第六定律数据挖掘放大感知的业务领域

该法讲的数据挖掘算法和流程的好处 – 他们带来的光图案中原本已经未被发现的数据。

数据挖掘第七定律或“预测法”:预测由当地推广增加信息

这是我认为最有挑战性的,我自己的心态,以澄清法律,但在这里说:

数据挖掘技术为我们提供了方式来看待,其结果是未知的情况下,并找到相似之处,其中的结果是已知的过去的案例。通过了解这些相似之处,我们获得了有关新病例可能结果的信息。

数据挖掘第八定律,或“价值规律”:数据挖掘结果的价值不因预测模型的准确性和稳定性决定

这个过程的真正价值在于填补业务需求。准确度或稳定性的模型是不错的,当然,也可以是比的问题不那么重要,如预测值对业务的重要性,有意义的见解,或便于把使用的预测的。

数据挖掘第九定律,还是“法律变化”:所有的模式都可能发生变化

有很大的当今商业价值模型可能是另一位刚刚明天模式。企业没有坐以待毙,也不能数据挖掘。

你有他们 – 那格言总结了目前的想法,以及数据挖掘的一些渊源。

转载请注明:数据分析 » 数据挖掘基本面:数据挖掘Khabaza的9大定律

喜欢 (0)or分享 (0)