数据挖掘模型:行为细分和分类
两个的数据挖掘模型中最常见的应用是用于行为细分和分类。在行为细分,聚类模型来分析客户的行为模式,并确定可操作的分组与差异化的特点。分类模型,用于预测事件的发生(如客户流失,购买附加产品等),并估计事件的倾向。分类(或倾向)模型通常用于优化直接营销活...
cdadata
10年前 (2015-07-13) 3790℃
1喜欢
实现挖掘大数据价值有哪些因素
很多公司都在探索如何挖掘大数据的价值,但有一类公司不得不擅长做这项工作,那就是:数据分析提供商。这些公司的商业模式决定了其必须能够有效、持续地提供客户愿意买单的数据产品和服务。下面将分享一家伟大的数据分析提供商- ComScore,如何...
shujufenxi
10年前 (2015-07-13) 2624℃
0喜欢
数据挖掘的基本要素_数据挖掘具体要做什么
数据挖掘的基本要素:根据维基百科,“在经营理念上,本质是,对于任何特定种类的实体,有一组特征或属性的所有这一切都那样的任何实体必须具备的看法。“我不求数据的柏拉图形式矿业,但我求清晰的地方往往缺乏。有周围的数据挖掘是如何从相关的领域,如统...
cdadata
10年前 (2015-07-10) 3906℃
1喜欢
数据挖掘之七种常用的方法_数据挖掘方法
数据挖掘又称数据库中的知识发现,是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程
利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、...
shujufenxi
10年前 (2015-07-07) 3195℃
2喜欢
数据挖掘十大经典算法(10) CART: 分类与回归树
如果一个人必须去选择在很大范围的情形下性能都好的、同时不需要应用开发者付出很多的努力并且易于被终端用户理解的分类技术的话,那么Brieman, Friedman, Olshen和Stone(1984)提出的分类树方法是一个强...
cdadata
10年前 (2015-07-01) 3425℃
0喜欢
数据挖掘十大经典算法(9) 朴素贝叶斯分类器 Naive Bayes
贝叶斯分类器
贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。目前研究较多的贝叶斯分类器主要有四...
cdadata
10年前 (2015-06-30) 3430℃
1喜欢
数据挖掘十大经典算法(8) kNN: k-nearest neighbor classification
邻近算法
KNN算法的决策过程
k-Nearest Neighbor algorithm
右图中,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于...
cdadata
10年前 (2015-06-29) 3744℃
0喜欢
数据挖掘十大经典算法(7) AdaBoost
Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器 (强分类器)。Adaboost算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个...
cdadata
10年前 (2015-06-28) 3115℃
1喜欢
数据挖掘十大经典算法(6) PageRank
PageRank是Google算法的重要内容。2001年9月被授予美国专利,专利人是Google创始人之一拉里·佩奇(Larry Page)。因此,PageRank里的page不是指网页,而是指佩奇,即这个等级方法是以佩奇来命名的。...
cdadata
10年前 (2015-06-27) 2468℃
0喜欢
数据挖掘十大经典算法(5) 最大期望(EM)算法
在统计计算中,最大期望(EM,Expectation–Maximization)算法是在概率(probabilistic)模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量(Latent Variabl)。最...
cdadata
10年前 (2015-06-26) 3517℃
0喜欢