数据挖掘十大经典算法(9) 朴素贝叶斯分类器 Naive Bayes
贝叶斯分类器
贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。目前研究较多的贝叶斯分类器主要有四...
cdadata
10年前 (2015-06-30) 3430℃
1喜欢
数据挖掘十大经典算法(8) kNN: k-nearest neighbor classification
邻近算法
KNN算法的决策过程
k-Nearest Neighbor algorithm
右图中,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于...
cdadata
10年前 (2015-06-29) 3744℃
0喜欢
数据分析软件_数据分析软件工具都有哪些
数据分析也好,统计分析也好,数据挖掘也好、商业智能也好都需要在学习的时候掌握各种分析手段和技能,特别是要掌握分析软件工具!我曾经说过,沈老师的学习方法,一般是先学软件开始,再去应用,再学会理论和原理,因为是老师,再去教给别人!没有软件的方...
cdadata
10年前 (2015-06-28) 6057℃
0喜欢
数据挖掘十大经典算法(6) PageRank
PageRank是Google算法的重要内容。2001年9月被授予美国专利,专利人是Google创始人之一拉里·佩奇(Larry Page)。因此,PageRank里的page不是指网页,而是指佩奇,即这个等级方法是以佩奇来命名的。...
cdadata
10年前 (2015-06-27) 2468℃
0喜欢
数据挖掘十大经典算法(5) 最大期望(EM)算法
在统计计算中,最大期望(EM,Expectation–Maximization)算法是在概率(probabilistic)模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量(Latent Variabl)。最...
cdadata
10年前 (2015-06-26) 3518℃
0喜欢
数据挖掘十大经典算法(4) The Apriori algorithm
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称...
cdadata
10年前 (2015-06-25) 4016℃
2喜欢
数据挖掘十大经典算法(3) Support vector machines
支持向量机,英文为Support Vector Machine,简称SV机(论文中一般简称SVM)。它是一种監督式學習的方法,它广泛的应用于统计分类以及回归分析中。
支持向量机属于一般化线性分类器.他们也...
cdadata
10年前 (2015-06-25) 3132℃
1喜欢
数据挖掘十大经典算法(2) The k-means algorithm
k-means algorithm算法是一个聚类算法,把n的对象根据他们的属性分为k个分割,k < n。它与处理混合正态分布的最大期望算法很相似,因为他们都试图找到数据中自然聚类的中心。它假设对象属性来...
cdadata
10年前 (2015-06-25) 3675℃
1喜欢
数据挖掘十大经典算法(1) C4.5_决策树算法
机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出...
cdadata
10年前 (2015-06-25) 2887℃
1喜欢
数据挖掘十大经典算法_数据挖掘算法
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM...
cdadata
10年前 (2015-06-23) 2919℃
0喜欢