决策树—信息增益,信息增益比,Geni指数的理解
决策树 是表示基于特征对实例进行分类的树形结构
从给定的训练数据集中,依据特征选择的准则,递归的选择最优划分特征,并根据此特征将训练数据进行分割,使得各子数据集有一个最好的分类的过程。
决策树算法3要素...
cdadata
7年前 (2017-10-24) 7647℃
0喜欢
spss进行主成分分析图文完整教程
关键词:spss进行主成分分析、用spss进行主成分分析、spss主成分分析、spss主成分分析步骤、spss主成分分析结果、spss主成分分析案例、数据分析
主成分分析是将多个指标化为少数几个不相关的综合指标,并对综合指标按照一定的规...
cdadata
7年前 (2017-10-24) 42832℃
47喜欢
Spss K-means聚类分析案例——某移动公司客户细分模型
关键词:kmeans聚类案例分析、聚类分析k means案例、kmeans聚类算法案例、数据分析师
聚类分析在各行各业应用十分常见,而顾客细分是其最常见的分析需求,顾客细分总是和聚类分析挂在一起。
顾客细分,关键问题...
cdadata
7年前 (2017-10-24) 8280℃
2喜欢
SPSS聚类分析:用于筛选聚类变量的一套方法
关键词:spss聚类数据筛选、spss聚类分析、数据分析师
聚类分析是常见的数据分析方法之一,主要用于市场细分、用户细分等领域。利用SPSS进行聚类分析时,用于参与聚类的变量决定了聚类的结果,无关变量有时会引起严重的错分,因此,筛选有...
cdadata
7年前 (2017-10-24) 5522℃
0喜欢
R中dataframe常见操作
在使用R做数据挖掘时,最常用的数据结构莫过于dataframe了,下面列出几种常见的dataframe的操作方法。
1.查看数据
head(dataframe) # 查看数据前10行
tail(dataframe) # 查看数据后10行
...
cdadata
7年前 (2017-10-16) 10228℃
3喜欢
1.回归的多面性
回归类型
用途
简单线性
个量化的解释变量来预测一个量化的响应变量(一个因变量、一个自变量)
多项式
一个量化的解释变量预测一个量化的响应变量,模型的关系是
n阶多项式(一个预测变量,但同时包含变量的幂)
多元线性
用两个或多个量化的解释变量预...
cdadata
7年前 (2017-10-16) 6647℃
8喜欢
基于R语言构建的电影评分预测模型
关键词:电影票房预测模型、R语言、数据分析
电影评分系统是一种常见的推荐系统。现在使用R语言基于协同过滤算法来构建一个电影评分预测模型。
一,前提准备
1.R语言包:ggplot2包(绘图),recommenderlab包,...
cdadata
7年前 (2017-10-02) 8315℃
4喜欢
使用R语言对照片人物进行情绪分析
人脸提供关于情绪的各种信息。微软于2015年12月推出免费服务,分析人脸,进行情绪检测。
检测到的情绪是愤怒,蔑视,厌恶,恐惧,幸福,中立,悲伤和惊喜。 这些情绪被理解为与特定的面部表情跨文化和普遍传达。
Emotion API将图...
cdadata
7年前 (2017-09-30) 5180℃
2喜欢
R语言:再谈REmap包
关键词:r语言remap包、R语言迁移图、R语言颜色等级图、R语言热力图、R语言气泡图
之前写过一篇关于Remap的文章,原文链接为:http://www.cdadata.com/17939
但有许多网友都存在不同的问题,在我的微信公众号后台或博客留言,...
cdadata
7年前 (2017-09-27) 6549℃
2喜欢
R语言如何多行注释
关键词:R如何注释多行、R如何多行注释
R语言本身并没有类似C/ C++/ JAVA这些语言一样提供 像 /* ….. */ 一样的多行注释,但我们也有其他方法可以达到这种方法。
一. if语句
我们可以通过一个if语句,...
cdadata
7年前 (2017-09-26) 14494℃
2喜欢