R语言分析QQ聊天记录
关键词:数据分析、R语言分析、qq聊天记录分析
首先来说一下我们会用到的知识:
(1)正则表达式
(2)中文分词
(3)词频统计
(4)文本可视化
(5)ggplot2绘图
如果你对这几地方有不懂得地方可以在文末根据 推荐阅读 点击查看相关文章。
一.数据...
cdadata
7年前 (2017-09-21) 6289℃
0喜欢
Rwordseg包如何加载本地词典
关键词:搜狗词库、Rwordseg包、R语言
尽管Rwordseg对中文分词已经做得很好了,但有的时候还是不行的。我们可以加载本地词典。比如我们从搜狗官网上面下载下来的.scel词典,可以通过下面方法加载:
installDict("D:\\P...
cdadata
7年前 (2017-09-21) 3953℃
0喜欢
使用R语言进行中文分词
关键词:R语言中文分词、R语言数据分析、数据分析师
1.准备包
①rJava包
② Rwordseg包
③java环境
④搜狗词库(此为扩展词库)
Rwordseg包依赖于rJava包。由于Rwordseg包并没有托管在CRAN上面,而是在R-Forge上...
cdadata
7年前 (2017-09-21) 3490℃
0喜欢
李航《统计学习方法》笔记——R语言统计学原理到实现
关键词:数据分析、统计学学习方法、李航、数据分析师
最近在看李航的《统计学习方法》,在看的过程中自己整理了一份笔记
整理这份笔记耗时一个月,中间稍有断续,希望对各位ML爱好者有帮助啦。
笔记的内容包括:
1·书本某些证明的推导
...
cdadata
7年前 (2017-09-12) 5594℃
3喜欢
Efron的LARS算法
最近临时抱佛脚,为了报告一篇Group Regression的文章,研究了一下Efron于2004年发在Annals of Statistics里一篇被discuss的论文。这篇文章很长,有45页。加上后面一些模型方面大牛的discuss paper,一...
cdadata
8年前 (2017-06-13) 3114℃
0喜欢
用R进行文本挖掘与分析:分词、画词云
关键词:文本挖掘 分词、r语言数据挖掘、数据分析师、数据分析
要分析文本内容,最常见的分析方法是提取文本中的词语,并统计频率。频率能反映词语在文本中的重要性,一般越重要的词语,在文本中出现的次数就会越多。词语提取后,还可以做成词云,让词语的频...
cdadata
8年前 (2017-06-09) 4126℃
2喜欢
R语言做文本挖掘 Part3文本聚类
关键词:用r语言做文本挖掘、数据挖掘、r语言 文本挖掘 代码、r语言文本挖掘实例
Part3文本聚类
分类和聚类算法,都是数据挖掘中最常接触到的算法,分类聚类算法分别有很多种。可以看下下面两篇文章对常见的分类聚类算法的简介:
分类算法:...
cdadata
8年前 (2017-06-07) 3953℃
0喜欢
主成分分析(PCA)及其在R里的实现
关键词:R语言主成分分析、主成分分析、数据分析、r语言数据分析
主成分分析(principal component analysis,PCA)是一种降维技术,把多个变量化为能够反映原始变量大部分信息的少数几个主成分。
设X有p个变量,为n*p...
cdadata
8年前 (2017-06-02) 7245℃
1喜欢
MedCalc 15.10
关键词:medcalc 破解版、medcalc中文破解版、medcalc注册码、medcalc有mac版本么
MedCalc 是一个专门为医学工作者设计的医学计算器,功能齐全。它可以帮助医生快速作出普通的医学计算,从而对症下药。提供超过76种常用的规则...
cdadata
8年前 (2017-05-25) 5819℃
1喜欢
MedCalc16: 4.3.1分布图: 直方图
关键词:medcalc怎么保存图、medcalc、数据分析师
4.3 分布图
MedCalc的分布图包括直方图(histogram)、累积频率分布图(cumulative frequency distribution graph...
cdadata
8年前 (2017-05-25) 9338℃
3喜欢