数据分析师的基本素质
1.1.4 数据分析师的基本素质
Mr.林看到小白斗志昂扬的样子非常高兴:别光说不做啊,要成为一名优秀的数据分析师,并非一件容易的事。虽然所学的专业与数据分析不相关,但你可以通过工作中的实践学习数据分析,需要付出大量的时间和精力,不经一番寒彻骨,怎得梅花扑鼻...
cdadata
9年前 (2016-02-22) 2999℃
0喜欢
数据挖掘系列篇(11):网易云音乐的个性化推荐漫谈
用过虾米、酷狗、QQ音乐、网易云音乐,个人感受网易云音乐在音乐推荐这块做的真心不错,特别是以“人”为角度的推荐,没有像虾米、酷狗推的那么乱。虾米还可以,但更多的是以歌搜歌的形式。刚注册了一个新的账号,避免有历史数据的干扰,听了...
cdadata
9年前 (2016-02-05) 3806℃
4喜欢
数据挖掘系列篇(10):大众点评的实时计算
实时计算是目前在推荐、搜索广告等场景中经常需要应用的地方,它不像离线计算那样可以有长时间来准备数据,做数据处理。在实际的应用场景,要考虑到用户的感受。比如我在城西银泰搜索附近的商家,这个就需要实时计算距离来支持。还有像双十一这样的推荐...
cdadata
9年前 (2016-02-03) 3998℃
0喜欢
数据挖掘系列篇(9):今日头条的个性化推荐
今日头条作为一种新型的新闻阅读方式,已经将传统的新浪、腾讯、网易、搜狐这些新闻媒体以一种大数据+新闻内容的方式呈现给用户。上线没几年,用户量已经发展到3亿累计用户,日活奔着3000万去。看到这样的数据,小编还是比较震撼。这几乎是目前A...
cdadata
9年前 (2016-02-02) 4520℃
2喜欢
数据挖掘系列篇(8):在线机器学习FTRL(Follow-the-regularized-Leader)算法介绍
最近几个同事在做推荐平台的项目,都问到怎么实现FTRL算法,要求协助帮忙实现FTRL的算法模块。今天也是有空,赶紧来做个整理。明天还要去上海参加天善智能组织的FL...
cdadata
9年前 (2016-02-01) 6255℃
2喜欢
数据分析系列篇(7):十本数据分析推荐精读
现在碎片化的信息太多,而没有太多系统的知识整理,买几本好书放在家里或者车上,没事的时候可以看看。找了几本书,基本的要求如下:
1)废话不要太多,读下来没任何印象;
2)有数据分析的技能介绍;
3)有当下的热点分析,有实际案例;
4)跨...
cdadata
9年前 (2016-01-28) 7588℃
3喜欢
数据挖掘系列篇(6):聚类算法概述
本篇重点介绍聚类算法的原理,应用流程、使用技巧、评估方法、应用案例等。具体的算法细节可以多查阅相关的资料。聚类的主要用途就是客户分群。
1.聚类 VS 分类
分类是“监督学习”,事先知道有哪些类别可以分。
聚类是...
cdadata
9年前 (2016-01-27) 3993℃
0喜欢
数据挖掘系列篇(7):推荐系统综述以及美团推荐系统介绍
其实推荐系统前面已经讲过不少,那时候主要是放在机器学习上讲的,既然这次要系统撸一遍数据挖掘,就把推荐系统单独拿出来说一说。相信如果做过推荐系统的人,都知道是什么回事。一堆features,一堆算法模型,一堆online、o...
cdadata
9年前 (2016-01-26) 4198℃
1喜欢
数据挖掘系列篇(5):分类算法概述
数据挖掘这块重点就是介绍算法和应用案例,还有相应的开发语言R、excel、mapreduce、spark。前面重点介绍了数据挖掘主要解决的几类问题,而分类问题是数据挖掘中的重头戏。如果我们在高校里,常见的就是训练一群样本数据的特征,跑出模型,...
cdadata
9年前 (2016-01-26) 2986℃
2喜欢
数据挖掘系列篇(4):Netflix机器学习系统的构建经验
有很多很好的介绍机器学习的教科书和课程,,甚至可以学习一些最复杂的特定的方法或算法,理解这些理论是一个非常重要的基础和起点。还有很多构建真实系统的实际问题,你可能闻所未闻。这篇文章将分享一些Netflix多年来构建大型...
cdadata
9年前 (2016-01-24) 3759℃
1喜欢