想成为一个数据科学家:针对大学毕业生指南
恭喜你,刚毕业的大学生,并欢迎员工队伍!所有你申请工作的,一个与性感的标题为“数据科学家”可能是最艰难的获得,以及潜在的最有意义的了。但不要害怕:Datanami在这里与意见如何成为他们中的一个实际的数据科学家。
第一条建议的萌芽数据科学家是不是感到沮丧的工作要求。最近没有大学毕业可以填写同时是一个数学/统计的天才,在市场营销/衍生工具/网络安全专家,和亲的Python / Java的/ R编码器。(提示:这就是为什么一个数据科学家称为独角兽,因为它们不存在!)
“有科学数据的保护伞下很多技巧,我们不应指望任何一个单一的人是他们全部的高手,”柯克承担,数据科学家说,博思艾伦咨询公司。“对数据科学人才短缺的最佳解决方案是一个团队数据科学家。所以我建议你成为专家在两个或两个以上技能领域,但也有其他的工作经验。“
据承担,你自己做好骨上的核心数据的科学技能,如机器学习,信息检索,统计,数据和信息可视化。你也想知道你身边一个数据库和数据结构的方式,并至少在你的腰带一些编程语言,如Python,R,SAS或火花。熟悉图形分析,自然语言处理和优化看起来也不错对数据科学的简历一样,数据建模和仿真。
“为物理学,生物学,天文学,化学等理科学生的好消息是,他们可以轻松地转换自己的科学技能到数据的科学界,”他说。
你应该回学校?
虽然一些数据科学博士学位课程还冒出了最近帮助阻止麒麟不足,你会不会想留在学校里太久。硕士学位是理想的,按照承担。
这一评估是由阿希什Thusoo,首席执行官呼应Qubole,托管的Hadoop服务提供商。虽然有数学,数据挖掘,统计,概率论坚实的背景,和SQL要求,数据科学家将最终需要从象牙塔冒险出来,到行业得到他们的手最重要的元素:有趣的数据。“这些天,越来越多的企业愿意雇用数据科学家很少场工作,并与一些经验,没有一个先进的程度,”他告诉Datanami。“的程度将最终的职业发展非常重要的(也许是最重要的工商管理硕士学位,现在包括业务分析),所以切忌不要让你的这学位的只是没有来到你的第一个数据科学工作之前。”
“在行业学习这些技能是非常重要的,”Thusoo,谁也共同创造者说的Apache蜂巢。“你有强劲的基本面。但为了应用这些技能,你需要获得对数据的访问。很多有趣的数据集绑在产业。这是不正确的20或30年前,当很多有趣的数据集将在学术界。“
今天的顶级科学家的数据没有去学校成为数据科学家。相反,他们去学校学习是计算机科学家,天体物理学家(如承担),化工工程师,或理论物理学家。作为世界上发展而来的,这些硬科学和数学技能证明了宝贵的操作不断增长的数据的浪潮。
“比什么都重要的是能够想围绕数据更重要的是,“Thusoo说。“我认为工具和语言,这些东西你可以拿起。随机森林算法是一种随机森林算法,无论是在Python或斯卡拉或Java或其他任何语言来实现。你需要明白的地方使用特定的技术,而不是如何编码的技术。“
统计还起着大数据至关重要的作用,说Monnie麦基博士,统计科学副教授南方卫理公会大学和项目主任科学数据科学计划大学的硕士学位。
“无论是统计与计算机科学是很重要的技能,”她说。“不过,这是我的信念,也许这显示了我的偏见作为一个统计学家,与统计培训个人迫切需要在数据科学领域。”
有统计培训并不仅仅意味着能够运用正确的统计方法或运行软件,她说。“我的意思是,制定了可以检测一个假设,来收集数据正确,设计一个计划用于估计是什么信号,什么是噪声,并且在该问题的上下文中的术语来解释结果的能力,”她说。
耐心,年轻的蚂蚱
不要指望能解决世界的科学数据的问题,当你成为22数据科学家其实需要多年的训练和经验与失败和毅力不伤害量好!
据什洛莫Engelson Argamon,计算机科学与数据科学硕士课程主任的教授伊利诺理工大学,说是成功的科学数据在需要许多不同领域的专业知识。“这是多样的技术和工具的数量巨大,”Argamon继续。“这需要多年的经验,开发真正深入其中。关键的萌芽数据科学家,但是,是有很强的把握基本原则在各地区,以及使用一个或两个方法和工具的能力。其它的工具和技术可以很容易地拿起,提供基本面之一的理解是好“。
它已经预测,本出版物和其他地方,在推进软件最终将会取代需要熟练的数据科学家。专案小组实际数据科学家的共识是混上。按照承担,事实上,数据科学家们的经验,一个坚实的基础,并在识字之类的东西的统计,机器学习和数据处理给了他们一个优势是独立的,上面什么任何软件可以把表。“有了这些天赋和才能,敏捷的数据科学家能够学习和运用新的软件包,可以学习和运用新的编程技能,并能学习和应用是由众多组织辉煌的分析思维创造新的方法,”他说。
“因此,”继续源性,“在分析软件包的进步不会取代需要对数据科学家,如一些人所预测的。但是,这些进步肯定会取代一些数据科学家的技能(如Java或Hadoop的)需求,但不是全部的技能:我认为,我们都需要知道的编程语言(Python中,R或SAS)而且SQL可预见的未来。
软技能物质
你可能是一个硬核定量能够跨越数十亿行数据的单一绑定。但是,这并不能自动转化为数据的科学赛道上的成功。除了基本的数学和技术技能,也有“软技能”在起作用,如谦让,好奇心和决心,根据SMU的麦基。
“谦卑是必要的,因为往往是数据不告诉我们什么,我们想听到的,”她说。“我们有足够谦虚的接受和解释什么数据实际上告诉我们。好奇心,因为不断地问这个世界的问题在我们身边,以及如何找到这些问题的答案是很重要的。和决心,因为这些问题的答案是不容易获得,有时需要回答的问题数据不可用或者。数据科学家必须保持告诉自己,“我知道有一种方法可以做到这一点,”并保持刻苦,直到她的数字出来。如果数据科学家是错误的?有没有办法?见特质之一“。
IIT的Argamon鼓励通过作业的部分强硬萌芽数据科学家保护者。“在任何数据分析工作的绝大部分是”数据drudgery‘,重新格式化混乱的数据集,搞清楚如何结合不同的数据格式,处理错误或丢失的数据元素,探索的数据,测试的整体造型和不同的丢弃模型,等等,“他说。“如果你想成功,在发现数据被隐藏的见解,你必须充满活力和顽强。这是无法传授或学习在任何教育计划,但它可以通过刻苦实践中制定了质量。“
找出该走的方向是,所有的萌芽数据科学家们必须应对的一个挑战。你可能会自然地具有得天独厚的人才在数学,解决问题,和通信,或已优化了程序设计和数据处理能力在大学或研究生院。幸运的是,你可以把这些技能在多种行业使用,从科研到网络安全市场和财务。“为物理学,生物学,天文学,化学等理科学生的好消息是,他们可以轻松地转换自己的科学技能到数据的科学界,”他说。“我的头号忠告一直是首先按照你的激情,”承担,谁最近离开乔治·梅森大学实践科学数据在私营部门在博思艾伦汉密尔顿说。“知道你擅长和你关心什么,追求的。”
成为一名科学家的数据,感恩
作为一个科学家的数据是很多人梦寐以求的工作(甚至你!)源性说要记住特权。“作为一个成功的数据科学家,你的日子就可以开始和你计算你的祝福,你住你的梦想通过解决与数据真实世界的问题结束,”他说。
源性的提醒一个FastCompany故事,关于杰弗里哈梅巴赫,谁离开了天才科学家的数据实,以帮助发现Cloudera的。“”如果你认为你的稀缺[数据科学]技能可以在其他地方得到更好的利用,大胆地做出举动。“
转载请注明:数据分析 » 想成为一个数据科学家:针对大学毕业生指南