从大学生到数据分析师成长
我羡慕那些从学校走出甚至还未走出的时候,就可以以自己学会的知识和技术来创造价值的人;而另外一些人,比如我,要再过很久才能找到自己的位置。已经开始读这篇文章的话,你与我很可能是同类。大学期间,我基本算得上是个正牌的文科生。毕业之后,目光却逐渐转向数据分析,这个跨度颇有点不靠谱的意味。不过,在岗位上一段时间之后,我发现像我这样的人不在少数,只是他们可能在开始时距离“数据”没有那么远,例如传媒或者社会科学,但大家跨越自己原专业、进行新知识学习的程度是相似的。既然如此,也一定会有后来人需要这些故事和鼓励,使他们在立志的时候,得到一些示例、经验以及方法,大致的感知某些路径,以便在专业背景弱势、技术起点偏低的情况下,避免绕弯路,避免挫折,更有效率的前进。
豆瓣配套豆列:从文科生到数据分析师(书籍部分)任何问题欢迎随时评论探讨。
—————————-
【我们所说的“数据分析”:产业与链条
“数据分析”是一个含义颇为宽泛的概念,并且,在这个数据化的时代,这个概念几乎是无处不在的。为了保证内容的有效性,在这里仅提供我了解的一些方面。我接触的数据分析,主要是围绕互联网产品展开的。从数据采集前的规划,到采集过程(交互逻辑设计等),到回收数据的整理(机器层面和人工层面),与业务相联系的数据汇总,到后期的报告呈现(项目成果呈现),都有“数据分析”涉及。对单一产品来讲,数据分析(非挖掘)的集中体现,往往在运营层面。一方面是日常数据的跟踪,另一方面是重大活动、市场策略、新版本上市时的数据监测。产品经理也可以依据产品日常数据进行用户需求分析。从典型性上看,电商和网络游戏是这个框架下比较成熟的两类数据链条。对于商业咨询/研究来讲,数据分析为观点服务,这里的数据分析,选样、分析过程、呈现都是依附于特定商业目标和商业逻辑的,没有太多的共性。重要的是要知道如何获取高质量的数据,以及熟练使用业界通用的分析方法。此外,在一些商业提案、演讲、培训中也会用到数据分析,这里的数据分析更是为了主题服务,一方面需要描述市场规模、时间变化趋势等的宏观数据,另一方面需要具体的案例数据,讲述提案所涉及的方法在哪些指标上使客户/用户得到提升。综上,数据分析可能出现在产业链条的任何一个位置,产品、运营、市场,甚至销售、商务、人力,等等等等,当然职位可能就叫数据分析,但理解这个职位在哪一个业务板块,会更利于数据分析的进行。
【转型数据分析,早期技能综述
数据分析在我看来是个无底洞,越做越觉得技能欠缺——文科生可能尤其如此,因为他们几乎零基础;这如果不令他们陷入迷茫,就很可能令他们陷入知识获取的癫狂状态。深浅远近的知识一起吃未必不好,不过我还是建议入门早期首先关注三个方面:1、统计学基础基本的统计学原理和简单的几种分布的概念。可能在工作中都用不到分布,但这是后续升级的基础。推荐书目深入浅出数据分析 (豆瓣)深入浅出统计学 (豆瓣)爱上统计学 (豆瓣)后两本有所重合,随意看一本即可。【《爱上统计学》我有pdf电子版,需要的话可以留邮箱。】还有网络课程:Statistical Thinking and Data Analysis
2、业务逻辑就是业务逻辑,公司与公司不同,岗位与岗位不同。业务逻辑包括数据指标和计算方法,还有一些特殊的时间点、事件带来的例外情况。可以学习一下市场营销的课程,或者看一本入门教材,了解一下marketing的大致方法论。如市场营销原理 (豆瓣)另参考《如何在一周内摸清一个行业》:网站分析公会的微博 新浪微博
3、excel,SPSS至少一种最基本的数据处理和制图用工具。一些基础函数和数据透视表是最最基础的技能。可参考谁说菜鸟不会数据分析 (豆瓣)另外可以关注一些网络视频课程。
此外,了解一些数理逻辑基础、数据结构基础、软件工程的基础会更方便理解互联网的产品。
【文科生做数据分析,有何优势个人认为,最大的优势在于,当数据分析需要呈现的时候,很多文科生有能力一击抓住要点。这是需要跳出数据,思考问题本身的时刻。此时有必要相信距离媒体更近、距离项目报告更近的专业出身的学生。此外,有些数据分析需要宏观层面的联想,甚至一些出人意表的思路。文科生可以发挥创意。然后,文科生可能有着更多与“人”沟通的倾向和能力,这对数据需求的获取和数据表达的方向至关重要。培养这些能力,可参考:认知盈余 (豆瓣)爆发 (豆瓣)引爆点 (豆瓣)浅薄 (豆瓣)另外一些心理学的书籍也可以培养观察数据的角度问题。
不过,总体来讲,上述都略有牵强,这一段是本篇的鸡汤属性较强的地方。因为过于发散的思维可能影响数据分析的严谨性。且如果文科生做数据分析处处是优点,也就不会有这系列文章了。
【入门建议找一个喜欢的行业入手。这个行业需要真正重视数据而不仅是把数据挂在嘴边的,也即,数据是其核心竞争力,或是产品进步的必要推动力。最好是小公司。大公司里你很可能只是一个汇总excel、写周报的,连上下游的数据维度都摸不到。边入门边想清楚自己最终想走到哪一步。到市场传播,还是到产品经理,到投资/管理/业务咨询,甚至是向数据挖掘靠拢?每个方向所要关注的东西都是不同的。不抛弃,不放弃。同时放轻松,知道这将是一场漫长而艰苦的斗争。
优质报告的三大准则——市场、品牌性报告讨论
作为数据分析师,报告的写作是基本功,也是最终呈现的主要内容之一。本篇来讨论下什么是市场和品牌层面的“优质报告”,供各位在写作中参考,也为了后面讨论更深的内容打个基础——对于文科生来讲,从内容进入数据维度是比较好的思路。
市场、品牌层面的数据报告分为很多种,比较常见的是行业整体的报告和垂直领域的报告,前者规模一般比较大,如CNNIC的《中国互联网络发展状况统计报告》和一些咨询公司、市场研究机构发布的年度报告等,从数据上看,这些报告往往有通盘的考虑和固定的周期;后者相对小型,切入点以微观视点为主。当然这都是相对而言,因为垂直领域也会有整体性的报告,重点在于报告要解决的是什么问题。因为原则是相通的,所以本文的例子有各种报告。
【“优质报告”准则之一:提出新的观察范畴】
一个报告最重要的价值,就是分析出一个行业的趋势,从数据层面提出意见。而趋势的核心是“变化”——新生、增长、衰退、消失,等等。“提出新的观察范畴”即对变化的把握。示例:BCG《中国数字化新世代3.0——未来的网络领军者》中国数字化新世代3.0:未来的网络领军者.pdf这篇报告最出色的地方莫过于点亮了“农村群体”和“年长者群体”这两个观察范畴。新的观察范畴/对象,是几个基础指标结合后出现的、之前未曾观察到的群体。由这份报告来看,基础指标为:年龄,居住地区,网络使用情况(使用时长,使用者在人群中的比例,网络渗透率等),都是一些常规的数据维度,但它们的组合却指向了深刻的洞见——以前非行业目标的“农村居民”和“年长者”,应该受到重视了。这两个群体进入观察视野,对社交网站、互联网广告、电子商务等行业有现实意义,背后紧跟着用户拓展、电商网站的商品规划、广告精准投放、网络服务和产品设计等一连串问题。这就是趋势报告最高的价值体现:提出一个新的观察范畴,为整个产业创造意义,可能带动后续一系列媒体、机构、企业的跟踪和投入。而这个范畴本身又为作为咨询公司的BCG开拓了一个新的市场空间,充实了咨询企业的方法论。从这些意义上看,此报告绝对是一篇市场层面的上乘之作。
【“优质报告”准则之二:精彩的、有意义的跨行业比较】
跨行业比较,使用好了的话,是一步非常高明的棋。这种比较将给予自身的行业/业务一个快速、明确的定位,并展现出它的前景与机会。而这正是市场、品牌报告的所要解决的问题。示例1:Stephen Wolfram:Data Science of the Facebook Worldhttp://blog.stephenwolfram.com/2013/04/data-science-of-the-facebook-world/Mathematica软件之父Stephen使用Wolfram|Alpha Personal Analytics for Facebook(基于Mathematica进行个人Facebook数据分析的服务),基于Facebook用户贡献的数据,进行的一系列研究。其中,他将Facebook呈现出的婚姻状况与美国人口普查的官方数据进行了对比,发现Facebook上20岁以下的用户和寡妇有“谎报”已婚的倾向,同时,Facebook上的用户结婚的年龄比官方统计的结婚年龄要晚,但只考虑城市的话,两者更为相近。于是得出结论:对于美国年轻人来讲,Facebook这一样本显著性很高。这个简单的跨行业比较,体现出Personal Analytics for Facebook这项服务的价值和准确性所在。这篇的其他分析也非常有见地,建议大家认真看完。
示例2:友盟《移动应用争夺春晚期间用户注意力》移动应用争夺春晚期间用户注意力友盟是一家移动应用数据公司,提供应用内统计分析、移动互联网广告网络、移动应用社会化分享等工具,帮助开发者进行应用开发、数据统计,并移动广告服务等。友盟定期发布行业大报告,不定期发布垂直领域分析。这篇是后者,事件型的报告。它目的很明确:借春节和春节联欢晚会的契机,突出移动互联网在广告领域的价值。报告将用户的移动互联网行为(启动APP的次数)与电视行为(春晚节目单)对比,通过零点报时和春晚前十分钟的手机使用情况,强烈的表明,手机APP作为广告媒介,在关键事件时,拥有巨大的投放空间和投放价值;它远比电视广告便宜,但可能价值不逊于电视广告,甚至可能收获更好的效果。
诸如此类的跨行业比较,对突出(报告自身所在的)行业优势有很好的效果。它比传统公关事件和文章更有数据上的说服力,也让市场和潜在用户深刻的认识到其业务的核心内容,令报告本身有了更强的参考意义。
【“优质报告”准则之三:紧贴业务模式的维度设计】
示例:Millennial Media月度S.M.A.R.T.报告(以2013年6月份的为例)mm-smart-jun-2013.pdfMillennial Media是一家移动互联网广告公司,其SMART报告每月一期,针对不同的移动广告垂直领域进行分析。整体上看,SMART报告都遵循着一定的模式,如广告主目标分析、受众人群分析,以及定期的垂直领域市场规模排名等。因为是移动互联网广告公司,对Campaign效果的评估就十分重要,而对Campaign的评估,来自对“广告主的目标”和“最终用户反馈”之间的映射的观察。因此,你可以在SMART报告中看到对【Advertisers’ Campaign Goals】的分析,以及对【Post-Click Campaign Action】的分析。通过这二者的对比,就可以直观的看出Campaign成果如何。此外,SMART也提供了餐饮行业广告主的【Post-Click Campaign Action】与全行业的对比,可以帮助广告主调整后续策略。【Top Audiences Engaging with Restaurant Ads】的分析,则给出了最易受餐馆广告影响的最终用户类型。这对广告主策略的改进也是非常重要的。这就是所谓“紧贴业务模式的维度设计”的体现。它们无疑比“移动广告覆盖智能设备TOP 10”、“手机与平板的流量比例”、“XX领域受众男女比例”要高明一些——不是说这些数据不重要,而是,它们与业务的相关性太低。想想看,如果你是广告主,看到Millennial Media的分析报告,会不会感受到它对广告主需求的把握?会不会被它的服务吸引?结论显而易见。
在我看来,一份优质的报告,以上三点均不可少。不过,这并非易事,因为每一点背后都意味着更多的功课:先说第三点,紧贴业务模式的维度设计,要求你对自己的业务非常了解,包括报告的受众、服务的主要客户、数据来源和基本的数据点,统计中误差如何生成、怎样避免,等等等等;然后是第二点,有意义的跨行业比较,要求你对相近的行业有所了解,保证比较的意义;最后是第一点,提出新的观察范畴,这是对行业整体及相近行业深入了解后才可能有的洞见。
分析师们,加油吧!
转载请注明:数据分析 » 从大学生到数据分析师成长_数据分析师成长之路