大数据环境下如何进行数据挖掘
关键词:大数据环境数据挖掘、如何进行数据挖掘、数据分析师、数据挖掘
大数据环境下如何进行数据挖掘?
工具/原料
-
互联网
方法/步骤
-
是知识发现、商业智能、预测分析还是预测建模。其实都可以归为一类:数据挖掘是一项探测大量数据以发现有意义的模式(pattern)和规则(rule)的业务流程。
-
模型集中的每个变量都有一个与它相关的时间帧,它描述了该变量产生作用的时间段。可以理解为对在过去一段时间的数据的整合,超过这个时间的数据就作废。
-
很多数据挖掘问题都可以概括为预测问题:基于过去的响应,基于过去的相应,谁将会有相应?基于过去的注销记录,谁有一个不良风险?解决问题最好的办法是限定输入变量严格产生于目标变脸之前。
-
剖析,从字面上的理解是,基于人口统计变量,例如:地理位置、性别和年龄等。剖析模型能发现同一条件下的关系,但他们不能指出原因和影响。出于这个原因,剖析模型经常使用客户的人口统计信息作为输入,而把客户行为作为目标,在这种情况下,确定原因和影响更直观。
-
把业务问题转换为数据挖掘问题
·选择合适的数据
·认识数据
·创建一个模型集
-
修复问题数据
·转换数据以揭示信息
·构建模型
评估模型
-
部署模型
评估结果
重新开始
转载请注明:数据分析 » 大数据环境下如何进行数据挖掘_大数据环境数据挖掘