您现在的位置:   首页 >> 新闻中心 >> 数据分析

数据挖掘建模:如何从数据中“淘金”?

发布人:www.yunke.ai 发布时间:2021-01-01 165 次浏览

本文笔者将对数据挖掘建模的一般过程进行解析,主要分为四部分:数据准备、模式发现、模型构建以及模型评价。

数据挖掘介绍

数据挖掘(Data Mining,DM):就是从大量数据(包括文本)中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程;是利用各种分析工具在海量数据中发现模型和数据之间关系的过程。这些模型和关系可以被企业用来分析风险、进行预测。

数据挖掘的目的就是从数据中“淘金”,就是从数据中获取智能的过程,数据挖掘是提供了从数据到价值的解决方案。

数据+工具+方法+目标+行动=价值。

目前,数据挖掘已有一系列应用:

  1. 分类分析:有监督学习,将数据映射到事先定义的群组或类。应用在将信用卡人分为低中高风险群等。
  2. 回归分析:用属性的历史数据预测未来趋势,应用预测哪些用户在未来半年会流失等。
  3. 聚类分析:无指导学习,在没有给定划分类的情况下,根据信息相似度进行信息聚类。应用在对客户行为分析,对客户分层进行精准营销。
  4. 关联分析:发现事物间的关联规则或称相关程度,常用在交叉销售,交叉分析,著名的啤酒与尿布。
  5. 时序模式:已知的数据预测未来的值,回归不强调数据间的先后顺序。
  6. 偏差分析:来发现与正常情况不同的异常和变化,并进一步分析这种变化是有意的诈骗行为,还是正常的变化。常用在防欺诈,以及保险领域。

以上这些应用涉及的技术和工具各不相同,然而却可以依据统一的方法论来实行,并可以协同作战,解决许多有价值的商业问题。

数据挖掘建模的一般过程