(3)数据挖掘与数据化运营

如题所述

第1个回答  2022-06-13
数据挖掘的指导思想是以业务为核心,思路为重点,挖掘技术为辅助的。

通过对用户特征分析,实现对用户个性化服务对精细化运营。

使用算法等手段发现输入变量与目标变量之间的关系。

发现用户浏览方式,进而对用户分群,群体特征分析,或者产品改进,下一个页面对预测等。

风险预测模型,找出可能流失等用户,通过优惠诱导等挽留;另一方面预测用户有下一步要购买的物品,主动引导和满足。通过历史数据挖掘关联商品组合和购买概率。

lift值是最常用的模型评价方法,可根据业务需求不同,显示对应不同目标群体规模的模型效果,方便应用时挑选最佳当的受众群体规模。包含两个指标,响应率和捕获率。
首先把经过模型预测后的观察对象按照预测概率的分数从高到低进行排序。然后对排序后的对象按照均等的数量划分成10个或20个区间,这样各个区间可以被命名为前10%,20%的对象集合。

1)某数据对象多个属性缺失,去除该对象
2)某属性大量数值缺失,去除该属性
3)缺失值替换
如果是连续型数据或者区间型数据,中位数,众数,均值,最大值,最小值等替换。如果是类别型数据,众数或者给定新值。
4)利用模型预测

(1)数据抽取和清洗
取具有代表性的数据样本
(2)去除共线性
(3)分布转换
(4)自变量筛选
(5)模型搭建和分析
(6)模型落地和跟踪反馈

(1)RFM分析方法
R代表客户消费新鲜度;F代表客户消费频度;M代表客户消费金额。三个变量按轻重顺序先后排列。客户消费新鲜度最具有价值。一般来说,每个属性里划分区间,可以是好,中,差等等级。
(2)聚类
(3)

一般通过AB试验对照分析

漏斗分析用于分析关键节点的转化效果。

对用户网络行为进行追踪和记录,分析行为特点。用户产品优化和设计,用户频繁路径识别等。从而分析用户行为和心理活动等。并了解用户如何使用产品以及各个功能点的价值。
常见方法是:基于序列的关联规则;遍历算法;社会网络分析方法。

做假设(大胆),定标准,做比较(不同时间,不同类型,竞品),看趋势,观全局,辨真伪(集中主要矛盾),下结论。
主要方法:
(1)SEMMA方法论
相似回答