前言
数据来源于阿里天池竞赛:阿里移动推荐算法数据集_数据集-阿里云天池
竞赛数据包括两个部分。
第一部分是脱敏后的用户在移动端行为数据(D),对应文件是tianchi_mobile_recommend_train_user.zip,包含如下字段:
第二个部分是脱敏后的商品子集(P),文件名为tianchi_mobile_recommend_train_item.csv,包含如下字段:
我下载的是zip文件,有1225万条数据,数据量大,所以选取了前10万条做数据分析。
使用Navicat工具对数据进行操作,首先将数据导入mysql数据库中,注意所有的字段都按照默认格式varchar导入,导入成功后再设计表,按照需求修改字段格式。数据概览如下:
SELECT *,COUNT(user_id) from data GROUP BY user_id,item_id,behavior_type,user_geohash,item_category,time having count(user_id)>1
有重复,但根据业务理解不需要处理,结果如下:
查看time范围,检查是否有时间之外的数据出现,结果显示没有异常值。
select min(time), max(time) from data
查看各字段的数量,无缺失值。
select count(user_id), count(item_id), count(behavior_type), count(item_category),count(time) from data;
select count(distinct user_id) user,count(distinct item_id) item,count(distinct behavior_type) behavior_type from data;
该数据集包含899位用户,80961种商品,4种用户行为。
本项目数据从11月18日开始,到12月18日结束,11月18日前无可分析数据。在靠近11月18日的当日新增用户中很大一部分并非当日新增,而是18日前就已经活跃用户。日期靠后的数据,越能体现出当日新增真实值,具体值需要等待后续数据。
本项目数据源共100000条,pv为94543 ,uv为898, 人均页面访问数为105.28。
浏览页跳失率为26.92%,关键页跳失率73.08%。
时间维度用户行为
从时间维度的日期、时段、星期,来观察用户行为。
从11月30日开始,pv、cart值增大,12月4日、6日出现小范围减小;12月12日当天pv、cart、buy值激增,达到高点,次日骤降,回归平均水平。
从日时段来看,用户在10点到24点较为活跃。从17点开始逐渐增高,晚上21点—22点达到最高值。
基于以上数据,12·12活动一般选择在11月底、12月初开始预热,至少提前1-2周进行;网站的客服、维护尤其要注意晚上20点—23点这一时段;日常的推新、促销选择在周四——周六这一时间段进行。
这里主要考察次日留存率、3日留存率和7日留存。可以看到进入12月后,留存率有所增长,表明双十二的预热起到一定效果。
本项目中的收藏col与加购cart的行为不是相互独立的,都是确定购买buy意向的行为,没有先后之分。因此,从浏览pv、加购cart、购买buy这一路径来简要分析。
从浏览到加购的转化率为2.81%,用户花了大量时间寻找合适的产品。可优化网站筛选、关键词搜索功能,推荐更适合用户的商品,方便用户迅速获取信息。
从加购到购买的转化率约为35.9%。可针对加购未购买产品细分,采用提供优惠券、推荐同款商品等促销方法。
用户购买次数在1-5次,更高次数的用户很少,整体复购率为52.89%,相对可观,可将运营重点放在培养用户忠诚度上,从质量、价格、服务、物流等方面做出改进,鼓励用户更高频次的消费
从购买次数,分析商品类别、商品id的受欢迎程度。
成交品类较高的是1863、4324、5232三大类。
按照成交量与浏览量的高低,把商品类别分为四大类。
pv低buy低,多数商品集中在这一类,商品存在替代性,可增加该类商品的客流量,以提高成交量;
pv低buy高,商品是有竞争力的,可在活动中作为主打商品,提高复购率,同时增加宣传,打开市场、吸引新用户,营造品类口碑;
pv高buy低,购买存在较大随机性,可在商品的描述、价格等方面做出改变,提升商品竞争力;
pv高buy高,用户有较高需求,可提炼商品卖点、精简描述,方便用户更快做出购买决策。
仅在会员(购买过商品的用户)范围内,进行价值划分,R/F等级为1-5,由于本项目的数据不涉及M(Monetary),所以只做4类划分。
通过RFM模型,了解每位顾客的特性,实现差异化营销。
重要价值用户,R高F高。经常在网站购物,并形成习惯,做好维护即可。
重要深耕用户,R高F低。这类用户粘性不强,近期有消费行为,可能是针对需要的商品直接下单,不会过于频繁地进行其他商品的浏览、购买。可推荐更符合用户喜好、性价比高商品,吸引其进行购买,逐渐建立消费习惯。
重要唤回用户,R低F高。最近没有购买行为,可以通过短信等场外提醒,引导其入场参与优惠活动,尽快完成下次购买行为。
重要挽留用户,R低F低。该类用户容易流失,占比40.02%,可提升空间大,运营活动可重点针对这部分用户,通过拼团打折、积分兑换、捆绑销售等活动唤起用户注意力,提升用户兴趣。
关注活动前后指标数据,优化推荐策略和搜索功能
针对用户群体特征采取差异化营销