53

硬核干货|如何利用逻辑回归模型,实现用户增长?

 4 years ago
source link: https://www.tuicool.com/articles/zqQn6nU
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

技术派是如何利用逻辑回归模型实现用户增长的

YrmyAfa.jpg!web

黄天文将用户增长分为三大流派,分别是 市场营销派 、 实验增长派 和 技术派 ,下面简单介绍下这三大流派:

1、市场营销派——做品牌和花钱买流量

市场营销派做不好,叫流量获取,这活谁都能干,只要给钱就有量;做的好才叫用户增长,通过对渠道精细化运营来调控获客成本和质量。

2、实验增长派——提出增长假设,做实验

即,发现问题、提出想法、预期效果、测试、复盘,这5步称之为一个增长周期,不断循环这5步,致使数据达到增长目标。

3、技术派——就是大家常说的“增长黑客”,运用技术套利,实现低成本增 长。

市场营销和实验增长派在之前的文章里已经介绍过(详见本人之前的文章 《如何用更少的钱,带来更优质的量? | 渠道质量评估模型》《没有护城河的流量池,用户来得快,流失更快》 ),所以今天就来个技术派跟大家分享一下。

真正做到know your customer(不是反洗钱的KYC哦),要像个“跟踪狂”一样,跟踪用户的关键行为,这个用户看了首页、又看了视频页、看了13篇文章、分享了1篇文章、点击下单按钮了、最终购买了某件商品。

从第一次启动APP到购买的整个过程,都是你监控的范围。 甚至能通过购买前的一些行为,来预测用户的购买概率,从而推动成交量的增长。

其实技术派的例子也是屡见不鲜:

如网飞(Netflix)通过分析客户观看的电影和节目,发现凯文史派西参演的电影和政治题材的电视剧都非常受用户欢迎,所以才有的网飞制作电视剧《纸牌屋》;

商务智能公司RJMetrics的团队发现,在使用其免费产品期间,用过软件编辑图表的用户与没用过此功能的用户相比,转化率高出一倍之多,随后每多使用一次,其购买的可能性就会提高。

通过以上几个例子,大家可以知道, 大体逻辑就是基于用户的行为,来判断用户另外一种行为的概率。 纸牌屋的例子是通过用户的观看习惯,来推断新产品是否受欢迎。RJMetrics公司是通过购买前的某些行为,来判断用户是否购买产品。

因此,我们就引出今天的主题: 技术派是如何利用逻辑回归模型实现用户增长的 ——这也是增长三部曲的最后一部。

虽然在当下,深度学习模型已经成为时尚,但逻辑回归仍然坚守在第一线,靠的就是其高时效性与高准确度性。许多银行和金融平台利用此模型预测借款人违约的概率,在金融领域都能站住脚,足以看出逻辑回归的江湖地位。

很多运营同学听到逻辑回归模型都会大惊失色,觉得难度系数过高,所以 下 文提供了难易两条路线供大家参考。 第一条是“懒人”路线,第二条是“挑战”路线。

“懒人”路线就是按照下文的步骤,把需求提给技术,也就是建模的过程交给技术(别跟我说技术不会逻辑回归模型,只可能是你魅力不够~~),在技术的辅助下,将模型结果拿来用就OK,适合所有运营人士;

“挑战”路线则是自己建模分析,有时候人不逼一下自己怎幺能行呢!没准从此走上了用数据说话的道路,告别“数据神棍”。另外告诉大家一件事,数据运营比运营更来钱,运营的同学还在等什幺,赶紧往数据转吧哈哈哈~~

今天来跟大家分享的题目是, 如何运用逻辑回归模型促成交,提高GMV。

在做模型之前,确立自己的目标是什幺?那就是让用户下单,重点放在没有下单的用户身上。如何去做?根据用户行为,构建模型,找出下单用户画像。之后呢?我们要做两件事。第一,引导没有下单但已经具备下单潜质的用户(预下单用户)下单。第二,引导用户成为预下单用户。

一、模型搭建

选出你认为对下单有影响的变量,然后给到技术,让技术算法大神根据这些行为list(变量)和最后是否下单(因变量)做一个模型,并告诉你模型的可行性和筛选后剩下的变量。如下图:

uIZzuaN.png!web

用户行为list图

最后告诉你这个模型O不OK就搞定,OK就进入下一环节,不OK再继续改善模型,直到模型成功为止。

有想挑战的同学,推荐的建模工具有SPSS和python,如果是初学者的话,建议使用SPSS,操作简单,不需要编程能力,网上有大量的逻辑回归模型的教学视频,快的一周,慢的一个月怎幺也玩明白了。

简单的说, 逻辑回归模型其实就是: 将历史用户在下单前或者未下单前的行为,放进模型中,模型会模拟出一个方程,之后我们根据方程套用到新的用户身上,来判断哪些用户下单的概率高,哪些行为对用户下单影响较大,最后根据模型来做后续的策略。

下面我们就来简述一下建模过程。

(1)  数据预处理

如下图所示,红色的“是否下单”这一列是目标值,指的是历史用户最终是否下单;蓝色的各列是用户下单前的行为。

下图可以这样解读,每一行就代表着用户从进入平台到下单(未下单)的全路径行为。

aMFRbmA.png!web

样本数据图

如上图所示,模型中分为两种变量,一种是连续变量,比如“浏览页面数”,是按照自然数统计的;另外一种是哑变量,比如“是否下单”,1代表下单,0代表未下单。

到此为止样本数据都已经处理完成,接下来就把这些数据导入到模型中,模型会给出相应的反馈结果。

(2)  检验模型

不是把数据扔进模型后就完事了,还要看一下模型拟合优度,说白了就是模型能不能用。如下图

jymEbmi.png!web

模型评估

这里只看步骤二红框里的几个数字就可以。

第一个是-2对数似然值,这个值越低越好,在100以下就算可以接受,1000以下嘛也将将可以。第二个就是卡方&显着性(Sig),卡方一般小于100,Sig<=0.05即可,说明模型当中的变量(用户行为)对下单有显着影响。

看完这3个数,就证明模型拟合优度OK,可以使用。当然除了统计学外,也可以通过AUC值作为模型的评价标准。

二、结果解读

劳烦技术大神或算法大神把下单用户的行为告诉你,并且把倍数关系告诉你,如下图:

FFr2Ynq.png!web

倍数关系图

上图的“是否注册”为2.909,表示注册的用户,其下单的概率是未注册用户的2.909倍,换而言之,注册比不注册下单率高了近3倍。

再看 “生命周期”,生命周期长与生命周期短的比值0.998,说明生命周期越长,下单的概率越小。

至此第二阶段就已经完成了,开始进入第三阶段,模型应用篇。

将上面(一)中的数据输入到模型中,待模型通过检验后,反馈给我们的数据,就是今天的重点。

vQZjqa6.png!web

模型方程变量图

上图的B代表逻辑回归的系数,SE为标准误,Wald是Wald卡方值,df为自由度,Sig是显着程度,Exp(B)代表概率。

模型采用的是向后Wald法,筛选变量,步骤1中,模型发现是否“完成任务”对下单影响不显着,所以在步骤2时,剔除掉此变量,留下的变量都是Sig<0.05的显着变量。

通过B值构建逻辑回归模型:

1.069是否注册+0.93浏览新闻视频数+0.06APP停留时长+0.076主页停留时长+0.052启动次数+0.004浏览页面数+0.194看过页面A+0.767看过成交页-0.02生命周期-3.571

通过Sig我们可以知道:

当Sig<0.05时,该变量十分显着,经过筛选(步骤2),这些变量的Sig全部小于0.05,说明我们选取的行为对下单的影响是非常显着的。

通过EXP(B)我们可以得到的结论是:

有过该行为的用户是没有该行为用户下单率的倍数。以“是否注册”为例,在其他变量不变的情况下,注册用户的下单概率是非注册用户的2.909倍。看过页面A的用户是没看过页面A用户的1.214倍。

模型结果解读后,是不是觉得有很多东西值得我们去做的,模型虽好但若不能落地等于没做,还是那句老话,不能将数据分析落地执行的业务需求都是耍流氓,所以我们这就开始讲解模型的应用场景。

三、模型的应用

这一步开始“懒人”路线和“挑战”路线就合并了,我也终于从“精神分裂模式”回归成一个人了,不论是运营还是数据运营都可以完成本章内容,这一章可千万别懒了。

下面列举几个应用场景,供大家参考。

应用场景一 模型触达用户

触达可以分为两种,全自动触达和半自动触达:

(1)全自动触达:

通过上述回归模型,在程序内可以将每一个用户的下单概率算出来,筛选出下单概率高的用户,自动触发短信、PUSH或者红包。

(2)半自动触达:

半自动指的是我们并不用上述模型计算概率的方法选择触达用户,而是将模型输出的行为(变量)倍数关系作为参考,手动去选择行为的阈值,这样做可能会比全自动化计算出来的用户多一点,在预算不吃紧的情况下可以用这种方式进行触达。如下图红框所示:

UbY3QrM.png!web

半自动阈值图

应用场景二 产品化即时弹窗

当用户满足上面提到的行为时,自动触发弹窗,引导用户下单。

这种方法其实要比场景一的转化率高很多,因为触达短信属于后置动作,用户在收到短信时,可能已经错过最好转化时机。而自动弹窗,会在用户意愿值最高时,及时提醒并转化。

这种产品化弹窗并不少见,比如腾讯的和平精英游戏,会在你获得胜利(吃鸡)时,弹出窗口,提醒你去应用商店给游戏打分。这样做不仅能够提高用户评分率,还能保证好评率,是一种经典的产品运营方式。

应用场景三 产品化调整

通过模型我们知道提高下单转化的三个重点指标依次为 注册 、 看过页面A 和 看过成交页 。

那幺我们从产品层面,要做一些调整,比如通过强制注册或者调小注册页的跳过按钮来提高注册率;调整成交页的下单按钮的大小、位置和颜色;改变页面A的入口深度,让用户更容易进入该页等等;不要小看这些操作,比如下图,将注册页由表单形式改成分布式,注册率就能提升7%,如下图所示:

jmUv2m6.png!web

产品改动提升注册率图

总而言之,我们通过改动产品,带动重点指标增长,从而提高下单转化率,是一种“曲线救国”的方法。

四、模型的拓展

模型的拓展主要分为两个方面,自身优化和横向拓展。自身优化主要是针对下单模型如何进一步优化,提高准确度;横向拓展是将模型套用到其他业务上,不光下单可以使用该模型,用户留存、UGC互动行为等都可套用。

至此,整个逻辑回归模型流程已经介绍完毕,后续还有多种分析方法以及策略,在这里只是抛砖引玉,就不多赘述了。

今天讲的逻辑回归模型可能有些硬核, 其实模型原理很简单,就是根据用户的行为,去推断用户另一种行为的概率。 逻辑回归模型是一线机器学习工程师最爱模型,并非浪得虚名,熟练掌握此模型会对业务有非常大的帮助。

最后,我们就把今天分析的过程捋一捋:

ieINZjA.png!web

模型流程图

(1)确定增长目标

(2)用户行为数据准备

(3)模型调试

(4)模型结果解读

(5)模型的应用(产品层、技术层、运营层)

今天给大家介绍的技术派用户增长之逻辑回归模型就到这里了,这也是用户增长三大流派中最难的一种,但也并非可遇不可求,相信自己,只要努力没有什幺事情是你搞不砸的,玩笑玩笑哈哈~~

写在后面:希望这篇文章可以帮助广大的运营人士,也能够让用户了解平台运营方式,同时欢迎同行与爱好者一起交流学习,提出您宝贵的意见。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK