0

小红书推荐算法的秘密

 1 year ago
source link: http://www.91yunying.com/124798.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

小红书推荐算法的秘密

发布者: 91运营

2022-09-22 11:58周推荐 小红书 推荐算法  1688

系统学习运营课程,加入《91运营网VIP会员》,开启365天运营成长计划>>

581 小红书推荐算法的秘密

最近偶尔会有人来公司找我聊聊天,但话题嘛,都是围绕小红书转的,有意思的是基本每次到最后,都会聊到小红书的推荐算法是什么?

根据我的观察,来者不管对小红书是否真正的理解,但大家普遍都有一个共识“小红书的流量是有算法的”,不要笑,这样的共识很重要,因为有算法,就会有权重,这也是一切逆推的基础。

1 有哪些流量入口?

在开始聊算法之前,我也想和大家一起统一一个概念,很多人都说小红书的流量都来源于推荐,但实际上,小红书上的流量入口有很多,并非完全都来源于推荐。

这里我做了个整理,可以发现小红书的流量入口大致可以分为六个。

1、搜索结果页:打开小红书App,搜索词后进入搜索结果页

513 小红书推荐算法的秘密

2、发现页:打开小红书App选择顶部发现页

522 小红书推荐算法的秘密

3、关注页:打开小红书App选择顶部关注页

532 小红书推荐算法的秘密

4、个人页:打开小红书App点击笔记博主头像进入个人页(含其他形式进入主页)

542 小红书推荐算法的秘密

5、附近页:打开小红书App选择顶部附近页

552 小红书推荐算法的秘密

6、站外:站外带来的流量(含PC与H5)

561 小红书推荐算法的秘密

我们常说的推荐以及算法,其实就是指的“发现页”流量。

聊到这了,顺便说一句,其他的流量入口就不存在权重和算法吗?其实也存在,比如搜索结果页,谁排前面谁排后面,这都是有学问的,只要不是随机的,不是人工的,就一定有算法;但每个流量入口给用户的价值并不相同每个流量入口的算法也自然各不相同,不能一概而论。

当然,你也可以去问小红书客服,小红书会不会限流?笔记有没有权重?小红书客服会告诉你,什么都没有。不过对于我们而言,只能内心一笑,一切尽在不言中。

2 小红书的推荐算法

明确一下,我们这里聊的推荐算法,只是针对小红书发现页的算法。

在小红书一篇笔记发布到推荐的流程是什么样的?

571 小红书推荐算法的秘密

1、笔记发布

2、语义分析/分类/打标签

3、平台审核

4、分配流量池(权重:账号状态,账号在类目内表现情况,类目竞争情况)

5、增加流量池(权重:互动情况,用户行为,笔记发布时间)

6、推荐结束

稍微做个分析,我们会发现,一篇笔记的流量推荐主要由“2、4、5”组成,其中2是为了将笔记内容做识别,匹配给有需求的用户,4/5的意义就是给大众用户推荐好的内容。

所以我们做一下总结,小红书推荐流量的本质就是两件事,一个是如何精准匹配用户,一个是如何判断“好”的笔记。

我们先说如何精准匹配用户,这就涉及到了语义分析,也涉及到了给笔记分类目和打标签,目前为止,小红书的识别已经不止文字了,假设文字基本不写,也能通过图片或视频来识别内容是什么。

你或许会疑问,聊算法怎么扯到精准匹配了?因为精准匹配就是推荐算法的前提。

首先平台为了让用户感觉推荐满意,保险起见,会尽量推送你近期有浏览行为的相关笔记,我相信你应该有过在小红书搜索某个产品后,推荐页会立刻推荐相关产品的其他笔记的经历,就是这个原因。

这个问题代表什么呢?代表一篇笔记必定是有分类的,必定是有受众人群的,假设你不是受众人群,平台会推荐给你吗?完全不会。因此发布一篇笔记之后,本质上不是在与所有笔记竞争,而是与同样分类下的相似笔记在竞争,这个时候你问其他博主今天流量好不好,其实没什么意义,大家的类目都不同,竞争关系也不同。

这就是你在小红书,极少看到一篇笔记有上百万的点赞的原因,是小红书用户量不多吗?不是,是因为这些笔记没有机会被推送给“全部用户”。

精准匹配到这里就结束了,下一步就进入到了推荐算法环节,也就是平台如何判断一篇笔记“好”。

不用多想也知道,平台本身无法判断笔记好坏,于是就会借助用户的力量,让用户自行投票(点赞收藏评论)来决定笔记好不好。

讲到这,又会多出一个疑问,一篇新笔记刚发布,肯定是没有人投票的,只有小红书把笔记推荐出去,才会有人根据内容来投票,新笔记发布的时候推荐多少人合适呢?推荐的少了,从统计学的角度来说,不太具备科学性;推荐的多了,万一这篇笔记就是不好,那岂不是给用户推荐了垃圾内容了?

怎么办呢?于是平台出了一个新办法,根据权重综合决定这篇笔记该拿多少初始流量。

这些权重,比如:

1、账号状态

当前账号有没有违规?是不是限流?是不是垃圾营销号?有没有保持活跃?一切正常且表现良好的,自然给的多一点,不正常,那就按最小原则来分配;这就是有些批量运营的账号或者断更账号发布笔记流量少的原因。

这里不得不提一句,有些账号一注册就会被认为账号异常,比如用虚拟运营商的手机号注册,就会被识别为疑似异常账号,别问为什么,问就是其他灰产都是这么干的。

2、账号在类目内表现情况

近期账号在该类目下是不是连续发布笔记(主运营类目)?是不是经常出爆文(笔记写的好)?好,那就多给点。这就是有些博主出过爆文,再次发布一篇同类笔记,爆文概率非常高的原因,一部分是掌握了当前用户的喜好,一部分也是初始流量给的就多。

3、类目竞争情况

当然,其他两项都是决定多给和少给的问题,但决定具体给多少,实际上是类目竞争情况决定的;

比如夏天发一篇羽绒服的笔记,受众必然是近期浏览过羽绒服的用户,但夏天啊,哪有多少人看羽绒服?假设全国一天就1万人,每天还新增几十篇笔记,为了保证每个正常的笔记都有流量可推,所以就会减少初始流量的绝对值,比如只给100个曝光,剩下的流量还得留给好的笔记呢。但要是夏天发裙子,那就会有所不同,裙子在夏天本来流量就大,初始流量可分配的也就多了一点。

以前零克Club群里总会有人问,初始流量池是多少?是100还是200?看过以上这段话,你就应该知道了,没有绝对值,也不是直接用100还是200去定义的,而是根据不同的类目当前的流量情况,在结合账号状态以及历史笔记表现情况(权重)来综合得出的,而且完全由系统自动执行,我相信就连小红书的运营,也办法告诉你初始流量池是多少。

有了初始推荐流量后,不少用户就能看见这篇笔记了,有的点进来觉得不错,点了个赞,有的点进来觉得不行,直接退出了,这些用户的动作,都会成为小红书判断笔记质量的因素。

小红书的内容算法CES全称community engagement score;
模型是:CES=点赞数*1分+收藏数*1分+评论数*4分+转发数*4分+关注数*8分

我相信你们都看过上面网传的小红书推荐CES算法,但实际上,这已经是2017年以前的小红书算法,当时的小红书还无法获取用户太多的动作(没有埋点),仅能凭借基本的用户互动来判断笔记质量。

放到现在,如果单独只看用户的互动,这个CES的互动评分(互动以重要程度排序)还是合理的,但现在2022年了,不只看互动了,小红书也看笔记的完播率,跳出率等等。

何况如果小红书的算法就是简单的加法和乘法,那么小红书的程序员都可以下岗了,更别提判断因素仅仅有“互动”。

因此,一篇笔记有了初始流量池后,小红书会根据以下几方面来判断笔记的质量:

1、点击率

2、互动率(含转发等)

3、完播率/完读率

4、互动值

其中互动值(点赞收藏评论),完播率是我们能看见的,而点击率,互动率都是我们暂时无法看见的,每一个行为也都是用户的一种表态,因此用户做出动作的,一定会权重占比更高,比如点赞,收藏以及评论,其中评论最复杂,所以评论的权重一定比点赞收藏更高,同理点赞收藏肯定也比完播率这些不用做出动作的要更复杂,核心就是互动难度越高,权重占比越高,平台就是根据这些综合得出一篇笔记到底算不算优秀,值不值得去推荐。

有些零克Club会员会问,到底有多少点赞才能进入下个流量池?到底有多少点击率才能进入下个流量池?看完上文这段话,你就知道我也回答不了这个问题,小红书的人也回答不了这个问题,因为小红书的算法根本就不是按互动绝对值作为衡量优秀标准的,衡量标准是动态的,要按照当下类目其他笔记表现来算。

如果大家都很差,那么你稍微好点,就可以了,如果大家都很好,那么就很难了。

就像高考时大学的录取分数线也是动态的一样(某些),是由实际录取的最低成绩的学生决定的,我也称之为动态平衡机制。

假设,我们能过了初始流量这一关,那么就可以进入下一个流量池了,但这里进入下个流量池并不是非黑即白的关系,不是只有表现最好的10%才能进入,剩下90%都进不去,而是10%进入更好的流量池,40%进入小一点的流量池,余下的小部分才不会分配流量。(具体%是不清楚的,只是举例子)

与初始流量池的考核逻辑一致,如果下一个流量池表现很好,就能进入再下一个流量池,直到这个类目下没有匹配流量可以进行推送为止。

我猜看到这里,你会有个疑惑,如果我的笔记表现还行?类目流量也很大,是不是就能一直无限推下去?

实际上是不会的,因为我们一直都少提了一个因素,就是时间因素,新发布的笔记权重最高,老笔记的权重相应递减,这点很好理解,平台肯定不希望推荐一些旧东西。所以在逐渐进入新流量池时,时间因素也会发挥重要作用,比如发布了1-2天的笔记,表现很好,你会明显感受到笔记流量还是很多的,但是即便你的笔记表现很好,互动率很高,10多天的笔记也基本没什么流量了,这个就是时间的原因。平台不会把流量放在一篇旧笔记上!这也是作为博主必须持续不断的更新笔记的原因,老本是吃不起的。

目前来看,小红书的自然流量最长也就在30天左右,这还是极好表现的笔记或者是小众类目(内容不多)的笔记,一般的笔记也就在3-14天结束自然推荐。

至此,整个小红书的流量推荐就结束了。

3 知道算法又如何?

看完上面文章,了解小红书算法之后,我猜你会觉得,好像知道了和没知道,没啥区别?

其实这挺正常,因为看完文章后会发现无法利用小红书算法作弊。

很多人想了解算法,就是想通过逆向思维进行作弊,比如知道点赞高就能有流量,那么直接刷点数据呗?知道算法有什么Bug,就利用算法的Bug薅点流量呗?

但是根据现在的结果来看,会发现小红书算法非常复杂,很难通过简单的动作就进行干预,这对不少人来说,无疑感觉很失望,最终还得通过识别用户的兴趣,做好内容才行,还是不能投机取巧。

但这也合情合理,算法的意义就是尽可能的公平,让做的好的,有能力的博主脱颖而出,这也是算法存在的意义。

在我看来,了解算法背后的逻辑和意义,并非为了去作弊,而是通过算法知道自己的笔记被如何运行在了小红书上,如何被推荐,为什么流量好,为什么流量不好,通过算法的原理去反思问题在哪里,去优化问题,这才是学习算法的真正意义。

而且有些算法上的问题也是完全可以被实际应用调整的,比如笔记的类目和标签(可以用零克追踪zz.lingke.pro查询)被小红书官方打错了,举个例子,洋娃娃的衣服本应是玩具类目,结果被分到了时尚,理论上不会有什么好的效果,这个时候我们就应当调整笔记的内容,更多的出现玩具和洋娃娃这样的词,笔记就会被分到正常的类目下,流量也会顺其自然的好起来。

再比如我们发布了一篇笔记,互动不错,发现笔记每天都有流量,但是每天都不多,这时候就要反思是不是类目过于小众,当前类目的流量是不是总体就不够大导致的,最佳方法当然就是调整账号的方向。

相应的可根据算法进行反思调整的可能点还有很多,但这依赖于根据真实场景的分析,而非别人的提醒。

但以上都是基于免费的自然流量而言,假设自己的内容就是认定不错,就是每次无法突破小流量池怎么办?小红书也提供了动态平衡下的人工可干预机制,付费购买薯条,也就是付费购买流量,但诚实的说,这不便宜。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK