了解一下抖音推荐机制以及威尔逊得分排序算法

了解一下抖音推荐机制

抖音，相信大家都玩过，没玩过，那总听说过吧？你知道你为什么上不了热门吗？

其实，抖音的上热门的方法类似于威尔逊得分排序算法，但是远远又比威尔逊得分排序算法更复杂。

大概就是：

机器审核+人工双重审核。

当一个视频初期上传，平台会给你一个初始流量，如果初始流量之后，根据点赞率，评论率，转发率，进行判断：该视频是受欢迎还是不受欢迎，如果第一轮评判为受欢迎的，那么他会进行二次传播。

当第二次得到了最优反馈，那么就会给与推荐你更大的流量。

相反，在第一波或者第N波，反应不好，就不再推荐，没有了平台的推荐，你的视频想火的概率微乎其微，因为没有更多的流量能看见你。

你的视频火的第一步是被别人看见，第一步就把路给走死了，后续也只能依靠朋友星星点点的赞。

其实，不难看出这个抖音推荐机制算法背后思维逻辑：流量池，叠加推荐，热度加权及用户心理追求。

下面还是来了解一下威尔逊得分(Wilson Score)排序算法吧！

威尔逊得分(Wilson Score)排序算法

威尔逊得分(Wilson Score)排序算法：是对质量进行排序，评论中含有好评还有差评，综合考虑评论数与好评率，得分越高，质量越高。

威尔逊算法.png

u表示正例数（好评），v表示负例数（差评），n表示实例总数（评论总数），p表示好评率，z是正态分布的分位数（参数），S表示最终的威尔逊得分。z一般取值2即可，即95%的置信度。

正太分布的分位数表：

威尔逊算法-分位数表.png

算法性质：
性质：得分S的范围是[0,1)，效果：已经归一化，适合排序
性质：当正例数u为0时，p为0，得分S为0；效果：没有好评，分数最低；
性质：当负例数v为0时，p为1，退化为1/(1 + z^2 / n)，得分S永远小于1；效果：分数具有永久可比性；
性质：当p不变时，n越大，分子减少速度小于分母减少速度，得分S越多，反之亦然；效果：好评率p相同，实例总数n越多，得分S越多；
性质：当n趋于无穷大时，退化为p，得分S由p决定；效果：当评论总数n越多时，好评率p带给得分S的提升越明显；
性质：当分位数z越大时，总数n越重要，好评率p越不重要，反之亦然；效果：z越大，评论总数n越重要，区分度低；z越小，好评率p越重要；

威尔逊得分算法的分布图：

威尔逊得分算法的分布图.png

所以，zP一般是取值为2即可，即95%的置信度。

分别用Java、Python、Go实现

其实用什么语言实现都是一样的道理，编程在乎的是一种思想，在这里我罗列一下Java、Python、Go实现的代码，你就知道了。

Java实现

package com.lzhpo.wsdemo1.test1;/** * 威尔逊得分(Wilson Score)排序算法 * * @author lzhpo */public class WilsonScoreDemo1 {    /**     * 计算威尔逊得分     * <p>     * zP一般取值2即可，即95%的置信度。     * </p>     *     * @param u  好评数     * @param n  评论总数     * @param zP 正态分布的分位数     * @return s 威尔逊得分     */    public static double wilsonScore(double u, double n, double zP) {        // 好评率        double p = u / n;        System.out.println("好评率为：" + p);        // 威尔逊得分        double s = (p + (Math.pow(zP, 2) / (2. * n)) - ((zP / (2. * n)) * Math.sqrt(4. * n * (1. - p) * p + Math.pow(zP, 2)))) / (1. + Math.pow(zP, 2) / n);        System.out.println("威尔逊得分为：" + s);        return s;    }    public static void main(String[] args) {        // 计算结果：0.46844027984510983        System.out.println(wilsonScore(500, 1000, 2));    }}

Python实现

import numpy as npdef wilson_score(u, n, zP=2.):    """    威尔逊得分(Wilson Score)排序算法 => 计算威尔逊得分    :param u: 好评数    :param n: 评论总数    :param zP: 正太分布的分位数(zP一般取值2即可，即95%的置信度)    :return: 威尔逊得分    """    pos_rat = u * 1. / n * 1.    score = (pos_rat + (np.square(zP) / (2. * n))             - ((zP / (2. * n)) * np.sqrt(4. * n * (1. - pos_rat) * pos_rat + np.square(zP)))) / (1. + np.square(zP) / n)    return score# 计算结果：0.46844027984510983print(wilson_score(500, 1000, 2))

package mainimport (    "fmt"    "math")// 威尔逊得分(Wilson Score)排序算法func main() {    // 计算结果：0.46844027984510983    wilsonScore(500, 1000, 2)}// 计算威尔逊得分// u：好评数    zP：正态分布的分位数(一般取值2即可，即95%的置信度)    s：威尔逊得分func wilsonScore(u float64, n float64, zP float64) float64 {    p := u / n    println()    fmt.Println("好评率为：", p)    s := (p + (math.Pow(zP, 2) / (2. * n)) - ((zP / (2. * n)) * math.Sqrt(4.*n*(1.-p)*p+math.Pow(zP, 2)))) / (1. + math.Pow(zP, 2)/n)    fmt.Println("威尔逊得分为：", s)    return s}

本文作者： lzhpo
本文链接： http://www.lzhpo.com/article/115
版权声明： 本文为本人原创文章，采用 CC BY 3.0 CN协议，可自由转载、引用，但需署名作者且注明文章出处。

正文到此结束

所属分类：Java开发

了解一下抖音推荐机制以及威尔逊得分排序算法

了解一下抖音推荐机制以及威尔逊得分排序算法

了解一下抖音推荐机制

威尔逊得分(Wilson Score)排序算法

分别用Java、Python、Go实现

Java实现

Python实现

Recommend

0521 - 程序与交易结合

0523 - 交易靠自己

TinyML ESP32 人检测应用的移植和使用

Doing the Right Thing > Doing Things Right

"Back to the Future" De Lorean added to the National Historic Vehicle...

夏天冻死人的失温，被忽视的运动杀手

豚鼠背后的海上黄金时代

What I Learned from Pair Programming in My First Job

5 Ways Big Data and Analytics Will Change Sports -Big Data Analytics News

Docker LAMP 环境搭建和 Docker Compose 的使用

About Joyk