向量体系(Embedding)在严选的落地实践

向量化在业界的运用越来越广，近期也有许多文章分享过相关的主题。严选于18年下半年开始探索向量化在搜索推荐场景中的运用，从最开始基于商品召回用户的任务到后续的搜索召回、搜索个性化排序、搜索底纹、搜索发现词、搜索建议词、跨类目推荐、推荐召回、多兴趣召回、通用排序、端智能重排等等，我们不断拓宽向量体系在严选的运用，在这过程中一点点迭代与沉淀。本文将从模型算法和落地运用等角度做简要介绍，希望能给读者一些启发。

本文将从以下几个方面展开介绍

向量体系｜算法模型｜相关技术｜落地分享｜总结展望

篇幅较长，时间充裕的读者建议全文阅读，不充裕的话也可以有选择阅读。

向量体系

YZJj6vq.png!mobile

上图是对严选向量体系的一个概览。引言中说了那么多运用场景，第一眼看会觉得有些场景之间跨度蛮大，但是仔细考虑一下我们会发现，其实电商场景的大部分任务（包含以上所述的）都是在做对象之间的匹配，可能是商品和人的匹配，可能是检索词和商品的匹配，可能是用户和检索词的匹配等等。

于是，摆在我们面前的问题就是如何把我们目前遇到的以及将来会遇到的对象进行一个比较好的表征并刻画对象之间的相似度，其本质是学习出各个对象在同一个空间中距离的刻画。

如果我们把各个对象都学习到同一个空间，那么这些对象之间的组合几乎能覆盖各种运用场景，例如我们拥有用户(U)、商品(I)、检索词(Q) 的表征，仅仅是这三者的组合就可以有例如U2I、Q2I、I2Q、Q2Q、U2Q、I2I等等，我们进一步扩展类目、专题等等的表征之后能覆盖的场景就更多了。

那么我们如何去表征各个对象呢？向量凭借着简单的结构、快速的相似性计算、强大的表征能力有着得天独厚的优势。因此我们选择向量作为对象的表征方式。

当然有了向量表征仅仅是第一步，为了能让其服务于各个场景，线上线下需要其他模块的辅助配合，需要将具体的场景进行抽象，同时过程中也离不开不断的迭代优化，需要考虑模型的效果、稳定性、可扩展性、以及线上性能等等。

由点及面，在有了向量基础后，我们需要进一步扩展向量存储、向量计算等能力，进一步，由面到体，我们需要不断去分析和抽象具体的业务场景，以此不断铺开向量体系在实际业务中的落地运用。

算法模型

最开始我们使用的是图嵌入技术同时学习商品和用户，例如LINE、Node2Vec等模型（节点做标示进行区分），后续也尝试过使用YoutubeDNN的方式学习商品和用户向量，最后为了兼顾模型的可扩展性以及稀疏数据上表征的可靠性，我们选择了两步走的策略。

确认商品是整个电商场景中的核心，单独学习优化商品向量表征
其他对象都和商品有直接或者间接的关系（交互），通过专门的聚合模块得到对象表征

实践表明，这个两步走的策略在我们的场景中要优于之前尝试的方案，接下来我会对这两步做简要的介绍。

商品向量学习

商品向量的学习关键在于用户行为数据的梳理以及模型的构建（参考了Airbnb的模型，在其基础上做了较多改进）。

商品是电商场景下用户交互最核心的东西，大部分的用户行为都围绕着商品。大量的用户行为中，天然的包含了用户对商品的认知，通过对这些认知的提取，我们便能够刻画出用户眼中商品的样子，利用用户眼中商品的样子能更好得去引导用户的行为。

我们有用户和商品交互的各种数据以及商品自身的一些属性。用户的 连续点击行为 能在商品之间构建关联；用户的 购买行为 能告诉我们用户的探索路径更容易收敛到哪些商品；用户的相继的购买行为能反应商品之间的搭配购买信息；商品自身的属性能在冷启动时给我们提供很多额外信息等等。我们要做的就是融合行为和属性学习出商品向量。

2MRnme.png!mobile

jAf2ymm.png!mobile

从上图可以看到，我们训练数据的构建其实可以等效看成构建了商品之间有权有向的关系图，同时增加了一些转化导向的长连接。我们的模型训练有别于传统的方式，对一个单一训练样本 center(中心商品):contexts(临近点击):global(序列内购买) ，我们希望 center 和 contexts(包含多个id) 以及 center 和 global 的距离越接近越好，所以在构建损失函数的时候我们一次性算出 center 和 contexts(包含多个id) 的相似性以及 center 和 global 的相似性，然后再加上负采样的约束。对于负采样，我们采取的是在一个 batch 内构建负样本的方式，这种方式简单有效且能满足按照样本出现的频率采样，同时结合矩阵运算能加快训练数据。在获取负样本后我们进一步构建 pair-wise 的loss，这对模型效果能有一些提升。模型的细节可以参考下图。

Bvu6vuB.png!mobile

FVJrea3.png!mobile

还有需要提及的一点是，为了学习到更好的商品向量表征，通常的方式是每日全量重新训练商品向量，但是这就引入了一些问题，例如每日的商品向量不在同一个空间中，相互之间的计算是没有意义的，如果不小心拿隔日向量进行了计算，会引入意外的结果。于是有人会采用增量训练的方式，每日只对新增的商品做推断获取它们的向量，但是这样也会引入一些问题，比如商品之间的关系并不是稳定不变的，只针对新商品做推断的话会使得原有商品之间的关系无法依据新数据进行调整。

针对这些问题我们提出了两种解决方案，一种是在隔日的向量空间之间学习一个仿射变换，对当日学得的向量做仿射变换，然后最小化相邻两天共现对象向量间的差异，这样仿射变换后的向量就能变换到历史空间中，同时包含一些新的结构信息。还有一种方案类似预训练的方式，在第二日训练的时候拿前一日的向量做初始化，对于没有出现过的对象做随机初始化，然后降低学习率做微调学习。在我们的场景中第二种方案效果相对好一些，第一种也能取得不错的效果。

此外从19年下半年开始我们也针对GNN相关的模型做了尝试，例如graphSAGE、LightGCN、SR-GNN等，目前看来SR-GNN模型在我们的场景中效果还可以。

扩展向量学习

假设我们只有商品向量(I)，我们能做的事相对比较局限，例如我们可以做基于I2I的各种任务、我们可以将商品向量作为预训练的向量提供给具体场景用于迁移学习。进一步我们获取了用户向量(U)之后，我们便可以做U2I、I2U等召回场景，很多分享案例都止步于此，但是只要我们再加一个对象例如检索词向量(U)，我们的运用场景就瞬间开阔了许多，进一步我们还会有类目向量(C)、专题向量(T)等等。

随着业务场景的铺开，我们会遇到越来越多的对象匹配任务。我们可以针对每个场景分别学习，例如针对商品和检索词构建深度模型，学习他们的相似度量，例如针对检索词历史进行挖掘做检索词的相关推荐，例如针对用户和商品的历史交互建模做商品的召回，例如针对用户和专题的交互历史做专题召回等等，在这样的模式下每新增一个场景我们就需要花费人力去开发和后期维护，并且有的新增场景一开始并没有训练数据给你使用。考虑到可扩展性，我们可以将这些对象统一到一个增量向量产出框架中，抽象出一套聚合逻辑，产出同一向量空间中的向量。

y2MbQzN.png!mobile

结合落地实践，我们的聚合模块主要包含上图所示的子模块，我们将新增对象叫做target，将基础的商品叫做source。到实际场景中，对象和商品的交互可能存在时间上的先后，因此需要时间衰减模块来处理时间因子；考虑到对象和商品的交互次数会有频次上的差异，我们需要权重累计模块来处理这个因素；考虑到对象和商品的交互会有一些噪音数据比如用户的误点击行为、或者运营的错误配置等等，我们需要噪音过滤模块来对噪音数据降权；考虑到有的场景使用单向量表征更合适，我们需要对交互数据做自注意力机制的处理，来凸显主要兴趣，因此引入了注意力机制模块；但是在有些场景，对象交互的商品往往是分布在空间中的多个区域（对用户而言是多兴趣表征，对检索词而言是多义词表征），为此我们加入了聚类模块（可以使用传统的聚类算法，也可以考虑用复杂网络中的社区检测算法来进行聚类，一般是在全局商品上进行操作），来输出对象的多向量表征。

凭借通用聚合框架，每次我们要新增对象的向量表征的时候，只需要处理一份target和source的关系表，同时每一个source都带上target和它交互的相关附加信息，将这份关系数据输入聚合框架便能产出和商品向量属于同一向量空间的对象向量了，任意对象之间都可以相互计算，判断相似情况。此外聚合模块的逻辑经过较小的改动也可以直接运用到线上对象的实时向量表征中。

购买预测

此外再提一个购买预测的场景，用户日常的行为可能是目的明确地浏览、也可能是目的不明地闲逛，那么如何区分是哪种行为呢。其实很简单，分析下用户看过的商品之间是相似的还是没什么关联的就行，很显然（I2I）能满足我们的需求，我们可以为每个商品计算它与其它所有商品相似度得分的均值（记为S），如果每个商品最终得分都较大，那么用户是在目的明确地浏览，如果每个商品的得分都较小那么用户是在目的不明地闲逛，如果几个商品得分较高，几个商品得分较低，那么用户是相对集中的看了几个类似商品，同时无意地点了几个其他商品。基于以上我们可以挑选出那些目的明确地浏览的用户。至此读者可能会想，然后把得分最大的商品挑出来就可以了，但是其实还没有结束。截止到目前我们只使用了用户当日的行为，但是我们上手还有用户以往的行为，这些信息不能浪费，它们会修正我们当下作出的判断。假设今日挑选出的商品中，有的商品用户前几日就很有兴趣，那么今日他购买的概率必然比S得分相似的其他商品要更大，因此更好的判断应当基于今日的S以及用户前几日兴趣对商品们的得分（U2I） , 这个项目的上线明显提升了用户的转化。 （I2I和U2I的运用）

总结展望

Jvyiy2Q.png!mobile

向量体系有着很明显的优势，它能让我们迅速完成产品新功能的上线并取得不错的效果，同时在有的场景中也能完胜一些老的复杂的方法，这恰恰也印证了奥卡姆剃刀原则。

随着表征对象的增加以及对业务的进一步理解，我们仍将一步步不断拓宽向量体系在业务中的落地，但是在实践中我们也会发现它的局限性，这个局限性一方面来自于向量表征结构自身，另一方面源于部分实际问题的复杂性需要新的表征方式来解决，所以我们将会进一步探索其他的表征方式，以及新的技术方向。

作者简介

张俊，高级算法工程师，2018年毕业于中国人民大学后加入网易严选，致力于严选搜索推荐业务的迭代优化，推动向量体系在严选从无到有的构建并运用于各个业务场景。

本文由作者授权严选技术团队发布

V3aqiq.png!mobile

fUfAzy3.jpg!mobile

向量体系

商品向量学习

扩展向量学习

相关技术

推荐召回

购买预测

Recommend

FGPM：文本对抗样本生成新方法

使用卷积神经网络和openCV预测年龄和性别

基于OpenCV对神经网络预处理人脸图像的快速指南

面试：谈谈你对MyBatis执行过程之SQL执行过程理解

.GAY域名正式开放注册 - 卢松松博客

toString如何转json

闲鱼服务端架构演进历程

Linux不同共享库中同名函数的处理

抢食生鲜，美团最大对手会是拼多多

InnerEye深度学习工具包开源：让医学影像AI普及化

About Joyk