电商个性化推荐中的Match和Rank
电商环境下的个性化推荐是指通过三个模块来实现的,这三个模块分别是候选召回、候选商品的精排和线上的策略调控。其中,候选召回和候选商品的精排是推荐流程中非常重要的两个步骤。
Match
召回模块是为了从全量商品集合中根据用户行为和属性信息触发尽可能多的正确结果,并将这些结果返回给精排模块。
在个性化推荐中,召回模块的重要性不可忽视。因为在没有明确的查询条件的情况下,召回模块需要尽可能丰富相关性的信息。
为了实现这一目标,召回模块需要面对整个商品库集合,并保留尽可能多的相关结果,同时剔除相关性较弱的结果,以减轻后续处理的压力。
为了实现高召回率和高准确率,召回模块需要综合利用多种信息,包括用户信息、类目信息、店铺信息和文本信息等。召回结果的质量对整个推荐结果有着重要的影响。
召回策略主要分为两类:基于内容匹配的召回和基于协同过滤的召回。
基于内容匹配的召回主要是根据用户的画像信息和商品的内容信息进行匹配召回。这种方式召回率较高,但精度较低,适用于冷启动的语义环境。
基于协同过滤的召回主要是根据用户和商品之间的行为矩阵,通过一系列策略得到用户和候选商品之间的相关性。这种方式精度较高,但存在一定程度的冷启动问题。协同过滤是当前推荐系统的基础策略。
Rank
精排模块是为了对召回阶段筛选出来的商品进行精准打分,并根据打分结果进行排序截断,决定最终向用户展示的结果顺序。
精排模块的核心是特征抽取和打分模型的学习训练。
特征抽取的第一步是清洗日志,通过过滤曝光日志并结合准确的用户行为日志,如搜索、点击、收藏等,进行用户和商品的维度聚合,构造用户特征样本。
除了基本属性特征,如用户id、商品id、用户的年龄和性别等人群特征,特征抽取还包括实时反馈特征和双向交叉特征。实时反馈特征包括小时级或分钟级的回流特征,双向交叉特征包括用户在不同类目下的偏好程度和商品在不同人群下的点击率等。
除了实时特征外,还需要进行离线模型的日志和特征的接入、预处理以及离线特征的统计工作,作为实时特征的补充。这些工作为长期兴趣的统计类特征提供了保障。
打分模型主要包括CTR和CVR预估模型。在展示商品前,结合用户历史行为、商品和场景信息,预估展示商品后用户的点击和购买行为,以便在精排时有不同的CTR和CVR倾向。
目前,成熟的排序模型都是多维度分数融合排序,通过计算多个维度的预估分数,包括CTR预估、CVR预估、笔单价和商品毛利润等,根据业务指标进行调控,最终得到最终的排序分数。
End
推荐算法是召回和精排的协同作用。当召回模块召回的内容较少时,精排模块的排序作用就不太明显。当用户的行为丰富时,召回模块就能够获得更多的召回结果,精排模块的作用也更加明显。
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请您通过400-62-96871或关注我们的公众号与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!







请先 登录后发表评论 ~