CN114519138A

CN114519138A - 一种基于他域表征转移的用户冷启动方法

Info

Publication number: CN114519138A
Application number: CN202111654926.9A
Authority: CN
Inventors: 韩弘炀; 傅剑文; 陈心童; 章建森; 周文彬
Original assignee: Tianyi Electronic Commerce Co Ltd
Current assignee: Tianyi Electronic Commerce Co Ltd
Priority date: 2021-12-30
Filing date: 2021-12-30
Publication date: 2022-05-20

Abstract

本发明公开了一种基于他域表征转移的用户冷启动方法，它涉及推荐系统技术领域。对用户目标与来源场景下曝光和点击数据进行采集，对不同场景进行推荐模型预训练，获取不同场景用户交集，得到表征，构建来源域用户embedding；利用目标场景已训练物料结合来源场景的用户embedding进行深度学习模型训练，获取将来源场景用户embedding转化为目标场景用户embedding的结构与参数；获取来源场景有行为用户的embedding，利用表征利用他域表征转移模型将此类用户在目标场景进行推荐。本发明既获取用户个性化的表征，又能够将不同场景下用户表征进行区分，能够准确有效地利用其他场景的信息对用户进行推荐。

Description

一种基于他域表征转移的用户冷启动方法

技术领域

本发明涉及的是推荐系统技术领域，具体涉及一种基于他域表征转移的用户冷启动方法。

背景技术

千人千面形式的个性化推荐已在众多生活场景中发挥作用，不断智能化地满足用户各方面的喜好，其准确捕捉用户兴趣的来源就是用户大量的交互数据。然而在很多场景下，用户是否有交互行为仍然遵循着二八原则，如何对用户进行较为准确的冷启动推荐是推荐场景下的重要环节。目前推荐冷启动方法存在以下问题：

(1)传统冷启动方法大多使用热度或标签结合热度的方式，以群体特征替代个体特征，弱化用户个性化的学习，使得用户推荐效果较为相似，缺失了用户的个性，对用户推荐效果不够准确；

(2)少量场景利用用户在其他场景下用户的表征直接替换当前场景用户表征，虽可以对用户进行冷启动，但未将表征在同一空间中表示，没有考虑不同场景下模型生成的表征差异。

(3)场景间物料类型差异大，无法使用其他场景交互的物料信息。

为了解决上述问题，开发一种基于他域表征转移的用户冷启动方法尤为必要。

发明内容

针对现有技术上存在的不足，本发明目的是在于提供一种基于他域表征转移的用户冷启动方法，利用学习用户表征转移的方式，既获取用户个性化的表征，又能够将不同场景下用户表征进行区分，从而能够准确、有效地利用其他场景的信息对用户进行推荐，易于推广使用。

为了实现上述目的，本发明是通过如下的技术方案来实现：一种基于他域表征转移的用户冷启动方法，其步骤为：

(1)采集模块：利用流技术对用户目标与来源场景下曝光和点击行为数据进行采集、存储；

(2)预训练模块：对各场景单独进行预学习训练，对于两个不同场景进行推荐模型预训练，分别获取其用户、物料等embedding；

(3)模型训练模块：他域表征转移模型训练，获取不同场景用户交集及相应embedding和行为记录，使用多层神经网络+平均池化的形式得到类似attention后的表征，丰富用户表征的刻画学习，并与用户embedding拼接后接多层神经网络构建来源域用户embedding；利用目标场景已训练的物料及其他embedding结合来源场景的用户embedding进行深度学习模型训练，获取将来源场景用户embedding转化为目标场景用户embedding的结构与参数；

(4)冷启动模块：获取来源场景有行为用户的embedding，利用表征利用他域表征转移模型预测当前场景结果，将此类用户在目标场景进行推荐。

作为优选，所述的步骤(1)的具体步骤为：利用流技术对用户目标与来源场景下曝光和点击数据进行采集，并存储至hive中，分别记为table_t和table_s；数据采集技术及存储形式包括但不限于以上所述方式。

作为优选，所述的步骤(2)的具体步骤为：对于hive中的table_t与table_s分别进行用户、物料、上下文等特征构建，对于每条样本，曝光样本label记为0，点击样本label记为1，将目标场景样本与来源场景样本分别存储于hive表S_t与S_s中；分别对目标场景与来源场景进行推荐模型构建，生成目标场景下用户集{U^t}用户i表征

物料表征

与其他表征

生成来源场景下用户集{U^s}用户j表征

物料表征

与其他表征

作为优选，所述的步骤(3)的具体步骤为：①获取目标场景与来源场景有行为的用户交集{U^t∩U^s}并获取该交集下用户p在预训练后的目标场景表征

及来源场景表征

②获取S_s中用户p的样本对应用户表征

与交互物料表征序列

③生成用户交互物料序列类注意力机制表征

其中g(·)为多层神经网络：

④生成补充交互信息的来源场景用户表征

其中h(·)为多层神经网络，输出维度与目标场景用户表征一致；

⑤获取S_t中用户p的样本对应物料表征

与其他表征

拼接来源场景用户表征

经过神经网络训练模型，获取他域用户表征转移的结构和参数h(·)，用户表征

可视为来源场景用户表征转移至目标场景后的用户表征。

作为优选，所述的步骤(4)的具体步骤为：①对于仅有来源场景行为的用户通过训练模块获取其用户表征

对于既有来源场景行为又有目标场景行为的用户使用池化获取其用户表征

②利用上述用户表征输入目标场景预训练的模型获取用户p推荐结果，并将结果存储于hive中。

本发明的有益效果：本方法通过其他场景用户交互物料类注意力机制表征获取用户兴趣，避免了因场景间物料类型差异大无法使用其他场景交互的物料信息。同时利用学习用户表征转移的方式既获取用户个性化的表征，又能够将不同场景下用户表征进行区分，从而能够准确、有效地利用其他场景的信息对用户进行推荐，应用前景广阔。

附图说明

下面结合附图和具体实施方式来详细说明本发明；

图1为本发明利用他域表征转移算法训练示意图；

图2为本发明的实施流程图。

具体实施方式

为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，下面结合具体实施方式，进一步阐述本发明。

参照图1-2，本具体实施方式采用以下技术方案：一种基于他域表征转移的用户冷启动方法，其步骤为：

(1)采集模块：利用流技术对用户目标与来源场景下曝光和点击行为数据进行采集、存储。

具体地：利用流技术对用户目标与来源场景下曝光和点击数据进行采集，并存储至hive中，分别记为table_t和table_s；数据采集技术及存储形式包括但不限于以上所述方式。

对于hive中的table_t与table_s分别进行用户、物料、上下文等特征构建，对于每条样本，曝光样本label记为0，点击样本label记为1，将目标场景样本与来源场景样本分别存储于hive表S_t与S_s中；分别对目标场景与来源场景进行推荐模型构建，生成目标场景下用户集{U^t}用户i表征

物料表征

与其他表征

生成来源场景下用户集{U^s}用户j表征

物料表征

与其他表征

①获取目标场景与来源场景有行为的用户交集{U^t∩U^s}并获取该交集下用户p在预训练后的目标场景表征

及来源场景表征

②获取S_s中用户p的样本对应用户表征

与交互物料表征序列

③生成用户交互物料序列类注意力机制表征

其中g(·)为多层神经网络：

④生成补充交互信息的来源场景用户表征

⑤获取S_t中用户p的样本对应物料表征

与其他表征

拼接来源场景用户表征

可视为来源场景用户表征转移至目标场景后的用户表征。

①对于仅有来源场景行为的用户通过训练模块获取其用户表征

本具体实施方式通过其他场景用户交互物料类注意力机制表征获取不同物料类型场景下用户兴趣，利用其他场景下物料交互信息作为补充，提取更多用户信息，补充表征信息，避免了因场景间物料类型差异大无法使用其他场景交互的物料信息。同时利用学习用户表征转移的方式将用户在其他场景的表征转化为当前场景的表征，既获取用户个性化的表征，又能够学习到不同场景下表征的区别，将不同场景下用户表征进行区分，针对场景进行个性化表征，从而能够准确、有效地利用其他场景的信息对用户进行推荐。

本具体实施方式能够使用其他场景用户表征转换为当前场景较为准确的用户表征，从而能对当前场景无行为的用户进行推荐，并补充用户在其他场景的交互信息，能够通过利用不同场景下不同物料类型的交互行为得到更为准确的推荐结果，该方法应用场景广阔，可节省用户当前场景信息获取的人力、资源开销，同时根据不同用户不同场景进行精细化排序，实现用户转化最大化，具有广阔的市场应用前景。

实施例1：一种基于他域表征转移的用户冷启动方法，其步骤为：

①利用流技术对用户目标与来源场景下曝光和点击数据进行采集并存储至hive中分别记为table_t和table_s。

②对于hive中的table_t与table_s分别进行用户、物料、上下文等特征构建，对于每条样本，曝光样本label记为0，点击样本label记为1，将目标场景样本与来源场景样本分别存储于hive表S_t与S_s中。

③分别对目标场景与来源场景进行推荐模型构建，生成目标场景下用户集{U^t}用户i表征

物料表征

与其他表征

生成来源场景下用户集{U^s}用户j表征

物料表征

与其他表征

④获取目标场景与来源场景有行为的用户交集{U^t∩U^s}并获取该交集下用户p在预训练后的目标场景表征

及来源场景表征

⑤获取S_s中用户p的样本对应用户表征

与交互物料表征序列

⑥生成用户交互物料序列类注意力机制表征

⑦生成补充交互信息的来源场景用户表征

⑧获取S_t中用户p的样本对应物料表征

与其他表征

拼接来源场景用户表征

经过神经网络训练模型，获取他域用户表征转移的结构和参数h(·)。

⑨对于仅有来源场景行为的用户通过训练模块获取其用户表征

经验取α＝0.7。

⑩利用上述用户表征输入目标场景预训练的模型获取用户p推荐结果，并将结果存储于hive中。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.一种基于他域表征转移的用户冷启动方法，其特征在于，其步骤为：

(2)预训练模块：对各场景单独进行预学习训练，对于两个不同场景进行推荐模型预训练，分别获取其用户、物料embedding；

(3)模型训练模块：他域表征转移模型训练，获取不同场景用户交集及相应embedding和行为记录，使用多层神经网络+平均池化的形式得到类似attention后的表征，并与用户embedding拼接后接多层神经网络构建来源域用户embedding；利用目标场景已训练的物料及其他embedding结合来源场景的用户embedding进行深度学习模型训练，获取将来源场景用户embedding转化为目标场景用户embedding的结构与参数；

2.根据权利要求1所述的一种基于他域表征转移的用户冷启动方法，其特征在于，所述的步骤(1)的具体步骤为：利用流技术对用户目标与来源场景下曝光和点击数据进行采集，并存储至hive中，分别记为table_t和table_s。

3.根据权利要求1所述的一种基于他域表征转移的用户冷启动方法，其特征在于，所述的步骤(2)的具体步骤为：对于hive中的table_t与table_s分别进行用户、物料、上下文特征构建，对于每条样本，曝光样本label记为0，点击样本label记为1，将目标场景样本与来源场景样本分别存储于hive表S_t与S_s中；分别对目标场景与来源场景进行推荐模型构建，生成目标场景下用户集{U^t}用户i表征