CN117033749A

CN117033749A - 信息推荐方法、装置、设备及计算机可读存储介质

Info

Publication number: CN117033749A
Application number: CN202210473901.7A
Authority: CN
Inventors: 乔阳; 付煜文; 陈亮; 何秀强
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-04-29
Filing date: 2022-04-29
Publication date: 2023-11-10

Abstract

本申请实施例提供一种信息推荐方法、装置、设备及计算机可读存储介质，至少应用于人工智能领域，包括：对目标域行为序列和源域行为序列分别进行兴趣特征提取，得到目标域兴趣特征和一阶源域兴趣特征；源域包括目标对象已有信息的数据特征，目标域至少包括目标对象的待学习信息的数据特征；对目标域兴趣特征和一阶源域兴趣特征进行兴趣特征融合处理，对目标域兴趣特征和源域融合兴趣特征进行跨域聚合处理，得到聚合兴趣特征；基于聚合兴趣特征，对目标域的目标推荐对象进行信息推荐。通过本申请，能够利用源域充分的目标对象行为，指导目标域用户兴趣特征的表示，从而缓解目标域目标对象行为的稀疏性，提升目标域推荐准确性。

Description

信息推荐方法、装置、设备及计算机可读存储介质

技术领域

本申请实施例涉及人工智能技术领域，涉及但不限于一种信息推荐方法、装置、设备及计算机可读存储介质。

背景技术

随着大数据时代的到来，推荐系统已经进入人们生活的方方面面。点击率(CTR，Click Through Rate)预估模块作为推荐系统中的核心模块发展迅速，从最早的稀疏浅层模型到深度模型，再到序列和图模型，模型复杂度越来越高，使用的信息越来越全面，所需要的训练数据规模也越来越大。而现实生活中的推荐系统往往存在数据稀疏、冷启动等问题，尤其是很多业务往往存在多个场景，这些场景规模存在差异，场景间既存在共性又存在不同，如何结合不同域数据的特点，充分利用多场景的信息就成为一个非常关键的问题，因此近年来跨域推荐(CDR，Cross-domain Recommendation)逐渐受到人们的关注。

相关技术中，通常是基于源域和目标域行为序列建模进行跨域推荐，但是，相关技术中的方法，在进行跨域推荐时，跨域兴趣特征表征不全面、且跨域兴趣特征融合不充分，从而导致跨域推荐的准确性较低。

发明内容

本申请实施例提供一种信息推荐方法、装置、设备及计算机可读存储介质，至少应用于人工智能领域，能够利用源域充分的目标对象行为，指导目标域用户兴趣特征的表示，从而缓解目标域目标对象行为的稀疏性，提升目标域推荐准确性。

本申请实施例的技术方案是这样实现的：

本申请实施例提供一种信息推荐方法，所述方法包括：

获取目标对象在目标域中的目标域行为序列和在源域中的源域行为序列；其中，所述源域包括所述目标对象已有信息的数据特征，所述目标域至少包括所述目标对象的待学习信息的数据特征；对所述目标域行为序列和所述源域行为序列分别进行兴趣特征提取，对应得到目标域兴趣特征和一阶源域兴趣特征；对所述目标域兴趣特征和所述一阶源域兴趣特征进行兴趣特征融合处理，得到源域融合兴趣特征；对所述目标域兴趣特征和所述源域融合兴趣特征进行跨域聚合处理，得到聚合兴趣特征；基于所述聚合兴趣特征，对所述目标域的目标推荐对象进行信息推荐，其中，所述目标对象的待学习信息至少包括所述目标推荐对象。

在一些实施例中，对目标域行为序列进行兴趣特征提取，得到目标域兴趣特征，包括：基于自注意力机制，对所述目标域行为序列进行向量表示，得到目标域行为向量；获取所述目标域中的每一推荐对象的第一对象信息、所述目标对象的第二对象信息、与当前推荐场景对应的上下文信息；基于所述第一对象信息、所述第二对象信息和所述上下文信息，生成目标域查询向量；基于所述目标域查询向量，对所述目标域行为向量进行聚合处理，得到所述目标域兴趣特征。

在一些实施例中，所述基于所述第一对象信息、所述第二对象信息和所述上下文信息，生成目标域查询向量，包括：分别对所述第一对象信息、所述第二对象信息和所述上下文信息进行特征提取，得到第一对象特征向量、第二对象特征向量和上下文特征向量；对所述第一对象特征向量、所述第二对象特征向量和所述上下文特征向量进行拼接处理，得到第一拼接向量；将所述第一拼接向量确定为所述目标域查询向量。

在一些实施例中，对源域行为序列进行兴趣特征提取，得到一阶源域兴趣特征，包括：基于自注意力机制，对所述源域行为序列进行向量表示，得到源域行为向量；获取所述目标对象的第二对象信息、与当前推荐场景对应的上下文信息；基于所述第二对象信息和所述上下文信息，生成源域查询向量；基于所述源域查询向量，对所述源域行为向量进行合并处理，得到原始源域兴趣特征；获取空间转换参数；采用所述空间转换参数，对所述原始源域兴趣特征进行空间转换，得到所述一阶源域兴趣特征。

在一些实施例中，所述基于所述第二对象信息和所述上下文信息，生成源域查询向量，包括：分别对所述第二对象信息和所述上下文信息进行特征提取，得到第二对象特征向量和上下文特征向量；对所述第二对象特征向量和所述上下文特征向量进行拼接处理，得到第二拼接向量；将所述第二拼接向量确定为所述源域查询向量。

在一些实施例中，所述对所述目标域兴趣特征和所述一阶源域兴趣特征进行兴趣特征融合处理，得到源域融合兴趣特征，包括：对所述目标域兴趣特征和所述一阶源域兴趣特征进行映射处理，得到二阶源域兴趣特征；对所述一阶源域兴趣特征和所述二阶源域兴趣特征进行源域特征融合处理，得到所述源域融合兴趣特征。

在一些实施例中，所述对所述目标域兴趣特征和所述一阶源域兴趣特征进行映射处理，得到二阶源域兴趣特征，包括：对所述目标域兴趣特征和所述一阶源域兴趣特征进行向量哈达玛积运算，得到融合兴趣向量；基于每一推荐对象的第一对象信息和所述融合兴趣向量，生成融合查询向量；基于所述融合查询向量，对所述源域行为向量进行聚合处理，得到源域聚合兴趣特征；采用所述空间转换参数，对所述源域聚合兴趣特征进行空间转换，得到所述二阶源域兴趣特征。

在一些实施例中，所述对所述一阶源域兴趣特征和所述二阶源域兴趣特征进行源域特征融合处理，得到所述源域融合兴趣特征，包括：对所述一阶源域兴趣特征和所述二阶源域兴趣特征进行元素对应叠加，得到所述源域融合兴趣特征。

在一些实施例中，所述对所述目标域兴趣特征和所述源域融合兴趣特征进行跨域聚合融合处理，得到聚合兴趣特征，包括：通过门控网络分别为所述目标域兴趣特征、所述源域融合兴趣特征和所述融合兴趣向量对应分配目标域权重、源域权重和融合权重；基于所述目标域权重、所述源域权重和所述融合权重，对所述目标域兴趣特征、所述源域融合兴趣特征和所述融合兴趣向量进行加权融合，得到加权融合向量；将所述加权融合向量确定为所述聚合兴趣特征。

在一些实施例中，所述通过门控网络分别为所述目标域兴趣特征、所述源域融合兴趣特征和所述融合兴趣向量对应分配目标域权重、源域权重和融合权重，包括：基于所述目标对象的第二对象信息、所述目标域兴趣特征、所述源域融合兴趣特征、所述融合兴趣向量、与当前推荐场景对应的上下文信息，通过所述门控网络，分别为所述目标域兴趣特征、所述源域融合兴趣特征和所述融合兴趣向量对应分配所述目标域权重、所述源域权重和所述融合权重。

在一些实施例中，所述基于所述聚合兴趣特征，对所述目标域的目标推荐对象进行信息推荐，包括：基于所述聚合兴趣特征，生成模型输入向量；将所述模型输入向量输入至信息推荐模型中；通过所述信息推荐模型，确定所述目标对象对所述目标域中的每一推荐对象进行交互的交互概率；基于所述交互概率，从所述目标域中的推荐对象中确定出所述目标推荐对象；对所述目标推荐对象进行信息推荐。

在一些实施例中，所述基于所述聚合兴趣特征，生成模型输入向量，包括：获取所述目标域中的每一推荐对象的第一对象信息、所述目标对象的第二对象信息、与当前推荐场景对应的上下文信息；分别对所述第一对象信息、所述第二对象信息和所述上下文信息进行特征提取，得到第一对象特征向量、第二对象特征向量和上下文特征向量；对所述第一对象特征向量、所述第二对象特征向量、所述上下文特征向量和所述聚合兴趣特征进行拼接处理，得到第三拼接向量；将所述第三拼接向量，确定为所述模型输入向量。

本申请实施例提供一种信息推荐装置，所述装置包括：

获取模块，用于获取目标对象在目标域中的目标域行为序列和在源域中的源域行为序列；其中，所述源域包括所述目标对象已有信息的数据特征，所述目标域至少包括所述目标对象的待学习信息的数据特征；特征提取模块，用于对所述目标域行为序列和所述源域行为序列分别进行兴趣特征提取，对应得到目标域兴趣特征和一阶源域兴趣特征；融合处理模块，用于对所述目标域兴趣特征和所述一阶源域兴趣特征进行兴趣特征融合处理，得到源域融合兴趣特征；聚合处理模块，用于对所述目标域兴趣特征和所述源域融合兴趣特征进行跨域聚合处理，得到聚合兴趣特征；信息推荐模块，用于基于所述聚合兴趣特征，对所述目标域的目标推荐对象进行信息推荐，其中，所述目标对象的待学习信息至少包括所述目标推荐对象。

在一些实施例中，所述特征提取模块还用于：基于自注意力机制，对所述目标域行为序列进行向量表示，得到目标域行为向量；获取所述目标域中的每一推荐对象的第一对象信息、所述目标对象的第二对象信息、与当前推荐场景对应的上下文信息；基于所述第一对象信息、所述第二对象信息和所述上下文信息，生成目标域查询向量；基于所述目标域查询向量，对所述目标域行为向量进行聚合处理，得到所述目标域兴趣特征。

在一些实施例中，所述特征提取模块还用于：分别对所述第一对象信息、所述第二对象信息和所述上下文信息进行特征提取，得到第一对象特征向量、第二对象特征向量和上下文特征向量；对所述第一对象特征向量、所述第二对象特征向量和所述上下文特征向量进行拼接处理，得到第一拼接向量；将所述第一拼接向量确定为所述目标域查询向量。

在一些实施例中，所述特征提取模块还用于：基于自注意力机制，对所述源域行为序列进行向量表示，得到源域行为向量；获取所述目标对象的第二对象信息、与当前推荐场景对应的上下文信息；基于所述第二对象信息和所述上下文信息，生成源域查询向量；基于所述源域查询向量，对所述源域行为向量进行合并处理，得到原始源域兴趣特征；获取空间转换参数；采用所述空间转换参数，对所述原始源域兴趣特征进行空间转换，得到所述一阶源域兴趣特征。

在一些实施例中，所述特征提取模块还用于：分别对所述第二对象信息和所述上下文信息进行特征提取，得到第二对象特征向量和上下文特征向量；对所述第二对象特征向量和所述上下文特征向量进行拼接处理，得到第二拼接向量；将所述第二拼接向量确定为所述源域查询向量。

在一些实施例中，所述融合处理模块还用于：对所述目标域兴趣特征和所述一阶源域兴趣特征进行映射处理，得到二阶源域兴趣特征；对所述一阶源域兴趣特征和所述二阶源域兴趣特征进行源域特征融合处理，得到所述源域融合兴趣特征。

在一些实施例中，所述融合处理模块还用于：对所述目标域兴趣特征和所述一阶源域兴趣特征进行向量哈达玛积运算，得到融合兴趣向量；基于每一推荐对象的第一对象信息和所述融合兴趣向量，生成融合查询向量；基于所述融合查询向量，对所述源域行为向量进行聚合处理，得到源域聚合兴趣特征；采用所述空间转换参数，对所述源域聚合兴趣特征进行空间转换，得到所述二阶源域兴趣特征。

在一些实施例中，所述融合处理模块还用于：对所述一阶源域兴趣特征和所述二阶源域兴趣特征进行元素对应叠加，得到所述源域融合兴趣特征。

在一些实施例中，所述聚合处理模块还用于：通过门控网络分别为所述目标域兴趣特征、所述源域融合兴趣特征和所述融合兴趣向量对应分配目标域权重、源域权重和融合权重；基于所述目标域权重、所述源域权重和所述融合权重，对所述目标域兴趣特征、所述源域融合兴趣特征和所述融合兴趣向量进行加权融合，得到加权融合向量；将所述加权融合向量确定为所述聚合兴趣特征。

在一些实施例中，所述聚合处理模块还用于：基于所述目标对象的第二对象信息、所述目标域兴趣特征、所述源域融合兴趣特征、所述融合兴趣向量、与当前推荐场景对应的上下文信息，通过所述门控网络，分别为所述目标域兴趣特征、所述源域融合兴趣特征和所述融合兴趣向量对应分配所述目标域权重、所述源域权重和所述融合权重。

在一些实施例中，所述信息推荐模块还用于：基于所述聚合兴趣特征，生成模型输入向量；将所述模型输入向量输入至信息推荐模型中；通过所述信息推荐模型，确定所述目标对象对所述目标域中的每一推荐对象进行交互的交互概率；基于所述交互概率，从所述目标域中的推荐对象中确定出所述目标推荐对象；对所述目标推荐对象进行信息推荐。

在一些实施例中，所述信息推荐模块还用于：获取所述目标域中的每一推荐对象的第一对象信息、所述目标对象的第二对象信息、与当前推荐场景对应的上下文信息；分别对所述第一对象信息、所述第二对象信息和所述上下文信息进行特征提取，得到第一对象特征向量、第二对象特征向量和上下文特征向量；对所述第一对象特征向量、所述第二对象特征向量、所述上下文特征向量和所述聚合兴趣特征进行拼接处理，得到第三拼接向量；将所述第三拼接向量，确定为所述模型输入向量。

本申请实施例提供一种信息推荐设备，包括：

存储器，用于存储可执行指令；处理器，用于执行所述存储器中存储的可执行指令时，实现上述信息推荐方法。

本申请实施例提供一种计算机程序产品或计算机程序，计算机程序产品或计算机程序包括可执行指令，可执行指令存储在计算机可读存储介质中；其中，信息推荐设备的处理器从计算机可读存储介质中读取可执行指令，并执行可执行指令时，实现上述的信息推荐方法。

本申请实施例提供一种计算机可读存储介质，存储有可执行指令，用于引起处理器执行所述可执行指令时，实现上述信息推荐方法。

本申请实施例具有以下有益效果：通过对目标域行为序列和源域行为序列分别进行兴趣特征提取，对应得到目标域兴趣特征和一阶源域兴趣特征；并对目标域兴趣特征和一阶源域兴趣特征进行兴趣特征融合处理，得到源域融合兴趣特征；之后，再对目标域兴趣特征和源域融合兴趣特征进行跨域聚合处理，得到聚合兴趣特征，从而基于聚合兴趣特征，对目标域的目标推荐对象进行信息推荐。如此利用源域充分的目标对象行为，指导目标域用户兴趣特征的表示，从而缓解目标域目标对象行为的稀疏性，提升目标域推荐准确性。

附图说明

图1是本申请实施例提供的基于源域和目标域进行跨域推荐的四种情况；

图2是本申请实施例提供的MiNet模型的结构示意图；

图3是本申请实施例提供的MACDM模型的结构示意图；

图4是本申请实施例提供的信息推荐系统的一个可选的架构示意图；

图5是本申请实施例提供的信息推荐设备的结构示意图；

图6是本申请实施例提供的进程控制方法的一个可选的流程示意图；

图7是本申请实施例提供的进程控制方法的另一个可选的流程示意图；

图8是本申请实施例提供的SICDM模型的结构示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请作进一步地详细描述，所描述的实施例不应视为对本申请的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。除非另有定义，本申请实施例所使用的所有的技术和科学术语与属于本申请实施例的技术领域的技术人员通常理解的含义相同。本申请实施例所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

随着大数据时代的到来，推荐系统已经进入人们生活的方方面面。相关技术中的信息推荐方案，尤其是基于源域和目标域行为序列建模进行跨域推荐的方案，主要存在跨域兴趣表征不全面、且融合不充分的缺陷。

基于相关技术中所存在的问题，本申请实施例提供一种信息推荐方法，该信息推荐方法是一种实现跨域推荐的信息推荐方法。跨域推荐不同于一般的推荐系统，需要关心不同领域之间信息的传递和迁移。本申请实施例中，根据迁移信息和迁移方法的不同，跨域推荐有很多种划分方法。在进行跨域推荐时，考虑两个域：源域(Source)和目标域(Target)场景。

这里需要解释的是：源域是已有知识的域；目标域是要进行学习的域；其中，域是由数据特征和特征分布组成，是学习的主体。域的不同有两种可能的场景：第一种场景，特征空间不同，例如，在文本分类任务中，中文文本和英文文本的特征空间不同；在图像识别任务中，人脸图片和鸟类图片的特征空间不同。第二种场景，边缘概率分布不同，例如，在文本分类任务中，文本都是中文语言的特征空间，但讨论的是不同的主题，如游戏和娱乐；在图片识别任务中，图片都是鸟类的特征空间，但一个是在城市中拍到的鸟，一个是在大自然中拍到的。

跨域推荐是指当迁移学习应用到推荐系统中时就被称为跨域推荐，本申请实施例中，跨域推荐的目的是指基于源域和目标域的已有特征，对目标域的特征进行学习，从而实现对目标对象在目标域进行信息推荐。本申请实施例在实现跨域推荐时，源域包括目标对象已有信息的数据特征，目标域至少包括目标对象的待学习信息的数据特征。

本申请实施例中，根据两个域用户和物品的重叠情况，可以将跨域推荐分为四种情况，如图1所示，是基于源域和目标域进行跨域推荐的四种情况，包括：情况1：两个域R^A和R^B之间无重叠；情况2：两个域之间只有用户(U^A和U^B)存在重叠；情况3：两个域之间只有物品(I^A和I^B)存在重叠；情况4：两个域之间用户和物品均存在重叠。需要说明的是，本申请实施例涉及到的技术，主要可解决的是情况2和情况4的场景，即源域和目标域存在相同的用户。

下面，对本申请实施例提供的跨域推荐的划分方式进行说明。

在一些实施例中，当按照信息迁移的方法论进行划分时，跨域推荐可以分为四种方法：

方法一：基于共享实体表示。

该类方法适用于两个领域之间存在共享实体的情况，可以是用户或物品。通过重叠实体建立领域之间的关联性，从而融合不同领域的信息。主要思路是对每个领域中的实体进行不同的嵌入(embedding)表示，在结合层(combine layer)对重叠实体进行最大池化(max-pooling)保留场景的重要信息，然后再预测层使用这些结合后的信息进行推荐。

方法二：基于域映射模型。

该类方法适用于源推荐领域(即源域)数据充分，目标域数据稀疏的场景，通过利用源域丰富的信息提升目标域推荐效果，原则上要求源域和目标域存在共享实体。与共享实体方法类似，该类方法利用两个域重叠的实体学习一个映射函数，通过这个函数将源域实体映射到目标域新实体空间。

方法三：基于异构图。

该类方法适用于领域间存在重叠实体的场景，并要求实体存在辅助信息，如标签信息等，构建异构图刻画实体间的关系，通过泛化性信息更好的衡量用户和物品之间的相似性。该方法将每个实体表示为两种嵌入向量，分别是通过样本学习的嵌入向量和通过异构图表征的嵌入向量，并在后续使用中融合这两种表示，从而利用不同域的信息。

方法四：基于协同训练。

该类方法适用性广泛，理论上对实体的重叠不做要求，其核心思路是利用多个领域的数据联合训练，通过参数学习两个领域的相关关系。该类方法聚焦解决不同任务间参数的共享与复用上，通过一些机制保留各域独有的信息，并利用其他域有效的信息。

本申请实施例中所使用的涉及到跨域推荐的解决方案，可以是以上四种方法的融合。解决方案都引入了用户在源域和目标域的行为序列信息，通过跨域的兴趣提升跨域推荐的效果。在跨域兴趣表示上既借鉴了一些域映射的思路，也借鉴了了协同训练的思路。这里以混合兴趣跨域模型(MiNet，Mixed Interest Network)为例进行说明，其中，MiNet模型结构如图2所示。

MiNet模型基于用户在新闻域(源域)和广告域(目标域)的混合兴趣来进行跨域推荐，将用户在新闻域丰富的行为信息应用于广告推荐域，从而提升广告推荐的效果，这种跨域的信息传递是通过混合兴趣表示的，用户的兴趣表示被分为三部分，分别是长期兴趣、源域短期兴趣、目标域短期兴趣。

长期兴趣使用用户的基本属性信息进行刻画，如年龄、性别、地域等信息，这些信息在模型内部被表示成嵌入向量(embedding)，然后进行拼接，长期兴趣表示p_u如以下公式(1)：

p_u＝[e_u123||e_BJ||e_male||e_ios] (1)；

其中，e_u123为用户信息表示；e_BJ为年龄信息表示；e_male为性别信息表示；e_ios为地域信息表示。

目标域短期兴趣指的是对用户历史有过行为的广告进行建模，使用注意力机制差异化权重聚合，目标域短期兴趣表示a_t如以下公式(2)至(4)：

其中，r_tj表示用户历史广告行为中的第j个行为；q_t表示目标广告；ReLU()为线性整流函数函数；表示目标域兴趣映射的可学习参数，其中，可以先随机初始化形成，然后跟随整个模型进行迭代学习和更新。

源域短期兴趣指的是对用户历史新闻行为进行建模，由于新闻和广告并不是在同一个域，因此需要通过一个矩阵M对这两个域进行映射，其中，源域短期兴趣表示a_s如以下公式(5)至(7)：

其中，r_si表示用户历史新闻行为中的第i个行为，参数W_s、h_s、M的维度分别为：表示源域兴趣映射的可学习参数。

有了上述三种兴趣表示后需要对这三种兴趣表示进行融合，考虑到对每个目标广告这三种兴趣的重要性不同，MiNet模型对每种兴趣设置了差异性的权重，权重的计算方式如以下公式(8)：

其中，v_u、v_s、v_t分别表示长期兴趣表示的权重、源域短期兴趣表示的权重、目标域短期兴趣表示的权重；V、b、g均为可学习参数，其中，V_u、b_u、为针对长期兴趣表示的可学习参数，V_s、b_s、为针对源域短期兴趣表示的可学习参数，V_t、b_t、为针对目标域短期兴趣表示的可学习参数。

通过这三种权重对三种不同的兴趣进行融合，得到融合后的兴趣表示m_t如以下公式(9)：

其中，表示定义式。

整个模型还引入了辅助任务，即点击率预估任务学习长期兴趣中的嵌入表示，其损失形式均采用交叉熵损失，如以下公式(10)和(11)：

loss＝loss_t+γloss_s (11)；

其中，loss_t表示目标域损失值；loss_s表示源域损失值；loss表示整个模型的损失值；γ为损失比例；y_t表示当前样本的真实标签，对于分类问题可取0和1；表示模型对当前样本的预测标签，用于计算损失；为y_t的取值范围。

除了上述MiNet模型外，另一种跨域推荐方法的模型为多头注意力跨域模型(MACDM，Multi-head Attention Cross-domain Model)考虑视频和商品混合推荐场景，MACDM模型的结构如图3所示。该方法将源域和目标域的不同目标对象行为序列直接进行拼接，然后输入多头注意力块进行学习，使源域的视频和目标域的商品被表示到同一空间，得到混合目标对象行为序列。此时视频和商品兴趣表示并未考虑当前待排序物品信息，因此再基于当前待排序的物品信息，重新对混合兴趣序列使用两个不同的多头注意力块再次进行表示，则得到的视频兴趣和商品兴趣均考虑了待排序物品信息。在兴趣的使用上，可以直接将源域的兴趣和目标域的兴趣进行拼接，给到下游排序任务使用。

这里需要说明的是，在本申请实施例的信息推荐方法中，源域为视频域，目标域为商品域，视频域中的视频和商品域中的商品被表示到同一空间，此时的兴趣包括源域的兴趣和目标域的兴趣。源域的兴趣即视频兴趣，源域的兴趣至少包括用户对视频域中的视频进行互动的互动概率；目标域的兴趣即商品兴趣，目标域的兴趣至少包括用户对商品域中的商品进行互动的互动概率。这里，互动包括但不限于以下至少之一：点击操作、选择操作、阅读操作、购买操作、分享操作、评论操作等用户交互操作。

下面对行为序列建模进行说明。本申请实施例中，可以将目标对象行为序列建模方法分为四类，分别是基于池化/注意力的方法，基于循环神经网络(RNN，RecurrentNeural Network)的方法，基于转换器(Transformer)的方法和基于Capsule的方法。

第一类：基于池化/注意力的方法。

基于池化的方法的基本思想是将用户历史行为序列中每个元素进行嵌入向量表示，并通过平均值/最大值等池化方法得到定长的用户兴趣表示，这种方法等价于对目标对象行为所有元素等权看待，但目标对象行为中不同元素的权重往往是不同的，因此出现了基于注意力的方法，根据待排序的物品，动态调节序列中不同元素的权重。

第二类：基于RNN的方法。

为了刻画用户历史行为的顺序性和变化性，在RNN序列模型出现后，产生了较多基于RNN的目标对象行为序列建模方法。实际使用中一般基于RNN的两种变种长短期记忆网络(LSTM，Long Short-Term Memory)和门控循环单元(GRU，Gate Recurrent Unit)解决原生RNN模型在序列较长的时候信息丢失等问题。

第三类：基于Transformer的方法。

随着在自然语言处理(NLP，Natural Language Processing)机器翻译等任务中使用基于自注意力(self-attention)结构的Transformer模型取得了更优的效果，本申请实施例中，也可以将Transformer应用于目标对象行为序列建模中。相比于LSTM等序列建模方法，Transformer基于纯粹的注意力机制，可以彻底解决长距离依赖的问题，可以更好的并行化，也可以更好地刻画序列之间各个元素的相关关系。

本申请实施例中，MiNet模型通过一个可学习的映射矩阵M将源域兴趣映射到目标域空间，通过对源域序列和目标域序列分别抽取再进行权重拼接的方案。但抽取源域兴趣时，并未考虑目标域兴趣，这会导致源域兴趣表示缺乏针对性。比如想迁移用户在短视频域(源域)的兴趣到直播域(目标域)，用户在直播域(目标域)有较多的美食探店类直播浏览的行为，那该用于短视频域(源域)中与美食探店相关的兴趣权重应该更高，因此在抽取源域兴趣表示时，不仅仅要考虑得到的源域兴趣与目标域同空间，还要考虑目标域用户兴趣情况。此外，在源域和目标域兴趣表示时MiNet模型并未考虑序列元素之间的相关关系(其注意力只考虑了目标对象属性和待排序物品)。

而MACDM模型的方法直接将源域行为序列和目标域行为序列进行拼接，通过多头注意力模块将源域和目标域行为序列元素表达到同一空间，同时再通过第二级多头注意力模块考虑当前待排序物品重新对源域和目标域兴趣进行表示。这种方案理论上可以获取用户融合兴趣，但源域和目标域行为交互过早，且这种交互通过多头注意力块进行隐式学习，多头注意力块既要承担兴趣计算，又要承担源域和目标域的映射学习。在实际应用中，源域和目标域在行为覆盖度、物品类型往往差异性很大，用户在源域有着更加丰富的行为，且源域物品往往与目标域物品并无直接的相关性(比如源域是商品域，目标域是新闻域)，直接将源域行为和目标域行为混合处理会导致源域和目标域的信息互相干扰，导致源域的信息不仅起不到补充作用，反而可能干扰原有目标域用户兴趣的表达。

基于以上实施例，本申请实施例再提供一种信息推荐方法，该方法是一种基于多层注意力的异构序列兴趣融合(SICDM，Sequence Interest based Cross-domain Model)的跨域推荐建模方案，其主要技术包括但不限于：

(1)基于自注意力+合并注意力(concat attention)双重注意力机制对源域和目标域兴趣进行独立的表示，得到一阶源域兴趣特征表示和一阶目标域兴趣特征表示(即目标域兴趣特征)。在用户兴趣特征表征的过程中，既充分考虑行为序列中各元素的相关性，也考虑与待排序物品、目标对象特征、当前环境等的相关性。同时源域融合兴趣特征和目标域兴趣特征独立抽取，避免源域和目标域信息过早交互产生互相干扰的问题。

(2)基于可学习映射矩阵将源域融合兴趣特征映射到目标域空间中，并通过源域融合兴趣特征和目标域兴趣特征的哈达玛积表征出用户源域和目标域的混合兴趣，使源域和目标域兴趣充分进行融合。

(3)考虑融合兴趣和当前待排序物品、目标对象特征、当前环境等信息，基于混合注意力(mix attention)再次对源域目标对象行为序列兴趣进行二次抽取，作为对源域兴趣的补充，并将二阶源域兴趣特征与一阶源域兴趣特征的加和作为完整的源域融合兴趣特征表示，从而充分挖掘源域行为序列的信息，并且在兴趣表示的过程中充分考虑了用户目标域兴趣和当前待排序的相关信息。

(4)通过门控网络动态调整源域融合兴趣特征、目标域兴趣特征、混合兴趣特征三者的权重，生成用户总体兴趣以适配不同的下游任务需求。比如用户在目标域兴趣非常充分，或源域兴趣与目标域兴趣差异性过大时，适当降低源域融合兴趣特征和混合兴趣特征的权重，优先使用目标域兴趣特征，减少源域信息对目标域信息的干扰。将最终得到的用户兴趣与原模型特征表达拼接后给到下游任务使用，下游任务可以是CTR/CVR预估等推荐场景典型任务，主模型可以采用MLP、多目标模型、DeepFM等任何模型。

本申请实施例通过设计的双层注意力机制先对源域和目标域兴趣独立进行一阶表示，充分考虑了序列元素相关性、目标对象属性和待排序物品属性，减少了源域和目标域兴趣直接的互相干扰。同时通过公共映射矩阵将源域兴趣映射到目标域空间，并通过哈达玛积对源域融合兴趣特征和目标域兴趣特征进行充分融合。然后基于融合兴趣和排序环境信息，再次对源域兴趣进行二阶补充抽取，与源域公共一阶兴趣进行加和，提升了源域兴趣表征的全面性和目的性。最后通过权重网络根据当前排序环境信息，动态调整源域、目标域和混合兴趣的权重，从而更好地适配下游任务。该方法可以应用于互联网证券产品平台，如自选股和微证券的资讯推荐场景，利用用户在股票域丰富的行为序列信息，辅助资讯推荐任务，取得了比现有方法更优的效果。

本申请实施例提供的信息推荐方法中，首先，获取目标对象在目标域中的目标域行为序列和在源域中的源域行为序列；其中，源域包括目标对象已有信息的数据特征，目标域至少包括目标对象的待学习信息的数据特征；并对目标域行为序列和源域行为序列分别进行兴趣特征提取，对应得到目标域兴趣特征和一阶源域兴趣特征；然后，对目标域兴趣特征和一阶源域兴趣特征进行兴趣特征融合处理，得到源域融合兴趣特征；对目标域兴趣特征和源域融合兴趣特征进行跨域聚合融合处理，得到聚合兴趣特征；最后，基于聚合兴趣特征，对目标域的目标推荐对象进行信息推荐，其中，目标对象的待学习信息至少包括所述目标推荐对象。如此，由于利用源域充分的目标对象行为，指导目标域用户兴趣特征的表示，从而缓解目标域目标对象行为的稀疏性，提升目标域推荐准确性。

下面说明本申请实施例的信息推荐设备的示例性应用，本申请实施例提供的信息推荐设备可以实施为终端，也可以实施为服务器。在一种实现方式中，本申请实施例提供的信息推荐设备可以实施为笔记本电脑，平板电脑，台式计算机，移动设备(例如，移动电话，便携式音乐播放器，个人数字助理，专用消息设备，便携式游戏设备)、智能机器人、智能家电和智能车载设备等任意的具备信息推荐功能的终端；在另一种实现方式中，本申请实施例提供的信息推荐设备还可以实施为服务器，其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN，Content Delivery Network)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请实施例中不做限制。下面，将说明信息推荐设备实施为服务器时的示例性应用。

参见图4，图4是本申请实施例提供的信息推荐系统的一个可选的架构示意图，为支撑任意一个信息推荐应用，实现对目标域中的目标推荐对象进行信息推荐，本申请实施例的终端上至少安装有信息推荐应用。信息推荐系统10中至少包括终端100、网络200和服务器300，其中服务器300是信息推荐应用的服务器，服务器300可以构成本申请实施例的信息推荐设备。终端100通过网络200连接服务器300，网络200可以是广域网或者局域网，又或者是二者的组合。在运行信息推荐应用进行信息推荐时，终端100采集得到目标对象在目标域中的目标域行为序列和在源域中的源域行为序列，并基于目标对象在目标域中的目标域行为序列和在源域中的源域行为序列生成信息推荐请求，将信息推荐请求通过网络200发送给服务器300。服务器300响应于信息推荐请求，对目标域行为序列和源域行为序列分别进行兴趣特征提取，对应得到目标域兴趣特征和一阶源域兴趣特征；然后对目标域兴趣特征和一阶源域兴趣特征进行兴趣特征融合处理，得到源域融合兴趣特征；再然后，对目标域兴趣特征和源域融合兴趣特征进行跨域聚合融合处理，得到聚合兴趣特征；最后，基于聚合兴趣特征，确定出目标域中的目标推荐对象，并将目标推荐对象推荐给终端，实现对目标对象在目标域的信息推荐。

在一些实施例中，还可以由服务器300获取目标对象在目标域中的目标域行为序列和在源域中的源域行为序列，此时终端向服务器发送的信息推荐请求中可以仅具有目标域的标识和源域的标识，服务器响应于信息推荐请求对目标对象在目标域进行信息推荐。

在另一些实施例中，服务器300可以获取目标对象在目标域中的目标域行为序列和在源域中的源域行为序列，并主动对目标对象在目标域进行信息推荐，也就是说，服务器无需在接收到信息推荐请求之后对该信息推荐请求进行响应，即可主动确定出目标域中的目标推荐对象，并将目标推荐对象在终端可接收推荐信息的情况下发送给终端。

本申请实施例所提供的信息推荐方法还可以基于云平台并通过云技术来实现，例如，上述服务器300可以是云端服务器，通过云端服务器获取目标对象在目标域中的目标域行为序列和在源域中的源域行为序列；或者，通过云端服务器对目标域行为序列和所述源域行为序列分别进行兴趣特征提取；或者，通过云端服务器对目标域兴趣特征和一阶源域兴趣特征进行兴趣特征融合处理；或者，通过云端服务器对目标域兴趣特征和源域融合兴趣特征进行跨域聚合融合处理；或者，通过云端服务器基于聚合兴趣特征，对目标域的目标推荐对象进行信息推荐等。

在一些实施例中，还可以具有云端存储器，可以将目标对象在目标域中的目标域行为序列和在源域中的源域行为序列存储至云端存储器中，或者，还可以将对目标对象在目标域的目标推荐对象存储至云端存储器中。这样，在后续对目标对象进行再次推荐时，可以直接从云端存储器中获取目标域行为序列和源域行为序列等信息。

这里需要说明的是，云技术(Cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来，实现数据的计算、储存、处理和共享的一种托管技术。云技术基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称，可以组成资源池，按需所用，灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源，如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用，将来每个物品都有可能存在自己的识别标志，都需要传输到后台系统进行逻辑处理，不同程度级别的数据将会分开处理，各类行业数据皆需要强大的系统后盾支撑，只能通过云计算来实现。

图5是本申请实施例提供的信息推荐设备的结构示意图，图5所示的信息推荐设备包括：至少一个处理器310、存储器350、至少一个网络接口320和用户接口330。信息推荐设备中的各个组件通过总线系统340耦合在一起。可理解，总线系统340用于实现这些组件之间的连接通信。总线系统340除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图5中将各种总线都标为总线系统340。

处理器310可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

用户接口330包括使得能够呈现媒体内容的一个或多个输出装置331，以及一个或多个输入装置332。

存储器350可以是可移除的，不可移除的或其组合。示例性的硬件设备包括固态存储器，硬盘驱动器，光盘驱动器等。存储器350可选地包括在物理位置上远离处理器310的一个或多个存储设备。存储器350包括易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM，Read Only Memory)，易失性存储器可以是随机存取存储器(RAM，Random Access Memory)。本申请实施例描述的存储器350旨在包括任意适合类型的存储器。在一些实施例中，存储器350能够存储数据以支持各种操作，这些数据的示例包括程序、模块和数据结构或者其子集或超集，下面示例性说明。

操作系统351，包括用于处理各种基本系统服务和执行硬件相关任务的系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务；

网络通信模块352，用于经由一个或多个(有线或无线)网络接口320到达其他计算设备，示例性的网络接口320包括：蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB，Universal Serial Bus)等；

输入处理模块353，用于对一个或多个来自一个或多个输入装置332之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。

在一些实施例中，本申请实施例提供的装置可采用软件方式实现，图5示出了存储在存储器350中的一种信息推荐装置354，该信息推荐装置354可以是信息推荐设备中的信息推荐装置，其可以是程序和插件等形式的软件，包括以下软件模块：获取模块3541、特征提取模块3542、融合处理模块3543、聚合处理模块3544和信息推荐模块3545，这些模块是逻辑上的，因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。

在另一些实施例中，本申请实施例提供的装置可以采用硬件方式实现，作为示例，本申请实施例提供的装置可以是采用硬件译码处理器形式的处理器，其被编程以执行本申请实施例提供的信息推荐方法，例如，硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC，Application Specif ic Integrated Circuit)、DSP、可编程逻辑器件(PLD，Programmable Logic De vice)、复杂可编程逻辑器件(CPLD，ComplexProgrammable Logic Device)、现场可编程门阵列(FPGA，Field-Programmable GateArray)或其他电子元件。

本申请各实施例提供的信息推荐方法可以由作为信息推荐设备的电子设备来执行，其中，该信息推荐设备可以是任意一种具备信息推荐功能的终端，或者也可以是服务器，即本申请各实施例的信息推荐方法可以通过终端来执行，也可以通过服务器来执行，或者还可以通过终端与服务器进行交互来执行。

参见图6，图6是本申请实施例提供的进程控制方法的一个可选的流程示意图，下面将结合图6示出的步骤进行说明，需要说明的是，图6中的进程控制方法是通过终端作为执行主体为例来说明的。

步骤S601，获取目标对象在目标域中的目标域行为序列和在源域中的源域行为序列。

这里，目标域与源域可以是完全不同的两个领域，例如，目标域可以是短视频领域，源域可以是直播领域。本申请实施例的信息推荐方法是一种跨域推荐方法，利用源域的目标对象行为，指导目标域用户兴趣特征的表示，从而对目标域用户兴趣特征进行准确的表示，实现针对目标域的推荐对象进行信息推荐。也就是说，结合用户在源域的行为特征，对用户在目标域的兴趣进行评估和预测，并进行用户兴趣特征表示，从而实现将用户在目标域感兴趣的推荐对象作为目标推荐对象推荐给用户。本申请实施例中，跨域推荐的目的是指基于源域和目标域的已有特征，对目标域的特征进行学习，从而实现对目标对象在目标域进行信息推荐。本申请实施例在实现跨域推荐时，源域包括目标对象已有信息的数据特征，目标域至少包括目标对象的待学习信息的数据特征。

目标对象可以是用户，目标域行为序列是目标对象在预设历史时间段内针对目标域中的对象执行用户操作行为的数据，目标域行为序列中包括多个用户操作行为数据；源域行为序列是目标对象在预设历史时间段内针对源域中的对象执行用户操作行为的数据，源域行为序列中包括多个用户操作行为数据。这里，用户操作行为可以是点击操作、选择操作、阅读操作、购买操作、分享操作、评论操作等任意一种用户交互操作。

步骤S602，对目标域行为序列和源域行为序列分别进行兴趣特征提取，对应得到目标域兴趣特征和一阶源域兴趣特征。

这里，对目标域行为序列进行兴趣特征提取，得到目标域兴趣特征；对源域行为序列进行兴趣特征提取，得到一阶源域兴趣特征。

本申请实施例中，可以基于自注意力+合并注意力的双重注意力机制对目标域行为序列和源域行为序列进行兴趣特征提取，得到目标域兴趣特征和一阶源域兴趣特征，其中，目标域兴趣特征为一阶目标域兴趣特征。

本申请实施例中，目标域兴趣特征和一阶源域兴趣特征均以向量形式表征，目标域兴趣特征和一阶源域兴趣特征的维度相同。

步骤S603，对目标域兴趣特征和一阶源域兴趣特征进行兴趣特征融合处理，得到源域融合兴趣特征。

本申请实施例中，兴趣特征融合处理是指对目标域兴趣特征和一阶源域兴趣特征中的兴趣特征进行融合处理，从而实现对源域特征的进一步抽取。在对目标域兴趣特征和一阶源域兴趣特征进行兴趣特征融合处理时，可以是先基于当前排序环境，对源域行为序列进行二次兴趣特征抽取，得到二阶源域兴趣特征，将二阶源域兴趣特征与一阶源域兴趣特征加和作为完整的源域融合兴趣特征，从而考虑用户目标域兴趣和当前排序环境，有针对性的充分挖掘源域行为序列的信息，得到源域融合兴趣特征。

步骤S604，对目标域兴趣特征和源域融合兴趣特征进行跨域聚合融合处理，得到聚合兴趣特征。

这里，跨域聚合融合处理是指对不同领域的兴趣特征进行融合处理，通过融合充分挖掘到的源域行为序列的信息和目标域行为序列的信息，得到聚合兴趣特征。

步骤S605，基于聚合兴趣特征，对目标域的目标推荐对象进行信息推荐。

在得到聚合兴趣特征之后，将聚合兴趣特征作为信息推荐模型的输入特征输入至信息推荐模型中，信息推荐模型基于聚合兴趣特征确定出目标对象在目标域中感兴趣的目标推荐对象，从而将目标推荐对象推荐给目标对象。需要说明的是，目标对象的待学习信息至少包括目标推荐对象。

本申请实施例中，由于聚合兴趣特征是通过融合目标域兴趣特征和源域融合兴趣特征得到的，而源域融合兴趣特征是对目标对象在源域中的源域行为序列进行充分的信息挖掘之后得到的兴趣特征，因此，源域融合兴趣特征能够准确的表征目标对象在源域的兴趣表示，且聚合兴趣特征能够准确的表征用户在整个源域和目标域中的兴趣表示。

在一些实施例中，信息推荐模型可以是以二分类的形式对目标域中的每一推荐对象进行二分类处理，当任一推荐对象的二分类处理结果为1时，表明该推荐对象是目标对象感兴趣的对象；当任一推荐对象的二分类处理结果为0时，表明该推荐对象是目标对象不感兴趣的对象。

本申请实施例提供的信息推荐方法，通过对目标域行为序列和源域行为序列分别进行兴趣特征提取，对应得到目标域兴趣特征和一阶源域兴趣特征；并对目标域兴趣特征和一阶源域兴趣特征进行兴趣特征融合处理，得到源域融合兴趣特征；之后，再对目标域兴趣特征和源域融合兴趣特征进行跨域聚合处理，得到聚合兴趣特征，从而基于聚合兴趣特征，对目标域的目标推荐对象进行信息推荐。如此利用源域充分的目标对象行为，指导目标域用户兴趣特征的表示，从而缓解目标域目标对象行为的稀疏性，提升目标域推荐准确性。

在一些实施例中，信息推荐系统中至少包括终端和服务器，终端上运行有信息推荐应用，服务器构成信息推荐应用的服务器。终端可以采集并统计目标对象在终端上的目标对象行为，其中，目标对象行为包括目标对象在目标域中的目标域行为序列和在源域中的源域行为序列。图7是本申请实施例提供的进程控制方法的另一个可选的流程示意图，如图7所示，方法包括以下步骤：

步骤S701，终端采集得到目标对象在目标域中的目标域行为序列和在源域中的源域行为序列。

目标域行为序列是目标对象在预设历史时间段内针对目标域中的对象执行用户操作行为的数据，目标域行为序列中包括多个用户操作行为数据；源域行为序列是目标对象在预设历史时间段内针对源域中的对象执行用户操作行为的数据，源域行为序列中包括多个用户操作行为数据。

本申请实施例中，终端可以在接收到用户在终端上的用户操作行为时，对该用户操作行为对应的操作内容进行判断，确定操作内容属于目标域还是源域，然后将本次用户操作行为对应记录至目标域行为集合或者源域行为集合中。在记录用户操作行为时，可以为每一用户操作行为添加时间戳，这样，在获取目标域行为序列和源域行为序列时，可以基于时间戳从目标域行为集合和源域行为集合中获取预设历史时间段内的用户操作行为，形成目标域行为序列和源域行为序列。

步骤S702，终端基于目标对象在目标域中的目标域行为序列和在源域中的源域行为序列，生成信息推荐请求。

这里，可以将目标域行为序列和源域行为序列封装至信息推荐请求中。

步骤S703，终端将信息推荐请求发送给服务器。

步骤S704，服务器响应于信息推荐请求，解析得到目标域行为序列和源域行为序列。

步骤S705，基于自注意力机制，对目标域行为序列进行向量表示，得到目标域行为向量。

本申请实施例中，目标域行为序列中的每一目标域行为对应一查询内容(query)和键值对(key-value)，因此，可以生成每一目标域行为的查询内容向量、键向量和值向量。这里，在生成查询内容向量、键向量和值向量时，可以是基于预设的映射矩阵，对目标域行为中的查询内容和键值对进行映射变换，得到与该目标域行为对应的查询内容向量、键向量和值向量。

需要说明的是，映射变换后的查询内容向量、键向量和值向量的维度，与目标域行为序列中的目标域行为的维度均相同。

在得到查询内容向量、键向量和值向量之后，可以基于基于自注意力机制，对查询内容向量、键向量和值向量进行自注意力计算，得到目标域行为向量。本申请实施例中，自注意力计算可以采用softmax函数来实现。

步骤S706，获取目标域中的每一推荐对象的第一对象信息、目标对象的第二对象信息、与当前推荐场景对应的上下文信息。

这里，上下文信息是用于表征当前环境的环境信息。

步骤S707，基于第一对象信息、第二对象信息和上下文信息，生成目标域查询向量。

在一些实施例中，生成目标域查询向量，可以通过以下步骤S7071至步骤S7073(图中未示出)实现：

步骤S7071，分别对第一对象信息、第二对象信息和上下文信息进行特征提取，得到第一对象特征向量、第二对象特征向量和上下文特征向量。

步骤S7072，对第一对象特征向量、第二对象特征向量和上下文特征向量进行拼接处理，得到第一拼接向量。

这里，拼接处理是指将第一对象特征向量、第二对象特征向量和上下文特征向量连接成一个具有更高维度的第一拼接向量，其中，第一拼接向量的维度是第一对象特征向量、第二对象特征向量和上下文特征向量的维度之和。

步骤S7073，将第一拼接向量确定为目标域查询向量。

步骤S708，基于目标域查询向量，对目标域行为向量进行聚合处理，得到目标域兴趣特征。

本申请实施例中，在提取目标域兴趣特征时，考虑了每一推荐对象的信息、目标对象的信息和当前环境的环境信息，如此，全面的考虑各方面因素对用户兴趣的影响，能够准确的确定用户的目标域兴趣特征。

至此，通过步骤S705至步骤S708完成对目标域行为序列进行兴趣特征提取，得到目标域兴趣特征的步骤。

步骤S709，基于自注意力机制，对源域行为序列进行向量表示，得到源域行为向量。

本申请实施例中，源域行为序列中的每一源域行为也对应一查询内容(qu ery)和键值对(key-value)，因此，可以生成每一源域行为的查询内容向量、键向量和值向量。这里，在生成查询内容向量、键向量和值向量时，也可以是基于预设的映射矩阵，对源域行为中的查询内容和键值对进行映射变换，得到与该源域行为对应的查询内容向量、键向量和值向量。

需要说明的是，映射变换后的查询内容向量、键向量和值向量的维度，与源域行为序列中的源域行为的维度均相同。

在得到查询内容向量、键向量和值向量之后，可以基于基于自注意力机制，对查询内容向量、键向量和值向量进行自注意力计算，得到源域行为向量。本申请实施例中，自注意力计算可以采用softmax函数来实现。

步骤S710，获取目标对象的第二对象信息、与当前推荐场景对应的上下文信息。

步骤S711，基于第二对象信息和上下文信息，生成源域查询向量。

在一些实施例中，生成源域查询向量，可以通过以下步骤S7111至步骤S7113(图中未示出)实现：

步骤S7111，分别对第二对象信息和上下文信息进行特征提取，得到第二对象特征向量和上下文特征向量。

步骤S7112，对第二对象特征向量和上下文特征向量进行拼接处理，得到第二拼接向量。

这里，拼接处理是指将第二对象特征向量和上下文特征向量连接成一个具有更高维度的第二拼接向量，其中，第二拼接向量的维度是第二对象特征向量和上下文特征向量的维度之和。

步骤S7113，将第二拼接向量确定为源域查询向量。

步骤S712，基于源域查询向量，对源域行为向量进行合并处理，得到原始源域兴趣特征。

步骤S713，获取空间转换参数。

步骤S714，采用空间转换参数，对原始源域兴趣特征进行空间转换，得到一阶源域兴趣特征。

本申请实施例中，在提取一阶源域兴趣特征时，考虑了目标对象的信息和当前环境的环境信息，如此，全面的考虑各方面因素对用户兴趣的影响，能够准确的确定用户的源域融合兴趣特征。

至此，通过步骤S709至步骤S714完成对源域行为序列进行兴趣特征提取，得到一阶源域兴趣特征的步骤。

步骤S715，服务器对目标域兴趣特征和一阶源域兴趣特征进行映射处理，得到二阶源域兴趣特征。

在一些实施例中，步骤S715可以通过以下步骤S7151至步骤S7154(图中未示出)实现：

步骤S7151，对目标域兴趣特征和一阶源域兴趣特征进行向量哈达玛积运算，得到融合兴趣向量。

这里，哈达玛积运算是矩阵的一类运算，若A＝(a_ij)和B＝(b_ij)是两个同阶矩阵，若c_ij＝a_ij×b_ij，则称矩阵C＝(c_ij)为A和B的哈达玛积。

本申请实施例中，目标域兴趣特征和一阶源域兴趣特征的维度相同，目标域兴趣特征和一阶源域兴趣特征为同阶矩阵。

步骤S7152，基于每一推荐对象的第一对象信息和融合兴趣向量，生成融合查询向量。

这里，可以将第一对象信息和融合兴趣向量进行拼接之后得到融合查询向量。

步骤S7153，基于融合查询向量，对源域行为向量进行聚合处理，得到源域聚合兴趣特征。

步骤S7154，采用空间转换参数，对源域聚合兴趣特征进行空间转换，得到二阶源域兴趣特征。

这里，空间转换处理可以是将空间转换参数与源域聚合兴趣特征进行相乘，得到二阶源域兴趣特征。

步骤S716，服务器对一阶源域兴趣特征和二阶源域兴趣特征进行源域特征融合处理，得到源域融合兴趣特征。

在一些实施例中，对一阶源域兴趣特征和二阶源域兴趣特征进行源域特征融合处理，可以是对一阶源域兴趣特征和二阶源域兴趣特征进行元素对应叠加，得到源域融合兴趣特征。也就是说，将一阶源域兴趣特征和二阶源域兴趣特征中相同位置的元素对应相加，得到每一位置的元素加和值，然后基于每一位置的元素加和值，将每一位置的元素加和值作为源域融合兴趣特征中对应位置的元素值。

步骤S717，服务器对目标域兴趣特征和源域融合兴趣特征进行跨域聚合处理，得到聚合兴趣特征。

在一些实施例中，步骤S717的跨域聚合处理过程可以通过以下步骤S7171至步骤S7173(图中未示出)实现：

步骤S7171，通过门控网络分别为目标域兴趣特征、源域融合兴趣特征和融合兴趣向量对应分配目标域权重、源域权重和融合权重。

在一些实施例中，可以基于目标对象的第二对象信息、目标域兴趣特征、源域融合兴趣特征、融合兴趣向量、与当前推荐场景对应的上下文信息，通过门控网络，分别为目标域兴趣特征、源域融合兴趣特征和融合兴趣向量对应分配目标域权重、源域权重和融合权重。

步骤S7172，基于目标域权重、源域权重和融合权重，对目标域兴趣特征、源域融合兴趣特征和融合兴趣向量进行加权融合，得到加权融合向量。

步骤S7173，将加权融合向量确定为聚合兴趣特征。

步骤S718，服务器基于聚合兴趣特征，对目标域的目标推荐对象进行信息推荐。

在一些实施例中，步骤S718可以通过以下步骤S7181至步骤S7185(图中未示出)实现：

步骤S7181，基于聚合兴趣特征，生成模型输入向量。

在一些实施例中，可以通过以下方式生成模型输入向量：首先，获取目标域中的每一推荐对象的第一对象信息、目标对象的第二对象信息、与当前推荐场景对应的上下文信息；然后，分别对第一对象信息、第二对象信息和上下文信息进行特征提取，得到第一对象特征向量、第二对象特征向量和上下文特征向量；再然后，对第一对象特征向量、第二对象特征向量、上下文特征向量和聚合兴趣特征进行拼接处理，得到第三拼接向量；并将第三拼接向量，确定为模型输入向量。

这里，对第一对象特征向量、第二对象特征向量、上下文特征向量和聚合兴趣特征进行拼接处理，可以是将第一对象特征向量、第二对象特征向量、上下文特征向量和聚合兴趣特征，连接成一个具有更高维度的第三拼接向量，其中，第三拼接向量的维度是第一对象特征向量、第二对象特征向量、上下文特征向量和聚合兴趣特征的维度之和。

步骤S7182，将模型输入向量输入至信息推荐模型中。

步骤S7183，通过信息推荐模型，确定目标对象对目标域中的每一推荐对象进行交互的交互概率。

本申请实施例中，信息推荐模型基于模型输入向量对目标对象是否会对每一推荐对象进行交互进行预测，得到每一推荐对象的交互概率。这里，交互概率可以取值0或1，也可以取值0至1。

当交互概率取值0或1时，如果任一推荐对象的交互概率为0，表明信息推荐模型基于模型输入向量预测出目标对象对该推荐对象不感兴趣，不会进行交互；如果任一推荐对象的交互概率为1，表明信息推荐模型基于模型输入向量预测出目标对象对该推荐对象感兴趣，会进行交互。当交互概率取值0至1时，可以具有一交互概率阈值，如果任一推荐对象的交互概率小于交互概率阈值时，表明信息推荐模型基于模型输入向量预测出目标对象对该推荐对象不感兴趣，不会进行交互；如果任一推荐对象的交互概率大于或等于交互概率阈值时，表明信息推荐模型基于模型输入向量预测出目标对象对该推荐对象感兴趣，会进行交互。

步骤S7184，基于交互概率，从目标域中的推荐对象中确定出目标推荐对象。

本申请实施例中，可以基于交互概率，将交互概率为1的推荐对象确定为目标推荐对象，或者，将交互概率大于或等于交互概率阈值的推荐对象确定为目标推荐对象。目标推荐对象的数量可以为一个或多个。

步骤S7185，对目标推荐对象进行信息推荐。

在确定出目标推荐对象之后，在信息推荐应用中对该目标推荐对象进行推荐。

本申请实施例提供的信息推荐方法，利用源域充分的目标对象行为，指导目标域用户兴趣特征的表示，从而能够缓解目标域目标对象行为的稀疏性，提升目标域推荐准确性。

下面，将说明本申请实施例在一个实际的应用场景中的示例性应用。

跨域推荐在解决推荐系统冷启动、数据稀疏等问题发挥着日益重要的作用。本申请实施例面向跨域推荐场景，针对现有基于用户跨域行为序列兴趣表示的建模方案存在的跨域兴趣融合不充分、抽取源域兴趣表示时并未与考虑目标域兴趣的匹配度等问题，提出了一种新的基于异构序列兴趣融合的跨域推荐SIC DM方案(即信息推荐方法)。

图8是本申请实施例提供的SICDM模型的结构示意图，如图8所示，SIC DM模型包括以下五个部分：目标域兴趣抽取模块801、源域兴趣抽取模块802、二阶源域兴趣抽取模块803、兴趣聚合模块804和主模型805。其中，目标域兴趣抽取模块801用于实现用户目标域行为序列的兴趣抽取和表示；源域兴趣抽取模块802用于实现用户源域行为序列的兴趣抽取和表示；二阶源域兴趣抽取模块803用于实现基于融合兴趣的源域序列兴趣二次抽取；兴趣聚合模块804用于实现源域、目标域多兴趣融合；主模型805是CTR排序的主模型。

本申请实施例的方法可以应用于以下场景：想把用户股票点击行为应用于新闻推荐场景，那新闻域就是目标域，股票域就是源域，目标域兴趣就是新闻序列兴趣，源域兴趣就是股票序列兴趣。为了方便进行表示，定义以下符号：

目标对象特征表示，如性别、年龄等基础信息和访问次数、天数等统计信息。

当前待排序目标域物品(即推荐对象)特征表示，如物品类型、转化率等信息。

上下文特征表示，如当前时间、曝光位置等场景信息。

Y∈{0,1}：标签(label)，即用户是否对当前物品(即目标推荐对象)发生点击。

用户目标域行为序列，其中t_i均代表一个定长特征向量，代表每个目标域元素特征表示，N代表目标对象行为序列长度。

用户源域行为序列，其中s_i均代表一个定长特征向量，代表每个源域元素特征表示，N代表目标对象行为序列长度。

下面对SICDM模型中的五个部分分别进行说明：

(1)目标域兴趣抽取模块801：

本申请实施例中，可以基于两层注意力机制对目标域兴趣特征进行抽取表示，对于用户目标域行为序列T：{t₁,t₂,......,t_n}，首先基于Transformer提出的自注意力机制对T：{t₁,t₂,......,t_n}进行表示，自注意力机制的表示与多头注意力机制的区别只是相当于向量表示的头部取1的时候的一种特例，此举是为了学习序列元素之间的相关性。表达形式如下：

首先基于T生成查询(query)、键(key)、值(value)向量，分别基于Q_T、K_T、V_T表示如以下公式(12)：

其中，是映射矩阵，是可以学习的参数，维度均为变换后生成的Q_T、K_T、V_T的维度与T的维度相同，仍然是

接下来进行自注意力计算，得到目标域行为向量T^inr如以下公式(13)：

其中，T^inr与原始的序列T的维度仍然一致，的上角标T代表的是矩阵的转置操作；D_t是维度值用于归一化处理。但序列中每个元素表示已经融合了其他元素的信息，从而学习到了序列元素的相关性。

此时的用户目标域行为序列兴趣表示仍未考虑用户、环境和当前待排序物品的信息，还需要通过concat attention重新对T^inr进行表示。由于此时处于目标域，当前待排序物品q_t与目标域行为序列T中的各个元素处于同一空间，因此可以直接引入待排序物品信息，同时考虑目标对象特征X和上下文特征C，生成目标域查询向量q_target，如以下公式(14)所示：

q_target＝[C||q_t||X] (14)；

其中，||表示拼接操作，此时目标域查询向量q_target包含了用户信息、待排序物品信息、上下文特征信息，基于q_target对序列再次进行注意力聚合得到目标域兴趣特征表示，目标域兴趣特征E₁的表示形式如公式(15)至(17)所示：

其中，和表示可学习参数，用于注意力权重的学习，最终可以得到用户目标域兴趣特征表达，即此时的目标域兴趣特征表示，既考虑了序列之间元素的相关性，也考虑了和目标对象属性、待排序物品和当前环境(即上下文特征信息)的相关性。

(2)源域兴趣抽取模块802：

对于源域融合兴趣特征表示在第一步和目标域兴趣特征表示一样，先基于自注意力机制对源域行为序列进行转换：

首先基于S生成查询(query)、键(key)、值(value)向量，分别基于Q_S、K_S、V_S表示如以下公式(18)：

其中，可学习参数矩阵维度均为生成的Q_S、K_S、V_S的维度与S同为

然后进行自注意力计算，得到源域行为向量S^inr如以下公式(19)：

其中，同样学习到了序列元素的相关性；D_s是维度值用于归一化处理。

接下来与目标域信息表示一样继续进行合并注意力操作(即合并处理)对S^inr进行聚合。由于此时处于源域，待排序物品q_t与源域行为序列S中各个元素并不是在同一空间，为了避免对源域兴趣抽取的干扰，生成源域查询向量q_source的时候，只考虑目标对象特征X和上下文特征C，其中，源域查询向量q_source通过以下公式(20)生成：

q_source＝[C||X] (20)；

其中，基于q_source对序列进行合并注意力兴趣表示，得到原始源域兴趣特征E_stemp如以下公式(21)至(23)：

其中，和表示可学习参数，用于注意力权重的学习，最终可以得到原始源域兴趣特征表达，即

但由于目前并未对源域兴趣和目标域兴趣做关联和映射，因此此时得到的源域兴趣和目标域仍然处于不同的空间，可以考虑使用可学习参数对源域空间进行映射，使源域空间转换到目标域空间，定义可学习参数(即空间转换参数)，通过公式(24)对原始源域兴趣特征进行映射，得到一阶源域兴趣特征：

E₂₁＝M_transE_stemp (24)；

此时得到的映射后的一阶源域兴趣特征已和目标域兴趣特征维度一致且处于同一空间。

(3)二阶源域兴趣抽取模块803：

此时一阶源域兴趣特征即E₂₁只是基于目标对象特征和环境信息对用户兴趣的聚合，可以视为源域基础兴趣，但在抽取源域兴趣时并未考虑目标域兴趣，这会导致源域兴趣表达的不完善。比如想迁移用户在短视频域(源域)的兴趣到直播域(目标域)，用户在直播域(目标域)有较多的美食探店直播浏览的行为，那该用户在短视频域(源域)中与美食探店相关的兴趣权重应该更高。与此同时，这种兴趣权重还与当前待排序物品有关，因此在抽取源域兴趣时，还要考虑当前待排序物品的信息。

为了解决上述问题，由于之前已经将源域和目标域兴趣映射到了同一空间，因此可以将源域和目标域兴趣进行融合，再补充上待排序物品信息后，重新对源域行为序列进行一次补充抽取。由于在抽取目标域兴趣时，已经考虑了当前待排序物品q_t，因此此时得到的目标域兴趣已经是与待排序物品相关的了。通过这样的方式，进一步强化源域兴趣中与目标域兴趣、当前待排序物品相关的部分，提升兴趣表示的针对性和目的性。形式化表达如下：

首先是源域和目标域兴趣融合映射，得到融合兴趣向量融合方法可以使用向量哈达玛积，即element-wise的向量乘法，如以下公式(25)：

E₃＝E₂₁⊙E₁ (25)；

然后生成融合查询向量，此时的融合查询向量表达式如以下公式(26)：

q_mix＝[q_t||E₃] (26)；

其中，基于融合查询向量q_mix重新对源域行为序列进行融合注意力聚合，此时使用的源域行为序列是经过自注意力处理后的源域行为序列，融合注意力后所得到的源域聚合兴趣特征E_mtemp的表达式如公式(27)至(29)：

其中，和为可学习参数，用于注意力权重的学习，M_trans和前面E₂₁生成过程中的公式(24)权重矩阵是相同的，用于将源域序列中每个元素映射到目标域，此时为了得到二阶源域兴趣特征E₂₂，仍然需要做一次映射，使其变换到目标域，映射方式与公式(24)相同，为以下公式(30)：

E₂₂＝M_transE_mtemp (30)；

此时得到的二阶源域兴趣特征已经和目标域空间一致，且是对原源域兴趣E₂₁的信息补充，因此可以将一阶和二阶源域兴趣特征进行融合，融合方式直接叠加即可，如以下公式(31)：

E₂＝E₂₁+E₂₂ (31)；

此时得到的最终源域融合兴趣特征既保证了空间和目标域的一致性，在生成兴趣时还考虑了用户基础信息、目标域兴趣、当前环境和当前待排序物品，是全面和有目的性的利用了源域目标对象行为信息。

(4)兴趣聚合模块804：

由于已经得到了三种兴趣，目标域兴趣特征即E₁、源域融合兴趣特征即E₂，以及融合兴趣向量即E₃，这三种兴趣的重要性在不同情况下也是不一样的。如果用户在目标域行为非常丰富，那么源域的信息就没有那么重要，此外对于很多场景下，用户在不同时间、不同栏目的兴趣偏好也是不相同的。因此通过一个门控网络为每种兴趣分配不同的权重，考虑用户基础特征X，三种兴趣和当前环境C，表达形式如以下公式(32)：

其中，使用tanh变换的原因主要源域兴趣并非总是有正向作用的，tanh激活函数取值范围为[-1，+1]，可以更好的刻画兴趣的正负影响，并且利用tanh的有界性对兴趣学习做一些限制。有了权重后，就可以对三种兴趣进行加权融合，如以下公式(33)：

E＝[w_tE₁||w_sE₂||w_mE₃] (33)；

最终得到的用户兴趣(即聚合兴趣特征)充分挖掘了源域和目标域的用户兴趣，可以给到下游任务使用。

(5)主模型805：

由于最终希望通过用户、物品、环境特征和用户兴趣用于判断用户对当前物品点击的概率，即CTR预估，因此最终输入主模型的特征是上述信息的拼接，如以下公式(34)：

features＝[X||q_t||C||E] (34)；

主模型可以使用多层MLP、多目标优化模型、DeepFM模型等任意结构，训练使用的监督信号来自于线上收集的用户隐式反馈信息，其中曝光且点击视为正样本，曝光未点击视为负样本。CTR预估是一个典型的二分类问题，因此损失函数使用交叉熵损失，其形式如公式(35)所示：

其中，y是当前样本的真实标签，对于分类问题可取0和1；是主模型对当前样本的预测标签。

本申请实施例提供的信息推荐方法，可以应用在互联网证券平台自选股和微证券的资讯推荐场景，用户在自选股和微证券平台上除了有丰富的资讯点击行为，也有大量的股票浏览、加自选、收藏等行为。可以利用用户丰富的股票行为(源域)，提升用户在资讯推荐场景(目标域)下的效果。该方法在离线和线上均取得了相对现有方法更优的效果。其中离线评估指标采用的是AUC和命中率(HR，Hit Ratio)，其中HR的计算公式如以下公式(36)：

其中，NumberOfHits表示命中数量；GT表示所有的测试集合。

CTR排序主模型选取DeepFM，源域和目标域目标对象行为均选取最近30天产生的行为，其中用户源域行为序列(股票点击序列)长度被限制为100，目标域行为序列(资讯点击序列)长度。如果用户实际行为序列比最大长度短，则使用全0的特征补足，如果超出则按照时间先后顺序截断。测试结果如表1所示：

表1整体效果

其中单域模型中的DIN是只引入了用户在目标域(资讯域)资讯点击行为的DIN结构单序列模型；MLP++是将两个MLP网络合并在一起，并使用共享用户嵌入向量的跨域模型。

整体看引入跨域信息的模型不管是离线效果还是线上效果，都优于单域模型，这说明源域为目标域信息起到了很好的补充效果。MACDM和MiNet是与本申请实施例最为接近的方法，其中由于用户在股票域行为和资讯域行为在覆盖度、实体类型上差别过大，MACDM效果要低于MiNet，但二者由于引入了新的源域信息，效果都优于单域模型。由于SICDM是本申请实施例提出的方法，可以看出不管在离线还是在线都取得了最优的效果。

需要说明的是，本申请实施例提出的技术方案可以有很多种变型，比如在抽取一阶和二阶用户序列兴趣时，可以根据实际效果使用包括多头注意力等其他注意力方法。除了对源域兴趣进行二阶兴趣抽取外，也可以基于混合兴趣对目标域进行二次抽取，获得目标域兴趣的更精细刻画。此外，对于多兴趣权重计算，可以使用MLP等不同方法生成一个向量权重取代本申请上述实施例使用的标量权重，对兴趣的每一维的重要性进行更精细刻画。

可以理解的是，在本申请实施例中，涉及到用户信息的内容，例如，用户在目标域中的目标域行为序列和在源域中的源域行为序列、针对用户所推荐的目标推荐对象等信息，如果涉及与用户信息或企业信息相关的数据，当本申请实施例运用到具体产品或技术中时，需要获得用户许可或者同意，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

下面继续说明本申请实施例提供的信息推荐装置354实施为软件模块的示例性结构，在一些实施例中，如图5所示，信息推荐装置354包括：

需要说明的是，本申请实施例装置的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果，因此不做赘述。对于本装置实施例中未披露的技术细节，请参照本申请方法实施例的描述而理解。

本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括可执行指令，该可执行指令是一种计算机指令；该可执行指令存储在计算机可读存储介质中。当信息推荐设备的处理器从计算机可读存储介质读取该可执行指令，处理器执行该可执行指令时，使得该信息推荐设备执行本申请实施例上述的方法。

本申请实施例提供一种存储有可执行指令的存储介质，其中存储有可执行指令，当可执行指令被处理器执行时，将引起处理器执行本申请实施例提供的方法，例如，如图6示出的方法。

在一些实施例中，存储介质可以是计算机可读存储介质，例如，铁电存储器(FRAM，Ferromagnetic Random Access Memory)、只读存储器(ROM，Read Only Memory)、可编程只读存储器(PROM，Programmable Read Only Memory)、可擦除可编程只读存储器(EPROM，Erasable Programmable Read Only Memory)、带电可擦可编程只读存储器(EEPROM，Electrically Erasable Programmable Read Only Memory)、闪存、磁表面存储器、光盘、或光盘只读存储器(CD-ROM，Compact Disk-Read Only Memory)等存储器；也可以是包括上述存储器之一或任意组合的各种设备。

在一些实施例中，可执行指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言(包括编译或解释语言，或者声明性或过程性语言)来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例，可执行指令可以但不一定对应于文件系统中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言(HTML，Hyper TextMarkup Language)文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件(例如，存储一个或多个模块、子程序或代码部分的文件)中。作为示例，可执行指令可被部署为在一个计算设备(可以是作业运行时长确定设备)上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行。

以上所述，仅为本申请的实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本申请的保护范围之内。

Claims

1.一种信息推荐方法，其特征在于，所述方法包括：

获取目标对象在目标域中的目标域行为序列和在源域中的源域行为序列；其中，所述源域包括所述目标对象已有信息的数据特征，所述目标域至少包括所述目标对象的待学习信息的数据特征；

对所述目标域行为序列和所述源域行为序列分别进行兴趣特征提取，对应得到目标域兴趣特征和一阶源域兴趣特征；

对所述目标域兴趣特征和所述一阶源域兴趣特征进行兴趣特征融合处理，得到源域融合兴趣特征；

对所述目标域兴趣特征和所述源域融合兴趣特征进行跨域聚合处理，得到聚合兴趣特征；

基于所述聚合兴趣特征，对所述目标域的目标推荐对象进行信息推荐，其中，所述目标对象的待学习信息至少包括所述目标推荐对象。

2.根据权利要求1所述的方法，其特征在于，对目标域行为序列进行兴趣特征提取，得到目标域兴趣特征，包括：

基于自注意力机制，对所述目标域行为序列进行向量表示，得到目标域行为向量；

获取所述目标域中的每一推荐对象的第一对象信息、所述目标对象的第二对象信息、与当前推荐场景对应的上下文信息；

基于所述第一对象信息、所述第二对象信息和所述上下文信息，生成目标域查询向量；

基于所述目标域查询向量，对所述目标域行为向量进行聚合处理，得到所述目标域兴趣特征。

3.根据权利要求2所述的方法，其特征在于，所述基于所述第一对象信息、所述第二对象信息和所述上下文信息，生成目标域查询向量，包括：

分别对所述第一对象信息、所述第二对象信息和所述上下文信息进行特征提取，得到第一对象特征向量、第二对象特征向量和上下文特征向量；

对所述第一对象特征向量、所述第二对象特征向量和所述上下文特征向量进行拼接处理，得到第一拼接向量；

将所述第一拼接向量确定为所述目标域查询向量。

4.根据权利要求1所述的方法，其特征在于，对源域行为序列进行兴趣特征提取，得到一阶源域兴趣特征，包括：

基于自注意力机制，对所述源域行为序列进行向量表示，得到源域行为向量；

获取所述目标对象的第二对象信息、与当前推荐场景对应的上下文信息；

基于所述第二对象信息和所述上下文信息，生成源域查询向量；

基于所述源域查询向量，对所述源域行为向量进行合并处理，得到原始源域兴趣特征；

获取空间转换参数；

采用所述空间转换参数，对所述原始源域兴趣特征进行空间转换，得到所述一阶源域兴趣特征。

5.根据权利要求4所述的方法，其特征在于，所述基于所述第二对象信息和所述上下文信息，生成源域查询向量，包括：

分别对所述第二对象信息和所述上下文信息进行特征提取，得到第二对象特征向量和上下文特征向量；

对所述第二对象特征向量和所述上下文特征向量进行拼接处理，得到第二拼接向量；

将所述第二拼接向量确定为所述源域查询向量。

6.根据权利要求4所述的方法，其特征在于，所述对所述目标域兴趣特征和所述一阶源域兴趣特征进行兴趣特征融合处理，得到源域融合兴趣特征，包括：

对所述目标域兴趣特征和所述一阶源域兴趣特征进行映射处理，得到二阶源域兴趣特征；

对所述一阶源域兴趣特征和所述二阶源域兴趣特征进行源域特征融合处理，得到所述源域融合兴趣特征。

7.根据权利要求6所述的方法，其特征在于，所述对所述目标域兴趣特征和所述一阶源域兴趣特征进行映射处理，得到二阶源域兴趣特征，包括：

对所述目标域兴趣特征和所述一阶源域兴趣特征进行向量哈达玛积运算，得到融合兴趣向量；

基于每一推荐对象的第一对象信息和所述融合兴趣向量，生成融合查询向量；

基于所述融合查询向量，对所述源域行为向量进行聚合处理，得到源域聚合兴趣特征；

采用所述空间转换参数，对所述源域聚合兴趣特征进行空间转换，得到所述二阶源域兴趣特征。

8.根据权利要求6所述的方法，其特征在于，所述对所述一阶源域兴趣特征和所述二阶源域兴趣特征进行源域特征融合处理，得到所述源域融合兴趣特征，包括：

对所述一阶源域兴趣特征和所述二阶源域兴趣特征进行元素对应叠加，得到所述源域融合兴趣特征。

9.根据权利要求7所述的方法，其特征在于，所述对所述目标域兴趣特征和所述源域融合兴趣特征进行跨域聚合处理，得到聚合兴趣特征，包括：

通过门控网络分别为所述目标域兴趣特征、所述源域融合兴趣特征和所述融合兴趣向量对应分配目标域权重、源域权重和融合权重；

基于所述目标域权重、所述源域权重和所述融合权重，对所述目标域兴趣特征、所述源域融合兴趣特征和所述融合兴趣向量进行加权融合，得到加权融合向量；

将所述加权融合向量确定为所述聚合兴趣特征。

10.根据权利要求9所述的方法，其特征在于，所述通过门控网络分别为所述目标域兴趣特征、所述源域融合兴趣特征和所述融合兴趣向量对应分配目标域权重、源域权重和融合权重，包括：

基于所述目标对象的第二对象信息、所述目标域兴趣特征、所述源域融合兴趣特征、所述融合兴趣向量、与当前推荐场景对应的上下文信息，

通过所述门控网络，分别为所述目标域兴趣特征、所述源域融合兴趣特征和所述融合兴趣向量对应分配所述目标域权重、所述源域权重和所述融合权重。

11.根据权利要求1至10任一项所述的方法，其特征在于，所述基于所述聚合兴趣特征，对所述目标域的目标推荐对象进行信息推荐，包括：

基于所述聚合兴趣特征，生成模型输入向量；

将所述模型输入向量输入至信息推荐模型中；

通过所述信息推荐模型，确定所述目标对象对所述目标域中的每一推荐对象进行交互的交互概率；

基于所述交互概率，从所述目标域中的推荐对象中确定出所述目标推荐对象；

对所述目标推荐对象进行信息推荐。

12.根据权利要求11所述的方法，其特征在于，所述基于所述聚合兴趣特征，生成模型输入向量，包括：

对所述第一对象特征向量、所述第二对象特征向量、所述上下文特征向量和所述聚合兴趣特征进行拼接处理，得到第三拼接向量；

将所述第三拼接向量，确定为所述模型输入向量。

13.一种信息推荐装置，其特征在于，所述装置包括：

获取模块，用于获取目标对象在目标域中的目标域行为序列和在源域中的源域行为序列；其中，所述源域包括所述目标对象已有信息的数据特征，所述目标域至少包括所述目标对象的待学习信息的数据特征；

特征提取模块，用于对所述目标域行为序列和所述源域行为序列分别进行兴趣特征提取，对应得到目标域兴趣特征和一阶源域兴趣特征；

融合处理模块，用于对所述目标域兴趣特征和所述一阶源域兴趣特征进行兴趣特征融合处理，得到源域融合兴趣特征；

聚合处理模块，用于对所述目标域兴趣特征和所述源域融合兴趣特征进行跨域聚合处理，得到聚合兴趣特征；

信息推荐模块，用于基于所述聚合兴趣特征，对所述目标域的目标推荐对象进行信息推荐，其中，所述目标对象的待学习信息至少包括所述目标推荐对象。

14.一种信息推荐设备，其特征在于，包括：

存储器，用于存储可执行指令；处理器，用于执行所述存储器中存储的可执行指令时，实现权利要求1至12任一项所述的信息推荐方法。

15.一种计算机可读存储介质，其特征在于，存储有可执行指令，用于引起处理器执行所述可执行指令时，实现权利要求1至12任一项所述的信息推荐方法。