CN113779380A

CN113779380A - 跨域推荐、内容推荐方法、装置及设备

Info

Publication number: CN113779380A
Application number: CN202110925829.2A
Authority: CN
Inventors: 雷陈奕; 王国鑫; 唐海红
Original assignee: Alibaba China Co Ltd
Current assignee: Alibaba China Co Ltd
Priority date: 2021-08-12
Filing date: 2021-08-12
Publication date: 2021-12-10
Anticipated expiration: 2041-08-12
Also published as: CN113779380B

Abstract

本申请实施例提供一种跨域推荐、内容推荐方法、装置及设备。该方法包括：获得用户在至少两个类型域的行为对象序列的特征表达，对至少两个类型域的行为对象序列的特征表达进行处理，得到映射到同一空间中的至少两个类型域的行为对象序列的映射后表达，并根据至少两个类型域的映射后表达，确定用户对至少两个类型域中特定类型域中的目标对象进行网络操作的概率，以根据概率向用户推荐对象。本申请能够提高获知的用户行为意图的准确性，从而能够提高推荐效果。

Description

跨域推荐、内容推荐方法、装置及设备

技术领域

本申请涉及互联网技术领域，尤其涉及一种跨域推荐、内容推荐方法、装置及设备。

背景技术

在用户通过互联网获取信息时，可以向用户推荐对象，例如视频推荐、商品推荐等。

以视频推荐为例，通常是根据用户针对视频的历史行为，向用户推荐视频。具体的，根据用户针对视频的历史行为，获知用户的行为意图，并向用户推荐与其行为意图相似的视频。然而，在用户对视频的行为比较稀疏，且视频的行为意图比较多样时，仅根据用户针对视频的历史行为进行推荐，存在无法正确的获知用户的行为意图，从而导致推荐效果较差的问题。

发明内容

本申请实施例提供一种跨域推荐、内容推荐方法、装置及设备，用以解决现有技术中推荐效果较差的问题。

第一方面，本申请实施例提供一种跨域推荐方法，包括：

获得用户在至少两个类型域的行为对象序列的特征表达，所述至少两个类型域存在关联性，任一类型域的行为对象序列的特征表达中包括所述类型域中多个对象的特征表达；

对所述至少两个类型域的行为对象序列的特征表达进行处理，得到映射到同一空间中的所述至少两个类型域的行为对象序列的映射后表达，任一类型域的行为对象序列的映射后表达中包括所述类型域中多个对象的映射后表达；

根据所述至少两个类型域的所述映射后表达，确定所述用户对所述至少两个类型域中特定类型域中的目标对象进行网络操作的概率，以根据所述概率向所述用户推荐对象。

第二方面，本申请实施例提供一种内容推荐方法，包括：

获得用户在内容域和商品域的行为对象序列的特征表达，所述内容域中的内容是关于所述商品域中商品的内容，所述内容域的行为对象序列的特征表达中包括多个内容的特征表达，所述商品域的行为对象序列的特征表达中包括多个商品的特征表达；

对所述内容域和所述商品域的行为对象序列的特征表达进行处理，得到映射到同一空间中的所述内容域和所述商品域的行为对象序列的映射后表达，所述内容域的行为对象序列的映射后表达中包括所述多个内容的映射后表达，所述商品域的行为对象序列的映射后表达中包括所述多个商品的映射后表达；

根据所述内容域和所述商品域的所述映射后表达，确定所述用户对目标内容进行浏览的概率，以根据所述概率向所述用户进行内容推荐。

第三方面，本申请实施例提供一种跨域推荐装置，包括：

获得模块，用于获得用户在至少两个类型域的行为对象序列的特征表达，所述至少两个类型域之间存在关联，任一类型域的行为对象序列的特征表达中包括所述类型域中多个对象的特征表达；

编码模块，用于对所述至少两个类型域的行为对象序列的特征表达进行处理，得到映射到同一空间中的所述至少两个类型域的行为对象序列的映射后表达，任一类型域的行为对象序列的映射后表达中包括所述类型域中多个对象的映射后表达；

推荐模块，用于根据所述至少两个类型域的所述映射后表达，确定所述用户对所述至少两个类型域中特定类型域中的目标对象进行网络操作的概率，以根据所述概率向所述用户推荐对象。

第四方面，本申请实施例提供一种内容推荐装置，包括：

获得模块，用于获得用户在内容域和商品域的行为对象序列的特征表达，所述内容域中的内容是关于所述商品域中商品的内容，所述内容域的行为对象序列的特征表达中包括多个内容的特征表达，所述商品域的行为对象序列的特征表达中包括多个商品的特征表达；

编码模块，用于对所述内容域和所述商品域的行为对象序列的特征表达进行处理，得到映射到同一空间中的所述内容域和所述商品域的行为对象序列的映射后表达，所述内容域的行为对象序列的映射后表达中包括所述多个内容的映射后表达，所述商品域的行为对象序列的映射后表达中包括所述多个商品的映射后表达；

推荐模块，用于根据所述内容域和所述商品域的所述映射后表达，确定所述用户对目标内容进行浏览的概率，以根据所述概率向所述用户进行内容推荐。

第五方面，本申请实施例提供一种服务器，包括：存储器、处理器；其中，所述存储器用于存储一条或多条计算机指令，所述一条或多条计算机指令被所述处理器执行时实现如第一方面任一项所述的方法。

第六方面，本申请实施例提供一种计算机程序产品，包括计算机程序指令，当所述指令由处理器执行时，实现如第一方面任一项所述的方法。

第七方面，本申请实施例提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序被执行时，实现如第一方面任一项所述的方法。

在本申请实施例中，服务器可以将用户在存在关联性的至少两个类型域中行为对象的特征表达，映射到同一个空间，并基于行为对象的映射后表达进行用户的跨域意图综合分析，其中，类型域是基于行为所针对主体的类型所划分出的范围，例如，行为所针对主体的类型包括商品和视频时，该至少两个类型域可以包括内容域和商品域，内容域和商品域的关联性可以体现为内容域中的内容是关于商品域中商品的内容。通过跨域意图综合分析，实现了根据用户在至少两个类型域的历史行为，进行该至少两个类型域中特定类型域中的对象推荐，由于用户在不同类型域的历史行为有一定的意图一致性，因此能够提高获知的用户行为意图的准确性，从而能够提高推荐效果。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例的推荐系统的示意图；

图2为本申请一实施例提供的跨域推荐方法的流程示意图；

图3为本申请一实施例提供的多头注意力块的结构示意图；

图4A为本申请一实施例提供的通过多头注意力块处理视频域的行为对象序列的示意图；

图4B为本申请一实施例提供的通过多头注意力块处理商品域的行为对象序列的示意图；

图5为本申请一实施例提供的采用对比学习的算法训练序列编码器的示意图；

图6为本申请一实施例提供的确定用户对目标视频的浏览概率的示意图；

图7为本申请一实施例提供的内容推荐方法的流程示意图；

图8为本申请一实施例提供的跨域推荐装置的结构示意图；

图9为本申请一实施例提供的服务器的结构示意图；

图10为本申请一实施例提供的内容推荐装置的结构示意图；

图11为本申请另一实施例提供的服务器的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义，“多种”一般包含至少两种，但是不排除包含至少一种的情况。

应当理解，本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

取决于语境，如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的商品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种商品或者系统所固有的要素。在没有更多限制情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。

另外，下述各方法实施例中的步骤时序仅为一种举例，而非严格限定。

为了方便本领域技术人员理解本申请实施例提供的技术方案，下面先对技术方案实现的技术环境进行说明。

相关技术中比较常用的视频推荐方法，主要包括根据用户针对视频的历史行为，获知用户的行为意图，并向用户推荐与其行为意图相似的视频，然而，在用户对视频的行为比较稀疏，且视频的行为意图比较多样时，仅根据用户针对视频的历史行为进行推荐，存在无法正确的获知用户的行为意图，从而导致推荐效果较差的问题，因此相关技术中亟需一种能够提高获知的用户行为意图的准确性，从而提高推荐效果的推荐方式。

基于类似于上文所述的实际技术需求，本申请提供的推荐方法可以利用技术化的手段提高获知的用户行为意图的准确性，从而提高推荐效果。

下面通过一个示例性的应用场景具体说明本申请各个实施例提供的推荐方法。

本申请实施例提供的推荐方法可以应用于图1所示的推荐系统。如图1所示，该推荐系统中可以包括：服务器11和用户使用的终端12。其中，服务器11例如可以是云服务器、分布式服务器等任意形式的数据处理服务器。终端12例如可以是台式机、笔记本电脑、平板电脑、智能手机等。服务器11可以执行本申请实施例提供的推荐方法，以向使用终端12的用户进行对象推荐。终端12可以接收服务器11推荐的对象，并向用户输出该对象，以便用户可以针对该对象进行网络操作，例如浏览等。

为了解决无法正确的获知用户的行为意图，从而导致推荐效果较差的技术问题，在图1所示的推荐系统中，服务器可以将用户在存在关联性的至少两个类型域中行为对象的特征表达，映射到同一个空间，并基于行为对象的映射后表达进行用户的跨域意图综合分析。其中，类型域是基于行为所针对主体的类型所划分出的范围，例如，在行为所针对主体的类型包括商品和内容时，该至少两个类型域可以包括内容域和商品域，内容域和商品域的关联性可以体现在内容域中的内容是关于商品域中商品的内容。通过跨域意图综合分析，实现了根据用户在至少两个类型域的历史行为，进行该至少两个类型域中特定类型域中的对象推荐，由于用户在不同类型域的历史行为有一定的意图一致性，因此能够提高获知的用户行为意图的准确性，从而能够提高推荐效果。

需要说明的是，根据内容的不同类型，内容域具体可以为特定内容类型的内容域。例如，在内容类型是视频内容时，内容域具体可以为视频内容类型的内容域，可以简称为视频域。又例如，在内容类型是图片内容时，内容域具体可以为图片内容类型的内容域。以下主要以至少两个类型域包括视频域和商品域为例进行举例说明。

基于上述，在图1所示的推荐系统中，服务器11获得用户在存在关联性的至少两个类型域的行为对象序列的特征表达，任一类型域的对象序列的特征表达中包括该类型域中多个对象的特征表达，对至少两个类型域的行为对象序列的特征表达进行处理，得到映射到同一空间中的至少两个类型域的行为对象序列的映射后表达，任一类型域的行为对象序列的映射后表达中包括该类型域中多个对象的映射后表达，并根据至少两个类型域的映射后表达，确定用户对至少两个类型域中特定类型域中的目标对象进行网络操作的概率，以根据概率向用户推荐对象。

下面结合附图，对本申请的一些实施方式作详细说明。在不冲突情况下，下述的实施例及实施例中的特征可以相互组合。

图2为本申请一实施例提供的跨域推荐方法的流程示意图，本实施例的执行主体可以为图1中的服务器11。如图2所示，本实施例的方法可以包括：

步骤21，获得用户在至少两个类型域的行为对象序列的特征表达，所述至少两个类型域存在关联性，任一类型域的行为对象序列的特征表达中包括所述类型域中多个对象的特征表达；

步骤22，对所述至少两个类型域的行为对象序列的特征表达进行处理，得到映射到同一空间中的所述至少两个类型域的行为对象序列的映射后表达，任一类型域的行为对象序列的映射后表达中包括所述类型域中多个对象的映射后表达；

步骤23，根据所述至少两个类型域的所述映射后表达，确定所述用户对所述至少两个类型域中特定类型域中的目标对象进行网络操作的概率，以根据所述概率向所述用户推荐对象。

本申请实施例中，行为对象序列中包括行为所针对的多个对象的序列，例如观看行为针对的多个视频，购买行为针对的多个商品等。示例性的，行为对象序列具体可以包括按照行为时间排序的多个对象。以至少两个类型域包括视频域和商品域为例，视频域的行为对象序列中包括多个视频，可以表示为V＝{υ₁，υ₂，…，υ_n}，其中，υ₁和υ₂等均表示视频；商品域的行为对象序列中包括多个商品，可以表示为P＝{p₁，p₂，…，p_l}，其中，p₁和p₂等均表示商品。

行为对象序列的特征表达包括多个行为对象的特征表达，行为对象序列的特征表达中可以包括多个对象中每个对象的特征表达。示例性的，视频域的行为对象序列的特征表达中包括多个视频的特征表达，商品域的行为对象序列的特征表达中包括多个商品的特征表达。需要说明的是，获得对象的特征表达的具体方式可以灵活实现，可选的，可以通过特征提取的方式获得对象的特征表达。

一个实施例中，可以通过神经网络对对象进行特征提取，获得对象的特征表达。具体的，可以将每个对象的信息输入用于提取对象特征的特征提取网络进行处理，得到该对象的特征表达。需要说明的是，在通过神经网络进行特征提取时，特征表达具体可以是向量表达。可选的，在输入特征提取网络的对象的信息是多模态信息(例如文本信息、视觉信息、音频信息等)，提取的对象的特征具体可以是多模态特征，从而有利于更好的获取用户的意图。

视频的多模态特征例如可以包括视频标题、视频标签和视频框架等，例如可以通过预训练得到的UniVL模型对视频进行特征提取。商品的多模态特征例如可以包括商品标题、商品封面和商品类别等，例如可以通过预训练得到的UNITER模型对商品进行特征提取。可选的，无论商品还是视频，还可以增加ID类特征、类目特征、商家/作者特征、统计特征等。

本申请实施例中，在获得用户在至少两个类型域的行为对象序列的特征表达之后，可以对该至少两个类型域的行为对象序列的特征表达进行处理，得到映射到同一空间中的该至少两个类型域的行为对象序列的映射后表达。

其中，行为对象序列的映射后表达中包括多个行为对象的映射后表达，行为对象序列的映射后表达中可以包括多个对象中每个对象的映射后表达。以至少两个类型域包括视频域和商品域为例，可以对视频域和商品域的行为对象序列的特征表达进行处理，得到映射到同一空间中的视频域和商品域的行为对象序列的映射后表达，其中，视频域的行为对象序列的映射后表达中包括多个视频的映射后表达，商品域的行为对象序列的映射后表达中包括多个商品的映射后表达。

一个实施例中，可以通过神经网络进行空间转换。基于此，步骤22具体可以包括：通过预训练得到的至少两个序列编码器，对应对至少两个类型域的行为对象序列的特征表达进行处理，得到映射到同一空间中的该至少两个类型域的行为对象序列的映射后表达，序列编码器与类型域一一对应。以至少两个类型域包括视频域和商品域为例，可以通过预训练得到的视频域对应的序列编码器，对视频域的行为对象序列的特征表达进行处理，并通过预训练得到的商品域对应的序列编码器，对商品域的行为对象序列的特征表达进行处理，得到映射到同一空间中的视频域和商品域的行为对象序列的映射后表达。

示例性的，序列编码器具体可以是多头注意力块(Muti-Head Attention Block)，即可以由多头注意力块实现空间转换。由于多头注意机制不知道序列顺序信息，因此可以使用时间戳嵌入来保留序列顺序信息，以便随时间捕获动态用户偏好。基于此，本申请实施例提供的方法还可以包括：将至少两个类型域的行为对象序列的特征表达中，每个对象的特征表达与其行为时间的特征表达相加，得到至少两个类型域的行为对象序列的叠加后表达。相应的，步骤22具体可以包括：将至少两个类型域的叠加后表达，对应输入至少两个序列编码器进行处理，至少两个序列编码器用于将至少两个类型域的叠加后表达映射到同一空间。

其中，行为时间的特征表达可以通过用于提取时间特征的特征提取网络获得。不同类型域对应的行为时间可以采用同一特征提取网络进行特征提取。

多头注意力块的结构例如可以如图3所示。图3中，多头注意力(Muti-HeadAttention)是底层。Add&Norm层中，Add表示残差连接(Residual Connection)用于防止网络退化，Norm表示Layer Normalization，用于进行归一化。前馈(Feed Forward)层是一个全连接层用于进行映射。

通过视频域对应的多头注意力块对视频域的行为对象序列进行处理的示意图可以如图4A所示。图4A中，

表示视频域的行为对象序列V的特征表达，

表示行为对象序列V中视频υ₁的特征表达，

表示行为对象序列V中视频υ₂的特征表达，

表示行为对象序列V中视频υ_n特征表达。

中

表示视频υ₁的行为时间的特征表达，

表示视频υ₂的行为时间的特征表达，

表示视频υ_n的行为时间的特征表达。

表示视频域的叠加后表达，

表示视频域的映射后表达。例如，特征可以使用128维的向量来表达，即

其中，i∈[1，n]，在此情况下视频域的编码后向量可以是128乘以n维，即

通过商品域对应的多头注意力块对商品域的行为对象序列的特征进行处理的示意图可以如图4B所示。图4B中，

表示商品域的行为对象序列P的特征表达，

表示行为对象序列P中商品p₁的特征表达，

表示行为对象序列P中商品p₂的特征表达，

表示行为对象序列P中商品p_l的特征表达。

中

表示商品p₁的行为时间的特征表达，

表示商品p₂的行为时间的特征表达，

表示商品p_l的行为时间的特征表达。

表示商品域的叠加后表达，

表示商品域的映射后表达。例如，特征可以使用128维的向量来表达，即

其中，j∈[1，l]，在此情况下商品域的编码后向量可以是128乘以n维，即

一个实施例中，可以采用对比学习的算法对序列编码器进行预训练，考虑到是对不同类型域对应的序列编码器进行预训练，对其进行对比学习具体可以记为跨域对比学习(Cross-Domain Contrastive Learning，CCL)。

实际应用中，在一个短的时间窗口内(比如1天)，一个用户的兴趣与意图是有一定的持续性和统一性，换句话说，在短时间内，用户在至少两个类型域的意图应该有较大的重合性。借助这一特性，可以进行序列编码器的预训练。由此，对序列编码器进行预训练的训练目标可以为：在一个短时间窗口内，一个用户在至少两个类型域分别的行为对象序列的特征表达在某个转换空间尽量相近，相对的，该用户在至少两个类型域分别的行为对象序列的特征表达，应该与任意选取的其他用户在至少两个类型域分别的行为对象序列的特征表达尽量远。

基于此，至少两个序列编码器可以是按照方式训练得到：

获得多个样本用户中每个样本用户同一时间窗口内在所述至少两个类型域分别的行为对象序列的样本特征表达；

构建至少两对序列编码器，所述至少两对序列编码器中设置有可学习参数，每个类型域对应一对序列编码器，每对序列编码器对应一个类型域，每对序列编码器中包括一个第一序列编码器和一个第二序列编码器；

将所述多个样本用户在至少两个类型域的样本特征表达，分别对应输入至至少两个第一序列编码器中，生成所述样本特征表达的第一样本映射后表达，并将所述多个样本用户在至少两个类型域的样本特征表达，分别对应输入至至少两个第二序列编码器中，生成所述样本特征表达的第二样本映射后表达；

基于每个样本用户在任意类型域的第一样本映射后表达，相对于多个目标用户在其他每个类型域的第二样本映射后表达的后验概率，以及所述第一样本映射后表达和所述第二样本映射后表达是否是一对正样本的标签，计算损失并根据所述损失对所述任意类型域对应的序列编码器的可学习参数进行迭代调整，直至所述损失满足预设要求；其中，所述多个目标用户包括所述样本用户以及至少一个其他样本用户。

需要说明的是，在使用时间戳嵌入来保留序列顺序信息时，某一行为对象序列的样本特征表达可以通过将该行为对象序列的特征表达中每个对象的特征表达，与其行为时间的特征表达相加得到。

其中，第一序列编码器可以理解为查询编码器(Query Encoder)，第二序列编码器可以理解为键编码器(Key Encoder)。训练得到的至少两个第一序列编码器可以用于对至少两个类型域的行为对象序列的特征表达进行处理，得到映射到同一空间中的至少两个类型域的行为对象序列的映射后表达。

每个样本用户在任意类型域的第一样本映射后表达可以作为“查询”，多个目标用户在其他每个类型域的第二样本映射后表达可以作为“键”保存在基于队列的字典中。以至少两个类型域包括视频域和商品域为例：每个样本用户在视频域的第一样本映射后表达可以作为“查询”，多个目标用户在商品域的第二样本映射后表达可以作为“键”保存在基于队列的字典D_ps中；每个样本用户在商品域的第一样本映射后表达可以作为“查询”，多个目标用户在视频域的第二样本映射后表达可以作为“键”保存在基于队列的字典D_υs中。

需要说明的是，某一用户在任意类型域的第一样本映射后表达，与该用户在其他每个类型域的第二样本映射后表达均可以作为一对正样本。某一用户在任意类型域的第一样本映射后表达，与另一用户在其他每个类型域的第二样本映射后表达均可以作为一对负样本。

以至少两个类型域包括视频域和商品域为例，某一用户在视频域的第一样本映射后表达，与该用户在商品域的第二样本映射后表达可以作为一对正样本，该用户在商品域的第一样本映射后表达，与该用户在视频域的第二样本映射后表达也可以作为一对正样本。以至少两个类型域包括视频域和商品域为例，用户1在视频域的第一样本映射后表达，与用户2在商品域的第二样本映射后表达可以作为一对负样本，用户1在商品域的第一样本映射后表达，与用户2在视频域的第二样本映射后表达也可以作为一对负样本。

需要说明的是，如果某一第一样本映射后表达与某一第二样本映射后表达是一对正样本，则在使用该第一样本映射后表达进行查询时，该第二样本映射后表达是与该其匹配的键。如果某一第一样本映射后表达与某一第二样本映射后表达是一对负样本，则在使用该第一样本映射后表达进行查询时，该第二样本映射后表达是与该其不匹配的键。

由此，对序列编码器训练的过程，就是用“查询”，去对应的字典中找到匹配的键，也即对应的正样本，这里，可以用InfoNCE作为寻找过程的损失函数。对序列编码器训练的目标，就是编码的“查询”应该与其匹配的键相似，并且与其不匹配的键不同，使不同类型域之间的互信息的下限最大化。

可选的，所述根据所述损失对所述任意类型域对应的序列编码器的可学习参数进行迭代调整，具体可以包括：根据所述损失对所述任意类型域对应的第一序列编码器的可学习参数进行迭代调整，并在对所述第一序列编码器的可学习参数进行多次迭代调整后，根据所述第一序列编码器调整后的可学习参数，更新与所述第一序列编码器对应的第二序列编码器的可学习参数。

示例性的，在每次寻找的过程中，误差所产生的梯度会反向传播，直接更新第一序列编码器的参数(即查询编码器)的参数，每个批量(Batch)训练结束后，第一序列编码器的参数会通过一个动量更新(Momentum Update)去更新与其对应的第二序列编码器(即键编码器)的参数，即通过一个小的幅度让第二序列编码器去跟进第一序列编码器。这种更新机制的目的是让负样本能够缓慢的更新其表征状态，从而既能使得第二序列编码器技能不断更新参数跟进第一序列编码器，又能够在每次更新字典的时候，最大程度保证负样本的一致性。从而增加第一序列编码器寻找正样本的难度，增强训练效果。

以下，以至少两个类型域包括视频域和商品域为例，参考图5对采用对比学习的算法训练序列编码器进行举例说明。

首先，对对比学习的算法的输入进行举例说明，输入例如可以为：多个样本用户在视频域的行为对象序列的样本特征表达的集合V^s，该多个样本用户在商品域的行为对象序列的样本特征表达的集合P^s；字典D_υs和D_ps；编码器f_υs,f_ps，z_υs，z_ps；字典大小K；学习率y；小批量尺寸M；动量m。

其次，对对比学习的算法的输出进行举例说明，输出例如可以为：较优解

其中，

表示编码器f_υs的可学习参数，

表示编码器f_ps的可学习参数，

表示编码器z_υs的可学习参数，

表示z_ps的可学习参数。

最后，对采用对比学习的算法对序列编码器进行训练的过程进行举例说明，训练过程例如可以包括如下步骤a至步骤p。

步骤a，初始化参数

步骤b，针对字典D_υs，随机加载字典样本

其中，

至

分别表示不同样本用户在视频域的行为对象序列的样本特征表达。

步骤c，针对字典D_ps，随机加载字典样本

其中，

至

分别表示不同样本用户在商品域的行为对象序列的样本特征表达。

步骤d，基于字典样本

初始化字典D_υs：

基于字典样本

初始化字典D_ps：

其中，

即为某一样本用户在商品域的第二样本映射后表达，

即为某一样本用户在视频域的第二样本映射后表达，函数g(·)为最大池化函数(max pooling function)，目的是将编码器编码出来的多个向量表达融合成一个向量表达。

进一步的，针对每次批量训练，执行如下步骤e至步骤p。

步骤e，加载一个小批量的视频域的行为对象序列的样本：

步骤f，加载一个小批量的商品域的行为对象序列的样本：

步骤g，通过编码器z_υs编码

并通过函数g(·)将编码结果融合成一个向量表达：

步骤h，通过编码器z_ps编码

并通过函数g(·)将编码结果融合成一个向量表达：

步骤i，更新D_υs：如果

未包括在字典D_υs中，则将字典D_υs中的一个元素出队，并将

入队。

步骤j，更新D_ps：如果

未包括在字典D_ps中，则将字典将D_ps中的一个元素出队，并将

入队。

步骤k，通过编码器f_υs编码

并通过函数g(·)将编码结果融合成一个向量表达：

其中，

即为某一样本用户在视频域的第一样本映射后表达。

步骤l，通过编码器f_ps编码

并通过函数g(·)编码将编码结果融合成一个向量表达：

其中，

即为某一样本用户在商品域的第一样本映射后表达。

步骤m，采用公式(1)计算后验概率

其中，M是小批量尺寸，t是温度项，后验是定义在具有一个正对和K-1个负对的跨域空间上。

步骤n，采用公式(2)计算后验概率

步骤o，根据交叉熵损失，将梯度反向传播到f_υs和f_ps：采用公式(3)更新

并采用公式(4)更新

其中，γ是学习率，

是指示

是否是一对正样本的标签。

步骤p，采用公式(5)动量更新

采用公式(6)动量更新

其中，m是动量值。

需要说明的是，图5中，υ^s，query表示当前输入到视频域对应的查询编码器的样本用户的样本特征表达，q^υs表示υ^s，query依次经过视频域对应的查询编码器和函数g(·)的结果；p^s，query表示当前输入到商品域对应的查询编码器的样本用户的样本特征表达，q^ps表示p^s ^，query依次经过商品域对应的查询编码器和函数g(·)的结果；

和

等表示之前输入到视频域对应的键编码器的样本用户的样本特征表达，

表示

依次经过视频域对应的键编码器和函数g(·)的结果，

表示

依次经过视频域对应的键编码器和函数g(·)的结果；

和

等表示之前输入到商品域对应的键编码器的样本用户的样本特征表达，

表示

依次经过商品域对应的键编码器和函数g(·)的结果，

表示

依次经过商品域对应的键编码器和函数g(·)的结果；υ^s，key表示当前输入到视频域对应的键编码器的样本用户的样本特征表达，k^υs表示υ^s，key依次经过视频域对应的键编码器和函数g(·)的结果；p^s，key表示当前输入到商品域对应的键编码器的样本用户的样本特征表达，k^ps表示p^s，key依次经过商品域对应的键编码器和函数g(·)的结果。可以理解的是，图5中υ^s，key和υ^s，query相同，p^s，key和p^s，query相同。

需要说明的是，以上采用对比学习的算法对序列编码器进行训练的方式仅为举例，在其他实施例中，也可以采用其他公式计算后验概率，以及采用其他公式更新

和

或者，在其他实施例中也可以采用其他训练算法进行训练，例如类似掩膜项目模型(Masked Item Modeling)的算法，类似的，可以将视频域的行为对象序列中的某些视频遮掩，然后尝试通过自监督学习恢复出这些视频。

本申请实施例中，在得到映射到同一空间中的至少两个类型域的映射后表达之后，可以根据映射后表达确定用户对至少两个类型域中特定类型域中的目标对象进行网络操作的概率，以根据概率向用户推荐对象。以特定类型域为视频域为例，网络操作例如可以为浏览。

一个实施例中，可以通过神经网络确定用户对目标对象进行网络操作的概率。基于此，在特征表达为向量表达时，步骤23具体可以包括如下步骤A至步骤C。

步骤A，对所述至少两个类型域的所述映射后进行串联，得到第一串联后表达；

步骤B，将所述第一串联后表达输入第一网络进行处理，得到所述第一串联后表达中每个对象的加权后表达；每个对象的加权后表达用于表征所述对象的映射后表达相对于其他对象的映射后表达在进行对象推荐时的重要程度；

步骤C，根据每个对象的加权后表达，确定所述用户对所述至少两个类型域中特定类型域中的目标对象进行网络操作的概率。

示例性的，第一网络具体可以是多头注意力块，其结构例如可以如图3所示。通过第一网络的处理可以将至少两个类型域的映射后表达进行融合。在此情况下，每个对象的映射后表达可以作为多头注意力机制的查询(query)，该对象之外的其他对象的映射后表达均可以作为多头注意力机制的键(key)。

可以理解的是，对象行为序列的加权后表达中包括多个对象的加权后表达。

一个实施例中，可以以类型域为单元，确定用户在每个类型域与目标向量表达相关联的意图表达。基于此，步骤C具体可以包括如下步骤C1和步骤C2。

步骤C1，将所述至少两个类型域的行为对象序列的加权后表达和目标向量表达一起，对应输入至少两个第二网络进行处理，得到所述用户在每个类型域与所述目标向量表达相关联的意图表达；所述类型域与所述第二网络一一对应，所述目标向量表达是关于所述至少两个类型域中特定类型域中的目标对象的特征表达；

步骤C2，根据所述用户在所述至少两个类型域的意图表达，确定所述用户对所述目标对象进行网络操作的概率。

示例性的，第二网络具体可以是多头注意力块，其结构例如可以如图3所示。在此情况下，目标向量表达可以作为查询(query)，对象序列中多个对象的映射后表达均可以作为键(key)。用户在每个类型域与目标向量表达相关联的意图表达中，突出了该类型域的行为对象序列的加权后表达中与目标向量表达相似的特征。

一个实施例中，可以通过将至少两个类型域与目标对象相关联的意图表达串联的方式，得到整体表征，基于此，步骤C2具体可以包括：对所述用户在所述至少两个类型域的意图表达以及所述目标向量表达进行串联，得到第二串联后表达；以及，将所述第二串联后表达，输入第三网络进行处理，得到所述用户对所述目标对象进行网络操作的概率。

如图6所示，以至少两个域包括视频域和商品域为例，首先，可以将视频域对应的序列编码器输出的映射后表达

(如图4A所示)和商品域对应的序列编码器输出的映射后表达

(如图4B所示)串联(concat)得到第一串联后表达

然后，由多头注意力块61对第一串联后表达

进行处理，得到视频域的对象行为序列的加权后表达

以及商品域的对象行为序列的加权后表达

可以理解的是，在

时

在

时

之后，将视频域的加权后表达

以及目标向量表达

输入多头注意力块62进行处理得到用户在视频域与目标向量相关联的意图表达u_υ，并将商品域的加权后表达

以及目标向量表达

输入多头注意力块63进行处理得到用户在商品域与目标向量表达相关联的意图表达u_p，其中，

表示目标对象的特征表达，

表示当前时间的特征表达。之后，将视频域与目标向量表达相关联的意图表达u_υ，商品域与目标向量表达相关联的意图表达u_p以及目标向量表达

串联，得到第二串联后表达。最后，可以将第二串联后表达输入到多层感知器(MLP)络进行处理，得到用户对目标对象进行浏览的概痒

对于图6所示的网络，可以根据如下公式(7)所示的交叉熵损失学习参数。

其中，y∈{0，1}是指示用户是否完全观看视频的标签。

需要说明的是，采用交叉熵函数计算损失仅为举例，在其他实施例中也可以采用其他损失函数计算损失，例如均方误差损失(mean-squared loss)函数。

本申请实施例提供的跨域推荐方法，通过对用户在存在关联性的至少两个类型域的行为对象序列的特征表达进行处理，得到映射到同一空间中的至少两个类型域的行为对象序列的映射后表达，并根据至少两个类型域的映射后表达，确定用户对至少两个类型域中特定类型域中的目标对象进行网络操作的概率，以根据概率向用户推荐对象，实现了在进行对象推荐时，将用户在至少两个类型域中行为对象的特征表达映射到同一个空间，并基于行为对象的映射后表达进行用户的跨域意图综合分析，从而实现了根据用户在至少两个类型域的历史行为，进行该至少两个类型域中特定类型域中的对象推荐，由于用户在不同类型域的历史行为有一定的意图一致性，因此能够提高获知的用户行为意图的准确性，从而能够提高推荐效果。

图7为本申请一实施例提供的内容推荐方法的流程示意图，本实施例的执行主体可以为图1中的服务器11。如图7所示，本实施例的方法可以包括：

步骤71，获得用户在内容域和商品域的行为对象序列的特征表达，所述内容域中的内容是关于所述商品域中商品的内容，所述内容域的行为对象序列的特征表达中包括多个内容的特征表达，所述商品域的行为对象序列的特征表达中包括多个商品的特征表达；

步骤72，对所述内容域和所述商品域的行为对象序列的特征表达进行处理，得到映射到同一空间中的所述内容域和所述商品域的行为对象序列的映射后表达，所述内容域的行为对象序列的映射后表达中包括所述多个内容的映射后表达，所述商品域的行为对象序列的映射后表达中包括所述多个商品的映射后表达；

步骤73，根据所述内容域和所述商品域的所述映射后表达，确定所述用户对目标内容进行浏览的概率，以根据所述概率向所述用户进行内容推荐。

可选的，所述特征表达具体可以为向量表达，步骤72具体可以包括：通过预训练得到的内容域对应的序列编码器对内容域的行为对象序列的特征表达进行处理，并通过预先训练得到的商品域对应的序列编码器对商品域的行为对象序列的特征表达进行处理，得到映射到同一空间中的内容域和商品域的行为对象序列的映射后表达。

可选的，该方法还可以包括：将内容域的行为对象序列的特征表达中，每个对象的特征表达与其行为时间的特征表达相加，得到内容域的行为对象序列的叠加后表达；将商品域的行为对象序列的特征表达中，每个对象的特征表达与其行为时间的特征表达相加，得到商品域的行为对象序列的叠加后表达。

所述通过预训练得到的内容域对应的序列编码器，对应内容域的行为对象序列的特征表达进行处理，可以包括：将内容域的行为对象序列的叠加后表达，输入内容域对应的序列编码器进行处理。所述通过预训练得到对应的商品域的序列编码器，对应商品域的行为对象序列的特征表达进行处理，可以包括：将商品域的行为对象序列的叠加后表达，输入商品域对应的序列编码器进行处理。

可选的，内容域和商品域的序列编码器是按照下述方式训练得到：

获得多个样本用户中每个样本用户同一时间窗口内在内容域和商品域的行为对象序列的样本特征表达；

构建两对序列编码器，所述至少两对序列编码器中设置有可学习参数，内容域对应一对序列编码器，商品域对应另一对序列编码器，每对序列编码器中包括一个第一序列编码器和一个第二序列编码器；

将所述多个样本用户在内容域和商品域的样本特征表达，分别对应输入至两个第一序列编码器中，生成所述样本特征表达的第一样本映射后表达，并将所述多个样本用户在内容域和商品域的样本特征表达，分别对应输入至两个第二序列编码器中，生成所述样本特征表达的第二样本映射后表达；

基于每个样本用户在第一类型域的第一样本映射后表达，相对于多个目标用户在第二类型域的第二样本映射后表达的后验概率，以及所述第一样本映射后表达和所述第二样本映射后表达是否是一对正样本的标签，计算损失并根据所述损失对第一类型域对应的序列编码器的可学习参数进行迭代调整，直至所述损失满足预设要求；其中，所述多个目标用户包括所述样本用户以及至少一个其他样本用户；第一类型域为内容域且第二类型域为商品域，或者，第一类型域为商品域且第二类型域为内容域。

可选的，所述根据所述损失对所述第一类型域对应的序列编码器的可学习参数进行迭代调整，具体可以包括：根据所述损失对所述第一类型域对应的第一序列编码器的可学习参数进行迭代调整，并在对所述第一序列编码器的可学习参数进行多次迭代调整后，根据所述第一序列编码器调整后的可学习参数，更新与所述第一序列编码器对应的第二序列编码器的可学习参数。

可选的，所述特征表达具体可以为向量表达，步骤73具体可以包括：对内容域和商品域的所述映射后表达进行串联，得到第一串联后表达；将所述第一串联后表达输入第一网络进行处理，得到所述第一串联后表达中每个对象的加权后表达；每个对象的加权后表达用于表征所述对象的映射后表达相对于其他对象的映射后表达在进行对象推荐时的重要程度；以及，根据每个对象的加权后表达，确定所述用户对目标内容进行浏览的概率。

可选的，对象行为序列的加权后表达中包括多个对象的加权后表达；所述根据每个对象的加权后表达，确定所述用户对目标内容进行浏览的概率，具体可以包括：将内容域的行为对象序列的加权后表达和目标向量表达一起，输入内容域对应的第二网络进行处理，得到用户在每个类型域与所述目标向量表达相关联的意图表达；所述类型域与所述第二网络一一对应，所述目标向量表达是关于所述至少两个类型域中特定类型域中的目标对象的特征表达；以及，根据用户在所述至少两个类型域的意图表达，确定所述用户对所述目标对象进行网络操作的概率。

可选的，所述根据用户在所述至少两个类型域的意图表达，确定所述用户对目标内容进行浏览操作的概率，具体可以包括：对用户在所述至少两个类型域的意图表达以及所述目标向量表达进行串联，得到第二串联后表达；以及，将所述第二串联后表达，输入第三网络进行处理，得到所述用户对所述目标内容进行浏览的概率。

可选的，所述特征表达为多模态特征的向量表达。

需要说明的是，关于本实施例的具体内容，可以参见图2所示实施例中关于至少两个类型域包括内容域和商品域的相关描述，在此不再赘述。

本申请实施例提供的内容推荐方法，通过对用户在存在关联性的内容域和商品域的行为对象序列的特征表达进行处理，得到映射到同一空间中的内容域和商品域的行为对象序列的映射后表达，并根据内容域和商品域的映射后表达，确定用户对目标内容进行浏览的概率，以根据概率向用户进行内容推荐，实现了在进行内容推荐时，将用户在内内容域和商品域中行为对象的特征表达映射到同一个空间，并基于行为对象的映射后表达进行用户的跨域意图综合分析，从而实现了根据用户在内容域和商品域的历史行为，进行内容推荐，由于用户在内容域和商品域的历史行为有一定的意图一致性，因此能够提高获知的用户行为意图的准确性，从而能够提高推荐效果。

图8为本申请一实施例提供的跨域推荐装置的结构示意图；参考附图8所示，本实施例提供了一种跨域推荐装置，该装置可以执行图2所示实施例所述的跨域推荐方法，具体的，该装置可以包括：

获得模块81，用于获得用户在至少两个类型域的行为对象序列的特征表达，所述至少两个类型域之间存在关联，任一类型域的行为对象序列的特征表达中包括所述类型域中多个对象的特征表达；

编码模块82，用于对所述至少两个类型域的行为对象序列的特征表达进行处理，得到映射到同一空间中的所述至少两个类型域的行为对象序列的映射后表达，任一类型域的行为对象序列的映射后表达中包括所述类型域中多个对象的映射后表达；

推荐模块83，用于根据所述至少两个类型域的所述映射后表达，确定所述用户对所述至少两个类型域中特定类型域中的目标对象进行网络操作的概率，以根据所述概率向所述用户推荐对象。

可选的，所述特征表达为向量表达，所述编码模块82，具体用于：通过预训练得到的至少两个序列编码器，对应对所述至少两个类型域的行为对象序列的特征表达进行处理，得到映射到同一空间中的所述至少两个类型域的行为对象序列的映射后表达，所述序列编码器与所述类型域一一对应。

可选的，所述获得模块81，还用于：将所述至少两个类型域的行为对象序列的特征表达中，每个对象的特征表达与其行为时间的特征表达相加，得到所述至少两个类型域的行为对象序列的叠加后表达；

所述编码模块82，具体用于：将所述至少两个类型域的所述叠加后表达，对应输入所述至少两个序列编码器进行处理；所述至少两个序列编码器用于将所述至少两个类型域的所述叠加后表达映射到同一空间。

可选的，所述至少两个序列编码器是按照下述方式训练得到：

获得多个样本用户中每个样本用户同一时间窗口内在所述至少两个类型域的行为对象序列的样本特征表达；

可选的，所述特征表达为向量表达，所述推荐模块83具体用于：对所述至少两个类型域的所述映射后表达进行串联，得到第一串联后表达；将所述第一串联后表达输入第一网络进行处理，得到所述第一串联后表达中每个对象的加权后表达；每个对象的加权后表达用于表征所述对象的映射后表达相对于其他对象的映射后表达在进行对象推荐时的重要程度；以及，根据每个对象的加权后表达，确定所述用户对所述至少两个类型域中特定类型域中的目标对象进行网络操作的概率。

可选的，所述推荐模块83用于根据每个对象的加权后表达，确定所述用户对所述至少两个类型域中特定类型域中的目标对象进行网络操作的概率，具体包括：将所述至少两个类型域的行为对象序列的加权后表达和目标向量表达一起，对应输入至少两个第二网络进行处理，得到用户在每个类型域与目标向量表达相关联的意图表达，以及用户在商品域与目标向量表达相关联的意图表达；所述类型域与所述第二网络一一对应，所述目标向量表达是关于所述至少两个类型域中特定类型域中的目标对象的特征表达；以及，根据用户在至少两个类型域的意图表达，确定所述用户对所述目标对象进行网络操作的概率。

可选的，所述推荐模块83用于根据用户在所述至少两个类型域的意图表达，确定所述用户对所述目标对象进行网络操作的概率，具体包括：对用户在所述至少两个类型域的意图表达以及所述目标向量表达进行串联，得到第二串联后表达；以及，将所述第二串联后表达，输入第三网络进行处理，得到所述用户对所述目标对象进行网络操作的概率。

可选的，所述特征表征为多模态特征的向量表达。

图8所示装置可以执行图2所示实施例所述的方法，本实施例未详细描述的部分，可参考对图2所示实施例的相关说明。该技术方案的执行过程和技术效果参见图2所示实施例中的描述，在此不再赘述。

在一个可能的实现中，图8所示装置的结构可实现为一服务器。如图9所示，该服务器可以包括：处理器91和存储器92。其中，存储器92用于存储支持服务器执行上述图2所示实施例所述方法的程序，处理器91被配置为用于执行存储器92中存储的程序。

程序包括一条或多条计算机指令，其中，一条或多条计算机指令被处理器91执行时能够实现如下步骤：

可选地，处理器91还用于执行前述图2所示实施例中的全部或部分步骤。

其中，服务器的结构中还可以包括通信接口93，用于服务器与其他设备或通信网络通信。

图10为本申请一实施例提供的内容推荐装置的结构示意图；参考附图10所示，本实施例提供了一种内容推荐装置，该装置可以执行图7所示实施例所述的内容推荐方法，具体的，该装置可以包括：

获得模块101，用于获得用户在内容域和商品域的行为对象序列的特征表达，所述内容域中的内容是关于所述商品域中商品的内容，所述内容域的行为对象序列的特征表达中包括多个内容的特征表达，所述商品域的行为对象序列的特征表达中包括多个商品的特征表达；

编码模块102，用于对所述内容域和所述商品域的行为对象序列的特征表达进行处理，得到映射到同一空间中的内容域和商品域的行为对象序列的映射后表达，所述内容域的行为对象序列的映射后表达中包括所述多个内容的映射后表达，所述商品域的行为对象序列的映射后表达中包括所述多个商品的映射后表达；

推荐模块103，用于根据所述内容域和所述商品域的所述映射后表达，确定所述用户对目标内容进行浏览的概率，以根据所述概率向所述用户进行内容推荐。

图10所示装置可以执行图7所示实施例所述的方法，本实施例未详细描述的部分，可参考对图7所示实施例的相关说明。该技术方案的执行过程和技术效果参见图7所示实施例中的描述，在此不再赘述。

在一个可能的实现中，图10所示装置的结构可实现为一服务器。如图11所示，该服务器可以包括：处理器111和存储器112。其中，存储器112用于存储支持服务器执行上述图7所示实施例所述方法的程序，处理器111被配置为用于执行存储器112中存储的程序。

程序包括一条或多条计算机指令，其中，一条或多条计算机指令被处理器111执行时能够实现如下步骤：

可选地，处理器111还用于执行前述图7所示实施例中的全部或部分步骤。

其中，服务器的结构中还可以包括通信接口113，用于服务器与其他设备或通信网络通信。

另外，本申请实施例还提供一种计算机程序产品，包括计算机程序指令，当所述指令由处理器执行时，实现图2所示实施例所述的方法。

本申请实施例还提供一种计算机程序产品，包括计算机程序指令，当所述指令由处理器执行时，实现图7所示实施例所述的方法。

本申请实施例还提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序被执行时，实现如图2所示实施例所述的方法。

本申请实施例还提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序被执行时，实现如图7所示实施例所述的方法。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现，当然也可以通过硬件和软件结合的方式来实现。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程设备的处理器以产生一个机器，使得通过计算机或其他可编程设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、链表、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

1.一种跨域推荐方法，其特征在于，包括：

获得用户在至少两个类型域的行为对象序列的特征表达，所述至少两个类型域存在关联性，任一类型域的对象序列的特征表达中包括所述类型域中多个对象的特征表达；

2.根据权利要求1所述的方法，其特征在于，所述特征表达为向量表达；所述对所述至少两个类型域的行为对象序列的特征表达进行处理，得到映射到同一空间中的所述至少两个类型域的行为对象序列的映射后表达，包括：

通过预训练得到的至少两个序列编码器，对应对所述至少两个类型域的行为对象序列的特征表达进行处理，得到映射到同一空间中的所述至少两个类型域的行为对象序列的映射后表达，所述序列编码器与所述类型域一一对应。

3.根据权利要求2所述的方法，其特征在于，所述至少两个序列编码器是按照下述方式训练得到：

4.根据权利要求1-3任一项所述的方法，其特征在于，所述特征表达为向量表达；所述根据所述至少两个类型域的所述映射后表达，确定所述用户对所述至少两个类型域中特定类型域中的目标对象进行网络操作的概率，包括：

对所述至少两个类型域的所述映射后表达进行串联，得到第一串联后表达；

将所述第一串联后表达输入第一网络进行处理，得到所述第一串联后表达中每个对象的加权后表达；每个对象的加权后表达用于表征所述对象的映射后表达相对于其他对象的映射后表达在进行对象推荐时的重要程度；

根据每个对象的加权后表达，确定所述用户对所述至少两个类型域中特定类型域中的目标对象进行网络操作的概率。

5.根据权利要求4所述的方法，其特征在于，所述根据每个对象的加权后表达，确定所述用户对所述至少两个类型域中特定类型域中的目标对象进行网络操作的概率，包括：

将所述至少两个类型域的行为对象序列的加权后表达和目标向量表达一起，对应输入至少两个第二网络进行处理，得到所述用户在每个类型域与所述目标向量表达相关联的意图表达；所述类型域与所述第二网络一一对应，所述目标向量表达是关于所述至少两个类型域中特定类型域中的目标对象的特征表达；

根据所述用户在所述至少两个类型域的意图表达，确定所述用户对所述目标对象进行网络操作的概率。

6.根据权利要求5所述的方法，其特征在于，所述根据所述用户在所述至少两个类型域的意图表达，确定所述用户对所述目标对象进行网络操作的概率，包括：

对所述用户在所述至少两个类型域的意图表达以及所述目标向量表达进行串联，得到第二串联后表达；

将所述第二串联后表达，输入第三网络进行处理，得到所述用户对所述目标对象进行网络操作的概率。

7.一种内容推荐方法，其特征在于，包括：

8.一种跨域推荐装置，其特征在于，包括：

9.一种内容推荐装置，其特征在于，包括：

10.一种服务器，其特征在于，包括：存储器、处理器；其中，所述存储器用于存储一条或多条计算机指令，所述一条或多条计算机指令被所述处理器执行时实现如权利要求1至7中任一项所述的方法。

11.一种计算机程序产品，其特征在于，包括计算机程序指令，当所述指令由处理器执行时，实现如权利要求1至7中任一项所述的方法。

12.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，当所述计算机程序被执行时，实现如权利要求1至7任一项所述的方法。