WO2023173550A1

WO2023173550A1 - 一种跨领域数据推荐方法、装置、计算机设备及介质

Info

Publication number: WO2023173550A1
Application number: PCT/CN2022/090364
Authority: WO
Inventors: 侯昶宇
Original assignee: 平安科技（深圳）有限公司
Priority date: 2022-03-14
Filing date: 2022-04-29
Publication date: 2023-09-21
Also published as: CN114661887A

Abstract

一种跨领域数据推荐方法、装置、计算机设备及介质，方法包括：获取多种源领域数据和多种目标领域数据（S101）；将所述多种源领域数据和所述多种目标领域数据输入预先训练的跨领域数据推荐模型中，以根据所述多种源领域数据从所述多种目标领域数据确定出待推荐数据；其中，所述预先训练的跨领域数据推荐模型是基于知识图谱和用户数据训练生成的，所述知识图谱是根据多种历史源领域数据构建的（S102）；输出所述多种源领域数据对应的待推荐数据，并将所述待推荐数据推送至相应客户端（S103）。通过知识图谱来表征用户和不同领域产品之间关系所构成的拓扑结构，同时结合了用户数据对结果的影响，从而得到更加精准的源领域嵌入向量，使得模型训练后的精度更高，提升了数据推荐的准确性。

Description

一种跨领域数据推荐方法、装置、计算机设备及介质

优先权申明

本申请要求于2022年3月14日提交中国专利局、申请号为202210248145.8，发明名称为“一种跨领域数据推荐方法、装置、计算机设备及介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，特别涉及一种跨领域数据推荐方法、装置、计算机设备及介质。

背景技术

近年来，互联网技术的日益发展和普及给用户带来了大量的信息，满足了用户对信息的需求。但随着信息呈指数级增长，使得用户难以从海量的数据中筛选出自己真正想要的信息。在这种情况下，推荐系统应运而生，推荐系统用于精准推荐，即向用户提供精准的推荐内容和服务。

在推荐系统领域，数据稀疏性和冷启动是仍然存在且颇具挑战性的问题，研究者们提出了很多种解决方案。近年来，出现了一种新的研究趋势，即跨领域推荐，旨在缓解数据稀疏性和冷启动对推荐系统性能的影响。现实中，在不同推荐领域都会遇到这些问题。例如，某在线购物网站拥有不止一个商品领域，如书籍、美妆、电子产品、影片等。同一个用户的在不同领域的喜好或许是相似的，因而将用户在某个领域的偏好特征迁移到目标域来提高目标域的推荐性能是一个不错的选择。

传统的冷启动推荐有两种方法，一是通过设计决策策略解决冷启动问题；二是利用辅助信息帮助冷启动(如用户属性、项目属性等)。但由于个体差异，不同领域的偏好是复杂的，发明人意识到现有的方法都不能很好的使用各类信息，用公用的偏好桥也不能准确的抓获复杂多样的关系，从而使得模型训练后的精度较低，降低了数据推荐的准确性。

发明内容

基于此，有必要针对数据推荐的准确性低的问题，提供一种跨领域数据推荐方法、装置、计算机设备及介质。

一种跨领域数据推荐方法，方法包括：获取多种源领域数据和多种目标领域数据；将多种源领域数据和多种目标领域数据输入预先训练的跨领域数据推荐模型中，以根据多种源领域数据从多种目标领域数据确定出待推荐数据；其中，预先训练的跨领域数据推荐模型是基于知识图谱和用户数据训练生成的，知识图谱是根据多种历史源领域数据构建的；输出多种源领域数据对应的待推荐数据，并将待推荐数据推送至相应客户端。

在其中一个实施例中，按照以下步骤生成预先训练的跨领域推荐模型，包括：创建跨领域数据推荐模型；其中，跨领域数据推荐模型为孪生网络，孪生网络包括源领域子模型和目标领域子模型；根据多种历史源领域数据构建源领域的拓扑结构，得到知识图谱；将知识图谱和用户数据输入源领域子模型中，输出多种源领域历史数据对应的源领域嵌入向量；根据多种历史目标领域数据构建不同正负比例的训练的数据；将不同正负比例的训练的数据与用户数据输入目标领域子模型中，输出多种历史目标领域数据对应的目标领域嵌入向量；根据源领域嵌入向量与目标领域嵌入向量生成预先训练的跨领域推荐模型。

在其中一个实施例中，根据多种历史源领域数据构建源领域的拓扑结构，得到知识图谱，包括：获取多种历史源领域数据；分析多种历史源领域数据，确定出源领域的用户喜好数据；基于源领域的用户喜好数据从多种历史源领域数据中确定出用户喜好关系和产品属性关系；根据用户喜好关系和产品属性关系构建源领域的拓扑结构，生成源领域的图结构；将源领域的图结构确定为知识图谱。

在其中一个实施例中，源领域子模型包括graph transformer图神经网络和第一桥接函数；将知识图谱和用户数据输入源领域子模型中，输出多种源领域历史数据对应的源领域嵌入向量，包括：将知识图谱输入graph transformer图神经网络中，输出源领域用户喜好的嵌入向量；将用户数据输入graph transformer图神经网络中，输出用户自身数据的嵌入向量；将源领域用户喜好的嵌入向量与用户自身数据的嵌入向量输入桥接函数中进行向量拼接，输出多种源领域历史数据对应的源领域嵌入向量。

在其中一个实施例中，根据多种历史目标领域数据构建不同正负比例的训练的数据，包括：获取多种历史目标领域数据；分析多种历史目标领域数据，确定出目标领域的产品数据；根据目标领域的产品数据构建不同正负比例的训练的数据。

在其中一个实施例中，目标领域子模型包括JK-Net网络和第二桥接函数；将不同正负比例的训练的数据与用户数据输入目标领域子模型中，输出多种历史目标领域数据对应的目标领域嵌入向量，包括：获取不同正负比例的训练的数据中每个产品的嵌入向量；将用户数据输入JK-Net网络中，输出用户在目标领域自身的嵌入向量；将每个产品的嵌入向量与用户在目标领域自身的嵌入向量输入桥接函数中进行拼接，输出多种历史目标领域数据对应的目标领域嵌入向量。

在其中一个实施例中，根据源领域嵌入向量与目标领域嵌入向量生成预先训练的跨领域推荐模型，包括：根据源领域嵌入向量与目标领域嵌入向量进行相似度计算，生成相似度分数；将相似度分数确定为模型损失值；当模型损失值到达预设阈值时，生成预先训练的跨领域推荐模型。

一种跨领域数据推荐装置，装置包括：数据获取模块，用于获取多种源领域数据和多种目标领域数据；数据输入模块，用于将多种源领域数据和多种目标领域数据输入预先训练的跨领域数据推荐模型中，以根据多种源领域数据从多种目标领域数据确定出待推荐数据；其中，预先训练的跨领域数据推荐模型是基于知识图谱和用户数据训练生成的，知识图谱是根据多种历史源领域数据构建的；数据推送模块，用于输出多种源领域数据对应的待推荐数据，并将待推荐数据推送至相应客户端。

一种计算机设备，其中，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行如下步骤的指令：

获取多种源领域数据和多种目标领域数据；

将所述多种源领域数据和所述多种目标领域数据输入预先训练的跨领域数据推荐模型中，以根据所述多种源领域数据从所述多种目标领域数据确定出待推荐数据；其中，所述预先训练的跨领域数据推荐模型是基于知识图谱和用户数据训练生成的，所述知识图谱是根据多种历史源领域数据构建的；

输出所述多种源领域数据对应的待推荐数据，并将所述待推荐数据推送至相应客户端。

一种存储有计算机可读指令的介质，其中，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行如下步骤的指令：

获取多种源领域数据和多种目标领域数据；

上述跨领域数据推荐方法、装置、设备和介质，跨领域数据推荐装置获取多种源领域数据和多种目标领域数据；将多种源领域数据和多种目标领域数据输入预先训练的跨领域数据推荐模型中，以根据多种源领域数据从多种目标领域数据确定出待推荐数据；其中，预先训练的跨领域数据推荐模型是基于知识图谱和用户数据训练生成的，知识图谱是根据多种历史源领域数据构建的；输出多种源领域数据对应的待推荐数据，并将待推荐数据推送至相应客户端。由于本申请通过知识图谱来表征用户和不同领域产品之间关系所构成的拓扑结构，同时结合了用户数据对结果的影响，从而得到更加精准的源领域嵌入向量，使得模型训练后的精度更高，提升了数据推荐的准确性。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

图1为本申请一个实施例中提供的跨领域数据推荐方法的实施环境图；

图2为本申请一个实施例中计算机设备的内部结构示意图；

图3为本申请一个实施例中提供的跨领域数据推荐方法的方法示意图；

图4为本申请一个实施例中提供的跨领域数据推荐模型训练方法的方法示意图；

图5为本申请一个实施例中提供的跨领域数据推荐模型训练过程的过程示意图；

图6是本申请实施例提供的一种跨领域数据推荐装置的装置示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

可以理解，本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件，但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。

图1为一个实施例中提供的跨领域数据推荐方法的实施环境图，如图1所示，在该实施环境中，包括服务端110以及客户端120。

服务端110可以为服务器，该服务器具体可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器，例如为保存预先训练的跨领域数据推荐模型的服务器设备。当需要进行跨领域数据推荐时，服务端110获取来自客户端120的发送的多种源领域数据和多种目标领域数据，服务端110将多种源领域数据和多种目标领域数据输入预先训练的跨领域数据推荐模型中，以根据多种源领域数据从多种目标领域数据确定出待推荐数据，服务端110输出多种源领域数据对应的待推荐数据，并将待推荐数据推送至相应客户端120。

需要说明的是，客户端120可为智能手机、平板电脑、笔记本电脑、台式计算机等，但并不局限于此。服务端110以及客户端120可以通过蓝牙、USB(Universal Serial Bus，通用串行总线)或者其他通讯连接方式进行连接，本申请在此不做限制。

图2为一个实施例中计算机设备的内部结构示意图。如图2所示，该计算机设备包括通过系统总线连接的处理器、介质、存储器和网络接口。其中，该计算机设备的介质存储有操作系统、数据库和计算机可读指令，数据库中可存储有控件信息序列，该计算机可读指令被处理器执行时，可使得处理器实现一种跨领域数据推荐方法。该计算机设备的处理器用于提供计算和控制能力，支撑整个设备的运行。该计算机设备的存储器中可存储有计算机可读指令，该计算机可读指令被处理器执行时，可使得处理器执行一种跨领域数据推荐方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解，图2中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。其中，介质为一种可读的存储介质。

下面将结合附图3，对本申请实施例提供的跨领域数据推荐方法进行详细介绍。该方法可依赖于计算机程序实现，可运行于基于冯诺依曼体系的跨领域数据推荐装置上。该计算机程序可集成在应用中，也可作为独立的工具类应用运行。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

请参见图3，为本申请实施例提供了一种跨领域数据推荐方法的流程示意图，应用于服务端。如图3所示，本申请实施例的方法可以包括以下步骤：

S101，获取多种源领域数据和多种目标领域数据；

在一种可能的实现方式中，在进行跨领域数据推荐时，首先获取多种源领域数据和多种目标领域数据。

S102，将多种源领域数据和多种目标领域数据输入预先训练的跨领域数据推荐模型中，以根据多种源领域数据从多种目标领域数据确定出待推荐数据；

其中，预先训练的跨领域数据推荐模型是基于知识图谱和用户数据训练生成的，知识图谱是根据多种历史源领域数据构建的；预先训练的跨领域数据推荐模型是根据多种源领域数据从多种目标领域数据确定出待推荐数据进行推荐的数学模型。

在本申请实施例中，在生成预先训练的跨领域数据推荐模型时，首先创建跨领域数据推荐模型；其中，跨领域数据推荐模型为孪生网络，孪生网络包括源领域子模型和目标领域子模型，然后根据多种历史源领域数据构建源领域的拓扑结构，得到知识图谱，再将知识图谱和用户数据输入源领域子模型中，输出多种源领域历史数据对应的源领域嵌入向量，其次根据多种历史目标领域数据构建不同正负比例的训练的数据，再将不同正负比例的训练的数据与用户数据输入目标领域子模型中，输出多种历史目标领域数据对应的目标领域嵌入向量，最后根据源领域嵌入向量与目标领域嵌入向量生成预先训练的跨领域推荐模型。

在一种可能的实现方式中，服务端在根据步骤S101获取到多种源领域数据和多种目标领域数据后，可将多种源领域数据和多种目标领域数据输入到预先训练的跨领域数据推荐模型中进行处理。

S103，输出多种源领域数据对应的待推荐数据，并将待推荐数据推送至相应客户端。

在一种可能的实现方式中，在根据步骤S102中的预先训练的跨领域数据推荐模型进行处理后，可输出多种源领域数据对应的待推荐数据，最后将待推荐数据推送至相应客户端进行展示。

在本申请实施例中，跨领域数据推荐装置获取多种源领域数据和多种目标领域数据；将多种源领域数据和多种目标领域数据输入预先训练的跨领域数据推荐模型中，以根据多种源领域数据从多种目标领域数据确定出待推荐数据；其中，预先训练的跨领域数据推荐模型是基于知识图谱和用户数据训练生成的，知识图谱是根据多种历史源领域数据构建的；输出多种源领域数据对应的待推荐数据，并将待推荐数据推送至相应客户端。由于本申请通过知识图谱来表征用户和不同领域产品之间关系所构成的拓扑结构，同时结合了用户数据对结果的影响，从而得到更加精准的源领域嵌入向量，使得模型训练后的精度更高，提升了数据推荐的准确性。

请参见图4，为本申请实施例提供了一种生成预先训练的跨领域推荐模型的流程示意图。如图4所示，本申请实施例的方法可以包括以下步骤：

S201，创建跨领域数据推荐模型；

其中，跨领域数据推荐模型为孪生网络，孪生网络包括源领域子模型和目标领域子模型；

通常，模型采用孪生网络的结构，可以将不同领域的输入映射到了新的相同的向量空间中，并且在工程实践中每次需要embedding的内容被大大减少，有效的提升了模型效率，实现更大规模数据的线上使用。同时，基于孪生网络自身的高扩展性，可以更加方便的同时针对多个领域的内容进行推荐冷启动。

S202，根据多种历史源领域数据构建源领域的拓扑结构，得到知识图谱；

在本申请实施例中，在生成知识图谱时，首先获取多种历史源领域数据，再分析多种历史源领域数据，确定出源领域的用户喜好数据，然后基于源领域的用户喜好数据从多种历史源领域数据中确定出用户喜好关系和产品属性关系，其次根据用户喜好关系和产品属性关系构建源领域的拓扑结构，生成源领域的图结构，最后将源领域的图结构确定为知识图谱。

S203，将知识图谱和用户数据输入源领域子模型中，输出多种源领域历史数据对应的源领域嵌入向量；

其中，源领域子模型包括graph transformer图神经网络和第一桥接函数。

在本申请实施例中，首先将知识图谱输入graph transformer图神经网络中，输出源领域用户喜好的嵌入向量，然后将用户数据输入graph transformer图神经网络中，输出用户自身数据的嵌入向量，最后将源领域用户喜好的嵌入向量与用户自身数据的嵌入向量输入桥接函数中进行向量拼接，输出多种源领域历史数据对应的源领域嵌入向量。

S204，根据多种历史目标领域数据构建不同正负比例的训练的数据；

在本申请实施例中，首先获取多种历史目标领域数据，然后分析多种历史目标领域数据，确定出目标领域的产品数据，最后根据目标领域的产品数据构建不同正负比例的训练的数据。

S205，将不同正负比例的训练的数据与用户数据输入目标领域子模型中，输出多种历史目标领域数据对应的目标领域嵌入向量；

其中，目标领域子模型包括JK-Net网络和第二桥接函数。

在本申请实施例中，首先获取不同正负比例的训练的数据中每个产品的嵌入向量，然后将用户数据输入JK-Net网络中，输出用户在目标领域自身的嵌入向量，最后将每个产品的嵌入向量与用户在目标领域自身的嵌入向量输入桥接函数中进行拼接，输出多种历史目标领域数据对应的目标领域嵌入向量。

具体的，JK-Net网络是一种深层GNN架构的网络，JK-Net通过自适应学习处在不同位置的节点聚合不同领域，从而可以改善节点的表示形式。

S206，根据源领域嵌入向量与目标领域嵌入向量生成预先训练的跨领域推荐模型。

在本申请实施例中，在生成预先训练的跨领域推荐模型时，首先根据源领域嵌入向量与目标领域嵌入向量进行相似度计算，生成相似度分数，然后将相似度分数确定为模型损失值，最后当模型损失值到达预设阈值时，生成预先训练的跨领域推荐模型。

例如图5所示，图5是跨领域推荐模型训练过程的过程示意框图，首先，根据多种历史源领域数据确定出用户喜好，根据用户喜好和产品属性的关系，构建起源领域的图结构。以此图结构为基础，使用graph transformer图神经网络结构，获取用户在源领域使用喜好的节点所构成的子图的图嵌入表示，并以此作为用户在源领域喜好的嵌入表示；根据用户的在源领域的喜好，同样使用图网络获取用户自身数据的嵌入表示。

之后通过一个桥接网络(如一个简单线性层，但本方法采用一个LSTM结构，将用户自身的嵌入表示和用户在源领域的喜好通过LSTM结构合并成一个向量)，得到最终源领域的嵌入表示,这样得到的嵌入表示相当于是针对不同用户的个性化偏好迁移函数，不再是通过一个统一的函数对所有用户的偏好进行迁移，更有效的利用了用户信息。

同样，在目标领域，使用JK-Net的方式可以解决传统图网络层数不能太深的问题，获取目标领域每个产品的嵌入表示，仿照在源领域的方式，使用图网络得到用户在目标领域自身的嵌入表示后，再通过一个桥接网络得到用户在目标领域的最终嵌入表示。最终，通过源领域的嵌入表示和目标领域的嵌入表示，得到最终的分数，确定用户是否会对目标领域内容感兴趣。

模型整体采用孪生网络结构，目标域和源领域分别使用类似的网络结构，在训练过程中使用相同的损失函数进行优化，在用户数据和领域产品数据桥接的函数共享参数。同时，模型在针对多个目标领域时，可以采用类似triple network的结构，在训练时可以针对不同目标领域构建不同正负比例的训练的数据，让模型可以同时计算在多个目标领域的推荐结果。

需要说明的是，本申请有效的利用了用户、不同领域商品之间关系所构成的拓扑结构，同时结合了用户自身信息对结果的影响，实现了更加精准的源领域、目标域嵌入表示，从而提升了模型的推荐精度。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

请参见图6，其示出了本申请一个示例性实施例提供的跨领域数据推荐装置的结构示意图，应用于服务器。该跨领域数据推荐装置可以通过软件、硬件或者两者的结合实现成为设备的全部或一部分。该装置1包括数据获取模块10、数据输入模块20、数据推送模块30。

数据获取模块10，用于获取多种源领域数据和多种目标领域数据；

数据输入模块20，用于将多种源领域数据和多种目标领域数据输入预先训练的跨领域数据推荐模型中，以根据多种源领域数据从多种目标领域数据确定出待推荐数据；其中，预先训练的跨领域数据推荐模型是基于知识图谱和用户数据训练生成的，知识图谱是根据多种历史源领域数据构建的；

数据推送模块30，用于输出多种源领域数据对应的待推荐数据，并将待推荐数据推送至相应客户端。

需要说明的是，上述实施例提供的高压后部识别装置在执行高压后部识别方法时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的高压后部识别装置与高压后部识别方法实施例属于同一构思，其体现实现过程详见方法实施例，这里不再赘述。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

在一个实施例中，提出了一种计算机设备，设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：获取多种源领域数据和多种目标领域数据；将多种源领域数据和多种目标领域数据输入预先训练的跨领域数据推荐模型中，以根据多种源领域数据从多种目标领域数据确定出待推荐数据；其中，预先训练的跨领域数据推荐模型是基于知识图谱和用户数据训练生成的，知识图谱是根据多种历史源领域数据构建的；输出多种源领域数据对应的待推荐数据，并将待推荐数据推送至相应客户端。

在一个实施例中，处理器执行生成预先训练的跨领域推荐模型时，具体执行以下操作：创建跨领域数据推荐模型；其中，跨领域数据推荐模型为孪生网络，孪生网络包括源领域子模型和目标领域子模型；根据多种历史源领域数据构建源领域的拓扑结构，得到知识图谱；将知识图谱和用户数据输入源领域子模型中，输出多种源领域历史数据对应的源领域嵌入向量；根据多种历史目标领域数据构建不同正负比例的训练的数据；将不同正负比例的训练的数据与用户数据输入目标领域子模型中，输出多种历史目标领域数据对应的目标领域嵌入向量；根据源领域嵌入向量与目标领域嵌入向量生成预先训练的跨领域推荐模型。

在一个实施例中，处理器执行根据多种历史源领域数据构建源领域的拓扑结构，得到知识图谱时，具体执行以下操作：获取多种历史源领域数据；分析多种历史源领域数据，确定出源领域的用户喜好数据；基于源领域的用户喜好数据从多种历史源领域数据中确定出用户喜好关系和产品属性关系；根据用户喜好关系和产品属性关系构建源领域的拓扑结构，生成源领域的图结构；将源领域的图结构确定为知识图谱。

在一个实施例中，处理器执行将知识图谱和用户数据输入源领域子模型中，输出多种源领域历史数据对应的源领域嵌入向量时，具体执行以下操作：将知识图谱输入graph transformer图神经网络中，输出源领域用户喜好的嵌入向量；将用户数据输入graph transformer图神经网络中，输出用户自身数据的嵌入向量；将源领域用户喜好的嵌入向量与用户自身数据的嵌入向量输入桥接函数中进行向量拼接，输出多种源领域历史数据对应的源领域嵌入向量。

在一个实施例中，处理器执行根据多种历史目标领域数据构建不同正负比例的训练的数据时，具体执行以下操作：获取多种历史目标领域数据；分析多种历史目标领域数据，确定出目标领域的产品数据；根据目标领域的产品数据构建不同正负比例的训练的数据。

在一个实施例中，处理器执行将不同正负比例的训练的数据与用户数据输入目标领域子模型中，输出多种历史目标领域数据对应的目标领域嵌入向量时，具体执行以下操作：获取不同正负比例的训练的数据中每个产品的嵌入向量；将用户数据输入JK-Net网络中，输出用户在目标领域自身的嵌入向量；将每个产品的嵌入向量与用户在目标领域自身的嵌入向量输入桥接函数中进行拼接，输出多种历史目标领域数据对应的目标领域嵌入向量。

在一个实施例中，处理器执行根据源领域嵌入向量与目标领域嵌入向量生成预先训练的跨领域推荐模型时，具体执行以下操作：根据源领域嵌入向量与目标领域嵌入向量进行相似度计算，生成相似度分数；将相似度分数确定为模型损失值；当模型损失值到达预设阈值时，生成预先训练的跨领域推荐模型。

在一个实施例中，提出了一种存储有计算机可读指令的介质，该计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：获取多种源领域数据和多种目标领域数据；将多种源领域数据和多种目标领域数据输入预先训练的跨领域数据推荐模型中，以根据多种源领域数据从多种目标领域数据确定出待推荐数据；其中，预先训练的跨领域数据推荐模型是基于知识图谱和用户数据训练生成的，知识图谱是根据多种历史源领域数据构建的；输出多种源领域数据对应的待推荐数据，并将待推荐数据推送至相应客户端。所述存储有计算机可读指令的介质可以是非易失性，也可以是易失性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一计算机可读取介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性介质，或随机存储记忆体(Random Access Memory，RAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种跨领域数据推荐方法，其中，所述方法包括：

获取多种源领域数据和多种目标领域数据；

将所述多种源领域数据和所述多种目标领域数据输入预先训练的跨领域数据推荐模型中，以根据所述多种源领域数据从所述多种目标领域数据确定出待推荐数据；其中，所述预先训练的跨领域数据推荐模型是基于知识图谱和用户数据训练生成的，所述知识图谱是根据多种历史源领域数据构建的；

输出所述多种源领域数据对应的待推荐数据，并将所述待推荐数据推送至相应客户端。
根据权利要求1所述的方法，其中，按照以下步骤生成预先训练的跨领域推荐模型，包括：

创建跨领域数据推荐模型；其中，所述跨领域数据推荐模型为孪生网络，所述孪生网络包括源领域子模型和目标领域子模型；

根据多种历史源领域数据构建源领域的拓扑结构，得到知识图谱；

将所述知识图谱和用户数据输入所述源领域子模型中，输出所述多种源领域历史数据对应的源领域嵌入向量；

根据多种历史目标领域数据构建不同正负比例的训练的数据；

将所述不同正负比例的训练的数据与所述用户数据输入所述目标领域子模型中，输出所述多种历史目标领域数据对应的目标领域嵌入向量；

根据所述源领域嵌入向量与所述目标领域嵌入向量生成预先训练的跨领域推荐模型。
根据权利要求2所述的方法，其中，所述根据多种历史源领域数据构建源领域的拓扑结构，得到知识图谱，包括：

获取多种历史源领域数据；

分析所述多种历史源领域数据，确定出源领域的用户喜好数据；

基于所述源领域的用户喜好数据从所述多种历史源领域数据中确定出用户喜好关系和产品属性关系；

根据所述用户喜好关系和产品属性关系构建源领域的拓扑结构，生成源领域的图结构；

将所述源领域的图结构确定为知识图谱。
根据权利要求2所述的方法，其中，所述源领域子模型包括graph transformer图神经网络和第一桥接函数；

所述将所述知识图谱和用户数据输入所述源领域子模型中，输出所述多种源领域历史数据对应的源领域嵌入向量，包括：

将所述知识图谱输入所述graph transformer图神经网络中，输出源领域用户喜好的嵌入向量；

将所述用户数据输入所述graph transformer图神经网络中，输出用户自身数据的嵌入向量；

将所述源领域用户喜好的嵌入向量与所述用户自身数据的嵌入向量输入所述桥接函数中进行向量拼接，输出所述多种源领域历史数据对应的源领域嵌入向量。
根据权利要求2所述的方法，其中，所述根据多种历史目标领域数据构建不同正负比例的训练的数据，包括：

获取多种历史目标领域数据；

分析所述多种历史目标领域数据，确定出目标领域的产品数据；

根据所述目标领域的产品数据构建不同正负比例的训练的数据。
根据权利要求2所述的方法，其中，所述目标领域子模型包括JK-Net网络和第二桥接函数；

所述将所述不同正负比例的训练的数据与所述用户数据输入所述目标领域子模型中，输出所述多种历史目标领域数据对应的目标领域嵌入向量，包括：

获取所述不同正负比例的训练的数据中每个产品的嵌入向量；

将所述用户数据输入所述JK-Net网络中，输出用户在目标领域自身的嵌入向量；

将所述每个产品的嵌入向量与所述用户在目标领域自身的嵌入向量输入所述桥接函数中进行拼接，输出所述多种历史目标领域数据对应的目标领域嵌入向量。
根据权利要求2所述的方法，其中，所述根据所述源领域嵌入向量与所述目标领域嵌入向量生成预先训练的跨领域推荐模型，包括：

根据所述源领域嵌入向量与所述目标领域嵌入向量进行相似度计算，生成相似度分数；

将所述相似度分数确定为模型损失值；

当所述模型损失值到达预设阈值时，生成预先训练的跨领域推荐模型。
一种跨领域数据推荐装置，其中，所述装置包括：

数据获取模块，用于获取多种源领域数据和多种目标领域数据；

数据输入模块，用于将所述多种源领域数据和所述多种目标领域数据输入预先训练的跨领域数据推荐模型中，以根据所述多种源领域数据从所述多种目标领域数据确定出待推荐数据；其中，所述预先训练的跨领域数据推荐模型是基于知识图谱和用户数据训练生成的，所述知识图谱是根据多种历史源领域数据构建的；

数据推送模块，用于输出所述多种源领域数据对应的待推荐数据，并将所述待推荐数据推送至相应客户端。
一种计算机设备，其中，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行如下步骤的指令：

获取多种源领域数据和多种目标领域数据；

将所述多种源领域数据和所述多种目标领域数据输入预先训练的跨领域数据推荐模型中，以根据所述多种源领域数据从所述多种目标领域数据确定出待推荐数据；其中，所述预先训练的跨领域数据推荐模型是基于知识图谱和用户数据训练生成的，所述知识图谱是根据多种历史源领域数据构建的；

输出所述多种源领域数据对应的待推荐数据，并将所述待推荐数据推送至相应客户端。
根据权利要求9所述的计算机设备，其中，按照以下步骤生成预先训练的跨领域推荐模型，包括：

创建跨领域数据推荐模型；其中，所述跨领域数据推荐模型为孪生网络，所述孪生网络包括源领域子模型和目标领域子模型；

根据多种历史源领域数据构建源领域的拓扑结构，得到知识图谱；

将所述知识图谱和用户数据输入所述源领域子模型中，输出所述多种源领域历史数据对应的源领域嵌入向量；

根据多种历史目标领域数据构建不同正负比例的训练的数据；

将所述不同正负比例的训练的数据与所述用户数据输入所述目标领域子模型中，输出所述多种历史目标领域数据对应的目标领域嵌入向量；

根据所述源领域嵌入向量与所述目标领域嵌入向量生成预先训练的跨领域推荐模型。
根据权利要求10所述的计算机设备，其中，所述根据多种历史源领域数据构建源领域的拓扑结构，得到知识图谱，包括：

获取多种历史源领域数据；

分析所述多种历史源领域数据，确定出源领域的用户喜好数据；

基于所述源领域的用户喜好数据从所述多种历史源领域数据中确定出用户喜好关系和产品属性关系；

根据所述用户喜好关系和产品属性关系构建源领域的拓扑结构，生成源领域的图结构；

将所述源领域的图结构确定为知识图谱。
根据权利要求10所述的计算机设备，其中，所述源领域子模型包括graph transformer图神经网络和第一桥接函数；

所述将所述知识图谱和用户数据输入所述源领域子模型中，输出所述多种源领域历史数据对应的源领域嵌入向量，包括：

将所述知识图谱输入所述graph transformer图神经网络中，输出源领域用户喜好的嵌入向量；

将所述用户数据输入所述graph transformer图神经网络中，输出用户自身数据的嵌入向量；

将所述源领域用户喜好的嵌入向量与所述用户自身数据的嵌入向量输入所述桥接函数中进行向量拼接，输出所述多种源领域历史数据对应的源领域嵌入向量。
根据权利要求10所述的计算机设备，其中，所述根据多种历史目标领域数据构建不同正负比例的训练的数据，包括：

获取多种历史目标领域数据；

分析所述多种历史目标领域数据，确定出目标领域的产品数据；

根据所述目标领域的产品数据构建不同正负比例的训练的数据。
根据权利要求10所述的计算机设备，其中，所述目标领域子模型包括JK-Net网络和第二桥接函数；

所述将所述不同正负比例的训练的数据与所述用户数据输入所述目标领域子模型中，输出所述多种历史目标领域数据对应的目标领域嵌入向量，包括：

获取所述不同正负比例的训练的数据中每个产品的嵌入向量；

将所述用户数据输入所述JK-Net网络中，输出用户在目标领域自身的嵌入向量；

将所述每个产品的嵌入向量与所述用户在目标领域自身的嵌入向量输入所述桥接函数中进行拼接，输出所述多种历史目标领域数据对应的目标领域嵌入向量。
一种存储有计算机可读指令的介质，其中，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行如下步骤的指令：

获取多种源领域数据和多种目标领域数据；

将所述多种源领域数据和所述多种目标领域数据输入预先训练的跨领域数据推荐模型中，以根据所述多种源领域数据从所述多种目标领域数据确定出待推荐数据；其中，所述预先训练的跨领域数据推荐模型是基于知识图谱和用户数据训练生成的，所述知识图谱是根据多种历史源领域数据构建的；

输出所述多种源领域数据对应的待推荐数据，并将所述待推荐数据推送至相应客户端。
根据权利要求15所述的介质，其中，按照以下步骤生成预先训练的跨领域推荐模型，包括：

创建跨领域数据推荐模型；其中，所述跨领域数据推荐模型为孪生网络，所述孪生网络包括源领域子模型和目标领域子模型；

根据多种历史源领域数据构建源领域的拓扑结构，得到知识图谱；

将所述知识图谱和用户数据输入所述源领域子模型中，输出所述多种源领域历史数据对应的源领域嵌入向量；

根据多种历史目标领域数据构建不同正负比例的训练的数据；

将所述不同正负比例的训练的数据与所述用户数据输入所述目标领域子模型中，输出所述多种历史目标领域数据对应的目标领域嵌入向量；

根据所述源领域嵌入向量与所述目标领域嵌入向量生成预先训练的跨领域推荐模型。
根据权利要求16所述的介质，其中，所述根据多种历史源领域数据构建源领域的拓扑结构，得到知识图谱，包括：

获取多种历史源领域数据；

分析所述多种历史源领域数据，确定出源领域的用户喜好数据；

基于所述源领域的用户喜好数据从所述多种历史源领域数据中确定出用户喜好关系和产品属性关系；

根据所述用户喜好关系和产品属性关系构建源领域的拓扑结构，生成源领域的图结构；

将所述源领域的图结构确定为知识图谱。
根据权利要求16所述的介质，其中，所述源领域子模型包括graph transformer图神经网络和第一桥接函数；

所述将所述知识图谱和用户数据输入所述源领域子模型中，输出所述多种源领域历史数据对应的源领域嵌入向量，包括：

将所述知识图谱输入所述graph transformer图神经网络中，输出源领域用户喜好的嵌入向量；

将所述用户数据输入所述graph transformer图神经网络中，输出用户自身数据的嵌入向量；

将所述源领域用户喜好的嵌入向量与所述用户自身数据的嵌入向量输入所述桥接函数中进行向量拼接，输出所述多种源领域历史数据对应的源领域嵌入向量。
根据权利要求16所述的介质，其中，所述根据多种历史目标领域数据构建不同正负比例的训练的数据，包括：

获取多种历史目标领域数据；

分析所述多种历史目标领域数据，确定出目标领域的产品数据；

根据所述目标领域的产品数据构建不同正负比例的训练的数据。
根据权利要求16所述的介质，其中，所述目标领域子模型包括JK-Net网络和第二桥接函数；

所述将所述不同正负比例的训练的数据与所述用户数据输入所述目标领域子模型中，输出所述多种历史目标领域数据对应的目标领域嵌入向量，包括：

获取所述不同正负比例的训练的数据中每个产品的嵌入向量；

将所述用户数据输入所述JK-Net网络中，输出用户在目标领域自身的嵌入向量；

将所述每个产品的嵌入向量与所述用户在目标领域自身的嵌入向量输入所述桥接函数中进行拼接，输出所述多种历史目标领域数据对应的目标领域嵌入向量。