WO2023213157A1

WO2023213157A1 - 数据处理方法、装置、程序产品、计算机设备和介质

Info

Publication number: WO2023213157A1
Application number: PCT/CN2023/084690
Authority: WO
Inventors: 沈春旭; 成昊; 薛扣英
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2022-05-05
Filing date: 2023-03-29
Publication date: 2023-11-09
Also published as: CN114580794A; US20240177006A1; CN114580794B

Abstract

本申请公开了一种数据处理方法、装置、程序产品、计算机设备和介质，该方法由计算机设备执行，包括：获取包含N个对象的对象节点和M个资源的资源节点的转化异质图；若对象对资源具有转化行为，则对象的对象节点与资源的资源节点在转化异质图中具有连边；获取每个对象对应的对象同质图；任一对象同质图包含对应对象在多个维度上的对象特征的对象特征节点；获取每个资源对应的资源同质图；任一资源同质图包含对应资源在多个维度上的资源特征的资源特征节点；基于转化异质图、每个对象的对象同质图和每个资源的资源同质图训练预测网络，得到训练好的预测网络；训练好的预测网络用于预测对象针对资源的转化指数。

Description

数据处理方法、装置、程序产品、计算机设备和介质

本申请要求于2022年5月5日提交中国专利局、申请号为202210479316.8、发明名称为“数据处理方法、装置、程序产品、计算机设备和介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，尤其涉及一种数据处理方法、装置、程序产品、计算机设备和介质。

发明背景

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。其中，人工智能中的机器学习就应用到了生活的方方面面。

现有应用中，在预测用户针对资源(如软件或者广告等)的转化指数时，通常可以通过已有的用户针对资源的转化行为来训练预测网络，进而通过训练好的预测网络来预测用户针对资源的转化指数。但是若是有用户对资源并不存在转化行为，或者资源不存在有用户对其具有转化行为，则在训练预测网络时该用户和该资源的特征将无法进行有效传递，进而导致训练得到的预测网络也不能对用户针对资源的转化指数进行准确预测。

发明内容

本申请提供了一种数据处理方法、装置、程序产品、计算机设备和介质，可提升训练得到的预测网络的准确性，以采用训练得到的预测网络对对象针对资源的转化指数进行准确预测。

本申请一方面提供了一种数据处理方法，由计算机设备执行，该方法包括：

获取转化异质图；转化异质图包含N个对象节点和M个资源节点，每个对象节点各自表示一个对象，每个资源节点各自表示一个资源，N和M均为正整数；若N个对象中任一对象对M个资源中任一资源具有转化行为，则任一对象的对象节点与任一资源的资源节点在转化异质图中具有连边；

获取N个对象中每个对象分别对应的对象同质图；任一对象同质图包含多个对象特征节点，任一对象特征节点用于表示对应对象在一个维度上的对象特征；

获取M个资源中每个资源分别对应的资源同质图；任一资源同质图包含多个资源特征节点，任一资源特征节点用于表示对应资源在一个维度上的资源特征；

基于转化异质图、每个对象的对象同质图和每个资源的资源同质图训练预测网络，得到训练好的预测网络；训练好的预测网络用于预测对象针对资源的转化指数。

本申请一方面提供了一种数据处理装置，该装置包括：

第一获取模块，用于获取转化异质图；转化异质图包含N个对象节点和M个资源节点，每个对象节点各自表示一个对象，每个资源节点各自表示一个资源，N和M均为正整数；若N个对象中任一对象对M个资源中任一资源具有转化行为，则任一对象的对象节点与任一资源的资源节点在转化异质图中具有连边；

第二获取模块，用于获取N个对象中每个对象分别对应的对象同质图；任一对象同质图包含多个对象特征节点，任一对象特征节点用于表示对应对象在一个维度上的对象特征；

第三获取模块，用于获取M个资源中每个资源分别对应的资源同质图；任一资源同质图包含多个资源特征节点，任一资源特征节点用于表示对应资源在一个维度上的资源特征；

训练模块，用于基于转化异质图、每个对象的对象同质图和每个资源的资源同质图训练预测网络，得到训练好的预测网络；训练好的预测网络用于预测对象针对资源的转化指数。

本申请一方面提供了一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，计算机程序被处理器执行时，使得处理器执行本申请中一方面中的方法。

本申请一方面提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序包括程序指令，该程序指令被处理器执行时使该处理器执行上述一方面中的方法。

根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述一方面等各种方式中提供的方法。

附图简要说明

为了更清楚地说明本申请或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请提供的一种网络架构的结构示意图；

图2是本申请提供的一种数据处理的场景示意图；

图3是本申请提供的一种数据处理方法的流程示意图；

图4是本申请提供的一种生成转化异质图的场景示意图；

图5是本申请提供的一种生成对象同质图的场景示意图；

图6是本申请提供的一种生成资源同质图的场景示意图；

图7是本申请提供的一种模型训练方法的流程示意图；

图8是本申请提供的一种网络训练的场景示意图；

图9是本申请提供的一种损失生成方法的流程示意图；

图10是本申请提供的一种生成预测损失值的场景示意图；

图11是本申请提供的一种模型训练的场景示意图；

图12是本申请提供的一种数据处理装置的结构示意图；

图13是本申请提供的一种计算机设备的结构示意图。

实施方式

下面将结合本申请中的附图，对本申请中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请涉及到人工智能相关技术。其中，人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本申请中主要涉及到了人工智能中的机器学习。其中，机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科，专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

本申请中所涉及到的机器学习主要指，如何训练预测模型(即预测网络)，以通过训练好的预测模型来预测对象针对资源的转化指数，具体可以参见下述图3对应的实施例中的描述。

本申请涉及到云技术。其中，云技术(Cloud Technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来，实现数据的计算、储存、处理和共享的一种托管技术。

云技术是基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称，可以组成资源池，按需所用，灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源，如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用，将来每个物品都有可能存在自己的识别标志，都需要传输到后台系统进行逻辑处理，不同程度级别的数据将会分开处理，各类行业数据皆需要强大的系统后盾支撑，只能通过云计算来实现。本申请中所涉及到的云技术可以指后台可以通过“云”向对象的前端推送资源。

首先，需要进行说明的是，本申请在收集用户的相关数据(如下述用户针对资源的转化行为及用户的特征等用户数据)之前以及在收集用户的相关数据的过程中，都可以显示提示界面或者弹窗，该提示界面或者弹窗用于提示用户当前正在搜集其相关数据，使得本申请仅仅在获取到用户对该提示界面或者弹窗发出的确认操作后，才开始执行获取用户相关数据的相关步骤，否则(即未获取到用户对该提示界面或者弹窗发出的确认操作时)，结束获取用户相关数据的相关步骤，即不获取用户的相关数据。换句话说，本申请所采集的所有用户数据都是在用户同意并授权的情况下进行采集的，且相关用户数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

此处，对本申请所涉及到的相关概念进行解释：

转化率(conversion rate,CVR)：广告曝光后用户成功转化的概率，成功转化通常指完成对目标商品的购买等行为。该转化率可以是下述转化指数。

同质图(Homogeneous graph)：顶点和边都只有一种类型的图。

异质图(Heterogeneous graph)：顶点和边的类型大于或等于两种的图。

二部图(bipartite graph)：图的顶点集可以被分割成两个互不相交的子集，图中每条边两端的顶点(如下述中的对象节点或者资源节点)都属于不同的两个子集，并且同一个子集中的顶点不相邻。

自监督(self-supervised)：无需对数据进行人工标注，直接从无标签数据中获得监督信号用于学习的一种方法。

请参见图1，图1是本申请提供的一种网络架构的结构示意图。如图1所示，网络架构可以包括服务器200和终端设备集群，终端设备集群可以包括一个或者多个终端设备，这里将不对终端设备的数量进行限制。如图1所示，多个终端设备具体可以包括终端设备100a、终端设备101a、终端设备102a、…、终端设备103a；如图1所示，终端设备100a、终端设备101a、终端设备102a、…、终端设备103a均可以与服务器200进行网络连接，以便于每个终端设备可以通过网络连接与服务器200之间进行数据交互。

如图1所示的服务器200可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备可以是：智能手机、平板电脑、笔记本电脑、桌上型电脑、智能电视、车载终端等智能终端。下面以终端设备100a与服务器200之间的通信为例，进行本申请实施例的具体描述。

请一并参见图2，图2是本申请提供的一种数据处理的场景示意图。如图2所示上述终端设备100a、终端设备101a、终端设备102a、…、终端设备103a可以是各个用户(可以是下述对象)所持有的终端设备，终端设备中可以包含应用程序，应用程序的应用页面上可以显示若干广告(可以是下述资源)，用户可以通过所持有的终端设备在应用程序的应用页面购买广告中所推荐的商品。服务器200可以是该应用程序的后台服务器，服务器200可以获取到用户针对广告中所推荐的商品的购买行为(可以称之为是用户针对广告的转化行为)，进而，服务器200可以通过各个用户针对各个广告中的商品的购买行为构建转化异质图，该转化异质图中包含用户的用户节点和广告的广告节点，若一个用户对一个广告中的商品具有购买行为，则该转化异质图中该用户的用户节点与该广告的广告节点之间就具有连边。

进而，服务器200还可以根据各个用户的对象特征构建各个用户分别对应的同质图(包含用户的特征节点，可以称为对象特征节点)，并可以根据各个广告的广告特征构建各个广告分别对应的同质图(包含广告的特征节点，可以称为资源特征节点)。

进而，服务器200可以结合上述转化异质图、各个用户的同质图以及各个广告的同质图来一同训练预测网络，进而得到训练好的预测网络，训练好的预测网络就可以用于预测用户针对广告的转化指数，该转化指数表征了用户购买广告中所推荐的商品的概率。该过程可以参见下述图3对应实施例中的相关描述。

本申请中，通过结合上述转化异质图、各个用户的同质图以及各个广告的同质图来一同训练预测网络，可以使得预测网络对于转化异质图中较为孤立的节点(用户节点或者广告节点)对应的特征也能进行有效学习，提升了所训练得到的预测网络的准确性，进而提升了对用户针对广告的转化指数的预测准确性。

请参见图3，图3是本申请提供的一种数据处理方法的流程示意图。本申请实施例中的执行主体可以是一个计算机设备或者多个计算机设备所构成的计算机设备集群，该计算机设备可以是服务器，也可以终端设备。下述将本申请中的执行主体统称为计算机设备为例进行说明。如图3所示，该方法可以包括：

步骤S101，获取转化异质图；转化异质图包含N个对象节点和M个资源节点，每个对象节点各自表示一个对象，每个资源节点各自表示一个资源，N和M均为正整数；若N个对象中任一对象对M个资源中任一资源具有转化行为，则任一对象的对象节点与任一资源的资源节点在转化异质图中具有连边。

计算机设备可以获取到转化异质图，顾名思义，该转化异质图是一个异质图，该转化异质图可以包括N个对象节点以及M个资源节点，每个对象节点各自表示一个对象，每个资源节点各自表示一个资源，换句话说，共有N个对象和M个资源，一个对象在转化异质图中可以有一个对象节点，一个资源在转化异质图中可以有一个资源节点，N和M均为正整数，N和M的具体取值根据实际应用场景确定，对此不做限制。该N个对象和M个资源可以是任意一个应用平台中的对象和资源。

其中，对象可以是指用户，资源可以是指可以向用户进行推荐或者推送的任意数据。例如，资源可以是广告数据，该广告数据可以用于向用户推荐相应的产品，该产品可以是可以购买的商品(如洗发水、护手霜、遮阳帽或者墨镜等等)，或者，该产品还可以是可以下载安装的应用程序(如软件(app))。资源具体是什么数据可以根据实际应用场景确定，对此不做限制。

其中，若N个对象中的任一对象对M个资源中的任一资源具有转化行为，则该任一对象的对象节点与该任一资源的资源节点在转化异质图中具有连边(即该对象节点和该资源节点在转化异质图中是相互连接的)。换句话说，若某个对象对某个资源具有转化行为，则转化异质图中该对象的对象节点与该资源的资源节点之间具有连边(相互连接)。

对象针对资源的转化行为可以根据实际应用场景确定。例如，若资源是针对商品的广告数据，则对象对资源的转化行为可以是指对象购买了广告数据中所推荐的商品；再如，若资源是针对软件的推荐数据(也可以属于广告数据)，则对象对资源的转化行为可以是指对象下载安装了该推荐数据中所推荐的软件。

其中，上述转化异质图也属于非完全(即顶点之间并不完全连接)的二部图，转化异质图中包括两种类型的顶点(即节点)，一种是对象的对象节点，一种是资源的资源节点，在转化异质图中，若一个对象对一个资源具有转化行为，则转化异质图中该对象的对象节点与该资源的资源节点之间具有连边，否则，即该对象对该资源不具有转化行为，则转化异质图中该对象的对象节点与该资源的资源节点之间就不具有连边。

请参见图4，图4是本申请提供的一种生成转化异质图的场景示意图。如图4所示，上述N个对象可以包括对象1～对象9，上述M个资源可以包括资源1～资源5。其中，对象1对资源1具有转化行为，因此转化异质图中对象1的对象节点1与资源1的资源节点1具有连边；对象2对资源3具有转化行为，因此转化异质图中对象2的对象节点2与资源3的资源节点3具有连边；对象3对任一个资源都不具有转化行为，因此转化异质图中对象3的对象节点3与任一资源的资源节点都不具有连边。

更多的，对象4对资源1具有转化行为，因此转化异质图中对象4的对象节点4与资源1的资源节点1具有连边；对象5对资源4具有转化行为，因此转化异质图中对象5的对象节点5与资源4的资源节点4具有连边；对象6对资源1和资源3具有转化行为，因此转化异质图中对象6的对象节点6与资源1的资源节点1具有连边，且对象6的对象节点6与资源3的资源节点3具有连边；对象7对资源4具有转化行为，因此转化异质图中对象7的对象节点7与资源4的资源节点4具有连边。

更多的，对象8对资源5具有转化行为，因此转化异质图中对象8的对象节点8与资源5的资源节点5具有连边；对象9对任一个资源都不具有转化行为，因此转化异质图中对象9的对象节点9与任一资源的资源节点都不具有连边。

步骤S102，获取N个对象中每个对象分别对应的对象同质图；任一对象同质图包含多个对象特征节点，任一对象特征节点用于表示对应对象在一个维度上的对象特征。

计算机设备可以获取到上述N个对象中每个对象分别对应的同质图，可以将对象的同质图称之为是对象同质图，一个对象可以具有一个对象同质图。任一个对象同质图可以包含多个特征节点，可以将对象同质图中的特征节点称之为是对象特征节点，任一个对象特征节点用于表示对应对象在一个维度上的对象特征。

其中，对象的对象同质图可以是完全图，即任一个对象同质图中两两对象特征节点之间都可以是相互连接的。

例如，对象可以有多个维度(即多维)的对象特征，该多维对象特征可以包括对象年龄的特征、对象所在城市的特征及对象工作的特征，则对象的对象同质图中可以包含对象年龄的特征节点、对象所在城市的特征节点以及对象工作的特征节点。

其中，对象的多维对象特征具体是什么特征可以根据实际应用场景进行设置，对象的一维对象特征可以对应对象的对象同质图中一个对象特征节点。不同对象的多维对象特征可以相同，也可以不相同，具体根据实际应用场景确定。

请参见图5，图5是本申请提供的一种生成对象同质图的场景示意图。若一个对象具有多个维度(包括第1个维度～第5个维度)的对象特征，那么构建的该对象的对象同质图中就可以包括该对象在第1个维度上的对象特征对应的对象特征节点、该对象在第2个维度上的对象特征对应的对象特征节点、该对象在第3个维度上的对象特征对应的对象特征节点、该对象在第4个维度上的对象特征对应的对象特征节点及该对象在第5个维度上的对象特征对应的对象特征节点，这5个对象特征节点之间两两相连。

步骤S103，获取M个资源中每个资源分别对应的资源同质图；任一资源同质图包含多个资源特征节点，任一资源特征节点用于表示对应资源在一个维度上的资源特征。

计算机设备可以获取到上述M个资源中每个资源分别对应的同质图，可以将资源的同质图称之为是资源同质图，一个资源可以具有一个资源同质图。任一个资源同质图可以包含多个特征节点，可以将资源同质图中的特征节点称之为是资源特征节点，任一个资源特征节点用于表示对应资源在一个维度上的资源特征。

其中，资源的资源同质图可以是完全图，即任一个资源同质图中两两资源特征节点之间都可以是相互连接的。

例如，资源可以有多个维度(即多维)的资源特征，该多维资源特征可以包括资源的资源风格的特征、资源所属领域的特征及资源类型的特征，则资源的资源同质图中可以包含资源风格的特征节点、资源所属领域的特征节点以及资源类型的特征节点。

其中，资源的多维资源特征具体是什么特征可以根据实际应用场景进行设置，资源的一维资源特征可以对应资源的资源同质图中一个资源特征节点。不同资源的多维资源特征可以相同，也可以不相同，具体根据实际应用场景确定。

请参见图6，图6是本申请提供的一种生成资源同质图的场景示意图。若一个资源具有多个维度(包括第1个维度～第6个维度)的资源特征，那么构建的该资源的资源同质图中就可以包括该资源在第1个维度上的资源特征对应的资源特征节点、该资源在第2个维度上的资源特征对应的资源特征节点、该资源在第3个维度上的资源特征对应的资源特征节点、该资源在第4个维度上的资源特征对应的资源特征节点、该资源在第5个维度上的资源特征对应的资源特征节点及该资源在第6个维度上的资源特征对应的资源特征节点，这6个资源特征节点之间两两相连。

步骤S104，基于转化异质图、每个对象的对象同质图和每个资源的资源同质图训练预测网络，得到训练好的预测网络；训练好的预测网络用于预测对象针对资源的转化指数。

转化异质图包含了对象与资源之间的转化关系，对象的同质图表征了对象本身的特征，资源的同质图表征了资源本身的特征，计算机设备可以根据上述获取到的转化异质图、每个对象的对象同质图以及每个资源的资源同质图来训练预测网络，进而得到训练好的预测网络。其中，训练预测网络的具体过程也可以参见下述图7对应实施例中的相关描述。

其中，训练好的预测网络可以用于预测对象针对资源的转化指数，该转化指数表征了对象会对资源执行转化行为的概率，计算机设备可以根据所预测得到的各个对象针对各个资源的转化指数来确定对各个对象进行资源推送的策略(简称资源推送策略)。其中，若一个对象针对一个资源的转化指数越大，则表明该对象对该资源执行转化行为的概率越大，反之，若一个对象针对一个资源的转化指数越小，则表明该对象对该资源执行转化行为的概率越小。

例如，计算机设备可以获取到预测对象和预测资源，该预测对象可以是上述N个对象中的任一个，或者该预测对象也可以是新增的(即不属于N个对象中的任一个)，同理，该预测资源可以是上述M个资源中的任一个，或者该预测资源也可以是新增的(即不属于M个资源中的任一个)。

进而，计算机设备可以获取到该预测对象的对象标识，并获取到预测资源的资源标识，并可以将该预测对象的对象标识以及预测资源的资源标识映射到统一的哈希空间，该哈希空间可以与下述步骤S201中N个对象的对象标识以及M个资源的资源标识所映射到的哈希空间相同，具体阐释可以参见下述步骤S201中的描述。

进而，计算机设备可以获取到预测对象的对象标签特征以及预测资源的资源标签特征，其中，获取预测对象的对象标签特征的过程与下述步骤S202中获取各个对象的对象标签特征的过程相同，获取预测资源的资源标签特征的过程与下述步骤S203中获取各个资源的资源标签特征的过程相同。

进而，计算机设备可以将预测对象在哈希空间中映射的特征值、预测对象的对象标签特征、预测资源在哈希空间中映射的特征值、预测资源的资源标签特征输入训练好的预测网络，调用预测网络根据预测对象在哈希空间中映射的特征值、预测对象的对象标签特征、预测资源在哈希空间中映射的特征值、预测资源的资源标签特征，预测该预测对象针对预测资源的转化指数，该转化指数可以是0～1的值。

若上述所预测得到的预测对象针对预测资源的转化指数大于转化指数阈值，则可以将预测资源推送给预测对象。

预测资源还可以有多个，如预测资源还可以包括上述M个资源中的各个资源，因此，计算机设备可以获取到预测对象针对每个预测资源的转化指数，并可以根据每个预测资源分别对应的转化指数按照从大到小的顺序对每个预测资源进行排序，并可以将排序在前T个的资源推送给预测对象，T为正整数，T的具体取值可以根据实际应用场景确定。

其中，本申请重点描述了如何准确训练预测网络，进而如何通过所训练的预测网络生成对象针对资源准确的转化指数，后续具体如何通过对象针对资源的转化指数来向对象进行资源的推送的策略，可以根据实际应用场景确定，对此不做限制。

本申请通过结合对象和资源之间的转化异质图、对象以及资源的同质图来一同训练预测网络，可以使得预测网络对转化异质图中比较孤立的节点(如与其他资源节点或者对象节点不存在连边或者连边很少的节点)对应对象或者资源的特征也可以进行较好的学习，这可以解决针对对象和资源的冷启动问题(如存在新增的对象或者资源时，对新增的对象或者资源学习不充分的问题；还如某些已有的对象或者资源与其他对象或者资源关联不大(如在转化异质图中对应连边不存在或者存在极少)时，对该关联不大的对象和资源学习不充分的问题)，使得训练得到的预测网络对于所有对象针对所有资源的转化指数都能进行准确的预测。

本申请可以获取转化异质图；转化异质图包含N个对象的对象节点和M个资源的资源节点，N和M均为正整数；若N个对象中任一对象对M个资源中任一资源具有转化行为，则任一对象的对象节点与任一资源的资源节点在转化异质图中具有连边；获取N个对象中每个对象分别对应的对象同质图；任一对象同质图包含多个对象特征节点，任一对象特征节点用于表示对应对象在一个维度上的对象特征；获取M个资源中每个资源分别对应的资源同质图；任一资源同质图包含多个资源特征节点，任一资源特征节点用于表示对应资源在一个维度上的资源特征；基于转化异质图、每个对象的对象同质图和每个资源的资源同质图训练预测网络，得到训练好的预测网络；训练好的预测网络用于预测对象针对资源的转化指数。由此可见，本申请提出的方法可以同时结合对象和资源的异质图、对象的同质图以及资源的同质图来训练预测网络，使得在训练预测网络时对于各个对象和各个资源(同时包括之间不具有访问行为的对象与资源及之间具有访问行为的对象与资源)的特征都能进行有效传播，因此可以提升训练得到的预测网络的准确性，通过训练得到的预测网络也可以实现对对象针对资源的转化指数的准确预测。

请参见图7，图7是本申请提供的一种模型训练方法的流程示意图。本申请实施例中的执行主体可以与上述图3对应实施例中的执行主体相同，如图6所示，该方法包括：

步骤S201，调用预测网络基于转化异质图生成每个对象的第一对象嵌入特征及每个资源的第一资源嵌入特征。

首先，计算机设备可以获取到各个对象的对象标识(对象id)以及各个资源的资源标识(资源id)，计算机设备可以将各个对象的对象标识以及各个资源的资源标识映射到统一的哈希空间中，如可以通过特定的哈希算法对各个对象的对象标识以及各个资源的资源标识进行运算，即可将各个对象的对象标识以及各个资源的资源标识映射到统一的哈希空间中，一个对象的对象标识映射为该哈希空间中的一个哈希值，一个资源的资源标识也映射为该哈希空间中的一个哈希值。

计算机设备可以通过上述各个资源以及各个对象映射在哈希空间中的哈希值将上述转化异质图表示为关系矩阵，该关系矩阵中横向可以表示各个资源，竖向可以表示各个对象，若一个对象的对象节点与一个资源的资源节点在转化异质图中具有连边，则该关系矩阵中该对象与该资源对应位置处的元素值就为1，否则(即不具有连边)，该关系矩阵中该对象与该资源对应位置处的元素值就为0。例如，若关系矩阵中第1行表示对象1，第1列表示资源1，若对象1具有对资源1的转化行为，则关系矩阵中第1行第1列位置处的元素值就为1，否则，若对象1不具有对资源1的转化行为，则关系矩阵中第1行第1列位置处的元素值就为0。换句话说，该关系矩阵用于指示转化异质图中各个资源节点与对象节点之间的连边关系。

其中，上述关系矩阵的矩阵空间即为上述将对象标识及资源标识映射至的哈希空间，该关系矩阵中的横向位置可以包含资源标识可以映射为的一个个哈希值对应的位置，该关系矩阵中的纵向位置可以包含对象标识可以映射为的一个个哈希值。该关系矩阵中还可以包含上述N个对象和M个资源未映射到的位置，即该关系矩阵中可以存在若干的元素值为0，关系矩阵中所存在的元素值为0的位置可以支持在后续继续映射新的对象和新的资源。因此，可以理解的是，通过将对象的对象标识和资源的资源标识都映射到统一的哈希空间中，可以使得后续即使出现预测网络训练时未出现但预测网络应用时新出现的对象以及资源，预测网络也可以识别出将该新出现的对象以及资源映射到哈希空间中的对应位置，即使得预测网络对于未接触过的新出现的对象和资源也可以进行识别和预测，可以提升预测网络的针对对象及资源的预测范围以及预测准确性。

其中，可以将转化异质图表示为的关系矩阵记为R，计算机设备还可以获取到该关系矩阵R的邻接矩阵，可以将该邻接矩阵表示为A，如下述公式(1)所示，该邻接矩阵A为：

其中，R^T表示关系矩阵R的转置。

其中，可以理解的是，转化异质图本身的结构就是邻接矩阵A的结构，邻接矩阵A是一个对称矩阵，本申请中可以将转化异质图表示为邻接矩阵A，邻接矩阵A也记录了转化异质图所包含的各个对象针对各个资源的转化行为，进而使得在预测网络中通过该邻接矩阵可以进行更简便的运算。

计算机设备可以将上述邻接矩阵A输入预测网络。

调用预测网络根据邻接矩阵A生成各个对象的嵌入特征以及各个资源的嵌入特征的过程可以是：

预测网络可以包括NGCF(一种图神经网络)，该NGCF可以很好地对异质图中各个节点之间的信息进行传播，因此，本申请可以通过调用预测网络中的NGCF来生成对象的第一对象嵌入特征及资源的第一资源嵌入特征，该过程可以包括：计算机设备可以调用NGCF获取到特征传播矩阵，该特征传播矩阵用于对转化异质图中各个节点(包括资源节点和对象节点)对应的特征(包括资源特征和对象特征)之间的信息进行相互传播，进而可以生成N个对象和M个资源对应的嵌入特征矩阵，如下述公式(2)～公式(4)所示：
E^(k+1)＝σ((I+L)E^(k)W₁+(LE^(k))⊙E^(k)W₂) (2)
L＝D¹/₂AD¹/₂ (3)

其中，此处NGCF可以具有4层(还可以是其他层数)用于进行特征学习和生成的网络层，根据公式(2)，k的取值可以是0～3，第1层进行特征学习和生成的网络层可以根据E⁽⁰⁾生成特征矩阵E⁽¹⁾，第2层进行特征学习和生成的网络层可以根据E⁽¹⁾生成特征矩阵E⁽²⁾，第3层进行特征学习和生成的网络层可以根据E⁽²⁾生成特征矩阵E⁽³⁾，第4层进行特征学习和生成的网络层可以根据E⁽³⁾生成特征矩阵E⁽⁴⁾。

σ表示激活函数，L就表示上述特征传播矩阵，L属于图拉普拉斯矩阵，用于进行节点间信息的传播，D表示度的矩阵，D中记录了转化异质图中每个节点(包括对象节点和资源节点)的度，一个节点的度就等于与该节点具有连边的其他节点的数量。I表示单位矩阵，W₁和W₂均属于NGCF中的参数矩阵(也是用于进行节点间信息传播)，在对预测网络进行不断训练过程中，该W₁和W₂也会进行不断更新修正。

进而通过上述公式(2)和公式(3)就可以获取到E⁽¹⁾～E⁽⁴⁾，可以将获取到的E⁽¹⁾～E⁽⁴⁾均作为嵌入特征矩阵，公式(4)中的||表示拼接，即通过对多个嵌入特征矩阵(包括E⁽⁰⁾～E⁽⁴⁾)进行拼接即可获取到拼接后的嵌入特征矩阵

其中，E⁽⁰⁾～E⁽⁴⁾均为嵌入特征矩阵，任一个嵌入特征矩阵均包含转化异质图中各个节点分别对应的嵌入特征(可以是特征向量)。其中，对于预测网络的初次训练(即第1次训练)，E⁽⁰⁾属于初始化的嵌入特征矩阵，该初始化的嵌入特征矩阵中包含各个对象分别对应的初始化的嵌入特征以及各个资源分别对应的初始化的嵌入特征，各个对象分别对应的初始化的嵌入特征以及各个资源分别对应的初始化的嵌入特征可以是进行随机初始化得到的。此外，由于预测网络是可以不断进行迭代训练的，每一次迭代训练过程中，预测网络均可以生成E⁽¹⁾～E⁽⁴⁾，因此，在预测网络的迭代训练过程中，对于预测网络的非初次训练(即不是第1次训练)，后一次迭代训练过程中的E⁽⁰⁾可以是前一次迭代训练过程中的E⁽⁴⁾。

若E⁽⁰⁾～E⁽⁴⁾中每个嵌入特征(转化异质图中一个节点在一个嵌入特征矩阵中对应一个嵌入特征)都是16维(还可以是其他维度)的，那么拼接后的嵌入特征矩阵中每个嵌入特征就为16*5共80维的，因此，可以对拼接后的嵌入特征矩阵进行特征降维(即进行特征映射处理，可以在多层感知机(Multilayer Perceptron，MLP)通过映射矩阵来映射，该映射矩阵也可以是训练得到的)，得到目标嵌入特征矩阵，该目标嵌入特征矩阵就是对拼接后的嵌入特征矩阵进行特征降维后得到。该目标嵌入特征矩阵中就包括各个对象的嵌入特征以及各个资源的嵌入特征，目标嵌入特征矩阵中所包含的各个嵌入特征也可以是16维的。

进而，计算机设备就可以从目标嵌入特征矩阵中提取得到各个对象的嵌入特征，作为各个对象的第一对象嵌入特征，一个对象具有一个第一对象嵌入特征，计算机网络还可以从目标嵌入特征矩阵中提取得到各个资源的嵌入特征，作为各个资源的第一资源嵌入特征，一个资源具有一个第一资源嵌入特征。

其中，上述各个对象的第一对象嵌入特征和各个资源的第一资源嵌入特征就是预测网络通过转化异质图所生成的各个对象的嵌入特征和各个资源的嵌入特征，在对预测网络进行迭代训练过程中，对预测网络进行每一次训练(可以理解为每一轮训练)都可以生成该次训练过程中各个对象的第一对象嵌入特征和各个资源的第一资源嵌入特征。

步骤S202，调用预测网络基于每个对象的对象同质图分别生成每个对象的第二对象嵌入特征。

预测网络还可以包含归纳学习网络、或称为图注意力网络(Graph Attention Network,GAT)，该GAT具有良好的归纳学习能力，因此，计算机网络可以通过调用预测网络中的GAT根据每个对象的对象同质图来生成每个对象的嵌入特征(可以称之为第二对象嵌入特征)。

由于通过GAT生成每个对象的第二对象嵌入特征的过程均相同，因此，下述以通过GAT生成目标对象的第二对象嵌入特征为例进行说明，其中，目标对象可以是N个对象中的任意一个对象，请参见下述内容描述。

目标对象的对象同质图中任两个对象特征节点之间均具有连边(即对象同质图是完全连接图)。

计算机设备可以将目标对象的对象同质图表示为对应的邻接矩阵(获取目标对象的对象同质图的邻接矩阵的过程与上述获取转化异质图的邻接矩阵的过程相同)，可以将目标对象的对象同质图的邻接矩阵表示为A_D，进而计算机设备可以将邻接矩阵A_D输入预测网络。

更多的，计算机设备还可以将每个对象的对象标签特征(可以表示为向量)输入预测网络。

其中，每个对象的对象标签特征可以是分别通过每个对象在每个维度的对象特征上具体的对象特征(通过在各个维度的对象特征上的特征值体现)得到。例如，一个对象具有3个维度上的对象特征，该3个维度中的任一个维度的特征空间都为1000(即一个维度上的对象特征有1000种取值，即1000个特征值)，则该对象的对象标签特征就可以是由该对象分别在该3个维度上的对象特征中的特征值构成。

举个例子，若一个对象具有3个维度的对象特征，该3个维度的对象特征分别对应是对象年龄的特征、对象所在城市的特征以及对象工作的特征，其中，该3个维度的对象特征的特征空间都可以是1000的大小，即对象年龄的特征可以具有1000种可以选取的特征值，该1000种可以选取的特征值可以包括0岁到999岁分别对应的映射值(可以理解为用于表示某个年龄的标识，一个年龄可以对应一个映射值)；对象所在城市的特征也可以具有1000种可以选取的特征值，该1000种可以选取的特征值可以包括1000个城市分别对应的映射值(可以理解为用于表示某个城市的标识，一个城市可以对应一个映射值)；同理，对象工作的特征也可以具有1000种可以选取的特征值，该1000种可以选取的特征值可以包括1000种工作分别对应的映射值(可以理解为用于表示某个工作的标识，一个工作可以对应一个映射值)。因此，若某个对象(如对象1)的年龄是20岁，20岁对应的映射值是0.3，对象1所在城市是重庆，重庆对应的映射值是0.5，对象1的工作是自由工作，自由工作对应的映射值是0.2，则该对象1的对象标签特征就可以为(0.3，0.5，0.2)。

每种维度上的每种特征值(即映射值)可以是通过将对应的对象特征映射到统一的哈希空间中得到，一个维度的对象特征可以对应具有一个哈希空间，通过将各个维度上的若干种对象特征都映射到对应的哈希空间中，可以保证各个维度上的各种对象特征(一个特征值可以对应表示一种对象特征)都是可控的，并且对于新出现的对象特征(如训练时未用到，但实际预测时用到的某个维度上的某种特征值所指示的对象特征)也能保证在预先设定的特征空间(即哈希空间)中，即使得预测网络可以识别出在各个维度的哈希空间中的所有对象特征。

例如，对于对象年龄的特征，可以通过特定的哈希算法(算法的具体表达可以根据实际应用场景确定)将对象年龄所能够选取的各个年龄都映射到一个哈希空间中，例如，对象年龄所能够选取的各个年龄包括0到999岁，则可以对0到999共1000个年龄进行哈希运算，得到各个年龄分别对应的映射值(属于哈希值)，该各个年龄分别对应的映射值就为对象年龄的特征维度上可以选取的各个特征值。

因此，生成目标对象的第二对象嵌入特征的过程可以是：计算机设备可以调用GAT对目标对象的对象同质图中的连边进行删除处理，得到目标对象的对象同质图的激活子图，可以将目标对象的对象同质图的激活子图称之为第一激活子图，该第一激活子图是对目标对象的对象同质图中关联不大的对象特征节点之间的连边进行去除后所得到的，该第一激活子图是不完全连接的图，该第一激活子图可以表示为对目标对象的对象同质图中的连边进行删除后所得到的关系矩阵，进而可以得到第一激活子图的邻接矩阵，此处获取第一激活子图的邻接矩阵的过程与上述获取转化异质图的邻接矩阵的过程相同。如下述公式(5)～公式(7)所示，该过程可以是：

其中，M_i，j表示目标对象的对象同质图中第i个对象特征节点和第j个对象特征节点之间的相关度(可以理解为是相似性)，第i个对象特征节点和第j个对象特征节点可以是目标对象的对象同质图中任意两个对象特征节点。

为目标对象的对象同质图中各个对象特征节点的特征矩阵，中包含各个对象特征节点分别对应的嵌入特征，表示中第i个对象特征节点对应的嵌入特征，表示中第j个对象特征节点对应的嵌入特征，表示与之间的余弦距离。

其中，就表示第一激活子图的邻接矩阵，∈表示要保留目标对象的对象同质图中的多少连边(也用于指示要删除目标对象的对象同质图中的多少连边)，例如，若∈为30(还可以是其他值，具体根据实际应用场景确定)，则可以对目标对象的对象同质图中各个对象特征节点之间的相关度进行排序，保留相关度排序在前30％的对象特征节点之间的连边，即删除相关度排序在后70％的对象特征节点之间的连边，任意两个对象特征节点之间具有一个相关度，即任一条连边对应一个相关度。

例如，若∈为30，目标对象的对象同质图中对象特征节点1与对象特征节点2之间的相关度排序在所有对象特征节点之间的相关度的前30％，则可以保留目标对象的对象同质图中对象特征节点1与对象特征节点2之间的连边，否则，即若目标对象的对象同质图中对象特征节点1与对象特征节点2之间的相关度排序在所有对象特征节点之间的相关度的后70％，则可以删除目标对象的对象同质图中对象特征节点1与对象特征节点2之间的连边。可以理解的是，第一激活子图中就包含目标对象的对象同质图中相关度排序在前30％的对象特征节点之间的连边。

因此，就表示目标对象的对象同质图中相关度排序在前∈％的对象特征节点之间的连边，即第一激活子图中就包含目标对象的对象同质图中相关度排序在前∈％的对象特征节点之间的连边。上述公式(5)就表示在第一激活子图的邻接矩阵中只有相关度排序在前∈％的对象特征节点之间具有连接关系(即表明在第一激活子图中具有连边)，反之，相关度排序不在前∈％的对象特征节点之间就不具有连接关系。

更多的，可以理解的是，在对预测网络进行初次训练(即第1次训练)时，H表示初始化的特征矩阵，H中包含目标对象的每个维度上的对象特征分别对应的初始化的嵌入特征，即H包含目标对象的对象同质图中每个对象特征节点分别对应的初始化的嵌入特征，一个维度的对象特征对应一个初始化的嵌入特征，即一个对象特征节点对应一个初始化的嵌入特征，H中各个对象特征节点分别对应的初始化的嵌入特征可以是进行随机初始化得到。

其中，计算机设备可以通过目标对象的对象标签特征来获取到各个对象特征节点分别对应的初始化的嵌入特征，其中可以理解的是，可以预先建立目标对象在各个维度的对象特征上的特征值(即上述映射值)分别与对应的初始化的嵌入特征之间的关联关系，一个特征值对应一个初始化的嵌入特征。由于一个维度的对象特征对应一个对象特征节点，一个维度的对象特征也对应一个初始化的嵌入特征，因此，一个对象特征节点对应一个初始化的嵌入特征，这个初始化的嵌入特征就是这个对象特征节点所指示维度的对象特征对应的初始化的嵌入特征。

因此，计算机设备可以通过目标对象的对象标签特征所包含的各个维度的对象特征分别对应的特征值来获取具有关联关系的初始化的嵌入特征，作为目标对象的每个对象特征节点分别对应的初始化的嵌入特征。

此外，由于预测网络是可以不断进行迭代训练的，每一次迭代训练过程中，预测网络均可以通过公式(7)的逻辑生成即也在每次训练过程中不断在更新，因此，在预测网络的迭代训练过程中，对于预测网络的非初次训练(即不是第1次训练)，后一次迭代训练过程中带入公式(7)的H可以是前一次迭代训练过程中的公式(7)中的W₃属于GAT的参数矩阵，b₃是偏置向量，在预测网络的训练过程中，W₃和b₃也会不断进行更新，即W₃和b₃也属于预测网络的网络参数。

其中可以理解的是，在对预测网络的每次迭代过程中，都可以在目标对象的对象同质图的基础上去掉不同的连边，得到不同的第一激活子图，可以理解的是，预测网络的后一次迭代训练过程是在前一次迭代训练的结果上进行训练的。

更多的，计算机设备可以基于上述第一激活子图的邻接矩阵来生成目标对象的第二对象嵌入特征，该过程如下公式(8)～公式(10)所示：

其中，N_i表示第i个对象特征节点的邻居节点的集合，第i个对象特征节点的邻居节点的集合可以通过上述第一激活子图的邻接矩阵得到，第i个对象特征节点的邻居节点是指在第一激活子图中与第i个对象特征节点具有连边的对象特征节点，u属于N_i，即u属于第i个对象特征节点的邻居节点。

通过上述公式(8)～公式(10)可以对第一激活子图中目标对象在各个对象特征节点所指示维度上的对象特征进行特征传播，进而生成各个对象特征节点的分别对应的节点特征，此处具体描述了生成第i个对象特征节点的节点特征

其中，GAT中可以有M个特征生成网络层，m的取值范围可以是0～M-2，表示M个特征生成网络层中第m个特征生成网络层所生成的第i个对象特征节点的嵌入特征，表示M个特征生成网络层中第m个特征生成网络层的下一个特征生成网络层所生成的第i个对象特征节点的嵌入特征，每个特征生成网络层均可以生成第i个对象特征节点的K个嵌入特征，k的取值范围为1～K，如在第m层可以生成K个σ表示激活函数，公式(8)中的||表示拼接，W^(m)表示第m个特征生成网络层的参数矩阵，α_iu表示第i个对象特征节点与第u个对象特征节点之间归一化的连边权重。

对于公式(9)，exp表示指数函数，LeakyRelu和α均表示激活函数(两种激活函数可以不同)，W表示预测网络的参数矩阵，属于网络参数(即模型参数)，训练过程不断更新，||表示拼接。表示M个特征生成网络层中第m个特征生成网络层所生成的第u个对象特征节点的嵌入特征，表示M个特征生成网络层中第m个特征生成网络层所生成的第v个对象特征节点的嵌入特征，v也属于N_i，即v也属于第i个对象特征节点的邻居节点，v可以是u，也可以不是u。

其中，通过公式(8)～公式(9)可以获取到上述M个特征生成网络层的前M-1个特征生成网络层(即当m小于等于M-2时)所生成的第i个对象特征节点的嵌入特征，即M个特征生成网络层中的前M-1个特征生成网络层的处理逻辑可以是公式(8)～公式(9)的逻辑。M个特征生成网络层中最后一层(即第M个特征生成网络层)的处理逻辑可以与前M-1个特征生成网络层不同，第M个特征生成网络层的处理逻辑可以是公式(10)的处理逻辑，通过第M个特征生成网络层就可以输出第i个对象特征节点最终的嵌入特征作为第i个对象特征节点的节点特征

对于公式(10)，W^(M)表示第M个特征生成网络层的参数矩阵，属于网络参数，需要不断更新，就表示第M-1个特征生成网络层(即当m等于M-2)所生成的第i个对象特征节点的嵌入特征。

通过上述与获取第i个对象特征节点的节点特征同样的过程，计算机设备就可以生成目标对象的对象同质图中每个对象特征节点(即第一激活子图中每个对象特征节点，第一激活子图与目标对象的对象同质图所包含的对象特征节点相同，只是连边不同)分别对应的节点特征，每个节点特征的维度相同，如都是维度为16的特征向量。

进而，计算机设备就可以将目标对象的每个对象特征节点分别对应的节点特征进行求和，即可得到目标对象的第二对象嵌入特征。其中，对每个对象特征节点分别对应的节点特征进行求和可以是对每个对象特征节点分别对应的节点特征中相同位置处的元素值进行求和，因此，所得到的目标对象的第二对象嵌入特征与各个节点特征的维度是相同的。

举个例子，若目标对象的各个对象特征节点的节点特征包括节点特征(0.1,0.2,0.3)和节点特征(0.2,0.4,0.6)，则对该节点特征(0.1,0.2,0.3)和节点特征(0.2,0.4,0.6)进行求和的结果可以是(0.3,0.6,0.9)，即目标对象的第二对象嵌入特征就为(0.3,0.6,0.9)。

进而，计算机设备就可以以生成目标对象的第二对象嵌入特征同样的方式生成每个对象分别对应的第二对象嵌入特征。

步骤S203，调用预测网络基于每个资源的资源同质图分别生成每个资源的第二资源嵌入特征。

生成每个资源的第二资源嵌入特征的过程均与上述生成目标对象的第二对象嵌入特征的过程相同，此过程中需要将上述目标对象的对象同质图替换为资源的资源同质图，将对象特征节点替换为资源特征节点。因此，生成各个资源的第二资源嵌入特征的具体过程可以参见上述S202中的具体描述。

且需要强调的是，在生成各个资源的第二资源嵌入特征之前，计算机设备也需要将各个资源的资源标签特征输入预测网络，每个资源的资源标签特征也可以是分别通过每个资源所具有的标签特征得到。每个资源的资源标签特征的维度可以是不同的，一个资源具有哪些维度上的标签特征，则该资源的资源标签特征就可以具有这些维度的标签特征对应的特征值。本申请中，一种标签特征就可以对应是一个维度的资源特征，因此，一个维度的资源特征就可以只具有一个特征值。

例如，一个资源具有3个维度上的标签特征，则该资源的资源标签特征就可以是由该3个维度上的标签特征对应的特征值构成。

举个例子，若某个资源(如资源1)是动漫，资源1具有3个维度的标签特征，该3个维度的标签特征分别是国风的特征、魔幻的特征以及人物特写的特征，国风的特征对应的特征值是0.1，魔幻的特征对应的特征值是0.2，人物特写的特征对应的特征值是0.6，则该资源1的资源标签特征就可以为(0.1，0.2，0.6)。再举个例子，若某个资源(如资源2)是商品的广告，资源2具有4个维度的标签特征，该4个维度的标签特征分别是家用的特征、电器的特征、节能的特征以及便携的特征，该家用的特征对应的特征值是0.11，电器的特征对应的特征值是0.22，节能的特征对应的特征值是0.33，便携的特征对应的特征值是0.44，则该资源2的资源标签特征就可以为(0.11，0.22，0.33，0.44)。

同理，每种维度上的每种特征值(即映射值)可以是通过将对应的标签特征映射到统一的哈希空间中得到，所有维度的标签特征可以具有一个统一的哈希空间(此哈希空间与上述对象特征的哈希空间不同)，通过将各个维度的标签特征都映射到统一的哈希空间中，可以保证各个维度上的各种标签特征(即资源特征，一种标签特征可以对应表示一个维度的资源特征)都是可控的，并且对于新出现的资源特征(如训练时未用到，但实际预测时用到的某个维度上的标签特征)也能保证在预先设定的特征空间(即哈希空间)中，即使得预测网络可以识别出在各个维度的资源特征对应哈希空间中的所有资源特征。

例如，对于资源某种特定风格的特征，可以通过特定的哈希算法(算法的具体表达可以根据实际应用场景确定)将资源的该种特定风格的特征映射到哈希空间中。例如，资源的该种特定风格的特征可以具有特征标识(id)，则可以对该特征标识进行哈希运算，即可得到该种特定风格的特征对应的特征值。

同理，计算机设备可以通过各个资源的资源标签特征所包含的特征值来获取资源的各个资源特征节点分别对应的初始化的嵌入特征。

例如，M个资源中的任意一个可以表示为目标资源，计算机设备可以调用GAT对目标资源的资源同质图进行连边删除处理，得到目标资源的资源同质图的激活子图，可以将目标资源的资源同质图的激活子图称之为是第二激活子图。其中，获取第二激活子图的方式与上述获取第一激活子图的方式相同。

进而，计算机设备可以根据该第二激活子图对目标资源在多个维度上的资源特征进行特征传播处理，得到第二激活子图中目标资源的每个资源特征节点(即资源同质图中每个资源特征节点，目标资源的资源同质图中的资源特征节点与目标资源的第二激活子图中的资源特征节点相同，只是资源特征节点之间的连边不同)分别对应的节点特征，其中，获取目标资源的各个资源特征节点分别对应的节点特征的过程与上述获取目标对象的各个对象特征节点分别对应的节点特征的过程相同。

因此，计算机设备就可以通过目标资源的各个资源特征节点分别对应的节点特征生成目标资源的第二资源嵌入特征。其中，根据目标资源的各个资源特征节点分别对应的节点特征生成目标资源的第二资源嵌入特征的过程，与上述根据目标对象的各个对象特征节点分别对应的节点特征生成目标对象的第二对象嵌入特征的过程相同。

通过上述与生成目标资源的第二资源嵌入特征相同的过程，计算机设备可以生成每个资源的第二资源嵌入特征，一个资源对应一个第二资源嵌入特征。

步骤S204，根据每个对象的第一对象嵌入特征、每个对象的第二对象嵌入特征、每个资源的第一资源嵌入特征及每个资源的第二资源嵌入特征训练预测网络，得到训练好的预测网络。

计算机设备可以通过上述每个对象的第一对象嵌入特征、每个对象的第二对象嵌入特征、每个资源的第一资源嵌入特征及每个资源的第二资源嵌入特征生成针对预测网络的预测损失值，该预测损失值表征了预测网络针对对象以及资源的预测偏差，该预测损失值越大，预测网络的预测偏差就越大，反之，该预测损失值越小，预测网络的预测偏差就越小。

因此，计算机设备可以通过该预测损失值来修正预测网络的网络参数(即模型参数)，如可以通过调整预测网络的网络参数，使得该预测损失值达到最小值。

其中，可以对预测网络进行不断迭代训练，每次训练均会有对应的预测损失值，通过每个迭代训练过程中所产生的预测损失值不断更新修正预测网络的网络参数，可以将最终训练完成的预测网络(如网络参数训练至收敛状态或者训练次数达到某个次数阈值)作为训练好的预测网络。

请参见图8，图8是本申请提供的一种网络训练的场景示意图。如图8所示，计算机设备可以调用预测网络通过转化异质图生成每个对象的第一对象嵌入特征以及每个资源的第一资源嵌入特征，计算机设备还可以调用预测网络通过每个对象的对象同质图生成每个对象的第二对象嵌入特征，计算机设备还可以调用预测网络通过每个资源的资源同质图生成每个资源的第二资源嵌入特征。

进而，计算机设备可以通过所生成的各个对象的第一对象嵌入特征、各个对象的第二对象嵌入特征、各个资源的第一资源嵌入特征以及各个资源的第二资源嵌入特征，生成预测网络的预测损失函数(即上述预测损失值)，进而，通过该预测损失函数修正预测网络的网络参数，即可得到训练好的预测网络。

本申请通过自监督的方式让通过同质图(如资源同质图和对象同质图)得到的嵌入特征(如第二资源嵌入特征和第二对象嵌入特征)与通过转化异质图得到的嵌入特征(如第一资源嵌入特征和第一对象嵌入特征)进行对齐，以期同质图能有效泛化到异质二部图(即转化异质图)并在冷启动场景替代二部图，能够解决传统二部图方法的冷启动问题(如在二部图中新增的节点可能存在的孤立的问题)，使得预测网络可以对异质二部图中各个节点(包括对象节点和资源节点)对应的节点特征都可以进行有效学习，后续也能对对象针对资源的转化指数进行准确预测。

请参见图9，图9是本申请提供的一种损失生成方法的流程示意图。本申请实施例主要描述了如何生成预测网络的预测损失值，本申请实施例中的执行主体可以与上述图3对应实施例中的执行主体相同，如图9所示，该方法包括：

步骤S301，根据每个对象的第一对象嵌入特征、每个对象的第二对象嵌入特征、每个资源的第一资源嵌入特征及每个资源的第二资源嵌入特征，生成预测网络的特征泛化损失值；特征泛化损失值用于指示每个对象的第一对象嵌入特征和第二对象嵌入特征之间的特征差异，并用于指示每个资源的第一资源嵌入特征和第二资源嵌入特征之间的特征差异。

计算机设备将同质图的特征空间泛化到转化异质图的特征空间，具体的，计算机设备可以将通过同质图所得到的嵌入特征(包括每个对象的第二对象嵌入特征和每个资源的第二资源嵌入特征)与通过转化异质图所得到的嵌入特征(包括每个对象的第一对象嵌入特征和每个资源的第一对象嵌入特征)进行对齐(即使得两者相似)，进而生成预测网络的特征泛化损失值，该特征泛化损失值就用于表征每个对象的第一对象嵌入特征和第二对象嵌入特征之间的特征差异，以及用于表征每个资源的第一资源嵌入特征与第二资源嵌入特征之间的特征差异。

如，特征泛化损失值越大，表征每个对象的第一对象嵌入特征和第二对象嵌入特征之间的特征差异及每个资源的第一资源嵌入特征与第二资源嵌入特征之间的特征差异越大(即越不相似)，反之，特征泛化损失值越小，表征每个对象的第一对象嵌入特征和第二对象嵌入特征之间的特征差异及每个资源的第一资源嵌入特征与第二资源嵌入特征之间的特征差异越小(即越相似)。

可以将特征泛化损失值记为L_s，如下述公式(11)所示，该特征泛化损失值L_s为：
L_s＝Σ_{a∈[1，N]，b∈[1，M]}(||e_a-e′_a||₁+||e_b-e′_b||₁) (11)

其中，a表示N个对象中第a个对象，a的取值范围即为1～N，同理，b表示M个资源中第b个资源，b的取值范围即为1～M。其中，e_a表示第a个对象的第一对象嵌入特征，e′_a表示第a个对象的第二对象嵌入特征，e_b表示第b个资源的第一资源嵌入特征，e′_b表示第b个资源的第二资源嵌入特征。

其中，e_a-e′_a就表示第a个对象的第一对象嵌入特征与第二对象嵌入特征之间的特征差异，可以将Σ_a∈[1，N](||e_a-e′_a||₁)称之为是第一泛化损失值，表征对象的第一对象嵌入特征和第二对象嵌入特征之间的泛化损失值；e_b-e′_b就表示第b个资源的第一资源嵌入特征与第二资源嵌入特征之间的特征差异，可以将Σ_b∈[1，M](||e_b-e′_b||₁)称之为是第二泛化损失值，表征资源的第一资源嵌入特征和第二资源嵌入特征之间的泛化损失值；特征泛化损失值L_s就为第一泛化损失值和第二泛化损失值之和。||...||₁表示1范数。

步骤S302，根据每个对象的第一对象嵌入特征和每个资源的第一资源嵌入特征，生成预测网络的第一转化预测损失值。

计算机设备可以根据每个对象的第一对象嵌入特征和每个资源的第一资源嵌入特征，生成预测网络的第一转化预测损失值，该第一转化预测损失值表征了预测网络通过转化异质图来预测对象针对资源的转化指数的预测损失。

首先，可以将预测网络在训练过程中根据转化异质图所预测得到的第a个对象针对第b个资源的转化指数记为可以将该转化指数称之为是第a个对象针对第b个资源的第一预测转化指数，如下述公式(12)所示，第a个对象针对第b个资源的第一预测转化指数为：

其中，sigmoid表示激活函数(一种S型函数)，W₄表示预测网络的参数矩阵，属于网络参数，训练过程中会不断更新，b₄为偏置向量，e_a表示第a个对象的第一对象嵌入特征，e_b表示第b个资源的第一资源嵌入特征，||表示拼接。

因此，可以将第一转化预测损失值记为L_z1，如下述公式(13)所示，该第一转化预测损失值L_z1为：

其中，Y_a，b表示第a个对象与第b个资源之间真实的转化标签(训练预测网络时可以输入，也可以通过转化异质图得到)，该转化标签指示了第a个对象实际是否对第b个资源具有转化行为。表示上述通过转化异质图所预测得到的第a个对象针对第b个资源的转化指数。

步骤S303，根据每个对象的第二对象嵌入特征和每个资源的第二资源嵌入特征，生成预测网络的第二转化预测损失值。

同理，计算机设备可以根据每个对象的第二对象嵌入特征和每个资源的第二资源嵌入特征，生成预测网络的第二转化预测损失值，该第二转化预测损失值表征了预测网络通过同质图(包括对象同质图和资源同质图)来预测对象针对资源的转化指数的预测损失。

首先，可以将预测网络在训练过程中根据同质图所预测得到的第a个对象针对第b个资源的转化指数记为可以将该转化指数称之为是第a个对象针对第b个资源的第二预测转化指数，如下述公式(14)所示，第a个对象针对第b个资源的第二预测转化指数为：

其中，sigmoid表示激活函数(一种S型函数)，W₅表示预测网络的参数矩阵(通常与上述W₄不同)，属于网络参数，训练过程中会不断更新，b₅为偏置向量(通常与上述b₄不同)，e′_a表示第a个对象的第二对象嵌入特征，e′_b表示第b个资源的第二资源嵌入特征，||表示拼接。

因此，可以将第二转化预测损失值记为L_z2，如下述公式(15)所示，该第二转化预测损失值L_z2为：

其中，Y_a，b表示上述第a个对象与第b个资源之间真实的转化标签，该转化标签指示了第a个对象实际是否对第b个资源具有转化行为。表示上述根据同质图所预测得到的第a个对象针对第b个资源的转化指数。

其中，可以理解的是，在对预测网络训练完成，得到训练好的预测网络后(训练好的预测网络包括更新完成后的W₄和更新完成后的b₄)，也可以通过上述公式(14)所示的原理来生成上述预测对象针对预测资源的转化指数，该过程需要将第a个对象的第二对象嵌入特征替换为训练好的预测网络所生成的预测对象的第二对象嵌入特征，还需要将第b个资源的第二资源嵌入特征替换为训练好的预测网络所生成的预测资源的第二资源嵌入特征。

步骤S304，根据每个对象的第一对象嵌入特征、每个对象的第二对象嵌入特征、每个资源的第一资源嵌入特征及每个资源的第二资源嵌入特征，生成预测网络的正则损失值。

计算机设备还可以根据每个对象的第一对象嵌入特征、每个对象的第二对象嵌入特征、每个资源的第一资源嵌入特征及每个资源的第二资源嵌入特征，生成预测网络的正则损失值。该正则损失值是用于确保通过转化异质图和同质图学习到的特征空间(如上述第一对象嵌入特征、第二对象嵌入特征、第一资源嵌入特征及第二资源嵌入特征所在的特征空间)在单位球表面，避免预测网络过拟合。

可以将正则损失值记为L_R，如下述公式(16)所示，该正则损失值L_R为：

其中，λ₁、λ₂、λ₃和λ₄均为超参数，可以预先定义，||...||₂表示二范数。

步骤S305，根据特征泛化损失值、第一转化预测损失值、第二转化预测损失值和正则损失值确定预测损失值。

计算机设备可以通过上述所获取到的特征泛化损失值、第一转化预测损失值、第二转化预测损失值以及正则损失值生成(如加权求和)预测网络最终的预测损失值。

其中，可以将预测损失值记为L，如下述公式(17)所示，该预测损失值记为L为：
L＝L_z2+αL_s+βL_z1+L_R (17)

其中，L_z2即为上述所生成的第二转化预测损失值，L_s即为上述特征泛化损失值，L_z1即为上述第一转化预测损失值，L_R即为上述正则损失值。α为预先定义好的超参数，用于控制L_s的损失权重；β也为预先定义好的超参数，用于控制L_z1的损失权重。上述L、L_z2、L_s、L_z1和L_R均属于损失函数。

其中，本申请在获取到训练好的预测网络之后，也可以基于训练好的预测网络通过对象(如上述预测对象)和资源(如上述预测资源)的同质图来预测对象针对资源的转化指数，因此，如公式(17)所示，本申请是以第二转化预测损失值L_z2作为主要的损失值。

可以理解的是，本申请可以只在训练预测网络时使用对象和资源的转化异质图，在得到训练好的预测网络之后，就无需使用对象和资源的转化异质图，而是使用对象和资源的同质图，来预测对象针对资源的转化指数，如通过上述图7对应实施例中所描述的过程通过需要预测对象的对象同质图和需要预测资源的资源同质图，先生成需要预测的对象的第二对象嵌入特征以及需要预测的资源的第二资源嵌入特征，后续再通过该第二对象嵌入特征和该第二资源嵌入特征生成(如上述公式(14)所指示的方式)对象针对资源的转化指数。

请参见图10，图10是本申请提供的一种生成预测损失值的场景示意图。如图10所示，计算机设备可以通过各个对象的第一对象嵌入特征和第二对象嵌入特征、各个资源的第一资源嵌入特征和第二资源嵌入特征，生成特征泛化损失值；计算机设备还可以通过各个对象的第一对象嵌入特征、各个资源的第一资源嵌入特征，生成第一转化预测损失值；计算机设备还可以通过各个对象的第二对象嵌入特征、各个资源的第二资源嵌入特征，生成第二转化预测损失值；计算机设备还可以通过各个对象的第一对象嵌入特征和第二对象嵌入特征、各个资源的第一资源嵌入特征和第二资源嵌入特征，生成正则损失值。

进而，计算机设备即可通过上述特征泛化损失值、第一转化预测损失值、第二转化预测损失值以及正则损失值，生成预测网络的预测损失值。

采用本申请所提供的方法，通过结合多种损失值来最终确定预测网络的预测损失值，可以提升预测网络在各方面的训练效果，其间，可以通过上述特征泛化损失值L_s可以基于自监督的方式将同质图的特征空间泛化到转化异质图的特征空间。

请参见图11，图11是本申请提供的一种模型训练的场景示意图。如图11所示，本申请可以通过用户的多维特征标签(用于指示用户的多维特征，即多维对象特征)构建用户的同质图，并在预测网络中通过用户的同质图得到用户的激活子图(即上述第一激活子图)，进而通过该激活子图得到用户的嵌入特征(如上述第二对象嵌入特征)。

同理，本申请还可以通过广告(即资源)的多维特征标签(用于指示广告的多维广告特征，即多维资源特征)构建广告的同质图，并在预测网络中通过广告的同质图得到广告的激活子图(即上述第二激活子图)，进而通过该激活子图得到广告的嵌入特征(如上述第二资源嵌入特征)。

本申请可以构建用户与广告的转化异质图，进而还可以通过用户标识(即对象标识)以及广告标识(即资源标识)对该转化异质图中各个节点之间的信息进行传递(通过映射到对应的哈希空间中传递)，得到用户的嵌入特征(如上述第一对象嵌入特征)以及广告的嵌入特征(如上述第一资源嵌入特征)。

进而，预测网络可以通过用户的第一对象嵌入特征、用户的第二对象嵌入特征、广告的第一资源嵌入特征以及广告的第二资源嵌入特征可以进行自监督学习(可以通过上述特征泛化损失值体现)，还可以通过用户的第一对象嵌入特征、用户的第二对象嵌入特征、广告的第一资源嵌入特征以及广告的第二资源嵌入特征进行转化预测损失的学习(可以通过上述第一转化预测损失值以及第二转化预测损失值体现)，另外，还可以通过正则损失的学习(可以通过上述正则损失值体现)，即可学习得到训练好的预测网络。

在一种可行的实施方式中，本申请还可以应用在游戏推荐领域，上述N个对象可以是N个用户，M个资源可以是M个可以向用户进行推荐的游戏应用，对象针对资源的转化行为可以是用户已经注册游戏应用的行为。

因此，若一个用户在一个游戏应用中注册了用户账户，则该用户对该游戏应用就具有转化行为，该用户的节点(即对象节点)与该游戏应用的节点(即资源节点)在转化异质图中就具有连边，反之，若一个用户在一个游戏应用中未注册用户账户，则该用户对该游戏应用就不具有转化行为，该用户的节点与该游戏应用的节点在转化异质图中就不具有连边。

此外，本申请还可以获取到各个用户的同质图(即对象同质图)以及各个游戏应用的同质图(即资源同质图)，进而结合用户和游戏应用的转化异质图、用户的同质图以及游戏应用的同质图对预测网络进行训练，以得到训练好的预测网络，该训练好的预测网络就可以对任意用户针对任意游戏应用的转化指数进行准确的预测。

在此种游戏推荐的领域中，通过将用户和游戏应用的转化异质图结合上用户的同质图以及游戏应用的同质图，在考虑到用户对游戏应用的转化行为的第一条件的基础上，还充分考虑到了各个用户和各个游戏应用本身特征(通过同质图体现)的第二条件，使得在对预测网络进行训练的过程中，预测网络可以对基于该两种条件所学习到的特征进行相互迁移，以此可以训练得到非常准确的预测网络。

因此，采用本申请提供的方法也可以很好地解决在游戏推荐领域的用户冷启动问题，如当存在新用户时，该新用户对M个游戏应用中极大部分游戏应用或者全部游戏应用都不具有转化行为(若该新用户属于N个对象中的用户，则表现为该新用户的节点在转化异质图中属于比较孤立的节点)，通过训练得到的预测网络也可以准确预测得到该新用户对每个游戏应用的转化指数，进而通过该新用户对各个游戏应用的转化指数就可以向该新用户进行准确的游戏应用推荐。

更多的，本申请在进行离线实验时，可以采用过去某一日期的第-9～-3天的数据作为训练集，第-2天的数据作为验证集，第-1天的数据作为测试集。观察任取10个日期的训练结果，对多域自注意力模型的结果进行对比，实验结果如下述表1所示：

表1

上述自监督图下的指标是采用本申请所提供方法得到的指标，由上述表1可以看出，本申请相比多域的自注意力模型，对于Acc、AUC和AUCG的测试在极多数情况下均有较大提升。

请参见图12，图12是本申请提供的一种数据处理装置的结构示意图。该数据处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码)，例如该数据处理装置为一个应用软件，该数据处理装置可以用于执行本申请实施例提供的方法中的相应步骤。如图12所示，该数据处理装置1可以包括：第一获取模块11、第二获取模块12、第三获取模块13和训练模块14。

第一获取模块11，用于获取转化异质图；转化异质图包含N个对象节点和M个资源节点，每个对象节点各自表示一个对象，每个资源节点各自表示一个资源，N和M均为正整数；若N个对象中任一对象对M个资源中任一资源具有转化行为，则任一对象的对象节点与任一资源的资源节点在转化异质图中具有连边；

第二获取模块12，用于获取N个对象中每个对象分别对应的对象同质图；任一对象同质图包含多个对象特征节点，任一对象特征节点用于表示对应对象在一个维度上的对象特征；

第三获取模块13，用于获取M个资源中每个资源分别对应的资源同质图；任一资源同质图包含多个资源特征节点，任一资源特征节点用于表示对应资源在一个维度上的资源特征；

训练模块14，用于基于转化异质图、每个对象的对象同质图和每个资源的资源同质图训练预测网络，得到训练好的预测网络；训练好的预测网络用于预测对象针对资源的转化指数。

训练模块14基于转化异质图、每个对象的对象同质图和每个资源的资源同质图训练预测网络，得到训练好的预测网络的方式，包括：

调用预测网络基于转化异质图生成每个对象的第一对象嵌入特征及每个资源的第一资源嵌入特征；

调用预测网络基于每个对象的对象同质图分别生成每个对象的第二对象嵌入特征；

调用预测网络基于每个资源的资源同质图分别生成每个资源的第二资源嵌入特征；

根据每个对象的第一对象嵌入特征、每个对象的第二对象嵌入特征、每个资源的第一资源嵌入特征及每个资源的第二资源嵌入特征训练预测网络，得到训练好的预测网络。

训练模块14调用预测网络基于转化异质图生成每个对象的第一对象嵌入特征及每个资源的第一资源嵌入特征的方式，包括：

将转化异质图表示为关系矩阵；关系矩阵用于指示转化异质图中资源节点与对象节点之间的连边关系；

调用预测网络获取特征传播矩阵，并基于特征传播矩阵和关系矩阵对N个对象的对象特征和M个资源的资源特征进行相互传播，生成N个对象和M个资源对应的嵌入特征矩阵；

基于嵌入特征矩阵生成每个对象的第一对象嵌入特征和每个资源的第一资源嵌入特征。

嵌入特征矩阵有多个；训练模块14基于嵌入特征矩阵生成每个对象的第一对象嵌入特征和每个资源的第一资源嵌入特征的方式，包括：

对多个嵌入特征矩阵进行拼接，得到拼接后的嵌入特征矩阵；

对拼接后的嵌入特征矩阵进行特征映射处理，得到目标嵌入特征矩阵；

从目标嵌入特征矩阵中提取每个对象的第一对象嵌入特征和每个资源的第一资源嵌入特征。

N个对象中的任一个表示为目标对象，目标对象的对象同质图中任两个对象特征节点之间具有连边；

训练模块14调用预测网络基于每个对象的对象同质图分别生成每个对象的第二对象嵌入特征的方式，包括：

调用预测网络对目标对象的对象同质图中的连边进行删除处理，得到目标对象的对象同质图的第一激活子图；

基于第一激活子图对目标对象的在多个维度上的对象特征进行特征传播处理，得到第一激活子图中目标对象的每个对象特征节点分别对应的节点特征；

根据目标对象的每个对象特征节点分别对应的节点特征生成目标对象的第二对象嵌入特征。

M个资源中的任一个表示为目标资源，目标资源的资源同质图中任两个资源特征节点之间具有连边；

训练模块14调用预测网络基于每个资源的资源同质图分别生成每个资源的第二资源嵌入特征的方式，包括：

调用预测网络对目标资源的资源同质图中的连边进行删除处理，得到目标资源的资源同质图的第二激活子图；

基于第二激活子图对目标资源在多个维度上的资源特征进行特征传播处理，得到第二激活子图中目标资源的每个资源特征节点分别对应的节点特征；

根据目标资源的每个资源特征节点分别对应的节点特征生成目标资源的第二资源嵌入特征。

训练模块14根据每个对象的第一对象嵌入特征、每个对象的第二对象嵌入特征、每个资源的第一资源嵌入特征及每个资源的第二资源嵌入特征训练预测网络，得到训练好的预测网络的方式，包括：

根据每个对象的第一对象嵌入特征、每个对象的第二对象嵌入特征、每个资源的第一资源嵌入特征及每个资源的第二资源嵌入特征，生成预测网络的预测损失值；

基于预测损失值修正预测网络的网络参数，得到训练好的预测网络。

训练模块14根据每个对象的第一对象嵌入特征、每个对象的第二对象嵌入特征、每个资源的第一资源嵌入特征及每个资源的第二资源嵌入特征，生成预测网络的预测损失值的方式，包括：

根据每个对象的第一对象嵌入特征、每个对象的第二对象嵌入特征、每个资源的第一资源嵌入特征及每个资源的第二资源嵌入特征，生成预测网络的特征泛化损失值；特征泛化损失值用于指示每个对象的第一对象嵌入特征和第二对象嵌入特征之间的特征差异，并用于指示每个资源的第一资源嵌入特征和第二资源嵌入特征之间的特征差异；

根据每个对象的第一对象嵌入特征和每个资源的第一资源嵌入特征，生成预测网络的第一转化预测损失值；

根据每个对象的第二对象嵌入特征和每个资源的第二资源嵌入特征，生成预测网络的第二转化预测损失值；

根据每个对象的第一对象嵌入特征、每个对象的第二对象嵌入特征、每个资源的第一资源嵌入特征及每个资源的第二资源嵌入特征，生成预测网络的正则损失值；

根据特征泛化损失值、第一转化预测损失值、第二转化预测损失值和正则损失值确定预测损失值。

训练模块14根据每个对象的第一对象嵌入特征、每个对象的第二对象嵌入特征、每个资源的第一资源嵌入特征及每个资源的第二资源嵌入特征，生成预测网络的特征泛化损失值的方式，包括：

根据每个对象的第一对象嵌入特征和第二对象嵌入特征，生成针对对象嵌入特征的第一泛化损失值；

根据每个资源的第一资源嵌入特征和第二资源嵌入特征，生成针对资源嵌入特征的第二泛化损失值；

根据第一泛化损失值和第二泛化损失值生成特征泛化损失值。

训练模块14根据每个对象的第一对象嵌入特征和每个资源的第一资源嵌入特征，生成预测网络的第一转化预测损失值的方式，包括：

根据每个对象的第一对象嵌入特征和每个资源的第一资源嵌入特征，生成每个对象分别针对每个资源的第一预测转化指数；

根据每个对象分别针对每个资源的第一预测转化指数及每个对象分别针对每个资源的转化行为，生成第一转化预测损失值。

训练模块14根据每个对象的第二对象嵌入特征和每个资源的第二资源嵌入特征，生成预测网络的第二转化预测损失值的方式，包括：

根据每个对象的第二对象嵌入特征和每个资源的第二资源嵌入特征，生成每个对象分别针对每个资源的第二预测转化指数；

根据每个对象分别针对每个资源的第二预测转化指数及每个对象分别针对每个资源的转化行为，生成第二转化预测损失值。

上述装置1还用于：

获取预测对象和预测资源；

调用训练好的预测网络预测上述预测对象针对预测资源的转化指数；

若预测对象针对预测资源的转化指数大于或等于转化指数阈值，则将预测资源推送给预测对象。

根据本申请的一个实施例，图3所示的数据处理方法所涉及的步骤可由图12所示的数据处理装置1中的各个模块来执行。例如，图3中所示的步骤S101可由图12中的第一获取模块11来执行，图3中所示的步骤S102可由图12中的第二获取模块12来执行；图3中所示的步骤S103可由图12中的第三获取模块13来执行，图3中所示的步骤S104可由图12中的训练模块14来执行。

本申请可以获取转化异质图；转化异质图包含N个对象的对象节点和M个资源的资源节点，N和M均为正整数；若N个对象中任一对象对M个资源中任一资源具有转化行为，则任一对象的对象节点与任一资源的资源节点在转化异质图中具有连边；获取N个对象中每个对象分别对应的对象同质图；任一对象同质图包含多个对象特征节点，任一对象特征节点用于表示对应对象在一个维度上的对象特征；获取M个资源中每个资源分别对应的资源同质图；任一资源同质图包含多个资源特征节点，任一资源特征节点用于表示对应资源在一个维度上的资源特征；基于转化异质图、每个对象的对象同质图和每个资源的资源同质图训练预测网络，得到训练好的预测网络；训练好的预测网络用于预测对象针对资源的转化指数。由此可见，本申请提出的装置可以同时结合对象和资源的异质图、对象的同质图以及资源的同质图来训练预测网络，使得在训练预测网络时对于各个对象和各个资源(同时包括之间不具有访问行为的对象与资源及之间具有访问行为的对象与资源)的特征都能进行有效传播，因此可以提升训练得到的预测网络的准确性，通过训练得到的预测网络也可以实现对对象针对资源的转化指数的准确预测。

根据本申请的一个实施例，图12所示的数据处理装置1中的各个模块可以分别或全部合并为一个或若干个单元来构成，或者其中的某个(些)单元还可以再拆分为功能上更小的多个子单元，可以实现同样的操作，而不影响本申请的实施例的技术效果的实现。上述模块是基于逻辑功能划分的，在实际应用中，一个模块的功能也可以由多个单元来实现，或者多个模块的功能由一个单元实现。在本申请的其它实施例中，数据处理装置1也可以包括其它单元，在实际应用中，这些功能也可以由其它单元协助实现，并且可以由多个单元协作实现。

根据本申请的一个实施例，可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用计算机设备上运行能够执行如图3中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码)，来构造如图12中所示的数据处理装置1，以及来实现本申请实施例的数据处理方法。上述计算机程序可以记载于例如计算机可读存储介质上，并通过计算机可读存储介质装载于上述计算设备中，并在其中运行。

请参见图13，图13是本申请提供的一种计算机设备的结构示意图。如图13所示，计算机设备1000可以包括：处理器1001，网络接口1004和存储器1005，此外，计算机设备1000还可以包括：用户接口1003，和至少一个通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。其中，用户接口1003可以包括显示屏(Display)、键盘(Keyboard)，用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是非易失性存储器(non-transitory memory)，例如至少一个磁盘存储器。存储器1005还可以是至少一个位于远离前述处理器1001的存储装置。如图13所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。

在图13所示的计算机设备1000中，网络接口1004可提供网络通讯功能；而用户接口1003主要用于为用户提供输入的接口；而处理器1001可以用于调用存储器1005中存储的设备控制应用程序，以实现：

应当理解，本申请实施例中所描述的计算机设备1000可执行前文图3对应实施例中对上述数据处理方法的描述，也可执行前文图12所对应实施例中对上述数据处理装置1的描述，在此不再赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。

此外，这里需要指出的是：本申请还提供了一种计算机可读存储介质，且计算机可读存储介质中存储有前文提及的数据处理装置1所执行的计算机程序，且计算机程序包括程序指令，当处理器执行程序指令时，能够执行前文图3所对应实施例中对数据处理方法的描述，因此，这里将不再进行赘述。对于本申请所涉及的计算机存储介质实施例中未披露的技术细节，请参照本申请方法实施例的描述。

作为示例，上述程序指令可被部署在一个计算机设备上执行，或者被部署在位于一个地点的多个计算机设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算机设备上执行，分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链网络。

上述计算机可读存储介质可以是前述任一实施例提供的数据处理装置或者上述计算机设备的内部存储单元，例如计算机设备的硬盘或内存。该计算机可读存储介质也可以是该计算机设备的外部存储设备，例如该计算机设备上配备的插接式硬盘，智能存储卡(smart media card，SMC)，安全数字(secure digital，SD)卡，闪存卡(flash card)等。进一步地，该计算机可读存储介质还可以既包括该计算机设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

本申请提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行前文图3对应实施例中对上述数据处理方法的描述，因此，这里将不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节，请参照本申请方法实施例的描述。

本申请实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象，而非用于描述特定顺序。此外，术语“包括”以及它们的任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块，而是还包括没有列出的步骤或模块，或还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本申请实施例提供的方法及相关装置是参照本申请实施例提供的方法流程图和/或结构示意图来描述的，具体可由计算机程序指令实现方法流程图和/或结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能的步骤。

以上所揭露的仅为本申请较佳实施例而已，当然不能以此来限定本申请之权利范围，因此依本申请权利要求所作的等同变化，仍属本申请所涵盖的范围。

Claims

一种数据处理方法，由计算机设备执行，其特征在于，所述方法包括：

获取转化异质图；所述转化异质图包含N个对象节点和M个资源节点，每个对象节点各自表示一个对象，每个资源节点各自表示一个资源，N和M均为正整数；若N个对象中任一对象对M个资源中任一资源具有转化行为，则所述任一对象的对象节点与所述任一资源的资源节点在所述转化异质图中具有连边；

获取所述N个对象中每个对象分别对应的对象同质图；任一对象同质图包含多个对象特征节点，任一对象特征节点用于表示对应对象在一个维度上的对象特征；

获取所述M个资源中每个资源分别对应的资源同质图；任一资源同质图包含多个资源特征节点，任一资源特征节点用于表示对应资源在一个维度上的资源特征；

基于所述转化异质图、所述每个对象的对象同质图和所述每个资源的资源同质图训练预测网络，得到训练好的预测网络；所述训练好的预测网络用于预测对象针对资源的转化指数。
根据权利要求1所述的方法，其特征在于，所述基于所述转化异质图、所述每个对象的对象同质图和所述每个资源的资源同质图训练预测网络，得到训练好的预测网络，包括：

调用所述预测网络基于所述转化异质图生成所述每个对象的第一对象嵌入特征及所述每个资源的第一资源嵌入特征；

调用所述预测网络基于所述每个对象的对象同质图分别生成所述每个对象的第二对象嵌入特征；

调用所述预测网络基于所述每个资源的资源同质图分别生成所述每个资源的第二资源嵌入特征；

根据所述每个对象的第一对象嵌入特征、所述每个对象的第二对象嵌入特征、所述每个资源的第一资源嵌入特征及所述每个资源的第二资源嵌入特征训练所述预测网络，得到所述训练好的预测网络。
根据权利要求2所述的方法，其特征在于，所述调用所述预测网络基于所述转化异质图生成所述每个对象的第一对象嵌入特征及所述每个资源的第一资源嵌入特征，包括：

将所述转化异质图表示为关系矩阵；所述关系矩阵用于指示所述转化异质图中资源节点与对象节点之间的连边关系；

调用所述预测网络获取特征传播矩阵，并基于所述特征传播矩阵和所述关系矩阵，对所述N个对象的对象特征和所述M个资源的资源特征进行相互传播，生成所述N个对象和所述M个资源对应的嵌入特征矩阵；

基于所述嵌入特征矩阵生成所述每个对象的第一对象嵌入特征和所述每个资源的第一资源嵌入特征。
根据权利要求3所述的方法，其特征在于，所述嵌入特征矩阵有多个；所述基于所述嵌入特征矩阵生成所述每个对象的第一对象嵌入特征和所述每个资源的第一资源嵌入特征，包括：

对多个嵌入特征矩阵进行拼接，得到拼接后的嵌入特征矩阵；

对所述拼接后的嵌入特征矩阵进行特征映射处理，得到目标嵌入特征矩阵；

从所述目标嵌入特征矩阵中提取所述每个对象的第一对象嵌入特征和所述每个资源的第一资源嵌入特征。
根据权利要求2所述的方法，其特征在于，所述N个对象中的任一个表示为目标对象，所述目标对象的对象同质图中任两个对象特征节点之间具有连边；

所述调用所述预测网络基于所述每个对象的对象同质图分别生成所述每个对象的第二对象嵌入特征，包括：

调用所述预测网络对所述目标对象的对象同质图中的连边进行删除处理，得到所述目标对象的对象同质图的第一激活子图；

基于所述第一激活子图，对所述目标对象的在多个维度上的对象特征进行特征传播处理，得到所述第一激活子图中所述目标对象的每个对象特征节点分别对应的节点特征；

根据所述目标对象的每个对象特征节点分别对应的节点特征生成所述目标对象的第二对象嵌入特征。
根据权利要求2所述的方法，其特征在于，所述M个资源中的任一个表示为目标资源，所述目标资源的资源同质图中任两个资源特征节点之间具有连边；

所述调用所述预测网络基于所述每个资源的资源同质图分别生成所述每个资源的第二资源嵌入特征，包括：

调用所述预测网络对所述目标资源的资源同质图中的连边进行删除处理，得到所述目标资源的资源同质图的第二激活子图；

基于所述第二激活子图，对所述目标资源在多个维度上的资源特征进行特征传播处理，得到所述第二激活子图中所述目标资源的每个资源特征节点分别对应的节点特征；

根据所述目标资源的每个资源特征节点分别对应的节点特征生成所述目标资源的第二资源嵌入特征。
根据权利要求2所述的方法，其特征在于，所述根据所述每个对象的第一对象嵌入特征、所述每个对象的第二对象嵌入特征、所述每个资源的第一资源嵌入特征及所述每个资源的第二资源嵌入特征训练所述预测网络，得到训练好的预测网络，包括：

根据所述每个对象的第一对象嵌入特征、所述每个对象的第二对象嵌入特征、所述每个资源的第一资源嵌入特征及所述每个资源的第二资源嵌入特征，生成所述预测网络的预测损失值；

基于所述预测损失值修正所述预测网络的网络参数，得到所述训练好的预测网络。
根据权利要求7所述的方法，其特征在于，所述根据所述每个对象的第一对象嵌入特征、所述每个对象的第二对象嵌入特征、所述每个资源的第一资源嵌入特征及所述每个资源的第二资源嵌入特征，生成所述预测网络的预测损失值，包括：

根据所述每个对象的第一对象嵌入特征、所述每个对象的第二对象嵌入特征、所述每个资源的第一资源嵌入特征及所述每个资源的第二资源嵌入特征，生成所述预测网络的特征泛化损失值；所述特征泛化损失值用于指示所述每个对象的第一对象嵌入特征和第二对象嵌入特征之间的特征差异，并用于指示所述每个资源的第一资源嵌入特征和第二资源嵌入特征之间的特征差异；

根据所述每个对象的第一对象嵌入特征和所述每个资源的第一资源嵌入特征，生成所述预测网络的第一转化预测损失值；

根据所述每个对象的第二对象嵌入特征和所述每个资源的第二资源嵌入特征，生成所述预测网络的第二转化预测损失值；

根据所述每个对象的第一对象嵌入特征、所述每个对象的第二对象嵌入特征、所述每个资源的第一资源嵌入特征及所述每个资源的第二资源嵌入特征，生成所述预测网络的正则损失值；

根据所述特征泛化损失值、所述第一转化预测损失值、所述第二转化预测损失值和所述正则损失值确定所述预测损失值。
根据权利要求8所述的方法，其特征在于，所述根据所述每个对象的第一对象嵌入特征、所述每个对象的第二对象嵌入特征、所述每个资源的第一资源嵌入特征及所述每个资源的第二资源嵌入特征，生成所述预测网络的特征泛化损失值，包括：

根据所述每个对象的第一对象嵌入特征和第二对象嵌入特征，生成针对对象嵌入特征的第一泛化损失值；

根据所述每个资源的第一资源嵌入特征和第二资源嵌入特征，生成针对资源嵌入特征的第二泛化损失值；

根据所述第一泛化损失值和所述第二泛化损失值生成所述特征泛化损失值。
根据权利要求8所述的方法，其特征在于，所述根据所述每个对象的第一对象嵌入特征和所述每个资源的第一资源嵌入特征，生成所述预测网络的第一转化预测损失值，包括：

根据所述每个对象的第一对象嵌入特征和所述每个资源的第一资源嵌入特征，生成所述每个对象分别针对所述每个资源的第一预测转化指数；

根据所述每个对象分别针对所述每个资源的第一预测转化指数及所述每个对象分别针对所述每个资源的转化行为，生成所述第一转化预测损失值。
根据权利要求8所述的方法，其特征在于，所述根据所述每个对象的第二对象嵌入特征和所述每个资源的第二资源嵌入特征，生成所述预测网络的第二转化预测损失值，包括：

根据所述每个对象的第二对象嵌入特征和所述每个资源的第二资源嵌入特征，生成所述每个对象分别针对所述每个资源的第二预测转化指数；

根据所述每个对象分别针对所述每个资源的第二预测转化指数及所述每个对象分别针对所述每个资源的转化行为，生成所述第二转化预测损失值。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取预测对象和预测资源；

调用所述训练好的预测网络预测所述预测对象针对所述预测资源的转化指数；

若所述预测对象针对所述预测资源的转化指数大于或等于转化指数阈值，则将所述预测资源推送给所述预测对象。
一种数据处理装置，其特征在于，所述装置包括：

第一获取模块，用于获取转化异质图；所述转化异质图包含N个对象节点和M个资源节点，每个对象节点各自表示一个对象，每个资源节点各自表示一个资源，N和M均为正整数；若N个对象中任一对象对M个资源中任一资源具有转化行为，则所述任一对象的对象节点与所述任一资源的资源节点在所述转化异质图中具有连边；

第二获取模块，用于获取所述N个对象中每个对象分别对应的对象同质图；任一对象同质图包含多个对象特征节点，任一对象特征节点用于表示对应对象在一个维度上的对象特征；

第三获取模块，用于获取所述M个资源中每个资源分别对应的资源同质图；任一资源同质图包含多个资源特征节点，任一资源特征节点用于表示对应资源在一个维度上的资源特征；

训练模块，用于基于所述转化异质图、所述每个对象的对象同质图和所述每个资源的资源同质图训练预测网络，得到训练好的预测网络；所述训练好的预测网络用于预测对象针对资源的转化指数。
根据权利要求13所述的装置，其特征在于，所述训练模块进一步用于：

调用所述预测网络基于所述转化异质图生成所述每个对象的第一对象嵌入特征及所述每个资源的第一资源嵌入特征；

调用所述预测网络基于所述每个对象的对象同质图分别生成所述每个对象的第二对象嵌入特征；

调用所述预测网络基于所述每个资源的资源同质图分别生成所述每个资源的第二资源嵌入特征；

根据所述每个对象的第一对象嵌入特征、所述每个对象的第二对象嵌入特征、所述每个资源的第一资源嵌入特征及所述每个资源的第二资源嵌入特征训练所述预测网络，得到所述训练好的预测网络。
根据权利要求14所述的装置，其特征在于，所述训练模块进一步用于：

将所述转化异质图表示为关系矩阵；所述关系矩阵用于指示所述转化异质图中资源节点与对象节点之间的连边关系；

调用所述预测网络获取特征传播矩阵，并基于所述特征传播矩阵和所述关系矩阵对所述N个对象的对象特征和所述M个资源的资源特征进行相互传播，生成所述N个对象和所述M个资源对应的嵌入特征矩阵；

基于所述嵌入特征矩阵生成所述每个对象的第一对象嵌入特征和所述每个资源的第一资源嵌入特征。
根据权利要求15所述的装置，其特征在于，所述嵌入特征矩阵有多个；所述训练模块进一步用于：

对多个嵌入特征矩阵进行拼接，得到拼接后的嵌入特征矩阵；

对所述拼接后的嵌入特征矩阵进行特征映射处理，得到目标嵌入特征矩阵；

从所述目标嵌入特征矩阵中提取所述每个对象的第一对象嵌入特征和所述每个资源的第一资源嵌入特征。
根据权利要求14所述的装置，其特征在于，所述N个对象中的任一个表示为目标对象，所述目标对象的对象同质图中任两个对象特征节点之间具有连边，所述训练模块进一步用于：

调用所述预测网络对所述目标对象的对象同质图中的连边进行删除处理，得到所述目标对象的对象同质图的第一激活子图；

基于所述第一激活子图，对所述目标对象的在多个维度上的对象特征进行特征传播处理，得到所述第一激活子图中所述目标对象的每个对象特征节点分别对应的节点特征；

根据所述目标对象的每个对象特征节点分别对应的节点特征生成所述目标对象的第二对象嵌入特征。
一种计算机程序产品，包括计算机程序/指令，该计算机程序/指令被处理器执行时实现权利要求1-12任一项所述方法的步骤。
一种计算机设备，其特征在于，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行权利要求1-12中任一项所述方法的步骤。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序适用于由处理器加载并执行权利要求1-12任一项所述的方法。