CN114756768A

CN114756768A - 数据处理方法、装置、设备、可读存储介质及程序产品

Info

Publication number: CN114756768A
Application number: CN202210677007.1A
Authority: CN
Inventors: 朱灵子; 成昊; 沈春旭
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-06-15
Filing date: 2022-06-15
Publication date: 2022-07-15
Anticipated expiration: 2042-06-15
Also published as: CN114756768B

Abstract

本申请提供了一种基于人工智能的数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品；方法包括：对包括目标对象以及目标物品的二分异质图进行特征提取处理，得到目标对象的对象图嵌入特征以及目标物品的物品图嵌入特征；对包括目标对象的社交同质图进行特征提取处理，得到目标对象的社交图嵌入特征；基于对象图嵌入特征、物品图嵌入特征、社交图嵌入特征以及目标对象的历史数据进行指标预测处理，得到目标物品对应目标对象的推荐指标；基于目标物品对应目标对象的推荐指标执行推荐操作。通过本申请，能够提高信息推荐的准确性。

Description

数据处理方法、装置、设备、可读存储介质及程序产品

技术领域

本申请涉及人工智能技术，尤其涉及一种基于人工智能的数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

背景技术

人工智能（AI，Artificial Intelligence）是计算机科学的一个综合技术，通过研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，例如自然语言处理技术以及机器学习/深度学习等几大方向，随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

推荐系统是人工智能领域的重要应用之一，能够在信息过载的环境中帮助用户发现可能令他们感兴趣的信息，并将信息推送给对它们感兴趣的用户。

虽然，相关技术中的推荐系统可以基于待推荐物品的推荐指标，从大量的待推荐物品中，确定出用户可能感兴趣的信息，并向用户推荐用户可能感兴趣的物品。但是，相关技术中待推荐物品的推荐指标的准确性有待提高。

发明内容

本申请实施例提供一种基于人工智能的数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品，能够提高信息推荐的准确性。

本申请实施例的技术方案是这样实现的：

本申请实施例提供一种基于人工智能的数据处理方法，包括：

对包括目标对象以及目标物品的二分异质图进行特征提取处理，得到所述目标对象的对象图嵌入特征以及所述目标物品的物品图嵌入特征；

对包括所述目标对象的社交同质图进行特征提取处理，得到所述目标对象的社交图嵌入特征；

基于所述对象图嵌入特征、所述物品图嵌入特征、所述社交图嵌入特征以及所述目标对象的历史数据进行指标预测处理，得到所述目标物品对应所述目标对象的推荐指标；

基于所述目标物品对应所述目标对象的推荐指标执行推荐操作。

本申请实施例提供一种基于人工智能的数据处理装置，包括：

第一特征提取模块，用于对包括目标对象以及目标物品的二分异质图进行特征提取处理，得到所述目标对象的对象图嵌入特征以及所述目标物品的物品图嵌入特征；

第二特征提取模块，用于对包括所述目标对象的社交同质图进行特征提取处理，得到所述目标对象的社交图嵌入特征；

预测模块，用于基于所述对象图嵌入特征、所述物品图嵌入特征、所述社交图嵌入特征以及所述目标对象的历史数据进行指标预测处理，得到所述目标物品对应所述目标对象的推荐指标；

推荐模块，用于基于所述目标物品对应所述目标对象的推荐指标执行推荐操作。

上述技术方案中，所述第一特征提取模块还用于确定所述二分异质图中所述目标对象的邻居物品、以及所述二分异质图中所述目标物品的邻居对象；

对所述目标对象的邻居物品进行多次图卷积处理，得到所述目标对象的多个对象特征；

对所述多个对象特征进行聚合处理，得到所述目标对象的对象图嵌入特征；

对所述目标物品的邻居对象进行多次图卷积处理，得到所述目标物品的多个物品特征；

对所述多个物品特征进行聚合处理，得到所述目标物品的物品图嵌入特征。

上述技术方案中，所述图卷积处理是通过图卷积层实现的，所述图卷积层之间以级联形式连接；所述第一特征提取模块还用于通过所述级联形式的图卷积层中的第一个图卷积层，对所述目标对象的邻居物品的初始物品特征进行归一化处理，得到所述目标对象在第一个图卷积层的所述对象特征；

将所述目标对象在第一个图卷积层的所述对象特征输出到后续级联的图卷积层，通过所述后续级联的图卷积层继续进行归一化处理，得到所述目标对象在后续级联的图卷积层的所述对象特征；

通过所述级联形式的图卷积层中的第一个图卷积层，对所述目标物品的邻居对象的初始对象特征进行归一化处理，得到所述目标物品在第一个图卷积层的所述物品特征；

将所述目标物品在第一个图卷积层的所述物品特征输出到后续级联的图卷积层，通过所述后续级联的图卷积层继续进行归一化处理，得到所述目标物品在后续级联的图卷积层的所述物品特征。

上述技术方案中，所述第一特征提取模块还用于通过所述级联形式的图卷积层的第j个图卷积层执行以下处理：

针对所述目标对象的多个邻居物品中的第i个邻居物品执行以下处理：

确定所述第i个邻居物品在第j-1个图卷积层的物品特征；

确定所述第i个邻居物品的度以及所述目标对象的度；

基于所述第i个邻居物品的度以及所述目标对象的度，对所述第i个邻居物品在第j个图卷积层的物品特征进行归一化处理，得到所述第i个邻居物品的归一化特征；

对所述多个邻居物品分别对应的归一化特征进行加和处理，得到所述目标对象在第j个图卷积层的所述对象特征；

其中，j为递增的自然数且取值范围为1<j≤J，J为所述图卷积层的数量，J为大于1的正整数，i为递增的自然数且取值范围为1≤i≤M，M为所述邻居物品的数量，M为正整数。

上述技术方案中，所述第一特征提取模块还用于确定所述二分异质图的邻接矩阵；

基于所述邻接矩阵对所述二分异质图进行多次图卷积处理，得到所述二分异质图的多个嵌入矩阵；

对所述多个嵌入矩阵进行聚合处理，得到所述二分异质图的目标嵌入矩阵；

基于所述目标对象在所述目标嵌入矩阵的位置，从所述目标嵌入矩阵中提取出所述目标对象的对象图嵌入特征；

基于所述目标物品在所述目标嵌入矩阵的位置，从所述目标嵌入矩阵中提取出所述目标物品的物品图嵌入特征。

上述技术方案中，所述图卷积处理是通过图卷积层实现的，所述图卷积层之间以级联形式连接；所述第一特征提取模块还用于通过所述级联形式的图卷积层中的第一个图卷积层，对所述二分异质图的初始嵌入矩阵以及所述邻接矩阵进行归一化卷积处理，得到所述二分异质图在第一个图卷积层的所述嵌入矩阵；

将所述二分异质图在第一个图卷积层的所述嵌入矩阵输出到后续级联的图卷积层，通过所述后续级联的图卷积层继续进行归一化卷积处理，得到所述二分异质图在后续级联的图卷积层的所述嵌入矩阵。

上述技术方案中，所述第一特征提取模块还用于通过所述级联形式的图卷积层的第k个图卷积层执行以下处理：

确定所述二分异质图的度矩阵；

基于所述二分异质图的度矩阵对所述邻接矩阵进行归一化处理，得到归一化后的所述邻接矩阵；

对归一化后的所述邻接矩阵、以及所述二分异质图在第k-1个图卷积层的所述嵌入矩阵进行卷积处理，得到所述二分异质图在第k个图卷积层的所述嵌入矩阵；

其中，k为递增的自然数且取值范围为1<k≤K，K为所述图卷积层的数量，K为大于1的正整数。

上述技术方案中，所述第二特征提取模块还用于确定所述社交同质图中所述目标对象的多个社交邻居对象；

对所述目标对象以及每个所述社交邻居对象分别进行特征向量转换处理，得到所述目标对象的转换特征以及所述社交邻居对象的转换特征；

对所述目标对象的转换特征以及每个所述社交邻居对象的转换特征进行注意力处理，得到所述目标对象的社交图嵌入特征。

上述技术方案中，所述第二特征提取模块还用于对所述目标对象的转换特征以及每个所述社交邻居对象的转换特征进行自注意力处理，得到所述目标对象与每个所述社交邻居对象之间的注意力权重；

基于每个所述社交邻居对象的转换特征以及所述注意力权重，确定所述目标对象的社交图嵌入特征。

上述技术方案中，所述第二特征提取模块还用于基于所述注意力权重对每个所述社交邻居对象的转换特征进行加权求和处理，得到所述目标对象的加权特征；

对所述目标对象的加权特征进行映射处理，得到所述目标对象的社交图嵌入特征。

上述技术方案中，所述第二特征提取模块还用于对所述目标对象的转换特征以及每个所述社交邻居对象的转换特征进行非线性映射处理，得到所述目标对象与每个所述社交邻居对象之间的注意力系数；

对所述目标对象与每个所述社交邻居对象之间的注意力系数进行归一化处理，得到所述目标对象与每个所述社交邻居对象之间的注意力权重。

上述技术方案中，所述预测模块还用于获取所述目标对象的历史数据；

对所述目标对象的历史数据进行向量映射处理，得到所述目标对象的历史特征；

对所述对象图嵌入特征、所述物品图嵌入特征、所述社交图嵌入特征以及所述历史特征进行合并处理，得到合并特征；

对所述合并特征进行指标映射处理，得到所述目标物品对应所述目标对象的推荐指标。

本申请实施例提供一种电子设备，所述电子设备包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现本申请实施例提供的基于人工智能的数据处理方法。

本申请实施例提供一种计算机可读存储介质，存储有可执行指令，用于引起处理器执行时，实现本申请实施例提供的基于人工智能的数据处理方法。

本申请实施例提供一种计算机程序产品，包括计算机程序或指令，所述计算机程序或指令被处理器执行时实现本申请实施例提供的基于人工智能的数据处理方法。

本申请实施例具有以下有益效果：

通过从二分异质图中提取出对象图嵌入特征以及目标物品的物品图嵌入特征，从社交同质图中提取出目标对象的社交图嵌入特征，并基于对象图嵌入特征、物品图嵌入特征、社交图嵌入特征以及目标对象的历史数据这四个维度的特征数据进行指标预测处理，通过提高特征数据的多样性，从而基于多样的特征数据进行指标预测，以提高推荐指标的准确性，进而提高推荐的准确性。

附图说明

图1是本申请实施例提供的推荐系统的应用场景示意图；

图2是本申请实施例提供的电子设备的结构示意图；

图3是本申请实施例提供的基于人工智能的数据处理方法的第一流程示意图；

图4是本申请实施例提供的基于人工智能的数据处理方法的第二流程示意图；

图5是本申请实施例提供的基于人工智能的数据处理方法的第三流程示意图；

图6是本申请实施例提供的二分图；

图7是本申请实施例提供的同质图；

图8是本申请实施例提供的注意力权重计算结构图；

图9是本申请实施例提供的注意力权重加权求和计算结构图；

图10是本申请实施例提供的模型结构图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请作进一步地详细描述，所描述的实施例不应视为对本申请的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在以下的描述中，所涉及的术语“第一\第二”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

对本申请实施例进行进一步详细说明之前，对本申请实施例中涉及的名词和术语进行说明，本申请实施例中涉及的名词和术语适用于如下的解释。

1）目标对象：当前使用推荐系统的用户、即当前用户，例如用户A在使用文本推荐系统看新闻，则用户A为目标用户。

2）特征集合数据：又称用户角色，作为一种勾画目标对象、联系对象诉求与设计方向的有效工具。在各领域有广泛的应用，在实际操作的过程中，往往会以最为浅显和贴近生活的话语将目标对象的属性、行为与期待联结起来，作为实际对象的虚拟代表。

3）推荐指标：用于指引推荐系统进行推荐的指标，例如，目标对象是否会点击待推荐物品、目标对象是否对该待推荐物品感兴趣、目标对象是否会基于该待推荐物品进行转化、目标对象是否会评价该待推荐物品、目标对象是否会购买该待推荐物品等。

4）深度神经网络（DNN，Deep Neural Network）：一类具有深度结构的前馈神经网络，是机器学习（ML，Machine Learning）领域中一种技术，可以用较少的参数表示复杂的函数。

5）图（Graph）：一个非常常用的数据结构，现实世界中很多任务可以描述为图问题，比如社交网络，蛋白体结构，交通路网数据，以及知识图谱等，甚至规则网格结构数据（如图像，视频等）也是图数据的一种特殊形式，因此图是一个很值得研究的领域。针对图的研究可以分为三类：1、Graph算法，如生成树算法、最短路径算法、复杂一点的二分图匹配、费用流问题等等；2、概率图模型，将条件概率表达为图结构，并进一步挖掘，例如条件随机场等；3、图神经网络，研究图结构数据挖掘的问题，例如图嵌入（Graph Embedding），图卷积网络（GCN，Graph Convolutional Network）等等。其中，Graph Embedding为结构化的图生成分布式表示。

6）广告投放：使用算法确认目标人群，并在公众场景对目标人群进行广告投放。算法对广告投放影响很大，算法已经融入到广告投放的方方面面，包括基础竞价、投放策略、投放分析等等。算法在广告投放中的应用指的是从广泛的受众中提炼目标人群的过程，前提是受众数据足够多，包括年龄、兴趣、行为等等。

本申请实施例提供了一种基于人工智能的数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品，能够提高推荐的准确性。

本申请实施例所提供的基于人工智能的数据处理方法，可以由终端/服务器独自实现；也可以由终端和服务器协同实现，例如终端独自承担下文所述的基于人工智能的数据处理方法，或者，终端向服务器发送针对目标用户的信息推荐请求，服务器根据接收的针对目标用户的信息推荐请求执行基于人工智能的数据处理方法，确定目标物品对应目标用户的推荐指标，并基于目标物品对应目标用户的推荐指标执行推荐操作，以响应针对目标用户的信息推荐请求。

本申请实施例提供的用于数据处理的电子设备可以是各种类型的终端设备或服务器，其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器；终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

以服务器为例，例如可以是部署在云端的服务器集群，向用户开放人工智能云服务（AI as a Service，AIaaS），AIaaS平台会把几类常见的AI服务进行拆分，并在云端提供独立或者打包的服务，这种服务模式类似于一个AI主题商城，所有的用户都可以通过应用程序编程接口的方式来接入使用AIaaS平台提供的一种或者多种人工智能服务。

例如，其中的一种人工智能云服务可以为数据处理服务，即云端的服务器封装有本申请实施例提供的数据处理的程序。用户通过终端（运行有客户端，例如新闻客户端、视频客户端等）调用云服务中的数据处理服务，以使部署在云端的服务器调用封装的数据处理的程序，对包括目标对象以及目标物品的二分异质图进行特征提取处理，得到目标对象的对象图嵌入特征以及目标物品的物品图嵌入特征，对包括目标对象的社交同质图进行特征提取处理，得到目标对象的社交图嵌入特征，基于对象图嵌入特征、物品图嵌入特征、社交图嵌入特征以及目标对象的历史数据进行指标预测处理，得到目标物品对应目标对象的推荐指标，基于目标物品对应目标对象的推荐指标执行推荐操作，从而将目标物品（例如新闻、视频、广告）分发给符合兴趣需求的目标用户，提升信息推荐的效果。

参见图1，图1是本申请实施例提供的推荐系统10的应用场景示意图，终端（示例性示出终端200-1、终端200-2以及终端200-3）通过网络300连接服务器100，网络300可以是广域网或者局域网，又或者是二者的组合。

终端（运行有客户端，例如新闻客户端、视频客户端等）可以被用来获取针对目标用户的信息推荐请求，例如，当目标用户打开终端上运行的视频客户端后，终端自动获取针对目标用户的视频推荐请求。

在一些实施例中，终端获取针对目标用户的信息推荐请求后，调用服务器100的数据处理接口（可以提供为云服务的形式，即数据处理服务），服务器100基于针对目标用户的信息推荐请求，对包括目标对象以及目标物品的二分异质图进行特征提取处理，得到目标对象的对象图嵌入特征以及目标物品的物品图嵌入特征，对包括目标对象的社交同质图进行特征提取处理，得到目标对象的社交图嵌入特征，基于对象图嵌入特征、物品图嵌入特征、社交图嵌入特征以及目标对象的历史数据进行指标预测处理，得到目标物品对应目标对象的推荐指标，基于目标物品对应目标对象的推荐指标执行推荐操作，从而将目标物品（例如新闻、视频、广告）分发给符合兴趣需求的目标用户，提升信息推荐的效果。

作为一个应用示例，对于视频应用，当多个目标用户打开终端上运行的视频客户端后，终端自动获取针对目标用户的视频推荐请求，调用服务器100的数据处理接口，服务器100执行基于人工智能的数据处理方法，确定目标视频分别对应多个目标用户的推荐指标（例如是否点击），则基于目标视频分别对应多个目标用户的推荐指标执行推荐操作，例如目标用户1、目标用户2可能会点击目标视频进行观看，则将目标视频推送至目标用户1对应的终端200-1、目标用户2对应的终端200-2，从而提升信息推荐的效果。

在一些实施例中，终端中运行的客户端中可以植入有数据处理插件，用以在客户端本地实现基于人工智能的数据处理方法。例如，终端获取针对目标用户的信息推荐请求后，调用数据处理插件，以实现基于人工智能的数据处理方法，对包括目标对象以及目标物品的二分异质图进行特征提取处理，得到目标对象的对象图嵌入特征以及目标物品的物品图嵌入特征，对包括目标对象的社交同质图进行特征提取处理，得到目标对象的社交图嵌入特征，基于对象图嵌入特征、物品图嵌入特征、社交图嵌入特征以及目标对象的历史数据进行指标预测处理，得到目标物品对应目标对象的推荐指标，基于目标物品对应目标对象的推荐指标执行推荐操作，从而将目标物品（例如新闻、视频、广告）分发给符合兴趣需求的目标用户，提升信息推荐的效果。

作为一个应用示例，对于新闻应用，当目标用户打开终端上运行的新闻客户端后，终端自动获取针对目标用户的新闻推荐请求，调用数据处理插件，执行基于人工智能的数据处理方法，确定目标新闻对应目标用户的推荐指标（例如是否点击），当目标新闻对应目标用户的推荐指标表征目标用户会点击目标新闻时，执行待推荐任务，从而提升信息推荐的效果。

作为另一个应用示例，对于游戏应用，当目标用户打开终端上运行的游戏客户端后，终端自动获取针对目标用户的广告推荐请求，调用数据处理插件，执行基于人工智能的数据处理方法，确定目标广告对应目标用户的推荐指标（例如是否点击），当目标广告对应目标用户的推荐指标表征目标用户会点击目标广告时，则向目标用户推送目标广告，从而提升广告推荐的效果。

下面说明本申请实施例提供的用于数据处理的电子设备的结构，参见图2，图2是本申请实施例提供的用于数据处理的电子设备500的结构示意图，以电子设备500是服务器为例说明，图2所示的用于数据处理的电子设备500包括：至少一个处理器510、存储器550、至少一个网络接口520和用户接口530。电子设备500中的各个组件通过总线系统540耦合在一起。可理解，总线系统540用于实现这些组件之间的连接通信。总线系统540除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图2中将各种总线都标为总线系统540。

处理器510可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器（DSP，Digital Signal Processor），或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

存储器550包括易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器（ROM，Read Only Memory），易失性存储器可以是随机存取存储器（RAM，Random Access Memory）。本申请实施例描述的存储器550旨在包括任意适合类型的存储器。存储器550可选地包括在物理位置上远离处理器510的一个或多个存储设备。

在一些实施例中，存储器550能够存储数据以支持各种操作，这些数据的示例包括程序、模块和数据结构或者其子集或超集，下面示例性说明。

操作系统551，包括用于处理各种基本系统服务和执行硬件相关任务的系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务；

网络通信模块552，用于经由一个或多个（有线或无线）网络接口520到达其他计算设备，示例性的网络接口520包括：蓝牙、无线相容性认证（WiFi）、和通用串行总线（USB，Universal Serial Bus）等；

在一些实施例中，本申请实施例提供的基于人工智能的数据处理装置可以采用软件方式实现，例如，可以是上文所述的服务器中数据处理服务，还可以是上文所述的终端中数据处理插件。当然，不局限于此，本申请实施例提供的基于人工智能的数据处理装置可以提供为各种软件实施例，包括应用程序、软件、软件模块、脚本或代码在内的各种形式。

图2示出了存储在存储器550中的基于人工智能的数据处理装置555，其可以是程序和插件等形式的软件，例如数据处理插件，并包括一系列的模块，包括第一特征提取模块5551、第二特征提取模块5552、预测模块5553以及推荐模块5554；其中，第一特征提取模块5551、第二特征提取模块5552、预测模块5553以及推荐模块5554用于实现本申请实施例提供的数据处理功能。

如前所述，本申请实施例提供的基于人工智能的数据处理方法可以由各种类型的电子设备实施。参见图3，图3是本申请实施例提供的基于人工智能的数据处理方法的第一流程示意图，结合图3示出的步骤进行说明。

在下面步骤中，目标物品可以是文本、图像、图文、视频等数据。推荐指标用于指引推荐系统进行推荐的指标，例如，目标对象是否会点击待推荐物品、目标对象是否对该待推荐物品感兴趣、目标对象是否会基于该待推荐物品进行转化、目标对象是否会评价该待推荐物品、目标对象是否会购买该待推荐物品等。

在步骤101中，对包括目标对象以及目标物品的二分异质图进行特征提取处理，得到目标对象的对象图嵌入特征以及目标物品的物品图嵌入特征。

需要说明的是，二分异质图（又称二分图）是指包括两种类型节点的图，即包括对象（例如用户）节点以及物品节点，对象节点为用于表征对象的节点（即二分异质图中的对象），物品节点为用于表征待推荐物品的节点（即二分异质图中的物品），二分异质图包括多个对象节点以及多个物品节点，其中，目标对象对应二分异质图中的任意对象节点，目标物品为二分异质图中的任意物品节点。需要说明的是，二分异质图中的任意对象可称为对象节点，二分异质图中的任意物品可称为物品节点。

例如，基于对象与物品的交互行为，构建二分异质图，并将二分异质图输入图神经网络（GNN，Graph Neural Network），以提取聚合有对象与物品的交互行为的目标对象的对象图嵌入特征（例如用户的交互行为图嵌入表示）以及目标物品的物品图嵌入特征（物品的交互行为图嵌入表示）。

如图6所示，当用户1与物品3、物品4有交互行为时，则构建二分异质图中用户1与物品3、物品4之间的边，例如当物品为游戏时，则用户1注册了游戏3、游戏4；当物品为商品时，则用户1购买了商品3、商品4。

参见图4，图4是本申请实施例提供的基于人工智能的数据处理方法的第二流程示意图，图4示出图3中的步骤101可以通过图4示出的步骤1011-步骤1015实现：在步骤1011中，确定二分异质图中目标对象的邻居物品、以及二分异质图中目标物品的邻居对象；在步骤1012中，对目标对象的邻居物品进行多次图卷积处理，得到目标对象的多个对象特征；在步骤1013中，对多个对象特征进行聚合处理，得到目标对象的对象图嵌入特征；在步骤1014中，对目标物品的邻居对象进行多次图卷积处理，得到目标物品的多个物品特征；在步骤1015中，对多个物品特征进行聚合处理，得到目标物品的物品图嵌入特征。

其中，邻居物品表征二分异质图中与目标对象相邻的物品，邻居对象表征二分异质图中与目标物品相邻的对象。

例如，通过在二分异质图上平滑特征，从而准确学习节点表示（即二分异质图中节点（物品或对象）的特征），为了达到此目的，迭代的聚合邻居节点（与目标节点相邻的节点称为邻居节点，当目标节点为目标对象时，邻居节点为邻居物品；当目标节点为目标物品时，邻居节点为邻居对象）的特征作为新的节点表示，例如，对目标对象的邻居物品进行多次（大于或等于2次）图卷积处理，得到目标对象的多个对象特征，并对多个对象特征进行聚合处理，得到目标对象的对象图嵌入特征（对象图嵌入特征表征目标对象在二分异质图中的嵌入向量（一种低维度向量）），从而迭代地从邻居物品聚合特征作为目标对象节点的表示；对目标物品的邻居对象进行多次图卷积处理，得到目标物品的多个物品特征，并对多个物品特征进行聚合处理，得到目标物品的物品图嵌入特征（物品图嵌入特征表征目标物品在二分异质图中的嵌入向量（一种低维度向量）），从而迭代地聚合邻居对象的特征作为目标对象的节点表示。

在一些实施例中，图卷积处理是通过图卷积层实现的，图卷积层之间以级联形式连接；对目标对象的邻居物品进行多次图卷积处理，得到目标对象的多个对象特征，包括：通过级联形式的图卷积层中的第一个图卷积层，对目标对象的邻居物品的初始物品特征进行归一化处理，得到目标对象在第一个图卷积层的对象特征；将目标对象在第一个图卷积层的对象特征输出到后续级联的图卷积层，通过后续级联的图卷积层继续进行归一化处理，得到目标对象在后续级联的图卷积层的对象特征；对目标物品的邻居对象进行多次图卷积处理，得到目标物品的多个物品特征，包括：通过级联形式的图卷积层中的第一个图卷积层，对目标物品的邻居对象的初始对象特征进行归一化处理，得到目标物品在第一个图卷积层的物品特征；将目标物品在第一个图卷积层的物品特征输出到后续级联的图卷积层，通过后续级联的图卷积层继续进行归一化处理，得到目标物品在后续级联的图卷积层的物品特征。

需要说明的是，在经过一层的图卷积层的计算后，对对象特征或物品特征的理解就加深一步，经过多层图卷积层的计算，就能够逐步准确学习到对象特征或物品特征。通过级联形式的处理，能够获取精度渐进的对象特征或物品特征。

例如，通过多个级联的图卷积层对目标对象的邻居物品（对应邻居物品节点）进行归一化处理，从而迭代地聚合邻居物品的特征。例如，通过级联形式的图卷积层中的第一个图卷积层，对目标对象的邻居物品的初始物品特征进行归一化处理，得到目标对象在第一个图卷积层的对象特征，将目标对象在第一个图卷积层的对象特征输出到第二个图卷积层，对目标对象的邻居物品在第一个图卷积层的物品特征进行归一化处理，得到目标对象在第二个图卷积层的对象特征，多个级联的图卷积层依次执行上述操作，从而得到目标对象的多个对象特征。其中，初始物品特征表示二分异质图中所有的物品节点。

例如，通过多个级联的图卷积层对目标物品的邻居对象（对应邻居对象节点）进行归一化处理，从而迭代地聚合邻居对象的特征。例如，通过级联形式的图卷积层中的第一个图卷积层，对目标物品的邻居对象的初始对象特征进行归一化处理，得到目标物品在第一个图卷积层的物品特征，将目标物品在第一个图卷积层的物品特征输出到第二个图卷积层，对目标物品的邻居对象在第一个图卷积层的对象特征进行归一化处理，得到目标物品在第二个图卷积层的物品特征，多个级联的图卷积层依次执行上述操作，从而得到目标物品的多个物品特征。其中，初始对象特征表示二分异质图中所有的对象节点。

在一些实施例中，通过后续级联的图卷积层继续进行归一化处理，得到目标对象在后续级联的图卷积层的对象特征，包括：通过级联形式的图卷积层的第j个图卷积层执行以下处理：针对目标对象的多个邻居物品中的第i个邻居物品执行以下处理：确定第i个邻居物品在第j-1个图卷积层的物品特征；确定第i个邻居物品的度以及目标对象的度；基于第i个邻居物品的度以及目标对象的度，对第i个邻居物品在第j个图卷积层的物品特征进行归一化处理，得到第i个邻居物品的归一化特征；对多个邻居物品分别对应的归一化特征进行加和处理，得到目标对象在第j个图卷积层的对象特征；其中，j为递增的自然数且取值范围为1<j≤J，J为图卷积层的数量，J为大于1的正整数，i为递增的自然数且取值范围为1≤i≤M，M为邻居物品的数量，M为正整数。

需要说明的是，图卷积层的归一化处理过程如以下公式所示

，其中，

表示目标对象在第j个图卷积层（即第j次图卷积操作）的对象特征（即节点表示），

表示第i个邻居物品在第j-1个图卷积层的物品特征，

表示目标对象的度（即目标对象的邻居物品的数量），

表示第i个邻居物品的度（即第i个邻居物品的邻居对象的数量）。

在一些实施例中，通过后续级联的图卷积层继续进行归一化处理，得到目标物品在后续级联的图卷积层的物品特征，包括：通过级联形式的图卷积层的第j个图卷积层执行以下处理：针对目标物品的多个邻居对象中的第i个邻居对象执行以下处理：确定第i个邻居对象在第j-1个图卷积层的对象特征；确定第i个邻居对象的度以及目标物品的度；基于第i个邻居对象的度以及目标物品的度，对第i个邻居对象在第j个图卷积层的对象特征进行归一化处理，得到第i个邻居对象的归一化特征；对多个邻居对象分别对应的归一化特征进行加和处理，得到目标物品在第j个图卷积层的物品特征；其中，j为递增的自然数且取值范围为1<j≤N，N为图卷积层的数量，N为大于1的正整数，i为递增的自然数且取值范围为1≤i≤M，M为邻居对象的数量，M为正整数。

需要说明的是，图卷积层的归一化处理过程如以下公式所示

，其中，

表示目标物品在第j个图卷积层（即第j次图卷积操作）的物品特征（即节点表示），

表示第i个邻居对象在第j-1个图卷积层的对象特征，

表示目标物品的度（即目标物品的邻居对象的数量），

表示第i个邻居对象的度（即第i个邻居对象的邻居物品的数量）。

在一些实施例中，对多个物品特征进行聚合处理，得到目标物品的物品图嵌入特征，包括：对多个物品特征进行加权求和处理，得到目标物品的物品图嵌入特征；对多个对象特征进行聚合处理，得到目标对象的对象图嵌入特征，包括：对多个对象特征进行加权求和处理，得到目标物品的对象图嵌入特征。

例如，对多个对象特征进行加权求和处理的计算过程为

，其中，

表示第j个图卷积层的权重，第j层的权重可以被视为一个超参数来手动调整，也可以看成一个学习参数自动学习，

表示目标对象的对象图嵌入特征（即最终嵌入表示）。

例如，对多个物品特征进行加权求和处理的计算过程为

，其中，

表示目标物品的物品图嵌入特征（即最终嵌入表示）。

在一些实施例中，对包括目标对象以及目标物品的二分异质图进行特征提取处理，得到目标对象的对象图嵌入特征以及目标物品的物品图嵌入特征，包括：确定二分异质图的邻接矩阵；基于邻接矩阵对二分异质图进行多次图卷积处理，得到二分异质图的多个嵌入矩阵；对多个嵌入矩阵进行聚合处理，得到二分异质图的目标嵌入矩阵；基于目标对象在目标嵌入矩阵的位置，从目标嵌入矩阵中提取出目标对象的对象图嵌入特征；基于目标物品在目标嵌入矩阵的位置，从目标嵌入矩阵中提取出目标物品的物品图嵌入特征。

例如，为了能够快速计算二分异质图中所有节点表示，可通过矩阵形式进行计算，邻接矩阵是二分图异质图的一种矩阵形式。基于邻接矩阵对二分异质图进行多次图卷积处理，得到二分异质图的多个嵌入矩阵，对多个嵌入矩阵进行聚合处理，得到二分异质图的目标嵌入矩阵（即最后的嵌入矩阵），基于目标对象在目标嵌入矩阵的位置，从目标嵌入矩阵中提取出目标对象的对象图嵌入特征，基于目标物品在目标嵌入矩阵的位置，对多个嵌入矩阵进行聚合处理，得到二分异质图的目标嵌入矩阵，从而迭代地从邻居节点聚合特征作为每个节点的表示。

其中，邻接矩阵为

，其中，

表示对象与物品的交互矩阵，M和N分别表示对象数量和物品数量，如果u与i有交互行为，则

，否则

。

在一些实施例中，图卷积处理是通过图卷积层实现的，图卷积层之间以级联形式连接；基于邻接矩阵对二分异质图进行多次图卷积处理，得到二分异质图的多个嵌入矩阵，包括：通过级联形式的图卷积层中的第一个图卷积层，对二分异质图的初始嵌入矩阵以及邻接矩阵进行归一化卷积处理，得到二分异质图在第一个图卷积层的嵌入矩阵；将二分异质图在第一个图卷积层的嵌入矩阵输出到后续级联的图卷积层，通过后续级联的图卷积层继续进行归一化卷积处理，得到二分异质图在后续级联的图卷积层的嵌入矩阵。

例如，通过多个级联的图卷积层对嵌入矩阵以及邻接矩阵进行归一化卷积处理，从而迭代地聚合邻居节点的特征。例如，对二分异质图的初始嵌入矩阵以及邻接矩阵进行归一化卷积处理，得到二分异质图在第一个图卷积层的嵌入矩阵，将二分异质图在第一个图卷积层的嵌入矩阵输出到第二个图卷积层，对二分异质图在第一个图卷积层的嵌入矩阵以及邻接矩阵进行归一化卷积处理，得到二分异质图在第二个图卷积层的嵌入矩阵，多个级联的图卷积层依次执行上述操作，从而得到二分异质图的多个嵌入矩阵。其中，初始嵌入矩阵

，其中T表示嵌入大小，M和N分别表示对象数量和物品数量。

在一些实施例中，通过后续级联的图卷积层继续进行归一化卷积处理，得到二分异质图在后续级联的图卷积层的嵌入矩阵，包括：通过级联形式的图卷积层的第k个图卷积层执行以下处理：确定二分异质图的度矩阵；基于二分异质图的度矩阵对邻接矩阵进行归一化处理，得到归一化后的邻接矩阵；对归一化后的邻接矩阵、以及二分异质图在第k-1个图卷积层的嵌入矩阵进行卷积处理，得到二分异质图在第k个图卷积层的嵌入矩阵；其中，k为递增的自然数且取值范围为1<k≤K，K为图卷积层的数量，K为大于1的正整数。

需要说明的是，图卷积层的归一化卷积处理过程如以下公式所示

，其中，

表示二分异质图在第k个图卷积层的嵌入矩阵，

表示二分异质图的度矩阵，D是（M+N）*(M+N)的对角矩阵，用于对A进行归一化，其中，每个元素

表示邻接矩阵A的第i行向量中非零项的个数。

在一些实施例中，对多个嵌入矩阵进行聚合处理，得到二分异质图的目标嵌入矩阵，包括：对多个嵌入矩阵进行加权求和处理，得到二分异质图的目标嵌入矩阵。

例如，对多个嵌入矩阵进行加权求和处理的计算过程为

，其中，

表示第k个图卷积层的权重，第j层的权重可以被视为一个超参数来手动调整，也可以看成一个学习参数自动学习，E表示目标对象的目标嵌入矩阵。其中，

中对应对象节点的位置的向量表示对象节点的最终嵌入表示，

中对应物品节点的位置的向量表示物品节点的最终嵌入表示。

在步骤102中，对包括目标对象的社交同质图进行特征提取处理，得到目标对象的社交图嵌入特征。

需要说明的是，社交同质图（简称同质图）是指包括一种类型节点的图，即包括对象（例如用户）节点，对象节点为用于表征对象的节点，二同质图包括多个对象节点，其中，目标对象对应同质图中的任意对象节点。

例如，基于用户之间的社交关系链，构建同质图，并将同质图输入图注意力网络，以提取聚合有社交关系信息的目标对象的社交图嵌入特征（例如用户基于社交关系链的图嵌入表示）。

如图7所示，当用户1与用户5、用户7有社交关系时，则构建同质图中用户1与用户5、用户7之间的边。

参见图5，图5是本申请实施例提供的基于人工智能的数据处理方法的第三流程示意图，图5示出图3中的步骤102可以通过图5示出的步骤1021-步骤1023实现：在步骤1021中，确定社交同质图中目标对象的多个社交邻居对象；在步骤1022中，对目标对象以及每个社交邻居对象分别进行特征向量转换处理，得到目标对象的转换特征以及社交邻居对象的转换特征；在步骤1023中，对目标对象的转换特征以及每个社交邻居对象的转换特征进行注意力处理，得到目标对象的社交图嵌入特征。

例如，将对象节点i映射至特征空间，得到对象节点i的转换特征（即节点特征向量

，F表示相应的特征向量维度。其中，社交邻居对象为与目标对象具有社交关系的邻居对象。

在一些实施例中，对目标对象的转换特征以及每个社交邻居对象的转换特征进行注意力处理，得到目标对象的社交图嵌入特征，包括：对目标对象的转换特征以及每个社交邻居对象的转换特征进行自注意力处理，得到目标对象与每个社交邻居对象之间的注意力权重；基于每个社交邻居对象的转换特征以及注意力权重，确定目标对象的社交图嵌入特征。

需要说明的是，通过引入注意力机制来实现更好的邻居聚合。通过学习邻居的权重，可以实现对邻居的加权聚合。因此，不仅对于噪音邻居较为鲁棒，注意力机制也赋予了模型一定的可解释性。

在一些实施例中，对目标对象的转换特征以及每个社交邻居对象的转换特征进行自注意力处理，得到目标对象与每个社交邻居对象之间的注意力权重，包括：对目标对象的转换特征以及每个社交邻居对象的转换特征进行非线性映射处理，得到目标对象与每个社交邻居对象之间的注意力系数；对目标对象与每个社交邻居对象之间的注意力系数进行归一化处理，得到目标对象与每个社交邻居对象之间的注意力权重。

其中，对目标对象的转换特征以及每个社交邻居对象的转换特征进行非线性映射处理的计算过程如下公式所示：

，a表示一个

的映射，

表示一个权值矩阵，

表示目标对象i与社交邻居对象j之间的注意力系数（表示计算i与j之间的相关系数）。

其中，对目标对象与每个社交邻居对象之间的注意力系数进行归一化处理如下公式所示：

，其中，

表示目标对象i与社交邻居对象j之间的注意力权重，softmax表示归一化函数。

在一些实施例中，基于每个社交邻居对象的转换特征以及注意力权重，确定目标对象的社交图嵌入特征，包括：基于注意力权重对每个社交邻居对象的转换特征进行加权求和处理，得到目标对象的加权特征；对目标对象的加权特征进行映射处理，得到目标对象的社交图嵌入特征。

需要说明的是，映射处理可通过激活函数

实现，目标对象的社交图嵌入特征即对象基于社交关系链的图嵌入表示（graph embedding）。

在步骤103中，基于对象图嵌入特征、物品图嵌入特征、社交图嵌入特征以及目标对象的历史数据进行指标预测处理，得到目标物品对应目标对象的推荐指标。

例如，基于对象图嵌入特征、物品图嵌入特征、社交图嵌入特征以及目标对象的历史数据这四个维度的特征数据进行指标预测处理，通过提高特征数据的多样性，从而基于多样的特征数据进行指标预测，以提高推荐指标的准确性，进而提高推荐的准确性。

在一些实施例中，基于对象图嵌入特征、物品图嵌入特征、社交图嵌入特征以及目标对象的历史数据进行指标预测处理，得到目标物品对应目标对象的推荐指标，包括：获取目标对象的历史数据；对目标对象的历史数据进行向量映射处理，得到目标对象的历史特征；对对象图嵌入特征、物品图嵌入特征、社交图嵌入特征以及历史特征进行合并处理，得到合并特征；对合并特征进行指标映射处理，得到目标物品对应目标对象的推荐指标。

其中，目标对象的历史数据可以是目标对象的特征集合数据（例如年龄、兴趣），还可以是历史行为数据（例如购买行为数据、点击行为数据）。通过深度神经网络（DNN，DeepNeural Networks）构建的多层感知机（MLP，Multilayer Perceptron）对目标对象的历史数据进行向量映射处理，得到目标对象的历史特征（历史数据的向量表示）。将对象图嵌入特征、物品图嵌入特征、社交图嵌入特征以及历史特征进行合并后，通过分类器对合并特征进行指标映射处理，得到目标物品对应目标对象的推荐指标。

在步骤104中，基于目标物品对应目标对象的推荐指标执行推荐操作。

需要说明的是，推荐指标是用于指引是否进行推荐的指标，例如，目标对象是否会点击待推荐物品、目标对象是否对该待推荐物品感兴趣、目标对象是否会基于该待推荐物品进行转化、目标对象是否会评价该待推荐物品、目标对象是否会购买该待推荐物品等，则当目标物品对应目标对象的推荐指标指引进行推荐时，则将目标物品推荐给目标对象。

需要说明的是，推荐指标是用于指引进行推荐的概率，例如，目标对象点击待推荐物品的概率、目标对象基于该待推荐物品进行转化的概率，则获取所有物品对应所有对象的推荐指标，对所有物品对应所有对象的推荐指标进行降序排序，对排序在前的多个推荐指标对应的对象执行推荐操作，当目标物品对应目标对象的推荐指标属于排序在前的多个推荐指标时，将目标物品推荐给目标对象。

下面，将说明本申请实施例在一个实际的应用场景中的示例性应用。

本申请实施例的数据处理方法可应用于各种推荐场景，例如广告投放、视频推荐等。下面将以广告投放为例进行说明：

相关技术中，广告投放主要分为人工运营和算法建模两大类。人工运营的方案无法对受众数据包括年龄、兴趣、行为等进行综合的考量与分析，且人工运营效率较低；算法建模方案如一种用于分类和回归的模型（wide_and_deep）、深度推荐模型（deepfm）、深度兴趣模型（DIN）等，考虑维度比较单一，而且模型效果较差。

为了解决上述问题，本申请实施例提供一种基于图神经网络（GNN，Graph NeuralNetwork）与深度神经网络（DNN，Deep Neural Networks）的广告投放方法（由基于人工智能的数据处理方法实现），该方法基于轻量级图卷积网络构建用户-物品（usr-item）二分图，得到用户（usr）的交互行为图嵌入表示（graph embedding）和物品（item）的交互行为graphembedding；同时基于图注意力网络（GAT，Graph Attention Network）构建usr-usr社交（SNS）同质图，得到usr基于社交关系链的graph embedding，最后将usr的交互行为graphembedding、item的交互行为graph embedding、usr基于社交关系链的graph embedding与深度神经网络（DNN，Deep Neural Networks）构建的多层感知机（MLP，MultilayerPerceptron）层合并（concat），从而进行转化率（CVR，Conversion Rate）广告建模，并使用该方案预测对应广告的目标人群，并在公众号场景进行广告投放。如今算法已经融入到广告投放的方方面面，包括基础竞价、投放策略、投放分析等等。

下面具体说明本申请实施例的基于图神经网络与深度神经网络的广告投放方法：

首先，本申请实施例基于轻量级图卷积网络通过用户和物品交互行为，构建如图6所示的用户-物品二分图，以及用户与物品的邻接矩阵。如图6所示，当用户1与物品3、物品4有交互行为时，则构建用户-物品二分图中用户1与物品3、物品4之间的边，例如当物品为游戏时，则用户1注册了游戏3、游戏4；当物品为商品时，则用户1购买了商品3、商品4。需要说明的是，邻接矩阵是用户-物品二分图的一种矩阵形式。

需要说明的是，轻量级图卷积网络是一种轻型有效的图卷积神经网络（GCN），舍弃了GCN的特征变换和非线性激活，并通过实验验证了这两种操作对协同过滤是无效的。GCN的基本思想是通过在图上平滑特征，从而学习节点表示，为了达到此目的，迭代的从邻居节点聚合特征作为新的节点表示，如公式（1）所示：

（1）

其中，

表示用户节点在第k+1次的节点表示，

表示物品节点在第k次的节点表示，

表示用户节点的邻居节点，AGG表示一个聚合函数，是图数据卷积的核心。

在轻量级图卷积网络中，采用简单的加权求和方法，并且舍弃了特征变换和非线性激活，轻量级图卷积网络的轻量图卷积（LGC）操作如公式（2）所示：

（2）

其中，

表示用户节点在第k+1次图卷积操作的节点表示，

表示物品节点在第k+1次的节点表示，

表示物品节点的邻居节点。

在轻量级图卷积网络中，聚合只使用了邻居节点而没有整合节点自己（self-connections），层的组合（combination）操作在基本上可以取得与自连接（self-connections）一样的效果。

在轻量级图卷积网络中，训练用的模型参数只有第0层，即

表示所有用户节点，

表示所有物品节点，参数经过k层后，会得到最终表示，经过K层LGC之后，进一步结合在每一层得到的嵌入表示，形成一个用户节点或物品节点的最终嵌入表示，如公式（3）所示：

；

（3）

其中，

表示第k层嵌入的权重，第k层的权重可以被视为一个超参数来手动调整，也可以看成一个学习参数自动学习，

表示用户节点的最终嵌入表示，

表示物品节点的最终嵌入表示。

本申请实施例提供轻量级图卷积网络的矩阵形式。令用户与物品的邻接矩阵为

，其中，

表示用户与物品的交互矩阵，M和N分别表示用户数量和物品数量，如果u与i有交互行为，则

，否则

。

将轻量级图卷积网络的轻量图卷积（LGC）操作过程用等式表示为公式（4）：

（4）

其中，D是（M+N）*(M+N)的对角矩阵，用于对A进行归一化，其中每个元素

表示邻接矩阵A的第i行向量中非零项的个数（即度矩阵）。其中，第0层嵌入矩阵

，其中T表示嵌入大小。

最后的嵌入矩阵如公式（5）所示：

（5）

其中，

中对应用户节点的位置的向量表示用户节点的最终嵌入表示，

因此，基于轻量级图卷积网络构建的用户-物品二分图，得到usr的交互行为graphembedding和item的交互行为graph embedding。

接下来，本申请实施例基于用户之间的社交关系链构建如图7所示的usr-usr社交（SNS）同质图。如图7所示，当用户1与用户5、用户7有社交关系时，则构建同质图中用户1与用户5、用户7之间的边。

需要说明的是，GAT引入了注意力机制来实现更好的邻居聚合。通过学习邻居的权重，GAT可以实现对邻居的加权聚合。因此，GAT不仅对于噪音邻居较为鲁棒，注意力机制也赋予了模型一定的可解释性。

下面具体说明GAT的工作流程，其中，GAT的输入是一个节点特征向量集

，N表示节点的个数，F表示相应的特征向量维度。

（1）如图8所示计算注意力系数（attention coefficient）

首先，对于节点i，逐个计算节点i与节点i的邻居节点j之间的相关系数（即注意力系数）如公式（6）所示，然后对相关系数进行softmax归一化，得到节点之间的注意力权重如公式（7）所示：

（6）

（7）

其中，a表示一个

的映射，

表示一个权值矩阵。

（2）如图9所示进行加权求和（aggregate）

基于步骤（1）中计算的注意力权重，将节点特征进行加权求和，如公式（8）所示：

（8）

其中，

表示用户节点i基于社交关系链的graph embedding。

因此，对于同质图中的节点逐个计算它与邻居节点之间的注意力系数，然后对注意力系数进行softmax归一化，得到它与邻居节点之间的注意力权重，然后基于计算注意力权重，将特征进行加权求和，从而构建同质图模型，得到usr基于社交关系链的graphembedding。

如图10所示，本申请实施例使用轻量级图卷积网络构建的用户-物品（usr-item）二分图、基于GAT构建的SNS同质图，并合并（concat）深度神经网络（DNN，Deep NeuralNetworks）构建的多层感知机（MLP，Multilayer Perceptron）层输出的受众群体的用户的特征集合数据（如年龄、兴趣以及广告行为数据等），最后进行CVR分类。

综合上述方案，本申请实施例的整体方案如下：

（1）从用户行为角度构建usr-item二分图，学习到聚合有用户行为信息的usr的交互行为graph embedding以及item的交互行为graph embedding；

（2）从社交关系角度构建usr-usr同质图，学习到聚合有社交关系信息的usr基于社交关系链的graph embedding；

（3）将三种graph embedding与已有基于用户的特征集合数据或者历史行为数据合并在一起进行CVR分类，以确认对应广告的目标人群，并在公众号场景进行广告投放。

本申请实施例考虑到用户节点与物品节点之间的网络拓扑结构关系、用户节点与用户节点之间的网络拓扑结构关系，训练usr-embedding与item-embedding，并与已有的深度神经网络（DNN，Deep Neural Networks）构建的多层感知机层进行融合，同时考虑个体与群组信息进行建模；从多个维度建模，如DNN、联合建模、图建模，融合多个模型来提升整体投放效果。

本申请实施例提出的基于图神经网络与深度神经网络的广告投放方法，主要运用在公众号场景进行广告投放的任务中，模型（受试者工作特征曲线（ROC，ReceiverOperating Characteristic curve下与坐标轴围成的面积）达到84%。目前累计进行13次实验，核心观测指标投资回报率（ROI，Return On Investment）胜出11次，胜出率为84.6%；相对建模的对照组（本方案为实验组)，实验组累计额外带来点击人数+42551，下载人数+6212，注册人数+5223，付费人数+99，付费金额+12187.22。

至此已经结合本申请实施例提供的服务器的示例性应用和实施，说明本申请实施例提供的基于人工智能的数据处理方法。本申请实施例还提供数据处理装置，实际应用中，数据处理装置中的各功能模块可以由电子设备（如终端设备、服务器或服务器集群）的硬件资源，如处理器等计算资源、通信资源（如用于支持实现光缆、蜂窝等各种方式通信）、存储器协同实现。图2示出了存储在存储器550中的基于人工智能的数据处理装置555，其可以是程序和插件等形式的软件，例如，软件C/C++、Java等编程语言设计的软件模块、C/C++、Java等编程语言设计的应用软件或大型软件系统中的专用软件模块、应用程序接口、插件、云服务等实现方式，下面对不同的实现方式举例说明。

其中，数据处理装置555包括一系列的模块，包括第一特征提取模块5551、第二特征提取模块5552、预测模块5553以及推荐模块5554。下面继续说明本申请实施例提供的数据处理装置555中各个模块配合实现数据处理的方案。

在一些实施例中，所述第一特征提取模块还用于确定所述二分异质图中所述目标对象的邻居物品、以及所述二分异质图中所述目标物品的邻居对象；对所述目标对象的邻居物品进行多次图卷积处理，得到所述目标对象的多个对象特征；对所述多个对象特征进行聚合处理，得到所述目标对象的对象图嵌入特征；对所述目标物品的邻居对象进行多次图卷积处理，得到所述目标物品的多个物品特征；对所述多个物品特征进行聚合处理，得到所述目标物品的物品图嵌入特征。

在一些实施例中，所述图卷积处理是通过图卷积层实现的，所述图卷积层之间以级联形式连接；所述第一特征提取模块还用于通过所述级联形式的图卷积层中的第一个图卷积层，对所述目标对象的邻居物品的初始物品特征进行归一化处理，得到所述目标对象在第一个图卷积层的所述对象特征；将所述目标对象在第一个图卷积层的所述对象特征输出到后续级联的图卷积层，通过所述后续级联的图卷积层继续进行归一化处理，得到所述目标对象在后续级联的图卷积层的所述对象特征；通过所述级联形式的图卷积层中的第一个图卷积层，对所述目标物品的邻居对象的初始对象特征进行归一化处理，得到所述目标物品在第一个图卷积层的所述物品特征；将所述目标物品在第一个图卷积层的所述物品特征输出到后续级联的图卷积层，通过所述后续级联的图卷积层继续进行归一化处理，得到所述目标物品在后续级联的图卷积层的所述物品特征。

在一些实施例中，所述第一特征提取模块还用于通过所述级联形式的图卷积层的第j个图卷积层执行以下处理：针对所述目标对象的多个邻居物品中的第i个邻居物品执行以下处理：确定所述第i个邻居物品在第j-1个图卷积层的物品特征；确定所述第i个邻居物品的度以及所述目标对象的度；基于所述第i个邻居物品的度以及所述目标对象的度，对所述第i个邻居物品在第j个图卷积层的物品特征进行归一化处理，得到所述第i个邻居物品的归一化特征；对所述多个邻居物品分别对应的归一化特征进行加和处理，得到所述目标对象在第j个图卷积层的所述对象特征；其中，j为递增的自然数且取值范围为1<j≤J，J为所述图卷积层的数量，J为大于1的正整数，i为递增的自然数且取值范围为1≤i≤M，M为所述邻居物品的数量，M为正整数。

在一些实施例中，所述第一特征提取模块还用于确定所述二分异质图的邻接矩阵；基于所述邻接矩阵对所述二分异质图进行多次图卷积处理，得到所述二分异质图的多个嵌入矩阵；对所述多个嵌入矩阵进行聚合处理，得到所述二分异质图的目标嵌入矩阵；基于所述目标对象在所述目标嵌入矩阵的位置，从所述目标嵌入矩阵中提取出所述目标对象的对象图嵌入特征；基于所述目标物品在所述目标嵌入矩阵的位置，从所述目标嵌入矩阵中提取出所述目标物品的物品图嵌入特征。

在一些实施例中，所述图卷积处理是通过图卷积层实现的，所述图卷积层之间以级联形式连接；所述第一特征提取模块还用于通过所述级联形式的图卷积层中的第一个图卷积层，对所述二分异质图的初始嵌入矩阵以及所述邻接矩阵进行归一化卷积处理，得到所述二分异质图在第一个图卷积层的所述嵌入矩阵；将所述二分异质图在第一个图卷积层的所述嵌入矩阵输出到后续级联的图卷积层，通过所述后续级联的图卷积层继续进行归一化卷积处理，得到所述二分异质图在后续级联的图卷积层的所述嵌入矩阵。

在一些实施例中，所述第一特征提取模块还用于通过所述级联形式的图卷积层的第k个图卷积层执行以下处理：确定所述二分异质图的度矩阵；基于所述二分异质图的度矩阵对所述邻接矩阵进行归一化处理，得到归一化后的所述邻接矩阵；对归一化后的所述邻接矩阵、以及所述二分异质图在第k-1个图卷积层的所述嵌入矩阵进行卷积处理，得到所述二分异质图在第k个图卷积层的所述嵌入矩阵；其中，k为递增的自然数且取值范围为1<k≤K，K为所述图卷积层的数量，K为大于1的正整数。

在一些实施例中，所述第二特征提取模块还用于确定所述社交同质图中所述目标对象的多个社交邻居对象；对所述目标对象以及每个所述社交邻居对象分别进行特征向量转换处理，得到所述目标对象的转换特征以及所述社交邻居对象的转换特征；对所述目标对象的转换特征以及每个所述社交邻居对象的转换特征进行注意力处理，得到所述目标对象的社交图嵌入特征。

在一些实施例中，所述第二特征提取模块还用于对所述目标对象的转换特征以及每个所述社交邻居对象的转换特征进行自注意力处理，得到所述目标对象与每个所述社交邻居对象之间的注意力权重；基于每个所述社交邻居对象的转换特征以及所述注意力权重，确定所述目标对象的社交图嵌入特征。

在一些实施例中，所述第二特征提取模块还用于基于所述注意力权重对每个所述社交邻居对象的转换特征进行加权求和处理，得到所述目标对象的加权特征；对所述目标对象的加权特征进行映射处理，得到所述目标对象的社交图嵌入特征。

在一些实施例中，所述第二特征提取模块还用于对所述目标对象的转换特征以及每个所述社交邻居对象的转换特征进行非线性映射处理，得到所述目标对象与每个所述社交邻居对象之间的注意力系数；对所述目标对象与每个所述社交邻居对象之间的注意力系数进行归一化处理，得到所述目标对象与每个所述社交邻居对象之间的注意力权重。

在一些实施例中，所述预测模块还用于获取所述目标对象的历史数据；对所述目标对象的历史数据进行向量映射处理，得到所述目标对象的历史特征；对所述对象图嵌入特征、所述物品图嵌入特征、所述社交图嵌入特征以及所述历史特征进行合并处理，得到合并特征；对所述合并特征进行指标映射处理，得到所述目标物品对应所述目标对象的推荐指标。

本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该电子设备执行本申请实施例上述的基于人工智能的数据处理方法。

本申请实施例提供一种存储有可执行指令的计算机可读存储介质，其中存储有可执行指令，当可执行指令被处理器执行时，将引起处理器执行本申请实施例提供的基于人工智能的数据处理方法，例如，如图3-5示出的基于人工智能的数据处理方法。

在一些实施例中，计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器；也可以是包括上述存储器之一或任意组合的各种设备。

在一些实施例中，可执行指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言（包括编译或解释语言，或者声明性或过程性语言）来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例，可执行指令可以但不一定对应于文件系统中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言（HTML，Hyper TextMarkup Language）文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件（例如，存储一个或多个模块、子程序或代码部分的文件）中。

作为示例，可执行指令可被部署为在一个计算设备上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行。

可以理解的是，在本申请实施例中，涉及到用户信息等相关的数据，当本申请实施例运用到具体产品或技术中时，需要获得用户许可或者同意，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

以上所述，仅为本申请的实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本申请的保护范围之内。

Claims

1.一种基于人工智能的数据处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对包括目标对象以及目标物品的二分异质图进行特征提取处理，得到所述目标对象的对象图嵌入特征以及所述目标物品的物品图嵌入特征，包括：

确定所述二分异质图中所述目标对象的邻居物品、以及所述二分异质图中所述目标物品的邻居对象；

3.根据权利要求2所述的方法，其特征在于，

所述图卷积处理是通过图卷积层实现的，所述图卷积层之间以级联形式连接；

所述对所述目标对象的邻居物品进行多次图卷积处理，得到所述目标对象的多个对象特征，包括：

通过所述级联形式的图卷积层中的第一个图卷积层，对所述目标对象的邻居物品的初始物品特征进行归一化处理，得到所述目标对象在第一个图卷积层的所述对象特征；

所述对所述目标物品的邻居对象进行多次图卷积处理，得到所述目标物品的多个物品特征，包括：

4.根据权利要求3所述的方法，其特征在于，所述通过所述后续级联的图卷积层继续进行归一化处理，得到所述目标对象在后续级联的图卷积层的所述对象特征，包括：

通过所述级联形式的图卷积层的第j个图卷积层执行以下处理：

确定所述第i个邻居物品在第j-1个图卷积层的物品特征；

确定所述第i个邻居物品的度以及所述目标对象的度；

5.根据权利要求1所述的方法，其特征在于，所述对包括目标对象以及目标物品的二分异质图进行特征提取处理，得到所述目标对象的对象图嵌入特征以及所述目标物品的物品图嵌入特征，包括：

确定所述二分异质图的邻接矩阵；

6.根据权利要求5所述的方法，其特征在于，

所述基于所述邻接矩阵对所述二分异质图进行多次图卷积处理，得到所述二分异质图的多个嵌入矩阵，包括：

通过所述级联形式的图卷积层中的第一个图卷积层，对所述二分异质图的初始嵌入矩阵以及所述邻接矩阵进行归一化卷积处理，得到所述二分异质图在第一个图卷积层的所述嵌入矩阵；

7.根据权利要求6所述的方法，其特征在于，所述通过所述后续级联的图卷积层继续进行归一化卷积处理，得到所述二分异质图在后续级联的图卷积层的所述嵌入矩阵，包括：

通过所述级联形式的图卷积层的第k个图卷积层执行以下处理：

确定所述二分异质图的度矩阵；

8.根据权利要求1所述的方法，其特征在于，所述对包括所述目标对象的社交同质图进行特征提取处理，得到所述目标对象的社交图嵌入特征，包括：

确定所述社交同质图中所述目标对象的多个社交邻居对象；

9.根据权利要求8所述的方法，其特征在于，所述对所述目标对象的转换特征以及每个所述社交邻居对象的转换特征进行注意力处理，得到所述目标对象的社交图嵌入特征，包括：

对所述目标对象的转换特征以及每个所述社交邻居对象的转换特征进行自注意力处理，得到所述目标对象与每个所述社交邻居对象之间的注意力权重；

10.根据权利要求9所述的方法，其特征在于，所述基于每个所述社交邻居对象的转换特征以及所述注意力权重，确定所述目标对象的社交图嵌入特征，包括：

基于所述注意力权重对每个所述社交邻居对象的转换特征进行加权求和处理，得到所述目标对象的加权特征；

11.根据权利要求9所述的方法，其特征在于，所述对所述目标对象的转换特征以及每个所述社交邻居对象的转换特征进行自注意力处理，得到所述目标对象与每个所述社交邻居对象之间的注意力权重，包括：

对所述目标对象的转换特征以及每个所述社交邻居对象的转换特征进行非线性映射处理，得到所述目标对象与每个所述社交邻居对象之间的注意力系数；

12.根据权利要求1所述的方法，其特征在于，所述基于所述对象图嵌入特征、所述物品图嵌入特征、所述社交图嵌入特征以及所述目标对象的历史数据进行指标预测处理，得到所述目标物品对应所述目标对象的推荐指标，包括：

获取所述目标对象的历史数据；

13.一种基于人工智能的数据处理装置，其特征在于，所述装置包括：

14.一种电子设备，其特征在于，所述电子设备包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现权利要求1至12任一项所述的基于人工智能的数据处理方法。

15.一种计算机可读存储介质，其特征在于，存储有可执行指令，用于被处理器执行时实现权利要求1至12任一项所述的基于人工智能的数据处理方法。

16.一种计算机程序产品，包括计算机程序或指令，其特征在于，所述计算机程序或指令被处理器执行时实现权利要求1至12任一项所述的基于人工智能的数据处理方法。