CN117251820A

CN117251820A - 数据处理方法、装置、计算机设备和存储介质

Info

Publication number: CN117251820A
Application number: CN202210635330.2A
Authority: CN
Inventors: 高晓沨; 郑作武; 张长旺; 陈贵海; 尹红军
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-06-07
Filing date: 2022-06-07
Publication date: 2023-12-19

Abstract

本申请涉及一种数据处理方法、装置、计算机设备、存储介质和计算机程序产品。所述首先获取目标对象对应的对象属性树以及对象原始表示，以及标的物对应的标的物属性树以及标的物原始表示等用于数据处理的基础数据。而后通过节点信息的聚合，将对象属性树以及标的物属性树中地信息聚合为属性信息，再基于标的物原始表示，将目标对象属性信息与对象原始表示进行融合，得到对象融合表示，基于对象原始表示，将标的物属性信息与标的物原始表示进行融合，得到标的物融合表示，通过双重意向来将目标对象与标的物进行融合。最终得到目标对象与标的物之间的兴趣匹配的数据处理结果，提升兴趣预估的准确性。

Description

数据处理方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域，特别是涉及一种数据处理方法、装置、计算机设备和存储介质。

背景技术

随着计算机技术与人工智能(ArtificialIntelligence,AI)技术的发展，出现了机器学习(MachineLearning,ML)技术，机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。例如对于内容推荐的领域，可以通过机器学习技术来预估所推荐内容的点击率，从而保证内容推荐的效果。

目前的针对推荐内容进行点击率预估的数据处理过程一般可以通过用户兴趣模型来实现。然而用户兴趣模型往往是挖掘用户对于推荐内容的兴趣，但是忽略了用户对于推荐内容的不同属性特征的意向，同时推荐内容对于具备不同属性的用户群体，其受欢迎度也是不同的，因此通过用户兴趣模型来实现兴趣匹配数据处理的准确率较低。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高兴趣匹配准确率的数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

第一方面，本申请提供了一种数据处理预估方法。所述方法包括：

获取与目标对象的至少一部分属性相匹配的对象属性树以及目标对象的对象原始表示，并获取与标的物的至少一部分属性相匹配的标的物属性树以及标的物的标的物原始表示；

对每一所述对象属性树分别进行节点信息聚合处理，得到目标对象属性信息，对每一所述标的物属性树分别进行节点信息聚合处理，得到标的物属性信息；

基于所述标的物原始表示，将所述目标对象属性信息与所述对象原始表示进行融合，得到对象融合表示，基于所述对象原始表示，将所述标的物属性信息与所述标的物原始表示进行融合，得到标的物融合表示；

基于所述对象融合表示、所述标的物融合表示、所述目标对象属性信息以及所述标的物属性信息，对所述目标对象和所述标的物进行数据匹配处理，得到所述目标对象对所述标的物的数据处理结果。

第二方面，本申请还提供了一种数据处理装置。所述装置包括：

数据获取模块，用于获取与目标对象的至少一部分属性相匹配的对象属性树以及目标对象的对象原始表示，并获取与标的物的至少一部分属性相匹配的标的物属性树以及标的物的标的物原始表示；

信息聚合模块，用于对每一所述对象属性树分别进行节点信息聚合处理，得到目标对象属性信息，对每一所述标的物属性树分别进行节点信息聚合处理，得到标的物属性信息；

信息融合模块，用于基于所述标的物原始表示，将所述目标对象属性信息与所述对象原始表示进行融合，得到对象融合表示，基于所述对象原始表示，将所述标的物属性信息与所述标的物原始表示进行融合，得到标的物融合表示；

数据处理模块，用于基于所述对象融合表示、所述标的物融合表示、所述目标对象属性信息以及所述标的物属性信息，对所述目标对象和所述标的物进行数据匹配处理，得到所述目标对象对所述标的物的数据处理结果。

第三方面，本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

第四方面，本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

第五方面，本申请还提供了一种计算机程序产品。所述计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现以下步骤：

上述数据处理方法、装置、计算机设备、存储介质和计算机程序产品，首先获取目标对象对应的对象属性树以及对象原始表示，以及标的物对应的标的物属性树以及标的物原始表示等用于数据处理的基础数据。而后通过节点信息的聚合，将对象属性树以及标的物属性树中地信息聚合为属性信息，再基于标的物原始表示，将目标对象属性信息与对象原始表示进行融合，得到对象融合表示，基于对象原始表示，将标的物属性信息与标的物原始表示进行融合，得到标的物融合表示，通过双重意向来将目标对象与标的物进行融合。最终基于得到的对象融合表示、标的物融合表示、目标对象属性信息以及标的物属性信息，来得到目标对象与标的物之间的兴趣匹配的数据处理结果，提升兴趣预估的准确性。

附图说明

图1为一个实施例中数据处理方法的应用环境图；

图2为一个实施例中数据处理方法的流程示意图；

图3为一个实施例中对象属性树的示意图；

图4为一个实施例中标的物属性树的示意图；

图5为一个实施例中标的物数据集的示意图；

图6为一个实施例中得到对象融合表示的流程示意图；

图7为一个实施例中的预设对象标的物交互图；

图8为一个实施例中数据处理方法的简要流程框图；

图9为一个实施例中数据处理装置的结构框图；

图10为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请涉及人工智能领域，是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。而本申请具体涉及到了人工智能中的机器学习技术。

在本文中，需要理解的是，所涉及的术语：

深度神经网络(DeepNeuralNetwork，DNN)：是一种拥有多层隐藏层的神经网络，是目前最流行最有效的点击率预测模型。

循环神经网络(RecurrentNeuralNetwork，RNN)：是一类以序列数据为输入，在序列的演进方向进行递归且所有节点(循环单元)按链式连接的递归神经网络。

门控循环单元(GateRecurrentUnit，GRU)：是循环神经网络的一种，旨在解决标准循环神经网络中出现的梯度消失问题。

嵌入(Embedding)：一个将离散变量转为连续向量表示的方法。深度神经网络模型普遍会把离散特征转换为嵌入向量，拼接或者进行其他处理之后作为模型的输入层。

求和/平均初花(Sum/MeanPooling)：求和池化/平均池化，即对局部接受域中的所有值求和或求均值。

点击率(Click-ThroughRate，CTR)。

转化率(ConversionRate，CVR)。

本申请实施例提供的数据处理方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上，也可以放在云上或其他服务器上。当终端102方的工作人员需要为数据库中的个人对象进行内容推荐时，需要确定与其数据处理的标的物，因此可以通过本申请的数据处理方法来进行对象与标的物之间的数据处理，提高推荐成功率。首先终端102方的工作人员可以将目标对象以及标的物发送至服务器104，服务器104获取与目标对象的至少一部分属性相匹配的对象属性树以及目标对象的对象原始表示，并获取与标的物的至少一部分属性相匹配的标的物属性树以及标的物的标的物原始表示；对每一对象属性树分别进行节点信息聚合处理，得到目标对象属性信息，对每一标的物属性树分别进行节点信息聚合处理，得到标的物属性信息；基于标的物原始表示，将目标对象属性信息与对象原始表示进行融合，得到对象融合表示，基于对象原始表示，将标的物属性信息与标的物原始表示进行融合，得到标的物融合表示；基于对象融合表示、标的物融合表示、目标对象属性信息以及标的物属性信息，对目标对象和标的物进行数据匹配处理，得到目标对象对标的物的数据处理结果。而后终端102可以根据数据处理结果向目标对象进行标的物推荐。其中，终端102可以但不限于是各种台式计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备，物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种数据处理方法，以该方法应用于图1中的服务器104为例进行说明，包括以下步骤：

步骤201，获取与目标对象的至少一部分属性相匹配的对象属性树以及目标对象的对象原始表示，并获取与标的物的至少一部分属性相匹配的标的物属性树以及标的物的标的物原始表示。

其中，目标对象是指本申请的数据处理方法所指定的匹配对象，具体可以是指用户，如视频应用的用户或者游戏用户等。标的物则是指等待向目标对象进行推荐的物品、信息或者其他可以进行推荐的数据。具体地，标的物可以为图书等物体或者视频广告等内容信息。可以视目标对象对标的物的数据处理结果，决定是否向目标对象推荐该标的物。数据处理即估计目标对象对标的物的感兴趣程度，从而为目标对象推荐其感兴趣的标的物，或者将标的物推荐给对其感兴趣的对象等。属性可以理解为对象或者标的物所携带的标签，对于对象，其属性可以包括性别、年龄、学历、地域以及喜好等内容。而对于标的物，其属性可以包括标的物编号、出品商、所属行业、所属类别以及所属品牌等。属性具体根据数据处理应用的领域进行不同的划分。对象属性树则是基于不同属性之间的依赖关系所构建出来的一种数据结构。可以基于不同属性之间的依赖关系，来构建不同的对象属性树，如在一个具体的实施例中，目标对象为具体地用户，对象属性具体包括了性别、年龄、所属城市、所属国家等。此时可以构建出的对象属性树可以参照图3所示，所属城市与所属国家存在这明显的依赖关系，因此可以将所属城市作为用户的父节点，而所属国家作为所属城市的更上一级父节点，从而构建3个对象属性树，每一个对象属性树与相关联的一部分对象属性相匹配。类似的，在另一个实施例中，标的物为广告，此时标的物属性具体包括了广告商(advertiser)、行业(industry)、站点(site)、类别(category)以及品牌(brand)等，此时可以识别出广告商与行业存在上下级关系，站点与类别存在上下级关系，此时可以根据这种上下级关系分别构建出3个标的物属性树，每一个标的物属性树与相关联的一部分标的物属性相匹配。所构建的标的物属性树具体可以参照图4所示。对象原始表示为将目标对象通过嵌入(Embedding)的方式转化得到的向量表示，嵌入可以将一个将离散变量转为连续向量表示，通过嵌入方式可以将目标对象转化为目标对象对应的连续向量。同理，可以将标的物也转化为标的物对应的连续向量，即标的物的标的物原始表示。

具体地，当工作人员需要对目标对象进行标的物推荐，或者需要将标的物推荐给不同对象时，可以先对对象以及标的物进行匹配，确定对象对标的物的数据处理结果，在确定对象对标的物感兴趣之后，再将标的物推荐给用户，提高推荐成功率。此时，工作人员可以根据实际需要，通过终端102指定若干的对象与若干的标的物给到服务器104，如工作人员需要为一个对象推荐若干的标的物，则可以指定一个目标对象与多个待推荐的标的物。而工作人员需要将一个标的物推荐给多个对象时，则可以指定多个目标对象与一个待推荐的标的物。同理，目标人员也可以指定一个对象与一个标的物，确定他们之间的数据处理结果，或者指定多个对象与多个标的物，确定每个对象与每个标的物之间的数据处理结果。当服务器104接收到终端102指定的目标对象与标的物之后，可以对齐进行数据处理，每次对一个目标对象一个标的物进行匹配。首先，得到与目标对象的至少一部分属性相匹配的对象属性树，同时对指定的目标对象进行嵌入处理，得到目标对象的对象原始表示。得到与标的物的至少一部分属性相匹配的标的物属性树，并对指定的标的物进行嵌入处理，得到标的物的标的物原始表示。在其中一个实施例中，本申请的数据处理方法具体用于进行视频应用中的内容推荐，此时目标对象具体可以是指视频应用的某个指定用户，而标的物则是待推荐的多个内容，推荐即为从待推荐的多个内容中，识别出目标对象较为感兴趣的部分内容。首先，服务器获取视频用户所对应的对象属性树，同时通过嵌入的方式将该指定的用户转化为对象原始表示，同时从待推荐的多个内容中选取一个作为本次匹配的标的物，并得到标的物对应的对象属性树，并通过嵌入的方式将该标的物转化为标的物原始表示。

步骤203，对每一对象属性树分别进行节点信息聚合处理，得到目标对象属性信息，对每一标的物属性树分别进行节点信息聚合处理，得到标的物属性信息。

其中，节点信息聚合是指将一个对象属性树或标的物属性树中不同节点的信息聚合提取上级节点中，通过聚合可以有效提高数据处理过程的处理效率与准确率。目标对象属性信息则是指将一个属性与其子节点属性结合后得到属性信息，通过优化后的目标对象属性信息可以有效地对目标对象所具备属性进行有效展示。同理，可以得到优化后的标的物属性信息。

具体地，现有的特征交互类方法会将标的物的属性特征转化为独热向量(one-hot向量)，即有且只有一个元素为1，其余元素都为0的向量，而后再将这些特征输入到机器学习模型中实现数据处理，然而申请人发现，这些属性之间是存在联系和依赖关系的，比如对于广告领域，一个广告属于一个广告主，一个广告主又对应着一个行业。所以仅仅使用稀疏向量来表示每个属性特征是不充分的，为了提高数据处理准确率应当将其中隐含的结构信息考虑进来。因此本申请的方案通过建立属性树来挖掘属性之间隐含的结构信息。因此当得到与目标对象的至少一部分属性相匹配的对象属性树，以及与标的物的至少一部分属性相匹配的标的物属性树后，为了对属性表示进行优化处理，可以通过聚合的方式对对象属性树以及标的物属性树进行节点信息聚合，将节点的信息聚集到更高级的节点中，实现同一对象属性树中关联属性的融合，同时实现同一标的物属性树中关联属性的融合。

步骤205，基于标的物原始表示，将目标对象属性信息与对象原始表示进行融合，得到对象融合表示，基于对象原始表示，将标的物属性信息与标的物原始表示进行融合，得到标的物融合表示。

其中，对象融合表示具体用于表征对象对不同标的物属性信息的意向，而标的物融合表示则用于表征标的物对不同目标对象属性信息的意向。通过对象融合表示可以不同标的物属性对于对象而言的受欢迎程度，而通过标的物融合表示可以不同目标对象属性对于标的物而言的受欢迎程度。

具体地，现有的数据处理方法往往是研究对象对于不同标的物的兴趣，但是忽略了用户对于不同标的物属性的意向，比如一个用户之所以点击某个广告，是因为他喜欢这个种类的广告。其次，一条广告对于不同的对象群体，其受欢迎度也是不同的。比如年轻女性可能喜欢点击美妆类广告，而年轻男性倾向于点击游戏类广告。应当对不同属性的意向进行挖掘建模，增强模型的可解释性。即本申请可以在得到优化后的标的物属性信息后，将其与对象原始表示进行融合，从而挖掘用户对于不同标的物属性的意向，得到对象融合表示。同理，可以将优化后的目标对象属性信息与标的物原始表示进行融合，从而挖掘标的物对于不同对象属性的意向，得到标的物融合表示。在一个具体的实施例中，本申请的方案具体用于对识别目标对象对于不同类型广告的兴趣，此时可以通过节点信息聚合得到广告所对应的不同类型的标的物属性信息，以及目标对象对应的不同类型的目标对象属性信息，而后针对每个类型的标的物属性或者目标对象属性信息，都可以通过注意力机制为其分配一个对应的权重。而后可以将对象原始表示与各个类型的目标对象属性信息进行融合，得到对象对各个标的物属性信息意向的对象融合表示。同理，可以将标的物原始表示与各个类型的标的物属性信息进行融合，得到标的物对各个对象属性信息意向的标的物融合表示。

步骤207，基于对象融合表示、标的物融合表示、目标对象属性信息以及标的物属性信息，对目标对象和标的物进行数据匹配处理，得到目标对象对标的物的数据处理结果。

其中，数据匹配处理的目的具体是指找到目标对象感兴趣的标的物，或者为标的物匹配到对齐感兴趣的对象。数据处理结果具体可以用目标对象与标的物的匹配度来表示，匹配度越高，目标对象对标的物的兴趣越大。

具体地，本申请的方案具体应用于机器学习模型的输入层，通过对输入数据处理模型的数据进行优化，来实现更准确的匹配。因此，在得到对象融合表示、标的物融合表示、目标对象属性信息以及标的物属性信息这些优化后的对象表示，标的物标识以及属性表示后，可以基于预设的机器学习模型来对目标对象与标的物的兴趣进行匹配得到其相应的数据处理结果。在其中一个实施例中，本申请的方法具体用于通过数据处理结果为目标对象推送视频广告。因此，标的物为视频广告，此时可以将目标对象与备选的多个视频广告进行数据处理，得到目标对象对于不同视频广告的匹配度，最后将匹配度较高的若干个视频广告推送至目标对象。而在另一个实施例中，本申请的方法用于通过数据处理结果为将目标视频广告推送给用户，此时可以将目标视频广告与备选的多个用户进行数据处理，得到目标视频广告对于不同用户的匹配度，最终将目标视频广告推送至匹配度较高的若干个用户。

上述数据处理方法，首先获取目标对象对应的对象属性树以及对象原始表示，以及标的物对应的标的物属性树以及标的物原始表示等用于数据处理的基础数据。而后通过节点信息的聚合，将对象属性树以及标的物属性树中地信息聚合为属性信息，再基于标的物原始表示，将目标对象属性信息与对象原始表示进行融合，得到对象融合表示，基于对象原始表示，将标的物属性信息与标的物原始表示进行融合，得到标的物融合表示，通过双重意向来将目标对象与标的物进行融合。最终基于得到的对象融合表示、标的物融合表示、目标对象属性信息以及标的物属性信息，来得到目标对象与标的物之间的兴趣匹配的数据处理结果，提升兴趣预估的准确性。

在一个实施例中，步骤203包括：识别各个对象属性树中各个节点的上下级关系；基于各个节点的上下级关系识别对象属性树中各节点对应的子节点；将各个对象属性树中的子节点的节点信息，聚合至子节点对应的上级父节点中，得到各个对象属性树对应的目标对象属性信息。

其中，对象属性树具体由属性以及对象构成，对象为对象属性树中的叶子节点，而属性则依据其依赖关系，占据不同层级的父节点。因此，在进行节点信息聚合时，需要先识别出不同节点之间的上下级关系，而后才可以将下级节点信息聚合到上级节点中，保证节点信息聚合有效性。将子节点的节点信息聚合到父节点之后，就可以通过多个父节点的节点信息，得到对象属性树对应的目标对象属性信息。

具体地，在对对象属性树中的节点进行信息聚合时，一般可以采用图卷积来进行聚合，但是由于不同的属性具有不同的语义信息，比如广告主和商品价格两种属性，其语义和数据分布完全不同，如果使用传统的图卷积方式来进行聚合，在聚合不同邻居节点的信息时，可能会引入一些额外的噪声。因此在本申请中，提出了一种自底向上的聚合策略，来将对象属性树中的节点信息进行融合，当需要学习对象属性树中父节点的属性信息时，可以将其对应的下级子节点的信息自底而上的聚合到父节点中，得到聚合后的父节点属性表示。而后，还可以将父节点的属性表示再聚合到更上一级的父节点中。最终，通过聚合后的父节点所对应的属性表示，来得到各个对象属性树对应的目标对象属性信息。而所有对象属性树的目标对象属性信息综合起来，即为目标对象所对应的属性信息。同理，对于标的物属性树的节点信息聚合，可以将标的物属性树中的节点信息自底而上地从下级节点聚合到对应的上级父节点中，最终综合所有的标的物属性树对应的标的物属性信息，即为标的物所对应的属性信息。在其中一个实施例中，本申请的方案用于对实现用户对广告的数据处理，此时标的物具体为广告，而其标的物属性树具体可以参照图4所示。当需要进行节点信息聚合时，可以对于第一个标的物属性树，可以将广告主下三个广告的信息聚合分别聚合到上级的广告主中，得到两个关于广告主的属性信息，再将两个广告主的属性信息聚合到行业中，得到一个关于行业的属性信息。同理，可以得到两个站点的属性信息，一个类别的属性信息以及一个品牌的属性信息，将这些属性信息综合起来，即为广告所对应的标的物属性信息。本实施例中，通过自底而上的节点信息聚合，可以有效减少属性聚合过程中的噪声，从而保证数据处理的准确率。

在其中一个实施例中，将各个对象属性树中的子节点的节点信息，聚合至子节点对应的上级父节点中，得到各个对象属性树对应的目标对象属性信息包括：计算子节点对应的上级父节点与子节点之间的哈达玛积，得到第一聚合结果；将子节点对应的上级父节点与子节点进行向量拼接，得到第二聚合结果；根据第一聚合结果以及第二聚合结果，得到各个对象属性树对应的目标对象属性信息。

其中，哈达玛积即element-wiseproduct，其符号为⊙，是指“元素层面上的乘积”，即两个向量按元素一个一个地相乘，组成一个新的向量，结果向量与原向量尺寸相同。而向量拼接的符号为⊕，其指的是将两个向量拼接为一个向量。

具体地，本申请的方案具体通过两种交互方式建模融合来将子节点中的信息聚合到父节点中，从而得到优化后的父节点的属性表示，进而得到对象属性树对应的目标对象属性信息。在其中一个实施例中，在进行聚合时具体可以通过以下聚合函数来实现聚合。

其中，e_H表示父节点，表示子节点的集合，/>表示将子节点/>中的信息聚合到父节点e_h后所得到的父节点的属性表示，/>为第一聚合结果，/>为第二聚合结果，σ为激活函数，此处使用的为sigmoid激活函数(S型生长曲线)，W₁，W₂以及W₃是参数矩阵，随机初始化的，在聚合函数的训练过程中可以随梯度随时更新。本实施例中，通过哈达玛积和向量拼接来将子节点的节点信息进行聚合，可以有效保证节点信息聚合过程的有效性，从而保证数据处理的准确率。

在其中一个实施例中，获取与目标对象的至少一部分属性相匹配的对象属性树包括：获取对象数据集；基于预设对象属性树结构遍历对象数据集，构建对象属性树。

其中，预设对象属性树具体由工作人员根据需要匹配的目标对象以及标的物所需要的属性进行选取并构造。对象数据集中包含了若干的对象数据，而每个对象数据都包含了各类对象属性的具体数值。同理，对于标的物属性树，同样可以基于标的物数据集构建，标的物数据集中包含多个标的物数据，每个标的物数据都包含了各类标的物属性的具体数值。

具体地，当需要进行数据处理时，服务器104需要预先构造出与目标对象的至少一部分属性相匹配的对象属性树，同时还需要构造与标的物的至少一部分属性相匹配的标的物属性树。工作人员可以根据实际数据处理需要，确定需要进行匹配的对象与标的物，而后指定参与匹配的对象属性与标的物属性，并基于指定参与匹配的对象属性与标的物属性，构建相应的对象数据集以及标的物数据集。同时，工作人员可以参考对象属性之间的关联以及标的物属性之间的关联，构造出相应的预设属性树，如对于广告领域，广告的标的物属性具体包括了广告商(advertiser)、行业(industry)、站点(site)、类别(category)以及品牌(brand)，标的物数据集具体可以参照图5所示。通过总结属性间的依赖关系，可以得到标的物属性树。其中第一个标的物属性树，广告-广告商-行业，第二个标的物属性树，广告-站点-类别，第三个标的物属性树，广告-品牌。在得到三个预设标的物属性树后，再遍历标的物数据集，从而将数据集中的数据填充到标的物属性树中，得到最终可用的标的物属性树。同理，对于对象属性树亦可参照标的物属性树进行相应的构建。本实施例中，通过遍历数据集，可以有效地构造出对象属性树以及标的物属性树，从而有效利用属性之间的依赖关系，保证数据处理的准确率。

在其中一个实施例中，如图6所示，步骤205包括：

步骤601，基于标的物原始表示，得到各类目标对象属性对应的属性权重，各类目标对象属性对应的属性权重通过注意力机制确定。

步骤603，基于各类目标对象属性对应的属性权重，将目标对象属性信息与对象原始表示进行融合，得到对象属性融合结果。

步骤605，基于对象属性融合结果，通过图卷积对预设对象标的物交互图进行卷积处理，得到预设对象标的物交互图中各阶邻居节点对应的对象表示。

步骤607，将各阶邻居节点对应的对象表示进行总和池化处理，得到对象融合表示。

其中，目标对象属性对应的属性权重是一种通过注意力机制动态学习得到的权重参数，用于表征标的物对于不同属性用户的受欢迎程度。注意力机制是机器学习中的一种数据处理方法，广泛应用在自然语言处理、图像识别及语音识别等各种不同类型的机器学习任务中。主要用于从众多信息中选择出对当前任务目标更关键的信息。本申请的方案中通过注意力机制来实现权重分配。预设对象标的物交互图通过对象与标的物交互的数据集建立，如数据集为广告类数据集，则统计的每天样本包括对象特征和广告特征，以及是否点击，如果对象点击了广告就把用户和广告连一条边，最终形成一个预设对象标的物交互图，预设对象标的物交互图的示例可以参照图7所示，图中对象包括了u1、u2、u3、u4以及u5，而标的物包括了i1、i2、i3、i4以及i5。两者间的连线代表了两者间的交互关系，如对于广告，如果用户u1点击了i1和i2两个广告，则将u1与i1和i2连接。而邻居节点则指的是与当前节点连接的点，一阶邻居节点就是指经过一条边连接的点，二阶邻居节点就是一阶节点再连一条边，连两次。如对于图7，u1的一阶邻居节点是i1和i2，二阶邻居节点是u2和u3。图卷积是一种用于对图数据进行深度学习的方法，用于从图数据中提取特征，本申请的方案中通过图卷积来生成各阶邻居节点对应的对象表示。总和池化处理即sumpooling，通过将各阶邻居节点的对象表示进行总和池化，可以得到最终的对象表示。

具体地，本申请的方案在进行目标对象属性信息与对象原始表示的融合处理时，首先会需要通过标的物原始表示，来确定各类对象属性所对应的属性权重，将各类目标对象属性结合对应权重后，融合到对象原始表示中，得到相应的对象属性融合结果。在得到对象属性融合结果后，再通过图卷积的方式，求取图网络中各阶邻居节点下的对象表示，从而将对象与标的物的交互信息再融合到用户表示中。在其中一个实施例中，在对目标对象属性信息与对象原始表示进行融合时，可以用α(v,a)表示标的物v对不同对象属性a的受欢迎程度，其通过注意力机制确定属性权重的计算公式为：

其中，为标的物v的标的物原始表示,e_a为目标对象属性a的嵌入表示。A_u是所有目标对象属性构建的一个集合。而将所有的目标对象属性信息与对象原始表示进行融合，得到对象属性融合结果的计算公式则为：

在上述公式确定对象属性融合结果后，即可将上述得到的送入图网络中，得到预设对象标的物交互图中后续各阶邻居节点对应的对象表示，各阶邻居节点对应的对象表示具体可以通过以下公式计算：

其中，N_u表示目标对象u的邻居节点。通过上述公式确定目标对象u的各个邻居节点后，当考虑L阶邻居节点的信息时，可以获得L个对象的表示，最后将其做综合池化来得到最终优化后的对象表示，其计算公式具体为：

本实施例中，通过注意力机制确定标的物对于不同属性的对象受欢迎程度，来确定属性权重，从而将各个对象属性融合到对象原始表示中，并通过图卷积等方式来优化对象表示，可以有效保证对象表示的有效性，从而提高数据处理的准确率。

在其中一个实施例中，步骤205还包括：基于对象原始表示，得到各类标的物属性对应的属性权重，各类标的物属性对应的属性权重通过注意力机制确定；基于各类标的物属性对应的属性权重，将标的物属性信息与标的物原始表示进行融合，得到标的物属性融合结果；基于标的物属性融合结果，通过图卷积对预设对象标的物交互图进行卷积处理，得到预设对象标的物交互图中各阶邻居节点对应的标的物表示；将各阶邻居节点对应的标的物表示进行总和池化处理，得到标的物融合表示。

其中，标的物属性对应的属性权重是一种通过注意力机制动态学习得到的权重参数，用于表征用户对于不同标的物属性的意见。注意力机制是机器学习中的一种数据处理方法，广泛应用在自然语言处理、图像识别及语音识别等各种不同类型的机器学习任务中。主要用于从众多信息中选择出对当前任务目标更关键的信息。

具体地，参照对象属性的融合过程，本申请的方案在进行标的物属性信息与标的物原始表示的融合处理时，首先会需要通过对象原始表示，来确定各类标的物属性所对应的属性权重，将各类标的物属性结合对应权重后，融合到标的物原始表示中，得到相应的标的物属性融合结果。在得到标的物属性融合结果后，再通过图卷积的方式，求取图网络中各阶邻居节点下的标的物表示，从而将对象与标的物的交互信息再融合到标的物表示中。在其中一个实施例中，在对标的物属性信息与标的物原始表示进行融合时，可以用α(u,a)表示对象u对不同标的物属性a的意向，其通过注意力机制确定属性权重的计算公式为：

其中，为对象u的对象原始表示,e_a为标的物属性a的嵌入表示。A_v是所有标的物属性构建的一个集合。而将所有的标的物属性信息与标的物原始表示进行融合，得到对象属性融合结果的计算公式则为：

其中，N_v表示标的物v的邻居节点。通过上述公式确定目标对象v的各个邻居节点后，当考虑L阶邻居节点的信息时，可以获得L个对象的表示，最后将其做综合池化来得到最终优化后的对象表示，其计算公式具体为：

本实施例中，通过注意力机制确定对象对于不同标的物属性的意向，来确定属性权重，从而将各个标的物属性融合到标的物原始表示中，并通过图卷积等方式来优化标的物表示，可以有效保证标的物表示的有效性，从而提高数据处理的准确率。

在其中一个实施例中，步骤207包括：将对象融合表示、标的物融合表示、目标对象属性信息以及标的物属性信息输入预设特征交互模型，以对目标对象和标的物进行数据匹配处理，得到目标对象对标的物的数据处理结果。

具体地，本申请的方案具体应用于机器学习模型的输入层，用于对输出预设特征交互模型中的数据进行优化。本申请的方案中所得到的对象融合表示、标的物融合表示、目标对象属性信息以及标的物属性信息都以嵌入向量的形式进行表示，在得到这些数据后，可以将对象融合表示、标的物融合表示、目标对象属性信息以及标的物属性信息结合，构建一组输入数据，并将该输入数据输入到预设特征交互模型中，通过特征交互模型来进行特征提取，特征匹配以及特征交叉等处理，最终得到目标对象与标的物之间的数据处理结果。具体地，本申请中所使用的预设特征交互模型具体可以为DeepFM(深度因子分解机)模型，而本申请的方案则具体用于向视频网站的用户推荐视频广告，因此对象具体为用户，而标的物则为视频广告。当得到用户融合表示、视频广告融合表示、用户的属性信息以及视频属性信息这四个信息数据后，可以将四个信息列为同一组数据，而后将得到的数据输入到已经训练完成的DeepFM模型中。而在DeepFM模型中，这些数据在FM结构中显示交互作用，以及在DNN结构中隐式交互作用，最后将两者相加，模型输出的即为预测得到的用户与视频广告之间的匹配值，最终服务器依据该匹配值，可以得到输入的这一组数据中的用户与视频广告是否互相匹配的数据处理结果，最后依据各组数据对应的数据处理结果来向用户推荐视频广告。本实施例中，通过预设特征交互模型结合本申请得到的对象融合表示、标的物融合表示、目标对象属性信息以及标的物属性信息等四个输入层数据来进行数据处理，可以有效提高数据处理的准确率。

本申请还提供一种应用场景，该应用场景应用上述的数据处理方法。具体地，该数据处理方法在该应用场景的应用如下：

当视频网站的运营商需要为视频网站用户推送视频广告时，为了提高广告推送的成功率，可以预先确定目标用户的兴趣，此时，可以通过本申请的数据处理方法来确定目标用户与待推荐的多个视频广告的数据处理结果，确定用户与视频广告之间的匹配度，而后推送与目标用户匹配度较高的视频广告至用户，来完成视频广告的推荐过程。总体的流程框图可以参照图8所示，首先，用于数据处理的服务器可以先建立视频广告对应的标的物属性树以及目标用户对应的对象属性树，同时对目标用户以及视频广告分别进行嵌入编码，得到目标用户的对象原始表示以及视频广告的标的物原始表示。在这个过程中，对象属性树具体可以通过遍历目标用户对应的对象数据集构建，而标的物属性树则通过遍历视频广告的标的物数据集构建。在得到对象属性树以及标的物属性树之后，可以对每一对象属性树分别进行节点信息聚合处理，得到目标对象属性信息，对每一标的物属性树分别进行节点信息聚合处理，得到标的物属性信息。聚合过程具体可以采用自底而上的聚合方式，即通过哈达玛积和向量拼接，基于属性之间的依赖关系，将下级节点中的节点信息聚合到上级的父节点中，得到优化之后的属性表示。之后，需要将得到的对象属性信息与对象原始表示进行融合，从而优化对象表示，该过程需要结合标的物对不同对象属性的对象而言的受欢迎程度确定。可以先基于标的物原始表示，得到各类目标对象属性对应的属性权重，各类目标对象属性对应的属性权重通过注意力机制确定；基于各类目标对象属性对应的属性权重，将目标对象属性信息与对象原始表示进行融合，得到对象属性融合结果；基于对象属性融合结果，通过图卷积对预设对象标的物交互图进行卷积处理，得到预设对象标的物交互图中各阶邻居节点对应的对象表示；将各阶邻居节点对应的对象表示进行总和池化处理，得到对象融合表示。同理对于原始标的物表示的优化，可以先基于对象原始表示，得到各类标的物属性对应的属性权重，各类标的物属性对应的属性权重通过注意力机制确定；基于各类标的物属性对应的属性权重，将标的物属性信息与标的物原始表示进行融合，得到标的物属性融合结果；基于标的物属性融合结果，通过图卷积对预设对象标的物交互图进行卷积处理，得到预设对象标的物交互图中各阶邻居节点对应的标的物表示；将各阶邻居节点对应的标的物表示进行总和池化处理，得到标的物融合表示。最终，将得到对象融合表示、标的物融合表示、目标对象属性信息以及标的物属性信息这四个信息输入到预设特征交互模型，以对目标对象和标的物进行数据匹配处理，得到目标对象对标的物的数据处理结果。通过将目标用户与多个待推荐的视频广告进行数据处理的处理，可以得到各个视频广告所对应的推荐度，而后基于将推荐度较高的几个视频广告推荐给到目标用户端，实现视频广告的推荐处理。

应该理解的是，虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本申请实施例还提供了一种用于实现上述所涉及的数据处理方法的数据处理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个数据处理装置实施例中的具体限定可以参见上文中对于数据处理方法的限定，在此不再赘述。

在一个实施例中，如图9所示，提供了一种数据处理装置，包括：

数据获取模块902，用于获取与目标对象的至少一部分属性相匹配的对象属性树以及目标对象的对象原始表示，并获取与标的物的至少一部分属性相匹配的标的物属性树以及标的物的标的物原始表示。

信息聚合模块904，用于对每一对象属性树分别进行节点信息聚合处理，得到目标对象属性信息，对每一标的物属性树分别进行节点信息聚合处理，得到标的物属性信息。

信息融合模块906，用于基于标的物原始表示，将目标对象属性信息与对象原始表示进行融合，得到对象融合表示，基于对象原始表示，将标的物属性信息与标的物原始表示进行融合，得到标的物融合表示。

数据处理模块908，用于基于对象融合表示、标的物融合表示、目标对象属性信息以及标的物属性信息，对目标对象和标的物进行数据匹配处理，得到目标对象对标的物的数据处理结果。

在一个实施例中，信息聚合模块904具体用于：识别各个对象属性树中各个节点的上下级关系；基于各个节点的上下级关系识别对象属性树中各节点对应的子节点；将各个对象属性树中的子节点的节点信息，聚合至子节点对应的上级父节点中，得到各个对象属性树对应的目标对象属性信息。

在一个实施例中，信息聚合模块904还用于：计算子节点对应的上级父节点与子节点之间的哈达玛积，得到第一聚合结果；将子节点对应的上级父节点与子节点进行向量拼接，得到第二聚合结果；根据第一聚合结果以及第二聚合结果，得到各个对象属性树对应的目标对象属性信息。

在一个实施例中，数据获取模块902具体用于：获取对象数据集；基于预设对象属性树结构遍历对象数据集，构建对象属性树。

在一个实施例中，信息融合模块906具体用于：基于标的物原始表示，得到各类目标对象属性对应的属性权重，各类目标对象属性对应的属性权重通过注意力机制确定；基于各类目标对象属性对应的属性权重，将目标对象属性信息与对象原始表示进行融合，得到对象属性融合结果；基于对象属性融合结果，通过图卷积对预设对象标的物交互图进行卷积处理，得到预设对象标的物交互图中各阶邻居节点对应的对象表示；将各阶邻居节点对应的对象表示进行总和池化处理，得到对象融合表示。

在一个实施例中，信息融合模块906具体用于：基于对象原始表示，得到各类标的物属性对应的属性权重，各类标的物属性对应的属性权重通过注意力机制确定；基于各类标的物属性对应的属性权重，将标的物属性信息与标的物原始表示进行融合，得到标的物属性融合结果；基于标的物属性融合结果，通过图卷积对预设对象标的物交互图进行卷积处理，得到预设对象标的物交互图中各阶邻居节点对应的标的物表示；将各阶邻居节点对应的标的物表示进行总和池化处理，得到标的物融合表示。

在一个实施例中，数据处理模块908具体用于：将对象融合表示、标的物融合表示、目标对象属性信息以及标的物属性信息输入预设特征交互模型，以对目标对象和标的物进行数据匹配处理，得到目标对象对标的物的数据处理结果。

上述数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图10所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output，简称I/O)和通信接口。其中，处理器、存储器和输入/输出接口通过系统总线连接，通信接口通过输入/输出接口连接到系统总线。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据处理过程相关数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据处理模块方法。

本领域技术人员可以理解，图10中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各方法实施例中的步骤。

需要说明的是，本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，均为经用户授权或者经过各方充分授权的信息和数据，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory，ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(MagnetoresistiveRandomAccessMemory，MRAM)、铁电存储器(FerroelectricRandomAccessMemory，FRAM)、相变存储器(PhaseChangeMemory，PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(RandomAccessMemory，RAM)或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(StaticRandomAccessMemory，SRAM)或动态随机存取存储器(DynamicRandomAccessMemory，DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

Claims

1.一种数据处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对每一所述对象属性树分别进行节点信息聚合处理，得到目标对象属性信息包括：

识别各个所述对象属性树中各个节点的上下级关系；

基于所述各个节点的上下级关系识别所述对象属性树中各节点对应的子节点；

将各个所述对象属性树中的子节点的节点信息，聚合至子节点对应的上级父节点中，得到各个所述对象属性树对应的目标对象属性信息。

3.根据权利要求2所述的方法，其特征在于，所述将各个所述对象属性树中的子节点的节点信息，聚合至子节点对应的上级父节点中，得到各个所述对象属性树对应的目标对象属性信息包括：

计算子节点对应的上级父节点与所述子节点之间的哈达玛积，得到第一聚合结果；

将子节点对应的上级父节点与所述子节点进行向量拼接，得到第二聚合结果；

根据所述第一聚合结果以及所述第二聚合结果，得到各个所述对象属性树对应的目标对象属性信息。

4.根据权利要求1所述的方法，其特征在于，所述获取与目标对象的至少一部分属性相匹配的对象属性树包括：

获取对象数据集；

基于预设对象属性树结构遍历所述对象数据集，构建对象属性树。

5.根据权利要求1至4任意一项所述的方法，其特征在于，所述基于所述标的物原始表示，将所述目标对象属性信息与所述对象原始表示进行融合，得到对象融合表示包括：

基于所述标的物原始表示，得到各类目标对象属性对应的属性权重，所述各类目标对象属性对应的属性权重通过注意力机制确定；

基于各类目标对象属性对应的属性权重，将目标对象属性信息与所述对象原始表示进行融合，得到对象属性融合结果；

基于所述对象属性融合结果，通过图卷积对预设对象标的物交互图进行卷积处理，得到预设对象标的物交互图中各阶邻居节点对应的对象表示；

将所述各阶邻居节点对应的对象表示进行总和池化处理，得到对象融合表示。

6.根据权利要求1至4任意一项所述的方法，其特征在于，所述基于所述对象原始表示，将所述标的物属性信息与所述标的物原始表示进行融合，得到标的物融合表示包括：

基于所述对象原始表示，得到各类标的物属性对应的属性权重，所述各类标的物属性对应的属性权重通过注意力机制确定；

基于各类标的物属性对应的属性权重，将标的物属性信息与所述标的物原始表示进行融合，得到标的物属性融合结果；

基于所述标的物属性融合结果，通过图卷积对预设对象标的物交互图进行卷积处理，得到预设对象标的物交互图中各阶邻居节点对应的标的物表示；

将所述各阶邻居节点对应的标的物表示进行总和池化处理，得到标的物融合表示。

7.根据权利要求1所述的方法，其特征在于，所述基于所述对象融合表示、所述标的物融合表示、所述目标对象属性信息以及所述标的物属性信息，对所述目标对象和所述标的物进行数据匹配处理，得到所述目标对象对所述标的物的数据处理结果包括：

将所述对象融合表示、所述标的物融合表示、所述目标对象属性信息以及所述标的物属性信息输入预设特征交互模型，以对所述目标对象和所述标的物进行数据匹配处理，得到所述目标对象对所述标的物的数据处理结果。

8.一种数据处理装置，其特征在于，所述装置包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

11.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。