WO2023165352A1

WO2023165352A1 - 一种业务对象的分类方法、装置、设备及存储介质

Info

Publication number: WO2023165352A1
Application number: PCT/CN2023/077115
Authority: WO
Inventors: 李岩
Original assignee: 百果园技术(新加坡)有限公司; 李岩
Priority date: 2022-03-03
Filing date: 2023-02-20
Publication date: 2023-09-07
Also published as: CN114564516A

Abstract

本申请公开了一种业务对象的分类方法、装置、设备及存储介质，该方法包括：将多个业务对象转换为图神经网络，每个业务对象具有由多个特征组成的特征向量，图神经网络中的节点表示对应业务对象的特征向量；针对图神经网络中的每个节点，计算每个节点与图神经网络中的其他节点之间的关联程度，作为每个节点的节点度；执行图神经网络，以输出对应业务对象归属多个类别的每个类别的第一概率；使用特征向量识别对应业务对象归属多个类别的每个的类别的第二概率；针对每个类别，根据节点的节点度将所述第一概率与第二概率融合为第三概率；根据多个类别的第三概率确定业务对象归属的类别。

Description

一种业务对象的分类方法、装置、设备及存储介质

本申请要求在2022年3月3日提交中国专利局、申请号为202210203772.X的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机处理的技术领域，例如涉及一种业务对象的分类方法、装置、设备及存储介质。

背景技术

在社群挖掘、异常检测等业务场景中，会对用户、视频、音频等业务对象进行分类，不同分类算法的优劣有所不同，因此，常常使用多个分类算法进行分类，通过集成机制将多个分类的结果集成为一个最终分类的结果。

目前，集成机制多使用平均值的方法，即，多个分类算法对一个业务对象输出多个分数向量，计算所有分数向量的平均值，为最终分数向量，取最大的分数向量所对应的类别为最终的分类结果。

对多个分数向量计算平均值的处理方法形式单一，针对不同的业务对象均使用统一的处理方式，分类的精度较低。

发明内容

本申请提供了一种业务对象的分类方法、装置、设备及存储介质，以解决如何提高通过集成机制分类的精度。

根据本申请的一方面，提供了一种业务对象的分类方法，包括：

将多个业务对象转换为图神经网络，每个业务对象具有由多个特征组成的特征向量，所述图神经网络中的节点表示对应业务对象的特征向量；

针对所述图神经网络中的每个节点，计算所述每个节点与所述图神经网络中的其他节点之间的关联程度，作为所述每个节点的节点度；

执行所述图神经网络，以输出所述对应业务对象归属多个类别的每个类别的第一概率；

执行预设的分类模型，以使用所述特征向量识别所述对应业务对象归属所述多个类别的每个类别的第二概率；

针对所述每个类别，根据所述节点的节点度将所述第一概率与所述第二概率融合为第三概率；

根据所述多个类别的第三概率确定所述业务对象归属的所述类别。

根据本申请的另一方面，提供了一种业务对象的分类装置，包括：

图神经网络转换模块，设置为将多个业务对象转换为图神经网络，每个业务对象具有由多个特征组成的特征向量，所述图神经网络中的节点表示对应业务对象的特征向量；

节点度计算模块，设置为针对所述图神经网络中的每个节点，计算所述每个节点与所述图神经网络中的其他节点之间的关联程度，作为所述每个节点的节点度；

第一分类模块，设置为执行所述图神经网络，以输出所述对应业务对象归属多个类别的每个类别的第一概率；

第二分类模块，设置为执行预设的分类模型，以使用所述特征向量识别所述对应业务对象归属多个类别的每个的类别的第二概率；

概率融合模块，设置为针对所述每个类别，根据所述节点的所述节点度将所述第一概率与所述第二概率融合为第三概率；

类别确定模块，设置为根据所述多个类别的第三概率确定所述业务对象归属的所述类别。

根据本申请的另一方面，提供了一种业务对象的分类设备，所述业务对象的分类设备包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请任一实施例所述的业务对象的分类方法。

根据本申请的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序设置为使处理器执行时实现本申请任一实施例所述的业务对象的分类方法。

附图说明

图1是根据本申请实施例一提供的一种业务对象的分类方法的流程图；

图2是根据本申请实施例一提供的一种图神经网络的示例图；

图3是根据本申请实施例二提供的一种业务对象的分类装置的结构示意图；

图4是实现本申请实施例的业务对象的分类方法的业务对象的分类设备的结构示意图。

具体实施方式

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例一

图1为本申请实施例一提供的一种业务对象的分类方法的流程图，本实施例可适用于通过基于节点度的集成机制集成多个分类的结果为最终分类的结果的情况，该方法可以由业务对象的分类装置来执行，该业务对象的分类装置可以采用硬件和软件中至少之一的形式实现，该业务对象的分类装置可配置于业务对象的分类设备中。如图1所示，该方法包括：

步骤101、将多个业务对象转换为图神经网络。

在不同业务场景中，具有不同的业务对象，这些业务对象为具有业务领域特征的数据的集合。

例如，对于面向用户的服务领域而言，业务对象可以为用户，对于新闻媒体领域而言，业务对象可以为新闻数据，对于移动通讯领域而言，业务对象可以为移动通讯数据；对于电子商务(Electronic Commerce，EC)领域而言，业务对象可以为广告数据，对于自动驾驶领域而言，业务对象可以为点云，等等。

业务对象虽然承载不同业务领域的业务特性，但业务对象本质仍然是数据，例如，文本信息、图像数据、音频数据、视频数据，等等。

对于这些业务对象，可以预先按照业务场景中的业务需求，调用对该业务配置的方法从业务对象提取特征，以向量的形式表示，形成特征向量，即，在对业务对象分类时，业务对象具有由多个特征组成的特征向量，属于多维的特征向量。

示例性地，若业务为识别用户(客户端)是否为网络爬虫，可以提取用户(客户端)访问统一资源标识符(Uniform Resource Identifier，URI)的行为，作为特征向量，例如，访问各种URI的数量，访问各种URI的时间，访问各种URI的密度，等等。

在本实施例中，将业务对象转换为图神经网络(Graph Neural Networks，GNN)，图神经网络是一种基于图结构的广义神经网络，也是一种连接模型，它通过图的节点之间的消息传递来捕捉图的依赖关系。与标准神经网络不同的是，图神经网络保留了一种状态，可以表示来自其邻域的具有任意深度的信息。

其中，图是一种数据结构，它为一组对象(节点)及其关系(边)建模。

一般情况下，图神经网络可以划分为五大类别，分别是：图卷积网络(Graph Convolution Networks，GCN)、图注意力网络(Graph Attention Networks)、图自编码器(Graph Autoencoders)、图生成网络(Graph Generative Networks)和图时空网络(Graph Spatial-temporal Networks)。

图神经网络的输入包括图G＝(V,E)和特征向量Feat，在图G中，节点(Vertex，又称顶点)的集合V＝{v₁,v₂,…,v_p}，边(Edge)的集合E＝{e₁,e₂,…,e_q}，任意一条边e_i＝(v_j,v_k)表示e_i连接节点v_j和节点v_k，每个节点v_i对应一个n维特征向量Feat_i＝{f₁,f₂,…,f_n}。

在本实施例中，将多个业务对象的多个特征向量输入图神经网络中，输出多个节点、多个边，其中，图神经网络中的节点表示业务对象的特征向量，图神经网络中的边表示业务对象之间的关系，即，存在边的业务对象之间存在一定的关联性。

步骤102、针对图神经网络中的每个节点，计算每个节点与所述图神经网络中的其他节点之间的关联程度，作为每个节点的节点度。

在图神经网络中，部分节点与其他节点之间存在一定的关联性(又称相关性)，这些关联性以边的数量、权重等形式体现，在本实施例中，针对图神经网络中的每个节点，可以计算该节点与其他节点之间的关联程度，作为节点的节点度。

节点的节点度可设置为区分该节点的类型，该类型包括社群节点、孤立节点，社群节点又称非孤立节点，为与其他节点关联程度较高的节点，表现为该节点的节点度大于或等于预设的关联阈值，孤立节点为与其他节点关联程度较低甚至为零的节点，表现为该节点的节点度小于预设的关联阈值，即，社群节点的节点度大于孤立节点的节点度。

以边的数量为例，可以针对图神经网络中的每个节点，统计每个节点连接(又称关联)的边的数量，作为每个节点的节点度，其中，一条边连接(又称关联)两个节点。

在本示例中，当一个节点连接的边的数量等于0，表示该节点与其他节点没有任何关联的边，此时，该节点为孤立节点。

当一个节点连接的边的数量大于或等于1，表示该节点与其他节点有关联的边，此时，该节点为社群节点。

那么，可以设置关联阈值为1，孤立节点可以为节点度小于1(关联阈值)的节点，社群节点可以为节点度大于或等于1(关联阈值)的节点。

在一种统计方式中，在图神经网络中，设节点的集合V＝{v₁,v₂,…,v_p}，边的集合E＝{e₁,e₂,…,e_q}，针对图神经网络中的每个节点v_i，v_i∈V，对每个节点v_i初始化节点度为零

查询图神经网络中的边e_i＝(v_j,v_k)，e_i∈E，表示e_i连接节点v_j和节点v_k，v_j、v_k∈V。

针对图神经网络中每条边，对边连接的两个节点的节点度累加1，即，

在如图2所示的图神经网络中共存在9个节点，节点v₁的节点度为5，节点v₂的节点度为2，节点v₃的节点度为2，节点v₄的节点度为0，节点v₅的节点度为2，节点v₆的节点度为5，节点v₇的节点度为4，节点v₈的节点度为3，节点v₉的节点度为1，节点v₁、v₂、v₃、v₅、v₆、v₇、v₈、v₉均为社群节点，节点v₄为孤立节点。

当然，上述计算节点度的方式只是作为示例，在实施本实施例时，可以根据实际情况设置其它计算节点度的方式，例如，对节点度所有关联的边的权重求和，作为该节点的节点度，等等，本申请实施例对此不加以限制。另外，除了上述计算节点度的方式外，本领域技术人员还可以根据实际需要采用其它计算节点度的方式，本实施例对此也不加以限制。

步骤103、执行图神经网络，以输出业务对象归属预设的类别的第一概率。

在本实施例中，可以预先按照业务场景中的业务需求通过端到端的方式训练完整的图神经网络。

在对业务对象分类时，执行图神经网络，图神经网络是将底层的图形作为计算图，并通过在整张图形上传递、转换和聚合节点的特征，从而学习神经网络基元以生成单节点的嵌入向量(Embedding)，即特征向量，生成的嵌入向量可作为可微预测层的输入，用于节点的分类。

在本实施例中，对于每个节点v_i，图神经网络输出一个m维的向量S_i＝(s₁,s₂,…,s_m)，其中，s_t表示该节点v_i属于预设的类别C_t的概率(又称分数)，记为第一概率，其中，t∈m，m为正整数。

步骤104、执行预设的分类模型，以使用特征向量识别业务对象归属预设的类别的第二概率。

在本实施例中，可以根据预先按照业务场景中的业务需求训练至少一个分类模型，该分类模型为独立于图神经网络的模型，是基于特征向量进行分类的模型，即，输入为仅包含特征向量的业务对象，输出业务对象属于预设的类别的概率(又称分数)。

示例性地，该分类模型可以应用机器学习算法，例如，支持向量机(support vector machines，SVM)、梯度提升机(Light Gradient Boosting Machine，LightGBM)，等等，该分类模型可以应用深度学习算法，例如，卷积神经网络(Convolutional Neural Network，CNN)，循环神经网络(Recurrent Neural Network，RNN)，等等。

其中，对于深度学习算法，该分类模型的结构不局限于人工设计的神经网络，也可以通过模型量化方法优化的神经网络，通过神经网络结构搜索(Neural Architecture Search，NAS)方法针对业务场景中的业务需求搜索的神经网络，等等，本实施例对此不加以限制。

在本实施例中，对于每个节点v_i，输入为业务对象的n维特征向量Feat_i＝{f₁,f₂,…,f_n}，每个分类模型均输出一个m维的向量S_i＝(s₁,s₂,…,s_m)，其中，s_t表示该节点v_i属于预设的类别C_t的概率(又称分数)，记为第二概率，其中，t∈m，m为正整数。

步骤105、针对同一类别，根据节点度将第一概率与第二概率融合为第三概率。

针对同一业务对象，图神经网络预测业务对象属于多个(至少两个)类别的第一概率，与此同时，每个分类模型预测业务对象属于多个(至少两个)类别的第二概率，图神经网络对业务对象划分的类别与分类模型对业务对象划分的类别相同，那么，针对同一类别，同一业务对象具有至少两个属于该类别的概率(即第一概率、至少一个第二概率)。

图神经网络对于社群节点的分类预测具有优势，通过节点之间的边让业务对象的特征在节点之间传播，节点关联的边越多，特征传播越丰富，从而优化社群挖掘的结果，但是，对于孤立节点，由于没有关联的边或者关联的边稀疏，图神经网络分类的效果往往较差。

分类模型以单个业务数据的特征向量为输入，不考虑业务对象之间的关联性，对于无关联或关联较为稀疏的孤立节点的分类效果较好，但是，对于关联较为丰富的业务对象，由于忽略了关联性，导致分类的效果较差。

对于同一类别，考虑到节点度表征的、业务对象之间的关联程度对于图神经网络、分类模型的影响，可以以节点度表征的、业务对象之间的关联程度作为调节第一概率、第二概率的参数，通过节点度将第一概率与第二概率线性或非线性融合为第三概率，该第三概率为综合衡量图神经网络分类的结果与分类模型分类的结果。

在本申请的一个实施例中，步骤105可以包括如下步骤：

步骤1051、按照节点度分别计算图神经网络对于分类的第一权重、分类模型对于分类的第二权重。

考虑到节点度表征的、业务对象之间的关联程度对于图神经网络、分类模型的影响，可以参考节点度表征的、业务对象之间的关联程度对图神经网络配置适用于分类的权重，记为第一权重，该第一权重可体现图神经网络对于社群节点分类的优势、对于孤立节点分类的劣势，同理，可以参考节点度表征的、业务对象之间的关联程度对分类模型配置适用于分类的权重，记为第二权重，该第二权重可体现分类模型对于社群节点分类的劣势、对于孤立节点分类的优势。

在实现中，可以预先按照业务场景中的业务需求对图神经网络配置第一映射函数，对分类模型配置第二映射函数。

那么，在对神经网络分类的类别配置第一权重、对分类模型分类的类别配置第二权重时，可以将节点度代入对图神经网络配置的第一映射函数中，以生成图神经网络对于分类的第一权重，以及，将节点度代入对分类模型配置的第二映射函数中，以生成第二映射函数对于分类的第二权重。

第一映射函数、第二映射函数通常属于单调递增的函数，第一权重与节点度正相关，即，节点度越大，第一权重越大，反之，节点度越小，第一权重越小，第二权重与节点度正相关，即，节点度越大，第二权重越大，反之，节点度越小，第二权重越小。

第一映射函数、第二映射函数是成对设计，第一权重增加的速率与第二权重增长的速率并不一致，对于同一节点度，第一权重与第二权重之间存在差异，从而使得图神经网络与分类模型之间的重要性存在差异，适应不同的业务场景。

若节点度表示节点为社群节点，则第一权重大于或等于第二权重，以体现图神经网络对于社群节点的重要性。

若节点度表示节点为孤立节点，则第一权重小于第二权重，以体现分类模型对于孤立节点的重要性。

在一个示例中，第一映射函数包括：

其中，H_G(x)为第一权重，x为节点度，δ为权重的下限值，δ∈[0,1)，α为超参数，如α＝1。

相应地，第二映射函数包括：

其中，H_P(x)为第二权重，x为节点度，δ为权重的下限值，δ∈[0,1)，α为超参数，如α＝1。

在本示例中，权重(第一权重、第二权重)随着节点度的缓慢平滑增长更好地适配业务场景的业务需求。

在另一个示例中，第一映射函数包括：

其中，H_G(x)为第一权重，x为节点度，δ为权重的下限值，δ∈[0,1)，β为超参数，如β＝1。

相应地，第二映射函数包括：

其中，H_P(x)为第二权重，x为节点度，δ为权重的下限值，δ∈[0,1)，β、γ均为超参数，如β＝1、γ＝2。

在本示例中，节点度存在一范围，权重(第一权重、第二权重)在该范围内增长迅速，更好地适配业务场景的业务需求。

在又一个示例中，第一映射函数包括：

其中，H_G(x)为第一权重，x为节点度，δ为权重的下限值，δ∈[0,1)。

相应地，第二映射函数包括：

其中，H_P(x)为第二权重，x为节点度，δ为权重的下限值，μ、ε属于超参数，如μ＝2、ε＝2。

当然，上述第一映射函数、第二映射函数只是作为示例，在实施本实施例时，可以根据实际情况设置其它第一映射函数、第二映射函数，本申请实施例对此不加以限制。另外，除了上述第一映射函数、第二映射函数外，本领域技术人员还可以根据实际需要采用其它第一映射函数、第二映射函数，本实施例对此也不加以限制。

步骤1052、针对每个类别，将第一权重与第一概率之间的乘积设置为第一调权值，将第二权重与第二概率之间的乘积设置为第二调权值。

步骤1053、计算第一调权值与第二调权值之间的和值，作为第三概率。

在本实施例中，通过线性的方式将第一概率与第二概率融合为第三概率，即，针对同一类别，对于图神经网络，将第一权重与第一概率相乘，得到的乘积记为第一调权值，对于分类模型，将第二权重与第二概率相乘，将得到的乘积记为第二调权值，将第一调权值与第二调权值相加，将得到的和值记为第三概率。

假设，图神经网络预测节点v_i归属多个分类的第一概率为对节点v_i配置第一权重

分类模型预测节点v_i归属多个分类的第二概率为对节点v_i配置第二权重

则集成节点v_i归属多个分类的第三概率为

步骤106、根据第三概率确定业务对象归属的类别。

在本实施例中，可以预先按照置信度对分类设计规则，若某个类别的第三概率满足该规则，表示业务对象属于该类别的置信度较高，则可以最终确定业务对象归属该类别。

示例性地，从多个类别的第三概率中选择最大者，作为目标概率，确定目标概率对应的类别为业务对象归属的类别。

当然，上述确定类别的方法只是作为示例，在实施本实施例时，可以根据实际情况设置其它确定类别的方法，例如，从大于概率阈值的第三概率中选择最大者，作为目标概率，确定目标概率对应的类别为业务对象归属的类别，等等，本申请实施例对此不加以限制。另外，除了上述确定类别的方法外，本领域技术人员还可以根据实际需要采用其它确定类别的方法，本实施例对此也不加以限制。

在本实施例中，将业务对象转换为图神经网络，业务对象具有多个特征，图神经网络中的节点表示业务对象的特征向量；在图神经网络中计算节点之间的关联程度，作为节点的节点度；执行图神经网络，以输出业务对象归属预设的类别的第一概率；执行预设的分类模型，以使用特征向量识别业务对象归属预设的类别的第二概率；针对同一类别，根据节点度将第一概率与第二概率融合为第三概率；根据第三概率确定业务对象归属的类别。图神经网络对于关联程度强的业务对象分类预测具有优势，对于关联程度弱的业务对象分类预测存在劣势，而分类模型对于关联程度弱的业务对象分类预测具有优势，对于关联程度强的业务对象分类预测存在劣势，两者存在互补的关系，两者可以保证分类效果的全面性，考虑到节点度表征的、业务对象之间的关联程度对于图神经网络、分类模型的影响，可以以节点度表征的、业务对象之间的关联程度融合图神经网络分类的结果与分类模型分类的结果，不同的业务场景下节点度有所不同，可以灵活调节融合图神经网络分类的结果与分类模型分类的结果，大大提高了分类的精度。

本实施例使用节点度对基于图神经网络的社群节点预测的分类和基于特征向量的单个节点预测的分类进行结合，最终确定分类，提高了分类的精度。

实施例二

图3为本申请实施例二提供的一种业务对象的分类装置的结构示意图。如图3所示，该装置包括：

图神经网络转换模块301，设置为将多个业务对象转换为图神经网络，每个业务对象具有由多个特征组成的特征向量，所述图神经网络中的节点表示对应业务对象的特征向量；

节点度计算模块302，设置为针对所述图神经网络中的每个节点，计算所述每个节点与所述图神经网络中的其他节点之间的关联程度，作为所述每个节点的节点度；

第一分类模块303，设置为执行所述图神经网络，以输出所述对应业务对象归属多个类别的每个类别的第一概率；

第二分类模块304，设置为执行预设的分类模型，以使用所述特征向量识别所述对应业务对象归属多个类别的每个类别的第二概率；

概率融合模块305，设置为针对所述每个类别，根据所述节点的所述节点度将所述第一概率与所述第二概率融合为第三概率；

类别确定模块306，设置为根据所述多个类别的第三概率确定所述业务对象归属的所述类别。

在本申请的一个实施例中，所述节点度计算模块302包括：

边统计模块，设置为针对所述图神经网络中的每个所述节点，统计每个所述节点连接的边的数量，作为每个所述节点的节点度，其中，一条所述边连接两个所述节点。

在本申请的一个实施例中，所述边统计模块包括：

节点度初始化模块，设置为针对所述图神经网络中的每个所述节点，对每个所述节点初始化节点度为零；

边查询模块，设置为查询所述图神经网络中的边；

节点度累加模块，设置为针对所述图神经网络中每条所述边，对所述边连接的两个所述节点的所述节点度累加1。

在本申请的一个实施例中，所述概率融合模块305包括：

权重计算模块，设置为按照所述节点度分别计算所述图神经网络对于分类的第一权重、所述分类模型对于分类的第二权重；

调权值计算模块，设置为针对所述每个类别，将所述第一权重与所述第一概率之间的乘积设置为第一调权值，将所述第二权重与所述第二概率之间的乘积设置为第二调权值；

调权值求和模块，设置为计算所述第一调权值与所述第二调权值之间的和值，作为第三概率。

在本申请的一个实施例中，所述权重计算模块包括：

第一映射模块，设置为将所述节点度代入对所述图神经网络配置的第一映射函数中，以生成所述图神经网络对于分类的第一权重；

第二映射模块，设置为将所述节点度代入对所述分类模型配置的第二映射函数中，以生成所述第二映射函数对于分类的第二权重；

其中，所述第一权重与所述节点度正相关，所述第二权重与所述节点度正相关；

若所述节点度表示所述节点为社群节点，则所述第一权重大于或等于所述第二权重；

若所述节点度表示所述节点为孤立节点，则所述第一权重小于所述第二权重。

在本实施例的一个示例中，所述第一映射函数包括：

其中，H_G(x)为所述第一权重，x为所述节点度，δ为权重的下限值，α为超参数；

所述第二映射函数包括：

其中，H_P(x)为所述第二权重，x为所述节点度，δ为权重的下限值，α为超参数。

在本实施例的另一个示例中，所述第一映射函数包括：

其中，H_G(x)为所述第一权重，x为所述节点度，δ为权重的下限值，β为超参数；

所述第二映射函数包括：

其中，H_P(x)为所述第二权重，x为所述节点度，δ为权重的下限值，β、γ均为超参数。

在本实施例的又一个示例中，所述第一映射函数包括：

其中，H_G(x)为所述第一权重，x为所述节点度，δ为权重的下限值；

所述第二映射函数包括：

其中，H_P(x)为所述第二权重，x为所述节点度，δ为权重的下限值，μ、ε属于超参数。

在本申请的一个实施例中，所述类别确定模块306包括：

目标概率选择模块，设置为从多个所述类别的所述第三概率中选择最大者，作为目标概率；

目标概率确定模块，设置为确定所述目标概率对应的所述类别为所述业务对象归属的所述类别。

本申请实施例所提供的业务对象的分类装置可执行本申请任意实施例所提供的业务对象的分类方法，具备执行业务对象的分类方法相应的功能模块和效果。

实施例三

图4示出了可以用来实施本申请的实施例的业务对象的分类设备10的结构示意图。

如图4所示，业务对象的分类设备10包括至少一个处理器11，以及与至少一个处理器11通信连接的存储器，如只读存储器(Read-Only Memory，ROM)12、随机访问存储器(Random Access Memory，RAM)13等，其中，存储器存储有可被至少一个处理器执行的计算机程序，处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序，来执行各种适当的动作和处理。在RAM 13中，还可存储业务对象的分类设备10操作所需的各种程序和数据。处理器11、ROM12以及RAM 13通过总线14彼此相连。输入/输出(Input/Output，I/O)接口15也连接至总线14。

业务对象的分类设备10中的多个部件连接至I/O接口15，包括：输入单元16，例如键盘、鼠标等；输出单元17，例如各种类型的显示器、扬声器等；存储单元18，例如磁盘、光盘等；以及通信单元19，例如网卡、调制解调器、无线通信收发机等。通信单元19允许业务对象的分类设备10通过诸如因特网的计算机网络和各种电信网络中的至少之一与其他设备交换信息/数据。

处理器11可以是各种具有处理和计算能力的通用和专用处理组件中的至少之一。处理器11的示例包括但不限于中央处理单元(Central Processing Unit，CPU)、图形处理单元(Graphics Processing Unit，GPU)、各种专用的人工智能(Artificial Intelligence，AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(Digital Signal Process，DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的方法和处理，例如业务对象的分类方法。

在一个实施例中，业务对象的分类方法可被实现为计算机程序，其被有形地包含于计算机可读存储介质，例如存储单元18。在一个实施例中，计算机程序的部分或者全部可以经由ROM 12和通信单元19中至少之一而被载入和/或安装到业务对象的分类设备10上。当计算机程序加载到RAM 13并由处理器11执行时，可以执行上文描述的业务对象的分类方法的至少一个步骤。备选地，在其他实施例中，处理器11可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行业务对象的分类方法。

Claims

一种业务对象的分类方法，包括：

将多个业务对象转换为图神经网络，每个业务对象具有由多个特征组成的特征向量，所述图神经网络中的节点表示对应业务对象的特征向量；

针对所述图神经网络中的每个节点，计算所述每个节点与所述图神经网络中的其他节点之间的关联程度，作为所述每个节点的节点度；

执行所述图神经网络，以输出所述对应业务对象归属多个类别的每个类别的第一概率；

执行预设的分类模型，以使用所述特征向量识别所述对应业务对象归属所述多个类别的每个类别的第二概率；

针对所述每个类别，根据所述节点的节点度将所述第一概率与所述第二概率融合为第三概率；

根据所述多个类别的第三概率确定所述业务对象归属的所述类别。
根据权利要求1所述的方法，其中，所述针对所述图神经网络中的每个节点，计算每个所述节点与所述图神经网络中的其他节点之间的关联程度，作为每个所述节点的节点度，包括：

针对所述图神经网络中的每个所述节点，统计每个所述节点连接的边的数量，作为每个所述节点的节点度，其中，一条所述边连接两个所述节点。
根据权利要求2所述的方法，其中，所述针对所述图神经网络中的每个所述节点，统计每个所述节点连接的边的数量，作为每个所述节点的节点度，包括：

针对所述图神经网络中的每个所述节点，对每个所述节点初始化节点度为零；

查询所述图神经网络中的边；

针对所述图神经网络中每条所述边，对所述边连接的两个所述节点的所述节点度累加1。
根据权利要求1所述的方法，其中，所述针对所述每个类别，根据所述节点的所述节点度将所述第一概率与所述第二概率融合为第三概率，包括：

按照所述节点度分别计算所述图神经网络对于分类的第一权重、所述分类模型对于分类的第二权重；

针对所述每个类别，将所述第一权重与所述第一概率之间的乘积设置为第一调权值，将所述第二权重与所述第二概率之间的乘积设置为第二调权值；

计算所述第一调权值与所述第二调权值之间的和值，作为第三概率。
根据权利要求4所述的方法，其中，所述按照所述节点度分别计算所述图神经网络对于分类的第一权重、所述分类模型对于分类的第二权重，包括：

将所述节点度代入对所述图神经网络配置的第一映射函数中，以生成所述图神经网络对于分类的第一权重；

将所述节点度代入对所述分类模型配置的第二映射函数中，以生成所述第二映射函数对于分类的第二权重；

其中，所述第一权重与所述节点度正相关，所述第二权重与所述节点度正相关；

若所述节点度表示所述节点为社群节点，则所述第一权重大于或等于所述第二权重；

若所述节点度表示所述节点为孤立节点，则所述第一权重小于所述第二权重。
根据权利要求5所述的方法，其中，

所述第一映射函数包括：

其中，H_G(x)为所述第一权重，x为所述节点度，δ为权重的下限值，α为超参数；

所述第二映射函数包括：

其中，H_P(x)为所述第二权重，x为所述节点度，δ为权重的下限值，α为超参数。
根据权利要求5所述的方法，其中，

所述第一映射函数包括：

其中，H_G(x)为所述第一权重，x为所述节点度，δ为权重的下限值，β为超参数；

所述第二映射函数包括：

其中，H_P(x)为所述第二权重，x为所述节点度，δ为权重的下限值，β、γ均为超参数。
根据权利要求5所述的方法，其中，

所述第一映射函数包括：

其中，H_G(x)为所述第一权重，x为所述节点度，δ为权重的下限值；

所述第二映射函数包括：

其中，H_P(x)为所述第二权重，x为所述节点度，δ为权重的下限值，μ、ε属于超参数。
根据权利要求1-8中任一项所述的方法，其中，所述根据所述多个类别的第三概率确定所述业务对象归属的所述类别，包括：

从多个所述类别的所述第三概率中选择最大者，作为目标概率；

确定所述目标概率对应的所述类别为所述业务对象归属的所述类别。
一种业务对象的分类装置，包括：

图神经网络转换模块(301)，设置为将多个业务对象转换为图神经网络，每个业务对象具有由多个特征组成的特征向量，所述图神经网络中的节点表示对应业务对象的特征向量；

节点度计算模块(302)，设置为针对所述图神经网络中的每个节点，计算所述每个节点与所述图神经网络中的其他节点之间的关联程度，作为所述每个节点的节点度；

第一分类模块(303)，设置为执行所述图神经网络，以输出所述对应业务对象归属多个类别的每个类别的第一概率；

第二分类模块(304)，设置为执行预设的分类模型，以使用所述特征向量识别所述对应业务对象归属所述多个类别的每个类别的第二概率；

概率融合模块(305)，设置为针对所述每个类别，根据所述节点的所述节点度将所述第一概率与所述第二概率融合为第三概率；

类别确定模块(306)，设置为根据所述多个类别的第三概率确定所述业务对象归属的所述类别。
一种业务对象的分类设备，包括：

至少一个处理器(11)；以及

与所述至少一个处理器(11)通信连接的存储器(12，13)；其中，

所述存储器(12，13)存储有可被所述至少一个处理器(11)执行的计算机程序，所述计算机程序被所述至少一个处理器(11)执行，以使所述至少一个处理器(11)能够执行权利要求1-9中任一项所述的业务对象的分类方法。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序设置为被处理器执行时实现权利要求1-9中任一项所述的业务对象的分类方法。