CN111080304A

CN111080304A - 一种可信关系识别方法、装置及设备

Info

Publication number: CN111080304A
Application number: CN201911274061.6A
Authority: CN
Inventors: 宝鹏庆; 陆毅成; 金宏; 王维强
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2019-12-12
Filing date: 2019-12-12
Publication date: 2020-04-28
Anticipated expiration: 2039-12-12
Also published as: CN111080304B

Abstract

本说明书实施例提供一种可信关系识别方法、装置及设备。方案包括：获取发生交易行为的不同类型的待识别实体在关联关系拓扑图中的图结构特征，其中，图结构特征包括待识别实体的图关系特征以及待识别实体的节点属性特征，关联关系拓扑图是根据包括待识别实体在内的多个实体预先进行处理得到的；将图结构特征输入预先训练完成的图神经网络模型中，图神经网络模型会输出相应的分数，当所述输出数值大于或等于参考数值时，可以确定所述待识别实体之间的关系为可信关系。

Description

一种可信关系识别方法、装置及设备

技术领域

本说明书一个或多个实施例涉及计算机技术领域，尤其涉及一种可信关系识别方法、装置及设备。

背景技术

目前，网上交易已成为主流，比如：网上购物，网络转账等。随着网络交易的发展，交易的安全性成为重中之重，为保障用户的资金安全，网络交易平台(比如：支付宝)每天需要对上亿个交易进行风险识别，对于有风险的交易，则需要进一步进行身份核验。在实际应用中，绝大多数的交易关系均属于可信关系，这里所指的可信关系可以表示风险率低于预设阈值的交易关系，例如：用户A与用户B之间经常互相转账，可推断用户A与用户B之间的交易关系较为紧密，当交易发生在用户A与用户B之间时，可认为这一交易关系为可信关系，因此，为了避免对每次交易均进行进一步的身份审核操作，导致系统资源消耗增加，通常会对可信关系进行识别，对于可信交易关系，不必对其进行风险深度识别。

现有技术中，在对可信关系进行识别时，通常根据两个实体之间的历史交易数据来推断两个实体间的关系是否紧密；或者通过定义的名单判断实体间的关系是否为可信关系；但是现有技术中的方法需要大量的历史交易数据且仅能识别名单中定义的实体间的关系，识别覆盖率低。

因此，需要提供一种更有效的可信关系识别方案。

发明内容

有鉴于此，本说明书一个或多个实施例提供了一种可信关系识别方法、装置及设备，用于提高可信关系的识别覆盖率。

为解决上述技术问题，本说明书实施例是这样实现的：

本说明书实施例提供的一种可信关系识别方法，包括：

获取待识别实体在关联关系拓扑图中的图结构特征，所述待识别实体为发生交易行为的不同类型的两个实体，所述图结构特征包括所述待识别实体在所述关联关系拓扑图中的图关系特征以及所述待识别实体在所述关联关系拓扑图中的节点属性特征，所述关联关系拓扑图是根据包括所述待识别实体在内的多个实体预先进行处理得到的；

将所述图结构特征输入预先训练完成的图神经网络模型中，得到所述图神经网络模型的输出数值；

当所述输出数值大于或等于参考数值时，确定所述待识别实体之间的关系为可信关系。

本说明书实施例提供的一种可信关系识别模型构建方法，包括：

获取可信关系已知的样本数据，所述样本数据中包括多个类型的实体，所述实体为发生交易行为的实体；

根据所述样本数据构建关联关系拓扑图；

根据所述关联关系拓扑图确定所述样本数据中各个实体在所述关联关系拓扑图中的图结构特征，所述图结构特征包括所述样本数据中各个实体在所述关联关系拓扑图中的图关系特征以及各个实体的节点属性特征；

将所述图结构特征作为输入量，训练图神经网络，得到训练完成的图神经网络模型。

本说明书实施例提供的一种可信关系识别装置，包括：

图结构特征获取模块，用于获取待识别实体在关联关系拓扑图中的图结构特征，所述待识别实体为发生交易行为的不同类型的两个实体，所述图结构特征包括所述待识别实体在所述关联关系拓扑图中的图关系特征以及所述待识别实体在所述关联关系拓扑图中的节点属性特征，所述关联关系拓扑图是根据包括所述待识别实体在内的多个实体预先进行处理得到的；

识别模块，用于将所述图结构特征输入预先训练完成的图神经网络模型中，得到所述图神经网络模型的输出数值；

可信关系确定模块，用于当所述输出数值大于或等于参考数值时，确定所述待识别实体之间的关系为可信关系。

本说明书实施例提供的一种可信关系识别模型构建装置，包括：

样本数据获取模块，用于获取可信关系已知的样本数据，所述样本数据中包括多个类型的实体，所述实体为发生交易行为的实体；

关联关系拓扑图构建模块，用于根据所述样本数据构建关联关系拓扑图；

图结构特征确定模块，用于根据所述关联关系拓扑图确定所述样本数据中各个实体在所述关联关系拓扑图中的图结构特征，所述图结构特征包括所述样本数据中各个实体在所述关联关系拓扑图中的图关系特征以及各个实体的节点属性特征；

模型训练模块，用于将所述图结构特征作为输入量，训练图神经网络，得到训练完成的图神经网络模型。

本说明书实施例提供的一种可信关系识别设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：

本说明书实施例提供的一种可信关系识别模型构建设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

根据所述样本数据构建关联关系拓扑图；

本说明书实施例提供的一种计算机可读介质，其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现一种可信关系识别方法以及一种可信关系识别模型构建方法。

本说明书一个实施例实现了能够达到以下有益效果：通过确定发生交易行为的两个不同类型的实体在关联关系拓扑图中的图关系特征以及所述实体节点属性特征，并将图关系特征以及所述实体属性特征作为输入量输入到预先训练完成的图神经网络模型中，通过进一步比对模型的输出分数数值与参考数值的大小，将输出数值大于或等于参考数值的关系确定为可信关系。采用预先训练完成的图神经网络模型能够对不同类型的实体之间的关系进行识别，可以对本身关系信息较少的实体关系进行可信关系识别，提高了对无足够历史数据的实体之间的关系识别覆盖率。

附图说明

此处所说明的附图用来提供对本说明书一个或多个实施例的进一步理解，构成本说明书一个或多个实施例的一部分，本说明书的示意性实施例及其说明用于解释本说明书一个或多个实施例，并不构成对本说明书一个或多个实施例的不当限定。在附图中：

图1为现有技术中可信关系识别方法的原理示意图；

图2为本说明书实施例中一种可信关系识别方法的整体方案流程示意图；

图3本说明书实施例提供的一种可信关系识别方法的识别原理示意图；

图4为本说明书实施例提供的一种可信关系识别方法的流程示意图；

图5为本说明书实施例提供的一种可信关系识别方法中的关联关系拓扑图的示意图；

图6为本说明书实施例提供的一种可信关系识别模型构建方法的流程示意图；

图7为本说明书实施例提供的对应于图4的一种可信关系识别装置的结构示意图；

图8为本说明书实施例提供的对应于图6的一种可信关系识别模型构建装置的结构示意图；

图9为本说明书实施例提供的对应于图4的一种可信关系识别设备的结构示意图；

图10为本说明书实施例提供的对应于图6的一种可信关系识别模型构建设备的结构示意图。

具体实施方式

为使本说明书一个或多个实施例的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本说明书一个或多个实施例的技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书的一部分实施例，而不是全部的实施例。基于本说明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本说明书一个或多个实施例保护的范围。

以下结合附图，详细说明本说明书各实施例提供的技术方案。

图1为现有技术中可信关系识别方法的原理示意图。

如图1所示，在现有技术中，在识别可信关系时，可以有两种方法，一种是通过实体间(比如：实体1与实体2)的历史交易累积数据，判断交易频次和交易金额，推断可信关系，比如：两个实体间交易频次越大或交易金额越大，交易频次或交易金额超过预设阈值时，可以判定为可信关系，但是这种方法只能针对交易次数较多的实体进行识别，无法识别从未有过交易或交易次数少的实体关系进行可信识别。其次，还可以通过业务专家直接定义的关系名单来推断可信关系，存在于关系名单中的实体之间可以认为是可信关系。例如：用户A与用户A家中电脑的设备ID，用户A与自家的WIFI名称或者用户A与家人之间的交易关系都可以定义在关系名单中，这种方法只能覆盖名单中列出的实体，对于不在名单中的实体无法进行可信识别。

另外，除上述两种方法外，现有技术中还提供了利用图神经网络进行可信关系识别，但是现有技术中的图神经网络仅能对同构图进行识别，这里所述的图构图可以理解为是节点数相同、结构相同、链数(连线)相同的节点。然而在可信关系判断的实际应用中，通常会存在多种实体类型，比如：账户、设备以及网络等，不同类型的实体存在不同的属性信息，不同的实体间存在不同的关联关系信息，此时，采用现有技术中的方法无法准确识别出不同类型的实体之间的可信关系。

为了解决现有技术中的缺陷，本方案给出了以下实施例：

图2为本说明书实施例中一种可信关系识别方法的整体方案流程示意图。如图2所示，当获取到需要识别可信关系的关系对(实体1和实体2)时，首先，需要根据实体1和实体2对应的历史交易操作记录，构建与两个实体相关的关联关系拓扑图，所述关联关系拓扑图中包括与实体1和/或实体2连接的邻居节点。然后根据平台中获取的实体数据进行图神经网络训练，得到训练完成的图神经网络模型；最后根据构建的关联关系拓扑图，利用训练完成的图神经网络模型(GNN模型)对关系对(实体1和实体2)之间的可信关系进行识别，得到识别结果。

在具体根据训练完成的图神经网络模型进行关系识别时，识别的原理过程可以结合图3进行说明：

图3本说明书实施例提供的一种可信关系识别方法的识别原理示意图。

如图3所示，图神经网络模型可以包括输入层、图标层(Graph Labeling Layer)、隐藏层(Hidden Layer)以及输出层(Output Layer)。其中输入层会输入待识别的两个实体的表征向量以及两个实体在关联关系拓扑图中的邻居节点的表征向量。其中，两个实体对应的节点的表征向量可以表示为：Node1Embedding、Node2Embedding，将表征向量输入模型中后，图标层会对所有节点进行数字打标排序，对节点进行打标排序的目的是为了确定由待识别的两个实体所在的图结构与模型中可信关系对应的图结构之间的相似度，图标层对所有节点进行打标排序之后，将节点按照标签序号从左至右依次输入到隐藏层中，然后连接输出层，得到输出结果，以此完成关系识别的过程。

实施例1

图4为本说明书实施例提供的一种可信关系识别方法的流程示意图。从程序角度而言，流程的执行主体可以为搭载于应用服务器的程序或应用客户端。

如图4所示，该流程可以包括以下步骤：

步骤402：获取待识别实体在关联关系拓扑图中的图结构特征，所述待识别实体为发生交易行为的不同类型的两个实体，所述图结构特征包括所述待识别实体在所述关联关系拓扑图中的图关系特征以及所述待识别实体在所述关联关系拓扑图中的节点属性特征，所述关联关系拓扑图是根据包括所述待识别实体在内的多个实体预先进行处理得到的。

在实际应用中，待识别实体可以是包括不同实体类型的一个关系对，一个关系对可以包括两个实体，比如：可以包括用户、设备以及网络信息等，其中用户可以包括交易平台账户、银行卡账户或其他能表示用户身份的实体。设备可以包括设备ID、硬件地址等。网络信息可以包括IP地址、WIFI名称等。比如：待识别的关系对可以是：用户A与用户2、用户A与设备1、设备1与设备2、用户A与IP地址3等。待识别的两个实体可以为发生交易行为的实体，例如：发生转账行为的两个实体。

图结构特征可以包括待识别实体在关联关系拓扑图中的图关系特征以及待识别实体的实体属性特征，其中，图关系特征可以表示待识别实体在关联关系拓扑图中的图连接关系，比如：待识别的实体为用户A和用户B，根据用户A对应的图结构特征可以确定哪些节点对应的实体与用户A之间存在关联关系。

步骤404：将所述图结构特征输入预先训练完成的图神经网络模型中，得到所述图神经网络模型的输出数值。

图神经网络模型(Graph Neural Network，简称GNN模型)，是一种在拓扑图上结合结构信息与属性信息的深度学习方法，一般可以将底层图形作为计算图，并通过在整张图上传递、转换和聚合节点特征信息，从而学习神经网络基元以生成单节点嵌入向量。生成的节点嵌入向量可作为任何可微识别层的输入，并用于节点分类或识别节点之间的连接，完整的模型可以通过端到端的方式训练。

训练完成的图神经网络模型可以为用于识别链接关系的模型，可以识别任意两个不同类型或相同类型的实体之间的可信关系，比如：可以识别用户与用户之间的可信关系，也可以识别用户与设备或网络之间的可信关系。

采用训练完成的神经网络模型对关系对进行关系识别时，得到的识别结果可以包括可信关系和非可信关系。可信关系可以表示识别的关系对对应的两个实体之间的关联关系的风险程度值小于预设风险程度阈值，即风险程度较低。

步骤406：当所述输出数值大于或等于参考数值时，确定所述待识别实体之间的关系为可信关系。

在风控场景下，可信关系可以指的是风险率非常低的关系对之间的关联关系，关系的主体可以是账户、设备等。

模型在训练或者预测时，模型最终会给出一个0至1之间的分值，通常选取大于某个分值阈值作为满足可信的条件。具体地，图神经网络模型在训练或者识别时，可以根据实际应用场景以及输入的特征信息训练参数，并根据实际应用场景确定模型的参考数值，模型在对待识别对象进行识别打分时，通过比对模型输出的分值与参考分数的大小来确定模型的识别结果。本方案中，当训练完成的图神经网络模型的识别分值大于或等于参考分值时，可以确定待识别实体之间的关系为可信关系。

应当理解，本说明书一个或多个实施例所述的方法其中部分步骤的顺序不因为步骤序号而受到限定，可以根据实际需要相互交换。

图4中的方法，通过确定发生交易行为的两个不同类型的实体在关联关系拓扑图中的图关系特征以及所述实体属性特征，并将图关系特征以及所述实体属性特征作为输入量输入到预先训练完成的图神经网络模型中，进一步比对模型的输出数值与参考数值的大小，当所述输出数值大于或等于参考数值时，确定所述待识别实体之间的关系为可信关系。采用预先训练完成的图神经网络模型能够对不同类型的实体之间的关系进行识别，可以对本身关系信息较少的实体关系进行可信关系识别，提高了对无足够历史数据的实体之间的关系识别覆盖率，进一步提高了可信关系识别的准确率。

基于图4的方法，本说明书实施例还提供了该方法的一些具体实施方案，下面进行说明。

在实际应用中，在对实体进行关系识别时，需要从实体所在的关联关系拓扑图中获取实体的图连接关系，因此，需要提前建立一个包括待识别实体的关联关系拓扑图，因此，所述获取待识别实体在关联关系拓扑图中的图结构特征之前，还可以包括：

获取包括所述待识别实体在内的目标实体数据；所述目标实体包括用户类型实体、设备类型实体和/或网络类型实体，所述目标实体数据包括各目标实体的属性数据以及两个目标实体间的关系数据；

根据所述目标实体数据构建关联关系拓扑图，所述关联关系拓扑图中的节点表示所述目标实体数据中的实体，所述实体关系网络中的连线表示任意两个目标实体间的关联关系。

在识别阶段，关联关系拓扑图可以是根据包括待识别实体在内的目标实体数据预先进行处理得到的，比如：某交易平台中，从交易平台的在线和/或离线数据库中获取到实体数据，根据实体数据建立得到的关联关系拓扑图。待识别的实体为交易平台上的注册用户、授权设备或接入的环境信息等。

为了更清楚地阐述关联关系拓扑图以及图结构特征，可以结合图5进行说明：

图5为本说明书实施例提供的一种可信关系识别方法中的关联关系拓扑图的示意图。

如图5所示，以用户B为例，用户B对应的图结构可以是：用户B与用户A之间存在一度连接关系、与用户D存在一度连接关系，与设备1存在一度连接关系，与用户F存在两度连接关系，……。关联关系拓扑图中的实体可以包括多种类型，比如：用户、设备或者环境信息(WIFI、IP等)，关联关系拓扑图可以由多个节点和多条边构成，节点可以表示各个实体，边可以表示各个实体间的关联关系，两个节点之间存在连线(边)可以表示两个节点对应的两个实体之间具有关联关系，比如：用户A与用户B之间的连线用于表示用户A与用户B之间存在关联关系。以用户H为例，根据用户H对应的图关系特征可以确定与用户H存在一度连接关系的邻居实体有：设备4、WiFi 2和WiFi 1，当然，也可以根据实际应用场景中，依据模型参数根据多度连接关系确定实体对应的图关系特征。

更进一步地，每个节点可以包括点描述向量，点描述向量可以用于描述关联关系拓扑图中的节点(实体)，描述实体时，可以采用实体属性特征。比如：假设待识别实体为用户A与用户B，确定得到用户A的邻居实体为设备1和用户C，用户B的邻居实体为用户D和IP地址1，此时，待识别实体的节点属性特征可以包括用户A、设备1、用户C、用户B、用户D以及IP地址1对应的实体特征以及这几个实体之间的关系类型特征。

节点属性特征可以包括实体的基本属性特征，比如：当实体为用户时，用户的属性信息可以是用户账户、用户年龄、身份归属地、性别、职业等；当实体为设备时，设备的属性可以是设备ID、设备硬件地址、设备型号等；当实体为网络环境时，属性信息可以是IP地址、Wifi名称等。可以将涉及到两个实体的事件都作为两个实体间的关联关系。关联关系可以包括多种类型。例如：关联关系可以包括交易关系、社会关系以及操作关系等。其中，交易关系可以根据两个实体间的交易数据推断得到，社会关系也可以包括多种类型，比如：社会关系可以包括好友关系，比如：实体的通讯录中的联系人。也可以包括同事关系，比如：同属于一家公司中的实体等。

需要说明的是，关联关系拓扑图在计算机中实质上是对实体以及实体间的关系对应的数据进行存储，在具体存储时，可以存储到关系型数据库中，也可以存储到图数据库中，以存储到关系型数据库中为例：

可以将节点对应的实体数据存储到一个数据表中，将边对应的关系数据存储到另一个数据表中，在具体进行存储时，可以将所述目标实体数据进行分类，得到实体集合、实体属性数据集合以及实体间的关系数据集合，其中，实体属性数据可以用于表示实体的基本信息属性，比如：用户的身份信息、职业信息等；实体间的关系数据集合可以包括关系类型数据和关系属性数据，关系类型数据可以包括：交易关系、社会关系等；关系属性数据可以包括任意一种关系类型的关系对应的属性，比如：以交易关系为例，交易关系的属性可以包括：在设定时间内的交易次数、交易金额等。

将所述实体集合以及所述实体属性数据集合存储在第一数据表中；

将所述实体间的关系数据集合存储在第二数据表中，所述第一数据表与所述第二数据表属于同一个数据库。

将实体集合中的各个实体与对应的实体属性数据存储到一张表中，具体地，可以将实体作为key值，实体对应的属性数据作为value值，存储到第一数据表中。将实体间的关系集合存储到第二数据表中，具体地，可以将关系类型作为key值，将关系对应的属性信息作为value值存储到第二数据表中。

通过上述方法，根据不同类型的实体的属性数据以及两个目标实体间的关系数据构建关联关系拓扑图，能够方便从关联关系拓扑图中得到各个实体对应的图连接关系信息，便于图神经网络模型根据图连接关系判断实体间的关联关系。

在建立完成目标实体数据对应的关联关系拓扑图之后，可以从关联关系拓扑图中确定所述待识别实体在所述关联关系拓扑图中的图关系特征以及所述待识别实体在所述关联关系拓扑图中的节点属性特征。

具体地，由于在进行关系识别时，需要输入模型中的输入量为节点及边特征的矩阵X以及代表图连接关系的邻接矩阵A。而由于图关系特征可以表示待识别实体在关联关系拓扑图中的图连接关系，所述节点属性特征可以包括待识别实体的属性特征以及各实体间的关系类型特征。因此，可以根据所述图连接关系计算所述待识别实体中各个实体对应的邻接矩阵，根据所述待识别实体的属性特征以及各实体间的关系类型特征计算所述待识别实体对应的特征矩阵。

在根据图连接关系转换为邻接矩阵时，可以将顶点对应为下标，将边设置为1，例如：假设存在5个实体，分别为：A、B、C、D、E，在关联关系拓扑图中，A与B之间、A与D之间、B与C之间、B与E之间、C与D之间、C与E之间存在边，则计算邻接矩阵可以为：

网络中的链路识别(Link Prediction)可以表示如何通过已知的网络节点以及网络结构等信息识别网络中尚未产生连边的两个节点之间产生链接的可能性。在链接识别类问题中，待识别链接周围的邻居信息对于识别结果非常重要，采用现有的方法并不能对周围邻居信息进行异构或相似度等结构的识别。因此，在本方案中增加了对节点进行打标排序的步骤，打标排序这一功能可以由模型自身设置相应的处理层进行实现，也可以采用其他方式实现，比如将打标排序后的结果输入到图神经网络模型中进行训练，以便于训练完成的图神经模型对实体所在结构进行识别。例如：可以在现有的图神经网络模型中加入图标层(Graph Labeling Layer)，对输入模型中的节点进行打标。也可以采用算法对即将输入现有图神经网络模型中的节点信息进行打标，将打标排序后的节点信息输入现有图神经网络模型中。本方案中考虑加入了图标层来处理待识别关系周围的邻居构成情况，将打标结合到图神经网络中对可信关系进行识别，至于如何打标在本方案中不进行限定。

更为具体地，所述将所述图结构特征输入预先训练完成的图神经网络模型中之前，还可以包括：

根据所述图连接关系对所述待识别实体以及所述待识别实体在所述关联关系拓扑图中的邻居实体进行排序。

在对节点进行打标排序时，可以采用多种方法，本方案对于打标的具体方式不做具体限定，例如：可以采用WL算法对关联关系拓扑图中的节点进行打标，具体地，可以采用WL算法根据所述邻接矩阵对所述关联关系拓扑图中的待识别节点以及所述待识别节点的邻居节点进行排序，得到所述待识别节点以及所述邻居节点对应的图标序号。

其中，WL算法可以为大多数图分配一个独特的特征，比如：每一个节点都被分配到一个可以唯一描述它在图中的角色的特征。对于大多数不规则的图，这个特征分配可以用来检验图同构(比如两个图是否相同，取决于节点的排列)。

在进行识别时，将邻接矩阵作为训练完成的图神经网络模型的每一层的输入，训练完成的图神经网络模型中包括输入层、图标层、隐藏层和输出层，图标层可以根据邻接矩阵对这些节点的表征进行排序，并根据打完标号后的图标信息进行节点表征的排序，依照顺序从左至右将节点信息放入最终的隐藏层。

在对待识别节点以及待识别节点的邻居节点进行打标排序时，可以结合节点的图标号以及模型中的训练参数，识别待识别实体之间的可信关系，具体地，可以包括：

根据所述图标信息得到待识别实体所属的第一图结构；

确定所述第一图结构与训练完成的图神经网络模型中的第二图结构之间的相似度，所述第二图结构用于表示具有可信关系的实体对应的图结构；

当所述相似度大于预设阈值时，确定所述待识别实体之间具有可信关系。

训练完成的图神经网络模型中存在具有可信关系的待识别实体对应的图结构特征，在识别可信关系时，可以确定待识别实体所在图结构的图结构特征与训练完成的图神经网络模型中的图结构特征之间的相似度，根据相似度数值判断是否为可信关系。

通过上述方法，通过对关联关系拓扑图中的待识别节点以及待识别节点的邻接节点进行打标排序，便于图神经网络能够识别到待识别节点所属的图结构，并结合图结构判断待识别节点间的可信关系，不需要根据大量的历史交易数据或人工定义的关系名单来识别可信关系，提高了对于有限数据的信息挖掘能力，进一步提高了可信关系识别的覆盖率以及数据利用率。

可选地，输入模型中的节点的表征向量可以是利用图神经网络根据节点的图结构信息迭代更新节点的隐式表达，具体在对节点信息进行更新时，可以采用多种方法，例如：

a)对邻居信息求平均(mean)(针对一个节点来说)，其更新表达式可表达为：

其中i表示第i个节点；hi(t+1)是第i个节点在第t+1次迭代得到的隐含特征；N(i)表示节点i的邻居集合；xi代表节点i的特征；W和V对应模型参数。

b)对邻居信息求和(sum)，其更新表达式可表达为：

c)对邻居信息进行卷积(conv)，其更新表达式可表达为：

其中i表示第i个节点；hi(t+1)是第i个节点在第t+1次迭代得到的隐含特征；N(i)表示节点i的邻居集合；N(j)表示节点j的邻居集合，W对应模型参数。

通过上述方法，根据图结构特征更新节点在设定时刻的隐式表达，可以将节点周围邻居节点的信息汇聚到自身节点的表征向量中。

在采用训练完成的图神经网络模型对待识别实体进行识别时，输入模型的表征向量除了待识别的实体的表征向量外，还需要输入待识别实体周围邻居实体的表征向量，输入的样本数量由模型设置的参数确定，需要保证每个样本包含的邻居数量是一定的，例如：在训练时，每次输入的样本中实体数量为10个，那么在进行识别时，输入的样本数量也应该为10个。每个节点会有自己的表征向量，可以用“e”表示。比如：第一个训练样本中，包括(e1-e10)10个节点，第二个样本中，包括(e'1-e'10)。通过把这10个表征向量(embedding)拼接成一个向量E＝[e1,e2,...,e10]，作为下一步的输入，将e'1-e'10拼接成E'。图标层(Graph Labeling Layer)的作用可以是确定E中10个embedding拼接的顺序，使得E和E’对齐，从而便于模型比较其相似度。

在具体场景中，实体邻居的数量可能会不一样，但是对于图标层的输出要求会保持一致，所以，当输入的节点数量较多时，会根据图标层设置的参数对多出来的节点做截断，例如：图标层的参数为10，在输入时，只保留标号小于10的节点。当输入的节点的数量不满足设置的参数时，对于不够数量的做填充，具体地，只需要保证两个实体对应的表征向量集合中的数量相同即可，因此，在填充时，可以写“0”进行填充。

除了上述提供的可信关系识别的方法外，基于同样的思路，本说明书实施例还提供了一种可信关系识别模型的建立方法。

实施例2

图6为本说明书实施例提供的一种可信关系识别模型构建方法的流程示意图。从程序角度而言，流程的执行主体可以为搭载于应用服务器的程序或应用客户端。

如图6所示，该流程可以包括以下步骤：

步骤602：获取可信关系已知的样本数据，所述样本数据中包括多个类型的实体，所述实体为发生交易行为的实体。

样本数据可以包括可信关系已知的样本，可以包括可信关系样本和不可信关系样本，一个样本中可以包含一对具有可信关系的实体以及这一对实体对应的邻居实体，样本中实体的数量由模型参数决定。

步骤604：根据所述样本数据构建关联关系拓扑图。

训练模型时用到的关联关系拓扑图可以是属于识别前建立的拓扑图中的一部分，也可以是一个新建立的拓扑图，训练模型时由样本数据构建关联关系拓扑图。

步骤606：根据所述关联关系拓扑图确定所述样本数据中各个实体在所述关联关系拓扑图中的图结构特征，所述图结构特征包括所述样本数据中各个实体在所述关联关系拓扑图中的图关系特征以及各个实体的节点属性特征。

步骤608：将所述图结构特征作为输入量，训练图神经网络，得到训练完成的图神经网络模型。

本说明书实施例提供的一种可信关系识别模型构建方法的方法步骤与图4中提供的一种可信关系识别方法的步骤相对应，具体实现原理与图4中的方法相同，唯一的区别是：建立关联关系拓扑图所依据的样本数据不同，输入模型的邻接矩阵和特征矩阵不同。

图6中的方法，通过根据可信关系已知的、包括多个实体类型的样本数据构建关联关系拓扑图，并将各个实体在构建的关联关系拓扑图中的图结构特征作为模型输入量，进行迭代训练，直至模型的输出参数收敛，得到训练完成的图神经网络模型，能够实现图神经网络模型对不同类型的实体之间的链接关系进行可信识别。

基于图6的方法，本说明书实施例还提供了该方法的一些具体实施方案，下面进行说明。

可选的，所述根据所述样本数据构建关联关系拓扑图之后，还可以包括：

根据所述关联关系拓扑图，确定所述样本数据中各个实体在所述关联关系拓扑图中的图关系特征；

根据所述关联关系拓扑图，确定所述样本数据中各个实体在所述关联关系拓扑图中的节点属性特征。

可选的，所述将所述图结构特征作为输入量，训练图神经网络之前，还可以包括：

根据所述图关系特征确定所述样本数据中各个实体在所述关联关系拓扑图中的图连接关系；

根据所述图连接关系计算所述样本数据中各个实体对应的邻接矩阵。

可选的，所述节点属性特征包括样本数据中各实体的属性特征以及各实体间的关系类型特征；所述将所述图结构特征作为输入量，训练图神经网络之前，还可以包括：

根据所述样本数据的属性特征以及所述样本数据中各实体间的关系类型特征计算所述样本数据对应的特征矩阵。

可选的，所述将所述图结构特征作为输入量之前，还可以包括：

采用WL算法根据所述图连接关系对所述关联关系拓扑图中的各节点进行排序，得到各节点对应的图标序号。

上述对应的具体实施方案与实施例1中的方法对应的具体实施方案实现原理相似，可以参考实施例1中的方法对应的具体实施方案进行实现，这里不再进行赘述。

上述方法，通过将图结构信息与实体特征信息进行融合，结合图神经网络对节点表征进行排序然后进行关系识别，可以提高数据的利用效率，训练完成后的图神经网络模型能够识别大量的可信关系，提高了识别可信关系的覆盖率，对数据的挖掘能力也能够得到提升。

基于同样的思路，本说明书实施例还提供了实施例中的方法对应的装置。图7为本说明书实施例提供的对应于图4的一种可信关系识别装置的结构示意图。如图7所示，该装置可以包括：

图结构特征获取模块702，用于获取待识别实体在关联关系拓扑图中的图结构特征，所述待识别实体为发生交易行为的不同类型的两个实体，所述图结构特征包括所述待识别实体在所述关联关系拓扑图中的图关系特征以及所述待识别实体在所述关联关系拓扑图中的节点属性特征，所述关联关系拓扑图是根据包括所述待识别实体在内的多个实体预先进行处理得到的；

识别模块704，用于将所述图结构特征输入预先训练完成的图神经网络模型中，得到所述图神经网络模型的输出数值；

可信关系确定模块706，用于当所述输出数值大于或等于参考数值时，确定所述待识别实体之间的关系为可信关系。

基于图7的装置，本说明书实施例还提供了该装置的一些具体实施方案，下面进行说明。

可选的，所述装置，还可以包括：

目标实体数据获取模块，用于获取包括所述待识别实体在内的目标实体数据；所述目标实体包括用户类型实体、设备类型实体和/或网络类型实体，所述目标实体数据包括各目标实体的属性数据以及两个目标实体间的关系数据；

关联关系拓扑图模块，用于根据所述目标实体数据构建关联关系拓扑图，所述关联关系拓扑图中的节点表示所述目标实体数据中的实体，所述实体关系网络中的连线表示任意两个目标实体间的关联关系。

可选的，所述装置，还可以包括：

图关系特征第一确定模块，用于根据所述关联关系拓扑图，确定所述待识别实体在所述关联关系拓扑图中的图关系特征；

节点属性特征第一确定模块，用于根据所述关联关系拓扑图，确定所述待识别实体在所述关联关系拓扑图中的节点属性特征。

可选的，所述图关系特征第一确定模块，还可以用于：

根据所述图关系特征确定所述待识别实体中各个实体的图连接关系；

根据所述图连接关系计算所述待识别实体中各个实体对应的邻接矩阵。

可选的，所述节点属性特征包括待识别实体的属性特征以及各实体间的关系类型特征；

所述节点属性特征第一确定模块，还可以用于：

根据所述待识别实体的属性特征以及各实体间的关系类型特征计算所述待识别实体对应的特征矩阵。

可选的，所述装置，还可以包括：

排序模块，用于根据所述图连接关系对所述待识别实体以及所述待识别实体在所述关联关系拓扑图中的邻居实体进行排序。

可选的，所述排序单元，具体可以用于：

采用WL算法根据所述邻接矩阵对所述关联关系拓扑图中的待识别节点以及所述待识别节点的邻居节点进行排序，得到所述待识别节点以及所述邻居节点对应的图标序号。

基于同样的思路，本说明书实施例还提供了实施例2中的方法对应的装置。图8为本说明书实施例提供的对应于图6的一种可信关系识别模型构建装置的结构示意图。如图8所示，该装置可以包括：

样本数据获取模块802，用于获取可信关系已知的样本数据，所述样本数据中包括多个类型的实体，所述实体为发生交易行为的实体；

关联关系拓扑图构建模块804，用于根据所述样本数据构建关联关系拓扑图；

图结构特征确定模块806，用于根据所述关联关系拓扑图确定所述样本数据中各个实体在所述关联关系拓扑图中的图结构特征，所述图结构特征包括所述样本数据中各个实体在所述关联关系拓扑图中的图关系特征以及各个实体的节点属性特征；

模型训练模块808，用于将所述图结构特征作为输入量，训练图神经网络，得到训练完成的图神经网络模型。

基于图8的装置，本说明书实施例还提供了该装置的一些具体实施方案，下面进行说明。

可选的，所述装置，还可以包括：

图关系特征第二确定模块，用于根据所述关联关系拓扑图，确定所述样本数据中各个实体在所述关联关系拓扑图中的图关系特征；

节点属性特征第二确定模块，用于根据所述关联关系拓扑图，确定所述样本数据中各个实体在所述关联关系拓扑图中的节点属性特征。

可选的，所述图关系特征第二确定模块，还可以用于：

可选的，所述节点属性特征包括样本数据中各实体的属性特征以及各实体间的关系类型特征；

所述节点属性特征第二确定模块，还可以用于：

可选的，所述图关系特征第二确定模块，还可以用于：

采用WL算法根据所述图连接关系对所述关联关系拓扑图中的各节点进行排序，得到各节点对应的图标序号。基于同样的思路，本说明书实施例还提供了实施例1中的方法对应的设备。

图9为本说明书实施例提供的对应于图4的一种可信关系识别设备的结构示意图。如图9所示，设备900可以包括：

至少一个处理器910；以及，

与所述至少一个处理器通信连接的存储器930；其中，

所述存储器930存储有可被所述至少一个处理器910执行的指令920，所述指令被所述至少一个处理器910执行。

对应于实施例1，所述指令可以使所述至少一个处理器910能够：

基于同样的思路，本说明书实施例还提供了实施例2中的方法对应的设备。

图10为本说明书实施例提供的对应于图6的一种可信关系识别模型构建设备的结构示意图。如图10所示，设备1000可以包括：

至少一个处理器1010；以及，

与所述至少一个处理器通信连接的存储器1030；其中，

所述存储器1030存储有可被所述至少一个处理器1010执行的指令1020，所述指令被所述至少一个处理器1010执行。

对应于实施例2，所述指令可以使所述至少一个处理器1010能够：

根据所述样本数据构建关联关系拓扑图；

基于同样的思路，本说明书实施例还提供了实施例1中的方法对应的计算机可读介质。计算机可读介质上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现以下方法：

基于同样的思路，本说明书实施例还提供了实施例2中的方法对应的计算机可读介质。计算机可读介质上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现以下方法：

根据所述样本数据构建关联关系拓扑图；

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书一个或多个实施例可提供为方法、系统、或计算机程序产品。因此，本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书一个或多个实施例是参照根据本说明书一个或多个实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带式磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本说明书一个或多个实施例。对于本领域技术人员来说，本说明书一个或多个实施例可以有各种更改和变化。凡在本说明书一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书一个或多个实施例的权利要求范围之内。

Claims

1.一种可信关系识别方法，包括：

2.如权利要求1所述的方法，所述获取待识别实体在关联关系拓扑图中的图结构特征之前，还包括：

3.如权利要求2所述的方法，根据所述目标实体数据构建关联关系拓扑图之后，还包括：

根据所述关联关系拓扑图，确定所述待识别实体在所述关联关系拓扑图中的图关系特征；

根据所述关联关系拓扑图，确定所述待识别实体在所述关联关系拓扑图中的节点属性特征。

4.如权利要求3所述的方法，所述将所述图结构特征输入预先训练完成的图神经网络模型中之前，还包括：

5.如权利要求3所述的方法，所述节点属性特征包括待识别实体的属性特征以及各实体间的关系类型特征；

所述将所述图结构特征输入预先训练完成的图神经网络模型中之前，还包括：

6.如权利要求3所述的方法，所述将所述图结构特征输入预先训练完成的图神经网络模型中之前，还包括：

7.如权利要求4所述的方法，所述根据所述图连接关系对所述待识别实体以及所述待识别实体在所述关联关系拓扑图中的邻居实体进行排序，具体包括：

8.一种可信关系识别模型构建方法，包括：

根据所述样本数据构建关联关系拓扑图；

9.如权利要求8所述的方法，所述根据所述样本数据构建关联关系拓扑图之后，还包括：

10.如权利要求9所述的方法，所述将所述图结构特征作为输入量，训练图神经网络之前，还包括：

11.如权利要求9所述的方法，所述节点属性特征包括样本数据中各实体的属性特征以及各实体间的关系类型特征；所述将所述图结构特征作为输入量，训练图神经网络之前，还包括：

12.如权利要求10所述的方法，所述将所述图结构特征作为输入量之前，还包括：

13.一种可信关系识别装置，包括：

14.一种可信关系识别模型构建装置，包括：

15.一种可信关系识别设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

16.一种可信关系识别模型构建设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

根据所述样本数据构建关联关系拓扑图；

17.一种计算机可读介质，其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现权利要求1至12中任一项所述的一种可信关系识别方法以及一种可信关系识别模型构建方法。