CN110852755A

CN110852755A - 针对交易场景的用户身份识别方法和装置

Info

Publication number: CN110852755A
Application number: CN201911075119.4A
Authority: CN
Inventors: 吴郑伟; 刘子奇
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2019-11-06
Filing date: 2019-11-06
Publication date: 2020-02-28
Anticipated expiration: 2039-11-06
Also published as: CN110852755B

Abstract

本说明书实施例提供一种针对交易场景的用户身份识别方法和装置，方法包括：获取目标用户到目标商户进行交易时采集的目标用户的目标生物信息；查找与目标生物信息最相似的多个存储生物信息，将多个存储生物信息分别对应的用户作为目标用户的候选用户；根据针对关系网络图预先训练的图神经网络模型，确定各候选用户分别对应的各第一节点嵌入向量，以及目标商户对应的第二节点嵌入向量；根据各第一节点嵌入向量和第二节点嵌入向量，确定各候选用户到目标商户的各交易概率中的最大交易概率；当最大交易概率大于预设阈值时，将最大交易概率对应的候选用户确定为目标用户。能够提高交易场景中用户身份识别的准确性。

Description

针对交易场景的用户身份识别方法和装置

技术领域

本说明书一个或多个实施例涉及计算机领域，尤其涉及针对交易场景的用户身份识别方法和装置。

背景技术

当前，在交易场景中，用户与商户进行交易时，常常会采集用户的生物信息，例如，人脸信息，根据人脸信息识别用户身份，再根据识别出的用户身份，对该用户身份关联的账户进行转账等操作。

现有技术中，根据人脸信息识别用户身份时，常常会出现识别不准确的问题。

因此，希望能有改进的方案，能够提高交易场景中用户身份识别的准确性。

发明内容

本说明书一个或多个实施例描述了一种针对交易场景的用户身份识别方法和装置，能够提高交易场景中用户身份识别的准确性。

第一方面，提供了一种针对交易场景的用户身份识别方法，方法包括：

获取目标用户到目标商户进行交易时采集的所述目标用户的目标生物信息；

从预先存储的存储生物信息与用户的各对应关系中，查找与所述目标生物信息最相似的多个存储生物信息，将所述多个存储生物信息分别对应的用户作为所述目标用户的候选用户；

根据针对关系网络图预先训练的图神经网络模型，确定各候选用户分别对应的各第一节点嵌入向量，以及所述目标商户对应的第二节点嵌入向量；其中，所述关系网络图包括与多个用户对应的多个用户节点，多个商户对应的多个商户节点，每个用户节点通过第一类连接边连接到第一历史时段上具有交易关系的商户所对应的商户节点，并通过第二类连接边连接到具有好友关系的用户所对应的用户节点；

根据各所述第一节点嵌入向量和所述第二节点嵌入向量，确定各所述候选用户到所述目标商户的各交易概率中的最大交易概率；

当所述最大交易概率大于预设阈值时，将所述最大交易概率对应的候选用户确定为所述目标用户。

在一种可能的实施方式中，所述目标生物信息包括以下至少一种：

人脸信息、指纹信息、视网膜信息、虹膜信息、声音信息和骨架信息。

在一种可能的实施方式中，所述确定各所述候选用户到所述目标商户的各交易概率，包括：

确定各所述第一节点嵌入向量和所述第二节点嵌入向量之间的各相关度；

将各相关度映射到交易概率的取值区间内，得到各所述候选用户到所述目标商户的各交易概率。

在一种可能的实施方式中，所述图神经网络模型通过以下方式预先训练：

确定所述关系网络图中各个节点的节点特征，各个连接边的边特征；

基于所述节点特征确定各个节点的初级迭代的节点嵌入向量；

执行多级向量迭代，以确定各个节点的多级迭代的节点嵌入向量，其中所述多级向量迭代的每级向量迭代包括，对于各个节点，至少基于该节点的邻居节点的上一级迭代的节点嵌入向量、连接该节点的连接边的边特征向量，以及参数集，确定该节点的本级迭代的节点嵌入向量；

将第二历史时段中发生过交易的商户与用户作为一组正样本，正样本具有第一标签值，将该第二历史时段中没有发生过交易的商户与用户作为一组负样本，负样本具有第二标签值，对于各组商户与用户，基于该商户的多级迭代的节点嵌入向量、该用户的多级迭代的节点嵌入向量，确定该组商户与用户对应的交易概率预测值，其中，所述第二历史时段在所述第一历史时段之后；

调整所述参数集中的参数值，使得预定义的损失函数的函数值达到最小，其中所述损失函数的函数值基于各组商户与用户的交易概率预测值和标签值而确定。

进一步地，确定各个节点的节点特征包括：

对于各个节点中的用户节点，至少采用该用户节点对应的用户常住地作为节点特征；和/或，

对于各个节点中的商户节点，至少采用该商户节点对应的商户地理位置作为节点特征。

进一步地，确定各个连接边的边特征包括：

对于各个连接边中的第一类连接边，将该连接边所连接的商户与用户之间的交易频次作为该连接边的边特征；和/或，

对于各个连接边中的第二类连接边，将该连接边所连接的两个用户好友关系建立的时长作为该连接边的边特征。

进一步地，还包括：初始化所述参数集。

进一步地，所述确定该节点的本级迭代的节点嵌入向量，包括：

利用所述参数集中的参数作为权重，对该节点的初级迭代的节点嵌入向量、其各个邻居节点的上一级迭代的节点嵌入向量、连接该节点的各个连接边的边特征向量三者进行加权求和，基于求和结果确定该节点的本级迭代的节点嵌入向量。

在一种可能的实施方式中，所述预设阈值通过如下方式确定：

获取测试集，所述测试集包括多组训练样本，训练样本的样本输入为商户与用户的组合，训练样本的样本标签用于指示组合中的用户与商户是否发生交易，发生交易的训练样本为正例，反之为负例；

根据所述测试集中的样本输入，以及预先训练的所述图神经网络模型，确定该样本输入对应的样本交易概率；

在交易概率的取值区间内取多个备选阈值，针对每个备选阈值，样本交易概率大于或等于该备选阈值的样本输入识别为正例，反之识别为负例，根据该样本输入对应的样本标签，确定该备选阈值对应的所述图神经网络模型的误识率；

从所述多个备选阈值中，选取误识率低于预设的第一比例时的最小备选阈值作为所述预设阈值。

第二方面，提供了一种针对交易场景的用户身份识别装置，装置包括：

获取单元，用于获取目标用户到目标商户进行交易时采集的所述目标用户的目标生物信息；

查找单元，用于从预先存储的存储生物信息与用户的各对应关系中，查找与所述获取单元获取的目标生物信息最相似的多个存储生物信息，将所述多个存储生物信息分别对应的用户作为所述目标用户的候选用户；

嵌入单元，用于根据针对关系网络图预先训练的图神经网络模型，确定所述查找单元得到的各候选用户分别对应的各第一节点嵌入向量，以及所述目标商户对应的第二节点嵌入向量；其中，所述关系网络图包括与多个用户对应的多个用户节点，多个商户对应的多个商户节点，每个用户节点通过第一类连接边连接到第一历史时段上具有交易关系的商户所对应的商户节点，并通过第二类连接边连接到具有好友关系的用户所对应的用户节点；

交易概率确定单元，用于根据所述嵌入单元确定的各所述第一节点嵌入向量和所述第二节点嵌入向量，确定各所述候选用户到所述目标商户的各交易概率中的最大交易概率；

身份确定单元，用于当所述交易概率确定单元确定的最大交易概率大于预设阈值时，将所述最大交易概率对应的候选用户确定为所述目标用户。

第三方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行第一方面的方法。

第四方面，提供了一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现第一方面的方法。

通过本说明书实施例提供的方法和装置，先根据目标用户的目标生物信息筛选出多个候选用户，然后根据针对关系网络图预先训练的图神经网络模型，确定各候选用户分别对应的各第一节点嵌入向量，以及目标商户对应的第二节点嵌入向量，再根据各第一节点嵌入向量和第二节点嵌入向量，对各候选用户到目标商户的各交易概率进行排序预测，最后当最大交易概率大于预设阈值时，将最大交易概率对应的候选用户确定为目标用户。由上可见，这种身份识别方法结合了目标生物信息的匹配与交易概率的预测，从而使交易场景中的身份识别更为准确。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为根据一个实施例的关系网络图；

图2示出根据一个实施例的实施场景示意图；

图3示出根据一个实施例的针对交易场景的用户身份识别方法流程图；

图4示出根据另一个实施例的针对交易场景的用户身份识别方法流程图；

图5示出根据一个实施例的针对交易场景的用户身份识别装置的示意性框图。

具体实施方式

下面结合附图，对本说明书提供的方案进行描述。

如前所述，在交易场景中，用户与商户进行交易时，常常会采集用户的生物信息，例如，人脸信息，根据人脸信息识别用户身份，再根据识别出的用户身份，对该用户身份关联的账户进行转账等操作。根据人脸信息识别用户身份时，常常会出现识别不准确的问题。为了更准确的识别用户身份，根据本说明书的实施例，借助用户和商户的关系网络图来增加其数据丰富度，关系网络图体现了用户之间、用户和商户之间的关系，通过针对关系网络图训练图神经网络模型学习到用户和商户的关联特征，从而利用该图神经网络模型识别用户身份的准确性高。

基于以上考虑，根据本说明书一个或多个实施例，构建全面的关系网络图，用于交易场景中识别用户身份。图1为根据一个实施例的关系网络图。在该关系网络图中，包括与多个用户对应的多个用户节点，多个商户对应的多个商户节点，每个用户节点通过第一类连接边连接到第一历史时段上具有交易关系的商户所对应的商户节点，并通过第二类连接边连接到具有好友关系的用户所对应的用户节点。参照图1，各用户可以具有各自的用户身份标识；各商户可以具有各自的商户标识；在图1中，为了示意，采用空心圆代表用户节点，采用实心圆代表商户节点，将第一类连接边用实线示出，第二类连接边用虚线示出。

对于这样的关系网络图，提出一种图神经网络模型，该模型用于对上述的关系网络图进行深度学习，通过多级迭代，确定用户节点的节点嵌入向量和商户节点的节点嵌入向量。

图2示出根据一个实施例的实施场景示意图。如图2所示，为了获取上述图神经网络模型，首先，计算平台基于关系网络图中已经标定的商户与用户组合对该图神经网络模型进行训练，确定模型所需的参数集。在模型训练好之后，就可以利用该图神经网络模型，给出关系网络图中任意一个节点的节点嵌入向量，用作进一步分析。后续可以根据各候选用户的第一节点嵌入向量和目标商户的第二节点嵌入向量，确定各候选用户与目标商户的各交易概率，并最终确定目标用户。

图3示出根据一个实施例的针对交易场景的用户身份识别方法流程图。首先获取用户生物信息(例如人脸信息)，然后根据该用户生物信息确定多个相似候选用户，接着根据预先训练的图神经网络模型确定各候选用户和目标商户之间的交易概率，根据各交易概率对各候选用户进行排序预测，最后当确定排在首位的候选用户的交易概率大于阈值分数时，将该排在首位的候选用户确定为目标用户。

下面通过一个具体的实施例详细描述使用该图神经网络模型进行用户身份识别的过程。

图4示出根据另一个实施例的针对交易场景的用户身份识别方法流程图。该方法可以基于图1所示的关系网络图，以及图2所示的实施场景。所述方法的执行主体可以是任何具有计算、处理能力的装置、设备、平台、设备集群等，例如图2所示的计算平台。

如图4所示，为了进行用户身份识别，首先在步骤41，获取目标用户到目标商户进行交易时采集的所述目标用户的目标生物信息。可以理解的是，该目标生物信息可以包括一种或多种生物信息。

在一个示例中，所述目标生物信息包括以下至少一种：人脸信息、指纹信息、视网膜信息、虹膜信息、声音信息和骨架信息。

然后在步骤42，从预先存储的存储生物信息与用户的各对应关系中，查找与所述目标生物信息最相似的多个存储生物信息，将所述多个存储生物信息分别对应的用户作为所述目标用户的候选用户。可以理解的是，可以将各用户的用户身份标识与其对应的存储生物信息预先存储在数据库中。存储生物信息为预先采集的用户生物信息，包含的生物信息种类与目标生物信息相同或部分相同，例如，目标生物信息仅包括人脸信息，存储生物信息包括人脸信息和指纹信息。

在一个示例中，当一个用户到一个商户(shop)进行刷脸支付时，根据该用户扫描的人脸信息从数据库中召回最相似的n个候选用户标识uid。为了保证计算延迟要求，n的数值一般小于10。

接着在步骤43，根据针对关系网络图预先训练的图神经网络模型，确定各候选用户分别对应的各第一节点嵌入向量，以及所述目标商户对应的第二节点嵌入向量。可以理解的是，各候选用户和目标商户均对应关系网络图中的节点。

其中，所述关系网络图包括与多个用户对应的多个用户节点，多个商户对应的多个商户节点，每个用户节点通过第一类连接边连接到第一历史时段上具有交易关系的商户所对应的商户节点，并通过第二类连接边连接到具有好友关系的用户所对应的用户节点。

在一个示例中，可以使用图神经网络模型，根据各节点相关的数字模态信息(包括交易数据、好友数据、用户常住地信息、商户地理位置等)，计算各节点的节点嵌入向量，包括各用户节点嵌入向量h_uid和各商户节点嵌入向量h_shop，从各节点的节点嵌入向量中查找这n个候选用户以及目标商户分别对应的节点嵌入向量:h_uid1,…,h_uidn,h_shop1。

在一个示例中，所述图神经网络模型通过以下方式预先训练：

进一步地，确定各个节点的节点特征包括：

进一步地，确定各个连接边的边特征包括：

作为示例，根据第一历史时段的交易数据，得到具有交易关系的用户和商户组成的关系对(uid,shop)，并将这个关系对出现的频次作为该关系对对应的第一类连接边上的边特征。其中，第一历史时段可以为第二历史时段之前的历史时段，例如，第一历史时段为当前月份之前的前2月、前3月，第二历史时段为当前月份之前的前1月，假定当前月份为10月，则第一历史时段可以为7月和8月，第二历史时段可以为9月。

作为示例，根据历史好友关系，得到具有好友关系的用户和用户组成的关系对(uid1,uid2)，并将这个关系对好友关系建立的时长作为该关系对对应的第二类连接边上的边特征。

本说明书实施例，可以先初始化所述参数集。

进一步地，利用所述参数集中的参数作为权重，对该节点的初级迭代的节点嵌入向量、其各个邻居节点的上一级迭代的节点嵌入向量、连接该节点的各个连接边的边特征向量三者进行加权求和，基于求和结果确定该节点的本级迭代的节点嵌入向量。

在一个示例中，使用公式

迭代计算节点嵌入向量。其中

为第i个节点在第l层的本级迭代的节点嵌入向量，e_ij节点i和节点j之间的连接边对应的边特征向量，进行多级向量迭代的层数共L层，通常取L＝2。W^(l)和b^(l)是模型参数。σ函数为激活函数，可以选择sigmoid,tanh等函数。j∈N_i表示节点j是节点i的邻居节点，其中邻居节点可以为用户节点，也可以为商户节点，前述关系对中的两个节点互为邻居节点，即一个连接边连接的两个节点互为邻居节点。

在一个示例中，使用第二历史时段(例如最近一个月)的存在交易关系的用户和商户作为一组正样本，对正样本中出现的商户随机选取没有交易过的用户得到一组负样本，保证每个商户正负样本数相等。记样本集合为{(uid_i,shop_i)},i∈[1,N]，标签集合为{y_i},i∈[1,N]。其中y_i＝1表示第二历史时段用户uid_i在商户shop_i消费过，y_i＝0则表示相反。

在一个示例中，定义损失函数为

通过反向传播更新参数W^(l)和b^(l)的值。这个损失函数使用了交叉熵(crossentropy)的形式，用于计算两个分布之间的距离。使用

和

分别作为最终用户和商户对应的节点嵌入向量。

再在步骤44，根据各所述第一节点嵌入向量和所述第二节点嵌入向量，确定各所述候选用户到所述目标商户的各交易概率中的最大交易概率。可以理解的是，可以先计算各交易概率，然后基于各交易概率的排序确定最大交易概率。

在一个示例中，确定各所述第一节点嵌入向量和所述第二节点嵌入向量之间的各相关度；将各相关度映射到交易概率的取值区间内，得到各所述候选用户到所述目标商户的各交易概率。

例如，定义交易概率公式为

根据上述公式计算n个候选用户uid到商户(shop)的交易概率分别是p₁,…,p_n。由大到小排序得到p₁′,…,p′_n。

最后在步骤45，当所述最大交易概率大于预设阈值时，将所述最大交易概率对应的候选用户确定为所述目标用户。可以理解的是，该预设阈值可以根据对用户身份识别的准确性的要求确定。

在一个示例中，所述预设阈值通过如下方式确定：

例如，在(0,1)的范围内等间距地遍历阈值τ，比如τ＝0.1,0.2,…,0.9。对于每个给定的阈值，将交易概率大于等于该阈值的认为是正例，反之为负例。根据测试集上真实的用户到店行为，可以计算出误识率，其中误识率的定义是测试集中是正例的情况下实际是负例的比例。随着阈值取值逐渐变大，误识率会逐步降低，选取误识率低于第一比例(例如1％)的最小值作为预设阈值。

通过本说明书实施例提供的方法，先根据目标用户的目标生物信息筛选出多个候选用户，然后根据针对关系网络图预先训练的图神经网络模型，确定各候选用户分别对应的各第一节点嵌入向量，以及目标商户对应的第二节点嵌入向量，再根据各第一节点嵌入向量和第二节点嵌入向量，对各候选用户到目标商户的各交易概率进行排序预测，最后当最大交易概率大于预设阈值时，将最大交易概率对应的候选用户确定为目标用户。由上可见，这种身份识别方法结合了目标生物信息的匹配与交易概率的预测，从而使交易场景中的身份识别更为准确。

图5示出根据一个实施例的针对交易场景的用户身份识别装置的示意性框图，该装置用于执行本说明书实施例提供的针对交易场景的用户身份识别方法。如图5所示，针对交易场景的用户身份识别装置500包括：

获取单元51，用于获取目标用户到目标商户进行交易时采集的所述目标用户的目标生物信息；

查找单元52，用于从预先存储的存储生物信息与用户的各对应关系中，查找与所述获取单元51获取的目标生物信息最相似的多个存储生物信息，将所述多个存储生物信息分别对应的用户作为所述目标用户的候选用户；

嵌入单元53，用于根据针对关系网络图预先训练的图神经网络模型，确定所述查找单元52得到的各候选用户分别对应的各第一节点嵌入向量，以及所述目标商户对应的第二节点嵌入向量；其中，所述关系网络图包括与多个用户对应的多个用户节点，多个商户对应的多个商户节点，每个用户节点通过第一类连接边连接到第一历史时段上具有交易关系的商户所对应的商户节点，并通过第二类连接边连接到具有好友关系的用户所对应的用户节点；

交易概率确定单元54，用于根据所述嵌入单元53确定的各所述第一节点嵌入向量和所述第二节点嵌入向量，确定各所述候选用户到所述目标商户的各交易概率中的最大交易概率；

身份确定单元55，用于当所述交易概率确定单元54确定的最大交易概率大于预设阈值时，将所述最大交易概率对应的候选用户确定为所述目标用户。

可选地，作为一个实施例，所述获取单元51获取的目标生物信息包括以下至少一种：

可选地，作为一个实施例，所述交易概率确定单元54，具体用于：

可选地，作为一个实施例，所述图神经网络模型通过以下方式预先训练：

进一步地，确定各个节点的节点特征包括：

进一步地，确定各个连接边的边特征包括：

进一步地，还包括：初始化所述参数集。

进一步地，所述嵌入单元53，具体用于利用所述参数集中的参数作为权重，对该节点的初级迭代的节点嵌入向量、其各个邻居节点的上一级迭代的节点嵌入向量、连接该节点的各个连接边的边特征向量三者进行加权求和，基于求和结果确定该节点的本级迭代的节点嵌入向量。

可选地，作为一个实施例，所述预设阈值通过如下方式确定：

通过本说明书实施例提供的装置，结合了目标生物信息的匹配与交易概率的预测，从而使交易场景中的身份识别更为准确。

根据另一方面的实施例，还提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行结合图3和图4所描述的方法。

根据再一方面的实施例，还提供一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现结合图3和图4所描述的方法。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种针对交易场景的用户身份识别方法，所述方法包括：

2.如权利要求1所述的方法，其中，所述目标生物信息包括以下至少一种：

3.如权利要求1所述的方法，其中，所述确定各所述候选用户到所述目标商户的各交易概率，包括：

4.如权利要求1所述的方法，其中，所述图神经网络模型通过以下方式预先训练：

5.如权利要求4所述的方法，其中，确定各个节点的节点特征包括：

6.如权利要求4所述的方法，其中，确定各个连接边的边特征包括：

7.如权利要求4所述的方法，还包括：初始化所述参数集。

8.如权利要求4所述的方法，其中，所述确定该节点的本级迭代的节点嵌入向量，包括：

9.如权利要求1所述的方法，其中，所述预设阈值通过如下方式确定：

10.一种针对交易场景的用户身份识别装置，所述装置包括：

11.如权利要求10所述的装置，其中，所述获取单元获取的目标生物信息包括以下至少一种：

12.如权利要求10所述的装置，其中，所述交易概率确定单元，具体用于：

13.如权利要求10所述的装置，其中，所述图神经网络模型通过以下方式预先训练：

14.如权利要求13所述的装置，其中，确定各个节点的节点特征包括：

15.如权利要求13所述的装置，其中，确定各个连接边的边特征包括：

16.如权利要求13所述的装置，其中，还包括：初始化所述参数集。

17.如权利要求13所述的装置，其中，所述嵌入单元，具体用于利用所述参数集中的参数作为权重，对该节点的初级迭代的节点嵌入向量、其各个邻居节点的上一级迭代的节点嵌入向量、连接该节点的各个连接边的边特征向量三者进行加权求和，基于求和结果确定该节点的本级迭代的节点嵌入向量。

18.如权利要求10所述的装置，其中，所述预设阈值通过如下方式确定：

19.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-9中任一项的所述的方法。

20.一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-9中任一项的所述的方法。