CN116542673B

CN116542673B - 应用于机器学习的欺诈行为识别方法及系统

Info

Publication number: CN116542673B
Application number: CN202310815381.8A
Authority: CN
Inventors: 涂浩; 李欣; 刘跃然
Original assignee: Chengdu Lechaoren Technology Co ltd
Current assignee: Chengdu Lechaoren Technology Co ltd
Priority date: 2023-07-05
Filing date: 2023-07-05
Publication date: 2023-09-08
Anticipated expiration: 2043-07-05
Also published as: CN116542673A

Abstract

本申请实施例提供一种应用于机器学习的欺诈行为识别方法及系统，基于第一欺诈行为识别网络提取每个待学习用户会话活动数据的第一用户会话知识节点的第一欺诈判别向量，以及提取每个待学习用户会话活动数据在多个衍生特征维度下对应有欺诈行为的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量和欺诈估计字段，然后结合待学习用户会话活动数据中的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量和欺诈估计字段对第一欺诈行为识别网络进行更新，由此可以获得欺诈行为识别性能更强的第二欺诈行为识别网络，提高对任意用户会话活动数据进行欺诈行为识别的准确性，进而提高后续反欺诈处理的可靠性。

Description

应用于机器学习的欺诈行为识别方法及系统

技术领域

本申请涉及计算机风控技术领域，具体而言，涉及一种应用于机器学习的欺诈行为识别方法及系统。

背景技术

互联网金融就是互联网技术和金融功能的有机结合，依托大数据和云计算在开放的互联网平台上形成的功能化金融业态及其服务体系，包括基于网络平台的金融市场体系、金融服务体系、金融组织体系、金融产品体系以及互联网金融监管体系等，并具有普惠金融、平台金融、信息金融和碎片金融等相异于传统金融的金融模式。反欺诈是对包含交易诈骗，网络诈骗，电话诈骗，盗卡盗号等欺诈行为进行识别的一项服务。在线反欺诈是互联网金融必不可少的一部分，相关技术中，如何提高对任意用户会话活动数据进行欺诈行为识别的准确性，进而提高后续反欺诈处理的可靠性，是亟待解决的技术问题。

发明内容

有鉴于此，本申请的目的在于提供一种应用于机器学习的欺诈行为识别方法及系统。

依据本申请的第一方面，提供一种应用于机器学习的欺诈行为识别方法，应用于云服务器，所述方法包括：

从第一模板用户会话活动数据序列中获取多个待学习用户会话活动数据，所述第一模板用户会话活动数据序列包括多个欺诈标签的欺诈行为对应的模板用户会话活动数据，每个模板用户会话活动数据分别携带包括欺诈行为定位数据的第一用户会话知识节点及该第一用户会话知识节点对应的模板欺诈字段，所述多个待学习用户会话活动数据分别属于多个欺诈标签的欺诈行为对应的模板用户会话活动数据；

基于第一欺诈行为识别网络提取所述多个待学习用户会话活动数据中每个待学习用户会话活动数据的第一用户会话知识节点的第一欺诈判别向量；

基于所述第一欺诈行为识别网络提取每个所述待学习用户会话活动数据在多个衍生特征维度下对应有欺诈行为的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量以及每个第二用户会话知识节点对应的欺诈估计字段；

基于每个所述待学习用户会话活动数据中的第一用户会话知识节点、第一用户会话知识节点的第一欺诈判别向量以及第一用户会话知识节点的模板欺诈字段、所述待学习用户会话活动数据中的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量以及每个第二用户会话知识节点对应的欺诈估计字段，生成欺诈学习误差值；

基于所述欺诈学习误差值更新所述第一欺诈行为识别网络的网络权重信息，直至满足网络收敛要求时得到第二欺诈行为识别网络，并基于所述第二欺诈行为识别网络对任意输入的用户会话活动数据进行欺诈行为识别，以基于欺诈行为识别结果进行对应的反欺诈处理。

在第一方面的一种可能的实施方式中，基于每个所述待学习用户会话活动数据中的第一用户会话知识节点、第一用户会话知识节点的第一欺诈判别向量以及第一用户会话知识节点的模板欺诈字段、所述待学习用户会话活动数据中的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量以及每个第二用户会话知识节点对应的欺诈估计字段，生成欺诈学习误差值，包括：

基于所述待学习用户会话活动数据中的第一用户会话知识节点，从该待学习用户会话活动数据对应的多个第二用户会话知识节点中选取目标用户会话知识节点；

基于每个所述待学习用户会话活动数据对应的第一欺诈判别向量、每个所述待学习用户会话活动数据的目标用户会话知识节点的第二欺诈判别向量以及每个所述待学习用户会话活动数据所属的欺诈标签得到第一误差度量值；

基于每个所述待学习用户会话活动数据对应的第一用户会话知识节点和该第一用户会话知识节点对应的模板欺诈字段、以及每个所述待学习用户会话活动数据对应的各第二用户会话知识节点和各第二用户会话知识节点对应的欺诈估计字段得到第二误差度量值；

将所述第一误差度量值与所述第二误差度量值进行相加获得欺诈学习误差值。

在第一方面的一种可能的实施方式中，所述基于每个所述待学习用户会话活动数据对应的第一欺诈判别向量、每个所述待学习用户会话活动数据的目标用户会话知识节点的第二欺诈判别向量以及每个所述待学习用户会话活动数据所属的欺诈标签得到第一误差度量值，包括：

对所述待学习用户会话活动数据对应的第一欺诈判别向量、该待学习用户会话活动数据的目标用户会话知识节点的第二欺诈判别向量进行融合生成所述待学习用户会话活动数据的第三欺诈判别向量；

将属于同一欺诈标签的待学习用户会话活动数据的第三欺诈判别向量进行特征代价计算得到第一特征代价值，所述第一特征代价值用于表征类内特征特征偏离值；

将属于不同欺诈标签的待学习用户会话活动数据的第三欺诈判别向量进行特征代价计算得到第二特征代价值，所述第二特征代价值用于表征类间特征特征偏离值；

基于所述第一特征代价值与所述第二特征代价值之间的商得到第一误差度量值。

在第一方面的一种可能的实施方式中，所述基于每个所述待学习用户会话活动数据中的第一用户会话知识节点从该待学习用户会话活动数据对应多个第二用户会话知识节点中选取目标用户会话知识节点，包括：

将所述待学习用户会话活动数据中的第一用户会话知识节点与该待学习用户会话活动数据对应的各第二用户会话知识节点进行会话依赖值计算，生成该待学习用户会话活动数据对应的各第二用户会话知识节点的会话依赖值，其中，所述会话依赖值用于表征所述第一用户会话知识节点与所述第二用户会话知识节点存在相同会话意图的置信度值；

获取会话依赖值大于设定依赖值的第二用户会话知识节点，作为所述待学习用户会话活动数据的目标用户会话知识节点。

在第一方面的一种可能的实施方式中，所述基于每个所述待学习用户会话活动数据对应的第一用户会话知识节点和该第一用户会话知识节点对应的模板欺诈字段、以及各第二用户会话知识节点和各第二用户会话知识节点对应的欺诈估计字段得到第二误差度量值，包括：

基于每个所述待学习用户会话活动数据对应的第一用户会话知识节点和各第二用户会话知识节点，生成该待学习用户会话活动数据中各第二用户会话知识节点对应的网络学习价值；

基于每个所述待学习用户会话活动数据对应的第二用户会话知识节点的第一数量和目标用户会话知识节点的第二数量得到该待学习用户会话活动数据的训练价值参数；

基于所述待学习用户会话活动数据中第一用户会话知识节点对应的模板欺诈字段和各第二用户会话知识节点对应的欺诈估计字段，生成所述待学习用户会话活动数据的欺诈估计置信度；

基于每个待学习用户会话活动数据中各第二用户会话知识节点对应的网络学习价值、该待学习用户会话活动数据的训练价值参数和欺诈估计置信度，生成第二误差度量值。

在第一方面的一种可能的实施方式中，基于每个所述待学习用户会话活动数据对应的第一用户会话知识节点和各第二用户会话知识节点，生成该待学习用户会话活动数据中各第二用户会话知识节点对应的网络学习价值，包括：

将每个所述待学习用户会话活动数据对应的第一用户会话知识节点和各第二用户会话活动数据进行共享特征数量计算，生成每个待学习用户会话活动数据中各第二用户会话活动数据对应的共享特征值，每个所述第二用户会话活动数据对应的共享特征值为该第二用户会话知识节点对应的网络学习价值；

所述基于每个所述待学习用户会话活动数据对应第二用户会话知识节点的第一数量和目标用户会话知识节点的第二数量得到该待学习用户会话活动数据的训练价值参数，包括：

获取所述待学习用户会话活动数据对应的第二用户会话知识节点的第一数量与目标用户会话知识节点的第二数量之间的差值；

基于所述待学习用户会话活动数据对应的差值与和该待学习用户会话活动数据对应的目标用户会话分支数据的第三数量之间的商，生成待学习用户会话活动数据的训练价值参数；

所述基于所述待学习用户会话活动数据中第一用户会话知识节点对应的模板欺诈字段和各第二用户会话知识节点对应的欺诈估计字段，生成所述待学习用户会话活动数据的欺诈估计置信度，包括：

获取所述待学习用户会话活动数据中各第二用户会话知识节点对应的欺诈估计字段中与第一用户会话知识节点对应的模板欺诈字段相同的欺诈估计字段的第四数量；

将该第四数量与待学习用户会话活动数据对应的第二用户会话知识节点的第一数量相除获得的商，确定为所述待学习用户会话活动数据的欺诈估计置信度；

所述基于每个待学习用户会话活动数据中各第二用户会话知识节点对应的网络学习价值、该待学习用户会话活动数据的训练价值参数和欺诈估计置信度，生成第二误差度量值，包括：

对所述待学习用户会话活动数据中各第二用户会话活动数据对应的网络学习价值进行融合生成所述待学习用户会话活动数据的网络学习价值；

对所述待学习用户会话活动数据的欺诈估计置信度计算信息散度，将计算的信息散度与该待学习用户会话活动数据的网络学习价值和训练价值参数进行加权融合得到该待学习用户会话活动数据对应的误差度量值；

对每个所述待学习用户会话活动数据的误差度量值进行相加，生成第二误差度量值。

在第一方面的一种可能的实施方式中，所述第一欺诈行为识别网络的训练步骤，包括：

获取第二模板用户会话活动数据序列，所述第二模板用户会话活动数据序列中包括多个欺诈标签的欺诈行为对应的模板用户会话活动数据，每个模板用户会话活动数据分别携带包括欺诈行为定位数据的第一用户会话知识节点及该第一用户会话知识节点对应的模板欺诈字段；

将第二模板用户会话活动数据序列中的各模板用户会话活动数据加载到长短期记忆网络模型中，依据各模板用户会话活动数据对长短期记忆网络模型进行迭代权重信息更新，生成第一欺诈行为识别网络。

依据本申请的第二方面，提供一种云服务器，所述云服务器包括机器可读存储介质及处理器，所述机器可读存储介质存储有机器可执行指令，所述处理器在执行所述机器可执行指令时，该云服务器实现前述的应用于机器学习的欺诈行为识别方法。

依据本申请的第三方面，提供提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机可执行指令，当所述计算机可执行指令被执行时，实现前述的应用于机器学习的欺诈行为识别方法。

依据上述任一方面，本申请的有效效果为：

通过从第一模板用户会话活动数据序列中获取多个待学习用户会话活动数据，基于第一欺诈行为识别网络提取每个待学习用户会话活动数据的第一用户会话知识节点的第一欺诈判别向量，以及提取每个待学习用户会话活动数据在多个衍生特征维度下对应有欺诈行为的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量和欺诈估计字段，基于每个待学习用户会话活动数据中的第一用户会话知识节点、第一用户会话知识节点的第一欺诈判别向量和模板欺诈字段、待学习用户会话活动数据中的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量和欺诈估计字段，生成欺诈学习误差值，基于欺诈学习误差值更新第一欺诈行为识别网络的网络权重信息，直至满足网络收敛要求时得到第二欺诈行为识别网络。由此可以获得欺诈行为识别性能更强的第二欺诈行为识别网络，提高对任意用户会话活动数据进行欺诈行为识别的准确性，进而提高后续反欺诈处理的可靠性。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以依据这些附图获得其它相关的附图。

图1本申请实施例所提供的应用于机器学习的欺诈行为识别方法的流程示意图；

图2示出了本申请实施例所提供的用于实现上述的应用于机器学习的欺诈行为识别方法的云服务器的组件结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将依据本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，应当理解，本申请中附图仅起到说明和描述的目的，并不用于限定本申请的保护范围。另外，应当理解，示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了依据本申请实施例的一些实施例实现的操作。应该理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其它操作，也可以从流程图中销毁一个或多个操作。

另外，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。依据本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例，都属于本申请保护的范围。

图1示出了本申请实施例提供的应用于机器学习的欺诈行为识别方法的流程示意图，应当理解，在其它实施例中，本实施例的应用于机器学习的欺诈行为识别方法其中部分步骤的顺序可以依据实际需要相互共享，或者其中的部分步骤也可以省略或维持。该应用于机器学习的欺诈行为识别方法的详细包括：

步骤110，从第一模板用户会话活动数据序列中获取多个待学习用户会话活动数据。

其中，第一模板用户会话活动数据序列包括多个欺诈标签（如交易诈骗、网络诈骗、电话诈骗、盗卡、盗号等欺诈标签）的欺诈行为对应的模板用户会话活动数据（如用户在金融贷款申请过程中的会话行为数据），每个模板用户会话活动数据分别携带包括欺诈行为定位数据的第一用户会话知识节点及该第一用户会话知识节点对应的模板欺诈字段，多个待学习用户会话活动数据分别属于多个欺诈标签的欺诈行为对应的模板用户会话活动数据。

步骤120：基于第一欺诈行为识别网络提取多个待学习用户会话活动数据中每个待学习用户会话活动数据的第一用户会话知识节点的第一欺诈判别向量。

其中，第一欺诈行为识别网络可以是基于第二模板用户会话活动数据序列中的大量的模板用户会话活动数据结合深度学习算法进行迭代权重信息更新得到的神经网络模型。深度学习算法可以包括但不限于长短期记忆网络模型的算法等等。

其中，用户会话知识节点可以表示用户在业务会话过程中经由的某个业务行为流程，如用户在金融贷款申请过程中填写用途数据的业务行为流程。

例如，可以将第二模板用户会话活动数据序列中的各模板用户会话活动数据加载到长短期记忆网络模型中，依据各模板用户会话活动数据对长短期记忆网络模型进行迭代权重信息更新，生成第一欺诈行为识别网络。

在基于第一欺诈行为识别网络提取多个待学习用户会话活动数据中每个待学习用户会话活动数据的第一用户会话知识节点的第一欺诈判别向量时，提取到的第一用户会话知识节点的第一欺诈判别向量可以用于表征该第一用户会话知识节点中的欺诈行为对应的欺诈字段的语义特征。

步骤130：基于第一欺诈行为识别网络提取每个待学习用户会话活动数据在多个衍生特征维度下对应有欺诈行为的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量以及每个第二用户会话知识节点对应的欺诈估计字段。

其中，第一欺诈行为识别网络可以对各待学习用户会话活动数据进行场景衍生（如将金融贷款申请场景衍生到金融投资资金转移场景），并对场景衍生后的各待学习用户会话活动数据进行欺诈特征识别，生成场景衍生后的用户会话活动数据中，对应有欺诈行为的第二用户会话知识节点，以及对该第二用户会话知识节点进行欺诈字段挖掘，生成该第二用户会话知识节点对应的欺诈估计字段，其中，该欺诈估计字段至少包括该第二用户会话知识节点中的欺诈行为对应的欺诈标签，该欺诈估计字段还可以包括对应的第二用户会话知识节点中的欺诈行为的标识字段信息，由此获得各待学习用户会话活动数据在每个衍生特征维度下的第二用户会话知识节点和该用户会话知识节点对应的欺诈估计字段。第二用户会话知识节点可以仅包括第一用户会话知识节点的部分子节点，也可以包括完整的第一用户会话知识节点，也即第一用户会话知识节点可以为第二用户会话知识节点的一部分。

第一欺诈行为识别网络可以包括多个编码单元和降维单元，多个编码单元中每个编码单元所对应的编码区间不同。该第一欺诈行为识别网络可以通过如下的过程来输出待学习用户会话活动数据的第一欺诈判别向量和第二欺诈判别向量：多个编码单元包括第一编码单元和第二编码单元，由第一编码单元对待学习用户会话活动数据进行编码，生成第一用户会话知识节点对应的第一欺诈判别向量；由降维单元对场景衍生处理后的待学习用户会话活动数据进行处理得到场景衍生后的模板用户会话活动数据中的第二用户会话知识节点，并由第二编码单元对场景衍生后的各模板用户会话活动数据中的第二用户会话知识节点进行编码得到的第二欺诈判别向量。

本实施例中，第一欺诈行为识别网络还可以包括全连接单元，用于基于对各第二用户会话知识节点编辑的特征向量输出该第二用户会话知识节点中的欺诈行为对应的欺诈标签的置信度，也即得到各待学习用户会话活动数据在每个衍生特征维度下的第二用户会话知识节点对应的欺诈估计字段。

例如，全连接单元可以第二欺诈判别向量为输入，并基于第二欺诈判别向量依次进行预测，对场景衍生后的待学习用户会话活动数据中第二用户会话知识节点中的欺诈行为的最终预测数据，该第二用户会话知识节点中的欺诈行为属于预定欺诈标签的第一置信度。也即，可以通过全连接单元得到场景衍生处理后的待学习用户会话活动数据中第二用户会话知识节点对应的欺诈估计字段。

步骤140：基于每个待学习用户会话活动数据中的第一用户会话知识节点、第一用户会话知识节点的第一欺诈判别向量以及第一用户会话知识节点的模板欺诈字段、待学习用户会话活动数据中的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量以及每个第二用户会话知识节点对应的欺诈估计字段，生成欺诈学习误差值。

一些示例性的设计思路中，上述步骤140可以是：基于待学习用户会话活动数据中的第一用户会话知识节点对应的第一欺诈判别向量和第二用户会话知识节点对应的第二欺诈判别向量以及每个待学习用户会话活动数据所属的欺诈标签得到第一误差度量值。基于每个待学习用户会话活动数据对应的第一用户会话知识节点和该第一用户会话知识节点对应的模板欺诈字段、以及每个待学习用户会话活动数据对应的各第二用户会话知识节点和各第二用户会话知识节点对应的欺诈估计字段得到第二误差度量值；基于第一误差度量值和第二误差度量值得到欺诈学习误差值。

基于每个待学习用户会话活动数据中的第一用户会话知识节点、第一用户会话知识节点的第一欺诈判别向量以及第一用户会话知识节点的模板欺诈字段、待学习用户会话活动数据中的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量以及每个第二用户会话知识节点对应的欺诈估计字段，生成欺诈学习误差值的方式还可以有其它可能的处理方式，此处不作具体限定。

步骤150：基于所述欺诈学习误差值更新所述第一欺诈行为识别网络的网络权重信息，直至满足网络收敛要求时得到第二欺诈行为识别网络，并基于所述第二欺诈行为识别网络对任意输入的用户会话活动数据进行欺诈行为识别，以基于欺诈行为识别结果进行对应的反欺诈处理。

例如，可以获取欺诈行为识别结果中的每个欺诈行为标签所对应反欺诈处理策略，然后基于该对应的反欺诈处理策略进行对应的反欺诈处理。

基于以上步骤，基于第一欺诈行为识别网络提取每个待学习用户会话活动数据的第一用户会话知识节点的第一欺诈判别向量，以及提取每个待学习用户会话活动数据在多个衍生特征维度下对应有欺诈行为的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量和欺诈估计字段，从而在基于每个待学习用户会话活动数据中的第一用户会话知识节点、第一用户会话知识节点的第一欺诈判别向量和模板欺诈字段、待学习用户会话活动数据中的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量和欺诈估计字段，生成欺诈学习误差值，并基于欺诈学习误差值更新第一欺诈行为识别网络的网络权重信息，直至满足网络收敛要求时得到第二欺诈行为识别网络。可以实现基于少量的模板用户会话活动数据对第一欺诈行为识别网络进行权重信息更新，且权重信息更新过程中，对各待学习用户会话活动数据进行场景衍生处理后提取特征，可以使得提取的各待学习用户会话活动数据的第二欺诈判别向量的精度更高，由此获得欺诈行为识别性能更高的第二欺诈行为识别网络，提高对任意用户会话活动数据进行欺诈行为识别的准确性。

下面提供以上欺诈行为识别网络的训练方法的实施例，具体步骤可以包括：

步骤210：从第一模板用户会话活动数据序列中获取多个待学习用户会话活动数据。

其中，第一模板用户会话活动数据序列包括多个欺诈标签的欺诈行为对应的模板用户会话活动数据，每个模板用户会话活动数据分别携带包括欺诈行为定位数据的第一用户会话知识节点及该第一用户会话知识节点对应的模板欺诈字段，多个待学习用户会话活动数据分别属于多个欺诈标签的欺诈行为对应的模板用户会话活动数据。

步骤220：基于第一欺诈行为识别网络提取多个待学习用户会话活动数据中每个待学习用户会话活动数据的第一用户会话知识节点的第一欺诈判别向量。

步骤230：基于第一欺诈行为识别网络提取每个待学习用户会话活动数据在多个衍生特征维度下对应有欺诈行为的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量以及每个第二用户会话知识节点对应的欺诈估计字段。

步骤240：基于待学习用户会话活动数据中的第一用户会话知识节点，从该待学习用户会话活动数据对应的多个第二用户会话知识节点中选取目标用户会话知识节点。

其中，基于待学习用户会话活动数据中的第一用户会话知识节点从其对应的多个第二用户会话知识节点中选取目标用户会话知识节点的方式可以有多种，例如，可以依据相似度计算方法、匹配算法等等。

一些示例性的设计思路中，上述步骤240可以是，将待学习用户会话活动数据中的第一用户会话知识节点与该待学习用户会话活动数据对应的各第二用户会话知识节点进行会话依赖值计算，生成该待学习用户会话活动数据对应的各第二用户会话知识节点的会话依赖值；获取会话依赖值大于设定依赖值的第二用户会话知识节点，作为待学习用户会话活动数据的目标用户会话知识节点。

当上述的会话依赖值具体指共享特征数量时，上述步骤240还可以是，待学习用户会话活动数据中的第一用户会话知识节点，从该待学习用户会话活动数据对应的第二用户会话知识节点中选取出与该第一用户会话知识节点共享特征数量大于预设共享特征数量阈值的用户会话知识节点。

上述的预设共享特征数量阈值可以是0.5。也即，待学习用户会话活动数据对应的第二用户会话知识节点中与该待学习用户会话活动数据对应的第一用户会话知识节点的共享特征数量大于0.5的用户会话知识节点作为目标用户会话知识节点。

步骤250：基于每个待学习用户会话活动数据对应的第一欺诈判别向量、每个待学习用户会话活动数据的目标用户会话知识节点的第二欺诈判别向量以及每个待学习用户会话活动数据所属的欺诈标签得到第一误差度量值。

其中，上述步骤250可以是，基于每个待学习用户会话活动数据对应的第一欺诈判别向量和该待学习用户会话活动数据的目标用户会话知识节点的第二欺诈判别向量确定该待学习用户会话活动数据的第三欺诈判别向量。基于各待学习用户会话活动数据所属欺诈标签计算属于相同欺诈标签的各待学习用户会话活动数据的第三欺诈判别向量之间的第一特征偏离值，以及计算属于不同欺诈标签的各待学习用户会话活动数据的第三欺诈判别向量之间的第二特征偏离值，并将第一特征偏离值与第二特征偏离值的商作为第一误差度量值。

上述步骤250可以包括以下步骤：

步骤251：对待学习用户会话活动数据对应的第一欺诈判别向量、该待学习用户会话活动数据的目标用户会话知识节点的第二欺诈判别向量进行融合生成待学习用户会话活动数据的第三欺诈判别向量。

步骤252：将属于同一欺诈标签的待学习用户会话活动数据的第三欺诈判别向量进行特征代价计算得到第一特征代价值。

步骤253：将属于不同欺诈标签的待学习用户会话活动数据的第三欺诈判别向量进行特征代价计算得到第二特征代价值。

步骤254：基于第一特征代价值与第二特征代价值之间的商得到第一误差度量值。

其中，上述步骤254具体可以是，将第一特征代价值与第二特征代价值之间的商作为第一误差度量值。

示例性的，以待学习用户会话活动数据包括用户会话活动数据a、用户会话活动数据b、用户会话活动数据c、用户会话活动数据d以及用户会话活动数据e，且用户会话活动数据a和用户会话活动数据b属于欺诈标签A，用户会话活动数据c属于欺诈标签B，用户会话活动数据d和用户会话活动数据e属于欺诈标签C，则步骤252可以是：对用户会话活动数据a和用户会话活动数据b进行特征代价计算以及对用户会话活动数据d和用户会话活动数据e进行特征代价计算后累加或计算均值，生成第一特征代价值。

相应的，步骤253可以是：将用户会话活动数据a与用户会话活动数据c、用户会话活动数据d以及用户会话活动数据e分别进行特征代价计算，将用户会话活动数据b与用户会话活动数据c、用户会话活动数据d以及用户会话活动数据e分别进行特征代价计算，以及将用户会话活动数据c与用户会话活动数据d和用户会话活动数据e分别进行特征偏离值计算，将上述进行特征偏离值的计算结果进行累加或计算均值，生成第二特征代价值。

上述步骤253还可以是，对用户会话活动数据a和用户会话活动数据b计算特征均值得到欺诈标签A对应的特征值，以及将用户会话活动数据d和用户会话活动数据e计算特征均值，生成欺诈标签C对应的特征值，对欺诈标签A、欺诈标签B以及欺诈标签C进行两两之间的特征代价计算后累加或者进行融合生成第二特征代价值。

由于同欺诈标签的待学习用户会话活动数据的第三欺诈判别向量之间的特征偏离值较小，而不同欺诈标签的待学习用户会话活动数据的第三欺诈判别向量之间的特征偏离值较大，因此，通过将同欺诈标签的待学习用户会话活动数据之间的第三欺诈判别向量特征偏离值(第一特征代价值)与不同欺诈标签的待学习用户会话活动数据指之间的第三欺诈判别向量特征偏离值(第二特征代价值)相除获得的商越小，则可以确认上述的第一欺诈行为识别网络获得的欺诈估计字段和目标用户会话知识节点的第二欺诈判别向量越准确。

步骤260：基于每个待学习用户会话活动数据对应的第一用户会话知识节点和该第一用户会话知识节点对应的模板欺诈字段、以及每个待学习用户会话活动数据对应的各第二用户会话知识节点和各第二用户会话知识节点对应的欺诈估计字段得到第二误差度量值。

其中，上述步骤260可以包括：将上述的待学习用户会话活动数据对应的第一用户会话知识节点和该第一用户会话知识节点对应的模板欺诈字段、以及每个待学习用户会话活动数据对应的各第二用户会话知识节点和各第二用户会话知识节点对应的欺诈估计字段得到第二误差度量值加载到预置的Loss函数（如交叉熵损失函数）进行计算，生成第二误差度量值。

一些示例性的设计思路中，步骤260可以包括下述步骤：

步骤261：基于每个待学习用户会话活动数据对应的第一用户会话知识节点和各第二用户会话知识节点，生成该待学习用户会话活动数据中各第二用户会话知识节点对应的网络学习价值。

其中，上述步骤261具体可以是，将每个待学习用户会话活动数据对应的第一用户会话知识节点和各第二用户会话活动数据进行共享特征数量计算，生成每个待学习用户会话活动数据中各第二用户会话活动数据对应的共享特征值，每个第二用户会话活动数据对应的共享特征值为该第二用户会话知识节点对应的网络学习价值。

或者，将每个待学习用户会话活动数据对应的第一用户会话知识节点和各第二用户会话活动数据进行关联度分析，生成每个待学习用户会话活动数据中各第二用户会话活动数据对应的关联度，每个第二用户会话活动数据对应的关联度为该第二用户会话知识节点对应的网络学习价值。

步骤262：基于每个待学习用户会话活动数据对应的第二用户会话知识节点的第一数量和目标用户会话知识节点的第二数量得到该待学习用户会话活动数据的训练价值参数。

待学习用户会话活动数据相对应的目标用户会话知识节点可以是待学习用户会话活动数据对应的第二用户会话知识节点中，与第一用户会话知识节点的共享特征数量或匹配度大于设定匹配度的第二用户会话知识节点。

上述的训练价值参数可以是每个待学习用户会话活动数据的目标用户会话知识节点的第二数量与该张用户会话活动数据的第二用户会话知识节点的第一数量的商，上述的训练价值参数还可以是每个待学习用户会话活动数据的目标用户会话知识节点的第二数量与该张用户会话活动数据的第二用户会话知识节点的第一数量和目标用户会话知识节点的第二数量的差值的商。

一些示例性的设计思路中，上述步骤262具体可以是：获取待学习用户会话活动数据对应的第二用户会话知识节点的第一数量与目标用户会话知识节点的第二数量之间的差值；基于待学习用户会话活动数据对应的差值与和该待学习用户会话活动数据对应的目标用户会话分支数据的第三数量之间的商，生成待学习用户会话活动数据的训练价值参数。

其中，上述基于待学习用户会话活动数据对应的差值与和该待学习用户会话活动数据对应的目标用户会话分支数据的第三数量之间的商，生成待学习用户会话活动数据的训练价值参数，可以是，将待学习用户会话活动数据对应的差值与和该待学习用户会话活动数据对应的目标用户会话分支数据的第三数量之间的商与一预设系数相乘得到训练价值参数，也可以是将待学习用户会话活动数据对应的差值与和该待学习用户会话活动数据对应的目标用户会话分支数据的第三数量之间的商作为待学习用户会话活动数据的训练价值参数。

步骤263：基于待学习用户会话活动数据中第一用户会话知识节点对应的模板欺诈字段和各第二用户会话知识节点对应的欺诈估计字段，生成待学习用户会话活动数据的欺诈估计置信度。

其中，上述步骤263具体可以是，获取目标用户会话活动数据中第二用户会话知识节点对应的模板欺诈字段中与第一用户会话活动数据对应的模板欺诈字段相同的欺诈字段数量，将该第四数量与目标用户会话活动数据中第二用户会话知识节点的第一数量相比，生成欺诈估计置信度。

也即，一些示例性的设计思路中，上述步骤263包括：获取待学习用户会话活动数据中各第二用户会话知识节点对应的欺诈估计字段中与第一用户会话知识节点对应的模板欺诈字段相同的欺诈估计字段的第四数量；将该第四数量与待学习用户会话活动数据对应的第二用户会话知识节点的第一数量相除获得的商，确定为待学习用户会话活动数据的欺诈估计置信度。

步骤264：基于每个待学习用户会话活动数据中各第二用户会话知识节点对应的网络学习价值、该待学习用户会话活动数据的训练价值参数和欺诈估计置信度，生成第二误差度量值。

其中，上述步骤264可以是：对每个模板用户会话活动数据中各第二用户会话知识节点对应的网络学习价值计算均值或中值得到该待学习用户会话活动数据的网络学习价值，将每个待学习用户会话活动数据的网络学习价值、训练价值参数以及欺诈估计置信度进行加权融合得到第二误差度量值。

一些示例性的设计思路中，上述步骤264具体可以是：对待学习用户会话活动数据中各第二用户会话活动数据对应的网络学习价值进行融合生成待学习用户会话活动数据的网络学习价值；对待学习用户会话活动数据的欺诈估计置信度计算信息散度，将计算的信息散度与该待学习用户会话活动数据的网络学习价值和训练价值参数进行加权融合得到该待学习用户会话活动数据对应的误差度量值；对每个待学习用户会话活动数据的误差度量值进行相加，生成第二误差度量值。

步骤270：将第一误差度量值与第二误差度量值进行相加获得欺诈学习误差值。

步骤280：基于欺诈学习误差值更新第一欺诈行为识别网络的网络权重信息，直至满足网络收敛要求时得到第二欺诈行为识别网络。

基于以上步骤，通过基于待学习用户会话活动数据中的第一用户会话知识节点，从该待学习用户会话活动数据对应的多个第二用户会话知识节点中选取目标用户会话知识节点，基于每个待学习用户会话活动数据对应的第一欺诈判别向量、每个待学习用户会话活动数据的目标用户会话知识节点的第二欺诈判别向量以及每个待学习用户会话活动数据所属的欺诈标签得到第一误差度量值；以及基于每个待学习用户会话活动数据对应的第一用户会话知识节点和该第一用户会话知识节点对应的模板欺诈字段、以及每个待学习用户会话活动数据对应的各第二用户会话知识节点和各第二用户会话知识节点对应的欺诈估计字段得到第二误差度量值；并基于对第一误差度量值与第二误差度量值进行相加获得的欺诈学习误差值更新第一欺诈行为识别网络。由此可以同时使用两个误差度量值来更新第一欺诈行为识别网络，即使用用于表征同一欺诈标签中的特征和不同欺诈标签的特征之间的区别表征(也即表征相同欺诈标签的区别表征小而不同欺诈标签的区别表征大)的第一误差度量值和用于表征进行欺诈识别误差的第二误差度量值共同更新第一欺诈行为识别网络，由此可以获得欺诈行为性能更强的第二欺诈行为识别网络，提高对任意用户会话活动数据进行欺诈行为识别的准确性。

下面提供以上欺诈行为识别网络的训练方法的另一种实施例，具体步骤可以包括：

步骤310：将第二模板用户会话活动数据序列中的多个欺诈标签的模板用户会话活动数据分别加载到长短期记忆网络模型的模型参数层中，基于该模型参数层进行迭代权重信息更新，生成第一欺诈行为识别网络。

步骤320：基于第一欺诈行为识别网络的第一编码单元提取多个待学习用户会话活动数据中每个待学习用户会话活动数据的第一用户会话知识节点的第一欺诈判别向量。

步骤330：基于第一欺诈行为识别网络的降维单元提取每个待学习用户会话活动数据在多个衍生特征维度下对应有欺诈行为的第二用户会话知识节点、以及基于第一欺诈行为识别网络的第二编码单元提取每个第二用户会话知识节点对应的第二欺诈判别向量以及基于第一欺诈行为识别网络的全连接单元输出每个第二用户会话知识节点对应的欺诈估计字段。

步骤340：基于待学习用户会话活动数据中的第一用户会话知识节点，从该待学习用户会话活动数据对应的多个第二用户会话知识节点中选取目标用户会话知识节点，并基于每个待学习用户会话活动数据对应的第一欺诈判别向量、每个待学习用户会话活动数据的目标用户会话知识节点的第二欺诈判别向量以及每个待学习用户会话活动数据所属的欺诈标签得到第一误差度量值。

示例性的，可以将待学习用户会话活动数据中的第一用户会话知识节点与该待学习用户会话活动数据对应的各第二用户会话知识节点进行会话依赖值计算，生成该待学习用户会话活动数据对应的各第二用户会话知识节点的会话依赖值；获取会话依赖值大于设定依赖值的第二用户会话知识节点，作为待学习用户会话活动数据的目标用户会话知识节点。对待学习用户会话活动数据对应的第一欺诈判别向量、该待学习用户会话活动数据的目标用户会话知识节点的第二欺诈判别向量进行融合生成待学习用户会话活动数据的第三欺诈判别向量；以及将属于同一欺诈标签的待学习用户会话活动数据的第三欺诈判别向量进行特征代价计算得到第一特征代价值；将属于不同欺诈标签的待学习用户会话活动数据的第三欺诈判别向量进行特征代价计算得到第二特征代价值；基于第一特征代价值与第二特征代价值之间的商得到第一误差度量值。

步骤350：基于每个待学习用户会话活动数据对应的第一用户会话知识节点和该第一用户会话知识节点对应的模板欺诈字段、以及每个待学习用户会话活动数据对应的各第二用户会话知识节点和各第二用户会话知识节点对应的欺诈估计字段得到第二误差度量值。

示例性的，可以将每个待学习用户会话活动数据对应的第一用户会话知识节点和各第二用户会话活动数据进行共享特征数量计算，生成每个待学习用户会话活动数据中各第二用户会话活动数据对应的共享特征值，每个第二用户会话活动数据对应的共享特征值为该第二用户会话知识节点对应的网络学习价值。获取待学习用户会话活动数据对应的第二用户会话知识节点的第一数量与目标用户会话知识节点的第二数量之间的差值，基于待学习用户会话活动数据对应的差值与和该待学习用户会话活动数据对应的目标用户会话分支数据的第三数量之间的商，生成待学习用户会话活动数据的训练价值参数。获取待学习用户会话活动数据中各第二用户会话知识节点对应的欺诈估计字段中与第一用户会话知识节点对应的模板欺诈字段相同的欺诈估计字段的第四数量；将该第四数量与待学习用户会话活动数据对应的第二用户会话知识节点的第一数量相除获得的商，确定为待学习用户会话活动数据的欺诈估计置信度。

在获得第一误差度量值和第二误差度量值后，可以执行如下步骤：

步骤360：将第一误差度量值与第二误差度量值进行相加获得欺诈学习误差值。

步骤370：基于欺诈学习误差值更新第一欺诈行为识别网络的网络权重信息。

在完成更新第一欺诈行为识别网络的网络权重信息后，可以分析是否达到网络收敛要求，若未达到，则返回执行步骤310，直至满足网络收敛要求时得到第二欺诈行为识别网络。

下面提供本申请进一步的应用实施例，包括下述步骤：

步骤410：获取任意输入的用户会话活动数据。

步骤420：调用第二欺诈行为识别网络，对任意输入的用户会话活动数据进行欺诈行为识别，生成欺诈行为识别结果。

通过在获取到任意输入的用户会话活动数据时，调用第二欺诈行为识别网络对任意输入的用户会话活动数据进行欺诈行为识别，可以提高对任意输入的用户会话活动数据进行欺诈行为识别得到的欺诈行为识别结果的准确性。

图2示意性地示出了可被用于实现本申请中所述的各个实施例的云服务器100。

对于一个实施例，图2示出了云服务器100，该云服务器100具有一个或多个处理器102、被耦合到(一个或多个)处理器102中的一个或多个的控制模块(芯片组)104、被耦合到控制模块104的存储器106、被耦合到控制模块104的非易失性存储器(NVM)/存储设备108、被耦合到控制模块104的一个或多个输入/输出设备110，和被耦合到控制模块104的网络接口112。

处理器102可包括一个或多个单核或多核处理器，处理器102可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。一些示例性的设计思路中，云服务器100能够作为本申请实施例中所述网关等服务器设备。

一些示例性的设计思路中，云服务器100可包括具有指令114的一个或多个计算机可读介质(例如，存储器106或NVM/存储设备108)和与该一个或多个计算机可读介质相融合被配置为执行指令114以实现模块从而执行本公开中所述的动作的一个或多个处理器102。

对于一个实施例，控制模块104可包括任意适当的接口控制器，以向(一个或多个)处理器102中的一个或多个和/或与控制模块104通信的任意适当的设备或组件提供任意适当的接口。

控制模块104可包括存储器控制器模块，以向存储器106提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。

存储器106可被用于例如为云服务器100加载和存储数据和/或指令114。对于一个实施例，存储器106可包括任意适当的易失性存储器，例如，适当的DRAM。一些示例性的设计思路中，存储器106可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。

对于一个实施例，控制模块104可包括一个或多个输入/输出控制器，以向NVM/存储设备108及(一个或多个)输入/输出设备110提供接口。

例如，NVM/存储设备108可被用于存储数据和/或指令114。NVM/存储设备108可包括任意适当的非易失性存储器(例如，闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如，一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。

NVM/存储设备108可包括在物理上作为云服务器100被安装在其上的设备的一部分的存储资源，或者其可被该设备访问可不必作为该设备的一部分。例如，NVM/存储设备108可依据网络经由(一个或多个)输入/输出设备110进行访问。

(一个或多个)输入/输出设备110可为云服务器100提供接口以与任意其它适当的设备通信，输入/输出设备110可以包括通信组件、拼音组件、传感器组件等。网络接口112可为云服务器100提供接口以依据一个或多个网络通信，云服务器100可依据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信，例如接入依据通信标准的无线网络，如WwFw、2G、3G、4G、5G等，或它们的组合进行无线通信。

对于一个实施例，(一个或多个)处理器102中的一个或多个可与控制模块104的一个或多个控制器(例如，存储器控制器模块)的逻辑加载在一起。对于一个实施例，(一个或多个)处理器102中的一个或多个可与控制模块104的一个或多个控制器的逻辑加载在一起以形成系统级加载。对于一个实施例，(一个或多个)处理器102中的一个或多个可与控制模块104的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例，(一个或多个)处理器102中的一个或多个可与控制模块104的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。

在各个实施例中，云服务器100可以但不限于是：云服务器、台式计算设备或移动计算设备(例如，膝上型计算设备、手持计算设备、平板电脑、上网本等)等终端设备。在各个实施例中，云服务器100可具有更多或更少的组件和/或不同的架构。例如，一些示例性的设计思路中，云服务器100包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。

以上对本申请实施例进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种应用于机器学习的欺诈行为识别方法，其特征在于，应用于云服务器，所述方法包括：

基于所述欺诈学习误差值更新所述第一欺诈行为识别网络的网络权重信息，直至满足网络收敛要求时得到第二欺诈行为识别网络，并基于所述第二欺诈行为识别网络对任意输入的用户会话活动数据进行欺诈行为识别，以基于欺诈行为识别结果进行对应的反欺诈处理；

基于每个所述待学习用户会话活动数据中的第一用户会话知识节点、第一用户会话知识节点的第一欺诈判别向量以及第一用户会话知识节点的模板欺诈字段、所述待学习用户会话活动数据中的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量以及每个第二用户会话知识节点对应的欺诈估计字段，生成欺诈学习误差值，包括：

将所述第一误差度量值与所述第二误差度量值进行相加获得欺诈学习误差值；

所述基于每个所述待学习用户会话活动数据对应的第一欺诈判别向量、每个所述待学习用户会话活动数据的目标用户会话知识节点的第二欺诈判别向量以及每个所述待学习用户会话活动数据所属的欺诈标签得到第一误差度量值，包括：

基于所述第一特征代价值与所述第二特征代价值之间的商得到第一误差度量值；

所述基于所述待学习用户会话活动数据中的第一用户会话知识节点，从该待学习用户会话活动数据对应的多个第二用户会话知识节点中选取目标用户会话知识节点，包括：

获取会话依赖值大于设定依赖值的第二用户会话知识节点，作为所述待学习用户会话活动数据的目标用户会话知识节点；

所述基于每个所述待学习用户会话活动数据对应的第一用户会话知识节点和该第一用户会话知识节点对应的模板欺诈字段、以及每个所述待学习用户会话活动数据对应的各第二用户会话知识节点和各第二用户会话知识节点对应的欺诈估计字段得到第二误差度量值，包括：

2.根据权利要求1所述的应用于机器学习的欺诈行为识别方法，其特征在于，基于每个待学习用户会话活动数据中各第二用户会话知识节点对应的网络学习价值、该待学习用户会话活动数据的训练价值参数和欺诈估计置信度，生成第二误差度量值，包括：

所述基于每个所述待学习用户会话活动数据对应的第二用户会话知识节点的第一数量和目标用户会话知识节点的第二数量得到该待学习用户会话活动数据的训练价值参数，包括：

3.根据权利要求1-2中任意一项所述的应用于机器学习的欺诈行为识别方法，其特征在于，所述第一欺诈行为识别网络的训练步骤，包括：

4.一种计算机可读存储介质，其特征在于，其上存储有机器可执行指令，所述机器可执行指令被处理器执行时实现权利要求1-3中任意一项所述的应用于机器学习的欺诈行为识别方法。

5.一种云服务器，其特征在于，包括处理器以及计算机可读存储介质，所述计算机可读存储介质存储有机器可执行指令，所述机器可执行指令被处理器执行时实现权利要求1-3中任意一项所述的应用于机器学习的欺诈行为识别方法。

6.一种基于如权利要求1-3中任一项所述的应用于机器学习的欺诈行为识别方法的识别系统，其特征在于，所述应用于机器学习的欺诈行为识别系统包括云服务器以及与所述云服务器通信连接的用户终端，所述云服务器具体用于：