CN109086975A

CN109086975A - 一种交易风险的识别方法和装置

Info

Publication number: CN109086975A
Application number: CN201810752760.6A
Authority: CN
Inventors: 郭龙
Original assignee: Alibaba Group Holding Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2018-07-10
Filing date: 2018-07-10
Publication date: 2018-12-25
Anticipated expiration: 2038-07-10
Also published as: CN109086975B

Abstract

本申请公开了一种交易风险的识别方法和装置，该方法包括：获取目标服务商的安全交易对应的第一数据以及待识别交易对应的第二数据；获取风险识别模型，所述风险识别模型基于所述第一数据和所述第二数据的混合数据进行训练得到，所述风险识别模型用于对交易的数据进行聚类；获取所述风险识别模型针对所述混合数据所输出的输出结果；根据所述输出结果对所述待识别交易的风险进行识别。

Description

一种交易风险的识别方法和装置

技术领域

本申请涉及信息安全领域，尤其涉及一种交易风险的识别方法和装置。

背景技术

在互联网交易中，用户在向服务商发送交易请求时，可以将用户信息携带在交易请求中，服务商在接收到交易请求，并对用户信息进行验证后，可以对用户的交易请求进行处理，进而实现互联网交易。

然而，随着互联网环境越来越复杂，存在一些非法用户，利用非法手段盗取用户在互联网交易中携带的用户信息，并使用这些用户信息进行非法交易，给用户的信息安全和财产安全带来极大风险。如何识别非法用户的非法交易成为亟需解决的问题。

发明内容

本申请实施例提供一种交易风险的识别方法和装置，用于解决在互联网交易中，如何识别非法用户的非法交易的问题。

为解决上述技术问题，本申请实施例是这样实现的：

第一方面，提出一种交易风险的识别方法，包括：

获取目标服务商的安全交易对应的第一数据以及待识别交易对应的第二数据；

获取风险识别模型，所述风险识别模型基于所述第一数据和所述第二数据的混合数据进行训练得到，所述风险识别模型用于对交易的数据进行聚类；

获取所述风险识别模型针对所述混合数据所输出的输出结果；

根据所述输出结果对所述待识别交易的风险进行识别。

第二方面，提出一种交易风险的识别装置，包括：

第一获取单元，获取目标服务商的安全交易对应的第一数据以及待识别交易对应的第二数据；

第二获取单元，获取风险识别模型，所述风险识别模型基于所述第一数据和所述第二数据的混合数据进行训练得到，所述风险识别模型用于对交易的数据进行聚类；

第三获取单元，获取所述风险识别模型针对所述混合数据所输出的输出结果；

识别单元，根据所述输出结果对所述待识别交易的风险进行识别。

第三方面，提出一种电子设备，该电子设备包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，该可执行指令在被执行时使该处理器执行以下操作：

根据所述输出结果对所述待识别交易的风险进行识别。

第四方面，提出一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下方法：

根据所述输出结果对所述待识别交易的风险进行识别。

第五方面，提出一种银行交易风险的识别方法，包括：

获取目标银行的安全交易对应的第一数据以及待识别交易对应的第二数据；

根据所述输出结果对所述待识别交易的风险进行识别。

第六方面，提出一种银行交易风险的识别装置，包括：

第一获取单元，获取目标银行的安全交易对应的第一数据以及待识别交易对应的第二数据；

第七方面，提出一种电子设备，该电子设备包括：

处理器；以及

根据所述输出结果对所述待识别交易的风险进行识别。

第八方面，提出一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下方法：

根据所述输出结果对所述待识别交易的风险进行识别。

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：

本申请实施例提供的技术方案，在对目标服务商的交易风险进行识别时，获取目标服务商的安全交易对应的第一数据以及待识别交易对应的第二数据；获取风险识别模型，所述风险识别模型基于所述第一数据和所述第二数据的混合数据进行训练所得到，所述风险识别模型用于对交易的数据进行聚类；获取所述风险识别模型针对所述混合数据所输出的输出结果；根据所述输出结果对所述待识别交易的风险进行识别。这样，以安全交易的交易数据和待识别交易的交易数据作为训练样本，可以实现无监督训练，根据无监督训练得到的风险识别模型，可以对存在异常的待识别交易进行有效识别，进而对目标服务商的交易风险进行有效识别。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请的一个实施例交易风险的识别方法的流程示意图；

图2是本申请的一个实施例交易风险的识别方法的流程示意图；

图3是本申请的一个实施例银行交易风险的识别方法的流程示意图；

图4是本申请的一个实施例电子设备的结构示意图；

图5是本申请的一个实施例交易风险的识别装置的结构示意图；

图6是本申请的一个实施例电子设备的结构示意图；

图7是本申请的一个实施例银行交易风险的识别装置的结构示意图。

具体实施方式

在互联网交易中，服务商在接收到用户的交易请求时，需要验证交易请求中携带的用户信息，在验证通过后，可以对用户的交易请求进行处理，从而实现互联网交易。然而，在实际应用中，存在一些非法用户会盗取用户信息，进而利用用户信息实现非法交易。

以银行交易为例时，银行卡的服务商在对银行卡的BIN(银行标识代码，BankIdentification Number)、银行卡的用户名以及银行卡的有效期等信息进行验证后，就可以实现银行交易。然而，当银行卡的BIN、银行卡的用户名以及银行卡的有效期等信息泄露时，非法用户将会轻易盗取具有相同BIN的一类银行卡的信息，进而利用盗用的信息进行非法交易，导致该类银行卡存在大量的非法交易行为，给用户带来极大损失。

现有技术中，为了识别非法用户的非法交易，通常可以从服务商的历史交易数据中获取安全交易数据和非法交易数据，并对安全交易数据以及非法交易数据进行训练，得到用于进行风险识别的模型，这样，服务商可以根据训练得到的模型对非法交易进行识别。

然而，在实际应用中，上述根据历史交易数据进行训练，根据训练得到的模型识别非法交易的方法，至少存在以下缺点：

(1)针对某些服务商而言，其历史交易数据中可能没有足够的非法交易数据用于进行模型训练，进而无法得到用于进行风险识别的模型；

(2)模型训练时使用的安全交易数据以及非法交易数据均为历史交易数据，当出现新的非法交易行为时，使用历史交易数据训练得到模型并不能有效识别新的非法交易，导致训练得到的模型具有滞后性。

由此可见，上述模型训练的方法并不能对互联网交易中的非法交易进行有效识别。

有鉴于此，本申请实施例提供一种交易风险的识别方法和装置，该方法包括：获取目标服务商的安全交易对应的第一数据以及待识别交易对应的第二数据；获取风险识别模型，所述风险识别模型基于所述第一数据和所述第二数据的混合数据进行训练所得到，所述风险识别模型用于对交易的数据进行聚类；获取所述风险识别模型针对所述混合数据所输出的输出结果；根据所述输出结果对所述待识别交易的风险进行识别。

本申请实施例提供的技术方案，至少可以达到如下有益效果：

(1)在进行模型训练时，由于无需获取历史的非法交易数据，因此，可以避免由于没有足够的非法交易数据导致的不能进行模型训练的问题；

(2)在进行模型训练时，训练的样本为历史的安全交易数据以及待识别的交易数据，这样，可以实现无监督训练，当待识别的交易数据中出现新的非法行为时，无监督训练得到的风险识别模型可以对新的非法行为进行有效识别；

(3)用于训练的待识别数据为当前的交易数据时，还可以实现对交易风险的实时识别。

为了使本技术领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

本申请实施例中，互联网交易可以是通过互联网实现的各种交易，包括但不限于基于银行卡信息实现的网上交易、外汇交易、购物交易，等，服务商可以理解为提供互联网交易的一方，用户在进行互联网交易时，服务商对应的服务端可以对用户的交易请求进行处理，在处理交易请求的过程中，可以通过本申请实施例提供的技术方案对交易的风险进行识别。

需要说明的是，本申请实施例在对进行模型训练时，可以实现无监督训练，训练得到的风险识别模型，可以用于对单笔交易的风险进行识别，也可以对多笔交易中是否存在大量的非法交易(即服务商是否存在被批量攻击的现象)进行识别。

以下结合附图，详细说明本申请各实施例提供的技术方案。

图1是本申请的一个实施例交易风险的识别方法的流程示意图。所述方法如下所述。

S102：获取目标服务商的安全交易对应的第一数据以及待识别交易对应的第二数据。

在S102中，在对目标服务商的交易风险进行识别时，可以获取目标服务商的安全交易对应的交易数据以及待识别交易对应的交易数据。为了便于区分，可以将安全交易对应的交易数据视为第一数据，将待识别交易对应的交易数据视为第二数据。

所述安全交易可以理解为没有用户举报、无非法交易行为记录且确定无风险的历史交易，在获取安全交易对应的第一数据时，可以从目标服务商的历史交易数据中获取，其中，在获取安全交易对应的第一数据时，为了便于后续进行模型训练，可以获取多笔安全交易对应的第一数据。

所述待识别交易可以理解为未确定是否存在风险的交易，为了便于实时地对目标服务商的交易风险进行识别，所述待识别交易可以是目标服务商当天已完成的所有交易或当天某段时间内的交易，在获取待识别交易对应的第二数据时，可以从目标服务商当天的交易数据中获取，其中，在获取待识别交易对应的第二数据时，为了便于后续进行模型训练，可以获取多笔待识别交易对应的第二数据。

在获取到目标服务商的安全交易对应的第一数据以及待识别交易对应的第二数据后，可以执行S104。

S104：获取风险识别模型。

在S104中，可以基于S102中获取的所述第一数据以及所述第二数据的混合数据进行训练，并获取训练得到的风险识别模型，其中，所述风险识别模型可以用于对交易的数据进行聚类，即对所述第一数据以及所述第二数据的混合数据进行训练的过程，可以视为对所述第一数据以及所述第二数据的混合数据进行聚类的过程。

本申请实施例中，可以通过以下方式训练得到所述风险识别模型，包括：

确定所述第一数据的初始风险值以及所述第二数据的初始风险值；

根据确定的所述风险初始值，采用预设的异常识别算法对所述第一数据以及所述第二数据的混合数据进行训练，得到所述风险识别模型。

本申请实施例中，所述第一数据的初始风险值与所述第二数据的初始风险值不同，具体可以由人为设定。优选地，所述第一数据的初始风险值可以是“1”，所述第二数据的初始风险值可以是“0”。

在确定所述第一数据的初始风险值以及所述第二数据的初始风险值后，可以根据所述第一数据以及所述第二数据各自的初始风险值，使用预设的异常识别算法进行模型训练。

本申请实施例中，所述预设的异常识别算法优选isolation forest(孤立森林)算法，可选地，所述预设的异常识别算法也可以是其他算法，例如，Local Outlier Factor(局部异常因子)算法，Principal Component Analysis(主分量分析)算法等，这里不再一一举例说明。

在使用预设的异常识别算法对所述第一数据以及所述第二数据的混合数据进行模型训练时，具体训练过程可以参见现有技术中的相关内容，本申请实施例可以以使用isolation forest算法进行模型训练为例进行说明。

具体地：首先，可以构建一棵iTree；其次，从交易数据的特征中，随机选择一个特征作为起始节点，并在该特征的最大值和最小值之间随机选择一个值，将所述第一数据以及所述第二数据的混合数据中小于该取值的数据以及大于等于该取值的数据划到不同的分支；再次，在不同分支的数据中，重复上述步骤，直到数据不可再分(即只包含一条数据，或者全部数据相同)，或二叉树达到限定的最大深度时，可以停止训练，此时，可以得到风险识别模型。

需要说明的是，由于本申请实施例的模型训练过程为无监督训练(样本数据中包含已标记为无风险的第一数据以及未标记的第二数据)，因此，为了便于更好地进行模型训练，用于训练的样本数据中不同样本的数量需要满足以下条件：其中一种样本在总样本中的占比需要远大于另一种样本在总样本中的占比，也即其中一种样本在总样本中的占比需要远小于另一种样本在总样本中的占比，保证不同样本在总样本中的占比差异较大。

有鉴于此，本申请实施例在进行模型训练时，可以在所述第一数据以及所述第二数据满足上述条件的情况下，进行模型训练。具体地：

在本申请的一个实施例中，根据确定的所述初始风险值，采用预设的异常识别算法对所述第一数据以及所述第二数据的混合数据进行训练，可以包括：

确定所述第一数据对应的第一交易数量以及所述第一数据和所述第二数据的混合数据对应的总交易数量；

判断所述第一交易数量在所述总交易数量中的占比是否大于等于第一设定值或小于等于第二设定值，所述第二设定值小于所述第一设定值；

若是，则根据确定的所述初始风险值，采用预设的异常识别算法对所述第一数据以及所述第二数据的混合数据进行训练。

所述第一交易数量可以理解为所述第一数据对应的安全交易的交易数量，所述总交易数据可以理解为所述第一交易数量与所述第二数据对应的待识别交易的第二交易数量之和。

在确定所述第一交易数量以及所述总交易数量后，可以判断所述第一交易数量在所述总交易数量中的占比是否大于等于第一设定值，或小于等于第二设定值，其中，所述第一设定值大于所述第二设定值，优选地，所述第一设定值可以大于等于90％，所述第二设定值可以小于等于10％。

若判断结果为所述占比大于等于所述第一设定值，或，所述占比小于等于所述第二设定值，则可以说明，所述第一数据以及所述第二数据可以满足上述记载的不同样本在总样本中的占比要求，此时，可以按照上述记载的方法，根据确定的所述初始风险值，采用预设的异常识别算法对所述第一数据以及所述第二数据的混合数据进行训练。

若判断结果为所述占比小于所述的交易数量以及所述第二数据不满足上述记载的不同样本在总样本中的占比要求。

此时，可以对所述第一数据以及所述第二数据中的至少一种进行欠采样，使得采样后的第一数据以及第二数据能够满足上述记载的不同样本在总样本中的占比要求，即欠采样后，所述第一交易数量在所述总交易数量中的占比大于等于所述第一设定值或小于等于所述第二设定值。其中，所述欠采样可以理解为随机采样。

在对所述第一数据以及所述第二数据中的至少一种进行欠采样时，可以根据所述第一交易数量、所述第二交易数量、所述第一设定值以及所述第二设定值确定具体采样的数量。

例如，所述第一数据的第一交易数量为1000笔，所述第二数据的第二交易数量为500笔，总交易数量为1500笔，所述第一设定值为90％，所述第二设定值为10％，可知，第一交易数量在总交易数量中的占比为33％，即不大于等于90％，也不小于等于10％，也就是说，所述第一数据以及所述第二数据不满足上述记载的不同样本在总样本中的占比要求，此时，可以对所述第一数据以及所述第二数据中的至少一种进行欠采样。

在欠采样时，至少可以包括以下四种方法：

第一种方法：从第一数据中欠采样，使得第一交易数量在总交易数量中的占比小于10％，例如，可以从第一数据中欠采样50笔；

第二种方法：从第二数据中欠采样，使得第一交易数量在总交易数量中的占比大于90％，例如，可以从第二数据中欠采样100笔；

第三种方法：从第一数据以及第二数据中欠采样，使得第一交易数量在总交易数量中的占比小于10％，例如，可以从第一数据中欠采样40笔，从第二数据中欠采样400笔；

第四种方法：从第一数据以及第二数据中欠采样，使得第一交易数量在总交易数量中的占比大于90％，例如，可以从第一数据中欠采样900笔，从第二数据中欠采样90笔。

在按照上述记载的方法对所述第一数据以及所述第二数据中的至少一种进行欠采样后，可以基于欠采样后所述第一数据以及所述第二数据，按照上述记载的方法，对欠采样得到的所述第一数据以及所述第二数据的混合数据进行训练。

需要说明的是，在本申请的另一个实施例中，为了简化步骤，避免对交易数据进行欠采样，可以在S102中，按照上述记载的不同样本在总样本中的占比要求，获取所述第一数据以及所述第二数据。

例如，可以所述第一设定值或所述第二设定值，确定所述第一数据的交易数量与所述第二数据的交易数量的比值，并按照所述比值获取所述第一数据以及所述第二数据，也可以在获取到所述第一数据后，根据所述第一数据的交易数量以及所述比值获取所述第二数据，还可以在获取到所述第二数据后，根据所述第二数据的交易数量以及所述比值获取所述第一数据。

在实际应用中，可以按照不同样本在总样本中的占比要求获取所述第一数据以及所述第二数据，也可以在获取所述第一数据以及所述第二数据后，通过欠采样的方式使得所述第一数据以及所述第二数据满足不同样本在总样本中的占比要求，具体采用哪种方式可以根据实际情况确定，这里不做具体限定。

在S104中，在对所述第一数据以及所述第二数据的混合数据进行训练，并获取训练得到的所述风险识别模型后，可以执行S106。

S106：获取所述风险识别模型针对所述混合数据所输出的输出结果。

在S106中，可以根据训练得到的所述风险识别模型，确定所述风险识别模型针对所述第一数据以及所述第二数据的混合数据的输出结果。

具体地，可以以所述混合数据作为输入，确定所述风险识别模型针对所述混合数据的输出结果，所述输出结果可以是所述混合数据中包含的每一笔交易数据各自对应的风险分值，所述风险分值可以用于后续识别所述第二数据对应的待识别交易是否存在风险。

S108：根据所述输出结果对所述待识别交易的风险进行识别。

在S108中，可以根据S106中风险识别模型针对混合数据输出的风险分值，识别所述待识别交易是否存在风险。

本申请实施例中，根据所述输出结果对所述待识别交易的风险进行识别，可以包括：

根据所述输出结果，确定所述第一数据的风险分值和所述第二数据的风险分值；

若所述第一数据的风险分值和所述第二数据的风险分值的差值超过预设值，则确定所述待识别交易存在风险。

所述输出结果可以是多个风险分值，每一个风险分值可以对应一笔交易数据，在确定所述第一数据的风险分值以及所述第二数据的风险分值时，可以从输出结果的多个分值中确定哪些是安全交易对应的分值，哪些是待识别交易对应的分值。

在确定所述第一数据的风险分值时，可以将所有安全交易对应的分值所在的范围确定为所述第一数据的风险分值，也可以将所有安全交易对应的分值的平均值确定为所述第一数据的风险分值，还可以对所有安全交易对应的分值进行计算，将计算得到的结果确定为所述第一数据的风险值，例如，计算结果可以是平均值+方差，也可以是中位数，等。

在确定所述第二数据的风险分值时，可以将所有待识别交易对应的分值所在的范围确定为所述第二数据的风险分值，也可以将所有待识别交易对应的分值的平均值确定为所述第二数据的风险分值，还可以对所有安全交易对应的分值进行计算，将计算得到的结果确定为所述第一数据的风险值。

在确定所述第一数据的风险分值和所述第二数据的风险分值后，可以进一步识别所述待识别交易是否存在安全风险。

本申请实施例中，根据所述第一数据的风险分值和所述第二数据的风险分值，可以识别所述待识别交易中是否存在大量的风险交易，也可以识别所述待识别交易中其中一笔交易是否为风险交易。

在识别所述待识别交易中是否存在大量的非法交易时，可以判断所述第一数据的风险分值是否偏离所述第二数据的风险分值(即所述第一数据的风险分值相较于所述第二数据的风险分值是否相对偏高或相对偏低)，具体地，可以判断所述第一数据的风险分值与所述第二数据的风险分值是否超过预设值，所述预设值可以根据实际情况确定。

若判断结果为是，则可以说明，所述第一数据的风险分值偏离所述第二数据的风险分值，此时，可以确定所述待识别交易中存在大量的风险交易，目标服务商存在被批量攻击的现象。

若判断结果为否，则可以说明，所述第一数据的风险分值接近所述第二数据的风险分值，此时，可以确定所述待识别交易为安全交易，即所述待识别交易不存在安全风险。

例如，当所述第一数据的风险分值为0.5～0.7时，若第二数据的风险分值为0.2～0.3，则，可以说明，所述待识别交易均为风险交易；若第二数据的风险分值为0.2～0.65，其中，0.2～0.3对应的交易数量在待识别交易中的占比较大，则，可以说明所述待识别交易中存在大量的风险交易；若第二数据的风险分值为0.55～0.65，则，可以说明所述待识别交易均为安全交易。

在识别所述待识别交易中其中一笔交易是否为非法交易时，可以确定该笔交易的风险分值，并确定该笔交易的风险分值是否偏离所述第一数据的风险分值，若是，则可以说明该笔交易存在风险，若否，则可以说明该笔交易不存在风险，为安全交易。

例如，当所述第一数据的风险分值为0.5～0.7时，若一笔待识别交易的第二数据的风险分值为0.2，则，可以说明，该笔待识别交易为风险交易；若一笔待识别交易的第二数据的风险分值为0.6，则，可以说明所述待识别交易为安全交易。

在本申请的一个实施例中，若确定所述待识别交易存在风险，所述方法还可以包括：

确定所述待识别交易对应的用户信息；

当接收到携带所述用户信息的交易请求时，返回提示信息，所述提示信息用于提示交易失败或用于提示输入验证信息。

具体地，可以确定存在风险的交易对应的用户信息，当目标服务商对应的服务端接收到携带该用户信息的交易请求时，可以向用户返回提示信息，提示用户输入验证信息，以便于根据用户输入的验证信息对用户是否是非法用户进行识别，或者，也可以直接返回交易失败的提示信息

其中，提示用户输入验证信息的方式有多种，例如，可以向用户预留的手机号码发送短信验证码，当用户为正常用户时，可以验证通过，当用户为非法用户时，由于非法用户无法轻易获取到短信验证码，因此，在验证不通过的情况下，可以有效避免非法交易的再次发生。

再例如，可以预留用户的指纹，在提示用户输入验证信息时，可以提示用户验证指纹等，这里不再一一举例说明。

图2是本申请的一个实施例交易风险的识别方法的流程示意图。图3所述的交易风险的识别方法与图1所示的交易风险的识别方法属于相同的发明构思。所述方法如下所述。

S201：获取目标服务商的安全交易对应的第一数据以及待识别交易对应的第二数据。

目标服务商可以是提供互联网交易的一方，安全交易的第一数据可以从目标服务商的历史交易数据中获取，待识别交易的第二数据可以从目标服务商当天的交易数据中获取。

S202：判断所述第一数据的交易数量在总交易数量中的占比是否大于第一设定值，或小于第二设定值。

所述总交易数量为所述第一数据的交易数量与所述第二数据的交易数量之和，所述第一设定值大于所述第二设定值，所述第一设定值优选90％，所述第二设定值优选10％。

若判断结果为是，则可以执行S204；若判断结果为否，则可以执行S203。

S203：对所述第一数据以及所述第二数据中的至少一种进行欠采样。

可以根据所述第一数据的交易数量、所述第二数据的交易数量、所述第一设定值以及所述第二设定值，确定需要欠采样的数量，使得欠采样得到的所述第一数据的交易数量在总交易数量中的占比是否大于第一设定值，或小于第二设定值。

在欠采样后，可以执行S204。

S204：使用预设的异常识别算法，对所述第一数据以及所述第二数据的混合数据进行训练，得到风险识别模型。

所述异常识别算法优选isolation forest算法，也可以是Local Outlier Factor算法，Principal Component Analysis算法等。

S205：根据所述风险识别模型，确定所述第一数据的风险分值以及所述第二数据的风险分值。

确定所述第一数据的风险分值以及所述第二数据分风险分值的具体方法，可以参见图1所示实施例中记载的内容，这里不再重复描述。

S206：判断所述第一数据的风险分值和所述第二数据的风险分值的差值是否超过预设值。

若是，则可以执行S207；若否，则可以执行S208。

S207：确定所述待识别交易存在风险。

在确定所述待识别交易存在风险后，为了避免非法交易的再次发生，可以确定所述待识别交易对应的用户信息，当接收到携带所述用户信息的交易请求时，可以提示用户输入验证信息，以验证是否是非法用户，或者，直接反悔交易失败的提示信息。

S208：确定所述待识别交易不存在风险。

应理解，上述在S201中，也可以根据所述第一设定值以及所述第二设定值，确定所述第一数据的交易数量与所述第二数据的交易数量的比值，并按照所述比值获取所述第一数据以及所述第二数据。这样，可以省去上述步骤S202和S203，避免欠采样。

以上举例说明了在互联网交易中，交易风险的识别方法的实施过程。为更直观的说明本申请实施例的设计构思和技术效果，下面以上述交易风险的识别方法应用在银行交易这一场景为例，说明本申请实施例的实施过程。以上关于交易风险的识别方法的阐释与说明均可应用于以下银行交易风险的识别方法这一具体应用场景，重复内容不再赘述。

图3是本申请的一个实施例银行交易风险的识别方法的流程示意图。所述方法如下所述。

S302：获取目标银行的安全交易对应的第一数据以及待识别交易对应的第二数据。

在S302中，在对目标银行的交易风险进行识别时，可以获取目标银行的安全交易对应的交易数据以及待识别交易对应的交易数据。其中，可以将安全交易对应的交易数据视为第一数据，将待识别交易对应的交易数据视为第二数据。

在获取所述第一数据时，可以从目标银行的历史交易数据中获取，具体可以获取多笔安全交易的第一数据；在获取待识别交易对应的第二数据时，可以从目标银行当天的交易数据中获取，具体可以获取多笔待识别交易对应的第二数据。

S304：获取风险识别模型。

在S304中，可以基于所述第一数据和所述第二数据的混合数据进行训练，并获取训练得到的风险识别模型，其中，所述风险识别模型用于对交易的数据进行聚类。

进一步地，可以通过以下方式训练得到所述风险识别模型，包括：

根据确定的所述初始风险值，采用预设的异常识别算法对所述第一数据以及所述第二数据的混合数据进行训练，得到所述风险识别模型。

所述第一数据的初始风险值可以是“1”，所述第二数据的初始风险值可以是“0”。所述预设的异常识别算法优选isolation forest算法，也可以是Local Outlier Factor算法，Principal Component Analysis算法等。

判断所述第一交易数量在所述总交易数量中的占比是否大于等于第一设定值或小于等于第二设定值，所述第二设定值小于所述第二设定值；

若是，则根据确定的所述初始风险值，采用预设的异常识别算法对所述第一数据以及所述第二数据进行训练。

进一步地，若所述第一交易数量在所述总交易数量中的占比小于所述第一设定值且大于所述第二设定值，则对所述第一数据以及所述第二数据中的至少一种进行欠采样，欠采样后，所述第一交易数量在所述总交易数量中的占比大于等于所述第一设定值或小于等于所述第二设定值；

其中，采用预设的异常识别算法对所述第一数据以及所述第二数据的混合数据进行训练，包括：

采用预设的异常识别算法对欠采样得到的所述第一数据以及所述第二数据进行训练。

本实施例中，在对所述第一数据以及所述第二数据的混合数据进行模型训练时，需要确定所述第一数据的交易数量以及所述第二数据的交易数量是否满足无监督训练对样本数量的要求，若满足，则可以进行模型训练，若不满足，可以对所述第一数据以及所述第二数据中的至少一种进行欠采样，并对欠采样得到的所述第一数据以及所述第二数据的混合数据进行模型训练。

S306：获取所述风险识别模型针对所述混合数据所输出的输出结果。

在S306中，可以根据训练得到的所述风险识别模型，确定所述风险识别模型针对所述第一数据以及所述第二数据的混合数据的输出结果。其中，输出结果可以是风险分值，所述风险分值可以用于后续识别所述第二数据对应的待识别交易是否存在风险。

S308：根据所述输出结果对所述待识别交易的风险进行识别。

进一步地，根据所述输出结果对所述待识别交易的风险进行识别，包括：

当所述待识别交易中存在大量的风险交易时，可以说明目标银行存在被批量攻击的现象。

进一步地，在确定所述待识别交易存在风险时，所述方法还包括：

确定所述待识别交易对应的用户信息；

图3所示实施例相关步骤的具体实现可参考图1所示实施例中对应步骤的具体实现，本说明书一个或多个实施例在此不再赘述。

本申请实施例提供的技术方案，在对目标银行的交易风险进行识别时，获取目标银行的安全交易数据对应的第一数据以及待识别交易对应的第二数据；基于所述第一数据以及所述第二数据进行模型训练，得到风险识别模型，根据风险识别模型针对所述第一数据以及所述第二数据的混合数据所输出的结果，识别目标银行的交易是否存在风险。

本申请实施例可以对银行的交易风险进行实时识别，在进行风险识别时，由于无需获取历史的非法交易数据，因此，可以避免由于没有足够的非法交易数据导致的不能进行模型训练的问题；在进行模型训练时，训练的样本为历史的安全交易数据以及待识别的交易数据，这样，可以实现无监督训练，当待识别的交易数据中出现新的非法行为时，无监督训练得到的风险识别模型可以对新的非法行为进行有效识别。

上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

图4是本申请的一个实施例电子设备的结构示意图。请参考图4，在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-Access Memory，RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(Industry Standard Architecture，工业标准体系结构)总线、PCI(PeripheralComponent Interconnect，外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图4中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成交易风险的识别装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

根据所述输出结果对所述待识别交易的风险进行识别。

上述如本申请图4所示实施例揭示的交易风险的识别装置执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

该电子设备还可执行图1的方法，并实现交易风险的识别装置在图1所示实施例中的功能，本申请实施例在此不再赘述。

当然，除了软件实现方式之外，本申请的电子设备并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

本申请实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图1所示实施例的方法，并具体用于执行以下操作：

根据所述输出结果对所述待识别交易的风险进行识别。

图5是本申请的一个实施例交易风险的识别装置50的结构示意图。请参考图5，在一种软件实施方式中，所述交易风险的识别装置50可包括：第一获取单元51、第二获取单元52、第三获取单元53以及识别单元54，其中：

第一获取单元51，获取目标服务商的安全交易对应的第一数据以及待识别交易对应的第二数据；

第二获取单元52，获取风险识别模型，所述风险识别模型基于所述第一数据和所述第二数据的混合数据进行训练得到，所述风险识别模型用于对交易的数据进行聚类；

第三获取单元53，获取所述风险识别模型针对所述混合数据所输出的输出结果；

识别单元54，根据所述输出结果对所述待识别交易的风险进行识别。

可选地，所述识别单元54，根据所述输出结果对所述待识别交易的风险进行识别，包括：

可选地，所述第二获取单元52获取的风险识别模型通过以下方式训练得到，包括：

可选地，所述第二获取单元52，根据确定的所述初始风险值，采用预设的异常识别算法对所述第一数据以及所述第二数据的混合数据进行训练，包括：

可选地，所述第二获取单元52，在确定所述第一交易数量在所述总交易数量中的占比小于所述第一设定值且大于所述第二设定值时，对所述第一数据以及所述第二数据中的至少一种进行欠采样，欠采样后，所述第一交易数量在所述总交易数量中的占比大于等于所述第一设定值或小于等于所述第二设定值；

其中，所述第二获取单元52，采用预设的异常识别算法对所述第一数据以及所述第二数据的混合数据进行训练，包括：

采用预设的异常识别算法对欠采样得到的所述第一数据以及所述第二数据的混合数据进行训练。

可选地，所述交易风险的识别装置50还包括：提示单元55，其中：

所述提示单元55，在所述识别单元54确定所述待识别交易存在风险时，确定所述待识别交易对应的用户信息；

交易风险的识别装置50还可执行图1的方法，并实现交易风险的识别装置在图1所示实施例的功能，本申请实施例在此不再赘述。

图6是本申请的一个实施例电子设备的结构示意图。请参考图6，在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-Access Memory，RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(Industry Standard Architecture，工业标准体系结构)总线、PCI(PeripheralComponent Interconnect，外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图6中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成银行交易风险的识别装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

根据所述输出结果对所述待识别交易的风险进行识别。

上述如本申请图6所示实施例揭示的银行交易风险的识别装置执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(Central ProcessingUnit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(DigitalSignal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

该电子设备还可执行图3的方法，并实现银行交易风险的识别装置在图3所示实施例中的功能，本申请实施例在此不再赘述。

本申请实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图3所示实施例的方法，并具体用于执行以下操作：

根据所述输出结果对所述待识别交易的风险进行识别。

图7是本申请的一个实施例银行交易风险的识别装置70的结构示意图。请参考图7，在一种软件实施方式中，所述银行交易风险的识别装置70可包括：第一获取单元71、第二获取单元72、第三获取单元73以及识别单元74，其中：

第一获取单元71，获取目标银行的安全交易对应的第一数据以及待识别交易对应的第二数据；

第二获取单元72，获取风险识别模型，所述风险识别模型基于所述第一数据和所述第二数据的混合数据进行训练得到，所述风险识别模型用于对交易的数据进行聚类；

第三获取单元73，获取所述风险识别模型针对所述混合数据所输出的输出结果；

识别单元74，根据所述输出结果对所述待识别交易的风险进行识别。

可选地，所述识别单元74，根据所述输出结果对所述待识别交易的风险进行识别，包括：

可选地，所述第二获取单元72获取的风险识别模型通过以下方式训练得到，包括：

可选地，所述第二获取单元72，根据确定的所述初始风险值，采用预设的异常识别算法对所述第一数据以及所述第二数据的混合数据进行训练，包括：

可选地，所述第二获取单元72，在确定所述第一交易数量在所述总交易数量中的占比小于所述第一设定值且大于所述第二设定值时，对所述第一数据以及所述第二数据中的至少一种进行欠采样，欠采样后，所述第一交易数量在所述总交易数量中的占比大于等于所述第一设定值或小于等于所述第二设定值；

其中，所述第二获取单元72，采用预设的异常识别算法对所述第一数据以及所述第二数据的混合数据进行训练，包括：

可选地，所述银行交易风险的识别装置70还包括：提示单元75，其中：

所述提示单元75，在所述识别单元74确定所述待识别交易存在风险时，确定所述待识别交易对应的用户信息；

银行交易风险的识别装置70还可执行图3的方法，并实现银行交易风险的识别装置在图3所示实施例的功能，本申请实施例在此不再赘述。

总之，以上所述仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本申请中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

Claims

1.一种交易风险的识别方法，包括：

根据所述输出结果对所述待识别交易的风险进行识别。

2.如权利要求1所述的方法，根据所述输出结果对所述待识别交易的风险进行识别，包括：

3.如权利要求1所述的方法，通过以下方式训练得到所述风险识别模型，包括：

4.如权利要求1所述的方法，根据确定的所述初始风险值，采用预设的异常识别算法对所述第一数据以及所述第二数据的混合数据进行训练，包括：

5.如权利要求4所述的方法，所述方法还包括：

若所述第一交易数量在所述总交易数量中的占比小于所述第一设定值且大于所述第二设定值，则对所述第一数据以及所述第二数据中的至少一种进行欠采样，欠采样后，所述第一交易数量在所述总交易数量中的占比大于等于所述第一设定值或小于等于所述第二设定值；

6.如权利要求2所述的方法，在确定所述待识别交易存在风险时，所述方法还包括：

确定所述待识别交易对应的用户信息；

7.一种银行交易风险的识别方法，包括：

根据所述输出结果对所述待识别交易的风险进行识别。

8.如权利要求7所述的方法，根据所述输出结果对所述待识别交易的风险进行识别，包括：

9.如权利要求7所述的方法，通过以下方式训练得到所述风险识别模型，包括：

10.如权利要求7所述的方法，根据确定的所述初始风险值，采用预设的异常识别算法对所述第一数据以及所述第二数据的混合数据进行训练，包括：

11.如权利要求10所述的方法，所述方法还包括：

12.如权利要求8所述的方法，在确定所述待识别交易存在风险时，所述方法还包括：

确定所述待识别交易对应的用户信息；

13.一种交易风险的识别装置，包括：

14.一种银行交易风险的识别装置，包括：

15.一种电子设备，包括：

处理器；以及

根据所述输出结果对所述待识别交易的风险进行识别。

16.一种电子设备，包括：

处理器；以及

根据所述输出结果对所述待识别交易的风险进行识别。

17.一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下方法：

根据所述输出结果对所述待识别交易的风险进行识别。

18.一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下方法：

根据所述输出结果对所述待识别交易的风险进行识别。