CN107563757A

CN107563757A - 数据风险控制的方法及装置

Info

Publication number: CN107563757A
Application number: CN201610512684.2A
Authority: CN
Inventors: 霍文虎; 黄承伟; 王维强
Original assignee: Alibaba Group Holding Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2016-07-01
Filing date: 2016-07-01
Publication date: 2018-01-09
Anticipated expiration: 2036-07-01
Also published as: KR20190025005A; US11074350B2; WO2018001195A1; TW201802732A; CN107563757B; JP2019525309A; TWI673666B; EP3480769A1; JP6697584B2; US20190130116A1; EP3480769A4; MY188651A; SG11201811395YA; KR102175226B1

Abstract

本发明公开了一种数据风险控制的方法及装置，涉及互联网技术领域，主要目的在于解决针对单笔交易数据进行风险防控的风险控制体系，无法对分散的批量交易数据进行风险识别的问题，快速、准确地识别出批量交易数据中存在的风险。本发明的技术方案包括：对预定时间段内的批量交易数据按照第一属性进行分类；针对每个类别的批量交易数据分别根据第二属性生成对应的用于识别批量交易数据中存在风险的图的图指标；将不同类别的批量交易数据对应的所述图指标分别输入到对应的风险识别模型，根据模型输出结果得到输入图指标对应的批量交易数据是否有风险。

Description

数据风险控制的方法及装置

技术领域

本发明涉及互联网技术领域，尤其涉及一种数据风险控制的方法及装置。

背景技术

随着互联网技术的快速发展，电子支付的应用也越来越广泛；其中，电子支付是指付款人直接或授权他人通过电子终端发出支付指令，实现货币支付与资金转移的行为，电子支付能够使人们的日常生活更便利、快捷、高效。

目前，为了能够确定电子支付过程中资金的安全性，常通过风险控制体系对每笔电子支付进行风险防控。风险控制体系一般由策略规则和支付模型组成，主要针对单笔电子支付进行实时风险判断及风险决策，当确定某一笔电子支付存在风险时，进行风险报警，即将该存在风险的电子支付进行拦截或取消，避免用户的经济损失。

但是，在风险控制体系防控过程中，恶意作案者经常通过在每笔电子支付中模拟正常电子支付的行为习惯进行支付，以躲避风险控制体系的防控。而在恶意作案者实施电子支付时会形成一定的批量性，对于批量电子支付，由于其电子支付主体分散且持续时间长，因此，风险控制体系在对单笔电子支付进行防控时，分散的电子支付可能还未达到风险控制体系进行风险报警的条件，无法对分散的批量电子支付进行识别，可能直接导致电子支付用户不必要的经济损失。

发明内容

有鉴于此，本发明实施例提供一种数据风险控制的方法及装置，主要目的在于解决现有技术中针对以单笔交易数据进行风险防控的风险控制体系，无法对分散的批量交易数据进行风险识别的问题，能够快速、准确地识别出批量交易数据中存在的风险。

为达到上述目的，本发明提供如下技术方案：

第一方面，本发明提供一种数据风险控制的方法，包括：

对预定时间段内的批量交易数据按照第一属性进行分类；

针对每个类别的批量交易数据分别根据第二属性生成对应的用于识别批量交易数据中存在风险的图的图指标；

将不同类别的批量交易数据对应的所述图指标分别输入到对应的风险识别模型，根据模型输出结果得到输入图指标对应的批量交易数据是否有风险。

第二方面，本发明提供的一种数据风险控制的装置，包括：

第一分类单元，用于对预定时间段内对批量交易数据按照第一属性进行分类；

第一生成单元，用于针对所述第一分类单元分类后的每个类别的批量交易数据分别根据第二属性生成对应的用于识别批量交易数据中存在风险的图的图指标；

输入单元，用于将所述第一生成单元生成的不同类别的批量交易数据对应的所述图指标分别输入到风险识别模型；

确定单元，用于根据模型输出结果得到输入图指标对应的批量交易数据是否有风险。

借由上述技术方案，本发明实施例提供的技术方案至少具有下列优点：

本发明提供的数据风险控制的方法及装置，风险控制体系/系统在进行风险控制时，首先，对预定时间段内的批量交易数据按照第一属性进行分类，针对每个类别的批量交易数据分别根据第二属性生成对应的用于识别批量交易数据中存在风险的图的图指标，将不同类别的批量交易数据对应的图指标输入到风险识别模型，根据模型输出结果得到输入图指标对应的批量交易数据是否有风险，以便风险控制体系/系统对图指标对应的包含风险的批量交易数据进行风险控制。本发明通过对预定时间段内对单笔交易数据积累的批量交易数据进行分类、生成图指标，能够通过风险识别模型快速、准确地识别出不同类别批量交易数据中存在的集中性风险，减少用户不必要的经济损失。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本发明实施例提供的一种数据风险控制的方法的流程图；

图2示出了本发明实施例提供的一种图的示意图；

图3示出了本发明实施例提供的一种数据风险控制的装置的组成框图；

图4示出了本发明实施例提供的另一种数据风险控制的装置的组成框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例提供一种数据风险控制的方法，该方法应用于计算机设备。如图1所示，该方法包括：

101、对预定时间段内的批量交易数据按照第一属性进行分类。

现有技术中，风险控制体系/系统会对每一个单笔交易数据进行非常严格的风险控制，但是，在风险控制体系/系统防控过程中，团伙作案者经常会通过模拟正常用户的习惯对单笔交易数据进行操作，以避开风险控制体系/系统的防控，其中，该单笔交易数据通常为用户的资金流转数据，例如：银行转账、网上购物支付、跨平台资金支付等等。但是，由于团伙作案者进行作案过程中，其主体分散且持续时间较长，风险控制体系/系统在对单笔交易数据进行风险评估或决策时，将风险分散到每个主体，但是每个主体或许还没达到风险控制体系/系统风险报警的阈值，因此，会遗漏掉大部分的集中性风险，造成用户不必要的经济损失。在实际应用中，所述主体为资金流出方，可以包括但不局限于以下内容，例如：银行卡、某资金交易平台的注册账号等等，本发明实施例对资金流出方对应的主体不进行限定。

因此，为解决现有技术中仅能够识别单笔交易数据中存在的风险，易存在风险遗漏的问题，本发明实施例以批量交易数据为单位识别批量交易数据中存在的风险。本发明实施例所述的风险控制体系/系统在风险防控过程中，对批量交易数据进行风险识别，而非单笔交易数据；因此，在风险控制系统防控之前，需要对单笔交易数据进行积累，以得到批量交易数据。由于数据库中记录的单笔交易数据的量较大，在获取批量交易数据时，通常不会对数据库中全部的单笔交易数据进行积累，而是对某一预定时间段内的单笔交易数据进行积累，以得到批量交易数据。若积累到的批量交易数据量过大，容易将批量交易数据中的风险“稀释”，且在识别批量交易数据中的风险时，较大的数据量给识别风险带来一定的阻碍；若积累得到的批量交易数据量过小，易导致其不具备统计单笔交易数据的意义，达不到识别批量交易数据中风险的目的。

由于作案者作案时批量性的特征，团伙作案内部必然存在联系。在按照第一属性对批量交易数据进行分类的时候，比如说可以将账户的注册为同一个国家、进行交易的产品为同一种、产品的收货国家或者地区相同和/或收款账号相同分为一类。分类的维度，可以根据具体的风险业务来决定。不同国家、地区都会产生不同的风险形态，都会导致不同的分类方法。因此，本发明实施例通过对批量交易数据进行分类的方式，将风险“包裹”在某一具体类别中，确定批量风险集中于某一类别，确保了识别批量交易数据中风险的准确性，防止风险的遗漏，以避免给用户带去不必要的、未知的经济损失。需要说明的是，这里的第一属性仅是为了描述上的方便，其并不是指一个属性，而是可以包括一个或者多个属性。

在实际应用中，当作案者在非法获取某一产品时，为了谋取利益，需要将非法获取的产品进行销赃，在网上销赃过程中一般涉及产品的类目(如手机数码、汽车、家电、服装等类目)、卖家所在地区、买家所在地区等信息，因此，本发明实施例在按照第一属性进行分类时，可以将产品类目、卖家所在地区或者买家所在地区等作为第一属性，也可以将类目中包含的子类目(如手机、电脑、女装、车型、生活电器等子类目)、卖家所在城市等作为第一属性，本发明实施例对第一属性的具体设定不作限定。

本发明实施例中，对预定时间段内的单笔交易数据进行积累，其目的在于，在将单笔交易数据进行聚集的时候，对该些单笔交易数据中可能存在的未知风险在进行积累。在实际应用中，可以对某一天内的单笔交易数据进行积累得到批量交易数据；或者，也可以对连续三天内的单笔交易数据进行积累得到批量交易数据；或者，还可以对某一周内的单笔交易数据进行积累得到批量交易数据，本发明实施例对预定时间段的具体设定不作限定。

102、针对每个类别的批量交易数据分别根据第二属性生成对应的用于识别批量交易数据中存在风险的图的图指标。

步骤101对批量交易数据进行分类之后，同一类别的批量交易数据中可能存在一种风险，也可能不存在风险，也可能同时存在多种风险，因此，需要分别对不同类别的批量交易数据进行识别，确定风险。

为了辨别出某一类别的批量交易数据中是否存在风险，本发明实施例使用风险识别模型对不同类别的批量交易数据中是否存在风险进行识别。其中，所述风险识别模型用于根据图指标对批量交易数据中存在的风险进行识别。在风险识别模型对风险进行识别时，该风险识别模型的输入为根据批量交易数据建立的图的图指标。

本步骤的目的在于，为了满足风险识别模型对输入数据的要求，针对不同类别的批量交易数据分别根据第二属性生成图，基于生成的图得到每个图的指标。这里的第二属性也是为了描述的方便，可以是一个属性，也可以是多个属性。比如说，可以按照交易数据中交易发生的设备这一属性建立图，也可以同时根据邮箱、IP地址分别在每个类别的批量交易数据内建立图。不同的批量交易数据在生成图的时候，依据的第二属性可以相同，也可以不同，可以根据实际情况决定。第一属性和第二属性可以相同，也可以不同，也可以部分相同。根据图衍生出的图指标可以包括图中的节点数量，节点之间发生联系的边的个数等等。

103、将不同类别的批量交易数据对应的所述图指标分别输入到对应的风险识别模型，根据模型输出结果得到输入图指标对应的批量交易数据是否有风险。

在确定批量交易数据中是否存在风险时，将不同类别的批量交易数据对应的图指标分别输入到对应的风险识别模型中，由风险识别模型确定输入的图指标对应的批量交易数据是否存在风险。

在风险识别模型根据模型输出结果确定出批量交易数据中存在风险时，输出图指标对应的包含风险的批量交易数据的第一属性、第二属性及确定风险对应的图指标，供风险控制体系作风险防控参考、作风险决策，即根据第一属性、第二属性及图指标对风险进行防控，避免用户的经济损失。

本发明提供的数据风险控制的方法，风险控制体系/系统在进行风险控制时，首先，对预定时间段内的批量交易数据按照第一属性进行分类，针对每个类别的批量交易数据分别根据第二属性生成对应的用于识别批量交易数据中存在风险的图的图指标，将不同类别的批量交易数据对应的图指标输入到风险识别模型，根据模型输出结果得到输入图指标对应的批量交易数据是否有风险，以便风险控制体系/系统对图指标对应的包含风险的批量交易数据进行风险控制。本发明通过对预定时间段内对单笔交易数据积累的批量交易数据进行分类、生成图指标，能够通过风险识别模型快速、准确地识别出不同类别批量交易数据中存在的集中性风险，减少用户不必要的经济损失。

进一步的，在对预定时间段内对单笔交易数据进行积累得到的批量交易数据进行分类时，需要按照第一属性对批量交易数据进行分类，其中，所述第一属性随国家、地区或者业务的不同，而存在差异，所述第一属性包括但不限于国家、产品型号、公司名、汽车品牌等等。示例性的，假设，在预定时间段为2016/2/17，00:00-24:00的时间段内，数据库中需要分类的单笔交易数据为1000个，此时按照第一属性收货国家对该1000个单笔交易数据进行分类，其中，收货国家为美国的单笔交易数据为300个，收货国家为中国的单笔交易数据为400个，收获国家为英国的单笔交易数据为300个，表1详细记录了数据库中对1000个单笔交易数据进行分类的信息，如表1所示，表1示出了根据第一属性收货国家确定的类别详细表单，其中，表1仅为示例性的举例，本发明实施例对分类的详细记录信息方式不进行限定。

表1

交易日期	类别	收货国家	订单号	备注
					2016/2/17	I	美国	1001
2016/2/17	I	美国	1002
					2016/2/17	I	美国	……
2016/2/17	II	中国	1005
					2016/2/17	II	中国	1010
2016/2/17	II	中国	……
					2016/2/17	III	英国	1026
2016/2/17	III	英国	……

进一步的，在使用训练用批量交易数据进行训练，以得到风险识别模型中不同类别的训练用批量交易数据存在风险的一般规则，即对分类后的训练用批量交易数据进行预置处理操作确定的训练图指标对应的预置风险阈值，通过该预置风险阈值确定批量交易数据中是否存在风险，所述训练用批量交易数据为对预定时间段内的历史单笔交易数据进行积累得到的批量交易数据。因此，为了满足风险识别模型对输入数据的要求，在步骤102执行针对每个类别的批量交易数据分别根据第二属性生成对应的用于识别批量交易数据中存在风险的图的图指标时，对分类后的批量交易数据进行预置处理操作。与此同时，分类后的批量交易数据进行预置处理操作在一定程度上能够提高风险识别模型识别风险的速度、效率。其中，所述预置处理操作包括：针对每个类别的批量交易数据按照第二属性构建单笔交易数据之间存在关联的图、并根据该图衍生用于识别批量交易数据中存在风险的图指标。

本实施例中，根据不同类别的批量交易数据按照第二属性分别生成用于识别批量交易数据中存在风险的图指标，其目的在于，确定同一类别中单笔交易数据之间是否存在内在联系，该图使得具有相同第二属性的单笔交易数据之间存在关联关系。在构建完成图之后，不能确定两两单笔交易数据的关联程度，因此，还需要根据图生成其对应的图指标，并将该图指标输入到风险识别模型中，以便风险识别模型通过图指标识别批量交易数据中的风险。

进一步的，在分别对不同类别的批量交易数据根据第二属性构建图时，可以通过但不局限于以下的方法实现，例如，首先，在同一类别的批量交易数据中查找第二属性相同的单笔交易数据，将该些第二属性相同的单笔交易数据建立关联关系，其次，构造存在关联关系的单笔交易数据之间的边，并设置边的距离阈值，最后，根据边及边的距离阈值构建图。在对同一类别的批量交易数据中构造图时，可以根据一个第二属性构造图，也可以根据至少两个第二属性构造对应数量的图。通常情况下，第二属性的数量与构造的图的数量是一一对应的关系，极端情况下，若在不同类别的批量交易数据中确认第二属性出现的误差较大，则可能造成在该类别的批量交易数据中无法查找到至少两个与该第二属性相同的单笔交易数据，该种情况在实际应用中极少发生。本发明实施例对第二属性的具体内容及个数、在同一类别中构造图的具体个数、图中包含的单笔交易数据的个数不作限定。

本发明实施例中，在确定第二属性时，需要根据不同类别中单笔交易数据的实际内容进行确定，所述第二属性可以包括但不局限于以下内容，例如：终端设备属性、购物平台或资金交易平台的注册账号、网络之间互连的协议(Internet Protocol，IP)、收款账号信息/付款账号信息等等，本发明实施例对此不作限定。

示例性的，作案者批量性作案的特点，可能使用多个某资金交易平台的注册账号与同一张银行卡进行绑定，例如，不同购物平台中的注册账号，同时绑定一张银行卡；或者，同一个购物网站的注册账号同时绑定或者使用多个用户的银行卡，例如，用户I的购物网站注册账号:abc@*.com，同时绑定用户A、用户B、用户C的银行卡，当用户I在盗取用户A、用户B、用户C的个人基本信息(身份证、手机号码、银行卡卡号)之后，可执行网上支付行为，导致用户A、用户B、用户C的经济损失。因此，在确定第二属性对批量交易数据进行构图时，可根据作案者作案的一些必不可少的步骤确定第二属性，如用于进行资金交易的设备信息或者IP网段信息、资金交易平台账号信息、银行卡信息等等。

需要说明的是，在构造完关联关系数据之间的边后，需要设置边的距离阈值，其目的在于，将图中的边进行“量化”，即将同一类别中的存在关联关系的单笔交易数据进行量化。在设置边的距离阈值的设置原理为：若单笔交易数据之间依赖于第二属性存在关联关系，则将两单笔交易数据构成的边对应的距离阈值设置的相对较小，例如，设置边的距离阈值为1；或者，设置边的距离阈值为2等等；若单笔交易数据之间不存在依赖于第二属性的关联关系，说明两个单笔交易数据之间为相互独立的，可以将该些独立的单笔交易数据之间的边的距离阈值设置的相对较大值，例如，设置边的距离阈值为1000；或者，设置边的距离阈值为5000等等，本发明实施例对设置的边的距离阈值的具体数值不进行限定。

示例性的，承由上述表1所示的示例，对收货国家为美国的批量交易数据根据以下第二属性构造图，第二属性包括：收款终端设备属性智能手机、IP地址、收款时某资金交易平台的注册账号、收款银行卡类别，图2示出了本发明实施例提供的一种图的示意图，如图2所示，该图中为根据上述四种第二属性构建的图，其中，A代表单笔交易数据中根据收款终端设备属性智能手机确定的关联关系，B代表单笔交易数据中根据IP地址确定的关联关系，C代表单笔交易数据中根据收款时某资金交易平台的注册账号确定的关联关系、D代表单笔交易数据中根据收款银行卡类别确定的关联关系，图中A、B、C、D所示的边代表其构成边的单笔交易数据之间存在关联关系，且设置两两存在关联关系的单笔交易数据之间每条边的距离阈值为2，设置两两未存在关联关系的单笔交易数据之间的距离阈值为1000，例如，单笔交易数据1与单笔交易数据2、单笔交易数据3之间的距离阈值分别为1000，单笔交易数据3与单笔交易数据4之间的距离阈值为2，单笔交易数据3与单笔交易数据1、单笔交易数据2之间的距离阈值为1000。需要说明的是，图2仅为示例性的举例，本发明实施例对具体的第二属性、存在关联关系的单笔交易数据的个数、某一类别中批量交易数据的个数、两两单笔交易数据之间的距离阈值等内容不作限定。针对收货国家为中国、收货国家为英国的批量交易数据根据第二属性构造关联关系图时，采用的方法与收货国家为美国的批量交易数据根据第二属性构造图的方法、第二属性相同，在此不再进行赘述。

进一步的，在根据第二属性构造完成图之后，为了便于风险识别系统识别批量交易数据中的风险，对构造的所有图分别衍生其对应的图指标。衍生图指标的过程包括：对不同类别的批量交易数据对应的图进行解析，分别确定不同类别的批量交易数据中单笔交易数据的个数，图中边的个数及其边对应的距离阈值，根据获取的单笔交易数据的个数，图中边的个数及其边对应的距离阈值生成图指标。

为了便于对图指标进行更好的理解，以下将对图指标进行详细说明。对于某一类别的批量交易数据，其包括存在关联关系的单笔交易数据及单笔交易数据之间无关联关系相互独立的单笔交易数据，当该类别的批量交易数据根据第二属性终端设备属性构建图时，衍生的图指标包括：边距离阈值的平均距离、边距离阈值的最近距离、单笔交易数据的个数、单笔交易数据支付次数熵、边的平均个数。其中，所述边距离阈值的平均距离越小，说明存在关联关系的单笔交易数据之间的关联越大，即支付越集中，存在风险的机率越大；所述边距离阈值的平均距离越大，说明存在关联关系的单笔交易数据之间的关联越小，即支付越分散，存在风险的机率越小。边距离阈值的最近距离为设置的边的距离阈值相对较小的值，说明两个单笔交易数据之间存在关联关系；边距离阈值的最近距离为设置的边的距离阈值相对较大的值，说明两个单笔交易数据之间相互独立，不存在关联关系。单笔交易数据支付次数熵为对每个账户的支付次数计算的熵，熵越小说明该关联关系图中的支付集中于某几个账户，熵越大说明该图中的支付较分散；不同各类别的批量交易数据中单笔交易数据的个数的越多，说明该类别的批量交易数据中的支付次数越多，出现风险的机率越大；边的平均个数＝边的个数/其中，n＝单笔交易数据的个数，边的平均个数越大，表示越多的单笔交易数据会被关联上，即支付越集中，出现风险的机率越大。

进一步的，在利用风险识别模型对风险进行识别之前，需要使用预定时间段内的历史单笔交易数据进行积累得到的批量交易数据进行训练，构建风险识别模型，以得到训练用批量交易数据中存在风险时图指标对应的预置风险阈值，保证风险识别模型识别风险的准确性。在构建风险识别模型时，可以根据训练用批量交易数据的类别构建对应类型的风险识别模型，具体包括：对用于所述风险识别模型训练的批量交易数据进行分类，并对不同类别的训练用批量交易数据根据第二属性构建训练图，根据训练图生成其对应的训练图指标，用训练图指标进行风险识别模型的训练，根据训练结果确定不同类别的训练用批量交易数据的图指标对应的预置风险阈值。

其中，训练用批量交易数据与前述批量交易数据相似，训练用批量交易数据为对预定时间段内的历史单笔交易数据进行积累得到的批量交易数据，批量交易数据为对预定时间段内的单笔交易数据进行积累得到的批量交易数据；而历史单笔交易数据与前述单笔交易数据相似，均为用户的资金流转数据，但是，在实质上也存在不同，不同点在于：历史单笔交易数据为已经确认交易完成的数据，其是否存在风险是已知的，对于已经完成的、且存在风险的交易，是无法对其挽回的；而单笔交易数据可能正处于交易过程中的数据，其是否存在风险为未知的，在交易未完成之前，若发现该单笔交易数据中存在风险，可执行对交易的暂停或者取消，避免用户不必要的经济损失。例如，当单笔交易数据为银行转账数据，且该银行转账金额还未成功转到目的账号时，若该过程中发现目的账号可能包含风险，则执行取消该银行转账。

本发明实施例中，虽然历史单笔交易数据的风险为已知的，但是，当历史单笔交易数据积累在一起形成训练用批量交易数据时，还是无法确定训练批量交易数据中存在风险的规律规则，因此，还需要对已经风险的训练用批量交易数据进行训练，总结确定出风险存在时图指标的预置风险阈值，风险识别系统根据该预置风险阈值，对未完成交易的批量交易数据作风险防控，确保交易数据的安全性。

在实际应用中，在根据图衍生图指标及训练图指标时，计算出的图指标或者训练图指标为一个具体的数值，而预置风险阈值是根据训练图指标确定的，因此，可以预置风险阈值作为风险识别模型的变量，为该变量赋衍生训练图指标得到的具体数值。在风险识别模型识别图指标是否超过预置风险阈值时，将预置风险阈值与图指标(变量)的值进行比对，若匹配成功，则说明图指标所在类型的批量交易数据中存在风险；若匹配不成功，则说明图指标所在类型的批量交易数据中未存在风险。

进一步的，作为对上述图1所示方法的实现，本发明另一实施例还提供了一种数据风险控制的装置。该装置实施例与前述方法实施例对应，为便于阅读，本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述，但应当明确，本实施例中的装置能够对应实现前述方法实施例中的全部内容。

本发明实施例提供一种数据风险控制的装置，如图3所示，该装置包括：

第一分类单元31，用于对预定时间段内对批量交易数据按照第一属性进行分类；

第一生成单元32，用于针对所述第一分类单元31分类后的每个类别的批量交易数据分别根据第二属性生成对应的用于识别批量交易数据中存在风险的图的图指标；

输入单元33，用于将所述第一生成单元32生成的不同类别的批量交易数据对应的所述图指标分别输入到风险识别模型；

确定单元34，用于根据模型输出结果得到输入图指标对应的批量交易数据是否有风险。

进一步的，如图4所示，所述第一生成单元32包括：

构建模块321，用于针对每个类别的批量交易数据根据第二属性构建单笔交易数据之间存在关联关系的图；

生成模块322，用于根据所述构建模块321构建的所述图生成其对应的图指标。

进一步的，如图4所示，所述构建模块321包括：

查找子模块3211，用于查找同一类别的批量交易数据中所述第一属性相同的单笔交易数据；

建立子模块3212，用于建立所述查找子模块3211查找的第一属性相同的单笔交易数据之间的关联关系；

构造子模块3213，用于构造所述建立子模块3212建立的存在关联关系的单笔交易数据之间的边；

设置模块3214，用于设置所述构造子模块3213构造的边的距离阈值。

进一步的，如图4所示，所述生成模块322包括：

解析子模块3221，用于针对每个类别的批量交易数据对应的图进行解析；

确定子模块3222，用于在所述解析子模块3221针对每个类别批量交易数据对应的图进行解析的过程中，确定每个类别的批量交易数据中的单笔交易数据个数、图中边的个数及边的距离阈值；

生成子模块3223，用于根据所述确定子模块3222确定的所述单笔交易数据个数、所述图中边的个数及所述边的距离阈值生成所述图指标。

进一步的，如图4所示，所述装置还包括：

第二分类单元35，用于对用于所述风险识别模型训练的批量交易数据进行分类；

构建单元36，用于对所述第二分类单元35分出的每个类别的训练用批量交易数据根据第一属性构建训练图；所述训练批量交易数据为对预定时间段内的历史单笔交易数据进行积累得到的批量交易数据；

第二生成单元37，用于根据所述构建单元36构建的所述训练图生成其对应的训练图指标；

训练单元38，用于用所述第二生成单元37生成的所述训练图指标进行所述风险识别模型的训练。

本发明提供的数据风险控制的装置，风险控制体系/系统在进行风险控制时，首先，对预定时间段内的批量交易数据按照第一属性进行分类，针对每个类别的批量交易数据分别根据第二属性生成对应的用于识别批量交易数据中存在风险的图的图指标，将不同类别的批量交易数据对应的图指标输入到风险识别模型，根据模型输出结果得到输入图指标对应的批量交易数据是否有风险，以便风险控制体系/系统对图指标对应的包含风险的批量交易数据进行风险控制。本发明通过对预定时间段内对单笔交易数据积累的批量交易数据进行分类、生成图指标，能够通过风险识别模型快速、准确地识别出不同类别批量交易数据中存在的集中性风险，减少用户不必要的经济损失。

所述数据风险控制的装置包括处理器和存储器，上述第一分类单元、生成单元、输入单元及确定单元等均作为程序单元存储在存储器中，由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个或以上，通过调整内核参数来解决现有技术中针对单笔交易数据为单位进行风险防控的风险控制体系，无法对分散的批量交易数据进行风险识别的问题，能够快速、准确地识别出批量交易数据中存在的风险。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flashRAM)，存储器包括至少一个存储芯片。

本申请还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行初始化有如下方法步骤的程序代码：对预定时间段内的批量交易数据按照第一属性进行分类；针对每个类别的批量交易数据分别根据第二属性生成对应的用于识别批量交易数据中存在风险的图的图指标；将不同类别的批量交易数据对应的所述图指标分别输入到对应的风险识别模型，根据模型输出结果得到输入图指标对应的批量交易数据是否有风险。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的图表中图形的显示方法、装置、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flashRAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种数据风险控制的方法，其特征在于，包括：

对预定时间段内的批量交易数据按照第一属性进行分类；

2.根据权利要求1所述的方法，其特征在于，针对每个类别的批量交易数据分别根据第二属性生成对应的用于识别批量交易数据中存在风险的图的图指标包括：

针对每个类别的批量交易数据根据第二属性构建单笔交易数据之间存在关联关系的图；

根据所述图生成其对应的图指标。

3.根据权利要求2所述的方法，其特征在于，针对每个类别的批量交易数据根据第二属性构建单笔交易数据之间存在关联关系的图包括：

查找同一类别的批量交易数据中所述第一属性相同的单笔交易数据；

建立第一属性相同的单笔交易数据之间的关联关系；

构造存在关联关系的单笔交易数据之间的边，并设置边的距离阈值。

4.根据权利要求3所述的方法，其特征在于，根据所述图生成其对应的图指标包括：

针对每个类别的批量交易数据对应的图进行解析，确定每个类别的批量交易数据中的单笔交易数据个数、图中边的个数及边的距离阈值；

根据所述单笔交易数据个数、所述图中边的个数及所述边的距离阈值生成所述图指标。

5.根据权利要求1-4中任一项所述的方法，其特征在于，所述方法还包括：

对用于风险识别模型训练的批量交易数据进行分类，并对每个类别的训练用批量交易数据根据第一属性构建训练图；所述训练用批量交易数据为对预定时间段内的历史单笔交易数据进行积累得到的批量交易数据；

根据所述训练图生成其对应的训练图指标；

用所述训练图指标进行所述风险识别模型的训练。

6.一种数据风险控制的装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，所述第一生成单元包括：

构建模块，用于针对每个类别的批量交易数据根据第二属性构建单笔交易数据之间存在关联关系的图；

生成模块，用于根据所述构建模块构建的所述图生成其对应的图指标。

8.根据权利要求7所述的装置，其特征在于，所述构建模块包括：

查找子模块，用于查找同一类别的批量交易数据中所述第一属性相同的单笔交易数据；

建立子模块，用于建立所述查找子模块查找的第一属性相同的单笔交易数据之间的关联关系；

构造子模块，用于构造所述建立子模块建立的存在关联关系的单笔交易数据之间的边；

设置模块，用于设置所述构造子模块构造的边的距离阈值。

9.根据权利要求8所述的装置，其特征在于，所述生成模块包括：

解析子模块，用于针对每个类别的批量交易数据对应的图进行解析；

确定子模块，用于在所述解析子模块针对每个类别批量交易数据对应的图进行解析的过程中，确定每个类别的批量交易数据中的单笔交易数据个数、图中边的个数及边的距离阈值；

生成子模块，用于根据所述确定子模块确定的所述单笔交易数据个数、所述图中边的个数及所述边的距离阈值生成所述图指标。

10.根据权利要求6-9中任一项所述的装置，其特征在于，所述装置还包括：

第二分类单元，用于对用于风险识别模型训练的批量交易数据进行分类；

构建单元，用于对所述第二分类单元分出的每个类别的训练用批量交易数据根据第一属性构建训练图；所述训练批量交易数据为对预定时间段内的历史单笔交易数据进行积累得到的批量交易数据；

第二生成单元，用于根据所述构建单元构建的所述训练图生成其对应的训练图指标；

训练单元，用于用所述第二生成单元生成的所述训练图指标进行所述风险识别模型的训练。