CN109636580A

CN109636580A - 基于大数据的风险检测方法、装置、设备及存储介质

Info

Publication number: CN109636580A
Application number: CN201811254967.7A
Authority: CN
Inventors: 向纯玉
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-10-25
Filing date: 2018-10-25
Publication date: 2019-04-16

Abstract

本发明提供一种基于大数据的风险检测方法、装置、设备及可读存储介质，在进行信贷风险分析时，根据风控的需要获取贷款请求者的请求者信息，再以“关系”的方式将请求者信息与其它信息之间建立关联关系，从而可将孤立的请求者信息与其它信息进行整合，形成信息关联图谱(信息关联网络)；并结合染黑(或染灰)的处理逻辑进行信贷风险检测，从而以大数据分析的方式对贷款申请者的贷款终端进行关联风险检测，提高信贷风险检测的准确性，能够更有效地对潜在风险进行预警，可尽早地发现并规避风险和降低贷款坏账率。

Description

基于大数据的风险检测方法、装置、设备及存储介质

技术领域

本发明涉及大数据领域，尤其涉及一种基于大数据的风险检测方法、装置、设备及存储介质。

背景技术

随着社会和金融行业的快速发展，信贷业务活跃于市场。信贷机构在向贷款请求者进行放款前，需要对贷款请求者的多项资料信息进行分析和风控检测，以确定其欺诈风险性。在传统的风险检测过程中，一般是对贷款请求者所提供的各项资料进行单一的验真核对，如通过电话回访的方式进行电话核对等；但这种检测方法忽略了信贷资料信息与其它信息之间的关联性，从而降低了信贷风险检测的准确性。

发明内容

本发明的主要目的在于提供一种基于大数据的风险检测方法、装置、设备及存储介质，旨在提高信贷风险分析的准确性。

为实现上述目的，本发明提供一种基于大数据的风险检测方法，所述风险检测方法包括：

在接收到请求终端发送的信贷请求时，根据所述信贷请求确定目标产品，并根据所述目标产品的风控需求获取对应的请求者信息；

根据所述请求者信息的信息类型确定对应的预设关联规则，并根据所述预设关联规则获取与所述请求者信息匹配的关联信息；

当所述关联信息属于黑名单信息时，根据预设关系度公式计算所述请求者信息与所述关联信息之间的关系度，并判断所述关系度是否大于预设关系阈值；

若所述关系度大于预设关系阈值，则确定所述请求者信息为风险信息。

此外，为实现上述目的，本发明还提供一种基于大数据的风险检测装置，所述风险检测装置包括：

请求接收模块，用于在接收到请求终端发送的信贷请求时，根据所述信贷请求确定目标产品，并根据所述目标产品的风控需求获取对应的请求者信息；

信息获取模块，用于根据所述请求者信息的信息类型确定对应的预设关联规则，并根据所述预设关联规则获取与所述请求者信息匹配的关联信息；

关系度计算模块，用于当所述关联信息属于黑名单信息时，根据预设关系度公式计算所述请求者信息与所述关联信息之间的关系度，并判断所述关系度是否大于预设关系阈值；

风险确定模块，用于若所述关系度大于预设关系阈值，则确定所述请求者信息为风险信息。

此外，为实现上述目的，本发明还提供一种基于大数据的风险检测设备，所述风险检测设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的风险检测程序，其中所述风险检测程序被所述处理器执行时，实现如上述的基于大数据的风险检测方法的步骤。

此外，为实现上述目的，本发明还提供一种存储介质，所述存储介质上存储有风险检测程序，其中所述风险检测程序被处理器执行时，实现如上述的基于大数据的风险检测方法的步骤。

本发明在进行信贷风险分析时，根据风控的需要获取贷款请求者的请求者信息，再以“关系”的方式将请求者信息与其它信息之间建立关联关系，从而可将孤立的请求者信息与其它信息进行整合，形成信息关联图谱(信息关联网络)；并结合染黑(或染灰)的处理逻辑进行信贷风险检测，从而以大数据分析的方式对贷款申请者的贷款终端进行关联风险检测，提高信贷风险检测的准确性，能够更有效地对潜在风险进行预警，可尽早地发现并规避风险和降低贷款坏账率。

附图说明

图1为本发明实施例方案中涉及的基于大数据的风险检测设备的硬件结构示意图；

图2为本发明基于大数据的风险检测方法第一实施例的流程示意图；

图3为本发明基于大数据的风险检测装置第一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明实施例涉及的基于大数据的风险检测方法主要应用于基于大数据的风险检测设备，该风险检测设备可以是个人计算机(personal computer，PC)、笔记本电脑、服务器等具有数据处理功能的设备。

参照图1，图1为本发明实施例方案中涉及的基于大数据的风险检测设备的硬件结构示意图。本发明实施例中，该风险检测设备可以包括处理器1001(例如中央处理器Central Processing Unit，CPU)，通信总线1002，用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信；用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)；网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真WIreless-FIdelity，WI-FI接口)；存储器1005可以是高速随机存取存储器(random access memory，RAM)，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器，存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解，图1中示出的硬件结构并不构成对本发明的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

继续参照图1，图1中作为一种计算机可读存储介质的存储器1005可以包括操作系统、网络通信模块以及风险检测程序。在图1中，网络通信模块可用于连接数据库，与数据库进行数据通信；而处理器1001可以调用存储器1005中存储的风险检测程序，并执行本发明实施例提供的基于大数据的风险检测方法。

本发明实施例提供了一种基于大数据的风险检测方法。

参照图2，图2为本发明基于大数据的风险检测方法第一实施例的流程示意图。

本实施例中，所述风险检测方法包括以下步骤：

步骤S10，在接收到请求终端发送的信贷请求时，根据所述信贷请求确定目标产品，并根据所述目标产品的风控需求获取对应的请求者信息；

随着社会和金融行业的快速发展，信贷业务活跃于市场。信贷机构在向贷款请求者进行放款前，需要对贷款请求者的多项资料信息进行分析和风控检测，以确定其欺诈风险性。在传统的风险检测过程中，一般是对贷款请求者所提供的资料信息进行单一的验真核对，如通过电话回访的方式进行电话核对等；但这种检测方法忽略了这些资料信息与其它信息之间的关联性，从而降低了信贷风险检测的准确性。对此，本实施例中提出一种基于大数据的风险检测方法，在进行信贷风险分析时，根据风控的需要获取贷款请求者的请求者信息，再将请求者信息与其它信息之间建立关联关系，形成信息关联图谱(信息关联网络)，并结合染黑(或染灰)的处理逻辑进行信贷风险检测，从而以大数据分析的方式对贷款申请者的贷款终端进行关联风险检测，提高信贷风险检测的准确性。

本实施例中基于大数据的风险检测方法是由基于大数据的风险检测设备实现的，该风险检测设备以检测服务器为例进行说明。本实施例中，贷款请求者在需要进行信贷申请时，可在请求终端(如个人电脑PC、笔记本电脑、手机、平板电脑等)上进行信贷操作，请求终端则根据请求者的操作向检测服务器发送对应的信贷请求。检测服务器在接收到请求终端发送的信贷请求时，首先要请求者的请求者信息，并对该请求者信息进行风险检测，从而判断该请求者是否可信，确定是否对请求者进行放款。值得说明的是，对于不同的贷款产品，由于其产品特性(如贷款金额，贷款周期，利率等)的不同，其风控需求也会有所区别，也即所需要分析检测的请求者信息也不同。具体的，本实施例中，请求者在请求终端上进行信贷操作时，需要通过选择或是手动录入的方式选择目标产品，请求终端则根据该操作将对应的目标产品标识添加至信贷请求中并发送至检测服务器；检测服务器在接收到该信贷请求时，将会根据该信贷请求中的目标产品标识确定请求者的目标产品，然后获取该目标产品的风控需求信息，并根据该风控需求信息确定风控信息类型，再根据该风控信息类型获取对应的请求者信息。

对于请求者信息，可以包括请求者的个人基本信息，如姓名、年龄、性别、家庭成员、家庭地址、银行账户等；还可以包括请求者的工作单位信息，如工作单位名称、工作单位地址、实际工作地址(工作单位地址不一定与实际工作地址一致)、单位电话、单位邮箱等；还可以包括请求者的请求者证件号，如身份证号、学位证、护照、房屋产权证等；还可以包括请求者所用请求终端的终端信息，如请求终端的GPS地址、请求终端的IP地址(InternetProtocol Address，互联网协议地址)、请求终端的社交特征信息(如手机联系人、通话记录、短信记录)等。对于上述请求者信息，可以是贷款申请者在通过请求终端提出贷款申请时，自行录入至请求终端，并由请求终端发送至检测服务器中；当然有的请求者信息也可以是检测服务器在得到请求者的授权后，通过安装在该请求终端中的信息获取SDK(SoftwareDevelopment Kit，软件开发工具包)或其它技术获取得到。

步骤S20，根据所述请求者信息的信息类型确定对应的预设关联规则，并根据所述预设关联规则获取与所述请求者信息匹配的关联信息；

本实施例中，检测服务器在获取到请求者信息后，将根据一定的关联规则获取与该请求者信息匹配的其它信息，并在请求者信息与关联信息之间进行关联，从而进行后续的数据分析；其中，与请求者信息匹配的其它信息，为描述方便，可称为关联信息。当然，由于请求者信息的信息类型不同，与之匹配的关联信息类型、以及获取的方式也会有所区别，因此检测服务器首先需要根据请求者信息的信息类型确定对应的关联规则，然后再根据该管理规则获取关联信息。

可选地，当请求者信息为请求者的请求者证件号时，检测服务器可根据该请求者证件号查询预设的信贷记录库，以确定是否曾经有人以该请求者证件号进行过信贷申请；若有，则检测服务器将会获取与该请求者证件号对应的历史信贷件，该历史信贷件中还包括有包括电话号码、银行卡号、地址(包括多种地址)、其它证件号等历史信息。例如，检测服务器根据请求者本次(18年3月)申请所提供的身份证号，查询到17年3月的历史信贷记录，而在17年3月的历史信贷记录中，则还包括提出当时所提供的电话号码、银行卡号、地址、护照等历史信息。在得到该历史信贷件时，即可将该历史信贷件确定为与请求者证件号匹配的关联信息，并两者之间建立关联。

进一步的，对于该请求者的证件号，其一般与证件人所在地、或是发证地、或是证件所代表的权利标的所在地等实体地址，具有一定的对应关系，例如身份证号与身份证所有者的出生地籍贯具有对应关系，护照号与护照签发地具有对应关系，房屋产权证与房屋所在地具有对应关系等。本实施例中，检测服务器在获取到请求者证件号后，还可对请求者证件号进行归属地分析，确定该请求者证件号对应的证件号归属地。并将该证件号归属地确定为与请求者证件号匹配的关联信息。具体的，证件号一般具有一定的号码编译规则，例如我国的身份证号一般为18位，而各段的号码又具有不同的含义，如前6位为地址特征片段，基于这一号码编译规则，若获取到某一身份证号的前6位(我国的一个身份证号)，即可根据该编码规则获取身份证所有者的出生地籍贯。对此，检测服务器中可预先存储有各类信贷证件的号码编译规则，该号码编码规则包括有地址特征表，地址映射表中记录有地址特征片段的地址特征字符与地址的映射关系；在得到请求者证件号时，将根据请求者证件号所的证件类型确定对应的号码编译规则，并根据该号码编译规则对请求者证件号进行分段切分，获取到其中的地址特征片段(如身份证号的前6位)；然后根据地址特征片段查询地址特征表，根据地址特征片段和地址特征表确定对应的证件号归属地。当然，在实际中，检测服务器也可以是与相关的证件管理系统(如公安系统、房屋管理系统等)进行连接，在获得证件号信息时，直接向证件管理系统发送地址查询请求，该地址查询请求中包括有请求者证件号，以查询该请求者证件号对应的证件号归属地。

可选地，当请求者信息为请求者手机号时，检测服务器会通过查询与该请求者手机号具有相似社交特征的参考手机号，并将该参考手机号作为与请求者手机号匹配的关联信息。具体的，检测服务器在得到请求者手机号时，将会通过SDK技术从请求者手机中获取请求者手机号的社交特征信息，当然还可以是得到请求者的授权后，从运营商处获取该请求者手机号的社交特征信息；为了描述方便，请求者手机号的社交特征信息在后续称为“第一社交特征信息”，该第一社交特征信息包括通话记录、短信记录和联系人等，可在一定程度上反映请求者的社交特征。在得到请求者手机号的第一社交特征信息时，将根据该社交特征信息在预设号码库中查询与请求者手机号匹配的参考手机号。其中，该预设号码库，包括有历史借贷事件获得的历史号码及其社交特征信息，还包括有通过爬虫技术从网络上获取的网络号码及其社交特征信息，这些历史号码和网络号码可统称为参考手机号，参考手机号的社交特征信息可称为第二社交特征信息。在查询与请求者手机号匹配的参考手机号时，即是将请求者手机号的第一社交特征信息与某一参考手机号的第二社交特征信息进行比对，并基于一预设的社交相似规则判断两者的社交相似度是否大于一预设相似阈值；若该社交相似度大于预设相似阈值，则认为请求者手机号与该参考手机号具有相似的社交特征，该参考手机号为与请求者手机号匹配的关联信息，并在两者之间进行关联。例如，社交特征信息以通话记录为例，请求者的请求者手机号为P，请求者手机号P对应的通话记录集为P1；检测服务器从预设号码库获取到的参考手机号为Q，参考手机号为Q对应的通话记录集为Q1；检测服务器将对通话记录集P1和通话记录集为Q1进行比对，判断两者的通话相似度是否大于预设通话阈值；若两者的通话相似度大于预设通话阈值，则说明两个号码的社交特征具有一定相似性(关联性)，此时可在请求者手机号P和参考手机号Q之间建立关联。进一步的，对于通话记录相似度，则可以以相同通话对象数来衡量，相同通话对象数越大，通话相似度越高；当然，检测服务器在通过相同通话对象数分析通话记录集P1和通话记录集为Q1的通话相似度时，是统计预设时间段(如一年内)的相同通话对象数，根据该预设时间段两者的相同通话对象数判断所述通话相似度是否大于预设通话阈值。当然，在实际中，对于不同类型的社交特征信息，其相似度对应的相似阈值可以设置为不同的标准。

可选地，当请求终端为手机时，请求者信息还可以是请求终端的基站信息；此时，检测服务器可根据该基站信息对请求终端进行定位，得到终端所在地，然后将该终端所在地确定为与基站信息匹配的关联信息，并在两者之间建立关联。具体的，对于该基站信息，可以由请求终端对当前所在环境的基站信号进行检查，获取到对应的基站信息，再将该基站信息发送至检测服务器；该基站信息可以包括国家代码、网络号码、位置区域码、基站ID、基站信号强度等内容。值得说明的是，请求终端所处的环境，可能是同时位于多个基站的信号覆盖范围之内，而检测服务器在获取基站信息时，可以是仅获取当前所连接的一个基站的基站信息，也可以是获取当前所在区域可以连接的多个基站的基站信息集合，例如，请求终端所在位置可能是在A、B、C三个基站的信号覆盖之内，则检测服务器获取到的基站信息集包括A、B、C三个基站的基站信息。在得到基站信息后，可根据这些基站信息确定请求终端的终端所在地。在根据信贷基站信息确定终端所在地的过程中，可以是根据基站信息中的基站特征标识(如国家代码、网络号码、位置区域码、基站ID等)查询运营商、第三方平台的方式或是其它的方式确定基站的基站地址(或是地理坐标)，再根据基站的信号覆盖范围、或者是基站信息中的基站信号强度即可获取到终端所在地(所在区域)。值得说明的是，当检测服务器的基站信息仅包括有一个基站的相关信息时，根据该基站信息得到的终端所在地可能是一个较宽泛的区域范围；为了提高定位的准确性，检测服务器在获取基站信息时，可以是获取三组以上(此处“以上”包括本数，下同)的基站信息，并根据这多组信贷基站信息进行终端定位，从而提高终端定位的准确性。

进一步的，当检测服务器获得的基站信息包括三组基站的向信息时，检测服务器可以是通过三角定位的方法进行定位的。具体的，对于这三组基站信息，可以看作是三个基站特征组，其中每个基站特征组表示请求终端所在环境下搜到的各基站的信息集合，其中每个基站特征组又包括各基站的基站特征标识(如国家代码、网络号码、位置区域码、基站ID等)、以及请求终端所能检测到的该基站信号的基站信号强度，例如请求终端能检测到a、b、c三个基站的基站信息，即分别获取到A、B、C三个基站特征组，其中基站特征组A包括有基站A的基站特征标识A1、基站A的基站信号强度A2，基站特征组B包括有基站B的基站特征标识B1、基站B的基站信号强度B2，基站特征组C包括有基站C的基站特征标识C1、基站C的基站信号强度C2；检测服务器在得到上述三个基站特征组的基站信息时，将根据各基站特征组中各自的基站特征标识查询相关运营商系统或是第三方基站信息平台，从而确定各基站特征组(基站)对应的基站地址。而又由于基站信号属于电磁波的一种，其强度与基站距离之间具有一定的对应关系，基站距离越远，信号衰减越严重，基站信号强度越弱(当然基站信号强度还可能与其它因素有关)；基于这一规律，检测服务器中可预先设置有对应的信号强度规则，该规则中包括信号强度与基站距离(信号源距离)的函数关系，然后根据该信号强度规则、以及各基站特征组中的基站信号强度可分别确定请求终端与各基站之间的基站距离。在得到基站距离及基站地址时，对于每组基站特征组，均可以在预设的坐标系(如地表坐标系)中以基站地址为中心、基站距离为半径进行做圆；而由于检测服务器是获得了三个基站特征组，因此可做出三个圆；对于这三个圆的交点即可认为是终端所在地，此时检测服务器可根据该交点在预设坐标系中的交点坐标对进行定位，从而确定终端所在地。通过上述获取三个基站特征组并通过三角定位算法进行定位的方式，可提高终端定位的准确度，进而提高后续风险分析的准确性。

再进一步的，当检测服务器获得的信贷基站信息至少包括四组的基站信息时，还可以是通过递归三角定位的方法进行定位的。具体的，为描述方便，以四组基站信息为例进行说明，这四组基站信息可对应四个基站特征组，分别为A、B、C、D，其中每个基站特征组又分别包括各自对应的基站特征标识和基站信号强度。检测服务器在获取到这四个基站特征组时，首先将会以有放回的方式对这四个特征组进行三三组合，从而得到四个特征组集(每个特征组集中包括三个基站特征组)，可分别命名E1(包括A、B、C)、E2(包括A、B、D)、E3(包括A、C、D)、E4(包括B、C、D)。对于每个基站特征组，可分别通过上述三角定位的方法分别得到一个定位地址(三角定位的过程此处不再赘述)；由于共有四个基站特征组，则检测服务器可得到四个定位地址，此时检测服务器可通过这四个定位地址得到一个四边形，再根据确定该四边形几何中心的方式获取到终端所在地。当然，也可以时根据实际情况设置其它的定位规则(如根据定位地址的定位坐标的加权相加等)，基于这四个定位地址获取终端所在地。

可选地，当请求者信息为请求者的工作单位信息，根据根据该工作单位信息查询与之对应的间接特征信息，然后将该间接特征信息确定为与工作单位信息匹配的关联信息，并在两者之间进行关联。具体的，对于请求者提供的工作单位信息，可能是单位名称、单位电话、单位地址、单位邮箱等；对于每一个单项的工作单位信息，都可以反向查询到其对应的单位实体，然后将该单位实体的特征信息作为间接特征信息；例如，请求者提供的是单位电话，对此检测服务器可根据该单位电话反向查询该电话的所属单位，并确定该电话所属单位的地址，为描述方便，该单位电话所属单位的地址可称为间接特征地址；其它类型的工作单位信息及对应的间接特征信息的获取方式与上述类似，此处不再赘述。

进一步的，对于间接特征信息查询的过程，可以检测服务器通过爬虫技术或其它手段从相关的网页中爬取已知单位特征信息，并预先建立已知单位特征库(该已知单位特征库中包括有单位名称及该单位对应的地址、电话、类型等内容)，然后检测服务器再根据请求者的工作单位信息从该已知单位特征库中查询到的间接特征信息。具体的，检测服务器可向网络上的黄页站点、百科服务站点等发送特征获取请求(Request)，等待站点服务器响应；如果站点服务器能正常响应，将向检测服务器返回一个请求回复(Response)，回复包括有已知公司特征；检测服务器若在该预设时间接收到了站点返回的请求回复，即可根据该请求回复得到已知单位特征，并形成已知单位特征库；检测服务器在获取到请求者的某项工作单位信息时，即可根据该工作单位信息查询该已知单位特征库，查找到具有相同的工作单位信息的已知单位，并获取该已知单位的已知单位的其它特征信息作为间接特征信息。值得说明的是，检测服务器从黄页站点(或百科站点等)爬取已知单位特征时，对于黄页站点所返回的请求回复，其回复格式可能包括多种类型，如超文本标记语言html、Json字符串、二进制数据(如图片)等类型；检测服务器在得到该请求回复时，首先需要对请求回复进行相应的解析，以获得其中的已知单位特征。具体的，检测服务器中可预先设置有不同回复类型所对应的解析规则，例如对于html格式，可以是通过正则表达式和/或网页解析库的方式进行解析；对于Json格式，则可以转化为Json对象解析，如通过eval函数、又或者通过JSON.parse()方法进行解析；对于二进制数据，则可以是直接进行存储(或是进行其它处理)。当然，也可以是检测服务器与工商管理系统连接，在获得请求者的工作单位信息时，直接向工商管理系统发送特征查询请求，以查询该工作单位信息对应的间接特征信息。

值得说明的是，对于本实施例中与请求者信息进行直接关联的关联信息，还可称为一次关联信息；而对于一次关联信息，则可能会与其它具有匹配关系的信息进行关联，例如历史信贷件可以与历史申请手机号关联，参考手机号可以与参考手机号所在地关联，终端所在地可以与所在地类型(如小区、工业区、商城等)关联，间接单位特征信息又可以与历史信贷件关联，对于这些与一次关系信息进行关联的信息，为描述方便，可称为二次关联信息，这些二次关联信息可看作与请求者信息间接关联；一次关联信息与二次关联信息统称为关联信息，请求者信息与各关联信息均具有关联关系(直接关联或间接关联)。依此类推，请求者信息还可以与三次关联信息、四次关联信息等进行关联，从而以请求者信息为起点，形成信息关联图谱(信息关联网络)，以进行后续的风险检测。

步骤S30，当所述关联信息属于黑名单信息时，根据预设关系度公式计算所述请求者信息与所述关联信息之间的关系度，并判断所述关系度是否大于预设关系阈值；

本实施例中，检测服务器在得到与请求者信息匹配的关联信息，将请求者信息与关联信息建立关联后，即可通过染黑逻辑(或染灰逻辑)对请求者信息进行欺诈风险分析。当某一关联信息属于黑名单信息(例如如请求者证件号对应的历史信贷件逾期，请求者手机号匹配的参考手机号为黑产手机号，该请求终端的基站信息所匹配的重点所在地为欺诈多发区，该请求者的工作单位信息所匹配的间接特征信息为虚假信息等)时，检测服务器将根据预设关系度公式计算请求者信息与关联信息之间的关系度。而对于请求者信息与关联信息之间的关系度，则可看作是请求者信息与关联信息之间联系紧密的表征；关系度越大，两者的联系越紧密。其中预设关系度公式为：

其中f为请求者信息与关联信息之间的关系度；

m为请求者信息与关联信息之间的最短关联路径上的路径信息数量，且路径信息包括请求者信息和关联信息，m≥2；值得说明的是，当请求者信息所关联的关联信息包括一次关联信息、二次关联信息、三次关联信息等时，若计算的是一次关联信息与请求者信息的关系度，则m＝2，若计算的是二次关联信息与请求者信息的关系度，则m＝3，依此类推；

k₀为与关联信息的信息类型(如历史信贷件、参考手机号、终端所在地等)对应的预设距离系数，k₀＞0；

x₀为与关联信息的信息类型(如历史信贷件、参考手机号、终端所在地等)对应的预设强度系数，x₀＞0；

k_i为最短关联路径上各路径信息各自对应的关联距离系数，k_i＞0，请求者信息与各路径信息的关联距离(即关联的路径数)越大，k_i越小；

x_i为最短关联路径上各路径信息各自对应的关系强度系数，x_i＞0，与路径信息的信息类型有关；

u_i为最短关联路径上各路径信息各自对应的衰减因子系数，0＜u_i≤1，与路径信息的信息类型有关。

具体的，在进行计算请求者信息与某一关联的(匹配的)关联信息的关联度时，首先获取该关联信息的预设距离系数k₀和预设强度系数x₀；然后根据请求者信息与关联信息的关联关系确定两者的计算关系路径，其中若请求者信息与关联信息之间有多条关系路径(可以是通过直接关联的方式关联，也可以是通过间接关联的方式关联)，则选择关系数最少的一条作为计算关系路径(即最短关系路径)；在确定计算关系路径时，将要确定该计算关系路径上的所有路径信息(包括请求者信息与关联信息)，并根据计算关系路径的关联距离、各路径信息的信息类型、关联强度等确定各路径信息对应的关联距离系数k_i、衰减因子系数u_i和关联强度系数x_i，再将各参数代入至上述公式中，即可计算出请求者信息与关联信息的关系度。

本实施例中，检测服务器在得到请求者信息与关联信息之间的关系度时，即可通过染黑逻辑(或染灰逻辑)对请求者信息进行欺诈风险分析。具体的，当某一关联信息属于黑名单信息(例如如请求者证件号对应的历史信贷件逾期，请求者手机号匹配的参考手机号为黑产手机号，该请求终端的基站信息所匹配的重点所在地为欺诈多发区，该请求者的工作单位信息所匹配的间接特征信息为虚假信息等)时，检测服务器将判断请求者信息与该关联信息之间的关系度是否大于预设关系阈值，即通过两者之间的关系紧密程度关联分析请求者信息的风险性。

步骤S40，若所述关系度大于预设关系阈值，则确定所述请求者信息为风险信息。

本实施例中，若请求者信息与该黑名单关联信息之间的关系度大于预设关系阈值，则可认为请求者信息也是可疑的，并将该请求者信息确定为风险信息；而如果请求者信息与该黑名单关联信息之间的关系度小于或等于预设关系阈值，则可认为该请求者信息是可信的。

值得说明是，在信贷风控审核过程中，往往是需要对多项请求者信息进行风险检测；对此，检测服务器在对单项请求者信息的风险性进行判断后，还可以根据所有请求者信息中的风险信息数输出对应的请求处理建议。具体的，检测服务器在确定各项请求者信息的风险性时(即是否为风险信息)，将统计其中风险信息数，然后判断该风险信息数是否大于预设风险阈值；若该风险信息数大于预设风险阈值，则可输出拒绝放款的建议；若该风险信息数小于或等于预设风险阈值，则了输出同意放款的建议。当然，在统计得到风险信息数，还可以是测算风险信息数所占请求者信息的风险信息占比，并通过该风险信息占比与一预设占比阈值的大小关系输出对应的请求处理建议。再进一步的，对于上述的预设风险阈值、预设占比阈值还可以是根据目标产品的风控需求确定，该风控需求包括风控等级，风控等级越高，预设风险阈值和预设占比阈值越小(审核标准越严格)，通过这样的方式，可在提高信贷风险分析的准确性的同时，根据信贷产品的实际风控要求动态调整准入口径。

本实施例在接收到请求终端发送的信贷请求时，根据所述信贷请求确定目标产品，并根据目标产品的风控需求获取对应的请求者信息；根据请求者信息的信息类型确定对应的预设关联规则，并根据所述预设关联规则获取与所述请求者信息匹配的关联信息，根据预设关系度公式计算所述请求者信息与所述关联信息之间的关系度；当所述关联信息属于黑名单信息时，判断所述关系度是否大于预设关系阈值；若所述关系度大于预设关系阈值，则确定所述请求者信息为风险信息。通过以上方式，本实施例在进行信贷风险分析时，根据风控的需要获取贷款请求者的请求者信息，再以“关系”的方式将请求者信息与其它信息之间建立关联关系，从而可将孤立的请求者信息与其它信息进行整合，形成信息关联图谱(信息关联网络)；并结合染黑(或染灰)的处理逻辑进行信贷风险检测，从而以大数据分析的方式对贷款申请者的贷款终端进行关联风险检测，提高信贷风险检测的准确性，能够更有效地对潜在风险进行预警，可尽早地发现并规避风险和降低贷款坏账率。

此外，本发明实施例还提供一种基于大数据的风险检测装置。

参照图3，图3为本发明基于大数据的风险检测装置第一实施例的功能模块示意图。

本实施例中，所述风险检测装置包括：

请求接收模块10，用于在接收到请求终端发送的信贷请求时，根据所述信贷请求确定目标产品，并根据所述目标产品的风控需求获取对应的请求者信息；

信息获取模块20，用于根据所述请求者信息的信息类型确定对应的预设关联规则，并根据所述预设关联规则获取与所述请求者信息匹配的关联信息；

关系度计算模块30，用于当所述关联信息属于黑名单信息时，根据预设关系度公式计算所述请求者信息与所述关联信息之间的关系度，并判断所述关系度是否大于预设关系阈值；

风险确定模块40，用于当所述关联信息属于黑名单信息时，根据预设关系度公式计算所述请求者信息与所述关联信息之间的关系度，并判断所述关系度是否大于预设关系阈值。

其中，上述风险检测装置的各虚拟功能模块存储于图1所示基于大数据的风险检测设备的存储器1005中，用于实现风险检测程序的所有功能；各模块被处理器1001执行时，可实现将请求者信息与关联信息进行关联，并结合染黑(或染灰)的处理逻辑对请求者信息进行风险检测的功能。

进一步的，所述请求者信息包括请求者证件号，所述信息获取模块20包括：

证件号匹配单元，用于根据所述请求者证件号在预设信贷记录库中查询与所述请求者证件号匹配的历史信贷件，并将所述历史信贷件确定为与所述请求者证件号匹配的关联信息。

进一步的，所述请求者信息包括请求者手机号，所述信息获取模块20包括：

特征获取单元，用于获取所述请求者手机号的第一社交特征信息，并在预设号码库中获取参考手机号、及所述参考手机号的第二社交特征信息；

相似度判断单元，用于基于预设社交相似规则判断所述第一社交特征信息与第二社交特征信息的社交相似度是否大于预设相似阈值；

手机号匹配单元，用于若所述社交相似度大于预设相似阈值，则确定所述参考手机号为与所述请求者手机号匹配的关联信息。

进一步的，所述请求者信息包括所述请求终端的基站信息，所述信息获取模块20包括：

基站匹配单元，用于根据所述基站信息对所述请求终端进行定位，获得对应的终端所在地，并将所述终端所在地确定为与所述基站信息匹配的关联信息。

进一步的，所述请求者信息包括所述请求者的工作单位信息，所述信息获取模块20包括：

单位匹配单元，用于根据所述工作单位信息查询得到间接特征信息，并将所述间接特征信息确定为与所述工作单位信息匹配的关联信息。

进一步的，所述风险检测装置还包括：

建议输出模块，用于统计所述请求者的风险信息数，并根据所述风险信息数输出对应的请求处理建议。

进一步的，所述预设关系度公式为：

其中，f为所述请求者信息与所述关联信息之间的关系度；

m为所述请求者信息与所述关联信息之间的关联路径上的路径信息数量，所述路径信息包括所述请求者信息和所述关联信息，所述m≥2；

k₀为与所述关联信息的终端类型对应的预设距离系数，k₀＞0；

x₀为与所述关联信息的终端类型对应的预设强度系数，x₀＞0；

k_i为所述路径信息各自对应的关联距离系数，k_i＞0；

u_i为所述路径信息各自对应的衰减因子系数，0＜u_i≤1；

x_i为所述路径信息各自对应的关联强度系数，x_i＞0。

其中，上述风险检测装置中各个模块的功能实现与上述基于大数据的风险检测方法实施例中各步骤相对应，其功能和实现过程在此处不再一一赘述。

此外，本发明实施例还提供一种存储介质。

本发明存储介质上存储有风险检测程序，其中所述风险检测程序被处理器执行时，实现如上述的基于大数据的风险检测方法的步骤。

其中，风险检测程序被执行时所实现的方法可参照本发明基于大数据的风险检测方法的各个实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于大数据的风险检测方法，其特征在于，所述风险检测方法包括：

2.如权利要求1所述的风险检测方法，其特征在于，所述请求者信息包括请求者证件号，

所述根据所述预设关联规则获取与所述请求者信息匹配的关联信息的步骤包括：

根据所述请求者证件号在预设信贷记录库中查询与所述请求者证件号匹配的历史信贷件，并将所述历史信贷件确定为与所述请求者证件号匹配的关联信息。

3.如权利要求1所述的风险检测方法，其特征在于，所述请求者信息包括请求者手机号，

获取所述请求者手机号的第一社交特征信息，并在预设号码库中获取参考手机号、及所述参考手机号的第二社交特征信息；

基于预设社交相似规则判断所述第一社交特征信息与第二社交特征信息的社交相似度是否大于预设相似阈值；

若所述社交相似度大于预设相似阈值，则确定所述参考手机号为与所述请求者手机号匹配的关联信息。

4.如权利要求1所述的风险检测方法，其特征在于，所述请求者信息包括所述请求终端的基站信息，

根据所述基站信息对所述请求终端进行定位，获得对应的终端所在地，并将所述终端所在地确定为与所述基站信息匹配的关联信息。

5.如权利要求1所述的风险检测方法，其特征在于，所述请求者信息包括所述请求者的工作单位信息，

根据所述工作单位信息查询得到间接特征信息，并将所述间接特征信息确定为与所述工作单位信息匹配的关联信息。

6.如权利要求1所述的风险检测方法，其特征在于，所述若所述关系度大于预设关系阈值，则确定所述请求者信息为风险信息的步骤之后，还包括：

统计所述请求者的风险信息数，并根据所述风险信息数输出对应的请求处理建议。

7.如权利要求1至6中任一项所述的风险检测方法，其特征在于，所述预设关系度公式为：

其中，f为所述请求者信息与所述关联信息之间的关系度；

k_i为所述路径信息各自对应的关联距离系数，k_i＞0；

u_i为所述路径信息各自对应的衰减因子系数，0＜u_i≤1；

x_i为所述路径信息各自对应的关联强度系数，x_i＞0。

8.一种基于大数据的风险检测装置，其特征在于，所述风险检测装置包括：

9.一种基于大数据的风险检测设备，其特征在于，所述风险检测设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的风险检测程序，其中所述风险检测程序被所述处理器执行时，实现如权利要求1至7中任一项所述的基于大数据的风险检测方法的步骤。

10.一种存储介质，其特征在于，所述存储介质上存储有风险检测程序，其中所述风险检测程序被处理器执行时，实现如权利要求1至7中任一项所述的基于大数据的风险检测方法的步骤。