CN112231486A - 目标数据库构建方法、目标申请人识别方法及装置、系统 - Google Patents
目标数据库构建方法、目标申请人识别方法及装置、系统 Download PDFInfo
- Publication number
- CN112231486A CN112231486A CN202010920944.6A CN202010920944A CN112231486A CN 112231486 A CN112231486 A CN 112231486A CN 202010920944 A CN202010920944 A CN 202010920944A CN 112231486 A CN112231486 A CN 112231486A
- Authority
- CN
- China
- Prior art keywords
- group
- target
- applicant
- loan
- malicious
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000010276 construction Methods 0.000 title claims abstract description 24
- 230000011218 segmentation Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/41—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/45—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Multimedia (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开提供一种目标数据库构建方法、目标申请人识别方法及装置、系统,该目标数据库构建方法具体为:首先基于当前全量贷款申请人及相应的申请人信息构建申请人关系图谱,然后基于预设的疑似团伙特征对申请人关系图谱进行切分以获得若干团伙图谱,接着根据每一团伙谱图中申请人之间的相似度判断贷款团伙是否为目标恶意贷款团伙,最后基于所有目标恶意贷款团伙的团伙特征构建目标数据库,该方法能基于当前的全量贷款申请人构建包括所有目标恶意贷款团伙的团伙特征的数据库,其通过关系图谱的方式,直接针对可能存在欺诈的团伙特征及节点切分出贷款团伙并进一步验证确认,从而缩短识别团伙的时间,识别效率较高。
Description
技术领域
本发明涉及数据处理领域,特别涉及一种目标数据库构建方法、目标申请人识别方法及装置、系统。
背景技术
随着互联网金融的发展,很多机构贷款可以完全通过线上进行贷款申请和审批,造成许多贷款恶意申请贷款,拿到额度后立即失联,给金融机构带来了极大损失,如何识别恶意贷款成为了各家金融机构面临的问题。
当前技术中,贷款的识别主要分为两个步骤,首先是找出疑似的贷款团伙,通常是使用一定的条件直接在申请人信息数据表中进行探查,找出具有一定共性且表现可疑的申请人,作为疑似的贷款团伙。其次,在找出疑似的团伙名单后,需要对名单进行验证,此步骤通常由人工进行手动检查,根据名单中申请人一些地址信息,进一步判断是否为聚集的申请人,从而来判断这批申请人是否为有组织的贷款团伙。
在找出疑似的贷款团伙时,传统的数据表结构需要在全量数据上进行搜索和探查,往往搜索效率极其低下,并且占用大量的资源,且随着数据量的增加,搜索时长将不断增加,造成资源浪费。并且,在对疑似名单进行验证时,人工验证的工作非常繁琐、成本较高,且容易有错漏。
因此,需要寻求一种能快速、准确识别贷款团伙并形成数据库的方法,基于该数据库能有效判断贷款申请人是否属于贷款团伙。
发明内容
为解决上述技术问题,本发明提供了一种目标数据库构建方法、目标申请人识别方法及装置、系统,该方法能基于全量贷款申请人构建包括所有恶意贷款团伙的团伙特征的数据库,其构建过程准确、高效,且能有效用于对新贷款申请人是否为恶意贷款团伙的判断。
本发明提供的技术方案如下:
第一方面,提供一种目标数据库构建方法,所述方法至少包括如下步骤:
基于当前全量贷款申请人及相应的申请人信息构建申请人关系图谱;
基于预设的疑似团伙特征对所述申请人关系图谱进行切分以获得若干团伙图谱,所述团伙图谱对应于包括若干满足所述疑似团伙特征的申请人的贷款团伙;
根据每一所述团伙谱图中申请人之间的相似度判断所述贷款团伙是否为目标恶意贷款团伙;
基于所有所述目标恶意贷款团伙的团伙特征构建目标数据库。
在一种实施方式中,所述基于当前全量贷款申请人及相应的申请人信息构建申请人关系图谱,包括如下子步骤:
提取当前全量贷款申请人的申请人信息;
根据所述申请人信息获取任意两个申请人之间的关联关系;
以所述申请人为目标节点,所述申请人之间的关联关系为所述目标节点之间的目标关系构建申请人关系图谱。
在一种实施方式中,所述基于预设的疑似团伙特征对所述申请人关系图谱进行切分以获得团伙图谱,所述团伙图谱对应于包括若干满足所述疑似团伙特征的申请人的贷款团伙,包括如下子步骤:
在所述申请人关系图谱中提取符合同一预设的疑似团伙特征的若干目标关系及其对应的若干目标节点;
以每一所述疑似团伙特征所对应的若干目标节点为单位对所述申请人关系图谱逐层切分以形成若干团伙图谱。
在一种实施方式中,所述根据每一所述团伙谱图中申请人之间的相似度判断所述贷款团伙是否为目标恶意贷款团伙,包括如下子步骤:
提取每一所述团伙谱图中每一申请人的若干目标特征,所述目标特征包括申请人信息中除所述目标关系之外的其余特征;
计算每一所述贷款团伙中所有申请人之间的每一目标特征之间的相似度;
当任一所述目标特征的相似度符合预设相似度阈值和/或所述目标特征符合一定阈值时,判定所述贷款团伙为目标恶意贷款团伙。
在一种实施方式中,所述目标特征包括结构化数据和非结构化数据中的至少一种;
所述结构化数据包括申请地区、申请地址、IP地址、申请设备、密码及申请页面停留时长中的至少一种;
所述非结构化数据包括录入人脸、录入语音、视频背景、音频背景中的至少一种。
在一种实施方式中,所述基于所有所述目标恶意贷款团伙构建目标数据库,包括如下子步骤:
对每一所述目标恶意贷款团伙进行团伙特征标注;
基于每一所述目标恶意贷款团伙的团伙特征构建目标数据库。
第二方面,提供一种基于所述目标数据库构建方法的目标申请人识别方法,包括如下步骤:
获取当前贷款申请人的当前申请信息;
将所述当前申请信息与所述目标数据库中的每一目标恶意贷款团伙的团伙特征按照预设的匹配规则进行匹配;
当所述当前申请信息与所述目标恶意贷款团伙的团伙特征匹配,则判定所述当前贷款申请人为目标申请人。
第三方面,提供一种目标数据库构建装置,所述装置包括:
第一构建模块,用于基于当前全量贷款申请人及相应的申请人信息构建申请人关系图谱;
切分模块,用于基于预设的疑似团伙特征对所述申请人关系图谱进行切分以获得若干团伙图谱,所述团伙图谱对应于包括若干满足所述疑似团伙特征的申请人的贷款团伙;
判断模块,用于根据每一所述团伙谱图中申请人之间的相似度判断所述贷款团伙是否为目标恶意贷款团伙;第二构建模块,用于基于所有所述目标恶意贷款团伙的团伙特征构建目标数据库。
第四方面,提供一种目标申请人识别装置,所述装置至少包括:
获取模块,用于获取当前贷款申请人的当前申请信息;
匹配模块,用于将所述当前申请信息与所述目标数据库中的每一目标恶意贷款团伙的团伙特征按照预设的匹配规则进行匹配;判定模块,用于当所述当前申请信息与所述目标恶意贷款团伙的团伙特征匹配,则判定所述当前贷款申请人为目标申请人。
第五方面,提供一种计算机系统,包括:
一个或多个处理器;以及
与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如下操作:
基于当前全量贷款申请人及相应的申请人信息构建申请人关系图谱;
基于预设的疑似团伙特征对所述申请人关系图谱进行切分以获得若干团伙图谱,所述团伙图谱对应于包括若干满足所述疑似团伙特征的申请人的贷款团伙;
根据每一所述团伙谱图中申请人之间的相似度判断所述贷款团伙是否为目标恶意贷款团伙;
基于所有所述目标恶意贷款团伙的团伙特征构建目标数据库。
本发明相比现有技术而言的有益效果在于:
本发明提供一种目标数据库构建方法、目标申请人识别方法及装置、系统,该目标数据库构建方法具体为:首先基于当前全量贷款申请人及相应的申请人信息构建申请人关系图谱,然后基于预设的疑似团伙特征对申请人关系图谱进行切分以获得若干团伙图谱,接着根据每一团伙谱图中申请人之间的相似度判断贷款团伙是否为目标恶意贷款团伙,最后基于所有目标恶意贷款团伙的团伙特征构建目标数据库,该方法能基于当前的全量贷款申请人构建包括所有目标恶意贷款团伙的团伙特征的数据库,其通过关系图谱的方式,直接针对可能存在欺诈的团伙特征及节点切分出贷款团伙并进一步验证确认,从而缩短识别团伙的时间,识别效率较高;
另外,在对贷款团伙进行验证时,充分利用了结构化数据及非结构化数据相结合的方式,采用机器学习的方式对相关数据进行自动处理,避免人工核对,进一步提高目标恶意团伙的验证效率;
再者,本实施例还提出一种目标申请人识别方法,在完成目标数据库构建之后,当有新的贷款申请人提出贷款申请时,通过将该申请人的申请信息与目标数据库中已确定的目标恶意贷款团伙的团伙特征按照预设匹配规则进行匹配,来判定当前贷款申请人是否为目标申请人,因此,在完成目标数据库构建后,仅需要通过简单的特征比对就能判断出目标申请人是否属于贷款团伙,而不需要基于全量申请人逐个对比,系统处理量小,判断过程快速、精准、高效。
需要说明的是,本申请的方案只要实现其中任一技术效果即可。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种目标数据库构建方法的流程图;
图2是本发明实施例二提供的一种目标申请人识别方法的流程图;
图3是本发明实施例三提供的一种目标数据库构建装置的结构图;
图4是本发明实施例四提供的一种目标申请人识别装置的结构图;
图5是本发明实施例五提供的计算机系统架构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
鉴于当前的恶意贷款团伙恶意申请贷款,且相关机构无法快速、精准地识别恶意贷款团伙的情形,本实施例提出一种目标数据库构建方法及目标申请人识别方法,其能在短时间内完成恶意贷款团伙的识别,并基于此对新的贷款申请人进行风险判断。
下面将结合具体实施例对该目标数据库构建方法、目标申请人识别方法及装置、系统作进一步说明。
实施例一
结合图1所示,本实施例提供一种目标数据库构建方法,其至少包括如下步骤:
S1、基于当前全量贷款申请人及相应的申请人信息构建申请人关系图谱。具体地,S1包括如下子步骤:
S11、提取当前全量贷款申请人的申请人信息;
S12、根据申请人信息获取任意两个申请人之间的关联关系;
S13、以申请人为目标节点,申请人之间的关联关系为目标节点之间的目标关系构建申请人关系图谱。
具体地,本实施例中的关联关系至少包括疑似欺诈类且能体现一定聚集性的关系,如多个申请人身份证号来自同一地区、同一申请地址、IP地址相似、使用同一设备、账号使用同样的密码等。
在一种较佳的实施方式中,步骤S1还包括:将疑似欺诈类且能体现一定聚集性的关系优先/突出体现,以便后续处理过程中优先考虑这一类关联关系。
S2、基于预设的疑似团伙特征对所述申请人关系图谱进行切分以获得若干团伙图谱,所述团伙图谱对应于包括若干满足所述疑似团伙特征的申请人的贷款团伙。具体地,步骤S2具体包括如下子步骤:
S21、在所述申请人关系图谱中提取符合同一预设的疑似团伙特征的若干目标关系及其对应的若干目标节点。
具体地,疑似团伙特征是根据经验预先设置的,疑似团伙特征包括一种节点之间的目标关系以及所关联的节点数量阈值,或者多种节点之间的目标关系的组合及每一种目标关系分别对应的节点数量阈值。如,一种疑似团伙特征为:节点账号使用同样的密码,且使用该密码的节点数量超过20个;另一种疑似团伙特征为两种目标关系的组合,即同时满足:节点账号使用同样的密码,且使用该密码的节点数量超过20个,以及身份证号前六位显示来自同一地区,且包括的节点数量超过10个,并且两种目标关系对应的节点具有一定的重叠率。
需要说明的是,疑似团伙特征为关联关系中的一种或多种的组合。
S22、以每一所述疑似团伙特征所对应的若干目标节点为单位对所述申请人关系图谱逐层切分以形成若干团伙图谱。
在S21中获取与疑似团伙特征对应的若干节点之后,步骤S22将这些节点从其所在的一层申请人中取出,并形成一个团伙图谱,该团伙图谱的两两节点之间同样包括至少一种目标关系。
S3、根据每一所述团伙谱图中申请人之间的相似度判断所述贷款团伙是否为目标恶意贷款团伙。需要说明的是,此处的目标恶意贷款团伙用于表明该恶意贷款团伙为本实施例的查找目标。具体地,该步骤S3包括如下子步骤:
S31、提取每一所述团伙谱图中每一申请人的若干目标特征,所述目标特征包括申请人信息中除所述目标关系之外的其余特征。
S32、计算每一所述贷款团伙中所有申请人之间的每一目标特征之间的相似度;
S33、任一所述目标特征的相似度符合预设相似度阈值和/或所述目标特征符合一定阈值时,判定所述贷款团伙为目标恶意贷款团伙。
具体地,为了进一步确定贷款团伙中申请人是否有欺诈属性,可以通过目标关系之外的其他特征作进一步筛选。具体的筛选过程可根据具体场景而设置,本实施例不做具体限定,通常为针对具体目标特征属性设置相应的阈值范围,如操作时间、IP地址、设备标识等目标特征。
目标特征包括结构化数据和非结构化数据中的至少一种。结构化数据包括申请地区、申请地址、IP地址、申请设备、密码及申请页面停留时长中的至少一种;非结构化数据包括录入人脸、录入语音、视频背景、音频背景中的至少一种。
在一种示例性场景中,目标特征为结构化数据,如申请页面停留时长时,具体包括如下子步骤:
Sa1、提取贷款团伙中每一申请人在填写申请人信息时在某一页面的停留时长;
Sa2、计算该停留时间的相似度值;
Sa3、当相似的停留时长符合预设时常(如1分钟内),并且申请页面停留时长较长的发生概率低于阈值(如1%),则判定贷款团伙为目标恶意贷款团伙。
在一种具体地实施方式中,根据存量客户的申请页面停留时长拟合出申请时间范围分布,进一步可以推算出每个页面停留时长对应的发生概率,批量贷款申请团伙往往对申请流程非常熟悉,申请页面的停留时间会对应明显缩短。当若干账户申请页面停留时长明显低于正常水平,并且对应发生概率极低,说明该账户是贷款团伙恶意注册的风险较高。
在又一示例性场景中,目标特征为非结构化数据,如视频背景,正常情况下,在申请贷款过程中有真人核身环节,以人脸识别视频为例,该场景下具体包括如下子步骤:
Sb1、在人脸识别视频中识别出人脸后,用边缘检测算法将人像部分去除,获得剩下的背景图像;
Sb2、对背景图像进行相似度计算;在一种具体的实施方式中,可采用直方图匹配的方法进行计算。例如对于图像1和图像2,可分别计算两幅图像的直方图得到Hist1和Hist2,利用巴氏距离、直方图相交距离等得出两个直方图的归一化相关系数,然后根据系数判断两幅图像的相似性。
Sb3、当相似度值符合预设阈值,则判定贷款团伙为目标恶意贷款团伙。
当发现团伙图谱中的申请人的背景图像相似度很高,那么说明这部分人是在同一地点申请的贷款,进而可以确定他们是团伙性欺诈套现。
当然,在对背景图像进行识别时所采用的图像采集、图像预处理、特征提取及图像识别过程,可采用深度学习等手段实现相应的视频图像处理,为本领域惯用技术手段,本实施例中对此不再赘述。
该方法同样适用于目标特征为音频背景的场景中,同样可以根据音频背景的相似度值来判断申请人是否在同一地点进行申请。
S4、基于所有所述目标恶意贷款团伙的团伙特征构建目标数据库,所构建的目标数据库包括以若干以目标恶意贷款团伙为单位的团伙特征。该步骤S4具体包括如下子步骤:
S41、对每一目标恶意贷款团伙进行团伙特征标注,所标注的团伙特征至少包括符合预设相似度阈值的目标特征;
S42、基于每一目标恶意贷款团伙的团伙特征构建目标数据库。
同样的,团伙特征包括申请地区、申请地址、IP地址、申请设备、密码及申请页面停留时长、录入人脸、录入语音、视频背景、音频背景中的一种或多种的组合。
本实施例提供的一种目标数据库构建方法该方法能基于当前的全量贷款申请人构建包括所有目标恶意贷款团伙的团伙特征的数据库,其通过关系图谱的方式,直接针对可能存在欺诈的团伙特征及节点切分出贷款团伙并进一步验证确认,从而缩短识别团伙的时间,识别效率较高;
另外,在对贷款团伙进行验证时,充分利用了结构化数据及非结构化数据相结合的方式,采用机器学习的方式对相关数据进行自动处理,避免人工核对,进一步提高目标恶意团伙的验证效率;
实施例二
结合图2所示,本实施例提供一种目标申请人识别方法,该方法基于实施例一所构建的目标数据库实现,至少包括如下步骤:
S1'、获取当前贷款申请人的当前申请信息。
当前申请信息至少包括如实施例一中的结构化数据及非结构化数据中的至少一种,结构化数据包括申请地区、申请地址、IP地址、申请设备、密码及申请页面停留时长中的至少一种;非结构化数据包括录入人脸、录入语音、视频背景、音频背景中的至少一种。
S2'、将当前申请信息与目标数据库库中的每一目标恶意贷款团伙的团伙特征按照预设的匹配规则进行匹配。
匹配规则可作多样化设置,如包括一种当前申请信息的较为精确的匹配关系,或者为基于多种类型的当前申请信息且对多种类型申请信息采用的加权求和形成的匹配关系,本实施例对此并不加以限定。如,当当前申请信息中包括IP地址时,可通过预设的基于IP地址的匹配规则计算匹配度。又如,当目标申请信息包括身份证号前六位相同的申请地区信息以及音频背景时,则可通过预设的基于申请区域信息及音频背景的匹配规则计算匹配度。当然,不同类型的匹配规则可预先按照优先级排序,并按照优先级顺序逐个匹配。
S3'、若当前申请信息与目标恶意贷款团伙的团伙特征匹配,则判定当前贷款申请人为目标申请人。
具体地,经过S2'中匹配度计算,获得至少一个相应匹配规则下的匹配度,当任意一个匹配度符合相应匹配规则对应的匹配度阈值时,确定当前贷款申请人属于相应的目标恶意贷款团伙,即完成目标申请人的识别,此处的目标申请人为具有恶意贷款等欺诈可能的贷款申请人。
需要说明的是,只要任一匹配度触达相应的匹配度阈值即可完成认定,即便是其他匹配规则下的匹配度较低也不造成识别影响。
本实施例提出一种目标申请人识别方法,在完成目标数据库构建之后,当有新的贷款申请人提出贷款申请时,通过将该申请人的申请信息与目标数据库中已确定的目标恶意贷款团伙的团伙特征按照预设匹配规则进行匹配,来判定当前贷款申请人是否为目标申请人,因此,在完成目标数据库构建后,仅需要通过简单的特征比对就能判断出目标申请人是否属于贷款团伙,而不需要基于全量申请人逐个对比,系统处理量小,判断过程快速、精准、高效。
实施例三
为执行上述实施例一中的一种识别贷款方法,本实施例提供一种与之对应的识别贷款装置,如图3所示,该装置至少包括:
第一构建模块,用于基于当前全量贷款申请人及相应的申请人信息构建申请人关系图谱。第一构建模块至少包括:
第一提取单元,用于提取当前全量贷款申请人的申请人信息;
获取单元,用于根据所述申请人信息获取任意两个申请人之间的关联关系;
第一构建单元,用于以所述申请人为目标节点,所述申请人之间的关联关系为所述目标节点之间的目标关系构建申请人关系图谱。
切分模块,用于基于预设的疑似团伙特征对所述申请人关系图谱进行切分以获得若干团伙图谱,所述团伙图谱对应于包括若干满足所述疑似团伙特征的申请人的贷款团伙。切分模块至少包括:
第二提取单元,用于在所述申请人关系图谱中提取符合同一预设的疑似团伙特征的若干目标关系及其对应的若干目标节点;;
切分单元,用于以每一所述疑似团伙特征所对应的若干目标节点为单位对所述申请人关系图谱逐层切分以形成若干团伙图谱。
判断模块,用于根据每一所述团伙谱图中申请人之间的相似度判断所述贷款团伙是否为目标恶意贷款团伙;。判断模块至少包括:
第三提取单元,用于提取每一所述团伙谱图中每一申请人的若干目标特征,所述目标特征包括申请人信息中除所述目标关系之外的其余特征;
计算单元,用于计算每一所述贷款团伙中所有申请人之间的每一目标特征之间的相似度;
判定单元,用于当任一所述目标特征的相似度符合预设相似度阈值和/或所述目标特征符合一定阈值时,判定所述贷款团伙为目标恶意贷款团伙。
第二构建模块,用于基于所有所述目标恶意贷款团伙的团伙特征构建目标数据库。第二构建模块至少包括:
标注单元,用于对每一所述目标恶意贷款团伙进行团伙特征标注,所标注的团伙特征至少包括符合预设相似度阈值的目标特征;
第二构建单元,用于基于每一所述目标恶意贷款团伙的团伙特征构建目标数据库。
需要说明的是:上述实施例提供的目标数据库构建装置在触发目标数据库构建业务时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的一种目标数据库构建装置与实施例一提供的一种目标数据库构建方法的实施例属于同一构思,即该装置是基于该方法的,其具体实现过程详见方法实施例,这里不再赘述。
实施例四
为执行上述实施例二中的一种目标申请人识别方法,本实施例提供一种与之对应的目标申请人识别装置,如图4所示,该装置至少包括:
获取模块,用于获取目标贷款申请人的当前申请信息;
匹配模块,用于将所述当前申请信息与所述目标数据库中的每一目标恶意贷款团伙的团伙特征按照预设的匹配规则进行匹配;
判定模块,用于当所述当前申请信息与所述目标恶意贷款团伙的团伙特征匹配,则判定所述当前贷款申请人为目标申请人。
需要说明的是:上述实施例提供的目标申请人识别装置在目标申请人识别业务时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的一种目标申请人识别装置与实施例二提供的一种目标申请人识别方法的实施例属于同一构思,即该装置是基于该方法的,其具体实现过程详见方法实施例,这里不再赘述。
实施例五
对应上述方法和装置,本实施例提供一种计算机系统,包括:
一个或多个处理器;以及
与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如下操作:
基于当前全量贷款申请人及相应的申请人信息构建申请人关系图谱;
基于预设的疑似团伙特征对所述申请人关系图谱进行切分以获得若干团伙图谱,所述团伙图谱对应于包括若干满足所述疑似团伙特征的申请人的贷款团伙;
根据每一所述团伙谱图中申请人之间的相似度判断所述贷款团伙是否为目标恶意贷款团伙;
基于所有所述目标恶意贷款团伙的团伙特征构建目标数据库。
其中,图5示例性的展示出了计算机系统的架构,具体可以包括处理器1510,视频显示适配器1511,磁盘驱动器1512,输入/输出接口1513,网络接口1514,以及存储器1520。上述处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514,与存储器1520之间可以通过通信总线1530进行通信连接。
其中,处理器1510可以采用通用的CXU(Central Xrocessing Unit,中央处理器)、微处理器、应用专用集成电路(AXXlication SXecific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本申请所提供的技术方案。
存储器1520可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1520可以存储用于控制计算机系统1500运行的操作系统1521,用于控制计算机系统1500的低级别操作的基本输入输出系统(BIOS)。另外,还可以存储网页浏览器1523,数据存储管理系统1524,以及图标字体处理系统1525等等。上述图标字体处理系统1525就可以是本申请实施例中具体实现前述各步骤操作的应用程序。总之,在通过软件或者固件来实现本申请所提供的技术方案时,相关的程序代码保存在存储器1520中,并由处理器1510来调用执行。
输入/输出接口1513用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
网络接口1514用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1530包括一通路,在设备的各个组件(例如处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514,与存储器1520)之间传输信息。
另外,该计算机系统1500还可以从虚拟资源对象领取条件信息数据库1541中获得具体领取条件的信息,以用于进行条件判断,等等。
需要说明的是,尽管上述设备仅示出了处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514,存储器1520,总线1530等,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本申请方案所必需的组件,而不必包含图中所示的全部组件。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,云服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的数据下,即可以理解并实施。
尽管已描述了本发明实施例中的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例中范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种目标数据库构建方法,其特征在于,所述方法至少包括如下步骤:
基于当前全量贷款申请人及相应的申请人信息构建申请人关系图谱;
基于预设的疑似团伙特征对所述申请人关系图谱进行切分以获得若干团伙图谱,所述团伙图谱对应于包括若干满足所述团伙特征的申请人的贷款团伙;
根据每一所述团伙谱图中申请人之间的相似度判断所述贷款团伙是否为目标恶意贷款团伙;
基于所有所述目标恶意贷款团伙的团伙特征构建目标数据库。
2.根据权利要求1所述的方法,其特征在于,所述基于当前全量贷款申请人及相应的申请人信息构建申请人关系图谱,包括如下子步骤:
提取当前全量贷款申请人的申请人信息;
根据所述申请人信息获取任意两个申请人之间的关联关系;
以所述申请人为目标节点,所述申请人之间的关联关系为所述目标节点之间的目标关系构建申请人关系图谱。
3.根据权利要求2所述的方法,其特征在于,所述基于预设的疑似团伙特征对所述申请人关系图谱进行切分以获得团伙图谱,所述团伙图谱对应于包括若干满足所述团伙特征的申请人的贷款团伙,包括如下子步骤:
在所述申请人关系图谱中提取符合同一预设的疑似团伙特征的若干目标关系及其对应的若干目标节点;
以每一所述疑似团伙特征所对应的若干目标节点为单位对所述申请人关系图谱逐层切分以形成若干团伙图谱。
4.根据权利要求2所述的方法,其特征在于,所述根据每一所述团伙谱图中申请人之间的相似度判断所述贷款团伙是否为目标恶意贷款团伙,包括如下子步骤:
提取每一所述团伙谱图中每一申请人的若干目标特征,所述目标特征包括申请人信息中除所述目标关系之外的其余特征;
计算每一所述贷款团伙中所有申请人之间的每一目标特征之间的相似度;
当任一所述目标特征的相似度符合预设相似度阈值和/或所述目标特征符合一定阈值时,判定所述贷款团伙为目标恶意贷款团伙。
5.根据权利要求4所述的方法,其特征在于,所述目标特征包括结构化数据和非结构化数据中的至少一种;
所述结构化数据包括申请地区、申请地址、IP地址、申请设备、密码及申请页面停留时长中的至少一种;
所述非结构化数据包括录入人脸、录入语音、视频背景、音频背景中的至少一种。
6.根据权利要求4所述的方法,其特征在于,所述基于所有所述目标恶意贷款团伙的团伙特征构建目标数据库,包括如下子步骤:
对每一所述目标恶意贷款团伙进行团伙特征标注;
基于每一所述目标恶意贷款团伙的团伙特征构建目标数据库。
7.一种基于权利要求1~6任意一项所述方法的目标申请人识别方法,其特征在于,包括如下步骤:
获取当前贷款申请人的当前申请信息;
将所述当前申请信息与所述目标数据库中的每一目标恶意贷款团伙的团伙特征按照预设的匹配规则进行匹配;
当所述当前申请信息与所述目标恶意贷款团伙的团伙特征匹配,则判定所述当前贷款申请人为目标申请人。
8.一种目标数据库构建装置,其特征在于,所述装置包括:
第一构建模块,用于基于当前全量贷款申请人及相应的申请人信息构建申请人关系图谱;
切分模块,用于基于预设的疑似团伙特征对所述申请人关系图谱进行切分以获得若干团伙图谱,所述团伙图谱对应于包括若干满足所述疑似团伙特征的申请人的贷款团伙;
判断模块,用于根据每一所述团伙谱图中申请人之间的相似度判断所述贷款团伙是否为目标恶意贷款团伙;
第二构建模块,用于基于所有所述目标恶意贷款团伙的团伙特征构建目标数据库。
9.一种目标申请人识别装置,其特征在于,所述装置至少包括:
获取模块,用于获取当前贷款申请人的当前申请信息;
匹配模块,用于将所述当前申请信息与所述目标数据库中的每一目标恶意贷款团伙的团伙特征按照预设的匹配规则进行匹配;
判定模块,用于当所述当前申请信息与所述目标恶意贷款团伙的团伙特征匹配,则判定所述当前贷款申请人为目标申请人。
10.一种计算机系统,其特征在于,包括:
一个或多个处理器;以及
与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如下操作:
基于当前全量贷款申请人及相应的申请人信息构建申请人关系图谱;
基于预设的疑似团伙特征对所述申请人关系图谱进行切分以获得若干团伙图谱,所述团伙图谱对应于包括若干满足所述疑似团伙特征的申请人的贷款团伙;
根据每一所述团伙谱图中申请人之间的相似度判断所述贷款团伙是否为目标恶意贷款团伙;
基于所有所述目标恶意贷款团伙的团伙特征构建目标数据库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010920944.6A CN112231486A (zh) | 2020-09-04 | 2020-09-04 | 目标数据库构建方法、目标申请人识别方法及装置、系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010920944.6A CN112231486A (zh) | 2020-09-04 | 2020-09-04 | 目标数据库构建方法、目标申请人识别方法及装置、系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112231486A true CN112231486A (zh) | 2021-01-15 |
Family
ID=74116050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010920944.6A Pending CN112231486A (zh) | 2020-09-04 | 2020-09-04 | 目标数据库构建方法、目标申请人识别方法及装置、系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112231486A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413707A (zh) * | 2019-07-22 | 2019-11-05 | 百融云创科技股份有限公司 | 互联网中欺诈团伙关系的挖掘与排查方法及其系统 |
CN110930246A (zh) * | 2019-12-04 | 2020-03-27 | 深圳市新国都金服技术有限公司 | 信贷反欺诈识别方法、装置、计算机设备及计算机可读存储介质 |
-
2020
- 2020-09-04 CN CN202010920944.6A patent/CN112231486A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413707A (zh) * | 2019-07-22 | 2019-11-05 | 百融云创科技股份有限公司 | 互联网中欺诈团伙关系的挖掘与排查方法及其系统 |
CN110930246A (zh) * | 2019-12-04 | 2020-03-27 | 深圳市新国都金服技术有限公司 | 信贷反欺诈识别方法、装置、计算机设备及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109271418B (zh) | 可疑团伙识别方法、装置、设备及计算机可读存储介质 | |
CN111369342B (zh) | 基于机器学习的贷款审批方法、装置、设备和存储介质 | |
CN105389722B (zh) | 恶意订单识别方法及装置 | |
CN108734380B (zh) | 风险账户判定方法、装置及计算设备 | |
WO2020199621A1 (zh) | 基于知识图谱检测欺诈 | |
CN110930246A (zh) | 信贷反欺诈识别方法、装置、计算机设备及计算机可读存储介质 | |
WO2021068635A1 (zh) | 信息处理方法、装置及电子设备 | |
CN109299334B (zh) | 一种知识图谱的数据处理方法及装置 | |
WO2020048056A1 (zh) | 一种风险决策方法和装置 | |
TW201926170A (zh) | 目標用戶群體的確定方法及裝置 | |
CN112949767A (zh) | 样本图像增量、图像检测模型训练及图像检测方法 | |
CN115145587A (zh) | 一种产品参数校验方法、装置、电子设备及存储介质 | |
CN110827036A (zh) | 一种欺诈交易的检测方法、装置、设备及存储介质 | |
CN114140221A (zh) | 一种欺诈风险预警方法、装置及设备 | |
CN109711984B (zh) | 一种基于催收的贷前风险监控方法及装置 | |
CN109992960B (zh) | 一种伪造参数检测方法、装置、电子设备及存储介质 | |
CN113706279B (zh) | 欺诈分析方法、装置、电子设备及存储介质 | |
CN112231486A (zh) | 目标数据库构建方法、目标申请人识别方法及装置、系统 | |
CN115758271A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN111339373B (zh) | 一种图谱特征的提取方法、系统、计算机设备和存储介质 | |
CN114781517A (zh) | 风险识别的方法、装置及终端设备 | |
CN110766091B (zh) | 一种套路贷团伙的识别方法及系统 | |
CN113469696A (zh) | 一种用户异常度评估方法、装置及计算机可读存储介质 | |
CN108055661B (zh) | 基于通信网络的电话号码黑名单建立方法及装置 | |
CN113723522B (zh) | 异常用户的识别方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210115 |
|
RJ01 | Rejection of invention patent application after publication |