CN111754340A - 一种基于图数据库的担保网络风险排查系统 - Google Patents

一种基于图数据库的担保网络风险排查系统 Download PDF

Info

Publication number
CN111754340A
CN111754340A CN202010629108.2A CN202010629108A CN111754340A CN 111754340 A CN111754340 A CN 111754340A CN 202010629108 A CN202010629108 A CN 202010629108A CN 111754340 A CN111754340 A CN 111754340A
Authority
CN
China
Prior art keywords
network
node
graph
early warning
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010629108.2A
Other languages
English (en)
Other versions
CN111754340B (zh
Inventor
丁佳
仇钧
韩静
李志刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of Communications Co Ltd
Original Assignee
Bank of Communications Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of Communications Co Ltd filed Critical Bank of Communications Co Ltd
Priority to CN202010629108.2A priority Critical patent/CN111754340B/zh
Publication of CN111754340A publication Critical patent/CN111754340A/zh
Application granted granted Critical
Publication of CN111754340B publication Critical patent/CN111754340B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于图数据库的担保网络风险排查系统,该系统利用图数据库实现对担保网络数据图形化的抽象,通过对图复杂度与图特征到复杂担保网络风险与特殊担保模式风险的映射,实现了这两类担保网络风险的指标化与量化计算,进而可以大批量工程化地获取现有分析方法无法识别的风险点。与现有技术相比,本发明能够使后台风险管理部门更高效、更高质量地完成担保网络风险初步排查工作,辅助人工更快更好地筛选出风险客户清单,实现了大数据量下的非人工的自动、快速、高效的数据处理。

Description

一种基于图数据库的担保网络风险排查系统
技术领域
本发明涉及一种担保网络风险排查系统,尤其是涉及一种基于图数据库的担保网络风险排查系统。
背景技术
风险控制一直是银行运营管理中非常重要的环节,与银行的利润息息相关,而担保类业务又在银行授信业务中的占有很大的比重,因此担保网络风险排查工作是从总行到各个分支机构风险管理部门一项非常重要的常规工作。传统的担保网络风险排查工作采取非现场检查与现场检查相结合的方式,由后台风险管理部门根据借款人与担保人基本信息、授信余额、资金流水、担保关系等数据,按行业风险、经营风险、资金链风险、特殊事件等不同维度,筛选出可能存在违约风险的客户清单。支行网点对风险客户清单进行现场排查,实地约见借款人与担保人的财务负责人、法定代表人或实际控制人进行双向实地核实,尽量还原企业最真实最本色的经营情况、财务情况、担保情况,排查方式十分繁琐,无法对于大批量的数据快速、有效地排查出风险点。
为解决上述问题,目前可采用的方式是利用现有关系型数据库通过写SQL的方式查询出担保网络相关风险点。包括但不限于:根据高风险行业标准、客户PD等级、客户授信余额、净资产、注册资金、担保业务数据等查询出高风险行业客户清单、违约客户清单、担保人在以上清单中的借款人清单、弱势担保与超额担保业务清单(包括借款人与担保人)、授信余额与担保余额同时大于0的身兼二职客户清单。这种方案中列举的排查指标都只限于挖掘借款人本身或与借款人直接关联的担保人信息,而担保网络中的风险往往无法仅从一层担保关系中发现。对于担保网络风险中最长担保链路、多层担保成圈、特殊担保结构(如挎包形网络)、两公司间多层担保路径发现,如果用关系型数据库实现,每多探查一层担保关系意味着对上一层探查结果的全量遍历,而实践中银行大型担保网络规模可至上万个节点,该技术方案的时间复杂度无法支持。
另一种较为常用的解决方式为使用社会网络分析软件(如UCINET、NETDRAW等)进行担保网络风险分析。使用excel表格将担保网络数据构造为矩阵格式,矩阵值为横轴节点对纵轴节点的担保余额,若没有担保业务则为0。将该excel表格导入到UCINET软件中,软件可将担保网络进行可视化展示,并且提供多种网络分析程序,如中心性分析、结构和位置分析、凝聚子群分析等。然而采用矩阵格式构造担保网络,形成的网络中可存储的信息有限,只有节点名称与单一矩阵值,这就意味着每次构造的网络只能针对一个指标进行分析,如上述例子中的担保余额。如果想要再进行授信余额的分析,那么就需要重新构造一个网络矩阵,如果想要将两者结合起来分析则工具无法实现支持。此外,上述软件主要是针对社会网络分析设计,提供的网络分析程序并不能完全适用于担保网络,也没有灵活的个性化分析程序,可以分析的指标有限。通过中心性分析等可以发现一些关键节点或节点对,但对于最长担保链路、多层担保成圈、特殊担保结构(如挎包形网络)、两公司间多层担保路径等风险点,无法依靠程序去量化计算,实现大数据量下的非人工自动分析。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于图数据库的担保网络风险排查系统,该系统可实现担保网络风险的指标化与量化计算,且可大批量工程化获取现有分析方法无法识别的风险点。
本发明的目的可以通过以下技术方案来实现:
一种基于图数据库的担保网络风险排查系统,包括数据导入模块、网络拆分模块、指标计算模块、预警参数配置模块和报告导出模块。
数据导入模块:获取借款人数据、内外部担保人数据、内外部担保业务数据,将每一个借款人视为网络中的一个节点,并将借款人与担保人数据合并去重后导出为图数据库点文件,同时将担保业务数据导出为图数据边文件。所述图数据库点文件包括企业节点和自然人节点文件,所述企业节点包括企业名称、净资产、注册资本、授信余额等字段,所述自然人节点包括证件号、姓名在内的字段数据。所述图数据边文件的边为有向边,该文件由担保人出发指向借款人表示担保关系,所述图数据边文件包括担保人主键、借款人主键、担保类型和担保余额等字段。
网络拆分模块:对借款人数据逐层获取所有与之有联通路径的节点,将这些节点添加至一个担保网络中,并打上网络ID标签,循环执行上述操作,直到所有节点都被分配到一个担保网络中。该模块的具体实现过程包括:
1)将数据导入模块获取的借款人数据生成借款人清单;
2)取其中第一个客户名称,并将其从借款人清单中剔除;
3)调用联通子图算法,获取与该客户联通的联通子图节点清单,并为这些节点打上子图标签,将具有相同标签的节点设于一个联通子图网络;
4)判断联通子图节点清单中的子图元素是否小于三个,若是,则清除子图标签,执行下一步,若不是,则剔除借款人清单中已在打上标签的联通子图清单中的节点,执行下一步;
5)判断借款人清单是否不为空,若是,则执行步骤2),若否,则结束。
指标计算模块:对网络拆分模块中拆分好的担保网络子图进行处理,利用打上网络ID标签的节点作为原始数据,分别计算网络层指标、节点层指标和机构层指标。
进一步地,所述网络层指标的计算方法为:
以网络联通子图为维度统计,循环遍历所有网络拆分模块中拆分出的担保网络清单,在每个担保网络联通子图范围内通过图算法语言量化计算第一图复杂度风险指标与第一图特征风险指标,并将输出结果持久化储存至关系型数据库中。
所述第一图复杂度风险指标包括第一连边总数与有向完全图连边总数比值,第一节点有向寻径的任意两点间路径总数和第一节点有向寻径的最长链条长度,所述第一图特征风险指标包括第一节点两点有向成圈网络数与网络担保余额,第一节点三至六点无向成圈网络数与网络担保余额,第一节点三至六点有向成圈网络数与网络担保余额和第一挎包形网络数与网络担保余额。
所述节点层指标的计算方法为:
在网络层指标的基础上,针对每个借款人节点量化计算第二图复杂度风险指标与第二图特征风险指标,所述第二图复杂度风险指标包括第二节点有向寻径的任意两点间路径总数,第二节点有向寻径的最长链条长度,节点排名和节点介质中心度,所述第二图特征风险指标根据网络层指标计算时得到的节点明细,对比当前计算节点是否在这些图形中,若判断当前计算节点在这些图形中,则获取包含当前计算节点的图形数量。
所述第二图特征风险指标包括第二节点两点有向成圈网络数与网络担保余额,第二节点三至六点无向成圈网络数与网络担保余额,第二节点三至六点有向成圈网络数与网络担保余额和挎包形网络数与网络担保余额。
所述机构层指标的计算方法为:
在网络层指标的基础上,根据每个联通子图归属的机构对网络层指标进行汇总,获取第三图复杂度风险指标和第三图特征风险指标,所述第三图复杂度风险指标包括第二连边总数与有向完全图连边总数比值,第三节点有向寻径的任意两点间路径总数和第三节点有向寻径的最长链条长度,所述第三图特征风险指标包括第三节点两点有向成圈网络数与网络担保余额,第三节点三至六点无向成圈网络数与网络担保余额,第三节点三至六点有向成圈网络数与网络担保余额和第三挎包形网络数与网络担保余额。
预警参数配置模块:提供预警参数配置页面,针对指标计算模块获取的每个风险指标配置对应的预警值及触发预警比例,对超过配置的预警值及比例值的情况触发该指标预警。该模块具体包括:
预警参数配置显示单元;
默认触发预警值配置单元,对所述指标计算模块获取的每一个网络层指标、节点层指标、机构层指标配置默认触发预警值,并在预警参数配置显示单元进行显示;
个性化触发预警值配置单元,选择一家分支机构,初始化所有风险指标默认值,并针对部分风险指标配置个性化触发预警值,并在预警参数配置显示单元进行显示;
触发预警比例配置单元,对每一个网络层指标、节点层指标、机构层指标各自配置一个触发预警指标占所有指标比例,若触发预警指标超过该比例,则视为超比例预警网络、节点、机构;
个性化触发比例配置单元,选择一家机构,初始化网络层、节点层、机构层默认触发预警比例,并针对部分指标层级配置个性化触发比例;
触发单元,与上述各触发配置单元连接,若触发预警的指标超过配置的阈值或比例值,则发出预警,并在预警参数配置显示单元进行显示。
报告导出模块:根据指标计算模块获取的风险指标值与预警参数配置模块配置的预警值,为所有触发预警值的指标打上触发标签;随后根据预警参数配置模块配置的预警比例查询获取所有超比例预警的网络、借款人、机构清单,并导出报告及触发指标明细。
与现有技术相比,本发明具有以下有益效果:
一、本发明利用了图数据库在多层深度关系探查方面、以及大数据量计算方面的优势,应用图数据库实现了对担保网络数据图形化的抽象,通过对图复杂度与图特征到复杂担保网络风险与特殊担保模式风险的映射,实现了这两类担保网络风险的指标化与量化计算,进而可以大批量工程化地获取现有分析方法无法识别的风险点,使得后台风险管理部门可以更高效、更高质量地完成担保网络风险初步排查工作,辅助人工更快更好地筛选出风险客户清单;
二、本发明改进了传统担保网络风险排查中非现场检查的部分,提供了一种简单、方便的系统化排查技术方案,通过对图数据库的应用,计算挖掘担保网络中的图形化特征,使后台风险管理部门担保网络风险排查人员可以从繁琐的表格处理与数据分析工作中解放出来,实现了大数据量下的非人工的自动、快速、高效的数据处理,大大提高了工作效率。
附图说明
图1为实施例中基于图数据库的担保网络风险排查系统的结构示意图;
图2为实施例中网络拆分模块的实现流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
实施例
本发明涉及一种基于图数据库的担保网络风险排查系统,通过授信客户信息以及行内外担保业务与担保人信息构造节点与边文件,导入图数据库;然后从借款人出发通过联通性检测进行担保网络拆分,并为节点打上网络标签;最后批量循环对所有网络、所有借款人节点、所有机构分别进行三个不同层面的指标计算,导出超比例触发指标预警值的网络、节点、机构清单供专人进行现场检查。其中指标预警值与预警比例支持动态配置。具体地,如图1所示,该系统包括:
1、数据导入模块
该模块通过银行内部系统和外部系统获取借款人数据、内外部担保人数据、内外部担保业务数据,并将借款人与担保人数据合并去重后导出为图数据库点文件。导出的图数据库点文件包括企业节点与自然人节点文件,其中企业节点主要涉及企业名称、净资产、注册资本、授信余额等字段,自然人节点主要涉及证件号、姓名等字段;同时将担保业务数据导出为图数据边文件,该边为有向边,由担保人出发指向借款人表示担保关系,边文件主要涉及担保人主键、借款人主键、担保类型、担保余额等字段。
2、网络拆分模块
该模块针对借款人数据逐层探查所有与之有联通路径的节点,将这些节点添加到一个担保网络中并为它们打上网络ID标签;循环执行上述步骤,直到所有节点都被分配到一个担保网络中。具体实现方法如图2所示,即:
步骤1、将数据导入模块得到的借款人数据生成借款人清单(授信客户清单);
步骤2、开始计时(计数器i=0)。
步骤3、取其中第一个客户名称,并将其从借款人清单中剔除。
步骤4、调用联通子图算法,得到与该客户联通的联通子图节点清单,并为这些节点打上子图标签SGi。拥有相同SG标签的节点在一个联通子图网络中。具体地,输入一个客户名称至连通子图算法,基础数据是上述点边数据。联通子图算法是通过广度优先遍历算法,从输入的客户名称对应的节点出发,遍历所有与该节点联通(不考虑担保边的方向,只需要节点之间有担保边就算联通)的节点添加到联通子图中,再从这些联通节点出发逐层遍历所有联通节点,直到下一步找到的所有联通节点都已经在联通子图中。
步骤5、判断联通子图节点清单中的子图元素是否小于3个?若是,则清除子图标签,执行下一步;若不是,则剔除借款人清单中已在SGi联通子图清单中的节点,执行下一步。
步骤6、判断借款人清单是否不为空,若是,则计数器i=i+1,执行步骤3,若否,则结束。
因两两担保的简单担保网络分析意义不强故过滤,所有的联通子图SG0-SGn即为拆分出的担保网络清单。
3、指标计算模块
该模块利用在联通子图网络带有SG标签的节点作为原始数据,用于计算网络层指标、节点层指标和机构层指标。
3.1、计算网络层指标
网络层指标是针对所有网络拆分模块中拆分好的担保网络子图进行分析,将图复杂度与图特征映射为担保网络风险指标,并利用图算法语言(Neo4j的Cypher语言/TigerGraph的GSQL等)量化计算。具体地,循环遍历所有网络拆分模块中拆分出的担保网络清单,在每个担保网络联通子图范围内通过图算法语言量化计算风险指标,并将输出结果持久化储存至关系型数据库中。图复杂度指标与图特征指标分别用于量化复杂担保网络风险与特殊担保模式风险,具体说明如下:
图复杂度风险指标:
1)连边总数/有向完全图连边总数
统计担保网络连通子图节点总数与连边总数,根据节点总数计算有向完全图连边总数,得到连边总数/有向完全图连边总数比例。
2)任意两点间路径总数(有向)
由一个节点出发,按连边方向向外探索所有路径,按始节点-终节点汇总路径数,统计路径数最大值、最小值、平均值。
3)最长链条长度(有向)
由一个节点出发,按连边方向向外探索,寻找最长路径,统计所有节点出发最长路径长度最大值、最小值、平均值。
图特征风险指标:
1)2点成圈(有向)网络数与网络担保余额
由一个节点出发,按连边方向向外探索,寻找经过1个节点后回到自己本身(即互相担保关系)的图结构,统计成圈网络数与网络担保余额。
2)3-6点成圈(无向)网络数与网络担保余额
由一个节点出发,无论连边方向只要两节点相连即向外探索,寻找经过2-5个节点后回到自己本身的图结构,按成圈点数不同分别统计成圈网络数与网络担保余额。
3)3-6点成圈(有向)网络数与网络担保余额
由一个节点出发,按连边方向向外探索,寻找经过2-5个节点后回到自己本身的图结构,按成圈点数不同分别统计成圈网络数与网络担保余额。
4)挎包形网络数与网络担保余额
在2点成圈图(有向)基础上,按连边方向反向向外探索,寻找是否存在自然人节点同时对2成圈节点提供担保,存在则构成挎包型网络结构,统计挎包型网络数与网络担保余额。
3.2、计算节点层指标
计算节点层指标则在网络层指标的基础上,针对每个借款人节点量化计算图复杂度与图特征指标,指标具体说明如下:
图复杂度风险指标:
1)任意两点间路径总数(有向)
由该节点出发,按连边方向向外探索所有路径,按终节点汇总路径数,统计路径数最大值、最小值、平均值。
2)最长链条长度(有向)
由该节点出发,按连边方向向外探索,寻找最长路径,统计最长路径长度。
3)节点排名
对全图调用PageRank图算法计算每个节点的排名,其中排名值分为正向、反向、无向,每个又分别区分带权重与不带权重(担保余额作为权重),共计6个排名值。担保余额是边文件中的初始数据,即一笔担保业务当前剩余未归还金额。
PageRank算法公式如下:
PR(A)=(1-d)+d(PR(T1)/C(T1)+…+PR(Tn)/C(Tn))
其中,PR(i)为i节点的PageRank排名值,C(i)为节点i的对外连边数,T1~Tn为n个指向A的节点,d为消减因子(通常设为0.85)。
正向、反向、无向PageRank算法调用中对外指向的定义分别为担保、被担保、担保或被担保,可将这三类PageRank排名值分别映射为分析节点被担保、担保、综合风险重要度。
4)节点中心度
调用Betweenness Centrality算法(介质中心度算法)计算所有节点的介质中心度(有向)。
介质中心度算通过计算一个连通图中,所有节点对之间的最短路径(有向传播路径);将经过一个节点的最短路径的条数作为该节点的介质中心度。介质中心度可用于发现在担保业务中参与度高的重要中间节点,介质中心度高的节点发生违约易导致多条担保链同时发生违约风险。
图特征风险指标:
1)2点成圈(有向)网络数/网络担保余额
统计包含该节点的2点成圈(有向)网络数与网络担保余额。根据网络层指标计算时得到的2点成圈(有向)网络数与网络担保余额,对比当前计算节点是否在这些图形中,若判断当前计算节点在这些图形中,则得到包含当前计算节点的图形数量。2)3-6点成圈(无向)网络数/网络担保余额
统计包含该节点的3-6点成圈(无向)网络数与网络担保余额。根据网络层指标计算时得到的3-6点成圈(无向)网络数/网络担保余额,对比当前计算节点是否在这些图形中,若判断当前计算节点在这些图形中,则得到包含当前计算节点的图形数量。
3)3-6点成圈(有向)网络数/网络担保余额
统计包含该节点的3-6点成圈(有向)网络数与网络担保余额。根据网络层指标计算时得到的3-6点成圈(有向)网络数/网络担保余额,对比当前计算节点是否在这些图形中,若判断当前计算节点在这些图形中,则得到包含当前计算节点的图形数量。
4)挎包形图数/网络担保余额
统计包含该节点的挎包形网络数与网络担保余额。根据网络层指标计算时得到的挎包形图数/网络担保余额,对比当前计算节点是否在这些图形中,若判断当前计算节点在这些图形中,则得到包含当前计算节点的图形数量。
需要说明的是,在本领域,网络是一个广义的概念,联通子图、圈、挎包图等都为不同类型的网络。
3.2、计算机构层指标
机构层指标的计算,是在网络层指标的基础上,根据网络连通子图归属机构汇总图复杂度与图特征指标,具体指标同网络层指标;机构层指标与网络层指标统计的维度不同,其中,网络层指标是以网络联通子图为维度统计,每个网络联通子图SGi一行数据;而机构层指标会根据每个联通子图归属的机构对网络层指标进行汇总。网络联通子图SGi一行数据指的是指标计算结果,以SGi为维度统计,例如:
Figure BDA0002567750240000091
Figure BDA0002567750240000101
4、预警参数配置模块
该模块用于提供预警参数配置页面,可针对每个风险指标配置对应的预警值,超过该预警值视为触发该指标预警;针对网络层、节点层、机构层指标分别配置超比例预警的比例值,触发预警指标个数占所有对应层级指标比例视为超比例预警。具体地,该模块包括:
预警参数配置显示单元;
默认触发预警值配置单元,该单元针对上述指标计算模块中网络层、节点层、机构层每个风险指标配置默认触发预警值,并可在预警参数配置显示单元进行显示。
个性化触发预警值配置单元,该单元通过选择一家分支机构,初始化所有风险指标默认值,并可针对根据实际应用需求,对部分风险指标配置个性化触发预警值,并在预警参数配置显示单元进行显示。分支机构即银行的省分行、省辖行、直属行等各个层级的分支机构,对应于机构层指标的统计维度。
触发预警比例配置单元,用于针对网络层、节点层、机构层各配置一个触发预警指标占所有指标比例,触发预警指标超过该比例,视为超比例预警网络、节点、机构。
个性化触发比例配置单元,通过选择一家机构,初始化网络层、节点层、机构层默认触发预警比例,可根据实际应用需求,针对部分指标层级配置个性化触发比例。
触发单元,该单元与上述各触发配置单元连接,若触发预警的指标超过配置的阈值,则发出预警,并在预警参数配置显示单元进行显示。
5、报告导出模块
该模块根据指标计算模块计算得到的风险指标值与预警参数配置模块配置的预警值,为所有触发预警值的指标打上触发标签;再根据预警参数配置模块配置的预警比例查询得到所有超比例预警的网络、节点(借款人)、机构清单;提供报告导出功能,导出上述清单与触发指标明细。
本发明利用图数据库在多层深度关系探查方面、以及大数据量计算方面的优势,应用图数据库实现了对担保网络数据图形化的抽象,通过对图复杂度与图特征到复杂担保网络风险与特殊担保模式风险的映射,实现了这两类担保网络风险的指标化与量化计算,进而可以大批量工程化地获取现有分析方法无法识别的风险点,使得后台风险管理部门可以更高效、更高质量地完成担保网络风险初步排查工作,辅助人工更快更好地筛选出风险客户清单,提供更加简单、方便的系统化排查技术方案,使后台风险管理部门担保网络风险排查人员可以从繁琐的表格处理与数据分析工作中解放出来,实现了大数据量下的非人工的自动、快速、高效的数据处理。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的工作人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种基于图数据库的担保网络风险排查系统,其特征在于,包括:
数据导入模块,获取借款人数据、内外部担保人数据、内外部担保业务数据,将每一个借款人视为网络中的一个节点,并将借款人与担保人数据合并去重后导出为图数据库点文件,同时将担保业务数据导出为图数据边文件;
网络拆分模块,对借款人数据逐层获取所有与之有联通路径的节点,将这些节点添加至一个担保网络中,并打上网络ID标签,循环执行上述操作,直到所有节点都被分配到一个担保网络中;
指标计算模块,对网络拆分模块中拆分好的担保网络子图进行处理,利用打上网络ID标签的节点作为原始数据,分别计算网络层指标、节点层指标和机构层指标;
预警参数配置模块,提供预警参数配置页面,针对指标计算模块获取的每个风险指标配置对应的预警值及触发预警比例,对超过配置的预警值及比例值的情况触发该指标预警;
报告导出模块,根据指标计算模块获取的风险指标值与预警参数配置模块配置的预警值,为所有触发预警值的指标打上触发标签;随后根据预警参数配置模块配置的预警比例查询获取所有超比例预警的网络、借款人、机构清单,并导出报告及触发指标明细。
2.根据权利要求1所述的一种基于图数据库的担保网络风险排查系统,其特征在于,所述图数据库点文件包括企业节点和自然人节点文件,所述企业节点包括企业名称、净资产、注册资本、授信余额在内的字段数据,所述自然人节点包括证件号、姓名在内的字段数据。
3.根据权利要求1所述的一种基于图数据库的担保网络风险排查系统,其特征在于,所述图数据边文件的边为有向边,该文件由担保人出发指向借款人表示担保关系,所述图数据边文件包括担保人主键、借款人主键、担保类型和担保余额在内的字段。
4.根据权利要求1所述的一种基于图数据库的担保网络风险排查系统,其特征在于,网络拆分模块的具体实现过程包括:
1)将数据导入模块获取的借款人数据生成借款人清单;
2)取其中第一个客户名称,并将其从借款人清单中剔除;
3)调用联通子图算法,获取与该客户联通的联通子图节点清单,并为这些节点打上子图标签,将具有相同标签的节点设于一个联通子图网络;
4)判断联通子图节点清单中的子图元素是否小于三个,若是,则清除子图标签,执行下一步,若不是,则剔除借款人清单中已在打上标签的联通子图清单中的节点,执行下一步;
5)判断借款人清单是否不为空,若是,则执行步骤2),若否,则结束。
5.根据权利要求1所述的一种基于图数据库的担保网络风险排查系统,其特征在于,所述网络层指标的计算方法为:
以网络联通子图为维度统计,循环遍历所有网络拆分模块中拆分出的担保网络清单,在每个担保网络联通子图范围内通过图算法语言量化计算第一图复杂度风险指标与第一图特征风险指标,并将输出结果持久化储存至关系型数据库中。
6.根据权利要求5所述的一种基于图数据库的担保网络风险排查系统,其特征在于,所述第一图复杂度风险指标包括第一连边总数与有向完全图连边总数比值,第一节点有向寻径的任意两点间路径总数和第一节点有向寻径的最长链条长度,所述第一图特征风险指标包括第一节点两点有向成圈网络数与网络担保余额,第一节点三至六点无向成圈网络数与网络担保余额,第一节点三至六点有向成圈网络数与网络担保余额和第一挎包形网络数与网络担保余额。
7.根据权利要求1所述的一种基于图数据库的担保网络风险排查系统,其特征在于,所述节点层指标的计算方法为:
在网络层指标的基础上,针对每个借款人节点量化计算第二图复杂度风险指标与第二图特征风险指标,所述第二图复杂度风险指标包括第二节点有向寻径的任意两点间路径总数,第二节点有向寻径的最长链条长度,节点排名和节点介质中心度,所述第二图特征风险指标根据网络层指标计算时得到的节点明细,对比当前计算节点是否在这些图形中,若判断当前计算节点在这些图形中,则获取包含当前计算节点的图形数量。
8.根据权利要求7所述的一种基于图数据库的担保网络风险排查系统,其特征在于,所述第二图特征风险指标包括第二节点两点有向成圈网络数与网络担保余额,第二节点三至六点无向成圈网络数与网络担保余额,第二节点三至六点有向成圈网络数与网络担保余额和挎包形网络数与网络担保余额。
9.根据权利要求1所述的一种基于图数据库的担保网络风险排查系统,其特征在于,所述机构层指标的计算方法为:
在网络层指标的基础上,根据每个联通子图归属的机构对网络层指标进行汇总,获取第三图复杂度风险指标和第三图特征风险指标,所述第三图复杂度风险指标包括第二连边总数与有向完全图连边总数比值,第三节点有向寻径的任意两点间路径总数和第三节点有向寻径的最长链条长度,所述第三图特征风险指标包括第三节点两点有向成圈网络数与网络担保余额,第三节点三至六点无向成圈网络数与网络担保余额,第三节点三至六点有向成圈网络数与网络担保余额和第三挎包形网络数与网络担保余额。
10.根据权利要求1所述的一种基于图数据库的担保网络风险排查系统,其特征在于,所述预警参数配置模块包括:
预警参数配置显示单元;
默认触发预警值配置单元,对所述指标计算模块获取的每一个网络层指标、节点层指标、机构层指标配置默认触发预警值,并在预警参数配置显示单元进行显示;
个性化触发预警值配置单元,选择一家分支机构,初始化所有风险指标默认值,并针对部分风险指标配置个性化触发预警值,并在预警参数配置显示单元进行显示;
触发预警比例配置单元,对每一个网络层指标、节点层指标、机构层指标各自配置一个触发预警指标占所有指标比例,若触发预警指标超过该比例,则视为超比例预警网络、节点、机构;
个性化触发比例配置单元,选择一家机构,初始化网络层、节点层、机构层默认触发预警比例,并针对部分指标层级配置个性化触发比例;
触发单元,与上述各触发配置单元连接,若触发预警的指标超过配置的阈值或比例值,则发出预警,并在预警参数配置显示单元进行显示。
CN202010629108.2A 2020-07-03 2020-07-03 一种基于图数据库的担保网络风险排查系统 Active CN111754340B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010629108.2A CN111754340B (zh) 2020-07-03 2020-07-03 一种基于图数据库的担保网络风险排查系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010629108.2A CN111754340B (zh) 2020-07-03 2020-07-03 一种基于图数据库的担保网络风险排查系统

Publications (2)

Publication Number Publication Date
CN111754340A true CN111754340A (zh) 2020-10-09
CN111754340B CN111754340B (zh) 2022-06-21

Family

ID=72678817

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010629108.2A Active CN111754340B (zh) 2020-07-03 2020-07-03 一种基于图数据库的担保网络风险排查系统

Country Status (1)

Country Link
CN (1) CN111754340B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112508709A (zh) * 2020-10-21 2021-03-16 杭州衡泰软件有限公司 一种基于网络结构的信用风险传染监控方法
CN112528038A (zh) * 2020-12-10 2021-03-19 交通银行股份有限公司 基于多层图结构担保联通体唯一性识别方法、设备及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933621A (zh) * 2015-06-19 2015-09-23 天睿信科技术(北京)有限公司 一种担保圈的大数据分析系统和方法
CN108062639A (zh) * 2018-02-23 2018-05-22 大连火眼征信管理有限公司 一种风险传播模型及适用于该模型的算法
CN109086317A (zh) * 2018-06-28 2018-12-25 招联消费金融有限公司 风险控制方法和相关装置
CN109816245A (zh) * 2019-01-25 2019-05-28 北京海致星图科技有限公司 用于对公授信客户风险预警的风险传导评估系统及方法
CN110209826A (zh) * 2018-02-06 2019-09-06 武汉观图信息科技有限公司 一种面向银行风险控制的金融图谱构建与分析方法
CN110390465A (zh) * 2019-06-18 2019-10-29 深圳壹账通智能科技有限公司 业务数据的风控分析处理方法、装置和计算机设备
CN110569369A (zh) * 2019-09-16 2019-12-13 神州数码融信软件有限公司 银行金融系统知识图谱的生成方法及装置、应用方法及装置
CN111309824A (zh) * 2020-02-18 2020-06-19 中国工商银行股份有限公司 实体关系图谱显示方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933621A (zh) * 2015-06-19 2015-09-23 天睿信科技术(北京)有限公司 一种担保圈的大数据分析系统和方法
CN110209826A (zh) * 2018-02-06 2019-09-06 武汉观图信息科技有限公司 一种面向银行风险控制的金融图谱构建与分析方法
CN108062639A (zh) * 2018-02-23 2018-05-22 大连火眼征信管理有限公司 一种风险传播模型及适用于该模型的算法
CN109086317A (zh) * 2018-06-28 2018-12-25 招联消费金融有限公司 风险控制方法和相关装置
CN109816245A (zh) * 2019-01-25 2019-05-28 北京海致星图科技有限公司 用于对公授信客户风险预警的风险传导评估系统及方法
CN110390465A (zh) * 2019-06-18 2019-10-29 深圳壹账通智能科技有限公司 业务数据的风控分析处理方法、装置和计算机设备
CN110569369A (zh) * 2019-09-16 2019-12-13 神州数码融信软件有限公司 银行金融系统知识图谱的生成方法及装置、应用方法及装置
CN111309824A (zh) * 2020-02-18 2020-06-19 中国工商银行股份有限公司 实体关系图谱显示方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112508709A (zh) * 2020-10-21 2021-03-16 杭州衡泰软件有限公司 一种基于网络结构的信用风险传染监控方法
CN112528038A (zh) * 2020-12-10 2021-03-19 交通银行股份有限公司 基于多层图结构担保联通体唯一性识别方法、设备及介质
CN112528038B (zh) * 2020-12-10 2022-07-05 交通银行股份有限公司 基于多层图结构担保联通体唯一性识别方法、设备及介质

Also Published As

Publication number Publication date
CN111754340B (zh) 2022-06-21

Similar Documents

Publication Publication Date Title
US11928733B2 (en) Systems and user interfaces for holistic, data-driven investigation of bad actor behavior based on clustering and scoring of related data
Rowe et al. Automated social hierarchy detection through email network analysis
CN111754340B (zh) 一种基于图数据库的担保网络风险排查系统
CN107229619A (zh) 互联网业务链路调用情况的统计、展示方法及装置
CN111861595A (zh) 一种基于知识图谱的循环开票风险识别方法
CN112419030B (zh) 财务舞弊风险评估的方法、系统及设备
CN111833182B (zh) 识别风险对象的方法和装置
Plaksiy et al. Applying big data technologies to detect cases of money laundering and counter financing of terrorism
Ampatzoglou et al. An embedded multiple-case study on OSS design quality assessment across domains
Niu et al. iConViz: Interactive visual exploration of the default contagion risk of networked-guarantee loans
Lin The AI Revolution in Financial Services: Emerging Methods for Fraud Detection and Prevention
CN104933621A (zh) 一种担保圈的大数据分析系统和方法
CN117971606A (zh) 基于ElasticSearch的日志管理系统及方法
CN116245580A (zh) 数据资产价值获取方法、装置、设备、介质和程序产品
CN206497498U (zh) 一种基于企业征信业务的信用评级信息数据集成系统
M'Baba et al. Blockchain logging for process mining: a systematic review
CN112508119A (zh) 特征挖掘组合方法、装置、设备及计算机可读存储介质
CN113240516A (zh) 基于区块链的银行纳税信息处理方法及装置
US11776078B2 (en) Systems and methods for generating strategic competitive intelligence data relevant for an entity
CN117217634A (zh) 一种基于复杂网络的企业合作社区发现方法
Hou Financial Abnormal Data Detection System Based on Reinforcement Learning
Sotiropoulos et al. ADAMM: Anomaly Detection of Attributed Multi-graphs with Metadata: A Unified Neural Network Approach
CN116308158B (zh) 一种国有资产监督管理系统
CN114036174B (zh) 数据更新方法、装置、设备及存储介质
CN112925847B (zh) 一种针对区块链的数据处理与网络分析工具

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant