CN114626701A - 社区风险预警方法、装置、计算机设备和存储介质 - Google Patents

社区风险预警方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN114626701A
CN114626701A CN202210193122.1A CN202210193122A CN114626701A CN 114626701 A CN114626701 A CN 114626701A CN 202210193122 A CN202210193122 A CN 202210193122A CN 114626701 A CN114626701 A CN 114626701A
Authority
CN
China
Prior art keywords
risk
community
loss
target
overdue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210193122.1A
Other languages
English (en)
Inventor
张闯
吕飞鹏
李科定
黎景光
张睿为
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202210193122.1A priority Critical patent/CN114626701A/zh
Publication of CN114626701A publication Critical patent/CN114626701A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及大数据智能分析技术领域,提供一种社区风险预警方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取目标对象的目标对象数据,目标对象数据包括资源归还相关信息、对象社会关系信息和资源流转信息;基于资源归还相关信息进行风险预测,从目标对象中确定出逾期风险对象、失联风险对象和失信风险对象;基于对象社会关系信息和资源流转信息,对目标对象进行社区划分,得到多个目标社区;对于每个目标社区,根据各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个,对目标社区进行预警。采用本方法能够提高风险预测准确性,有效地预测团体欺诈行为、失联情形、恶意拖欠资源行为。

Description

社区风险预警方法、装置、计算机设备和存储介质
技术领域
本申请涉及大数据智能分析技术领域,特别是涉及一种社区风险预警方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着大数据技术的发展,出现了应用于资源归还催收场景的风险预警技术,能够及时识别催收对象的逾期风险,比如账龄滚动风险。
目前资源归还催收场景下的风险预警技术主要是基于单个催收对象的数据进行风险预测,即获取单个催收对象的风险指标,比如账龄滚动风险指标,根据与单个催收对象相关的风险指标对单个催收对象进行预测,监控单个催收对象的逾期风险,若发现逾期风险高,则对催收对象进行预警,以及时采取相应的风险管控措施。这种技术的风险预测准确性不高,已经不能适应于日益复杂的风险情形,特别是针对团体欺诈行为。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高风险预测准确性的社区风险预警方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种社区风险预警方法。所述方法包括:
获取目标对象的目标对象数据,所述目标对象数据包括资源归还相关信息、对象社会关系信息和资源流转信息;
基于所述资源归还相关信息进行风险预测,得到多个风险维度的风险评分,基于所述多个风险维度的风险评分,从所述目标对象中确定出逾期风险对象、失联风险对象和失信风险对象;
基于所述对象社会关系信息和资源流转信息,确定各社区节点之间的边权重,基于各社区节点之间的边权重,对所述目标对象进行社区划分,得到多个目标社区,所述社区节点表征对目标对象进行社区划分过程中的节点;
对于每个目标社区,根据各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个,对所述目标社区进行预警。
第二方面,本申请还提供了一种社区风险预警装置。所述装置包括:
获取模块,用于获取目标对象的目标对象数据,所述目标对象数据包括资源归还相关信息、对象社会关系信息和资源流转信息;
预测模块,用于基于所述资源归还相关信息进行风险预测,得到多个风险维度的风险评分,基于所述多个风险维度的风险评分,从所述目标对象中确定出逾期风险对象、失联风险对象和失信风险对象;
划分模块,用于基于所述对象社会关系信息和资源流转信息,确定各社区节点之间的边权重,基于各社区节点之间的边权重,对所述目标对象进行社区划分,得到多个目标社区,所述社区节点表征对目标对象进行社区划分过程中的节点;
预警模块,用于对于每个目标社区,根据各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个,对所述目标社区进行预警。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取目标对象的目标对象数据,所述目标对象数据包括资源归还相关信息、对象社会关系信息和资源流转信息;
基于所述资源归还相关信息进行风险预测,得到多个风险维度的风险评分,基于所述多个风险维度的风险评分,从所述目标对象中确定出逾期风险对象、失联风险对象和失信风险对象;
基于所述对象社会关系信息和资源流转信息,确定各社区节点之间的边权重,基于各社区节点之间的边权重,对所述目标对象进行社区划分,得到多个目标社区,所述社区节点表征对目标对象进行社区划分过程中的节点;
对于每个目标社区,根据各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个,对所述目标社区进行预警。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取目标对象的目标对象数据,所述目标对象数据包括资源归还相关信息、对象社会关系信息和资源流转信息;
基于所述资源归还相关信息进行风险预测,得到多个风险维度的风险评分,基于所述多个风险维度的风险评分,从所述目标对象中确定出逾期风险对象、失联风险对象和失信风险对象;
基于所述对象社会关系信息和资源流转信息,确定各社区节点之间的边权重,基于各社区节点之间的边权重,对所述目标对象进行社区划分,得到多个目标社区,所述社区节点表征对目标对象进行社区划分过程中的节点;
对于每个目标社区,根据各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个,对所述目标社区进行预警。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取目标对象的目标对象数据,所述目标对象数据包括资源归还相关信息、对象社会关系信息和资源流转信息;
基于所述资源归还相关信息进行风险预测,得到多个风险维度的风险评分,基于所述多个风险维度的风险评分,从所述目标对象中确定出逾期风险对象、失联风险对象和失信风险对象;
基于所述对象社会关系信息和资源流转信息,确定各社区节点之间的边权重,基于各社区节点之间的边权重,对所述目标对象进行社区划分,得到多个目标社区,所述社区节点表征对目标对象进行社区划分过程中的节点;
对于每个目标社区,根据各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个,对所述目标社区进行预警。
上述社区风险预警方法、装置、计算机设备、存储介质和计算机程序产品,通过获取目标对象的包括资源归还相关信息、对象社会关系信息和资源流转信息的目标对象数据,不仅基于目标对象的资源归还相关信息从单一维度对目标对象进行风险预测,得到多个风险维度的风险评分,基于多个风险维度的风险评分,确定出逾期风险对象、失联风险对象和失信风险对象;还基于目标对象的对象社会关系信息和资源流转信息,确定各社区节点之间的边权重,基于各社区节点之间的边权重,对目标对象进行社区划分,得到多个目标社区,对于每个目标社区,根据各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个,对目标社区进行预警,即利用风险在目标社区的传导实现了从团体维度以社区为单位对目标对象进行风险预测,提供了团体逾期风险、失联风险、失信风险的预测方式,因此,能够提高对目标对象进行风险预测的准确性。并且,通过在同一平台对逾期风险、失联风险和失信风险进行监控,及时识别目标对象的风险,能够有效地对团体欺诈行为、失联行为和恶意拖欠资源行为进行预警,以控制风险的传导,并提供了失联修复的方法。
附图说明
图1为一个实施例中社区风险预警方法的应用环境图;
图2为一个实施例中社区风险预警方法的流程示意图;
图3为一个实施例中社区划分步骤的流程示意图;
图4为另一个实施例中社区风险预警方法的流程示意图;
图5A为一个实施例中社区划分步骤的结构示意图;
图5B是一个实施例中社区划分步骤的结构示意图;
图6是一个实施例中知识图谱的示意图;
图7为一个实施例中社区风险预警装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的社区风险预警方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。终端102可单独执行本申请实施例提供的社区风险预警方法,终端102和服务器104也可协同执行本申请实施例提供的社区风险预警方法。
当终端102单独执行社区风险预警方法时,终端102获取目标对象的目标对象数据,目标对象数据包括资源归还相关信息、对象社会关系信息和资源流转信息;基于资源归还相关信息进行风险预测,得到多个风险维度的风险评分,基于多个风险维度的风险评分,从目标对象中确定出逾期风险对象、失联风险对象和失信风险对象;基于对象社会关系信息和资源流转信息,确定各社区节点之间的边权重,基于各社区节点之间的边权重,对目标对象进行社区划分,得到多个目标社区,社区节点表征对目标对象进行社区划分过程中的节点;对于每个目标社区,根据各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个,对目标社区进行预警。
当终端102和服务器104协同执行社区风险预警方法时,终端102获取目标对象的目标对象数据,目标对象数据包括资源归还相关信息、对象社会关系信息和资源流转信息,并将目标对象数据发送至服务器104。服务器104基于资源归还相关信息进行风险预测,得到多个风险维度的风险评分,基于多个风险维度的风险评分,从目标对象中确定出逾期风险对象、失联风险对象和失信风险对象;基于对象社会关系信息和资源流转信息,确定各社区节点之间的边权重,基于各社区节点之间的边权重,对目标对象进行社区划分,得到多个目标社区,社区节点表征对目标对象进行社区划分过程中的节点;对于每个目标社区,根据各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个,对目标社区进行预警。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
应当理解的是,本申请实施例中使用的“第一”、“第二”、“第三”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。除非上下文另外清楚地指出,否则单数形式的“一个”、“一”或者“该”等类似词语也不表示数量限制,而是表示存在至少一个。
在一个实施例中,如图2所示,提供了一种社区风险预警方法,该方法可以由终端或服务器单独执行,也可以由终端和服务器协同执行。本申请实施例以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤202,获取目标对象的目标对象数据,目标对象数据包括资源归还相关信息、对象社会关系信息和资源流转信息。
其中,目标对象指的是从目标平台借用资源的用户、团体、组织或企业等,例如在信用卡催收业务场景中,目标对象可以是持有信用卡的目标用户。目标对象数据指的是与目标对象的属性和行为有关的数据,包括资源归还相关信息、对象社会关系信息和资源流转信息。
资源归还相关信息包括对象属性信息、对象信用信息、借用资源信息、资源使用记录、按期归还资源记录、逾期归还资源记录、资源归还催收记录等。例如在信用卡催收业务场景中,对象属性信息可以为持有信用卡的目标用户的相关属性信息,对象信用信息可以为征信机构出具的个人征信信息,借用资源信息可以为用户所持有的信用卡的类型、额度等,资源使用记录可以为持有信用卡的目标用户使用信用卡的消费记录,按期归还资源记录可以为持有信用卡的目标用户还款的历史记录,逾期归还资源记录可以为持有信用卡的目标用户逾期未还款的历史记录,资源归还催收记录可以为持有信用卡的目标用户收到催收通知的历史记录。
需要说明的是,在其他的业务场景中,对象属性信息可以是企业或团体的属性信息,对象信用信息可以为企业或团体的征信信息,借用资源信息可以为企业或团体的资源借用额度等,资源使用记录可以为企业或团体的消费记录,按期归还资源记录可以为企业或团体还款的历史记录,逾期归还资源记录可以为企业或团体逾期未还款的历史记录,资源归还催收记录可以为企业或团体收到催收通知的历史记录。
对象社会关系信息包括与目标对象具有社会关系的其他的对象信息,比如目标对象借用资源的担保对象、共同借用方、共同归还方,以及与目标对象具有资源关联关系的对象等。
资源流转信息包括资源流转数量和资源流转频率。例如在信用卡催收业务场景中,资源流转信息可以为与目标对象具有社会关系的持有信用卡的对象与目标对象之间的交易流水。在其他业务场景中,资源流程信息也可以是不同企业或团体间的交易流水。
具体地,终端基于目标对象的资源借用申请信息和资源使用情况,获取每个目标对象的资源归还相关信息;基于对象的社会关系网络、资源借用申请信息和资源关联关系,获取每个目标对象的对象社会关系;并基于目标对象的对象社会关系和资源流转记录,获取每个目标对象的资源流转信息。
在一个实施例中,终端在基于资源归还相关信息进行风险预测之前,该方法还包括:终端将白名单对象从目标对象中剔除。其中,白名单对象是预先设置的为风险较低的对象,可以包括合作企业、享有宽限权的企业或个人等。
步骤204,基于资源归还相关信息进行风险预测,得到多个风险维度的风险评分,基于多个风险维度的风险评分,从目标对象中确定出逾期风险对象、失联风险对象和失信风险对象。
其中,逾期风险对象指的是超过规定期限未归还资源的对象,例如规定期限为30天,则将从借用资源之日起,30天内未归还资源的目标对象确定为逾期风险对象。失联风险对象指的是逾期风险对象中失去联系方式可能性大的对象,例如将逾期后预设周期(比如30天)内,催收次数大于等于预设次数(比如6次),催收天数大于等于预设天数(比如5天)均未联系上的目标对象,确定为失联风险对象。失信风险对象指的是逾期风险对象中具有归还资源能力的对象。风险评分是对目标对象进行风险预测的结果,包括多个风险维度的风险评分,例如逾期风险评分、失联风险评分和失信风险评分。
具体地,终端基于资源归还相关信息,通过不同的机器学习模型分别对目标对象进行逾期滚动风险预测、失联风险预测和失信风险预测,得到多个风险维度的风险评分,基于多个风险维度的风险评分,从目标对象中分别确定出逾期风险对象、失联风险对象和失信风险对象。
步骤206,基于对象社会关系信息和资源流转信息,确定各社区节点之间的边权重,基于各社区节点之间的边权重,对目标对象进行社区划分,得到多个目标社区,社区节点表征对目标对象进行社区划分过程中的节点。
其中,社区节点为对目标对象进行社区划分过程中的节点。在对目标对象进行社区划分之前,将每个目标对象作为一个初始的社区节点,即社区节点均为未合并的节点;在对目标对象进行社区划分过程中,社区节点包括合并后的节点和未合并的节点(初始的社区节点中的一部分)。
边权重为社区节点和其可以直接到达的社区节点之间边的权重,表征社区节点与其相邻社区节点之间的密切关系。在对目标对象进行社区划分之后,随着社区节点的更新,更新后的各个社区节点之间的边权重也随之更新。
具体地,终端可预先将每个目标对象均作为一个初始的社区节点,进而基于对象社会关系信息和资源流转信息计算各社区节点之间的边权重,基于各社区节点之间的边权重,对边权重大的社区节点,也就是联系紧密的社区节点进行合并,不断重复迭代,直至最后划分得到多个目标社区。
在一个实施例中,终端可基于每个目标对象各自所对应的对象社会关系信息和资源流转信息,对一些列的目标对象进行聚类得到多个簇,其中,每个簇就可作为一个目标社区。
步骤208,对于每个目标社区,根据各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个,对目标社区进行预警。
其中,逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率分别是目标社区内存在逾期风险对象、失联风险对象和失信风险对象的概率。
具体地,对于每个目标社区,终端获取风险对象覆盖率阈值,风险对象覆盖率阈值包括逾期风险对象覆盖率阈值、失联风险对象覆盖率阈值和失信风险对象覆盖率阈值;若各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个超过对应的风险对象覆盖率阈值,则对目标社区进行预警。
上述社区风险预警方法中,通过获取目标对象的包括资源归还相关信息、对象社会关系信息和资源流转信息的目标对象数据,不仅基于目标对象的资源归还相关信息从单一维度对目标对象进行风险预测,得到多个风险维度的风险评分,基于多个风险维度的风险评分,确定出逾期风险对象、失联风险对象和失信风险对象;还基于目标对象的对象社会关系信息和资源流转信息,确定各社区节点之间的边权重,基于各社区节点之间的边权重,对目标对象进行社区划分,得到多个目标社区,对于每个目标社区,根据各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个,对目标社区进行预警,即利用风险在目标社区的传导实现了从团体维度以社区为单位对目标对象进行风险预测,提供了团体逾期风险、失联风险、失信风险的预测方式,因此,能够提高对目标对象进行风险预测的准确性。并且,通过在同一平台对逾期风险、失联风险和失信风险进行监控,及时识别目标对象的风险,能够有效地对团体欺诈行为、失联行为和恶意拖欠资源进行预警,以控制风险的传导,并提供了失联修复的方法。
在一个实施例中,如图3所示,基于对象社会关系信息和资源流转信息,确定各社区节点之间的边权重,基于各社区节点之间的边权重,对目标对象进行社区划分,得到多个目标社区,包括:
步骤302,将每一个目标对象作为一个初始的社区节点。
其中,初始的社区节点,也可以叫做顶点,属于社区发现算法的处理对象。社区发现算法用来发现网络中的社区结构,可以看做是一种聚类算法,复杂网络是复杂系统的抽象,网络中的节点表示系统中的个体,边表示个体之间的关系。目前已有很多不同类型的社区发现算法,例如LPA、SLPA、BMLPA、Louvain,不同的社区发现算法将得到不同的社区划分结果,本申请实施例对此不做限定。
具体地,终端将每一个目标对象作为一个初始的社区节点,此时,所有的初始的社区节点形成一个社区网络。
步骤304,基于目标对象的对象社会关系信息和资源流转信息,确定各社区节点之间的边权重。
边权重用于表示社区之间的对象社会关系和资源流转的密切关系,社区与社区之间的边权重越高,表示社区与社区之间的对象社会关系和资源流转越密切。
具体地,终端基于目标对象的对象社会关系信息,确定对象社会关系得分;基于目标对象的资源流转信息,确定资源流转数量得分和资源流转频率得分;对对象社会关系得分、资源流转数量得分和资源流转频率得分进行加权求和,得到各社区节点之间的边权重。
进一步地,终端基于目标对象的对象社会关系信息,确定对象社会关系得分,包括:终端将与目标对象有联系,且联系紧密的对象(比如,目标对象借用资源的担保方、共同借用方、共同归还方等)相关的对象社会关系得分,确定为高分;将与目标对象有联系,但联系疏远的对象(比如,目标对象的合作方)相关的对象社会关系得分,确定为低分,这样就确定了目标对象的对象社会关系得分。
进一步地,终端基于目标对象的资源流转信息,确定资源流转数量得分和资源流转频率得分,包括:终端按照目标对象的资源流转数量的由大到小,确定资源流转数量得分为从高到低;终端按照目标对象的资源流转频率的由高到低,确定资源流转频率得分为从高到低。
步骤306,依次将每个社区节点和与其相邻的社区节点进行合并,基于当前社区节点和与其相邻的社区节点之间的边权重,计算合并后的社区节点的模块度增益。
其中,模块度指的是社区网络的模块度,定义为社区网络所包含的所有社区的边权重差值的和,该边权重差值为社区内部的边权重和占比与社区内部的度和占比的差值。其中,社区内部的边权重和占比指的是社区内部的边权重之和占社区网络的边权重之和的比值,社区内部的度和占比指的是社区内部的度之和占社区网络的度之和的比值。
度指的是社区节点的度,定义为与社区节点相连的边权重之和。
以社区网络中包括社区节点i、社区节点j和社区节点k为例,定义社区节点i和社区节点j之间边权重为0,社区节点i和社区节点k之间边权重为50,社区节点j和社区节点k之间边权重为10,则社区节点i的度是50,社区节点j的度是10,社区节点k的度是60。此时,社区节点i、社区节点j和社区节点k内部的边权重之和均为0,因此社区节点i、社区节点j和社区节点k内部的边权重和占比均为0;社区节点i内部的度和占比为0.42,社区节点j内部的度和占比为0.08,社区节点k内部的度和占比为0.5。
模块度增益指的是合并后的模块度与合并前的模块度的差。
具体地,终端基于所有的初始的社区节点之间的边权重,计算初始的模块度;依次将每个初始的社区节点和与其相邻的社区节点逐一进行合并,得到进行合并的当前社区节点内部的边权重、以及进行合并的当前社区节点和其他社区节点之间的边权重,基于进行合并的当前社区节点内部的边权重、以及进行合并的当前社区节点和其他社区节点之间的边权重,计算合并后的模块度;并根据合并后的模块度和初始的模块度,计算模块度增益。
以将社区网络中的社区节点k合并到社区节点i为例。
终端计算初始的模块度,该模块度定义为社区网络所包含的所有社区的边权重差值的和,该边权重差值为社区内部的边权重和占比与社区内部的度和占比平方的差值,即模块度的计算公式为:模块度=(社区i内部的边权重和占比-社区i内部的度和占比^2)+(社区j内部的边权重和占比-社区j内部的度和占比^2)+(社区k内部的边权重和占比-社区k内部的度和占比^2),得到初始的模块度为-0.25。
当终端将社区节点k合并到社区节点i之后,则合并后的社区网络中包括社区节点ik和社区节点j,此时社区节点ik和社区节点j之间边权重为10,社区节点ik内部的边权重之和为50,社区节点j内部的边权重之和仍然为0,社区节点ik的度是110,社区节点j的度是10。此时,社区节点ik内部的边权重和占比为0.83,社区节点j内部的边权重和占比仍然为0;社区节点ik内部的度和占比为0.92,社区节点j内部的度和占比仍然为0.08。
终端计算合并后的模块度,根据上述模块度的计算公式,得到合并后的模块度为-0.0228,模块度增益为0.2272。
步骤308,若合并后的社区节点的模块度增益大于零,则将合并后的社区节点作为一个新的社区节点。
其中,新的社区节点指的是包括了进行合并的两个社区节点的社区节点。
具体地,若合并后的社区节点的模块度增益大于零,则表示此时可以进行合并,终端将合并后的两个社区节点作为一个新的社区节点,将新的社区节点加入社区网络中,并将进行合并的两个社区节点的社区节点从社区网络中排除;若合并后的社区节点的模块度增益不大于零,则表示此时不可以合并,算法达到稳定状态,社区节点的划分达到稳定状态,终端不执行将合并后的两个社区节点作为一个新的社区节点步骤。
以将社区网络中的社区节点k合并到社区节点i为例。由于社区节点k与社区节点i合并后的模块度增益为0.2272,大于零,因此可以将合并后的社区节点ik作为一个新的社区节点。
步骤310,基于新的社区节点返回依次将每个社区节点和与其相邻的社区节点进行合并步骤继续执行,直至达到社区划分停止条件时停止。
其中,社区划分停止条件指的是合并后的社区节点的模块度增益不大于零。
具体地,终端基于新的社区节点,更新社区网络,返回依次将每个社区节点和与其相邻的社区节点进行合并步骤继续执行,若合并后的社区节点的模块度增益大于零,则将合并后的社区节点作为一个新的社区节点;若达到社区划分停止条件,即合并后的社区节点的模块度增益不大于零,则停止执行。
步骤312,基于最终社区划分得到的多个社区节点,得到多个目标社区。
具体地,社区划分完成后,终端将最终社区划分得到的多个社区节点中的每个社区节点作为一个目标社区,从而得到多个目标社区。
本实施例中,根据目标对象的对象社会关系信息和资源流转信息,确定各社区节点之间的边权重,通过确定的各社区节点之间的边权重进行社区划分,能够将目标对象划分为不同的社区,得到多个目标社区;并且,根据所确定的各社区节点之间的边权重,能够检测到多个目标社区中具有密切对象社会关系和资源流转的社区。此外,与其他基于模块度和模块度增益算法不同的是,本申请中的计算速度很快,尤其是对一些节点多边少的网络,进行聚类的效果特别明显,因此能够提高风险预测的速度。
在一个实施例中,基于资源归还相关信息进行风险预测,得到多个风险维度的风险评分,基于多个风险维度的风险评分,从目标对象中确定出逾期风险对象、失联风险对象和失信风险对象,包括:获取资源归还相关信息中的第一目标数据,基于滚动预测模型和第一目标数据对目标对象进行逾期滚动风险预测,得到逾期风险评分,基于逾期风险评分,得到逾期滚动风险级别,基于逾期滚动风险级别,确定出逾期风险对象;获取资源归还相关信息中的第二目标数据,基于失联预测模型和第二目标数据对目标对象进行失联风险预测,得到失联风险评分,基于失联风险评分,得到失联风险级别,基于失联风险级别,确定出失联风险对象;获取资源归还相关信息中的第三目标数据,基于失信预测模型和第三目标数据对目标对象进行失信风险预测,得到失信风险评分,基于失信风险评分,得到失信风险级别,基于失信风险级别,确定出失信风险对象。
其中,滚动预测模型、失联预测模型和失信预测模型均是数学模型,例如可以是机器学习模型。
滚动预测模型用于预测每一账龄段的目标对象迁徙到下一账龄段的风险,包括M0-M1模型、M1-M2模型、M2-M3模型、M3-M4模型等。以M0-M1模型为例,M0-M1模型表示当前目标对象的账龄为M0,即目标对象是正常对象,预测该目标对象下个月会变成M1账龄的可能性。滚动预测模型的输入数据为第一目标范围内的第一目标数据,包括对象属性信息、对象收入信息、对象信用信息、借用资源信息、资源使用记录、按期归还资源记录、逾期归还资源记录、资源归还催收记录;输出数据为逾期风险评分。逾期风险评分是将第一目标范围内的第一目标数据按区间映射不同分值后,将分值进行统计(例如求和、筛选数据后求和、求平均值、求最值)得到的一个分值。
在其中一个实施例中,基于滚动预测模型和第一目标数据对目标对象进行逾期滚动风险预测,得到逾期滚动风险级别,包括:确定与滚动预测模型对应的多个第一变量,基于第一目标数据确定与各个第一变量分别对应的第一变量值,通过滚动预测模型,按照各第一变量值分别所属的区间,将各第一变量值映射为不同的第一分值,并根据第一分值的和得到逾期风险评分,基于逾期风险评分,确定逾期滚动风险级别。
其中,第一变量为第一目标数据的子类别的变量,例如当第一目标数据的子类别为逾期归还资源记录时,逾期归还资源记录对应的第一变量可以为当前逾期资源总量占资源借用总量的比例,也可以为最近一年实际归还资源总量占应当归还资源总量的比例的最大值;又例如当第一目标数据的子类别为资源使用记录时,资源使用记录对应的第一变量可以为资源的使用率大于80%的目标对象数量占所有目标对象数量的比例。第一变量值是将第一变量赋值后的数值,例如当第一变量为当前逾期资源总量占资源借用总量的比例时,第一变量值可以为0到1中的任意一个数值。第一变量值所属的区间指的是第一变量值对应的数值区间,例如当第一变量值为0到1中的任意一个数值时,第一变量值所属的区间可以是(0.5,0.8),具体的区间划分可以很多,本实施例对此不作限定。第一分值指的是按照逾期风险评分规则,根据第一变量值所属的区间,确定的一个分数值,第一分值可以为正整数、负整数或零,例如当第一变量值所属的区间是(0.5,0.8)时,第一分值为59分。逾期风险评分为第一分值的和,即为输入滚动预测模型的所有第一变量对应的第一分值的和。
逾期滚动风险级别是目标对象逾期的风险级别,逾期滚动风险级别可以包括极高风险、高风险、中风险、低风险和极低风险。比如,以滚动预测模型为M0-M1模型为例。定义不大于380分的逾期风险评分对应的逾期滚动风险级别为极高风险,大于380分且不小于542分的逾期风险评分对应的逾期滚动风险级别为高风险,大于542分且不小于667分的逾期风险评分对应的逾期滚动风险级别为中风险,大于667分且不小于737分的逾期风险评分对应的逾期滚动风险级别为低风险,不小于737分的逾期风险评分对应的逾期滚动风险级别为极低风险。例如输入账龄为M0的目标对象的多个第一变量分别对应的第一变量值到滚动预测模型,得到逾期风险评分是591分,则该目标对象由M0逾期滚动到M1的逾期滚动风险级别是中风险。
失联预测模型用于在目标对象逾期未归还资源时,对于能联系到的目标对象预测其未来失联的风险。失联预测模型的输入数据为第二目标范围内的第二目标数据,包括对象属性信息、资源使用记录、逾期归还资源记录、资源归还催收记录;输出数据为失联风险评分。失联风险评分是将第二目标范围内的第二目标数据按区间映射不同分值后,将分值进行统计(例如求和、筛选数据后求和、求平均值、求最值)得到的一个分值。
在其中一个实施例中,基于失联预测模型和第二目标数据对目标对象进行失联风险预测,得到失联风险级别,包括:确定与失联预测模型对应的多个第二变量,基于第二目标数据确定与各个第二变量分别对应的第二变量值,通过失联预测模型,按照各第二变量值分别所属的区间,将各第二变量值映射为不同的第二分值,并根据第二分值的和得到失联风险评分,基于失联风险评分,确定失联风险级别。
其中,第二变量为第二目标数据的子类别的变量,例如当第二目标数据的子类别为逾期归还资源记录时,逾期归还资源记录对应的第二变量可以为预设时间段的逾期资源平均量;又例如当第二目标数据的子类别为资源使用记录时,资源使用记录对应的第二变量可以为最近一个月资源的使用率。第二变量值是将第二变量赋值后的数值,例如当第二变量为预设时间段的逾期资源平均量时,第二变量值可以是任意正整数,比如2000。第二变量值所属的区间指的是第二变量值对应的数值区间,例如当第二变量值为2000时,第二变量值所属的区间可以是[150,+∞),具体的区间划分可以很多,本实施例对此不作限定。第二分值指的是按照失联风险评分规则,根据第二变量值所属的区间,确定的一个分数值,第二分值可以为正整数、负整数或零,例如当第二变量值所属的区间是[150,+∞)时,第二分值为32分。失联风险评分为第二分值的和,即为输入失联预测模型的所有第二变量对应的第二分值的和。
失联风险级别是目标对象失联的风险级别,失联风险级别可以包括极高风险、高风险、中风险、低风险和极低风险。比如,定义小于410分的失联风险评分对应的失联风险级别为低风险,不小于410分且小于580分的失联风险评分对应的失联风险级别为中风险,不小于580分的失联风险评分对应的失联风险级别为高风险。例如输入目标对象的多个第二变量分别对应的第二变量值到失联预测模型,得到失联风险评分是544分,则该目标对象失联的失联风险级别是中风险。
失信预测模型用于在目标对象逾期未归还资源时,预测目标对象还款意愿低的风险。失信预测模型的输入数据为第三目标范围内的第三目标数据,包括对象信用信息、按期归还资源记录、逾期归还资源记录、资源归还催收记录;输出数据为失信风险评分。失信风险评分是将第三目标范围内的第三目标数据按区间映射不同分值后,将分值进行统计(例如求和、筛选数据后求和、求平均值、求最值)得到的一个分值。
在其中一个实施例中,基于失信预测模型和第三目标数据对目标对象进行失信风险预测,得到失信风险级别,包括:确定与失信预测模型对应的多个第三变量,基于第三目标数据确定与各个第三变量分别对应的第三变量值,通过失信预测模型,按照各第三变量值分别所属的区间,将各第三变量值映射为不同的第三分值,并根据第三分值的和得到失信风险评分,基于失信风险评分,确定失信风险级别。
其中,第三变量为第三目标数据的子类别的变量,例如当第三目标数据的子类别为资源归还催收记录时,资源归还催收记录对应的第三变量可以是最近一次催收时间距统计日的时长;又例如当第三目标数据的子类别为逾期归还资源记录时,逾期归还资源记录对应的第三变量可以是最近6个月逾期天数小于3天的历史逾期记录占所有历史逾期记录的比例。第三变量值是将第三变量赋值后的数值,例如当第三变量为最近一次催收时间距统计日的时长时,第三变量值可以是任意正整数,比如201。第三变量值所属的区间指的是第三变量值对应的数值区间,例如当第三变量值为201时,第三变量值所属的区间可以是(198,782],具体的区间划分可以很多,本实施例对此不作限定。第三分值指的是按照失信风险评分规则,根据第三变量值所属的区间,确定的一个分数值,第三分值可以为正整数、负整数或零,例如当第三变量值所属的区间是(198,782]时,第三分值为60分。失信风险评分为第三分值的和,即为输入失信预测模型的所有第三变量对应的第三分值的和。
失信风险级别是目标对象失信的风险级别,失信风险级别可以包括极高风险、高风险、中风险、低风险和极低风险。比如,定义小于410分的失信风险评分对应的失信风险级别为低风险,不小于410分且小于550分的失信风险评分对应的失信风险级别为中风险,不小于550分的失信风险评分对应的失信风险级别为高风险。例如输入目标对象的多个第三变量分别对应的第三变量值到失信预测模型,得到失信风险评分是555分,则该目标对象预测为失信风险对象的失信风险级别是高风险。
根据业务需要,设置不同的评分规则,划分不同的分数区间为不同的风险级别。评分规则包括逾期风险评分规则、失联风险评分规则和失信风险评分规则,用于基于逾期风险评分、失联风险评分和失信风险评分分别确定目标对象的逾期风险级别、失联风险级别和失信风险级别为极低风险、低风险、中风险、高风险或极高风险。
具体地,终端获取资源归还相关信息中处于第一目标范围内的第一目标数据,将第一目标数据输入滚动预测模型,通过滚动预测模型对目标对象进行评分,得到逾期风险评分;基于逾期风险评分和逾期风险评分规则,得到逾期滚动风险级别;基于逾期风险级别,从目标对象中确定出逾期风险对象。终端获取资源归还相关信息中处于第二目标范围内的第二目标数据,将第二目标数据输入失联预测模型,通过失联预测模型对目标对象进行评分,得到失联风险评分;基于失联风险评分和失联风险评分规则,得到失联风险级别;基于失联风险级别,从目标对象中确定出失联风险对象。终端获取资源归还相关信息中处于第三目标范围内的第三目标数据,将第三目标数据输入失信预测模型,通过失信预测模型对目标对象进行评分,得到失信风险评分;基于失信风险评分和失信风险评分规则,得到失信风险级别;基于失信风险级别,从目标对象中确定出失信风险对象。
本实施例中,通过整合多个预测模型,分别进行逾期风险预测、失联风险预测和失信风险预测,能够达到从多个风险维度对目标对象进行风险预测的目的。通过滚动预测模型得到逾期风险评分,基于逾期风险评分能够发现逾期风险对象,以对逾期风险对象进行催收;通过失联预测模型得到失联风险评分,基于失联风险评分能够发现失联风险对象,以对失联风险对象进行预警;通过失信预测模型得到失信风险评分,基于失信风险评分能够发现失信风险对象,以对失信风险对象进行预警。
在一个实施例中,根据各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个,对目标社区进行预警,包括:获取风险对象覆盖率阈值,风险对象覆盖率阈值包括逾期风险对象覆盖率阈值、失联风险对象覆盖率阈值和失信风险对象覆盖率阈值;根据目标社区内的逾期风险对象数量,计算逾期风险对象覆盖率;根据目标社区内的失联风险对象数量,计算失联风险对象覆盖率;根据目标社区内的失信风险对象数量,计算失信风险对象覆盖率;若逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个超过对应的风险对象覆盖率阈值,则对目标社区进行预警。
其中,风险对象覆盖率阈值指的是风险对象覆盖率的最大值,包括逾期风险对象覆盖率阈值、失联风险对象覆盖率阈值和失信风险对象覆盖率阈值,根据实际业务需要进行设置。目标社区的预警条件是逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个超过对应的风险对象覆盖率阈值,若满足目标社区的预警条件,则对目标社区进行预警。
具体地,终端获取风险对象覆盖率阈值,风险对象覆盖率阈值包括逾期风险对象覆盖率阈值、失联风险对象覆盖率阈值和失信风险对象覆盖率阈值;根据目标社区内的逾期风险对象数量占目标社区内所有对象数量的比例,计算逾期风险对象覆盖率;根据目标社区内的失联风险对象数量占目标社区内所有对象数量的比例,计算失联风险对象覆盖率;根据目标社区内的失信风险对象数量占目标社区内所有对象数量的比例,计算失信风险对象覆盖率;若逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个超过对应的风险对象覆盖率阈值,则对目标社区进行预警。
本实施例中,根据逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个是否超过对应的风险对象覆盖率阈值,判断是否对目标社区进行预警,能够达到以社区为单位对目标对象进行风险预警的目的。
在一个实施例中,若逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个超过对应的风险对象覆盖率阈值,则对目标社区进行预警,包括:采用知识图谱展示多个目标社区;若逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个超过对应的风险对象覆盖率阈值,则基于知识图谱,对目标社区进行标注提醒。
其中,知识图谱由三元组构成,三元组是由实体、属性和关系组成的。其中,实体包括目标对象、目标对象所对应的目标地点和目标对象所对应的目标团体等。属性包括目标对象的资源归还相关信息、目标对象的风险预测信息、目标对象所属社区的风险信息、目标对象所对应企业的属性,其中,目标对象的风险预测信息是指目标对象的逾期滚动风险级别、失联风险级别和失信风险级别,目标对象所属社区的风险信息是指目标对象所属社区是否满足预警条件。关系包括目标对象的对象社会关系信息和资源流转信息、目标对象与目标地点间的关联关系(比如,是否为常驻地)、目标对象与目标团体间的关联关系。
知识图谱具有标注功能。当终端检测到高风险的目标对象或目标社区时,能够通过知识图谱的用户界面进行标注提醒。标注提醒的方式可以是高亮或者发出提示声等。
知识图谱还具有查询功能。当终端检测到失联风险对象或失信风险对象时,能够通过知识谱图的用户界面查看失联风险对象或失信风险对象的对象社会关系信息,以便于修复失联,作为制定催收方案的辅助方法。修复失联是指当目标对象的联系方式变更时,通过目标对象所属目标社区中的其他目标对象,间接地联系上目标对象。
通过对知识图谱进行进一步地统计分析,还可得到催收风险报表。催收风险报表是以地区、单位等不同维度,按天、周、月度,对催收情况以及风险进行梳理,报告高风险目标社区的数量、高风险目标社区内目标对象的数量、预计逾期的资源总量、预计损失的资源总量等。
具体地,终端采用知识图谱展示多个目标社区;若逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个超过对应的风险对象覆盖率阈值,则基于知识图谱,对目标社区进行标注提醒;若确定目标对象中存在失联风险对象和失信风险对象中的至少一个,则基于知识图谱,查询失联风险对象和失信风险对象中的至少一个所属目标社区,根据所属目标社区中的其他目标对象的资源归还相关信息和对象社会关系信息,修复失联风险对象和失信风险对象中的至少一个的联系方式。
本实施例中,通过知识谱图展示目标对象的资源归还相关信息、对象社会关系信息和资源流转信息、目标对象的风险预测信息和目标对象所属社区的风险信息,能够对高风险的目标对象或目标社区进行标注提醒,还能够对失联风险对象或失信风险对象的联系方法进行修复失联。
在一个实施例中,如图4所示,提供了一种社区风险预警方法,该方法包括以下步骤:
1.数据收集清洗,包括资源归还相关信息、对象社会关系信息和资源流转信息。资源归还相关信息包括对象属性信息、对象收入信息、对象信用信息、借用资源信息、资源使用记录、按期归还资源记录、逾期归还资源记录、资源归还催收记录等。对象社会关系信息包括与对象具有社会关系的其他的对象信息,比如对象借用资源的担保方、共同借用方、共同归还方,以及与对象具有资源关联关系的对象等。资源流转信息包括资源流转数量和资源流转频率,例如不同目标对象之间的交易流水。
2.加入白名单:一些合作对象和白名单对象会预先从目标对象中剔除。
3.预测模型。
3.1滚动预测:滚动预测模型用于预测每一账龄段的目标对象迁徙到下一额账龄的风险概率,概率越高,下个月继续违约的可能性越高。滚动预测模型包括M0-M1模型、M1-M2模型、M2-M3模型、M3-M4模型。M0-M1模型:当前目标对象的账龄为M0,是正常对象,预测下个月会变成M1的可能性。以此类推M1-M2模型,M2-M3模型,M3-M4模型。滚动预测模型的输入数据包括:对象属性信息、对象收入信息、对象信用信息、借用资源信息、资源使用记录、按期归还资源记录、逾期归还资源记录、资源归还催收记录。
基于逻辑回归,根据滚动预测模型的输入数据确定多个变量及变量值,将变量值按区间映射不同的分值,再将分数加总,可以的到一个分值。可以根据业务需要,划分不同的分数区间为不同风险级别,根据分值所属的分数区间,确定目标对象的逾期滚动风险级别。
3.2失联预测:失联预测模型用于在逾期阶段,对于尚能联系到的目标对象预测其未来失联的概率,以对于失联可能性大的目标对象可以进行信息修复。失联预测模型的输入数据包括:对象属性信息、资源使用记录、逾期归还资源记录、资源归还催收记录。与上述滚动预测模型的预测方法类似,使用逻辑回归进行失联风险预测。
3.3失信预测:失信预测模型用于对逾期阶段还款意愿极低的目标对象进行预测。失信预测模型的输入数据包括对象信用信息、按期归还资源记录、逾期归还资源记录、资源归还催收记录。与上述滚动预测模型、失联预测模型的预测方法类似,使用逻辑回归进行失信风险预测。
4.社区发现。
4.1边权重计算:连接不同节点之间的边的权重有如下定义:
资源流转数量得分*系数1+资源流转频率得分*系数2+对象社会关系得分*系数3。
其中,对象社会关系得分指的是将与目标对象有联系,且联系紧密的对象相关的对象社会关系得分,确定为高分,将于与目标对象有联系,且联系疏远的对象相关的对象社会关系得分,确定为低分。例如,定义目标对象之间为合作关系或者非亲密关系的对象社会关系得分为50分,目标对象之间为担保关系、共同借用资源关系或者亲密关系的对象社会关系得分为100分。
例如,定义两个目标对象之间的数量为0的资源流转数量对应的资源流转数量得分为0分,数量不大于1000的资源流转数量对应的资源流转数量得分为20分,数量大于1000且不小于10000的资源流转数量对应的资源流转数量得分为40分,数量大于10000且不小于20000的资源流转数量对应的资源流转数量得分为60分,数量大于20000且不小于30000的资源流转数量对应的资源流转数量得分为80分,数量大于30000的资源流转数量对应的资源流转数量得分为100分。
例如,定义两个目标对象最近一年频率为0次的资源流转频率对应的资源流转频率得分为0分,频率为1次或2次的资源流转频率对应的资源流转频率得分为20分,频率为3次、4次或5次的资源流转频率对应的资源流转频率得分为40分,频率为6次、7次或8次的资源流转频率对应的资源流转频率得分为60分,频率为9次或10次的资源流转频率对应的资源流转频率得分为80分,频率大于10次的资源流转频率对应的资源流转频率得分为100分。
系数1、系数2、系数3分别为资源流转数量得分、资源流转频率得分和对象社会关系得分对应的系数,其总和为1。例如,定义系数1为0.25,系数2为0.25,系数3为0.5。例如两个目标对象之间为合作关系,这两个目标对象之间的资源流转数量为5000,资源流转频率为最近一年1次或2次,系数1为0.25,系数2为0.25,系数3为0.5,则对应的资源流转数量得分为40分,资源流转频率得分为20分,对象社会关系为50分,两个目标对象之间的边权重为40*0.25+20*0.25+50*0.5=40。
4.2Louvain社区发现
Louvain算法是一种基于模块度的图算法模型,与普通的基于模块度和模块度增益不同的是,该算法速度很快,而且对一些点多边少的图,进行聚类效果特别明显。通过Louvain社区发现,可以检测到具有密切社会关系以及密切资金来往的社群。
以图5A所示的ABC三个目标对象为例,AC边权重为50,BC边权重为10。定义某一点的度是改点可直接到达的点数的加权之和,如A可到达C点,且边权重是50。
初始有假设A B C三个目标对象分别是三个社区。A的度是50,C的度=50+10=60,B的度是10。社区A里的所有点的度占总度=50/(50+60+10)=0.42,社区B里的所有点的度占总度=10/(50+60+10)=0.08,社区C里的所有点的度占总度=60/(50+60+10)=0.5。此时3个社区内各自的存在的边数是0。根据模块度=Σ(社区i内边数占总边数-社区i内的度占总度的比例^2),计算得到初始模块度=(0-0.42^2)+(0-0.08^2)+(0-0.5^2)=-0.25。
如果C点加入A社区,则AC社区里的边数占总边数的比例=50/(50+10)=0.83,AC社区里的度占总度的比例=(50+60)/(50+60+10)=0.92,B社区里边数占总边数的比例依旧为0,B社区里的所有点的度占总度=10/(50+60+10)=0.08。此时的模块度=(0.83-0.92^2)+(0-0.08^2)=-0.0228。
由于C社区与A社区合并后模块度上升,则可以合并AC社区,得到如图5B所示的社区。将AC社区是为一个新的节点,重新计算整体模块度。重复以上过程。
5.风险报告
5.1社群催收风险知识图谱:参考图6,知识图谱由三元组构成的,三元组是由实体、属性和关系组成的。
实体,包括:目标对象、目标地点和目标团体。
属性,包括:目标对象属性和目标团体属性,其中目标对象属性包括:逾期风险对象、失联风险对象和失信风险对象、对象所属目标社区预警信息和资源归还相关信息。
关系,包括:目标对象的对象社会关系信息和资源流转信息;目标对象与目标地点的关联关系;以及目标对象与目标团体的关联关系。
5.1.1标注功能:知识图谱展现界面,设置监控的阈值,一个目标社区里超过多少比例的滚动预测模型标的、失联预测模型标的或失信预测模型标的时认为是高风险社群进行标注提醒。
5.1.2查询功能:对于目标对象在失联预测模型或失信预测模型被预测为标的时,使用知识图谱可以查看目标对象的社区关系,便于修复失联,作为辅助制定催收方案的工具。
“失联修复”是指目标对象当前的联系方式发生改变,催收方通过相关修复手段或渠道修复目标对象当前的联系方式的行为就是“失联修复”。本案例中,可通过目标对象的多度联系人间接找到目标对象。
例如,当目标对象甲有较高失联风险时,可以查询目标对象甲具有相关关系的目标对象,如图6所示,是显示二度关系目标对象关系。可以通过查询与目标对象甲具有亲密关系的目标对象丙的最新地址以及联系方式,从而获得目标对象甲的更多的联系方式。
5.2社群催收风险报表:以目标地点、目标团体等不同维度,报告维度内高风险社群的数量、涉及目标对象数量、以及预计逾期、损失的资源总量。
本实施例中,通过整合多个模型结果在同一平台对逾期滚动风险、失联风险和失信风险进行监控,并利用风险在社群的传导规律,能够有效控制风险的传导,对失联、失信相关目标对象的风险传导影响及早识别,有效监测团体欺诈行为,并提供了失联修复的方法。通过知识图谱可视化易操作界面呈现风险监控结果,能够实现动态监控,信息时效性高。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的社区风险预警方法的社区风险预警装置。下面所提供的一个或多个社区风险预警装置实施例中的具体限定可以参见上文中对于社区风险预警方法的限定,在此不再赘述。
在一个实施例中,如图7所示,提供了一种社区风险预警装置700,包括:获取模块702、预测模块704、和划分模块706、预警模块708,其中:获取模块702,用于获取目标对象的目标对象数据,目标对象数据包括资源归还相关信息、对象社会关系信息和资源流转信息;预测模块704,用于基于资源归还相关信息进行风险预测,得到多个风险维度的风险评分,基于多个风险维度的风险评分,从目标对象中确定出逾期风险对象、失联风险对象和失信风险对象;划分模块706,用于基于对象社会关系信息和资源流转信息,确定各社区节点之间的边权重,基于各社区节点之间的边权重,对目标对象进行社区划分,得到多个目标社区,社区节点表征对目标对象进行社区划分过程中的节点;预警模块708,用于对于每个目标社区,根据各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个,对目标社区进行预警。
在一个实施例中,划分模块706还用于将每一个目标对象作为一个初始的社区节点;基于目标对象的对象社会关系信息和资源流转信息,确定各社区节点之间的边权重;依次将每个社区节点和与其相邻的社区节点进行合并,基于当前社区节点和与其相邻的社区节点之间的边权重,计算合并后的社区节点的模块度增益;若合并后的社区节点的模块度增益大于零,则将合并后的社区节点作为一个新的社区节点;基于新的社区节点返回依次将每个社区节点和与其相邻的社区节点进行合并步骤继续执行,直至达到社区划分停止条件时停止;基于最终社区划分得到的多个社区节点,得到多个目标社区。
在一个实施例中,预测模块704还用于获取资源归还相关信息中的第一目标数据,基于滚动预测模型和第一目标数据对目标对象进行逾期滚动风险预测,得到逾期风险评分,基于逾期风险评分,确定出逾期风险对象;获取资源归还相关信息中的第二目标数据,基于失联预测模型和第二目标数据对目标对象进行失联风险预测,得到失联风险评分,基于失联风险评分,确定出失联风险对象;获取资源归还相关信息中的第三目标数据,基于失信预测模型和第三目标数据对目标对象进行失信风险预测,得到失信风险评分,基于失信风险评分,确定出失信风险对象。
在一个实施例中,预测模块704还用于确定与滚动预测模型对应的多个第一变量,基于第一目标数据确定与各个第一变量分别对应的第一变量值,通过滚动预测模型,按照各第一变量值分别所属的区间,将各第一变量值映射为不同的第一分值,并根据第一分值的和得到逾期风险评分;确定与失联预测模型对应的多个第二变量,基于第二目标数据确定与各个第二变量分别对应的第二变量值,通过失联预测模型,按照各第二变量值分别所属的区间,将各第二变量值映射为不同的第二分值,并根据第二分值的和得到失联风险评分;确定与失信预测模型对应的多个第三变量,基于第三目标数据确定与各个第三变量分别对应的第三变量值,通过失信预测模型,按照各第三变量值分别所属的区间,将各第三变量值映射为不同的第三分值,并根据第三分值的和得到失信风险评分。
在一个实施例中,预警模块708还用于获取风险对象覆盖率阈值,风险对象覆盖率阈值包括逾期风险对象覆盖率阈值、失联风险对象覆盖率阈值和失信风险对象覆盖率阈值;根据目标社区内的逾期风险对象数量,计算逾期风险对象覆盖率;根据目标社区内的失联风险对象数量,计算失联风险对象覆盖率;根据目标社区内的失信风险对象数量,计算失信风险对象覆盖率;若逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个超过对应的风险对象覆盖率阈值,则对目标社区进行预警。
在一个实施例中,预警模块708还用于采用知识图谱展示多个目标社区;若逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个超过对应的风险对象覆盖率阈值,则基于知识图谱,对目标社区进行标注提醒。
上述社区风险预警装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图8所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种社区风险预警方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置,显示屏可以是液晶显示屏或电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (13)

1.一种社区风险预警方法,其特征在于,所述方法包括:
获取目标对象的目标对象数据,所述目标对象数据包括资源归还相关信息、对象社会关系信息和资源流转信息;
基于所述资源归还相关信息进行风险预测,得到多个风险维度的风险评分,基于所述多个风险维度的风险评分,从所述目标对象中确定出逾期风险对象、失联风险对象和失信风险对象;
基于所述对象社会关系信息和资源流转信息,确定各社区节点之间的边权重,基于各社区节点之间的边权重,对所述目标对象进行社区划分,得到多个目标社区,所述社区节点表征对目标对象进行社区划分过程中的节点;
对于每个目标社区,根据各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个,对所述目标社区进行预警。
2.根据权利要求1所述的方法,其特征在于,所述基于所述对象社会关系信息和资源流转信息,确定各社区节点之间的边权重,基于各社区节点之间的边权重,对所述目标对象进行社区划分,得到多个目标社区,包括:
将每一个目标对象作为一个初始的社区节点;
基于所述目标对象的对象社会关系信息和资源流转信息,确定各社区节点之间的边权重;
依次将每个社区节点和与其相邻的社区节点进行合并,基于当前社区节点和与其相邻的社区节点之间的边权重,计算合并后的社区节点的模块度增益;
若合并后的社区节点的模块度增益大于零,则将合并后的社区节点作为一个新的社区节点;
基于新的社区节点返回所述依次将每个社区节点和与其相邻的社区节点进行合并步骤继续执行,直至达到社区划分停止条件时停止;
基于最终社区划分得到的多个社区节点,得到多个目标社区。
3.根据权利要求1所述的方法,其特征在于,所述基于所述资源归还相关信息进行风险预测,得到多个风险维度的风险评分,基于所述多个风险维度的风险评分,从所述目标对象中确定出逾期风险对象、失联风险对象和失信风险对象,包括:
获取所述资源归还相关信息中的第一目标数据,基于滚动预测模型和所述第一目标数据对目标对象进行逾期滚动风险预测,得到逾期风险评分,基于逾期风险评分,确定出逾期风险对象;
获取所述资源归还相关信息中的第二目标数据,基于失联预测模型和所述第二目标数据对目标对象进行失联风险预测,得到失联风险评分,基于失联风险评分,确定出失联风险对象;
获取所述资源归还相关信息中的第三目标数据,基于失信预测模型和所述第三目标数据对目标对象进行失信风险预测,得到失信风险评分,基于失信风险评分,确定出失信风险对象。
4.根据权利要求3所述的方法,其特征在于,所述基于滚动预测模型和所述第一目标数据对目标对象进行逾期滚动风险预测,得到逾期风险评分,包括:
确定与滚动预测模型对应的多个第一变量,基于所述第一目标数据确定与各个第一变量分别对应的第一变量值,通过所述滚动预测模型,按照各第一变量值分别所属的区间,将各所述第一变量值映射为不同的第一分值,并根据所述第一分值的和得到逾期风险评分;
所述基于失联预测模型和所述第二目标数据对目标对象进行失联风险预测,得到失联风险评分,包括:
确定与失联预测模型对应的多个第二变量,基于所述第二目标数据确定与各个第二变量分别对应的第二变量值,通过所述失联预测模型,按照各第二变量值分别所属的区间,将各所述第二变量值映射为不同的第二分值,并根据所述第二分值的和得到失联风险评分;
所述基于失信预测模型和所述第三目标数据对目标对象进行失信风险预测,得到失信风险评分,包括:
确定与失信预测模型对应的多个第三变量,基于所述第三目标数据确定与各个第三变量分别对应的第三变量值,通过所述失信预测模型,按照各第三变量值分别所属的区间,将各所述第三变量值映射为不同的第三分值,并根据所述第三分值的和得到失信风险评分。
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述根据各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个,对所述目标社区进行预警,包括:
获取风险对象覆盖率阈值,所述风险对象覆盖率阈值包括逾期风险对象覆盖率阈值、失联风险对象覆盖率阈值和失信风险对象覆盖率阈值;
根据目标社区内的逾期风险对象数量,计算逾期风险对象覆盖率;
根据目标社区内的失联风险对象数量,计算失联风险对象覆盖率;
根据目标社区内的失信风险对象数量,计算失信风险对象覆盖率;
若所述逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个超过对应的风险对象覆盖率阈值,则对所述目标社区进行预警。
6.根据权利要求5所述的方法,其特征在于,所述若所述逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个超过对应的风险对象覆盖率阈值,则对所述目标社区进行预警,包括:
采用知识图谱展示多个目标社区;
若所述逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个超过对应的风险对象覆盖率阈值,则基于所述知识图谱,对目标社区进行标注提醒。
7.一种社区风险预警装置,其特征在于,所述装置包括:
获取模块,用于获取目标对象的目标对象数据,所述目标对象数据包括资源归还相关信息、对象社会关系信息和资源流转信息;
预测模块,用于基于所述资源归还相关信息进行风险预测,得到多个风险维度的风险评分,基于所述多个风险维度的风险评分,从所述目标对象中确定出逾期风险对象、失联风险对象和失信风险对象;
划分模块,用于基于所述对象社会关系信息和资源流转信息,确定各社区节点之间的边权重,基于各社区节点之间的边权重,对所述目标对象进行社区划分,得到多个目标社区,所述社区节点表征对目标对象进行社区划分过程中的节点;
预警模块,用于对于每个目标社区,根据各目标社区的逾期风险对象覆盖率、失联风险对象覆盖率和失信风险对象覆盖率中的至少一个,对所述目标社区进行预警。
8.根据权利要求7所述的装置,其特征在于,所述划分模块还用于:
将每一个目标对象作为一个初始的社区节点;
基于目标对象的对象社会关系信息和资源流转信息,确定各社区节点之间的边权重;
依次将每个社区节点和与其相邻的社区节点进行合并,基于当前社区节点和与其相邻的社区节点之间的边权重,计算合并后的社区节点的模块度增益;
若合并后的社区节点的模块度增益大于零,则将合并后的社区节点作为一个新的社区节点;
基于新的社区节点返回依次将每个社区节点和与其相邻的社区节点进行合并步骤继续执行,直至达到社区划分停止条件时停止;
基于最终社区划分得到的多个社区节点,得到多个目标社区。
9.根据权利要求7所述的装置,其特征在于,所述预测模块还用于:
获取资源归还相关信息中的第一目标数据,基于滚动预测模型和第一目标数据对目标对象进行逾期滚动风险预测,得到逾期风险评分,基于逾期风险评分,确定出逾期风险对象;
获取资源归还相关信息中的第二目标数据,基于失联预测模型和第二目标数据对目标对象进行失联风险预测,得到失联风险评分,基于失联风险评分,确定出失联风险对象;
获取资源归还相关信息中的第三目标数据,基于失信预测模型和第三目标数据对目标对象进行失信风险预测,得到失信风险评分,基于失信风险评分,确定出失信风险对象。
10.根据权利要求9所述的装置,其特征在于,所述预测模块还用于:
确定与滚动预测模型对应的多个第一变量,基于第一目标数据确定与各个第一变量分别对应的第一变量值,通过滚动预测模型,按照各第一变量值分别所属的区间,将各第一变量值映射为不同的第一分值,并根据第一分值的和得到逾期风险评分;
确定与失联预测模型对应的多个第二变量,基于第二目标数据确定与各个第二变量分别对应的第二变量值,通过失联预测模型,按照各第二变量值分别所属的区间,将各第二变量值映射为不同的第二分值,并根据第二分值的和得到失联风险评分;
确定与失信预测模型对应的多个第三变量,基于第三目标数据确定与各个第三变量分别对应的第三变量值,通过失信预测模型,按照各第三变量值分别所属的区间,将各第三变量值映射为不同的第三分值,并根据第三分值的和得到失信风险评分。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
13.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202210193122.1A 2022-02-28 2022-02-28 社区风险预警方法、装置、计算机设备和存储介质 Pending CN114626701A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210193122.1A CN114626701A (zh) 2022-02-28 2022-02-28 社区风险预警方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210193122.1A CN114626701A (zh) 2022-02-28 2022-02-28 社区风险预警方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN114626701A true CN114626701A (zh) 2022-06-14

Family

ID=81900081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210193122.1A Pending CN114626701A (zh) 2022-02-28 2022-02-28 社区风险预警方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN114626701A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024164667A1 (zh) * 2023-02-06 2024-08-15 中国银联股份有限公司 增量图划分方法、装置、设备、介质及产品

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024164667A1 (zh) * 2023-02-06 2024-08-15 中国银联股份有限公司 增量图划分方法、装置、设备、介质及产品

Similar Documents

Publication Publication Date Title
CN110390465A (zh) 业务数据的风控分析处理方法、装置和计算机设备
Long et al. Mapping block-level urban areas for all Chinese cities
CN111340246A (zh) 用于企业智能决策分析的处理方法、装置和计算机设备
CN112148987A (zh) 基于目标对象活跃度的消息推送方法及相关设备
CN112534456A (zh) 一种保护计划及保修数据分析的系统及方法
WO2023123934A1 (zh) 一种信息管理方法、设备及存储介质
CN113360580A (zh) 基于知识图谱的异常事件检测方法、装置、设备及介质
CN113392150A (zh) 一种基于业务域的数据表展示方法、装置、设备及介质
CN114612194A (zh) 产品推荐方法、装置、电子设备及存储介质
CN115619245A (zh) 一种基于数据降维方法的画像构建和分类方法及系统
CN115545103A (zh) 异常数据识别、标签识别方法和异常数据识别装置
WO2016037346A1 (en) Measuring and diagnosing noise in urban environment
CN114372681A (zh) 基于流水数据的企业分类方法、装置、设备、介质和产品
CN114626701A (zh) 社区风险预警方法、装置、计算机设备和存储介质
CN114741402A (zh) 业务特征池的处理方法、装置、计算机设备和存储介质
CN113962457A (zh) 数据处理方法、装置、计算机设备和存储介质
US11295325B2 (en) Benefit surrender prediction
Lagarias Exploring land use policy scenarios with the use of a cellular automata-based model: urban sprawl containment and sustainable development in Thessaloniki
CN115758271A (zh) 数据处理方法、装置、计算机设备和存储介质
CN115049429A (zh) 增益预测方法、装置和计算机设备
Beale Effective use of GIS for spatial epidemiology
CN114490406A (zh) 测试覆盖项管理方法、装置、设备及介质
CN113537806A (zh) 异常用户识别方法、装置、电子设备及可读存储介质
CN113919942A (zh) 基于人工智能的借款逾期客户分群方法及相关设备
CN108537654B (zh) 客户关系网络图的渲染方法、装置、终端设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination