CN112037038B - 银行信贷风险预测方法及装置 - Google Patents
银行信贷风险预测方法及装置 Download PDFInfo
- Publication number
- CN112037038B CN112037038B CN202010908828.2A CN202010908828A CN112037038B CN 112037038 B CN112037038 B CN 112037038B CN 202010908828 A CN202010908828 A CN 202010908828A CN 112037038 B CN112037038 B CN 112037038B
- Authority
- CN
- China
- Prior art keywords
- transaction
- credit risk
- risk prediction
- heterogeneous graph
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 230000011218 segmentation Effects 0.000 claims abstract description 62
- 238000012545 processing Methods 0.000 claims abstract description 52
- 238000013528 artificial neural network Methods 0.000 claims abstract description 41
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 40
- 239000000203 mixture Substances 0.000 claims abstract description 29
- 238000013058 risk prediction model Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 16
- 238000012502 risk assessment Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 9
- 230000002159 abnormal effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 14
- 238000002790 cross-validation Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000010354 integration Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 210000001503 joint Anatomy 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 241000283014 Dama Species 0.000 description 1
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- JNSGIVNNHKGGRU-JYRVWZFOSA-N diethoxyphosphinothioyl (2z)-2-(2-amino-1,3-thiazol-4-yl)-2-methoxyiminoacetate Chemical compound CCOP(=S)(OCC)OC(=O)C(=N/OC)\C1=CSC(N)=N1 JNSGIVNNHKGGRU-JYRVWZFOSA-N 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Technology Law (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种银行信贷风险预测方法及装置,该方法包括:对交易流水相关数据进行分词处理,确定不同客户的交易信息;所述交易信息包括交易商户和商户类别码;根据不同客户的交易信息,以每一客户和商户为节点,建立交易的异构图;采用异构图神经网络算法,根据交易的异构图,确定每一客户的信贷风险预测值。本发明通过异构图显示每一客户与不同商户间交易的金额,次数和渠道,与现有技术对比,解决了传统技术下不能整合与客户有关的全部交易信息的问题,实现了对与客户有关的全部交易信息进行综合分析的目的,提高了对客户进行信贷风险预测的准确度。可确定交易流水相关数据中实际的交易商户和商户类别码,提高了银行信贷风险预测的适用性。
Description
技术领域
本发明涉及神经网络技术领域,尤其涉及一种银行信贷风险预测方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
目前客户的信贷风险预测方法,主要是基于深度学习和机器学习等,通过对客户的客户信息、金融属性、征信信息和消费行为数据等进行数据挖掘而得出。现有技术下的信贷风险预测方法只能对交易流水相关数据进行简单的统计,无法考虑交易商户和商户类别。举一例,如两个相同的客户,都是消费了N笔M元,但是A客户购买家电,B客户购买股票,A客户和B客户的信贷风险是不一样的,C客户虽然消费了N-3笔,但交易流水相关数据也是涉及家电,A客户在进行信贷风险预测时则与C客户更为相似,但若采用目前客户的信贷风险预测方法对上述进行分析则只能得出A客户在进行信贷风险预测时则与B客户更为相似。
由上述可知,传统的信贷风险评估方法仅是基于客户不同单次消费的交易数据,如仅能统计客户在不同渠道的交易笔数金额和不同类型的交易笔数金额,而不能整合与客户有关的全部交易信息,不能结合交易流水相关数据对交易商户和商户类别进行综合分析,从而降低了银行信贷风险预测的准确度。
同时,传统的信贷风险预测方法分析的银行交易数据,主要是基于传统的线下交易,线下交易多为基于POS机渠道的交易,具有明确的时间、地点、商户类型等。由于第三方支付平台以及网上电商平台存在,客户不是直接用银行卡与商户交易,导致银行无法辨别出实际的交易商户和商户类别。如现在很多线上支付线下消费,银行的交易流水相关数据中,交易商户对应的是电商平台,如银行卡绑定微信支付的所有交易记录的交易商户都是腾讯支付,而不是具体消费的实际交易商户如沃尔玛等,传统技术并不能区分这一点。因此当交易通过线上渠道支付的时候,银行对接的交易商户则是第三方支付渠道或者电商平台,传统的信贷风险预测方法并不能准确分析客户进行线上交易的交易流水相关数据,不能准确地确定出交易涉及的交易商户和商户类别,因此传统的信贷风险预测方法无法对线上交易进行准确地分析,具有一定的局限性,且降低了银行信贷风险预测的适用性。
发明内容
本发明实施例提供一种银行信贷风险预测方法,用以提高银行信贷风险预测的准确度和适用性,该方法包括:
对交易流水相关数据进行分词处理,确定不同客户的交易信息;所述交易信息包括交易商户和商户类别;
根据不同客户的交易信息,以每一客户和商户为节点,建立交易的异构图;所述异构图用于显示每一客户与不同商户间交易的金额,次数和渠道;
采用异构图神经网络算法,根据交易的异构图,确定每一客户的信贷风险预测值。
本发明实施例还提供一种银行信贷风险预测装置,用以提高银行信贷风险预测的准确度和适用性,该装置包括:
分词模块,用于对交易流水相关数据进行分词处理,确定不同客户的交易信息;所述交易信息包括交易商户和商户类别码;
异构图建立模块,用于根据不同客户的交易信息,以每一客户和商户为节点,建立交易的异构图;所述异构图用于显示每一客户与不同商户间交易的金额,次数和渠道;
预测模块,用于采用异构图神经网络算法,根据交易的异构图,确定每一客户的信贷风险预测值。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述银行信贷风险预测方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述银行信贷风险预测方法的计算机程序。
本发明实施例中,对交易流水相关数据进行分词处理,确定不同客户的交易信息;所述交易信息包括交易商户和商户类别码;根据不同客户的交易信息,以每一客户和商户为节点,建立交易的异构图;所述异构图用于显示每一客户与不同商户间交易的金额,次数和渠道;采用异构图神经网络算法,根据交易的异构图,确定每一客户的信贷风险预测值,从而可通过异构图显示每一客户与不同商户间交易的金额,次数和渠道,与现有技术对比,解决了传统技术下不能整合与客户有关的全部交易信息的问题,实现了对与客户有关的全部交易信息进行综合分析的目的,提高了对客户进行信贷风险预测的准确度。同时,通过分词处理,可确定交易流水相关数据中交易商户和商户类别码,解决了现有技术不能对线上交易相关数据进行准确分析的问题,提高了银行信贷风险预测的适用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中银行信贷风险预测方法的流程示意图;
图2为本发明实施例中银行信贷风险预测方法实例的示意图;
图3为本发明实施例中银行信贷风险预测方法实例的示意图;
图4为本发明实施例中银行信贷风险预测方法实例的示意图;
图5为本发明实施例中银行信贷风险预测方法实例的示意图;
图6为本发明实施例中银行信贷风险预测装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
图1为本发明实施例中银行信贷风险预测方法的流程示意图,如图1所示,本发明实施例提供的一种银行信贷风险预测方法,可包括如下步骤:
步骤101:对交易流水相关数据进行分词处理,确定不同客户的交易信息;所述交易信息包括交易商户和商户类别码;
步骤102:根据不同客户的交易信息,以每一客户和商户为节点,建立交易的异构图;所述异构图用于显示每一客户与不同商户间交易的金额,次数和渠道;
步骤103:采用异构图神经网络算法,根据交易的异构图,确定每一客户的信贷风险预测值。
本发明实施例中,对交易流水相关数据进行分词处理,确定不同客户的交易信息;所述交易信息包括交易商户和商户类别码;根据不同客户的交易信息,以每一客户和商户为节点,建立交易的异构图;所述异构图用于显示每一客户与不同商户间交易的金额,次数和渠道;采用异构图神经网络算法,根据交易的异构图,确定每一客户的信贷风险预测值,从而可通过异构图显示每一客户与不同商户间交易的金额,次数和渠道,与现有技术对比,解决了传统技术下不能整合与客户有关的全部交易信息的问题,实现了对与客户有关的全部交易信息进行综合分析的目的,提高了对客户进行信贷风险预测的准确度。同时,通过分词处理,可确定交易流水相关数据中交易商户和商户类别码,解决了现有技术不能对线上交易相关数据进行准确分析的问题,提高了银行信贷风险预测的适用性。
具体实施时,首先对交易流水相关数据进行分词处理,确定不同客户的交易信息;所述交易信息包括交易商户和商户类别码。
实施例中,本发明实施例中提供的银行信贷风险预测方法还可以包括:从交易流水相关数据中,以预设置的第一参数抽取交易数据;所述第一参数包括银行记录的交易商户和商户类别码;所述第一参数还可以包括银行记录的客户号和交易渠道。而对交易流水相关数据进行分词处理,确定不同客户的交易信息的方法有多种,例如,可以包括:对交易流水相关数据中交易描述数据,以预设置的第二参数进行分词处理;所述第二参数包括实际的交易商户和商户类别码;第二参数包括还可以包括实际的客户号和交易第三方渠道;对从交易流水相关数据中抽取的交易数据和进行分词处理后的交易描述数据,进行交叉验证处理,确定不同客户的交易信息。
其中,第一参数表示在银行记录中的参数,如银行记录的交易商户、商户类别码、客户号和交易渠道;举一例,如第二参数包括实际进行交易的交易商户、商户类别码、实际的客户号和交易第三方渠道。举一例,如应用支付宝进行的线下交易,在经传统的银行信贷风险预测方法对客户进行信贷风险预测时,从对交易流水相关数据里,获取的信息为:银行记录的交易渠道为线上交易,刷卡商户为支付宝,MCC(商户类别码,Merchant CategoryCode)对应的是电商支付;而经本发明实施例中提供的银行信贷风险预测方法对交易描述数据拆分时,可确定出实际进行交易的交易第三方渠道为支付宝;实际进行交易的交易商户为沃尔玛,实际进行交易的商户类别码对应的为超市。
在上述实施例中,首先从交易流水相关数据中,以预设置的第一参数抽取交易数据,可获取到交易流水相关数据(如综合交易流水表)里已有的客户号,及与同一客户号对应的商户类别码(MCC,Merchant Category Code),银行记录的交易商户(可称作刷卡商户)和银行记录的交易渠道;其次对交易流水相关数据进行分词处理,确定不同客户的交易信息,其中,不同客户的交易信息可以包括与同一客户号对应的不同交易的实际进行交易的的商户类别码(可称作消费商户类别码),商户类别码(可称作实际消费商户)和交易渠道(可称作交易第三方渠道)等。
通过分词处理确定不同客户的交易信息,可以准确地确定出交易流水相关数据中线上交易数据所交易涉及的交易商户和商户类别,可实现对分布各地的大型商户分店的信息,如各地的麦当劳、沃尔玛等。通过对交易流水相关数据中交易描述数据进行分词处理,可识别出线上交易涉及的第三方支付平台、线上平台及所在地区等,并通过对从交易流水相关数据中抽取的交易数据和进行分词处理后的交易描述数据,进行交叉验证处理,可细分或者合并成不同客户的交易信息,其中交易信息包括除交易商户和商户类别码外,还可以包括不同客户的交易所使用的渠道,如支付宝或微信,以及交易所在地区。通过分词处理,可将只有收单行才能获取的数据转化为发卡行可分区,如微信能够获取客户在微信里把钱支付给了沃尔玛,但是银行这边获取的只是客户的交易对手是微信,而这个信息,在交易描述的字段里有写,如“腾讯财付通—深圳南山区沃尔玛”;或者客户使用A行信用卡在B行的pos机刷卡,那么B行POS机相关的信息如地理位置、商铺情况等只有B行通过多个字段存储下来,B行发给A行的主要是交易商户、金额、交易描述,A行无法获得交易的地理信息。举一例,如进行分词处理后的交易描述数据除了已有的商户号字段外,同时还包括提取出具体的商户,同时可以合并很多分店的商户,如“山东麦当劳”“汉堡王(上海)”描述,对异地商户进行合并,而不是拆分成不同的商户,将同一商户在不同地区的商户合并为一类,避免了对同一家商户的频繁计算,便于精准地对客户的交易信息进行分析。
通过交叉验证处理,可将线下交易数据中交易描述数据,与从交易流水相关数据中抽取的交易数据的相关字段进行融合、补充和细化。由于线下POS机消费的交易会有对应的商户信息如交易商户(可通过交易商户号或交易商户名称体现交易商户)、商户类别码等;同时交易描述数据里也有对应的分词,通过交叉验证处理可将两部分信息需要进行融合。如商户类别码,线上交易则直接取交易描述数据中的商户类别码;如果为线下交易,则拼接MCC码与进行分词处理后的交易描述数据。举一例,如交易渠道,线下交易可取银行记录的交易渠道的字段,用于区分POS机和银行自身系统;线上支付的交易,可通过分词拆分出“支付宝”“财付通”“京东”“美团”等线上的支付渠道或电商平台等,作为交易第三方渠道。
如图2所示,图2中展示了分词处理和交叉验证处理的具体流程图,在图2中,银行获取的交易信息即为交易流水相关数据。而从交易流水相关数据中抽取交易数据,则可确定出客户号(图中未标出),商户类别码(即图中的MCC码),刷卡商户和银行记录的交易渠道。对交易流水相关数据中交易描述数据进行分词处理,可得到客户号(图中未标出),实际消费商户类别码,实际消费商户和交易第三方渠道;所述交易描述数据包括包含交易信息的文本字段,如信用卡中心会收到不同渠道反馈回来的文本字段。对从交易流水相关数据中抽取的交易数据和进行分词处理后的交易描述数据进行交叉验证处理,可通过交叉验证模块实现,最终确定不同客户的交易信息,其中,不同客户的交易信息可以包括交易渠道、交易商户和商户类别码。
通过分词处理和交叉验证处理,可应用于如下三种情况:
1)可实现对第三方渠道和电商平台的支付拆分:举一例,如应用支付宝进行的交易,在经传统的银行信贷风险预测方法对客户进行信贷风险预测时,原有的交易信息里,银行记录的交易渠道为线上交易,刷卡商户为支付宝,MCC码对应的是电商支付;而经本发明实施例中提供的银行信贷风险预测方法对交易描述数据拆分时,可确定出交易第三方渠道为支付宝;实际消费商户为沃尔玛,商户类别码对应的为超市;此时通过交叉验证处理,则会输出交叉验证后的与每一客户的交易信息,其中,该交易信息中包括交易渠道为支付宝,交易商户为沃尔玛,商户类别码为超市;
2)可实现线下连锁商户的合并及地区的细分:举一例,如深圳南山区科技园麦当劳店、北京海淀区中关村麦当劳店,虽然对应的POS机注册的交易商户不一样,但是都为麦当劳;对交易商户进行交叉验证可得出:交易渠道都为POS机。而交易所在地区通过分词处理可以细分到市、区的具体地区,而经传统的银行信贷风险预测方法对客户进行信贷风险预测时,银行记录的交易渠道仅为深圳、北京;
3)可实现对线上交易和线下交易的合并:举一例,微信支付下在麦当劳进行交易,记录的交易商户为腾讯的财付通商户,而线下刷卡方式下在麦当劳进行交易时,对应的交易商户为麦当劳,交易渠道为POS渠道。通过对从交易流水相关数据中抽取的交易数据和进行分词处理后的交易描述数据,进行交叉验证处理,可将微信支付时记录的交易商户,与刷卡支付时记录的交易商户进行统一,同时在不同交易所在地区的统一交易商户,如北京和深圳的统一交易商户,也可进行统一,由此实现了对与客户有关的全部交易信息进行综合分析的目的,有利于提高对客户进行信贷风险预测的准确度。
具体实施时,对交易流水相关数据进行分词处理,确定不同客户的交易信息的方法有多种,例如,可以包括:通过结巴分词组件,对交易流水相关数据进行分词处理,确定不同客户的交易信息。
实施例中,对交易流水相关数据进行分词处理,可以采用jieba(结巴)分词组件,或者其他分词组件,可获取交易流水相关数据中的客户的交易信息,如与不同交易对应的交易所在地区、交易渠道、交易商户(如交易商户名称)、商户类别码。其中jieba(结巴)分词组件可以包括结巴分词工具,该结巴分词工具是开源公开的中文分词工具,其作用为可以把一句话拆分成一个个词。
举一例,如交易流水相关数据中包括的一条交易描述信息如下所示:“财付通商户号-广州市钱大妈农产品有限公司”。通过分词处理,可将上述交易描述信息拆分成“广州市”、“财付通”、“钱大妈”、“农产品”,并对应存入到交易所在地区、交易渠道、交易商户、商户类别码类型的字段中。
在上述实施例中,通过分词处理和交叉验证处理,可确定交易流水相关数据中实际的交易商户和商户类别码,解决了现有技术不能对线上交易相关数据进行准确分析的问题,提高了银行信贷风险预测的适用性。
具体实施时,在对交易流水相关数据进行分词处理,确定不同客户的交易信息后,根据不同客户的交易信息,以每一客户和商户为节点,建立交易的异构图;所述异构图用于显示每一客户与不同商户间交易的金额,次数和渠道。
实施例中,根据不同客户的交易信息,以每一客户和商户为节点,建立交易的异构图的方法有多种,例如,可以包括:根据不同客户的交易信息,确定待建立异构图的边属性关系;所述边属性关系包括与每一客户节点对应的交易信息;根据待建立异构图的边属性关系,以每一客户和商户为节点,建立交易的异构图。
在上述实施例中,待建立异构图的边属性关系包括与每一客户节点对应的交易信息,其中,与每一客户节点对应的交易信息可以包括不同交易对应的交易所在地点、商户类别码,交易渠道,交际金额、交易时间和交易笔数等。在建立交易的异构图时,可以通过邻接表、邻接矩阵表示来客户与商户的关系,而对与每一客户节点对应的交易信息可通过独立的表进行存储。
举一例,如图3所示,图3中客户节点为客户A和B,与客户节点有交易关系的商户为商户A、B、C和D。建立异构图的边属性关系可包括图中的线条,不同粗细的线条展示了不同的交易信息,如图中展示的交易渠道,包括支付宝、POS机和微信等,异构图展示了不同客户节点在不同的交易中所涉及的商户间的关系。
具体实施时,在根据不同客户的交易信息,以每一客户和商户为节点,建立交易的异构图后,采用异构图神经网络算法,根据交易的异构图,确定每一客户的信贷风险预测值。
实施例中,采用异构图神经网络算法,根据交易的异构图,确定每一客户的信贷风险预测值的方法有多种,例如,可以包括:以预设置的交易参数对交易的异构图进行划分,得到多个异构图子图;所述交易参数包括交易渠道,交易频率和交易金额;采用异构图神经网络算法,根据多个异构图子图,确定每一客户的信贷风险预测值。
在上述实施例中,可根据预设置的交易参数,如不同的交易金额(大额、小额)、交易次数(高频、低频)和交易渠道等划分成不同的子图,为后续风险评估做准备。如图4所示,当发生套现交易时,有关低频交易和大额交易的异构图子图可以明显发现团伙聚集性,可认定客户的风险较高;而小额交易可能主要集中在日常的消费如地铁等,可认定客户的信贷风险较低。经实验验证,以预设置的交易次数对交易的异构图进行划分,可以提升对信贷风险预测的精准度。
具体实施时,采用异构图神经网络算法,根据多个异构图子图,确定每一客户的信贷风险预测值的方法有多种,例如,可以包括:针对每一异构图子图,采用异构图神经网络算法,根据该异构图子图建立信贷风险预测模型;所述信贷风险预测模型用于计算该异构图子图对应的每一客户的初始信贷风险预测值;根据对应每一异构图子图的信贷风险预测模型,确定每一客户的信贷风险预测值。
实施例中,根据对应每一异构图子图的信贷风险预测模型,确定每一客户的信贷风险预测值的方法有多种,例如,可以包括:将每一信贷风险预测模型中每一客户的初始信贷风险预测值,进行整合处理,确定每一客户的信贷风险预测值。其中,每一客户的信贷风险预测值可从对应该信贷风险预测模型的异构图子图中获取,如从异构图子图的边、节点、节点的邻接表或者邻接矩阵中获取。
实施例中,进行整合处理的方法有多种,例如,通过卷积神经网络算法中的全连接层,以及全局平均池化层等,进行多个异构图子图的输出整合。
在上述实施例中,通过异构图神经网络算法,可建立信贷风险预测模型,用于进行信贷风险评估。由于异构图自带的拓扑结构,因此需要通过图神经网络算法中的异构图神经网络算法,进行有监督地进行信贷风险预测模型训练。此处的图神经网络算法,可以选取RGCN(relation graph convolutional network,关系图卷积网络)、HGT(HeterogeneousGraph Transformer,异构图转换)等可以处理异构图的算法。如图5所示,通过对拆分后的子图,通过图神经网络输出对每个节点的预测值,然后输入到普通神经网络(可为卷积神经网络算法中的全连接层,以及全局平均池化层),进行整合后,可输出每一个客户节点的信贷风险预测值。通过异构图神经网络算法,可以避免同构图对交易信息的缺失,异构图的丰富信息可以让后续的信贷风险预测更为精准。在上述实施例中,本发明实施例还可将异构图转换为同构图,继而采用同构图的相关图神经网络算法进行信贷风险预测模型建模。
具体实施时,本发明实施例中提供的银行信贷风险预测方法还可以包括:根据客户的历史信用记录,对客户添加风险评估标签;采用异构图神经网络算法,根据交易的异构图,确定每一客户的信贷风险预测值,包括:采用异构图神经网络算法,根据交易的异构图,结合客户的风险评估标签,确定每一客户的信贷风险预测值。
实施例中,可根据通过客户已有的历史信用记录对客户进行添加风险评估标签,在确定每一客户的信贷风险预测值时,结合客户的风险评估标签,确定每一客户的信贷风险预测值,有利于提高信贷风险预测的精准度。
在上述实施例中,对客户添加风险评估标签可首先确定历史信用记录中的欺诈用户和优质客户,有利于提高信贷风险预测的精准度。
本发明实施例中,对交易流水相关数据进行分词处理,确定不同客户的交易信息;所述交易信息包括交易商户和商户类别码;根据不同客户的交易信息,以每一客户和商户为节点,建立交易的异构图;所述异构图用于显示每一客户与不同商户间交易的金额,次数和渠道;采用异构图神经网络算法,根据交易的异构图,确定每一客户的信贷风险预测值,从而可通过异构图显示每一客户与不同商户间交易的金额,次数和渠道,与现有技术对比,解决了传统技术下不能整合与客户有关的全部交易信息的问题,实现了对与客户有关的全部交易信息进行综合分析的目的,提高了对客户进行信贷风险预测的准确度。同时,通过分词处理,可确定交易流水相关数据中交易商户和商户类别码,解决了现有技术不能对线上交易相关数据进行准确分析的问题,提高了银行信贷风险预测的适用性。
如上所述,目前对客户的信贷风险预测方法,没有充分考虑到客户与商家消费行为之间的这种关系网络,无法充分挖掘交易信息间的异构图关系,如两个客户经常在相同时间相同商家消费,代表一定程度上客户的稳定性接近,但传统的预测方法无法自动发掘这种关联关系。由于消费的关系网络在第三方支付平台的情况下导致关系不清晰,往往是第三方支付平台对接大批量商户,银行对接第三方支付平台,降低了银行信贷风险预测的准确度。而本发明实施例通过对交易描述数据进行分词,提取关键信息并融合原有的信息,构建基于消费行为的关系图谱,通过消费时间、消费类型、消费渠道来构建多种消费关系的异构图。并针对已确定欺诈用户和优质客户数据,通过异构图神经网络算法进行网络结构的学习,对不同的关系下客户信息进行传递,最后对所有关系进行合并,输出用户的风险概率,得到风险评估模型。最后,对关系图中的其他客户进行风险评估。
本发明实施例中还提供了一种银行信贷风险预测装置,如下面的实施例所述。由于该装置解决问题的原理与银行信贷风险预测方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。
图6为本发明实施例中银行信贷风险预测装置的结构示意图,如图6所示,本发明实施例提供的一种银行信贷风险预测装置,可以包括:
分词模块01,用于对交易流水相关数据进行分词处理,确定不同客户的交易信息;所述交易信息包括交易商户和商户类别码;
异构图建立模块02,用于根据不同客户的交易信息,以每一客户和商户为节点,建立交易的异构图;所述异构图用于显示每一客户与不同商户间交易的金额,次数和渠道;
预测模块03,用于采用异构图神经网络算法,根据交易的异构图,确定每一客户的信贷风险预测值。
在一个实施例中,本发明实施例提供的银行信贷风险预测装置,还可以包括:
交易数据抽取模块,用于从交易流水相关数据中,以预设置的第一参数抽取交易数据;所述第一参数包括银行记录的交易商户和商户类别码;
分词模块,具体用于:对交易流水相关数据中交易描述数据,以预设置的第二参数进行分词处理;所述第二参数包括实际的交易商户和商户类别码;对从交易流水相关数据中抽取的交易数据和进行分词处理后的交易描述数据,进行交叉验证处理,确定不同客户的交易信息。
在一个实施例中,分词模块,具体用于:通过结巴分词组件,对交易流水相关数据进行分词处理,确定不同客户的交易信息。
在一个实施例中,异构图建立模块,具体用于:根据不同客户的交易信息,确定待建立异构图的边属性关系;所述边属性关系包括与每一客户节点对应的交易信息;根据待建立异构图的边属性关系,以每一客户和商户为节点,建立交易的异构图。
在一个实施例中,预测模块,具体用于:以预设置的交易参数对交易的异构图进行划分,得到多个异构图子图;所述交易参数包括交易渠道,交易频率和交易金额;采用异构图神经网络算法,根据多个异构图子图,确定每一客户的信贷风险预测值。
在一个实施例中,预测模块,具体用于:针对每一异构图子图,采用异构图神经网络算法,根据该异构图子图建立信贷风险预测模型;所述信贷风险预测模型用于计算该异构图子图对应的每一客户的初始信贷风险预测值;根据对应每一异构图子图的信贷风险预测模型,确定每一客户的信贷风险预测值。
在一个实施例中,预测模块,具体用于:将每一信贷风险预测模型中每一客户的初始信贷风险预测值,输入到图神经网络层进行整合处理,确定每一客户的信贷风险预测值。
在一个实施例中,本发明实施例提供的银行信贷风险预测装置,还可以包括:
标签添加模块,用于:根据客户的历史信用记录,对客户添加风险评估标签;
预测模块,具体用于:采用异构图神经网络算法,根据交易的异构图,结合客户的风险评估标签,确定每一客户的信贷风险预测值。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述银行信贷风险预测方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述银行信贷风险预测方法的计算机程序。
本发明实施例中,对交易流水相关数据进行分词处理,确定不同客户的交易信息;所述交易信息包括交易商户和商户类别码;根据不同客户的交易信息,以每一客户和商户为节点,建立交易的异构图;所述异构图用于显示每一客户与不同商户间交易的金额,次数和渠道;采用异构图神经网络算法,根据交易的异构图,确定每一客户的信贷风险预测值,从而可通过异构图显示每一客户与不同商户间交易的金额,次数和渠道,与现有技术对比,解决了传统技术下不能整合与客户有关的全部交易信息的问题,实现了对与客户有关的全部交易信息进行综合分析的目的,提高了对客户进行信贷风险预测的准确度。同时,通过分词处理,可确定交易流水相关数据中交易商户和商户类别码,解决了现有技术不能对线上交易相关数据进行准确分析的问题,提高了银行信贷风险预测的适用性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种银行信贷风险预测方法,其特征在于,包括:
对交易流水相关数据进行分词处理,确定不同客户的交易信息;所述交易信息包括交易商户和商户类别码;
根据不同客户的交易信息,以每一客户和商户为节点,建立交易的异构图;所述异构图用于显示每一客户与不同商户间交易的金额,次数和渠道;
采用异构图神经网络算法,根据交易的异构图,确定每一客户的信贷风险预测值;
根据不同客户的交易信息,以每一客户和商户为节点,建立交易的异构图,包括:
根据不同客户的交易信息,确定待建立异构图的边属性关系;所述边属性关系包括与每一客户节点对应的交易信息;根据待建立异构图的边属性关系,以每一客户和商户为节点,建立交易的异构图;
采用异构图神经网络算法,根据交易的异构图,确定每一客户的信贷风险预测值,包括:以预设置的交易参数对交易的异构图进行划分,得到多个异构图子图;所述交易参数包括交易渠道,交易频率和交易金额;采用异构图神经网络算法,根据多个异构图子图,确定每一客户的信贷风险预测值;
采用异构图神经网络算法,根据多个异构图子图,确定每一客户的信贷风险预测值,包括:针对每一异构图子图,采用异构图神经网络算法,根据该异构图子图建立信贷风险预测模型;所述信贷风险预测模型用于计算该异构图子图对应的每一客户的初始信贷风险预测值;根据对应每一异构图子图的信贷风险预测模型,确定每一客户的信贷风险预测值;
根据对应每一异构图子图的信贷风险预测模型,确定每一客户的信贷风险预测值,包括:将每一信贷风险预测模型中每一客户的初始信贷风险预测值进行整合处理,确定每一客户的信贷风险预测值。
2.如权利要求1所述的方法,其特征在于,还包括:从交易流水相关数据中,以预设置的第一参数抽取交易数据;所述第一参数包括银行记录的交易商户和商户类别码;
对交易流水相关数据进行分词处理,确定不同客户的交易信息,包括:
对交易流水相关数据中交易描述数据,以预设置的第二参数进行分词处理;所述第二参数包括实际的交易商户和商户类别码;所述交易描述数据包括包含交易信息的文本字段;
对从交易流水相关数据中抽取的交易数据和进行分词处理后的交易描述数据,进行交叉验证处理,确定不同客户的交易信息。
3.如权利要求1所述的方法,其特征在于,对交易流水相关数据进行分词处理,确定不同客户的交易信息,包括:
通过结巴分词组件,对交易流水相关数据进行分词处理,确定不同客户的交易信息。
4.如权利要求1所述的方法,其特征在于,还包括:
根据客户的历史信用记录,对客户添加风险评估标签;
采用异构图神经网络算法,根据交易的异构图,确定每一客户的信贷风险预测值,包括:
采用异构图神经网络算法,根据交易的异构图,结合客户的风险评估标签,确定每一客户的信贷风险预测值。
5.一种银行信贷风险预测装置,其特征在于,包括:
分词模块,用于对交易流水相关数据进行分词处理,确定不同客户的交易信息;所述交易信息包括交易商户和商户类别码;
异构图建立模块,用于根据不同客户的交易信息,以每一客户和商户为节点,建立交易的异构图;所述异构图用于显示每一客户与不同商户间交易的金额,次数和渠道;
预测模块,用于采用异构图神经网络算法,根据交易的异构图,确定每一客户的信贷风险预测值;
异构图建立模块,具体用于:根据不同客户的交易信息,确定待建立异构图的边属性关系;所述边属性关系包括与每一客户节点对应的交易信息;根据待建立异构图的边属性关系,以每一客户和商户为节点,建立交易的异构图;
预测模块,具体用于:以预设置的交易参数对交易的异构图进行划分,得到多个异构图子图;所述交易参数包括交易渠道,交易频率和交易金额;采用异构图神经网络算法,根据多个异构图子图,确定每一客户的信贷风险预测值;采用异构图神经网络算法,根据多个异构图子图,确定每一客户的信贷风险预测值,包括:针对每一异构图子图,采用异构图神经网络算法,根据该异构图子图建立信贷风险预测模型;所述信贷风险预测模型用于计算该异构图子图对应的每一客户的初始信贷风险预测值;根据对应每一异构图子图的信贷风险预测模型,确定每一客户的信贷风险预测值;根据对应每一异构图子图的信贷风险预测模型,确定每一客户的信贷风险预测值,包括:将每一信贷风险预测模型中每一客户的初始信贷风险预测值进行整合处理,确定每一客户的信贷风险预测值。
6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4任一所述方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至4任一所述方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010908828.2A CN112037038B (zh) | 2020-09-02 | 2020-09-02 | 银行信贷风险预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010908828.2A CN112037038B (zh) | 2020-09-02 | 2020-09-02 | 银行信贷风险预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112037038A CN112037038A (zh) | 2020-12-04 |
CN112037038B true CN112037038B (zh) | 2024-05-28 |
Family
ID=73591157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010908828.2A Active CN112037038B (zh) | 2020-09-02 | 2020-09-02 | 银行信贷风险预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112037038B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112699938B (zh) * | 2020-12-30 | 2024-01-05 | 北京邮电大学 | 一种基于图卷积网络模型的分类方法及装置 |
CN112785155B (zh) * | 2021-01-22 | 2023-04-07 | 中信银行股份有限公司 | 一种客户网络特征的标签传播算法的风险识别方法及系统 |
CN113554099A (zh) * | 2021-07-27 | 2021-10-26 | 中国银联股份有限公司 | 一种识别异常商户的方法及装置 |
CN113919630A (zh) * | 2021-09-01 | 2022-01-11 | 深圳云天励飞技术股份有限公司 | 一种企业经济犯罪侦查方法、系统及设备 |
CN115860904A (zh) * | 2022-11-14 | 2023-03-28 | 中科聚信信息技术(北京)有限公司 | 信贷异常群体挖掘方法及装置 |
CN116091208B (zh) * | 2023-01-16 | 2023-10-27 | 张一超 | 基于图神经网络的信贷风险企业识别方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103460A (zh) * | 2017-03-27 | 2017-08-29 | 杭州呯嘭智能技术有限公司 | 基于信用大数据的跨境支付快速结算方法 |
CN109191110A (zh) * | 2018-07-27 | 2019-01-11 | 阿里巴巴集团控股有限公司 | 后付费交易数据处理方法、装置、处理设备、及服务器 |
CN111127185A (zh) * | 2019-11-25 | 2020-05-08 | 北京明略软件系统有限公司 | 信贷欺诈识别模型构建方法及装置 |
CN111309983A (zh) * | 2020-03-10 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 基于异构图进行业务处理的方法及装置 |
CN111400560A (zh) * | 2020-03-10 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 一种基于异构图神经网络模型进行预测的方法和系统 |
-
2020
- 2020-09-02 CN CN202010908828.2A patent/CN112037038B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103460A (zh) * | 2017-03-27 | 2017-08-29 | 杭州呯嘭智能技术有限公司 | 基于信用大数据的跨境支付快速结算方法 |
CN109191110A (zh) * | 2018-07-27 | 2019-01-11 | 阿里巴巴集团控股有限公司 | 后付费交易数据处理方法、装置、处理设备、及服务器 |
CN111127185A (zh) * | 2019-11-25 | 2020-05-08 | 北京明略软件系统有限公司 | 信贷欺诈识别模型构建方法及装置 |
CN111309983A (zh) * | 2020-03-10 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 基于异构图进行业务处理的方法及装置 |
CN111400560A (zh) * | 2020-03-10 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 一种基于异构图神经网络模型进行预测的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112037038A (zh) | 2020-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112037038B (zh) | 银行信贷风险预测方法及装置 | |
De Witte et al. | Is a little sunshine all we need? On the impact of sunshine regulation on profits, productivity and prices in the Dutch drinking water sector | |
US8924279B2 (en) | Risk assessment rule set application for fraud prevention | |
US9336524B2 (en) | System and method for tracking the secondary gift card marketplace | |
WO2020143345A1 (zh) | 仓单质押的信贷风险监控方法及装置 | |
US8706596B2 (en) | Account portfolio risk characterization | |
CN111080338B (zh) | 用户数据的处理方法、装置、电子设备及存储介质 | |
CN102203775A (zh) | 市场动态 | |
Silva et al. | Assessing the advancement of new renewable energy sources in Latin American and Caribbean countries | |
US9558490B2 (en) | Systems and methods for predicting a merchant's change of acquirer | |
CN111767319A (zh) | 基于资金流向的客户挖掘方法及装置 | |
CN111932310A (zh) | 一种银行产品的潜在对公客户挖掘方法及装置 | |
CN106875595A (zh) | 一种pos终端使用地点的确定方法及装置 | |
WO2022136692A1 (en) | Method for calculating at least one score representative of a probable activity breakage of a merchant, system, apparatus and corresponding computer program | |
CN113159924A (zh) | 授信客户对象的确定方法及装置 | |
CN112330373A (zh) | 用户行为分析方法、装置及计算机可读存储介质 | |
CN110910241B (zh) | 现金流评估方法、装置、服务器设备及存储介质 | |
CN116051272A (zh) | 企业风险分析方法及相关设备 | |
KR20050036972A (ko) | 포트폴리오 평가 시스템, 컴퓨터 및 컴퓨터 프로그램 | |
CN115545909A (zh) | 一种审批方法、装置、设备及存储介质 | |
CN115660814A (zh) | 风险预测方法、装置、计算机可读存储介质及电子设备 | |
US20230100685A1 (en) | Financial product information collecting platform system, financial product information collecting method, and computer program for the same | |
US20140344040A1 (en) | Transaction linked merchant data collection | |
US20170200176A1 (en) | Systems and methods for tracking consumer spend behaviors | |
CN113870007A (zh) | 一种产品推荐方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |