CN114638696A - 信贷风险预测模型的训练方法及系统 - Google Patents

信贷风险预测模型的训练方法及系统 Download PDF

Info

Publication number
CN114638696A
CN114638696A CN202210367094.0A CN202210367094A CN114638696A CN 114638696 A CN114638696 A CN 114638696A CN 202210367094 A CN202210367094 A CN 202210367094A CN 114638696 A CN114638696 A CN 114638696A
Authority
CN
China
Prior art keywords
prediction model
credit risk
risk prediction
training
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210367094.0A
Other languages
English (en)
Inventor
韩彧
苏树清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Weiyan Technology Co ltd
Original Assignee
Shenzhen Weiyan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Weiyan Technology Co ltd filed Critical Shenzhen Weiyan Technology Co ltd
Priority to CN202210367094.0A priority Critical patent/CN114638696A/zh
Publication of CN114638696A publication Critical patent/CN114638696A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Abstract

本发明公开了一种信贷风险预测模型的训练方法及系统,涉及信贷风险领域。本发明包括以下步骤:获取经济数据样本,经济数据样本包括宏观经济状况,金融机构状况以及信贷者经济状况;将经济数据样本分为训练样本和测试样本;将训练样本输入到预先建立的BP神经网络中,对BP神经网络进行训练,得到第一信贷风险预测模型;将测试样本输入到所述第一信贷风险预测模型中,对所述第一信贷风险预测模型测试,并利用损失函数对所述第一信贷风险预测模型校正,得到信贷风险预测模型。本发明通过建立银行不良信贷风险评估模型,根据银行不良信贷风险评估指数公式对银行中各个不良信贷指标进行优化处理,从而得到海量数据下的银行不良信贷风险评估结果。

Description

信贷风险预测模型的训练方法及系统
技术领域
本发明涉及信贷风险领域,更具体的说是涉及信贷风险预测模型的训练方法及系统。
背景技术
随着现代经济的发展,银行是金融业的主要实体,银行业的稳定影响着整个社会的稳定。信贷风险在银行经营中不可回避,它使得商业银行面临信贷资产损失的可能。银行信贷风险管理要求对风险尽早识别,为管理层在决策阶段获得主动性,从而降低不良贷款发生率,减少信贷资产损失。
利用传统算法进行海量数据下的银行不良信贷风险评估过程中,由于不良信贷风险的影响因素具有海量性、冗余性,无法根据银行在经营中产生的海量数据信息对银行不良信贷风险进行准确的评估。因此,如何解决上述问题是本领域技术人员亟需解决的。
发明内容
有鉴于此,本发明提供了一种信贷风险预测模型的训练方法及系统,以解决背景技术中存在的问题。
为了实现上述目的,本发明采用如下技术方案:
一种信贷风险预测模型的训练方法,包括以下步骤:
获取经济数据样本,所述经济数据样本包括宏观经济状况,金融机构状况以及信贷者经济状况;
将经济数据样本分为训练样本和测试样本;
将训练样本输入到预先建立的BP神经网络中,对BP神经网络进行训练,得到第一信贷风险预测模型;
将测试样本输入到所述第一信贷风险预测模型中,对所述第一信贷风险预测模型测试,并利用损失函数对所述第一信贷风险预测模型校正,得到信贷风险预测模型。
可选的,还包括对经济数据样本进行多维信息衍生,并利用模糊评价模型对衍生出的多维信息进行评价,并挑选符合预先设定阈值的多维信息。
以上技术方案具有以下有益效果:
通过模糊评价模型科学客观地评估信贷者的状况,避免商业银行放贷的盲目性,加强商业银行信贷资产管控和预防不良贷款的能力。
可选的,把衍生出的多维信息做WOE转换后,当作新的衍生变量放入到经济数据样本中。
可选的,对所述经济数据样本的关联数据进行预处理,并基于所述资源描述框架,自预处理后的经济数据样本的关联数据中抽取经济数据样本的实体三元组数据,以建立新的经济数据样本的知识图谱或更新预存储的经济数据样本知识图谱,并将知识图谱作为训练样本和测试样本。
可选的,还包括利用RS理论和BP神经网络共同构建第一信贷风险预测模型。
可选的,所述损失函数采用权重交叉熵损失函数,以调整权重。
可选的,将经济数据样本分为两部分,其中,70%为训练样本,30%为测试样本。
一种信贷风险预测模型的训练系统,包括:
样本获取模块:用于获取经济数据样本,所述经济数据样本包括宏观经济状况,金融机构状况以及信贷者经济状况;
样本分类模块:用于将经济数据样本分为训练样本和测试样本;
训练模块:用于将训练样本输入到预先建立的BP神经网络中,对BP神经网络进行训练,得到第一信贷风险预测模型;
信贷风险预测模型校正模块:将测试样本输入到所述第一信贷风险预测模型中,对所述第一信贷风险预测模型测试,并利用损失函数对所述第一信贷风险预测模型校正,得到信贷风险预测模型。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了信贷风险预测模型的训练方法及系统,通过建立银行不良信贷风险评估模型,根据银行不良信贷风险评估指数公式对银行中各个不良信贷指标进行优化处理,从而得到海量数据下的银行不良信贷风险评估结果。同时能够有效提高信贷风险预测的准确性、全面性及可靠性,且能够有效提高输出的信贷风险预测结果的信息全面性,进而能够有效提高基于信贷风险预测结果进行信贷风险防控的效率、准确性及可靠性,有效节省人力及时间成本,并能够提高防控人员的用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明的流程示意图;
图2为本发明的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种信贷风险预测模型的训练方法,如图1所示,包括以下步骤:
获取经济数据样本,经济数据样本包括宏观经济状况,金融机构状况以及信贷者经济状况;
将经济数据样本分为训练样本和测试样本;需要说明的是,将经济数据样本分为两部分,其中,70%为训练样本,30%为测试样本。
将训练样本输入到预先建立的BP神经网络中,对BP神经网络进行训练,得到第一信贷风险预测模型;
将测试样本输入到第一信贷风险预测模型中,对第一信贷风险预测模型测试,并利用损失函数对第一信贷风险预测模型校正,得到信贷风险预测模型。损失函数采用权重交叉熵损失函数,以调整权重。
其中,还包括对经济数据样本进行多维信息衍生,并利用模糊评价模型对衍生出的多维信息进行评价,并挑选符合预先设定阈值的多维信息。通过模糊评价模型科学客观地评估企业的信贷状况,避免商业银行放贷的盲目性,加强商业银行信贷资产管控和预防不良贷款的能力。
进一步的,把衍生出的多维信息做WOE转换后,当作新的衍生变量放入到经济数据样本中。
更进一步的,在进行海量数据下的银行不良信贷风险评估过程中,建立神经网络模型,其中包含了多个银行不良信贷信息的输入层、隐含层和输出层,隐含层又称扩展层,由于各个神经元具有较强的关联性,将每层的银行不良信贷信息神经元进行相互连接,从而完成基于神经网络的优化建模。
在本实施例中,对经济数据样本的关联数据进行预处理,并基于资源描述框架,自预处理后的经济数据样本的关联数据中抽取经济数据样本的实体三元组数据,以建立新的经济数据样本的知识图谱或更新预存储的经济数据样本知识图谱,并将知识图谱作为训练样本和测试样本。
在另一实施例中,还可以利用RS理论和BP神经网络共同构建第一信贷风险预测模型,具体如下:
1)根据RS理论构建银行不良信贷信息风险评估指标体系,并剔除大量的冗余信息。
2)利用函数f:U×R→V对输入数据进行变量离散化处理,确定各个银行不良信贷风险影响因素的非线性关系。
3)进行属性约简,提取有效的特征数据,形成简化的决策规则,从而能够得到精确的模型输入数据。
4)将RS理论与BP模型相结合,建立新的银行不良信贷风险评估模型。
在本实施例中还公开了一种信贷风险预测模型的训练系统,如图2所示,包括:
样本获取模块:用于获取经济数据样本,经济数据样本包括宏观经济状况,金融机构状况以及信贷者经济状况;
样本分类模块:用于将经济数据样本分为训练样本和测试样本;
训练模块:用于将训练样本输入到预先建立的BP神经网络中,对BP神经网络进行训练,得到第一信贷风险预测模型;
信贷风险预测模型校正模块:将测试样本输入到第一信贷风险预测模型中,对第一信贷风险预测模型测试,并利用损失函数对第一信贷风险预测模型校正,得到信贷风险预测模型。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种信贷风险预测模型的训练方法,其特征在于,包括以下步骤:
获取经济数据样本,所述经济数据样本包括宏观经济状况,金融机构状况以及信贷者经济状况;
将经济数据样本分为训练样本和测试样本;
将训练样本输入到预先建立的BP神经网络中,对BP神经网络进行训练,得到第一信贷风险预测模型;
将测试样本输入到所述第一信贷风险预测模型中,对所述第一信贷风险预测模型测试,并利用损失函数对所述第一信贷风险预测模型校正,得到信贷风险预测模型。
2.根据权利要求1所述的一种信贷风险预测模型的训练方法,其特征在于,还包括对经济数据样本进行多维信息衍生,并利用模糊评价模型对衍生出的多维信息进行评价,并挑选符合预先设定阈值的多维信息。
3.根据权利要求2所述的一种信贷风险预测模型的训练方法,其特征在于,把衍生出的多维信息做WOE转换后,当作新的衍生变量放入到经济数据样本中。
4.根据权利要求1所述的一种信贷风险预测模型的训练方法,其特征在于,对所述经济数据样本的关联数据进行预处理,并基于所述资源描述框架,自预处理后的经济数据样本的关联数据中抽取经济数据样本的实体三元组数据,以建立新的经济数据样本的知识图谱或更新预存储的经济数据样本知识图谱,并将知识图谱作为训练样本和测试样本。
5.根据权利要求1所述的一种信贷风险预测模型的训练方法,其特征在于,还包括利用RS理论和BP神经网络共同构建第一信贷风险预测模型。
6.根据权利要求1所述的一种信贷风险预测模型的训练方法,其特征在于,所述损失函数采用权重交叉熵损失函数,以调整权重。
7.根据权利要求1所述的一种信贷风险预测模型的训练方法,其特征在于,将经济数据样本分为两部分,其中,70%为训练样本,30%为测试样本。
8.一种信贷风险预测模型的训练系统,其特征在于,包括:
样本获取模块:用于获取经济数据样本,所述经济数据样本包括宏观经济状况,金融机构状况以及信贷者经济状况;
样本分类模块:用于将经济数据样本分为训练样本和测试样本;
训练模块:用于将训练样本输入到预先建立的BP神经网络中,对BP神经网络进行训练,得到第一信贷风险预测模型;
信贷风险预测模型校正模块:将测试样本输入到所述第一信贷风险预测模型中,对所述第一信贷风险预测模型测试,并利用损失函数对所述第一信贷风险预测模型校正,得到信贷风险预测模型。
CN202210367094.0A 2022-04-08 2022-04-08 信贷风险预测模型的训练方法及系统 Pending CN114638696A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210367094.0A CN114638696A (zh) 2022-04-08 2022-04-08 信贷风险预测模型的训练方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210367094.0A CN114638696A (zh) 2022-04-08 2022-04-08 信贷风险预测模型的训练方法及系统

Publications (1)

Publication Number Publication Date
CN114638696A true CN114638696A (zh) 2022-06-17

Family

ID=81951225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210367094.0A Pending CN114638696A (zh) 2022-04-08 2022-04-08 信贷风险预测模型的训练方法及系统

Country Status (1)

Country Link
CN (1) CN114638696A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115689720A (zh) * 2022-09-02 2023-02-03 睿智合创(北京)科技有限公司 一种基于风险归因的新增风险监控系统
CN115934809A (zh) * 2023-03-08 2023-04-07 北京嘀嘀无限科技发展有限公司 一种数据处理方法、装置和电子设备
CN117094566A (zh) * 2023-10-19 2023-11-21 中节能大数据有限公司 一种视图导向的企业管理分析策略方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115689720A (zh) * 2022-09-02 2023-02-03 睿智合创(北京)科技有限公司 一种基于风险归因的新增风险监控系统
CN115934809A (zh) * 2023-03-08 2023-04-07 北京嘀嘀无限科技发展有限公司 一种数据处理方法、装置和电子设备
CN115934809B (zh) * 2023-03-08 2023-07-18 北京嘀嘀无限科技发展有限公司 一种数据处理方法、装置和电子设备
CN117094566A (zh) * 2023-10-19 2023-11-21 中节能大数据有限公司 一种视图导向的企业管理分析策略方法
CN117094566B (zh) * 2023-10-19 2024-01-02 中节能大数据有限公司 一种视图导向的企业管理分析策略方法

Similar Documents

Publication Publication Date Title
Huang et al. An empirical analysis of data preprocessing for machine learning-based software cost estimation
CN114638696A (zh) 信贷风险预测模型的训练方法及系统
TWI690865B (zh) 交易量的預測方法及裝置
US9449344B2 (en) Dynamically retraining a prediction model based on real time transaction data
CN107424070A (zh) 一种基于机器学习的贷款用户信用评级方法及系统
CN106952155A (zh) 一种基于信用评分的催收方法及装置
CN105825342A (zh) 一种管道失效可能性评价方法及系统
CN110738564A (zh) 贷后风险评估方法及装置、存储介质
CN102117459A (zh) 风险控制系统及方法
Chen et al. A study of ANFIS-based multi-factor time series models for forecasting stock index
CN108898476A (zh) 一种贷款客户信用评分方法和装置
CN104778622A (zh) Tps交易事件阈值的预测方法及预测系统
CN108492001A (zh) 一种用于担保贷款网络风险管理的方法
CN110348977A (zh) 基于多层模型结构的金融风险分析方法、装置及电子设备
CN108898480A (zh) 用于授信贷款的贷款等级评估系统及方法
US20180314952A1 (en) Artificially intelligent historical analysis modeling and computer transaction ranking
CN106407305A (zh) 一种数据挖掘系统和方法
CN112037005B (zh) 一种评分卡的融合方法、装置、计算机设备及存储介质
CN116522912B (zh) 一种包装设计语言模型的训练方法、装置、介质及设备
CN112766814A (zh) 一种信用风险压力测试模型的训练方法、装置及设备
Xie et al. A Big Data Technique for Internet Financial Risk Control
CN112329862A (zh) 基于决策树的反洗钱方法及系统
CN110059126B (zh) 基于lkj异常值数据的复杂关联网络分析方法及系统
CN116596674A (zh) 基于大数据分析的对外贸易风险评估方法
KR20110114181A (ko) 예측 정확성이 향상된 대출 심사 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination