CN114638696A - 信贷风险预测模型的训练方法及系统 - Google Patents
信贷风险预测模型的训练方法及系统 Download PDFInfo
- Publication number
- CN114638696A CN114638696A CN202210367094.0A CN202210367094A CN114638696A CN 114638696 A CN114638696 A CN 114638696A CN 202210367094 A CN202210367094 A CN 202210367094A CN 114638696 A CN114638696 A CN 114638696A
- Authority
- CN
- China
- Prior art keywords
- prediction model
- credit risk
- risk prediction
- training
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Abstract
本发明公开了一种信贷风险预测模型的训练方法及系统,涉及信贷风险领域。本发明包括以下步骤:获取经济数据样本,经济数据样本包括宏观经济状况,金融机构状况以及信贷者经济状况;将经济数据样本分为训练样本和测试样本;将训练样本输入到预先建立的BP神经网络中,对BP神经网络进行训练,得到第一信贷风险预测模型;将测试样本输入到所述第一信贷风险预测模型中,对所述第一信贷风险预测模型测试,并利用损失函数对所述第一信贷风险预测模型校正,得到信贷风险预测模型。本发明通过建立银行不良信贷风险评估模型,根据银行不良信贷风险评估指数公式对银行中各个不良信贷指标进行优化处理,从而得到海量数据下的银行不良信贷风险评估结果。
Description
技术领域
本发明涉及信贷风险领域,更具体的说是涉及信贷风险预测模型的训练方法及系统。
背景技术
随着现代经济的发展,银行是金融业的主要实体,银行业的稳定影响着整个社会的稳定。信贷风险在银行经营中不可回避,它使得商业银行面临信贷资产损失的可能。银行信贷风险管理要求对风险尽早识别,为管理层在决策阶段获得主动性,从而降低不良贷款发生率,减少信贷资产损失。
利用传统算法进行海量数据下的银行不良信贷风险评估过程中,由于不良信贷风险的影响因素具有海量性、冗余性,无法根据银行在经营中产生的海量数据信息对银行不良信贷风险进行准确的评估。因此,如何解决上述问题是本领域技术人员亟需解决的。
发明内容
有鉴于此,本发明提供了一种信贷风险预测模型的训练方法及系统,以解决背景技术中存在的问题。
为了实现上述目的,本发明采用如下技术方案:
一种信贷风险预测模型的训练方法,包括以下步骤:
获取经济数据样本,所述经济数据样本包括宏观经济状况,金融机构状况以及信贷者经济状况;
将经济数据样本分为训练样本和测试样本;
将训练样本输入到预先建立的BP神经网络中,对BP神经网络进行训练,得到第一信贷风险预测模型;
将测试样本输入到所述第一信贷风险预测模型中,对所述第一信贷风险预测模型测试,并利用损失函数对所述第一信贷风险预测模型校正,得到信贷风险预测模型。
可选的,还包括对经济数据样本进行多维信息衍生,并利用模糊评价模型对衍生出的多维信息进行评价,并挑选符合预先设定阈值的多维信息。
以上技术方案具有以下有益效果:
通过模糊评价模型科学客观地评估信贷者的状况,避免商业银行放贷的盲目性,加强商业银行信贷资产管控和预防不良贷款的能力。
可选的,把衍生出的多维信息做WOE转换后,当作新的衍生变量放入到经济数据样本中。
可选的,对所述经济数据样本的关联数据进行预处理,并基于所述资源描述框架,自预处理后的经济数据样本的关联数据中抽取经济数据样本的实体三元组数据,以建立新的经济数据样本的知识图谱或更新预存储的经济数据样本知识图谱,并将知识图谱作为训练样本和测试样本。
可选的,还包括利用RS理论和BP神经网络共同构建第一信贷风险预测模型。
可选的,所述损失函数采用权重交叉熵损失函数,以调整权重。
可选的,将经济数据样本分为两部分,其中,70%为训练样本,30%为测试样本。
一种信贷风险预测模型的训练系统,包括:
样本获取模块:用于获取经济数据样本,所述经济数据样本包括宏观经济状况,金融机构状况以及信贷者经济状况;
样本分类模块:用于将经济数据样本分为训练样本和测试样本;
训练模块:用于将训练样本输入到预先建立的BP神经网络中,对BP神经网络进行训练,得到第一信贷风险预测模型;
信贷风险预测模型校正模块:将测试样本输入到所述第一信贷风险预测模型中,对所述第一信贷风险预测模型测试,并利用损失函数对所述第一信贷风险预测模型校正,得到信贷风险预测模型。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了信贷风险预测模型的训练方法及系统,通过建立银行不良信贷风险评估模型,根据银行不良信贷风险评估指数公式对银行中各个不良信贷指标进行优化处理,从而得到海量数据下的银行不良信贷风险评估结果。同时能够有效提高信贷风险预测的准确性、全面性及可靠性,且能够有效提高输出的信贷风险预测结果的信息全面性,进而能够有效提高基于信贷风险预测结果进行信贷风险防控的效率、准确性及可靠性,有效节省人力及时间成本,并能够提高防控人员的用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明的流程示意图;
图2为本发明的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种信贷风险预测模型的训练方法,如图1所示,包括以下步骤:
获取经济数据样本,经济数据样本包括宏观经济状况,金融机构状况以及信贷者经济状况;
将经济数据样本分为训练样本和测试样本;需要说明的是,将经济数据样本分为两部分,其中,70%为训练样本,30%为测试样本。
将训练样本输入到预先建立的BP神经网络中,对BP神经网络进行训练,得到第一信贷风险预测模型;
将测试样本输入到第一信贷风险预测模型中,对第一信贷风险预测模型测试,并利用损失函数对第一信贷风险预测模型校正,得到信贷风险预测模型。损失函数采用权重交叉熵损失函数,以调整权重。
其中,还包括对经济数据样本进行多维信息衍生,并利用模糊评价模型对衍生出的多维信息进行评价,并挑选符合预先设定阈值的多维信息。通过模糊评价模型科学客观地评估企业的信贷状况,避免商业银行放贷的盲目性,加强商业银行信贷资产管控和预防不良贷款的能力。
进一步的,把衍生出的多维信息做WOE转换后,当作新的衍生变量放入到经济数据样本中。
更进一步的,在进行海量数据下的银行不良信贷风险评估过程中,建立神经网络模型,其中包含了多个银行不良信贷信息的输入层、隐含层和输出层,隐含层又称扩展层,由于各个神经元具有较强的关联性,将每层的银行不良信贷信息神经元进行相互连接,从而完成基于神经网络的优化建模。
在本实施例中,对经济数据样本的关联数据进行预处理,并基于资源描述框架,自预处理后的经济数据样本的关联数据中抽取经济数据样本的实体三元组数据,以建立新的经济数据样本的知识图谱或更新预存储的经济数据样本知识图谱,并将知识图谱作为训练样本和测试样本。
在另一实施例中,还可以利用RS理论和BP神经网络共同构建第一信贷风险预测模型,具体如下:
1)根据RS理论构建银行不良信贷信息风险评估指标体系,并剔除大量的冗余信息。
2)利用函数f:U×R→V对输入数据进行变量离散化处理,确定各个银行不良信贷风险影响因素的非线性关系。
3)进行属性约简,提取有效的特征数据,形成简化的决策规则,从而能够得到精确的模型输入数据。
4)将RS理论与BP模型相结合,建立新的银行不良信贷风险评估模型。
在本实施例中还公开了一种信贷风险预测模型的训练系统,如图2所示,包括:
样本获取模块:用于获取经济数据样本,经济数据样本包括宏观经济状况,金融机构状况以及信贷者经济状况;
样本分类模块:用于将经济数据样本分为训练样本和测试样本;
训练模块:用于将训练样本输入到预先建立的BP神经网络中,对BP神经网络进行训练,得到第一信贷风险预测模型;
信贷风险预测模型校正模块:将测试样本输入到第一信贷风险预测模型中,对第一信贷风险预测模型测试,并利用损失函数对第一信贷风险预测模型校正,得到信贷风险预测模型。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (8)
1.一种信贷风险预测模型的训练方法,其特征在于,包括以下步骤:
获取经济数据样本,所述经济数据样本包括宏观经济状况,金融机构状况以及信贷者经济状况;
将经济数据样本分为训练样本和测试样本;
将训练样本输入到预先建立的BP神经网络中,对BP神经网络进行训练,得到第一信贷风险预测模型;
将测试样本输入到所述第一信贷风险预测模型中,对所述第一信贷风险预测模型测试,并利用损失函数对所述第一信贷风险预测模型校正,得到信贷风险预测模型。
2.根据权利要求1所述的一种信贷风险预测模型的训练方法,其特征在于,还包括对经济数据样本进行多维信息衍生,并利用模糊评价模型对衍生出的多维信息进行评价,并挑选符合预先设定阈值的多维信息。
3.根据权利要求2所述的一种信贷风险预测模型的训练方法,其特征在于,把衍生出的多维信息做WOE转换后,当作新的衍生变量放入到经济数据样本中。
4.根据权利要求1所述的一种信贷风险预测模型的训练方法,其特征在于,对所述经济数据样本的关联数据进行预处理,并基于所述资源描述框架,自预处理后的经济数据样本的关联数据中抽取经济数据样本的实体三元组数据,以建立新的经济数据样本的知识图谱或更新预存储的经济数据样本知识图谱,并将知识图谱作为训练样本和测试样本。
5.根据权利要求1所述的一种信贷风险预测模型的训练方法,其特征在于,还包括利用RS理论和BP神经网络共同构建第一信贷风险预测模型。
6.根据权利要求1所述的一种信贷风险预测模型的训练方法,其特征在于,所述损失函数采用权重交叉熵损失函数,以调整权重。
7.根据权利要求1所述的一种信贷风险预测模型的训练方法,其特征在于,将经济数据样本分为两部分,其中,70%为训练样本,30%为测试样本。
8.一种信贷风险预测模型的训练系统,其特征在于,包括:
样本获取模块:用于获取经济数据样本,所述经济数据样本包括宏观经济状况,金融机构状况以及信贷者经济状况;
样本分类模块:用于将经济数据样本分为训练样本和测试样本;
训练模块:用于将训练样本输入到预先建立的BP神经网络中,对BP神经网络进行训练,得到第一信贷风险预测模型;
信贷风险预测模型校正模块:将测试样本输入到所述第一信贷风险预测模型中,对所述第一信贷风险预测模型测试,并利用损失函数对所述第一信贷风险预测模型校正,得到信贷风险预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210367094.0A CN114638696A (zh) | 2022-04-08 | 2022-04-08 | 信贷风险预测模型的训练方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210367094.0A CN114638696A (zh) | 2022-04-08 | 2022-04-08 | 信贷风险预测模型的训练方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114638696A true CN114638696A (zh) | 2022-06-17 |
Family
ID=81951225
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210367094.0A Pending CN114638696A (zh) | 2022-04-08 | 2022-04-08 | 信贷风险预测模型的训练方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114638696A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115689720A (zh) * | 2022-09-02 | 2023-02-03 | 睿智合创(北京)科技有限公司 | 一种基于风险归因的新增风险监控系统 |
CN115934809A (zh) * | 2023-03-08 | 2023-04-07 | 北京嘀嘀无限科技发展有限公司 | 一种数据处理方法、装置和电子设备 |
CN117094566A (zh) * | 2023-10-19 | 2023-11-21 | 中节能大数据有限公司 | 一种视图导向的企业管理分析策略方法 |
-
2022
- 2022-04-08 CN CN202210367094.0A patent/CN114638696A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115689720A (zh) * | 2022-09-02 | 2023-02-03 | 睿智合创(北京)科技有限公司 | 一种基于风险归因的新增风险监控系统 |
CN115934809A (zh) * | 2023-03-08 | 2023-04-07 | 北京嘀嘀无限科技发展有限公司 | 一种数据处理方法、装置和电子设备 |
CN115934809B (zh) * | 2023-03-08 | 2023-07-18 | 北京嘀嘀无限科技发展有限公司 | 一种数据处理方法、装置和电子设备 |
CN117094566A (zh) * | 2023-10-19 | 2023-11-21 | 中节能大数据有限公司 | 一种视图导向的企业管理分析策略方法 |
CN117094566B (zh) * | 2023-10-19 | 2024-01-02 | 中节能大数据有限公司 | 一种视图导向的企业管理分析策略方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | An empirical analysis of data preprocessing for machine learning-based software cost estimation | |
CN114638696A (zh) | 信贷风险预测模型的训练方法及系统 | |
TWI690865B (zh) | 交易量的預測方法及裝置 | |
US9449344B2 (en) | Dynamically retraining a prediction model based on real time transaction data | |
CN107424070A (zh) | 一种基于机器学习的贷款用户信用评级方法及系统 | |
CN106952155A (zh) | 一种基于信用评分的催收方法及装置 | |
CN105825342A (zh) | 一种管道失效可能性评价方法及系统 | |
CN110738564A (zh) | 贷后风险评估方法及装置、存储介质 | |
CN102117459A (zh) | 风险控制系统及方法 | |
Chen et al. | A study of ANFIS-based multi-factor time series models for forecasting stock index | |
CN108898476A (zh) | 一种贷款客户信用评分方法和装置 | |
CN104778622A (zh) | Tps交易事件阈值的预测方法及预测系统 | |
CN108492001A (zh) | 一种用于担保贷款网络风险管理的方法 | |
CN110348977A (zh) | 基于多层模型结构的金融风险分析方法、装置及电子设备 | |
CN108898480A (zh) | 用于授信贷款的贷款等级评估系统及方法 | |
US20180314952A1 (en) | Artificially intelligent historical analysis modeling and computer transaction ranking | |
CN106407305A (zh) | 一种数据挖掘系统和方法 | |
CN112037005B (zh) | 一种评分卡的融合方法、装置、计算机设备及存储介质 | |
CN116522912B (zh) | 一种包装设计语言模型的训练方法、装置、介质及设备 | |
CN112766814A (zh) | 一种信用风险压力测试模型的训练方法、装置及设备 | |
Xie et al. | A Big Data Technique for Internet Financial Risk Control | |
CN112329862A (zh) | 基于决策树的反洗钱方法及系统 | |
CN110059126B (zh) | 基于lkj异常值数据的复杂关联网络分析方法及系统 | |
CN116596674A (zh) | 基于大数据分析的对外贸易风险评估方法 | |
KR20110114181A (ko) | 예측 정확성이 향상된 대출 심사 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |