CN117151851B - 基于遗传算法的银行风险预测方法、装置和电子设备 - Google Patents
基于遗传算法的银行风险预测方法、装置和电子设备 Download PDFInfo
- Publication number
- CN117151851B CN117151851B CN202311174791.5A CN202311174791A CN117151851B CN 117151851 B CN117151851 B CN 117151851B CN 202311174791 A CN202311174791 A CN 202311174791A CN 117151851 B CN117151851 B CN 117151851B
- Authority
- CN
- China
- Prior art keywords
- risk
- operator
- data
- preset model
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 68
- 230000002068 genetic effect Effects 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000013011 mating Effects 0.000 claims abstract description 30
- 238000011156 evaluation Methods 0.000 claims abstract description 24
- 230000035772 mutation Effects 0.000 claims abstract description 22
- 239000011159 matrix material Substances 0.000 claims description 55
- 230000006870 function Effects 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 19
- 230000009467 reduction Effects 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 15
- 238000010606 normalization Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 abstract description 12
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 11
- 230000008859 change Effects 0.000 description 10
- 238000000513 principal component analysis Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000013058 risk prediction model Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Physiology (AREA)
- Genetics & Genomics (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于遗传算法的银行风险预测方法、装置和电子设备,涉及人工智能应用的技术领域,包括基于预设模型和目标时间变量,将风险数据的每个风险类别对应的不同维度分配相应权重;将分配相应权重的风险数据进行预处理,转换为符合遗传算法要求的编码串;将编码串输入预设模型,依据预设模型中的选择算子、交配算子、变异算子和评估函数,预测生成每个风险类别对应的路径节点;将每个风险类别对应的路径节点进行合并,转换为预测趋势图,以缓解不能支持关联风险的实时预测的技术问题。
Description
技术领域
本发明涉及人工智能应用的技术领域,尤其是涉及一种基于遗传算法的银行风险预测方法、装置和电子设备。
背景技术
商业银行风险是指在商业银行经营过程中,由于不确定性因素的影响,使得银行实际收益偏离预期收益,从而导致遭受损失或不能获取额外收益的可能性。
为了经济全面与世界接轨,通过商业银行风险预测来加强风险管理力度,使得风险管理方面能够达到国际标准的要求。商业银行风险预测是指通过分析银行自身或相关对象的不同数据,包括债务、市场、政策、外部形势等,形成以时间维度的预测趋势图,并评价各种风险状态偏离预警线的强弱程度,向决策层发出预警信号并提前采取预控对策。
在实际应用中各种风险来源可能会产生关联风险,而此种风险预测方式并不能支持该关联风险的实时预测,进而影响商业银行风险预测的可靠性。
发明内容
本发明的目的在于提供一种基于遗传算法的银行风险预测方法、装置和电子设备,以缓解不能支持关联风险的实时预测的技术问题。
第一方面,本发明实施例提供了一种基于遗传算法的银行风险预测方法,包括:
基于预设模型和目标时间变量,将风险数据的每个风险类别对应的不同维度分配相应权重;
将分配相应权重的风险数据进行预处理,转换为符合遗传算法要求的编码串;
将所述编码串输入所述预设模型,依据所述预设模型中的选择算子、交配算子、变异算子和评估函数,预测生成所述每个风险类别对应的路径节点;
将所述每个风险类别对应的路径节点进行合并,转换为预测趋势图。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,将分配相应权重的风险数据进行预处理,转换为符合遗传算法要求的编码串的步骤,包括:
对分配相应权重的风险数据进行预处理,确定每个所述风险类别下的每个维度对应的矩阵;
将所述矩阵进行降维编码,转换为符合遗传算法要求的编码串。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,对分配相应权重的风险数据进行预处理,确定每个所述风险类别下的每个维度对应的矩阵的步骤,包括:
对所述风险数据进行归一化处理,得到第一处理结果;
将所述第一处理结果的缺失值进行补全,得到所述风险数据对应的目标长度的数据值;
根据每个所述风险数据对应的目标长度的数据值,生成满足所述预设模型要求的第一矩阵;
将所述第一矩阵转换为直方图,确定每个所述风险类别下的每个维度对应的第二矩阵。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,将所述矩阵进行降维编码,转换为符合遗传算法要求的编码串的步骤,包括:
通过降维方式,将每个所述风险类别下的每个维度对应的第二矩阵合并为一个第三矩阵;
将所述第三矩阵进行归一化,得到一维数组;
将所述一维数组进行编码转换,得到所述遗传算法支持的编码串。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,将所述编码串输入所述预设模型,依据所述预设模型中的选择算子、交配算子、变异算子和评估函数,预测生成所述每个风险类别对应的路径节点的步骤,包括:
根据所述每个风险类别,将所述预设模型增加算子;所述算子包括选择算子、交配算子和变异算子;
依据时间变量确定实时编码串,并将所述实时编码串输入所述预设模型,分别根据所述选择算子、所述交配算子和所述变异算子进行迭代计算,直至所述评估函数的输出符合预期,预测得到所述每个风险类别对应的路径节点。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,将所述每个风险类别对应的路径节点进行合并,转换为预测趋势图的步骤,包括:
将所述每个风险类别对应的路径节点合并相加,进行归一化处理,生成多个风险等级;
基于所述多个风险等级和每个所述风险等级对应的时间变量,生成预测趋势图。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述方法还包括:
当所述风险数据发生改变时,将变更的风险数据插入所述预设模型中的对应位置,再执行上述风险预测的步骤。
第二方面,本发明实施例还提供一种基于遗传算法的银行风险预测装置,包括:
定义模块,基于预设模型和目标时间变量,将风险数据的每个风险类别对应的不同维度分配相应权重;
转换模块,将分配相应权重的风险数据进行预处理,转换为符合遗传算法要求的编码串;
预测模块,将所述编码串输入所述预设模型,依据所述预设模型中的选择算子、交配算子、变异算子和评估函数,预测生成所述每个风险类别对应的路径节点;
合并模块,将所述每个风险类别对应的路径节点进行合并,转换为预测趋势图。
第三方面,实施例提供一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述前述实施方式任一项所述的方法的步骤。
第四方面,实施例提供一种机器可读存储介质,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,机器可执行指令促使处理器实现前述实施方式任一项所述的方法的步骤。
本发明实施例带来了一种基于遗传算法的银行风险预测方法、装置和电子设备,可对每个风险类别风险数据对应的维度进行相应的权重分配,再将分配权重的风险数据进行预处理,得到符合遗传算法的染色体编码串,此种编码串输入预设模型,依据模型中的选择算子、交配算子、变异算子和评估函数,预测出各个风险类别对应的路径节点,合并每个路径节点生成预测趋势图,以此实现银行风险预测目的。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于遗传算法的银行风险预测方法流程图;
图2为本发明实施例提供的一种主成分分析PCA算法降维示意图;
图3为本发明实施例提供的一种编码转换输出示意图;
图4为本发明实施例提供的一种基于遗传算法的银行风险预测装置的功能模块示意图;
图5为本发明实施例提供的电子设备的硬件架构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
商业银行经营时所面临的风险主要可归纳为4类:信用风险、市场风险、流动性风险、操作风险,其中对于这4类风险的每一类目前都有不同数据和预测模型。其中,信用风险主要指银行对外借贷,因经济变化、错贷等因素,出现借款人违约;市场风险是因汇率、利率、CPI变化等因素造成货币贬值;操作风险是因人为因素的造成的银行资产损失,如对股市、市场等走势判断有误,用资金购买了会亏损的资产。而流动性风险则是来源其他风险的关联造成的。
风险预测的常见做法是基于每类风险进行单独建模,再通过不同渠道收集风险相关的数据,将数据代入模型后进行推演。对于流动性风险的预测需要采用数据模型+人工的方式,完成后基于所有结果形成最终预测趋势图。考虑到不同风险之间存在关联性,如:因借款人债务违约造成的逾期率上升引起的信用风险可能会间接造成储户的恐慌,从而引起存款赎回的踩踏,变为更为严重的流动性风险。基于这种问题,当取得每次的风险趋势后,需要在做一次人工的风险评价,通过行业专家介入,对不同时间节点的风险进行分析,判断关联性风险的可能性,并对预测结果做校对。目前这种方式存在如下的问题:
(1)不支持实时关联风险的预测,只能通过后续的人工分析对不同风险进行判断,从而得出关联风险发生的可能性,人工分析的方式无法做到实时性,一般是按照周甚至月为单位进行,无法细化到每天一次预测的粒度。
(2)风险预测模型不支持数据变化,除了信用风险模型,如KMV等可以根据债务违约率等进行实时调整外,其他操作风险、市场风险、人为操作风险涉及到的预测模型都无法支持数据变化,只能通过重新建模的方式重新预测。
(3)对流动性风险的评估能力较弱,流动性风险一般使用模型+人工两者结合的方式,这种方式与关联风险的预测类似,存在无法实时性的问题。
基于此,本发明实施例提供的一种基于遗传算法的银行风险预测方法、装置和电子设备,可以通过遗传算法自身的优点,有效解决当前银行风险预测无非实时预测关联风险、无法满足数据变化以及加强流动性风险评估的问题。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种基于遗传算法的银行风险预测方法进行详细介绍,该方法可应用于控制器、上位机、服务器等具有控制功能的设备中。
图1为本发明实施例提供的一种基于遗传算法的银行风险预测方法流程图。
如图1所示,该方法包括如下步骤:
步骤S102,基于预设模型和目标时间变量,将风险数据的每个风险类别对应的不同维度分配相应权重。
这里提前针对风险数据对预设模型进行定义,传统方式需要针对每种风险数据定义不同的模型,而本发明实施例仅需要定义统一的预设模型,即可涵盖全部类别的风险数据。本方案中的预设模型变量的定义如下:
除了上升变量外,预设模型整体还包括一个T时间变量来表示时间。
其中,信用风险M1-M4为当前债务违约率统计和历史债务违约率统计,M后缀数字越高代表对应的风险越高;市场风险汇率风险大于利率,因为汇率波动造成货币损失更大;操作风险中投资损失权值更高,这里参照了历史上巴林银行买入日本股票的损失问题,而人为损失随着制度健全会逐渐减少;流动性风险更多是关联风险,所以本身只考虑资金减少的情况。
步骤S104,将分配相应权重的风险数据进行预处理,转换为符合遗传算法要求的编码串。
其中,遗传算法(genetic algorithm)是一类模拟进化论当中自然选择和遗传学的算法,它的算子计算过程非常适合这种存在不确定性和多种关联问题的推演运算,能够解决对关联风险、数据变动,以及后面的流动性风险预测起到较好的帮助。
遗传算法本身有多个变种算法,这里选择混合遗传算法,混合遗传算法同时可模拟多点交配、部分匹配交配算子、循环交配算子等多种遗传学的计算方式,可以满足后续的数据变更等问题。
步骤S106,将编码串输入预设模型,依据预设模型中的选择算子、交配算子、变异算子和评估函数,预测生成每个风险类别对应的路径节点。
其中,预设模型中的算子是根据风险数据的类别进行确定的。
步骤S108,将每个风险类别对应的路径节点进行合并,转换为预测趋势图。
在实际应用的优选实施例中,可对每个风险类别风险数据对应的维度进行相应的权重分配,再将分配权重的风险数据进行预处理,得到符合遗传算法的染色体编码串,此种编码串输入预设模型,依据模型中的选择算子、交配算子、变异算子和评估函数,预测出各个风险类别对应的路径节点,合并每个路径节点生成预测趋势图,以此实现银行风险预测目的。
在一些实施例中,先将上述分配权重后的风险数据进行一系列预处理,以保证处理的数据能够进行后续遗传算法的处理,该步骤S104,包括:
步骤1.1),对分配相应权重的风险数据进行预处理,确定每个风险类别下的每个维度对应的矩阵。
步骤1.2),将矩阵进行降维编码,转换为符合遗传算法要求的编码串。
作为一种可选的实施例,上述步骤1.1)步骤-1.2)可通过以下步骤实现,具体包括:
步骤2.1),对风险数据进行归一化处理,得到第一处理结果。
因为输入的不同风险数据根据其类别差异,数值会有很大差别,需要先将目前数据归一化为0~1之间的浮点数方式;归一化算法可选用Z-score算法,算法公式为:
x=(x-m)/sigma;
步骤2.2),将第一处理结果的缺失值进行补全,得到风险数据对应的目标长度的数据值。
需要说明的是,由于不同风险数据的分类和来源不同,风险数据之间有很大差别,需要进行补全,这里直接采用缺失补零的方式,将所有不同的值按照0计算,以保证在后面自动按照0权值不会影响计算。
步骤2.3),根据每个风险数据对应的目标长度的数据值,生成满足预设模型要求的第一矩阵。
其中,因为前述步骤做了补全处理,这里目标长度是各个风险数据的统一最长长度;把风险数据按照之前的定义的预设模型,变换为4*N的第一矩阵方式,其中N为每行的目标长度。
步骤2.4),将第一矩阵转换为直方图,确定每个风险类别下的每个维度对应的第二矩阵。
其中,各个风险类别对应的直方图可如图2所示,进而降维得到各类矩阵。
示例性地,可直接使用直方图生产算法生成,如以下公式所示:
Hti=∑(矩阵元素i%CF(矩阵元素i+1))
其中,CF为转换函数,ti是时间维度,该时间维度为直方图横轴单位,i为迭代参数,可理解为以时间维度ti值为依据的计数,Hti是根据时间维度的直方图上的具体节点,矩阵元素可理解为前述步骤生成的第一矩阵中元素。
按照之前的预设模型定义,每个风险类别的分类下每个维度对应生成一个第二矩阵。可以理解的是,前述将第一矩阵转换为直方图的操作,能够使得后续降维操作更加方便,因此在后面降维算法前提前进行第一矩阵与直方图的转换。
步骤2.5),通过降维方式,将每个风险类别下的每个维度对应的第二矩阵合并为一个第三矩阵。
根据实际风险数据的类别情况,最终会生成多个第二矩阵,降维的过程是将多个第二矩阵合并为一个第三矩阵。本发明实施例采用PCA(Principal Component Analysis,主成分分析)算法进行降维,PCA算法包含:原始矩阵、原始矩阵维度、目标矩阵维度和scores分数4个输入变量,整个过程如:Sn=>S1,即将多个矩阵归为一个,其中scores变量是pca算法中调节结果的参数,其数值在正负1之内,需要根据实际情况进行调整和计算,但是必须控制在90以内,因为太大对于这种非图形数据会造成数据的损失。
步骤2.6),将第三矩阵进行归一化,得到一维数组。
这里,通过数据量化将已降维后的第三矩阵归一化为一维的数组,使用以下公式为:
V=∑(∑(矩阵元素i%C+(矩阵元素i+1)%C))n
其中:V是最终的输出向量,即一维数组,C是一个需要根据具体情况调整常量,n为上述公式的下标,可以理解为矩阵的高度。
步骤2.7),将一维数组进行编码转换,得到遗传算法支持的编码串。
这里,本发明实施例的遗传算法可支持浮点编码和二级制编码两种方式;这里以浮点编码方式为例进行说明,可通过以下公式生成编码串:
S=∑(Vi%seed)
其中,S为最终向量,即编码串,V是前述实施例处理后的向量,即一维数组,seed是一个归一化使用的种子值常量,为1-5000之间。
在一些实施例中,将前述预处理后的编码串通过预设模型中的算子和函数进行评估,预测出每个风险类别对应的路径节点;示例性地,步骤S106,包括:
步骤3.1),根据每个风险类别,将预设模型增加或设置算子,该算子包括选择算子、交配算子和变异算子。
其中,选择算子使用最常用的轮盘赌选择算法。交配算子使用混合遗传算法支持的多个算子组合实现,包括:多点交配、顺序交配、算子循环交配、算子边重组交配、算子边集合交配算子。变异算子为自行实现,因为要考虑对风险预测模型变更的支持,大概流程如下:生成0、1间随机数R=Random();对当前的时间变量T进行判断,如果时间变量T超过当前的时间,则为新加入变更的风险数据;循环遍历编码转换部分输出,即浮点数向量的每个值,该浮点数向量是通过将前述步骤得到的各风险类别降维矩阵量化后的数组进行编码进而确定的,如图3所示;如果该编码转换部分输出为新加入的数据,将值调整为随机数R;评估函数E采用标准的方式:E(C)=-F(X);F为根据业务自定义的评估计算算法,C和X是遗传算法中评估函数接受的参数,为遗传算法内部的两个变量。
步骤3.2),依据时间变量确定实时编码串,并将实时编码串输入预设模型,分别根据选择算子、交配算子和变异算子进行迭代计算,直至评估函数的输出符合预期,预测得到每个风险类别对应的路径节点。
完成前述步骤中的数据准备后就可以进行预测,预测是通过混合遗传算法的算子运算求出最终结果,因为按照风险模型的设定,总共有4个分类,所以前需要为模型增加4个特殊值的变量,这4个变量需要放在向量组的最后,遗传算法最终的结果是按照进化路径的方式产生的,遗传算法本身是通用的,但是其中有部分算子和函数需要根据具体的业务进行选择,其中有4个关键点需要实现,为:选择算子、交配算子、变异算子、评估函数。
其中,在迭代过程中会反复对上述3个算子进行顺序执行,并每次迭代做一次评估,直到评估函数输出结果为0,此时预测输出的结果为一串编码,编码的每个值与模型定义中维度对应,最终输出结果为4个编码串,对应4个风险分类的路径节点。
作为一种可选的实施例,上述预测过程可包括:
初始化全部变量,将时间变量T设置为最低;开始循环;执行选择算子;执行交配算子;执行变异算子;评估结果,如果输出为0则停止迭代,否则进入下一次迭代;输出结果路径节点。
在一些实施例中,预测后得到的数据为路径节点,需要结合时间变量再转换为趋势图的形式,这一过程分为2步:路径合并和转为趋势图;示例性地,该步骤S108可包括以下步骤:
步骤4.1),将每个风险类别对应的路径节点合并相加,进行归一化处理,生成多个风险等级。
这里,路径合并的算法过程为:
S`=norm(sum(P))
其中,P为结果路径,sum为P的每个节点相加,norm是一个归一化算法,用于将最终值控制在1-10之内,形成10个风险等级,即S`为风险等级;归一化算法采用premnmx算法。
步骤4.2),基于多个风险等级和每个风险等级对应的时间变量,生成预测趋势图。
这里,将上一步的每个风险等级S`与对应的时间变量T进行组合,形成趋势图。
在前述实施例的基础上,若风险数据出现变更,本发明实施例也能够通过调整预设模型中风险数据的类别维度分配的权重,进而保证风险预测的准确性,该方法还包括:
步骤5.1),当风险数据发生改变时,将变更的风险数据插入预设模型中的对应位置,再执行上述风险预测的步骤,即步骤S102-步骤S108。
当模型中风险数据发生改变时,需要对模型进行相应变更,本发明实施例的模型设计考虑了应用过程中风险数据变化的问题,所以变更相对比较简单,该步骤5.1)的执行过程为:
(1)对新的风险数据进行预处理、降维;
(2)初始化,完成数据量化后,根据向量数组转换为的编码,将编码的每个值根据值的t参数下标追加到现有模型的对应位置。
(3)完整预测过程与前述实施例较为相似:数据预处理、缺失值补全、生成矩阵、直方图生成、使用PCA算法降维、数据量化、编码转换、开始预测,生成代表4个风险分类的编码、执行算子、评估、迭代下一次、输出4个风险分类的预测结果、路径合并、输出趋势图;在此不再赘述。
本发明实施例提供了基于遗传算法实现商业银行风险预测的方法,通过遗传算法模拟趋势预测的优点,达到如下效果:
(1)支持风险关联和风险预测,在遗传算法模型中,将4个不同分类的风险数据合并在一个模型中,在模型数据层面属于同一维度,对其中一类风险预测时可以之间涉及其他分类的数据,进而实现在风险关联的影响下的风险预测准确性。
(2)支持模型数据变化,当模型中风险数据发生改变时,可以在按照变更过程对模型数据进行修改,保证风险预测的实时可靠性。
(3)对流动性风险这种需要关联其他风险结果的分类支持较好,因为在同一模型中进行预测,每次迭代都能产生整个模型层面的预测结果的更新,不区分分类,进而进一步保证在流动性风险的影响下的风险预测准确性。
如图4所示,本发明实施例提供一种基于遗传算法的银行风险预测装置,包括:
定义模块,基于预设模型和目标时间变量,将风险数据的每个风险类别对应的不同维度分配相应权重;
转换模块,将分配相应权重的风险数据进行预处理,转换为符合遗传算法要求的编码串;
预测模块,将所述编码串输入所述预设模型,依据所述预设模型中的选择算子、交配算子、变异算子和评估函数,预测生成所述每个风险类别对应的路径节点;
合并模块,将所述每个风险类别对应的路径节点进行合并,转换为预测趋势图。
在一些实施例中,转换模块,还具体用于,对分配相应权重的风险数据进行预处理,确定每个所述风险类别下的每个维度对应的矩阵;将所述矩阵进行降维编码,转换为符合遗传算法要求的编码串。
在一些实施例中,转换模块,还具体用于,对所述风险数据进行归一化处理,得到第一处理结果;将所述第一处理结果的缺失值进行补全,得到所述风险数据对应的目标长度的数据值根据每个所述风险数据对应的目标长度的数据值,生成满足所述预设模型要求的第一矩阵;将所述第一矩阵转换为直方图,确定每个所述风险类别下的每个维度对应的第二矩阵。
在一些实施例中,转换模块,还具体用于,通过降维方式,将每个所述风险类别下的每个维度对应的第二矩阵合并为一个第三矩阵;将所述第三矩阵进行归一化,得到一维数组;将所述一维数组进行编码转换,得到所述遗传算法支持的编码串。
在一些实施例中,预测模块,还具体用于,根据所述每个风险类别,将所述预设模型增加算子;所述算子包括选择算子、交配算子和变异算子;依据时间变量确定实时编码串,并将所述实时编码串输入所述预设模型,分别根据所述选择算子、所述交配算子和所述变异算子进行迭代计算,直至所述评估函数的输出符合预期,预测得到所述每个风险类别对应的路径节点。
在一些实施例中,合并模块,还具体用于,将所述每个风险类别对应的路径节点合并相加,进行归一化处理,生成多个风险等级;基于所述多个风险等级和每个所述风险等级对应的时间变量,生成预测趋势图。
在一些实施例中,所述装置还用于当所述风险数据发生改变时,将变更的风险数据插入所述预设模型中的对应位置,再执行上述风险预测的步骤。
本发明实施例提供的用于实现一种电子设备,本实施例中,所述电子设备可以是,但不限于,个人电脑(Personal Computer,PC)、笔记本电脑、监控设备、服务器等具备分析及处理能力的计算机设备。
作为一种示范性实施例,可参见图5,电子设备110,包括通信接口111、处理器112、存储器113以及总线114,处理器112、通信接口111和存储器113通过总线114连接;上述存储器113用于存储支持处理器112执行上述方法的计算机程序,上述处理器112被配置为用于执行该存储器113中存储的程序。
本文中提到的机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:RAM(Radom Access Memory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。
非易失性介质可以是非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、任何类型的存储盘(如光盘、dvd等),或者类似的非易失性存储介质,或者它们的组合。
可以理解的是,本实施例中的各功能模块的具体操作方法可参照上述方法实施例中相应步骤的详细描述,在此不再重复赘述。
本发明实施例所提供计算机可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序代码被执行时可实现上述任一实施例所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。
Claims (7)
1.一种基于遗传算法的银行风险预测方法,其特征在于,包括:
基于预设模型和目标时间变量,将风险数据的每个风险类别对应的不同维度分配相应权重;
对所述风险数据进行归一化处理,得到第一处理结果;
将所述第一处理结果的缺失值进行补全,得到所述风险数据对应的目标长度的数据值;
根据每个所述风险数据对应的目标长度的数据值,生成满足所述预设模型要求的第一矩阵;
将所述第一矩阵转换为直方图,确定每个所述风险类别下的每个维度对应的第二矩阵;
通过降维方式,将每个所述风险类别下的每个维度对应的第二矩阵合并为一个第三矩阵;
将所述第三矩阵进行归一化,得到一维数组;
通过下式将所述一维数组进行编码转换,得到所述遗传算法支持的编码串:
S=∑(Vi%seed)
其中,S为编码串,V是一维数组,seed是一个归一化使用的种子值常量,i为以直方图横轴单位为依据的计数;
将所述编码串输入所述预设模型,依据所述预设模型中的选择算子、交配算子、变异算子和评估函数,预测生成所述每个风险类别对应的路径节点;
将所述每个风险类别对应的路径节点进行合并,转换为预测趋势图。
2.根据权利要求1所述的方法,其特征在于,将所述编码串输入所述预设模型,依据所述预设模型中的选择算子、交配算子、变异算子和评估函数,预测生成所述每个风险类别对应的路径节点的步骤,包括:
根据所述每个风险类别,将所述预设模型增加算子;所述算子包括选择算子、交配算子和变异算子;
依据时间变量确定实时编码串,并将所述实时编码串输入所述预设模型,分别根据所述选择算子、所述交配算子和所述变异算子进行迭代计算,直至所述评估函数的输出符合预期,预测得到所述每个风险类别对应的路径节点。
3.根据权利要求1所述的方法,其特征在于,将所述每个风险类别对应的路径节点进行合并,转换为预测趋势图的步骤,包括:
将所述每个风险类别对应的路径节点合并相加,进行归一化处理,生成多个风险等级;
基于所述多个风险等级和每个所述风险等级对应的时间变量,生成预测趋势图。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述风险数据发生改变时,将变更的风险数据插入所述预设模型中的对应位置,再执行上述风险预测的步骤。
5.一种基于遗传算法的银行风险预测装置,其特征在于,包括:
定义模块,基于预设模型和目标时间变量,将风险数据的每个风险类别对应的不同维度分配相应权重;
转换模块,对所述风险数据进行归一化处理,得到第一处理结果;将所述第一处理结果的缺失值进行补全,得到所述风险数据对应的目标长度的数据值;根据每个所述风险数据对应的目标长度的数据值,生成满足所述预设模型要求的第一矩阵;将所述第一矩阵转换为直方图,确定每个所述风险类别下的每个维度对应的第二矩阵;通过降维方式,将每个所述风险类别下的每个维度对应的第二矩阵合并为一个第三矩阵;将所述第三矩阵进行归一化,得到一维数组;通过下式将所述一维数组进行编码转换,得到所述遗传算法支持的编码串:
S=∑(Vi%seed)
其中,S为编码串,V是一维数组,seed是一个归一化使用的种子值常量,i为以直方图横轴单位为依据的计数
预测模块,将所述编码串输入所述预设模型,依据所述预设模型中的选择算子、交配算子、变异算子和评估函数,预测生成所述每个风险类别对应的路径节点;
合并模块,将所述每个风险类别对应的路径节点进行合并,转换为预测趋势图。
6.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并且能够在所述处理器上运行的程序,所述处理器执行所述程序时实现如权利要求1至4中任一项所述的方法。
7.一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序被执行时实现权利要求1-4中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311174791.5A CN117151851B (zh) | 2023-09-12 | 2023-09-12 | 基于遗传算法的银行风险预测方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311174791.5A CN117151851B (zh) | 2023-09-12 | 2023-09-12 | 基于遗传算法的银行风险预测方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117151851A CN117151851A (zh) | 2023-12-01 |
CN117151851B true CN117151851B (zh) | 2024-04-30 |
Family
ID=88907835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311174791.5A Active CN117151851B (zh) | 2023-09-12 | 2023-09-12 | 基于遗传算法的银行风险预测方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117151851B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105913153A (zh) * | 2016-04-13 | 2016-08-31 | 广西财经学院 | 一种多维数据特征相似性测量的目标预测方法 |
CN106453085A (zh) * | 2016-12-14 | 2017-02-22 | 国家电网公司 | 基于业务重要度的风险均衡路由分配的方法及系统 |
CN114399224A (zh) * | 2022-01-21 | 2022-04-26 | 中国建设银行股份有限公司 | 数据处理方法、装置、设备、介质及产品 |
CN115758387A (zh) * | 2022-12-01 | 2023-03-07 | 安徽科测信息技术有限公司 | 一种信息安全风险评估方法 |
CN115907775A (zh) * | 2022-12-09 | 2023-04-04 | 城云科技(中国)有限公司 | 基于深度学习的个人征信评级方法及其应用 |
CN115907837A (zh) * | 2023-02-24 | 2023-04-04 | 山东财经大学 | 基于机器学习的期货数据分析、风险预测方法及系统 |
CN116090817A (zh) * | 2022-12-23 | 2023-05-09 | 中国电信股份有限公司 | 一种风险评估方法、装置、电子设备及存储介质 |
WO2023124204A1 (zh) * | 2021-12-29 | 2023-07-06 | 中国银联股份有限公司 | 反欺诈风险评估方法、训练方法、装置及可读存储介质 |
CN116611911A (zh) * | 2023-04-17 | 2023-08-18 | 中国工商银行股份有限公司 | 基于支持向量机的信用风险预测方法及装置 |
-
2023
- 2023-09-12 CN CN202311174791.5A patent/CN117151851B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105913153A (zh) * | 2016-04-13 | 2016-08-31 | 广西财经学院 | 一种多维数据特征相似性测量的目标预测方法 |
CN106453085A (zh) * | 2016-12-14 | 2017-02-22 | 国家电网公司 | 基于业务重要度的风险均衡路由分配的方法及系统 |
WO2023124204A1 (zh) * | 2021-12-29 | 2023-07-06 | 中国银联股份有限公司 | 反欺诈风险评估方法、训练方法、装置及可读存储介质 |
CN114399224A (zh) * | 2022-01-21 | 2022-04-26 | 中国建设银行股份有限公司 | 数据处理方法、装置、设备、介质及产品 |
CN115758387A (zh) * | 2022-12-01 | 2023-03-07 | 安徽科测信息技术有限公司 | 一种信息安全风险评估方法 |
CN115907775A (zh) * | 2022-12-09 | 2023-04-04 | 城云科技(中国)有限公司 | 基于深度学习的个人征信评级方法及其应用 |
CN116090817A (zh) * | 2022-12-23 | 2023-05-09 | 中国电信股份有限公司 | 一种风险评估方法、装置、电子设备及存储介质 |
CN115907837A (zh) * | 2023-02-24 | 2023-04-04 | 山东财经大学 | 基于机器学习的期货数据分析、风险预测方法及系统 |
CN116611911A (zh) * | 2023-04-17 | 2023-08-18 | 中国工商银行股份有限公司 | 基于支持向量机的信用风险预测方法及装置 |
Non-Patent Citations (3)
Title |
---|
基于支持向量机的独立学院教师计算机评价系统的研究;刘晓彦;赵建华;焦鸿斌;刘菲;矫亮;胡楠;姚玉霞;;农业网络信息;20101026(第10期);全文 * |
基于贷款人视角的互联网金融信用风险分级研究;林奕皓;王宇森;李旭东;许永峰;;软件导刊;20200615(第06期);全文 * |
基于非期望损失的私有担保价值研究;_孙艳;contemporary economics;20181231;第1卷(第1期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117151851A (zh) | 2023-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110659744B (zh) | 训练事件预测模型、评估操作事件的方法及装置 | |
US20130346350A1 (en) | Computer-implemented semi-supervised learning systems and methods | |
WO2007106787A2 (en) | Methods and systems for characteristic leveling | |
CN111950810B (zh) | 一种基于自演化预训练的多变量时间序列预测方法和设备 | |
US20230105547A1 (en) | Machine learning model fairness and explainability | |
CN111160733B (zh) | 一种基于有偏样本的风险控制方法、装置及电子设备 | |
CN117709446A (zh) | 基于规则引擎的动态金融信用风险模型的构建方法 | |
Kang et al. | A CWGAN-GP-based multi-task learning model for consumer credit scoring | |
CN113656707B (zh) | 一种理财产品推荐方法、系统、存储介质及设备 | |
CN115130894A (zh) | 基于人工智能的生产规划方法、装置、计算机设备及介质 | |
CN116029832A (zh) | 基于深度学习的量化交易策略预测方法、装置及存储介质 | |
CN115660795A (zh) | 数据处理方法、装置、设备、存储介质及程序产品 | |
Das et al. | Dynamic goals-based wealth management using reinforcement learning | |
CN117151851B (zh) | 基于遗传算法的银行风险预测方法、装置和电子设备 | |
Larijani et al. | Stock price prediction using the combination of firefly (FA) and genetic algorithms | |
Bi | Multi-objective programming in SVMs | |
WO2023227998A1 (en) | Method and system of generating a classical model to simulate a quantum computational model via input perturbation to enhance explainability | |
He | Automatic Quality Assessment of Speech‐Driven Synthesized Gestures | |
CN112949825A (zh) | 一种资源调整方法、装置及设备 | |
CN114638405A (zh) | 能源需求预测方法、装置及计算机设备 | |
CN111402042A (zh) | 一种用于股市大盘形态分析的数据分析与显示方法 | |
Cheng et al. | Predicting credit risk in peer-to-peer lending: A machine learning approach with few features | |
Pongsena et al. | Deep Learning for Financial Time-Series Data Analytics: An Image Processing Based Approach | |
Mahdi et al. | BANKRUPTCY PREDICTION BY USING SUPPORT VECTOR MACHINES AND GENETIC ALGORITHMS. | |
CN115409607A (zh) | 一种授信数据的确定方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |