CN117273545A - 资产质量指标数据分析方法及装置 - Google Patents
资产质量指标数据分析方法及装置 Download PDFInfo
- Publication number
- CN117273545A CN117273545A CN202311385060.5A CN202311385060A CN117273545A CN 117273545 A CN117273545 A CN 117273545A CN 202311385060 A CN202311385060 A CN 202311385060A CN 117273545 A CN117273545 A CN 117273545A
- Authority
- CN
- China
- Prior art keywords
- variable data
- data
- economic variable
- macro
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000007405 data analysis Methods 0.000 title claims abstract description 23
- 238000004590 computer program Methods 0.000 claims description 27
- 238000011156 evaluation Methods 0.000 claims description 24
- 238000012417 linear regression Methods 0.000 claims description 23
- 238000012216 screening Methods 0.000 claims description 12
- 230000006872 improvement Effects 0.000 claims description 11
- 238000004519 manufacturing process Methods 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 9
- 230000000977 initiatory effect Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 abstract description 2
- 230000006835 compression Effects 0.000 description 9
- 238000007906 compression Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Finance (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Biology (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种资产质量指标数据分析方法及装置,应用于金融领域,其中该方法包括:获取多个历史的宏观经济变量数据和资产质量指标数据;针对每一个历史的宏观经济变量数据,建立一一对应的单变量模型;根据每一个单变量模型,确定每一个历史的宏观经济变量数据的单变量边际提升度,构建为多个宏观经济变量数据组;根据多个宏观经济变量数据组,建立多变量模型;将待测宏观经济变量数据输入到多变量模型中,输出待测宏观经济变量数据对应的资产质量指标数据。本发明可以提高资产质量指标数据分析的准确性和时效性。
Description
技术领域
本发明涉及金融领域,尤其涉及资产质量指标数据分析方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
在针对宏观经济与资产质量关联建模分析的大样本数据集回归模型建模过程中,存在着模型训练过程效率低下、计算资源耗费较大、难以准确找到全局最优解的问题。宏观经济变量数据往往种类广且形式多样,难以从海量宏观经济变量数据中找到最合适的变量数据来分析资产质量指标数据,无法提高资产质量指标数据分析的准确性和时效性。
发明内容
本发明实施例提供一种资产质量指标数据分析方法,用以提高资产质量指标数据分析的准确性和时效性,该方法包括:
获取多个历史的宏观经济变量数据和资产质量指标数据;宏观经济变量数据包括生产总值、消费量、失业率、汇率、投资量和资产投资规模数据其中之一或任意组合;资产质量指标数据包括资产违约概率、资产违约损失率、资产不良率其中之一或任意组合,用于评价信贷资产的质量状况;
针对每一个历史的宏观经济变量数据,建立一一对应的单变量模型;单变量模型是根据每一个历史的宏观经济变量数据和资产质量指标数据,对每一个历史的宏观经济变量数据,构建第一线性回归模型来确定的;根据每一个单变量模型,确定每一个历史的宏观经济变量数据的单变量边际提升度,将多个历史的宏观经济变量数据的单变量边际提升度进行从大到小的排序,得到宏观经济变量数据排序列表;单变量边际提升度,用于评价单个宏观经济变量数据对资产质量指标数据的贡献度;
根据宏观经济变量数据排序列表,筛选出单变量边际提升度大于预设值的多个历史的宏观经济变量数据,构建为多个宏观经济变量数据组;
根据多个宏观经济变量数据组,建立多变量模型;多变量模型是在每一个宏观经济变量数据组中加入备选变量数据,根据多个加入备选变量数据后的宏观经济变量数据组和资产质量指标数据,对多个加入备选变量数据后的宏观经济变量数据组,构建第二线性回归模型来确定的;备选变量数据为:根据宏观经济变量数据排序列表,筛选出的单变量边际提升度不大于预设值的历史的宏观经济变量数据;
将待测宏观经济变量数据输入到多变量模型中,输出待测宏观经济变量数据对应的资产质量指标数据。
本发明实施例还提供一种资产质量指标数据分析装置,用以提高资产质量指标数据分析的准确性和时效性,该装置包括:
宏观经济变量数据和资产质量指标数据获取模块,用于获取多个历史的宏观经济变量数据和资产质量指标数据;宏观经济变量数据包括生产总值、消费量、失业率、汇率、投资量和资产投资规模数据其中之一或任意组合;资产质量指标数据包括资产违约概率、资产违约损失率、资产不良率其中之一或任意组合,用于评价信贷资产的质量状况;
单变量边际提升度确定模块,用于针对每一个历史的宏观经济变量数据,建立一一对应的单变量模型;单变量模型是根据每一个历史的宏观经济变量数据和资产质量指标数据,对每一个历史的宏观经济变量数据,构建第一线性回归模型来确定的;根据每一个单变量模型,确定每一个历史的宏观经济变量数据的单变量边际提升度,将多个历史的宏观经济变量数据的单变量边际提升度进行从大到小的排序,得到宏观经济变量数据排序列表;单变量边际提升度,用于评价单个宏观经济变量数据对资产质量指标数据的贡献度;
宏观经济变量数据组构建模块,用于根据宏观经济变量数据排序列表,筛选出单变量边际提升度大于预设值的多个历史的宏观经济变量数据,构建为多个宏观经济变量数据组;
多变量模型建立模块,用于根据多个宏观经济变量数据组,建立多变量模型;多变量模型是在每一个宏观经济变量数据组中加入备选变量数据,根据多个加入备选变量数据后的宏观经济变量数据组和资产质量指标数据,对多个加入备选变量数据后的宏观经济变量数据组,构建第二线性回归模型来确定的;备选变量数据为:根据宏观经济变量数据排序列表,筛选出的单变量边际提升度不大于预设值的历史的宏观经济变量数据;
资产质量指标数据输出模块,用于将待测宏观经济变量数据输入到多变量模型中,输出待测宏观经济变量数据对应的资产质量指标数据。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述资产质量指标数据分析方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述资产质量指标数据分析方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述资产质量指标数据分析方法。
本发明实施例中,通过获取多个历史的宏观经济变量数据和资产质量指标数据;宏观经济变量数据包括生产总值、消费量、失业率、汇率、投资量和资产投资规模数据其中之一或任意组合;资产质量指标数据包括资产违约概率、资产违约损失率、资产不良率其中之一或任意组合,用于评价信贷资产的质量状况;针对每一个历史的宏观经济变量数据,建立一一对应的单变量模型;单变量模型是根据每一个历史的宏观经济变量数据和资产质量指标数据,对每一个历史的宏观经济变量数据,构建第一线性回归模型来确定的;根据每一个单变量模型,确定每一个历史的宏观经济变量数据的单变量边际提升度,将多个历史的宏观经济变量数据的单变量边际提升度进行从大到小的排序,得到宏观经济变量数据排序列表;单变量边际提升度,用于评价单个宏观经济变量数据对资产质量指标数据的贡献度;根据宏观经济变量数据排序列表,筛选出单变量边际提升度大于预设值的多个历史的宏观经济变量数据,构建为多个宏观经济变量数据组;根据多个宏观经济变量数据组,建立多变量模型;多变量模型是在每一个宏观经济变量数据组中加入备选变量数据,根据多个加入备选变量数据后的宏观经济变量数据组和资产质量指标数据,对多个加入备选变量数据后的宏观经济变量数据组,构建第二线性回归模型来确定的;备选变量数据为:根据宏观经济变量数据排序列表,筛选出的单变量边际提升度不大于预设值的历史的宏观经济变量数据;将待测宏观经济变量数据输入到多变量模型中,输出待测宏观经济变量数据对应的资产质量指标数据。在上述过程中,本发明实施例通过宏观经济变量数据组建立多变量模型,分析输出待测宏观经济变量数据对应的资产质量指标数据,可以提高资产质量指标数据分析的准确性和时效性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中多变量模型构建流程图;
图2为本发明实施例中资产质量指标数据分析方法的流程图;
图3为本发明实施例中具体的多变量模型递归流程图;
图4为本发明实施例中资产质量指标数据分析装置的示意图;
图5为本发明实施例中具体的资产质量指标数据分析装置的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
对具体涉及的名词进行解释。
1、数据动态压缩算法
数据动态压缩算法是通过识别各字段数据类型,进而采用合适的压缩策略进行数据重编码。通过数据动态压缩算法对建模大样本数据集进行动态压缩编码,进而实现建模数据集的内存占用优化。
2、量化指标评价规则
量化指标评价规则是一系列用于衡量线性回归模型性能以及对业务建模目标贴切程度的数值度量规则。通过量化指标评价规则可以实现:客观衡量模型性能、充分结合业务建模目标、评估模型的可用性、配合后续建模单元找到最优模型结果。
3、单变量模型
单变量模型是指分别根据每一个历史的宏观经济变量数据和资产质量指标数据,对每一个历史的宏观经济变量数据,构建的线性回归模型。单变量模型可以结合量化指标评价规则来评估每个解释变量的重要性与贡献度。通过单变量模型遍历,可以实现单一解释变量的排序,并且为多变量模型的构建提供参考信息,从而提升后续多变量回归建模的效率。
4、多变量模型
多变量模型是指将一组宏观经济变量数据备选清单递归地构建多变量的线性回归模型,可以依据单变量边际提升度来不断调整特征变量组合,直至满足递归停止条件。通过多变量模型递归,可以实现:找到最佳解释变量特征子集从而获得最优模型结果、减少计算复杂度并提升运算效率。
5、单变量边际提升度
单变量模型边际提升度是一种度量单个宏观经济变量数据对多变量模型评价结果改善的指标,可以计算每个宏观经济变量数据在当前多变量模型是否入模对于模型评价指标带来的影响。通过计算单变量边际提升度,可以实现:评估单个宏观经济变量数据对资产质量指标数据的贡献度、精简多变量模型的备选变量清单从而提升运行效率。
6、整体边际提升度
整体模型边际提升度是一种度量单个宏观经济变量数据对多变量模型在多个评价指标(例如AIC、R2等)带来的边际影响,通过调和平均进行汇总。通过计算整体模型边际提升度,可以实现:评估单一解释变量在多个多变量模型评价指标下的贡献度,实现了多评价指标的综合考量。
7、多变量模型评价指标的限值(模型递归停止条件)
模型递归停止条件是一组用于判断多变量模型递归是否应终止的规则或标准。这些条件可以包括预设的最大迭代次数、模型性能指标(例如R2、AIC等)的阈值、整体边际提升度,也可以根据样本的特点和业务需求进行调整。通过模型递归停止条件,可以实现:有效控制模型复杂度并提升模型泛化能力、避免无效的模型迭代、自适应模型优化。
如图1所示为多变量模型构建流程图,本发明实施例中,通过载入数据,获取多个历史的宏观经济变量数据和资产质量指标数据;并可对载入的数据进行预处理,如数据集压缩等,后续针对每一个历史的宏观经济变量数据,建立一一对应的单变量模型;根据每一个单变量模型,确定每一个历史的宏观经济变量数据的单变量边际提升度,将多个历史的宏观经济变量数据的单变量边际提升度进行从大到小的排序,得到宏观经济变量数据排序列表;根据宏观经济变量数据排序列表,筛选出单变量边际提升度大于预设值的多个历史的宏观经济变量数据,构建为多个宏观经济变量数据组;根据多个宏观经济变量数据组,建立多变量模型;其中,多变量模型是在每一个宏观经济变量数据组中加入备选变量数据,根据多个加入备选变量数据后的宏观经济变量数据组和资产质量指标数据,对多个加入备选变量数据后的宏观经济变量数据组,构建第二线性回归模型来确定的;根据每一个历史的宏观经济变量数据的单变量边际提升度,调整多个宏观经济变量数据组,直至建立的多变量模型符合多变量模型评价指标的限值将待测宏观经济变量数据输入到多变量模型中,输出待测宏观经济变量数据对应的资产质量指标数据。在上述过程中,本发明实施例通过准确有效地确定多变量模型中的宏观经济变量数据组,从而提高预测资产质量的准确度。
图2为本发明实施例中资产质量指标数据分析方法的流程图,该方法包括:
步骤201,获取多个历史的宏观经济变量数据和资产质量指标数据;宏观经济变量数据包括生产总值、消费量、失业率、汇率、投资量和资产投资规模数据其中之一或任意组合;资产质量指标数据包括资产违约概率、资产违约损失率、资产不良率其中之一或任意组合,用于评价信贷资产的质量状况;
步骤202,针对每一个历史的宏观经济变量数据,建立一一对应的单变量模型;单变量模型是根据每一个历史的宏观经济变量数据和资产质量指标数据,对每一个历史的宏观经济变量数据,构建第一线性回归模型来确定的;根据每一个单变量模型,确定每一个历史的宏观经济变量数据的单变量边际提升度,将多个历史的宏观经济变量数据的单变量边际提升度进行从大到小的排序,得到宏观经济变量数据排序列表;单变量边际提升度,用于评价单个宏观经济变量数据对资产质量指标数据的贡献度;
步骤203,根据宏观经济变量数据排序列表,筛选出单变量边际提升度大于预设值的多个历史的宏观经济变量数据,构建为多个宏观经济变量数据组;
步骤204,根据多个宏观经济变量数据组,建立多变量模型;多变量模型是在每一个宏观经济变量数据组中加入备选变量数据,根据多个加入备选变量数据后的宏观经济变量数据组和资产质量指标数据,对多个加入备选变量数据后的宏观经济变量数据组,构建第二线性回归模型来确定的;备选变量数据为:根据宏观经济变量数据排序列表,筛选出的单变量边际提升度不大于预设值的历史的宏观经济变量数据;
步骤205,将待测宏观经济变量数据输入到多变量模型中,输出待测宏观经济变量数据对应的资产质量指标数据。
下面对每一步骤进行详细说明。
在步骤201中,获取多个历史的宏观经济变量数据和资产质量指标数据;宏观经济变量数据包括生产总值、消费量、失业率、汇率、投资量和资产投资规模数据其中之一或任意组合;资产质量指标数据包括资产违约概率、资产违约损失率、资产不良率其中之一或任意组合,用于评价信贷资产的质量状况。
在一实施例中,在获取多个历史的宏观经济变量数据之前,还包括:
获取多个历史的宏观经济变量数据之后,还包括对多个历史的宏观经济变量数据进行如下预处理:
从多个历史的宏观经济变量数据中筛选数值型数据和类别型数据,对数值型数据和类别型数据进行压缩处理。
具体实施例中,采用无损压缩和/或有损压缩方法对数值型数据进行压缩,得到压缩后的数值型数据;采用整数编码、独热编码、哈希编码的编码压缩方法对类别型数据进行压缩,得到压缩后的类别型数据。
在步骤202中,针对每一个历史的宏观经济变量数据,建立一一对应的单变量模型;单变量模型是根据每一个历史的宏观经济变量数据和资产质量指标数据,对每一个历史的宏观经济变量数据,构建第一线性回归模型来确定的;根据每一个单变量模型,确定每一个历史的宏观经济变量数据的单变量边际提升度,将多个历史的宏观经济变量数据的单变量边际提升度进行从大到小的排序,得到宏观经济变量数据排序列表;单变量边际提升度,用于评价单个宏观经济变量数据对资产质量指标数据的贡献度。
具体实施例中,分别针对每一个历史的宏观经济变量数据,根据每个历史的宏观经济变量数据与对应的资产质量指标数据,建立线性回归模型。
在步骤203中,根据宏观经济变量数据排序列表,筛选出单变量边际提升度大于预设值的多个历史的宏观经济变量数据,构建为多个宏观经济变量数据组。
具体实施例中,基于宏观经济变量数据排序列表,建立多变量模型的备选变量数据清单。
步骤204,根据多个宏观经济变量数据组,建立多变量模型;多变量模型是在每一个宏观经济变量数据组中加入备选变量数据,根据多个加入备选变量数据后的宏观经济变量数据组和资产质量指标数据,对多个加入备选变量数据后的宏观经济变量数据组,构建第二线性回归模型来确定的;备选变量数据为:根据宏观经济变量数据排序列表,筛选出的单变量边际提升度不大于预设值的历史的宏观经济变量数据。
具体实施例中,在排序靠前的备选变量数据清单中,逐个加入备选变量数据到构建为多个宏观经济变量数据组中,然后进行回归建模,得到多变量模型。
在一实施例中,还包括按照以下方式调整多变量模型:
根据每一个历史的宏观经济变量数据的单变量边际提升度,调整多个宏观经济变量数据组,直至建立的多变量模型符合多变量模型评价指标的限值。
在一实施例中,所述多变量模型评价指标包括:最大迭代次数、赤池信息量AIC、决定系数R2和整体边际提升度;整体边际提升度是通过对赤池信息量AIC和决定系数R2进行调和平均计算得到的,用于评价单个宏观经济变量数据在多个多变量模型评价指标下对资产质量指标数据的贡献度。
在一实施例中,决定系数R2与单变量边际提升度符合如下公式条件:
其中,为加入备选变量数据后的宏观经济变量数据组建立的多变量模型中的决定系数,/>为未加入备选变量数据的宏观经济变量数据组建立的多变量模型中的决定系数;
赤池信息量AIC与单变量边际提升度符合如下公式条件:
其中,AIC新为加入备选变量数据后的宏观经济变量数据组建立的多变量模型中的赤池信息量,AIC初始为未加入备选变量数据的宏观经济变量数据组建立的多变量模型中的赤池信息量。
如图3所示为具体的多变量模型递归流程图,首先输入宏观经济变量数据排序列表,筛选出多个宏观经济变量数据组,命名为combo_list,从combo_list按序选出一个变量数据组,命名为combo_A,在变量数据组combo A的基础上增加一个备选变量数据,得到combo_B,基于combo_B进行多变量模型建模,根据单变量边际提升度进行是否遍历了所有combo_A以外的备选变量数据的判断、是否满足多变量模型评价指标的预设条件的判断。
步骤205,将待测宏观经济变量数据输入到多变量模型中,输出待测宏观经济变量数据对应的资产质量指标数据。
本发明实施例中还提供了一种资产质量指标数据分析装置,如下面的实施例所述。由于该装置解决问题的原理与资产质量指标数据分析方法相似,因此该装置的实施可以参见资产质量指标数据分析方法的实施,重复之处不再赘述。如图4所示,该装置包括:
宏观经济变量数据和资产质量指标数据获取模块401,用于获取多个历史的宏观经济变量数据和资产质量指标数据;宏观经济变量数据包括生产总值、消费量、失业率、汇率、投资量和资产投资规模数据其中之一或任意组合;资产质量指标数据包括资产违约概率、资产违约损失率、资产不良率其中之一或任意组合,用于评价信贷资产的质量状况;
单变量边际提升度确定模块402,用于针对每一个历史的宏观经济变量数据,建立一一对应的单变量模型;单变量模型是根据每一个历史的宏观经济变量数据和资产质量指标数据,对每一个历史的宏观经济变量数据,构建第一线性回归模型来确定的;根据每一个单变量模型,确定每一个历史的宏观经济变量数据的单变量边际提升度,将多个历史的宏观经济变量数据的单变量边际提升度进行从大到小的排序,得到宏观经济变量数据排序列表;单变量边际提升度,用于评价单个宏观经济变量数据对资产质量指标数据的贡献度;
宏观经济变量数据组构建模块403,用于根据宏观经济变量数据排序列表,筛选出单变量边际提升度大于预设值的多个历史的宏观经济变量数据,构建为多个宏观经济变量数据组;
多变量模型建立模块404,用于根据多个宏观经济变量数据组,建立多变量模型;多变量模型是在每一个宏观经济变量数据组中加入备选变量数据,根据多个加入备选变量数据后的宏观经济变量数据组和资产质量指标数据,对多个加入备选变量数据后的宏观经济变量数据组,构建第二线性回归模型来确定的;备选变量数据为:根据宏观经济变量数据排序列表,筛选出的单变量边际提升度不大于预设值的历史的宏观经济变量数据;
资产质量指标数据输出模块405,用于将待测宏观经济变量数据输入到多变量模型中,输出待测宏观经济变量数据对应的资产质量指标数据。
如图5所示,在一实施例中,还包括多变量模型调整模块501,具体用于:
根据每一个历史的宏观经济变量数据的单变量边际提升度,调整多个宏观经济变量数据组,直至满足多变量模型评价指标的预设条件。
在一实施例中,所述多变量模型评价指标包括:最大迭代次数、赤池信息量AIC、决定系数R2和整体边际提升度;整体边际提升度是通过对赤池信息量AIC和决定系数R2进行调和平均计算得到的,用于评价单个宏观经济变量数据在多个多变量模型评价指标下对资产质量指标数据的贡献度。
在一实施例中,
决定系数R2与单变量边际提升度符合如下公式条件:
其中,为加入备选变量数据后的宏观经济变量数据组建立的多变量模型中的决定系数,/>为未加入备选变量数据的宏观经济变量数据组建立的多变量模型中的决定系数;
赤池信息量AIC与单变量边际提升度符合如下公式条件:
其中,AIC新为加入备选变量数据后的宏观经济变量数据组建立的多变量模型中的赤池信息量,AIC初始为未加入备选变量数据的宏观经济变量数据组建立的多变量模型中的赤池信息量。
在一实施例中,还包括数据预处理模块,具体用于:
获取多个历史的宏观经济变量数据之后,对多个历史的宏观经济变量数据进行如下预处理:
从多个历史的宏观经济变量数据中筛选数值型数据和类别型数据,对数值型数据和类别型数据进行压缩处理。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述资产质量指标数据分析方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述资产质量指标数据分析方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述资产质量指标数据分析方法。
本发明实施例中,通过获取多个历史的宏观经济变量数据和资产质量指标数据;宏观经济变量数据包括生产总值、消费量、失业率、汇率、投资量和资产投资规模数据其中之一或任意组合;资产质量指标数据包括资产违约概率、资产违约损失率、资产不良率其中之一或任意组合,用于评价信贷资产的质量状况;针对每一个历史的宏观经济变量数据,建立一一对应的单变量模型;单变量模型是根据每一个历史的宏观经济变量数据和资产质量指标数据,对每一个历史的宏观经济变量数据,构建第一线性回归模型来确定的;根据每一个单变量模型,确定每一个历史的宏观经济变量数据的单变量边际提升度,将多个历史的宏观经济变量数据的单变量边际提升度进行从大到小的排序,得到宏观经济变量数据排序列表;单变量边际提升度,用于评价单个宏观经济变量数据对资产质量指标数据的贡献度;根据宏观经济变量数据排序列表,筛选出单变量边际提升度大于预设值的多个历史的宏观经济变量数据,构建为多个宏观经济变量数据组;根据多个宏观经济变量数据组,建立多变量模型;多变量模型是在每一个宏观经济变量数据组中加入备选变量数据,根据多个加入备选变量数据后的宏观经济变量数据组和资产质量指标数据,对多个加入备选变量数据后的宏观经济变量数据组,构建第二线性回归模型来确定的;备选变量数据为:根据宏观经济变量数据排序列表,筛选出的单变量边际提升度不大于预设值的历史的宏观经济变量数据;将待测宏观经济变量数据输入到多变量模型中,输出待测宏观经济变量数据对应的资产质量指标数据。在上述过程中,本发明实施例通过宏观经济变量数据组建立多变量模型,分析输出待测宏观经济变量数据对应的资产质量指标数据,可以提高资产质量指标数据分析的准确性和时效性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (13)
1.一种资产质量指标数据分析方法,其特征在于,包括:
获取多个历史的宏观经济变量数据和资产质量指标数据;宏观经济变量数据包括生产总值、消费量、失业率、汇率、投资量和资产投资规模数据其中之一或任意组合;资产质量指标数据包括资产违约概率、资产违约损失率、资产不良率其中之一或任意组合,用于评价信贷资产的质量状况;
针对每一个历史的宏观经济变量数据,建立一一对应的单变量模型;单变量模型是根据每一个历史的宏观经济变量数据和资产质量指标数据,对每一个历史的宏观经济变量数据,构建第一线性回归模型来确定的;根据每一个单变量模型,确定每一个历史的宏观经济变量数据的单变量边际提升度,将多个历史的宏观经济变量数据的单变量边际提升度进行从大到小的排序,得到宏观经济变量数据排序列表;单变量边际提升度,用于评价单个宏观经济变量数据对资产质量指标数据的贡献度;
根据宏观经济变量数据排序列表,筛选出单变量边际提升度大于预设值的多个历史的宏观经济变量数据,构建为多个宏观经济变量数据组;
根据多个宏观经济变量数据组,建立多变量模型;多变量模型是在每一个宏观经济变量数据组中加入备选变量数据,根据多个加入备选变量数据后的宏观经济变量数据组和资产质量指标数据,对多个加入备选变量数据后的宏观经济变量数据组,构建第二线性回归模型来确定的;备选变量数据为:根据宏观经济变量数据排序列表,筛选出的单变量边际提升度不大于预设值的历史的宏观经济变量数据;
将待测宏观经济变量数据输入到多变量模型中,输出待测宏观经济变量数据对应的资产质量指标数据。
2.如权利要求1所述的方法,其特征在于,还包括按照以下方式调整多变量模型:
根据每一个历史的宏观经济变量数据的单变量边际提升度,调整多个宏观经济变量数据组,直至建立的多变量模型符合多变量模型评价指标的限值。
3.如权利要求2所述的方法,其特征在于,所述多变量模型评价指标包括:最大迭代次数、赤池信息量AIC、决定系数R2和整体边际提升度;整体边际提升度是通过对赤池信息量AIC和决定系数R2进行调和平均计算得到的,用于评价单个宏观经济变量数据在多个多变量模型评价指标下对资产质量指标数据的贡献度。
4.如权利要求3所述的方法,其特征在于,决定系数R2与单变量边际提升度符合如下公式条件:
其中,R2 新为加入备选变量数据后的宏观经济变量数据组建立的多变量模型中的决定系数,R2 初始为未加入备选变量数据的宏观经济变量数据组建立的多变量模型中的决定系数;
赤池信息量AIC与单变量边际提升度符合如下公式条件:
其中,AIC新为加入备选变量数据后的宏观经济变量数据组建立的多变量模型中的赤池信息量,AIC初始为未加入备选变量数据的宏观经济变量数据组建立的多变量模型中的赤池信息量。
5.如权利要求1所述的方法,其特征在于,获取多个历史的宏观经济变量数据之后,还包括对多个历史的宏观经济变量数据进行如下预处理:
从多个历史的宏观经济变量数据中筛选数值型数据和类别型数据,对数值型数据和类别型数据进行压缩处理。
6.一种资产质量指标数据分析装置,其特征在于,包括:
宏观经济变量数据和资产质量指标数据获取模块,用于获取多个历史的宏观经济变量数据和资产质量指标数据;宏观经济变量数据包括生产总值、消费量、失业率、汇率、投资量和资产投资规模数据其中之一或任意组合;资产质量指标数据包括资产违约概率、资产违约损失率、资产不良率其中之一或任意组合,用于评价信贷资产的质量状况;
单变量边际提升度确定模块,用于针对每一个历史的宏观经济变量数据,建立一一对应的单变量模型;单变量模型是根据每一个历史的宏观经济变量数据和资产质量指标数据,对每一个历史的宏观经济变量数据,构建第一线性回归模型来确定的;根据每一个单变量模型,确定每一个历史的宏观经济变量数据的单变量边际提升度,将多个历史的宏观经济变量数据的单变量边际提升度进行从大到小的排序,得到宏观经济变量数据排序列表;单变量边际提升度,用于评价单个宏观经济变量数据对资产质量指标数据的贡献度;
宏观经济变量数据组构建模块,用于根据宏观经济变量数据排序列表,筛选出单变量边际提升度大于预设值的多个历史的宏观经济变量数据,构建为多个宏观经济变量数据组;
多变量模型建立模块,用于根据多个宏观经济变量数据组,建立多变量模型;多变量模型是在每一个宏观经济变量数据组中加入备选变量数据,根据多个加入备选变量数据后的宏观经济变量数据组和资产质量指标数据,对多个加入备选变量数据后的宏观经济变量数据组,构建第二线性回归模型来确定的;备选变量数据为:根据宏观经济变量数据排序列表,筛选出的单变量边际提升度不大于预设值的历史的宏观经济变量数据;
资产质量指标数据输出模块,用于将待测宏观经济变量数据输入到多变量模型中,输出待测宏观经济变量数据对应的资产质量指标数据。
7.如权利要求6所述的装置,其特征在于,还包括多变量模型调整模块,具体用于:
根据每一个历史的宏观经济变量数据的单变量边际提升度,调整多个宏观经济变量数据组,直至建立的多变量模型符合多变量模型评价指标的限值。
8.如权利要求7所述的装置,其特征在于,所述多变量模型评价指标包括:最大迭代次数、赤池信息量AIC、决定系数R2和整体边际提升度;整体边际提升度是通过对赤池信息量AIC和决定系数R2进行调和平均计算得到的,用于评价单个宏观经济变量数据在多个多变量模型评价指标下对资产质量指标数据的贡献度。
9.如权利要求8所述的装置,其特征在于,决定系数R2与单变量边际提升度符合如下公式条件:
其中,R2 新为加入备选变量数据后的宏观经济变量数据组建立的多变量模型中的决定系数,R2 初始为未加入备选变量数据的宏观经济变量数据组建立的多变量模型中的决定系数;
赤池信息量AIC与单变量边际提升度符合如下公式条件:
其中,AIC新为加入备选变量数据后的宏观经济变量数据组建立的多变量模型中的赤池信息量,AIC初始为未加入备选变量数据的宏观经济变量数据组建立的多变量模型中的赤池信息量。
10.如权利要求6所述的装置,其特征在于,还包括数据预处理模块,具体用于:
在宏观经济变量数据和资产质量指标数据获取模块获取多个历史的宏观经济变量数据之后,对多个历史的宏观经济变量数据进行如下预处理:
从多个历史的宏观经济变量数据中筛选数值型数据和类别型数据,对数值型数据和类别型数据进行压缩处理。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一所述方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至5任一所述方法。
13.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至5任一所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311385060.5A CN117273545A (zh) | 2023-10-24 | 2023-10-24 | 资产质量指标数据分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311385060.5A CN117273545A (zh) | 2023-10-24 | 2023-10-24 | 资产质量指标数据分析方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117273545A true CN117273545A (zh) | 2023-12-22 |
Family
ID=89215951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311385060.5A Pending CN117273545A (zh) | 2023-10-24 | 2023-10-24 | 资产质量指标数据分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117273545A (zh) |
-
2023
- 2023-10-24 CN CN202311385060.5A patent/CN117273545A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106951984B (zh) | 一种系统健康度动态分析预测方法及装置 | |
CN111951097A (zh) | 企业信用风险评估方法、装置、设备及存储介质 | |
CN115906954A (zh) | 一种基于图神经网络的多变量时间序列预测方法及装置 | |
CN112418921A (zh) | 用电需量预测方法、装置、系统与计算机存储介质 | |
CN113094988A (zh) | 一种基于数据驱动的浆液循环泵运行优化方法及系统 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN114155072A (zh) | 基于大数据分析的财务预测模型构建方法及系统 | |
CN113988676B (zh) | 一种水处理设备的安全管理方法及系统 | |
CN113793057A (zh) | 一种基于回归分析模型的建筑招投标数据生成方法 | |
CN112418522A (zh) | 一种基于三支集成预测模型的工业加热炉钢温预测方法 | |
CN117235510A (zh) | 节理粗糙度预测方法与节理粗糙度预测模型训练方法 | |
CN117035155A (zh) | 一种水质预测方法 | |
CN117273545A (zh) | 资产质量指标数据分析方法及装置 | |
CN116561569A (zh) | 一种基于EO特征选择结合AdaBoost算法的工业电力负荷辨识方法 | |
CN114238102A (zh) | 一种基于复合变量特性的分阶段工作量预测方法及系统 | |
CN114048925A (zh) | 一种电网综合运营预警方法、装置及终端设备 | |
CN112116139A (zh) | 一种电力需求预测方法及系统 | |
CN113077189A (zh) | 一种小微企业生命周期评估的方法和装置 | |
CN116780524B (zh) | 一种基于lstm深度学习的工业企业短期负荷预测方法 | |
CN117408742B (zh) | 用户筛分方法及系统 | |
CN117011063B (zh) | 客户交易风险预测处理方法及装置 | |
CN117670000B (zh) | 基于组合预测模型的泵站供水量预测方法 | |
CN113204482B (zh) | 基于语义属性子集划分与度量匹配的异质缺陷预测方法及系统 | |
WO2023181230A1 (ja) | モデル分析装置、モデル分析方法、及び、記録媒体 | |
CN117009752A (zh) | 一种基于poa-vmd-ssa-kelm模型的用电需求预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |