CN115759751A - 一种企业风险预测方法、装置、存储介质、电子设备及产品 - Google Patents

一种企业风险预测方法、装置、存储介质、电子设备及产品 Download PDF

Info

Publication number
CN115759751A
CN115759751A CN202211527887.0A CN202211527887A CN115759751A CN 115759751 A CN115759751 A CN 115759751A CN 202211527887 A CN202211527887 A CN 202211527887A CN 115759751 A CN115759751 A CN 115759751A
Authority
CN
China
Prior art keywords
prediction
preset
time sequence
model
index item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211527887.0A
Other languages
English (en)
Inventor
李磊
颜可心
王靖文
尹丛笑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCB Finetech Co Ltd
Original Assignee
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCB Finetech Co Ltd filed Critical CCB Finetech Co Ltd
Priority to CN202211527887.0A priority Critical patent/CN115759751A/zh
Publication of CN115759751A publication Critical patent/CN115759751A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种企业风险预测方法、装置、电子设备、介质及产品。该方法通过获取目标企业的预设指标项在预设时间窗口的第一历史时间序列,基于预先构建指标预测模型,对预设指标项上的第一历史时间序列进行预测处理,得到预设指标项在预测时间范围内的预测时间序列,基于风险预测模型对预设指标项的第一历史时间序列和/或预测时间序列进行预测处理,得到目标企业的风险预测结果。解决了以往企业风险预测因忽略了变量在时间维度上的前后因果关系而导致模型无法实现提前预警的目的的问题,提升了企业风险预测的精度与准确性,为用户进行分析节约了时间,提高了数据的利用率。

Description

一种企业风险预测方法、装置、存储介质、电子设备及产品
技术领域
本发明涉及金融科技技术领域,尤其涉及一种企业风险预测方法、装置、电子设备、介质及产品。
背景技术
近年来,随着互联网与信息技术的高速发展,类金融服务逐渐转为线上线下结合的方式,结构复杂的类金融产品在互联网的加持下层出不穷,提高了类金融企业的业务复杂度,企业类金融的风险越来越不容忽视。
目前,针对企业类金融风险评价方式主要是基于监管政策、金融局的专家经验以及通过简单的逻辑模型进行回归。但以上三种方法均无法体现变量的时间因素,无法达到提前预警的目的。
发明内容
本发明提供了一种企业风险预测方法、装置、电子设备、介质及产品,以实现企业风险提前预警的目的。
根据本发明的一方面,提供了一种企业风险预测方法,包括:
获取目标企业的预设指标项在预设时间窗口的第一历史时间序列;
基于预先构建指标预测模型,对所述预设指标项上的第一历史时间序列进行预测处理,得到所述预设指标项在预测时间范围内的预测时间序列;
基于风险预测模型对所述预设指标项的所述第一历史时间序列和/或所述预测时间序列进行预测处理,得到所述目标企业的风险预测结果。
可选的,所述预设指标项的筛选方法包括:
获取候选指标项,确定所述候选指标项分别对应的第二历史时间序列,基于所述第二历史时间序列形成随时间变化的数据趋势图;
展示所述数据趋势图,并接收用户基于所述数据趋势图对所述候选指标项的选择操作,将被选择的候选指标项确定为所述预设指标项。
可选的,所述预设指标项的筛选方法包括:
获取候选指标项,确定所述候选指标项分别对应的第二历史时间序列;
对于任一所述第二历史时间序列进行自相关运算处理,得到自相关数据,和/或,对于任一所述第二历史时间序列进行偏自相关运算处理,得到偏自相关数据;
基于各所述候选指标项对应的所述自相关数据和/或所述偏自相关数据对所述候选指标项筛选,确定预设指标项。
可选的,所述基于各所述候选指标项对应的所述自相关数据和/或所述偏自相关数据对所述候选指标项筛选,确定预设指标项,包括:
将所述自相关数据满足预设趋势要求,和/或,所述偏自相关数据满足预设趋势要求的候选指标项确定为所述预设指标项。
可选的,所述指标预测模型为差分整合移动平均自回归模型。
可选的,所述指标预测模型的生成方法,包括:
基于所述预设指标项对应的第三历史时间序列,确定所述预设指标项对应的模型阶数;
基于所述模型阶数创建初始的指标预测模型,并基于训练数据对所述初始的指标预测模型进行训练,得到训练好的指标预测模型。
可选的,所述指标预测模型的数量为一个;所述指标预测模型基于多个预设指标项确定的模型阶数均值生成,或者,基于多个预设指标项确定的模型阶数最大值生成;
或者,所述每一预设指标项分别对应一个指标预测模型,任一所述预设指标项对应的指标预测模型,基于所述预设指标项确定的模型阶数生成。
可选的,所述基于所述预设指标项对应的第三历史时间序列,确定所述预设指标项对应的模型阶数,包括:
确定所述第三历史时间序列对应的自相关数据和/或偏自相关数据;
基于所述自相关数据和/或偏自相关数据随时间周期的变化趋势确定模型阶数。
可选的,在基于所述自相关数据和/或偏自相关数据随时间周期的变化趋势确定模型阶数之后,还包括:
对所述预设指标项对应的第三历史时间序列进行平稳性检测;
若所述预设指标项对应的第三历史时间序列不满足平稳性检测条件,则对所述预设指标项对应的第三历史时间序列进行差分处理,并更新所述预设指标项对应的模型阶数。
可选的,所述方法还包括:对差分处理后的第三历史时间序列进行平稳性检测,若差分处理后的第三历史时间序列不满足平稳性检测条件,则对所述差分处理后的第三历史时间序列再次进行差分处理;
其中,所述更新所述预设指标项对应的模型阶数,包括:
在完成一次差分处理后,对当前的模型阶数加一,得到新的模型阶数。
可选的,所述风险预测模型为基于XGBoost算法的回归预测模型。
可选的,所述预设指标项为类金融维度指标项;
所述目标企业的风险预测结果为所述目标企业属于类金融企业的风险预测结果。
根据本发明的另一方面,提供了一种企业风险预测装置,包括:
序列获取模块,用于获取目标企业的预设指标项在预设时间窗口的第一历史时间序列;
时间序列分析模块,用于基于预先构建指标预测模型,对所述预设指标项上的第一历史时间序列进行预测处理,得到所述预设指标项在预测时间范围内的预测时间序列;
回归分析模块,基于风险预测模型对所述预设指标项的所述第一历史时间序列和/或所述预测时间序列进行预测处理,得到所述目标企业的风险预测结果。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的企业风险预测方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的企业风险预测方法。
根据本发明的另一方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序在被处理器执行时实现本发明任一实施例所述的企业风险预测方法。
本发明实施例的技术方案,通过获取目标企业的预设指标项在预设时间窗口的第一历史时间序列,基于预先构建指标预测模型,对预设指标项上的第一历史时间序列进行预测处理,得到预设指标项在预测时间范围内的预测时间序列,基于风险预测模型对预设指标项的第一历史时间序列和/或预测时间序列进行预测处理,得到目标企业的风险预测结果。解决了以往企业风险预测因忽略了变量在时间维度上的前后因果关系而导致模型无法实现提前预警的目的的问题,提升了企业风险预测的精度与准确性。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种企业风险预测方法的流程图;
图2是本发明实施例一提供的另一种企业风险预测方法的流程图;
图3是本发明实施例二提供的一种企业风险预测装置的结构示意图;
图4是本发明实施例三提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一特征数据”、“第二特征数据”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请所涉及技术方案中对数据的获取、存储和/或处理,符合国家法律法规的相关规定。
实施例一
图1是本发明实施例一提供的一种企业风险预测方法的流程图,本实施例可适用于企业风险预测的情况,该方法可以由企业风险预测装置来执行,该企业风险预测装置可以采用硬件和/或软件的形式实现,该企业风险预测装置可配置于本发明实施例提供的电子设备中。如图1所示,该方法包括:
S110、获取目标企业的预设指标项在预设时间窗口的第一历史时间序列。
其中,目标企业可以是有风险预测预测需求的企业。预设指标项可以是经过预设方式筛选后获得的指标项,该预设指标项可以是用于对企业进行风险预测的有效指标项。可以理解的是,不同类型的风险预测需求可对应不同的预设指标项,可根据风险预测类型确定。每一风险预测类型对应的预设指标项的数量可以是多个。在一些实施例中,风险预测类型可以是类金融企业的风险预测,相应的,预设指标项可以为类金融维度指标项。
其中,针对任一预设指标项,基于目标企业在该预设指标项上的历史数据,形成第一历史时间序列,每一预设指标项分别对应一个第一历史时间序列。第一历史时间序列可以是指将任一预设指标项对应的历史企业数据按其发生的时间先后顺序排列而成的数据序列,或,反映目标企业的预设指标项中企业数据在时间维度上的前后因果关系的序列。相应的,构成第一历史时间序列的历史数据可以从对应的企业系统中直接提取获得或由目标企业提供,该历史数据可对应设置有时间戳,基于历史数据的时间戳和预设时间窗口进行历史数据的筛选,将筛选得到的历史数据按时间戳进行排序,形成第一历史时间序列。
其中,预设时间窗口可以是预先设置的,例如可以是通过结合专家经验与预设指标项所包含的时间跨度这两方面因素,综合确定的各预设指标项用于时间序列分析的时间窗口,相应的,时间跨度可以为几个月或几年,此处不作具体限定。
预设指标项可以是在大量的候选指标项中筛选得到的,具体的,可以是从候选指标项中剔除对风险预测的无效指标项,得到预设指标项。其中,预设指标项可以是满足特定趋势条件的指标项,和/或,预设指标项可以是满足自回归条件的指标项。在一些实施例中,预设指标项的筛选方法可以包括:获取候选指标项,确定候选指标项分别对应的第二历史时间序列,基于第二历史时间序列形成随时间变化的数据趋势图,展示数据趋势图,并接收用户基于数据趋势图对候选指标项的选择操作,将被选择的候选指标项确定为预设指标项。可以理解的是,第一历史时间序列和第二历史时间序列对应的时间窗口长度可以相同或不同,第一历史时间序列和第二历史时间序列对应的时间区间可以相同或不同,也可以存在重叠,此处不作限定。
其中,候选指标项可以是从类金融企业工商信息、财务信息、司法涉诉信息、涉税信息、企业被执行信息等企业基础信息维度选取的用于单元时间序列分析的基础指标,此处不做具体限定。可选的,候选指标项可以是人工初筛获取。
其中,第二历史时间序列可以是指将任一候选指标项中的企业数据按其发生的时间先后顺序排列而成的序列或反映目标企业的候选指标项中企业数据在时间维度上的前后因果关系的序列。相应的,第二历史时间序列可以从对应的企业系统中直接提取获得或由目标企业提供。
其中,数据趋势图可以是将候选指标项中的企业数据基于第二历史时间序列转化为随时间变化的曲线图的结果,数据趋势图可以是表征候选指标项中企业数据随时间变化趋势的图像。通过展示数据趋势图,便于操作用户直观的观看各候选指标项对应数据的变化趋势。相应的,对候选指标项的选择操作可以是用户观察数据趋势图并对数据趋势图满足预设条件的候选指标项的选择操作,此处不限定选择操作的实现方式,例如可以是对候选指标项的点击操作等。
通过对候选指标项的数据趋势图进行展示后,根据用户对候选指标项的选择操作确定预设指标项,由用户对各候选指标项对应的数据趋势进行判定,剔除了无效的指标项,减少了无效的指标项对预测过程的干扰,提高预设指标项的准确度,从而提高预测效率和预测精度。
在一些实施例中,预设指标项的筛选方法还可以包括:获取候选指标项,确定候选指标项分别对应的第二历史时间序列。对于任一第二历史时间序列进行自相关运算处理,得到自相关数据,或对于任一第二历史时间序列进行偏自相关运算处理,得到偏自相关数据。基于各候选指标项对应的自相关数据或偏自相关数据对候选指标项筛选,确定预设指标项。
其中,自相关运算处理可以是基于自相关函数(Autocorrelation Function)进行的运算过程。具体的,自相关函数ACF可以是数描述了时间序列的当前值与其过去值之间相关性的函数,其中可以包含了直接和间接的所有相关性信息。相应的,自相关数据可以是对于任一第二历史时间序列通过自相关函数ACF运算后得到的自相关系数。
其中,偏自相关运算处理可以是基于偏自相关函数(PartialAutocorrelationFunction)进行的运算过程。具体的,偏自相关函数PACF仅描述了当前值与其过去值之间的相关性,排除掉了中间的其他变量影响的相关信息。相应的,偏自相关数据可以是对于任一第二历史时间序列通过偏自相关函数PACF运算后得到的偏自相关系数。
其中,对候选指标项筛选可以是对候选指标项的第二历史时间序列进行自相关运算处理或偏自相关运算处理,将满足预设条件的自相关数据或偏自相关数据对应的第二历史时间序列表征的候选指标项确定为预设指标项。
可选的,将自相关数据满足预设趋势要求或偏自相关数据满足预设趋势要求的候选指标项确定为预设指标项,此处的预设趋势要求可以是预先设置的,此处不作限定。
相应的,基于自相关数据满足预设趋势要求或偏自相关数据形成随时间变化的数据趋势图,并将满足预设趋势要求的趋势图所对应的候选指标项确定为预设指标项。
通过自相关函数ACF及偏自相关函数PACF对候选指标项对应的历史时间序列进行运算,并基于自相关数据或偏自相关数据对候选指标项进行筛选确定预设指标项,进一步剔除了无效的指标项,减少了后续预测数据的复杂程度,从而提高了预测效率。
可选的,预设指标项的筛选方法还可以包括:获取候选指标项,确定候选指标项分别对应的第二历史时间序列。对于任一第二历史时间序列进行自相关运算处理,得到自相关数据和对于任一第二历史时间序列进行偏自相关运算处理,得到偏自相关数据。基于各候选指标项对应的自相关数据和偏自相关数据对候选指标项筛选,确定预设指标项。
相应的,对候选指标项筛选可以是对候选指标项的第二历史时间序列进行自相关运算处理和偏自相关运算处理,将自相关数据满足预设趋势要求和偏自相关数据均满足预设趋势要求的第二历史时间序列对应的候选指标项确定为预设指标项。
S120、基于预先构建指标预测模型,对预设指标项上的第一历史时间序列进行预测处理,得到预设指标项在预测时间范围内的预测时间序列。
其中,指标预测模型可以为差分整合移动平均自回归模型(AutoregressiveIntegratedMovingAveragemodel,ARIMA),其是时间序列预测分析方法之一。指标预测模型可以用于基于历史企业数据来预测未来的企业数据,即基于第一历史时间序列进行预测得到预测时间序列。
需要说明的是,在ARIMA模型中,AR代表“自回归模型”;MA代表“滑动平均模型”;ARMA代表自回归模型和移动平均模型的结合;ARIMA是经过差分后的ARMA模型,保证了数据的稳定性。具体的,ARIMA模型含有三个参数:p,d,q。其中,p为自回归项数,代表预测模型中采用的时序数据本身的滞后数(lags),d为差分的阶数,代表时序数据需要进行几阶差分化才是稳定的,q为滑动平均项数,代表预测模型中采用的预测误差的滞后数(lags),关于ARIMA模型的具体说明可以参考现有技术,此处不再赘述。
需要说明的是,预设指标项中包括的企业数据复杂程度越高,预测的难度就越高,需要的模型阶数也越高,因此,对不同的预设指标项需要设定不同阶数的模型。
可选的,指标预测模型的生成方法可以是:基于预设指标项对应的第三历史时间序列,确定预设指标项对应的模型阶数,基于模型阶数创建初始的指标预测模型,并基于训练数据对初始的指标预测模型进行训练,得到训练好的指标预测模型。
其中,第三历史时间序列可以是基于自相关数据或偏自相关数据进行预设处理后的预设指标项时间序列,此处的第三历史时间序列对应的时长和时间区间可以是与第一历史时间序列对应的时长和时间区间相同或不同,和/或,可以是与第二历史时间序列对应的时长和时间区间相同或不同。模型阶数可以是表征对应的指标预测模型的预测能力高低的参数,模型阶数可以通过预设运算得到,例如,自相关运算处理、偏自相关运算处理等。相应的,在通过自相关运算处理或偏自相关运算处理获得模型阶数后还可以基于AIC准则函数与SBC准则函数对模型进行优化迭代,并选取使得AIC或SBC函数达到最小的模型作为相对最优模型。
其中,初始的指标预测模型可以是没有经过数据训练的空白模型,此处的空白模型中的模型参数可以是随机参数,还可以是预设的初始参数,需进一步通过训练的方式调节上述模型参数。训练数据可以是历史预设时间内的指标项中的企业数据。
通过预设处理确定指标预测模型的模型阶数,以创建初始的指标预测模型,进一步的,基于训练数据调节初始的指标预测模型中的模型参数,提高了预测的精准度。
可选的,指标预测模型的数量可以为一个,该指标预测模型适用于所有的预设指标项。相应的,指标预测模型基于多个预设指标项确定的模型阶数均值生成,或者,基于多个预设指标项确定的模型阶数最大值生成。通过创建适用于所有预设指标项的指标预测模型,简化指标预测模型的数量,简化指标预测模型的训练过程。
可选的,指标预测模型的数量可以为多个,指标预测模型的数量可以与预设指标项的数量相同。相应的,每一预设指标项分别对应一个指标预测模型,任一预设指标项对应的指标预测模型,基于预设指标项确定的模型阶数生成。通过基于每一预设指标项分别创建一个指标预测模型,提高各个指标预测模型的针对性,进一步提高预设指标项对应预测时间序列的准确性。
通过对指标预测模型的模型阶数进行适应性的调整,使其能够更好的完成预测操作,从而确保预测结果更加精确。
可选的,确定预设指标项对应的模型阶数的过程可以是:确定第三历史时间序列对应的自相关数据或偏自相关数据,基于自相关数据或偏自相关数据随时间周期的变化趋势确定模型阶数。
其中,第三历史时间序列对应的自相关数据或偏自相关数据可以通过自相关函数ACF及偏自相关函数PACF计算获得。其中,第三历史时间序列对应的时间窗口可以包括多个时间周期,此处时间周期可以是工作人员基于实际情况设定的,例如,当第三历史时间序列的时间跨度为一年,则其时间周期可以基于每个季度的时间跨度确定,即三个月为一个周期,则该第三历史时间序列有四个周期,此处仅是举例说明,而非具体限定。模型阶数的确定可以是基于自相关数据或偏自相关数据达到预设条件时所处的周期数确定。
示例性的,基于第三历史时间序列对应的自相关数据对预设指标项对应的模型阶数确定的过程,可以是:确定自相关数据达到预设要求的周期数,基于该周期数确定模型阶数。其中,预设要求可以是自相关数据达到逐渐下降至0,模型阶数可以是上述周期数加一确定。例如,若自相关数据在第一周期出现小于0的情况,则确定该预设指标项对应的模型阶数为“2”。相应的,基于第三历史时间序列对应的偏自相关数据对预设指标项对应的模型阶数确定的过程同上。
可选的,确定预设指标项对应的模型阶数的过程,可以是:确定第三历史时间序列对应的自相关数据和偏自相关数据,基于自相关数据和偏自相关数据随时间周期的变化趋势确定模型阶数。
通过预设指标项时间序列的周期性变化趋势确定预设指标项对应的模型阶数,实现指标预测模型的模型阶数地精准确定,使指标预测模型的模型阶数与各个预设指标项更加契合。
可选的,在确定模型阶数之后,还可以对预设指标项对应的第三历史时间序列进行平稳性检测若预设指标项对应的第三历史时间序列不满足平稳性检测条件,则对预设指标项对应的第三历史时间序列进行差分处理,并更新预设指标项对应的模型阶数。
其中,平稳性检测可以是基于预设的平稳性检测模型或平稳性检测算法进行计算的过程,该平稳性检测模型或平稳性检测算法可以是预先设置的,在存在平稳性检测需求的情况下,可进行调用,此处不限定平稳性检测的具体实现方式。
若经过平稳性检测后,指标预测模型处于稳定状态,则保持当前指标预测模型的模型阶数不变;若经过平稳性检测后,指标预测模型处于不稳定状态,则预设指标项对应的第三历史时间序列进行差分处理。同时,更新预设指标项对应的模型阶数可以是在完成一次差分处理后,对当前的模型阶数加一,得到新的模型阶数。
可选的,对差分处理后的第三历史时间序列进行平稳性检测,若差分处理后的第三历史时间序列不满足平稳性检测条件,则对差分处理后的第三历史时间序列再次进行差分处理。
相应的,在每完成一次差分处理后,对当前的模型阶数加一,得到新的模型阶数。
通过对预设指标项对应的第三历史时间序列进行平稳性检测,并在未通过平稳性检测时,对其进行差分处理,使数据更加平稳,从而进一步的提高了风险预测的精度。
S130、基于风险预测模型对预设指标项的第一历史时间序列和/或预测时间序列进行预测处理,得到目标企业的风险预测结果。
其中,风险预测模型可以为基于XGBoost算法的回归预测模型。
需要说明的是,基于XGBoost(eXtremeGradientBoosting)算法的回归预测模型,又名极度梯度提升树,是机器学习模型中的一种。Boosting是一种集成技术,模型最终由多个树模型组成。梯度提升是一种创建新模型的方法,用于预测先前模型的残差或误差,并不断让新的树模型去拟合前面模型的残差。最终的总模型是将每轮训练得到的树模型加权求和得到,从而降低模型的最终偏差。关于XGBoost模型的具体说明可以参考现有技术,此处不再赘述。
此处,可以是将各预设指标项的预测时间序列输入至于风险预测模型中,得到的目标企业的风险预测结果;或者,将各预设指标项的第一历史时间序列输入至风险预测模型中,得到的目标企业的风险预测结果;或者,可以是分别将各预设指标项的第一历史时间序列和预测时间序列分别进行拼接处理,得到各预设指标项的目标时间序列,将各预设指标项的目标时间序列输入至风险预测模型中,得到的目标企业的风险预测结果。
该目标企业的风险预测结果可以是1或0,其中,1表征目标企业具有风险;0表征目标企业不具有风险。该目标企业的风险预测结果还可以是0-1之间的概率值,根据概率阈值与上述风险预测结果进行比对,确定目标企业是否具有风险。
目标企业的风险预测结果可以为目标企业属于类金融企业的风险预测结果。相应的,类金融企业可以是指经营业务具有金融活动属性,但是并未获得金融许可证,非由国家金融监管部门直接监管(即非一行三会监管)的企业,可以主要是指以互联网、大数据、人工智能等金融科技新型技术为基础发展起来的。
在一个可选的实施例中,具体参见图2,首先工作人员操作系统,通过指标选取模块进行风险指标人工初筛,即选择出候选指标项。将人工初筛出的风险指标输入特征工程模块进行ACF自相关/PACF偏自相关系数运算,依据自相关函数ACF及偏自相关函数PACF进行自相关处理及偏自相关处理,基于AIC/SBC准则输出风险指标集合,即筛选候选指标项确定预设指标项。将确定的预设指标项输入时间序列分析模块并各个确定预设指标项的时间窗口,基于预设指标项的时间窗口对其时间序列中的数据进行平稳性检测,防止指标预测模型中存在随机趋势或确定趋势,避免“伪回归”问题的产生,对于未通过平稳性检测的数据进行差分处理,以消除数据中所包含的随机趋势,将非平稳序列转换为平稳序列,从而使数据平稳,部分预设指标项的当期变动对于类金融企业所面临的企业风险的影响只有在经过一定时间间隔后才能被观察或捕捉到,而对于该种具有滞后性的指标,则通过LAGs滞后阶数计算来增强相关性,最终基于ARIMA模型运算,获得预测结果即得到预设指标项在预测时间范围内的预测时间序列。将预测时间序列输入回归分析模块基于XGBoost回归预测获得最终企业风险得分。
本实施例通过获取目标企业的预设指标项在预设时间窗口的第一历史时间序列,基于预先构建指标预测模型,对预设指标项上的第一历史时间序列进行预测处理,得到预设指标项在预测时间范围内的预测时间序列,基于风险预测模型对预设指标项的第一历史时间序列和/或预测时间序列进行预测处理,得到目标企业的风险预测结果。解决了以往企业风险预测因忽略了变量在时间维度上的前后因果关系而导致模型无法实现提前预警的目的的问题,提升了企业风险预测的精度与准确性,为用户进行分析节约了时间,提高了数据的利用率。
实施例二
图3是本发明实施例二提供的一种企业风险预测装置的结构示意图。
如图3所示,该装置包括:
序列获取模块310,用于获取目标企业的预设指标项在预设时间窗口的第一历史时间序列;
时间序列分析模块320,用于基于预先构建指标预测模型,对所述预设指标项上的第一历史时间序列进行预测处理,得到所述预设指标项在预测时间范围内的预测时间序列;
回归分析模块330,基于风险预测模型对所述预设指标项的所述第一历史时间序列和/或所述预测时间序列进行预测处理,得到所述目标企业的风险预测结果。
可选的,所述企业风险预测装置,还包括:
第一序候选指标项获取模块,用于获取候选指标项,确定所述候选指标项分别对应的第二历史时间序列,基于所述第二历史时间序列形成随时间变化的数据趋势图;
第一预设指标项确定模块,用于展示所述数据趋势图,并接收用户基于所述数据趋势图对所述候选指标项的选择操作,将被选择的候选指标项确定为所述预设指标项。
可选的,所述企业风险预测装置,还包括:
第二候选指标项获取模块,用于获取候选指标项,确定所述候选指标项分别对应的第二历史时间序列;
运算模块,用于对于任一所述第二历史时间序列进行自相关运算处理,得到自相关数据,和/或,对于任一所述第二历史时间序列进行偏自相关运算处理,得到偏自相关数据;
第二预设指标项确定模块,用于基于各所述候选指标项对应的所述自相关数据和/或所述偏自相关数据对所述候选指标项筛选,确定预设指标项。
可选的,所述第二预设指标项确定模块,具体用于:
将所述自相关数据满足预设趋势要求,和/或,所述偏自相关数据满足预设趋势要求的候选指标项确定为所述预设指标项。
可选的,所述指标预测模型为差分整合移动平均自回归模型。
可选的,所述企业风险预测装置,还包括:
模型阶数确定模块,用于基于所述预设指标项对应的第三历史时间序列,确定所述预设指标项对应的模型阶数;
指标预测模型训练模块,用于基于所述模型阶数创建初始的指标预测模型,并基于训练数据对所述初始的指标预测模型进行训练,得到训练好的指标预测模型。
可选的,所述指标预测模型的数量为一个;所述指标预测模型基于多个预设指标项确定的模型阶数均值生成,或者,基于多个预设指标项确定的模型阶数最大值生成;
或者,所述每一预设指标项分别对应一个指标预测模型,任一所述预设指标项对应的指标预测模型,基于所述预设指标项确定的模型阶数生成。
可选的,所述模型阶数确定模块,包括:
数据确定模块,用于确定所述第三历史时间序列对应的自相关数据和/或偏自相关数据;
阶数计算模块,用于基于所述自相关数据和/或偏自相关数据随时间周期的变化趋势确定模型阶数。
可选的,所述阶数计算模块,包括:
检测模块,用于在基于所述自相关数据和/或偏自相关数据随时间周期的变化趋势确定模型阶数之后,对所述预设指标项对应的第三历史时间序列进行平稳性检测;
更新模块,用于若所述预设指标项对应的第三历史时间序列不满足平稳性检测条件,则对所述预设指标项对应的第三历史时间序列进行差分处理,并更新所述预设指标项对应的模型阶数。
可选的,所述企业风险预测装置,还包括:
差分检测模块,用于对差分处理后的第三历史时间序列进行平稳性检测,若差分处理后的第三历史时间序列不满足平稳性检测条件,则对所述差分处理后的第三历史时间序列再次进行差分处理;
其中,所述更新模块,包括:
累加模块,用于在完成一次差分处理后,对当前的模型阶数加一,得到新的模型阶数。
可选的,所述风险预测模型为基于XGBoost算法的回归预测模型。
可选的,所述预设指标项为类金融维度指标项;
所述目标企业的风险预测结果为所述目标企业属于类金融企业的风险预测结果。
本发明实施例所提供的企业风险预测装置可执行本发明任意实施例所提供的企业风险预测方法,具备执行方法相应的功能模块和有益效果。
实施例三
图4是本发明实施例三提供的一种电子设备的结构示意图。电子设备10旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM12以及RAM13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如企业风险预测方法。
在一些实施例中,企业风险预测方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM13并由处理器11执行时,可以执行上文描述的企业风险预测方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行企业风险预测方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
实施例四
本发明实施例四还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行企业风险预测方法,该方法包括:
获取目标企业的预设指标项在预设时间窗口的第一历史时间序列;
基于预先构建指标预测模型,对所述预设指标项上的第一历史时间序列进行预测处理,得到所述预设指标项在预测时间范围内的预测时间序列;
基于风险预测模型对所述预设指标项的所述第一历史时间序列和/或所述预测时间序列进行预测处理,得到所述目标企业的风险预测结果。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
实施例五
本发明实施例五还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本发明任一实施例所述的企业风险预测方法。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (16)

1.一种企业风险预测方法,其特征在于,包括:
获取目标企业的预设指标项在预设时间窗口的第一历史时间序列;
基于预先构建指标预测模型,对所述预设指标项上的第一历史时间序列进行预测处理,得到所述预设指标项在预测时间范围内的预测时间序列;
基于风险预测模型对所述预设指标项的所述第一历史时间序列和/或所述预测时间序列进行预测处理,得到所述目标企业的风险预测结果。
2.根据权利要求1所述的方法,其特征在于,所述预设指标项的筛选方法包括:
获取候选指标项,确定所述候选指标项分别对应的第二历史时间序列,基于所述第二历史时间序列形成随时间变化的数据趋势图;
展示所述数据趋势图,并接收用户基于所述数据趋势图对所述候选指标项的选择操作,将被选择的候选指标项确定为所述预设指标项。
3.根据权利要求1所述的方法,其特征在于,所述预设指标项的筛选方法包括:
获取候选指标项,确定所述候选指标项分别对应的第二历史时间序列;
对于任一所述第二历史时间序列进行自相关运算处理,得到自相关数据,和/或,对于任一所述第二历史时间序列进行偏自相关运算处理,得到偏自相关数据;
基于各所述候选指标项对应的所述自相关数据和/或所述偏自相关数据对所述候选指标项筛选,确定预设指标项。
4.根据权利要求3所述的方法,其特征在于,所述基于各所述候选指标项对应的所述自相关数据和/或所述偏自相关数据对所述候选指标项筛选,确定预设指标项,包括:
将所述自相关数据满足预设趋势要求,和/或,所述偏自相关数据满足预设趋势要求的候选指标项确定为所述预设指标项。
5.根据权利要求1所述的方法,其特征在于,所述指标预测模型为差分整合移动平均自回归模型。
6.根据权利要求1或5所述的方法,其特征在于,所述指标预测模型的生成方法,包括:
基于所述预设指标项对应的第三历史时间序列,确定所述预设指标项对应的模型阶数;
基于所述模型阶数创建初始的指标预测模型,并基于训练数据对所述初始的指标预测模型进行训练,得到训练好的指标预测模型。
7.根据权利要求6所述的方法,其特征在于,所述指标预测模型的数量为一个;所述指标预测模型基于多个预设指标项确定的模型阶数均值生成,或者,基于多个预设指标项确定的模型阶数最大值生成;
或者,所述每一预设指标项分别对应一个指标预测模型,任一所述预设指标项对应的指标预测模型,基于所述预设指标项确定的模型阶数生成。
8.根据权利要求6所述的方法,其特征在于,所述基于所述预设指标项对应的第三历史时间序列,确定所述预设指标项对应的模型阶数,包括:
确定所述第三历史时间序列对应的自相关数据和/或偏自相关数据;
基于所述自相关数据和/或偏自相关数据随时间周期的变化趋势确定模型阶数。
9.根据权利要求8所述的方法,其特征在于,在基于所述自相关数据和/或偏自相关数据随时间周期的变化趋势确定模型阶数之后,还包括:
对所述预设指标项对应的第三历史时间序列进行平稳性检测;
若所述预设指标项对应的第三历史时间序列不满足平稳性检测条件,则对所述预设指标项对应的第三历史时间序列进行差分处理,并更新所述预设指标项对应的模型阶数。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
对差分处理后的第三历史时间序列进行平稳性检测,若差分处理后的第三历史时间序列不满足平稳性检测条件,则对所述差分处理后的第三历史时间序列再次进行差分处理;
其中,所述更新所述预设指标项对应的模型阶数,包括:
在完成一次差分处理后,对当前的模型阶数加一,得到新的模型阶数。
11.根据权利要求1所述的方法,其特征在于,所述风险预测模型为基于XGBoost算法的回归预测模型。
12.根据权利要求1所述的方法,其特征在于,所述预设指标项为类金融维度指标项;
所述目标企业的风险预测结果为所述目标企业属于类金融企业的风险预测结果。
13.一种企业风险预测装置,其特征在于,包括:
序列获取模块,用于获取目标企业的预设指标项在预设时间窗口的第一历史时间序列;
时间序列分析模块,用于基于预先构建指标预测模型,对所述预设指标项上的第一历史时间序列进行预测处理,得到所述预设指标项在预测时间范围内的预测时间序列;
回归分析模块,基于风险预测模型对所述预设指标项的所述第一历史时间序列和/或所述预测时间序列进行预测处理,得到所述目标企业的风险预测结果。
14.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-12中任一项所述的企业风险预测方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-12中任一项所述的企业风险预测方法。
16.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-12中任一项所述的企业风险预测方法。
CN202211527887.0A 2022-11-30 2022-11-30 一种企业风险预测方法、装置、存储介质、电子设备及产品 Pending CN115759751A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211527887.0A CN115759751A (zh) 2022-11-30 2022-11-30 一种企业风险预测方法、装置、存储介质、电子设备及产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211527887.0A CN115759751A (zh) 2022-11-30 2022-11-30 一种企业风险预测方法、装置、存储介质、电子设备及产品

Publications (1)

Publication Number Publication Date
CN115759751A true CN115759751A (zh) 2023-03-07

Family

ID=85341939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211527887.0A Pending CN115759751A (zh) 2022-11-30 2022-11-30 一种企业风险预测方法、装置、存储介质、电子设备及产品

Country Status (1)

Country Link
CN (1) CN115759751A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116012019A (zh) * 2023-03-27 2023-04-25 北京力码科技有限公司 一种基于大数据分析的金融风控管理系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116012019A (zh) * 2023-03-27 2023-04-25 北京力码科技有限公司 一种基于大数据分析的金融风控管理系统
CN116012019B (zh) * 2023-03-27 2023-06-06 北京力码科技有限公司 一种基于大数据分析的金融风控管理系统

Similar Documents

Publication Publication Date Title
US10628292B2 (en) Methods and systems for predicting estimation of project factors in software development
CN116307215A (zh) 一种电力系统的负荷预测方法、装置、设备及存储介质
CN115759751A (zh) 一种企业风险预测方法、装置、存储介质、电子设备及产品
CN115146853A (zh) 基于电碳因子的用碳量确定方法、装置、设备及存储介质
CN115775110A (zh) 一种服务质量评估方法及装置
CN117333076A (zh) 一种基于混合专家模型的估值方法、装置、设备及介质
CN114999665A (zh) 数据处理方法、装置、电子设备及存储介质
CN114692987A (zh) 一种时序数据分析方法、装置、设备及存储介质
CN114519636A (zh) 一种批量业务处理方法、装置、设备及存储介质
CN114399101A (zh) 基于tcn-bigru的燃气负荷预测方法和装置
Ahmed et al. Forecasting GDP Of Bangladesh Using Time Series Analysis
CN117934062A (zh) 卷烟数量预测方法、装置、设备和存储介质
US20240020436A1 (en) Automated data quality monitoring and data governance using statistical models
CN115858621A (zh) 用户行为预测方法、装置、电子设备及存储介质
CN115391160B (zh) 一种异常变更检测方法、装置、设备及存储介质
CN115146997A (zh) 基于电力数据的评估方法、装置、电子设备及存储介质
CN116933933A (zh) 一种时间序列的趋势预测方法、装置、设备及存储介质
CN115858291A (zh) 一种系统指标的检测方法、装置、电子设备及其存储介质
CN114971695A (zh) 行业趋势预测方法、装置、设备、介质和程序产品
CN114708079A (zh) 一种预期信用损失的确定方法、装置、设备、介质及产品
CN117408740A (zh) 一种针对券商客户的流失预警方法及系统
CN116151991A (zh) 一种企业估值方法、装置、电子设备、存储介质及产品
CN117808507A (zh) 数据资产估值方法、装置、电子设备及存储介质
CN115641216A (zh) 基金净值估算方法、装置、电子设备及存储介质
CN115480993A (zh) 一种信号到达时间阈值确定方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination