CN114742580A - 一种企业营业收入的预测方法、装置、设备及存储介质 - Google Patents
一种企业营业收入的预测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114742580A CN114742580A CN202210316212.5A CN202210316212A CN114742580A CN 114742580 A CN114742580 A CN 114742580A CN 202210316212 A CN202210316212 A CN 202210316212A CN 114742580 A CN114742580 A CN 114742580A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- factor
- revenue
- factors
- business
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种企业营业收入的预测方法、装置、设备及存储介质,本发明涉及大数据的技术领域。计算行业和/或区域历史影响企业营业收入的程度,作为影响因子,将企业划分至多个群体中,在群体的范围内,在成长性、稳定性、波动性与重要性中的至少一个维度下计算企业未来营业收入的能力,作为营收因子,根据影响因子与营收因子计算企业在未来营业收入的扩缩系数,使用扩缩系数对企业实际的营业收入进行调节,获得企业在未来的营业收入。不完全以专家的经验为依托,保证客观性,保证时效性,可以适应外界环境的变化及机构本身的业务发展,可以保证预测未来营业收入的精确度。
Description
技术领域
本发明实施例涉及大数据的技术领域,尤其涉及一种企业营业收入的预测方法、装置、设备及存储介质。
背景技术
在日常的经济活动中,企业在信贷、租赁等信用行为上会存在一定的风险,小微企业在经济波动较大的情况下,风险尤为明显,对此,可预测企业未来的营业收入,从而评价小微企业所能承担的债务总量,为开展信用行为提供指导。
目前预测企业未来营业收入的方法主要分为如下两大类:
1、规则类
根据专家经验和业务发展趋势将收入预测相关知识固化成规则,利用规则对小微企业未来收入进行预测。
但是,专家经验往往具有主观性,不同的专家可能对同一企业的存在认知上的差异,并且,外界环境以及提供信用行为的服务方本身的业务发展飞速,规则往往具有一定的滞后性,这些均会降低预测企业未来营业收入的精确度。
2、深度学习
采集企业的信息训练深度学习的模型,从而预测企业未来的营业收入。
但是,深度学习尚不成熟,实施难度高,并且,训练出的模型可解释性较差。
发明内容
本发明实施例提供一种企业营业收入的预测方法、装置、设备及存储介质,用以解决在保证预测企业未来营业收入的可行性的情况下,如何提高预测的精确度的问题。
第一方面,本发明实施例提供了一种企业营业收入的预测方法,包括:
计算行业和/或区域历史影响企业营业收入的程度,作为影响因子;
将所述企业划分至多个群体中;
在所述群体的范围内,在成长性、稳定性、波动性与重要性中的至少一个维度下计算所述企业未来营业收入的能力,作为营收因子;
根据所述影响因子与所述营收因子计算所述企业在未来营业收入的扩缩系数;
使用所述扩缩系数对所述企业实际的营业收入进行调节,获得所述企业在未来的营业收入。
第二方面,本发明实施例还提供了一种企业营业收入的预测装置,包括:
影响因子计算模块,用于计算行业和/或区域历史影响企业营业收入的程度,作为影响因子;
企业分群模块,用于将所述企业划分至多个群体中;
营收因子计算模块,用于在所述群体的范围内,在成长性、稳定性、波动性与重要性中的至少一个维度下计算所述企业未来营业收入的能力,作为营收因子;
扩缩系数计算模块,用于根据所述影响因子与所述营收因子计算所述企业在未来营业收入的扩缩系数;
营业收入调节模块,用于使用所述扩缩系数对所述企业实际的营业收入进行调节,获得所述企业在未来的营业收入。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明实施例中任一项所述的企业营业收入的预测方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明实施例中任一项所述的企业营业收入的预测方法。
第五方面,本发明实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本发明实施例中任一所述的企业营业收入的预测方法。
在本实施例中,计算行业和/或区域历史影响企业营业收入的程度,作为影响因子,将企业划分至多个群体中,在群体的范围内,在成长性、稳定性、波动性与重要性中的至少一个维度下计算企业未来营业收入的能力,作为营收因子,根据影响因子与营收因子计算企业在未来营业收入的扩缩系数,使用扩缩系数对企业实际的营业收入进行调节,获得企业在未来的营业收入。通过宏观和微观的角度选择合适的因子预测企业在未来的营业收入,这些因子是企业的历史行为的体现,不完全以专家的经验为依托,保证客观性,保证时效性,可以适应外界环境的变化及机构本身的业务发展,可以保证预测未来营业收入的精确度,并且,技术成熟,开发量低、运算量少,使得实施门槛低、成本低,预测的过程具有较强的解析性,可以满足机构有监督、审核等要求。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是根据本发明实施例一提供的一种企业营业收入的预测方法的流程图;
图2是根据本发明实施例一提供的一种决策树的示例图;
图3是根据本发明实施例一提供的一种关系图的示例图;
图4是根据本发明实施例三提供的一种企业营业收入的预测装置的结构示意图;
图5是实现本发明实施例的企业营业收入的预测方法的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
实施例一
图1为本发明实施例一提供的一种企业营业收入的预测方法的流程图,本实施例可适用于从宏观和微观出发,通过对企业进行分群,从多个角度下预测企业未来的营业收入的情况,该方法可以由企业营业收入的预测装置来执行,该企业营业收入的预测装置可以采用硬件和/或软件的形式实现,该企业营业收入的预测装置可配置于电子设备中。如图1所示,该方法包括:
步骤101、计算行业和/或区域历史影响企业营业收入的程度,作为影响因子。
本实施例可应用于金融机构(如银行)、资信评估机构等组织,对企业(又称公司、组织、机构等)未来(即位于当前时间之后的时间)的营业收入进行预测,以便评价该企业所能承担的债务总量,为开展信用行为提供指导。
待预测未来营业收入的企业一般为抗风险能力较差的企业,尤其为小微企业,小微企业可以按照通用的标准,从纳税所得额、从业人数、资产总额等指标上划分,包括小型企业、微型企业、家庭作坊式企业等,也可以按照金融机构(如银行)、资信评估机构等组织的业务提供与该业务适配的标准划分,本实施例对此不加以限制。
当然,对于抗风险能力较好的企业,也可以对其预测未来的营业收入,本实施例对此亦不加以限制。
企业的营业收入受外部宏观环境影响较大,企业在外部宏观环境较好的情况下,营业收入上升的概率较大,企业在外部宏观环境较差的情况下,营业收入下降的概率较大。
在本实施例中,引入行业和/或区域作为分析企业受外部宏观环境影响的角度,在这些角度下计算历史上该企业受外部宏观环境影响其营业收入的程度,记为影响因子。
在本发明的一个实施例中,影响因子包括行业影响影子,行业影响因子用于表示行业历史影响企业营业收入的程度,在本实施例中,步骤101可以包括如下步骤:
步骤10111、查询企业归属的行业。
在本实施例中,可以预先设置多个行业,例如,农业、林业、畜牧业、渔业、纺织业、医药制药业、金属制品业,等等,这些行业划分的标准可以为通用的标准,也可以按照金融机构(如银行)、资信评估机构等组织的业务制定,本实施例对此不加以限制。
若应用通用的标准划分行业,则可以在企业登记的工商信息中查询其归属的行业,若应用定制的标准划分行业,则可以获取该企业的基本信息(如工商信息、介绍信息等)、营业行为(如售卖的产品、承接的项目等)等企业数据,将这些企业数据代入定制的标准中,得到企业归属的行业。
步骤10112、获取区域在多个第一历史时间段内的市盈率。
在本实施例中,可以预先分析企业的营业规律,按照其营业规律划分出时间周期,例如,年、半年、季度、月,等等。
在历史的时间(即位于当前时间之前的时间)上,以多个数量不同的时间周期为节点,划分出多个时间段,记为第一历史时间段,因此,多个第一历史时间段划分为数量不等的时间周期。
一般情况下,设定时间周期的数量的上限为T(T为正整数),可设定T个第一历史时间段,每个第一历史时间段含有t(t为正整数)个时间周期,t∈T。
在具体实现中,可设第一历史时间段初始包含一个时间周期,判断第一历史时间段内包含时间周期的数量是否到达上限,若是,则确定完成构建第一历史时间段,若否,则在当前第一历史时间段的基础上往前推移一个时间周期,作为新的第一历史时间段,返回判断第一历史时间段内包含时间周期的数量是否到达上限。
即,第一个第一历史时间段包含一个时间周期,第二个第一历史时间段包含两个时间周期,第三个第一历史时间段包含三个时间周期,……,第T个第一历史时间段包含T个时间周期。
对于每个行业,可以从该行业中多个企业发布的营业数据中计算该行业的市盈率(Price Earnings Ratio,简称P/E或PER),市盈率为市价盈利比率,也称本益比或股价收益比率,可以指股票价格除以每股收益(每股收益,EPS)的比率,或以企业市值除以年度股东应占溢利。
示例性地,设具有T个第一历史时间段,N(N为正整数)个行业,则各个行业在各个第一历史时间段的市盈率可以组成如下N×T的二维矩阵:
其中,IRnt表示行业n(n为正整数,n∈N)在第一历史时间段t的市盈率。
步骤10113、针对每个第一历史时间段,将市盈率除以时间周期的数量,作为平均市盈率。
步骤10114、针对所有第一历史时间段,对所有平均市盈率计算平均值,得到行业影响因子。
针对每个行业的每个第一历史时间段,将该第一历史时间段的市盈率除以该第一历史时间段内时间周期的数量,作为平均市盈率,其表示在第一历史时间段内单位时间(即时间周期)的市盈率。
针对每个行业的所有第一历史时间段,对所有平均市盈率计算平均值,得到行业影响因子。
那么,计算行业影响因子的过程可以表示为:
其中,IRn为行业n(n∈N)的行业影响因子,IRnt为行业n在第一历史时间段t(t∈T)的市盈率,第一历史时间段t包含t个时间周期,N为行业的数量上限,T为第一历史时间段的数量上限。
在本发明的一个实施例中,影响因子包括区域影响影子,区域影响因子用于表示区域历史影响企业营业收入的程度,在本实施例中,步骤101可以包括如下步骤:
步骤10121、查询企业所处的区域。
在本实施例中,可以预先在地理位置上划分多个区域,例如,省、市、县,等等,这些区域划分的标准可以为通用的标准,如行政区域,也可以按照金融机构(如银行)、资信评估机构等组织的业务制定,如华南片区、华中片区、华东片区等,本实施例对此不加以限制。
无论应用通用的标准划分区域还是应用定制的标准划分区域,则可以预先确定各个区域的范围,此时,可以在企业登记的工商信息中查询其注册地或经营地等位置,从而将该位置与各个区域的范围进行比较,如果该位置落在某个范围内,则确定该企业处于该范围对应的区域中。
步骤10122、获取行业在多个第二历史时间段内生产总值的增长率。
在本实施例中,可以预先分析企业的营业规律,按照其营业规律划分出时间周期,例如,年、半年、季度、月,等等。
在历史的时间(即位于当前时间之前的时间)上,以多个数量不同的时间周期为节点,划分出多个时间段,记为第二历史时间段,因此,多个第二历史时间段划分为数量不等的时间周期。
一般情况下,设定时间周期的数量的上限为T(T为正整数),可设定T个第二历史时间段,每个第二历史时间段含有t(t为正整数)个时间周期,t∈T。
为便于统一数据的尺度,第一历史时间段与第二历史时间段可以在数量、包含的历史时间段等保持一致。
在具体实现中,可设第二历史时间段初始包含一个时间周期,判断第二历史时间段内包含时间周期的数量是否到达上限,若是,则确定完成构建第二历史时间段,若否,则在当前第二历史时间段的基础上往前推移一个时间周期,作为新的第二历史时间段,返回判断第二历史时间段内包含时间周期的数量是否到达上限。
即,第一个第二历史时间段包含一个时间周期,第二个第二历史时间段包含两个时间周期,第三个第二历史时间段包含三个时间周期,……,第T个第二历史时间段包含T个时间周期。
对于每个区域,可以从该区域发布的统计数据中查询该区域的生产总值GDP,生产总值是按市场价格计算的一个地区常住单位在一定时期内生产活动的成果。
示例性地,设具有T个第二历史时间段,M(M为正整数)个区域,则各个区域在各个第二历史时间段的生产总值的增长率可以组成如下N×T的二维矩阵:
其中,GRmt表示区域m(m为正整数,m∈M)在第二历史时间段t的生产总值的增长率。
步骤10123、针对每个第二历史时间段,将增长率除以时间周期的数量,作为平均增长率。
步骤10124、针对所有第二历史时间段,对所有平均增长率计算平均值,得到行业影响因子。
针对每个区域的每个第二历史时间段,将该第二历史时间段内生产总值的增长率除以该第二历史时间段内时间周期的数量,作为平均增长率,其表示在第二历史时间段内,生产总值子啊单位时间(即时间周期)的增长率。
针对每个区域的所有第二历史时间段,对所有平均增长率计算平均值,得到区域影响因子。
那么,计算区域影响因子的过程可以表示为:
其中,GRm为区域m(m∈M)的区域影响因子,GRmt为区域m在第二历史时间段t(t∈T)的生产总值的增长率,第二历史时间段t包含t个时间周期,M为区域的数量上限,T为第二历史时间段的数量上限。
步骤102、将企业划分至多个群体中。
在实际的市场环境中,企业数量众多,小微企业尤为明显,不同的企业之间具有一定的共性,因此,本实施例通过对企业进行分群,即,预先设置多个群体,将企业划分至这些群体中,对每个客群中的企业在未来的营业收入进行估计,这样将有利于降低预测的偏差。
在本发明的一个实施例中,步骤102可以包括如下步骤:
步骤1021、确定决策树。
在本实施例中,可以预先挑选多个适于分群的属性,例如,行业、区域、规模、成立的相对年限,等等,从而对作为样本的客户采集这些属性下的数据,使用这些数据应用卡方自动交互检测法(chi-squared automatic interaction detector,CHAID)等方式针对企业构造决策树(Decision Tree),使得该决策树可用于在规定的属性下对企业划分群体,那么,在对企业分类时,将决策树加载至内存运行。
其中,决策树是一种机器学习的方法,如图2所示,决策树为一种树形结构,其具有根节点、多个子节点,每个子节点表示一个属性(如行业、区域、规模、成立的相对年限等)上的判断,每个分支代表一个判断结果的输出,最后每个子节点代表一种分类结果(即群体)。
训练决策树属于监管学习(有教师的Supervised Learning),监管学习就是给出一堆样本(企业),每个样本(企业)都有一组属性(如行业、区域、规模、成立的相对年限等)和一个分类结果(群体),也就是分类结果(群体)已知,那么通过学习这些样本得到一个决策树,这个决策树能够对新的数据(企业及其行业、区域、规模、成立的相对年限等属性)给出正确的分类结果(群体)。
步骤1022、对企业分别查询所属的行业、所处的区域、规模与成立的相对年限中的至少一者。
在本实施例中,可以按照决策树用于对企业划分群体的属性下,查询该企业在这些属性下的数据,从而使用这些数据确定该企业在这些属性下的参数值。
在本具体实现中,决策树用于对企业划分群体的属性包括如下至少一者:
1、行业
若在先在行业的角度上计算历史影响企业营业收入的程度(即行业影响因子),在此过程中会查询企业所属的行业,此时,可以复用企业所属的行业对该企业分群。
2、区域
若在先在区域的角度上历史影响企业营业收入的程度(即区域影响因子),在此过程中会查询企业所处的区域,此时,可以复用企业所处的区域对该企业分群。
3、规模
为便于对不同企业进行比较、从而对企业分群,企业的规模属于一个相对宽泛的属性,可以参考职工人数、销售额、资产总额等数据划分企业的规模。
在一种确定企业规模的方式中,可以预先构建第一映射关系,其中,第一映射关系用于记录第一候选范围与规模之间的关系,第一候选范围属于衡量单个时间周期内的销售额的范围。
示例性地,企业的规模可以划分为三个档次,分别为大、中、小,大这个档次的第一候选范围大于中这个档次的第一候选范围,中这个档次的第一候选范围大于小这个档次的第一候选范围,表示如下:
规模 | 第一候选范围 |
大 | (S1,∞) |
中 | (S2,S1] |
小 | [0,S2] |
其中,S1>S2。
在确定企业的规模时,可以加载第一映射关系,以及,从企业登记的信息、公开的信息等数据中获取企业在预设的时间周期内的销售额,该销售额可以是当前时间周期内的销售额,也可以是上一前时间周期内的销售额,还可以是多个历史时间周期内的销售额的平均值,本实施例对此不加以限制。
在第一映射关系中查询销售额所在的第一候选范围,作为第一目标范围,将第一目标范围映射的规模设置为企业的规模。
4、成立的相对年限
为便于对不同企业进行比较、从而对企业分群,企业成立的相对年限属于一个相对宽泛的属性,可以参考企业成立的时长划分企业成立的相对年限。
在一种确定企业成立的相对年限的方式中,可以预先构建第二映射关系,第二映射关系用于记录第二候选范围与成立的相对年限之间的关系,第二候选范围属于衡量成立时长的范围。
示例性地,企业成立的相对年限可以划分为三个档次,分别为长、中、短,长这个档次的第二候选范围大于中这个档次的第二候选范围,中这个档次的第二候选范围大于短这个档次的第二候选范围,表示如下:
其中,C1>C2。
在确定企业成立的相对年限时,可以加载第二映射关系,以及,从企业注册的工商信息等数据中获取企业成立的时长。
在第二映射关系中查询时长所在的第二候选范围,作为第二目标范围,将第二目标范围映射的成立的相对年限设置为企业成立的相对年限。
在本实施例中,企业所属的行业、企业所处的区域、企业的规模与企业成立的相对年限可以任意两者、三者、四者组合使用,优选为四者同时使用,也可以单独使用,本实施例对此不加以限制。
步骤1023、将行业、区域、规模与相对年限中的至少一者输入决策树中进行决策,得到企业归属的群体。
针对每个企业,将其行业、区域、规模与相对年限中的至少一者输入决策树中,比较行业、区域、规模与相对年限中的至少一者与决策树上的数值,递归执行该过程直到进入叶子结点,将企业定义为叶子节点所属的群体。
在本实施例中,使用决策树对企业分群不仅速度快,即,决策树计算量相对较小,且容易转化成分群的规则,沿着决策树的根节点向下一直走到叶子节点,沿途的分裂条件就能够唯一确定一个群体,并且准确性高,即,决策树挖掘出来的分群的规则准确性高,便于理解,可以清晰的显示哪些属性比较重要,从而生成可以理解的规则。
当然,上述分群的方法只是作为示例,在实施本实施例时,可以根据实际情况设置其它分群的方法,例如,使用随机森林分群、使用SVM(support vector machines,支持向量机)分群、使用深度学习分类,等等,本发明实施例对此不加以限制。另外,除了上述判断处理方法外,本领域技术人员还可以根据实际需要采用其它判断处理方法,本发明实施例对此也不加以限制。
步骤103、在群体的范围内,在成长性、稳定性、波动性与重要性中的至少一个维度下计算企业未来营业收入的能力,作为营收因子。
企业的营业收入受内部微观环境影响较大,企业在内部微观环境较好的情况下,营业收入上升的概率较大,企业在内部微观环境较差的情况下,营业收入下降的概率较大。
在本实施例中,引入成长性、稳定性、波动性与重要性中的至少一个维度作为分析企业受内部微观环境影响的角度,在这些角度下计算该企业在该内部微观环境所能达到的营业收入的能力,记为营收因子。
在本发明的一个实施例中,营收因子包括成长因子,成长因子用于在成长性下表示企业未来营业收入的能力,此时,企业的成长因子是企业粒度的,即,每个群体中不同企业的成长因子是不同的,在本实施例中,步骤103可以包括如下步骤:
步骤10311、确定为每个群体训练的第一逻辑回归模型。
在本实施例中,可以预先为每个群体训练一个第一逻辑回归模型,即,应用逻辑回归(Logistic Regression,LR)的模型,其假设数据服从某个分布,从而使用极大似然估计做参数的估计。
在本实施例中,该第一逻辑回归模型可用于计算企业的成长因子,成长因子可以在一定程度上表示随着成立的绝对年限的增加,企业的营业收入的变化百分比。
在训练时,可以针对每个群体,获取群体中每个企业历史在多个时间周期的营业收入,作为历史收入。
计算每个企业的历史收入的平均值,作为平均周期收入,即,将历史收入除以时间周期的数量,得到平均周期收入,记为:
其中,INCOMEc,m,t为群体c中企业m在时间周期t的营业收入,共T个事件周期,AVG_INCOMEc,m为群体c中企业m的平均周期收入。
由于本实施例预测企业在未来多个时间周期内的营业收入,因此,在采集历史收入时的时间周期的数量与预测营业收入时的时间周期的数量相等。
从企业登记的信息、公开的信息等渠道查询企业在当前时间周期实际的营业收入,作为实时收入。
将实时收入与凭据周期收入进行比较。
若实时收入大于平均周期收入,则将企业的第一标志位FLAG设置为1。
若实时收入小于或等于平均周期收入,则将企业的第一标志位FLAG设置为0。
从企业登记的信息、公开的信息等渠道获取企业的、与营收收入的能力相关的特征,针对不同的业务所使用的企业的特征有所不同。
示例性地,这些特征可以包括如下至少一者:
实际控制人信息、债项违约信息、客户信息、存款信息、高管情况、债项逾期信息、授信情况、贷款产品类信息、授信概要信息、征信信息、业务与担保品关系、贷款申请信息、信贷合同信息、信贷审批类信息、支用信息、贷款渠道类信息、债项信息、交易流水信息、其他相关信息。
针对每个群体,将所有企业的特征作为自变量X、所有企业的第一标志位FLAG作为因变量Y,对每个群体构建第一宽表,示例如下:
使用每个群体的第一宽表,利用逻辑回归算法为群体构建模型(即建模),记为第一逻辑回归模型,第一逻辑回归模型表示如下:
其中,x是根据逻辑回归算法进行建模得到的自变量,自变量是第一宽表X变量的子集,wT是自变量x对应的权重值,输出的因变量y就是第一标志位FLAG为1的概率,即为群体i中企业j的成长因子GFi,j。
步骤10312、针对每个群体的每个企业,获取企业与营收收入的能力相关的特征。
针对每个群体的每个企业,可以从企业登记的信息、公开的信息等渠道获取企业与营收收入的能力相关的特征,这些特征与构建第一逻辑回归模型所使用的企业的特征相同。
示例性地,这些特征可以包括如下至少一者:
实际控制人信息、债项违约信息、客户信息、存款信息、高管情况、债项逾期信息、授信情况、贷款产品类信息、授信概要信息、征信信息、业务与担保品关系、贷款申请信息、信贷合同信息、信贷审批类信息、支用信息、贷款渠道类信息、债项信息、交易流水信息、其他相关信息。
步骤10313、将企业的特征输入第一逻辑回归模型中进行处理,得到企业的成长因子。
将企业的特征输入至第一逻辑回归模型中,第一逻辑回归模型根据自身的结构、逻辑对企业的特征进行运算,从而输出该企业的成长因子,第一逻辑回归模型对于大量特征计算成长因子会十分快速且消耗的计算资源很少。
在本发明的一个实施例中,营收因子包括稳定因子,稳定因子用于在稳定性下表示企业未来营业收入的能力,企业在未来的营业收入的稳定性反映的是同一群体中不同企业之间的收入离差,此时,企业的稳定因子是群体粒度的,即,每个群体中不同企业的稳定因子是相同的。
在本实施例中,步骤103可以包括如下步骤:
步骤10321、针对每个群体,查询群体内所有企业的成长因子。
步骤10322、针对每个群体,计算所有成长因子之间的离散程度,作为群体内所有企业的稳定因子。
在本实施例中,可以查询每个群体中每个企业的成长因子,该成长因子用于在成长性下表示企业未来营业收入的能力。
针对每个群体,通过方差、标准差等方式计算所有企业的成长因子之间的离散程度,作为群体内企业的稳定因子,可以反映既定群体中各个企业的成长因子之间的差异大小,从而也就可以反映分布中心的指标对各个企业的成长因子代表性的高低。
示例性地,针对每个群体,对群体内所有企业的成长因子计算平均值,作为平均因子,分别对企业的成长因子与平均因子之间的差值取平方,对平方求平均值,得到群体内所有企业的稳定因子,表示如下:
其中,群体i中共n个企业,SFi为群体i的稳定因子,GFi,j为群体i中企业j的成长因子,AGFi为群体i中的平均因子,j∈n。
在本发明的一个实施例中,营收因子包括审慎因子,审慎因子用于在波动性下表示企业未来营业收入的能力,由于存在诸多不可观测的行为或者外部因素会导致企业未来的营业收入并不遵循正态分布,而是有偏斜的,这意味着在预测企业在未来的营业收入时存在未知风险,对此,可以使用审慎因子来修复未知风险带来的损失。此时,企业的审慎因子是群体粒度的,即,每个群体中不同企业的审慎因子是相同的。
在本实施例中,步骤103可以包括如下步骤:
步骤10331、确定为每个群体训练的第二逻辑回归模型。
在本实施例中,可以预先为每个群体训练一个第二逻辑回归模型,即,应用逻辑回归的模型,该第二逻辑回归模型可用于计算企业的审慎因子。
针对每个群体,可以在本机构或其他机构中获取群体中每个企业的租借行为,例如,借贷、租赁商铺,等等。
判断租借行为是否违约。
若租借行为已违约,则将企业的第二标志位FLAG设置为1。
若租借行为未违约,则将企业的第二标志位FLAG设置为0。
从企业登记的信息、公开的信息等渠道获取企业的、与营收收入的能力相关的特征,针对不同的业务所使用的企业的特征有所不同。
示例性地,这些特征可以包括如下至少一者:
实际控制人信息、债项违约信息、客户信息、存款信息、高管情况、债项逾期信息、授信情况、贷款产品类信息、授信概要信息、征信信息、业务与担保品关系、贷款申请信息、信贷合同信息、信贷审批类信息、支用信息、贷款渠道类信息、债项信息、交易流水信息、其他相关信息。
针对每个群体,将所有企业的特征作为自变量X、所有企业的第二标志位FLAG作为因变量Y,对每个群体构建第二宽表,示例如下:
使用每个群体的第二宽表,利用逻辑回归算法为群体构建模型(即建模),记为为群体构建第二逻辑回归模型,第二逻辑回归模型表示如下:
其中,x是根据逻辑回归算法进行建模得到的自变量,自变量是第二宽表X变量的子集,wT是自变量x对应的权重值,输出的因变量y就是第二标志位FLAG为1的概率,即为群体i中企业j的审慎因子RFi,j。
步骤10332、针对每个群体的每个企业,获取企业与营收收入的能力相关的特征。
针对每个群体的每个企业,可以从企业登记的信息、公开的信息等渠道获取企业与营收收入的能力相关的特征,这些特征与构建第二逻辑回归模型所使用的企业的特征相同。
示例性地,这些特征可以包括如下至少一者:
实际控制人信息、债项违约信息、客户信息、存款信息、高管情况、债项逾期信息、授信情况、贷款产品类信息、授信概要信息、征信信息、业务与担保品关系、贷款申请信息、信贷合同信息、信贷审批类信息、支用信息、贷款渠道类信息、债项信息、交易流水信息、其他相关信息。
步骤10333、将企业的特征输入第二逻辑回归模型中进行处理,得到群体中所有企业的审慎因子。
将企业的特征输入至第二逻辑回归模型中,第二逻辑回归模型根据自身的结构、逻辑对企业的特征进行运算,从而输出该企业的审慎因子,第一逻辑回归模型对于大量特征计算审慎因子会十分快速且消耗的计算资源很少。
步骤10334、将所有企业的审慎因子融合为群体的审慎因子。
在本实施例中,可以通过线性、非线性等方式将所有企业的审慎因子融合计算群体的审慎因子。
以线性融合为例,可以认为各个企业之间的权重相等,则对群体内所有企业的审慎因子计算平均值,得到该群体的审慎因子,表示如下:
其中,群体i中共n个企业,RFi为群体i的审慎因子,SFi,j为群体i中企业j的审慎因子,j∈n。
在本发明的一个实施例中,营收因子包括核心因子,核心因子用于在重要性下表示企业未来营业收入的能力,每个企业在自己所属的经营范围都有不同的重要度,一般越重要的企业未来的营业收入越高,此时,企业的核心因子是企业粒度的,即,每个群体中不同企业的核心因子是不同的,在本实施例中,步骤103可以包括如下步骤:
步骤10341、查询企业之间在营业上的担保行为。
在本实施例中,可以在本机构、其他机构查询查询不同企业之间在营业上的担保行为,即,为担保某项债务的实现而采取的措施,包括人保、物保和金钱担保。
步骤10342、以企业为节点,担保关系为边,构建关系图。
在本实施例中,以企业为节点,担保关系为边,可以从对企业之间的关系构建关系图,从而表示企业之间的担保关系。
在具体实现中,可以将企业设置为关系图中的节点,若两个企业之间存在担保行为,则在这两个企业对应的节点之间构建关系图中的边,这些边具有以下两个属性:
1、方向
边的方向为从被担保者指向担保者。
当然,如果两个企业之间并不存在担保关系,则这两个企业对应的节点之间并不构建关系图中的边。
2、权重
针对每个节点,对指向该节点的边的权重按照担保的额度归一化,得到该边的权重,具体而言,针对每个节点,计算企业作为担保者时担保的每个额度在其担保的所有额度的占比,作为边的权重。
在一个示例中,如图3所示,有A、B、C、D四个企业,为A、B、C、D四个企业分别生成四个节点,其中,B为A担保100万,C为A担保100万,C为B担保100万,D为A担保400万,D为C担保100万,D为B担保100万。相应地,A与B之间具有指向B的边,C与A之间具有指向C的边,C与B之间具有指向C的边,D与A之间具有指向D的边,D与C之间具有指向D的边,D与B之间具有指向D的边。
D的各个边的权重如下:
边AD对应的权重400/(400+100+100)=2/3;
边BD对应的权重100/(400+100+100)=1/6;
边CD对应的权重100/(400+100+100)=1/6。
步骤10343、在关系图中计算节点的重要性,作为企业的核心因子。
在本实施例中,可以通过PageRank(网页排名)等算法在关系图中计算各个节点在担保上的重要性,记为该节点对应企业的核心因子。
步骤104、根据影响因子与营收因子计算企业在未来营业收入的扩缩系数。
在本实施例中,综合表征外部宏观环境的影响影子、表征内部微观环境的营收因子,预测企业在未来某个时间范围营业收入扩大的程度或缩小的程度,记为扩缩系数。
在本发明的一个实施例中,影响因子包括行业影响因子与区域影响因子中的至少一者,营收因子包括成长因子、稳定因子、审慎因子与核心因子中的至少一者;那么,在本实施例中,步骤104可以包括如下步骤:
步骤1041、基于行业影响因子与区域影响因子中的至少一者,以及,成长因子、稳定因子、审慎因子与核心因子中的至少一者计算基准因子。
在本实施例中,通过线性或非线性的方式将行业影响因子与区域影响因子中的至少一者,以及,成长因子、稳定因子、审慎因子与核心因子中的至少一者融合为基准因子。
基准因子与行业影响因子正相关,即,行业影响因子越大,基准因子越大,反之,行业影响因子越小,基准因子越小。
基准因子与区域影响因子正相关,即,区域影响因子越大,基准因子越大,反之,区域影响因子越小,基准因子越小。
基准因子与成长因子正相关,即,成长因子越大,基准因子越大,反之,成长因子越小,基准因子越小。
基准因子与稳定因子负相关,即,稳定因子越大,基准因子越小,反之,稳定因子越小,基准因子越大。
基准因子与审慎因子负相关,即,审慎因子越大,基准因子越小,反之,审慎因子越小,基准因子越大。
基准因子与核心因子正相关,即,核心因子越大,基准因子越大,反之,核心因子越小,基准因子越小。
示例性地,将成长因子减去稳定因子与第一缩放因子之间的乘积,获得第一候选值;将第二常数、行业影响因子与第二缩放因子之间的乘积、区域影响因子与第三缩放因子之间的乘积相加,得到第二候选值;将第三常数减去审慎因子与第四缩放因子之间的乘积,获得第三候选值;将第四常数、核心因子与第五缩放因子之间的乘积相加,获得第四候选值;将第一候选值、第二候选值、第三候选值与第四候选值相乘,得到基准因子。
在本示例中,基准因子表示如下:
Si,j=(GFi,j-λ1SFi)(V2-λ2IRN+λ3GRN)(V3-λ4RFi)(V4-λ5CF)
其中,Si,j为群体i中企业j的基准因子,IRN为企业j所属行业的行业影响因子,GRN为企业j所处区域的区域影响因子,GFi,j为群体i中企业j的成长因子,SFi为群体i的稳定因子,RFi为群体i的审慎因子,CF为企业j的核心因子,V2为第二常数,V3为第三常数,V4为第四常数,λ1为第一缩放因子,λ2为第二缩放因子,λ3为第三缩放因子,λ4为第四缩放因子,λ5为第五缩放因子。
步骤1042、以第一常数与基准系数之间的和值为底、多个未来时间段为指数,计算营收系数。
步骤1043、针对时长最长的未来时间段,对营收系数求和,得到企业在未来时间段营业收入的扩缩系数。
在本实施例中,可以预先分析企业的营业规律,按照其营业规律划分出时间周期,例如,年、半年、季度、月,等等。
在未来的时间上,以多个数量不同的时间周期为节点,划分出多个时间段,记为未来时间段,因此,多个未来时间段具有数量不等的时间周期。
一般情况下,设定时间周期的数量的上限为T(T为正整数),可设定T个未来时间段,每个未来时间段含有t(t为正整数)个时间周期,t∈T。
在具体实现中,可设未来时间段初始包含一个时间周期,判断未来时间段内包含时间周期的数量是否到达上限,若是,则确定完成构建未来时间段,若否,则在当前未来时间段的基础上往后推移一个时间周期,作为新的未来时间段,返回判断未来时间段内包含时间周期的数量是否到达上限。
即,第一个未来时间段包含一个时间周期,第二个未来时间段包含两个时间周期,第三个未来时间段包含三个时间周期,……,第T个未来时间段包含T个时间周期。
针对每个未来时间段,以第一常数与基准系数之间的和值为底、多个未来时间段为指数,计算营收系数,针对时长最长的未来时间段,可以对营收系数求和,得到企业在该未来时间段营业收入的扩缩系数。
假设,对企业预测未来T个时间周期之后的扩缩系数,则计算过程如下:
其中,Ui,j为群体i中企业j的扩缩系数,Si,j为群体i中企业j的基准因子,t为时间周期,上限为T。
步骤105、使用扩缩系数对企业实际的营业收入进行调节,获得企业在未来的营业收入。
在本实施例中,在企业实际的营业收入的基础上使用扩缩系数对其进行调节,可以对企业实际的营业收入进行扩大或缩小,从而获得企业在未来的营业收入。
在具体实现中,可以从企业登记的信息、公开的信息等渠道查询企业在当前时间周期实际的营业收入,作为实时收入,将实际收入乘以扩缩系数,获得企业在未来多个时间周期的营业收入,表示如下:
T_INCOMEi,j=T_INCOMEi,j×Ui,j
其中,T_INCOMEi,j为为群体i中企业j在未来多个时间周期的营业收入,T_INCOMEi,j为群体i中企业j的实时收入,Ui,j为群体i中企业j在未来多个时间周期的扩缩系数。
在本实施例中,计算行业和/或区域历史影响企业营业收入的程度,作为影响因子,将企业划分至多个群体中,在群体的范围内,在成长性、稳定性、波动性与重要性中的至少一个维度下计算企业未来营业收入的能力,作为营收因子,根据影响因子与营收因子计算企业在未来营业收入的扩缩系数,使用扩缩系数对企业实际的营业收入进行调节,获得企业在未来的营业收入。通过宏观和微观的角度选择合适的因子预测企业在未来的营业收入,这些因子是企业的历史行为的体现,不完全以专家的经验为依托,保证客观性,保证时效性,可以适应外界环境的变化及机构本身的业务发展,可以保证预测未来营业收入的精确度,并且,技术成熟,开发量低、运算量少,使得实施门槛低、成本低,预测的过程具有较强的解析性,可以满足机构有监督、审核等要求。
实施例二
图4为本发明实施例三提供的一种企业营业收入的预测装置的结构示意图。如图4所示,该装置包括:
影响因子计算模块401,用于计算行业和/或区域历史影响企业营业收入的程度,作为影响因子;
企业分群模块402,用于将所述企业划分至多个群体中;
营收因子计算模块403,用于在所述群体的范围内,在成长性、稳定性、波动性与重要性中的至少一个维度下计算所述企业未来营业收入的能力,作为营收因子;
扩缩系数计算模块404,用于根据所述影响因子与所述营收因子计算所述企业在未来营业收入的扩缩系数;
营业收入调节模块405,用于使用所述扩缩系数对所述企业实际的营业收入进行调节,获得所述企业在未来的营业收入。
在本发明的一个实施例中,所述影响因子包括行业影响影子,所述行业影响因子用于表示行业历史影响企业营业收入的程度;
所述影响因子计算模块401还用于:
查询企业归属的行业;
获取所述区域在多个第一历史时间段内的市盈率,多个所述第一历史时间段划分为数量不等的时间周期;
针对每个所述第一历史时间段,将所述市盈率除以所述时间周期的数量,作为平均市盈率;
针对所有所述第一历史时间段,对所有所述平均市盈率计算平均值,得到行业影响因子。
在本发明的一个实施例中,所述影响因子包括区域影响影子,所述区域影响因子用于表示区域历史影响企业营业收入的程度;
所述影响因子计算模块401还用于:
查询企业所处的区域;
获取所述行业在多个第二历史时间段内生产总值的增长率,多个所述第二历史时间段划分为数量不等的时间周期;
针对每个所述第二历史时间段,将所述增长率除以所述时间周期的数量,作为平均增长率;
针对所有所述第二历史时间段,对所有所述平均增长率计算平均值,得到行业影响因子。
在本发明的一个实施例中,所述企业分群模块402还用于:
确定决策树;
对所述企业分别查询所属的行业、所处的区域、规模与成立的相对年限中的至少一者;
将所述行业、所述区域、所述规模与所述相对年限中的至少一者输入所述决策树中进行决策,得到所述企业归属的群体。
在本发明的一个实施例中,所述企业分群模块402还用于:
加载第一映射关系,所述第一映射关系用于记录第一候选范围与规模之间的关系;
获取所述企业在预设的时间周期内的销售额;
在所述第一映射关系中查询所述销售额所在的第一候选范围,作为第一目标范围;
将所述第一目标范围映射的规模设置为所述企业的规模。
在本发明的一个实施例中,所述企业分群模块402还用于:
加载第二映射关系,所述第二映射关系用于记录第二候选范围与成立的相对年限之间的关系;
获取所述企业成立的时长;
在所述第二映射关系中查询所述时长所在的第二候选范围,作为第二目标范围;
将所述第二目标范围映射的成立的相对年限设置为所述企业成立的相对年限。
在本发明的一个实施例中,所述营收因子包括成长因子,所述成长因子用于在成长性下表示所述企业未来营业收入的能力;
所述营收因子计算模块403还用于:
确定为每个所述群体训练的第一逻辑回归模型;
针对每个所述群体的每个所述企业,获取所述企业与营收收入的能力相关的特征;
将所述企业的所述特征输入所述第一逻辑回归模型中进行处理,得到所述企业的成长因子。
在本发明的一个实施例中,所述营收因子计算模块403还用于:
针对每个所述群体,获取所述群体中每个所述企业历史在多个时间周期的营业收入,作为历史收入;
计算所述企业的所述历史收入的平均值,作为平均周期收入;
查询所述企业在当前所述时间周期实际的营业收入,作为实时收入;
若所述实时收入大于所述平均周期收入,则将所述企业的第一标志位设置为1;
若所述实时收入小于或等于所述平均周期收入,则将所述企业的第一标志位设置为0;
获取所述企业的、与营收收入的能力相关的特征;
将所有所述企业的所述特征作为自变量、所有所述企业的所述第一标志位作为因变量,为所述群体构建第一逻辑回归模型。
在本发明的一个实施例中,所述营收因子包括稳定因子,所述稳定因子用于在稳定性下表示所述企业未来营业收入的能力;
所述营收因子计算模块403还用于:
针对每个所述群体,查询所述群体内所有所述企业的成长因子,所述成长因子用于在成长性下表示所述企业未来营业收入的能力;
针对每个所述群体,计算所有所述成长因子之间的离散程度,作为所述群体内所有所述企业的稳定因子。
在本发明的一个实施例中,所述营收因子计算模块403还用于:
针对每个所述群体,对所述群体内所有所述企业的所述成长因子计算平均值,作为平均因子;
分别对所述企业的所述成长因子与所述平均因子之间的差值取平方;
对所述平方求平均值,得到所述群体内所有所述企业的稳定因子。
在本发明的一个实施例中,所述营收因子包括审慎因子,所述审慎因子用于在波动性下表示所述企业未来营业收入的能力;
所述营收因子计算模块403还用于:
确定为每个所述群体训练的第二逻辑回归模型;
针对每个所述群体的每个所述企业,获取所述企业与营收收入的能力相关的特征;
将所述企业的所述特征输入所述第二逻辑回归模型中进行处理,得到所述企业的审慎因子;
将所有所述企业的所述审慎因子融合为所述群体的审慎因子。
在本发明的一个实施例中,所述营收因子计算模块403还用于:
针对每个所述群体,获取所述群体中每个所述企业的租借行为;
若所述租借行行为已违约,则将所述企业的第二标志位设置为1;
若所述租借行为未违约,则将所述企业的第二标志位设置为0;
获取所述企业的、与营收收入的能力相关的特征;
将所述特征作为自变量、所述第二标志位作为因变量,为所述群体构建第二逻辑回归模型。
在本发明的一个实施例中,所述营收因子包括核心因子,所述核心因子用于在重要性下表示所述企业未来营业收入的能力;
所述营收因子计算模块403还用于:
查询所述企业之间在营业上的担保行为;
以所述企业为节点,所述担保关系为边,构建关系图;
在所述关系图中计算所述节点的重要性,作为所述企业的核心因子。
在本发明的一个实施例中,所述营收因子计算模块403还用于:
将所述企业设置为关系图中的节点;
若所述企业之间存在担保行为,则在所述节点之间构建关系图中的边,所述边的方向为从被担保者指向担保者;
针对所述节点,计算所述企业作为担保者时担保的每个额度在所有所述额度的占比,作为所述边的权重。
在本发明的一个实施例中,所述影响因子包括行业影响因子与区域影响因子中的至少一者,所述营收因子包括成长因子、稳定因子、审慎因子与核心因子中的至少一者;
所述扩缩系数计算模块404还用于:
基于所述行业影响因子与所述区域影响因子中的至少一者,以及,所述成长因子、所述稳定因子、所述审慎因子与所述核心因子中的至少一者计算基准因子,所述基准因子分别与所述行业影响因子正相关、与所述区域影响因子正相关、与所述成长因子正相关、与所述稳定因子负相关、与所述审慎因子负相关、与所述核心因子正相关;
以第一常数与所述基准系数之间的和值为底、多个未来时间段为指数,计算营收系数,多个所述未来时间段具有数量不等的所述时间周期;
针对时长最长的所述未来时间段,对所述营收系数求和,得到所述企业在未来时间段营业收入的扩缩系数。
在本发明的一个实施例中,所述扩缩系数计算模块404还用于:
将所述成长因子减去所述稳定因子与第一缩放因子之间的乘积,获得第一候选值;
将第二常数、所述行业影响因子与第二缩放因子之间的乘积、所述区域影响因子与第三缩放因子之间的乘积相加,得到第二候选值;
将第三常数减去所述审慎因子与第四缩放因子之间的乘积,获得第三候选值;
将第四常数、所述核心因子与第五缩放因子之间的乘积相加,获得第四候选值;
将所述第一候选值、所述第二候选值、所述第三候选值与所述第四候选值相乘,得到基准因子。
在本发明的一个实施例中,所述营业收入调节模块405还用于:
查询所述企业在当前时间周期实际的营业收入,作为实时收入;
将所述实际收入乘以所述扩缩系数,获得所述企业在未来多个所述时间周期的营业收入。
本发明实施例所提供的企业营业收入的预测装置可执行本发明任意实施例所提供的企业营业收入的预测方法,具备执行企业营业收入的预测方法相应的功能模块和有益效果。
实施例三
图5示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图5所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如企业营业收入的预测方法。
在一些实施例中,企业营业收入的预测方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的企业营业收入的预测方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行企业营业收入的预测方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
实施例四
本发明实施例还提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现如本申请任一实施例所提供的企业营业收入的预测方法。
计算机程序产品在实现的过程中,可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (21)
1.一种企业营业收入的预测方法,其特征在于,包括:
计算行业和/或区域历史影响企业营业收入的程度,作为影响因子;
将所述企业划分至多个群体中;
在所述群体的范围内,在成长性、稳定性、波动性与重要性中的至少一个维度下计算所述企业未来营业收入的能力,作为营收因子;
根据所述影响因子与所述营收因子计算所述企业在未来营业收入的扩缩系数;
使用所述扩缩系数对所述企业实际的营业收入进行调节,获得所述企业在未来的营业收入。
2.根据权利要求1所述的方法,其特征在于,所述影响因子包括行业影响影子,所述行业影响因子用于表示行业历史影响企业营业收入的程度;
所述计算行业和/或区域历史影响企业营业收入的程度,作为影响因子,包括:
查询企业归属的行业;
获取所述区域在多个第一历史时间段内的市盈率,多个所述第一历史时间段划分为数量不等的时间周期;
针对每个所述第一历史时间段,将所述市盈率除以所述时间周期的数量,作为平均市盈率;
针对所有所述第一历史时间段,对所有所述平均市盈率计算平均值,得到行业影响因子。
3.根据权利要求1所述的方法,其特征在于,所述影响因子包括区域影响影子,所述区域影响因子用于表示区域历史影响企业营业收入的程度;
所述计算行业和/或区域历史影响企业营业收入的程度,作为影响因子,包括:
查询企业所处的区域;
获取所述行业在多个第二历史时间段内生产总值的增长率,多个所述第二历史时间段划分为数量不等的时间周期;
针对每个所述第二历史时间段,将所述增长率除以所述时间周期的数量,作为平均增长率;
针对所有所述第二历史时间段,对所有所述平均增长率计算平均值,得到行业影响因子。
4.根据权利要求1所述的方法,其特征在于,所述将所述企业划分至多个群体中,包括:
确定决策树;
对所述企业分别查询所属的行业、所处的区域、规模与成立的相对年限中的至少一者;
将所述行业、所述区域、所述规模与所述相对年限中的至少一者输入所述决策树中进行决策,得到所述企业归属的群体。
5.根据权利要求4所述的方法,其特征在于,所述对所述企业分别查询所属的行业、所处的区域、规模与成立的相对年限中的至少一者,包括:
加载第一映射关系,所述第一映射关系用于记录第一候选范围与规模之间的关系;
获取所述企业在预设的时间周期内的销售额;
在所述第一映射关系中查询所述销售额所在的第一候选范围,作为第一目标范围;
将所述第一目标范围映射的规模设置为所述企业的规模。
6.根据权利要求4所述的方法,其特征在于,所述对所述企业分别查询所属的行业、所处的区域、规模与成立的相对年限中的至少一者,包括:
加载第二映射关系,所述第二映射关系用于记录第二候选范围与成立的相对年限之间的关系;
获取所述企业成立的时长;
在所述第二映射关系中查询所述时长所在的第二候选范围,作为第二目标范围;
将所述第二目标范围映射的成立的相对年限设置为所述企业成立的相对年限。
7.根据权利要求1所述的方法,其特征在于,所述营收因子包括成长因子,所述成长因子用于在成长性下表示所述企业未来营业收入的能力;
所述在所述群体的范围内,在成长性、稳定性、波动性与重要性中的至少一个维度下计算所述企业未来营业收入的能力,作为营收因子,包括:
确定为每个所述群体训练的第一逻辑回归模型;
针对每个所述群体的每个所述企业,获取所述企业与营收收入的能力相关的特征;
将所述企业的所述特征输入所述第一逻辑回归模型中进行处理,得到所述企业的成长因子。
8.根据权利要求7所述的方法,其特征在于,所述确定为每个所述群体训练的第一逻辑回归模型,包括:
针对每个所述群体,获取所述群体中每个所述企业历史在多个时间周期的营业收入,作为历史收入;
计算所述企业的所述历史收入的平均值,作为平均周期收入;
查询所述企业在当前所述时间周期实际的营业收入,作为实时收入;
若所述实时收入大于所述平均周期收入,则将所述企业的第一标志位设置为1;
若所述实时收入小于或等于所述平均周期收入,则将所述企业的第一标志位设置为0;
获取所述企业的、与营收收入的能力相关的特征;
将所有所述企业的所述特征作为自变量、所有所述企业的所述第一标志位作为因变量,为所述群体构建第一逻辑回归模型。
9.根据权利要求1所述的方法,其特征在于,所述营收因子包括稳定因子,所述稳定因子用于在稳定性下表示所述企业未来营业收入的能力;
所述在所述群体的范围内,在成长性、稳定性、波动性与重要性中的至少一个维度下计算所述企业未来营业收入的能力,作为营收因子,包括:
针对每个所述群体,查询所述群体内所有所述企业的成长因子,所述成长因子用于在成长性下表示所述企业未来营业收入的能力;
针对每个所述群体,计算所有所述成长因子之间的离散程度,作为所述群体内所有所述企业的稳定因子。
10.根据权利要求9所述的方法,其特征在于,所述针对每个所述群体,计算所有所述成长因子之间的离散程度,作为所述群体内所有所述企业的稳定因子,包括:
针对每个所述群体,对所述群体内所有所述企业的所述成长因子计算平均值,作为平均因子;
分别对所述企业的所述成长因子与所述平均因子之间的差值取平方;
对所述平方求平均值,得到所述群体内所有所述企业的稳定因子。
11.根据权利要求1所述的方法,其特征在于,所述营收因子包括审慎因子,所述审慎因子用于在波动性下表示所述企业未来营业收入的能力;
所述在所述群体的范围内,在成长性、稳定性、波动性与重要性中的至少一个维度下计算所述企业未来营业收入的能力,作为营收因子,包括:
确定为每个所述群体训练的第二逻辑回归模型;
针对每个所述群体的每个所述企业,获取所述企业与营收收入的能力相关的特征;
将所述企业的所述特征输入所述第二逻辑回归模型中进行处理,得到所述企业的审慎因子;
将所有所述企业的所述审慎因子融合为所述群体的审慎因子。
12.根据权利要求11所述的方法,其特征在于,所述确定为每个所述群体训练的第二逻辑回归模型,包括:
针对每个所述群体,获取所述群体中每个所述企业的租借行为;
若所述租借行行为已违约,则将所述企业的第二标志位设置为1;
若所述租借行为未违约,则将所述企业的第二标志位设置为0;
获取所述企业的、与营收收入的能力相关的特征;
将所述特征作为自变量、所述第二标志位作为因变量,为所述群体构建第二逻辑回归模型。
13.根据权利要求1所述的方法,其特征在于,所述营收因子包括核心因子,所述核心因子用于在重要性下表示所述企业未来营业收入的能力;
所述在所述群体的范围内,在成长性、稳定性、波动性与重要性中的至少一个维度下计算所述企业未来营业收入的能力,作为营收因子,包括:
查询所述企业之间在营业上的担保行为;
以所述企业为节点,所述担保关系为边,构建关系图;
在所述关系图中计算所述节点的重要性,作为所述企业的核心因子。
14.根据权利要求13所述的方法,其特征在于,所述以所述企业为节点,所述担保关系为边,构建关系图,包括:
将所述企业设置为关系图中的节点;
若所述企业之间存在担保行为,则在所述节点之间构建关系图中的边,所述边的方向为从被担保者指向担保者;
针对所述节点,计算所述企业作为担保者时担保的每个额度在所有所述额度的占比,作为所述边的权重。
15.根据权利要求1-14中任一项所述的方法,其特征在于,所述影响因子包括行业影响因子与区域影响因子中的至少一者,所述营收因子包括成长因子、稳定因子、审慎因子与核心因子中的至少一者;
所述根据所述影响因子与所述营收因子计算所述企业在未来营业收入的扩缩系数,包括:
基于所述行业影响因子与所述区域影响因子中的至少一者,以及,所述成长因子、所述稳定因子、所述审慎因子与所述核心因子中的至少一者计算基准因子,所述基准因子分别与所述行业影响因子正相关、与所述区域影响因子正相关、与所述成长因子正相关、与所述稳定因子负相关、与所述审慎因子负相关、与所述核心因子正相关;
以第一常数与所述基准系数之间的和值为底、多个未来时间段为指数,计算营收系数,多个所述未来时间段具有数量不等的所述时间周期;
针对时长最长的所述未来时间段,对所述营收系数求和,得到所述企业在未来时间段营业收入的扩缩系数。
16.根据权利要求15所述的方法,其特征在于,所述基于所述行业影响因子与所述区域影响因子中的至少一者,以及,所述成长因子、所述稳定因子、所述审慎因子与所述核心因子中的至少一者计算基准因子,包括:
将所述成长因子减去所述稳定因子与第一缩放因子之间的乘积,获得第一候选值;
将第二常数、所述行业影响因子与第二缩放因子之间的乘积、所述区域影响因子与第三缩放因子之间的乘积相加,得到第二候选值;
将第三常数减去所述审慎因子与第四缩放因子之间的乘积,获得第三候选值;
将第四常数、所述核心因子与第五缩放因子之间的乘积相加,获得第四候选值;
将所述第一候选值、所述第二候选值、所述第三候选值与所述第四候选值相乘,得到基准因子。
17.根据权利要求1-14中任一项所述的方法,其特征在于,所述使用所述扩缩系数对所述企业实际的营业收入进行调节,获得所述企业在未来的营业收入,包括:
查询所述企业在当前时间周期实际的营业收入,作为实时收入;
将所述实际收入乘以所述扩缩系数,获得所述企业在未来多个所述时间周期的营业收入。
18.一种企业营业收入的预测装置,其特征在于,包括:
影响因子计算模块,用于计算行业和/或区域历史影响企业营业收入的程度,作为影响因子;
企业分群模块,用于将所述企业划分至多个群体中;
营收因子计算模块,用于在所述群体的范围内,在成长性、稳定性、波动性与重要性中的至少一个维度下计算所述企业未来营业收入的能力,作为营收因子;
扩缩系数计算模块,用于根据所述影响因子与所述营收因子计算所述企业在未来营业收入的扩缩系数;
营业收入调节模块,用于使用所述扩缩系数对所述企业实际的营业收入进行调节,获得所述企业在未来的营业收入。
19.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-17中任一项所述的企业营业收入的预测方法。
20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-17中任一项所述的企业营业收入的预测方法。
21.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序在被处理器执行时实现如权利要求1-17中任一项所述的企业营业收入的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210316212.5A CN114742580A (zh) | 2022-03-28 | 2022-03-28 | 一种企业营业收入的预测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210316212.5A CN114742580A (zh) | 2022-03-28 | 2022-03-28 | 一种企业营业收入的预测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114742580A true CN114742580A (zh) | 2022-07-12 |
Family
ID=82278006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210316212.5A Pending CN114742580A (zh) | 2022-03-28 | 2022-03-28 | 一种企业营业收入的预测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114742580A (zh) |
-
2022
- 2022-03-28 CN CN202210316212.5A patent/CN114742580A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8577791B2 (en) | System and computer program for modeling and pricing loan products | |
CN111754116B (zh) | 一种基于标签画像技术的信用评估方法及装置 | |
JP2017504126A (ja) | 投資証券の層別コンポジットポートフォリオ | |
CN107609771A (zh) | 一种供应商价值评价方法 | |
KR102628559B1 (ko) | 부동산 담보대출 자동심사 플랫폼 제공방법 및 제공장치 | |
JP2018503927A (ja) | 投資証券の複合ポートフォリオのセグメント化及び層化 | |
Boguslauskas et al. | The selection of financial ratios as independent variables for credit risk assessment | |
Murugan | Large-scale data-driven financial risk management & analysis using machine learning strategies | |
CN114943582A (zh) | 一种信息推荐方法、系统及推荐服务器 | |
Karminsky et al. | Increase of banks’ credit risks forecasting power by the usage of the set of alternative models | |
Garcia-Gallego et al. | Business failure prediction models: finding the connection between their results and the sampling method | |
CN114529400A (zh) | 一种消费贷款预授信评估方法、设备及介质 | |
CN110930078A (zh) | 一种业务对象识别方法、装置及设备 | |
Meng et al. | New combined weighting model based on maximizing the difference in evaluation results and its application | |
Nehrebecka et al. | The dynamic model of partial adjustment of the capital structure. Meta-analysis and a case of Polish enterprises | |
Berteloot et al. | A novel credit rating migration modeling approach using macroeconomic indicators | |
KR101856550B1 (ko) | 해외건설기업 의사결정 지원을 위한 발주국 평가방법 및 시스템 | |
CN114742580A (zh) | 一种企业营业收入的预测方法、装置、设备及存储介质 | |
CN113421014A (zh) | 一种目标企业确定方法、装置、设备和存储介质 | |
JP6121017B2 (ja) | 金融機関経営支援システム及びプログラム | |
Peshkova et al. | Modeling forecasting the financial condition of organizations | |
Fliginskih et al. | Evaluating and forecasting the capital adequacy for commercial banks | |
Gorskii et al. | Some Modifications of Integer Optimization Problems with Uncertainty and Risk | |
Seijas-Giménez et al. | Financing entrepreneurial activity in Uruguay: time to default in a public microcredit institution | |
KR102668661B1 (ko) | 부동산 투자회사의 주식 정보 제공 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |