CN115423594A - 企业财务风险的评估方法、装置、设备及存储介质 - Google Patents

企业财务风险的评估方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115423594A
CN115423594A CN202211201249.XA CN202211201249A CN115423594A CN 115423594 A CN115423594 A CN 115423594A CN 202211201249 A CN202211201249 A CN 202211201249A CN 115423594 A CN115423594 A CN 115423594A
Authority
CN
China
Prior art keywords
data
factor
financial
index
enterprise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211201249.XA
Other languages
English (en)
Inventor
杨桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oriental Hoshino Digital Technology Beijing Co ltd
Original Assignee
Oriental Hoshino Digital Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oriental Hoshino Digital Technology Beijing Co ltd filed Critical Oriental Hoshino Digital Technology Beijing Co ltd
Priority to CN202211201249.XA priority Critical patent/CN115423594A/zh
Publication of CN115423594A publication Critical patent/CN115423594A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种企业财务风险的评估方法、装置、设备及存储介质,选取变量指标,数据预处理,数据转换,Factor‑Logistic融合算法和等级划分。使用Factor‑Logistic融合算法一方面从众多财务指标筛选出关键指标因子,重新建立相互独立的指标体系,解决了风险指标间共线性问题;另一方面提高模型的可解释性,从特征的权重可以看到不同的特征对最后结果的影响,以概率的形式输出,有利于利用概率辅助决策的财务风险预警。在等级划分上使用统计学假设检验中的区间估计理论的迁移,根据置信区间对等级建立了划分标准和机制。

Description

企业财务风险的评估方法、装置、设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种企业财务风险的评估方法、装置、设备及存储介质。
背景技术
近年来,随着社会经济的迅速发展,企业面临的财务风险也愈加频繁和复杂,国内外各家企业都加大了对自身财务状况稳定的关注力度,越来越重视提高企业的财务状况和完善财务风险管理预警系统。传统的财务审计和风险评估,大多是通过人工审计的方式进行,这种方式需要耗费大量人力,且效率低、准确性低。
发明内容
本发明的主要目的在于提供一种企业财务风险的评估方法、装置、设备及存储介质,旨在解决现有的企业财务风险的评估效率低,准确性较差的问题。
为实现上述目的,本发明提供一种企业财务风险的评估方法,所述企业财务风险的评估方法包括:
采集企业的原始财务数据,并根据所述原始财务数据计算对应的原始变量指标数据;
基于拉依达准则对所述原始变量指标数据进行异常值剔除和筛选,得到中间变量指标数据;
基于Factor算法对所述中间变量指标数据进行数据转换,得到关键指标因子数据;
通过Logistic算法模型对所述关键指标因子数据进行计算,并根据计算结果确定企业财务风险情况。
可选地,所述企业原始财务数据包括:流动资产、流动负债、资产总额、留存收益、息税前利润、权益市值、负债总额、营业收入、经营活动产生的现金流量净额、资产总额期末、资产总额期初、营业成本;
所述原始变量指标数据包括:流动性指标、收益性指标、杠杆性指标、偿债性指标、周转性指标、现金流指标、资产增长指标、盈利性指标。
可选地,所述基于拉依达准则对所述原始变量指标数据进行异常值剔除和筛选,得到中间变量指标数据的步骤,包括:
获取所述原始变量指标数据的实验标准偏差和平均值;
根据所述实验标准偏差和平均值确定所述原始变量指标数据中的异常值,并剔除所述异常值;
对剔除异常值后的原始变量指标数据进行Z-Score标准化,得到中间变量指标数据。
可选地,所述基于Factor算法对所述中间变量指标数据进行数据转换,得到关键指标因子数据的步骤,包括:
对所述中间变量指标数据进行标准化;
获取标准化的中间变量指标数据的协方差矩阵;
对所述协方差矩阵进行特征值分解,得到特征值,并根据所述特征值对应的特征值向量获取因子载荷矩阵,其中,所述因子载荷矩阵的元素数量由公共因子的累计方差贡献率确定;
基于回归法对所述因子载荷矩阵进行计算,获得公共因子向量;
基于所述标准化的中间变量、所述因子载荷矩阵和所述公共因子向量,获得关键指标因子数据。
可选地,所述Logistic算法模型是基于Logistic算法构建得到,所述通过Logistic算法模型对所述关键指标因子数据进行计算,并根据计算结果确定企业财务风险情况的步骤,包括:
根据所述Logistic算法模型的判别函数和所述关键指标因子数据,计算得到对应的映射值,并根据所述映射值确定企业财务风险情况。
可选地,所述根据所述映射值确定企业财务风险情况的步骤,包括以下至少一项:
在所述映射值大于或等于0、且小于0.5时,确定所述企业财务高风险;
在所述映射值大于或等于0.5、且小于0.9时,确定所述企业财务中风险;
在所述映射值大于或等于0.9、且小于0.95时,确定所述企业财务低风险;
在所述映射值大于或等于0.95、且小于或等于1时,确定所述企业财务无风险。
此外,为实现上述目的,本发明还提供一种企业财务风险的评估装置,所述评估装置包括:
数据采集模块,用于采集企业的原始财务数据,并根据所述原始财务数据计算对应的原始变量指标数据;
预处理模块,用于基于拉依达准则对所述原始变量指标数据进行异常值剔除和筛选,得到中间变量指标数据;
数据转换模块,用于基于Factor算法对所述中间变量指标数据进行数据转换,得到关键指标因子数据;
Logistic算法计算模块,用于通过Logistic算法模型对所述关键指标因子数据进行计算,并根据计算结果确定企业财务风险情况。
此外,为实现上述目的,本发明还提供一种企业财务风险的评估设备,所述评估设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的企业财务风险的评估方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的企业财务风险的评估方法的步骤。
此外,为实现上述目的,本发明实施例还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上所述的企业财务风险的评估方法的步骤。
本发明实施例采集企业的原始财务数据,并根据所述原始财务数据计算对应的原始变量指标数据;基于拉依达准则对所述原始变量指标数据进行异常值剔除和筛选,得到中间变量指标数据;基于Factor算法对所述中间变量指标数据进行数据转换,得到关键指标因子数据;通过Logistic算法模型对所述关键指标因子数据进行计算,并根据计算结果确定企业财务风险情况。通过以上方式,使用Factor算法(Factor Analysis)技术将多个实测变量最终转换为少数几个综合指标(或称潜变量),从而减少需要分析的变量的数量,减少财务风险问题分析的复杂性;再使用这少数的几个综合指标和Logistic算法 (LogisticRegression)技术进行建模、训练、求解权重参数;两者技术深度融合(Factor-Logistic融合算法),适用于财务风险预警领域;最后使用统计学假设检验中的区间估计理论的迁移,根据置信区间对等级划分建立了划分标准和机制,有利提高企业财务风险评估的效率和准确率。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图;
图2为本发明企业财务风险的评估方法第一实施例的流程示意图;
图3为本发明企业财务风险的评估方法第一实施例的风险预警模型结构示意图;
图4为本发明企业财务风险的评估装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明实施例的企业财务风险的评估设备可以是服务器,也可以是PC (PersonalComputer,个人计算机)、平板电脑、便携计算机、可移动终端等终端设备。
如图1所示,该评估设备可以包括:处理器1001,例如CPU,通信总线 1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002 用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口 (如Wi-Fi接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的设备结构并不构成对评估设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器和/或数据哭,与后台服务器和/数据库进行数据通信;用户接口1003主要用于连接客户端,与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的计算机程序,并执行本发明企业财务风险的评估方法的各实施例。
基于上述硬件结构,提出本发明企业财务风险的评估方法的各实施例。
本发明提供一种企业财务风险的评估方法。
近年来,随着社会经济的迅速发展,企业面临的财务风险也愈加频繁和复杂,国内外各家企业都加大了对自身财务状况稳定的关注力度,越来越重视提高企业的财务状况和完善财务风险管理预警系统。传统的财务审计和风险评估,大多是通过人工审计的方式进行,这种方式需要耗费大量人力,且效率低、准确性低。
近年来,也有学者提出通过财务风险预警模型的方式进行财务风险评估,然而目前对财务风险预警模型的研究存在许多问题,从宏观角度上看:第一,多数学者或企业在进行预警分析时,均是将企业自身的财务数据代入国外已有的模型,忽视了国内外模型适用环境的不同,由于国内外的财务会计准则有较大的差异性,因而其所检验结果的准确性有待考证;第二,对财务风险预警的研究缺乏理论指导,以定性方法选取研究变量居多;第三,各个财务风险预警的侧重点不同,所选取的财务指标不够全面,有一定的片面性,而片面的指标选择必然会降低预警模型的解释能力。
本发明实施例针对上述第一点问题使用中国上市公司公开财务数据进行建模,更加精准的对中国企业的财务风险进行预警;针对第二、三点问题使用Factor算法算法对众多研究变量进行定量研究,根据数据确定研究变量的代表因子,在不丢失数据信息的前提下,将全面的数据压缩成少量的代表因子,更加具有科学性。
从技术实现的角度上看:第一,纽约大学斯特恩商学院教授Edward Altman在1968年利用多元线性判别开展财务风险预警,建立了Z-Score模型,但该模型的不足在于多元线性判别模型要求自变量服从正态分布、方差和协方差要一致,但在现实中很难满足如此苛刻的前提条件;第二,在1980年 Ohlson第一次将Logistic算法方法引入财务危机预警领域,但由于财务指标之间的多重共线性,模型在变量选择时存在限制;第三,在2006年AnaM.Aguilera等人将主成分分析与Logistic算法相结合来预测企业违约问题,但存在的不足在于主成分的实际意义难以解释。
本发明实施例使用Factor-Logistic融合算法克服了上述所阐述的局限性,使用Factor算法筛选众多财务指标,重新建立特征之间相互独立的指标体系,找出影响企业财务风险的八个关键指标因子,解决了风险指标间共线性问题,特征全面覆盖企业的经营、管理和财务的内容;使用Logistic算法可以提高模型的可解释性,从特征的权重可以看到不同的特征对最后结果的影响,适合二分类问题,不需要缩放输入特征,可以直接对分类可能性进行建模,无需事先假设数据分布,避免了假设分布不准确所带来的问题,以概率的形式输出,对利用概率辅助决策的财务风险预警很有用,而且本发明实施例对Logistic 算法进行L2正则化优化,防止模型过拟合;财务风险预警系统还包含等级划分部分,大部分学者通常采用均分区间的方法去划分,而本发明实施例在等级划分上使用统计学假设检验中的区间估计理论的迁移,根据90%(一般显著置信度)和95%(高显著置信度)为置信区间分界点,设置0%、50%和100%分别为下界,中界和上界置信度点。
本发明实施例针对传统企业财务风险预警模型需要划分行业或者只针对某一个行业进行建模的方法的情况,建立了不区分行业的通用模型结构以及参数。
参照图2,图2为本发明企业财务风险的评估方法第一实施例的流程示意图。
在本实施例中,企业财务风险的评估方法包括:
步骤S10,采集企业的原始财务数据,并根据所述原始财务数据计算对应的原始变量指标数据;
本实施例的企业财务风险的评估方法是由企业财务风险的评估设备实现的,该评估设备可以是服务器,也可以是客服机器人、智能服务大屏、PC (Personal Computer,个人计算机)、平板电脑、便携计算机、可移动终端等终端设备。
本实施例中,评估设备首先需要采集某一待评估企业的原始财务数据。为了提高分析的准确性,原始财务数据的维度至少包括两个维度,用以反映某个周期、或某个时间段的财务情况。例如,原始财务数据可以包括流动资产、流动负债、资产总额、留存收益、息税前利润、权益市值、负债总额、营业收入、经营活动产生的现金流量净额、资产总额期末、资产总额期初、营业成本等。
其中,这些原始财务数据可以是以若干个统计周期进行进行采集。在获得原始财务数据后,可根据这些原始财务数据获取对应的原始变量指标数据。例如,对于前述的原始财务数据,可根据以下方式获得对应的原始变量指标数据:
1)X1=流动性指标=(流动资产-流动负债)/资产总额(平均)
2)X2=收益性指标=留存收益/资产总额(平均)
3)X3=杠杆性指标=息税前利润/资产总额(平均)
4)X4=偿债性指标=权益市值/负债总额
5)X5=周转性指标=营业收入/资产总额(平均)
6)X6=现金流指标=经营活动产生的现金流量净额/流动负债
7)X7=资产增长指标=(资产总额期末-资产总额期初)/资产总额期初
8)X8=盈利性指标=(营业收入-营业成本)/营业收入
步骤S20,基于拉依达准则对所述原始变量指标数据进行异常值剔除和筛选,得到中间变量指标数据;
本实施例中,由于原始财务数据中由于统计失误等原因,有可能存在财务数据异常的情况,因此在获得原始变量指标数据后,对所述原始变量指标数据进行预处理、包括异常值剔除和筛选,得到中间变量指标。本实施例中可基于拉依达准则对所述原始变量指标数据进行异常值剔除和筛选,从而提高后续分析评估的准确性。
可选地,所述步骤S20包括:
A21,获取所述原始变量指标数据的实验标准偏差和平均值;
在进行预处理时,首先可获取原始变量指标的实验标准偏差s和平均值
Figure BDA0003872118390000081
其中,对于不同维度的原始变量指标,可以是分别获取各维度的原始变量指标的实验标准偏差s和平均值
Figure BDA0003872118390000082
A22,根据所述实验标准偏差和平均值确定所述原始变量指标数据中的异常值,并剔除所述异常值;
在得到实验标准偏差s和平均值
Figure BDA0003872118390000083
后,可计算某个原始变量指标数据xa与平均值
Figure BDA0003872118390000084
之差;若该差的绝对值大于或等于3s,则认为该原始变量指标数据xa为异常值,并将该异常值剔除。当剔除该异常值后,对剩余的原始变量指标数据再次执行上述A21和A22步骤,直至剩余的原始变量指标数据均满足
Figure BDA0003872118390000085
其中,对于不同维度的原始变量指标数据,是基于该维度的实验标准偏差s和平均值
Figure BDA0003872118390000086
确定异常值。
A23,对剔除异常值后的原始变量指标数据进行Z-Score标准化,得到中间变量指标数据。
在剔除异常值后,对于剩下的原始变量指标数据,可通过下列方式进行 Z-Score标准化,得到中间变量指标数据:
Figure BDA0003872118390000087
上式中,v是原始变量指标数据,v′是中间变量指标数据,
Figure BDA0003872118390000088
为样本的均值,σ为样本的标准差。其中,对于不同维度的原始变量指标数据,是基于该维度的平均值和标准差进行标准化。通过上述方式,可将不同量级的数据转化为统一量度的分值进行比较,确保具有较大定义域的属性不会支配具有较小定义域的属性,提高了数据可比性,使结果更加真实可靠,削弱了数据解释性。
步骤S30,基于Factor算法对所述中间变量指标数据进行数据转换,得到关键指标因子数据;
本实施例中,在得到中间变量指标数据后,将基于Factor算法对各中间变量指标数据进行数据转换,重新建立特征之间相互独立的指标体系,找出影响企业财务风险的关键指标因子数据,解决了风险指标间共线性问题,特征全面覆盖企业的经营、管理和财务的内容。
Factor算法是一种依据变量指标间相关性将多维变量归结为少数公共因子表示,然后加以分析处理的多维变量统计分析方法,它的基本思想是将原始变量分解为两部分:
1)公共因子的线性组合,浓缩表示了原始变量中的绝大部分信息。
2)与公共因子无关的特殊因子,反映了公共因子线性组合与原始变量间的差距。
p维变量x=[x1,...,xi,...,xp]T的Factor算法模型为:x=Af+ε
或记为
Figure BDA0003872118390000091
其中f=[f1,f2,...,fm]T即为提取的公共因子向量,代表了原始变量中不可直接观测但客观存在的m(m<p)个互相独立的共性影响因素,A=(aik)为因子载荷矩阵,矩阵元素aik为变量xi对公共因子fk的载荷,反映了二者的相关系数,其绝对值越大,相关性越高。
对多维变量x建立Factor算法模型的关键在于求解因子载荷矩阵A和公共因子向量f,其步骤如下:
1)为消除变量量纲不同的影响,对含n个p维变量的样本X=[x1,x2,...,xn] 进行标准化;标准化后,各变量的均值为0,方差为1;为表达方便标准化后的变量仍然用X表示,其各元素为
Figure BDA0003872118390000092
2)求样本的协方差矩阵S,其各元素为
Figure BDA0003872118390000093
3)对样本协方差矩阵S做特征值分解,得到p个特征值λ1≥λ2≥…≥λp≥0,对应的特征值向量为γ12,...,γp,可取前m个最大特征值的特征向量估计因子载荷矩阵;同时为保证公共因子向量各分量方差为1,需将其除以对应的标准差λj;因子载荷矩阵中对应特征向量γj则需乘以λj;因此可得因子载荷矩阵
Figure BDA0003872118390000101
其中参数m由公共因子的累积方差贡献率确定,即
Figure BDA0003872118390000102
一般认为,当前m个公共因子的累积方差贡献率超过90%时,可认为前m个公共因子的线性组合基本上能够还原原始变量信息。
公共因子向量f,即原始变量在公共因子上的具体得分可通过回归法估计得到
Figure BDA0003872118390000103
通过以上步骤,得到因子载荷矩阵和公共因子向量后,继而可得原始变量特殊因子向量为
Figure BDA0003872118390000104
进一步的,将上述Factor算法与财务风险分析结果,所述对所述中间变量指标进行数据转换的步骤,具体过程为,首先对所述中间变量指标数据进行标准化;获取标准化的中间变量指标数据的协方差矩阵;对所述协方差矩阵进行特征值分解,得到特征值,并根据所述特征值对应的特征值向量获取因子载荷矩阵,其中,所述因子载荷矩阵的元素数量由公共因子的累计方差贡献率确定;基于回归法对所述因子载荷矩阵进行计算,获得公共因子向量;基于所述标准化的中间变量、所述因子载荷矩阵和所述公共因子向量,获得关键指标因子数据。例如,对于前述X1=流动性指标、X2=收益性指标、X3=杠杆性指标、X4=偿债性指标、X5=周转性指标、X6=现金流指标、X7=资产增长指标、X8=盈利性指标,基于Factor算法将进行数据转换后,得到8个关键性指标因子数据,分别为:1)F1=资产增长因子;2)F2=偿债性因子;3)F3=收益性因子;4)F4=周转性因子;5)F5=盈利性因子;6)F6=现金流因子;7)F7=流动性因子;8)F8=杠杆性因子。
步骤S40,通过Logistic算法模型对所述关键指标因子数据进行计算,并根据计算结果确定企业财务风险情况。
本实施例中,在得到关键指标因子后,可通过预设模型对关键指标因子数据进行计算,并根据计算结果确定企业财务风险情况。其中,为了提高模型的可解释性,该预设模型可以是基于Logistic算法构建,从特征的权重可以看到不同的特征对最后结果的影响,适合二分类问题,不需要缩放输入特征,可以直接对分类可能性进行建模,无需事先假设数据分布,避免了假设分布不准确所带来的问题,以概率的形式输出,对利用概率辅助决策的财务风险预警很有用。
Logistic算法是一种二分类任务的一种常见的算法,是一种有监督的统计学习方法,主要用于对样本的分类。与线性回归不同,线性回归模型是要找到一个函数,使得f(x)与真实值尽可能接近;而Logistic算法在二分类任务上却是产生与输出标记y(y是布尔值0、1);Logistic算法是广义的线性回归,广义的线性回归是说对于一个回归任务来说,如果标记的输出是在指数尺度上变化的话,可以用来作为模型预测输出逼近的目标;同样的,Logistic算法就是要寻找一个函数g(z)使得线性回归的预测输出的实值转化为布尔值,通常使用Sigmoid函数,形式如下:
g(z)=1/(1+e-z)
该函数是一个S型的函数,当自变量z趋近正无穷时,因变量g(z)趋近于1,而当z趋近负无穷时,g(z)趋近于0,它能够将任何实数映射到(0,1)区间,使其可用于将任意值函数转换为更适合二分类的函数,这非常适合于我们的分类概率模型;因为这个性质,Sigmoid函数也被当作是归一化的一种方法,与归一化同理,是属于数据预处理中的“缩放”功能,可以将数据压缩到[0,1] 之内;区别在于,归一化之后,是可以取到0和1的(最大值归一化后就是1,最小值归一化后就是0),但Sigmoid函数只是无限趋近于0和1;另外,它还有一个很好的导数性质:
g′(z)=g(z)(1-g(z))
这个通过函数对g(z)求导很容易得到;如果令g(z)中的z为z=θx,这样就得到了二元Logistic算法模型的一般形式:
hθ(x)=1/(1+e-θx)
其中x为样本输入,hθ(x)为模型输出,可以理解为某一分类的概率大小。而θ为分类模型的要求出的模型参数;对于模型输出hθ(x),可让它和二元样本输出y(假设为0和1)有这样的对应关系,如果hθ(x)>0.5,即θx>0,则y 为1。如果hθ(x)<0.5,即θx<0,则y为0。y=0.5是临界情况,此时θx=0,从 Logistic算法模型本身无法确定分类。hθ(x)的值越小,而分类为0的的概率越高,反之,值越大的话分类为1的概率越高;如果靠近临界点,则分类准确率会下降;此处也可以将模型写成矩阵模式:
hθ(X)=1/(1+e-θX)
关于预设模型的损失函数的定义,目标是极小化损失函数来得到对应的模型系数θ。
由于线性回归是连续的,所以可以使用模型误差的的平方和来定义损失函数;但是Logistic算法不是连续的,自然线性回归损失函数定义的经验就用不上了;不过可以用最大似然法来推导出损失函数。
按照二元Logistic算法的定义,假设样本输出是0或者1两类;那么有
P(y=1|x,θ)=hθ(x)
P(y=0|x,θ)=1-hθ(x)
把这两个式子写成一个式子,就是:
P(y|x,θ)=hθ(x)y(1-hθ(x))1-y
其中y的取值只能是0或者1。
得到了y的概率分布函数表达式,就可以用似然函数最大化来求解需要的模型系数θ。
为了方便求解,这里用对数似然函数最大化,对数似然函数取反即为损失函数J(θ);其中似然函数的代数表达式为:
Figure BDA0003872118390000121
其中m为样本的个数。
对似然函数对数化取反的表达式,即损失函数表达式为:
Figure BDA0003872118390000122
损失函数用矩阵法表达更加简洁:
J(θ)=-YT loghθ(X)-(E-Y)T log(E-hθ(X))
其中E为全1向量。
对于二元Logistic算法的损失函数极小化,有比较多的方法,最常见的有梯度下降法,坐标轴下降法,拟牛顿法等;本模型用梯度下降法推导θ每次迭代的公式;但由于代数法推导比较的繁琐,就用矩阵法来做损失函数的优化过程,这里给出矩阵法推导二元Logistic算法梯度的过程。
对于上述用矩阵法表达的损失函数来说,通过J(θ)对θ向量求导可得:
Figure BDA0003872118390000131
这一步用到了向量求导的链式法则,和下面三个基础求导公式的矩阵形式:
Figure BDA0003872118390000132
Figure BDA0003872118390000133
(g(z)为Sigmoid函数)
Figure BDA0003872118390000134
对于刚才的求导公式进行化简可得:
Figure BDA0003872118390000135
从而在梯度下降法中每一步向量θ的迭代公式如下:
θ=θ-aXT(hθ(X)-Y)
其中,α为梯度下降法的步长。
另外,本实施例对Logistic算法进行L2正则化优化,其目的在于减小模型参数大小或者参数的数量,缓解过拟合;正则化的过程其实就是在原来的目标函数的基础上又加了一项非负项,并且这个非负项是θ的函数;这样的话目标不变的基础上可以让这个残差变得小一点,相当于对其产生了一种约束。
L2正则化对参数进行二次约束的公式如下:
Figure BDA0003872118390000136
本实施例使用Logistic算法构建模型的判别函数为:
Figure BDA0003872118390000137
Z=-0.613+0.724F1+0.342F2+2.919F3+1.499F4+0.456F5+1.354F6+ 1.135F7+1.784F8
其中F1、F2、F3、F4、F5、F6、F7和F8的含义如前述,此处不再赘述。
本实施例构建了企业财务风险预警通用模型,定义了通用模型的函数求解关系,首先需定义四个求解常量矩阵。
建模样本Factor算法中的成分得分系数矩阵C8×8如下所示,其中每行与每列分别都代表X1-X8
Figure BDA0003872118390000141
建模样本的特征维度均值向量M8×1、标准差向量S8×1如下所示,向量分别代表X1-X8。Logistic算法线性加权权重W9×1也如下所示,其中前8个代表Factor 算法后F1-F8的权重,最后一个代表偏差常量
Figure BDA0003872118390000142
设有N组预测样本特征数据矩阵DN×8,行和列都按照X1-X8的特征顺序排列,计算原理与步骤如下:
1)将特征维度均值向量M8×1、特征维度标准差向量S8×1的列向量转置后构建 N×8的矩阵为MN×8、SN×8,其中新矩阵每一行都是原向量。
2)计算DN×8矩阵Z-Score标准化得到D′N×8,计算公式如下所示
Figure BDA0003872118390000143
3)计算D′N×8矩阵与成分得分系数矩阵C8×8进行矩阵相乘,构建出因子得分矩阵D″N×8,计算公式如下所示:
D″N×8=D′N×8C8×8
4)将D″N×8最后一列拼接一组全1向量EN×1,构建成一组新的D″N×9矩阵。
5)将Logistic算法线性加权权重W9×1列向量转置后构建N×9的矩阵为 WN×9,计算D″N×9矩阵与WN×9进行哈达玛积后对行求和,也就是对应元素相乘后对行求和,得到ZN×1线性加权向量(也即前述的判别函数中的Z),计算公式如下:
Figure BDA0003872118390000151
6)计算线性加权向量ZN×1的Sigmoid函数映射值,计算公式如下:
Figure BDA0003872118390000152
(也即相当于前述的判别函数中的
Figure BDA0003872118390000153
)
7)按照风险等级划分的标准对PN×1进行等级划分,划分公式如下:
Figure BDA0003872118390000154
可选地,在预设模型是基于上述Logistic算法构建得到时,所述步骤S40 包括:
A41,根据所述预设模型的判别函数和所述关键指标因子数据,计算得到对应的映射值,并根据所述映射值确定企业财务风险情况;
在得到关键指标因子后,可根据前述的判别函数计算得到对应的映射值,然后可基于该映射值、以及前述的风险等级划分至确定企业财务风险情况。具体的,在所述映射值大于或等于0、且小于0.5时,确定所述企业财务高风险;在所述映射值大于或等于0.5、且小于0.9时,确定所述企业财务中风险;在所述映射值大于或等于0.9、且小于0.95时,确定所述企业财务低风险;在所述映射值大于或等于0.95、且小于或等于1时,确定所述企业财务无风险。本实施例在等级划分上使用统计学假设检验中的区间估计理论的迁移,根据 90%(一般显著置信度)和95%(高显著置信度)为置信区间分界点,设置 0%、50%和100%分别为下界,中界和上界置信度点即结合Logistic算法特性,将输出概率与置信区间概念融合,置信区间[0%-50%)在为高风险区, [50%-90%)为中风险区,[90%-95%)为低风险区,[95%-100%]为无风险区。
进一步的,可参见图3,图3为上述第一实施例的风险预警模型结构示意图,其中包括标准化数据部分、Factor算法部分、Logistic算法部分、等级划分部分,而各部分内容与上述实施例中的各步骤相对应,此处不再赘述。
本实施例中,采集企业的原始财务数据,并根据所述原始财务数据计算对应的原始变量指标数据;基于拉依达准则对所述原始变量指标数据进行异常值剔除和筛选,得到中间变量指标数据;基于Factor算法对所述中间变量指标数据进行数据转换,得到关键指标因子数据;通过Logistic算法模型对所述关键指标因子数据进行计算,并根据计算结果确定企业财务风险情况。通过以上方式,使用Factor算法(FactorAnalysis)技术将多个实测变量最终转换为少数几个个综合指标(或称潜变量),从而减少需要分析的变量的数量,减少财务风险问题分析的复杂性;再使用这少数的几个综合指标和Logistic 算法(Logistic Regression)技术进行建模、训练、求解权重参数;两者技术深度融合(Factor-Logistic融合算法),适用于财务风险预警领域;最后使用统计学假设检验中的区间估计理论的迁移,根据置信区间对等级划分建立了划分标准和机制,有利提高企业财务风险评估的效率和准确率。
本发明还提供一种企业财务风险的评估装置。
参照图4,图4为本发明企业财务风险的评估装置第一实施例的功能模块示意图。
如图4所示,所述评估装置包括:
数据采集模块10,用于采集企业的原始财务数据,并根据所述原始财务数据计算对应的原始变量指标数据;
预处理模块20,用于基于拉依达准则对所述原始变量指标数据进行异常值剔除和筛选,得到中间变量指标数据;
数据转换模块30,用于基于Factor算法对所述中间变量指标数据进行数据转换,得到关键指标因子数据;
Logistic算法计算模块40,用于通过Logistic算法模型对所述关键指标因子数据进行计算,并根据计算结果确定企业财务风险情况。
进一步地,所述企业原始财务数据包括:流动资产、流动负债、资产总额、留存收益、息税前利润、权益市值、负债总额、营业收入、经营活动产生的现金流量净额、资产总额期末、资产总额期初、营业成本;所述原始变量指标数据包括:流动性指标、收益性指标、杠杆性指标、偿债性指标、周转性指标、现金流指标、资产增长指标、盈利性指标。
进一步地,所述预处理模块20,具体用于获取所述原始变量指标数据的实验标准偏差和平均值;根据所述实验标准偏差和平均值确定所述原始变量指标数据中的异常值,并剔除所述异常值;对剔除异常值后的原始变量指标数据进行Z-Score标准化,得到中间变量指标数据。
进一步地,所述数据转换模块30,具体用于对所述中间变量指标数据进行标准化;获取标准化的中间变量指标数据的协方差矩阵;对所述协方差矩阵进行特征值分解,得到特征值,并根据所述特征值对应的特征值向量获取因子载荷矩阵,其中,所述因子载荷矩阵的元素数量由公共因子的累计方差贡献率确定;基于回归法对所述因子载荷矩阵进行计算,获得公共因子向量;基于所述标准化的中间变量、所述因子载荷矩阵和所述公共因子向量,获得关键指标因子数据。
进一步地,所述Logistic算法模型是基于Logistic算法构建得到,所述 Logistic算法计算模块40,具体用于根据所述Logistic算法模型的判别函数和所述关键指标因子数据,计算得到对应的映射值,并根据所述映射值确定企业财务风险情况。
进一步的,所述根据所述映射值确定企业财务风险情况,包括以下至少一项:
在所述映射值大于或等于0、且小于0.5时,确定所述企业财务高风险;
在所述映射值大于或等于0.5、且小于0.9时,确定所述企业财务中风险;
在所述映射值大于或等于0.9、且小于0.95时,确定所述企业财务低风险;
在所述映射值大于或等于0.95、且小于或等于1时,确定所述企业财务无风险。
其中,上述评估装置中各个模块的功能实现与上述评估方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如以上任一项实施例所述的企业财务风险的评估方法的步骤。
本发明计算机可读存储介质的具体实施例与上述企业财务风险的评估方法各实施例基本相同,在此不作赘述。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如以上任一项所述的企业财务风险的评估方法的步骤。
本发明计算机程序产品的具体实施例与上述企业财务风险的评估方法各实施例基本相同,在此不作赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明实施例提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明实施例提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种企业财务风险的评估方法,其特征在于,所述评估方法包括:
采集企业的原始财务数据,并根据所述原始财务数据计算对应的原始变量指标数据;
基于拉依达准则对所述原始变量指标数据进行异常值剔除和筛选,得到中间变量指标数据;
基于Factor算法对所述中间变量指标数据进行数据转换,得到关键指标因子数据;
通过Logistic算法模型对所述关键指标因子数据进行计算,并根据计算结果确定企业财务风险情况。
2.如权利要求1所述的评估方法,其特征在于,所述企业原始财务数据包括:流动资产、流动负债、资产总额、留存收益、息税前利润、权益市值、负债总额、营业收入、经营活动产生的现金流量净额、资产总额期末、资产总额期初、营业成本;
所述原始变量指标数据包括:流动性指标、收益性指标、杠杆性指标、偿债性指标、周转性指标、现金流指标、资产增长指标、盈利性指标。
3.如权利要求1所述的评估方法,其特征在于,所述基于拉依达准则对所述原始变量指标数据进行异常值剔除和筛选,得到中间变量指标数据的步骤,包括:
获取所述原始变量指标数据的实验标准偏差和平均值;
根据所述实验标准偏差和平均值确定所述原始变量指标数据中的异常值,并剔除所述异常值;
对剔除异常值后的原始变量指标数据进行Z-Score标准化,得到中间变量指标数据。
4.如权利要求1所述的评估方法,其特征在于,所述基于Factor算法对所述中间变量指标数据进行数据转换,得到关键指标因子数据的步骤,包括:
对所述中间变量指标数据进行标准化;
获取标准化的中间变量指标数据的协方差矩阵;
对所述协方差矩阵进行特征值分解,得到特征值,并根据所述特征值对应的特征值向量获取因子载荷矩阵,其中,所述因子载荷矩阵的元素数量由公共因子的累计方差贡献率确定;
基于回归法对所述因子载荷矩阵进行计算,获得公共因子向量;
基于所述标准化的中间变量、所述因子载荷矩阵和所述公共因子向量,获得关键指标因子数据。
5.如权利要求1所述的评估方法,其特征在于,所述Logistic算法模型是基于Logistic算法构建得到,所述通过Logistic算法模型对所述关键指标因子数据进行计算,并根据计算结果确定企业财务风险情况的步骤,包括:
根据所述Logistic算法模型的判别函数和所述关键指标因子数据,计算得到对应的映射值,并根据所述映射值确定企业财务风险情况。
6.如权利要求5所述的评估方法,其特征在于,所述根据所述映射值确定企业财务风险情况的步骤,包括以下至少一项:
在所述映射值大于或等于0、且小于0.5时,确定所述企业财务高风险;
在所述映射值大于或等于0.5、且小于0.9时,确定所述企业财务中风险;
在所述映射值大于或等于0.9、且小于0.95时,确定所述企业财务低风险;
在所述映射值大于或等于0.95、且小于或等于1时,确定所述企业财务无风险。
7.一种企业财务风险的评估装置,其特征在于,所述评估装置包括:
数据采集模块,用于采集企业的原始财务数据,并根据所述原始财务数据计算对应的原始变量指标数据;
预处理模块,用于基于拉依达准则对所述原始变量指标数据进行异常值剔除和筛选,得到中间变量指标数据;
数据转换模块,用于基于Factor算法对所述中间变量指标数据进行数据转换,得到关键指标因子数据;
Logistic算法计算模块,用于通过Logistic算法模型对所述关键指标因子数据进行计算,并根据计算结果确定企业财务风险情况。
8.一种企业财务风险的评估设备,其特征在于,所述评估设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的企业财务风险的评估方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的企业财务风险的评估方法的步骤。
CN202211201249.XA 2022-09-29 2022-09-29 企业财务风险的评估方法、装置、设备及存储介质 Pending CN115423594A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211201249.XA CN115423594A (zh) 2022-09-29 2022-09-29 企业财务风险的评估方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211201249.XA CN115423594A (zh) 2022-09-29 2022-09-29 企业财务风险的评估方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115423594A true CN115423594A (zh) 2022-12-02

Family

ID=84205226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211201249.XA Pending CN115423594A (zh) 2022-09-29 2022-09-29 企业财务风险的评估方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115423594A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117216801A (zh) * 2023-11-07 2023-12-12 江苏航运职业技术学院 一种基于人工智能的企业财务数据安全管理系统及方法
CN117217807A (zh) * 2023-11-08 2023-12-12 四川智筹科技有限公司 一种基于多模态高维特征的不良资产估值算法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117216801A (zh) * 2023-11-07 2023-12-12 江苏航运职业技术学院 一种基于人工智能的企业财务数据安全管理系统及方法
CN117217807A (zh) * 2023-11-08 2023-12-12 四川智筹科技有限公司 一种基于多模态高维特征的不良资产估值算法
CN117217807B (zh) * 2023-11-08 2024-01-26 四川智筹科技有限公司 一种基于多模态高维特征的不良资产估值方法

Similar Documents

Publication Publication Date Title
Thomas et al. Likelihood-free inference by ratio estimation
Wen et al. A generalized remaining useful life prediction method for complex systems based on composite health indicator
CN115423594A (zh) 企业财务风险的评估方法、装置、设备及存储介质
CN111738331A (zh) 用户分类方法及装置、计算机可读存储介质、电子设备
Doumpos et al. Preference disaggregation for multicriteria decision aiding: An overview and perspectives
CN114742520A (zh) 岗位匹配方法、装置、设备及存储介质
CN115374354A (zh) 基于机器学习的科技服务推荐方法、装置、设备及介质
CN114819777A (zh) 一种基于数字孪生技术的企业销售业务分析管理系统
CN110991247A (zh) 一种基于深度学习与nca融合的电子元器件识别方法
Stødle et al. Data‐driven predictive modeling in risk assessment: Challenges and directions for proper uncertainty representation
CN117495094A (zh) 一种产业链安全风险综合评估预警方法与系统
CN113281229A (zh) 一种基于小样本下多模型自适应大气pm2.5浓度预测方法
Fang et al. Building a cross-border e-commerce talent training platform based on logistic regression model
CN116702005A (zh) 一种基于神经网络的数据异常诊断方法和电子设备
CN114372835B (zh) 综合能源服务潜力客户识别方法、系统及计算机设备
Feng Data analysis and prediction modeling based on deep learning in E-commerce
Dessureault et al. Explainable global error weighted on feature importance: The xGEWFI metric to evaluate the error of data imputation and data augmentation
CN113010687B (zh) 一种习题标签预测方法、装置、存储介质以及计算机设备
Dhar et al. Quantitative rainfall prediction: deep neural network-based approach
CN113935413A (zh) 一种基于卷积神经网的配网录波文件波形识别方法
CN117875684A (zh) 企业质量风险的评估方法、装置、设备及存储介质
Begum et al. Software Defects Identification: Results Using Machine Learning and Explainable Artificial Intelligence Techniques
Nsofor Comparative analysis of predictive data-mining techniques
CN112991025A (zh) 一种保险智能推荐方法、系统、设备及计算机可读存储介质
Shahoud et al. Incorporating unsupervised deep learning into meta learning for energy time series forecasting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination