CN118014719B - 一种基于线性回归模型的企业信用智能分析方法和系统 - Google Patents
一种基于线性回归模型的企业信用智能分析方法和系统 Download PDFInfo
- Publication number
- CN118014719B CN118014719B CN202410411429.3A CN202410411429A CN118014719B CN 118014719 B CN118014719 B CN 118014719B CN 202410411429 A CN202410411429 A CN 202410411429A CN 118014719 B CN118014719 B CN 118014719B
- Authority
- CN
- China
- Prior art keywords
- credit
- enterprise
- index
- value
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 76
- 238000012417 linear regression Methods 0.000 title claims abstract description 59
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 238000000034 method Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims abstract description 8
- 238000011161 development Methods 0.000 claims description 15
- 238000007726 management method Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000011156 evaluation Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 7
- 238000012300 Sequence Analysis Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 238000013480 data collection Methods 0.000 claims description 6
- 238000013500 data storage Methods 0.000 claims description 6
- 230000004069 differentiation Effects 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000012821 model calculation Methods 0.000 claims description 3
- 238000013112 stability test Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007306 turnover Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2123/00—Data types
- G06F2123/02—Data types in the time domain, e.g. time-series data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及企业信用分析的技术领域,公开了一种基于线性回归模型的企业信用智能分析方法和系统,该方法包括以下步骤:S1:收集企业数据并进行数据预处理;S2:基于所述企业数据对二级信用指标赋值;S3:对所述二级信用指标进行重要性分析;S4:训练多输出线性回归模型,计算一级信用指标的取值;S5:建立每个一级信用指标的时间序列;S6:计算每个一级信用指标的预测值;S7:计算企业的信用得分和信用得分的预测值。本发明能够综合考虑企业的多个方面,以数据为基础对每种指标的权重分析,避免主观因素对信用分析的影响,从而更全面地评估企业的信用状况。
Description
技术领域
本发明涉及企业信用分析的技术领域,具体涉及一种基于线性回归模型的企业信用智能分析方法和系统。
背景技术
企业信用分析是评估企业按照合同如期履行义务的意愿和能力,进行企业信用分析的目的在于评估企业的违约风险大小。当下的企业信用主观分析方法虽然综合了多方分析结果,但主观性较强且受分析师个人影响较大,耗费大量人力物力,且不能及时反映企业信用水平。而现有的算法分析方法虽然实时性强,成本较低,但不能完全替代专家知识,对定性信息的理解也不充分,未来尚有很大的发展空间。现有的应用于企业信用分析的多元线性回归模型操作简单,易于理解,但该类模型大部分都是基于变量间有明显的线性关系的假设,适用范围受到了限制,对影响企业信用的各因素之间的相互关系处理过于简单,缺乏科学性和准确性。企业信用与其影响因素之间不是简单的线性关系,企业的信用受企业自身、所处行业、银行资金、市场经济大环境等多种因素共同影响,导致模型实际评估效果不佳。此外,对于企业的信用的分析主要基于静态的数据,对于企业的信用发展趋势的评价相对缺失,难以准确捕捉到企业经营状况的周期性波动和趋势走向。
如申请公开号为CN116308744A的专利公开了一种企业信用数据分析处理方法及装置,通过从第三方数据商服务器中获取第一分析数据,并对该第一分析数据进行数据处理,得到第二分析数据;再基于朴素贝叶斯模型进行学习率优化,得到企业信用模型后,将第二分析数据发送至该企业信用模型,确定该企业信用,解决现有技术中模型输出难以解释、模型分析结果准确度较低的问题。
如申请公开号为CN116628206A的专利公开了一种基于数据分析的企业信用分析管理系统,包括数据抓取模块、企业信息数据库和报告输出模块,还包括自身信用分析模块、社会信用分析模块、综合分析模块和关键词特征数据库。通过对企业自身信用度和社会信用度进行分析,反映了企业的管理水平和社会责任感,进一步巩固了企业信用意识,并且在此基础上对企业信用进行综合分析,更全面的评估了企业信用,改变了传统企业信用评估的单一性,使得企业信用评估的受众群体更广,能够为投资者、供应商、客户、求职者等多角色提供更全面、更准确的企业信用信息,很大程度上提升了企业信用评估的公信力。
以上专利都存在本背景技术提出的问题:对影响企业信用的各因素之间的相互关系处理过于简单,缺乏科学性和准确性;缺乏对信用的发展变化趋势的分析。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域普通技术人员所公知的现有技术。
发明内容
本发明所要解决的技术问题是克服现有技术的缺陷,提供一种基于线性回归模型的企业信用智能分析方法和系统,综合考虑企业的多个方面,以数据为基础对每种指标的权重分析,避免主观因素对信用分析的影响,从而更全面地评估企业的信用状况。
为解决上述技术问题,本发明提供如下技术方案:
一方面,本发明提供一种基于线性回归模型的企业信用智能分析方法,包括以下步骤:
S1:收集企业数据并进行数据预处理,并按时间将所述企业数据划分为不同的数据集;
S2:基于所述企业数据对二级信用指标赋值;
S3:对所述二级信用指标进行重要性分析,为每个二级信用指标分配初始权重;
S4:训练多输出线性回归模型;输入二级信用指标的取值和对应的初始权重,计算一级信用指标的取值;
S5:将根据每个数据集计算的一级信用指标按时间排序,建立每个一级信用指标的时间序列;
S6:基于所述一级信用指标的时间序列,计算每个一级信用指标的预测值;
S7:基于所述一级信用指标的时间序列和预测值,计算企业的信用得分和信用得分的预测值。
作为本发明所述基于线性回归模型的企业信用智能分析方法的一种优选方案,其中:所述一级信用指标包括偿债能力、发展能力、企业规模、盈利能力、经营能力、创新能力、企业素质。
作为本发明所述基于线性回归模型的企业信用智能分析方法的一种优选方案,其中:所述初始权重的计算公式如下:
;
其中,表示第i个二级信用指标对第j个一级信用指标的初始权重;i的取值范围
为1,2,……m,m为二级信用指标的个数;j的取值范围为1,2,……n,n为一级信用指标的个
数;为第k个样本的第i个二级信用指标的取值;k的取值范围为1,2,……p,p为样本个数;表示p个样本中的平均值;为第k个样本的第j个一级信用指标的取值;表示p个样
本中的平均值。
作为本发明所述基于线性回归模型的企业信用智能分析方法的一种优选方案,其中:所述多输出线性回归模型的方程如下:
;
其中,Y为n维向量,表示各个一级信用指标的取值,形式如下:
;
其中,,,,,分别表示第1,2,……n个一级信用指标;
W为m·n的矩阵,表示各个二级信用指标对各个一级信用指标的权重值,形式如下:
W=;
其中,表示第i个二级信用指标对第j个一级信用指标的权重;
X为m维向量,表示各个二级信用指标的取值,形式如下:
;
其中,,,,,分别表示第1,2,……m个二级信用指标;
ε为n维向量,表示模型的误差项,形式如下:
;
其中,,,,,分别表示第1,2,……n个一级信用指标的误差项。
作为本发明所述基于线性回归模型的企业信用智能分析方法的一种优选方案,其中:训练所述多输出线性回归模型采用的损失函数计算公式如下:
;
其中,表示第j个一级信用指标的模型计算值;表示第j个一级信用指标的实
际参考值;α为正则系数,q为混合参数。
作为本发明所述基于线性回归模型的企业信用智能分析方法的一种优选方案,其中:所述计算每个一级信用指标的预测值的方法如下:
建立每种一级信用指标的时间序列,形式如下:
;
其中,表示第j种一级信用指标的时间序列,,,,分别表示第1,
2,……,t时刻的一级信用指标的取值;t为时间序列中一级信用指标的最大个数;
对进行平稳性检验,确定差分阶数d;记录进行d次差分后平稳的的时间序列,
形式如下:
;
其中,表示经过d次差分后的时间序列;,,……,,分别表示,,,经过d次差分后的取值;
确定时间序列预测模型的滞后阶数,并进行参数估计;
所述时间序列预测模型的方程如下:
;
其中,为时间序列的第r个元素;c为常参数;为自回归参数,i的取值范
围为1,2,……,u;为滑动平均参数,k的取值范围为1,2,……,v;,……,,为误
差项;
应用完成参数估计的时间序列预测模型,输入每种一级信用指标的时间序列,计算输出每种一级信用指标的预测值。
作为本发明所述基于线性回归模型的企业信用智能分析方法的一种优选方案,其中:所述信用得分的计算公式如下:
;
其中,F为企业的信用得分;,,为权重系数;表示一级信用指标偿债能力
的取值;表示一级信用指标发展能力的取值;表示一级信用指标企业规模的取值;
表示一级信用指标盈利能力的取值;表示一级信用指标经营能力的取值;表示一级信
用指标创新能力的取值;表示一级信用指标企业素质的取值。
作为本发明所述基于线性回归模型的企业信用智能分析方法的一种优选方案,其中:所述信用得分的预测值的计算方法为记录每种一级信用指标的预测值,并采用信用得分的计算公式进行计算。
作为本发明所述基于线性回归模型的企业信用智能分析方法的一种优选方案,其中:所述训练多输出线性回归模型时首先对权重矩阵W进行初始化,初始化公式如下:
。
第二方面,本发明提供一种基于线性回归模型的企业信用智能分析系统,包括数据收集模块、预处理模块、数据存储模块、指标赋值模块、线性回归模块、时序分析模块、信用分析模块、展示管理模块;其中:
数据收集模块用于从不同渠道收集企业数据;
预处理模块用于对企业数据进行预处理;
数据存储模块用于存储企业数据;
指标赋值模块用于对二级信用指标进行计算和赋值;
线性回归模块用于计算一级信用指标的取值;
时序分析模块用于计算每个一级信用指标的预测值;
信用分析模块用于计算企业的信用得分以及信用得分的预测值;
展示管理模块用于展示企业信用报告、图表,以及企业信用评估结果的管理。
第三方面,本发明提供一种电子设备,包括:存储器,用于存储指令;处理器,用于执行所述指令,使得所述设备执行实现本发明所述的一种基于线性回归模型的企业信用智能分析方法的操作。
第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现本发明所述的一种基于线性回归模型的企业信用智能分析方法。
与现有技术相比,本发明所达到的有益效果如下:
结合一级信用指标的赋值和权重分析,可以综合考虑企业的多个方面,包括财务状况、经营状况、行业竞争力等,从而更全面地评估企业的信用状况;以数据为基础对每种指标的权重分析,避免了主观因素对信用分析的影响;通过时间序列特征帮助识别和捕捉企业信用状况的趋势变化,相较于传统方法依赖经验规则或简单的加权平均,本申请提出的方案更客观、科学,可以提供更全面、准确的信用评估结果。
通过训练多输出线性回归模型,准确地预测二级信用指标的取值,基于二级信用指标计算企业的信用得分,并根据得分划定信用等级,提高了信用分析的预测精度和准确性,能够帮助金融从业者规避风险,为投资人和合伙人提供客观公正的信用信息,减小了企业的经营管理压力,并有助于提升经济管理部门对企业的监管能力。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明提供的基于线性回归模型的企业信用智能分析方法的流程图;
图2为本发明提供的企业数据处理的方法示意图;
图3为本发明提供的基于线性回归模型的企业信用智能分析系统的结构示意图。
具体实施方式
下面通过附图以及具体实施例对本发明技术方案做详细地说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。
实施例1
本实施例介绍一种基于线性回归模型的企业信用智能分析方法,参照图1,该方法包括以下步骤:
S1:收集企业数据并进行数据预处理,并按时间将所述企业数据划分为不同的数据集;
所述企业数据包括企业基本信息、财务信息、行业现状。
所述预处理包括处理缺失值、异常值和重复值。
按企业数据对应的时间范围将其划分为不同的数据集,每个数据集对应一个月的企业数据。
S2:基于所述企业数据对二级信用指标赋值;
二级信用指标包括资产负债率、利息保障倍数、营业利润率、总资产周转率、流动资产周转率、总资产增长率、资本增长率、利润增长率、总资产、总现金流、权益总额、资本支出总额、市值、总交易量、债务总额、息税前收益、税后收入、净利润增长、净资产销售额、总资产销售额、流动比率、速动比率、现金比率、权益乘数、产权比率、资本保值增长率、营业利润增长率、营业收入增长率、资产报酬率、净资产收益率、研发人员数量占比、研发投入占比、高学历员工占比;
S3:对所述二级信用指标进行重要性分析,为每个二级信用指标分配初始权重;
重要性分析指每个二级信用指标对每个一级信用指标的重要性。所述一级信用指标包括偿债能力、发展能力、企业规模、盈利能力、经营能力、创新能力、企业素质。
所述初始权重的计算公式如下:
;
其中,表示第i个二级信用指标对第j个一级信用指标的初始权重;i的取值范围
为1,2,……m,m为二级信用指标的个数;j的取值范围为1,2,……n,n为一级信用指标的个
数;为第k个样本的第i个二级信用指标的取值;k的取值范围为1,2,……p,p为样本个数;表示p个样本中的平均值;为第k个样本的第j个一级信用指标的取值;表示p个样
本中的平均值。
S4:训练多输出线性回归模型;输入二级信用指标的取值和对应的初始权重,计算一级信用指标的取值;
所述多输出线性回归模型的方程如下:
;
其中,Y为n维向量,表示各个一级信用指标的取值,形式如下:
;
其中,,,,,分别表示第1,2,……n个一级信用指标;
W为m·n的矩阵,表示各个二级信用指标对各个一级信用指标的权重值,形式如下:
W=;
其中,表示第i个二级信用指标对第j个一级信用指标的权重;
X为m维向量,表示各个二级信用指标的取值,形式如下:
;
其中,,,,,分别表示第1,2,……m个二级信用指标;
ε为n维向量,表示模型的误差项,形式如下:
;
其中,,,,,分别表示第1,2,……n个一级信用指标的误差项。
训练多输出线性回归模型时首先对权重矩阵W进行初始化,初始化公式如下:
。
训练所述多输出线性回归模型采用的损失函数计算公式如下:
;
其中,表示第j个一级信用指标的模型计算值;表示第j个一级信用指标的实
际参考值;α为正则系数,q为混合参数。
所述一级信用指标的实际参考值由专家打分来确定。
S5:将根据每个数据集计算的一级信用指标按时间排序,建立每个一级信用指标的时间序列;
S6:基于所述一级信用指标的时间序列,计算每个一级信用指标的预测值;方法如下:
建立每种一级信用指标的时间序列,形式如下:
;
其中,表示第j种一级信用指标的时间序列,,,,分别表示第1,
2,……,t时刻的一级信用指标的取值;t为时间序列中一级信用指标的最大个数;
对进行平稳性检验,确定差分阶数d;记录进行d次差分后平稳的的时间序列,
形式如下:
;
其中,表示经过d次差分后的时间序列;,,……,,分别表示,,,经过d次差分后的取值;
确定时间序列预测模型的滞后阶数,并进行参数估计;
所述时间序列预测模型的方程如下:
;
其中,为时间序列的第r个元素;c为常参数;为自回归参数,i的取值范
围为1,2,……,u;为滑动平均参数,k的取值范围为1,2,……,v;,……,,为误
差项;
待估计的参数包括常参数c,自回归参数,滑动平均参数,误差项;
应用完成参数估计的时间序列预测模型,输入每种一级信用指标的时间序列,计算输出每种一级信用指标的预测值。
S7:基于所述以及信用指标的时间序列和预测值,计算企业的信用得分和信用得分的预测值。
所述信用得分的计算公式如下:
;
其中,F为企业的信用得分;,,为权重系数;表示一级信用指标偿债能力
的取值;表示一级信用指标发展能力的取值;表示一级信用指标企业规模的取值;
表示一级信用指标盈利能力的取值;表示一级信用指标经营能力的取值;表示一级信
用指标创新能力的取值;表示一级信用指标企业素质的取值。
所述信用得分的预测值的计算方法为记录每种一级信用指标的预测值,并采用信用得分的计算公式进行计算。上述对企业数据进行逐步处理,最终得到企业信用得分和企业信用得分预测值的数据处理过程如图2所示。
/表示企业在具有一定规模的情况下,其偿债能力的表现如何。规模越大,其
应对风险的能力相应也需要更强。·/表示企业在具有一定素质的情况下,其发展
能力和盈利能力的表现如何。/表示企业在具有一定创新能力的情况下,其经营能力的
表现如何。在创新能力的支撑下,企业可以通过技术创新、产品创新等手段提高市场占有率
和盈利能力。这样的计算可以使信用得分更加符合实际情况,反映企业发展过程中的内在
关联和相互作用。
偿债能力对企业的稳定性和可持续发展至关重要,因此设置为较高的0.5。发展
能力和盈利能力对企业的长期发展和竞争力有较大影响,设置为0.3。本实施例中设置
为0.2。可以根据行业创新能力的重要性进行调整,如果创新能力对企业的竞争优势具有重
要作用,在满足的条件下,可以适当增加的权重。
实施例2
本实施例为本发明的第二个实施例;与实施例1基于相同的发明构思,参照图3,本实施例介绍一种基于线性回归模型的企业信用智能分析系统,包括:数据收集模块、预处理模块、数据存储模块、指标赋值模块、线性回归模块、时序分析模块、信用分析模块、展示管理模块;其中:
数据收集模块用于从不同渠道收集企业数据;
预处理模块用于对企业数据进行预处理,包括数据清洗、去除异常值、填补缺失值,确保数据的准确性和完整性;
数据存储模块用于存储企业数据,通过数据库确保数据的安全性和可靠性;
指标赋值模块基于经过预处理的企业数据,对二级信用指标进行计算和赋值;
线性回归模块对每个二级信用指标进行重要性分析,为每个二级信用指标分配初始权重,以反映其在一级信用指标评估中的相对重要性;基于二级信用指标的取值和对应的初始权重,计算一级信用指标的取值;
时序分析模块用于将一级信用指标按时间排序,建立每个一级信用指标的时间序列,以反映企业信用指标的历史变化趋势;基于一级信用指标的时间序列,计算每个一级信用指标的预测值,用于预测企业未来的信用表现;
信用分析模块用于综合考虑各个一级信用指标的权重,计算企业的信用得分,并预测企业未来的信用得分,以提供对企业信用状况的评估和预测结果;
展示管理模块提供以下功能:
企业信用报告展示:根据企业的信用评估结果,生成信用报告并展示;
可视化展示:通过图表等可视化方式,直观地展示企业信用指标的历史变化趋势和预测结果,帮助更好地理解和分析企业信用情况;
查询和筛选功能:可以根据不同的条件搜索和筛选特定企业的信用评估结果,方便进行信息检索和比较分析;
审核和管理功能:管理员可以对企业信用评估结果进行审核和管理,包括修改、删除、导出等操作,确保数据的安全性、准确性和完整性。
上述各模块的具体功能实现参考实施例1所述的基于线性回归模型的企业信用智能分析方法中的相关内容,不予赘述。
实施例3
与其它实施例基于相同的发明构思,本实施例介绍一种电子设备,包括存储器和处理器,存储器用于存储指令,处理器用于执行该指令,使得计算机设备执行实现上述各实施例所提供的基于线性回归模型的企业信用智能分析方法。
由于本实施例所介绍的电子设备为实施本申请实施例中基于线性回归模型的企业信用智能分析方法所采用的电子设备,故而基于本申请实施例中所介绍的基于线性回归模型的企业信用智能分析方法,本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式,所以在此对于该电子设备如何实现本申请实施例中的方法不再详细介绍。只要本领域所属技术人员实施本申请实施例中基于线性回归模型的企业信用智能分析方法所采用的电子设备,都属于本申请所欲保护的范围。
实施例4
与其它实施例基于相同的发明构思,本实施例介绍一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现上述各实施例所提供的基于线性回归模型的企业信用智能分析方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (10)
1.一种基于线性回归模型的企业信用智能分析方法,其特征在于:包括以下步骤:
S1:收集企业数据并进行数据预处理,并按时间将所述企业数据划分为不同的数据集;
S2:基于所述企业数据对二级信用指标赋值;
S3:对所述二级信用指标进行重要性分析,为每个二级信用指标分配初始权重;
S4:训练多输出线性回归模型;输入二级信用指标的取值和对应的初始权重,计算一级信用指标的取值;
所述多输出线性回归模型的方程如下:
;
其中,Y为n维向量,表示各个一级信用指标的取值,形式如下:
;
其中,,,,,分别表示第1,2,……n个一级信用指标;
W为m·n的矩阵,表示各个二级信用指标对各个一级信用指标的权重值,形式如下:
;
其中,表示第i个二级信用指标对第j个一级信用指标的权重;
X为m维向量,表示各个二级信用指标的取值,形式如下:
;
其中,,,,,分别表示第1,2,……m个二级信用指标;
ε为n维向量,表示模型的误差项,形式如下:
;
其中,,,,,分别表示第1,2,……n个一级信用指标的误差项;
S5:将根据每个数据集计算的一级信用指标按时间排序,建立每个一级信用指标的时间序列;
S6:基于所述一级信用指标的时间序列,计算每个一级信用指标的预测值;方法如下:
建立每种一级信用指标的时间序列,形式如下:
;
其中,表示第j种一级信用指标的时间序列,,,,分别表示第1,2,……,t时刻的一级信用指标的取值;t为时间序列中一级信用指标的最大个数;
对进行平稳性检验,确定差分阶数d;记录进行d次差分后平稳的的时间序列,形式如下:
;
其中,表示经过d次差分后的时间序列;,,……,,分别表示,,,经过d次差分后的取值;
确定时间序列预测模型的滞后阶数,并进行参数估计;
所述时间序列预测模型的方程如下:
;
其中,为时间序列的第r个元素;c为常参数;为自回归参数,i的取值范围为1,2,……,u;为滑动平均参数,k的取值范围为1,2,……,v;,……,,为误差项;
应用完成参数估计的时间序列预测模型,输入每种一级信用指标的时间序列,计算输出每种一级信用指标的预测值;
S7:基于所述一级信用指标的时间序列和预测值,计算企业的信用得分和信用得分的预测值。
2.如权利要求1所述的一种基于线性回归模型的企业信用智能分析方法,其特征在于:所述一级信用指标包括偿债能力、发展能力、企业规模、盈利能力、经营能力、创新能力、企业素质。
3.如权利要求2所述的一种基于线性回归模型的企业信用智能分析方法,其特征在于:所述初始权重的计算公式如下:
;
其中,表示第i个二级信用指标对第j个一级信用指标的初始权重;i的取值范围为1,2,……m,m为二级信用指标的个数;j的取值范围为1,2,……n,n为一级信用指标的个数;为第k个样本的第i个二级信用指标的取值;k的取值范围为1,2,……p,p为样本个数;表示p个样本中的平均值;为第k个样本的第j个一级信用指标的取值;表示p个样本中的平均值。
4.如权利要求3所述的一种基于线性回归模型的企业信用智能分析方法,其特征在于:训练所述多输出线性回归模型采用的损失函数计算公式如下:
;
其中,表示第j个一级信用指标的模型计算值;表示第j个一级信用指标的实际参考值;α为正则系数,q为混合参数。
5.如权利要求4所述的一种基于线性回归模型的企业信用智能分析方法,其特征在于:所述信用得分的计算公式如下:
;
其中,F为企业的信用得分;,,为权重系数;表示一级信用指标偿债能力的取值;表示一级信用指标发展能力的取值;表示一级信用指标企业规模的取值;表示一级信用指标盈利能力的取值;表示一级信用指标经营能力的取值;表示一级信用指标创新能力的取值;表示一级信用指标企业素质的取值。
6.如权利要求5所述的一种基于线性回归模型的企业信用智能分析方法,其特征在于:所述信用得分的预测值的计算方法为记录每种一级信用指标的预测值,并采用信用得分的计算公式进行计算。
7.如权利要求6所述的一种基于线性回归模型的企业信用智能分析方法,其特征在于:所述训练多输出线性回归模型时首先对权重矩阵W进行初始化,初始化公式如下:
。
8.一种基于线性回归模型的企业信用智能分析系统,基于权利要求1-7中任一项所述的一种基于线性回归模型的企业信用智能分析方法实现,其特征在于:包括数据收集模块、预处理模块、数据存储模块、指标赋值模块、线性回归模块、时序分析模块、信用分析模块、展示管理模块;其中:
数据收集模块用于从不同渠道收集企业数据;
预处理模块用于对企业数据进行预处理;
数据存储模块用于存储企业数据;
指标赋值模块用于对二级信用指标进行计算和赋值;
线性回归模块用于计算一级信用指标的取值;
时序分析模块用于计算每个一级信用指标的预测值;
信用分析模块用于计算企业的信用得分以及信用得分的预测值;
展示管理模块用于展示企业信用报告、图表,以及企业信用评估结果的管理。
9.一种电子设备,其特征在于,包括:存储器,用于存储指令;处理器,用于执行所述指令,使得所述设备执行实现如权利要求1-7中任一项所述的一种基于线性回归模型的企业信用智能分析方法的操作。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时,实现如权利要求1-7中任一项所述的一种基于线性回归模型的企业信用智能分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410411429.3A CN118014719B (zh) | 2024-04-08 | 2024-04-08 | 一种基于线性回归模型的企业信用智能分析方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410411429.3A CN118014719B (zh) | 2024-04-08 | 2024-04-08 | 一种基于线性回归模型的企业信用智能分析方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN118014719A CN118014719A (zh) | 2024-05-10 |
CN118014719B true CN118014719B (zh) | 2024-08-16 |
Family
ID=90954834
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410411429.3A Active CN118014719B (zh) | 2024-04-08 | 2024-04-08 | 一种基于线性回归模型的企业信用智能分析方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118014719B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107437151A (zh) * | 2017-08-08 | 2017-12-05 | 惠国征信服务股份有限公司 | 企业信用评级方法 |
CN107507076A (zh) * | 2017-09-26 | 2017-12-22 | 贵州电网有限责任公司 | 基于数据挖掘的电力客户的综合评级的方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110083802B (zh) * | 2019-04-12 | 2022-05-03 | 重庆邮电大学 | 基于多目标回归的高速公路收费站车流量大数据预测方法 |
JP2022173863A (ja) * | 2021-05-10 | 2022-11-22 | 株式会社東芝 | モジュラー型時系列データ予測装置、モジュラー型時系列データ予測方法、および、プログラム |
CN113537807B (zh) * | 2021-07-27 | 2024-01-23 | 天元大数据信用管理有限公司 | 一种企业智慧风控方法及设备 |
CN113674087A (zh) * | 2021-08-19 | 2021-11-19 | 工银科技有限公司 | 企业信用等级评定方法、装置、电子设备和介质 |
-
2024
- 2024-04-08 CN CN202410411429.3A patent/CN118014719B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107437151A (zh) * | 2017-08-08 | 2017-12-05 | 惠国征信服务股份有限公司 | 企业信用评级方法 |
CN107507076A (zh) * | 2017-09-26 | 2017-12-22 | 贵州电网有限责任公司 | 基于数据挖掘的电力客户的综合评级的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN118014719A (zh) | 2024-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Amani et al. | Data mining applications in accounting: A review of the literature and organizing framework | |
Engelmann et al. | The Basel II risk parameters: estimation, validation, and stress testing | |
Sun | A re-evaluation of auditors’ opinions versus statistical models in bankruptcy prediction | |
Collard-Wexler et al. | Productivity volatility and the misallocation of resources in developing economies | |
KR102009309B1 (ko) | 금융상품 관리자동화 시스템 및 관리자동화 방법 | |
WO2007106786A2 (en) | Methods and systems for multi-credit reporting agency data modeling | |
CN110738527A (zh) | 一种特征重要性排序方法、装置、设备和存储介质 | |
Nasir et al. | Developing a decision support system to detect material weaknesses in internal control | |
Wihartati et al. | Decision Support System for Share Investment Using The Capital Assetpricing Method (CAPM) | |
CN112053233A (zh) | 基于gra的动态中小企业信用评分方法及系统 | |
Asker et al. | Productivity volatility and the misallocation of resources in developing economies | |
US11995667B2 (en) | Systems and methods for business analytics model scoring and selection | |
CN107133862A (zh) | 动态产生增强信用评估的详细交易支付经历的方法和系统 | |
Soheyli et al. | The relationship between components of intellectual capital and performance of Yazd Tile Companies | |
US20210056625A1 (en) | Artificial intelligence and machine learning in a clustering processes to develop a utility model for asset allocation and automated rebalancing of exchange traded funds | |
CN117114812A (zh) | 一种针对企业的金融产品推荐方法及装置 | |
CN118014719B (zh) | 一种基于线性回归模型的企业信用智能分析方法和系统 | |
De Marco et al. | A framework methodology for selection of risk analysis techniques in construction projects | |
CA3160715A1 (en) | Systems and methods for business analytics model scoring and selection | |
US11004156B2 (en) | Method and system for predicting and indexing probability of financial stress | |
WO2015191592A1 (en) | System and method for generating descriptive measures that assesses the financial health of a business | |
Greberg et al. | Using Gradient Boosting to Identify Pricing Errors in GLM-Based Tariffs for Non-life Insurance | |
Yan et al. | The Research in Credit Risk of Micro and Small Companies with Linear Regression Model | |
US20240113936A1 (en) | Method and system for artificial intelligence-based acceleration of zero-touch processing | |
CN117520624B (zh) | 一种大数据指标的配置与计算的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |