CN117541412A - 一种基于数据处理的财务成本挖掘与分析方法及系统 - Google Patents

一种基于数据处理的财务成本挖掘与分析方法及系统 Download PDF

Info

Publication number
CN117541412A
CN117541412A CN202311481578.9A CN202311481578A CN117541412A CN 117541412 A CN117541412 A CN 117541412A CN 202311481578 A CN202311481578 A CN 202311481578A CN 117541412 A CN117541412 A CN 117541412A
Authority
CN
China
Prior art keywords
cost
implicit
dominant
enterprise
costs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311481578.9A
Other languages
English (en)
Inventor
花鲜美
占欣荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Institute of Technology
Original Assignee
Xiamen Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Institute of Technology filed Critical Xiamen Institute of Technology
Priority to CN202311481578.9A priority Critical patent/CN117541412A/zh
Publication of CN117541412A publication Critical patent/CN117541412A/zh
Pending legal-status Critical Current

Links

Abstract

一种基于数据处理的财务成本挖掘与分析方法及系统,包括:获取已知企业的历史数据;对每一已知企业的每一项隐性成本使用主成分分析,确定出与每一项隐性成本相关的N项显性成本;将每一已知企业的每一项隐性成本与其对应的N项显性成本拟合成隐性‑显性函数;将显性成本相似度大于第一阈值,并且显性成本相似度最大的已知企业隐性‑显性函数确定为待分析企业相应隐性成本的隐性‑显性函数;根据隐性‑显性函数计算待分析企业的每一项隐性成本。通过上述方案基于历史数据的处理,使用历史数据分析出隐性成本,方案无需人工决策,便于计算机实现。

Description

一种基于数据处理的财务成本挖掘与分析方法及系统
技术领域
本发明涉及大数据分析与处理领域,具体而言涉及一种基于数据处理的财务成本挖掘与分析方法及系统。
背景技术
财务成本是指企业或个人在经营活动中所发生的各项成本支出,通常以货币形式表示。这些成本可以分为两类:显性成本和隐性成本。
显性成本是企业或个人在经营活动中直接支付的费用,是可以在财务报表中明确记录的。常见的显性成本包括:原材料和库存的购买成本、工资和薪水、租金和房屋抵押贷款、设备和机器的购买和维护费用、营销和广告费用、利息支出、税费(例如所得税和销售税)
隐性成本是企业或个人在经营活动中产生的,但不容易直接量化或在财务报表中反映出来的成本。隐性成本通常是机会成本或潜在成本,包括但不限于:停工和故障成本:由于设备故障或工作中断而导致的损失。不稳定的生产效率:生产线停工或产能利用率下降所带来的效率损失。不稳定的良品率:由于各种内外部原因导致产品良品率下降带来的损失。高员工离职率:导致培训和招聘成本增加,以及员工减少的生产力。
现有技术中显性成本成本通常可以通过计算机程序分析企业的财务报表数据、生产经营数据得出。然而隐性成本由于不直接到现有的财务指标相关联,通常通过人工进行分析和挖掘,难以通过计算机实现自动分析,需要付出较多的人力劳力。
发明内容
为解决上述技术问题,本发明公开了一种基于数据处理的财务成本挖掘与分析方法及系统,通过分析现有的财务数据,基于已有数据对财务成本挖掘与分析,方便使用计算机自动实现财务成本挖掘与分析。
在本发明的一个方面,提供一种基于数据处理的财务成本挖掘与分析方法,其特征在于:获取已知企业的历史数据,所述已知企业为已知显性成本、隐性成本的企业,所述历史数据包括历年显性成本、隐性成本;对每一已知企业的每一项隐性成本使用主成分分析,确定出与每一项隐性成本相关的N项显性成本,其中N为不小于4的正整数;将每一已知企业的每一项隐性成本与其对应的N项显性成本拟合成隐性-显性函数;根据每一已知企业的每一项隐性成本对应的N项显性成本获取待分析企业对应的N项显性成本,并计算相应数据的显性成本相似度;对于每一项隐性成本,将显性成本相似度大于第一阈值,并且显性成本相似度最大的已知企业隐性-显性函数确定为待分析企业相应隐性成本的隐性-显性函数;根据隐性-显性函数计算待分析企业的每一项隐性成本。
进一步地,使用FastPCA算法进行主成份分析。
进一步地,采用多项式回归拟合成隐性-显性函数。
进一步地,采用皮尔逊相关系数计算显性成本相似度。
进一步地,所述第一阈值为0.9。
本发明另一个方面还提供一种基于数据处理的财务成本挖掘与分析系统,其特征在于所述系统包括如下模块:数据库模块,用于获取已知企业的历史数据,所述已知企业为已知显性成本、隐性成本的企业,所述历史数据包括历年显性成本、隐性成本;分析模块,用于对每一已知企业的每一项隐性成本使用主成分分析,确定出与每一项隐性成本相关的N项显性成本,其中N为不小于4的正整数;拟合模块,用于将每一已知企业的每一项隐性成本与其对应的N项显性成本拟合成隐性-显性函数;计算模块,用于根据每一已知企业的每一项隐性成本对应的N项显性成本获取待分析企业对应的N项显性成本,并计算相应数据的显性成本相似度;确定模块,用于对于每一项隐性成本,将显性成本相似度大于第一阈值,并且显性成本相似度最大的已知企业隐性-显性函数确定为待分析企业相应隐性成本的隐性-显性函数;挖掘模块,用于根据隐性-显性函数计算待分析企业的每一项隐性成本。
进一步地,使用FastPCA算法进行主成份分析。
进一步地,采用多项式回归拟合成隐性-显性函数。
进一步地,采用皮尔逊相关系数计算显性成本相似度。
进一步地,所述第一阈值为0.9。
本发明通过上述技术方案,可以产生如下有益效果:
通过历史数据分析出隐性成本与显性成本的相关关系,并将隐性成本与显示成本拟合成函数,通过待分析企业与已知企业的显性成本组的相似性确定出待分析企业的隐性成本函数,从而挖掘出待分析企业的隐性成本数据,上述方法去除了人为干扰因素,因此可全部由计算机程序实现,从而提高了隐性成本挖掘的自动性和挖掘效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明方法的流程图。
具体实施方式
下面,结合附图以及具体实施方式,对发明做出优选的描述。
本实施例通过如下步骤解决上术问题:
在一个实施例中,参考图1,本发明提供一种基于数据处理的财务成本挖掘与分析方法具体包括:
获取已知企业的历史数据,所述已知企业为已知显性成本、隐性成本的企业,所述历史数据包括历年显性成本、隐性成本。
获取已知企业的历史数据,是指从现有的数据库中获取已知显性成本、隐性成本的企业的数据。通常,企业的历史财务数据可以通过其财务报表、年度报告或公开的财务信息获得。隐性成本通常不会在财务报表上直接体现,需要通过企业自身的内部管理信息或经过调研和分析来评估和估计。隐性成本数据,可通过与相关企业进行协商获取,还可通过商业数据服务商处获得。一切通过合法渠道获取相关数据方法均可实现本实施例,本发明不做特别限定。
需要指出的是,在获取和使用企业数据时,要遵守相关法律法规和数据隐私政策,确保合法合规处理和保存相关数据。
所述历史数据包括历年显性成本、隐性成本,例如,获取某企业近20年的显性成本、隐性成本数据,财务数据通常以季度公布,因此为了后续拟合的准确性,本实施例优选使用以季度组织的显性成本、隐性成本数据。
进一步地,为了统一处理,还需要将数据进行统一尺度以及统一归类;进一步地,对所有成本均使用百万为单位;对不同名称的同类数据,如薪酬、工资都统一归类为薪酬数据。
对所述每一已知企业的每一项隐性成本使用主成分分析,确定出与每一项隐性成本相关的N项显性成本,其中N为不小于4的正整数。
由于隐性成本通常与显示成本有一定的关联性,如隐性成本中的员工流失可能与显性成本中薪酬支出有一定的相关性;隐性成本中的不稳定的生产效率可能与显性成本中的设备和机器的购买和维护费用、薪酬支出有一定的相关性。但对不同的行业、不同的隐性成本,隐性成本与显性成本的具体关联度可能存在差异,如生重资产行业,良品率的隐性成本可能与设备和机器的购买和维护费用相关性更大,而轻资产行业,良品率可能与薪酬支出的相关性更大。因此,对不同的企业,不同的隐性成本均要分析与其相关的显性成本。
每一已知企业的每一项隐性Chij,Chij表示第i个企业的第j项隐性成本,在历史数据的基础上使用主成分分析法分析与之最相关的N个显性成本(Csi1,Csi2,Csi3,Csi4…),其中Csij表示第i个企业中的j项显性成本;通常为了减少误差,需要取稍多的相关项,本实施例优选地取N不小于4。
进一步地,企业A的良品率隐性成本相关联的显性成本分别为设备维护费、设备购买费用、人员平均薪酬、研发投入费用;类似地,对于企业A的其它隐性成本均可使用主成份分析法确定与其相关联的显性成本;类似地,对于全部其它已知企业均可采用类似的方法,获取全部隐性成本的与其相关联的显性成本。
主成分分析法(Pr incipal Component Analysis,简称PCA)是一种常用的多变量数据降维技术。它通过线性变换将原始数据映射到一个新的坐标系中,使得新坐标系中的数据具有最大的方差,从而实现数据的降维。主成分分析的基本思想是找到数据中最主要的特征,将这些特征作为新的坐标轴,而将较不重要的特征舍弃。这样做的目的是去除数据中的冗余信息,减少数据维度,从而简化数据分析和处理,并且降低计算成本。优选地,本实施例使用FastPCA算法进行主成份分析。
将每一已知企业的每一项隐性成本与其对应的N项显性成本拟合成隐性-显性函数。
在获取对每一项隐性成本起主要影响因素的显性成本后,为了可以进行后续的预测,本实施例继续对每一项隐性成本与其对应的N项显性成本拟合成隐性-显性曲线。
进一步地,企业A的良品率隐性成本相关联的显性成本分别为设备维护费、设备购买费用、人员平均薪酬、研发投入费用,则将良品率隐性成本的历史数据和设备维护费、设备购买费用、人员平均薪酬、研发投入费用进行拟合,确定出一隐性-显性函数Fhi(Csi1,Csi2,Csi3,Csi4),将一种隐性成本表示为几个显性成本的函数。当获知企业的几项显性成本后即可通过隐性-显性函数Fhi(Csi1,Csi2,Csi3,Csi4)计算出相应的隐性成本。
进一步地,本实施例使用回归分析将每一已知企业的每一项隐性成本与其对应的N项显性成本拟合成隐性-显性函数。回归分析是一种统计方法,用于建立因变量与自变量之间的关系模型,以预测因变量的值。
由于隐性成本通常具有一定的周期性,通常为曲线形式,进一步地,本实施例采用多项式回归建立隐性成本与多个显性成本之间的函数关系。
根据每一已知企业的每一项隐性成本对应的N项显性成本获取待分析企业对应的N项显性成本,并计算相应数据的对应相似度。
待分析企业的隐性成本有哪些,隐性成本和显性成本之间的关系均未知。但对于不同的企业,如果显性成本的变化趋势相似,则他们属于同一类型的概率极大。如两个企业在广告费用、市场营销、平均薪酬、设备维护几个方面的费用趋势以及费用比例均很类似,则两者很可能都属于销售类企业,则两者在广告费用、市场营销、平均薪酬、设备维护中的投入导致的隐性成本相同的概率也极大。因此,为了挖掘与分析待分析企业的隐性成本,本实施例根据每一已知企业的每一项隐性成本对应的N项显性成本获取待分析企业对应的N项显性成本,并计算相应数据的对应相似度。
进一步地,企业A的良品率隐性成本相关联的显性成本分别为设备维护费、设备购买费用、人员平均薪酬、研发投入费用;则取出等分析企业的设备维护费、设备购买费用、人员平均薪酬、研发投入费用数据,并计算企业A与待分析企业的设备维护费、设备购买费用、人员平均薪酬、研发投入费用的相似度。类似地,对于企业A的其它隐性成本对应的N项显性成本均确定出待分析企业相同的N项显性成本数据,并计算相似度。类似地,对于全部其它企业的隐性成本对应的N项显性成本均确定出待分析企业相同的N项显性成本数据,并计算相似度。
进一步地,在计算相似度时,本实施例采用皮尔逊相关系数;进一步地,企业A的良品率隐性成本相关联的显性成本分别为设备维护费、设备购买费用、人员平均薪酬、研发投入费用;则计算企业A的设备维护费与待分析企业的设备维护费的皮尔逊相关系数、计算企业A的设备购买费用与待分析企业的设备购买费用的皮尔逊相关系数、计算企业A的人员平均薪酬与待分析企业的人员平均薪酬的皮尔逊相关系数、计算企业A的研发投入费用与待分析企业的研发投入费用的皮尔逊相关系数,然后将四个皮尔逊相关系数求平均值,确定出企业A的良品率隐性成本相关联的显性成本分别为设备维护费、设备购买费用、人员平均薪酬、研发投入费用与待分析企业对应的显性成本的相似度。
对于每一项隐性成本,将显性成本相似度大于第一阈值,并且显性成本相似度最大的已知企业隐性-显性曲线确定为待分析企业的隐性-显性函数。
通过前述步骤,可以计算出每一已知企业的每一个隐性成本对应的显性成本与待分析企业相应的显性成本的相似度。进一步地,企业A有良品率隐性成本、人员流失隐性成本,并且良品率隐性成本、人员流失隐性成本都对应了四个相关的显性成本,则企业A的良品率隐性成本、人员流失隐性成本对应的显性成本均会与待分析企业相应的显性成本计算出相似度。类似地,对于其它已知企业,均可计算出相应的多组相似度。同时,对于每一项隐性成本可能对应多个相似度,例如企业A、企业B均有良品率隐性成本,则企业A、企业B的良品率隐性成本均会对应一个相似度。
进一步地,只有相似度大于一定的程度使用已知企业的预测函数才有意义,因此,只选择相似度大于第一阈值并且显性成本相似度最大的企业的隐性-显性函数。
进一步地,第一阈值设定为0.9。如果企业A、企业B的良品率隐性成本对应的相似度为0.8、0.85,则两者都小于第一阈值,此时两者都不选择,也就是不对待分析企业做良品率隐性成本的分析。如果企业A、企业B的良品率隐性成本对应的相似度为0.91、0.95,两者均大于第一阈值0.9,而企业B对应的相似度更大,则将企业B的良品率隐性成本对应的隐性-显性函数确定为待分析企业的良品率隐性成本分析函数。
根据隐性-显性函数计算待分析企业的每一项隐性成本。
在前述步骤中确定出了隐性成本对的隐性-显性函数,进一步地,继续以前述步骤中的示例为例,将企业B的良品率隐性成本对应的隐性-显性函数确定为待分析企业的良品率隐性成本分析函数,而企业B的良品率隐性成本对应的隐性-显性函数中包括了几项显性成本变量,将待分析企业的相应的几项显性成本数据代入企业B的良品率隐性成本对应的隐性-显性函数即可计算出待分析企业的良品率隐性成本,从而挖掘与分析出待分析企业的良品率隐性成本。
另一方面,本发明还提供一种基于数据处理的财务成本挖掘与分析系统,其特征在于所述系统包括如下模块:
数据库模块,用于获取已知企业的历史数据,所述已知企业为已知显性成本、隐性成本的企业,所述历史数据包括历年显性成本、隐性成本;
分析模块,用于对每一已知企业的每一项隐性成本使用主成分分析,确定出与每一项隐性成本相关的N项显性成本,其中N为不小于4的正整数;
拟合模块,用于将每一已知企业的每一项隐性成本与其对应的N项显性成本拟合成隐性-显性函数;
计算模块,用于根据每一已知企业的每一项隐性成本对应的N项显性成本获取待分析企业对应的N项显性成本,并计算相应数据的显性成本相似度;
确定模块,用于对于每一项隐性成本,将显性成本相似度大于第一阈值,并且显性成本相似度最大的已知企业隐性-显性函数确定为待分析企业相应隐性成本的隐性-显性函数;
挖掘模块,用于根据隐性-显性函数计算待分析企业的每一项隐性成本。
进一步地,上述所述的一种基于数据处理的财务成本挖掘与分析系统的实现方法均与一种基于数据处理的财务成本挖掘与分析方法相同,一种基于数据处理的财务成本挖掘与分析方法中的全部进一步的技术方案均完全引入一种基于数据处理的财务成本挖掘与分析系统中。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (10)

1.一种基于数据处理的财务成本挖掘与分析方法,其特征在于:
获取已知企业的历史数据,所述已知企业为已知显性成本、隐性成本的企业,所述历史数据包括历年显性成本、隐性成本;
对每一已知企业的每一项隐性成本使用主成分分析,确定出与每一项隐性成本相关的N项显性成本,其中N为不小于4的正整数;
将每一已知企业的每一项隐性成本与其对应的N项显性成本拟合成隐性-显性函数;
根据每一已知企业的每一项隐性成本对应的N项显性成本获取待分析企业对应的N项显性成本,并计算相应数据的显性成本相似度;
对于每一项隐性成本,将显性成本相似度大于第一阈值,并且显性成本相似度最大的已知企业隐性-显性函数确定为待分析企业相应隐性成本的隐性-显性函数;
根据隐性-显性函数计算待分析企业的每一项隐性成本。
2.根据权利要求1所述的一种基于数据处理的财务成本挖掘与分析方法,其特征在于:使用FastPCA算法进行主成份分析。
3.根据权利要求1所述的一种基于数据处理的财务成本挖掘与分析方法,其特征在于:采用多项式回归拟合成隐性-显性函数。
4.根据权利要求1所述的一种基于数据处理的财务成本挖掘与分析方法,其特征在于:采用皮尔逊相关系数计算显性成本相似度。
5.根据权利要求1所述的一种基于数据处理的财务成本挖掘与分析方法,其特征在于:所述第一阈值为0.9。
6.一种基于数据处理的财务成本挖掘与分析系统,其特征在于所述系统包括如下模块:
数据库模块,用于获取已知企业的历史数据,所述已知企业为已知显性成本、隐性成本的企业,所述历史数据包括历年显性成本、隐性成本;
分析模块,用于对每一已知企业的每一项隐性成本使用主成分分析,确定出与每一项隐性成本相关的N项显性成本,其中N为不小于4的正整数;
拟合模块,用于将每一已知企业的每一项隐性成本与其对应的N项显性成本拟合成隐性-显性函数;
计算模块,用于根据每一已知企业的每一项隐性成本对应的N项显性成本获取待分析企业对应的N项显性成本,并计算相应数据的显性成本相似度;
确定模块,用于对于每一项隐性成本,将显性成本相似度大于第一阈值,并且显性成本相似度最大的已知企业隐性-显性函数确定为待分析企业相应隐性成本的隐性-显性函数;
挖掘模块,用于根据隐性-显性函数计算待分析企业的每一项隐性成本。
7.根据权利要求6所述的一种基于数据处理的财务成本挖掘与分析系统,其特征在于:使用FastPCA算法进行主成份分析。
8.根据权利要求6所述的一种基于数据处理的财务成本挖掘与分析系统,其特征在于:采用多项式回归拟合成隐性-显性函数。
9.根据权利要求6所述的一种基于数据处理的财务成本挖掘与分析系统,其特征在于:采用皮尔逊相关系数计算显性成本相似度。
10.根据权利要求6所述的一种基于数据处理的财务成本挖掘与分析系统,其特征在于:所述第一阈值为0.9。
CN202311481578.9A 2023-11-08 2023-11-08 一种基于数据处理的财务成本挖掘与分析方法及系统 Pending CN117541412A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311481578.9A CN117541412A (zh) 2023-11-08 2023-11-08 一种基于数据处理的财务成本挖掘与分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311481578.9A CN117541412A (zh) 2023-11-08 2023-11-08 一种基于数据处理的财务成本挖掘与分析方法及系统

Publications (1)

Publication Number Publication Date
CN117541412A true CN117541412A (zh) 2024-02-09

Family

ID=89785371

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311481578.9A Pending CN117541412A (zh) 2023-11-08 2023-11-08 一种基于数据处理的财务成本挖掘与分析方法及系统

Country Status (1)

Country Link
CN (1) CN117541412A (zh)

Similar Documents

Publication Publication Date Title
US7930242B2 (en) Methods and systems for multi-credit reporting agency data modeling
CA3155689A1 (en) Early-warning method for commodity inventory risk based on a statistical interquartile range, and system and computer-readable storage medium thereof
WO2020257782A1 (en) Factory risk estimation using historical inspection data
Siekelova et al. Prediction financial stability of Romanian production companies through Altman Z-score
CN111754317A (zh) 一种金融投资数据测评方法及系统
CN110619462A (zh) 一种基于ai模型的项目质量评估方法
CN112241805A (zh) 使用历史检验数据进行缺陷预测
CN110990529A (zh) 企业的行业明细划分方法及系统
Fathi et al. Predicting financial distress using the worst-practice-frontier data envelopment analysis model and artificial neural network
KR20110114181A (ko) 예측 정확성이 향상된 대출 심사 방법
CN117541412A (zh) 一种基于数据处理的财务成本挖掘与分析方法及系统
Stiroh Economic Impacts of Information Technology.
CN115034762A (zh) 一种岗位推荐方法、装置、存储介质、电子设备及产品
CN112801798A (zh) 关联网络的影响传播分析和模式识别方法、系统、设备
Huang et al. An enhanced approach to optimizing the stock portfolio selection based on Modified Markowitz MV Method
Thanathamathee et al. Discovering Future Earnings Patterns through FP-Growth and ECLAT Algorithms with Optimized Discretization
CN117453805B (zh) 一种不确定性数据的可视化分析方法
CN116523301A (zh) 基于电商大数据进行风险评级预测的系统
CN116384751A (zh) 对风险指标进行标准化和风险评级预测的方法及计算设备
WO2022271431A1 (en) System and method that rank businesses in environmental, social and governance (esg)
CN116384750A (zh) 生成标记样本及训练风险评级预测模型的方法及计算设备
CN117670221A (zh) 一种erp与电商平台双向信息流集成方法及系统
Muneza et al. A Comparative Assessment of Frequentist Forecasting Models: Evidence from the S&P 500 Pharmaceuticals Index
CN112434850A (zh) 一种用于数字资产的数据处理方法
CN116384749A (zh) 训练风险评级预测模型的方法及计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination