CN116757334B - 财务数据处理方法、系统、可读存储介质及计算机 - Google Patents
财务数据处理方法、系统、可读存储介质及计算机 Download PDFInfo
- Publication number
- CN116757334B CN116757334B CN202311027602.1A CN202311027602A CN116757334B CN 116757334 B CN116757334 B CN 116757334B CN 202311027602 A CN202311027602 A CN 202311027602A CN 116757334 B CN116757334 B CN 116757334B
- Authority
- CN
- China
- Prior art keywords
- data
- correlation
- index
- sub
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 15
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000012545 processing Methods 0.000 claims abstract description 140
- 230000002159 abnormal effect Effects 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 32
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 13
- 238000005457 optimization Methods 0.000 claims description 37
- 238000012216 screening Methods 0.000 claims description 23
- 238000010586 diagram Methods 0.000 claims description 19
- 230000002776 aggregation Effects 0.000 claims description 16
- 238000004220 aggregation Methods 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 238000009826 distribution Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 4
- 238000003491 array Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Educational Administration (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供一种财务数据处理方法、系统、可读存储介质及计算机,该方法包括:计算出待处理的财务数据中所有子数据的数据空值,并根据数据空值计算出财务数据中所有子数据的占空率;将根据各子数据的占空率和均值算法识别出的异常数据从各子数据中删除得到优化数据;将优化数据输入至相关性指标处理模型中得到优化数据中各数据之间的相关性指标;利用数据处理模型对相关性指标和优化数据进行相关性处理得到相关性数据;根据数据处理指标对相关性数据进行数据处理得到处理结果。本发明利用数据空值计算出数据的占空率,将根据占空率和均值算法识别出的异常数据从各子数据中删除得到优化数据,从而提高数据处理的精准度。
Description
技术领域
本发明涉及数据处理技术领域,特别涉及一种财务数据处理方法、系统、可读存储介质及计算机。
背景技术
随着科技的飞速发展和人们生活水平的提高,各类企业在人们的生活中也层出不穷,因此,各企业针对财务数据的处理方式以及处理要求也在迅速发展。
现有的财务数据处理方式,通常是由企业的财务工作人员收集该企业的所有财务数据,并将所有的财务数据中不符合要求的财务数据进行人工筛查,将人工筛查的结果导入至预先构建的财务数据模板中,以得到对应的财务数据报告。
然而,随着企业的持续运营,财务数据的数量也在逐渐增大,因此,企业需要花费大量的人力物力对财务数据进行处理,从而使得企业的成本大大增加,并且,针对一些复杂的财务数据,人工筛查会存在误判的情况,从而导致财务数据的处理异常,影响财务工作人员的工作效率。
发明内容
基于此,本发明的目的是提供一种财务数据处理方法、系统、可读存储介质及计算机,以至少解决上述技术中的不足。
本发明提出一种财务数据处理方法,包括:
当接收到设备终端所上传的待处理的财务数据时,计算出所述财务数据中所有子数据的数据空值,并根据所述数据空值计算出所述财务数据中所有子数据的占空率;
根据各所述子数据的占空率和预设的均值算法识别出各所述子数据中的异常数据,并将所述异常数据从各所述子数据中删除得到优化数据;
构建相关性指标处理模型,将所述优化数据输入至所述相关性指标处理模型中,以得到所述优化数据中各数据之间的相关性指标;
利用预设的数据处理模型对所述相关性指标和所述优化数据进行相关性处理,以得到对应的相关性数据;
获取数据处理指标,并根据所述数据处理指标对所述相关性数据进行数据处理,以得到对应的处理结果。
进一步的,根据各所述子数据的占空率和预设的均值算法识别出各所述子数据中的异常数据,并将所述异常数据从各所述子数据中删除得到优化数据的步骤包括:
从各所述子数据中筛选出占空率不大于预设空占率阈值的子数据,并将其进行数据排序,以得到对应的数据排序表;
构建所述数据排序表的散点图,并从所述散点图中选择多个散点数据作为初始聚类中心,将其他的散点数据与各所述初始聚类中心的距离将所述其他的散点数据进行聚类分配,以得到聚类数据;
计算出所述聚类数据的聚类中心,并重复进行聚类分配直至所述聚类数据的聚类中心进行收敛,以识别出各所述散点数据中的异常数据,将所述异常数据从所述子数据中删除得到优化数据。
进一步的,构建相关性指标处理模型的步骤包括:
获取标准财务数据,并筛选出所述标准财务数据的频繁数据集;
根据所述频繁数据集构建所述标准财务数据的相关性指标处理模型。
进一步的,利用预设的数据处理模型对所述相关性指标和所述优化数据进行相关性处理,以得到对应的相关性数据的步骤包括:
获取所述优化数据的所有优化子数据以及所述相关性指标的所有相关指标;
利用预设的数据处理模型、各所述优化子数据以及各所述相关指标计算出所述优化数据与所述相关性指标的关联程度;
根据所述关联程度对所述优化数据进行数据筛选,以得到对应的相关性数据。
本发明还提出一种财务数据处理系统,包括:
数据计算模块,用于当接收到设备终端所上传的待处理的财务数据时,计算出所述财务数据中所有子数据的数据空值,并根据所述数据空值计算出所述财务数据中所有子数据的占空率;
数据优化模块,用于根据各所述子数据的占空率和预设的均值算法识别出各所述子数据中的异常数据,并将所述异常数据从各所述子数据中删除得到优化数据;
指标计算模块,用于构建相关性指标处理模型,将所述优化数据输入至所述相关性指标处理模型中,以得到所述优化数据中各数据之间的相关性指标;
相关性处理模块,用于利用预设的数据处理模型对所述相关性指标和所述优化数据进行相关性处理,以得到对应的相关性数据;
数据处理模块,用于获取数据处理指标,并根据所述数据处理指标对所述相关性数据进行数据处理,以得到对应的处理结果。
进一步的,所述数据优化模块包括:
数据排序单元,用于从各所述子数据中筛选出占空率不大于预设空占率阈值的子数据,并将其进行数据排序,以得到对应的数据排序表;
数据分配单元,用于构建所述数据排序表的散点图,并从所述散点图中选择多个散点数据作为初始聚类中心,将其他的散点数据与各所述初始聚类中心的距离将所述其他的散点数据进行聚类分配,以得到聚类数据;
数据优化单元,用于计算出所述聚类数据的聚类中心,并重复进行聚类分配直至所述聚类数据的聚类中心进行收敛,以识别出各所述散点数据中的异常数据,将所述异常数据从所述子数据中删除得到优化数据。
进一步的,所述指标计算模块包括:
频繁数据获取单元,用于获取标准财务数据,并筛选出所述标准财务数据的频繁数据集;
处理模型构建单元,用于根据所述频繁数据集构建所述标准财务数据的相关性指标处理模型。
进一步的,所述相关性处理模块包括:
数据解析单元,用于获取所述优化数据的所有优化子数据以及所述相关性指标的所有相关指标;
关联程度计算单元,用于利用预设的数据处理模型、各所述优化子数据以及各所述相关指标计算出所述优化数据与所述相关性指标的关联程度;
相关性处理单元,用于根据所述关联程度对所述优化数据进行数据筛选,以得到对应的相关性数据。
本发明还提出一种可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的财务数据处理方法。
本发明还提出一种计算机,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的财务数据处理方法。
本发明当中的财务数据处理方法、系统、可读存储介质及计算机,通过计算出财务数据中所有子数据的数据空值,并利用数据空值计算出所有子数据的占空率,根据占空率和均值算法识别出各子数据中的异常数据,将异常数据从各所述子数据中删除得到优化数据,从而使得数据处理时的数据更加精准,提高数据处理的精准度;通过构建相关性指标处理模型计算优化数据中各数据的相关性指标,以去除优化数据中的低层次数据,从而提高数据处理的效率。
附图说明
图1为本发明第一实施例中财务数据处理方法的流程图;
图2为图1中步骤S102的详细流程图;
图3为图1中步骤S103的详细流程图;
图4为图1中步骤S104的详细流程图;
图5为本发明第二实施例中财务数据处理系统的结构框图;
图6为本发明第三实施例中的计算机的结构框图。
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
实施例一
请参阅图1,所示为本发明第一实施例中的财务数据处理方法,所述财务数据处理方法具体包括步骤S101至S105:
S101,当接收到设备终端所上传的待处理的财务数据时,计算出所述财务数据中所有子数据的数据空值,并根据所述数据空值计算出所述财务数据中所有子数据的占空率;
在具体实施时,设备终端可以为手机、电脑、服务器等具有通信功能的设备,当接收到该设备终端所上传的待处理的财务数据时,解析出该待处理的财务数据中所有财务数据的数据属性;
其中,在上述的待处理的财务数据中存在多个财务子数据,且每个财务子数据均含有其对应的数据属性,将财务子数据的数据属性与财务属性数据库中的数据进行对比,当某个财务子数据的数据属性不存在财务属性数据库中,则将该财务子数据的数据属性标记为数据空值,统计所有财务子数据中数据属性为数据空值的财务子数据的数量,并将其与待评估的财务数据中所有财务子数据的总数进行对比,从而得到各财务子数据的空占率。
S102,根据各所述子数据的占空率和预设的均值算法识别出各所述子数据中的异常数据,并将所述异常数据从各所述子数据中删除得到优化数据;
进一步的,请参阅图2,所述步骤S102具体包括步骤S1021~S1023:
S1021,从各所述子数据中筛选出占空率不大于预设空占率阈值的子数据,并将其进行数据排序,以得到对应的数据排序表;
S1022,构建所述数据排序表的散点图,并从所述散点图中选择多个散点数据作为初始聚类中心,将其他的散点数据与各所述初始聚类中心的距离将所述其他的散点数据进行聚类分配,以得到聚类数据;
S1023,计算出所述聚类数据的聚类中心,并重复进行聚类分配直至所述聚类数据的聚类中心进行收敛,以识别出各所述散点数据中的异常数据,将所述异常数据从所述子数据中删除得到优化数据。
在具体实施时,在上述的所有财务子数据中占空率大于预设占空率阈值的财务子数据从待处理的财务数据中清除,并将清除后的数据按照占空率从小到大进行数据排序,从而得到数据排序表;
进一步的,对数据排序表进行散点图构建,对于散点图中单一连续变量才用K均值的聚类算法进行自动识别异常值,具体的,从散点图中选择多个散点数据作为初始聚类中心,对于剩下的其他散点数据,根据其与上述的各初始聚类中心的距离分别分配至距离最近的初始聚类中心,会得到新聚类(即聚类数据),计算出该新聚类的聚类中心,并重复聚类分配的步骤,直至聚类中心的变化趋于稳定,即筛除散点图中所有散点数据的异常数据。
S103,构建相关性指标处理模型,将所述优化数据输入至所述相关性指标处理模型中,以得到所述优化数据中各数据之间的相关性指标;
进一步的,请参阅图3,所述步骤S103具体包括步骤S1031~S1032:
S1031,获取标准财务数据,并筛选出所述标准财务数据的频繁数据集;
S1032,根据所述频繁数据集构建所述标准财务数据的相关性指标处理模型。
在具体实施时,标准财务数据即为该用户终端所对应的企业的历史财务数据,该历史财务数据为已完成财务数据处理、且该历史财务数据的数据处理结果为已知数据,由于财务数据处理中,历史财务数据可能与多个财务报表相关,因此,将与多个财务报表相关的历史财务数据进行数据整合,从而得到对应的频繁数据集,例如:当一个历史财务数据中存在n个不同的历史财务子数据,而n个历史财务子数据中可能与多个财务报表相关,将所有的历史财务子数据与财务报表相关的子数据的数量进行叠加,因此,n个财务子数据可能存在2n个与财务报表相关的数据,即为频繁数据集,将频繁数据集输入至预先构建的处理模型中,以使该处理模型进行模型优化,从而得到相关性指标处理模型。
具体的,将上述的优化数据输入至相关性指标处理模型中,以使该相关性指标处理模型对其进行相关性指标提取,以得到各财务子数据之间的相关性指标。
S104,利用预设的数据处理模型对所述相关性指标和所述优化数据进行相关性处理,以得到对应的相关性数据;
进一步的,请参阅图4,所述步骤S104具体包括步骤S1041~S1043:
S1041,获取所述优化数据的所有优化子数据以及所述相关性指标的所有相关指标;
S1042,利用预设的数据处理模型、各所述优化子数据以及各所述相关指标计算出所述优化数据与所述相关性指标的关联程度;
S1043,根据所述关联程度对所述优化数据进行数据筛选,以得到对应的相关性数据。
在具体实施时,获取优化数据的所有优化子数据,其中,/>表示优化数据中第/>个优化子数据,每个优化子数据均由多个数据标识(该数据标识即为该优化子数据在数据处理模型中的组成标识,由该数据处理模型自动生成)组成,各数据标识定义为/>,其中,/>表示数据标识的数量;
将上述的相关性指标定义为,其中,/>表示第/>个相关性指标,各相关性指标具有多个指标类型,各相关性指标的指标类型定义为,/>表示指标类型的数量。
进一步的,利用预设的数据处理模型对各优化数据的每个数据标识与相关性指标的指标类型进行对比,从而计算出各优化数据对相关性指标的隶属度,隶属度为各优化数据的数据标识存在与相关性指标中指标类型相关的比例,例如:数据中包含有个数据标识,则/>数据对相关性指标的隶属度表示为:
;
;
式中,表示第/>个相关性指标的指标类型集合,只要/>数据中的数据标识存在于指标类型集合中,其与指标类型集合的比值则为1,/>表示/>数据对相关性指标的隶属度。
由于各优化数据的多个数据标识均可能与相关性指标中多个指标类型相关,因此,计算出各优化数据和相关性指标的集合度,集合度为各优化数据的中所有数据包含有与相关性指标中多个指标类型相关的比例,例如:数据中包含有/>个数据标识,则/>数据对相关性指标的集合度表示为:
;
;
式中,表示/>数据中所有的数据标识与第/>个相关性指标的指标类型进行逐一对比,/>表示/>数据对相关性指标的集合度。
进一步的,根据各优化数据对相关性指标的隶属度和集合度计算出优化数据中各数据与相关性指标的关联程度:
;
;
;
式中,表示各数据对相关性指标的隶属度,/>表示各数据对相关性指标的集合度,/>表示关联程度系数,为用户设定的常数。
在得到上述的关联程度后,将关联程度大于预设关联程度阈值的数据从优化数据中筛除,其中,预设关联程度阈值的表达式为:
;
式中,表示优化数据中各数据的总数,/>表示阈值系数,为用户设定的常数。
S105,获取数据处理指标,并根据所述数据处理指标对所述相关性数据进行数据处理,以得到对应的处理结果。
在具体实施时,利用指标解析规则从预设的财务处理指标库中获取数据处理指标,需要说明的是,在财务处理指标库中存储有用于财务数据处理的所有数据处理指标,将所述数据处理指标对上述得到的相关性数据进行数据处理,从而得到对应的处理结果。
综上,本发明上述实施例中的财务数据处理方法,通过计算出财务数据中所有子数据的数据空值,并利用数据空值计算出所有子数据的占空率,根据占空率和均值算法识别出各子数据中的异常数据,将异常数据从各所述子数据中删除得到优化数据,从而使得数据处理时的数据更加精准,提高数据处理的精准度;通过构建相关性指标处理模型计算优化数据中各数据的相关性指标,以去除优化数据中的低层次数据,从而提高数据处理的效率。
实施例二
本发明另一方面还提出一种财务数据处理系统,请查阅图5,所示为本发明第二实施例中的财务数据处理系统,所述系统包括:
数据计算模块11,用于当接收到设备终端所上传的待处理的财务数据时,计算出所述财务数据中所有子数据的数据空值,并根据所述数据空值计算出所述财务数据中所有子数据的占空率;
数据优化模块12,用于根据各所述子数据的占空率和预设的均值算法识别出各所述子数据中的异常数据,并将所述异常数据从各所述子数据中删除得到优化数据;
进一步的,所述数据优化模块12包括:
数据排序单元,用于从各所述子数据中筛选出占空率不大于预设空占率阈值的子数据,并将其进行数据排序,以得到对应的数据排序表;
数据分配单元,用于构建所述数据排序表的散点图,并从所述散点图中选择多个散点数据作为初始聚类中心,将其他的散点数据与各所述初始聚类中心的距离将所述其他的散点数据进行聚类分配,以得到聚类数据;
数据优化单元,用于计算出所述聚类数据的聚类中心,并重复进行聚类分配直至所述聚类数据的聚类中心进行收敛,以识别出各所述散点数据中的异常数据,将所述异常数据从所述子数据中删除得到优化数据。
指标计算模块13,用于构建相关性指标处理模型,将所述优化数据输入至所述相关性指标处理模型中,以得到所述优化数据中各数据之间的相关性指标;
进一步的,所述指标计算模块13包括:
频繁数据获取单元,用于获取标准财务数据,并筛选出所述标准财务数据的频繁数据集;
处理模型构建单元,用于根据所述频繁数据集构建所述标准财务数据的相关性指标处理模型。
相关性处理模块14,用于利用预设的数据处理模型对所述相关性指标和所述优化数据进行相关性处理,以得到对应的相关性数据;
进一步的,所述相关性处理模块14包括:
数据解析单元,用于获取所述优化数据的所有优化子数据以及所述相关性指标的所有相关指标;
关联程度计算单元,用于利用预设的数据处理模型、各所述优化子数据以及各所述相关指标计算出所述优化数据与所述相关性指标的关联程度;
相关性处理单元,用于根据所述关联程度对所述优化数据进行数据筛选,以得到对应的相关性数据。
数据处理模块15,用于获取数据处理指标,并根据所述数据处理指标对所述相关性数据进行数据处理,以得到对应的处理结果。
上述各模块、单元被执行时所实现的功能或操作步骤与上述方法实施例大体相同,在此不再赘述。
本发明实施例所提供的财务数据处理系统,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
实施例三
本发明还提出一种计算机,请参阅图6,所示为本发明第三实施例中的计算机,包括存储器10、处理器20以及存储在所述存储器10上并可在所述处理器20上运行的计算机程序30,所述处理器20执行所述计算机程序30时实现上述的财务数据处理方法。
其中,存储器10至少包括一种类型的存储介质,所述存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器10在一些实施例中可以是计算机的内部存储单元,例如该计算机的硬盘。存储器10在另一些实施例中也可以是外部存储装置,例如插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,存储器10还可以既包括计算机的内部存储单元也包括外部存储装置。存储器10不仅可以用于存储安装于计算机的应用软件及各类数据,还可以用于暂时地存储已经输出或者将要输出的数据。
其中,处理器20在一些实施例中可以是电子控制单元 (Electronic ControlUnit,简称ECU,又称行车电脑)、中央处理器(Central Processing Unit, CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器10中存储的程序代码或处理数据,例如执行访问限制程序等。
需要指出的是,图6示出的结构并不构成对计算机的限定,在其它实施例当中,该计算机可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
本发明实施例还提出一种可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述的财务数据处理方法。
本领域技术人员可以理解,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (4)
1.一种财务数据处理方法,其特征在于,包括:
当接收到设备终端所上传的待处理的财务数据时,计算出所述财务数据中所有子数据的数据空值,并根据所述数据空值计算出所述财务数据中所有子数据的占空率;
根据各所述子数据的占空率和预设的均值算法识别出各所述子数据中的异常数据,并将所述异常数据从各所述子数据中删除得到优化数据,其中,根据各所述子数据的占空率和预设的均值算法识别出各所述子数据中的异常数据,并将所述异常数据从各所述子数据中删除得到优化数据的步骤包括:
从各所述子数据中筛选出占空率不大于预设空占率阈值的子数据,并将其进行数据排序,以得到对应的数据排序表;
构建所述数据排序表的散点图,并从所述散点图中选择多个散点数据作为初始聚类中心,将其他的散点数据与各所述初始聚类中心的距离将所述其他的散点数据进行聚类分配,以得到聚类数据;
计算出所述聚类数据的聚类中心,并重复进行聚类分配直至所述聚类数据的聚类中心进行收敛,以识别出各所述散点数据中的异常数据,将所述异常数据从所述子数据中删除得到优化数据;
构建相关性指标处理模型,将所述优化数据输入至所述相关性指标处理模型中,以得到所述优化数据中各数据之间的相关性指标,其中,构建相关性指标处理模型的步骤包括:
获取标准财务数据,并筛选出所述标准财务数据的频繁数据集,其中,所述标准财务数据即为用户终端所对应的企业的历史财务数据,所述历史财务数据为已完成财务数据处理、且所述历史财务数据的数据处理结果为已知数据,将与多个财务报表相关的历史财务数据进行数据整合,从而得到对应的频繁数据集;
将频繁数据集输入至预先构建的处理模型中,以使所述处理模型进行模型优化,从而得到相关性指标处理模型;
利用预设的数据处理模型对所述相关性指标和所述优化数据进行相关性处理,以得到对应的相关性数据,其中,利用预设的数据处理模型对所述相关性指标和所述优化数据进行相关性处理,以得到对应的相关性数据的步骤包括:
获取所述优化数据的所有优化子数据以及所述相关性指标的所有相关指标,所述优化数据的所有优化子数据,其中,/>表示优化数据中第/>个优化子数据,每个优化子数据均由多个数据标识组成,各数据标识定义为/>,其中,/>表示数据标识的数量;
利用预设的数据处理模型对各所述优化子数据的每个数据标识与各所述相关指标的指标类型进行对比,以计算出各所述优化数据对所述相关性指标的隶属度,其中,所述隶属度为各优化数据的数据标识存在与相关性指标中指标类型相关的比例,所述隶属度表示为:
;
;
式中,表示第/>个相关性指标的指标类型集合,只要/>数据中的数据标识存在于指标类型集合中,其与指标类型集合的比值则为1,/>表示/>数据对相关性指标的隶属度,/>数据中包含有/>个数据标识;
计算出各所述优化数据和所述相关性指标的集合度,并根据各所述优化数据对所述相关性指标的隶属度和集合度计算出所述优化数据中各数据与所述相关性指标的关联程度,其中,所述集合度为各优化数据的中所有数据包含有与相关性指标中多个指标类型相关的比例,所述集合度的计算公式为:
;
;
式中,表示/>数据中所有的数据标识与第/>个相关性指标的指标类型进行逐一对比,/>表示/>数据对相关性指标的集合度,/>数据中包含有/>个数据标识;
所述关联程度的计算公式为:
;
;
;
式中,表示各数据对相关性指标的隶属度,/>表示各数据对相关性指标的集合度,/>表示关联程度系数,为用户设定的常数;
根据所述关联程度对所述优化数据进行数据筛选,以得到对应的相关性数据,其中,根据所述关联程度对所述优化数据进行数据筛选,以得到对应的相关性数据的步骤包括:
将关联程度大于预设关联程度阈值的数据从优化数据中筛除,预设关联程度阈值的表达式为:
;
式中,表示优化数据中各数据的总数,/>表示阈值系数,为用户设定的常数;
获取数据处理指标,并根据所述数据处理指标对所述相关性数据进行数据处理,以得到对应的处理结果。
2.一种财务数据处理系统,其特征在于,包括:
数据计算模块,用于当接收到设备终端所上传的待处理的财务数据时,计算出所述财务数据中所有子数据的数据空值,并根据所述数据空值计算出所述财务数据中所有子数据的占空率;
数据优化模块,用于根据各所述子数据的占空率和预设的均值算法识别出各所述子数据中的异常数据,并将所述异常数据从各所述子数据中删除得到优化数据,其中,所述数据优化模块包括:
数据排序单元,用于从各所述子数据中筛选出占空率不大于预设空占率阈值的子数据,并将其进行数据排序,以得到对应的数据排序表;
数据分配单元,用于构建所述数据排序表的散点图,并从所述散点图中选择多个散点数据作为初始聚类中心,将其他的散点数据与各所述初始聚类中心的距离将所述其他的散点数据进行聚类分配,以得到聚类数据;
数据优化单元,用于计算出所述聚类数据的聚类中心,并重复进行聚类分配直至所述聚类数据的聚类中心进行收敛,以识别出各所述散点数据中的异常数据,将所述异常数据从所述子数据中删除得到优化数据;
指标计算模块,用于构建相关性指标处理模型,将所述优化数据输入至所述相关性指标处理模型中,以得到所述优化数据中各数据之间的相关性指标,其中,所述指标计算模块包括:
频繁数据获取单元,用于获取标准财务数据,并筛选出所述标准财务数据的频繁数据集,其中,所述标准财务数据即为用户终端所对应的企业的历史财务数据,所述历史财务数据为已完成财务数据处理、且所述历史财务数据的数据处理结果为已知数据,将与多个财务报表相关的历史财务数据进行数据整合,从而得到对应的频繁数据集;
处理模型构建单元,用于将频繁数据集输入至预先构建的处理模型中,以使所述处理模型进行模型优化,从而得到相关性指标处理模型;
相关性处理模块,用于利用预设的数据处理模型对所述相关性指标和所述优化数据进行相关性处理,以得到对应的相关性数据;
数据处理模块,用于获取数据处理指标,并根据所述数据处理指标对所述相关性数据进行数据处理,以得到对应的处理结果;
其中,所述相关性处理模块包括:
数据解析单元,用于获取所述优化数据的所有优化子数据以及所述相关性指标的所有相关指标,所述优化数据的所有优化子数据,其中,/>表示优化数据中第/>个优化子数据,每个优化子数据均由多个数据标识组成,各数据标识定义为,其中,/>表示数据标识的数量;
关联程度计算单元,用于利用预设的数据处理模型对各所述优化子数据的每个数据标识与各所述相关指标的指标类型进行对比,以计算出各所述优化数据对所述相关性指标的隶属度,其中,所述隶属度为各优化数据的数据标识存在与相关性指标中指标类型相关的比例,所述隶属度表示为:
;
;
式中,表示第/>个相关性指标的指标类型集合,只要/>数据中的数据标识存在于指标类型集合中,其与指标类型集合的比值则为1,/>表示/>数据对相关性指标的隶属度,/>数据中包含有/>个数据标识;
计算出各所述优化数据和所述相关性指标的集合度,并根据各所述优化数据对所述相关性指标的隶属度和集合度计算出所述优化数据中各数据与所述相关性指标的关联程度,其中,所述集合度为各优化数据的中所有数据包含有与相关性指标中多个指标类型相关的比例,所述集合度的计算公式为:
;
;
式中,表示/>数据中所有的数据标识与第/>个相关性指标的指标类型进行逐一对比,/>表示/>数据对相关性指标的集合度,/>数据中包含有/>个数据标识;
所述关联程度的计算公式为:
;
;
;
式中,表示各数据对相关性指标的隶属度,/>表示各数据对相关性指标的集合度,/>表示关联程度系数,为用户设定的常数;相关性处理单元,用于根据所述关联程度对所述优化数据进行数据筛选,以得到对应的相关性数据,其中,将关联程度大于预设关联程度阈值的数据从优化数据中筛除,预设关联程度阈值的表达式为:
;
式中,表示优化数据中各数据的总数,/>表示阈值系数,为用户设定的常数。
3.一种可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1所述的财务数据处理方法。
4.一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1所述的财务数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311027602.1A CN116757334B (zh) | 2023-08-16 | 2023-08-16 | 财务数据处理方法、系统、可读存储介质及计算机 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311027602.1A CN116757334B (zh) | 2023-08-16 | 2023-08-16 | 财务数据处理方法、系统、可读存储介质及计算机 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116757334A CN116757334A (zh) | 2023-09-15 |
CN116757334B true CN116757334B (zh) | 2023-11-24 |
Family
ID=87948135
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311027602.1A Active CN116757334B (zh) | 2023-08-16 | 2023-08-16 | 财务数据处理方法、系统、可读存储介质及计算机 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116757334B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6124232B1 (ja) * | 2016-11-15 | 2017-05-10 | シーロムパートナーズ税理士法人 | 財務予測システム、財務予測方法、及び財務予測プログラム |
CN112801529A (zh) * | 2021-02-05 | 2021-05-14 | 北京同邦卓益科技有限公司 | 财务数据分析方法及装置、电子设备及介质 |
CN112818028A (zh) * | 2021-01-12 | 2021-05-18 | 平安科技(深圳)有限公司 | 数据指标筛选方法、装置、计算机设备及存储介质 |
CN114298533A (zh) * | 2021-12-27 | 2022-04-08 | 北京达佳互联信息技术有限公司 | 性能指标处理方法、装置、设备和存储介质 |
CN114626553A (zh) * | 2022-03-31 | 2022-06-14 | 中国工商银行股份有限公司 | 财务数据监测模型的训练方法、装置和计算机设备 |
CN115239450A (zh) * | 2022-08-02 | 2022-10-25 | 中国平安人寿保险股份有限公司 | 财务数据处理方法、装置、计算机设备及存储介质 |
WO2022257459A1 (zh) * | 2021-06-10 | 2022-12-15 | 平安科技(深圳)有限公司 | 用户行为异常分析方法、装置、设备及存储介质 |
CN115511374A (zh) * | 2022-10-27 | 2022-12-23 | 中国兵器装备集团自动化研究所有限公司 | 一种工艺指标相关性计算方法、装置、设备及存储介质 |
CN115600119A (zh) * | 2022-12-13 | 2023-01-13 | 青岛左岸数据科技有限公司(Cn) | 适用于风力发电的数据处理方法及系统 |
CN115860924A (zh) * | 2023-02-15 | 2023-03-28 | 国网数字科技控股有限公司 | 供应链金融信用风险预警方法及相关设备 |
CN116128135A (zh) * | 2023-01-19 | 2023-05-16 | 中国建设银行股份有限公司 | 数据处理方法及装置、电子设备和存储介质 |
CN116452353A (zh) * | 2023-04-20 | 2023-07-18 | 贵州乌江水电开发有限责任公司 | 一种财务数据管理方法及系统 |
-
2023
- 2023-08-16 CN CN202311027602.1A patent/CN116757334B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6124232B1 (ja) * | 2016-11-15 | 2017-05-10 | シーロムパートナーズ税理士法人 | 財務予測システム、財務予測方法、及び財務予測プログラム |
CN112818028A (zh) * | 2021-01-12 | 2021-05-18 | 平安科技(深圳)有限公司 | 数据指标筛选方法、装置、计算机设备及存储介质 |
CN112801529A (zh) * | 2021-02-05 | 2021-05-14 | 北京同邦卓益科技有限公司 | 财务数据分析方法及装置、电子设备及介质 |
WO2022257459A1 (zh) * | 2021-06-10 | 2022-12-15 | 平安科技(深圳)有限公司 | 用户行为异常分析方法、装置、设备及存储介质 |
CN114298533A (zh) * | 2021-12-27 | 2022-04-08 | 北京达佳互联信息技术有限公司 | 性能指标处理方法、装置、设备和存储介质 |
CN114626553A (zh) * | 2022-03-31 | 2022-06-14 | 中国工商银行股份有限公司 | 财务数据监测模型的训练方法、装置和计算机设备 |
CN115239450A (zh) * | 2022-08-02 | 2022-10-25 | 中国平安人寿保险股份有限公司 | 财务数据处理方法、装置、计算机设备及存储介质 |
CN115511374A (zh) * | 2022-10-27 | 2022-12-23 | 中国兵器装备集团自动化研究所有限公司 | 一种工艺指标相关性计算方法、装置、设备及存储介质 |
CN115600119A (zh) * | 2022-12-13 | 2023-01-13 | 青岛左岸数据科技有限公司(Cn) | 适用于风力发电的数据处理方法及系统 |
CN116128135A (zh) * | 2023-01-19 | 2023-05-16 | 中国建设银行股份有限公司 | 数据处理方法及装置、电子设备和存储介质 |
CN115860924A (zh) * | 2023-02-15 | 2023-03-28 | 国网数字科技控股有限公司 | 供应链金融信用风险预警方法及相关设备 |
CN116452353A (zh) * | 2023-04-20 | 2023-07-18 | 贵州乌江水电开发有限责任公司 | 一种财务数据管理方法及系统 |
Non-Patent Citations (2)
Title |
---|
基于聚类-灰色关联分析的财务预警指标筛选研究;鲍新中 等;中国注册会计师(第07期);第73-78页 * |
改进财务评价指标体系的筛选研究;张文宇 等;计算机工程与应用;第52卷(第23期);第102-108页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116757334A (zh) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lengyel et al. | Silhouette width using generalized mean—A flexible method for assessing clustering efficiency | |
US10176246B2 (en) | Fast grouping of time series | |
WO2017215346A1 (zh) | 业务数据分类方法和装置 | |
TW201835789A (zh) | 評分模型的建立、用戶信用的評估方法及裝置 | |
CN112241494B (zh) | 基于用户行为数据的关键信息推送方法及装置 | |
CN110874604A (zh) | 模型训练方法及终端设备 | |
US9280551B2 (en) | De-duplication deployment planning | |
CN105139282A (zh) | 一种电网指标数据处理方法、装置以及计算设备 | |
CN111626360A (zh) | 用于检测锅炉故障类型的方法、装置、设备和存储介质 | |
CN111078512A (zh) | 告警记录生成方法、装置、告警设备及存储介质 | |
CN109408640B (zh) | 日志分类方法、装置及存储介质 | |
CN116757334B (zh) | 财务数据处理方法、系统、可读存储介质及计算机 | |
CN116468102A (zh) | 刀具图像分类模型剪枝方法、装置、计算机设备 | |
CN115511432A (zh) | 会计人才大数据管理方法、系统、可读存储介质及计算机 | |
CN113705625A (zh) | 异常生活保障申请家庭的识别方法、装置及电子设备 | |
CN113128574A (zh) | 场景缩减方法、装置及终端设备 | |
CN117311806B (zh) | 基于加权有向耦合网络的软件结构风险识别方法与装置 | |
CN110377592B (zh) | 定量变量到虚拟变量的数据预处理方法、装置及终端设备 | |
CN115099922B (zh) | 财务数据查询方法、系统、可读存储介质及计算机设备 | |
CN114299043B (zh) | 点云质量评估方法、装置、电子设备和存储介质 | |
CN117312303A (zh) | 一种自动化的数据资产盘点方法、装置、电子设备及介质 | |
CN112561262B (zh) | 应用于屏障分析的经验反馈数据推送方法和计算机终端 | |
CN113282807B (zh) | 基于二部图的关键词扩展方法、装置、设备及介质 | |
CN110119406B (zh) | 实时任务记录的核对方法及装置 | |
CN116629645A (zh) | 扫描终端评估方法、装置、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |