CN117522196A - 数据处理方法及装置、存储介质及电子装置 - Google Patents
数据处理方法及装置、存储介质及电子装置 Download PDFInfo
- Publication number
- CN117522196A CN117522196A CN202311474973.4A CN202311474973A CN117522196A CN 117522196 A CN117522196 A CN 117522196A CN 202311474973 A CN202311474973 A CN 202311474973A CN 117522196 A CN117522196 A CN 117522196A
- Authority
- CN
- China
- Prior art keywords
- data
- service
- business
- determining
- index parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 230000002159 abnormal effect Effects 0.000 claims abstract description 39
- 238000012545 processing Methods 0.000 claims abstract description 30
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000001514 detection method Methods 0.000 claims description 29
- 238000012544 monitoring process Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 14
- 230000005856 abnormality Effects 0.000 claims description 12
- 230000008901 benefit Effects 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 5
- 238000012790 confirmation Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Technology Law (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种数据处理方法及装置、存储介质及电子装置,其中,上述方法包括:基于预设维度对目标企业的业务数据进行分类,得到多组待处理数据,其中,多组待处理数据对应不同的业务指标;针对多组待处理数据中的每一组待处理数据,确定出每一组待处理数据在对应的业务指标下的一组指标参数值,得到多组指标参数值;基于多组指标参数值确定出业务数据所指示的业务状态,其中,业务状态至少包括以下之一:业务正常,业务异常。采用上述技术方案,解决了如何提高企业业务数据的处理效率的技术问题,进而可以实现提高企业业务数据的处理效率的效果。
Description
技术领域
本发明涉及数据分析领域,具体而言,涉及一种数据处理方法及装置、存储介质及电子装置。
背景技术
目前,企业的财务数据具有重要的参考价值,往往能反应出企业的业务经营状况以及影响业务决策。但是在实际应用中,通常由人工结合业务经验审阅财务报表,面对企业不断变化且海量的业务数据,人工审阅的方式耗费大量时间精力,还容易出现分析误差较大,财务造假等情况,无法准确高效的通过业务数据判断出企业当前的业务状态。
相关技术中,针对如何提高企业业务数据的处理效率的技术问题,目前尚未提出有效的解决方案。
因此,有必要对相关技术予以改良以克服相关技术中的所述缺陷。
发明内容
本发明实施例提供了一种数据处理方法及装置、存储介质及电子装置,以至少解决如何提高企业业务数据的处理效率的技术问题。
根据本发明实施例的一方面,提供了一种数据处理方法,包括:基于预设维度对目标企业的业务数据进行分类,得到多组待处理数据,其中,所述多组待处理数据对应不同的业务指标;针对所述多组待处理数据中的每一组待处理数据,确定出所述每一组待处理数据在对应的业务指标下的一组指标参数值,得到多组指标参数值;基于所述多组指标参数值确定出所述业务数据所指示的业务状态,其中,所述业务状态至少包括以下之一:业务正常,业务异常。
在一个示例性实施例中,确定出所述每一组待处理数据在对应的业务指标下的一组指标参数值,包括:在确定所述预设维度包括业务盈利维度的情况下,从所述多组待处理数据中确定出与所述业务盈利维度对应的目标待处理数据;确定出所述目标待处理数据在所述业务盈利维度下的目标业务指标,其中,所述目标业务指标至少包括以下之一:经营成本,利息成本,资产收益;从所述目标业务指标中确定出所述经营成本对应的第一指标参数值,所述利息成本对应的第二指标参数值以及所述资产收益对应的第三指标参数值;将所述第一指标参数值,所述第二指标参数值以及所述第三指标参数值确定为所述目标待处理数据在所述业务盈利维度下的一组指标参数值。
在一个示例性实施例中,基于所述多组指标参数值确定出所述业务数据所指示的业务状态,包括:确定出所述多组指标参数值中的任一组指标参数值所对应的预设权重值;获取所述任一组指标参数值和所述任一组指标参数值所对应的预设权重值之间的乘积,得到多个乘积;比较所述多个乘积的和值和第一预设值;在确定所述多个乘积的和值小于所述第一预设值的情况下,将所述目标企业的业务状态确定为业务异常。
在一个示例性实施例中,基于所述多组指标参数值确定出所述业务数据所指示的业务状态,包括:从所述目标业务指标中确定出正常业务指标;其中,所述正常业务指标至少包括经营成本,所述经营成本对应的第一指标参数值小于第二预设值;确定出所述目标业务指标所包含的除了所述正常业务指标之外的其他业务指标的数量,并确定出所述其他业务指标的数量和所述目标业务指标的数量之间的比值;在确定所述比值小于第三预设值的情况下,将所述目标企业的业务状态确定为业务正常。
在一个示例性实施例中,基于所述多组指标参数值确定出所述业务数据所指示的业务状态,包括:获取对所述多组指标参数值进行归一化处理后的处理数据,其中,所述处理数据包括所述多组指标参数值中的每一组指标参数值所对应的归一化值;确定出所述每一组指标参数值所对应的归一化值中的最大值和最小值,并获取所述最大值对应的分位点和所述最小值对应的分位点之间的分位点差值;在确定所述差值大于第四预设值的情况下,将所述目标企业的业务状态确定为业务异常。
在一个示例性实施例中,基于所述多组指标参数值确定出所述业务数据所指示的业务状态之后,所述方法还包括:在确定监测到的当前业务状态为业务异常的情况下,获取所述当前业务状态的当前监测时刻与开始监测时刻之间的监测时间段;如果确定所述监测时间段大于预设时间段,则对所述目标企业进行业务预警;和/或,如果确定监测到的当前业务状态为业务异常的次数大于预设次数,则对所述目标企业进行业务预警。
在一个示例性实施例中,基于预设维度对目标企业的业务数据进行分类之前,所述方法还包括:对所述业务数据进行缺失值检测,得到第一检测结果;在确定所述第一检测结果用于指示所述业务数据存在缺失值的情况下,将获取到的历史业务数据的中位数确定为所述业务数据的缺失值;在确定所述第一检测结果用于指示所述业务数据不存在缺失值的情况下,对所述业务数据进行异常值检测,得到第二检测结果;在所述第二检测结果用于指示所述业务数据存在异常值的情况下,删除所述业务数据的异常值。
根据本发明实施例的另一方面,还提供了一种数据处理装置,包括:数据分类模块,用于基于预设维度对目标企业的业务数据进行分类,得到多组待处理数据,其中,所述多组待处理数据对应不同的业务指标;数据处理模块,用于针对所述多组待处理数据中的每一组待处理数据,确定出所述每一组待处理数据在对应的业务指标下的一组指标参数值,得到多组指标参数值;状态确认模块,用于基于所述多组指标参数值确定出所述业务数据所指示的业务状态,其中,所述业务状态至少包括以下之一:业务正常,业务异常。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述数据处理方法。
根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述数据处理方法。
通过本发明,可以根据预设维度将企业的业务数据分类得到与不同的业务指标对应的多组待处理数据,对多组待处理数据进行处理得到与业务指标对应的多组指标参数值,进而根据多组指标参数值判断企业的业务状态。采用上述技术方案,解决了如何提高企业业务数据的处理效率的技术问题,进而可以实现提高企业业务数据的处理效率的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示例性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是执行本发明实施例的数据处理方法的计算机终端的硬件结构框图;
图2是根据本发明实施例的数据处理方法的流程图;
图3是根据本发明实施例的指标参数值分布示意图;
图4是根据本发明实施例的业务异常识别示意图;
图5是根据本发明实施例的数据处理方法的示意图;
图6是根据本发明实施例的数据处理装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语和“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例中所提供的方法实施例可以在计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是执行本发明实施例的数据处理方法的计算机终端的硬件结构框图。如图1所示,计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器(Microprocessor Unit,简称是MPU)或可编程逻辑器件(Programmable logic device,简称是PLD)和设置为存储数据的存储器104,在一个示例性实施例中,上述计算机终端还可以包括设置为通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示等同功能或比图1所示功能更多的不同的配置。
存储器104可设置为存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的数据处理方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106设置为经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其设置为通过无线方式与互联网进行通讯。
在本实施例中提供了一种数据处理方法,图2根据本发明实施例的数据处理方法的流程图,该流程包括如下步骤:
步骤S202,基于预设维度对目标企业的业务数据进行分类,得到多组待处理数据,其中,所述多组待处理数据对应不同的业务指标。
可选的,在上述步骤S202中,预设维度对应企业不同方面的能力,例如盈利能力,偿债能力等等。所述目标企业为待分析业务报表的企业。
步骤S204,针对所述多组待处理数据中的每一组待处理数据,确定出所述每一组待处理数据在对应的业务指标下的一组指标参数值,得到多组指标参数值。
步骤S206,基于所述多组指标参数值确定出所述业务数据所指示的业务状态,其中,所述业务状态至少包括以下之一:业务正常,业务异常。
需要说明的是,上述步骤S206中,业务异常状态包括,所述业务存在潜在异常,当存在潜在异常时可通过人工进一步分析审核。
通过上述步骤,基于预设维度对目标企业的业务数据进行分类,得到多组待处理数据,其中,多组待处理数据对应不同的业务指标;针对多组待处理数据中的每一组待处理数据,确定出每一组待处理数据在对应的业务指标下的一组指标参数值,得到多组指标参数值;基于多组指标参数值确定出业务数据所指示的业务状态,其中,业务状态至少包括以下之一:业务正常,业务异常。上述实施例解决了如何提高企业业务数据的处理效率的技术问题,进而可以实现提高企业业务数据的处理效率的效果。
在一个示例性实施例中,对于上述步骤S204中确定出所述每一组待处理数据在对应的业务指标下的一组指标参数值的实现过程,可以进一步包括:在确定所述预设维度包括业务盈利维度的情况下,从所述多组待处理数据中确定出与所述业务盈利维度对应的目标待处理数据;确定出所述目标待处理数据在所述业务盈利维度下的目标业务指标,其中,所述目标业务指标至少包括以下之一:经营成本,利息成本,资产收益;从所述目标业务指标中确定出所述经营成本对应的第一指标参数值,所述利息成本对应的第二指标参数值以及所述资产收益对应的第三指标参数值;将所述第一指标参数值,所述第二指标参数值以及所述第三指标参数值确定为所述目标待处理数据在所述业务盈利维度下的一组指标参数值。
可选的,在上述实施例中,在所述业务盈利维度下的目标业务指标还可以包括销售利润率,总资产报酬率,盈余现金保障倍数等,所述预设维度包括但不限于营运能力,长期偿债能力,短期偿债能力,成长能力等,其中,不同的预设维度分别对应多个不同的业务指标,表1给出了本实施例部分预设维度对应的业务指标示例,但不对此作出限定,其中预设维度和业务指标可根据实际业务情况设定,具体示例如表1所示:
表1
在一个示例性实施例中,上述步骤S206中基于所述多组指标参数值确定出所述业务数据所指示的业务状态的实现过程,具体包括:确定出所述多组指标参数值中的任一组指标参数值所对应的预设权重值;获取所述任一组指标参数值和所述任一组指标参数值所对应的预设权重值之间的乘积,得到多个乘积;比较所述多个乘积的和值和第一预设值;在确定所述多个乘积的和值小于所述第一预设值的情况下,将所述目标企业的业务状态确定为业务异常。
可选的,在上述实施例中,还包括在确定所述多个乘积的和值大于所述第一预设值的情况下,将所述目标企业的业务状态确定为业务正常。
可选的,在上述实施例中,多组指标参数值所对应的预设权重值可以设置为相同权重值,也可以根据指标的重要程度设置不同的权重值。例如,当预设维度仅包含业务盈利维度、营运能力维度、成长能力维度时,且第一预设值为80,其中,业务盈利维度对应的预设权重值为0.2,指标参数值为90;营运能力维度对应的预设权重值为0.3,指标参数值为60;成长能力维度对应的预设权重值为0.5,指标参数值为80。计算得到多个乘积的和值为76,小于第一预设值80,将目标企业的业务状态确定为业务异常。
需要说明的是,在上述实施例中,上述多个乘积的和值为盈利维度下的计算值,盈利越低代表对企业越不利,因此在小于所述第一预设值的情况下,将所述目标企业的业务状态确定为业务异常。若当上述多个乘积的和值为成本维度下的计算值时,成本越高代表对企业越不利,则需要在确定所述多个乘积的和值大于所述第一预设值的情况下,将所述目标企业的业务状态确定为业务异常。
在一个示例性实施例中,上述步骤S206中基于所述多组指标参数值确定出所述业务数据所指示的业务状态的实现过程,还可以包括:从所述目标业务指标中确定出正常业务指标;其中,所述正常业务指标至少包括经营成本,所述经营成本对应的第一指标参数值小于第二预设值;确定出所述目标业务指标所包含的除了所述正常业务指标之外的其他业务指标的数量,并确定出所述其他业务指标的数量和所述目标业务指标的数量之间的比值;在确定所述比值小于第三预设值的情况下,将所述目标企业的业务状态确定为业务正常。
可选的,在上述实施例中,正常业务指标为符合预期的业务指标,例如,第二预设值可以设置为第一指标参数值的历史最高值,当该指标参数值即经营成本小于历史最高值,符合预期,则确定目标业务指标正常。
可选的,在上述实施例中,例如,业务盈利维度包括经营成本,利息成本,资产收益三个指标,第三预设值为50%,在确定仅经营成本指标正常的情况下,其他业务指标与业务盈利维度下对应的业务指标的数量之间的比值为66%,大于第三预设值50%,将所述目标企业的业务状态确定为业务异常。
在一个示例性实施例中,还可以通过以下方式实现上述步骤S206中基于所述多组指标参数值确定出所述业务数据所指示的业务状态的过程,具体包括:获取对所述多组指标参数值进行归一化处理后的处理数据,其中,所述处理数据包括所述多组指标参数值中的每一组指标参数值所对应的归一化值;确定出所述每一组指标参数值所对应的归一化值中的最大值和最小值,并获取所述最大值对应的分位点和所述最小值对应的分位点之间的分位点差值;在确定所述差值大于第四预设值的情况下,将所述目标企业的业务状态确定为业务异常。
可选的,图3是根据本发明实施例的指标参数值分布示意图,以下结合图3对上述实施例中进行说明,例如,设置第四预设值为50%,当所述预设维度包含指标A至指标H,其中指标A至指标H的指标参数值进行归一化处理后的分布如图3所示,当其中的最大值指标A归一化值所处的分位点超过90%,而其中的最小值指标H归一化值所处的分位点不超过20%,最大值对应的分位点和最小值对应的分位点之间的差值大于70%,超过了第四预设值50%,则将所述目标企业的业务状态确定为业务异常。
在一个示例性实施例中,在执行上述步骤S206中基于所述多组指标参数值确定出所述业务数据所指示的业务状态之后,所述方法还包括:在确定监测到的当前业务状态为业务异常的情况下,获取所述当前业务状态的当前监测时刻与开始监测时刻之间的监测时间段;如果确定所述监测时间段大于预设时间段,则对所述目标企业进行业务预警;和/或,如果确定监测到的当前业务状态为业务异常的次数大于预设次数,则对所述目标企业进行业务预警。
在一个示例性实施例中,在执行上述步骤S202中基于预设维度对目标企业的业务数据进行分类之前,所述方法还可以包括:对所述业务数据进行缺失值检测,得到第一检测结果;在确定所述第一检测结果用于指示所述业务数据存在缺失值的情况下,将获取到的历史业务数据的中位数确定为所述业务数据的缺失值;在确定所述第一检测结果用于指示所述业务数据不存在缺失值的情况下,对所述业务数据进行异常值检测,得到第二检测结果;在所述第二检测结果用于指示所述业务数据存在异常值的情况下,删除所述业务数据的异常值。
显然,上述所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。为了更好的理解上述数据处理方法,以下结合实施例对上述过程进行说明,但不用于限定本发明实施例的技术方案,具体地:
在一个可选的实施例中,图4是根据本发明实施例的业务异常识别示意图,图4展示了业务异常识别的探索路径。具体如图4所示:
首先需要确定目标行业,然后根据成立时间、规模、组织形式等筛选出目标企业,例如选择成立日期在三年以上且资产合计在3000万以上的非管理型控股公司进行分析,然后获取企业的业务数据报表等信息,对于缺失值可以通过已获取的业务数据的中位数进行填充,异常数据可以进行剔除。之后对企业的业务数据进行分类,以本实施例为例,可以根据盈利能力,成长能力,营运能力等预设维度对业务数据进行划分得到多组指标。
可选的,对企业的业务数据进行分类之后还可以通过总结归纳同行业企业的业务数据特征,得到数据统计的计算模型,用于验证同行业的企业业务数据,进而发现存在潜在异常的业务数据,
可选的,在上述实施例中,还可以通过行业内的业务经验结合异常检测算法对上述指标数据进行检测,例如通过PyOD(Python Outlier Detection,Python异常检测工具库)中的多种异常检测算法COPOD、KNN、isdation、forest等算法以及有监督、无监督和深度学习等各种模型对上述指标数据进行异常检测,最后可以通过SHAP(Python的可解释机器学习库)定位异常原因。
通过上述实施例可以实现对企业业务数据的批量化处理,并且结合了机器学习等技术手段进行了异常检测,改善了传统人工方式仅基于业务经验分析无法发现业务数据存在的潜在异常点,经办人员也不再需要花费大量时间精力于用于业务数据的计算,可以实现有针对性的聚焦异常业务。
在一个可选的实施例中,图5是根据本发明实施例的数据处理方法的示意图,图5展示了本发明实施例判断业务异常的逻辑判断过程,具体如图5所示:
整体的业务异常判断逻辑分为3个层次,首先是不同预设维度下的具体业务指标,通过判断指标参数值所处的分为点是否处在极端值,例如低于5%分位点为极端差,或高于95%分位点为极端好,其他情况则可以视为正常状态,进而可以通过判断正常状态的指标占当前维度下所有业务指标的比例来确定当前维度是否正常,进一步的,还可以通过获取到所有预设维度对应的多组指标参数值,然后进行加权求和后与预设值进行比较,判断的企业整体业务状态。
需要说明的是,上述判断过程可以通过异常检测算法,机器学习,模型计算等方式实现。在完成企业整体业务状态的判断之后,还可以进一步的根据业务状态对企业发起风险预警信息,或者通过监控追踪等方式持续关注潜在异常。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
在本实施例中还提供了一种数据处理装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的设备较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图6是根据本发明实施例的数据处理装置的结构框图,该装置包括:
数据分类模块62,用于基于预设维度对目标企业的业务数据进行分类,得到多组待处理数据,其中,所述多组待处理数据对应不同的业务指标;
数据处理模块64,用于针对所述多组待处理数据中的每一组待处理数据,确定出所述每一组待处理数据在对应的业务指标下的一组指标参数值,得到多组指标参数值;
状态确认模块66,用于基于所述多组指标参数值确定出所述业务数据所指示的业务状态,其中,所述业务状态至少包括以下之一:业务正常,业务异常。
通过本发明实施例的业务数据的处理装置,可以基于预设维度对目标企业的业务数据进行分类,得到多组待处理数据,其中,多组待处理数据对应不同的业务指标;针对多组待处理数据中的每一组待处理数据,确定出每一组待处理数据在对应的业务指标下的一组指标参数值,得到多组指标参数值;基于多组指标参数值确定出业务数据所指示的业务状态,其中,业务状态至少包括以下之一:业务正常,业务异常。上述实施例解决了如何提高企业业务数据的处理效率的技术问题,进而可以实现提高企业业务数据的处理效率的效果。
在一个示例性实施例中,上述数据处理模块64还用于:在确定所述预设维度包括业务盈利维度的情况下,从所述多组待处理数据中确定出与所述业务盈利维度对应的目标待处理数据;确定出所述目标待处理数据在所述业务盈利维度下的目标业务指标,其中,所述目标业务指标至少包括以下之一:经营成本,利息成本,资产收益;从所述目标业务指标中确定出所述经营成本对应的第一指标参数值,所述利息成本对应的第二指标参数值以及所述资产收益对应的第三指标参数值;将所述第一指标参数值,所述第二指标参数值以及所述第三指标参数值确定为所述目标待处理数据在所述业务盈利维度下的一组指标参数值。
在一个示例性实施例中,上述状态确定模块66还用于:确定出所述多组指标参数值中的任一组指标参数值所对应的预设权重值;获取所述任一组指标参数值和所述任一组指标参数值所对应的预设权重值之间的乘积,得到多个乘积;比较所述多个乘积的和值和第一预设值;在确定所述多个乘积的和值小于所述第一预设值的情况下,将所述目标企业的业务状态确定为业务异常。
在一个示例性实施例中,上述状态确定模块66还用于:从所述目标业务指标中确定出正常业务指标;其中,所述正常业务指标至少包括经营成本,所述经营成本对应的第一指标参数值小于第二预设值;确定出所述目标业务指标所包含的除了所述正常业务指标之外的其他业务指标的数量,并确定出所述其他业务指标的数量和所述目标业务指标的数量之间的比值;在确定所述比值小于第三预设值的情况下,将所述目标企业的业务状态确定为业务正常。
在一个示例性实施例中,上述状态确定模块66还用于:获取对所述多组指标参数值进行归一化处理后的处理数据,其中,所述处理数据包括所述多组指标参数值中的每一组指标参数值所对应的归一化值;确定出所述每一组指标参数值所对应的归一化值中的最大值和最小值,并获取所述最大值对应的分位点和所述最小值对应的分位点之间的分位点差值;在确定所述差值大于第四预设值的情况下,将所述目标企业的业务状态确定为业务异常。
在一个示例性实施例中,上述状态确定模块66还用于:在确定监测到的当前业务状态为业务异常的情况下,获取所述当前业务状态的当前监测时刻与开始监测时刻之间的监测时间段;如果确定所述监测时间段大于预设时间段,则对所述目标企业进行业务预警;和/或,如果确定监测到的当前业务状态为业务异常的次数大于预设次数,则对所述目标企业进行业务预警。
在一个示例性实施例中,上述数据分类模块66还用于:对所述业务数据进行缺失值检测,得到第一检测结果;在确定所述第一检测结果用于指示所述业务数据存在缺失值的情况下,将获取到的历史业务数据的中位数确定为所述业务数据的缺失值;在确定所述第一检测结果用于指示所述业务数据不存在缺失值的情况下,对所述业务数据进行异常值检测,得到第二检测结果;在所述第二检测结果用于指示所述业务数据存在异常值的情况下,删除所述业务数据的异常值。
本发明的实施例还提供了一种存储介质,该存储介质包括存储的程序,其中,上述程序运行时执行上述任一实施例。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,基于预设维度对目标企业的业务数据进行分类,得到多组待处理数据,其中,所述多组待处理数据对应不同的业务指标。
S2,针对所述多组待处理数据中的每一组待处理数据,确定出所述每一组待处理数据在对应的业务指标下的一组指标参数值,得到多组指标参数值。
S3,基于所述多组指标参数值确定出所述业务数据所指示的业务状态,其中,所述业务状态至少包括以下之一:业务正常,业务异常。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,基于预设维度对目标企业的业务数据进行分类,得到多组待处理数据,其中,所述多组待处理数据对应不同的业务指标。
S2,针对所述多组待处理数据中的每一组待处理数据,确定出所述每一组待处理数据在对应的业务指标下的一组指标参数值,得到多组指标参数值。
S3,基于所述多组指标参数值确定出所述业务数据所指示的业务状态,其中,所述业务状态至少包括以下之一:业务正常,业务异常。
在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种数据处理方法,其特征在于,包括:
基于预设维度对目标企业的业务数据进行分类,得到多组待处理数据,其中,所述多组待处理数据对应不同的业务指标;
针对所述多组待处理数据中的每一组待处理数据,确定出所述每一组待处理数据在对应的业务指标下的一组指标参数值,得到多组指标参数值;
基于所述多组指标参数值确定出所述业务数据所指示的业务状态,其中,所述业务状态至少包括以下之一:业务正常,业务异常。
2.根据权利要求1所述的数据处理方法,其特征在于,确定出所述每一组待处理数据在对应的业务指标下的一组指标参数值,包括:
在确定所述预设维度包括业务盈利维度的情况下,从所述多组待处理数据中确定出与所述业务盈利维度对应的目标待处理数据;
确定出所述目标待处理数据在所述业务盈利维度下的目标业务指标,其中,所述目标业务指标至少包括以下之一:经营成本,利息成本,资产收益;
从所述目标业务指标中确定出所述经营成本对应的第一指标参数值,所述利息成本对应的第二指标参数值以及所述资产收益对应的第三指标参数值;
将所述第一指标参数值,所述第二指标参数值以及所述第三指标参数值确定为所述目标待处理数据在所述业务盈利维度下的一组指标参数值。
3.根据权利要求1所述的数据处理方法,其特征在于,基于所述多组指标参数值确定出所述业务数据所指示的业务状态,包括:
确定出所述多组指标参数值中的任一组指标参数值所对应的预设权重值;
获取所述任一组指标参数值和所述任一组指标参数值所对应的预设权重值之间的乘积,得到多个乘积;
比较所述多个乘积的和值和第一预设值;
在确定所述多个乘积的和值小于所述第一预设值的情况下,将所述目标企业的业务状态确定为业务异常。
4.根据权利要求2所述的数据处理方法,其特征在于,基于所述多组指标参数值确定出所述业务数据所指示的业务状态,包括:
从所述目标业务指标中确定出正常业务指标;其中,所述正常业务指标至少包括经营成本,所述经营成本对应的第一指标参数值小于第二预设值;
确定出所述目标业务指标所包含的除了所述正常业务指标之外的其他业务指标的数量,并确定出所述其他业务指标的数量和所述目标业务指标的数量之间的比值;
在确定所述比值小于第三预设值的情况下,将所述目标企业的业务状态确定为业务正常。
5.根据权利要求1所述的数据处理方法,其特征在于,基于所述多组指标参数值确定出所述业务数据所指示的业务状态,包括:
获取对所述多组指标参数值进行归一化处理后的处理数据,其中,所述处理数据包括所述多组指标参数值中的每一组指标参数值所对应的归一化值;
确定出所述每一组指标参数值所对应的归一化值中的最大值和最小值,并获取所述最大值对应的分位点和所述最小值对应的分位点之间的分位点差值;
在确定所述分位点差值大于第四预设值的情况下,将所述目标企业的业务状态确定为业务异常。
6.根据权利要求1所述的数据处理方法,其特征在于,基于所述多组指标参数值确定出所述业务数据所指示的业务状态之后,所述方法还包括:
在确定监测到的当前业务状态为业务异常的情况下,获取所述当前业务状态的当前监测时刻与开始监测时刻之间的监测时间段;
如果确定所述监测时间段大于预设时间段,则对所述目标企业进行业务预警;
和/或,如果确定监测到的当前业务状态为业务异常的次数大于预设次数,则对所述目标企业进行业务预警。
7.根据权利要求1所述的数据处理方法,其特征在于,基于预设维度对目标企业的业务数据进行分类之前,所述方法还包括:
对所述业务数据进行缺失值检测,得到第一检测结果;
在确定所述第一检测结果用于指示所述业务数据存在缺失值的情况下,将获取到的历史业务数据的中位数确定为所述业务数据的缺失值;在确定所述第一检测结果用于指示所述业务数据不存在缺失值的情况下,对所述业务数据进行异常值检测,得到第二检测结果;
在所述第二检测结果用于指示所述业务数据存在异常值的情况下,删除所述业务数据的异常值。
8.一种数据处理装置,其特征在于,包括:
数据分类模块,用于基于预设维度对目标企业的业务数据进行分类,得到多组待处理数据,其中,所述多组待处理数据对应不同的业务指标;数据处理模块,用于针对所述多组待处理数据中的每一组待处理数据,确定出所述每一组待处理数据在对应的业务指标下的一组指标参数值,得到多组指标参数值;
状态确认模块,用于基于所述多组指标参数值确定出所述业务数据所指示的业务状态,其中,所述业务状态至少包括以下之一:业务正常,业务异常。
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7任一项中所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311474973.4A CN117522196A (zh) | 2023-11-07 | 2023-11-07 | 数据处理方法及装置、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311474973.4A CN117522196A (zh) | 2023-11-07 | 2023-11-07 | 数据处理方法及装置、存储介质及电子装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117522196A true CN117522196A (zh) | 2024-02-06 |
Family
ID=89750594
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311474973.4A Pending CN117522196A (zh) | 2023-11-07 | 2023-11-07 | 数据处理方法及装置、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117522196A (zh) |
-
2023
- 2023-11-07 CN CN202311474973.4A patent/CN117522196A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113254510B (zh) | 业务风险客群的识别方法、装置、设备及存储介质 | |
CN109491850A (zh) | 一种磁盘故障预测方法及装置 | |
CN110956224A (zh) | 评估模型生成、评估数据处理方法、装置、设备及介质 | |
CN116629577A (zh) | 一种基于大数据的智能化供应链管理系统 | |
US11689555B2 (en) | Systems and methods for cybersecurity risk mitigation and management | |
CN112470131B (zh) | 检测数据集中异常的装置和方法以及它们相应的计算机程序产品 | |
US11258659B2 (en) | Management and control for IP and fixed networking | |
CN116485020B (zh) | 一种基于大数据的供应链风险识别预警方法、系统及介质 | |
CN111709828A (zh) | 一种资源处理方法、装置、设备及系统 | |
CN116915710A (zh) | 流量预警方法、装置、设备及可读存储介质 | |
CN114202256A (zh) | 架构升级预警方法、装置、智能终端及可读存储介质 | |
CN117495512B (zh) | 订单数据的管理方法、装置、设备及存储介质 | |
CN114138601A (zh) | 一种业务告警方法、装置、设备及存储介质 | |
JP7367196B2 (ja) | レジーム・シフトの識別及び分析のための方法及びシステム | |
Jiang et al. | [Retracted] Research on Intelligent Prediction Method of Financial Crisis of Listed Enterprises Based on Random Forest Algorithm | |
CN112529319A (zh) | 基于多维特征的评分方法、装置、计算机设备及存储介质 | |
WO2012030419A1 (en) | Organization resource allocation based on forecasted change outcomes | |
CN117522196A (zh) | 数据处理方法及装置、存储介质及电子装置 | |
CN116738348A (zh) | 设备状态评价方法及相关设备 | |
CN115423488A (zh) | 烟草销售串烟风险预测方法、装置、电子设备及存储介质 | |
CN114841590A (zh) | 供应链异常处理方法、装置、设备、存储介质及程序产品 | |
CN114356737A (zh) | 模型监测方法、设备、存储介质及计算机程序产品 | |
CN115689320A (zh) | 基站运行的健康管理方法、装置及计算机可读存储介质 | |
Dai | Identifying dissatisfied 4G customers from network indicators: a comparison between complaint and survey data | |
FI129751B (en) | Monitoring of target systems, such as communication networks or industrial processes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |