CN115049470A

CN115049470A - 数据处理方法、装置、计算机设备、存储介质和程序产品

Info

Publication number: CN115049470A
Application number: CN202210632335.XA
Authority: CN
Inventors: 洪泽慧; 尚琪林
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2022-06-07
Filing date: 2022-06-07
Publication date: 2022-09-13

Abstract

本申请涉及大数据技术领域，尤其是涉及一种数据处理方法、装置、计算机设备、存储介质和程序产品。该方法包括：对原始财务档案数据中冗余信息进行处理，得到目标财务档案数据；将目标财务档案数据输入预设的异常检测模型中，通过异常检测模型对目标财务档案数据进行异常检测，得到检测结果；若检测结果为目标财务档案数据存在异常，则获取目标财务档案数据中的异常财务档案数据；对异常财务档案数据进行核对处理，得到核对后的目标财务档案数据。采用本方法能够提高数据核对准确率和核对效率。

Description

数据处理方法、装置、计算机设备、存储介质和程序产品

技术领域

本申请涉及大数据技术领域，特别是涉及一种数据处理方法、装置、计算机设备、存储介质和程序产品。

背景技术

财务档案是指会计凭证，会计账簿和财务报告等会计核算专业资料，是记录和反映企事业单位经济业务发生情况的重要史料和证据，属于单位的重要经济档案。一个单位的财务档案可以反映该单位是否遵守财经纪律，在会计资料中有无弄虚作假、违法乱纪等行为。

相关技术中，按照财务特征决策树对企业财务档案数据进行特征分类，得到财务特征类型信息，再将财务特征类型信息与财务管理服务云平台进行服务匹配，得到财务应用信息，通过财务分析处理模型对财务特征类型信息和财务应用信息进行分析，得到财务数据处理结果，将企业财务档案数据信息、财务特征类型信息和财务数据处理结果直接存储至财务档案中。

但是，相关技术的方法数据核对准确率和核对效率较低。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高数据核对准确率和核对效率的数据处理方法、装置、计算机设备、存储介质和程序产品。

第一方面，本申请提供了一种数据处理方法，该方法包括：

对原始财务档案数据中冗余信息进行处理，得到目标财务档案数据；

将目标财务档案数据输入预设的异常检测模型中，通过异常检测模型对目标财务档案数据进行异常检测，得到检测结果；

若检测结果为目标财务档案数据存在异常，则获取目标财务档案数据中的异常财务档案数据；

对异常财务档案数据进行核对处理，得到核对后的目标财务档案数据。

在其中一个实施例中，对原始财务档案数据中冗余信息进行处理，得到目标财务档案数据，包括：

根据原始财务档案数据的所属部门对原始财务档案数据进行分类，得到多组财务档案数据；

对多组财务档案数据进行分析对比，滤除原始财务档案数据中冗余信息，得到目标财务档案数据。

在其中一个实施例中，对多组财务档案数据进行分析对比，滤除原始财务档案数据中冗余信息，得到目标财务档案数据，包括：

对多组财务档案数据进行排序处理，得到排序后的多组财务档案数据；

通过数据分类器对排序后的多组财务档案数据进行分析对比，滤除原始财务档案数据中冗余信息，得到目标财务档案数据。

在其中一个实施例中，获取目标财务档案数据中的异常财务档案数据，包括：

根据目标财务档案数据，生成目标财务档案数据的曲线图；

将曲线图中存在突变的位置对应的财务档案数据，确定为异常财务档案数据。

在其中一个实施例中，该方法还包括：

若检测结果为不存在异常财务档案数据，将目标财务档案数据、目标财务档案数据和目标财务档案数据对应的数据标识信息之间的对应关系存储至数据库中；或者，

将核对后的目标财务档案数据、核对后的目标财务档案数据和核对后的目标财务档案数据对应的数据标识信息之间的对应关系存储至数据库中。

在其中一个实施例中，该方法还包括：

接收用户终端发送的查询请求；查询请求包括数据标识信息；

将数据标识信息与数据库中的多个数据标识信息进行匹配，若数据标识信息与数据库中的任意一个数据标识信息匹配成功，则在数据库中获取数据标识信息对应的财务档案数据。

在其中一个实施例中，异常检测模型的构建过程包括：

获取多个样本目标财务档案数据和各样本目标财务档案数据对应的样本检测结果；

将各样本目标财务档案数据输入至初始异常检测模型中，对初始异常检测模型进行训练，得到初始异常检测模型输出的测试检测结果；

若各样本检测结果与测试检测结果之间满足预设的收敛条件，确定异常检测模型训练完成，得到异常检测模型。

在其中一个实施例中，获取多个样本目标财务档案数据和各样本目标财务档案数据对应的样本检测结果，包括：

从企业内部管理数据库中获取历史预设时长内的多个历史目标财务档案数据，以及获取多个历史目标财务档案数据对应的检测结果；

将多个历史目标财务档案数据确定为样本目标财务档案数据，以及，将多个历史目标财务档案数据对应的检测结果确定为样本检测结果。

第二方面，本申请还提供了一种数据处理装置，该装置包括：

处理模块，用于对原始财务档案数据中冗余信息进行处理，得到目标财务档案数据；

检测模块，用于将目标财务档案数据输入预设的异常检测模型中，通过异常检测模型对目标财务档案数据进行异常检测，得到检测结果；

第一获取模块，用于在检测结果为目标财务档案数据存在异常的情况下，则获取目标财务档案数据中的异常财务档案数据；

核对模块，用于对异常财务档案数据进行核对处理，得到核对后的目标财务档案数据。

第三方面，本申请还提供了一种计算机设备，该计算机设备包括存储器和处理器，存储器存储有计算机程序，处理器执行计算机程序时实现上述第一方面的方法实施例中的所有内容。

第四方面，本申请还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现上述第一方面的方法实施例中的所有内容。

第五方面，本申请还提供了一种计算机程序产品，该计算机程序产品包括计算机程序，该计算机程序被处理器执行时实现上述第一方面的方法实施例中的所有内容。

上述数据处理方法、装置、计算机设备、存储介质和程序产品，该方法通过对原始财务档案数据中冗余信息进行处理，得到目标财务档案数据，将目标财务档案数据输入预设的异常检测模型中，通过异常检测模型对目标财务档案数据进行异常检测，得到检测结果，若检测结果为目标财务档案数据存在异常，则获取目标财务档案数据中的异常财务档案数据，对异常财务档案数据进行核对处理，得到核对后的目标财务档案数据。该方法通过将原始财务档案数据中的冗余信息进行处理，避免了由于冗余信息造成异常检测结果不准确，提高了异常检测的效率；通过预设的异常检测模型能够快速且准确的判断目标财务档案数据中是否存在异常，在目标财务档案数据存在异常的情况下，能够快速准确的对异常财务档案数据进行核对，提高了财务档案数据核对的准确率和核对效率。

附图说明

图1为一个实施例中数据处理方法的应用环境图；

图2为一个实施例中数据处理方法的流程示意图；

图3为一个实施例中数据处理方法的流程示意图；

图4为一个实施例中数据处理方法的流程示意图；

图5为一个实施例中数据处理方法的流程示意图；

图6为一个实施例中数据处理方法的流程示意图；

图7为一个实施例中数据处理方法的流程示意图；

图8为一个实施例中数据处理方法的流程示意图；

图9为一个实施例中数据处理方法的流程示意图；

图10为一个实施例中数据处理装置的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

需要说明的是，本申请的数据处理方法、装置、服务器、存储介质和程序产品可以应用在大数据领域，也可用于除大数据领域外的其他技术领域，本申请对数据处理方法、装置、服务器、存储介质和程序产品的应用领域不做限定。

首先，在具体介绍本申请实施例的技术方案之前，先对本申请实施例基于的技术背景进行介绍。

财务档案是指会计凭证，会计账簿和财务报告等会计核算专业资料，是记录和反映企事业单位经济业务发生情况的重要史料和证据，属于单位的重要经济档案，是检查企事业单位过去经济活动的重要依据，也是国家档案的重要组成部分。财务档案数据是对一个单位经济活动的记录和反映，通过财务档案数据，可以了解企业的每一项业务的来龙去脉。国家可以根据企业的财务档案数据检查该企业是否遵守财经纪律，在会计资料中有无弄虚作假、违法乱纪等行为。同时，财务档案数据还可以为国家、企业提供详尽的经济资料，为国家制定宏观经济政策及企业制定经营决策提供参考，财务档案数据处理过程是指连续、系统、综合地核算企业的经济业务的过程，是对企业的经济业务的数据进行加工、处理以及存储的过程，为财务信息使用者提供有用的信息，就必须对大量经济业务产生的数据进行处理。

本申请实施例提供的数据处理方法，可以应用于如图1所示的应用环境中。该服务器包括通过系统总线连接的处理器、存储器和网络接口。其中，该服务器的处理器用于提供计算和控制能力。该服务器的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该服务器的数据库用于存储数据处理过程中的数据。该服务器的网络接口用于与外部的终端通过网络连接通信。其中，服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种数据处理方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤：

S201，对原始财务档案数据中冗余信息进行处理，得到目标财务档案数据。

其中，冗余信息是指原始财务档案数据中的重复信息或多余信息。

具体的，服务器可以通过数据分类器对企业的各个部门平台的统一资源定位系统(uniform resource locator，URL)发起请求，根据该请求从财务数据库中获取xml格式的原始财务档案数据，使用Python中的lxml对xml格式的原始财务档案信息进行解析，再通过xpath定位获取所需的原始财务档案数据。

可选的，通过相关的数据分析算法对原始财务档案数据进行分析，确定原始财务档案数据中的重复数据或多余信息，滤除原始财务档案数据中的重复数据或多余信息，得到目标财务档案数据。可选的，服务器通过数据分类器将获取的原始财务档案数据按照时间进行分类，将预设时间内的原始财务财务档案数据确定为目标财务档案数据。可选的，服务器可以通过数据分类器将获取的原始财务档案数据按照原始财务档案数据所属的部门进行分类，将需要部门的财务档案数据确定为目标财务档案数据。本实施例对于对原始财务档案数据中冗余信息进行处理，得到目标财务档案数据的方式不做限定。

S202，将目标财务档案数据输入预设的异常检测模型中，通过异常检测模型对目标财务档案数据进行异常检测，得到检测结果。

具体的，预设的异常检测模型是通过大量的样本数据进行训练的，通过预设的异常检测模型可以对目标财务档案数据进行异常检测，得到目标财务档案数据的异常检测结果，该异常检测结果包括目标财务档案数据中存在异常财务档案数据，或者，目标财务档案数据中不存在异常财务档案数据。例如，当异常检测模型输出结果为0时，表示目标财务档案数据中不存在异常财务档案数据；当异常检测模型输出结果为除0外的任意正整数时，表示目标财务档案数据中存在异常财务档案数据。

S203，若检测结果为目标财务档案数据存在异常，则获取目标财务档案数据中的异常财务档案数据。

具体的，当检测结果为目标财务档案数据中存在异常的情况下，需要具体确定目标财务档案数据中的异常财务档案数据。可选的，服务器可以通过相关的异常检测算法对目标财务档案数据进行检测，确定目标财务档案数据中的异常财务档案数据。例如，该异常检测算法可以是聚类算法或孤立森林算法等。可选的，服务器可以绘制目标财务档案数据的曲线图，将该曲线图上存在异常的点对应的财务档案数据确定为目标财务档案数据中的异常财务档案数据。可选的，服务器可以将目标财务档案数据输入至预设的神经网络模型中，通过预设的神经网络模型找出目标财务档案数据中存在异常的财务档案数据，得到目标财务档案数据中的异常财务档案数据。本实施例对获取目标财务档案数据中的异常财务档案数据的方法不做限定。

S204，对异常财务档案数据进行核对处理，得到核对后的目标财务档案数据。

具体的，服务器可以根据异常财务档案数据的标识信息从财务数据库中获取影响财务档案数据的因素对应的数据，通过影响财务档案数据的因素的数据、影响财务档案数据的因素的数据与财务档案数据之间的数学关系式确定该异常财务档案数据的值是否准确，若准确，则无需对该目标财务档案数据进行修改；若不准确，则通过多次计算，确定该异常财务档案数据不准确时，则使用计算的财务档案数据替换目标财务档案数据。例如，目标财务档案数据中的利润为80元时，利润受到成本和售价的影响，当财务数据库中的成本为50元，售价为135元，则利润本应该为85元，将目标财务档案数据中的利润修改为85元。

上述数据处理方法中，该方法通过对原始财务档案数据中冗余信息进行处理，得到目标财务档案数据，将目标财务档案数据输入预设的异常检测模型中，通过异常检测模型对目标财务档案数据进行异常检测，得到检测结果，若检测结果为目标财务档案数据存在异常，则获取目标财务档案数据中的异常财务档案数据，对异常财务档案数据进行核对处理，得到核对后的目标财务档案数据。该方法通过将原始财务档案数据中的冗余信息进行处理，避免了由于冗余信息造成异常检测结果不准确，提高了异常检测的效率；通过预设的异常检测模型能够快速且准确的判断目标财务档案数据中是否存在异常，在目标财务档案数据存在异常的情况下，能够快速准确的对异常财务档案数据进行核对，提高了财务档案数据核对的准确率和核对效率。

图3为本申请实施例提供的数据处理方法的流程示意图。本申请实施例涉及对原始财务档案数据中冗余信息进行处理，得到目标财务档案数据的一种可选的实现方式。在图2所示实施例的基础上，如图3所示，上述方法可以包括如下步骤：

S301，根据原始财务档案数据的所属部门对原始财务档案数据进行分类，得到多组财务档案数据。

具体的，原始财务档案数据携带不同部门的标识信息，服务器可以根据原始财务档案数据上携带的标识信息对原始财务档案数据进行分类，将同一种标识信息的原始财务档案数据归为一类，得到多组财务档案数据。其中，企业中有N个部门时，可以得到N组财务档案数据。

S302，对多组财务档案数据进行分析对比，滤除原始财务档案数据中冗余信息，得到目标财务档案数据。

可选的，服务器可以确定多组财务档案数据中是否存在数据量相同的两组或多组财务档案数据，若存在，则将两组或多组财务档案数据的数据进行匹配，若匹配成功，则确定多组财务档案数据中存在重复信息，将两组重复财务档案数据中的任意一组财务档案数据去除，或者，将多组重复财务档案数据中的任意一组财务档案数据保留，将除该组财务档案数据之外的其他财务档案数据去除，得到目标财务档案数据。

上述数据处理方法中，该方法根据原始财务档案数据的所属部门对原始财务档案数据进行分类，得到多组财务档案数据，对多组财务档案数据进行分析对比，滤除原始财务档案数据中冗余信息，得到目标财务档案数据。该方法通过对原始财务档案数据进行分类后得到多组财务档案数据，对多组财务档案数据分别进行分析，能够快速的滤除原始财务档案数据中的冗余信息，提高了原始财务档案数据分析的效率。

图4为本申请实施例提供的数据处理方法的流程示意图。本申请实施例涉及对多组财务档案数据进行分析对比，滤除原始财务档案数据中冗余信息，得到目标财务档案数据的一种可选的实现方式。在图3所示实施例的基础上，如图4所示，上述方法可以包括如下步骤：

S401，对多组财务档案数据进行排序处理，得到排序后的多组财务档案数据。

可选的，多组财务档案数据中的每一组财务档案数据对应企业的一个部门，服务器可以按照多组财务档案数据所属部门首字母的顺序对多组财务档案数据进行排序，得到排序后的多组财务档案数据。可选的，服务器可以按照多组财务数据中的数据量大小对多组财务档案数据进行排序，可以将数据量较大的一组财务数据排在靠前的位置，将数据量较小的一组财务数据排在靠后的位置，得到排序后的多组财务档案数据。本实施例对于多组财务档案数据的排序方式不做限定。

S402，通过数据分类器对排序后的多组财务档案数据进行分析对比，滤除原始财务档案数据中冗余信息，得到目标财务档案数据。

具体的，服务器可以通过数据分类器按照多组财务档案数据的排列顺序对多组财务档案数据进行分析对比，当多组财务档案数据中存在两组重复财务档案数据时，将两组重复财务档案数据中的任意一组财务档案数据进行删除，得到目标财务档案数据；当多组财务档案数据中存在多组重复财务档案数据时，将多组重复财务档案数据中的任意一组财务档案数据保留，将除该组财务档案数据之外的其他组财务档案数据进行删除，得到目标财务档案数据。

上述数据处理方法中，该方法通过对多组财务档案数据进行排序处理，得到排序后的多组财务档案数据，通过数据分类器对排序后的多组财务档案数据进行分析对比，滤除原始财务档案数据中冗余信息，得到目标财务档案数据。该方法通过对多组财务档案进行排序，使得数据分类器能够依次对多组财务档案数据进行分析，能够快速的滤除原始财务档案数据中的冗余信息，提高了多组财务档案数据的分析效率。

图5为本申请实施例提供的数据处理方法的流程示意图。本申请实施例涉及获取目标财务档案数据中的异常财务档案数据的一种可选的实现方式。在图2所示实施例的基础上，如图5所示，上述方法可以包括如下步骤：

S501，根据目标财务档案数据，生成目标财务档案数据的曲线图。

具体的，pyecharts软件支持丰富的图表样例，且pyecharts软件的绘制结果可以直接展示在计算机设备上，可以通过pyecharts软件对目标财务档案数据进行处理，得到目标财务档案数据的曲线图。其中，目标财务档案数据对应的曲线图可以是呈线性分布的曲线，也可以是周期性分布的曲线。

S502，将曲线图中存在突变的位置对应的财务档案数据，确定为异常财务档案数据。

具体的，大部分的目标财务档案数据都分布在曲线的周围，目标财务档案数据与曲线之间的垂直距离小于预设阈值，只有当财务档案数据中存在异常财务档案数据时，该异常财务档案数据在曲线图上的点与曲线之间的垂直距离较大。因此，服务器可以查询曲线图中存在突变的位置，将该突变位置对应的财务档案数据确定为异常财务档案数据。

上述数据处理方法中，该方法根据目标财务档案数据，生成目标财务档案数据的曲线图，将曲线图中存在突变的位置对应的财务档案数据，确定为异常财务档案数据。该方法通过目标财务档案数据对应曲线图确定异常财务档案数据，将曲线图中存在突变位置的财务档案数据确定为异常财务档案数据，通过曲线图能够准确的确定目标财务档案数据中的异常财务档案数据。

可选的，本申请实施例涉及将目标财务档案数据以及核对后的目标财务档案数据存储至数据库的一种可选的实现方式。在图2所示实施例的基础上，上述方法可以包括如下步骤：若检测结果为不存在异常财务档案数据，将目标财务档案数据、目标财务档案数据和目标财务档案数据对应的数据标识信息之间的对应关系存储至数据库中；或者，将核对后的目标财务档案数据、核对后的目标财务档案数据和核对后的目标财务档案数据对应的数据标识信息之间的对应关系存储至数据库中。

具体的，服务器可以通过开源的MySql数据库构建存储财务档案数据的数据库Course，将目标财务档案数据、目标财务档案数据和目标财务档案数据对应的数据标识信息之间的对应关系、核对后的目标财务档案数据、核对后的目标财务档案数据和核对后的目标财务档案数据对应的数据标识信息之间的对应关系导入至数据库Course中进行存储。例如，将目标财务档案数据、目标财务档案数据和目标财务档案数据对应的数据标识信息之间的对应关系、核对后的目标财务档案数据、核对后的目标财务档案数据和核对后的目标财务档案数据对应的数据标识信息之间的对应关系存储至item字典中，在pipelines.py文件中编写类CsdnPipeline，在类的__init__方法中建立和数据存储库的连接，并将封装在item字典中的财务档案数据插入数据库Course。

进一步的，可以理解的是，服务器可以将数据库中的目标财务档案数据和核对后的目标财务档案数据上传至云端，保证了财务档案数据的安全。

上述数据处理方法中，在检测结果为不存在异常财务档案数据的情况下，将目标财务档案数据、目标财务档案数据和目标财务档案数据对应的数据标识信息之间的对应关系存储至数据库中；或者，将核对后的目标财务档案数据、核对后的目标财务档案数据和核对后的目标财务档案数据对应的数据标识信息之间的对应关系存储至数据库中。该方法将目标财务档案数据以及更新后的目标财务档案数据存储至数据库中，保证了目标财务档案数据的准确性；同时，将目标财务档案数据与数据标识之间的对应关系也存储至数据库中，方便管理人员根据数据标识从数据库中获取财务档案数据，提高了财务档案数据的检索效率。

图6为本申请实施例提供的数据处理方法的流程示意图。本申请实施例涉及查询财务档案数据的一种可选的实现方式。在图2所示实施例的基础上，如图6所示，上述方法还可以包括如下步骤：

S601，接收用户终端发送的查询请求；查询请求包括数据标识信息。

其中，查询请求是指用户根据需要查询的内容，发起的查询请求。

具体的，查询请求中包括查询内容对应的标识信息，该标识信息和查询内容是一一对应的关系，标识信息可以包括关键字标识信息或财务档案数据的生成时间标识信息。例如，查询内容为2号的财务档案数据，对应的数据标识信息可以为2d；查询内容为1月的财务档案数据，对应的数据标识信息可以为1m，查询内容为2021年的财务档案数据，对应的数据标识信息可以为2021y，查询内容为2021年1月2号的财务档案数据，对应的数据标识信息就是2021y1m2d。

可选的，当用户需要查询某些财务档案数据时，用户可以在终端设备的界面上输入一些关键字，或者，用户还可以在终端设备上输入文本，终端设备可以在该文本内容中自动提取文本内容对应的关键字，或者，用户还还可以向终端设备输入语音，终端设备可以通过内置的语音转换器将语音转换为文本，从该文本内容中自动提取文本内容对应的关键字，终端根据得到的关键字生成查询请求。本实施例中对用户向终端发送查询请求的方式不做限定。服务器接收到终端发送的查询请求后，对该查询请求进行解析，获取查询请求中的标识信息。

需要说明的是，查询请求中可以包括一个关键字或一个生成时间，也可以包括多个关键字或多个生成时间，即一个查询请求可以查询到一个或多个索引，本申请实施例中不加以限制。

S602，将数据标识信息与数据库中的多个数据标识信息进行匹配，若数据标识信息与数据库中的任意一个数据标识信息匹配成功，则在数据库中获取数据标识信息对应的财务档案数据。

具体的，数据库中包括数据标识和财务档案数据之间的对应关系，可以是数据标识直接对应财务档案数据，或者，也可以是数据标识对应财务档案数据的存储地址。服务器获取到查询请求的数据标识信息后，再将查询请求的数据标识信息与数据库中的任意一个数据标识信息进行匹配，若数据标识信息与数据库中的任意一个数据标识信息匹配成功，即可以认为数据库中存在该数据标识信息对应的财务档案数据。可选的，服务器可以通过数据标识信息直接获取财务档案数据，或者，服务器可以通过数据标识信息查询到财务档案数据的存储地址，再根据财务档案数据的存储地址获取数据标识信息对应的财务档案数据。

上述数据处理方法中，该方法通过接收用户终端发送的查询请求，将数据标识信息与数据库中的多个数据标识信息进行匹配，若数据标识信息与数据库中的任意一个数据标识信息匹配成功，则在数据库中获取数据标识信息对应的财务档案数据。该方法中的查询请求包括数据标识信息，将查询请求中的数据标识与数据库中的多个数据标识信息进行匹配，在匹配成功的情况下，才可以获取数据标识对应的财务档案数据，能够更好的匹配查询请求与财务档案数据，能够提高财务档案数据的检索准确性，便于工作人员对财务档案数据的调用管理，提高了获取财务档案数据的安全性；根据查询数据的数据标识信息从数据库中获取该数据标识信息对应的财务档案数据，过程更加便捷，提高了财务档案数据的检索效率。

图7为本申请实施例提供的数据处理方法的流程示意图。本申请实施例涉及构建异常检测模型的一种可选的实现方式。在图2所示实施例的基础上，如图7所示，上述方法还可以包括如下步骤：

S701，获取多个样本目标财务档案数据和各样本目标财务档案数据对应的样本检测结果。

可选的，服务器可以根据时间标识从企业的财务数据库中获取预设的历史时长的多个样本目标财务档案数据，或者，服务器也可以根据不同部门的标识从企业的财务数据库中获取所需部门的多个样本目标财务档案数据。由于每一个样本目标财务档案数据携带有不同的电子标签，服务器可以根据样本目标财务档案数据的电子标签，从企业的财务数据库中获取各样本目标财务档案数据对应的样本检测结果。将多个样本目标财务档案数据分为两组，其中一组作为训练集，另一组作为测试集。

可选的，图8为本申请实施例提供的数据处理方法的流程示意图。本申请实施例涉及获取多个样本目标财务档案数据和各样本目标财务档案数据对应的样本检测结果的一种可选的实现方式。在图7所示实施例的基础上，如图8所示，上述方法还可以包括如下步骤：

S801，从企业内部管理数据库中获取历史预设时长内的多个历史目标财务档案数据，以及获取多个历史目标财务档案数据对应的检测结果。

具体的，历史预设时长可以是距离当前时刻1年之内，也可以是过去5年到过去3年的时间，对应的历史预设时长为1年和2年。为了保证样训练得到的异常检测模型的结果更准确，可以按照历史预设时长的时间标签从企业内部管理数据库中获取过去5年内的所有历史目标财务档案数据，根据各历史目标财务档案数据的电子标签，从企业的财务数据库中获取各历史目标财务档案数据对应的检测结果。

S802，将多个历史目标财务档案数据确定为样本目标财务档案数据，以及，将多个历史目标财务档案数据对应的检测结果确定为样本检测结果。

具体的，服务器通过步骤S801获取到多个历史目标财务档案数据和多个历史目标财务档案数据对应的检测结果后，将多个历史目标财务档案数据和多个历史目标财务档案数据对应的检测结果都作为样本数据。其中，多个历史目标财务档案数据作为样本目标财务档案数据，多个历史目标财务档案数据对应的检测结果作为样本检测结果。通过样本目标财务档案数据和样本检测结果训练异常检测模型，以使异常检测模型的准确度更高。

上述数据处理方法中，该方法从企业内部管理数据库中获取历史预设时长内的多个历史目标财务档案数据，以及获取多个历史目标财务档案数据对应的检测结果，将多个历史目标财务档案数据确定为样本目标财务档案数据，以及，将多个历史目标财务档案数据对应的检测结果确定为样本检测结果。该方法将历史预设时长内的多个历史目标财务档案数据确定为样本财务档案数据，将多个历史目标财务档案数据对应的检测结果确定为样本检测结果，该样本财务档案数据和样本检测结果的数量较多，通过多个样本训练得到的模型精确度较高。

S702，将各样本目标财务档案数据输入至初始异常检测模型中，对初始异常检测模型进行训练，得到初始异常检测模型输出的测试检测结果。

具体的，服务器可以将各样本目标财务档案数据作为样本数据，将各样本目标财务档案数据输入至初始异常检测模型中进行训练，通过初始异常检测模型对各样本目标财务档案数据进行训练，确定各样本目标财务档案数据中是否存在异常财务档案数据，输出初始异常检测模型输出的测试检测结果。其中，测试检测结果为样本目标财务档案数据中存在异常财务档案数据或样本目标财务档案数据中不存在异常财务档案数据。

S703，若各样本检测结果与测试检测结果之间满足预设的收敛条件，确定异常检测模型训练完成，得到异常检测模型。

具体的，服务器获取的各样本检测结果中80％的样本检测结果为样本目标财务档案数据中存在异常财务档案数据，通过初始异常检测模型的输出结果中78％为样本目标财务档案数据中存在异常财务档案数据，即各样本检测结果与测试检测结果之间的差值为2％，若预设的收敛条件为各样本检测结果与测试检测结果之间的差值小于等于5％，则各样本检测结果与测试检测结果之间满足预设的收敛条件，则确定异常检测模型训练完成，得到的异常检测模型的精度更高。

上述数据处理方法中，该方法通过获取多个样本目标财务档案数据和各样本目标财务档案数据对应的样本检测结果，将各样本目标财务档案数据输入至初始异常检测模型中，对初始异常检测模型进行训练，得到初始异常检测模型输出的测试检测结果，若各样本检测结果与测试检测结果之间满足预设的收敛条件，确定异常检测模型训练完成，得到异常检测模型。该方法通过多个样本目标财务档案数据和各样本目标财务档案数据对应的样本检测结果对初始异常检测模型进行训练，根据预设的收敛条件确定初始异常模型是否训练完成，以使得到的异常检测模型的检测准确度更高。

在一个实施例中，为了便于本领域技术人员的理解，以下对数据处理方法进行详细介绍，如图9所示，该方法可以包括：

S901，根据原始财务档案数据的所属部门对原始财务档案数据进行分类，得到多组财务档案数据；

S902，对多组财务档案数据进行排序处理，得到排序后的多组财务档案数据；

S903，通过数据分类器对排序后的多组财务档案数据进行分析对比，滤除原始财务档案数据中冗余信息，得到目标财务档案数据；

S904，将目标财务档案数据输入预设的异常检测模型中，通过异常检测模型对目标财务档案数据进行异常检测，得到检测结果；

S905，若检测结果为目标财务档案数据存在异常，根据目标财务档案数据，生成目标财务档案数据的曲线图；

S906，将曲线图中存在突变的位置对应的财务档案数据，确定为异常财务档案数据；

S907，对异常财务档案数据进行核对处理，得到核对后的目标财务档案数据；

S908，将核对后的目标财务档案数据、核对后的目标财务档案数据和核对后的目标财务档案数据对应的数据标识信息之间的对应关系存储至数据库中；

S909，若检测结果为不存在异常财务档案数据，将目标财务档案数据、目标财务档案数据和目标财务档案数据对应的数据标识信息之间的对应关系存储至数据库中；

S910，接收用户终端发送的查询请求；

S911，将数据标识信息与数据库中的多个数据标识信息进行匹配，若数据标识信息与数据库中的任意一个数据标识信息匹配成功，则在数据库中获取数据标识信息对应的财务档案数据。

需要说明的是，针对上述S901-S911中的描述可以参见上述实施例中相关的描述，且其效果类似，本实施例在此不再赘述。

上述数据处理方法中，该方法根据原始财务档案数据的所属部门对原始财务档案数据进行分类，得到多组财务档案数据，对多组财务档案数据进行排序处理，得到排序后的多组财务档案数据，通过数据分类器对排序后的多组财务档案数据进行分析对比，滤除原始财务档案数据中冗余信息，得到目标财务档案数据，将目标财务档案数据输入预设的异常检测模型中，通过异常检测模型对目标财务档案数据进行异常检测，得到检测结果，若检测结果为目标财务档案数据存在异常，根据目标财务档案数据，生成目标财务档案数据的曲线图，将曲线图中存在突变的位置对应的财务档案数据，确定为异常财务档案数据，对异常财务档案数据进行核对处理，得到核对后的目标财务档案数据，将核对后的目标财务档案数据、核对后的目标财务档案数据和核对后的目标财务档案数据对应的数据标识信息之间的对应关系存储至数据库中，若检测结果为不存在异常财务档案数据，将目标财务档案数据、目标财务档案数据和目标财务档案数据对应的数据标识信息之间的对应关系存储至数据库中，接收用户终端发送的查询请求，将数据标识信息与数据库中的多个数据标识信息进行匹配，若数据标识信息与数据库中的任意一个数据标识信息匹配成功，则在数据库中获取数据标识信息对应的财务档案数据。该方法通过将原始财务档案数据中的冗余信息进行处理，避免了由于冗余信息造成异常检测结果不准确，提高了异常检测的效率；通过预设的异常检测模型能够快速且准确的判断目标财务档案数据中是否存在异常，在目标财务档案数据存在异常的情况下，能够快速准确的对异常财务档案数据进行核对，提高了财务档案数据核对的准确率和核对效率；同时，将查询请求中的数据标识与数据库中的多个数据标识信息进行匹配，在匹配成功的情况下，才可以获取数据标识对应的财务档案数据，提高了获取财务档案数据的安全性。

应该理解的是，虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本申请实施例还提供了一种用于实现上述所涉及的数据处理方法的数据处理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个数据处理装置实施例中的具体限定可以参见上文中对于数据处理方法的限定，在此不再赘述。

在一个实施例中，如图10所示，提供了一种数据处理装置，包括：处理模块11、检测模块12、第一获取模块13和核对模块14，其中：

处理模块11，用于对原始财务档案数据中冗余信息进行处理，得到目标财务档案数据；

检测模块12，用于将目标财务档案数据输入预设的异常检测模型中，通过异常检测模型对目标财务档案数据进行异常检测，得到检测结果；

第一获取模块13，用于在检测结果为目标财务档案数据存在异常的情况下，则获取目标财务档案数据中的异常财务档案数据；

核对模块14，用于对异常财务档案数据进行核对处理，得到核对后的目标财务档案数据。

本实施例提供的数据处理装置，可以执行上述方法实施例，其实现原理和技术效果类似，在此不再赘述。

在一个实施例中，上述处理模块包括：分类单元和滤除单元，其中：

分类单元，用于根据原始财务档案数据的所属部门对原始财务档案数据进行分类，得到多组财务档案数据；

滤除单元，用于对多组财务档案数据进行分析对比，滤除原始财务档案数据中冗余信息，得到目标财务档案数据。

可选的，上述滤除单元具体用于对多组财务档案数据进行排序处理，得到排序后的多组财务档案数据；通过数据分类器对排序后的多组财务档案数据进行分析对比，滤除原始财务档案数据中冗余信息，得到目标财务档案数据。

在一个实施例中，上述第一获取模块包括：生成单元和第一确定单元，其中：

生成单元，用于根据目标财务档案数据，生成目标财务档案数据的曲线图；

第一确定单元，用于将曲线图中存在突变的位置对应的财务档案数据，确定为异常财务档案数据。

在一个实施例中，上述数据处理装置还包括存储模块，其中：

存储模块，用于在检测结果为不存在异常财务档案数据的情况下，将目标财务档案数据、目标财务档案数据和目标财务档案数据对应的数据标识信息之间的对应关系存储至数据库中；或者，

在一个实施例中，上述数据处理装置还包括：接收模块和匹配模块，其中：

接收模块，用于接收用户终端发送的查询请求；查询请求包括数据标识信息；

匹配模块，用于将数据标识信息与数据库中的多个数据标识信息进行匹配，若数据标识信息与数据库中的任意一个数据标识信息匹配成功，则在数据库中获取数据标识信息对应的财务档案数据。

在一个实施例中，上述数据处理装置还包括：第二获取模块、训练模块和确定模块，其中：

第二获取模块，用于获取多个样本目标财务档案数据和各样本目标财务档案数据对应的样本检测结果；

训练模块，用于将各样本目标财务档案数据输入至初始异常检测模型中，对初始异常检测模型进行训练，得到初始异常检测模型输出的测试检测结果；

确定模块，用于在各样本检测结果与测试检测结果之间满足预设的收敛条件的情况下，确定异常检测模型训练完成，得到异常检测模型。

在一个实施例中，上述第二获取模块包括：获取单元和第二确定单元，其中：

获取单元，用于从企业内部管理数据库中获取历史预设时长内的多个历史目标财务档案数据，以及获取多个历史目标财务档案数据对应的检测结果；

第二确定单元，用于将多个历史目标财务档案数据确定为样本目标财务档案数据，以及，将多个历史目标财务档案数据对应的检测结果确定为样本检测结果。

上述数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述方法实施例中的所有内容。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述方法实施例中的所有内容。

在一个实施例中，提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述方法实施例中的所有内容。

需要说明的是，本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，均为经用户授权或者经过各方充分授权的信息和数据。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory，ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory，MRAM)、铁电存储器(Ferroelectric Random Access Memory，FRAM)、相变存储器(Phase Change Memory，PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory，DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

Claims

1.一种数据处理方法，其特征在于，所述方法包括：

将所述目标财务档案数据输入预设的异常检测模型中，通过所述异常检测模型对所述目标财务档案数据进行异常检测，得到检测结果；

若所述检测结果为所述目标财务档案数据存在异常，则获取所述目标财务档案数据中的异常财务档案数据；

对所述异常财务档案数据进行核对处理，得到核对后的目标财务档案数据。

2.根据权利要求1所述的方法，其特征在于，所述对原始财务档案数据中冗余信息进行处理，得到目标财务档案数据，包括：

根据所述原始财务档案数据的所属部门对所述原始财务档案数据进行分类，得到多组财务档案数据；

对所述多组财务档案数据进行分析对比，滤除所述原始财务档案数据中冗余信息，得到所述目标财务档案数据。

3.根据权利要求2所述的方法，其特征在于，所述对所述多组财务档案数据进行分析对比，滤除所述原始财务档案数据中冗余信息，得到所述目标财务档案数据，包括：

对所述多组财务档案数据进行排序处理，得到排序后的多组财务档案数据；

通过数据分类器对所述排序后的多组财务档案数据进行分析对比，滤除所述原始财务档案数据中冗余信息，得到所述目标财务档案数据。

4.根据权利要求1-3任一项所述的方法，其特征在于，所述获取所述目标财务档案数据中的异常财务档案数据，包括：

根据所述目标财务档案数据，生成所述目标财务档案数据的曲线图；

将所述曲线图中存在突变的位置对应的财务档案数据，确定为所述异常财务档案数据。

5.根据权利要求1-3任一项所述的方法，其特征在于，所述方法还包括：

若所述检测结果为不存在异常财务档案数据，将所述目标财务档案数据、所述目标财务档案数据和所述目标财务档案数据对应的数据标识信息之间的对应关系存储至数据库中；或者，

将所述核对后的目标财务档案数据、所述核对后的目标财务档案数据和所述核对后的目标财务档案数据对应的数据标识信息之间的对应关系存储至所述数据库中。

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

接收用户终端发送的查询请求；所述查询请求包括数据标识信息；

将所述数据标识信息与所述数据库中的多个数据标识信息进行匹配，若所述数据标识信息与所述数据库中的任意一个数据标识信息匹配成功，则在所述数据库中获取数据标识信息对应的财务档案数据。

7.根据权利要求1-3任一项所述的方法，其特征在于，所述异常检测模型的构建过程包括：

获取多个样本目标财务档案数据和各所述样本目标财务档案数据对应的样本检测结果；

将各所述样本目标财务档案数据输入至初始异常检测模型中，对所述初始异常检测模型进行训练，得到所述初始异常检测模型输出的测试检测结果；

若各所述样本检测结果与所述测试检测结果之间满足预设的收敛条件，确定所述异常检测模型训练完成，得到所述异常检测模型。

8.根据权利要求7所述的方法，其特征在于，所述获取多个样本目标财务档案数据和各所述样本目标财务档案数据对应的样本检测结果，包括：

从企业内部管理数据库中获取历史预设时长内的多个历史目标财务档案数据，以及获取所述多个历史目标财务档案数据对应的检测结果；

将所述多个历史目标财务档案数据确定为样本目标财务档案数据，以及，将所述多个历史目标财务档案数据对应的检测结果确定为样本检测结果。

9.一种数据处理装置，其特征在于，所述装置包括：

检测模块，用于将所述目标财务档案数据输入预设的异常检测模型中，通过所述异常检测模型对所述目标财务档案数据进行异常检测，得到检测结果；

第一获取模块，用于在所述检测结果为所述目标财务档案数据存在异常的情况下，则获取所述目标财务档案数据中的异常财务档案数据；

核对模块，用于对所述异常财务档案数据进行核对处理，得到核对后的目标财务档案数据。

10.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。

12.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。