CN117422958B

CN117422958B - 基于深度学习的财务数据校验方法及系统

Info

Publication number: CN117422958B
Application number: CN202311744548.2A
Authority: CN
Inventors: 苗文婧; 隗茂虎; 刁振宇
Original assignee: Shandong Engineering Vocational and Technical University
Current assignee: Shandong Engineering Vocational and Technical University
Priority date: 2023-12-19
Filing date: 2023-12-19
Publication date: 2024-03-19
Anticipated expiration: 2043-12-19
Also published as: CN117422958A

Abstract

本发明提供了一种基于深度学习的财务数据校验方法及系统，对预处理后财务图像数据进行分割，得到多个分割后的子图像；对任一张子图像，采用预训练的文字识别模型进行文字识别，采用预训练的数字识别模型进行数字识别，将识别到的文字和数字进行组合，将组合结果与人工输入的财务数据进度对比校验，当校验结果一致时，判定人工输入的财务数据正确；当校验结果不一致时，再次对此子图像进行文字识别和数字识别并进行再次校验，当再次校验结果与首次校验结果一致时，生成校验告警信息。本发明提高了文字识别的精度和效率。

Description

基于深度学习的财务数据校验方法及系统

技术领域

本发明属于财务数据处理技术领域，具体涉及一种基于深度学习的财务数据校验方法及系统。

背景技术

在每个财务数据申报周期都需要收集录入数以千计的各行业公司财务报表，表格数量及财务金额数字量大，而在目前传统的财务业务办理过程中，信息采集仍然主要依靠业务人员的手工录入，特别是财务报表业务场景，手工录入效率低下，业务人员工作量较大，长时间录入工作易导致疲劳，并且很容易造成数据录入错误。

发明人发现，目前基于模式识别和深度学习文字识别技术日渐成熟，文字识别技术也已被运用到数据自动录入的场景，但是现有的传统识别模型中，对文字和数字进行统一训练和识别，导致识别精度较差，无法满足现有文字识别精度要求，且尤其对含有印章的文字内容识别精度更差；另，目前很多场景下为了保证数据的安全性，依然采用人工录入校核的方式进行财务数据处理，再采用人工校验的方式进行校验，效率较低且无法准确快速的识别到人工录入的错误。

发明内容

为了解决现有技术的不足，本发明提供了一种基于深度学习的财务数据校验方法及系统，结合残差神经网络，将输入特征向量与残差计算后的特征向量相加作为残差单元的输出，经一维卷积层转换为多维特征向量，取特征向量概率最大的索引值作为文字识别结果，极大提高了文字识别的精度和效率。

为了实现上述目的，本发明采用如下技术方案：

第一方面，本发明提供了一种基于深度学习的财务数据校验方法，该方法包括以下过程：

获取待处理的财务图像数据并进行预处理，对预处理后财务图像数据进行分割，得到多个分割后的子图像；

对任一张子图像，采用预训练的文字识别模型进行文字识别，采用预训练的数字识别模型进行数字识别，将识别到的文字和数字进行组合，将组合结果与人工输入的财务数据进行对比校验，当校验结果一致时，判定人工输入的财务数据正确；

当校验结果不一致时，再次对所述的任一张子图像进行文字识别和数字识别并进行再次校验，当再次校验结果与首次校验结果一致时，生成校验告警信息；

其中，预训练的文字识别模型中，经过卷积层提取的特征向量输入残差单元，将输入的特征向量与残差计算后的特征向量相加作为残差单元的输出，经一维卷积层转换为多维特征向量，取特征向量概率最大的索引值作为文字识别结果。

作为本发明第一方面进一步的限定，残差单元包括依次连接的1×1卷积层、BatchNorm & ReLu层、3×3卷积层、Batch Norm & ReLu层以及Batch Norm层。

作为本发明第一方面进一步的限定，特征向量的提取，包括依次连接的第一卷积层、第二卷积层、第一最大池化层、第三卷积层、第四卷积层、第二最大池化层、第五卷积层、第六卷积层、第七卷积层、第八卷积层、第九卷积层、第一全连接层和第一Softmax层。

作为本发明第一方面进一步的限定，预训练的数字识别模型，包括依次连接的第十卷积层、第十一卷积层、第三最大池化层、第十二卷积层、第十三卷积层、第四最大池化层、第十四卷积层、第十五卷积层、第二全连接层和第二Softmax层。

第二方面，本发明提供了一种基于深度学习的财务数据校验系统。

一种基于深度学习的财务数据校验系统，包括：

图像分割模块，被配置为：获取待处理的财务图像数据并进行预处理，对预处理后财务图像数据进行分割，得到多个分割后的子图像；

语义识别模块，被配置为：对任一张子图像，采用预训练的文字识别模型进行文字识别，采用预训练的数字识别模型进行数字识别，将识别到的文字和数字进行组合，将组合结果与人工输入的财务数据进行对比校验，当校验结果一致时，判定人工输入的财务数据正确；

校验告警模块，被配置为：当校验结果不一致时，再次对所述的任一张子图像进行文字识别和数字识别并进行再次校验，当再次校验结果与首次校验结果一致时，生成校验告警信息；

其中，预训练的文字识别模型中，经过卷积层提取的特征向量输入残差单元，将输入特征向量与残差计算后的特征向量相加作为残差单元的输出，经一维卷积层转换为多维特征向量，取特征向量概率最大的索引值作为文字识别结果。

作为本发明第二方面进一步的限定，残差单元包括依次连接的1×1卷积层、BatchNorm & ReLu层、3×3卷积层、Batch Norm & ReLu层以及Batch Norm层。

作为本发明第二方面进一步的限定，特征向量的提取，包括依次连接的第一卷积层、第二卷积层、第一最大池化层、第三卷积层、第四卷积层、第二最大池化层、第五卷积层、第六卷积层、第七卷积层、第八卷积层、第九卷积层、第一全连接层和第一Softmax层。

作为本发明第二方面进一步的限定，预训练的数字识别模型，包括依次连接的第十卷积层、第十一卷积层、第三最大池化层、第十二卷积层、第十三卷积层、第四最大池化层、第十四卷积层、第十五卷积层、第二全连接层和第二Softmax层。

第三方面，本发明提供了一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时实现如本发明第一方面所述的基于深度学习的财务数据校验方法。

第四方面，本发明提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的程序，所述处理器执行所述程序时实现如本发明第一方面所述的基于深度学习的财务数据校验方法。

与现有技术相比，本发明的有益效果是：

提出了一种基于深度学习的财务数据校验策略，结合残差神经网络，将输入特征向量与残差计算后的特征向量相加作为残差单元的输出，经一维卷积层转换为多维特征向量，取特征向量概率最大的索引值作为文字识别结果，提高了文字识别的精度和效率；当校验结果不一致时，再次对此子图像进行文字识别和数字识别并进行再次校验，当再次校验结果与首次校验结果一致时，生成校验告警信息，避免了单次检验带来的错误识别风险，提高了检验告警精度。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1为本发明实施例1所述的基于深度学习的财务数据校验方法流程图。

图2为本发明实施例2所述的基于深度学习的财务数据校验系统功能原理框图。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

实施例1

如图1所示，本发明实施例1提供了一种基于深度学习的财务数据校验方法，包括以下步骤：

步骤S1：获取待处理的财务图像数据并进行预处理，对预处理后财务图像数据进行分割，得到多个分割后的子图像；

步骤S2：对任一张子图像，采用预训练的文字识别模型进行文字识别，采用预训练的数字识别模型进行数字识别，将识别到的文字和数字进行组合，将组合结果与人工输入的财务数据进行对比校验，当校验结果一致时，判定人工输入的财务数据正确；

步骤S3：当校验结果不一致时，再次对此子图像进行文字识别和数字识别并进行再次校验，当再次校验结果与首次校验结果一致时，生成校验告警信息。

步骤S1中，具体的，财务图像可以是财务发票数据，也可以是财务合同数据，当然这里的财务发票数据和/或财务合同数据最好是信息固定的制式发票或者制式合同，如果为非制式合同或者制式发票，则需要经过更多次的模型训练，其模型训练方法及步骤均为本技术领域常规的模型训练方法，在此不再赘述。

本实施例中，采用的图像分割算法对待识别区域进行识别并分割，以用于后续的文字识别和数字识别，这里的分割算法采用常规算法对特定的位置进行识别并分割即可，例如采用基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法或基于特定理论的分割方法，上述算法具体的算法步骤在此不再赘述。

本实施例中，财务图像数据的预处理方法，包括图像锐化处理，也可以包括图像增强处理等以提高清晰度，图像锐化处理以及图像增强处理的方法步骤均为本领域常规技术方法，具体的预处理步骤在此不再赘述。

步骤S2中，预训练的文字识别模型中，具体的，经过卷积层提取的特征向量输入残差单元，将输入特征向量与残差计算后的特征向量相加作为残差单元的输出，经一维卷积层转换为多维特征向量，取特征向量概率最大的索引值作为文字识别结果。

更具体的，残差单元包括依次连接的1×1卷积层、Batch Norm & ReLu层、3×3卷积层、Batch Norm & ReLu层以及Batch Norm层。

更具体的，对于特征向量的提取，包括依次连接的第一卷积层、第二卷积层、第一最大池化层、第三卷积层、第四卷积层、第二最大池化层、第五卷积层、第六卷积层、第七卷积层、第八卷积层、第九卷积层、第一全连接层和第一Softmax层。

在进行字符识别的过程中，对无法识别的特殊字采用“-”替代，按照规则去掉重复字符和间隔字符，如果同一字符连续出现，则表示字符重复，保留1个字符，如果中间有间隔字符，则表示该字符不重复，保留所有字符。

步骤S2中，预训练的数字识别模型，具体的，包括依次连接的第十卷积层、第十一卷积层、第三最大池化层、第十二卷积层、第十三卷积层、第四最大池化层、第十四卷积层、第十五卷积层、第二全连接层和第二Softmax层。

本实施例，还对印章图像中的文字和数字进行识别，首先进行印章图像的处理，具体包括：

采用极坐标变换法将截取的圆形印章文字拉伸至水平，首先，根据模型输出的印章位置确定印章的中心点位置(x，y)和半径r，然后将直角坐标系转化为极坐标系；

根据原图像分别计算出缩放比例：

（1）；

（2）；

式中：src.cols为原图像的长，src.rows为原图像的宽，maxRadius为最大圆半径，然后根据缩放比例计算出极坐标系下点的坐标，经过变换后的图像采用上述预训练的文字识别模型和数字识别模型进行识别，得到最终的印章数据识别结果。

本实施例中，采用10000张训练图片和3000张测试图片，将训练集按照8：1：1比例划分为训练集、验证集和测试集，划分后的仅使用训练集进行模型训练，之后使用验证集和测试集分别微调文字识别模型和数字识别模型。

实施例2

如图2所示，本发明实施例2提供了一种基于深度学习的财务数据校验系统，包括：

文字识别模型中，残差单元包括依次连接的1×1卷积层、Batch Norm & ReLu层、3×3卷积层、Batch Norm & ReLu层以及Batch Norm层。

文字识别模型中，特征向量的提取，包括依次连接的第一卷积层、第二卷积层、第一最大池化层、第三卷积层、第四卷积层、第二最大池化层、第五卷积层、第六卷积层、第七卷积层、第八卷积层、第九卷积层、第一全连接层和第一Softmax层。

数字识别模型中，包括依次连接的第十卷积层、第十一卷积层、第三最大池化层、第十二卷积层、第十三卷积层、第四最大池化层、第十四卷积层、第十五卷积层、第二全连接层和第二Softmax层。

更具体的各个模块的工作方法如实施例1所述，在此不再赘述。

实施例3

本发明实施例3提供了一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时实现如本发明实施例1所述的基于深度学习的财务数据校验方法。

实施例4

本发明实施例4提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的程序，所述处理器执行所述程序时实现如本发明实施例1所述的基于深度学习的财务数据校验方法。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器和光学存储器等）上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备（系统）、和计算机程序产品的流程图和/或方框图中来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图中一个流程或多个流程和/或方框图中一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图中一个流程或多个流程和/或方框图中一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图中一个流程或多个流程和/或方框图中一个方框或多个方框中指定的功能的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体（Read-Only Memory，ROM）或随机存储记忆体（Random AccessMemory，RAM）等。

以上所述仅为本发明的优选实施例，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于深度学习的财务数据校验方法，其特征在于，包括以下过程：

其中，预训练的文字识别模型中，经过卷积层提取的特征向量输入残差单元，将输入特征向量与残差计算后的特征向量相加作为残差单元的输出，经一维卷积层转换为多维特征向量，取特征向量概率最大的索引值作为文字识别结果；

残差单元包括依次连接的1×1卷积层、Batch Norm & ReLu层、3×3卷积层、BatchNorm & ReLu层以及Batch Norm层；

特征向量的提取，包括依次连接的第一卷积层、第二卷积层、第一最大池化层、第三卷积层、第四卷积层、第二最大池化层、第五卷积层、第六卷积层、第七卷积层、第八卷积层、第九卷积层、第一全连接层和第一Softmax层；

预训练的数字识别模型，包括依次连接的第十卷积层、第十一卷积层、第三最大池化层、第十二卷积层、第十三卷积层、第四最大池化层、第十四卷积层、第十五卷积层、第二全连接层和第二Softmax层；

在进行字符识别的过程中，对无法识别的特殊字采用“-”替代，按照规则去掉重复字符和间隔字符，如果同一字符连续出现，则表示字符重复，保留1个字符，如果中间有间隔字符，则表示该字符不重复，保留所有字符；

对印章图像中的文字和数字进行识别，首先进行印章图像的处理，具体包括：

根据原图像分别计算出缩放比例：

；

2.一种基于深度学习的财务数据校验系统，其特征在于，包括：

语义识别模块，被配置为：对任一张子图像，采用预训练的文字识别模型进行文字识别，采用预训练的数字识别模型进行数字识别，将识别到的文字和数字进行组合，将组合结果与人工输入的财务数据进度对比校验，当校验结果一致时，判定人工输入的财务数据正确；

校验告警模块，被配置为：当校验结果不一致时，再次对此子图像进行文字识别和数字识别并进行再次校验，当再次校验结果与首次校验结果一致时，生成校验告警信息；

根据原图像分别计算出缩放比例：

；

3.一种计算机可读存储介质，其上存储有程序，其特征在于，该程序被处理器执行时实现如权利要求1所述的基于深度学习的财务数据校验方法。

4.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的程序，其特征在于，所述处理器执行所述程序时实现如权利要求1任一项所述的基于深度学习的财务数据校验方法。