CN110472524B

CN110472524B - 基于深度学习的发票信息管理方法、系统和可读介质

Info

Publication number: CN110472524B
Application number: CN201910677692.6A
Authority: CN
Inventors: 邱泽源; 杨志景; 兰上炜; 邱煜佳; 陈怡雯
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2019-07-25
Filing date: 2019-07-25
Publication date: 2022-09-13
Anticipated expiration: 2039-07-25
Also published as: CN110472524A

Abstract

本发明一种基于深度学习的发票信息采集管理系统及方法，方案如下：通过预先手工标注发票图片的感兴趣区域，作为卷积神经网络的训练样本，将发票的扫描件输入计算机，计算机首先由检测模块，得出感兴趣区域，再由字符识别模块将信息提取出来并转化为数据信息，系统自适应地将所有信息分类，最后得出一个Excel表格，供财务人员进行信息输入以及财务报账操作。本发明将传统的纸质发票，自动提取关键信息，生成Excel表格供财务人员进行报账，极大的减轻了传统财务工作流程中财务人员发票信息录入、报账审核等流程的工作量，节约了大量的人力资源。

Description

基于深度学习的发票信息管理方法、系统和可读介质

技术领域

本发明涉及到发票信息采集管理技术领域，更具体的，涉及一种基于深度学习的发票信息管理方法、系统和可读介质。

背景技术

传统的财务报销系统，需要财务人员收集发票，人工识别需要报销的费用类别、金额，并在电脑录入信息，传统的手工录入信息过于费时费力，财务人员需要耗费大量的时间在这一类重复性的工作上。

公开号CN109344838A的发明专利《发票信息自动快速识别方法、系统以及装置》公开了利用神经网络进行图片文字识别的技术方案，但并未有进一步将发票的有效信息单独提取出来，形成信息管理系统以解决财务人员传统报账的人力成本问题。

公开号CN109657665A的发明专利《一种基于深度学习的发票批量自动识别系统》公开了根据粗定位和细定位策略定位出目标区域，再进行字符识别的技术方案，但是这种定位策略在现实操作中往往因为发票打印信息的位置的不确定性，难以取得令人满意的信息采集准确率。

发明内容

针对现有解决方案中并未有可将发票的有效信息单独提取出来，形成信息管理系统以解决财务人员传统报账的人力成本的问题。

本发明第一方面公开一种基于深度学习的发票信息管理方法，包括以下步骤：

S1.通过发票扫描模块对纸质版发票进行扫描，收集转化为图片格式的发票图片数据；

S2.纠正预处理模块识别发票图片并进行边缘检测，若发票图片边缘倾斜的角度大于预设的阈值，将该发票图片进行角度偏移纠正；否则不进行操作；

S3.检测模块收集步骤S2的发票图片进行批注，根据所需要提取信息的特征不同，对需要提取的信息点进行相应的类别标签批注；并将标注好的数据放入Faster-Rcnn神经网络进行训练；将目标发票图片放入训练好的模型之中，对目标发票图片的目标框标签类别、目标框大小、目标框中心点坐标进行预测并得到目标发票图片上所有感兴趣信息的目标框字符信息；

S4.验证模块检测目标发票图片是否有发票抬头盖章信息，判断发票的真伪，若目标发票图片没有发票抬头盖章信息，则定义为可疑发票则将发出警示，提醒进行人工检核；

S5.字符识别模块识别目标发票图片的目标框的坐标信息，将目标框每一个信息的片段切割出来，将所有目标框的信息片段排成一竖列放入提前训练好的字符识别神经网络，将每个片段的图片信息转化为文本信息；

S6.信息分类及定位模块，计算目标发票图片中各个目标框的中心点的位置信息与目标框大小，与神经网络的训练数据进行对比，判断是否与训练结果一致，若一致则进入S7，否则提醒进行人工核验；

S7.输出模块将该目标框经过字符识别所得到的文本信息分类在相应的信息类别中并进行输出。

在一种优选方案中，所述的类别标签包括5类，类别标签1为发票抬头印章；2为发票编号；3为医院收费印章；4为诊疗类别以及患者性别信息；5为就诊科室以及详细费用类别名称与缴费方式。

在一种优选方案中，所述的S3具体步骤如下：

S31.将收集到的发票图片，根据信息特征进行批注，将需要提取的信息点分成5类标签类别进行标注，每个发票图片创建一个XML文件，该XML文件包含发票图片所有标注目标框的位置信息和标签信息；

S32.将标注好的发票图片放进Faster-Rcnn神经网络内进行训练，其中发票图片随机分配作为训练集与验证集，得到训练图片的目标框大小与目标框的中心点坐标信息；

S33.将目标发票图片经过S1、S2步骤后输入到训练好的Faster-Rcnn神经网络之中，Faster-Rcnn神经网络通过神经网络的训练结果，学习相应训练图片标签类别的特征信息，并对目标发票图片的标签类别、目标框大小、目标框中心点坐标进行预测；

S34.Faster-Rcnn神经网络通过注意力机制，将锚点覆盖整张图片，然后根据神经网络的反馈，通过不断改变锚点的长宽比和位置，最终得出使神经网络损失最小的一个锚点并将该锚点作为输出，当神经网络判断该输出锚点是目标框的概率超过预设的阈值，则将该锚点输出，得到目标发票图片中所有的目标框，以及目标框的位置坐标信息和标签信息。

在一种优选方案中，所述的S5具体步骤如下：

S51.字符识别模块识别目标发票图片中目标框的位置坐标信息，将每一个目标框从图片中切割成若干个目标片段，将背景信息去除；

S52.将所有目标片段排成一竖列放入提前训练好的字符识别神经网络，得出每个目标框的字符识别结果，将每个片段的图片信息转化为文本信息，记录在目标图片的XML文件中。

在一种优选方案中，所述的S6的具体步骤如下：

S61.计算目标发票信息中所有目标框的中心点坐标与目标框的端点坐标；

S62.根据每个目标框的中心点和端点坐标信息，计算出各个目标框的长宽；

S63.对比目标发票图片和训练图片判断目标发票的目标框大小、目标框中心点坐标是否与S33预测结果一致；若一致则进入S7，若不一致则发出警示，提醒进行人工检核。

在一种优选方案中，所述的S7的具体步骤如下:

建立一个EXCEL文件，对目标发票图片的XML文件进行收集，将目标发票图片经过转换的文本信息对应列入EXCEL文件中，输出目标发票图片所有关键信息。

本发明第二方面公开一种基于深度学习的发票信息管理系统，基于上述的基于深度学习的发票信息管理方法，包括

发票扫描模块，将纸质版的发票原件经过外设镜头设备的扫描，转化为图片格式文件，将图片文件上传至系统进行进一步的处理；

纠正预处理模块，识别发票图片并进行边缘检测，若发票图片边缘倾斜的角度大于预设的阈值，将该发票图片进行角度偏移纠正；否则不进行操作；

检测模块，前期人工将收集到的发票图片数据进行标注，根据所需要提取信息的特征不同，将需要提取的信息点，进行相应的类别标签批注；并将标注好的数据放入Faster-Rcnn神经网络进行训练，将目标发票图片放入训练好的模型之中，得到目标发票图片上所有感兴趣信息的目标框信息；

验证模块检测图片是否有发票抬头盖章信息，判断发票的真伪；

字符识别模块识别目标框的坐标信息，将目标框每一个信息的片段切割出来，将所有目标框的信息片段排成一竖列放入提前训练好的字符识别神经网络，将每个片段的图片信息转化为文本信息；

信息分类模块，将类别标签为1的目标框，根据该目标框的长宽，自动推算出发票图片中需要提取的不同类别的信息的区域位置。计算所有目标框在发票图片中的中心点的位置信息；

输出模块，若目标框的中心点坐标在相应的区域位置中，则将该目标框经过字符识别所得到的文本信息分类在相应的信息类别中，最后得到一个包含发票图片中所有关键信息的Excel表格。

本发明第三方面公开一种计算机可读介质，所述计算机可读介质中包括基于深度学习的发票信息管理方法程序，所述基于深度学习的发票信息管理方法程序被基于深度学习的发票信息管理系统执行时，实现上述的基于深度学习的发票信息管理方法的步骤。

与现有技术相比，本发明的有益效果为：

本发明利用Faster-Rcnn神经网络，准确地检测出发票图片中财务人员报账所需要的信息字段，对于遮挡，模糊，倾斜等情况的发票具有较强的鲁棒性，弥补了传统方法通过推断信息位置再进行字符识别的技术方案，导致信息准确率不高的缺点。

本发明将传统的纸质发票，自动提取关键信息，生成Excel表格供财务人员进行报账，极大的减轻了传统财务工作流程中财务人员发票信息录入、报账审核等流程的工作量，节约了大量的人力资源。

附图说明

图1为本发明提出的一种基于深度学习的发票信息管理方法的流程图；

图2为实施例1中纸质发票扫描的发票图片示意图；

图3为实施例1中进行手工批注后的批注示意图；

图4为实施例1中的神经网络对目标发票图片的目标框大小及位置进行预测示意图；

图5为实施例1中的输出文件示意图；

图6为实施例1提供的神经网络的具体组成图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，仅用于示例性说明，不能理解为对本专利的限制。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合附图和实施例对本发明的技术方案做进一步的说明。

实施例1

如图1所示，本发明第一方面公开一种基于深度学习的发票信息管理方法，包括以下步骤：

S1.通过发票扫描模块对纸质版发票进行扫描，收集转化为图片格式的发票图片数据，如图2所示，；

S3.检测模块收集的1000张发票图片使用工具Imglabel进行批注，根据所需要提取信息的特征不同，将需要提取的信息点，进行相应的类别标签批注，如图3所示；并将标注好的数据放入Faster-Rcnn神经网络进行训练，随机分配800张发票图片作为训练集，200张发票图片作为验证集，具体的神经网络如图6所示；将目标发票图片将目标发票图片放入训练好的模型之中，对目标发票图片的标签类别、目标框大小、目标框中心点坐标进行预测并得到目标发票图片上所有感兴趣信息的目标框信息；所述的目标框信息的坐标位置信息以及该目标框由神经网络判断出来的标签类别信息；

在一种优选方案中，所述的S3具体步骤如下：

S33.将目标发票图片经过S1、S2步骤后输入到训练好的神经网络之中，分类神经网络通过神经网络的训练结果，学习相应训练图片标签类别的特征信息，并对目标发票图片的标签类别、目标框大小、目标框中心点坐标进行预测，如图4所示；

S34.神经网络通过注意力机制，将锚点覆盖整张图片，然后根据神经网络的反馈，通过不断改变锚点的长宽比和位置，最终得出使神经网络损失最小的一个锚点并将该锚点作为输出，当神经网络判断该输出锚点是目标框的概率超过预设的阈值，其阈值设为0.5，则将该锚点输出，得到目标发票图片中所有的目标框，以及目标框的位置坐标信息和标签信息。

在一种优选方案中，所述的S5具体步骤如下：

在一种优选方案中，所述的S6的具体步骤如下：

在一种优选方案中，所述的S7的具体步骤如下:

首先建立一个EXCEL文件，对目标发票图片的XML文件进行收集，将目标发票图片经过转换的文本信息对应列入EXCEL文件中，如图5所示，输出目标发票图片所有关键信息。

实施例2

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种基于深度学习的发票信息管理方法，其特征在于，包括以下步骤：

S7.输出模块将该目标框经过字符识别所得到的文本信息分类在相应的信息类别中并进行输出；

所述的类别标签包括5类，其中类别标签1为发票抬头印章；2为发票编号；3为医院收费印章；4为诊疗类别以及患者性别信息；5为就诊科室以及详细费用类别名称与缴费方式；

所述的S3具体步骤如下：

S34.Faster-Rcnn神经网络通过注意力机制，将锚点覆盖整张图片，根据神经网络的反馈，通过不断改变锚点的长宽比和位置，最终得出使神经网络损失最小的一个锚点并将该锚点作为输出，当神经网络判断该输出锚点是目标框的概率超过预设的阈值，则将该锚点输出，得到目标发票图片中所有的目标框，以及目标框的位置坐标信息和标签信息；

所述的S6的具体步骤如下：

2.根据权利要求1所述的基于深度学习的发票信息管理方法，其特征在于，所述的S5具体步骤如下：

3.根据权利要求1所述的基于深度学习的发票信息管理方法，其特征在于，所述的S7的具体步骤如下:

4.一种基于深度学习的发票信息管理系统，基于权利要求1-3任一项所述的基于深度学习的发票信息管理方法，其特征在于，包括

信息分类模块，检测目标发票图片的目标框的类别标签，根据该目标框的长宽，自动推算出发票图片中需要提取的不同类别的信息的区域位置并计算所有目标框在发票图片中的中心点的位置信息；

输出模块，若目标框的中心点坐标在相应的区域位置中，则将该目标框经过字符识别所得到的文本信息分类在相应的信息类别中，输出包含发票图片中所有关键信息的Excel表格。

5.一种计算机可读介质，其特征在于，所述计算机可读介质中包括基于深度学习的发票信息管理方法程序，所述基于深度学习的发票信息管理方法程序被基于深度学习的发票信息管理系统执行时，实现如权利要求1至3任一项所述的基于深度学习的发票信息管理方法的步骤。