CN111325207A

CN111325207A - 基于预处理的票据识别方法及装置

Info

Publication number: CN111325207A
Application number: CN202010146478.0A
Authority: CN
Inventors: 丁平; 杨春明; 郭铸; 王欣; 李起飞; 宋科; 张红喜; 张明威; 夏理; 赵虹; 姚元伟; 廖旺胜; 王党团; 李娟�; 王冠华; 吴文建; 张天航; 边雅军; 王建标; 农倩倩
Original assignee: Bank of China Ltd
Current assignee: Bank of China Ltd
Priority date: 2020-03-05
Filing date: 2020-03-05
Publication date: 2020-06-23

Abstract

本发明公开了一种基于预处理的票据识别方法及装置，该方法包括：采集待识别票据的影像数据；将所述待识别票据的影像数据，输入至预先训练好的票据分类模型中，输出所述待识别票据的类别标识，其中，所述票据分类模型的输入数据为待识别票据的影像数据，输出数据为待识别票据的类别标识，所述类别标识包括：第一标识和第二标识，所述第一标识用于表征票据的OCR识别结果为识别成功，所述第二标识用于表征票据的OCR识别结果为识别失败；对第一标识的待识别票据进行OCR识别。本发明能够降低OCR识别票据的错误率。

Description

基于预处理的票据识别方法及装置

技术领域

本发明涉及票据识别领域，尤其涉及一种基于预处理的票据识别方法及装置。

背景技术

本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

随着光学识别字符(Optical Character Recognition，OCR)技术的快速发展和广泛应用，票据识别效率大大提高。

目前，对于通用票据的识别，OCR技术的识别准确率已能够达到一个相对较高的水平，但无法实现百分之百的识别准确率。例如，OCR技术对增值税发票的识别率可达到98％，仍然存在2％的增值税发票无法识别。

对于大型银行的单证处理中心，由于每日需要对数以百万计的票据进行识别处理，即使只有2％的识别错误率，也会影响到数万张识别错误的票据出现，这些错误识别的异常票据往往需要花费大量的时间进行处理，大量的审批流程，浪费了大量的人力物力，降低了使用OCR技术节省人力的效果。

传统票据识别处理方式是在前端加入一个简单的图片检测规则，用于检测图片大小、图片是否为拍照错误对象等，该种处理方式只能对差异较大的图片进行初筛，不能解决对大量识别错误的图片进行筛选的问题。

针对上述问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供一种基于预处理的票据识别方法，用以解决现有OCR技术对票据识别的准确率有待进一步地提高的技术问题，该方法包括：采集待识别票据的影像数据；将所述待识别票据的影像数据，输入至预先训练好的票据分类模型中，输出所述待识别票据的类别标识，其中，所述票据分类模型的输入数据为待识别票据的影像数据，输出数据为待识别票据的类别标识，所述类别标识包括：第一标识和第二标识，所述第一标识用于表征票据的OCR识别结果为识别成功，所述第二标识用于表征票据的OCR识别结果为识别失败；对第一标识的待识别票据进行OCR识别。

本发明实施例还提供一种基于预处理的票据识别装置，用以解决现有OCR技术对票据识别的准确率有待进一步地提高的技术问题，该装置包括：票据采集模块，用于采集待识别票据的影像数据；票据标注模块，用于将待识别票据的影像数据，输入至预先训练好的票据分类模型中，输出待识别票据的类别标识，其中，票据分类模型的输入数据为待识别票据的影像数据，输出数据为待识别票据的类别标识，类别标识包括：第一标识和第二标识，第一标识用于表征票据的OCR识别结果为识别成功，第二标识用于表征票据的OCR识别结果为识别失败；OCR识别模块，用于对第一标识的待识别票据进行OCR识别。

本发明实施例还提供一种计算机设备，用以解决现有OCR技术对票据识别的准确率有待进一步地提高的技术问题，该计算机设备可以包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述基于预处理的票据识别方法。

本发明实施例还提供一种计算机可读存储介质，用以解决现有OCR技术对票据识别的准确率有待进一步地提高的技术问题，该计算机可读存储介质存储有执行上述基于预处理的票据识别方法的计算机程序。

本发明实施例中，在对票据进行OCR识别之前，通过一个预先训练好的票据分类模型将待识别票据划分为票据的OCR识别结果为识别成功的票据和不能被OCR识别成功的票据，进而仅对票据的OCR识别结果为识别成功的票据进行OCR识别，可以大大降低OCR识别票据的错误率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1为本发明实施例中提供的一种基于预处理的票据识别方法流程图；

图2为本发明实施例中提供的一种基于神经网络的票据分类模型示意图；

图3为本发明实施例中提供的一种基于预处理的票据识别装置示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚明白，下面结合附图对本发明实施例做进一步详细说明。在此，本发明的示意性实施例及其说明用于解释本发明，但并不作为对本发明的限定。

在本说明书的描述中，所使用的“包含”、“包括”、“具有”、“含有”等，均为开放性的用语，即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本申请的实施，其中的步骤顺序不作限定，可根据需要作适当调整。

本发明实施例中提供了一种基于预处理的票据识别方法，现有先进的OCR技术保持不变的情况下，在OCR预处理之前对票据影像进行分类，将OCR技术无法识别的图像筛选出来，降低OCR技术的错误识别率，提升工作效率。

图1为本发明实施例中提供的一种基于预处理的票据识别方法流程图，如图1所示，该方法可以包括如下步骤：

S101，采集待识别票据的影像数据。

需要说明的是，本发明实施例中待识别票据可以是任意一种纸质票据，包括但不限于如下任意一种：专用票据、专用支票、提单等票据。

作为一种可选的实施方式，可以通过各种扫描电子设备(例如，扫描仪或摄像头)扫描纸质票据得到待识别票据的影像数据。

S102，将待识别票据的影像数据，输入至预先训练好的票据分类模型中，输出待识别票据的类别标识，其中，票据分类模型的输入数据为待识别票据的影像数据，输出数据为待识别票据的类别标识，类别标识包括：第一标识和第二标识，第一标识用于表征票据的OCR识别结果为识别成功，第二标识用于表征票据的OCR识别结果为识别失败。

需要说明的是，本发明实施例中票据分类模型可以是基于人工智能算法，通过机器学习预先训练得到的一个算法模型，该算法模型的输入数据为待识别票据的影像数据，输出数据为待识别票据的类别标识；通过该算法模型，能够将待识别票据标注为票据的OCR识别结果为识别成功的票据或不能被OCR识别成功的票据。

需要注意的是，在执行上述S102之前，本发明实施例需要训练一个票据分类模型，具体可以通过如下步骤来实现：获取训练数据和测试数据，其中，训练数据包括：第一预设数量的第一票据和第二票据的影像数据，测试数据包括：第二预设数量的第一票据和第二票据的影像数据，第一票据为标注第一标识的票据，第二票据为标注第二标识的票据；根据训练数据和测试数据，通过机器学习训练得到票据分类模型。

本发明实施例通过获取识别成功和失败的票据数据，作为票据数据。对选择的影像数据做一个预处理(例如，转换为预设尺寸大小的图片)，再利用影像数据构建神经网络模型，实现票据影像数据的二分类。

作为一种可选的实施方式，可以通过如下步骤来获取训练数据或测试数据：采集多张票据的影像数据和OCR识别结果；根据每张票据的OCR识别结果，对每张票据进行标注，其中，OCR识别成功的票据标注第一标识，OCR识别失败的票据标注第二标识。

S103，对第一标识的待识别票据进行OCR识别。

需要说明的是，由于第一标识的待识别票据表征待识别票据很大可能是能够被OCR识别成功的票据，因而，在通过票据分类模型筛选出第一标识的待识别票据后，根据第一标识的待识别票据的影像数据，采用OCR识别算法识别票据图像上的文字或字符，并将其转换为计算机能够处理的文字或字符。

可选地，在采用OCR识别算法识别票据图像之前，可以对待识别票据进行预处理，包括但不限于图像二值化、图像去噪、倾斜较正等处理。

由于待识别票据的票据图像可能是彩色图像，彩色图像中包含的信息量比较大，会影响计算效率。由此，本发明实施例将彩色图像分为前景与背景，并将前景和背景信息分别定义为黑色和白色，得到待识别票据对应的二值化图像。通过图像二值化，能够提高计算机识别文字的速度。

由于采集的待识别票据的票据图像中可能包含噪声信息，因而，在采用OCR识别算法识别票据图像之前，还可以采用各种去燥算法对待识别票据的票据图像进行去噪处理，以提高票据识别准确率。

另外，当用户通过扫描电子设备采集待识别票据图像的时候，由于人为因素可能导致采集的票据图像发生倾斜，因而，在采用OCR识别算法识别票据图像之前，还需要对采集的票据图像进行倾斜校正处理。通过倾斜校正，同样可以提高票据识别准确率。

由上可知，本发明实施例提供的基于预处理的票据识别方法，在采集到待识别票据的影像数据后，根据采集的影像数据，通过一个预先训练好的票据分类模型将待识别票据划分为票据的OCR识别结果为识别成功的票据和不能被OCR识别成功的票据，进而仅对票据的OCR识别结果为识别成功的票据进行OCR识别，可以大大降低OCR识别票据的错误率。

图2为本发明实施例中提供的一种基于神经网络的票据分类模型示意图，如图2所示，本发明实施例采用的票据分类模型可以是一个包含四个卷积层和三个全连接层的卷积神经网络模型。作为一种可选的实施方式，可以通过如下步骤来训练该神经网络模型：

①数据准备。获取识别成功的影像数据5000张，获取识别失败的数据5000张，并将这一万张数据按照成功和失败两种类型进行标注。对影像数据进行预处理，转变为128×128大小的图片。其中，识别成功的票据标为1，识别失败的票据标为0。从标注的数据中，随机抽取8000张作为训练集，2000张作为测试集。

②构建4层卷积层(4Convolutional layers)，第一个卷积层为128->64，第二卷积层为64->32，第三卷积层为32->16，第四卷积层为16->8。

③构建3个全连接层(3Fully-Connected Layers)。

④使用合并层(Flatten Layer)链接卷积层和全连接层。使用softmax layer标准化输出(例如，输出为0表示后续识别不成功的图片；输出为1表示后续识别成功的图片)。采用自适应估计优化器Adam优化训练结果。本发明实施例使用交叉熵(cross entropy)作为成本计量函数，取其均值。最优方法可以使用tf.train.AdamOptimizer()。

⑤模型迭代训练，直至收敛，收敛条件为误差小于一个预设阈值，该预设阈值可以根据具体应用场景进行设定。

⑥生成模型文件，命名为OCR_CLASSFICATION.model。

本发明实施例采用卷积神经网络训练票据分类模型，由于卷积神经网络直接利用图像像素信息作为输入，最大程度上保留了输入图像的所有信息，通过卷积操作进行特征的提取和高层抽象，模型输出直接是图像识别的结果。

基于同一发明构思，本发明实施例中还提供了一种基于预处理的票据识别装置，如下面的实施例。由于该装置实施例解决问题的原理与基于预处理的票据识别方法相似，因此该装置实施例的实施可以参见方法的实施，重复之处不再赘述。

图3为本发明实施例中提供的一种基于预处理的票据识别装置示意图，如图3所示，该装置可以包括：票据采集模块31，用于采集待识别票据的影像数据；票据标注模块32，用于将待识别票据的影像数据，输入至预先训练好的票据分类模型中，输出待识别票据的类别标识，其中，票据分类模型的输入数据为待识别票据的影像数据，输出数据为待识别票据的类别标识，类别标识包括：第一标识和第二标识，第一标识用于表征票据的OCR识别结果为识别成功，第二标识用于表征票据的OCR识别结果为识别失败；OCR识别模块33，用于对第一标识的待识别票据进行OCR识别。

由上可知，本发明实施例提供的基于预处理的票据识别装置，通过票据采集模块31采集待识别票据的影像数据；通过票据标注模块32基于一个预先训练好的票据分类模型将待识别票据划分为票据的OCR识别结果为识别成功的票据和不能被OCR识别成功的票据；通过OCR识别模块33仅对票据的OCR识别结果为识别成功的票据进行OCR识别，能够大大降低OCR识别票据的错误率。

在一种可选的实施例一种，本发明实施例提供的票据识别装置还可以包括：模型训练模块34，用于获取训练数据和测试数据，根据训练数据和测试数据，通过机器学习训练得到票据分类模型，其中，训练数据包括：第一预设数量的第一票据和第二票据的影像数据，测试数据包括：第二预设数量的第一票据和第二票据的影像数据，第一票据为标注第一标识的票据，第二票据为标注第二标识的票据。

在一种可选的实施例一种，本发明实施例提供的票据识别装置还可以包括：数据标注模块35，用于采集多张票据的影像数据和OCR识别结果，以及根据每张票据的OCR识别结果，对每张票据进行标注，其中，OCR识别成功的票据标注第一标识，OCR识别失败的票据标注第二标识。

可选地，本发明实施例提供的票据识别装置中，采用的票据分类模型可以是一个包含四个卷积层和一个全连接层的卷积神经网络模型。

综上所述，本发明实施例提供了一种基于预处理的票据识别方法、装置、计算机设备及计算机可读存储介质，在对票据进行OCR识别之前，通过一个预先训练好的票据分类模型将待识别票据划分为票据的OCR识别结果为能够识别成功的票据和不能被OCR识别成功的票据，进而仅对票据的OCR识别结果为识别成功的票据进行OCR识别，可以大大降低OCR识别票据的错误率。

本发明实施例能有效发现OCR技术无法识别的票据，进而在影像入库前对这些票据进行处理，即对于识别不成功概率比较大的票据，进行人工识别，避免后续花费大量时间对OCR识别异常的票据进行处理。

本发明实施例能够适用于各种票据影像的采集终端，各种影像票据，影像票据入库前检查等；降低OCR识别票据的错误率，增强识别的有效性，节省人力物力。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于预处理的票据识别方法，其特征在于，包括：

采集待识别票据的影像数据；

将所述待识别票据的影像数据，输入至预先训练好的票据分类模型中，输出所述待识别票据的类别标识，其中，所述票据分类模型的输入数据为待识别票据的影像数据，输出数据为待识别票据的类别标识，所述类别标识包括：第一标识和第二标识，所述第一标识用于表征票据的OCR识别结果为识别成功，所述第二标识用于表征票据的OCR识别结果为识别失败；

对第一标识的待识别票据进行OCR识别。

2.如权利要求1所述的方法，其特征在于，所述方法还包括：

获取训练数据和测试数据，其中，所述训练数据包括：第一预设数量的第一票据和第二票据的影像数据，所述测试数据包括：第二预设数量的第一票据和第二票据的影像数据，所述第一票据为标注第一标识的票据，所述第二票据为标注第二标识的票据；

根据所述训练数据和所述测试数据，通过机器学习训练得到所述票据分类模型。

3.如权利要求2所述的方法，其特征在于，所述方法还包括：

采集多张票据的影像数据和OCR识别结果；

根据每张票据的OCR识别结果，对每张票据进行标注，其中，OCR识别成功的票据标注第一标识，OCR识别失败的票据标注第二标识。

4.如权利要求1至3任一项所述的方法，其特征在于，所述票据分类模型为一个包含四个卷积层和三个全连接层的卷积神经网络模型。

5.一种基于预处理的票据识别装置，其特征在于，包括：

票据采集模块，用于采集待识别票据的影像数据；

票据标注模块，用于将所述待识别票据的影像数据，输入至预先训练好的票据分类模型中，输出所述待识别票据的类别标识，其中，所述票据分类模型的输入数据为待识别票据的影像数据，输出数据为待识别票据的类别标识，所述类别标识包括：第一标识和第二标识，所述第一标识用于表征票据的OCR识别结果为识别成功，所述第二标识用于表征票据的OCR识别结果为识别失败；

OCR识别模块，用于对第一标识的待识别票据进行OCR识别。

6.如权利要求5所述的装置，其特征在于，所述装置还包括：

模型训练模块，用于获取训练数据和测试数据，根据所述训练数据和所述测试数据，通过机器学习训练得到所述票据分类模型，其中，所述训练数据包括：第一预设数量的第一票据和第二票据的影像数据，所述测试数据包括：第二预设数量的第一票据和第二票据的影像数据，所述第一票据为标注第一标识的票据，所述第二票据为标注第二标识的票据。

7.如权利要求6所述的装置，其特征在于，所述装置还包括：

数据标注模块，用于采集多张票据的影像数据和OCR识别结果，以及根据每张票据的OCR识别结果，对每张票据进行标注，其中，OCR识别成功的票据标注第一标识，OCR识别失败的票据标注第二标识。

8.如权利要求5至7任一项所述的装置，其特征在于，所述票据分类模型为一个包含四个卷积层和三个全连接层的卷积神经网络模型。

9.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至4任一项所述基于预处理的票据识别方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有执行权利要求1至4任一项所述基于预处理的票据识别方法的计算机程序。