CN107766809B

CN107766809B - 电子装置、票据信息识别方法和计算机可读存储介质

Info

Publication number: CN107766809B
Application number: CN201710929629.8A
Authority: CN
Inventors: 田野; 刘鹏; 王健宗; 肖京
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2017-10-09
Filing date: 2017-10-09
Publication date: 2020-05-19
Anticipated expiration: 2037-10-09
Also published as: CN107766809A; WO2019071662A1

Abstract

本发明公开一种电子装置、票据信息识别方法和存储介质，该方法包括：在收到待处理的票据图片后，利用预先训练好的票据图片识别模型对票据图片中的票据类别进行识别；利用预先确定的矫正规则对票据图片进行倾斜矫正；确定识别的票据类别对应的待识别字段；确定各个待识别字段对应的第一识别模型，调用对应的第一识别模型对倾斜矫正后的票据图片的行字符区域进行区域识别，以分别识别出包含各个待识别字段的字符信息的目标行字符区域；确定各个待识别字段对应的第二识别模型，调用对应的第二识别模型进行字符识别，以分别识别出各个待识别字段的目标行字符区域包含的字符信息。本发明技术方案准确、高效的实现对票据图片中的文本信息的自动识别。

Description

电子装置、票据信息识别方法和计算机可读存储介质

技术领域

本发明涉及数据识别技术领域，特别涉及一种电子装置、票据信息识别方法和计算机可读存储介质。

背景技术

如今随着经济的发展和人们生活水平的提高，越来越多的人选择购买医疗、商业、金融等保险。为了改善用户的保险理赔体验，提升保险理赔效率，目前，有些保险公司推出了自助理赔业务，比如用户在进行医疗保险理赔过程中，只需要将门诊或住院票据拍照上传到保险公司系统，保险公司业务员会将用户上传的票据图片上的信息录入到理赔系统中，以进行下一步操作，这种自助理赔方式大大方便了用户进行理赔的过程；然而，这种自助理赔方式在带来了便捷的理赔过程的同时，却增加了保险公司业务人员的工作压力，问题主要表现在需要花费大量的人力来处理用户上传的票据图像，效率低下，且数据录入的错误率居高不下。

因此，运用于保险自助理赔业务的票据信息自动识别技术显得越来越重要和迫切，如何提出一种高效、准确地自动识别用户上传的票据图片中的文本信息的方案，成为亟待解决的问题。

发明内容

本发明的主要目的是提供一种电子装置、票据信息识别方法和计算机可读存储介质，旨在准确、高效的实现对用户上传的票据图片中的文本信息的自动识别。

为实现上述目的，本发明提出的电子装置，包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的票据信息识别系统，所述票据信息识别系统被所述处理器执行时实现如下步骤：

在收到待处理的票据图片后，利用预先训练好的票据图片识别模型对收到的票据图片中的票据类别进行识别，并输出票据的类别识别结果；

利用预先确定的矫正规则对收到的票据图片进行倾斜矫正；

根据预先确定的票据类别与待识别字段的映射关系，确定识别的票据类别对应的待识别字段；

根据预先确定的待识别字段与第一识别模型的映射关系，确定各个所述待识别字段对应的第一识别模型，针对各个所述待识别字段，调用对应的第一识别模型对倾斜矫正后的票据图片的行字符区域进行区域识别，以分别识别出包含各个所述待识别字段的字符信息的目标行字符区域；

根据预先确定的待识别字段与第二识别模型的映射关系，确定各个所述待识别字段对应的第二识别模型，针对各个所述待识别字段的目标行字符区域，调用对应的第二识别模型进行字符识别，以分别识别出各个所述待识别字段的目标行字符区域包含的字符信息，并将识别的各个所述待识别字段的字符信息与所述票据图片进行关联映射。

优选地，所述预先确定的矫正规则为：

用霍夫变换的概率算法找出图像中尽可能多的小段直线；

从找出的小段直线中确定出所有偏水平的直线，并将确定出的直线中x坐标值相差小于第一预设差值的直线按对应的y坐标值的大小顺序依次相连，按照x坐标值大小分为若干类，或者，将确定出的直线中y坐标值相差小于第二预设差值的直线按对应的x坐标值的大小顺序依次相连，按照y坐标值大小分为若干类；

将属于一类的所有水平直线作为一个目标类直线，并通过最小二乘法找出最接近各个目标类直线的长直线；

计算出各个长直线的斜率，计算出各个长直线的斜率的中位数和均值，比较计算出的斜率的中位数和均值的大小以确定出较小者，并根据确定出的较小者调整图像倾角。

优选地，所述票据图片识别模型的训练过程如下：

S1、为每一个预设票据图片类别准备预设数量的标注有对应的图片类别的票据图片样本；

S2、将每一个预设票据图片类别对应的票据图片样本分为第一比例的训练子集和第二比例的验证子集，将各个训练子集中的票据图片样本进行混合以得到训练集，并将各个验证子集中的票据图片样本进行混合以得到验证集；

S3、利用所述训练集训练所述票据图片识别模型，并利用所述验证集对经所述训练集训练完成后的所述票据图片识别模型的准确率进行验证；

S4、若准确率大于或者等于预设准确率，则训练结束；

S5、若准确率小于预设准确率，则增加每一个预设票据图片类别对应的票据图片样本的数量，并重新执行步骤S2、S3。

优选地，所述第一识别模型为卷积神经网络模型，针对一个待识别字段对应的第一识别模型的训练过程如下：

C1、针对该待识别字段，获取预设数量的票据图片样本；

C2、将包含该待识别字段的字符信息的票据图片样本归入第一训练集，并将不包含该待识别字段的字符信息的票据图片样本归入第二训练集；

C3、分别从第一训练集和第二训练集中提取出第一预设比例的票据图片样本作为待训练的样本图片，并将第一训练集和第二训练集中剩余的票据图片样本作为待验证的样本图片；

C4、利用提取的各个待训练的样本图片进行模型训练，以生成所述第一识别模型，并利用各个待验证的样本图片对生成的所述第一识别模型进行验证；

C5、若验证通过率大于等于预设阈值，则训练完成；

C6、若验证通过率小于预设阈值，则增加票据图片样本的数量，并重复执行步骤C2、C3、C4。

优选地，所述第二识别模型为时间递归神经网络模型，针对一个待识别字段对应的第二识别模型的训练过程如下：

针对该待识别字段，获取预设数量的票据图片样本，每个票据图片样本中仅包含一行该待识别字段的字符信息，字体为黑色，背景为白色，并将各个票据图片样本的名称命名为其所含的该待识别字段的字符信息；

将所述票据图片样本按照X：Y的比例分成第一数据集和第二数据集，第一数据集中的图片样本数量大于第二数据集中的图片样本数量，第一数据集作为训练集，第二数据集作为测试集；

将第一数据集中的图片样本送入时间递归神经网络模型进行模型训练，每隔预设时间，对模型使用第二数据集进行测试，以评估当前训练的模型效果；测试时，使用训练得到的模型对第二数据集中的图片样本进行字符信息识别，并和测试的图片样本的名称做对比，以计算识别的结果和该图片样本的名称的误差。

若测试时的模型对图片样本识别的误差出现发散，则调整训练参数并重新训练；

若测试时的模型对图片样本识别的误差收敛，则结束模型训练，生成的模型作为最终的该待识别字段对应的第二识别模型。

本发明还提出一种票据信息识别方法，该票据信息识别方法包括步骤：

利用预先确定的矫正规则对收到的票据图片进行倾斜矫正；

优选地，所述票据图片识别模型的训练过程如下：

S4、若准确率大于或者等于预设准确率，则训练结束；

C1、针对该待识别字段，获取预设数量的票据图片样本；

C5、若验证通过率大于等于预设阈值，则训练完成；

将第一数据集中的图片样本送入时间递归神经网络模型进行模型训练，每隔预设时间，对模型使用第二数据集进行测试，以评估当前训练的模型效果；测试时，使用训练得到的模型对第二数据集中的图片样本进行字符信息识别，并和测试的图片样本的名称做对比，以计算识别的结果与该图片样本的名称的误差。

本发明还提出一种计算机可读存储介质，所述计算机可读存储介质存储有票据信息识别系统，所述票据信息识别系统可被至少一个处理器执行，以使所述至少一个处理器执行上述任一项所述的票据信息识别方法。

本发明技术方案，首先通过预先训练好的票据图片识别模型识别出收到的票据图片中的票据类别，并通过预先确定的矫正规则对收到的票据图片进行倾斜矫正；然后根据票据类别与待识别字段的映射关系，确定当前接收到的待处理票据图片中的待识别字段；再根据待识别字段与第一识别模型的映射关系，分别确定各个待识别字段各自对应的第一识别模型，以识别出各个待识别字段的目标行字符区域；最后根据待识别字段与第二识别模型的映射关系，确定各个待识别字段各自对应的第二识别模型，根据各个第二识别模型分别识别出各个所述待识别字段的目标行字符区域包含的字符信息，并将识别出的各个字符信息与当前的票据图片进行关联映射，如此准确、高效的实现对用户上传的票据图片中的文本信息的自动识别。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。

图1为本发明票据信息识别方法一实施例的流程示意图；

图2为本发明票据信息识别方法一实施例中票据图片识别模型的训练过程流程图；

图3为本发明票据信息识别方法一实施例中第一识别模型的训练过程流程图；

图4为本发明票据信息识别方法一实施例中第二识别模型的训练过程流程图；

图5为本发明票据信息识别系统一实施例的运行环境示意图；

图6为本发明票据信息识别系统一实施例的程序模块图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

如图1所示，图1为本发明票据信息识别方法一实施例的流程示意图。

本实施例中，该票据信息识别方法包括：

步骤S10，在收到待处理的票据图片后，利用预先训练好的票据图片识别模型对收到的票据图片中的票据类别进行识别，并输出票据的类别识别结果；

系统在收到待处理的票据图片后，利用预先训练好的票据图片识别模型对收到的票据图片进行识别，识别出票据的类别并输出类别识别结果；例如，系统收到的待处理的票据图片为医疗票据图片，而医疗票据的类别包括门诊票据、住院票据、手术票据等，那么系统利用票据图片识别模型系统对收到的医疗票据图片识别后，输出该医疗票据的类别识别结果：门诊票据、住院票据、手术票据等。

步骤S20，利用预先确定的矫正规则对收到的票据图片进行倾斜矫正；

系统中具有预先确定的矫正规则；由于用户上传到系统的票据图片(即系统收到的票据图片)通常都有一定的歪斜，因此系统会对收到的票据图片利用预先确定的矫正规则进行倾斜矫正，以确保系统对票据信息的识别成功率。本实施例优选所述预先确定的矫正规则为：首先，用霍夫变换(Hough)的概率算法找出图像中尽可能多的小段直线；然后，从找出的小段直线中确定出所有偏水平的直线，并将确定出的直线中x坐标值相差小于第一预设差值(例如0.2cm)的直线按对应的y坐标值的大小顺序依次相连，按照x坐标值大小分为若干类，或者，将确定出的直线中y坐标值相差小于第二预设差值(例如0.3cm)的直线按对应的x坐标值的大小顺序依次相连，按照y坐标值大小分为若干类；接着，将属于一类的所有水平直线作为一个目标类直线，并通过最小二乘法找出最接近各个目标类直线的长直线；最后，计算出各个长直线的斜率，计算出各个长直线的斜率的中位数和均值，比较计算出的斜率的中位数和均值的大小以确定出较小者，并根据确定出的较小者调整图像倾角。当然，在其它实施例中，还可以采取其它矫正规则。

步骤S30，根据预先确定的票据类别与待识别字段的映射关系，确定识别的票据类别对应的待识别字段；

系统在得到票据图片的票据类别后，根据预先确定的票据类别与待识别字段的映射关系，则可确定出收到的票据图片的票据类别所对应的待识别字段，该票据类别对应的待识别字段的数量可能是一个或多个。

步骤S40，根据预先确定的待识别字段与第一识别模型的映射关系，确定各个所述待识别字段对应的第一识别模型，针对各个所述待识别字段，调用对应的第一识别模型对倾斜矫正后的票据图片的行字符区域进行区域识别，以分别识别出包含各个所述待识别字段的字符信息的目标行字符区域；

系统中具有预先确定的待识别字段与第一识别模型的第一映射关系表；系统在确定出票据图片的各个待识别字段后，通过查找该第一映射关系表，则可找到各个所述待识别字段各自对应的第一识别模型；系统针对每个待识别字段，均调用该待识别字段对应的第一识别模型对倾斜矫正后的票据图片的行字符区域进行区域识别，从而分别识别出票据图片中包含各个待识别字段的字符信息的目标行字符区域。

步骤S50，根据预先确定的待识别字段与第二识别模型的映射关系，确定各个所述待识别字段对应的第二识别模型，针对各个所述待识别字段的目标行字符区域，调用对应的第二识别模型进行字符识别，以分别识别出各个所述待识别字段的目标行字符区域包含的字符信息，并将识别的各个所述待识别字段的字符信息与所述票据图片进行关联映射。

系统中还具有预先确定的待识别字段与第二识别模型的第二映射关系表；系统在识别出所述票据图片中分别包含各个待识别字段的字符信息的目标行字符区域后，通过查找第二映射关系表，先找到各个所述待识别字段各自对应的第二识别模型；然后针对每个所述待识别字段的目标行字符区域，均调用对应的第二识别模型进行字符识别，从而通过各个对应的第二识别模型识别出各个所述待识别字段的目标行字符区域包含的字符信息，再将识别出的各个所述待识别字段的字符信息与所述票据图片进行关联映射，建立关联映射关系。

本实施例技术方案，首先通过预先训练好的票据图片识别模型识别出收到的票据图片中的票据类别，并通过预先确定的矫正规则对收到的票据图片进行倾斜矫正；然后根据票据类别与待识别字段的映射关系，确定当前接收到的待处理票据图片中的待识别字段；再根据待识别字段与第一识别模型的映射关系，分别确定各个待识别字段各自对应的第一识别模型，以识别出各个待识别字段的目标行字符区域；最后根据待识别字段与第二识别模型的映射关系，确定各个待识别字段各自对应的第二识别模型，根据各个第二识别模型分别识别出各个所述待识别字段的目标行字符区域包含的字符信息，并将识别出的各个字符信息与当前的票据图片进行关联映射，如此准确、高效的实现对用户上传的票据图片中的文本信息的自动识别。

如图2所示，本实施例中，所述票据图片识别模型的训练过程如下：

步骤S1，为每一个预设票据图片类别准备预设数量的标注有对应的图片类别的票据图片样本；

针对每一个预设票据图片类别，均准备预设数量(例如，1000张)的标注有对应的图片类别的票据图片样本；例如，预设票据图片类别总共有两种，分别为门诊票据和住院票据，则准备预设数量的标注有门诊票据的票据图片样本和预设数量的标注有住院票据的票据图片样本。

步骤S2，将每一个预设票据图片类别对应的票据图片样本分为第一比例的训练子集和第二比例的验证子集，将各个训练子集中的票据图片样本进行混合以得到训练集，并将各个验证子集中的票据图片样本进行混合以得到验证集；

针对每一个预设票据图片类别对应的票据图片样本，均分为第一比例(例如，80％)的训练子集和第二比例(例如，20％)的验证子集，然后将得到的各个训练子集中的票据图片样本混合，以得到训练集(例如，训练集由门诊票据的票据图片样本的80％与住院票据的票据图片样本的80％混合形成)，以及将得到的各个验证子集中的票据图片样本混合，以得到验证集(例如，验证集由门诊票据的票据图片样本的20％与住院票据的票据图片样本的20％混合形成)。

步骤S3，利用所述训练集训练所述票据图片识别模型，并利用所述验证集对经所述训练集训练完成后的所述票据图片识别模型的准确率进行验证；

在得到训练集和验证集后，先用得到的训练集对所述票据图片识别模型进行训练，在用所述训练集对所述票据图片识别模型训练完成后，再用得到的所述验证集对该票据图片识别模型的准确率进行验证；

步骤S4，若准确率大于或者等于预设准确率，则训练结束；

系统中预先设置了准确率的验证阈值(即所述预设准确率，例如98.5％)，用于对所述票据图片识别模型的训练效果进行检验；若通过所述验证集对所述票据图片识别模型验证得到的准确率大于所述预设准确率，那么说明该票据图片识别模型的训练达到了预设标准，此时则结束模型训练。

步骤S5，若准确率小于预设准确率，则增加每一个预设票据图片类别对应的票据图片样本的数量，并重新执行步骤S2、S3。

若是通过所述验证集对所述票据图片识别模型验证得到的准确率小于或等于所述预设准确率，那么说明该票据图片识别模型的训练还没有达到了预设标准，可能是训练集数量不够或验证集数量不够，所以，在这种情况时，则增加每一个预设票据图片类别对应的票据图片样本的数量(例如，每次增加固定数量或每次增加随机数量)，然后在这基础上，重新执行上述步骤S2和S3，如此循环执行，直至达到了步骤S4的要求，则结束模型训练。

本实施例中，所述票据图片识别模型优选为深度卷积神经网络(例如，该深度卷积神经网络可以为在CaffeNet的环境下选取的基于深度卷积神经网络SSD(Single ShotMultiBox Detector)算法模型)，本发明采用的深度卷积神经网络模型由1个输入层，13个卷积层，5个池化层，2个全连接层，1个分类层构成。所述深度卷积神经网络模型的详细结构如下表所示：

其中：Layer Name列表示每一层的名称，Input表示输入层，Conv表示模型的卷积层，Conv1表示模型的第1个卷积层，MaxPool表示模型的最大值池化层，MaxPool1表示模型的第1个最大值池化层，Fc表示模型中的全连接层，Fc1表示模型中第1个全连接层，Softmax表示Softmax分类器；Batch Size表示当前层的输入图像数目；Kernel Size表示当前层卷积核的尺度(例如，Kernel Size可以等于3，表示卷积核的尺度为3x3)；Stride Size表示卷积核的移动步长，即做完一次卷积之后移动到下一个卷积位置的距离；Pad Size表示对当前网络层之中的图像填充的大小。

本实施例中，所述票据图片识别模型的训练过程之前，可对票据图片样本做如下处理：

根据其高宽比信息以及印章的位置判断票据图片的转置情况，并做翻转调整；当高宽比大于1时，说明票据图片高宽颠倒，若印章位置在票据图片左侧，则对票据图像做顺时针旋转九十度处理，若印章位置在票据图片右侧，则对票据图像做逆时针旋转九十度处理；当高宽比小于1时，说明票据图片高宽未颠倒，若印章位置在票据图片下侧，则对票据图像做顺时针旋转一百八十度处理。

找出标注存在严重问题的票据图片样本(比如，关键位置信息缺失或超出整张图片范围，以及印章标注位置位于票据中央等明显错误的票据图片样本)，将这些票据图片样本去除，确保票据图片样本的准确无误，从而确保训练效果。

进一步地，如图3所示，本实施例优选所述第一识别模型为卷积神经网络模型，针对一个待识别字段对应的第一识别模型的训练过程如下：

步骤C1，针对该待识别字段，获取预设数量的票据图片样本；

随机获取预设数量(例如，10万个)的票据图片样本，其中，部分票据图片样本包含该待识别字段的字符信息，部分票据图片样本则不包含该待识别字段的字符信息。

步骤C2，将包含该待识别字段的字符信息的票据图片样本归入第一训练集，并将不包含该待识别字段的字符信息的票据图片样本归入第二训练集；

从获取的票据图片样本中，将包含该待识别字段的字符信息的票据图片样本与不包含该待识别字段的字符信息的票据图片样本分开，并将包含该待识别字段的字符信息的票据图片样本归入第一训练集，以及将不包含该待识别字段的字符信息的票据图片样本归入第二训练集。

步骤C3，分别从第一训练集和第二训练集中提取出第一预设比例的票据图片样本作为待训练的样本图片，并将第一训练集和第二训练集中剩余的票据图片样本作为待验证的样本图片；

从所述第一训练集和第二训练集中分别提取出第一预设比例(例如，80％)的票据图片样本作为待训练的样本图片，以及将第一训练集和第二训练集中剩余的票据图片样本作为带验证的样本图片，这样使得待训练的样本图片和待验证的样本图片中均存在包含和不包含该待识别字段的字符信息的票据图片样本，且包含和不包含该待识别字段的字符信息的票据图片样本在待训练的样本图片和待验证的样本图片中的比例一致。

步骤C4，利用提取的各个待训练的样本图片进行模型训练，以生成所述第一识别模型，并利用各个待验证的样本图片对生成的所述第一识别模型进行验证；

用提取的各个待训练的样本图片对预设类型模型进行模型训练，从而得到所述第一识别模型，然后再用各个待验证的样本图片对得到的所述第一识别模型进行验证，得出所述第一识别模型的验证通过率。

步骤C5，若验证通过率大于等于预设阈值，则训练完成；

系统中预先设置了验证通过率的验证阈值(即所述预设阈值，例如98％)，用于对所述第一识别模型的训练效果进行检验；若通过各个所述待验证的样本图片对所述第一识别模型验证得到的验证通过率大于所述预设阈值，那么说明该第一识别模型的训练达到了预期标准，此时则结束模型训练。

步骤C6，若验证通过率小于预设阈值，则增加票据图片样本的数量，并重复执行步骤C2、C3、C4。

若是通过各个所述待验证的样本图片对所述第一识别模型验证得到的验证通过率小于或等于所述预设阈值，那么说明该第一识别模型的训练还没有达到了预期标准，可能是待训练的样本图片数量不够或待验证的样本图片数量不够，所以，在这种情况时，则增加所述票据图片样本的数量(例如，每次增加固定数量或每次增加随机数量)，然后在这基础上，重新执行上述步骤C2、C3和C4，如此循环执行，直至达到了步骤C5的要求，则结束模型训练。

进一步地，如图4所示，本实施例优选所述第二识别模型为时间递归神经网络模型(Long-Short Term Memory，LSTM)，针对一个待识别字段对应的第二识别模型的训练过程如下：

步骤D1，针对该待识别字段，获取预设数量的票据图片样本，每个票据图片样本中仅包含一行该待识别字段的字符信息，字体为黑色，背景为白色，并将各个票据图片样本的名称命名为其所含的该待识别字段的字符信息；

获取预设数量(例如，10万个)的票据图片样本；获取的票据图片样本中，每个票据图片样本中包含且仅包含一行该待识别字段的字符信息，将每个票据图片样本的名称各自命名为其所述包含的该待识别字段的字符信息；该票据图片样本用于模型训练时，模型根据该字符信息的字体颜色和背景颜色即可识别出该字符信息的位置，从而获取该字符信息。

步骤D2，将所述票据图片样本按照X：Y的比例分成第一数据集和第二数据集，第一数据集中的图片样本数量大于第二数据集中的图片样本数量，第一数据集作为训练集，第二数据集作为测试集；

将获取的所有票据图片样本按照预设比例X：Y(X、Y均大于0)的比例分成第一数据集和第二数据集，其中，第一数据集中的图片样本数量比第二数据集中的图片样本数量多，即X大于Y(例如，X为4，Y为1)；将第一数据集作为训练集，用于训练模型；第二数据集作为测试集，用于测试模型的训练效果。

步骤D3，将第一数据集中的图片样本送入时间递归神经网络模型进行模型训练，每隔预设时间，对模型使用第二数据集进行测试，以评估当前训练的模型效果；测试时，使用训练得到的模型对第二数据集中的图片样本进行字符信息识别，并和测试的图片样本的名称做对比，以计算识别的结果和该图片样本的名称的误差。

用第一数据集中的图片样本对模型进行训练，在训练过程中每个预设时间(例如每进行1000次迭代)或者以预设的频率，对模型使用第二数据集进行测试，以检测当前训练的模型效果；具体在测试时，使用当前训练得到的模型对第二数据集中的图片样本进行字符信息识别，并将识别出的结果与测试的图片样本的名称做对比，从而计算出识别的结果与该图片样本的名称的误差，本实施例优选误差计算采用编辑距离作为计算标准。

步骤D4，若测试时的模型对图片样本识别的误差出现发散，则调整训练参数并重新训练；

如果模型对图片样本识别的误差出现发散，则模型训练不符合要求，此时则按预设规则或随机调整训练参数后重新对该模型进行训练，使训练时模型对票据图片的识别的误差能够收敛。

步骤D5，若测试时的模型对图片样本识别的误差收敛，则结束模型训练，生成的模型作为最终的该待识别字段对应的第二识别模型。

当模型对图片样本识别的误差收敛时，训练的模型达到要求，则结束模型训练，并将生成的模型(即当前训练后的模型)作为最终的该待识别字段对应的第二识别模型。

此外，本发明还提出一种票据信息识别系统。

请参阅图5，是本发明票据信息识别系统10较佳实施例的运行环境示意图。

在本实施例中，票据信息识别系统10安装并运行于电子装置1中。电子装置1可以是桌上型计算机、笔记本、掌上电脑及服务器等计算设备。该电子装置1可包括，但不仅限于，存储器11、处理器12及显示器13。图5仅示出了具有组件11-13的电子装置1，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

存储器11在一些实施例中可以是电子装置1的内部存储单元，例如该电子装置1的硬盘或内存。存储器11在另一些实施例中也可以是电子装置1的外部存储设备，例如电子装置1上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(SecureDigital,SD)卡，闪存卡(Flash Card)等。进一步地，存储器11还可以既包括电子装置1的内部存储单元也包括外部存储设备。存储器11用于存储安装于电子装置1的应用软件及各类数据，例如票据信息识别系统10的程序代码等。存储器11还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)，微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据，例如执行票据信息识别系统10等。

显示器13在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。显示器13用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面，例如业务定制界面等。电子装置1的部件11-13通过系统总线相互通信。

请参阅图6，是本发明票据信息识别系统10较佳实施例的程序模块图。在本实施例中，票据信息识别系统10可以被分割成一个或多个模块，一个或者多个模块被存储于存储器11中，并由一个或多个处理器(本实施例为处理器12)所执行，以完成本发明。例如，在图6中，票据信息识别系统10可以被分割成第一识别模块101、矫正模块102、确定模块103、第二识别模块104及第三识别模块105。本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段，比程序更适合于描述票据信息识别系统10在电子装置1中的执行过程，其中：

第一识别模块101，用于在收到待处理的票据图片后，利用预先训练好的票据图片识别模型对收到的票据图片中的票据类别进行识别，并输出票据的类别识别结果；

矫正模块102，用于利用预先确定的矫正规则对收到的票据图片进行倾斜矫正；

确定模块103，用于根据预先确定的票据类别与待识别字段的映射关系，确定识别的票据类别对应的待识别字段；

第二识别模块104，用于根据预先确定的待识别字段与第一识别模型的映射关系，确定各个所述待识别字段对应的第一识别模型，针对各个所述待识别字段，调用对应的第一识别模型对倾斜矫正后的票据图片的行字符区域进行区域识别，以分别识别出包含各个所述待识别字段的字符信息的目标行字符区域；

第三识别模块105，用于根据预先确定的待识别字段与第二识别模型的映射关系，确定各个所述待识别字段对应的第二识别模型，针对各个所述待识别字段的目标行字符区域，调用对应的第二识别模型进行字符识别，以分别识别出各个所述待识别字段的目标行字符区域包含的字符信息，并将识别的各个所述待识别字段的字符信息与所述票据图片进行关联映射。

本实施例中，所述票据图片识别模型的训练过程如下：

步骤S4，若准确率大于或者等于预设准确率，则训练结束；

进一步地，本实施例优选所述第一识别模型为卷积神经网络模型，针对一个待识别字段对应的第一识别模型的训练过程如下：

步骤C5，若验证通过率大于等于预设阈值，则训练完成；

进一步地，本实施例优选所述第二识别模型为时间递归神经网络模型(Long-Short Term Memory，LSTM)，针对一个待识别字段对应的第二识别模型的训练过程如下：

进一步地，本发明还提出一种计算机可读存储介质，所述计算机可读存储介质存储有票据信息识别系统，所述票据信息识别系统可被至少一个处理器执行，以使所述至少一个处理器执行上述任一实施例中的票据信息识别方法。

以上所述仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是在本发明的发明构思下，利用本发明说明书及附图内容所作的等效结构变换，或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims

1.一种电子装置，其特征在于，所述电子装置包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的票据信息识别系统，所述票据信息识别系统被所述处理器执行时实现如下步骤：

利用预先确定的矫正规则对收到的票据图片进行倾斜矫正；

根据预先确定的待识别字段与第二识别模型的映射关系，确定各个所述待识别字段对应的第二识别模型，针对各个所述待识别字段的目标行字符区域，调用对应的第二识别模型进行字符识别，以分别识别出各个所述待识别字段的目标行字符区域包含的字符信息，并将识别的各个所述待识别字段的字符信息与所述票据图片进行关联映射；

所述票据图片识别模型的训练过程如下：

S4、若准确率大于或者等于预设准确率，则训练结束；

2.如权利要求1所述的电子装置，其特征在于，所述票据图片识别模型的训练过程之前，对票据图片样本做如下处理：

3.如权利要求1所述的电子装置，其特征在于，所述第一识别模型为卷积神经网络模型，针对一个待识别字段对应的第一识别模型的训练过程如下：

C1、针对该待识别字段，获取预设数量的票据图片样本；

C5、若验证通过率大于等于预设阈值，则训练完成；

4.如权利要求1所述的电子装置，其特征在于，所述第二识别模型为时间递归神经网络模型，针对一个待识别字段对应的第二识别模型的训练过程如下：

将第一数据集中的图片样本送入时间递归神经网络模型进行模型训练，每隔预设时间，对模型使用第二数据集进行测试，以评估当前训练的模型效果；测试时，使用训练得到的模型对第二数据集中的图片样本进行字符信息识别，并和测试的图片样本的名称做对比，以计算识别的结果和该图片样本的名称的误差;

5.一种票据信息识别方法，其特征在于，该票据信息识别方法包括步骤：

利用预先确定的矫正规则对收到的票据图片进行倾斜矫正；

所述票据图片识别模型的训练过程如下：

S4、若准确率大于或者等于预设准确率，则训练结束；

6.如权利要求5所述的票据信息识别方法，其特征在于，所述票据图片识别模型的训练过程之前，对票据图片样本做如下处理：

7.如权利要求5或6所述的票据信息识别方法，其特征在于，所述第一识别模型为卷积神经网络模型，针对一个待识别字段对应的第一识别模型的训练过程如下：

C1、针对该待识别字段，获取预设数量的票据图片样本；

C5、若验证通过率大于等于预设阈值，则训练完成；

8.如权利要求5或6所述的票据信息识别方法，其特征在于，所述第二识别模型为时间递归神经网络模型，针对一个待识别字段对应的第二识别模型的训练过程如下：

将第一数据集中的图片样本送入时间递归神经网络模型进行模型训练，每隔预设时间，对模型使用第二数据集进行测试，以评估当前训练的模型效果；测试时，使用训练得到的模型对第二数据集中的图片样本进行字符信息识别，并和测试的图片样本的名称做对比，以计算识别的结果与该图片样本的名称的误差;

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有票据信息识别系统，所述票据信息识别系统可被至少一个处理器执行，以使所述至少一个处理器执行如权利要求5-8中的任一项所述的票据信息识别方法。