CN109214382A - 一种基于crnn的票据信息识别算法、设备及存储介质 - Google Patents
一种基于crnn的票据信息识别算法、设备及存储介质 Download PDFInfo
- Publication number
- CN109214382A CN109214382A CN201810779044.7A CN201810779044A CN109214382A CN 109214382 A CN109214382 A CN 109214382A CN 201810779044 A CN201810779044 A CN 201810779044A CN 109214382 A CN109214382 A CN 109214382A
- Authority
- CN
- China
- Prior art keywords
- crnn
- picture
- specific region
- bill
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Abstract
本发明提供一种基于CRNN的票据信息识别算法、设备及存储介质。该方法包括:从票据图片中定位并切分出特定区域,例如购买方名称区域,以便于更好的识别;采用CRNN神经网络训练产生识别模型,从而对票据上的特定区域的信息进行识别。该方法优选地适用于发票信息的识别算法。本发明的识别算法不需要对汉字的进行切分,不需要设定字符长度,更不需要识别单个汉字,避免了因切分错误而对识别率造成的影响,从而极大地提高了识别正确率。
Description
技术领域
本申请属于金融领域中票据图片处理和识别领域,具体涉及票据图片中文字的识别,尤其涉及一种基于卷积循环神经网络(CRNN)的票据信息识别算法、设备及存储介质。
背景技术
近年来,电子商务信息渗透各个行业,很多企业规模和业务量不断壮大,企业资金往来多元化,财务方面发票和其他金融票据数量急剧增大,从而使公司财务系统管理和工作量更加繁重。一方面,金融票据管理审核,具体地发票信息审核及报销,对电子化、数字化的需求也越来越高。而实际上,目前的票据审核大多是经过财务人员人工核算的,其相比人工智能核算,纯人工核算的工作效率低,且准确率也很容易受工作人员的心情、专注度的影响,更为关键的是审核出错之后,事后查找困难。
基于此,越来越多的研究人员研究采用人工智能技术进行票据的数据采集和识别。有人采用OCR(光学字符识别)文字识别技术,自动采集发票上的会计要素,自动对票据建立索引并归档,提高凭证信息查阅的一致性与准确性,与传统的会计人工录入数据方案相比,OCR扫描识别方案可以减少70%的工作量。也有人采用图像处理技术通过机器智能地去识别票据(例如,发票)中的目标区域。而在识别票据特定区域的信息的过程中,汉字识别是关键问题。传统的基于简单的CNN神经网络的识别方法只能训练和识别标签长度固定的图片,而票据中文字的长度未必都相同,例如发票中的购买方名称,因此必须进行单个汉字的切分来识别,如此以来就会因为切分时的错误对识别率造成影响。另外,直接使用RNN神经网络去识别效果偏低。
因此,现有技术存在的问题在于,常用的OCR系统只能完成部分类型发票的扫描录入,且识别准确率不高;而不同场景文字的检测与识别,汉字、字符和数字等文字信息的识别、端到端的解决技术方案还需要对文本进行切割,步骤复杂容易产生误差累积、效率低等诸多不足之处,以待改进。
鉴于现有技术中的上述缺陷或不足,本发明的发明者期望提供一种基于更优化的CRNN神经网络模型快速且准确的识别票据中文字信息的算法及设备,尤其是票据中某一特定区域的文字信息的识别算法,克服了上述现有技术不足,使财务人员从繁琐的票据审核工作解脱出来。
发明内容
基于上述目的,本发明创新性地从票据图片中定位并切分出特定区域,例如购买方名称区域,以便于更好的识别;同时,采用CRNN神经网络训练产生识别模型,不需要再进行汉字的切分识别单个汉字,避免了因切分错误而对识别率造成影响。具体地,首先利用CNN提取特征,然后再利用RNN处理序列,结合两者的优点进行识别,从而大大提高识别正确率。
第一方面,本发明提供了一种基于CRNN的票据信息识别算法,该方法包括以下步骤:
S1、获取多个票据图片;
S2、从所述多个票据图片中的任一票据图片上截取特定区域的图片作为所需的模板;
S3、采用模板匹配的方法来定位所述多个票据图片中相应位置的特定区域;
S4、重复执行S3,从所述多个票据图片中截取若干特定区域图片,整理并标注训练集;和
S5、利用CRNN训练模型识别所述特定区域图片中的文字信息。
具体地,
所述步骤S3采用模板匹配的方法来定位所述多个票据图片中的所述特定区域,包括:
S31、根据步骤S2得到的所述模板,采用模板匹配的方法从所述待审核的票据图片中定位与所述模板相应位置的特定区域;和
S32、根据所述模板中所述特定区域的相对位置和所述模板对应的文字信息,定位到所述待审核票据图片中相应的特定区域和相应的文字区域,并截取所述特定区域相应的文字区域的图片。
所述步骤S4采用S3中的方法截取若干所述特定区域相应文字信息的图片,整理并标注训练集,包括:
S41、重复执行步骤S3,从所述多张票据图片中截取所述特定区域的图片;
S42、删除截取有误的图片,截取正确的图片整理为训练集;和
S43、对训练集进行标注。所述步骤S5中所述CRNN训练模型识别特定区域的文字信息,具体包括:
S51、搭建CRNN网络,其结构层次包括卷积神经网络CNN和循环神经网络RNN;其中,所述卷积神经网络包括7层卷积层,除第三层和第七层卷积层以外的每层卷积层之后均会进行最大池化处理;所述循环神经网络包括2层双向循环神经网络层,其基本神经元为LSTM单元;
S52、调整所述CRNN中的网络参数;
S53、对在步骤S4中筛选出的所述特定区域图片进行训练集和测试集的分类;
S54、将测试集和训练集以可处理的文件格式进行存储;
S55、将训练集放入CRNN网络中进行训练,并在训练的同时对所述CRNN模型进行测试;
S56、当训练及测试的损失收敛时,停止训练,获取CRNN识别模型;和
S57、使用S56中生成的所述CRNN识别模型对特定区域的文字信息图片进行识别。
进一步地,本发明提供的一种基于CRNN的票据信息识别算法,适用于金融领域中票据信息的识别。其中,所述金融领域的票据包括支票、发票、提单、汇票等。
具体地,所述票据信息的识别包括独立地识别支票中的收款人、付款方区域的文字信息或公章的文字信息,以及发票中的购买方名称、纳税人识别号或其他区域的文字信息。
优选地,本发明提供的所述基于CRNN的票据信息识别算法可以适用于识别发票中每个区域的文字信息,例如购买方名称。
更进一步地,本发明提供了一种基于CRNN的发票信息的识别算法用于识别并核对发票中的购买方名称信息,该方法包括以下步骤:
S1、获取多个发票图片;
S2、从所述多个发票图片中的任一发票图片上截取特定区域的图片作为所需的模板;
S3、采用模板匹配的方法来定位所述多个发票图片中相应位置的特定区域,其中,步骤S3包括:
S31、根据步骤S2得到的所述模板,采用模板匹配的方法从所述待审核的发票图片中定位与所述模板相应位置的特定区域;和
S32、根据所述模板中所述特定区域的相对位置和所述模板对应的文字信息,定位到所述待审核发票图片中相应的特定区域和相应的文字区域,并截取所述特定区域相应的文字区域的图片;
S4、重复执行S3,从所述多个票据图片中截取若干特定区域图片,整理并标注训练集,其中,所述步骤S4包括:
S41、重复执行步骤S3,从所述发票图片中截取所述特定区域的文字信息图片;
S42、删除截取有误的图片,整理出截取正确的图片作为训练集;和
S43、对训练集进行标注;
S5、利用CRNN训练模型识别所述特定区域图片中的文字信息,其中所述步骤S5包括:
S51、搭建CRNN网络,其结构层次包括卷积神经网络CNN,和循环神经网络RNN;其中,所述CNN包括7层卷积层,除第三和第七层卷积层以外,每层卷积层之后都会进行最大池化处理;所述RNN包括了2层双向循环神经网络层,其中基本神经元为LSTM单元;
S52、调整CRNN网络中的参数,将batch大小设置为16或32,learning rate设置为0.0005,epoch设置为500;
S53、对在步骤S4中筛选出的所述特定区域文字信息图片进行训练集和测试集的分类;
S54、将测试集和训练集以’.mdb’文件格式进行存储;
S55、将训练集放入CRNN网络中进行训练,并在训练的同时对当前模型进行测试;
S56、当训练以及测试的损失收敛时,停止训练,获取所述CRNN网络模型;和
S57、使用S56中生成的所述CRNN识别模型对所述特定区域图片进行识别。
进一步地,在所述基于CRNN的发票信息的识别算法中,所述特定区域的文字信息是指购买方名称区域的文字信息。
进一步地,所述CRNN网络中的卷积神经网络CNN使用多个小过滤器,且在所述每一层中增加dropout的操作;所述CRNN网络中的循环神经网络RNN中基本神经单元可替代性地选用GRU单元。
更进一步地,所述GRU模型包括更新门和重置门,所述更新门用于控制前一时刻的状态信息被带入到当前状态中的程度,更新门的值越大说明前一时刻的状态信息带入越多。所述重置门用于控制忽略前一时刻的状态信息的程度,重置门的值越小说明忽略得越多。
第二方面,本发明还提供了一种设备,包括一个或多个处理器和存储器,其中存储器包含可由所述一个或多个处理器执行的指令以使得所述一个或多个处理器执行根据本发明各种实施方式提供的识别算法。
第三方面,本发明还提供一种存储有计算机程序的计算机可读存储介质,所述计算机程序使计算机执行根据本发明各实施方式提供的方法。
基于上述技术方案和特征,本发明提供的基于CRNN的票据信息的识别算法及设备针对现有CRNN框架进行重新的构建和优化,主要的改进以下两个方面:
一方面,现有CRNN框架中的卷积神经网络CNN部分采取的是相对传统的LeNet网络结构,该网络结构能够较好地对分类类别小的样本集进行分类。该LeNet网络存在的缺陷具体表现为:(1)由于LeNet网络结构每一层的过滤器是逐渐变大,该网络的参数量较多,因此存在训练慢,载入慢的缺点;(2)当分类的类别增多,网络的训练的过程中容易出现过拟合的情况。
针对这些缺点,本方面上述技术方案对卷积神经网络进行优化调整:(1)使用多个小过滤器代替卷积层中较大的过滤器使得在同样感受野效果的情况下,降低网络参数,使得模型训练,模型加载变得快捷;(2)在每一层中增加dropout的操作,避免了过拟合的现象。
另一方面,现有CRNN框架中的循环神经网络RNN部分采取了LSTM结构,LSTM良好的解决了RNN中的长依赖问题,同时也避免了梯度消失的问题。但是LSTM的重复网络模块的结构很复杂,它需要实现三个门计算,即遗忘门、输入门和输出门。基于此,本方面上述技术方案采取了LSTM的一个变体GRU来代替现有结构。所述GRU模型只有更新门和重置门。所述更新门用于控制前一时刻的状态信息被带入到当前状态中的程度,更新门的值越大说明前一时刻的状态信息带入越多。所述重置门用于控制忽略前一时刻的状态信息的程度,重置门的值越小说明忽略得越多。GRU保持了LSTM效果的同时又使结构更加简单,减少了模型的大小。
有益效果
与现有技术相比较,本发明提供的基于CRNN的票据信息识别算法,使基于CRNN的OCR技术,克服了传统OCR技术存在不足之处,不需要对文本进行切割,步骤较少,克服了传统方法中步骤繁多产生的误差累计及最终识别出现较大误差的问题,实现了端到端的处理。
具体体现在:一方面,在OCR技术方向,被使用到的一个模型是seq2seq模型。seq2seq模型采用RNN对输入数据进行编码,得到一个中间向量,然后又通过RNN进行解码,得到最终地输出。与之相比,本发明所述的CRNN相比,CRNN能够更好的捕获到long_distance的依赖关系,并且降低了由RNN引入的梯度消失/梯度爆炸Gradient Vanish/Explore风险。另一方面,在输入长度是n的情况下,RNN计算的时间复杂度是O(n),而CNN的时间复杂度是O(n/k),k是卷积窗口大小;在训练效率上,CNN可以方便的实现并行化处理,因此使CRNN能够更快的训练出于其的结果。
本发明的改进之处在于分别改进了RNN和CNN的模型设置,组合使用优化的CRNN,从而达到上述突出的技术效果。
附图说明
为了更清晰地了解本发明,请参照以下附图所作的对非限制性示例性说明,本文将对本申请的特征、目的和优点做全面的说明:
图1为本发明提供的一种基于CRNN的票据信息识别算法的流程图。
图2为本发明一种实施方式提供的一种基于CRNN的发票信息识别算法的流程图,其中,特定区域的文字信息是指发票图片中的购买方名称。
图3为本发明提供的一种基于CRNN的发票信息识别算法的中的CRNN模型的结构示意图。
图4为本发明提供的一种基于CRNN的发票信息识别算法的一种实施方式中步骤S2的示意图。
图5为本发明提供的一种基于CRNN的发票信息识别算法的一种实施方式中步骤S3的示意图。
图6为本发明提供的一种设备的结构示意图,该图所示设备可对应执行图1-2所示实施方式中基于CRNN神经网络模型的票据信息识别算法。
具体实施方式
下面结合附图和实施方式对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施方式仅仅用于解释本发明的技术方案、发明构思,而非对本发明所做的限制性说明。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。其它未明确示出或未明确说明的部分均应理解为现有技术常规手段或方案,其结合本发明示出的技术特征可以实现本发明的技术效果。
需要说明的是,在不冲突的情况下,本发明中的实施方式及实施例中的具体的附加技术特征可以相互组合或替换。下面将参考附图并结合实施例来详细说明本申请。
图1为本发明提供的一种基于CRNN的票据信息识别算法的示意流程图。
图2为本发明一种实施方式提供的一种基于CRNN的发票信息识别算法的示意流程图,其中特定区域的文字信息是指发票图片中的购买方名称。
正如图1和图2所示,本发明提供的基于CRNN的票据信息识别算法,该方法包括以下步骤:
S1、扫描票据,获取多个票据图片;
S2、从多个票据图片中的任一票据图片上截取特定区域的图片作为所需的模板;
S3、采用模板匹配的方法来定位所述多个票据图片中相应位置的特定区域;
S4、重复执行S3,从多个票据图片中截取若干特定区域图片,整理并标注训练集;和
S5、利用CRNN训练模型识别特定区域图片中的文字信息。
具体地,
步骤S3采用模板匹配的方法来定位多个票据图片中的特定区域,包括:
S31、根据步骤S2得到的模板,采用模板匹配的方法从待审核的票据图片中定位与模板相应位置的特定区域;和
S32、根据模板中特定区域的相对位置和模板对应的文字信息,定位到待审核票据图片中相应的特定区域和相应的文字区域,并截取特定区域相应的文字区域的图片。
步骤S4采用S3中的方法截取若干特定区域相应文字信息的图片,整理并标注训练集,包括:
S41、重复执行步骤S3,从多张票据图片中截取特定区域的图片;
S42、删除截取有误的图片,截取正确的图片整理为训练集;和
S43、对训练集进行标注。步骤S5中CRNN训练模型识别特定区域的文字信息,具体包括:
S51、搭建CRNN网络,其结构层次包括卷积神经网络CNN和循环神经网络RNN;其中,CNN包括7层卷积层,除第三层和第七层卷积层以外的每层卷积层之后均会进行最大池化处理;RNN包括2层双向循环神经网络层,其基本神经元为LSTM单元;
S52、调整CRNN中的网络参数,具体地,将batch大小设置为16或32,learning rate设置为0.0005,epoch设置为500;
S53、对在步骤S4中筛选出的特定区域图片,例如,发票购买方名称图片,进行训练集和测试集的分类,其中测试集Ntest张(例如,Ntest=2000张),训练集为Ntraining张(例如,Ntraining=13000张);
S54、将测试集和训练集以可处理的文件格式进行存储;
S55、将训练集放入CRNN网络中进行训练,并在训练的同时对CRNN模型进行测试;
S56、当训练及测试的损失收敛时,停止训练,获取CRNN识别模型;和
S57、使用S56中生成的CRNN识别模型对特定区域的文字信息图片进行识别,直至算法结束。
本发明优选的一种实施方式,即图2所示出的一种基于CRNN的发票信息识别算法的示意流程图,其中,特定区域的文字信息是指发票图片中的购买方名称。
如图2所示基于CRNN的发票信息的识别算法,并参考图4-5所示的步骤S2和S3的示例性说明,该方法包括以下步骤:
S1、扫描发票,获取大量的待审核发票图片;
S2、从多个发票图片中的任一发票图片上截取特定区域的图片作为所需的模板;
S3、采用模板匹配的方法来定位多个发票图片中相应位置的特定区域,其中,步骤S3包括:
S31、根据步骤S2得到的模板,采用模板匹配的方法从待审核的发票图片中定位与模板相应位置的特定区域;和
S32、根据模板中特定区域的相对位置和模板对应的文字信息,定位到待审核发票图片中相应的特定区域和相应的文字区域,并截取特定区域相应的文字区域的图片;
S4、重复执行S3,从多个票据图片中截取若干特定区域图片,整理并标注训练集,其中,步骤S4包括:
S41、重复执行步骤S3,从发票图片中截取特定区域的文字信息图片,例如,待审核发票图片为16000张;
S42、删除截取有误的图片,整理出截取正确的图片作为训练集,例如,截取正确的图片为15000张;和
S43、对训练集进行标注;
S5、利用CRNN训练模型识别特定区域图片中的文字信息。
更具体地,图3为本发明提供的一种基于CRNN的发票信息识别算法的中的CRNN模型的结构示意图。
如图3所示,步骤S5包括:
S51、搭建CRNN网络,其结构层次包括卷积神经网络CNN,和循环神经网络RNN;其中,CNN包括7层卷积层,除第三和第七层卷积层以外,每层卷积层之后都会进行最大池化处理;RNN包括了2层双向循环神经网络层,其中基本神经元为LSTM单元;
S52、调整CRNN网络中的参数,将batch大小设置为16或32,learning rate设置为0.0005,epoch设置为500;
S53、对在步骤S4中筛选出的特定区域文字信息图片进行训练集和测试集的分类;其中测试集Ntest张(例如,Ntest=2000张),训练集为Ntraining张(例如,Ntraining=13000张)
S54、将测试集和训练集以’.mdb’文件格式进行存储;
S55、将训练集放入CRNN网络中进行训练,并在训练的同时对当前模型进行测试;
S56、当训练以及测试的损失收敛时,停止训练,获取CRNN网络模型;和
S57、使用S56中生成的CRNN识别模型对特定区域图片进行识别。
图6为本发明提供的一种设备的一种实施方式,包括一个或多个处理器(CPU)1和存储器。其可以根据存储在只读存储器(ROM)2中的程序或者从存储部分8加载到随机访问存储器(RAM)3中的程序而执行各种适当的动作和处理。在RAM 3中,还存储有设备操作所需的各种程序和数据。CPU、ROM以及RAM通过总线4彼此相连。输入/输出(I/O)接口5也连接至总线。
以下部件连接至I/O接口5:包括键盘、鼠标等的输入部分6;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分7;包括硬盘等的存储部分8;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分9。通信部分9经由诸如因特网的网络执行通信处理。驱动器10也根据需要连接至I/O接口5。可拆卸介质11,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器10上,以便于从其上读出的计算机程序根据需要被安装入存储部分。其中存储器包含可由所示的一个或多个处理器执行的指令以使得所述一个或多个处理器执行根据本发明各种实施方式提供的识别算法,例如,图1或2所示的识别算法。
特别地,根据本申请的实施方式,上述任一实施方式描述的识别算法可以被实现为计算机软件程序。例如,本申请的实施方式包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于基于CRNN网络模型的票据信息的识别算法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。
作为又一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式的设备中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。
附图中的流程示意图和框图,图示了按照本发明一些实施方式的方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。也要注意的是,流程图中的每个方框、以及结构示意图的组合,可以通过执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以通过专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现。所描述的单元或模块也可以设置在处理器中,例如,各所述单元可以是设置在计算机或移动智能设备中的软件程序,也可以是单独配置的硬件装置。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
以上描述仅为本申请的较佳实施方式以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离本申请构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (13)
1.一种基于卷积循环神经网络CRNN的票据信息识别算法,其特征在于,所述方法包括以下步骤:
S1、获取多个票据图片;
S2、从所述多个票据图片中的任一票据图片上截取特定区域的图片作为所需的模板;
S3、采用模板匹配的方法来定位所述多个票据图片中相应位置的特定区域;
S4、重复执行S3,从所述多个票据图片中截取若干特定区域图片,整理并标注训练集;和
S5、利用CRNN训练模型识别所述特定区域图片中的文字信息。
2.根据权利要求1所述的基于CRNN的票据信息识别算法,其特征在于,所述步骤S3采用模板匹配的方法来定位所述多个票据图片中的所述特定区域,包括:
S31、根据步骤S2得到的所述模板,采用模板匹配的方法从所述待审核的票据图片中定位与所述模板相应位置的特定区域;和
S32、根据所述模板中所述特定区域的相对位置和所述模板对应的文字信息,定位到所述待审核票据图片中相应的特定区域和相应的文字区域,并截取所述特定区域相应的文字区域的图片。
3.根据权利要求1所述的基于CRNN的票据信息识别算法,其特征在于,所述步骤S4采用S3中的方法截取若干所述特定区域相应文字信息的图片,整理并标注训练集,包括:
S41、重复执行步骤S3,从所述多张票据图片中截取所述特定区域的图片;
S42、删除截取有误的图片,截取正确的图片整理为训练集;和
S43、对训练集进行标注。
4.根据权利要求1所述的基于CRNN的票据信息识别算法,其特征在于,所述步骤S5中所述CRNN训练模型识别特定区域的文字信息,具体包括:
S51、搭建CRNN网络,其结构层次包括卷积神经网络CNN和循环神经网络RNN;其中,所述卷积神经网络包括7层卷积层,除第三层和第七层卷积层以外的每层卷积层之后均会进行最大池化处理;所述循环神经网络包括2层双向循环神经网络层,其基本神经元为LSTM单元;
S52、调整所述CRNN中的网络参数;
S53、对在步骤S4中筛选出的所述特定区域图片进行训练集和测试集的分类;
S54、将测试集和训练集以可处理的文件格式进行存储;
S55、将训练集放入CRNN网络中进行训练,并在训练的同时对所述CRNN模型进行测试;
S56、当训练及测试的损失收敛时,停止训练,获取CRNN识别模型;和
S57、使用S56中生成的所述CRNN识别模型对特定区域的文字信息图片进行识别。
5.根据权利要求1所述的基于CRNN的票据信息识别算法,其特征在于,所述其中所述票据为金融领域中的票据。
6.根据权利要求5所述的基于CRNN的票据信息识别算法,其特征在于,所述金融领域的票据包括支票、发票、提单和汇票。
7.根据权利要求1所述的基于CRNN的票据信息识别算法,其特征在于,所述票据信息包括识别支票中的收款人、付款方区域的文字信息或发票中的购买方名称、纳税人识别号相应区域的文字信息。
8.根据权利要求1或7所述的基于CRNN的票据信息识别算法,其特征在于,所述基于CRNN的票据信息的识别算法包括以下步骤:
S1、获取多个发票图片;
S2、从所述多个发票图片中的任一发票图片上截取特定区域的图片作为所需的模板;
S3、采用模板匹配的方法来定位所述多个发票图片中相应位置的特定区域,其中,步骤S3包括:
S31、根据步骤S2得到的所述模板,采用模板匹配的方法从所述待审核的发票图片中定位与所述模板相应位置的特定区域;和
S32、根据所述模板中所述特定区域的相对位置和所述模板对应的文字信息,定位到所述待审核发票图片中相应的特定区域和相应的文字区域,并截取所述特定区域相应的文字区域的图片;
S4、重复执行S3,从所述多个票据图片中截取若干特定区域图片,整理并标注训练集,其中,所述步骤S4包括:
S41、重复执行步骤S3,从所述发票图片中截取所述特定区域的文字信息图片;
S42、删除截取有误的图片,整理出截取正确的图片作为训练集;和
S43、对训练集进行标注;
S5、利用CRNN训练模型识别所述特定区域图片中的文字信息,其中所述步骤S5包括:
S51、搭建CRNN网络,其结构层次包括卷积神经网络CNN,和循环神经网络RNN;其中,所述CNN包括7层卷积层,除第三和第七层卷积层以外,每层卷积层之后都会进行最大池化处理;所述RNN包括了2层双向循环神经网络层,其中基本神经元为LSTM单元;
S52、调整CRNN网络中的参数,将batch大小设置为16或32,learning rate设置为0.0005,epoch设置为500;
S53、对在步骤S4中筛选出的所述特定区域文字信息图片进行训练集和测试集的分类,其中测试集Ntest张,训练集为Ntraining张;
S54、将测试集和训练集以’.mdb’文件格式进行存储;
S55、将训练集放入CRNN网络中进行训练,并在训练的同时对当前模型进行测试;
S56、当训练以及测试的损失收敛时,停止训练,获取所述CRNN网络模型;和
S57、使用S56中生成的所述CRNN识别模型对所述特定区域图片进行识别。
9.根据权利要求8所述的基于CRNN的票据信息识别算法,其特征在于,在所述基于CRNN的发票信息的识别算法中,所述特定区域的文字信息包括购买方名称区域的文字信息。
10.根据权利要求1所述的基于CRNN的票据信息识别算法,其特征在于,所述CRNN网络中的所述卷积神经网络CNN使用一个以上的小过滤器,且在所述每一层中增加dropout操作;所述CRNN网络中的循环神经网络RNN中基本神经单元为GRU单元。
11.根据权利要求10所述的基于CRNN的票据信息识别算法,其特征在于,所述GRU模型包括更新门和重置门。
12.一种设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1-11中任一项所述的方法。
13.一种存储有计算机程序的计算机可读存储介质,其特征在于,该程序被处理器执行时实现如权利要求1-11中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810779044.7A CN109214382A (zh) | 2018-07-16 | 2018-07-16 | 一种基于crnn的票据信息识别算法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810779044.7A CN109214382A (zh) | 2018-07-16 | 2018-07-16 | 一种基于crnn的票据信息识别算法、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109214382A true CN109214382A (zh) | 2019-01-15 |
Family
ID=64990528
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810779044.7A Pending CN109214382A (zh) | 2018-07-16 | 2018-07-16 | 一种基于crnn的票据信息识别算法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109214382A (zh) |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109886274A (zh) * | 2019-03-25 | 2019-06-14 | 山东浪潮云信息技术有限公司 | 基于opencv和深度学习的社保卡识别方法及系统 |
CN109919125A (zh) * | 2019-03-19 | 2019-06-21 | 厦门商集网络科技有限责任公司 | 基于票据识别的差旅行程还原方法及其系统 |
CN110008956A (zh) * | 2019-04-01 | 2019-07-12 | 深圳市华付信息技术有限公司 | 发票关键信息定位方法、装置、计算机设备及存储介质 |
CN110245716A (zh) * | 2019-06-20 | 2019-09-17 | 杭州睿琪软件有限公司 | 样本标注审核方法及装置 |
CN110399845A (zh) * | 2019-07-29 | 2019-11-01 | 上海海事大学 | 一种图像中连续成段文本检测与识别方法 |
CN110399932A (zh) * | 2019-07-31 | 2019-11-01 | 中国工商银行股份有限公司 | 信用证软条款识别方法及装置 |
CN110442841A (zh) * | 2019-06-20 | 2019-11-12 | 平安科技(深圳)有限公司 | 识别简历的方法及装置、计算机设备、存储介质 |
CN110490181A (zh) * | 2019-08-14 | 2019-11-22 | 北京思图场景数据科技服务有限公司 | 一种基于ocr识别技术的表单填写审核方法、装置、设备以及计算机存储介质 |
CN110503100A (zh) * | 2019-08-16 | 2019-11-26 | 湖南星汉数智科技有限公司 | 一种医疗单据识别方法、装置、计算机装置及计算机可读存储介质 |
CN110689658A (zh) * | 2019-10-08 | 2020-01-14 | 北京邮电大学 | 一种基于深度学习的出租车票据识别方法和系统 |
CN110751143A (zh) * | 2019-09-26 | 2020-02-04 | 中电万维信息技术有限责任公司 | 一种电子发票信息的提取方法及电子设备 |
CN110766017A (zh) * | 2019-10-22 | 2020-02-07 | 国网新疆电力有限公司信息通信公司 | 基于深度学习的移动终端文字识别方法及系统 |
CN111046946A (zh) * | 2019-12-10 | 2020-04-21 | 昆明理工大学 | 基于crnn的缅甸语图像文本识别方法 |
CN111126319A (zh) * | 2019-12-27 | 2020-05-08 | 山东旗帜信息有限公司 | 一种发票识别方法及装置 |
CN111192392A (zh) * | 2019-12-16 | 2020-05-22 | 深圳供电局有限公司 | 身份验证方法、装置、计算机设备和计算机可读存储介质 |
CN111325092A (zh) * | 2019-12-26 | 2020-06-23 | 湖南星汉数智科技有限公司 | 一种动车票识别方法、装置、计算机装置及计算机可读存储介质 |
CN111340035A (zh) * | 2020-03-24 | 2020-06-26 | 山东浪潮通软信息科技有限公司 | 一种火车票识别方法、系统、设备以及介质 |
CN111414906A (zh) * | 2020-03-05 | 2020-07-14 | 北京交通大学 | 纸质票据图片的数据合成与文本识别方法 |
CN111444793A (zh) * | 2020-03-13 | 2020-07-24 | 安诚迈科(北京)信息技术有限公司 | 基于ocr的票据识别方法、设备、存储介质及装置 |
CN111507181A (zh) * | 2020-03-11 | 2020-08-07 | 平安科技(深圳)有限公司 | 票据图像的矫正方法、装置及计算机设备 |
CN112200177A (zh) * | 2020-07-21 | 2021-01-08 | 山东文多网络科技有限公司 | 一种基于提单扫描件大数据的单号识别方法及装置 |
CN112464941A (zh) * | 2020-10-23 | 2021-03-09 | 北京思特奇信息技术股份有限公司 | 一种基于神经网络的发票识别方法和系统 |
CN112949455A (zh) * | 2021-02-26 | 2021-06-11 | 武汉天喻信息产业股份有限公司 | 一种增值税发票识别系统及方法 |
WO2021139341A1 (zh) * | 2020-05-28 | 2021-07-15 | 平安科技(深圳)有限公司 | 基于红外光和紫外光的文字识别方法、装置和计算机设备 |
CN113191343A (zh) * | 2021-03-31 | 2021-07-30 | 成都飞机工业(集团)有限责任公司 | 一种基于卷积神经网络的航空线材识别码自动识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599819A (zh) * | 2016-12-06 | 2017-04-26 | 中国科学院半导体研究所 | 基于hol特征与子空间学习的静脉识别方法 |
CN107798299A (zh) * | 2017-10-09 | 2018-03-13 | 平安科技(深圳)有限公司 | 票据信息识别方法、电子装置及可读存储介质 |
CN108171127A (zh) * | 2017-12-13 | 2018-06-15 | 广东电网有限责任公司清远供电局 | 一种基于深度学习的发票自动识别方法 |
-
2018
- 2018-07-16 CN CN201810779044.7A patent/CN109214382A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599819A (zh) * | 2016-12-06 | 2017-04-26 | 中国科学院半导体研究所 | 基于hol特征与子空间学习的静脉识别方法 |
CN107798299A (zh) * | 2017-10-09 | 2018-03-13 | 平安科技(深圳)有限公司 | 票据信息识别方法、电子装置及可读存储介质 |
CN108171127A (zh) * | 2017-12-13 | 2018-06-15 | 广东电网有限责任公司清远供电局 | 一种基于深度学习的发票自动识别方法 |
Non-Patent Citations (2)
Title |
---|
BAOGUANG SHI ET AL: "An End-to-End Trainable Neural Network for Image-Based Sequence Recognition and Its Application to Scene Text Recognition", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 * |
高志强等: "《深度学习从入门到实践》", 30 June 2018, 中国铁道出版社 * |
Cited By (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109919125A (zh) * | 2019-03-19 | 2019-06-21 | 厦门商集网络科技有限责任公司 | 基于票据识别的差旅行程还原方法及其系统 |
CN109919125B (zh) * | 2019-03-19 | 2021-03-26 | 厦门商集网络科技有限责任公司 | 基于票据识别的差旅行程还原方法及其系统 |
CN109886274A (zh) * | 2019-03-25 | 2019-06-14 | 山东浪潮云信息技术有限公司 | 基于opencv和深度学习的社保卡识别方法及系统 |
CN110008956A (zh) * | 2019-04-01 | 2019-07-12 | 深圳市华付信息技术有限公司 | 发票关键信息定位方法、装置、计算机设备及存储介质 |
CN110245716B (zh) * | 2019-06-20 | 2021-05-14 | 杭州睿琪软件有限公司 | 样本标注审核方法及装置 |
CN110245716A (zh) * | 2019-06-20 | 2019-09-17 | 杭州睿琪软件有限公司 | 样本标注审核方法及装置 |
CN110442841A (zh) * | 2019-06-20 | 2019-11-12 | 平安科技(深圳)有限公司 | 识别简历的方法及装置、计算机设备、存储介质 |
CN110442841B (zh) * | 2019-06-20 | 2024-02-02 | 平安科技(深圳)有限公司 | 识别简历的方法及装置、计算机设备、存储介质 |
CN110399845A (zh) * | 2019-07-29 | 2019-11-01 | 上海海事大学 | 一种图像中连续成段文本检测与识别方法 |
CN110399932A (zh) * | 2019-07-31 | 2019-11-01 | 中国工商银行股份有限公司 | 信用证软条款识别方法及装置 |
CN110490181A (zh) * | 2019-08-14 | 2019-11-22 | 北京思图场景数据科技服务有限公司 | 一种基于ocr识别技术的表单填写审核方法、装置、设备以及计算机存储介质 |
CN110490181B (zh) * | 2019-08-14 | 2022-04-22 | 北京思图场景数据科技服务有限公司 | 一种基于ocr识别技术的表单填写审核方法、装置、设备以及计算机存储介质 |
CN110503100A (zh) * | 2019-08-16 | 2019-11-26 | 湖南星汉数智科技有限公司 | 一种医疗单据识别方法、装置、计算机装置及计算机可读存储介质 |
CN110503100B (zh) * | 2019-08-16 | 2022-05-03 | 湖南星汉数智科技有限公司 | 一种医疗单据识别方法、装置、计算机装置及计算机可读存储介质 |
CN110751143A (zh) * | 2019-09-26 | 2020-02-04 | 中电万维信息技术有限责任公司 | 一种电子发票信息的提取方法及电子设备 |
CN110689658A (zh) * | 2019-10-08 | 2020-01-14 | 北京邮电大学 | 一种基于深度学习的出租车票据识别方法和系统 |
CN110766017B (zh) * | 2019-10-22 | 2023-08-04 | 国网新疆电力有限公司信息通信公司 | 基于深度学习的移动终端文字识别方法及系统 |
CN110766017A (zh) * | 2019-10-22 | 2020-02-07 | 国网新疆电力有限公司信息通信公司 | 基于深度学习的移动终端文字识别方法及系统 |
CN111046946B (zh) * | 2019-12-10 | 2021-03-02 | 昆明理工大学 | 基于crnn的缅甸语图像文本识别方法 |
CN111046946A (zh) * | 2019-12-10 | 2020-04-21 | 昆明理工大学 | 基于crnn的缅甸语图像文本识别方法 |
CN111192392A (zh) * | 2019-12-16 | 2020-05-22 | 深圳供电局有限公司 | 身份验证方法、装置、计算机设备和计算机可读存储介质 |
CN111325092B (zh) * | 2019-12-26 | 2023-09-22 | 湖南星汉数智科技有限公司 | 一种动车票识别方法、装置、计算机装置及计算机可读存储介质 |
CN111325092A (zh) * | 2019-12-26 | 2020-06-23 | 湖南星汉数智科技有限公司 | 一种动车票识别方法、装置、计算机装置及计算机可读存储介质 |
CN111126319A (zh) * | 2019-12-27 | 2020-05-08 | 山东旗帜信息有限公司 | 一种发票识别方法及装置 |
CN111414906A (zh) * | 2020-03-05 | 2020-07-14 | 北京交通大学 | 纸质票据图片的数据合成与文本识别方法 |
CN111414906B (zh) * | 2020-03-05 | 2024-05-24 | 北京交通大学 | 纸质票据图片的数据合成与文本识别方法 |
CN111507181A (zh) * | 2020-03-11 | 2020-08-07 | 平安科技(深圳)有限公司 | 票据图像的矫正方法、装置及计算机设备 |
CN111507181B (zh) * | 2020-03-11 | 2023-05-26 | 平安科技(深圳)有限公司 | 票据图像的矫正方法、装置及计算机设备 |
CN111444793A (zh) * | 2020-03-13 | 2020-07-24 | 安诚迈科(北京)信息技术有限公司 | 基于ocr的票据识别方法、设备、存储介质及装置 |
CN111340035A (zh) * | 2020-03-24 | 2020-06-26 | 山东浪潮通软信息科技有限公司 | 一种火车票识别方法、系统、设备以及介质 |
WO2021139341A1 (zh) * | 2020-05-28 | 2021-07-15 | 平安科技(深圳)有限公司 | 基于红外光和紫外光的文字识别方法、装置和计算机设备 |
CN112200177A (zh) * | 2020-07-21 | 2021-01-08 | 山东文多网络科技有限公司 | 一种基于提单扫描件大数据的单号识别方法及装置 |
CN112464941A (zh) * | 2020-10-23 | 2021-03-09 | 北京思特奇信息技术股份有限公司 | 一种基于神经网络的发票识别方法和系统 |
CN112464941B (zh) * | 2020-10-23 | 2024-05-24 | 北京思特奇信息技术股份有限公司 | 一种基于神经网络的发票识别方法和系统 |
CN112949455A (zh) * | 2021-02-26 | 2021-06-11 | 武汉天喻信息产业股份有限公司 | 一种增值税发票识别系统及方法 |
CN112949455B (zh) * | 2021-02-26 | 2024-04-05 | 武汉天喻信息产业股份有限公司 | 一种增值税发票识别系统及方法 |
CN113191343A (zh) * | 2021-03-31 | 2021-07-30 | 成都飞机工业(集团)有限责任公司 | 一种基于卷积神经网络的航空线材识别码自动识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109214382A (zh) | 一种基于crnn的票据信息识别算法、设备及存储介质 | |
US11816165B2 (en) | Identification of fields in documents with neural networks without templates | |
CN110298338B (zh) | 一种文档图像分类方法及装置 | |
CN107067044B (zh) | 一种财务报销全票据智能审核系统 | |
Agrawal et al. | Automated bank cheque verification using image processing and deep learning methods | |
CN107194400B (zh) | 一种财务报销全票据图片识别处理方法 | |
WO2023015922A1 (zh) | 图像识别模型的训练方法、装置、设备及存储介质 | |
CN109670429A (zh) | 一种基于实例分割的监控视频多目标人脸检测方法及系统 | |
CN105138998B (zh) | 基于视角自适应子空间学习算法的行人重识别方法及系统 | |
CN107133571A (zh) | 一种将纸质发票自动生成财务报表的系统及方法 | |
CN109034155A (zh) | 一种文字检测及识别的方法及系统 | |
US20210366055A1 (en) | Systems and methods for generating accurate transaction data and manipulation | |
Caldeira et al. | Industrial optical character recognition system in printing quality control of hot-rolled coils identification | |
CN109919076A (zh) | 基于深度学习的确认ocr识别结果可靠性的方法及介质 | |
CN111340022A (zh) | 身份证信息识别方法、装置、计算机设备及存储介质 | |
Jha et al. | Automation of cheque transaction using deep learning and optical character recognition | |
Zhang et al. | Classification of financial tickets using weakly supervised fine-grained networks | |
Gayathri et al. | Optical Character Recognition in Banking Sectors Using Convolutional Neural Network | |
Shi et al. | An invoice recognition system using deep learning | |
US20200210748A1 (en) | Intelligent recognition and extraction of numerical data from non-numerical graphical representations | |
CN115205877A (zh) | 一种不规则排版发票单据布局预测方法、装置及存储介质 | |
Dong et al. | An Image Classification Algorithm of Financial Instruments Based on Convolutional Neural Network. | |
Chaudhary et al. | Bank cheque validation using image processing | |
Sarkar et al. | Improving isolated bangla compound character recognition through feature-map alignment | |
Dutly et al. | PHTI-WS: a printed and handwritten text identification web service based on FCN and CRF post-processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190115 |
|
RJ01 | Rejection of invention patent application after publication |