CN108345880A

CN108345880A - 发票识别方法、装置、计算机设备和存储介质

Info

Publication number: CN108345880A
Application number: CN201810079187.7A
Authority: CN
Inventors: 胡志成; 蒋菲; 陈桓; 张良杰
Original assignee: Kingdee Software China Co Ltd
Current assignee: Kingdee Software China Co Ltd
Priority date: 2018-01-26
Filing date: 2018-01-26
Publication date: 2018-07-31
Anticipated expiration: 2038-01-26
Also published as: CN108345880B

Abstract

本申请涉及一种发票识别方法、装置、计算机设备和存储介质。所述方法包括：获取发票图像，对发票图像进行分割得到多个目标区域；对多个目标区域的多个字符区域进行分割得到多个字符图像；将每个字符图像输入已训练好的深度学习神经网络模型中进行识别，得到对应的每个字符图像的第一字符识别结果和与第一字符识别结果对应的识别概率；根据第一字符识别结果对应的识别概率获取二次识别字符图像，将二次识别字符图像输入支持向量机模型，得到对应的第二字符识别结果；根据第一字符识别结果和第二字符识别结果得到与发票图像对应的发票识别结果。采用本方法能够得到的更为准确的字符识别结果，从而提高发票的识别准确率。

Description

发票识别方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域，特别是涉及一种发票识别方法、装置、计算机设备和存储介质。

背景技术

随着计算机技术和图像处理技术的发展，图像处理技术被广泛的应用于各个技术领域。

在发票识别领域主要是用于识别发票中的信息，记录发票信息。增值发票(即增值税专用发票)是由国家税务总局监制设计印制的，只限于增值税一般纳税人领购使用的，既作为纳税人反映经济活动中的重要会计凭证又是兼记销货方纳税义务和购货方进项税额的合法证明。是纳税与财务报销中有重要凭证。现有的发票录入方式通常是发票进行拍照，调用OCR识别图像来识别发票的关键字段，但是由于拍摄的发票图像存在光照不均和发票本身被污染等问题，是导致识别得到的发票信息不准确。

发明内容

基于此，有必要针对上述技术问题，提供一种通过对发票中识别准确率较低的字符进行二次识别，从而提高发票识别准确率的发票识别方法、装置、计算机设备和存储介质。

一种发票识别方法，包括：

获取发票图像，对所述发票图像进行分割得到多个目标区域；

对多个所述目标区域的多个字符区域进行分割得到多个字符图像；

将每个所述字符图像输入已训练好的深度学习神经网络模型中进行识别，得到对应的每个所述字符图像的第一字符识别结果和与所述第一字符识别结果对应的识别概率；

根据所述第一字符识别结果对应的识别概率获取二次识别字符图像，将所述二次识别字符图像输入支持向量机模型，得到对应的第二字符识别结果；

根据所述第一字符识别结果和所述第二字符识别结果得到与所述发票图像对应的发票识别结果。

在其中一个实施例中，所述对所述发票图像进行分割得到多个目标区域的步骤，包括：根据所述发票图像进行预处理得到二值化图像；根据分割算法对所述二值化图像进行分割，得到对应的二值化发票区域；根据所述二值化发票区域确定所述发票图像的初始发票区域；对所述初始发票区域进行阈值分割得到发票区域；对所述发票区域进行分割得到所述多个目标区域。

在其中一个实施例中，所述对所述初始发票区域进行阈值分割得到对应的发票区域的步骤，包括：获取所述初始发票区域的灰度等级；计算与所述灰度等级对应的灰度概率；根据所述灰度概率和所述灰度等级确定所述发票图像的分割阈值；按照所述分割阈值对所述发票图像进行分割得到发票区域。

在其中一个实施例中，所述对所述发票区域进行分割得到所述多个目标区域的步骤之前，包括：对所述发票图像进行色彩空间转换；在色彩空间转换后的颜色空间下提取所述发票图像的红色信息；根据所述红色信息确定红章在发票区域中的红章位置；根据所述红章位置和所述红章与发票区域的相对位置确定发票区域的位置信息；根据所述发票的位置信息对所述发票图像进行校正。

在其中一个实施例中，所述多个目标区域包括二维码区域和字符区域，所述所述发票图像进行分割得到多个目标区域的步骤，包括：提取所述发票图像的背景信息得到背景图像；将所述发票图像与所述背景图做差分运算像得到目标图像；对所述目标图像进行分割得到对应的多个初始目标区域；根据几何特征从所述多个初始目标区域确定出二维码区域；根据连通域法和投影法从所述多个初始目标区域确定出字符区域；对所述二维码区域和所述字符区域进行仿射变换得到校正后的所述多个目标区域。

在其中一个实施例中，所述对所述二维码区域和所述字符区域进行仿射变换得到校正后的所述多个目标区域的步骤之后，好包括：对仿射后的所述二维码区域进行识别；当所述二维码区域识别成功，直接输出所述发票识别结果；当所述二维码区域未识别结果，进入多个所述目标区域的多个字符区域进行分割得到多个字符图像的步骤。

在其中一个实施例中，所述根据所述第一字符识别结果对应的识别概率获取二次识别字符图像，将所述二次识别字符图像输入支持向量机模型，得到对应的第二字符识别结果的步骤，包括：当所述第一字符识别结果对应的识别概率小于或等于预设阈值时，将与所述识别概率对应的所述字符图像作为所述二次识别字符图像，对所述二次识别字符图像进行特征增强处理得到增强后的所述二次识别字符图像；对所述二次识别字符图像进行特征提取得到对应的特征；通过所述支持向量机模型对所述特征进行识别得到第二字符识别结果。

在其中一个实施例中，所述根据所述第一字符识别结果和第二字符识别结果得到与所述发票图像对应的发票识别结果的步骤之后，包括：根据所述发票识别结果向国家税控中心发送发票获取请求；接收所述国家税控中心根据所述发票获取请求发送的发票信息。

一种发票识别装置，包括：

目标区域获取模块，用于获取发票图像，对所述发票图像进行分割得到多个目标区域；

字符分割模块，用于对多个所述目标区域的多个字符区域进行分割得到多个字符图像；

第一字符识别模块，用于将每个所述字符图像输入已训练好的深度学习神经网络模型中进行识别，得到对应的每个所述字符图像的第一字符识别结果和与所述第一字符识别结果对应的识别概率；

第二字符识别模块，用于根据所述第一字符识别结果对应的识别概率获取二次识别字符图像，将每个所述字符图像输入支持向量机模型，得到对应的第二字符识别结果；

发票识别模块，用于根据所述第一字符识别结果和所述第二字符识别结果得到与所述发票图像对应的发票识别结果。

一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述发票识别方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述发票识别方法的步骤。

上述发票识别方法、装置、计算机设备和存储介质，通过获取发票图像，对所述发票图像进行分割得到多个目标区域；对多个所述目标区域的多个字符区域进行分割得到多个字符图像；将每个所述字符图像输入已训练好的深度学习神经网络模型中进行识别，得到对应的每个所述字符的第一字符识别结果和与所述第一字符识别结果对应的识别概率；根据所述第一字符识别结果对应的识别概率获取二次识别字符图像，将所述二次识别字符图像输入支持向量机模型，得到对应的第二字符识别结果；根据所述第一字符识别结果和所述第二字符识别结果得到与所述发票图像对应的发票识别结果。通过发票图像进行分割得到发票区域，对发票区域进行分割得到发票的各个目标区域，对各个目标区域进行字符分割得到分割后分字符图像，通过已训练好的深度学习神经网络对分割得到的字符图像进行识别，根据识别结果和与识别结果对应的识别概率进行判断，当识别概率小于预设阈值时，对识别率较低的字符图像进行二次识别，二次识别采用支持向量机模型进行识别，得到识别结果。根据已训练好的深度学习神经网络的识别结果和支持向量机模型的识别结果得到的更为准确的字符识别结果，从而提高发票的识别准确率。

附图说明

图1为一个实施例中发票识别方法的应用环境图；

图2为一个实施例中发票识别方法的流程示意图；

图3为一个实施例中图像分割得到目标的步骤的流程示意图；

图4为一个实施例中确定发票区域的步骤的流程示意图；

图5为一个实施例中红章位置与发票位置确定的步骤的流程示意图；

图6为一个实施例中背景差分法确定目标区域的步骤的流程示意图；

图7为一个实施例中二维码识别的步骤的流程示意图；

图8为一个实施例中支持向量机识别字符的步骤的流程示意图；

图9为一个实施例中获取国税发票信息的步骤的流程示意图；

图10为一个实施例中发票识别装置的结构框图；

图11为一个实施例中目标区域获取模块的结构框图；

图12为一个实施例中发票区域确定单元的结构框图；

图13为再一个实施例中目标区域获取模块的结构框图；

图14为又一个实施例中目标区域获取模块的结构框图；

图15为另一个实施例中发票识别装置的结构框图；

图16为另一个实施例中发票识别装置的结构框图；

图17为一个实施例中第二字符识别模块的结构框图；

图18为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的发票识别方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104通过网络进行通信。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种发票识别方法，该发票识别方法以应用于图1的终端或服务器进行举例说明，包括以下步骤：

步骤从S202，获取发票图像，对发票图像进行分割得到多个目标区域。

其中，发票图像是用过拍摄设备拍摄得到的包含发票的图像。目标区域包括用于字符区域和二维码区域，字符区域通过字符识别模型进行识别，二维码区域用过二维码识别模型进行识别。图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。图像分割方法包但不限于基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。

具体地，对拍摄设备拍摄得到的包含发票的图像进行分割，得到的感兴趣区域为发票区域，对发票区域进行分割得到的感兴趣区域为多个包含二维码和字符的目标区域。

在一个实施例中，对拍摄设备拍摄的图像进行图像分析，图像分析包括确定图像质量，同时判定该图像是否为发票图像，提取图像的颜色主分量，图像光照的饱和等用于判定图像质量的指标。对于不是发票的图像和分别率较低，图像尺寸太小等不符合要求的图像直接不做进一步的处理。

在一个实施例在，不符合要求的图像包括但不限于发票拍照不全，发票区域被遮挡，以及模糊不清等，对于不符合要求的图像，给用户一个反馈结果。如返回为非发票图像、发票拍摄不全、图像模糊等。

步骤S204，对多个目标区域的多个字符区域进行分割得到多个字符图像。

具体地，每个包含一个或多个字符目标区域都都进行图像分割，得到多个字符图像。其中字符图像为包含一个字符的字符图像。

步骤S206，将每个字符图像输入已训练好的深度学习神经网络模型中进行识别，得到对应的每个字符图像的第一字符识别结果和与第一字符识别结果对应的识别概率。

其中，已训练好的深度学习神经网络模型是通过对海量的字符字符图像进行学些得到，深度学习神经网络模型能够快速的学习图像中的特征。卷积神经网络是一种深度的监督学习下的机器学习模型，具有极强的适应性，善于挖掘数据局部特征，提取全局训练特征和分类，它的权值共享结构网络使之更类似于生物神经网络第一字符识别结果为通过深度学习神经网络识别得到的识别字符，第一字符识别结果对应的识别概率为识别得到的识别字符对应的概率。

具体地，将所有的包含一个字符的字符图像输入到已训练好的深度学习神经网络模型中，通过该网络模型对字符图像中的字符进行识别，输出字符识别结果和与字符识别结果对应的识别概率。通过深度学习神经网络模型对字符图像进行识别，能够快速且准确的识别出字符。

步骤S208，根据第一字符识别结果对应的识别概率获取二次识别字符图像，将二次识别字符图像输入支持向量机模型，得到对应的第二字符识别结果。

具体地，可以根据第一字符识别结果对应的识别概率的大小确定二次识别字符图像，也可以对识别概率作自定义处理，对处理后的数据进行判断等确定二次识别字符图像。如，根据识别概率直接确定二次识别字符图像，判断识别概率是否大于预设阈值确定二次识别字符图像，当字符的识别概率大于预设阈值时，说明识别较为准确，不需要进行二次识别，反之，当字符的识别概率小于预设阈值时，说明识别结果不是很理想，需要进行再次识别。支持向量机模型是一种分类器，该分类器尽最大努力使分开的两个类别有最大间隔，这样使得分类具有最高的可信度，对于未知的新样本有很好的预测能力。通过该分类器对识别概率较低的识别字符对应的字符图像进行识别，得到对应的字符识别结果更为准确，将该识别结果作为第二字符识别结果。

步骤S210，根据第一字符识别结果和第二字符识别结果得到与发票图像对应的发票识别结果。

具体地，根据上述深度学习神经网路中得到的字符识别结果和根据支持向量机模型识别得到的字符识别结果共同确定发票图像的发票识别结果。其中，发票识别结果是识别出发票中的发票代码，发票号码，日期，金额及校验码等。

上述发票识别方法中，通过对拍摄得到的包含发票的图像进行分割得到多个目标区域，对目标区域进行分割得到对应的包含字符的图像，通过识别准确率较高，且识别速率较快的已训练好的深度学习神经网络模型对包含字符的图像进行字符识别，得到对应的字符识别结果和识别概率，根据字符的识别概率确定需要进行二次识别的二次识别字符图像，二次识别字符图像通过支持向量机模型进行二次识别得到最终的识别结果，提高字符识别的准确率。先根据深度学习神经网络模型进行首次字符识别能够提高识别速率，仅对于识别率不高的字符进行二次识别，能够节约识别时间提高识别速率和提升识别准确率。

如图3所示，在一个实施例中，步骤S202，包括

步骤S2021，根据发票图像进行预处理得到二值化图像。

具体地，图像的二值化，就是根据预先设置好的阈值将图像的分成两个部分，即将图像上的像素点的灰度值设置为0或255，也就是将整个图像呈现出明显的只有黑和白的视觉效果。对发票图像按照预设的阈值进行二值化，得到二值化后的发票图像。

步骤S2023，根据分割算法对二值化图像进行分割，得到对应的二值化发票区域。

具体地，根据发票的基本它特征，从二值化图像中将发票区域确定下来得到二值化发票区域。如可以根据发票的几何特征，即为形状特征，一般的发票都是一个矩形框，故可以通过矩形框确定出二值化发票区域。

步骤S2025，根据二值化发票区域确定发票图像的初始发票区域。

具体地，通过二值化发票区域确定了发票的位置信息，根据发票的位置信息对发票图像进行分割得到初始发票区域。二值化图像由于仅仅是将图像分为两个部分，故损失了较多的细节信息，得到的发票区域较为粗糙。由于图像复杂多变，二值化图像往往存在毛刺断裂及局部干扰等。

在一个实施例中，对二值化后的图像进行形态学开闭操作，利用链码提取发票区域轮廓。如，链码采用8连接，每个像素点的周围为8邻域，对其8邻域依次标记为0-8，选取边界点进行搜索，记录其下一时刻的邻域像素点的标记，即可得到一条闭合线，假设其链码为形01333342343762的一串数字。数字大小表示方向，根据链码可以拟合几条直线以确定发票轮廓。

步骤S2027，对初始发票区域进行阈值分割得到发票区域。

具体地，为了进一步确定发票区域，根据初始发票区域的图像信息进行区域分割，得到更为准确的发票区域。该发票区域，可以是对整个发票图像的灰度信息进行处理得到的阈值，按照该阈值对发票图像进行分割得到更准确的发票区域，也可以是根据图像的颜色信息等对图像进行阈值分割，得到更为准确的发票区域。

步骤S2029，对发票区域进行分割得到多个目标区域。

具体地，对上述得到的发票区域根据分割算法对图像进行分割，得到多个目标区域，其中目标区域包括二维码区域和字符区域。

在本实施例中，对发票图像进行二值化，能够快速的确定出一个发票区域的一个大致位置，根据该位置信息和对图像的内容进行一步处理得到更为准确的发票区域位置。对发票区域进行分割得到目标区域是为了后续发票识别做准备。

如图4所示，在一个实施例中，步骤S2027，包括：

S2027a，获取初始发票区域的灰度等级。

S2027b，计算与灰度等级对应的灰度概率。

S2027c，根据灰度概率和灰度等级确定发票图像的分割阈值。

S2027d，按照分割阈值对发票图像进行分割得到发票区域。

具体地，图像灰度级指图像中的色度分量亮度的最大值与最小值之差的级别。一般图像的灰度变化范围为0-255,则图像有256个灰度级，也可以根据需要对灰度范围进行自定义。如将灰度均分为L个区间，即L个灰度级。计算灰度等级对应的灰度概率。根据灰度等级和对应的灰度概率按照预设的规则对发票图像进行阈值分割得到发票区域。其中，阈值是根据对灰度等级和对应的灰度概率确定的。如将灰度等级和灰度概率确定的最大类间方差作为阈值。

在一个实施例中，为了进一步精确提取发票区域，防止白色背景对区域定位的影响，对初始发票区域利用最大类间方差法再次二值化。假设发票图像有L个灰度级，各个灰度出现的概率为p_i。则二值化阈值t₀如式(1)所示：

其中最大类型方差为

w_o＝p_Aw_A+p_Bw_B，其中，P_i为第i个灰度等级对应的灰度概率。根据阈值t₀对初始发票区域进行分割得到更为准确的发票区域。

如图5所示，在一个实施例中，步骤S2029之前，包括：

步骤S2022，对发票图像的进行色彩空间转换。

其中，图像的色彩空间包括多种，如RGB(Red,Green,Blue)，CMYK(Cyan,Magenta,Yellow)，HSI(Hue Saturation Intensity)等色彩空间。常见设备拍摄得到的图像存储时采用的都是RGB色彩空间。

具体地，一般都是将图像从RGB色彩空间转换到其它的色彩空间中。如，将RGB图像转换为HSI图像，其中HSI色彩空间是从人的视觉系统出发，用色调(Hue)、色饱和度(Saturation)和亮度(Intensity)来描述色彩的。通过

步骤S2024，在色彩空间转换后的颜色空间下提取发票图像的红色信息。

步骤S2026，根据红色信息确定红章在发票区域中的红章位置。

具体地，在转换后的颜色空间下提取都发票图像中的红色信息。发票的红色信息在发票中代表了红章的信息。如，提取发票的红章信息，在HSI颜色空间中，红色所在区间为[-π/3,π/3]，则提取红章部分的灰度值为255，其余部分灰度为0。在HSI颜色空间下根据红色信息二值化发票图像，得到发票中红章的位置信息。

步骤S2028，根据红章位置和红章与发票区域的相对位置确定发票区域的位置信息。

具体地，发票区域与红章位置的一个较为固定的相对位置关系，已经求得红章的位置和红章与发票的相对位置，根据该相对位置确定发票区域在发票图像的相对位置关系。如，正向放置、倒立或侧立等。

步骤S2030，根据发票的位置信息对发票图像进行校正。

具体地，当所述发票不是出来正向放置时，根据上述发票区域在发票图像的相对位置关系，对所述发票图像进行校正，得到一个包含正向放置的发票的发票图像。

在本实施例，通过对图像进行颜色空间转换，在一个较为适合提取图像中的红色信息的颜色空间下提取红色信息，得到的红章位置更为准确，根据红章与发票的相对位置关系确定发票的放置方向，根据发票的位置方向确定是否对发票进行校正。对发票进行校正为后续图像的分割做准备，是的分割得到的包含字符的图像都是正向放置的。避免后续对字符进行分割识别时对图像不断进行校正。

如图6所示，在一个实施例中，步骤S202，包括：

步骤S202a，提取发票图像的背景信息得到背景图像。

具体地，背景信息是用于描述整幅图像中除了目标区域以外的图像内容。提取发票图像的背景信息，就是提取发票区域其外的图像信息，根据提取到的背景信息得到背景图像。如，通过局部极大值提取背景信息，用局部极大值替代局部像素点，得到背景图像。

步骤S202b，将发票图像与背景图像做差分运算得到目标图像。

具体地，目标图像是原始图像和背景图像做差分后得到的，背景图像可以是直接拍摄得到的背景图像，也可以是根据原始图像进行处理得到的背景图像。将包含目标区域的发票图像减去背景图像得到包含目标区域的目标图像。通过背景差分法减少背景对后续图像处理带来的干扰。

步骤S202c，对目标图像进行分割得到对应的多个初始目标区域。

具体地，对目标图像进行分割得到多个初始目标区域，初步的分割是为了将目标图像划分成多个区域。也就是将发票划分为多个区域，发票区域中包含了二维码区域和字符区域。其中字符区域包括但不限于发票代码区域、发票金额区域等文字区域。

步骤S202d，根据几何特征从多个初始目标区域确定出二维码区域。

具体地，有与二维码与字符的特征不完全一致，故根据二维码的几何特征提取得到二维码区域。如，利用二维码的形状和密度多个初始目标区域确定出二维码的区域。

步骤S202e，根据连通域法和投影法从多个初始目标区域确定出字符区域。

具体地，连通域法通过对二值图像中白色像素进行标记，让每个单独的连通区域形成一个被标识的块，获取这些块的轮廓、外接矩形、质心、不变矩等。投影法常用于实现字符分割，一般采用水平投影或者垂直投影。如对多个初始目标区域进行标记，形成多个标识块，通过对标识块进行投影，根据投影结果确定出字符区域。

步骤S202f，对二维码区域和字符区域进行仿射变换得到校正后的多个目标区域。

具体地，由于发票图像中的发票位置或者是发票分的得到的字符区域不是正向放置的，故在得到分割后的二维码区域和字符区域后，对其进行仿射变换，得到校正后的二维码区域和字符区域。对目标区域的校正的是能够减少外在因素导致的识别误差。

如图7所示，在一个实施例中，步骤S202f之后，包括：

步骤S202g，对仿射后的二维码区域进行识别。

具体地，对矫正后的二维码进行识别，二维码是用某种特定的几何图形按一定规律在平面(二维方向上)分布的黑白相间的图形记录数据符号信息的；在代码编制上巧妙地利用构成计算机内部逻辑基础的“0”、“1”比特流的概念，使用若干个与二进制相对应的几何形体来表示文字数值信息，通过图象输入设备或光电扫描设备自动识读以实现信息自动处理：它具有条码技术的一些共性：每种码制有其特定的字符集；每个字符占有一定的宽度；具有一定的校验功能等。

步骤S202h，当二维码区域识别成功，直接输出发票识别结果。

具体地，当成功获取到二维码中包含的信息，表示识别成果，直接输出根据二维码识别得到的消息。

步骤S202i，当二维码区域未识别结果，进入多个目标区域的多个字符区域进行分割得到多个字符图像的步骤。

具体地，当未能成功获取到二维码中包含的信息，表示识别失败，直接进入步骤S204，对目标区域中的多个字符区域进行分割得到多个制度图像，对字符图像进行双重识别得到最后的发票识别结果。

通过二维识别直接输出发票识别结果，提高识别速率，当二维码识别失败时，在进行字符识别，能够保证识别的准确率。

如图8所示，在一个实施例中，步骤S208，包括：

步骤S208a，当第一字符识别结果对应的识别概率小于或等于预设阈值时，获取与识别概率对应的字符图像作为二次识别字符图像。

具体地，预设阈值是用于判断第一字符识别结果的准确性的一个临界值，若第一字符识别结果对应的识别概率小于或等于该预设阈值时，表示第一字符识别结果较为粗糙，不能直接作为最终的字符识别结果。获取识别概率小于或等于该预设阈值对应的字符图像作为二次识别字符图像，需要对二次识别字符图像进行再次识别。

步骤S208b，对二次识别字符图像进行特征增强处理得到增强后的二次识别字符图像。

具体地，图像增强有目的地强调图像的整体或局部特性，将原来不清晰的图像变得清晰或强调某些感兴趣的特征，扩大图像中不同物体特征之间的差别，抑制不感兴趣的特征，使之改善图像质量、丰富信息量，加强图像判读和识别效果，满足某些特殊分析的需要常见的增强方法包括基于频域和基于空域的增强方法。

在本实施例中有意的增强字符，使得字符变得更加清晰，便于后续字符特征提取。

步骤S208c，对每个字符图像进行特征提取得到对应的特征。

具体地，对增强后的字符图像进行特征提取，得到对应的字符图像特征。图像特征提取是通过计算机提取图像信息，决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集，这些子集往往属于孤立的点、连续的曲线或者连续的区域。常见的特征提取算法包括SIFT算法、HOG算法、SURF算法等。

在一个实施例中，可以采用HOG算法提取字符图像的HOG特征。

步骤S208d，通过支持向量机模型对特征进行识别得到第二字符识别结果。

具体地，通过支持向量机模型对提取到的特征做分别识别，得到字符图像对应的字符识别结果。通过支持向量机模型对识别率相对较低的字符图像进行二次识别，在识别过程中，对字符图像进行增强处理，得到更为清晰的字符，字符更为清晰，提取到的字符特征更为准确，对应的得到的字符识别结果也更为准确，从而提高识别准确率。

如图9所示，在一个实施例中，步骤S210之后，包括：

步骤S212，根据发票识别结果向国家税控中心发送发票获取请求。

步骤S214，接收国家税控中心根据发票获取请求发送的发票信息。

具体地，步骤S210识别得到的发票识别结果或者步骤S202中得到的发票识别结果，也就是获取到的发票代码、发票日期、校验码、金额等票面信息果向国家税控中心发送发票获取请求，国家税控中心根据发票获取请求获取到对应的发票信息，接收国家税控中心发送的发票信息，将发票信息保存到服务器，并返回对应的发票信息给客户端。

如图10所示，在一个实施例中，一种发票识别装置200，装置包括：

目标区域获取模块202，用于获取发票图像，对发票图像进行分割得到多个目标区域。

字符分割模块204，用于对多个目标区域的多个字符区域进行分割得到多个字符图像。

第一字符识别模块206，用于将每个字符图像输入已训练好的深度学习神经网络模型中进行识别，得到对应的每个字符图像的第一字符识别结果和与第一字符识别结果对应的识别概率。

第二字符识别模块208，用于根据第一字符识别结果对应的识别概率获取二次识别字符图像，将二次识别字符图像输入支持向量机模型，得到对应的第二字符识别结果。

发票识别模块210，用于根据第一字符识别结果和第二字符识别结果得到与发票图像对应的发票识别结果。

如图10所示，在一个实施例中，目标区域获取模块202包括：

二值化单元2021，用于根据发票图像进行预处理得到二值化图像。

二值化区域确定单元2023，用于根据分割算法对二值化图像进行分割，得到对应的二值化发票区域。

初始发票区域确定单元2025，用于根据二值化发票区域确定发票图像的初始发票区域。

发票区域确定单元2027，用于对初始发票区域进行阈值分割得到发票区域。

目标区域分割单元2029，用于对发票区域进行分割得到多个目标区域。

如图12所示，在一个实施例中，发票区域确定单元2027包括：

灰度等级获取子单元2027a，用于获取初始发票区域的灰度等级。

灰度概率计算子单元2027b，用于计算与灰度等级对应的灰度概率。

分割阈值计算子单元2027c，用于根据灰度概率和灰度等级确定发票图像的分割阈值。

发票区域分割子单元2027d，用于按照分割阈值对发票图像进行分割得到发票区域。

如图所示，在一个实施例中，目标区域获取模块202包括：

色彩空间转换单元2022，用于对发票图像的进行色彩空间转换。

红色信息提取单元2024，用于在色彩空间转换后的颜色空间下提取发票图像的红色信息。

红章的位置获取单元2026，用于根据红色信息确定红章在发票区域中的红章位置。

发票位置确定单元2028，用于根据红章位置和红章与发票区域的相对位置确定发票区域的位置信息。

图像校正单元2030，用于根据发票的位置信息对发票图像进行校正。

如图所示，在一个实施例中，目标区域获取模块202包括：

背景图像获取单元202a，用于提取发票图像的背景信息得到背景图像。

目标图像获取单元202b，用于将发票图像与背景图像做差分运算得到目标图像。

初始目标区域获取单元202c，用于对目标图像进行分割得到对应的多个初始目标区域。

二维码区域确定单元202d，用于根据几何特征从多个初始目标区域确定出二维码区域。

字符区域确定单元202e，用于根据连通域法和投影法从多个初始目标区域确定出字符区域。

目标区域校正单元202f，用于对二维码区域和字符区域进行仿射变换得到校正后的多个目标区域。

如图所示，在一个实施例中，发票识别装置200，包括：

二维码识别模块402，对仿射后的二维码区域进行识别。

二维码成功识别模块404，用于当二维码区域识别成功，直接输出发票识别结果。

二维码未成功识别模块406，用于用于当二维码区域未识别结果，进入多个目标区域的多个字符区域进行分割得到多个字符图像的步骤。

如图所示，在一个实施例中，第二字符识别模块208包括：

二次识别字符图像单元208a，用于当第一字符识别结果对应的识别概率小于或等于预设阈值时，将与识别概率对应的字符图像作为二次识别字符图像。

字符增强单元208b，用于对二次识别字符图像进行特征增强处理得到增强后的二次识别字符图像。

特征提取单元208c，用于对二次识别字符图像进行特征提取得到对应的特征。

第二识别单元208d，用于通过支持向量机模型对特征进行识别得到第二字符识别结果。

如图所示，在一个实施例中，发票识别装置200，包括：

数据请求模块212，用于根据发票识别结果向国家税控中心发送发票获取请求。

数据接收模块214，用于接收国家税控中心根据发票获取请求获取到的发票信息。

关于发票识别装置的具体限定可以参见上文中对于发票识别方法的限定，在此不再赘述。上述发票识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图18所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种发票识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图18中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：获取发票图像，对发票图像进行分割得到多个目标区域；对多个目标区域的多个字符区域进行分割得到多个字符图像；将每个字符图像输入已训练好的深度学习神经网络模型中进行识别，得到对应的每个字符图像的第一字符识别结果和与第一字符识别结果对应的识别概率；根据第一字符识别结果对应的识别概率获取二次识别字符图像，将二次识别字符图像输入支持向量机模型，得到对应的第二字符识别结果；根据第一字符识别结果和第二字符识别结果得到与发票图像对应的发票识别结果。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：根据发票图像进行预处理得到二值化图像；根据分割算法对二值化图像进行分割，得到对应的二值化发票区域；根据二值化发票区域确定发票图像的初始发票区域；对初始发票区域进行阈值分割得到发票区域；对发票区域进行分割得到多个目标区域。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：获取初始发票区域的灰度等级；计算与灰度等级对应的灰度概率；根据灰度概率和灰度等级确定发票图像的分割阈值；按照分割阈值对发票图像进行分割得到发票区域。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：对发票图像进行色彩空间转换；在色彩空间转换后的颜色空间下提取发票图像的红色信息；根据所述红色信息确定红章在发票区域中的红章位置；根据所述红章位置和所述红章与发票区域的相对位置确定发票区域的位置信息；根据所述发票的位置信息对所述发票图像进行校正。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：提取发票图像的背景信息得到背景图像；将发票图像与背景图像做差分运算得到目标图像；对目标图像进行分割得到对应的多个初始目标区域；根据几何特征从多个初始目标区域确定出二维码区域；根据连通域法和投影法从多个初始目标区域确定出字符区域；对二维码区域和字符区域进行仿射变换得到校正后的多个目标区域。

在一个实施例中，所处理器执行计算机程序时还实现以下步骤：对仿射后的二维码区域进行识别；当二维码区域识别成功，直接输出发票识别结果；当二维码区域未识别结果，进入多个目标区域的多个字符区域进行分割得到多个字符图像的步骤。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：当第一字符识别结果对应的识别概率小于或等于预设阈值时，将与识别概率对应的字符图像作为二次识别字符图像；对二次识别字符图像进行特征增强处理得到增强后的二次识别字符图像；对二次识别字符图像进行特征提取得到对应的特征；通过支持向量机模型对特征进行识别得到第二字符识别结果。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：根据发票识别结果向国家税控中心发送发票获取请求；接收国家税控中心根据发票获取请求发送的发票信息。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：获取发票图像，对发票图像进行分割得到多个目标区域；对多个目标区域的多个字符区域进行分割得到多个字符图像；将每个字符图像输入已训练好的深度学习神经网络模型中进行识别，得到对应的每个字符图像的第一字符识别结果和与第一字符识别结果对应的识别概率；根据第一字符识别结果对应的识别概率获取二次识别字符图像，将二次识别字符图像输入支持向量机模型，得到对应的第二字符识别结果；根据第一字符识别结果和第二字符识别结果得到与发票图像对应的发票识别结果。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：根据发票图像进行预处理得到二值化图像；根据分割算法对二值化图像进行分割，得到对应的二值化发票区域；根据二值化发票区域确定发票图像的初始发票区域；对初始发票区域进行阈值分割得到发票区域；对发票区域进行分割得到多个目标区域。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：获取初始发票区域的灰度等级；计算与灰度等级对应的灰度概率；根据灰度概率和灰度等级确定发票图像的分割阈值；按照分割阈值对发票图像进行分割得到发票区域。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：对发票图像进行色彩空间转换；在色彩空间转换后的颜色空间下提取发票图像的红色信息；根据所述红色信息确定红章在发票区域中的红章位置；根据所述红章位置和所述红章与发票区域的相对位置确定发票区域的位置信息；根据所述发票的位置信息对所述发票图像进行校正。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：提取发票图像的背景信息得到背景图像；将发票图像与背景图像做差分运算得到目标图像；对目标图像进行分割得到对应的多个初始目标区域；根据几何特征从多个初始目标区域确定出二维码区域；根据连通域法和投影法从多个初始目标区域确定出字符区域；对二维码区域和字符区域进行仿射变换得到校正后的多个目标区域。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：对仿射后的二维码区域进行识别；当二维码区域识别成功，直接输出发票识别结果；当二维码区域未识别结果，进入多个目标区域的多个字符区域进行分割得到多个字符图像的步骤。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：当第一字符识别结果对应的识别概率小于或等于预设阈值时，将与识别概率对应的字符图像作为二次识别字符图像；对二次识别字符图像进行特征增强处理得到增强后的二次识别字符图像；对二次识别字符图像进行特征提取得到对应的特征；通过支持向量机模型对特征进行识别得到第二字符识别结果。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：根据发票识别结果向国家税控中心发送发票获取请求；接收国家税控中心根据发票获取请求发送的发票信息。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种发票识别方法，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述发票图像进行分割得到多个目标区域的步骤，包括：

根据所述发票图像进行预处理得到二值化图像；

根据分割算法对所述二值化图像进行分割，得到对应的二值化发票区域；

根据所述二值化发票区域确定所述发票图像的初始发票区域；

对所述初始发票区域进行阈值分割得到发票区域；

对所述发票区域进行分割得到所述多个目标区域。

3.根据权利要求2所述的方法，其特征在于，所述对所述初始发票区域进行阈值分割得到对应的发票区域的步骤，包括：

获取所述初始发票区域的灰度等级；

计算与所述灰度等级对应的灰度概率；

根据所述灰度概率和所述灰度等级确定所述发票图像的分割阈值；

按照所述分割阈值对所述发票图像进行分割得到发票区域。

4.根据权利要求2所述的方法，其特征在于，所述对所述发票区域进行分割得到所述多个目标区域的步骤之前，包括：

对所述发票图像进行色彩空间转换；

在所述色彩空间转换后的颜色空间下提取所述发票图像的红色信息；

根据所述红色信息确定红章在发票区域中的红章位置；

根据所述红章位置和所述红章与发票区域的相对位置确定发票区域的位置信息；

根据所述发票的位置信息对所述发票图像进行校正。

5.根据权利要求1所述的方法，其特征在于，所述多个目标区域包括二维码区域和字符区域，所述对所述发票图像进行分割得到多个目标区域的步骤，包括：

提取所述发票图像的背景信息得到背景图像；

将所述发票图像与所述背景图像做差分运算得到目标图像；

对所述目标图像进行分割得到对应的多个初始目标区域；

根据几何特征从所述多个初始目标区域确定出二维码区域；

根据连通域法和投影法从所述多个初始目标区域确定出字符区域；

对所述二维码区域和所述字符区域进行仿射变换得到校正后的所述多个目标区域。

6.根据权利要求5所述的方法，其特征在于，所述对所述二维码区域和所述字符区域进行仿射变换得到校正后的所述多个目标区域的步骤之后，好包括：

对仿射后的所述二维码区域进行识别；

当所述二维码区域识别成功，直接输出所述发票识别结果；

当所述二维码区域未识别结果，进入多个所述目标区域的多个字符区域进行分割得到多个字符图像的步骤。

7.根据权利要求1所述的方法，其特征在于，所述根据所述第一字符识别结果对应的识别概率获取二次识别字符图像，将所述二次识别字符图像输入支持向量机模型，得到对应的第二字符识别结果的步骤，包括：

当所述第一字符识别结果对应的识别概率小于或等于预设阈值时，获取与所述识别概率对应的所述字符图像作为所述二次识别字符图像；

对所述二次识别字符图像进行特征增强处理得到增强后的所述二次识别字符图像；

对所述二次识别字符图像进行特征提取得到对应的特征；

通过所述支持向量机模型对所述特征进行识别得到第二字符识别结果。

8.根据权利要求1所述的方法，其特征在于，所述根据所述第一字符识别结果和第二字符识别结果得到与所述发票图像对应的发票识别结果的步骤之后，包括：

根据所述发票识别结果向国家税控中心发送发票获取请求；

接收所述国家税控中心根据所述发票获取请求发送的发票信息。

9.一种发票识别装置，其特征在于，所述装置包括：

第二字符识别模块，用于根据所述第一字符识别结果对应的识别概率获取二次识别字符图像，将所述二次识别字符图像输入支持向量机模型，得到对应的第二字符识别结果；

10.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。