CN111931687B

CN111931687B - 一种票据识别方法及装置

Info

Publication number: CN111931687B
Application number: CN202010873968.0A
Authority: CN
Inventors: 邓练兵; 宋宇轩; 方文佳
Original assignee: Zhuhai Dahengqin Technology Development Co Ltd
Current assignee: Zhuhai Dahengqin Technology Development Co Ltd
Priority date: 2020-08-26
Filing date: 2020-08-26
Publication date: 2022-03-15
Anticipated expiration: 2040-08-26
Also published as: CN111931687A

Abstract

本申请提供一种票据识别方法及装置，该方法包括：获取待处理图像；其中，待处理图像中包括票据图像，票据图像中包括多个票据元素；根据预设的票据元素样本集合和待处理图像对应的字符识别信息，确定票据图像中的至少一个第一票据元素的识别结果；根据第一票据元素的识别结果中的位置特征，确定与第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域；根据目标区域对应的字符识别信息，确定第二票据元素的识别结果；根据第一票据元素的识别结果和至少一个第二票据元素的识别结果，生成票据识别结果。无需为不同票据类型的票据分别创建票据识别框架，具有较高的适应性。

Description

一种票据识别方法及装置

技术领域

本发明涉及自动化办公领域，具体涉及一种票据识别方法及装置。

背景技术

随着移动互联网技术的发展，办公智能化正在被广泛应用，其中，票据涉及到社会生活的各个领域，对于票据的智能识别和处理已成为目前研究的重点。

在现有技术中，通常是利用光学字符识别(Optical Character Recognition，简称：OCR)技术，对待处理票据对应的票据图像中的文字信息进行提取，并根据预设的票据识别框架，确定各文字信息对应的票据位置，对已获得的文字信息进行分类。

但是，由于一些大型银行经营范围较广，在办理业务过程中，会产生种类繁多的票据。票据种类存在多样化，现有技术中的票据识别方法的适应性较差，无法灵活应用于各种类型的票据。因此，急需一种能够满足多种应用场景的票据识别方法，对提高票据识别效率具有重要意义。

发明内容

因此，本发明要解决的技术问题在于现有技术中的票据识别方法存在适应性较差的缺陷，从而提供一种票据识别方法及装置。

本申请第一个方面提供一种票据识别方法，包括：

获取待处理图像；其中，所述待处理图像中包括票据图像，所述票据图像中包括多个票据元素；

根据预设的票据元素样本集合和所述待处理图像对应的字符识别信息，确定所述票据图像中的至少一个第一票据元素的识别结果；其中，所述识别结果包括所述第一票据元素对应的元素类型、语义信息和位置特征；

根据所述第一票据元素的识别结果中的位置特征，确定与所述第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域；

根据所述目标区域对应的字符识别信息，确定所述第二票据元素的识别结果；

根据所述第一票据元素的识别结果和至少一个第二票据元素的识别结果，生成票据识别结果。

可选的，所述根据预设的票据元素样本集合和所述待处理图像对应的字符识别信息，确定所述票据图像中的至少一个第一票据元素的识别结果，包括：

计算所述字符识别信息中的各字段与所述票据元素样本集合中各样本的相似度，根据所述相似度从大到小的排序结果，确定第一目标样本和所述第一目标样本对应的第一票据元素；

根据所述第一目标样本对应的元素类型，确定所述第一票据元素的元素类型；

根据所述第一目标样本对应的位置特征，确定所述第一票据元素的位置特征；

根据所述字符识别信息，确定所述第一票据元素的语义信息。

可选的，所述根据所述第一票据元素的识别结果中的位置特征，确定与所述第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域，包括：

在所述票据元素样本集合中，确定至少一个与所述第一目标样本存在位置关联关系的第二目标样本；根据所述第二目标样本对应的位置特征，确定所述第二票据元素对应的目标区域。

可选的，所述根据所述目标区域对应的字符识别信息，确定所述第二票据元素的识别结果，包括：

在所述字符识别信息中提取与所述目标区域的位置对应的字段，以确定所述第二票据元素的语义信息；

根据所述第二目标样本对应的元素类型，确定所述第二票据元素的元素类型；

根据所述第二目标样本对应的位置特征，确定所述第二票据元素的位置特征。

可选的，在根据预设的票据元素样本集合和所述待处理图像对应的字符识别信息，确定所述票据图像中的至少一个第一票据元素的识别结果之前，所述方法还包括：

对所述待处理图像进行OCR识别，以获得所述待处理图像对应的字符识别信息。

可选的，在对所述待处理图像进行OCR识别之前，所述方法还包括：

对所述待处理图像进行二值化处理，以获得所述待处理图像对应的二值化图像；

对所述二值化图像进行连通区域分析，以获得所述二值化图像对应的文本区域，

根据所述文本区域中的文本方向，确定所述二值化图像的待旋转角度和旋转方向；

根据所述待旋转角度和旋转方向，对所述二值化图像进行位置调整。

可选的，在对所述待处理图像进行二值化处理之前，所述方法还包括：

对所述待处理图像依次进行灰度处理、高斯滤波处理和去噪声处理。

本申请第二个方面提供一种票据识别装置，包括：获取模块、第一识别模块、确定模块、第二识别模块和生成模块；

所述获取模块用于获取待处理图像；其中，所述待处理图像中包括票据图像，所述票据图像中包括多个票据元素；

所述第一识别模块用于根据预设的票据元素样本集合和所述待处理图像对应的字符识别信息，确定所述票据图像中的至少一个第一票据元素的识别结果；其中，所述识别结果包括所述第一票据元素对应的元素类型、语义信息和位置特征；

所述确定模块用于根据所述第一票据元素的识别结果中的位置特征，确定与所述第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域；

所述第二识别模块用于根据所述目标区域对应的字符识别信息，确定所述第二票据元素的识别结果；

所述生成模块用于根据所述第一票据元素的识别结果和至少一个第二票据元素的识别结果，生成票据识别结果。

可选的，所述第一识别模块具体用于：

可选的，所述确定模块具体用于：

可选的，所述第二识别模块具体用于：

可选的，所述第一识别模块还用于：

本申请第三个方面提供一种电子设备，包括：至少一个处理器和存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如上第一个方面以及第一个方面各种可能的设计所述的方法。

本申请第四个方面提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行如上第一个方面以及第一个方面各种可能的设计所述的方法。

本申请技术方案，具有如下优点：

本申请提供的一种票据识别方法及装置，通过获取待处理图像；其中，待处理图像中包括票据图像，票据图像中包括多个票据元素；根据预设的票据元素样本集合和待处理图像对应的字符识别信息，确定票据图像中的至少一个第一票据元素的识别结果；其中，识别结果包括第一票据元素对应的元素类型、语义信息和位置特征；根据第一票据元素的识别结果中的位置特征，确定与第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域；根据目标区域对应的字符识别信息，确定第二票据元素的识别结果；根据第一票据元素的识别结果和至少一个第二票据元素的识别结果，生成票据识别结果。上述方案提供的票据识别方法，通过根据待处理图像中各票据元素之间的位置关联关系，确定目标区域和该目标区域对应的票据元素的识别结果，以此类推，可以得到票据图像中的多个票据元素的识别结果，无需为不同票据类型的票据分别创建票据识别框架，该方法具有较高的适应性，为提高票据识别效率奠定了基础。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本申请实施例基于的票据识别系统结构示意图；

图2为本申请实施例提供的票据识别方法的流程示意图；

图3为本申请实施例提供的票据识别装置的结构示意图；

图4为本申请实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

此外，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。在以下各实施例的描述中，“多个”的含义是两个以上，除非另有明确具体的限定。

在现有技术中，通常是利用光学字符识别(Optical Character Recognition，简称：OCR)技术，对待处理票据对应的票据图像中的文字信息进行提取，并根据预设的票据识别框架，确定各文字信息对应的票据位置，对已获得的文字信息进行分类。但是，由于一些大型银行经营范围较广，在办理业务过程中，会产生种类繁多的票据。票据种类存在多样化，现有技术中的票据识别方法的适应性较差，无法灵活应用于各种类型的票据。

针对上述问题，本申请实施例提供的票据识别方法及装置，通过获取待处理图像；其中，待处理图像中包括票据图像，票据图像中包括多个票据元素；根据预设的票据元素样本集合和待处理图像对应的字符识别信息，确定票据图像中的至少一个第一票据元素的识别结果；其中，识别结果包括第一票据元素对应的元素类型、语义信息和位置特征；根据第一票据元素的识别结果中的位置特征，确定与第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域；根据目标区域对应的字符识别信息，确定第二票据元素的识别结果；根据第一票据元素的识别结果和至少一个第二票据元素的识别结果，生成票据识别结果。上述方案提供的票据识别方法，通过根据待处理图像中各票据元素之间的位置关联关系，确定目标区域和该目标区域对应的票据元素的识别结果，以此类推，可以得到票据图像中的多个票据元素的识别结果，无需为不同票据类型的票据分别创建票据识别框架，该方法具有较高的适应性，为提高票据识别效率奠定了基础。

下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本发明的实施例进行描述。

首先，对本申请所基于的票据识别系统的结构进行说明：

本申请实施例提供的票据识别方法及装置，适用于对获取的票据图像中的票据信息进行识别。如图1所示，为本申请实施例基于的票据识别系统的结构示意图，主要包括图像采集设备和用于进行票据识别的电子设备，具体地，利用图像采集设备采集相应的待处理图像，并将采集到的待处理图像发送至电子设备。其中，待处理图像中包括待进行识别的票据图像。电子设备根据待处理图像中各票据元素之间的位置关联关系，确定目标区域和该目标区域对应的票据元素的识别结果，以此类推，可以得到票据图像中的多个票据元素的识别结果。

本申请实施例提供了一种票据识别方法，用于解决现有技术中的票据识别方法的适应性较差的技术问题。本申请实施例的执行主体为电子设备，比如服务器、台式电脑、笔记本电脑、平板电脑及其他可用于进行票据识别的电子设备。

如图2所示，为本申请实施例提供的一种票据识别方法的流程示意图，该方法包括：

步骤201，获取待处理图像。

其中，待处理图像中包括票据图像，票据图像中包括多个票据元素。

步骤202，根据预设的票据元素样本集合和待处理图像对应的字符识别信息，确定票据图像中的至少一个第一票据元素的识别结果。

其中，识别结果包括第一票据元素对应的元素类型、语义信息和位置特征；

需要解释的是，元素类型主要指票据抬头、票据落款和票据编号等类别信息，语义信息主要指该票据元素的具体内容，位置特征主要是指该票据元素当前在票据图像中的具体位置信息，可以是具体的坐标区域。

其中，预设的票据元素样本集合中包括多种票据元素的样本信息，具体可以根据实际需求进行设定和更新。

具体地，在一实施例中，可以通过计算字符识别信息中的各字段与票据元素样本集合中各样本的相似度，根据相似度从大到小的排序结果，确定第一目标样本和第一目标样本对应的第一票据元素；根据第一目标样本对应的元素类型，确定第一票据元素的元素类型；根据第一目标样本对应的位置特征，确定第一票据元素的位置特征；根据字符识别信息，确定第一票据元素的语义信息。

需要解释的是，票据元素样本集合包括个样本的对应的语义信息、样本对应的元素类型，及在当前样本图像中各样本的位置特征。

示例性的，若当前票据元素为付款人的姓名，则可以根据该字段的字符长度和首字符，计算与各样本的相似度，当根据相似度的排序结果，确定该票据元素对应的样本(第一目标样本)为姓名样本时，则可以确定该票据元素(第一票据元素)的元素类型为付款人姓名，根据第一样本的位置特征，确定第一票据元素的位置特征，例如：顶部左边缘，并根据字符识别信息，确定第一票据元素的具体语义信息，例如：李某某。

步骤203，根据第一票据元素的识别结果中的位置特征，确定与第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域。

具体地，在一实施例中，在票据元素样本集合中，确定至少一个与第一目标样本存在位置关联关系的第二目标样本；根据第二目标样本对应的位置特征，确定第二票据元素对应的目标区域。

具体地，票据元素样本集合中设有各样本之间的位置关联联系，例如：当第一目标样本为付款人姓名时，则可以根据位置关联关系确定对应的第二目标样本为付款时间，根据第二目标样本对应的位置特征，确定第二票据元素对应的目标区域，例如：第一票据元素对应的坐标区域正下方0.5cm之内的区域。

步骤204，根据目标区域对应的字符识别信息，确定第二票据元素的识别结果。

类似的，可以在字符识别信息中提取与目标区域的位置对应的字段，以确定第二票据元素的语义信息；根据第二目标样本对应的元素类型，确定第二票据元素的元素类型；根据第二目标样本对应的位置特征，确定第二票据元素的位置特征。其中，具体确定方式与第一票据元素的识别结果的确定方法相同，不再赘述。

步骤205，根据第一票据元素的识别结果和至少一个第二票据元素的识别结果，生成票据识别结果。

具体地，所生成的票据识别结果可以以表格的形式进行分类输出，也可以其他形式进行输出，本申请实施例不做限定。

在上述实施例的基础上，由于图像采集设备受到光线的影响，难以保障所采集到的待处理图像的图像质量，为了提高所获得待处理图像的图像质量，为提高所获得的票据识别结果的准确性奠定基础，作为一种可实施的方式，在上述实施例的基础上，在一实施例中，在根据预设的票据元素样本集合和待处理图像对应的字符识别信息，确定票据图像中的至少一个第一票据元素的识别结果之前，该方法还包括：对待处理图像进行OCR识别，以获得待处理图像对应的字符识别信息。

具体地，在一实施例中，在对待处理图像进行OCR识别之前，该方法还包括：对待处理图像进行二值化处理，以获得待处理图像对应的二值化图像；对二值化图像进行连通区域分析，以获得二值化图像对应的文本区域，根据文本区域中的文本方向，确定二值化图像的待旋转角度和旋转方向；根据待旋转角度和旋转方向，对二值化图像进行位置调整。

具体地，为了保障所后的待处理图像对应的字符识别信息的准确性，和OCR识别效率，在对待处理图像进行OCR识别前，可以对其进行上述的图片预处理操作，为提高字符识别信息的准确性奠定基础。

具体地，在一实施例中，在对待处理图像进行二值化处理之前，该方法还包括：对待处理图像依次进行灰度处理、高斯滤波处理和去噪声处理。

具体地，在对待处理图像依次进行灰度处理、高斯滤波处理和去噪声处理之后，再对其进行二值化处理，可以进一步改善二值化图像的质量，为提高字符识别信息的准确性奠定基础。

本申请实施例提供的一种票据识别方法，通过获取待处理图像；其中，待处理图像中包括票据图像，票据图像中包括多个票据元素；根据预设的票据元素样本集合和待处理图像对应的字符识别信息，确定票据图像中的至少一个第一票据元素的识别结果；其中，识别结果包括第一票据元素对应的元素类型、语义信息和位置特征；根据第一票据元素的识别结果中的位置特征，确定与第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域；根据目标区域对应的字符识别信息，确定第二票据元素的识别结果；根据第一票据元素的识别结果和至少一个第二票据元素的识别结果，生成票据识别结果。上述方案提供的票据识别方法，通过根据待处理图像中各票据元素之间的位置关联关系，确定目标区域和该目标区域对应的票据元素的识别结果，以此类推，可以得到票据图像中的多个票据元素的识别结果，无需为不同票据类型的票据分别创建票据识别框架，该方法具有较高的适应性，为提高票据识别效率奠定了基础。

本申请实施例提供了一种票据识别装置，用于解决现有技术中的票据识别方法的适应性较差的技术问题。如图3所示，为本申请实施例提供的票据识别装置的结构示意图，该装置30包括：获取模块301、第一识别模块302、确定模块303、第二识别模块304和生成模块305；

其中，获取模块用于获取待处理图像；其中，待处理图像中包括票据图像，票据图像中包括多个票据元素；第一识别模块用于根据预设的票据元素样本集合和待处理图像对应的字符识别信息，确定票据图像中的至少一个第一票据元素的识别结果；其中，识别结果包括第一票据元素对应的元素类型、语义信息和位置特征；确定模块用于根据第一票据元素的识别结果中的位置特征，确定与第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域；第二识别模块用于根据目标区域对应的字符识别信息，确定第二票据元素的识别结果；生成模块用于根据第一票据元素的识别结果和至少一个第二票据元素的识别结果，生成票据识别结果。

具体地，在一实施例中，第一识别模块具体用于：

计算字符识别信息中的各字段与票据元素样本集合中各样本的相似度，根据相似度从大到小的排序结果，确定第一目标样本和第一目标样本对应的第一票据元素；

根据第一目标样本对应的元素类型，确定第一票据元素的元素类型；

根据第一目标样本对应的位置特征，确定第一票据元素的位置特征；

根据字符识别信息，确定第一票据元素的语义信息。

具体地，在一实施例中，确定模块具体用于：

在票据元素样本集合中，确定至少一个与第一目标样本存在位置关联关系的第二目标样本；根据第二目标样本对应的位置特征，确定第二票据元素对应的目标区域。

具体地，在一实施例中，第二识别模块具体用于：

在字符识别信息中提取与目标区域的位置对应的字段，以确定第二票据元素的语义信息；

根据第二目标样本对应的元素类型，确定第二票据元素的元素类型；

根据第二目标样本对应的位置特征，确定第二票据元素的位置特征。

具体地，在一实施例中，第一识别模块还用于：

对待处理图像进行OCR识别，以获得待处理图像对应的字符识别信息。

具体地，在一实施例中，第一识别模块还用于：

对待处理图像进行二值化处理，以获得待处理图像对应的二值化图像；

对二值化图像进行连通区域分析，以获得二值化图像对应的文本区域，

根据文本区域中的文本方向，确定二值化图像的待旋转角度和旋转方向；

根据待旋转角度和旋转方向，对二值化图像进行位置调整。

具体地，在一实施例中，第一识别模块还用于：

对待处理图像依次进行灰度处理、高斯滤波处理和去噪声处理。

本申请实施例提供的一种票据识别装置，用于执行上述实施例提供的票据识别方法，其实现方式与原理相同，不再赘述。

本申请实施例还了提供一种电子设备，用于执行上述实施例提供的方法。

如图4所示，为本申请实施例提供的电子设备的结构示意图。该电子设备40包括：至少一个处理器41和存储器42；

其中，至少一个处理器执行存储器存储的计算机执行指令，使得至少一个处理器执行如前述实施例中任一项的方法的指令。

本申请实施例提供的一种电子设备，用于执行上述实施例提供的票据识别方法，其实现方式与原理相同，不再赘述。

本申请实施例提供了一种包含计算机可执行指令的存储介质，存储介质中存储有计算机处理器执行指令，当处理器执行计算机执行指令时，实现如上任一实施例提供的方法。

本申请实施例的包含计算机可执行指令的存储介质，可用于存储前述实施例中提供的票据识别方法的计算机执行指令，其实现方式与原理相同，不再赘述。

显然，上述实施例仅仅是为清楚地说明所作的举例，而并非对实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims

1.一种票据识别方法，其特征在于，包括：

根据所述第一票据元素的识别结果和至少一个第二票据元素的识别结果，生成票据识别结果；

其中，所述根据预设的票据元素样本集合和所述待处理图像对应的字符识别信息，确定所述票据图像中的至少一个第一票据元素的识别结果，包括：

根据所述字符识别信息，确定所述第一票据元素的语义信息；

所述根据所述第一票据元素的识别结果中的位置特征，确定与所述第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域，包括：

在所述票据元素样本集合中，确定至少一个与所述第一目标样本存在位置关联关系的第二目标样本；根据所述第二目标样本对应的位置特征，确定所述第二票据元素对应的目标区域；

其中，所述计算所述字符识别信息中的各字段与所述票据元素样本集合中各样本的相似度，包括：

根据所述字段的字符长度和首字符，计算该字段与所述票据元素样本集合中各样本的相似度。

2.根据权利要求1所述的票据识别方法，其特征在于，所述根据所述目标区域对应的字符识别信息，确定所述第二票据元素的识别结果，包括：

3.根据权利要求1所述的票据识别方法，其特征在于，在根据预设的票据元素样本集合和所述待处理图像对应的字符识别信息，确定所述票据图像中的至少一个第一票据元素的识别结果之前，所述方法还包括：

4.根据权利要求3所述的票据识别方法，其特征在于，在对所述待处理图像进行OCR识别之前，所述方法还包括：

5.根据权利要求4所述的票据识别方法，其特征在于，在对所述待处理图像进行二值化处理之前，所述方法还包括：

6.一种票据识别装置，其特征在于，包括：获取模块、第一识别模块、确定模块、第二识别模块和生成模块；

所述生成模块用于根据所述第一票据元素的识别结果和至少一个第二票据元素的识别结果，生成票据识别结果；

其中，所述第一识别模块具体用于：

所述确定模块具体用于：

其中，所述第一识别模块具体用于:

7.一种电子设备，其特征在于，包括：至少一个处理器和存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如权利要求1-5任一项所述的方法。

8.一种包含计算机可执行指令的存储介质，其特征在于，所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-5任一项所述的方法。