CN112560767A

CN112560767A - 文档签名识别方法、装置及计算机可读存储介质

Info

Publication number: CN112560767A
Application number: CN202011557454.0A
Authority: CN
Inventors: 肖威; 潘晓华; 刘福权
Original assignee: Shenzhen Digital Power Grid Research Institute of China Southern Power Grid Co Ltd
Current assignee: Southern Power Grid Digital Grid Research Institute Co Ltd; Shenzhen Digital Power Grid Research Institute of China Southern Power Grid Co Ltd
Priority date: 2020-12-24
Filing date: 2020-12-24
Publication date: 2021-03-26

Abstract

本申请公开了一种文档签名识别方法、装置及计算机可读存储介质。本申请的文档签名识别方法包括：获取待识别文档、待识别文档的文档类型；待识别文档是非图片文档；根据待识别文档的文档类型对待识别文档进行图片化处理，以获得待处理图片；对待处理图片进行图像分割处理以获得待识别图片；对待识别图片进行图像识别处理，获得目标图片；识别出目标图片的文档内容；文档内容用于表征待识别文档的签名信息。该方法提高文档签名识别的正确率。

Description

文档签名识别方法、装置及计算机可读存储介质

技术领域

本申请涉及但不限于信息处理领域，尤其是涉及一种文档签名识别方法、装置及计算机可读存储介质。

背景技术

签名识别技术应用于信息处理领域中，当前的签名识别技术存在错误率较高的问题。

发明内容

本申请旨在至少解决现有技术中存在的技术问题之一。为此，本申请提出一种文档签名识别方法，能够提高签名识别的准确性。

本申请还提出一种具有文档签名识别方法的装置。

本申请还提出一种具有文档签名识别方法的计算机可读存储介质。

根据本申请第一方面实施例的文档签名识别方法，所述方法包括：获取待识别文档、所述待识别文档的文档类型；所述待识别文档是非图片文档；根据待识别文档的文档类型对所述待识别文档进行图片化处理，以获得待处理图片；对所述待处理图片进行图像分割处理以获得待识别图片；对所述待识别图片进行图像识别处理，获得目标图片；识别出所述目标图片的文档内容；所述文档内容用于表征所述待识别文档的签名信息。

根据本申请实施例的文档签名识别方法，至少具有如下技术效果：本方法能够提升文档签名识别的正确率。

根据本申请的一些实施例，所述文档类型包括PDF文档，所述根据待识别文档的文档类型对所述待识别文档进行图片化处理，以获得待处理图片，包括：若所述文档类型为PDF文档，则通过PDFBOX对所述待识别文档进行图片化处理，以获得所述待处理图片。

根据本申请的一些实施例，所述文档类型包括非PDF文档，所述根据待识别文档的文档类型对所述待识别文档进行图片化处理，以获得待处理图片，包括：若所述文档类型为非PDF文档，则通过POI技术对所述待识别文档进行图片化处理，以获得所述待处理图片。

根据本申请的一些实施例，所述对所述待处理图片进行图像分割处理以获得待识别图片包括：根据Spire对图片进行图片分割处理以获得待识别图片。

根据本申请的一些实施例，所述识别出所述目标图片的文档内容包括：获取签名识别模型；根据签名识别模型识别出所述目标图片的文档内容。

根据本申请的一些实施例，所述识别出所述目标图片的文档内容，包括：若所述目标图片中有签名，则识别出所述目标图片的文档内容；若所述目标图片中没有签名，则根据所述目标图片训练所述签名识别模型。

根据本申请第二方面实施例的文档签名识别装置，包括：文档获取模块，用于获取待识别文档、所述待识别文档的文档类型；所述待识别文档是非图片文档；图片化处理模块，用于根据待识别文档的文档类型对所述待识别文档进行图片化处理，以获得待处理图片；图像分割模块，用于对所述待处理图片进行图像分割处理以获得待识别图片；目标图片获取模块，用于对所述待识别图片进行图像识别处理，获得目标图片；目标图片识别模块，用于识别出所述目标图片的文档内容；所述文档内容用于表征所述待识别文档的签名信息。

根据本申请第三方面实施例的文档签名识别装置，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现：本申请上述第一方面实施例的文档签名识别方法。

根据本申请第四方面实施例的计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于：执行上述第一方面实施例的所述的文档签名识别方法。

本申请的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过申请的实践了解到。

附图说明

下面结合附图和实施例对本申请做进一步的说明，其中：

图1是本申请一个实施例提供的文档签名识别方法流程图；

图2是本申请另一个实施例提供的文档签名识别方法流程图；

图3是本申请另一个实施例提供的文档签名识别方法流程图；

图4是本申请另一个实施例提供的文档签名识别方法流程图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本申请，而不能理解为对本申请的限制。

在本申请的描述中，需要理解的是，涉及到方位描述，例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本申请和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本申请的限制。

本申请的描述中，参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

现有技术普遍使用OCR直接识别文档，对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息，然后找出需要识别内容。但是直接使用OCR进行识别的方法存在正确率较低的问题，进而影响文本识别的实际应用效果。

针对OCR识别的正确率较低的情况，本发明主要将待识别内容通过深度学习进行识别训练，在应用中通过对文档进行图形处理，将文档中文本、签名、印章等信息转化为图片；利用深度学习对转化后的图片进行内容识别来确认是否包含特定的签名信息，有效的提高识别正确率，同时还可以不断完善训练模型，从而提高识别的正确率。

根据本申请实施例的文档签名识别方法，方法包括：获取待识别文档、待识别文档的文档类型；待识别文档是非图片文档；根据待识别文档的文档类型对待识别文档进行图片化处理，以获得待处理图片；对待处理图片进行图像分割处理以获得待识别图片；对待识别图片进行图像识别处理，获得目标图片；识别出目标图片的文档内容；文档内容用于表征待识别文档的签名信息。

如图1所示，在一些实施例中，文档签名识别方法包括：

S110，获取待识别文档、待识别文档的文档类型；

S120，根据待识别文档的文档类型对待识别文档进行图片化处理，以获得待处理图片；

S130，对待处理图片进行图像分割处理以获得待识别图片；

S140，对待识别图片进行图像识别处理，获得目标图片；

S150，识别出目标图片的文档内容。

在步骤S110中，待识别文档是非图片文档，文档类型包括PDF和非PDF两种类型，针对不同的文档类型，使用不同的图片化处理手段。

在步骤S120中，针对待识别文档，文档签名识别方法抽取文档中的图片信息，将文档内容进行拆分，并转换为待识图片，便于后续对文字的提取。

在步骤S130中，图像分割的目的是将待处理图片分割成多个部分，在对含有签名的区域进行识别时，避免了其他部分对识别准确率的影响。

在步骤S140中，文档签名识别方法通过获得目标图片的方式，找到最有可能包含签名的图片部分，进而再对其进行有针对性地识别工作。

在步骤S150中，文档内容用于表征待识别文档的签名信息，即所识别得到的内容就是签名中包含的文字内容。

本申请的文档签名识别方法利用了图形识别学习技术和文档图片转换技术，对需要识别的特定签名进行图形对比，同时结合了OCR识别技术，实现对特定签名的识别，从而能更准确地识别出文档内容，解决了现有识别方法的正确率较低的问题，提高文档签名识别的正确率。

根据本申请的一些实施例，文档类型包括PDF文档，根据待识别文档的文档类型对待识别文档进行图片化处理，以获得待处理图片，包括：若文档类型为PDF文档，则通过PDFBOX对待识别文档进行图片化处理，以获得待处理图片。

根据本申请的一些实施例，文档类型包括非PDF文档，根据待识别文档的文档类型对待识别文档进行图片化处理，以获得待处理图片，包括：若文档类型为非PDF文档，则通过POI技术对待识别文档进行图片化处理，以获得待处理图片。

如图2所示，在一些实施例中，文档签名识别方法包括：

S210，获取待识别文档的文档类型；

S220，判断文档类型是否为PDF文档；若判断结果为是，则执行步骤S230；若判断结果为否，则执行步骤S240；

S230，通过PDFBOX对待识别文档进行图片化处理，以获得待处理图片；

S240，则通过POI技术对待识别文档进行图片化处理，以获得待处理图片。

在步骤S210至S220中，文档类型用于决定对待识别文档的处理方式。

在步骤S230中，对于PDF文件，通过PDFBOX对PDF文档进行处理，抽取图片信息，将文档内容进行拆分及转换为待识图片。

在步骤S240中，对于非PDF文件，通过POI技术对文档进行处理，抽取图片信息，将文档内容进行拆分及转换为待识图片。

文档签名识别方法通过针对不同文档类型来设置不同的处理方法，提高了识别的正确率。

根据本申请的一些实施例，对待处理图片进行图像分割处理以获得待识别图片包括：根据Spire对图片进行图片分割处理以获得待识别图片。

在具体的实施例中，文档签名识别方法使用Spire对图片进行分割，将图片信息拆分，减少待识别内容的干扰。

根据本申请的一些实施例，识别出目标图片的文档内容包括：获取签名识别模型；根据签名识别模型识别出目标图片的文档内容。

如图3所示，在一些实施例中，文档签名识别方法包括：

S310，获取签名识别模型；

S320，根据签名识别模型识别出目标图片的文档内容。

在步骤S310至S320中，签名识别模型为深度学习领域的网络模型，本申请不对具体的网络类型和结构做具体限制。

在具体的实施例中，通过将包含签名数据及其标签的数据集作为训练集，输入深度学习网络中，对模型进行训练，从而得到签名识别模型，再利用签名识别模型对待检测文档中的签名进行识别，输出识别结果。

根据本申请的一些实施例，识别出目标图片的文档内容，包括：若目标图片中有签名，则识别出目标图片的文档内容；若目标图片中没有签名，则根据目标图片训练签名识别模型。

如图4所示，在一些实施例中，文档签名识别方法包括：

S410，对待识别图片进行图像识别处理，获得目标图片；

S420，判断目标图片中是否有签名；若判断结果为是，则执行步骤S430；若判断结果为否，则执行步骤S440；

S430，识别出目标图片的文档内容；

S440，根据目标图片训练签名识别模型。

在步骤S410至S440中，文档签名识别方法对拆分好的图片进行图片识别，识别出特定的签名信息所在图片。若发现识别错误的签名信息，即没有找到满足要求的目标图片，或找到的目标图片有误，则会将其纳入到模型的训练集中，从而提高模型的准确性，避免下次识别继续出现这种错误。

根据本申请实施例的文档签名识别装置，包括：文档获取模块，用于获取待识别文档、待识别文档的文档类型；待识别文档是非图片文档；图片化处理模块，用于根据待识别文档的文档类型对待识别文档进行图片化处理，以获得待处理图片；图像分割模块，用于对待处理图片进行图像分割处理以获得待识别图片；目标图片获取模块，用于对待识别图片进行图像识别处理，获得目标图片；目标图片识别模块，用于识别出目标图片的文档内容；文档内容用于表征待识别文档的签名信息。

本申请的文档签名识别装置实现了上述文档签名识别方法，利用了图形识别学习技术和文档图片转换技术，对需要识别的特定签名进行图形对比，同时结合了OCR识别技术，实现对特定签名的识别，从而能更准确地识别出文档内容，解决了现有识别方法的正确率较低的问题，提高文档签名识别的正确率。

根据本申请实施例的文档签名识别装置，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时实现：本申请上述任一实施例的文档签名识别方法。

根据本申请实施例的计算机可读存储介质，存储有计算机可执行指令，计算机可执行指令用于：执行上述任一实施例的文档签名识别方法。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

上面结合附图对本申请实施例作了详细说明，但是本申请不限于上述实施例，在所属技术领域普通技术人员所具备的知识范围内，还可以在不脱离本申请宗旨的前提下作出各种变化。此外，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

Claims

1.文档签名识别方法，其特征在于，包括：

获取待识别文档、所述待识别文档的文档类型；所述待识别文档是非图片文档；

根据待识别文档的文档类型对所述待识别文档进行图片化处理，以获得待处理图片；

对所述待处理图片进行图像分割处理以获得待识别图片；

对所述待识别图片进行图像识别处理，获得目标图片；

识别出所述目标图片的文档内容；所述文档内容用于表征所述待识别文档的签名信息。

2.根据权利要求1所述的文档签名识别方法，其特征在于，所述文档类型包括PDF文档，所述根据待识别文档的文档类型对所述待识别文档进行图片化处理，以获得待处理图片，包括：

若所述文档类型为PDF文档，则通过PDFBOX对所述待识别文档进行图片化处理，以获得所述待处理图片。

3.根据权利要求1所述的文档签名识别方法，其特征在于，所述文档类型包括非PDF文档，所述根据待识别文档的文档类型对所述待识别文档进行图片化处理，以获得待处理图片，包括：

若所述文档类型为非PDF文档，则通过POI技术对所述待识别文档进行图片化处理，以获得所述待处理图片。

4.根据权利要求1所述的文档签名识别方法，其特征在于，所述对所述待处理图片进行图像分割处理以获得待识别图片包括：

根据Spire对图片进行图片分割处理以获得待识别图片。

5.根据权利要求1所述的文档签名识别方法，其特征在于，所述识别出所述目标图片的文档内容包括：

获取签名识别模型；

根据签名识别模型识别出所述目标图片的文档内容。

6.根据权利要求5所述的文档签名识别方法，其特征在于，所述识别出所述目标图片的文档内容，包括：

若所述目标图片中有签名，则识别出所述目标图片的文档内容；

若所述目标图片中没有签名，则根据所述目标图片训练所述签名识别模型。

7.文档签名识别装置，其特征在于，包括：

文档获取模块，用于获取待识别文档、所述待识别文档的文档类型；所述待识别文档是非图片文档；

图片化处理模块，用于根据待识别文档的文档类型对所述待识别文档进行图片化处理，以获得待处理图片；

图像分割模块，用于对所述待处理图片进行图像分割处理以获得待识别图片；

目标图片获取模块，用于对所述待识别图片进行图像识别处理，获得目标图片；

目标图片识别模块，用于识别出所述目标图片的文档内容；所述文档内容用于表征所述待识别文档的签名信息。

8.文档签名识别装置，其特征在于，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现：

如权利要求1至7中任一项所述的文档签名识别方法。

9.计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于：

执行权利要求1至7中任一项所述的文档签名识别方法。