CN111950356B

CN111950356B - 印章文本定位方法、装置及电子设备

Info

Publication number: CN111950356B
Application number: CN202010621366.6A
Authority: CN
Inventors: 高亚南
Original assignee: Shenzhen Emperor Technology Co Ltd
Current assignee: Shenzhen Emperor Technology Co Ltd
Priority date: 2020-06-30
Filing date: 2020-06-30
Publication date: 2024-04-19
Anticipated expiration: 2040-06-30
Also published as: CN111950356A

Abstract

本公开实施例提供一种印章文本定位方法、装置及电子设备，属于图像处理技术领域。其中方法包括：接收待识别的印章图片；将所述印章图片输入训练好的文本区域定位模型，获得所述印章图片中文本区域的位点参数，其中，所述位点参数至少包括所述文本区域的顶点像素、头尾像素和边界像素中的至少一种；根据所述文本区域的位点参数，在所述印章图片中定位所述文本区域。本公开实施提供的方案，通过训练好的文本区域定位模型自动、准确地在待识别的印章图片中定位出文本区域，提高了印章图片中文本区域的识别效率和准确率。

Description

印章文本定位方法、装置及电子设备

技术领域

本公开涉及图像处理技术领域，尤其涉及一种印章文本定位方法、装置及电子设备。

背景技术

目前没有针对护照印章的文本检测技术，现有复杂场景下的文本检测，网络输入层图片较大，网络结构过于复杂，而护照的单个印章图片比较小，印章文本的背景相对简单，现有复杂场景下的文本检测速度比较慢，不具有可用性。现有的身份证文本检测技术是通过模板中固定元素的位置来实现定位的，而在印章变形、旋转、模糊、缺失的情况下，使用模板匹配来检测文本，准确率不高。

可见，现有的印章文本识别方案存在文本区域定位的准确率较低的技术问题。

发明内容

有鉴于此，本公开实施例提供一种印章文本定位方法、装置及电子设备，至少部分解决现有技术中存在的问题。

第一方面，本公开实施例提供了一种印章文本定位方法，包括：

接收待识别的印章图片；

将所述印章图片输入训练好的文本区域定位模型，获得所述印章图片中文本区域的位点参数，其中，所述位点参数至少包括所述文本区域的顶点像素、头尾像素和边界像素中的至少一种；

根据所述文本区域的位点参数，在所述印章图片中定位所述文本区域。

根据本公开实施例的一种具体实现方式，所述将所述印章图片输入训练好的文本区域定位模型，获得所述印章图片中文本区域的位点参数的步骤，包括：

将所述印章图片输入所述文本区域定位模型，其中，所述文本区域定位模型包括第一卷积块、第二卷积块和第三卷积块；

通过所述第一卷积块、第二卷积块和第三卷积块之间自顶向下进行的多层特征融合作用，得到第一输出分支、第二输出分支和第三输出分支；

根据所述第一输出分支识别所述印章图片中位于所述文本区域的边界框内的边界像素，根据所述第二输出分支识别位于所述文本区域的头部和/或尾部的头尾像素，以及，根据所述第三输出分支识别位于所述文本区域的顶点位置的顶点像素。

根据本公开实施例的一种具体实现方式，所述印章图片为正方形图片，所述印章图片的单边尺寸范围为256至400，所述第一卷积块的通道数为32，第二卷积块的通道数为64，第三卷积块的通道数为128；

所述通过所述第一卷积块、第二卷积块和第三卷积块之间自顶向下进行的多层特征融合作用，得到第一输出分支、第二输出分支和第三输出分支的步骤，包括：

通过所述第一卷积块对所述印章图片进行卷积处理，得到维度为128*128*32的第一特征图；

通过所述第二卷积块对所述第一特征图进行卷积处理，得到维度为64*64*64的第二特征图；

通过所述第三卷积块对所述第二特征图进行卷积处理，得到维度为32*32*128的第三特征图；

将所述第三特征图进行上采样处理，得到维度为64*64*128的第四特征图；

将所述第四特征图和所述第二特征图进行通道合并，得到维度为64*64*192的第五特征图；

依次通过包含32个1*1滤波器的卷积层、32个3*3滤波器的卷积层以及32个3*3的卷积层对所述第五特征图进行卷积处理，得到所述第一输出分支、所述第二输出分支和所述第三输出分支。

根据本公开实施例的一种具体实现方式，所述根据所述文本区域的位点参数，在所述印章图片中定位所述文本区域的步骤，包括：

根据所述顶点像素确定所述文本区域的初始像素区域；

根据所述头尾像素矫正所述初始像素区域至标准位姿；

根据所述边界像素，在矫正至所述标准位姿后的所述初始像素区域中标记所述文本区域。

根据本公开实施例的一种具体实现方式，所述根据所述文本区域的位点参数，在所述印章图片中定位所述文本区域的步骤之后，所述方法还包括：

查找与识别出的文本区域对应的参考印章模板；

计算所述文本区域的顶点坐标与所述参考印章模板的顶点坐标之间的坐标差值；

若所述坐标差值小于或者等于预定阈值，则确定所述印章图片的文本区域定位正确；

若所述差值坐标大于所述预定阈值，则确定所述印章图片的文本区域定位错误，通过所述参考印章模板重新定位所述印章图片的文本区域。

根据本公开实施例的一种具体实现方式，所述接收待识别的印章图片的步骤之前，所述方法还包括：

获取预设数量的对应不同属性参数的样本印章图片，其中，所述属性参数片包括文本方向、颜色参数、文本格式中的至少一种；

获取基础卷积神经网络，其中，所述基础卷积神经网络包括所述第一卷积块、所述第二卷积块和所述第三卷积块；

将包含印章像素的基础样本图片输入所述基础卷积神经网络进行学习训练，得到所述文本区域定位模型。

根据本公开实施例的一种具体实现方式，所述获取预设数量的样本印章图片的步骤之前，所述方法还包括：

采集实际印章图片；

根据预定的规则对所述实际印章图片进行数据增强，生成预设数量的逼真印章图片；

将所述逼真印章图片作为所述样本印章图片。

根据本公开实施例的一种具体实现方式，所述根据预定的规则对所述实际印章图片进行数据增强，生成预设数量的逼真印章图片的步骤，包括：

在包含印章像素的背景页图片获取对应不同属性参数的文本区域；

通过预定像素在所述文本区域的周围区域进行像素填充，并在所述文本区域生成文本数据；

获取初始顶点信息，并在所述初始顶点信息所指示的所述文本区域中的对应位置进行顶点标记，得到所述逼真印章图片。

第二方面，本公开实施例提供了一种印章文本定位装置，包括：

接收模块，用于接收待识别的印章图片；

分析模块，用于将所述印章图片输入训练好的文本区域定位模型，获得所述印章图片中文本区域的位点参数，其中，所述位点参数至少包括所述文本区域的顶点像素、头尾像素和边界像素中的至少一种；

定位模块，用于根据所述文本区域的位点参数，在所述印章图片中定位所述文本区域。

第三方面，本公开实施例还提供了一种电子设备，该电子设备包括：

至少一个处理器；以及，

与该至少一个处理器通信连接的存储器；其中，

该存储器存储有可被该至少一个处理器执行的指令，该指令被该至少一个处理器执行，以使该至少一个处理器能够执行前述第一方面或第一方面的任一实现方式中的印章文本定位方法。

第四方面，本公开实施例还提供了一种非暂态计算机可读存储介质，该非暂态计算机可读存储介质存储计算机指令，该计算机指令用于使该计算机执行前述第一方面或第一方面的任一实现方式中的印章文本定位方法。

第五方面，本公开实施例还提供了一种计算机程序产品，该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序，该计算机程序包括程序指令，当该程序指令被计算机执行时，使该计算机执行前述第一方面或第一方面的任一实现方式中的印章文本定位方法。

本公开实施例提供的印章文本定位方案，通过将所接收的待识别的印章图片输入训练好的文本区域定位模型，以获得所述印章图片中文本区域的位点参数，其中，所述位点参数至少包括所述文本区域的顶点像素、头尾像素和边界像素中的至少一种；再根据所述文本区域的位点参数来定位所述文本区域。这样，可以通过训练好的文本区域定位模型自动、准确地在待识别的印章图片中定位出文本区域，提高了印章图片中文本区域的识别效率和准确率。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本公开实施例提供的一种印章文本定位方法的流程示意图；

图2为本公开实施例提供的印章文本定位方法所涉及的印章图片的示意图；

图3为本公开实施例提供的印章文本定位方法所涉及的印章图片的像素分布示意图；

图4为本公开实施例提供的另一种印章文本定位方法的部分流程示意图；

图5为本公开实施例提供的印章文本定位方法所涉及的文本区域定位模型的处理过程示意图；

图6和图7为本公开实施例提供的印章文本定位方法所涉及的印章图片和参考印章模板的示意图；

图8为本公开实施例提供的一种印章文本定位装置的结构示意图；

图9为本公开实施例提供的电子设备的示意图。

具体实施方式

下面结合附图对本公开实施例进行详细描述。

以下通过特定的具体实例说明本公开的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本公开的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

需要说明的是，下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见，本文中所描述的方面可体现于广泛多种形式中，且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开，所属领域的技术人员应了解，本文中所描述的一个方面可与任何其它方面独立地实施，且可以各种方式组合这些方面中的两者或两者以上。举例来说，可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外，可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。

还需要说明的是，以下实施例中所提供的图示仅以示意方式说明本公开的基本构想，图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。

另外，在以下描述中，提供具体细节是为了便于透彻理解实例。然而，所属领域的技术人员将理解，可在没有这些特定细节的情况下实践所述方面。

本公开实施例提供一种印章文本定位方法。本实施例提供的印章文本定位方法可以由一计算装置来执行，该计算装置可以实现为软件，或者实现为软件和硬件的组合，该计算装置可以集成设置在服务器、终端设备等中。

参见图1，为本公开实施例提供的一种印章文本定位方法的流程示意图。如图1所示，所述方法主要包括以下步骤：

S101，接收待识别的印章图片；

本实施例提供的印章文本定位方法，应用于护照、发票等对应图片上的印章文本识别场景，尤其是针对护照页上印章种类、盖章位置和盖章角度多样等导致的印章文本识别难度较大的场景。本实施例提供的印章文本定位方法，主要用于在待识别的印章图片中定位印章的文本区域，以此来采集或者识别印章中的参数信息。

所提供的印章文本定位方法应用于电子设备，电子设备外接或者内置图像采集装置，这样，电子设备可以预先通过所连接的图像采集装置获取待识别的印章所在的图片图片，或者通过网络等渠道获取或接收的其他设备获取或者生成的待识别的印章所在的图片，利用所提供的方法在所采集的印章图片中进行文本区域的定位操作。在具体实施时，可以在用户持护照进行身份验证的通道前设置图像采集装置，用户将护照内待识别的印章所在页贴合到图像采集装置的图像采集端口，电子设备获取图像采集装置采集的护照页图片，作为后续印章文本定位识别中所依据的待识别的印章图片。

本实施例中的印章图片，主要是针对图片上一个印章内的文本区域进行定位，优选待识别的印章图片为仅包含一个印章所在的像素区域的印章切片，此类印章图片仅包含当前待进行文本区域定位的印章像素，不包含其他的印章像素或者干扰像素，文本区域定位的计算量较少，准确度更高。

若所接收的待识别的初始印章图片中包含多个印章像素或者包含其他干扰像素，则可以先通过实例分割算法获取初始印章图片中的每个印章的轮廓位置信息，再结合轮廓位置信息获得每个印章对应的印章切片，将单个印章切片作为文本区域定位流程的输入图片。

此处所涉及的实力分割算法，是指电子设备自动从图片中用目标检测方法框出不同实例区域，再用语义分割方法在不同实例区域内进行逐像素标记。本实施例所采用的实例分割算法可以包括Mask-RCNN算法、YOACT算法、级联Mask-RCNN算法等方法。依据上述步骤获取待识别图片中每个印章的轮廓位置信息后，即可提取每个印章的轮廓位置信息所指向的像素特征，以得到该印章对应的印章切片。这样，每个印章对应的印章切片内仅包含该印章对应的像素特征，不包含其他可能会影响文本区域定位的干扰像素。

S102，将所述印章图片输入训练好的文本区域定位模型，获得所述印章图片中文本区域的位点参数，其中，所述位点参数至少包括所述文本区域的顶点像素、头尾像素和边界像素中的至少一种；

电子设备内预先加载有训练好的文本区域定位模型，该文本区域定位模型能够对所输入的印章图片进行像素特征提取和融合，以获得输入的印章图片中文本区域的各类特定的位点参数，例如文本区域的顶点像素、头尾像素或者边界像素的坐标数据。其中，如图2和图3所示，顶点像素(如图2中所示的A)可以为印章的顶点位置对应的像素，例如矩形印章的四个顶点像素，头尾像素(如图2中所示的B)可以为印章的头部位置或者尾部位置对应的像素，边界像素(如图2中所示的C)则可以为文本区域内的边缘区域的像素。

将所述印章图片输入电子设备内的文本区域定位模型，通过该文本区域定位模型的特征提取和算法匹配，即可快速获取该印章图片中文本区域的各类位点参数。

S103，根据所述文本区域的位点参数，在所述印章图片中定位所述文本区域。

依据上述步骤获取文本区域的位点参数后，即可依据文本区域中的顶点像素、头尾像素或者边界像素等各类特定位点的参数来快速定位文本区域。如图3所示，头或尾边界像素分别可以预测的2个顶点坐标。印章图片中的所有像素构成了文本框形状，然后只用边界像素去预测回归顶点坐标。边界像素定义为两端深色框内部所有像素，是用所有的边界像素预测值的加权平均来预测头或尾的短边两端的两个顶点。头和尾部分边界像素分别预测2个顶点，最后得到4个顶点坐标。

在一种具体实施方式中，所述根据所述文本区域的位点参数，在所述印章图片中定位所述文本区域的步骤，可以包括：

根据所述顶点像素确定所述文本区域的初始像素区域；

根据所述头尾像素矫正所述初始像素区域至标准位姿；

根据文本区域的顶点像素，可以生成文本区域对应的最小外接图框，例如最小外接矩形框，则位于该最小外接矩形框内的像素区域均为文本区域的初始像素区域。接着，根据文本区域的头尾像素来矫正初始像素区域，以使所述初始像素区域至标准位姿，通常设置标准位姿为与水平轴夹角为0度。最后，从矫正后的初始像素区域中筛选出边界像素，则初始像素区域内的其他像素区域即为文本区域。这样，即可快速从印章图片中定位出文本信息所在的文本区域。

在印章图片中定位出文本区域之后，通常还可以根据光学字符识别方法(OpticalCharacter Recognition，简称OCR)，或者其他图像文本信息的识别方法来快速、准确地采集或者识别印章图片中的文本信息。

上述本公开实施例提供的印章文本定位方案，通过将所接收的待识别的印章图片输入训练好的文本区域定位模型，以获得所述印章图片中文本区域的位点参数，其中，所述位点参数至少包括所述文本区域的顶点像素、头尾像素和边界像素中的至少一种；再根据所述文本区域的位点参数来定位所述文本区域。这样，可以通过训练好的文本区域定位模型自动、准确地在待识别的印章图片中定位出文本区域，提高了印章图片中文本区域的识别效率和准确率。

在上述实施例的基础上，根据本公开实施例的一种具体实现方式，如图4所示，步骤S102所述的，将所述印章图片输入训练好的文本区域定位模型，获得所述印章图片中文本区域的位点参数的步骤，可以包括：

S401，将所述印章图片输入所述文本区域定位模型，其中，所述文本区域定位模型包括第一卷积块、第二卷积块和第三卷积块；

如图5所示，所使用的文本区域定位模型可以包括第一卷积块conv block1、第二卷积块conv block2和第三卷积块conv block3，其中conv block1、conv block2、convblock3是改进过的vgg16的卷积块，通道数分别为32、64、128，其中卷积块conv block1、conv block2、conv block3中滤波器的大小仍然是3x3。/2表示滤波器的步长为2，比如维度为256x256x3的图片image，其中256x256表示图片的长、宽，3表示图片的r、g、b的3个颜色通道。

S402，通过所述第一卷积块、第二卷积块和第三卷积块之间自顶向下进行的多层特征融合作用，得到第一输出分支、第二输出分支和第三输出分支；

如图5所示，所述印章图片为正方形图片，所述印章图片的单边尺寸范围为256至400，所述第一卷积块的通道数32，第二卷积块的通道数为64，第三卷积块的通道数为128。利用该文本区域定位模型的过程具体可以包括：

具体的，如图5所示，初始输入为单边尺寸范围为256至400的正方形图片，例如256*256，经过conv block1 32，/2中3x3的滤波器，其中32表示32个3x3滤波器，/2表示滤波器的步长为2，得到128x128x32特征图，其中128x128表示特征图的长、宽，32表示特征图的通道数，多少个滤波器就得到多少个通道数的特征图，再经过conv block2 64，/2中3x3的滤波器，得到64x64x64特征图，再经过conv block3 128，/2得到32x32x128特征图，32x32x128特征图经过上采样upsampling，得到64x64x128特征图，再与conv block2 64，/2得到的特征图64x64x64进行通道合并concat，得到64x64x192特征图，即自顶而下进行多层特征融合，再通过1x1，32即32个1x1的滤波器，得到64x64x32特征图，再通过3x3，32即32个3x3的滤波器，得到64x64x32特征图，再通过3x3,32得到64x64x32特征图，最终得到3个输出分支。

S403，根据所述第一输出分支识别所述印章图片中位于所述文本区域的边界框内的边界像素，根据所述第二输出分支识别位于所述文本区域的头部和/或尾部的头尾像素，以及，根据所述第三输出分支识别位于所述文本区域的顶点位置的顶点像素。

第一个输出分支1*1，1表示1个1x1的滤波器得到64x64x1的特征图，此特征图表示各像素是否在文本边界框内，是则为1，否则为0，第二个输出分支1x1，2表示2个1x1的滤波器得到64x64x2的特征图，此特征图表示各个像素是否属于文本框的头还是尾，64x64x2其中2表示特征图的通道数，第一个通道表示各个像素是否属于文本框的头部，若是，则为1，若否则为0，第二个通道表示各个像素是否属于文本框的尾部，若是，则为1，若否则为0，第三个输出分支1*1，4表示用4个1x1的滤波器得到64x64x4的特征图，4个通道的特征图，每个通道分别对应表示各个像素是否是4个顶点中的一个顶点，若是，则为1，若否则为0。

这样，即可快速准确地识别出印章图片中文本区域的顶点像素、边界像素和头尾像素。

本实施例提供的印章文本定位方法，所应用的轻量级文本区域定位模型，所接收的印章图片的大小较小，卷积层较少，每层的滤波器的数量也比较少，通过预测文本区域四个顶点的位置，实现快速定位任意方向的文本框。

在上述实施例的基础上，还增设了根据参考印章模板验证定位准确度的方案。根据本公开实施例的一种具体实现方式，步骤S103所述的，根据所述文本区域的位点参数，在所述印章图片中定位所述文本区域的步骤之后，所述方法还可以包括：

查找与识别出的文本区域对应的参考印章模板；

如图6所示为标准的国家护照出入境印章的图片，通常每一种印章中的文本区域的尺寸以及文本区域内各部分字符的位置都是相对固定的，由此可以预先存储针对每一种印章的参考印章模板，在定位出印章图片中的文本区域之后以参考印章模板来进行验证。需要说明的是，这类的参考印章模板的分类可以以归属国来分类，例如每个国家的出入境的参考印章模板是固定的，且不同国家的出入境的参考印章模板是不同的。当然也可以以身份验证的类别或者印章用途类别来分类，

如图7所示为通过文本区域定位模型定位识别出的文本区域，而其所对应的参考印章模板如图6所示，参考印章模板的统一大小为256x256，其中出境日期、机场、国家信息等字符位置是固定的。根据最长的文本区域的4个顶点位置，对整个印章图片进行旋转矫正得到如图7所示的印章图片后，与图6所示的参考印章模板进行相应位置求误差。

具体的，计算图6和图7中的对应4个顶点对应位置坐标的差值之和，判断是否小于或者等于预定阈值，若小于或者等于预定阈值则表示正确定位，否则不正确，此时可以用参考印章模板中的文本区域来定位印章图中的文本区域。具体实施时，预定阈值的范围可以是4至15个像素。针对误差较大的情况，可以持续修正，直至基本接近参考印章模板的文本区域为止。

本实施例提供的方法，借助参考印章模板来印章模型分析定位出的文本区域是否正确，在判定出文本区域定位不正确地情况下进行旋转矫正，进一步提高了印章文本定位准确度。

下述各实施方式，则是在上述实施方式的基础上，对文本区域定位模型的训练过程作了具体限定。

先获取预先搭建的如上述实施方式所提供的基础卷积神经网络，包括如图5所示的第一卷积块、第二卷积块和第三卷积块。再将预设数量的样本印章图片输入基础卷积神经网络进行学习训练，以得到具备文本区域定位能力的文本区域定位模型。

为提高各种情况下一种文本区域的定位准确度，要准备参数丰富的基础样本数据。考虑到护照页上的印章所在页可能存在多种背景颜色如红白蓝，且不同出入境关口所使用的印章形状可能不同如三角形圆形方形，印章尺寸与所在页的尺寸比例也不同。在准备样本数据时，可以参照真实印章所在的图片数据，构造各种样式的印章数据，即在护照背景图片上构造各种包括但不限于真实印章参数的颜色、各种形状及尺寸比例等属性参数的印章数据，如红色三角形、绿色四边形、黑色正六边形等。此外，还可以设置不同尺寸参数的印章，即宽度长度参数不同的印章，以及印章与所在基础样本图片的尺寸比例不同的基础样本图片，印章在所在基础样本图片中的位置不同等多种情况。

采集实际印章图片；

将所述逼真印章图片作为所述样本印章图片。

进一步的，所述根据预定的规则对所述实际印章图片进行数据增强，生成预设数量的逼真印章图片的步骤，可以包括：

考到实际护照页盖章的样本图片数比较少，可以通过生成一定数量的跟实际护照页盖章的像素特征类似逼真数据，即通过参考文本信息的颜色、文字、字体类型等，生成逼真数据。其中，逼真数据生成规则包括：先通过框选等方式获取包含印章像素的背景页的文本区域，文本区域可对应不同属性参数，再通过预定的像素填充文本区域如出入境日期、国家、出入境机场等信息，预定的像素为文本区域周围的像素，如图2中的文本日期25.Sep.2016周围的多个空白方框的像素，在护照各种印章上分别生成各种方向、格式、颜色、跟真实护照印章文本接近的文本数据。之后，再通过输入/输出设备接收指示图片顶点位置的初始顶点信息，进而根据该初始顶点信息所指示的所述文本区域中的对应位置，添加顶点标记，得到逼真印章图片。这样，即可实现数据增强，减少文本标注成本。

需要说明的是，所生成的基础样本图片为尺寸256x256的印章图片，当然也可以接收其它输入尺寸的印章图片，尺寸范围可以为256至400。

综上所述，本公开实施例提供的印章文本定位方法，能够针对护照印章的文本区域进行适应性定位识别，应用轻量型的网络结构，输入层图片适中，可以快速检测印章中的具有各种方向的文本区域。利用深度学习方法，结合传统的模板匹配的方法，加上数据增强的方法，综合提升印章中文本区域识别的准确率。

与上面的方法实施例相对应，参见图8，本公开实施例还提供了一种印章文本定位装置80，包括：

接收模块801，用于接收待识别的印章图片；

分析模块802，用于将所述印章图片输入训练好的文本区域定位模型，获得所述印章图片中文本区域的位点参数，其中，所述位点参数至少包括所述文本区域的顶点像素、头尾像素和边界像素中的至少一种；

定位模块803，用于根据所述文本区域的位点参数，在所述印章图片中定位所述文本区域。

图8所示装置可以对应的执行上述方法实施例中的内容，本实施例未详细描述的部分，参照上述方法实施例中记载的内容，在此不再赘述。

参见图9，本公开实施例还提供了一种电子设备90，该电子设备包括：

至少一个处理器；以及，

与该至少一个处理器通信连接的存储器；其中，

该存储器存储有可被该至少一个处理器执行的指令，该指令被该至少一个处理器执行，以使该至少一个处理器能够执行前述方法实施例中的印章文本定位方法。

本公开实施例还提供了一种非暂态计算机可读存储介质，该非暂态计算机可读存储介质存储计算机指令，该计算机指令用于使该计算机执行前述方法实施例中的印章文本定位方法。

本公开实施例还提供了一种计算机程序产品，该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序，该计算机程序包括程序指令，当该程序指令被计算机执行时，使该计算机执行前述方法实施例中的印章文本定位方法。

下面参考图9，其示出了适于用来实现本公开实施例的电子设备90的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图9示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图9所示，电子设备90可以包括处理装置(例如中央处理器、图形处理器等)901，其可以根据存储在只读存储器(ROM)902中的程序或者从存储装置908加载到随机访问存储器(RAM)903中的程序而执行各种适当的动作和处理。在RAM 903中，还存储有电子设备90操作所需的各种程序和数据。处理装置901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。

通常，以下装置可以连接至I/O接口905：包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置906；包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置907；包括例如磁带、硬盘等的存储装置908；以及通信装置909。通信装置909可以允许电子设备90与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种装置的电子设备90，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置909从网络上被下载和安装，或者从存储装置908被安装，或者从ROM 902被安装。在该计算机程序被处理装置901执行时，执行本公开实施例的方法中限定的上述功能。

需要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF(射频)等等，或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备能够实现上述方法实施例提供的方案。

或者，上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备能够实现上述方法实施例提供的方案。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，单元的名称在某种情况下并不构成对该单元本身的限定，例如，第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。

应当理解，本公开的各部分可以用硬件、软件、固件或它们的组合来实现。

以上所述，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以权利要求的保护范围为准。

Claims

1.一种印章文本定位方法，其特征在于，包括：

接收待识别的印章图片；

将所述印章图片输入训练好的文本区域定位模型，获得所述印章图片中文本区域的位点参数，其中，所述位点参数至少包括所述文本区域的顶点像素、头尾像素或边界像素中的至少一种；

根据所述文本区域的位点参数，在所述印章图片中定位所述文本区域；

其中，所述将所述印章图片输入训练好的文本区域定位模型，获得所述印章图片中文本区域的位点参数的步骤，包括：

根据所述第一输出分支识别所述印章图片中位于所述文本区域的边界框内的边界像素，根据所述第二输出分支识别位于所述文本区域的头部和/或尾部的头尾像素，以及，根据所述第三输出分支识别位于所述文本区域的顶点位置的顶点像素；

并且，所述印章图片为正方形图片，所述印章图片的单边尺寸范围为256至400，所述第一卷积块的通道数为32，第二卷积块的通道数为64，第三卷积块的通道数为128；

2.根据权利要求1所述的方法，其特征在于，所述根据所述文本区域的位点参数，在所述印章图片中定位所述文本区域的步骤，包括：

根据所述顶点像素确定所述文本区域的初始像素区域；

根据所述头尾像素矫正所述初始像素区域至标准位姿；

3.根据权利要求2所述的方法，其特征在于，所述根据所述文本区域的位点参数，在所述印章图片中定位所述文本区域的步骤之后，所述方法还包括：

查找与识别出的文本区域对应的参考印章模板；

若所述坐标差值大于所述预定阈值，则确定所述印章图片的文本区域定位错误，通过所述参考印章模板重新定位所述印章图片的文本区域。

4.根据权利要求2至3中任一项所述的方法，其特征在于，所述接收待识别的印章图片的步骤之前，所述方法还包括：

获取预设数量的对应不同属性参数的样本印章图片，其中，所述属性参数包括文本方向、颜色参数、文本格式中的至少一种；

5.根据权利要求4所述的方法，其特征在于，所述获取预设数量的样本印章图片的步骤之前，所述方法还包括：

采集实际印章图片；

将所述逼真印章图片作为所述样本印章图片。

6.根据权利要求5所述的方法，其特征在于，所述根据预定的规则对所述实际印章图片进行数据增强，生成预设数量的逼真印章图片的步骤，包括：

7.一种印章文本定位装置，其特征在于，包括：

分析模块，用于将印章图片输入训练好的文本区域定位模型，获得所述印章图片中文本区域的位点参数，其中，所述位点参数至少包括所述文本区域的顶点像素、头尾像素或边界像素中的至少一种；其中，所述将所述印章图片输入训练好的文本区域定位模型，获得所述印章图片中文本区域的位点参数的步骤，包括：将所述印章图片输入所述文本区域定位模型，其中，所述文本区域定位模型包括第一卷积块、第二卷积块和第三卷积块；通过所述第一卷积块、第二卷积块和第三卷积块之间自顶向下进行的多层特征融合作用，得到第一输出分支、第二输出分支和第三输出分支；根据所述第一输出分支识别所述印章图片中位于所述文本区域的边界框内的边界像素，根据所述第二输出分支识别位于所述文本区域的头部和/或尾部的头尾像素，以及，根据所述第三输出分支识别位于所述文本区域的顶点位置的顶点像素；

并且，所述印章图片为正方形图片，所述印章图片的单边尺寸范围为256至400，所述第一卷积块的通道数为32，第二卷积块的通道数为64，第三卷积块的通道数为128；所述通过所述第一卷积块、第二卷积块和第三卷积块之间自顶向下进行的多层特征融合作用，得到第一输出分支、第二输出分支和第三输出分支的步骤，包括：通过所述第一卷积块对所述印章图片进行卷积处理，得到维度为128*128*32的第一特征图；通过所述第二卷积块对所述第一特征图进行卷积处理，得到维度为64*64*64的第二特征图；通过所述第三卷积块对所述第二特征图进行卷积处理，得到维度为32*32*128的第三特征图；将所述第三特征图进行上采样处理，得到维度为64*64*128的第四特征图；将所述第四特征图和所述第二特征图进行通道合并，得到维度为64*64*192的第五特征图；依次通过包含32个1*1滤波器的卷积层、32个3*3滤波器的卷积层以及32个3*3的卷积层对所述第五特征图进行卷积处理，得到所述第一输出分支、所述第二输出分支和所述第三输出分支；

8.一种电子设备，其特征在于，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行前述权利要求1-6中任一项所述的印章文本定位方法。