CN113436080A

CN113436080A - 印章图像的处理方法、装置、设备及存储介质

Info

Publication number: CN113436080A
Application number: CN202110734972.3A
Authority: CN
Inventors: 师燕妮; 韩茂琨; 刘玉宇
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2021-06-30
Filing date: 2021-06-30
Publication date: 2021-09-24

Abstract

本发明涉及图像处理领域，公开了一种印章图像的处理方法、装置、设备及存储介质。所述印章图像的处理方法包括：基于印章图像检测模型，对印章图像进行目标检测，得到第一目标图像，并对第一目标图像进行镜像备份，得到第二目标图像；对第二目标图像进行预处理，得到第二目标图像对应的二值图；调用多点检测模型，对该二值图进行文本区域的多点检测，得到坐标点集合；根据坐标点集合，对该二值图进行边界拟合，得到目标二值图；对目标二值图进行轮廓检测，得到目标轮廓图像，并计算目标轮廓图像的倾斜角度，以及根据所述倾斜角度，旋转第一目标图像，得到准确的印章图像，从而提高对印章图像矫正的效率。

Description

印章图像的处理方法、装置、设备及存储介质

技术领域

本发明涉及图像处理领域，尤其涉及一种印章图像的处理方法、装置、设备及存储介质。

背景技术

印章是一种重要的身份凭证，在社会中一直被广泛使用。而对于使用印章得到的圆形印章图像而言，由于印章的使用者可能从各个角度进行盖章，所以导致圆形印章图像的倾斜，而倾斜后的圆形印章图像不能够被准确地识别，因此需要对倾斜的印章图像进行图像处理。

现有印章图像的图像处理方案通过人工计算印章图像的倾斜角后，对图像进行矫正处理，其效率低下。

发明内容

本发明的主要目的在于解决由现有印章图像的处理方案效率低下的问题。

本发明第一方面提供了一种印章图像的处理方法，包括：

基于预置的印章图像检测模型，对待检测的印章图像进行目标检测，得到包含圆形印章的第一目标图像，并对所述第一目标图像进行镜像备份，得到第二目标图像；

对所述第二目标图像进行预处理，得到所述第二目标图像对应的二值图；

调用预置的多点检测模型，对所述二值图进行文本区域的多点检测，得到坐标点集合，所述多点检测模型中包括特征提取网络、第一全连接网络和第二全连接网络，所述坐标点集合用于表示所述文本区域的位置信息；

根据所述坐标点集合，对所述二值图进行边界拟合，得到目标二值图；

对所述目标二值图进行轮廓检测，得到目标轮廓图像，并计算所述目标轮廓图像的倾斜角度，以及根据所述倾斜角度，旋转所述第一目标图像，得到准确的印章图像。

可选的，在本发明第一方面的第一种实现方式中，所述对所述第二目标图像进行预处理，得到目标二值图包括：

对所述第二目标图像进行灰度化处理，得到目标灰度图像；

对所述目标灰度图像进行二值化处理，得到所述第二目标图像对应的二值图。

可选的，在本发明第一方面的第二种实现方式中，所述调用预置的多点检测模型，对所述二值图进行文本区域的多点检测，得到坐标点集合包括：

基于预设的选择性查找算法，获取所述二值图对应的多个候选区域图，其中，所述候选区域图用于表示所述二值图中的候选区域；

调用所述特征提取网络，提取所述候选区域图对应的特征向量，其中，所述特征提取网络中包括卷积层和池化层；

调用所述第一全连接网络中的多分类器，对所述特征向量进行平均，并对平均后的特征向量均一化处理，得到一个多分类概率分布，其中，所述多分类概率分布用于表示每个候选区域图中包含文本的概率值；

调用所述第二全连接网络，对目标候选区域图进行回归处理，得到所述坐标点集合，其中，所述目标候选区域图中包含文本的概率值大于预设阈值。

可选的，在本发明第一方面的第三种实现方式中，所述调用所述特征提取网络，提取所述候选区域图对应的特征向量包括：

调用所述卷积层，对所述候选区域图进行卷积，得到所述候选区域图对应的特征矩阵；

调用所述池化层，对所述候选区域图对应的特征矩阵进行池化，得到所述候选区域图对应的特征向量。

可选的，在本发明第一方面的第四种实现方式中，所述调用所述第二全连接网络，对目标候选区域图进行回归处理，得到所述坐标点集合包括：

调用所述第二全连接网络中的直接回归子网络，构建所述目标候选区域图的初始包围框；

调用所述第二全连接网络中的迭代修正子网络，对所述初始包围框的大小进行迭代修正，得到覆盖完整文本行区域的目标包围框，并基于所述目标包围框，对所述目标候选区域图进行图像提取，得到文本行特征图；

调用所述第二全连接网络中的形状表征子网络，对所述文本行特征图进行上采样，得到目标中心线的掩模和所述目标中心线的偏移特征图，其中，所述目标中心线为目标文本行的中心线，所述偏移特征图用于表示所述目标中心线与目标边界之间的偏移信息，所述目标文本行为所述文本行特征图中的文字所在区域，所述目标边界为所述目标文本行的上下边界；

根据所述目标中心线的掩模和所述目标中心线的偏移特征图，确定所述目标文本行的边界点坐标，并根据所述边界点坐标，构建坐标点集合。

可选的，在本发明第一方面的第五种实现方式中，所述调用所述第二全连接网络中的迭代修正子网络，对所述初始包围框的大小进行迭代修正，得到覆盖完整文本行区域的目标包围框包括：

基于预设的卷积层和激活函数，对所述目标候选区域图进行处理，得到所述目标文本行对应的四个角点自注意力图；

基于所述四个角点自注意力图，确定所述目标文本行的角点坐标；

根据所述角点坐标，调整所述初始包围框的大小，得到覆盖完整文本行区域的目标包围框。

可选的，在本发明第一方面的第六种实现方式中，所述根据所述中心线掩模和所述偏移特征图，确定所述目标文本行的边界点坐标包括：

对所述目标中心线的掩模进行多点采样，得到多个目标中心点的坐标，其中，所述目标中心点之间的距离相等；

根据所述目标中心线的偏移特征图与所述目标中心点的坐标，确定所述目标文本行的边界点坐标，并基于所述边界点坐标，构建坐标点集合。

本发明第二方面提供了一种印章图像的处理装置，包括：

印章图像检测模块，用于基于预置的印章图像检测模型，对待检测的印章图像进行目标检测，得到包含圆形印章的第一目标图像，并对所述第一目标图像进行镜像备份，得到第二目标图像；

图像预处理模块，用于对所述第二目标图像进行预处理，得到所述第二目标图像对应的二值图；

多点检测模块，用于调用预置的多点检测模型，对所述二值图进行文本区域的多点检测，得到坐标点集合，所述多点检测模型中包括特征提取网络、第一全连接网络和第二全连接网络，所述坐标点集合用于表示所述文本区域的位置信息；

边界拟合模块，用于根据所述坐标点集合，对所述二值图进行边界拟合，得到目标二值图；

图像矫正模块，用于对所述目标二值图进行轮廓检测，得到目标轮廓图像，并计算所述目标轮廓图像的倾斜角度，以及根据所述倾斜角度，旋转所述第一目标图像。

可选的，在本发明第二方面的第一种实现方式中，所述图像预处理模块具体包括：

灰度处理单元，用于对所述第二目标图像进行灰度化处理，得到目标灰度图像；

二值化单元，用于对所述目标灰度图像进行二值化处理，得到所述第二目标图像对应的二值图。

可选的，在本发明第二方面的第二种实现方式中，所述多点检测模块具体包括：

获取单元，用于基于预设的选择性查找算法，获取所述二值图对应的多个候选区域图，其中，所述候选区域图用于表示所述二值图中的候选区域；

提取单元，用于调用所述特征提取网络，提取所述候选区域图对应的特征向量，其中，所述特征提取网络中包括卷积层和池化层；

分类单元，用于调用所述第一全连接网络中的多分类器，对所述特征向量进行平均，并对平均后的特征向量均一化处理，得到一个多分类概率分布，其中，所述多分类概率分布用于表示每个候选区域图中包含文本的概率值；

回归单元，用于调用所述第二全连接网络，对目标候选区域图进行回归处理，得到所述坐标点集合，其中，所述目标候选区域图中包含文本的概率值大于预设阈值。

可选的，在本发明第二方面的第三种实现方式中，所述提取单元具体用于：

可选的，在本发明第二方面的第四种实现方式中，所述回归单元具体用于：

可选的，在本发明第二方面的第五种实现方式中，所述回归单元具体用于：

可选的，在本发明第二方面的第六种实现方式中，所述回归单元具体用于：

对所述中心线掩模进行多点采样，得到多个目标中心点的坐标，其中，所述目标中心点之间的距离相等；

根据所述偏移特征图与所述目标中心点的坐标，确定所述目标文本行的边界点坐标，并基于所述边界点坐标，构建坐标点集合。

本发明第三方面提供了一种印章图像的处理设备，包括：存储器和至少一个处理器，所述存储器中存储有指令；所述至少一个处理器调用所述存储器中的所述指令，以使得所述印章图像的处理设备执行上述的印章图像的处理方法。

本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的印章图像的处理方法。

本发明提供的技术方案中，首先通过印章图像检测模型，识别出图像中的包含印章图像的第一目标图像，从而快速锁定目标，并对该第一目标图像进行镜像备份，得到第二目标图像；其次对第二目标图像进行预处理，得到目标二值图，并调用多点检测模型，对目标二值图进行文本区域的多点检测，得到坐标点集合，从而准确地识别出印章中包含的文本区域，用于进一步的图像处理；然后通过坐标点集合进行边界拟合，得到包含文本区域轮廓的目标二值图，最后对目标二值图，进行轮廓检测，得到目标轮廓图像，并计算目标轮廓图像的倾斜角度，并根据该倾斜角度，旋转所述第一目标图像，通过获取印章轮廓和文本框轮廓，从而直接计算对应的旋转角度，进而提高对印章图像矫正的效率。

附图说明

图1为本发明实施例中印章图像的处理方法的第一个实施例示意图；

图2为本发明实施例中印章图像的处理方法的第二个实施例示意图；

图3为本发明实施例中印章图像的处理方法的第三个实施例示意图；

图4为本发明实施例中印章图像的处理装置的一个实施例示意图；

图5为本发明实施例中印章图像的处理装置的另一个实施例示意图；

图6为本发明实施例中印章图像的处理设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种印章图像的处理方法、装置、设备及存储介质，处理效率更高。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解，下面对本发明实施例的具体流程进行描述，请参阅图1，本发明实施例中印章图像的处理方法的一个实施例包括：

101、基于预置的印章图像检测模型，对待检测的印章图像进行目标检测，得到包含圆形印章的第一目标图像，并对第一目标图像进行镜像备份，得到第二目标图像；

可以理解的是，日常生活中使用印章存在多种形状，服务器通过调用印章图像检测模型，以检测图像中包含的圆形印章，从而快速锁定目标区域。该印章图形检测模型基于图像识别模型，通过使用网络中的公开图像集(例如Open Images)和人工构建的印章图像集对该图像识别模型进行圆形印章的识别训练，并基于预设的损失函数计算对应的损失值，最后还根据损失值对模型的网络参数进行微调，从而让该模型快速且准确地提取圆形印章图像。该图像识别模型可以为VGG、ResNet、DenseNet等模型中的任意一种，在本实施例中并不做限定。

进一步的，服务器基于镜像技术，对该印章检测模型提取到的圆形印章图像(下面称为原图像)进行镜像备份，得到一张与原图像完全相同的备份图像，应该理解的是，该备份图像用于多次处理后以计算印章的倾斜角度，可以对其任意进行处理，而原图像只用于根据该倾斜角度来对自身进行旋转，以矫正倾斜的印章图像。

102、对第二目标图像进行预处理，得到第二目标图像对应的二值图；

可以理解的是，服务器对第二目标图像(备份图像)进行图像的预处理，例如图像增强、图像降噪、灰度化处理等方式，从而改变原印章图像的物理属性(如像素、尺寸、RGB值等)，进而减少后续对其进行图像处理时的计算量，以及提高处理时的准确率。

具体的，如一种可能的情况下，由于印章的使用者在盖章时用力过轻，导致印章图像中印章部分(印章文字及轮廓)区域的像素过少，当服务器对备份图像进行图像增强以后，选择性地突出了印章图像中像素过少的图像区域，在服务器后续对该备份图像进行文本区域检测以及印章的轮廓检测时，检测准确率明显提高。

103、调用预置的多点检测模型，对二值图进行文本区域的多点检测，得到坐标点集合，多点检测模型中包括特征提取网络、第一全连接网络和第二全连接网络，坐标点集合用于表示文本区域的位置信息；

可以理解的是，服务器通过调用多点检测模型，以识别出备份图像中的文本区域。该多点检测模型通过使用包含文本的图片样本对目标检测模型(例如Faster R-CNN)进行文本区域检测的训练获得，其输入为一张图片，输出为构成文本区域的坐标点对应的坐标信息。

具体的，服务器首先通过预设的选择性查找算法(selective search)，通过小尺寸区域的特征，合并小尺寸区域得到大尺寸区域，以实现候选区域的选取以获取目标二值图中多个候选区域图像。进一步的，服务器通过图像分割的方式初始化原始区域，即将图像分割成多个小块，并基于贪心策略，计算每两个相邻的小块之间的相似度，每次合并相似度最高的两块，以及将每次产生的图像块(包括合并的图像块)进行保存，直至最终只剩下一块完整的图片，最终得到目标二值图的分层表示。

其次，服务器调用该多点检测模型中特征提取网络，以提取候选区域图像对应的特征向量，具体的，服务器通过卷积网络对这些候选区域图进行卷积处理，生成候选区域图对应的特征矩阵(用于表示像素点分布)；为了进一步降低该特征矩阵中包含信息量以减少计算量，服务器通过池化网络对该特征矩阵进行降维处理，具体的，池化网络中包括dropout层和池化层，通过dropout层随机丢失该特征矩阵中的元素，得到新特征矩阵，并通过池化层中池化函数(如最大池化函数、平均池化函数等)对该新特征矩阵中的元素进行处理，从而生成对应的特征向量，在本实施例中对池化函数的类型并不做限定。可以理解的是，服务器通过池化函数对图像卷积后得到的特征映射结果(特征矩阵)进行处理，将局部区域特征映射为一个更小的区域特征，从而实现对特征矩阵的降维，进而提升模型处理图像的速度。

然后，服务器通过调用两个全连接网络分别对候选区域图对应的特征向量进行处理，其中，第一全连接网络中执行分类任务，从而预测哪些候选区域图中包含了文本行，第二全连接网络中执行回归任务，从而预测包含文本行在候选区域图中的具体位置。

具体的，服务器将这些不同尺寸大小的候选区域图对应的特征向量输入至第一全连接网络中，通过调用其中的多分类器(如softmax)，对该特征向量进行平均，并对平均后的特征向量均一化处理，得到一个多分类概率分布，即表示每个候选区域图中包含文本的概率值，若该概率分布中候选区域图的概率值大于预设阈值，则视为该候选区域图中包含文本行，例如存在A、B、C、D四个候选区域图，对应的多分类概率为[A：0.6，B：0.3，C：0.5，D：0.4]，若预设阈值为0.5，则确定A图中包含文本行。

最后，服务器将包含文本行的候选区域图(目标候选区域图)输入第二全连接网络中进行处理，具体的，第二全连接网络中还包括多个回归网络，即直接回归子网络(DirectRegressor，DR)、迭代修正子网络(Iterative Refinement Module，IRM)、形状表征子网络(Shape Expression Module，SEM)，服务器调用DR来构建一个粗略的预测框，进一步地，由于感受野的限制，直接回归子网络在检测长文字行时往往检测不全完整的文字行，为此，在本实施例中，服务器调用迭代修正子网络来迭代修正该预测框，从而使预测框能逐渐覆盖完整的文字行。值得一提的是，对于不规则文字行，预测框会包含较多背景区域。在预测框能够覆盖完整的文字行之后，服务器调用形状表征子网络，来回归预测框中文字行的几何特性，比如文字行区域、文字行的中心线和文字行的边界偏差(即中心线到上下边界的距离)来重构更加紧致的文字行表达形状，该文字行表达形状由多个边界点依次连接构成，服务器根据这些边界点坐标，生成对应坐标点集合。

104、根据坐标点集合，对二值图进行边界拟合，得到目标二值图；

可以理解的是，服务器根据该坐标点集合中所有坐标点，对二值图中的文本区域进行边界拟合(轮廓拟合)，从而让更多的点处于轮廓上，本实施例中对边界拟合的方式并不做限定，例如基于最小二乘法来进行文本区域的轮廓拟合。

105、对目标二值图进行轮廓检测，得到目标轮廓图像，并计算目标轮廓图像的倾斜角度，以及根据倾斜角度，旋转第一目标图像，得到准确的印章图像。

可以理解的是，服务器通过OpenCV(计算机视觉库)中的findContours函数来对目标二值图进行轮廓边缘的检测，从而得到印章的所有轮廓图像(外围轮廓与文本区域轮廓)。该findContours函数通过接收多个参数，从而进行轮廓检测，具体的，第一个参数为待检测图像的资源路径，该图像为单通道图像，可以是灰度图或二值图像；第二个参数为一个双重向量，用于表示待获取的轮廓信息；第三个参数为一个向量，用于表示轮廓的层级关系；第四个参数为轮廓的检索模式；第五个参数用于定义轮廓的近似方法；第六个参数用于表示所有的轮廓信息相对于原始图像对应点的偏移量，该参数可以为负值。

应当理解的是，服务器通过目标轮廓图像中印章轮廓与文本框轮廓之间的位置关系，从而计算对应的倾斜角度，在本实施例中，对目标轮廓图像的倾斜角度的计算方式并不做限定。例如通过射线扫描的方式来寻找目标起始边与目标终止边，通过射线产生装置向该目标轮廓图像发出穿过图像中心的射线，并以图像中心为固定点，开始360度的扫描，当检测到射线与目标轮廓图像中的印章轮廓以及文本框轮廓之间的交点个数为1时，即说明当前射线只与印章轮廓有焦点且扫过区域的弧度范围内，印章最上方的文本还未出现，当交点个数第一次大于1时，可得到目标起始边a，直到交点个数再次等于1时，可得到目标终止边b，根据目标起始边a和目标终止边b确定目标夹角A，倾斜角度(B)的计算公式为B＝A/2-90，最后服务器根据倾斜角度B旋转第一目标图像。

本实施例中，通过印章检测模型快速锁定目标，以及通过获取印章文字轮廓和印章轮廓，并基于两者的图像关系直接计算对应的倾斜角，从而提高对印章图像的处理(矫正)效率。

参阅图2，本发明实施例中印章图像的处理方法的第二个实施例包括：

201、基于预置的印章图像检测模型，对待检测的印章图像进行目标检测，得到包含圆形印章的第一目标图像，并对第一目标图像进行镜像备份，得到第二目标图像；

其中，步骤201与上述步骤101的执行步骤类似，具体此处不再赘述。

202、对第二目标图像进行灰度化处理，得到目标灰度图像；

可以理解的是，第二目标图像由像素点矩阵构成，而像素点矩阵中包括多个像素点，对于每一个像素点而言，其颜色由红、绿、蓝三原色组成，即对应三个变量R、G、B，组成像素点的RGB值，而灰度化处理即将第二目标图像中的每个像素点对应的R变量、G变量、B变量变换为相同数值大小(如分量、最大值和加权平均)，具体的，可以利用工程学函数直接对该第二目标图像进行处理，例如服务器通过调用OpenCV中的灰度化函数，从而实现图像的灰度化处理。

203、对目标灰度图像进行二值化处理，得到第二目标图像对应的二值图；

可以理解的是，二值化处理即是让图像的每个像素点的灰度值变为为0(黑色)或者255(白色)，从而只呈现黑白效果。类似地，服务器可以调用OpenCV中的二值化函数对该目标灰度图像进行处理，从而得到对应的目标二值图。

204、调用预置的多点检测模型，并基于预设的选择性查找算法，获取二值图对应的多个候选区域图，其中，候选区域图用于表示二值图中的候选区域，多点检测模型中包括特征提取网络、第一全连接网络和第二全连接网络；

可以理解的是，服务器通过图像分割的方式初始化目标二值图中的原始区域，即将图像分割成多个小块，并基于贪心策略，计算每两个相邻的小块之间的相似度，每次合并相似度最高的两块，以及将每次产生的图像块(包括合并的图像块)进行保存，直至最终只剩下一块完整的图片，最终得到目标二值图的分层表示。值得一提的是，对于相似度的计算，应综合考虑颜色、纹理、尺寸和空间交叠这四个图像属性。

205、调用特征提取网络，提取候选区域图对应的特征向量，其中，特征提取网络中包括卷积层和池化层；

可以理解的是，服务器调用该多点检测模型中特征提取网络，以提取候选区域图像对应的特征向量，具体的，服务器通过卷积网络对这些候选区域图进行卷积处理，生成候选区域图对应的特征矩阵(用于表示像素分布)；为了进一步降低该特征矩阵中包含信息量以减少计算量，服务器通过池化网络对该特征矩阵进行降维处理，具体的，池化网络中包括dropout层和池化层，通过dropout层随机丢失该特征矩阵中的元素，得到新特征矩阵，并通过池化层中池化函数(如最大池化函数、平均池化函数等)对该新特征矩阵中的元素进行处理，从而生成对应的特征向量，在本实施例中对池化函数的类型并不做限定。可以理解的是，服务器通过池化函数对图像卷积后得到的特征映射结果(特征矩阵)进行处理，将局部区域特征映射为一个更小的区域特征，从而实现对特征矩阵的降维，进而提升模型处理图像的速度。

206、调用第一全连接网络中的多分类器，对特征向量进行平均，并对平均后的特征向量均一化处理，得到一个多分类概率分布，其中，多分类概率分布用于表示每个候选区域图中包含文本的概率值；

可以理解的是，服务器将这些不同尺寸大小的候选区域图对应的特征向量输入至第一全连接网络中，通过调用其中的多分类器(如softmax)，对该特征向量进行平均，并对平均后的特征向量均一化处理，得到一个多分类概率分布，即表示每个候选区域图中包含文本的概率值，若该概率分布中候选区域图的概率值大于预设阈值，则视为该候选区域图中包含文本行，例如存在A、B、C、D四个候选区域图，对应的多分类概率为[A：0.6，B：0.3，C：0.5，D：0.4]，若预设阈值为0.5，则确定A图中包含文本行。

207、调用第二全连接网络，对目标候选区域图进行回归处理，得到坐标点集合，其中，目标候选区域图中包含文本的概率值大于预设阈值，坐标点集合用于表示文本区域的位置信息；

可以理解的是，第二全连接网络中还包括多个回归网络，即直接回归子网络(DirectRegressor，DR)、迭代修正子网络(Iterative Refinement Module，IRM)、形状表征子网络(Shape Expression Module，SEM)。

具体的，首先，服务器调用直接回归子网络来构建一个粗略的预测框，进一步地，由于感受野的限制，直接回归子网络在检测长文字行时往往检测不全完整的文字行，为此，在本实施例中，服务器调用迭代修正子网络来迭代修正该预测框，从而使预测框能逐渐覆盖完整的文字行，并基于该预测框进行图像的提取，得到对应的文本特征图。

其次，服务器调用形状表征子网络，通过该网络的上采样层对文本特征图进行上采样，得到一个掩模图像和偏移特征图，该掩模图像用于表示文本特征图中的文本行的中心线，偏移特征图用于表示该中心线与文本行的上下边界之间的偏差距离，从而得到该文本特征图中文字行的几何特性，进而重构更加紧致的文字行表达形状，该文字行表达形状即由多个边界点依次连接构成，服务器根据这些边界点坐标，生成对应坐标点集合。

进一步的，服务器对文本行的中心线对应的掩模进行多点采样，得到多个等间距的目标中心点及其坐标，然后根据偏移特征图与目标中心点的坐标，确定目标文本行的边界点坐标，并基于该边界点坐标，构建坐标点集合。

208、根据坐标点集合，对二值图进行边界拟合，得到目标二值图；

209、对目标二值图进行轮廓检测，得到目标轮廓图像，并计算目标轮廓图像的倾斜角度，以及根据倾斜角度，旋转第一目标图像，得到准确的印章图像。

其中，步骤208-209与上述步骤104-105的执行步骤类似，具体此处不再赘述。

本实施例中，详细描述了多点预测的过程，通过对图像进行多点预测，从而适应印章图像中文本区域的弯曲程度，从而获取文本区域对应的坐标点集合。

参阅图3，本发明实施例中印章图像的处理方法的第三个实施例包括：

301、基于预置的印章图像检测模型，对待检测的印章图像进行目标检测，得到包含圆形印章的第一目标图像，并对第一目标图像进行镜像备份，得到第二目标图像；

302、对第二目标图像进行预处理，得到第二目标图像对应的二值图；

其中，步骤301-302与上述步骤101-102的执行步骤类似，具体此处不再赘述。

303、调用预置的多点检测模型，并基于预设的选择性查找算法，获取二值图对应的多个候选区域图，其中，候选区域图用于表示二值图中的候选区域，多点检测模型中包括特征提取网络、第一全连接网络和第二全连接网络；

304、调用特征提取网络，提取候选区域图对应的特征向量，其中，特征提取网络中包括卷积层和池化层；

305、调用第一全连接网络中的多分类器，对特征向量进行平均，并对平均后的特征向量均一化处理，得到一个多分类概率分布，其中，多分类概率分布用于表示每个候选区域图中包含文本的概率值；

其中，步骤303-305与上述步骤204-206的执行步骤类似，具体此处不再赘述。

306、调用第二全连接网络中的直接回归子网络，构建目标候选区域图的初始包围框；

可以理解的是，服务器调用直接回归子网络来构建一个粗略的预测框。

307、调用第二全连接网络中的迭代修正子网络，对初始包围框的大小进行迭代修正，得到覆盖完整文本行区域的目标包围框，并基于目标包围框，对目标候选区域图进行图像提取，得到文本行特征图；

可以理解的是，由于感受野的限制，迭代修正子网络在检测长文字行时往往检测不全完整的文字行，为此，在本实施例中，服务器调用迭代修正子网络来迭代修正该预测框，从而使预测框能逐渐覆盖完整的文字行，并基于该预测框进行图像的提取，得到对应的文本特征图。

进一步的，在相同感受野的情况下，文本行的四个角点可以为文本行的边界提供更加精确的信息。服务器基于预设的卷积层和激活函数(如Sigmoid)，对目标候选区域图进行处理，生成文本行对应的4个角点自注意力图，并根据角点信息来调整包围框的大小，其中，角点注意力图的数值表示该位置对应角点坐标偏差回归的贡献权重，服务器可以根据每次迭代的收益来决定是否继续迭代，直到能够包围框覆盖完整文字行。

308、调用第二全连接网络中的形状表征子网络，对文本行特征图进行上采样，得到目标中心线的掩模和目标中心线的偏移特征图集合，其中，目标中心线为目标文本行的中心线，偏移特征图集合用于表示目标中心线与目标边界之间的偏移信息，目标文本行为文本行特征图中的文字所在区域，目标边界为目标文本行的上下边界；

可以理解的是，服务器调用形状表征子网络，以回归预测框中文字行的几何特性，比如文字行区域、文字行的中心线和文字行的边界偏差(即中心线到上下边界的距离)来重构更加紧致的文字行表达形状，该文字行表达形状即由多个边界点依次连接构成，服务器根据这些边界点坐标，生成对应坐标点集合。具体的，服务器基于形状表征子网络中的两个上采样层，对文本特征图进行两次上采样(upsampling)，第一次上采样后得到的是文本行区域(Text Region)的掩模，对该文本行区域的掩模进行第二次上采样，得到文本行的中心线(Text Center Line)对应的掩模和文本行的中心线对应的偏移特征图(Borderoffsets)，其中，文本行区域中的文字区域用1表示，背景区域用0表示；偏移特征图为一个4通道图像。

309、根据中心线掩模和偏移特征图集合，确定目标文本行的边界点坐标，并根据边界点坐标，构建坐标点集合，其中，坐标点集合用于表示文本区域的位置信息；

可以理解的是，服务器对文本行的中心线对应的掩模进行多点采样，得到多个等间距的目标中心点及其坐标，然后根据偏移特征图与目标中心点的坐标，确定目标文本行的边界点坐标，并基于该边界点坐标，构建坐标点集合。

具体的，服务器根据文本行的中心线长度，在中线线上找到多个等间距的中心点，并对这些中心点进行采样，对于曲线型的中心线，将其分为7个中心点，对于直线型的中心线，将其分为2个中心点；进一步的，该偏移特征图包含中心线到文本行区域上下边界的偏差信息，也可以理解为中心点到文本行区域上下边界的偏差信息，服务器根据该偏移特征图，从而确定文本行中文字内容最紧密的边界点坐标，并根据这些边界点坐标，构建坐标点集合。

310、根据坐标点集合，对二值图进行边界拟合，得到目标二值图；

311、对目标二值图进行轮廓检测，得到目标轮廓图像，并计算目标轮廓图像的倾斜角度，以及根据倾斜角度，旋转第一目标图像，得到准确的印章图像。

其中，步骤310-311与上述步骤104-105的执行步骤类似，具体此处不再赘述。

本实施例中，详细描述了对目标候选区域图进行回归处理过程，通过调用迭代修正子网络来修正包围框的大小，从而让包围框覆盖到完整文本区域，让多点预测更加准确，通过形状表征子网络来对文本区域进行更加紧密的覆盖，重构文本区域的形状表达，从而适应部分印章文本的弯曲程度。

上面对本发明实施例中印章图像的处理方法进行了描述，下面对本发明实施例中印章图像的处理装置进行描述，请参阅图4，本发明实施例中印章图像的处理装置的一个实施例包括：

印章图像检测模块401，用于基于预置的印章图像检测模型，对待检测的印章图像进行目标检测，得到包含圆形印章的第一目标图像，并对所述第一目标图像进行镜像备份，得到第二目标图像；

图像预处理模块402，用于对所述第二目标图像进行预处理，得到所述第二目标图像对应的二值图；

多点检测模块403，用于调用预置的多点检测模型，对所述二值图进行文本区域的多点检测，得到坐标点集合，所述多点检测模型中包括特征提取网络、第一全连接网络和第二全连接网络，所述坐标点集合用于表示所述文本区域的位置信息；

边界拟合模块404，用于根据所述坐标点集合，对所述二值图进行边界拟合，得到目标二值图；

图像矫正模块405，用于对所述目标二值图进行轮廓检测，得到目标轮廓图像，并计算所述目标轮廓图像的倾斜角度，以及根据所述倾斜角度，旋转所述第一目标图像。

参阅图5，本发明实施例中印章图像的处理装置的另一个实施例包括：

其中，所述图像预处理模块402包括：

灰度处理单元4021，用于对所述第二目标图像进行灰度化处理，得到目标灰度图像；

二值化单元4022，用于对所述目标灰度图像进行二值化处理，得到所述第二目标图像对应的二值图。

其中，所述多点检测模块403具体包括：

获取单元4031，用于基于预设的选择性查找算法，获取所述二值图对应的多个候选区域图，其中，所述候选区域图用于表示所述二值图中的候选区域；

提取单元4032，用于调用所述特征提取网络，提取所述候选区域图对应的特征向量，其中，所述特征提取网络中包括卷积层和池化层；

分类单元4033，用于调用所述第一全连接网络中的多分类器，对所述特征向量进行平均，并对平均后的特征向量均一化处理，得到一个多分类概率分布，其中，所述多分类概率分布用于表示每个候选区域图中包含文本的概率值；

回归单元4034，用于调用所述第二全连接网络，对目标候选区域图进行回归处理，得到所述坐标点集合，其中，所述目标候选区域图中包含文本的概率值大于预设阈值。

本发明实施例中，模块化的设计让印章图像的处理装置各部位的硬件专注于某一功能的实现，最大化实现了硬件的性能，同时模块化的设计也降低了装置的模块之间的耦合性，更加方便维护。

上面图4和图5从模块化功能实体的角度对本发明实施例中的印章图像的处理装置进行详细描述，下面从硬件处理的角度对本发明实施例中印章图像的处理设备进行详细描述。

图6是本发明实施例提供的一种印章图像的处理设备的结构示意图，该印章图像的处理设备600可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processing units，CPU)610(例如，一个或一个以上处理器)和存储器620，一个或一个以上存储应用程序633或数据632的存储介质630(例如一个或一个以上海量存储设备)。其中，存储器620和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对印章图像的处理设备600中的一系列指令操作。更进一步地，处理器610可以设置为与存储介质630通信，在印章图像的处理设备600上执行存储介质630中的一系列指令操作。

印章图像的处理设备600还可以包括一个或一个以上电源640，一个或一个以上有线或无线网络接口650，一个或一个以上输入输出接口660，和/或，一个或一个以上操作系统631，例如Windows Serve，Mac OS X，Unix，Linux，FreeBSD等等。本领域技术人员可以理解，图6示出的印章图像的处理设备结构并不构成对印章图像的处理设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本发明还提供一种印章图像的处理设备，所述印章图像的处理设备包括存储器和处理器，存储器中存储有计算机可读指令，计算机可读指令被处理器执行时，使得处理器执行上述各实施例中的所述印章图像的处理方法的步骤。

本发明还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，该计算机可读存储介质也可以为易失性计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在计算机上运行时，使得计算机执行所述印章图像的处理方法的步骤。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种印章图像的处理方法，其特征在于，所述印章图像的处理方法包括：

2.根据权利要求1所述的印章图像的处理方法，其特征在于，所述对所述第二目标图像进行预处理，得到目标二值图包括：

对所述第二目标图像进行灰度化处理，得到目标灰度图像；

3.根据权利要求1所述的印章图像的处理方法，其特征在于，所述调用预置的多点检测模型，对所述二值图进行文本区域的多点检测，得到坐标点集合包括：

4.根据权利要求3所述的印章图像的处理方法，其特征在于，所述调用所述特征提取网络，提取所述候选区域图对应的特征向量包括：

5.根据权利要求3所述的印章图像的处理方法，其特征在于，所述调用所述第二全连接网络，对目标候选区域图进行回归处理，得到所述坐标点集合包括：

6.根据权利要求5所述的印章图像的处理方法，其特征在于，所述调用所述第二全连接网络中的迭代修正子网络，对所述初始包围框的大小进行迭代修正，得到覆盖完整文本行区域的目标包围框包括：

7.根据权利要求1-6中任意一项所述的印章图像的处理方法，其特征在于，所述根据所述目标中心线的掩模和所述目标中心线的偏移特征图，确定所述目标文本行的边界点坐标包括：

8.一种印章图像的处理装置，其特征在于，所述印章图像的处理装置包括：

9.一种印章图像的处理设备，其特征在于，所述印章图像的处理设备包括：存储器和至少一个处理器，所述存储器中存储有指令；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述印章图像的处理设备执行如权利要求1-7中任意一项所述的印章图像的处理方法。

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，其特征在于，所述指令被处理器执行时实现如权利要求1-7中任一项所述的印章图像的处理方法。