CN115063802A - 一种基于PSENet的圆形印章识别方法、设备及介质 - Google Patents
一种基于PSENet的圆形印章识别方法、设备及介质 Download PDFInfo
- Publication number
- CN115063802A CN115063802A CN202210513550.8A CN202210513550A CN115063802A CN 115063802 A CN115063802 A CN 115063802A CN 202210513550 A CN202210513550 A CN 202210513550A CN 115063802 A CN115063802 A CN 115063802A
- Authority
- CN
- China
- Prior art keywords
- character
- seal
- stamp
- psenet
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1473—Recognising objects as potential recognition candidates based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/15—Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18105—Extraction of features or characteristics of the image related to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Character Input (AREA)
Abstract
本发明提出一种基于PSENet的圆形印章识别方法、设备及介质。属于人工智能技术领域。实现步骤为:首先通过HSV色彩空间提取图像中的红色印章;然后通过计算连通域定位印章区域,去处印章边框;再通过PSENet定位印章中的文字位置;之后对文字进行旋转矫正;再对矫正后的文字进行OCR识别;最后进行文字排版分析。HSV色彩空间中,通道间的独立性更强,能更好反映印章的颜色特征,因此能够有效提取文档图像中的圆形印章;对印章内文字采用先校正方向再OCR识别的方案,能够有效提高印章文字的识别的准确率。
Description
技术领域
本发明属于人工智能技术领域,具体涉及一种基于PSENet的圆形印章识别方法、设备及介质。
背景技术
印章是最高法律效力的认证,是被用于官方公告、合同协议、证照文件等文档上的重要认证工具,包含发证机关等重要信息。印章识别是文档图像识别中的一个重要环节,准确提取并识别印章,对文档图像识别分析有着重要意义。而印章一般作为文档产生的最后一个环节,加印在文档空白区域或覆盖在文字区域之上,往往后者的情况更常见。因此,一方面,如何从文档图像,尤其是印章和文字重叠的图像中准确分离印章,是文档图像处理中的难点所在。另一方面,印章大多为圆形,其中的文字为环形排版,这也给印章文字识别带来了一定的难度。
常见的印章提取方式是基于图像色彩特征的方法,即利用印章的色彩特征。一种实现方式是,通过分析图像RGB色彩空间中红色通道与蓝、绿两通道间的差值,以提取构成印章的红色像素,但此方式比较依赖于差值阈值的选取。印章文字识别方面,常见的方式是对提取的印章进行特征点检测,与已有的印章模版进行匹配,或者将印章内的文字变换到极坐标空间后进行OCR识别。不足在于,特征匹配的方式适用范围较小,仅能识别已有模版的印章,而变换到极坐标的方式使文字产生畸变,不利于文字OCR识别。
发明内容
为解决上述问题,本发明提出一种基于PSENet的圆形印章识别方法、装置及系统。首先通过HSV色彩空间提取图像中的红色印章;然后通过计算连通域定位印章区域,去处印章边框;再通过PSENet定位印章中的文字位置;之后对文字进行旋转矫正;再对矫正后的文字进行OCR识别;最后进行文字排版分析。
本方法具体步骤为:
步骤一,印章提取:通过HSV色彩空间特征提取文档图像中的红色印章像素。
步骤二,印章定位,去除边框:通过计算红色像素区域的连通域范围定位印章区域,并去除印章边框。
步骤三,文字位置定位:对于提取的印章图像,通过PSENet网络定位印章区域文字的边界框信息。
步骤四,文字旋转矫正:根据步骤三的检测的文字边框信息,计算每个文字块的旋转角度,进行反向旋转,矫正文字的方向。
步骤五,OCR识别:对步骤四矫正的文字块结果进行OCR识别,识别出文字内容。
步骤六,文字排版分析:按照步骤三中得到的位置信息对文字块进行排版分析,分为两类:环形排版的发证机关内容,横向排版的印章名称内容,再组合步骤五的文字块识别结果。
进一步,步骤一具体为:将原始RGB色彩空间的图像转换为使用HSV色彩空间的表示,分析HSV分量的范围提取红色像素区域;其中,H通道的范围是0~10或156~180,S通道的范围是43~255,V通道的范围是46~255。
进一步,步骤二具体为:连通域是图像中相互连通的像素点所构成的最大区域,提取的红色区域中,边界范围最大的连通域即为印章边框所在区域,从而定位到印章区域,并得到印章的中心,在图像上的坐标信息表示为(x,y),将边框去除,仅保留印章内的文字。
进一步,步骤三具体为:通过PSENet定位的印章内文字块边界框信息表示为(x1,y1,x2,y2,x3,y3,x4,y4),其中(x1,y1)、(x2,y2)、(x3,y3)和(x4,y4)分别为文字块边界框左上角点、右上角点、右下角点和左下角点的坐标表示;计算文字块的中心位置坐标,表示为(x5,y5),其中:
进一步,所述文字块的旋转角度的计算方法为:
(1)每个文字块旋转角度的计算公式为:
其中,y1表示文字块边界框左上角点纵坐标;y4表示文字块边界框左下角点纵坐标;x1表示文字块边界框左上角点横坐标;x4表示文字块边界框左下角点横坐标;angle表示文字块旋转角度;
(2)此外,还需结合文字块中心位置坐标(x5,y5)和印章中心坐标(x,y)对计算得到的旋转角度进行二次判断:
进一步,步骤六具体为:结合步骤二中得到的印章中心的位置信息(x,y),以及步骤三中得到的所有文字块中心的位置信息(x5,y5),计算所有文字块中心与印章中心在x方向上的距离,即|x5-x|;对于距离小于设定阈值的文字块,如果文字块的y5>y,则为印章名称,如果文字块的y5<y,则是发证机关内容中心位置的文字块,其中阈值设定为所有文字块边界框中的最小宽度;对于距离大于设定阈值的文字块,即为发证机关内容的其他文字块;结合已确定的中心位置的文字块的中心坐标(x5,y5),按照x5从小到大的顺序将所有属于发证机关内容的文字块进行排序,从而确定发证机关内容文字顺序,根据此顺序对文字识别结果进行组合,得到最终的识别结果。
本发明提供一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于:所述处理器执行所述计算机程序时可实现基于PSENet的圆形印章识别方法中任一项所述方法的步骤。
本发明提供一种计算机可读存储介质,用于存储计算机指令,其特征在于:所述计算机指令被处理器执行时可实现基于PSENet的圆形印章识别方法任一项所述方法的步骤。
本发明的有益效果为:本发明提出一种基于PSENet的圆形印章识别方法,首先通过HSV色彩空间的处理提取印章,再通过PSENet对印章文字进行定位,对每个文字块进行矫正后再通过OCR模型识别。HSV色彩空间中,通道间的独立性更强,能更好反映印章的颜色特征,因此能够有效提取文档图像中的圆形印章;对印章内文字采用先校正方向再OCR识别的方案,能够有效提高印章文字识别的准确率。
附图说明
图1为方案流程;
图2为PSENet文字定位过程;
图3为检测结果中的连通域;
图4为文字块矫正结果。
具体实施方式
下面将结合实施例及附图对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明的方案流程图,本发明的流程包括:
步骤S1,印章提取:通过HSV色彩空间特征提取文档图像中的红色印章像素。
步骤S2,印章定位,去除边框:通过计算红色像素区域的连通域范围定位印章区域,并去除印章边框。
步骤S3,文字位置定位:对于提取的印章图像,通过PSENet网络定位印章区域文字的边界框信息。
步骤S4,文字旋转矫正:根据步骤S3的检测的文字边框信息,计算每个文字块的旋转角度,进行反向旋转,矫正文字的方向。
步骤S5,OCR识别:对步骤S4矫正的文字块结果进行OCR识别。
步骤S6,文字排版分析:按照步骤S3中得到的位置信息对文字块进行排版分析,分为两类:环形排版的发证机关内容,横向排版的印章名称内容,再组合步骤S5的文字块识别结果。
所述步骤S1中,HSV色彩空间特征:将原始RGB色彩空间的图像转换为使用HSV色彩空间的表示,分析HSV分量的范围提取红色区域。具体的,H通道的范围是0~10、156~180,S通道的范围是43~255,V通道的范围是46~255。
所述步骤S2中,连通域是图像中相互连通的像素点所构成的最大区域,提取的红色区域中,边界范围最大的连通域即为印章边框所在区域,从而定位到印章区域,并得到印章的中心,在图像上的坐标信息表示为(x,y)。为了提高后续识别的准确性,将边框去除,仅保留印章内的文字。
所述步骤S3中,PSENet能够实现对弯曲文本的定位,因此适用于印章内的环形文字检测与定位。基于PSENet的文字定位过程如附图2所示,主要由两部分组成,左侧是用于图像特征提取的特征金字塔网络部分,右侧是特征融合部分,实现分割结果的渐进式的扩展算法。
其中,特征金字塔网络产生四个不同尺度的特征图(特征图1~4),每个特征图的维度均为256。模块C的处理为:对四组特征图分别尺度上采样(特征图2进行2倍上采样,特征图3进行4倍上采样,特征图4进行8倍上采样)统一调整为特征图1的尺寸后进行拼接,拼接后的维度是1024维。
模块F的处理为:首先通过一个卷积层将特征图的维度降为256,再通过一系列的卷积、上采样、Sigmoid计算得到n个分割结果。之后从分割结果1开始通过渐进式扩展算法逐层向上进行融合。
具体的,渐进式扩展算法是:从分割结果1开始,通过分割结果查找图像中的连通域,分配不同的标签,如附图3所示;再结合下一个分割结果,进行宽度优先搜索。如当前像素位置为(x0,y0),标签为1,对于其邻域的像素,如果无标签且在分割结果中被认为是文本类别,则添加标签1。
所述步骤S4中,通过PSENet定位的印章内文字块边界框信息表示为(x1,y1,x2,y2,x3,y3,x4,y4),其中(x1,y1)、(x2,y2)、(x3,y3)、(x4,y4)分别为文字块边界框左上角点、右上角点、右下角点、左下角点的坐标表示。
计算文字块的中心位置坐标,表示为(x5,y5),其中
每个文字块倾斜角度的计算为:
其中,y1表示文字块边界框左上角点纵坐标;y4表示文字块边界框左下角点纵坐标;x1表示文字块边界框左上角点横坐标;x4表示文字块边界框左下角点横坐标;angle表示文字块旋转角度。
此外,还需结合文字块中心位置坐标(x5,y5)和印章中心坐标(x,y)对计算得到的倾斜角度进行二次判断:
其中angle表示文字块倾斜角度。
最后根据每个文字块的倾斜角度进行反向倾斜矫正,文字块的矫正结果如图4所示。
所述步骤S6中,文字块的排版分析:
结合步骤S2中得到的印章中心的位置信息(x,y),以及步骤S4中得到的所有文字块中心的位置信息(x5,y5),计算所有文字块中心与印章中心在x方向上的距离,即|x5-x|。
对于距离小于设定阈值的文字块,如果文字块的y5>y,则为印章名称,如果文字块的y5<y,则是发证机关内容中心位置的文字块。其中阈值设定为所有文字块边界框中的最小宽度。
对于距离大于设定阈值的文字块,即为发证机关内容的其他文字块,结合已确定的中心位置的文字块的中心坐标(x5,y5),按照x5从小到大的顺序将所有属于发证机关内容的文字块进行排序,从而确定发证机关内容文字顺序,根据此顺序对文字识别结果进行组合,得到最终的识别结果。
Claims (8)
1.一种基于PSENet的圆形印章识别方法,其特征在于:所述识别方法的步骤包括:
步骤一,印章提取:通过HSV色彩空间特征提取文档图像中的红色印章像素;
步骤二,印章定位,去除边框:通过计算红色像素区域的连通域范围定位印章区域,并去除印章边框;
步骤三,文字位置定位:对于提取的印章图像,通过PSENet网络定位印章区域文字的边界框信息;
步骤四,文字旋转矫正:根据步骤三的检测的文字边框信息,计算每个文字块的旋转角度,进行反向旋转,矫正文字的方向;
步骤五,OCR识别:对步骤四矫正的文字块结果进行OCR识别,识别出文字内容;
步骤六,文字排版分析:按照步骤三中得到的位置信息对文字块进行排版分析,分为两类:环形排版的发证机关内容,横向排版的印章名称内容,再组合步骤五的文字块识别结果。
2.根据权利要求1所述的基于PSENet的圆形印章识别方法,其特征在于:所述步骤一具体为:将原始RGB色彩空间的图像转换为使用HSV色彩空间的表示,分析HSV分量的范围提取红色像素区域;其中,H通道的范围是0~10或156~180,S通道的范围是43~255,V通道的范围是46~255。
3.根据权利要求1所述的基于PSENet的圆形印章识别方法,其特征在于:所述步骤二具体为:连通域是图像中相互连通的像素点所构成的最大区域,提取的红色区域中,边界范围最大的连通域即为印章边框所在区域,从而定位到印章区域,并得到印章的中心,在图像上的坐标信息表示为(x,y),将边框去除,仅保留印章内的文字。
6.根据权利要求1所述的基于PSENet的圆形印章识别方法,其特征在于:步骤六具体为:结合步骤二中得到的印章中心的位置信息(x,y),以及步骤三中得到的所有文字块中心的位置信息(x5,y5),计算所有文字块中心与印章中心在x方向上的距离,即|x5-x|;对于距离小于设定阈值的文字块,如果文字块的y5>y,则为印章名称,如果文字块的y5<y,则是发证机关内容中心位置的文字块,其中阈值设定为所有文字块边界框中的最小宽度;对于距离大于设定阈值的文字块,即为发证机关内容的其他文字块;结合已确定的中心位置的文字块的中心坐标(x5,y5),按照x5从小到大的顺序将所有属于发证机关内容的文字块进行排序,从而确定发证机关内容文字顺序,根据此顺序对文字识别结果进行组合,得到最终的识别结果。
7.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1-6任一项所述方法的步骤。
8.一种计算机可读存储介质,用于存储计算机指令,其特征在于:所述计算机指令被处理器执行时实现权利要求1-6任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210513550.8A CN115063802A (zh) | 2022-05-12 | 2022-05-12 | 一种基于PSENet的圆形印章识别方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210513550.8A CN115063802A (zh) | 2022-05-12 | 2022-05-12 | 一种基于PSENet的圆形印章识别方法、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115063802A true CN115063802A (zh) | 2022-09-16 |
Family
ID=83197788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210513550.8A Pending CN115063802A (zh) | 2022-05-12 | 2022-05-12 | 一种基于PSENet的圆形印章识别方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115063802A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115661850A (zh) * | 2022-12-29 | 2023-01-31 | 武汉大学 | 一种融合多特征的印章识别方法 |
CN115690806A (zh) * | 2022-10-11 | 2023-02-03 | 杭州瑞成信息技术股份有限公司 | 一种基于图像数据处理的非结构化文档格式识别方法 |
CN117901559A (zh) * | 2024-03-18 | 2024-04-19 | 易签链(深圳)科技有限公司 | 一种基于数据采集分析的印文生成方法 |
CN117975492A (zh) * | 2024-03-29 | 2024-05-03 | 南昌航空大学 | 一种矩形印章文字识别方法 |
-
2022
- 2022-05-12 CN CN202210513550.8A patent/CN115063802A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115690806A (zh) * | 2022-10-11 | 2023-02-03 | 杭州瑞成信息技术股份有限公司 | 一种基于图像数据处理的非结构化文档格式识别方法 |
CN115661850A (zh) * | 2022-12-29 | 2023-01-31 | 武汉大学 | 一种融合多特征的印章识别方法 |
CN117901559A (zh) * | 2024-03-18 | 2024-04-19 | 易签链(深圳)科技有限公司 | 一种基于数据采集分析的印文生成方法 |
CN117901559B (zh) * | 2024-03-18 | 2024-05-17 | 易签链(深圳)科技有限公司 | 一种基于数据采集分析的印文生成方法 |
CN117975492A (zh) * | 2024-03-29 | 2024-05-03 | 南昌航空大学 | 一种矩形印章文字识别方法 |
CN117975492B (zh) * | 2024-03-29 | 2024-06-07 | 南昌航空大学 | 一种矩形印章文字识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110766014B (zh) | 票据信息定位方法、系统及计算机可读存储介质 | |
CN115063802A (zh) | 一种基于PSENet的圆形印章识别方法、设备及介质 | |
CN109740548B (zh) | 一种报销票据图像分割方法及系统 | |
CN111160352B (zh) | 一种基于图像分割的工件金属表面文字识别方法及系统 | |
CN104751142B (zh) | 一种基于笔划特征的自然场景文本检测方法 | |
CN110766008A (zh) | 一种面向任意方向和形状的文本检测方法 | |
CN110020692B (zh) | 一种基于印刷体模板的手写体分离与定位方法 | |
CN112364834A (zh) | 一种基于深度学习和图像处理的表格识别的还原方法 | |
CN112446259A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN110334709A (zh) | 基于端到端多任务深度学习的车牌检测方法 | |
CN111461133A (zh) | 快递面单品名识别方法、装置、设备及存储介质 | |
CN115618847B (zh) | 一种解析pdf文档的方法、装置和可读存储介质 | |
CN111160328A (zh) | 一种基于语义分割技术的交通标线自动提取的方法 | |
CN110135407B (zh) | 样本标注方法及计算机存储介质 | |
CN115995086A (zh) | 端子排图纸短连片图元的识别方法、设备及存储介质 | |
CN114693917A (zh) | 一种应用于招牌照识别的数据增强方法 | |
CN111274863A (zh) | 一种基于文本山峰概率密度的文本预测方法 | |
CN113361547A (zh) | 一种签章识别方法、装置、设备及可读存储介质 | |
CN111898402A (zh) | 一种智能排版系统 | |
CN110046618B (zh) | 基于机器学习和最大极值稳定区域的车牌识别方法 | |
CN116912857A (zh) | 手写体和印刷体文本分离方法及装置 | |
JP5010627B2 (ja) | 文字認識装置及び文字認識方法 | |
CN110619331A (zh) | 一种基于颜色距离的彩色影像字段定位方法 | |
CN110956174A (zh) | 一种器件编号的识别方法 | |
CN116030472A (zh) | 文字坐标确定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |