CN107944452B - 一种圆形印章文字识别方法 - Google Patents

一种圆形印章文字识别方法 Download PDF

Info

Publication number
CN107944452B
CN107944452B CN201711321686.4A CN201711321686A CN107944452B CN 107944452 B CN107944452 B CN 107944452B CN 201711321686 A CN201711321686 A CN 201711321686A CN 107944452 B CN107944452 B CN 107944452B
Authority
CN
China
Prior art keywords
image
circular seal
circular
value
seal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711321686.4A
Other languages
English (en)
Other versions
CN107944452A (zh
Inventor
陈锦昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wing letter Technology (Shenzhen) Co., Ltd. Boda
Original Assignee
Wing Letter Technology Shenzhen Co ltd Boda
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wing Letter Technology Shenzhen Co ltd Boda filed Critical Wing Letter Technology Shenzhen Co ltd Boda
Priority to CN201711321686.4A priority Critical patent/CN107944452B/zh
Publication of CN107944452A publication Critical patent/CN107944452A/zh
Application granted granted Critical
Publication of CN107944452B publication Critical patent/CN107944452B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

本发明提供一种圆形印章文字识别方法,包括如下步骤:获取待识别的圆形印章的RGB图像,自动定位所述圆形印章的位置;对所述圆形印章的RGB图像降采样,得到降采样之后的RGB图像;根据所述降采样之后的RGB图像,细定位所述圆形印章的圆心及半径;剔除所述圆形印章的辅助区域及数字区域;对所述圆形印章的文字进行分割;对所述圆形印章的文字进行识别。利用本申请提供的方法可以准确提取待识别圆形印章的提边缘信息,而且识别速度快,提取文字信息准确。

Description

一种圆形印章文字识别方法
技术领域
本发明属于图像处理、文字识别技术领域,尤其涉及一种圆形印章文字识别方法。
背景技术
印章是印和章的合称。它代表的是信物。在古代帝王所用的印章称为“玺”,官吏使用的称为“印”,而私人使用的印章则称为“私印”。现代社会里,各级国家机关、社会团体、企事业单位用的印章都称为“印”。涉外单位和“三资”企业也一样。所以从某种意义上来说,印章是权力的象征和职能的标志。随着社会的发展,印章使用越来越频繁,如何识别印章上的文字也变得越来越重要。
当前OCR(Optical Character Recognition,光学字符识别)技术已经相当成熟并应用在各个领域,OCR已经逐步进入了人们日常学习、生活、工作等各个应用领域。一般银行的客户存单一般都是进行图像存档,以前的存档方法是通过微拍的方式,非常耗时、耗力。现在通过OCR技术,就可以在通过扫描仪对存单进行扫描,通过OCR技术对存单的关键字段进行识别,然后进行索引、存入光盘,极大地方便了查找,极大地降低了人们的工作量。我们不难发现,只要涉及表格、文字方面的信息处理,OCR就会很好的发挥优势。这里存在的问题是,目前全国的业务系统OCR只能识别正规的印刷体,而没有一个专门能进行公司印章名称的方法,这样就需要用户手动输入印章上的公司名称,没有完全实现自动化,工作效率有待提高。
另外现有的OCR印章识别方法需要用户手动裁剪盖章位置,而且技术一般用Hough变换检测圆形印章,然而Hough变换的好坏是跟图像的质量息息相关的,如果图像质量差,那么提取的圆形印章边缘信息不准,会有误差;另外一个原因是引用Hough变换会使得OCR识别速度很慢,客户需要等一段时间才能出现识别结果,不能达到实时性;另外一个问题是提取到的Hough变换没有进行拟合补偿,这就会造成印章文字提取不准,从而导致最后的识别率差。所以现有技术中急需一种提取边缘信息准确、识别速度快的、提取文字信息准确的圆形印章文字识别方法。
发明内容
本发明为了解决现有技术中急需一种提取边缘信息准确、识别速度快的、提取文字信息准确的圆形印章文字识别方法的问题,提供一种圆形印章文字识别方法。
为了解决上述问题,本发明采用的技术方案如下所述:
一种圆形印章文字识别方法,包括如下步骤:S1:获取待识别的圆形印章的RGB图像,自动定位所述圆形印章的位置;S2:对所述圆形印章的RGB图像降采样,得到降采样之后的RGB图像;S3:根据所述降采样之后的RGB图像,细定位所述圆形印章的圆心及半径;S4:剔除所述圆形印章的辅助区域及数字区域;S5:对所述圆形印章的文字进行分割;S6:对所述圆形印章的文字进行识别。
优选地,所述步骤S1中包括如下步骤:S11:获取待识别的圆形印章的RGB图像,膨胀所述RGB图像,使得所述圆形印章的红色区域成为连通域;S12:将膨胀后的RGB图像转换到LAB空间,提取所述LAB空间的A值,所述A值的取值范围是[0,255],所述A值减掉一个经验值得到所述圆形印章去除背景的印迹灰度图像所述经验值是大于0的任意整数;S13:将所述印迹灰度图像二值化,将所述印迹灰度图像中像素点的灰度值大于等于所述经验值的设置为a,小于经验值的设置为b,其中a、b的取值范围均为0-255,且a不等于b,得到二值化图像;S14:用区域提取的方法提取所述二值化图像的连通域位置,选择最大面积的连通域做为最终的印章位置。
优选地,所述步骤S2中包括如下步骤:S21:获取所述圆形印章的RGB图像的高和宽;S22:根据预先设置的目标图像的高和宽的范围,将所述圆形印章的RGB图像降低到所述目标图像的高和宽的范围内,得到降采样之后的RGB图像。
优选地,所述步骤S3中包括如下步骤:S31:将所述降采样之后的RGB图像转换到LAB空间,提取所述LAB空间的A值,所述A值的取值范围是[0,255],所述A值减掉一个经验值,所述经验值是大于127的任意整数,得到所述圆形印章去除背景的印迹灰度图像;S32:将所述印迹灰度图像二值化,将印迹灰度图像中像素点的灰度值大于等于所述经验值的设置为a,小于经验值的设置为b,其中a、b的取值范围均为0-255,且a不等于b,得到二值化图像;S33:用区域提取的方法提取所述二值化图像的连通域;S34:通过细化算法,把所述连通域细化;S35:将细化后的连通域的像素点的位置放到一个数组中,然后作拟合圆处理,得到拟合后的拟合曲线;S36:根据所述拟合曲线与所述二值化图像的边框的重合的重合度,细定位圆形印章的圆心及半径。
优选地,所述步骤S4中包括如下步骤:S41:剔除所述圆形印章的边框区域:根据圆形印章的边框的拟合曲线和圆形印章的二值化图像的边框确定圆形印章的边框区域并剔除;S42:剔除所述圆形印章中的五角星区域:根据圆形印章公司名称字符所在的位置,去除五角星的区域;S43:剔除所述圆形印章中的数字区域:根据所述圆形印章的数字区域和文字区域的投影面积直方图,根据所述投影面积直方图的宽度梯度进行剔除;S44:剔除所述圆形印章中其他的噪点,包括:通过计算纸张的偏色度,辅助印章字体颜色跟背景颜色的RGB的R颜色通道的方差,自适应的调节阈值,去除纸张偏红造成的噪点。
优选地,所述步骤S5中包括如下步骤:S51:对所述圆形印章的文字进行分割:通过区域提取获取所述文字到所述圆形印章的边框所在的曲线投影,结合汉字字符的平均宽度、字符粘连在一起的平均宽度对所述圆形印章的文字进行分割,得到文字分割后的图像;S52:对所圆形印章的文字进行纠正:通过区域提取、区域合并、区域像素旋转处理所述文字分割后的图像,对旋转后的图像进行双线性插值,得到文字纠正后的图像。
优选地,所述步骤S6中印章文字识别采用两种深度学习方法,数字识别采用的是LeNet-5结构,具体的结构由7层网络组成,输入层、卷积层、下采样层、全连接层、全连接层和输出层组成;汉字识别采用的是VGG16结构。
本发明还提供一种圆形印章文字识别终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序所述处理器执行所述计算机程序时实现如上任一所述方法的步骤。
本发明又提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上任一所述方法的步骤。
本发明的有益效果为:提供一种圆形印章文字识别方法,利用本申请提供的方法可以准确提取待识别圆形印章的提边缘信息,而且识别速度快,提取文字信息准确。
附图说明
图1是本发明实施例1中圆形印章文字识别方法的示意图。
图2是本发明实施例1中定位所述圆形印章的位置方法的示意图。
图3是本发明实施例1中图像二值化实例图的示意图。
图4是本发明实施例1中印章边框提取示意图。
图5是本发明实施例1中得到降采样之后的RGB图像的方法示意图。
图6是本发明实施例1中细定位圆形印章的圆形及半径的方法示意图。
图7是本发明实施例1中拟合圆的拟合结果示意图。
图8是本发明实施例1中剔除圆形印章的辅助区域及数字区域的方法示意图。
图9是本发明实施例1中边框剔除结果示意图。
图10是本发明实施例1中印章剔除边框和中心辅助区域后的直方图投影示意图。
图11是本发明实施例1中剔除数字区域和中心辅助区域的示意图。
图12是本发明实施例1中对圆形印章的文字进行分割的方法示意图。
图13是本发明实施例1中印章图像分割纠正后的示意图。
具体实施方式
下面结合附图通过具体实施例对本发明进行详细的介绍,以使更好的理解本发明,但下述实施例并不限制本发明范围。另外,需要说明的是,下述实施例中所提供的图示仅以示意方式说明本发明的基本构思,附图中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的形状、数量及比例可为一种随意的改变,且其组件布局形态也可能更为复杂。
实施例1
如图1所示,一种圆形印章文字识别方法,包括如下步骤:
1.获取待识别的圆形印章的RGB图像,自动定位所述圆形印章的位置;
2.对所述圆形印章的RGB图像降采样,得到降采样之后的RGB图像;
3.根据所述降采样之后的RGB图像,细定位所述圆形印章的圆心及半径;
4.剔除所述圆形印章的辅助区域及数字区域;
5.对所述圆形印章的文字进行分割;
6.对所述圆形印章的文字进行识别。
上述步骤中的第1步是为为了定位圆形印章的位置,所述步骤1中包括如下步骤,如图2所示:
11.获取待识别的圆形印章的RGB图像,膨胀所述RGB图像,使得所述圆形印章的红色区域成为连通域;
膨胀RGB图像的目的是为了RGB图像的边框连接的更好,保证边框是连续的。
12.将膨胀后的RGB图像转换到LAB空间,提取所述LAB空间的A值,所述A值的取值范围是[0,255],所述A值减掉一个经验值得到所述圆形印章去除背景的印迹灰度图像所述经验值是大于0的任意整数;
经验值可以根据经验取值,目的是为了得到印章图像中去除背景的印迹灰色图像。
13.将所述印迹灰度图像二值化,将所述印迹灰度图像中像素点的灰度值大于等于所述经验值的设置为a,小于经验值的设置为b,其中a、b的取值范围均为0-255,且a不等于b,得到二值化图像;
当然,可以理解的是,a和b的差值越大,其图像区别越明显。比如,a的值可以取255,b的值可以取0。
如图3所示,是本发明一个实施例中中图像二值化实例图的示意图。
14.用区域提取的方法提取所述二值化图像的连通域位置,选择最大面积的连通域做为最终的印章位置。
如图4所示,是本发明一个实施例中印章边框提取示意图。
如图5所示,本发明的圆形印章文字识别方法的所述步骤2中包括如下步骤:
21.获取所述圆形印章的RGB图像的高和宽;
22.根据预先设置的目标图像的高和宽的范围,将所述圆形印章的RGB图像降低到所述目标图像的高和宽的范围内,得到降采样之后的RGB图像。
在本发明的一个实施例中,目标图像的高和宽都可以设置在300-500像素范围内。
如图6所示,本发明的圆形印章文字识别方法的所述步骤3中包括如下步骤:
31.将所述降采样之后的RGB图像转换到LAB空间,提取所述LAB空间的A值,所述A值的取值范围是[0,255],所述A值减掉一个经验值,所述经验值是大于127的任意整数,得到所述圆形印章去除背景的印迹灰度图像;
32.将所述印迹灰度图像二值化,将印迹灰度图像中像素点的灰度值大于等于所述经验值的设置为a,小于经验值的设置为b,其中a、b的取值范围均为0-255,且a不等于b,得到二值化图像;
33.用区域提取的方法提取所述二值化图像的连通域;
34.通过细化算法,把所述连通域细化;
可以理解的是,连通域细化到不断裂为最佳结果,因为连通域越细,其像素点越少,拟合圆处理的时候计算了就小,计算速度快。
35.将细化后的连通域的像素点的位置放到一个数组中,然后作拟合圆处理,得到拟合后的拟合曲线;
如图7所示,是本发明一个实施例中拟合圆的拟合结果示意图。可以理解的是,由于印章的边框存在防伪点,或者其它的一些干扰,造成印章边框断裂,故需要采用拟合的方法;由于获取印章RGB图像的角度问题,可能印章图像中不是一个真的圆,所以会变成椭圆。印章边框本身粗细不一致导致细化后的圆不是一个真正的圆形。
36.根据所述拟合曲线与所述二值化图像的边框的重合的重合度,细定位圆形印章的圆心及半径。
轮廓拟合已经粗定位印章的中心位置,可以再根据拟合后的曲线跟二值化图像的边框的重合的重合度,再进一步纠正圆的中心位置,如果重合度没有达到一定的要求,可以根据实际情况纠正。本发明的一种实施例中,可以看拟合曲线是否在二值化图像的边框的中间位置。
如图8所示,本发明的圆形印章文字识别方法的所述步骤4中包括如下步骤:
41.剔除所述圆形印章的边框区域:根据圆形印章的边框的拟合曲线和圆形印章的二值化图像的边框确定圆形印章的边框区域并剔除;
如图9所示,是本发明一个实施例中边框剔除结果示意图。
42.剔除所述圆形印章中的五角星区域:根据圆形印章公司名称字符所在的位置,去除五角星的区域;
42.剔除所述圆形印章中的数字区域:根据所述圆形印章的数字区域和文字区域的投影面积直方图,根据所述投影面积直方图的宽度梯度进行剔除;
可以理解的是,数字区域的剔除是根据曲线中心的投影来剔除的,一般来说,数字区域和印章公司名称的投影面积直方图都有很大的差异,根据该这些差异的梯度直方图的宽度进行剔除。
如图10所示,是印章剔除边框和中心辅助区域后的直方图投影示意图,可以很明显的看出,左边为公司名称,右边为数字区域。
43.剔除所述圆形印章中其他的噪点,包括:通过计算纸张的偏色度,辅助印章字体颜色跟背景颜色的RGB的R颜色通道的方差,自适应的调节阈值,去除纸张偏红造成的噪点。
图像印章噪点的滤除主要印章内部辅助区域的噪点,该噪点是由于印泥盖在纸上比较淡,造成二值化图像出现断裂;印章边框出现毛刺,毛刺去除算法一般是在细化之后,根据曲线的形状,然后分析单点曲线的节点个数来剔除毛刺;纸张偏红造成的噪点,印章颜色一般是红色的,但是很多时候由于镜头,还有拍照环境的影响,会造成纸张偏红,由于印章的印泥的颜色都是由特定的颜色组成,故本项采用颜色分割的方法,排除其他颜色的干扰,本发明中根据具体场景,一般选择LAB和HSV颜色空间进行颜色分割,另外再辅助纸张的偏色度、以及印章字体颜色跟背景颜色的RGB的R颜色通道的方差,一般要结合整张图像的偏色度以及印章图像跟背景图像的方差信息比较,自适应的调节阈值,从而达到最终的分割效果图。
如图11所示,是剔除数字区域和中心辅助区域的示意图。
如图12所示,本发明的圆形印章文字识别方法的所述步骤5中包括如下步骤:
51.对所述圆形印章的文字进行分割:通过区域提取获取所述文字到所述圆形印章的边框所在的曲线投影,结合汉字字符的平均宽度、字符粘连在一起的平均宽度对所述圆形印章的文字进行分割,得到文字分割后的图像;
52.对所圆形印章的文字进行纠正:通过区域提取、区域合并、区域像素旋转处理所述文字分割后的图像,对旋转后的图像进行双线性插值,得到文字纠正后的图像。
公司名称字符纠正的目的是为了算法后期识别方便,将印章公司的名称按顺序进行字符纠正,纠正的方法主要是区域提取、区域合并,区域像素旋转,最后对旋转后的图像进行双线性插值,解决空洞噪声。
如图13所示,本发明实施例1中印章图像分割纠正后的示意图。
所述步骤S6中印章文字识别采用两种深度学习方法,数字识别采用的是LeNet-5结构,具体的结构由7层网络组成,输入层、卷积层、下采样层、全连接层、全连接层和输出层组成;汉字识别采用的是VGG16结构。
采用本发明提供的方法,测量四千张圆形印章的图像,印章中文字单字的识别率达到了98%以上,整章的识别率超过了90%,可以准确提取待识别圆形印章的提边缘信息,而且识别速度快,提取文字信息准确。
实施例2
本发明一实施例提供的一种圆形印章文字识别终端设备。该实施例的终端设备包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,例如自动定位所述圆形印章的位置程序。所述处理器执行所述计算机程序时实现实施例1中各个圆形印章文字识别方法实施例中的步骤,例如图1所示的步骤:获取待识别的圆形印章的RGB图像,自动定位所述圆形印章的位置。或者,所述处理器执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如:对所述圆形印章的文字进行分割。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述一种圆形印章文字识别终端设备中的执行过程。例如,所述计算机程序可以被分割成:自动定位模块,降采样模块,细定位模块,剔除模块,文字分割模块,文字识别模块;各模块具体功能如下:
1.获取待识别的圆形印章的RGB图像,自动定位所述圆形印章的位置;
2.对所述圆形印章的RGB图像降采样,得到降采样之后的RGB图像;
3.根据所述降采样之后的RGB图像,细定位所述圆形印章的圆心及半径;
4.剔除所述圆形印章的辅助区域及数字区域;
5.对所述圆形印章的文字进行分割;
6.对所述圆形印章的文字进行识别。
所述一种圆形印章文字识别终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述一种圆形印章文字识别终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述上述示例仅仅是一种圆形印章文字识别终端设备的示例,并不构成对一种圆形印章文字识别终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述一种圆形印章文字识别终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述一种圆形印章文字识别终端设备的控制中心,利用各种接口和线路连接整个一种圆形印章文字识别终端设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述一种圆形印章文字识别终端设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
实施例3
所述一种圆形印章文字识别终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。

Claims (9)

1.一种圆形印章文字识别方法,其特征在于,包括如下步骤:
S1:获取待识别的圆形印章的RGB图像,基于所述待识别的圆形印章的RGB图像得到所述待识别的圆形印章的RGB图像中LAB图像,提取所述LAB图像的A通道的印迹灰色图像,将所述印迹灰色图像二值化自动定位所述圆形印章的位置;
S2:基于所述圆形印章的位置得到圆形印章的RGB图像,对所述圆形印章的RGB图像降采样,得到降采样之后的RGB图像;
S3:根据所述降采样之后的RGB图像转化到LAB空间得到去除背景的印迹灰色图像并进行二值化得到二值化图像,对所述二值化图像进行处理得到拟合曲线,根据所述拟合曲线与所述二值化图像细定位所述圆形印章的圆心及半径;
S4:剔除所述圆形印章的辅助区域及数字区域;
S5:对所述圆形印章的文字进行分割;
S6:对所述圆形印章的文字进行识别。
2.如权利要求1所述的圆形印章文字识别方法,其特征在于,所述步骤S1中包括如下步骤:
S11:获取待识别的圆形印章的RGB图像,膨胀所述RGB图像,使得所述圆形印章的红色区域成为连通域;
S12:将膨胀后的RGB图像转换到LAB空间,提取所述LAB空间的A值,所述A值的取值范围是[0,255],所述A值减掉一个经验值得到所述圆形印章去除背景的印迹灰度图像所述经验值是大于0的任意整数;
S13:将所述印迹灰度图像二值化,将所述印迹灰度图像中像素点的灰度值大于等于所述经验值的设置为a,小于经验值的设置为b,其中a、b的取值范围均为0-255,且a不等于b,得到二值化图像;
S14:用区域提取的方法提取所述二值化图像的连通域位置,选择最大面积的连通域做为最终的印章位置。
3.如权利要求1所述的圆形印章文字识别方法,其特征在于,所述步骤S2中包括如下步骤:
S21:获取所述圆形印章的RGB图像的高和宽;
S22:根据预先设置的目标图像的高和宽的范围,将所述圆形印章的RGB 图像降低到所述目标图像的高和宽的范围内,得到降采样之后的RGB图像。
4.如权利要求1所述的圆形印章文字识别方法,其特征在于,所述步骤S3中包括如下步骤:
S31:将所述降采样之后的RGB图像转换到LAB空间,提取所述LAB空间的A值,所述A值的取值范围是[0,255],所述A值减掉一个经验值,所述经验值是大于127的任意整数,得到所述圆形印章去除背景的印迹灰度图像;
S32:将所述印迹灰度图像二值化,将印迹灰度图像中像素点的灰度值大于等于所述经验值的设置为a,小于经验值的设置为b,其中a、b的取值范围均为0-255,且a不等于b,得到二值化图像;
S33:用区域提取的方法提取所述二值化图像的连通域;
S34:通过细化算法,把所述连通域细化;
S35:将细化后的连通域的像素点的位置放到一个数组中,然后作拟合圆处理,得到拟合后的拟合曲线;
S36:根据所述拟合曲线与所述二值化图像的边框的重合的重合度,细定位圆形印章的圆心及半径。
5.如权利要求1所述的圆形印章文字识别方法,其特征在于,所述步骤S4中包括如下步骤:
S41:剔除所述圆形印章的边框区域:根据圆形印章的边框的拟合曲线和圆形印章的二值化图像的边框确定圆形印章的边框区域并剔除;
S42:剔除所述圆形印章中的五角星区域:根据圆形印章公司名称字符所在的位置,去除五角星的区域;
S43:剔除所述圆形印章中的数字区域:根据所述圆形印章的数字区域和文字区域的投影面积直方图,根据所述投影面积直方图的宽度梯度进行剔除;
S44:剔除所述圆形印章中其他的噪点,包括:通过计算纸张的偏色度,辅助印章字体颜色跟背景颜色的RGB的R颜色通道的方差,自适应的调节阈值,去除纸张偏红造成的噪点。
6.如权利要求1所述的圆形印章文字识别方法,其特征在于,所述步骤S5中包括如下步骤:
S51:对所述圆形印章的文字进行分割:通过区域提取获取所述文字到所述圆形印章的边框所在的曲线投影,结合汉字字符的平均宽度、字符粘连在一起的平均宽度对所述圆形印章的文字进行分割,得到文字分割后的图像;
S52:对所圆形印章的文字进行纠正:通过区域提取、区域合并、区域像素旋转处理所述文字分割后的图像,对旋转后的图像进行双线性插值,得到文字纠正后的图像。
7.如权利要求1所述的圆形印章文字识别方法,其特征在于,所述步骤S6中印章文字识别采用两种深度学习方法,数字识别采用的是LeNet-5结构,具体的结构由7层网络组成,输入层、卷积层、下采样层、全连接层、全连接层和输出层组成;汉字识别采用的是VGG16结构。
8.一种圆形印章文字识别终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7任一所述方法的步骤。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一所述方法的步骤。
CN201711321686.4A 2017-12-12 2017-12-12 一种圆形印章文字识别方法 Active CN107944452B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711321686.4A CN107944452B (zh) 2017-12-12 2017-12-12 一种圆形印章文字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711321686.4A CN107944452B (zh) 2017-12-12 2017-12-12 一种圆形印章文字识别方法

Publications (2)

Publication Number Publication Date
CN107944452A CN107944452A (zh) 2018-04-20
CN107944452B true CN107944452B (zh) 2021-07-23

Family

ID=61942831

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711321686.4A Active CN107944452B (zh) 2017-12-12 2017-12-12 一种圆形印章文字识别方法

Country Status (1)

Country Link
CN (1) CN107944452B (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108717744B (zh) * 2018-04-27 2020-08-18 深圳怡化电脑股份有限公司 识别金融单据上的印章序号的方法、装置及终端设备
CN108710854A (zh) * 2018-05-22 2018-10-26 长治学院 一种电子元器件的识别方法和装置
CN109145723A (zh) * 2018-07-09 2019-01-04 长江大学 一种印章识别方法、系统、终端装置及存储介质
CN109636825B (zh) * 2018-11-01 2023-07-18 平安科技(深圳)有限公司 印章图形分割方法、装置及计算机可读存储介质
CN109460757A (zh) * 2018-11-16 2019-03-12 上海中信信息发展股份有限公司 印章位置识别方法及装置
CN109886974B (zh) * 2019-01-28 2021-06-11 北京易道博识科技有限公司 一种印章去除方法
CN110210503B (zh) * 2019-06-14 2021-01-01 厦门历思科技服务有限公司 一种印章识别方法和装置以及设备
CN110443250B (zh) * 2019-07-31 2022-06-10 天津车之家数据信息技术有限公司 一种合同印章的类别识别方法、装置和计算设备
CN110659647B (zh) * 2019-09-11 2022-03-22 杭州睿琪软件有限公司 印章图像识别方法及装置、智能发票识别设备和存储介质
CN110728198B (zh) * 2019-09-20 2021-02-19 北京三快在线科技有限公司 图像处理方法、装置、电子设备及可读存储介质
CN110895696A (zh) * 2019-11-05 2020-03-20 泰康保险集团股份有限公司 一种图像信息提取方法和装置
CN111191657B (zh) * 2019-11-19 2023-08-18 泰康保险集团股份有限公司 一种文字识别方法、装置及计算机可读存储介质
CN111046754B (zh) * 2019-11-26 2023-08-25 泰康保险集团股份有限公司 一种文字识别方法、装置及计算机可读存储介质
CN111178355B (zh) * 2019-12-27 2024-05-10 中化资本有限公司 印章识别方法、装置和存储介质
CN111767911A (zh) * 2020-06-22 2020-10-13 平安科技(深圳)有限公司 面向复杂环境的印章文字检测识别方法、装置及介质
CN111932647A (zh) * 2020-07-16 2020-11-13 江西金格科技股份有限公司 基于java的椭圆图章文字均等分配的算法
CN112016563B (zh) * 2020-10-17 2021-07-13 深圳神目信息技术有限公司 一种圆形印章的真伪识别方法
CN112766275B (zh) * 2021-04-08 2021-09-10 金蝶软件(中国)有限公司 印章文字识别方法、装置、计算机设备和存储介质
CN113361547A (zh) * 2021-06-30 2021-09-07 深圳证券信息有限公司 一种签章识别方法、装置、设备及可读存储介质
CN113378821B (zh) * 2021-07-02 2023-02-28 人民中科(济南)智能技术有限公司 基于深度学习的公章文字识别方法、系统、设备及存储介质
CN113627423A (zh) * 2021-07-08 2021-11-09 广州广电运通金融电子股份有限公司 圆形印章字符识别方法、装置、计算机设备和存储介质
CN113591849A (zh) * 2021-08-02 2021-11-02 国泰新点软件股份有限公司 基于签章识别的文件评审方法、装置、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101162506A (zh) * 2007-11-02 2008-04-16 北京大学 圆形印章的印鉴图像检索方法
CN103425970A (zh) * 2013-08-29 2013-12-04 大连理工大学 一种基于头部姿态的人机交互方法
CN105631447A (zh) * 2015-12-18 2016-06-01 杭州仁盈科技股份有限公司 一种识别圆形公章中文字的方法
CN107403405A (zh) * 2016-05-20 2017-11-28 富士通株式会社 图像处理装置、图像处理方法以及信息处理装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10029841B2 (en) * 2013-05-07 2018-07-24 Baby Blue Brand Damage indicating packaging

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101162506A (zh) * 2007-11-02 2008-04-16 北京大学 圆形印章的印鉴图像检索方法
CN103425970A (zh) * 2013-08-29 2013-12-04 大连理工大学 一种基于头部姿态的人机交互方法
CN105631447A (zh) * 2015-12-18 2016-06-01 杭州仁盈科技股份有限公司 一种识别圆形公章中文字的方法
CN107403405A (zh) * 2016-05-20 2017-11-28 富士通株式会社 图像处理装置、图像处理方法以及信息处理装置

Also Published As

Publication number Publication date
CN107944452A (zh) 2018-04-20

Similar Documents

Publication Publication Date Title
CN107944452B (zh) 一种圆形印章文字识别方法
CN109886974B (zh) 一种印章去除方法
CN104463195B (zh) 基于模板匹配的印刷体数字识别方法
Saxena Niblack’s binarization method and its modifications to real-time applications: a review
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
Shen et al. Improving OCR performance with background image elimination
CN108146093B (zh) 一种去除票据印章的方法
CN109871845B (zh) 证件图像提取方法及终端设备
CN108830275B (zh) 点阵字符、点阵数字的识别方法及装置
CN110378351B (zh) 印章鉴别方法及装置
CN109993161B (zh) 一种文本图像旋转矫正方法及系统
CN107195069A (zh) 一种人民币冠字号自动识别方法
CN111784675A (zh) 物品纹理信息处理的方法、装置、存储介质及电子设备
CN111462388A (zh) 一种票据检验方法、装置、终端设备及存储介质
CN108877030B (zh) 图像处理方法、装置、终端和计算机可读存储介质
US10657369B1 (en) Unsupervised removal of text from images using linear programming for optimal filter design
CN113570633A (zh) 基于深度学习模型对脂肪细胞图像进行分割计数的方法
CN111445402B (zh) 一种图像去噪方法及装置
CN113033562A (zh) 一种图像处理方法、装置、设备及存储介质
CN103617423B (zh) 基于色彩参数的图像拆分识别方法
CN115410191B (zh) 文本图像识别方法、装置、设备和存储介质
CN112396638A (zh) 一种图像处理方法、终端和计算机可读存储介质
CN110070103A (zh) 身份证识别的方法及终端设备
CN110942488A (zh) 图像处理装置、图像处理系统、图像处理方法及记录介质
CN115083024A (zh) 基于区域划分的签名识别方法、装置、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200519

Address after: A4-702, building a, Kexing Science Park, No. 15, Keyuan Road, Science Park community, Yuehai street, Nanshan District, Shenzhen City, Guangdong Province

Applicant after: Wing letter Technology (Shenzhen) Co., Ltd. Boda

Address before: 518000 the third floor of the No. 9 business seal mansion road, Nanshan District science and technology No. 1, Shenzhen, Guangdong

Applicant before: SHENZHEN CHUANGYE SIGNET INDUSTRIAL Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant