CN113627423A - 圆形印章字符识别方法、装置、计算机设备和存储介质 - Google Patents
圆形印章字符识别方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113627423A CN113627423A CN202110773949.5A CN202110773949A CN113627423A CN 113627423 A CN113627423 A CN 113627423A CN 202110773949 A CN202110773949 A CN 202110773949A CN 113627423 A CN113627423 A CN 113627423A
- Authority
- CN
- China
- Prior art keywords
- image
- character
- stamp
- seal
- circular
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000011218 segmentation Effects 0.000 claims abstract description 21
- 238000006243 chemical reaction Methods 0.000 claims abstract description 14
- 238000004590 computer program Methods 0.000 claims description 19
- 238000013527 convolutional neural network Methods 0.000 claims description 9
- 238000013519 translation Methods 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 7
- 230000000306 recurrent effect Effects 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 23
- 102100032202 Cornulin Human genes 0.000 description 8
- 101000920981 Homo sapiens Cornulin Proteins 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/66—Analysis of geometric attributes of image moments or centre of gravity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Character Input (AREA)
Abstract
本申请涉及一种圆形印章字符识别方法、装置、计算机设备和存储介质。所述方法包括:获取待识别图像,待识别图像中包括圆形印章;对待识别图像进行颜色分割,获得圆形印章的中心位置和半径,根据圆形印章的中心位置和半径,从待识别图像中提取印章区域图像;利用坐标转换将印章区域图像中的圆形印章展开为矩形,获得展开后图像,从展开后图像中截取字符区域图像;从字符区域图像中获取字符序列的起始位置和终止位置,基于起始位置和终止位置对字符区域图像进行变换,得到字符序列图像;对字符序列图像进行字符识别,获得印章字符识别结果。采用本方法能够提高印章字符识别效果。
Description
技术领域
本申请涉及图像处理技术领域,特别是涉及一种圆形印章字符识别方法、装置、计算机设备和存储介质。
背景技术
在金融机构的相关自动电子设备中,印章上的字符内容信息的识别具有很广泛的应用场景。因印章在盖章时,存在方向不定、印章墨汁不足而导致字符缺失、或印章盖在文本上造成背景干扰等问题,对印章字符内容的识别增加了难度。
目前的圆形印章字符识别方案,先将圆形印章展开成矩形,再分割出每个字符,最后利用图像特征对每个字符进行模式识别从而识别出印章里的字符内容信息。然而,这种方案比较依赖于字符的分割,字符分割对识别造成了一定的局限性,对于字符分割难度大,无法准确分割字符的情况,识别效果较差。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高识别效果的圆形印章字符识别方法、装置、计算机设备和存储介质。
一种圆形印章字符识别方法,所述方法包括:
获取待识别图像,所述待识别图像中包括圆形印章;
对所述待识别图像进行颜色分割,获得所述圆形印章的中心位置和半径,根据所述圆形印章的中心位置和半径,从所述待识别图像中提取印章区域图像;
利用坐标转换将所述印章区域图像中的圆形印章展开为矩形,获得展开后图像,从所述展开后图像中截取字符区域图像;
从所述字符区域图像中获取字符序列的起始位置和终止位置,基于所述起始位置和所述终止位置对所述字符区域图像进行变换,得到字符序列图像;
对所述字符序列图像进行字符识别,获得印章字符识别结果。
一种圆形印章字符识别装置,所述装置包括:
获取模块,用于获取待识别图像,所述待识别图像中包括圆形印章;
提取模块,用于对所述待识别图像进行颜色分割,获得所述圆形印章的中心位置和半径,根据所述圆形印章的中心位置和半径,从所述待识别图像中提取印章区域图像;
展开模块,用于利用坐标转换将所述印章区域图像中的圆形印章展开为矩形,获得展开后图像,从所述展开后图像中截取字符区域图像;
处理模块,用于从所述字符区域图像中获取字符序列的起始位置和终止位置,基于所述起始位置和所述终止位置对所述字符区域图像进行变换,得到字符序列图像;
识别模块,用于对所述字符序列图像进行字符识别,获得印章字符识别结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待识别图像,所述待识别图像中包括圆形印章;
对所述待识别图像进行颜色分割,获得所述圆形印章的中心位置和半径,根据所述圆形印章的中心位置和半径,从所述待识别图像中提取印章区域图像;
利用坐标转换将所述印章区域图像中的圆形印章展开为矩形,获得展开后图像,从所述展开后图像中截取字符区域图像;
从所述字符区域图像中获取字符序列的起始位置和终止位置,基于所述起始位置和所述终止位置对所述字符区域图像进行变换,得到字符序列图像;
对所述字符序列图像进行字符识别,获得印章字符识别结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待识别图像,所述待识别图像中包括圆形印章;
对所述待识别图像进行颜色分割,获得所述圆形印章的中心位置和半径,根据所述圆形印章的中心位置和半径,从所述待识别图像中提取印章区域图像;
利用坐标转换将所述印章区域图像中的圆形印章展开为矩形,获得展开后图像,从所述展开后图像中截取字符区域图像;
从所述字符区域图像中获取字符序列的起始位置和终止位置,基于所述起始位置和所述终止位置对所述字符区域图像进行变换,得到字符序列图像;
对所述字符序列图像进行字符识别,获得印章字符识别结果。
上述圆形印章字符识别方法、装置、计算机设备和存储介质,获取待识别图像,待识别图像中包括圆形印章;对待识别图像进行颜色分割,获得圆形印章的中心位置和半径,根据圆形印章的中心位置和半径,从待识别图像中提取印章区域图像;利用坐标转换将印章区域图像中的圆形印章展开为矩形,获得展开后图像,从展开后图像中截取字符区域图像;从字符区域图像中获取字符序列的起始位置和终止位置,基于起始位置和终止位置对字符区域图像进行变换,得到字符序列图像;对字符序列图像进行字符识别,获得印章字符识别结果。据此,从待识别图像中提取印章区域图像,对印章区域图像进行处理获得字符序列图像,直接对字符序列图像进行识别获得印章中的字符,不依赖于字符分割,具有较强的抗干扰能力,从而提高识别效果。
附图说明
图1为一个实施例中圆形印章字符识别方法的流程示意图;
图2为一个实施例中对待识别图像进行颜色分割,获得圆形印章的中心位置和半径步骤的流程示意图;
图3为一个实施例中待识别图像的示意图;
图4为一个实施例中第一二值化图像的示意图;
图5为一个实施例中第一最小外接矩形的示意图;
图6为一个实施例中印章区域图像的示意图;
图7为一个实施例中印章区域图像的示意图;
图8为一个实施例中展开后图像的示意图;
图9为一个实施例中字符区域图像的示意图;
图10为一个实施例中字符序列的起始位置和终止位置的示意图;
图11为一个实施例中字符序列图像的示意图;
图12为一个实施例中CRNN网络结构的示意图;
图13为一个实施例中圆形印章字符识别装置的结构框图;
图14为一个实施例中计算机设备的内部结构图;
图15为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种圆形印章字符识别方法,以该方法应用于终端为例进行说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤S102至步骤S110。
S102,获取待识别图像,待识别图像中包括圆形印章。
待识别图像可以是盖有印章的文件图像,印章由外围轮廓和轮廓内字符组成。轮廓内字符包括正文字符,用于指示印章所属者名字(例如公司名称)。轮廓内字符还可以包括副文字符,用于指示印章用途(例如合同专用章、财务专用章等)。
S104,对待识别图像进行颜色分割,获得圆形印章的中心位置和半径,根据圆形印章的中心位置和半径,从待识别图像中提取印章区域图像。
在待识别图像中,印章颜色与背景颜色不同,可以利用颜色差异对待识别图像进行颜色分割,以获得印章相关信息。在一个实施例中,如图2所示,对待识别图像进行颜色分割,获得圆形印章的中心位置和半径的步骤,具体可以包括以下步骤S1042至步骤S1046。
S1042,根据待识别图像中各像素点的色彩信息,对待识别图像进行二值化,获得第一二值化图像。
在一个实施例中,色彩信息包括色调和饱和度;根据待识别图像中各像素点的色彩信息,对待识别图像进行二值化,获得第一二值化图像的步骤,具体可以包括:将待识别图像中第一像素点的像素值转换为第一灰度值,第一像素点的色调满足预设色调范围且第一像素点的饱和度满足预设饱和度范围;将待识别图像中除第一像素点以外的其它像素点的像素值转换为第二灰度值。
第一像素点指的是印章对应的像素点,除第一像素点以外的其它像素点可以理解为背景像素点。对待识别图像进行二值化,具体可以是将第一像素点的像素值转换为255(即第一灰度值为255),将除第一像素点以外的其它像素点的像素值转换为0(即第二灰度值为0)。预设色调范围是指印章对应的像素点需要满足的色调范围,预设饱和度范围是指印章对应的像素点需要满足的饱和度范围,预设色调范围和预设饱和度范围可以根据实际印章颜色进行设置,此处不做限定。
如图3所示,示出了一个实施例中待识别图像的示意图,其中红色区域(在图中显示为深色区域)为圆形印章。具体而言,将待识别图像从RGB图像变换为HSV图像,HSV图像的色彩空间由色调(H)、饱和度(S)和明度(V)组成,可以通过如下公式(1)对图3中的待识别图像进行二值化:
其中,H(x,y)表示HSV图像中(x,y)处的H值,S(x,y)表示HSV图像中(x,y)点处的S值,f(x,y)表示待识别图像进行二值化后得到的第一二值化图像,即对待识别图像中的像素点做如下处理得到第一二值化图像:将H值小于8且饱和度值大于50的像素点的像素值转换为255,将H值大于160且饱和度值大于30的像素点的像素值转换为255,将其余像素点的像素值转换为0。如图4所示,示出了一个实施例中第一二值化图像的示意图,其中白色区域为印章,黑色区域为背景。
S1044,对第一二值化图像进行连通域提取,获得目标轮廓,目标轮廓对应圆形印章的外圆。
对第一二值化图像进行连通域提取,可以获得第一二值化图像中包含的轮廓,从获得的轮廓中选择最大的轮廓作为目标轮廓,目标轮廓对应圆形印章的外圆。参考图4,目标轮廓对应白色区域的最外层圆。
S1046,获取目标轮廓的最小外接圆,将最小外接圆的圆心位置作为圆形印章的中心位置,将最小外接圆的半径作为圆形印章的半径。
通过对二值化图像进行连通域提取获得的目标轮廓可能缺失部分像素点,导致目标轮廓并非是理想的圆形。基于此,可以对目标轮廓进行圆形拟合,获得目标轮廓的最小外接圆,该最小外接圆可认为是圆形印章的最外层圆,从而,将最小外接圆的圆心位置作为圆形印章的中心位置,将最小外接圆的半径作为圆形印章的半径。获得圆形印章的中心位置和半径之后,根据圆形印章的中心位置和半径,从待识别图像中提取印章区域图像。
在一个实施例中,根据圆形印章的中心位置和半径,从待识别图像中提取印章区域图像的步骤,具体可以包括:根据圆形印章的中心位置和半径,确定圆形印章的第一最小外接矩形;从待识别图像中提取第一最小外接矩形对应的区域,获得印章区域图像。
第一最小外接矩形是指圆形印章的最小外接矩形,可以理解,第一最小外接矩形的中心位置为圆形印章的中心位置,第一最小外接矩形的边长为圆形印章的直径(即半径的两倍)。如图5所示,示出了一个实施例中第一最小外接矩形的示意图,其中白色原点表示圆形印章的中心位置,白色框表示第一最小外接矩形。根据第一最小外接矩形的位置信息,从待识别图像中截取相应的位置区域,获得印章区域图像。如图6所示,示出了一个实施例中印章区域图像的示意图。
在一个实施例中,参考图6,印章字符包括正文和副文,正文“广州×××高科技股份有限公司”围绕印章的圆形内侧分布,副文“财务专用章”沿一直线分布。本实施例中,当印章包括副文时,可以去除印章区域图像中的印章副文,从而减少后续对印章正文字符识别的影响。
具体而言,在获得如图3所示的第一二值化图像之后,还包括以下步骤:对第一二值化图像进行连通域提取,获得圆形印章中每个字符的第二最小外接矩形;将位于一条直线上的第二最小外接矩形,确定为印章副文区域,获取印章副文区域的位置和相对于预设方向的角度。
第二最小外接矩形是指单个字符的最小外接矩形,可以理解,副文中各字符的第二最小外接矩形处于一条直线上,因此可以通过查找位于一条直线上的第二最小外接矩形来确定印章副文区域。预设方向可以但不限于是图像横坐标方向(水平方向)或者纵坐标方向(垂直方向),印章副文区域相对于预设方向的角度,具体可以是上述直线与预设方向的夹角。参考图6,白色框表示印章副文区域,印章副文区域与水平方向不平行,存在一定的角度。
在一个实施例中,根据印章副文区域的位置,将印章区域图像中相应区域的像素值转换为目标像素值;根据印章副文区域相对于预设方向的角度,对印章区域图像进行旋转。
目标像素值是指与印章正文的像素值不同的像素值,具体可以是背景像素值,将印章区域图像中的印章副文区域的像素值转换为目标像素值,以实现去除印章副文。此外,根据印章副文区域相对于预设方向的角度,将印章区域图像旋转相应的角度,使得印章副文区域与预设方向平行。如图7所示,示出了一个实施例中印章区域图像的示意图,其中印章副文区域与预设方向平行,印章副文被去除。
S106,利用坐标转换将印章区域图像中的圆形印章展开为矩形,获得展开后图像,从展开后图像中截取字符区域图像。
可以根据直角坐标到极坐标的变化把圆形印章展开成矩形。在一个实施例中,将印章区域图像中各像素点的直角坐标转换为极坐标,获得展开后图像,可以通过如下公式(2)进行坐标转换:
其中,(x,y)表示印章区域图像中的图像点位置的直角坐标,(x0,y0)表示圆形印章的中心位置的直角坐标,(ρ,θ)表示转换后的极坐标。如图8所示,示出了一个实施例中展开后图像的示意图,该图中的直线为印章圆形轮廓转换后的形状,直线左边为图7中圆形内部展开的图像,直线右边是图7中圆形外部展开的图像。
在一个实施例中,从展开后图像中截取字符区域图像的步骤,具体可以包括:从展开后图像中截取字符分布位置所对应的图像区域,并将截取后的图像区域旋转到水平方向,获得字符区域图像。
参考图8,展开后图像为垂直方向,字符分布于图中距离直线(对应印章圆形轮廓)一定范围内的区域,通过截取相应区域的图像,并将截取的图像区域旋转90度到水平方向,获得字符区域图像。如图9所示,示出了一个实施例中字符区域图像的示意图。
S108,从字符区域图像中获取字符序列的起始位置和终止位置,基于起始位置和终止位置对字符区域图像进行变换,得到字符序列图像。
字符序列由印章正文字符按照阅读顺序构成,起始位置是指字符序列中排在首位的字符所在的位置,终止位置是指字符序列中排在末位的字符所在的位置。参考图9,其中字符序列为“广州×××高科技股份有限公司”,按照阅读顺序排在首位的字符为“广”,按照阅读顺序排在末位的字符为“司”,然而此时的显示顺序为“公司”排在“广州×××高科技股份有限”前面,需要对其进行平移变换,得到字符序列图像,使得在字符序列图像中印章正文从左往右显示为“广州×××高科技股份有限公司”。
在一个实施例中,从字符区域图像中获取字符序列的起始位置和终止位置,基于起始位置和终止位置对字符区域图像进行变换,得到字符序列图像的步骤,具体可以包括:基于最大类间方差法对字符区域图像进行二值化,获得第二二值化图像,将第二二值化图像在垂直方向上进行投影,根据投影分布的大小和距离,获得字符序列的起始位置和终止位置;基于起始位置、终止位置以及字符区域图像的宽度,对字符区域图像进行平移变换,得到字符序列图像。
获得字符区域图像之后,可以对字符区域图像进行灰度变化并利用最大类间方差法(OTSU)进行二值化,获得第二二值化图像。具体而言,第二二值化图像中对应字符的像素点的灰度值转换为255,其余像素点的灰度值转换为0。将第二二值化图像在垂直方向上进行投影,可以理解,字符处对应的投影值比空白处对应的投影值大。具体地,投影分布中包括波峰和波谷,每个波峰对应一个字符,每个波谷可理解为两个字符之间的距离,每两个相邻字符之间的距离相差不大,排在首位和末位的字符之间的距离比起两个相邻字符之间的距离要更远,据此可以根据投影分布的大小和距离,获得字符序列的起始位置和终止位置。如图10所示,示出了一个实施例中字符序列的起始位置和终止位置的示意图,其中,起始位置(start_x)位于字符“广”的左侧,终止位置(end_x)位于字符“司”的右侧。
获得字符序列的起始位置和终止位置之后,对字符区域图像横向进行平移,即在x方向上向左平移start_x个像素,可以通过如下公式(3)进行平移变换:
其中,start_x’和end_x’分别表示平移后的start_x和end_x,w表示字符区域图像的宽度,f(x,y)为平移前的图像,f’(x,y)为平移后的图像。按照上述公式对字符区域图像进行平移变换后,再转换为灰度图,得到字符序列图像。如图11所示,示出了一个实施例中字符序列图像的示意图。
S110,对字符序列图像进行字符识别,获得印章字符识别结果。
具体而言,可以将字符序列图像输入到一个深度神经网络(CRNN)中,通过CRNN对字符序列图像进行字符识别,获得印章字符识别结果,CRNN可以实现不定长的字符识别,不依赖于字符分割,具有很强的抗干扰能力。
CRNN包括卷积神经网络(CNN)和循环神经网络(RNN)。对字符序列图像进行字符识别,获得印章字符识别结果的步骤,具体可以包括:使用卷积神经网络提取字符序列图像的图像特征;使用循环神经网络对图像特征中的各单位长度特征进行识别,获得各单位长度特征对应的识别结果;使用连接时序分类器对各各单位长度特征对应的识别结果进行解码,获得印章字符识别结果。
如图12所示,示出了一个实施例中CRNN网络结构的示意图。其中,CNN由卷积层(Conv)组成,RNN由双向循环神经网络(BiLSTM)和全连接层(FC)组成。CRNN网络的各层参数设置如下表1所示:
表1
其中,Conv表示卷积层,Relu表示激活函数,MaxPool表示池化层,Bn表示批归一化,BiLSTM表示双向循环神经网络,FC表示全连接层,stage表示各阶段的特征提取,nclass表示总的字符个数。
具体而言,使用CNN提取图像特征,输入图像的高度限定为32,将图9缩放成高32像素、宽等比例缩放的图像,输入到CNN中,经过CNN后输入到RNN的特征为时序长度为T(T=W/4+1)、高度为1、特征维度为512的序列,然后经过双向循环神经网络(BiLSTM)和全连接层(FC),输出T×nclass张量,即对于每个单位长度特征,获得其映射到nclass个字符中每个字符的概率,再通过连接时序分类器(CTC)解码得到最终字符识别结果,图9的最终字符识别结果为“广州XXXX高科技股份有限公司”。
上述实施例中,从待识别图像中提取印章区域图像,通过寻找印章副文位置定位印章的角度,并去除副文内容,减少后续对印章正文字符识别的影响;对于从圆形展开成矩形的字符区域图像,定位正文的起始位置和终止位置,得到字符序列图像,无需对正文每个字符进行定位分割,避免字符分割难度大对识别效果造成的影响;利用端到端的不定长字符识别模型CRNN来识别印章正文内容,而无需对单个字符做分割和特征提取,具有较强的抗干扰能力,识别准确性更高。
应该理解的是,虽然上述实施例涉及的各流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述实施例涉及的各流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图13所示,提供了一种圆形印章字符识别装置1300,包括:获取模块1310、提取模块1320、展开模块1330、处理模块1340和识别模块1350,其中:
获取模块1310,用于获取待识别图像,待识别图像中包括圆形印章。
提取模块1320,用于对待识别图像进行颜色分割,获得圆形印章的中心位置和半径,根据圆形印章的中心位置和半径,从待识别图像中提取印章区域图像。
展开模块1330,用于利用坐标转换将印章区域图像中的圆形印章展开为矩形,获得展开后图像,从展开后图像中截取字符区域图像。
处理模块1340,用于从字符区域图像中获取字符序列的起始位置和终止位置,基于起始位置和终止位置对字符区域图像进行变换,得到字符序列图像。
识别模块1350,用于对字符序列图像进行字符识别,获得印章字符识别结果。
在一个实施例中,提取模块1320在对待识别图像进行颜色分割,获得圆形印章的中心位置和半径时,具体用于:根据待识别图像中各像素点的色彩信息,对待识别图像进行二值化,获得第一二值化图像;对第一二值化图像进行连通域提取,获得目标轮廓,目标轮廓对应圆形印章的外圆;获取目标轮廓的最小外接圆,将最小外接圆的圆心位置作为圆形印章的中心位置,将最小外接圆的半径作为圆形印章的半径。
在一个实施例中,色彩信息包括色调和饱和度;提取模块1320在根据待识别图像中各像素点的色彩信息,对待识别图像进行二值化,获得第一二值化图像时,具体用于:将待识别图像中第一像素点的像素值转换为第一灰度值,第一像素点的色调满足预设色调范围且第一像素点的饱和度满足预设饱和度范围;将待识别图像中除第一像素点以外的其它像素点的像素值转换为第二灰度值。
在一个实施例中,提取模块1320在根据圆形印章的中心位置和半径,从待识别图像中提取印章区域图像时,具体用于:根据圆形印章的中心位置和半径,确定圆形印章的第一最小外接矩形;从待识别图像中提取第一最小外接矩形对应的区域,获得印章区域图像。
在一个实施例中,提取模块1320还用于:对第一二值化图像进行连通域提取,获得圆形印章中每个字符的第二最小外接矩形;将位于一条直线上的第二最小外接矩形,确定为印章副文区域,获取印章副文区域的位置和相对于预设方向的角度。
在一个实施例中,处理模块1340还用于:根据印章副文区域的位置,将印章区域图像中相应区域的像素值转换为目标像素值;根据印章副文区域相对于预设方向的角度,对印章区域图像进行旋转。
在一个实施例中,展开模块1330在利用坐标转换将印章区域图像中的圆形印章展开为矩形,获得展开后图像时,具体用于:将印章区域图像中各像素点的直角坐标转换为极坐标,获得展开后图像。
在一个实施例中,处理模块1340在从字符区域图像中获取字符序列的起始位置和终止位置,基于起始位置和终止位置对字符区域图像进行变换,得到字符序列图像时,具体用于:基于最大类间方差法对字符区域图像进行二值化,获得第二二值化图像,将第二二值化图像在垂直方向上进行投影,根据投影分布的大小和距离,获得字符序列的起始位置和终止位置;基于起始位置、终止位置以及字符区域图像的宽度,对字符区域图像进行平移变换,得到字符序列图像。
在一个实施例中,识别模块1350在对字符序列图像进行字符识别,获得印章字符识别结果时,具体用于:使用卷积神经网络提取字符序列图像的图像特征;使用循环神经网络对图像特征中的各单位长度特征进行识别,获得各单位长度特征对应的识别结果;使用连接时序分类器对各各单位长度特征对应的识别结果进行解码,获得印章字符识别结果。
关于圆形印章字符识别装置的具体限定可以参见上文中对于圆形印章字符识别方法的限定,在此不再赘述。上述圆形印章字符识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图14所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种圆形印章字符识别方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图15所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种圆形印章字符识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图14和图15中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
需要理解的是,上述实施例中的术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。针对数值范围的描述,术语“多个”理解为等于或大于两个。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (12)
1.一种圆形印章字符识别方法,其特征在于,所述方法包括:
获取待识别图像,所述待识别图像中包括圆形印章;
对所述待识别图像进行颜色分割,获得所述圆形印章的中心位置和半径,根据所述圆形印章的中心位置和半径,从所述待识别图像中提取印章区域图像;
利用坐标转换将所述印章区域图像中的圆形印章展开为矩形,获得展开后图像,从所述展开后图像中截取字符区域图像;
从所述字符区域图像中获取字符序列的起始位置和终止位置,基于所述起始位置和所述终止位置对所述字符区域图像进行变换,得到字符序列图像;
对所述字符序列图像进行字符识别,获得印章字符识别结果。
2.根据权利要求1所述的方法,其特征在于,对所述待识别图像进行颜色分割,获得所述圆形印章的中心位置和半径,包括:
根据所述待识别图像中各像素点的色彩信息,对所述待识别图像进行二值化,获得第一二值化图像;
对所述第一二值化图像进行连通域提取,获得目标轮廓,所述目标轮廓对应所述圆形印章的外圆;
获取所述目标轮廓的最小外接圆,将所述最小外接圆的圆心位置作为所述圆形印章的中心位置,将所述最小外接圆的半径作为所述圆形印章的半径。
3.根据权利要求2所述的方法,其特征在于,所述色彩信息包括色调和饱和度;根据所述待识别图像中各像素点的色彩信息,对所述待识别图像进行二值化,获得第一二值化图像,包括:
将所述待识别图像中第一像素点的像素值转换为第一灰度值,所述第一像素点的色调满足预设色调范围且所述第一像素点的饱和度满足预设饱和度范围;
将所述待识别图像中除所述第一像素点以外的其它像素点的像素值转换为第二灰度值。
4.根据权利要求2所述的方法,其特征在于,根据所述圆形印章的中心位置和半径,从所述待识别图像中提取印章区域图像,包括:
根据所述圆形印章的中心位置和半径,确定所述圆形印章的第一最小外接矩形;
从所述待识别图像中提取所述第一最小外接矩形对应的区域,获得印章区域图像。
5.根据权利要求4所述的方法,其特征在于,在获得第一二值化图像之后,还包括:
对所述第一二值化图像进行连通域提取,获得所述圆形印章中每个字符的第二最小外接矩形;
将位于一条直线上的第二最小外接矩形,确定为印章副文区域,获取所述印章副文区域的位置和相对于预设方向的角度。
6.根据权利要求5所述的方法,其特征在于,在获得印章区域图像之后,利用坐标转换将所述印章区域图像中的圆形印章展开为矩形之前,还包括:
根据所述印章副文区域的位置,将所述印章区域图像中相应区域的像素值转换为目标像素值;
根据所述印章副文区域相对于预设方向的角度,对所述印章区域图像进行旋转。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:利用坐标转换将所述印章区域图像中的圆形印章展开为矩形,获得展开后图像,从所述展开后图像中截取字符区域图像,包括:
将所述印章区域图像中各像素点的直角坐标转换为极坐标,获得展开后图像;
从所述展开后图像中截取字符分布位置所对应的图像区域,并将截取的图像区域旋转到水平方向,获得字符区域图像。
8.根据权利要求7所述的方法,其特征在于,从所述字符区域图像中获取字符序列的起始位置和终止位置,基于所述起始位置和所述终止位置对所述字符区域图像进行变换,得到字符序列图像,包括:
基于最大类间方差法对所述字符区域图像进行二值化,获得第二二值化图像,将所述第二二值化图像在垂直方向上进行投影,根据投影分布的大小和距离,获得字符序列的起始位置和终止位置;
基于所述起始位置、所述终止位置以及所述字符区域图像的宽度,对所述字符区域图像进行平移变换,得到字符序列图像。
9.根据权利要求1至8中任一项所述的方法,其特征在于,对所述字符序列图像进行字符识别,获得印章字符识别结果,包括:
使用所述卷积神经网络提取所述字符序列图像的图像特征;
使用所述循环神经网络对所述图像特征中的各单位长度特征进行识别,获得各单位长度特征对应的识别结果;
使用连接时序分类器对各所述各单位长度特征对应的识别结果进行解码,获得印章字符识别结果。
10.一种圆形印章字符识别装置,其特征在于,所述装置包括:
获取模块,用于获取待识别图像,所述待识别图像中包括圆形印章;
提取模块,用于对所述待识别图像进行颜色分割,获得所述圆形印章的中心位置和半径,根据所述圆形印章的中心位置和半径,从所述待识别图像中提取印章区域图像;
展开模块,用于利用坐标转换将所述印章区域图像中的圆形印章展开为矩形,获得展开后图像,从所述展开后图像中截取字符区域图像;
处理模块,用于从所述字符区域图像中获取字符序列的起始位置和终止位置,基于所述起始位置和所述终止位置对所述字符区域图像进行变换,得到字符序列图像;
识别模块,用于对所述字符序列图像进行字符识别,获得印章字符识别结果。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110773949.5A CN113627423A (zh) | 2021-07-08 | 2021-07-08 | 圆形印章字符识别方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110773949.5A CN113627423A (zh) | 2021-07-08 | 2021-07-08 | 圆形印章字符识别方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113627423A true CN113627423A (zh) | 2021-11-09 |
Family
ID=78379417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110773949.5A Pending CN113627423A (zh) | 2021-07-08 | 2021-07-08 | 圆形印章字符识别方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113627423A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114782957A (zh) * | 2022-04-26 | 2022-07-22 | 中国建设银行股份有限公司 | 确定印章图像中文本信息的方法、装置、电子设备和介质 |
CN115308121A (zh) * | 2022-07-28 | 2022-11-08 | 重庆川仪自动化股份有限公司 | 采用图像识别技术测定金属塑性成形摩擦系数的方法 |
CN115620299A (zh) * | 2022-12-14 | 2023-01-17 | 深圳思谋信息科技有限公司 | 图像识别方法、装置、计算机设备和存储介质 |
CN116757886A (zh) * | 2023-08-16 | 2023-09-15 | 南京尘与土信息技术有限公司 | 数据分析方法及分析装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107944452A (zh) * | 2017-12-12 | 2018-04-20 | 深圳市创业印章实业有限公司 | 一种圆形印章文字识别方法 |
CN109657666A (zh) * | 2018-11-23 | 2019-04-19 | 汉王科技股份有限公司 | 一种圆形印章识别方法及装置 |
CN110659647A (zh) * | 2019-09-11 | 2020-01-07 | 杭州睿琪软件有限公司 | 印章图像识别方法及装置、智能发票识别设备和存储介质 |
CN112488095A (zh) * | 2020-12-18 | 2021-03-12 | 北京字节跳动网络技术有限公司 | 印章图像识别方法、装置和电子设备 |
CN112766275A (zh) * | 2021-04-08 | 2021-05-07 | 金蝶软件(中国)有限公司 | 印章文字识别方法、装置、计算机设备和存储介质 |
WO2021115490A1 (zh) * | 2020-06-22 | 2021-06-17 | 平安科技(深圳)有限公司 | 面向复杂环境的印章文字检测识别方法、装置及介质 |
CN113076795A (zh) * | 2021-02-09 | 2021-07-06 | 江苏省联合征信有限公司 | 一种带印章的表格协议书图像自动审核方法 |
-
2021
- 2021-07-08 CN CN202110773949.5A patent/CN113627423A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107944452A (zh) * | 2017-12-12 | 2018-04-20 | 深圳市创业印章实业有限公司 | 一种圆形印章文字识别方法 |
CN109657666A (zh) * | 2018-11-23 | 2019-04-19 | 汉王科技股份有限公司 | 一种圆形印章识别方法及装置 |
CN110659647A (zh) * | 2019-09-11 | 2020-01-07 | 杭州睿琪软件有限公司 | 印章图像识别方法及装置、智能发票识别设备和存储介质 |
WO2021115490A1 (zh) * | 2020-06-22 | 2021-06-17 | 平安科技(深圳)有限公司 | 面向复杂环境的印章文字检测识别方法、装置及介质 |
CN112488095A (zh) * | 2020-12-18 | 2021-03-12 | 北京字节跳动网络技术有限公司 | 印章图像识别方法、装置和电子设备 |
CN113076795A (zh) * | 2021-02-09 | 2021-07-06 | 江苏省联合征信有限公司 | 一种带印章的表格协议书图像自动审核方法 |
CN112766275A (zh) * | 2021-04-08 | 2021-05-07 | 金蝶软件(中国)有限公司 | 印章文字识别方法、装置、计算机设备和存储介质 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114782957A (zh) * | 2022-04-26 | 2022-07-22 | 中国建设银行股份有限公司 | 确定印章图像中文本信息的方法、装置、电子设备和介质 |
CN115308121A (zh) * | 2022-07-28 | 2022-11-08 | 重庆川仪自动化股份有限公司 | 采用图像识别技术测定金属塑性成形摩擦系数的方法 |
CN115620299A (zh) * | 2022-12-14 | 2023-01-17 | 深圳思谋信息科技有限公司 | 图像识别方法、装置、计算机设备和存储介质 |
CN115620299B (zh) * | 2022-12-14 | 2023-03-21 | 深圳思谋信息科技有限公司 | 图像识别方法、装置、计算机设备和存储介质 |
CN116757886A (zh) * | 2023-08-16 | 2023-09-15 | 南京尘与土信息技术有限公司 | 数据分析方法及分析装置 |
CN116757886B (zh) * | 2023-08-16 | 2023-11-28 | 南京尘与土信息技术有限公司 | 数据分析方法及分析装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019169772A1 (zh) | 图片处理方法、电子装置及存储介质 | |
CN113627423A (zh) | 圆形印章字符识别方法、装置、计算机设备和存储介质 | |
CN110348294B (zh) | Pdf文档中图表的定位方法、装置及计算机设备 | |
CN104023249B (zh) | 电视频道识别方法和装置 | |
EP2783328B1 (en) | Text detection using multi-layer connected components with histograms | |
CN104751142B (zh) | 一种基于笔划特征的自然场景文本检测方法 | |
CN109753953B (zh) | 图像中定位文本的方法、装置、电子设备和存储介质 | |
WO2021143059A1 (zh) | 地图区域的确定方法、装置、设备及存储介质 | |
CN106875408B (zh) | 用于截图的方法、装置及终端设备 | |
CN111144366A (zh) | 一种基于联合人脸质量评估的陌生人脸聚类方法 | |
EA004910B1 (ru) | Способ и устройство для определения областей, представляющих интерес, в изображениях и для передачи изображения | |
WO2022134771A1 (zh) | 表格处理方法、装置、电子设备及存储介质 | |
CN110197238B (zh) | 一种字体类别的识别方法、系统及终端设备 | |
CN111899270A (zh) | 卡片边框检测方法、装置、设备及可读存储介质 | |
WO2021218183A1 (zh) | 证件边沿检测方法、装置、设备及介质 | |
CN114972817A (zh) | 图像相似度匹配方法、设备及存储介质 | |
Dong et al. | A parallel thinning algorithm based on stroke continuity detection | |
Belhedi et al. | Adaptive scene‐text binarisation on images captured by smartphones | |
CN115294557A (zh) | 图像处理方法、图像处理装置、电子设备及存储介质 | |
CN115049713A (zh) | 图像配准方法、装置、设备及可读存储介质 | |
CN111209922B (zh) | 基于svm和opencv的图像色系风格标记方法、装置、设备及介质 | |
CN113989481A (zh) | 一种合同文本图像印章检测和去除方法 | |
CN111899181B (zh) | 去除图像中的阴影的方法和装置 | |
Ojo et al. | Illumination invariant face detection using hybrid skin segmentation method | |
JP2002245404A (ja) | 領域切り出しプログラムおよび装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Country or region after: China Address after: 510663 9, 11, science Road, science and Technology City, Guangzhou high tech Industrial Development Zone, Guangdong Applicant after: Guangdian Yuntong Group Co.,Ltd. Address before: 510663 9, 11, science Road, science and Technology City, Guangzhou high tech Industrial Development Zone, Guangdong Applicant before: GRG BANKING EQUIPMENT Co.,Ltd. Country or region before: China |
|
CB02 | Change of applicant information |