CN113627432A - 图像中印章识别方法、装置、计算机设备及可读存储介质 - Google Patents
图像中印章识别方法、装置、计算机设备及可读存储介质 Download PDFInfo
- Publication number
- CN113627432A CN113627432A CN202110950515.8A CN202110950515A CN113627432A CN 113627432 A CN113627432 A CN 113627432A CN 202110950515 A CN202110950515 A CN 202110950515A CN 113627432 A CN113627432 A CN 113627432A
- Authority
- CN
- China
- Prior art keywords
- image
- seal
- stamp
- target image
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000001514 detection method Methods 0.000 claims abstract description 66
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 20
- 238000013507 mapping Methods 0.000 claims description 24
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 21
- 238000013135 deep learning Methods 0.000 abstract description 6
- 238000012015 optical character recognition Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000003287 optical effect Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000009432 framing Methods 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Character Input (AREA)
Abstract
本申请提供一种图像中印章识别方法、装置、计算机设备及可读存储介质,涉及深度学习技术领域。该方法包括:获取待识别的目标图像,所述目标图像中包括印章;将所述目标图像输入预先训练得到的印章检测模型,得到所述目标图像中的印章位置;根据所述目标图像中的印章位置,从所述目标图像中截取印章图像;对所述印章图像进行变形处理,得到所述印章图像对应的矩形图像;对所述矩形图像进行图像识别,得到所述目标图像中所包含的印章的第一文字信息。本申请实现了利用深度学习技术,自动标定图片中印章的位置,不受印章颜色的限制,并且校正了印章中倾斜的文字,极大地提升了印章识别的工作效率和准确率以及扩大了印章识别技术的应用场景。
Description
技术领域
本申请涉及深度学习技术领域,具体而言,涉及一种图像中印章识别方法、装置、计算机设备及可读存储介质。
背景技术
印章被广泛应用于文件,用来表示签署或鉴定的工具,因此,在办公和政务等方面对印章识别的需求日益增多。
目前,印章识别方法主要有两种:(1)采用基于人工标定及设定规则的方法,具体可以是人工标定出文件中需要识别的印章区域,随后按照设定的规则将标定区域的印章切割出来,再利用光学字符识别技术识别切割出的印章中的文字。(2)采用基于传统图像处理的方法,具体可以是将黑白文本图片中的红色印章提取出来,随后利用传统图像处理方法对红色印章进行灰度化、归一化,统一到一定的尺寸,再利用光学字符识别技术识别经过处理的印章中的文字。
但是,如果基于人工标定及设定规则的方法,会存在人工标定的印章区域出现漏标和错标的情况,并且由于规则是人工预先设定的,需要频繁的更新设定的规则,造成人工成本的大量浪费;如果基于传统图像处理的方法,由于传统图像处理技术易受到光线、图片不清晰等外界因素的影响,且仅适用于红色的印章,对于黑白的扫描文件失效,极大的限制了该印章识别技术的应用场景。
发明内容
本申请的目的在于,针对上述现有技术中的不足,提供一种图像中印章识别方法、装置、计算机设备及可读存储介质,以解决现有技术中存在的人工标定及设定规则和易受到光线、图片不清晰等外界因素的影响分别导致的人工成本的大量浪费和限制了印章识别技术的应用场景。
为实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请实施例提供了一种图像中印章识别方法,所述方法包括:
获取待识别的目标图像,所述目标图像中包括印章;
将所述目标图像输入预先训练得到的印章检测模型,得到所述目标图像中的印章位置;
根据所述目标图像中的印章位置,从所述目标图像中截取印章图像;
对所述印章图像进行变形处理,得到所述印章图像对应的矩形图像;
对所述矩形图像进行图像识别,得到所述目标图像中所包含的印章的第一文字信息。
可选的,所述对所述印章图像进行变形处理,得到所述印章图像对应的矩形图像,包括:
对所述印章图像中各像素点进行坐标转换,得到所述印章图像中各像素点在所述印章图像以及所述矩形图像中的坐标映射信息;
根据各像素点在所述印章图像以及所述矩形图像中的坐标映射信息,为所述矩形图像中的各像素点赋予像素值,得到所述印章图像对应的矩形图像。
可选的,所述将所述目标图像输入预先训练得到的印章检测模型,得到所述目标图像中的印章位置,包括:
将所述目标图像输入预先训练得到的印章检测模型,得到所述目标图像中的印章位置,以及所述目标图像中印章内的横排文字位置。
可选的,所述方法还包括:
根据所述目标图像中印章内的横排文字位置,从所述目标图像中截取横排文字图像;
对所述横排文字图像进行图像识别,得到所述目标图像中所包含的印章的第二文字信息。
可选的,所述对所述印章图像中各像素点进行坐标转换,得到所述印章图像中各像素点在所述印章图像以及所述矩形图像中的坐标映射信息之前,还包括:
根据所述目标图像中印章内的横排文字位置,将所述印章图像中横排文字位置上的像素点的像素值更新为预设像素值。
可选的,所述对所述印章图像中各像素点进行坐标转换,得到所述印章图像中各像素点在所述印章图像以及所述矩形图像中的坐标映射信息之前,还包括:
对所述印章图像进行尺寸扩充,得到新的印章图像。
可选的,对所述印章图像中各像素点进行坐标转换,得到所述印章图像中各像素点在所述印章图像以及所述矩形图像中的坐标映射信息之前,还包括:
检测所述印章图像中具有目标像素值的目标像素点;
将所述目标像素点的像素值更新为预设像素值。
第二方面,本申请实施例提供了一种图像中印章识别装置,所述装置包括:
获取模块,用于获取待识别的目标图像,所述目标图像中包括印章;
第一确定模块,用于将所述目标图像输入预先训练得到的印章检测模型,得到所述目标图像中的印章位置;
截取模块,用于根据所述目标图像中的印章位置,从所述目标图像中截取印章图像;
第二确定模块,用于对所述印章图像进行变形处理,得到所述印章图像对应的矩形图像;
第三确定模块,用于对所述矩形图像进行图像识别,得到所述目标图像中所包含的印章的第一文字信息。
可选的,第二确定模块具体用于对所述印章图像中各像素点进行坐标转换,得到所述印章图像中各像素点在所述印章图像以及所述矩形图像中的坐标映射信息;根据各像素点在所述印章图像以及所述矩形图像中的坐标映射信息,为所述矩形图像中的各像素点赋予像素值,得到所述印章图像对应的矩形图像。
可选的,第一确定模块具体用于将所述目标图像输入预先训练得到的印章检测模型,得到所述目标图像中的印章位置,以及所述目标图像中印章内的横排文字位置。
可选的,截取模块还用于根据所述目标图像中印章内的横排文字位置,从所述目标图像中截取横排文字图像;对所述横排文字图像进行图像识别,得到所述目标图像中所包含的印章的第二文字信息。
可选的,第一更新模块用于根据所述目标图像中印章内的横排文字位置,将所述印章图像中横排文字位置上的像素点的像素值更新为预设像素值。
可选的,第四确定模块用于对所述印章图像进行尺寸扩充,得到新的印章图像。
可选的,第二更新模块用于检测所述印章图像中具有目标像素值的目标像素点;将所述目标像素点的像素值更新为预设像素值。
第三方面,本申请实施例还提供了一种计算机设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如上述第一方面任一所述方法的步骤。
第四方面,本申请另一实施例提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述第一方面任一所述方法的步骤。
本申请的有益效果是:本申请提供了一种图像中印章识别方法,所述方法包括:获取待识别的目标图像,所述目标图像中包括印章;将所述目标图像输入预先训练得到的印章检测模型,得到所述目标图像中的印章位置;根据所述目标图像中的印章位置,从所述目标图像中截取印章图像;对所述印章图像进行变形处理,得到所述印章图像对应的矩形图像;对所述矩形图像进行图像识别,得到所述目标图像中所包含的印章的第一文字信息。本申请实现了利用深度学习技术,自动标定图片中印章的位置,不受印章颜色的限制,并且校正了印章中倾斜的文字,极大地提升了印章识别的工作效率和准确率以及扩大了印章识别技术的应用场景。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种图像中印章识别方法的流程示意图;
图2为本申请实施例提供的一种文本图片示意图;
图3为本申请实施例提供的一种标定印章的文本图片示意图;
图4为本申请实施例提供的一种截取印章的文本图片示意图;
图5为本申请实施例提供的一种印章变形后的文本图片示意图;
图6为本申请实施例提供的一种极坐标示意图;
图7为本申请实施例提供的又一种标定印章的文本图片示意图;
图8为本申请实施例提供的一种截取印章中横排文字的文本图片示意图;
图9为本申请实施例提供的一种更新横排文字位置的像素值的文本图片示意图;
图10为本申请实施例提供的一种更新印章中干扰信息位置的像素值的文本图片示意图;
图11为本申请实施例提供的一种图像中印章识别装置的结构示意图;
图12为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
目前印章识别方法主要有两种,一种是采用人工标定出文件中需要识别的印章区域,然后按照设定的规则将标定区域的印章切割出来,再利用光学字符识别技术识别切割出的印章中的文字,这种方法涉及到人工标定印章区域,并且需要频繁的更新切割印章的程序参数,存在漏标、错标和造成人工成本的大量浪费以及检查效率低等问题;另一种是采用基于传统图像处理的方法,具体可以是将黑白文本图片中的红色印章提取出来,随后利用传统图像处理方法对红色印章进行灰度化、归一化,统一到一定的尺寸,再利用光学字符识别技术识别经过处理的印章中的文字,这种方法只适用于红色印章,对于其他颜色的印章失效,如黑白的扫描文件中的印章失效,极大的限制了该印章识别技术的应用场景。并且上述两种方法均利用光学字符识别技术识别印章中的文字,但由于大多数的印章中的文字是倾斜的,直接使用光学字符识别来识别倾斜的文字,会出现识别不出来或识别出错的情况。
本申请基于上述的问题,提出一种图像中印章识别方法,基于用户输入的具有印章的图像,自动标定印章区域,并对印章中倾斜的文字进行校正,再用光学字符识别技术识别校正后的图像,该方法不仅提高了印章识别效率、扩大了该印章识别技术的应用场景,而且还提高了印章识别的准确率。
图1为本申请实施例提供的一种图像中印章识别方法的流程示意图;如图1所示,该方法包括:
S101、获取待识别的目标图像,目标图像中包括印章。
可选的,待识别的目标图像可以是通过各种方式获取的包含有至少一个印章的图像,其中印章的颜色可以是任意颜色,如红色、黑色等,在此不做限定;印章的形状可以是圆形或者椭圆形;印章中的文字所在区域在此不做限定,可以是印章的圆弧处具有文字、或者印章的圆弧处与中心处均具有文字。
可选的,待识别的目标图像可以是通过执行图像中印章识别方法的执行主体外接或者内置的图像采集装置获取的待识别的印章所在的图片,如护照、发票等图片上的印章通过图像采集装置获取。也可以是将文件扫描为PDF版本再转换为图片的方式获取待识别的印章所在的图片,如纸质合同、票据等纸上的印章通过扫描再转换的方式获取,还可以是通过网络爬虫的方式获取待识别的印章所在的图片。
示例性的,如图2所示,为某项目合同的文本图片,其中文字为虚构内容,仅作为示例。甲方印章为椭圆形的,仅圆弧处具有文字,且该印章的下面有合同内容,在此命名为印章一;乙方印章为圆形,圆弧及圆心均具有文字,在此命名为印章二。
与现有技术相比,待识别的印章不受印章颜色的限制,极大地提升了该印章识别方法的应用场景。
S102、将目标图像输入预先训练得到的印章检测模型,得到目标图像中的印章位置。
可选的,将目标图像输入到预先训练完成的印章检测模型中,该印章检测模型就可以检测出目标图像中的至少一个印章,并用检测框框出检测到的印章,即检测框框处的区域就是印章位置,则输出印章位置即就是输出检测框的位置信息,检测框的位置信息包括:标识信息、多个边界点,其中标识信息用于识别同一目标图片中的多个检测框,标识信息包括检测框类别以及该检测框属于该类别的得分,其中检测框的类别有seal、word两种类型,seal表示框出印章的检测框,word表示框出印章中横排文字的检测框,而多个边界点用于圈定检测框框出的区域,多个边界点可以是检测框的左上角坐标和右下角坐标。即就是,检测框的位置信息为[class,score,x_min,y_min,x_max,y_max],其中class为检测框类别,score标识检测框为该类别的得分,(x_min,y_min)为检测框的左上角坐标,(x_max,y_max)为检测框的右下角坐标。
可选的,印章检测模型可以采用PP-YOLO算法,PP-YOLO为一种目标检测算法,通过深度卷积神经网络学习印章图片中的深度信息,其中印章图片中标注有印章的位置及印章中横排文字的位置,进而利用深度卷积神经网络的特征不变性,学习到印章的位置及印章中横排文字的位置,最终实现对于任意图片中印章的检测。
具体训练印章检测模型过程如下:步骤1:通过网络爬虫及代码生成若干个圆形及椭圆形的印章,其中圆弧处及印章的中心位置均有文字;步骤2:通过网络爬虫收集文本类图片,而后编写相应代码,将生成的印章图片贴图到文本类图片中,组成含有印章的文本图片;步骤3:使用标注工具,对于批量生成的含有印章的文本图片进行印章位置及印章中横排文字位置的标注,最终形成含有上述位置信息的xml文件,此文件将用于输入深度卷积神经网络训练学习;步骤4:将此类含有印章的图片输入完成学习的深度卷积神经网络中进行训练,同时通过监控输出的值不断调整训练的学习率、迭代次数等参数,进而获得最终的训练结果,即获得预先训练得到的印章检测模型。
需要说明的是,若预先训练得到的印章检测模型未在目标图像中检测到印章,则不需要继续执行后续的印章识别流程,避免不必要的计算操作,提高检测效率。
示例性的,将如图2所示的文本图片输入到训练完成的印章检测模型中,得到如图3所示的文本图片,及印章一的位置信息[seal,9.2,73,510,130,200],印章二的位置信息[seal,7.9,110,607,451,300,]。
与现有技术相比,利用预先训练得到的印章检测模型标定印章区域,避免了漏标和错标问题,并且提高了检查效率,从而提升了印章识别效率。
S103、根据目标图像中的印章位置,从目标图像中截取印章图像。
可选的,印章位置即就是步骤S102中用检测框框出的区域,然后根据检测框的多个边界点,即左上角坐标(x_min,y_min)和右下角坐标(x_max,y_max)截取出印章图像,具体的,以x_min为起点,x_max-x_min为宽,y_min-y_max为高截取印章图像。
示例性的,将如图3所示的文本图片中的印章一截取出来,印章一截取的印章图像如图4所示。
根据训练得到的印章检测模型标定的检测框获取印章位置,进而截取印章图像,极大地减少了截取的印章图像中无关区域的面积,使得下述步骤中遍历印章图像时更加快速,从而提升了印章识别效率。
S104、对印章图像进行变形处理,得到印章图像对应的矩形图像。
可选的,对待识别的目标图像执行步骤S102和步骤S103得到印章图像后,由于大多数印章图像中圆弧处的文字是倾斜的,直接利用光学识别技术识别印章图像中圆弧处的文字,出错率较高。因此,对印章图像中倾斜的文字进行校正再识别能够极大提升印章识别的准确率。
可选的,将印章图像处于极坐标系下,遍历整个印章图像,转换极坐标系下的印章图像到笛卡尔坐标系,将印章图像中椭圆形或者圆形的印章变形为矩形,达到校正印章图像中倾斜文字的目的。
示例性的,将如图4所示印章图像变形为矩形图像,如图5所示,即通过上述方法校正了印章一中圆弧处的文字。
S105、对矩形图像进行图像识别,得到目标图像中所包含的印章的第一文字信息。
可选的,将步骤S104得到的矩形图像输入到光学字符识别系统,或者是调用光学字符识别,利用光学字符识别技术达到识别矩形图像中的文字的目的,并将识别到的文字信息输出到界面和/或存储文字信息的文件中,上述印章中的第一文字信息中的第一是用于与下述从横排文字图像中识别得到的文字信息做区分。示例性的,用光学字符识别技术识别图5中的文字,得到“张三有限公司”。
综上所述,本申请实施例提供了一种图像中印章识别方法,该方法通过将待识别印章所在的图片输入到预先训练完成的印章检测模型中,标定出待识别印章在所在图片中的坐标位置,然后根据坐标位置截取出印章图片,再将印章图像通过坐标系之间的变换对印章图像做变形处理,使得印章图像中的倾斜文字通过坐标转换为矩形图像中端正的横排文字,然后利用光学识别系统识别矩形图像中的横排文字,能够提高识别的准确率。本申请实现了利用深度学习技术,自动标定图片中印章的位置,不受印章颜色的限制,并且校正了印章中倾斜的文字,极大地提升了印章识别的工作效率和准确率以及扩大了印章识别技术的应用场景。
作为一种可选的实施方式,上述步骤S104包括:对印章图像中各像素点进行坐标转换,得到印章图像中各像素点在印章图像以及矩形图像中的坐标映射信息;根据各像素点在印章图像以及矩形图像中的坐标映射信息,为矩形图像中的各像素点赋予像素值,得到印章图像对应的矩形图像。
可选的,在执行步骤S103截取出印章图像之后,以印章图像的中心点为极坐标系的定点O,遍历出印章图像中所有像素点的极坐标和像素点对应的像素值,其中像素值即获取的是像素点的颜色对应的红绿蓝(red、gree、blue,简称RGB)三色值,如红色的RGB为(255、0、0),白色的RGB为(255、255、255),黑色的RGB为(0、0、0),一般红色印章的RGB为(204、0、0),其中红绿蓝分别对应的值最大为255,最小为0。坐标映射信息包括:各像素点在印章图像中的坐标以及对应在矩形图像中的坐标,还包括各像素点的像素值。
可选的,以椭圆形印章图像为例的坐标转换如下:建立极坐标系,以椭圆的中心点为极点O,以椭圆的右长轴为θ=0的正方向,以逆时针方向为θ增大的方向,θ的取值范围为椭圆面上任意一点的极坐标为(ρ,θ),其中ρ为径长,θ为与正方向的夹角,如图6所示。根据极坐标基本定义,将极坐标转换为二维直角坐标的计算公式如下:
x=ρcosθ (1)
y=ρsinθ (2)
可选的,以圆形印章图像为例的坐标转换如下:建立极坐标系,以圆形的中心点为极点O,以圆形的右水平半径方向为θ=0的正方向,以逆时针方向为θ增大的方向,θ的取值范围为圆形面上任意一点的极坐标转换为二维直接坐标的计算公式也是公式(1)和公式(2)。
需要说明的是,极点的位置和正方向可以为印章图像上的任意位置和方向,在此不做限定。在坐标转换之前或者之后,输出用于显示印章图像中文字的矩形框。若印章图像中的印章为椭圆形,将以椭圆形的短轴长度为矩形框的宽的二分之一,椭圆形的外周长为矩形框的长;若印章图像中的印章为圆形,将以圆形的直径为矩形框的宽,圆形的外周长为矩形框的长,其中矩形框处于二维直角坐标系,以矩形框的中心点为原点建立二维直角坐标系。
可选的,当图像中印章识别方法的执行主体将遍历印章图像得到的所有像素点的极坐标转换为二维直角坐标后,将根据像素点的二维直角坐标将像素点显示在矩形框中,然后将从印章图像中获取的像素点的像素值赋予矩形框中的像素点,得到如图5所示的矩形图像。
通过坐标映射使得印章图像中的像素点与矩形图像中的像素点呈一一对应关系,从而使得印章图像中的文字通过坐标转换为矩形图像中的文字之后不会改变字体;而得到坐标映射之后,这时矩形框中只是有了印章图像中像素点对应在矩形框中的位置,此时每个像素点还没有像素值,无法显示文字,因此,通过将印章图像中的各像素点的像素值赋值给对应在矩形框中的各像素点,从而可以在矩形框中显示出文字。
作为一种可选的实施方式,上述步骤S102包括:将目标图像输入预先训练得到的印章检测模型,得到目标图像中的印章位置,以及目标图像中印章内的横排文字位置。
可选的,将目标图像输入到预先训练完成的印章检测模型中,该印章检测模型就可以检测出目标图像中的至少一个印章和印章中的横排文字,并用检测框框出检测到的印章以及印章中的横排文字,即检测框框处的区域就是印章位置和横排文字位置,则输出横排文字位置即就是输出框横排文字的检测框的位置信息,框横排文字的检测框的位置信息与框印章的检测框的位置信息包含的内容相同,其中框横排文字的检测框的类型为word。
示例性的,将如图2所示的文本图片输入到训练完成的印章检测模型中,得到如图7所示的文本图片,及印章一的位置信息[seal,9.2,73,510,130,200],印章二的位置信息[seal,7.9,110,607,451,300,]、[word,8.7,213,491,332,370]。
可选的,对于横排文字的处理方法如下:根据目标图像中印章内的横排文字位置,从目标图像中截取横排文字图像;对横排文字图像进行图像识别,得到目标图像中所包含的印章的第二文字信息。
可选的,在步骤S102中,通过预设的训练得到印章检测模型确定出横排文字位置,如[word,8.7,213,491,332,370],并用检测框标定出横排文字位置,然后根据横排文字的检测框的左上角坐标(213,491)和右下角坐标(332,370)截取出印章图像,具体的,以213为起点,332-213=119为宽,491-370=121为高截取横排文字图像,再将横排文字图像输入到光学字符识别系统,或者是调用光学字符识别,利用光学字符识别技术达到识别横排文字图像中的文字的目的,并将识别到的文字信息输出到界面和/或存储文字信息的文件中,上述印章中的第二文字信息中的第二是用于与上述从印章图像中识别得到的文字信息做区分。
示例性的,将如图7所示的文本图片中的印章二中的横排文字图像截取出来,如图8所示,并用输入到光学字符识别系统得到横排文字图像中的第二文字信息为“专用章”。
需要说明的是,该上述方法是为了从待识别的印章图像中截取出印章中的横排文字图像,直接进行文字识别,无需校正文字。
可选的,对印章图像中各像素点进行坐标转换,得到印章图像中各像素点在印章图像以及矩形图像中的坐标映射信息之前,还包括:根据目标图像中印章内的横排文字位置,将印章图像中横排文字位置上的像素点的像素值更新为预设像素值。
可选的,以如图7所示的印章二为例,用预设的训练得到的印章检测模块确定出印章位置和横排文字位置后,根据印章位置截取出印章图像,根据横排文字位置截取出横排文字图像,由于横排文字图像位于印章图像中,当对印章图像进行步骤S104的变形处理时,而印章图像中的横排文字无需进行变形处理,因此将印章图像中横排文字位置上的像素点的像素值设为白色像素值,如图9所示,其中预设像素值可以为任意像素值,在此不做限定。对于图7所示的印章一中的五角星可以做上述处理,也可以无需做处理。
将印章图像中的横排文字位置的像素点的像素值更新为预设的像素值,避免了对横排文字进行变形导致的在进行印章图像对应的矩形图像的图像识别时输出错误的文字信息。
可选的,对印章图像中各像素点进行坐标转换,得到印章图像中各像素点在印章图像以及矩形图像中的坐标映射信息之前,还包括:对印章图像进行尺寸扩充,得到新的印章图像。
可选的,在上述截取出印章图像之后,由于截取出的印章图像比较小,不利于读取像素点的坐标值和光学字符识别系统识别印章图像中的文字,因此对印章图像进行放大处理,例如扩充到300*300,并且在进行放大处理时,每个像素点对应的像素值不变,使得印章放大后的清晰度不变。
需要说明的是,对于横排文字图像也可以进行尺寸扩充,得到新的横排文字图像。
通过印章图像进行放大处理,有利用对印章图像进行变形处理以及文字识别。
可选的,对印章图像中各像素点进行坐标转换,得到印章图像中各像素点在印章图像以及矩形图像中的坐标映射信息之前,还包括:检测印章图像中具有目标像素值的目标像素点;将目标像素点的像素值更新为预设像素值。
可选的,得到印章图像之后,如图4所示,印章图像中有合同签订日期“2021年6月28日”,为印章识别的干扰信息,影响印章识别的准确率,因此,需要将干扰信息剔除。
可选的,遍历整个印章图像的像素点的像素值,将除了红色像素值与白色像素值之外的像素值作为干扰信息,替换为白色像素值。例如,将像素值为黑色的像素点的像素值变为白色像素值,如图10所示。
需要说明的是,也可以进行检测横排文字图像中具有目标像素值的目标像素点,将目标像素点的像素值更新为预设像素值。
综上所述,本申请实施例提供了一种图像中印章识别方法,该方法通过将待识别印章所在的图片输入到预先训练完成的印章检测模型中,标定出待识别印章在所在图片中的坐标位置和待识别印章中横排文字的坐标位置,再根据坐标位置截取出印章图像和横排文字图像;然后,对印章图像和横排文字图像分别进行放大和干扰信息处理;将处理完成的印章图像中的各像素点的极坐标转换为二维直角坐标,并且给具有二维直角坐标的像素点赋予像素值显示在矩阵框内形成矩形图像,然后对矩形图像进行图像识别得到印章图像中的倾斜文字信息;对于处理完成的横排文字图像直接进行图像识别得到横排文字图像中的文字信息。本申请实现了利用深度学习技术,自动标定图片中印章的位置,不受印章颜色的限制,并且校正了印章中倾斜的文字及剔除了印章图像中的干扰信息,极大地提升了印章识别的工作效率和准确率以及扩大了印章识别技术的应用场景。
图11为本申请实施例提供的一种图像中印章识别装置,该装置包括:
获取模块1101,用于获取待识别的目标图像,目标图像中包括印章;
第一确定模块1102,用于将目标图像输入预先训练得到的印章检测模型,得到目标图像中的印章位置。
截取模块1103,用于根据目标图像中的印章位置,从目标图像中截取印章图像。
第二确定模块1104,用于对印章图像进行变形处理,得到印章图像对应的矩形图像。
第三确定模块1105,用于对矩形图像进行图像识别,得到目标图像中所包含的印章的第一文字信息。
可选的,第二确定模块具体用于对印章图像中各像素点进行坐标转换,得到印章图像中各像素点在印章图像以及矩形图像中的坐标映射信息;根据各像素点在印章图像以及矩形图像中的坐标映射信息,为矩形图像中的各像素点赋予像素值,得到印章图像对应的矩形图像。
一种可能的实施方式中,第一确定模块,具体用于将目标图像输入预先训练得到的印章检测模型,得到目标图像中的印章位置,以及目标图像中印章内的横排文字位置。
一种可能的实施方式中,截取模块,还用于根据目标图像中印章内的横排文字位置,从目标图像中截取横排文字图像;对横排文字图像进行图像识别,得到目标图像中所包含的印章的第二文字信息。
一种可能的实施方式中,第一更新模块,用于根据目标图像中印章内的横排文字位置,将印章图像中横排文字位置上的像素点的像素值更新为预设像素值。
一种可能的实施方式中,第四确定模块,用于对印章图像进行尺寸扩充,得到新的印章图像。
一种可能的实施方式中,第二更新模块,用于检测印章图像中具有目标像素值的目标像素点;将目标像素点的像素值更新为预设像素值。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
本申请实施例还提供了一种计算机设备,如图12所示,为本申请实施例提供的计算机设备结构示意图,包括:处理器1201、存储器1202、和总线1203。存储器1202存储有处理器1201可执行的机器可读指令(比如,图11中的装置中的获取模块1101、第一确定模块1102、截取模块1103、第二确定模块1104、第三确定模块1105对应的执行指令等),当计算机设备运行时,处理器1201与存储器1202之间通过总线1203通信,机器可读指令被处理器1201执行时执行如下处理:
获取待识别的目标图像,所述目标图像中包括印章;
将所述目标图像输入预先训练得到的印章检测模型,得到所述目标图像中的印章位置;
根据所述目标图像中的印章位置,从所述目标图像中截取印章图像;
对所述印章图像进行变形处理,得到所述印章图像对应的矩形图像;
对所述矩形图像进行图像识别,得到所述目标图像中所包含的印章的第一文字信息。
一种可能的实施方式中,处理器1201执行的指令中,对所述印章图像中各像素点进行坐标转换,得到所述印章图像中各像素点在所述印章图像以及所述矩形图像中的坐标映射信息;根据各像素点在所述印章图像以及所述矩形图像中的坐标映射信息,为所述矩形图像中的各像素点赋予像素值,得到所述印章图像对应的矩形图像。
一种可能的实施方式中,处理器1201执行的指令中,将所述目标图像输入预先训练得到的印章检测模型,得到所述目标图像中的印章位置,以及所述目标图像中印章内的横排文字位置。
一种可能的实施方式中,处理器1201执行的指令中,根据所述目标图像中印章内的横排文字位置,从所述目标图像中截取横排文字图像;对所述横排文字图像进行图像识别,得到所述目标图像中所包含的印章的第二文字信息。
一种可能的实施方式中,处理器1201执行的指令中,根据所述目标图像中印章内的横排文字位置,将所述印章图像中横排文字位置上的像素点的像素值更新为预设像素值。
一种可能的实施方式中,处理器1201执行的指令中,对所述印章图像进行尺寸扩充,得到新的印章图像。
一种可能的实施方式中,处理器1201执行的指令中,检测所述印章图像中具有目标像素值的目标像素点;将所述目标像素点的像素值更新为预设像素值。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述图中印章识别方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。
Claims (9)
1.一种图像中印章识别方法,其特征在于,所述方法包括:
获取待识别的目标图像,所述目标图像中包括印章;
将所述目标图像输入预先训练得到的印章检测模型,得到所述目标图像中的印章位置;
根据所述目标图像中的印章位置,从所述目标图像中截取印章图像;
对所述印章图像进行变形处理,得到所述印章图像对应的矩形图像;
对所述矩形图像进行图像识别,得到所述目标图像中所包含的印章的第一文字信息;
所述将所述目标图像输入预先训练得到的印章检测模型,得到所述目标图像中的印章位置,包括:
将所述目标图像输入预先训练得到的印章检测模型,得到所述目标图像中的印章位置,以及所述目标图像中印章内的横排文字位置。
2.根据权利要求1所述的图像中印章识别方法,其特征在于,所述对所述印章图像进行变形处理,得到所述印章图像对应的矩形图像,包括:
对所述印章图像中各像素点进行坐标转换,得到所述印章图像中各像素点在所述印章图像以及所述矩形图像中的坐标映射信息;
根据各像素点在所述印章图像以及所述矩形图像中的坐标映射信息,为所述矩形图像中的各像素点赋予像素值,得到所述印章图像对应的矩形图像。
3.根据权利要求1所述的图像中印章识别方法,其特征在于,所述方法还包括:
根据所述目标图像中印章内的横排文字位置,从所述目标图像中截取横排文字图像;
对所述横排文字图像进行图像识别,得到所述目标图像中所包含的印章的第二文字信息。
4.根据权利要求2所述的图像中印章识别方法,其特征在于,所述对所述印章图像中各像素点进行坐标转换,得到所述印章图像中各像素点在所述印章图像以及所述矩形图像中的坐标映射信息之前,还包括:
根据所述目标图像中印章内的横排文字位置,将所述印章图像中横排文字位置上的像素点的像素值更新为预设像素值。
5.根据权利要求2-4任一项所述的图像中印章识别方法,其特征在于,所述对所述印章图像中各像素点进行坐标转换,得到所述印章图像中各像素点在所述印章图像以及所述矩形图像中的坐标映射信息之前,还包括:
对所述印章图像进行尺寸扩充,得到新的印章图像。
6.根据权利要求2-4任一项所述的图像中印章识别方法,其特征在于,对所述印章图像中各像素点进行坐标转换,得到所述印章图像中各像素点在所述印章图像以及所述矩形图像中的坐标映射信息之前,还包括:
检测所述印章图像中具有目标像素值的目标像素点;
将所述目标像素点的像素值更新为预设像素值。
7.一种图像中印章识别装置,其特征在于,所述装置包括:
获取模块,用于获取待识别的目标图像,所述目标图像中包括印章;
第一确定模块,用于将所述目标图像输入预先训练得到的印章检测模型,得到所述目标图像中的印章位置;
截取模块,用于根据所述目标图像中的印章位置,从所述目标图像中截取印章图像;
第二确定模块,用于对所述印章图像进行变形处理,得到所述印章图像对应的矩形图像;
第三确定模块,用于对所述矩形图像进行图像识别,得到所述目标图像中所包含的印章的第一文字信息;
第一确定模块,还用于将所述目标图像输入预先训练得到的印章检测模型,得到所述目标图像中的印章位置,以及所述目标图像中印章内的横排文字位置。
8.一种计算机设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如权利要求1至6任一所述的图像中印章识别的方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至6任一所述的图像中印章识别的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110950515.8A CN113627432A (zh) | 2021-08-18 | 2021-08-18 | 图像中印章识别方法、装置、计算机设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110950515.8A CN113627432A (zh) | 2021-08-18 | 2021-08-18 | 图像中印章识别方法、装置、计算机设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113627432A true CN113627432A (zh) | 2021-11-09 |
Family
ID=78386416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110950515.8A Pending CN113627432A (zh) | 2021-08-18 | 2021-08-18 | 图像中印章识别方法、装置、计算机设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113627432A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114782957A (zh) * | 2022-04-26 | 2022-07-22 | 中国建设银行股份有限公司 | 确定印章图像中文本信息的方法、装置、电子设备和介质 |
CN116757886A (zh) * | 2023-08-16 | 2023-09-15 | 南京尘与土信息技术有限公司 | 数据分析方法及分析装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657666A (zh) * | 2018-11-23 | 2019-04-19 | 汉王科技股份有限公司 | 一种圆形印章识别方法及装置 |
CN111767911A (zh) * | 2020-06-22 | 2020-10-13 | 平安科技(深圳)有限公司 | 面向复杂环境的印章文字检测识别方法、装置及介质 |
CN111950555A (zh) * | 2020-08-17 | 2020-11-17 | 北京字节跳动网络技术有限公司 | 文本识别方法、装置、可读介质及电子设备 |
CN112766275A (zh) * | 2021-04-08 | 2021-05-07 | 金蝶软件(中国)有限公司 | 印章文字识别方法、装置、计算机设备和存储介质 |
-
2021
- 2021-08-18 CN CN202110950515.8A patent/CN113627432A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657666A (zh) * | 2018-11-23 | 2019-04-19 | 汉王科技股份有限公司 | 一种圆形印章识别方法及装置 |
CN111767911A (zh) * | 2020-06-22 | 2020-10-13 | 平安科技(深圳)有限公司 | 面向复杂环境的印章文字检测识别方法、装置及介质 |
CN111950555A (zh) * | 2020-08-17 | 2020-11-17 | 北京字节跳动网络技术有限公司 | 文本识别方法、装置、可读介质及电子设备 |
CN112766275A (zh) * | 2021-04-08 | 2021-05-07 | 金蝶软件(中国)有限公司 | 印章文字识别方法、装置、计算机设备和存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114782957A (zh) * | 2022-04-26 | 2022-07-22 | 中国建设银行股份有限公司 | 确定印章图像中文本信息的方法、装置、电子设备和介质 |
CN116757886A (zh) * | 2023-08-16 | 2023-09-15 | 南京尘与土信息技术有限公司 | 数据分析方法及分析装置 |
CN116757886B (zh) * | 2023-08-16 | 2023-11-28 | 南京尘与土信息技术有限公司 | 数据分析方法及分析装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019169772A1 (zh) | 图片处理方法、电子装置及存储介质 | |
CN113627432A (zh) | 图像中印章识别方法、装置、计算机设备及可读存储介质 | |
EP2772871A2 (en) | Creating tables with handwriting images, symbolic representations and media images from forms | |
CN114155546B (zh) | 一种图像矫正方法、装置、电子设备和存储介质 | |
WO2021051527A1 (zh) | 基于图像分割的文字定位方法、装置、设备及存储介质 | |
CN109242856A (zh) | 一种纸质作业电子化批阅方法及装置 | |
CN111340020B (zh) | 一种公式识别方法、装置、设备及存储介质 | |
CN111626292B (zh) | 一种基于深度学习技术的楼宇指示标识的文字识别方法 | |
CN107358184A (zh) | 文档文字的提取方法及提取装置 | |
CN115063802A (zh) | 一种基于PSENet的圆形印章识别方法、设备及介质 | |
CN112396047B (zh) | 训练样本生成方法、装置、计算机设备和存储介质 | |
CN113221897B (zh) | 图像矫正方法、图像文本识别方法、身份验证方法及装置 | |
CN111783763A (zh) | 基于卷积神经网络的文本定位框校正方法及其系统 | |
CN111274863A (zh) | 一种基于文本山峰概率密度的文本预测方法 | |
CN113743360B (zh) | 智能化印章解析的方法和装置 | |
CN115188016A (zh) | 一种表格文档比对识别方法及装置 | |
CN115457559A (zh) | 一种将文本及证照类图片智能摆正的方法、装置和设备 | |
JPH07168910A (ja) | 文書レイアウト解析装置及び文書フォ−マット識別装置 | |
CN111401365B (zh) | Ocr图像自动生成方法及装置 | |
CN112765646A (zh) | 一种艺术测评中书画录入及匿名阅卷方法及系统 | |
CN118609152B (zh) | 一种学生作业智能批改方法及系统 | |
CN113255613B (zh) | 判题方法、装置及计算机存储介质 | |
CN113920513B (zh) | 基于自定义通用模板的文本识别方法及设备 | |
CN112700413B (zh) | 答题卡异常检测方法、装置、电子设备及存储介质 | |
CN112825141B (zh) | 识别文本的方法、装置、识别设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211109 |