CN111814716A - 印章去除方法、计算机设备和可读存储介质 - Google Patents

印章去除方法、计算机设备和可读存储介质 Download PDF

Info

Publication number
CN111814716A
CN111814716A CN202010689598.5A CN202010689598A CN111814716A CN 111814716 A CN111814716 A CN 111814716A CN 202010689598 A CN202010689598 A CN 202010689598A CN 111814716 A CN111814716 A CN 111814716A
Authority
CN
China
Prior art keywords
pixel
seal
category
label classification
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010689598.5A
Other languages
English (en)
Inventor
于洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Eye Control Technology Co Ltd
Original Assignee
Shanghai Eye Control Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Eye Control Technology Co Ltd filed Critical Shanghai Eye Control Technology Co Ltd
Priority to CN202010689598.5A priority Critical patent/CN111814716A/zh
Publication of CN111814716A publication Critical patent/CN111814716A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及一种印章去除方法、计算机设备和可读存储介质,该方法包括:将原始文本图像中的印章区域图像输入预设的像素多标签分类模型,得到印章区域图像中每个像素点的多标签分类类别;该分类类别包括印章类别和字印重叠类别;对于印章区域图像,将多标签分类类别为字印重叠类别的像素点的像素值设置为第一像素值,将多标签分类类别为印章类别的像素点的像素值设置为第二像素值,得到目标区域图像;将原始文本图像中的印章区域图像替换为目标区域图像。该方法能够将印章和字符明显的区分开来,同时提高了对印章和字符重叠部分的印章去除效果。

Description

印章去除方法、计算机设备和可读存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种印章去除方法、计算机设备和可读存储介质。
背景技术
在光学字符识别(Optical Character Recognition,OCR)领域,通常是由电子设备(例如扫描仪)扫描纸张上的内容(如字符等),保存为图像格式,如扫描表单、证件等;然后采用计算机设备识别扫描得到的图像上的字符,以进行后续的字符验证等工作。
在一些场景中,经常会出现印章印在了待识别字符上,导致无法检测到文字或误识别文字,因此需要将印章去除来提高计算机设备识别字符的准确性。传统技术中,通常是采用训练收敛的网络模型,对扫描图像中的印章区域图像进行识别处理,以去除印章区域中的印章。
但是,传统技术的印章去除方法对印章和字符重叠的部分,其去除效果不佳。
发明内容
基于此,有必要针对传统技术中对印章和字符重叠的部分,印章去除效果不佳的问题,提供一种印章去除方法、计算机设备和可读存储介质。
一种印章去除方法,该方法包括:
将原始文本图像中的印章区域图像输入预设的像素多标签分类模型,得到印章区域图像中每个像素点的多标签分类类别;该多标签分类类别包括印章类别和字印重叠类别;
对于印章区域图像,将多标签分类类别为字印重叠类别的像素点的像素值设置为第一像素值,将多标签分类类别为印章类别的像素点的像素值设置为第二像素值,得到目标区域图像;
将原始文本图像中的印章区域图像替换为目标区域图像。
在其中一个实施例中,将原始文本图像中的印章区域图像输入预设的像素多标签分类模型,得到印章区域图像中每个像素点的多标签分类类别,包括:
将印章区域图像输入像素多标签分类模型,得到印章区域图像中每个像素点属于各多标签分类类别的概率;
根据每个像素点属于各多标签分类类别的概率,确定每个像素点的多标签分类类别。
在其中一个实施例中,根据每个像素点属于各多标签分类类别的概率,确定每个像素点的多标签分类类别,包括:
针对每个像素点,若像素点属于第一分类类别的概率大于预设阈值、且属于第二分类类别的概率不大于预设阈值,将第一分类类别作为像素点的多标签分类类别;其中,第一分类类别为各多标签分类类别中的一个类别,第二分类类别为各多标签分类类别中的另一个类别。
在其中一个实施例中,多标签分类类别还包括字符类别,第一像素值为字符类别对应的像素点的平均像素值。
在其中一个实施例中,多标签分类类别还包括背景类别;第二像素值的计算方式包括:
计算背景类别对应的所有像素点的平均像素值;
针对印章类别对应的每个印章像素点,根据平均像素值和平均像素值对应的权重、以及印章像素点的像素值和印章像素点的像素值对应的权重,计算印章像素点对应的第二像素值。
在其中一个实施例中,上述像素多标签分类模型的训练方式包括:
获取样本印章图像和所述样本印章图像的像素多标签分类标签;
将样本印章图像输入初始像素多标签分类网络,得到样本印章图像中每个像素点属于各多标签分类类别的预测概率;
采用损失函数计算预测概率与像素多标签分类标签对应的标签概率之间的损失,根据损失对初始像素多标签分类网络进行训练,得到像素多标签分类模型。
在其中一个实施例中,上述像素多标签分类模型的激活函数为sigmoid激活函数,损失函数为二分类交叉熵损失函数。
在其中一个实施例中,上述方法还包括:
将原始文本图像输入预设的印章检测模型,得到印章区域在原始文本图像中的位置坐标;
根据印章区域在原始文本图像中的位置坐标,从原始文本图像中获取印章区域图像。
一种印章去除装置,该装置包括:
分类模块,用于将原始文本图像中的印章区域图像输入预设的像素多标签分类模型,得到印章区域图像中每个像素点的多标签分类类别;该多标签分类类别包括印章类别和字印重叠类别;
像素设置模块,用于对于印章区域图像,将多标签分类类别为字印重叠类别的像素点的像素值设置为第一像素值,将多标签分类类别为印章类别的像素点的像素值设置为第二像素值,得到目标区域图像;
替换模块,用于将原始文本图像中的印章区域图像替换为目标区域图像。
一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行该计算机程序时实现以下步骤:
将原始文本图像中的印章区域图像输入预设的像素多标签分类模型,得到印章区域图像中每个像素点的多标签分类类别;该多标签分类类别包括印章类别和字印重叠类别;
对于印章区域图像,将多标签分类类别为字印重叠类别的像素点的像素值设置为第一像素值,将多标签分类类别为印章类别的像素点的像素值设置为第二像素值,得到目标区域图像;
将原始文本图像中的印章区域图像替换为目标区域图像。
一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以下步骤:
将原始文本图像中的印章区域图像输入预设的像素多标签分类模型,得到印章区域图像中每个像素点的多标签分类类别;该多标签分类类别包括印章类别和字印重叠类别;
对于印章区域图像,将多标签分类类别为字印重叠类别的像素点的像素值设置为第一像素值,将多标签分类类别为印章类别的像素点的像素值设置为第二像素值,得到目标区域图像;
将原始文本图像中的印章区域图像替换为目标区域图像。
上述印章去除方法、装置、计算机设备和可读存储介质,能够将原始文本图像中的印章区域输入预设的像素多标签分类模型,得到印章区域中每个像素点的多标签分类类别;然后对于印章区域图像,将多标签分类类别为字印重叠类别的像素点的像素值设置为第一像素值,将多标签分类类别为印章类别的像素点的像素值设置为第二像素值,得到目标区域图像;最后将原始文本图像中的印章区域图像替换为目标区域图像;其中,上述多标签分类类别包括印章类别和字印重叠类别,即可以将印章像素点以及印章和字符重叠的像素点分类出来,将印章和字符重叠的像素点设置为第一像素值,并将仅为印章类别的像素点设置为第二像素值,由此可将印章和字符明显的区分开来,且同时提高了对印章和字符重叠部分的印章去除效果,以在后续进行字符识别时提高字符识别的准确性。
附图说明
图1为一个实施例中计算机设备的内部结构图;
图2为一个实施例中印章去除方法的流程示意图;
图2a为一个实施例中印章去除过程的效果展示示意图;
图3为另一个实施例中印章去除方法的流程示意图;
图4为又一个实施例中印章去除方法的流程示意图;
图5为一个实施例中像素分类模型训练过程的流程示意图;
图6为又一个实施例中印章去除方法的流程示意图;
图7为又一个实施例中印章去除方法的流程示意图;
图8为一个实施例中印章去除装置的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的印章去除方法,可以适用于如图1所示的计算机设备。该计算机设备包括通过系统总线连接的处理器、存储器,该存储器中存储有计算机程序,处理器执行该计算机程序时可以执行下述方法实施例的步骤。可选地,该计算机设备还可以包括通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器,该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端通过网络连接通信。可选地,该计算机设备可以是个人计算机(personal computer,简称PC),还可以是个人数字助理,还可以是其他的终端设备,例如平板电脑(portable android device,简称PAD)、手机等等,还可以是云端或者远程服务器,本申请实施例对计算机设备的具体形式并不做限定。
在一个实施例中,如图2所示,提供了一种印章去除方法,本实施例涉及的是对原始文本图像中印章区域的印章进行去除的具体过程。以该方法应用于图1中的计算机设备为例进行说明,包括以下步骤:
S101,将原始文本图像中的印章区域图像输入预设的像素多标签分类模型,得到印章区域图像中每个像素点的多标签分类类别;该多标签分类类别包括印章类别和字印重叠类别。
其中,原始文本图像可以为由电子设备(如扫描仪)扫描纸张所得到的图像,该原始文本图像中具有印章区域;通常情况下,印章的颜色与文字颜色或背景颜色是不同的,多数为红色印章,则计算机设备可以根据原始文本图像中各个像素点的像素值进行区分识别,以确定原始文本图像中的印章区域,并将印章区域截取下来作为印章区域图像。
具体地,计算机设备可以将得到的印章区域图像输入预设的像素多标签分类模型,该像素多标签分类模型用于对印章区域图像中的每个像素点进行分类,以得到每个像素点的多标签分类类别。其中,该多标签分类类别用于表征像素点的归属类别,包括印章类别和字印重叠类别,即表示该像素点是属于印章像素点、还是属于印章和字符重叠的像素点。需要说明的是,本实施例中像素点的分类为多标签分类,可以将像素点的实际类别都分类出来。
可选地,上述像素多标签分类模型可以为神经网络模型,如全卷积神经网路;可选地,该像素多标签分类模型可以采用AlexNet作为骨干网络,并使用多通道(如2通道分别代表印章、文字)输出像素点的多标签分类类别。
S102,对于印章区域图像,将多标签分类类别为字印重叠类别的像素点的像素值设置为第一像素值,将多标签分类类别为印章类别的像素点的像素值设置为第二像素值,得到目标区域图像。
具体地,在实际场景中,上述印章区域图像中像素点的多标签分类类别一般包括印章类别(仅为印章)和字印重叠类别(印章和字符重叠)。在去除印章后,字符需要保留完整,那么字印重叠类别的像素点需要作为字符形式保留。因此,计算机设备可以将多标签分类类别为字印重叠类别的像素点的像素值设置为第一像素值,其中,该第一像素值可以为预设像素值,如可以设置为代表黑色或深灰色的像素值,也可以设置为原始文本图像中字符颜色对应的像素值。然后,将多标签分类类别为印章类别的像素点的像素值设置为第二像素值,即将只属于印章类别的像素点设置为第二像素值;其中,该第二像素值可以为根据背景像素点的像素值计算所得到的,即将印章类别的像素点的像素值设置为接近背景像素点的颜色,由此便将印章部分的像素值全部替换完成;可选地,上述背景像素点可以为原始文本图像中的背景像素点。计算机设备将像素值变换后的图像作为目标区域图像,该目标区域图像与印章区域图像尺寸相同。
可选地,上述第一像素值可以为0,即rnew_roi=0,gnew_roi=0,bnew_roi=0,其中(rnew_roi,gnew_roi,bnew_roi)为目标区域图像中像素点对应的像素值。可选地,第二像素值可以为对背景像素点的像素值进行排序后,选取的位于中间位置的像素值,即将印章区域图像中的印章部分替换为类似背景的显示效果,以去除印章。可选地,对于背景像素点,计算机设备可以不改变其像素值,即rnew_roi=rroi,gnew_roi=groi,bnew_roi=broi,其中(rroi,groi,broi)为印章区域图像中像素点对应的像素值。可选地,计算机设备还可以调用文字彩色图像恢复算法,根据每个像素点的多标签分类类别得到目标区域图像。
S103,将原始文本图像中的印章区域图像替换为目标区域图像。
具体地,得到上述目标区域图像后,因该目标区域图像与印章区域图像大小相同,则计算机设备便可以直接将原始文本图像中的印章区域图像替换为该目标区域图像,以完成整个印章去除过程。可选地,计算机设备可以将原始文本图像中的印章区域图像进行剪裁,并将目标区域图像填充进去,以完成替换过程。关于印章去除过程的效果展示图,可以参见图2a所示的示意图。
本实施例提供的印章去除方法,计算机设备将原始文本图像中的印章区域输入预设的像素多标签分类模型,得到印章区域中每个像素点的多标签分类类别;然后对于印章区域图像,将多标签分类类别为字印重叠类别的像素点的像素值设置为第一像素值,将多标签分类类别为印章类别的像素点的像素值设置为第二像素值,得到目标区域图像;最后将原始文本图像中的印章区域图像替换为目标区域图像;其中,上述多标签分类类别包括印章类别和字印重叠类别,即可以将印章像素点以及印章和字符重叠的像素点分类出来,将印章和字符重叠的像素点设置为第一像素值,并将仅为印章类别的像素点设置为第二像素值,由此可将印章和字符明显的区分开来,且同时提高了对印章和字符重叠部分的印章去除效果,以在后续进行字符识别时提高字符识别的准确性。
在一个实施例中,涉及的是将印章区域图像输入像素多标签分类模型,得到每个像素点的多标签分类类别的具体过程。可选地,如图3所示,上述S101可以包括:
S201,将印章区域图像输入像素多标签分类模型,得到印章区域图像中每个像素点属于各多标签分类类别的概率。
具体地,计算机设备将印章区域图像输入像素多标签分类模型中,通过像素多标签分类模型中卷积层、池化层、全连接层的处理,并经由激活函数输出每个像素点属于各多标签分类类别的概率。可选地,该像素多标签分类模型采用的激活函数为sigmoid函数,输出的为像素点属于印章类别的概率、属于字符类别的概率。
S202,根据每个像素点属于各多标签分类类别的概率,确定每个像素点的多标签分类类别。
具体地,对于每个像素点,计算机设备可以根据其属于各多标签分类类别的概率,确定最终的多标签分类类别。可选地,计算机设备可以设置一个预设阈值,若像素点属于第一分类类别的概率大于该预设阈值,且属于第二分类类别的概率不大于该预设阈值,则可以将第一分类类别作为该像素点的多标签分类类别;其中,第一分类类别为各多标签分类类别中的一个类别,第二分类类别为各多标签分类类别中的另一个类别。
示例性的,设定的预设阈值为0.5,对于像素点A,假设得到的A属于(印章、字符)的概率分别为(0.9、0.1),可以得知,A属于印章类别(即第一分类类别)的概率0.9大于预设阈值,属于字符类别(即第二分类类别)的概率不大于预设阈值,则可以将印章类别作为该像素点的多标签分类类别。对于像素点B,假设得到的B属于(印章、字符)的概率分别为(0.6、0.7),可以得知,B属于印章类别和属于字符类别(即第一分类类别)的概率都大于预设阈值,则可以将字印重叠类别作为该像素点的多标签分类类别,即该像素点为印章和字符重叠的部分。
本实施例提供的印章去除方法,计算机设备将印章区域图像输入像素多标签分类模型,可以得到印章区域图像中每个像素点属于各多标签分类类别的概率,并根据每个像素点属于各多标签分类类别的概率,确定每个像素点的多标签分类类别。由此,通过像素多标签分类模型的计算处理,可大大提高得到的像素点属于各多标签分类类别的概率,进而更好的将印章和字符区分开来,进一步提高印章和字符重叠区域印章去除的效果。
在一个实施例中,上述多标签分类类别还可以包括字符类别,则计算机设备可以将该字符类别对应的像素点的平均像素值作为第一像素值,并将字印重叠类别的像素点的像素值设置为该第一像素值。由此可将字印重叠的像素点替换为类似字符像素点的效果,降低此区域替换后的突兀感。
在一个实施例中,上述多标签分类类别还可以包括背景类别,则计算机设备还可以根据背景类别的像素点的平均像素值确定上述第二像素值。可选地,如图4所示,上述第二像素点的计算方式包括:
S301,计算背景类别对应的所有像素点的平均像素值。
具体地,背景类别对应的像素点可以为上述背景像素点,通过遍历上述印章区域图像,计算机设备可以确定所有背景类别对应的像素点,并计算这些像素点的像素值之和,然后将该像素值之和与该类像素点个数进行求商操作,将求商结果作为平均像素值。
其中,可以设置两个变量sum_rgb_back(表示像素值之和)、nuback(表示背景类别的像素点个数);首先上述两个变量初始值为0,开始逐像素点遍历印章区域图像,若遍历到背景类别的像素点C,则更新sum_rgb_back=sum_rgb_back+rc+gc+bc,num_back=num_back+1;遍历完印章区域图像的所有像素点后,通过ave_back=sum_rgb_back/num_back的关系式求得平均像素值ave_back。
S302,针对印章类别对应的每个印章像素点,根据平均像素值和平均像素值对应的权重、以及印章像素点的像素值和印章像素点的像素值对应的权重,计算印章像素点对应的第二像素值。
具体地,针对印章类别对应的每个印章像素点,计算机设备可以根据包含平均像素值和平均像素值对应的权重、印章像素点的像素值和该印章像素点的像素值对应的权重的关系式,计算该印章像素点对应的第二像素值。
可选地,计算机设备可以根据
Figure BDA0002588835560000111
的关系式计算上述第二像素值,其中λ为权重因子;优选地,λ取值为0.05,当然也可以根据实际场景进行相应的调整。可选地,计算机设备还可以根据包含
Figure BDA0002588835560000112
的其他关系式计算上述第二像素值。
本实施例提供的印章去除方法,计算机设备首先计算背景类别对应的所有像素点的平均像素值,然后根据平均像素值和平均像素值对应的权重、以及印章像素点的像素值和该印章像素点的像素值对应的权重,计算印章像素点对应的第二像素值。通过印章像素点自身的像素值和背景像素点的像素值,来确定印章像素点的第二像素值,可以使得印章像素点区域的显示效果和背景区域更融合,减少突兀感。
通常,在使用多标签像素分类模型之前,还需对该模型进行训练以提高模型精度,可选地,如图5所示,上述像素多标签分类模型的训练方式包括:
S401,获取样本印章图像和样本印章图像的像素多标签分类标签。
具体地,计算机设备可以获取大量带有印章的文本图像,并从中截取样本印章图像,然后采用标记工具对每个样本印章图像进行逐像素标记,得到每个样本印章图像的像素多标签分类标签。例如,如果是背景则标记为类别0,如果是印章标记为类别1,如果文字标记为类别2,如果是印章和文字的重叠区域,则标记为类别1和类别2。
S402,将样本印章图像输入初始像素多标签分类网络,得到样本印章图像中每个像素点属于各多标签分类类别的预测概率。
具体地,计算机设备将样本印章图像输入初始像素多标签分类网络,可以得到样本印章图像中每个像素点属于各多标签分类类别的预测概率,该处理过程可以参见上述实施例的描述,在此不再赘述。
可选地,初始像素多标签分类网络可以为AlexNet网络,计算机设备还可以先使用COCO训练集对该网络进行预训练得到基础模型,然后在该基础模型的基础上使用样本印章图像进行训练。
S403,采用损失函数计算预测概率与像素多标签分类标签对应的标签概率之间的损失,根据损失对初始像素多标签分类网络进行训练,得到像素多标签分类模型。
其中,像素多标签分类标签对应的标签概率可以理解为:对于一个像素点,若其标注的像素多标签分类标签为类别0(即背景类别),则其对应的标签概率(印章、字符、背景)为(0,0,1),即背景类别的概率为1,其余的类别为0;若其标注的像素多标签分类标签为类别1(即印章类别),则其对应的标签概率(印章、字符、背景)为(1,0,0),即印章类别的概率为1,其余的类别为0;其他的标签概率原理类似。然后计算机设备采用损失函数计算上述预测概率与像素多标签分类标签对应的标签概率之间的损失,根据该损失对初始像素多标签分类网络进行训练,得到上述像素多标签分类模型。可选地,训练过程中,可以设置基础学习率为0.0001,权重衰减系数(weight decay)为0.0001,momentum动量为0.99,优化算法采用RMSprop。
可选地,初始像素多标签分类模型的激活函数为sigmoid激活函数,输出的预测概率为
Figure BDA0002588835560000131
其中,w为样本印章图像的宽,h为样本印章图像的高,k为分类类别数。可选地,所采用的损失函数为二分类交叉熵损失函数,可以采用包含
Figure BDA0002588835560000132
的关系式计算上述损失,其中tijc为对应的标签概率。
本实施例提供的印章去除方法,计算机设备将样本印章图像输入初始像素多标签分类网络,得到样本印章图像中每个像素点属于各多标签分类类别的预测概率,并采用损失函数计算预测概率与像素多标签分类标签对应的标签概率之间的损失,根据该损失对初始像素多标签分类网络进行训练,以得到收敛的像素多标签分类模型。由此,通过训练得到精度较高的像素多标签分类模型,以提高得到的每个像素点多标签分类类别的准确性,进而提高印章的去除效果。
在一个实施例中,上述印章区域图像可以采用印章检测模型处理得到。可选地,如图6所示,上述方法还包括:
S501,将原始文本图像输入预设的印章检测模型,得到印章区域在原始文本图像中的位置坐标。
具体地,计算机设备可以将原始文本图像输入印章检测模型,该印章检测模型可以基于RetinaNet框架实现,该框架使用ResNet作为骨干网络,然后接特征金字塔网络获取多尺度特征,并对得到的多尺度特征做特征通道方向上的Concat操作,再分别连接分类子网络和回归子网络,经过后处理得到印章区域在原始文本图像中的位置坐标。可选地,该位置坐标可以为外接印章区域的矩形框坐标,除此之外,还可以得到印章的类别,如圆形章、矩形章等。
可选地,上述印章检测模型的训练方式可以包括:获取大量包含印章的文本图像,使用标记工具标记其中印章的水平外接矩形框的坐标,并记录相应的类别标签,其中类别标签包含三类:圆章、矩形章以及背景。然后采用COCO训练集预训练ResNet网络作为基础模型,并将上述标注的训练数据输入基础模型进行训练,以得到收敛的印章检测模型。在训练过程中,设置基础学习率为0.001,weight decay为0.0001,momentum动量为0.99,优化算法使用RMSprop。
S502,根据印章区域在原始文本图像中的位置坐标,从原始文本图像中获取印章区域图像。
具体地,计算机设备得到印章区域在原始文本图像中的位置坐标后,便可根据该位置坐标,从原始文本图像中截取或剪裁以获取对应的印章区域图像。
本实施例提供的印章去除方法,计算机设备将原始文本图像输入预设的印章检测模型,得到印章区域在原始文本图像中的位置坐标,再根据印章区域在原始文本图像中的位置坐标,从原始文本图像中获取得到印章区域图像。通过采用印章检测模型得到印章区域的位置坐标,可大大提高得到的印章区域图像的准确性,同时为后续的印章去除过程提供准确的数据基础。
为更好理解印章去除方法的整个过程,下面以一个整体实施例方式对该方法进行介绍。如图7所示,该方法包括:
S601,将原始文本图像输入预设的印章检测模型,得到印章区域在原始文本图像中的位置坐标;
S602,根据印章区域在原始文本图像中的位置坐标,从原始文本图像中获取印章区域图像;
S603,将印章区域图像输入像素多标签分类模型,得到印章区域图像中每个像素点属于各多标签分类类别的概率;
S604,根据每个像素点属于各多标签分类类别的概率,确定每个像素点的多标签分类类别;
S605,对于印章区域图像,将多标签分类类别为字印重叠类别的像素点的像素值设置为第一像素值,将多标签分类类别为印章类别的像素点的像素值设置为第二像素值,得到目标区域图像;
S606,将原始文本图像中的印章区域图像替换为目标区域图像。
关于各步骤的实现过程可以参见上述实施例的描述,其实现原理和技术效果类似,在此不再赘述。
应该理解的是,虽然图2-图7的流程图中各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-图7中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图8所示,提供了一种印章去除装置,包括:分类模块11、像素设置模块12和替换模块13。
具体地,分类模块11,用于将原始文本图像中的印章区域图像输入预设的像素多标签分类模型,得到印章区域图像中每个像素点的多标签分类类别;该多标签分类类别包括印章类别和字印重叠类别;
像素设置模块12,用于对于印章区域图像,将多标签分类类别为字印重叠类别的像素点的像素值设置为第一像素值,将多标签分类类别为印章类别的像素点的像素值设置为第二像素值,得到目标区域图像;
替换模块13,用于将原始文本图像中的印章区域图像替换为目标区域图像。
本实施例提供的印章去除装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在一个实施例中,分类模块11,具体用于将印章区域图像输入像素多标签分类模型,得到印章区域图像中每个像素点属于各多标签分类类别的概率;根据每个像素点属于各多标签分类类别的概率,确定每个像素点的多标签分类类别。
在一个实施例中,分类模块11,具体用于针对每个像素点,若像素点属于第一分类类别的概率大于预设阈值、且属于第二分类类别的概率不大于预设阈值,将第一分类类别作为像素点的多标签分类类别;其中,第一分类类别为各多标签分类类别中的一个类别,第二分类类别为各多标签分类类别中的另一个类别。
在一个实施例中,多标签分类类别还包括字符类别,第一像素值为字符类别对应的像素点的平均像素值。
在一个实施例中,多标签分类类别还包括背景类别;上述像素设置模块12,还用于计算背景类别对应的所有像素点的平均像素值;针对印章类别对应的每个印章像素点,根据平均像素值和平均像素值对应的权重、以及印章像素点的像素值和印章像素点的像素值对应的权重,计算印章像素点对应的第二像素值。
在一个实施例中,上述装置还包括训练模块,用于获取样本印章图像和所述样本印章图像的像素多标签分类标签;将样本印章图像输入初始像素多标签分类网络,得到样本印章图像中每个像素点属于各多标签分类类别的预测概率;采用损失函数计算预测概率与像素多标签分类标签对应的标签概率之间的损失,根据损失对初始像素多标签分类网络进行训练,得到像素多标签分类模型。
在一个实施例中,上述像素多标签分类模型的激活函数为sigmoid激活函数,损失函数为二分类交叉熵损失函数。
在一个实施例中,上述装置还包括印章检测模块,用于将原始文本图像输入预设的印章检测模型,得到印章区域在原始文本图像中的位置坐标;根据印章区域在原始文本图像中的位置坐标,从原始文本图像中获取印章区域图像。
本实施例提供的印章去除装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
关于印章去除装置的具体限定可以参见上文中对于印章去除方法的限定,在此不再赘述。上述印章去除装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图1所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种印章去除方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
将原始文本图像中的印章区域图像输入预设的像素多标签分类模型,得到印章区域图像中每个像素点的多标签分类类别;该多标签分类类别包括印章类别和字印重叠类别;
对于印章区域图像,将多标签分类类别为字印重叠类别的像素点的像素值设置为第一像素值,将多标签分类类别为印章类别的像素点的像素值设置为第二像素值,得到目标区域图像;
将原始文本图像中的印章区域图像替换为目标区域图像。
本实施例提供的计算机设备,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将印章区域图像输入像素多标签分类模型,得到印章区域图像中每个像素点属于各多标签分类类别的概率;
根据每个像素点属于各多标签分类类别的概率,确定每个像素点的多标签分类类别。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
针对每个像素点,若像素点属于第一分类类别的概率大于预设阈值、且属于第二分类类别的概率不大于预设阈值,将第一分类类别作为像素点的多标签分类类别;其中,第一分类类别为各多标签分类类别中的一个类别,第二分类类别为各多标签分类类别中的另一个类别。
在一个实施例中,多标签分类类别还包括字符类别,第一像素值为字符类别对应的像素点的平均像素值。
在一个实施例中,多标签分类类别还包括背景类别;处理器执行计算机程序时还实现以下步骤:
计算背景类别对应的所有像素点的平均像素值;
针对印章类别对应的每个印章像素点,根据平均像素值和平均像素值对应的权重、以及印章像素点的像素值和印章像素点的像素值对应的权重,计算印章像素点对应的第二像素值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取样本印章图像和所述样本印章图像的像素多标签分类标签;
将样本印章图像输入初始像素多标签分类网络,得到样本印章图像中每个像素点属于各多标签分类类别的预测概率;
采用损失函数计算预测概率与像素多标签分类标签对应的标签概率之间的损失,根据损失对初始像素多标签分类网络进行训练,得到像素多标签分类模型。
在一个实施例中,上述像素多标签分类模型的激活函数为sigmoid激活函数,损失函数为二分类交叉熵损失函数。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将原始文本图像输入预设的印章检测模型,得到印章区域在原始文本图像中的位置坐标;
根据印章区域在原始文本图像中的位置坐标,从原始文本图像中获取印章区域图像。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
将原始文本图像中的印章区域图像输入预设的像素多标签分类模型,得到印章区域图像中每个像素点的多标签分类类别;该多标签分类类别包括印章类别和字印重叠类别;
对于印章区域图像,将多标签分类类别为字印重叠类别的像素点的像素值设置为第一像素值,将多标签分类类别为印章类别的像素点的像素值设置为第二像素值,得到目标区域图像;
将原始文本图像中的印章区域图像替换为目标区域图像。
本实施例提供的计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将印章区域图像输入像素多标签分类模型,得到印章区域图像中每个像素点属于各多标签分类类别的概率;
根据每个像素点属于各多标签分类类别的概率,确定每个像素点的多标签分类类别。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
针对每个像素点,若像素点属于第一分类类别的概率大于预设阈值、且属于第二分类类别的概率不大于预设阈值,将第一分类类别作为像素点的多标签分类类别;其中,第一分类类别为各多标签分类类别中的一个类别,第二分类类别为各多标签分类类别中的另一个类别。
在一个实施例中,多标签分类类别还包括字符类别,第一像素值为字符类别对应的像素点的平均像素值。
在一个实施例中,多标签分类类别还包括背景类别;计算机程序被处理器执行时还实现以下步骤:
计算背景类别对应的所有像素点的平均像素值;
针对印章类别对应的每个印章像素点,根据平均像素值和平均像素值对应的权重、以及印章像素点的像素值和印章像素点的像素值对应的权重,计算印章像素点对应的第二像素值。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取样本印章图像和所述样本印章图像的像素多标签分类标签;
将样本印章图像输入初始像素多标签分类网络,得到样本印章图像中每个像素点属于各多标签分类类别的预测概率;
采用损失函数计算预测概率与像素多标签分类标签对应的标签概率之间的损失,根据损失对初始像素多标签分类网络进行训练,得到像素多标签分类模型。
在一个实施例中,上述像素多标签分类模型的激活函数为sigmoid激活函数,损失函数为二分类交叉熵损失函数。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将原始文本图像输入预设的印章检测模型,得到印章区域在原始文本图像中的位置坐标;
根据印章区域在原始文本图像中的位置坐标,从原始文本图像中获取印章区域图像。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种印章去除方法,其特征在于,所述方法包括:
将原始文本图像中的印章区域图像输入预设的像素多标签分类模型,得到所述印章区域图像中每个像素点的多标签分类类别;所述多标签分类类别包括印章类别和字印重叠类别;
对于所述印章区域图像,将多标签分类类别为字印重叠类别的像素点的像素值设置为第一像素值,将多标签分类类别为印章类别的像素点的像素值设置为第二像素值,得到目标区域图像;
将所述原始文本图像中的印章区域图像替换为所述目标区域图像。
2.根据权利要求1所述的方法,其特征在于,所述将原始文本图像中的印章区域图像输入预设的像素多标签分类模型,得到所述印章区域图像中每个像素点的多标签分类类别,包括:
将所述印章区域图像输入所述像素多标签分类模型,得到所述印章区域图像中每个像素点属于各多标签分类类别的概率;
根据所述每个像素点属于各多标签分类类别的概率,确定所述每个像素点的多标签分类类别。
3.根据权利要求2所述的方法,其特征在于,所述根据所述每个像素点属于各多标签分类类别的概率,确定所述每个像素点的多标签分类类别,包括:
针对每个像素点,若所述像素点属于第一分类类别的概率大于预设阈值、且属于第二分类类别的概率不大于所述预设阈值,则将所述第一分类类别作为所述像素点的多标签分类类别;
其中,所述第一分类类别为所述各多标签分类类别中的一个类别,所述第二分类类别为所述各多标签分类类别中的另一个类别。
4.根据权利要求1所述的方法,其特征在于,所述多标签分类类别还包括字符类别,所述第一像素值为字符类别对应的像素点的平均像素值。
5.根据权利要求1所述的方法,其特征在于,所述多标签分类类别还包括背景类别;所述第二像素值的计算方式包括:
计算所述背景类别对应的所有像素点的平均像素值;
针对所述印章类别对应的每个印章像素点,根据所述平均像素值和所述平均像素值对应的权重、以及所述印章像素点的像素值和所述印章像素点的像素值对应的权重,计算所述印章像素点对应的第二像素值。
6.根据权利要求1所述的方法,其特征在于,所述像素多标签分类模型的训练方式包括:
获取样本印章图像和所述样本印章图像的像素多标签分类标签;
将所述样本印章图像输入初始像素多标签分类网络,得到所述样本印章图像中每个像素点属于各多标签分类类别的预测概率;
采用损失函数计算所述预测概率与所述像素多标签分类标签对应的标签概率之间的损失,根据所述损失对所述初始像素多标签分类网络进行训练,得到所述像素多标签分类模型。
7.根据权利要求6所述的方法,其特征在于,所述像素多标签分类模型的激活函数为sigmoid激活函数,所述损失函数为二分类交叉熵损失函数。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述原始文本图像输入预设的印章检测模型,得到印章区域在所述原始文本图像中的位置坐标;
根据所述印章区域在所述原始文本图像中的位置坐标,从所述原始文本图像中获取所述印章区域图像。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-8中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8中任一项所述方法的步骤。
CN202010689598.5A 2020-07-17 2020-07-17 印章去除方法、计算机设备和可读存储介质 Withdrawn CN111814716A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010689598.5A CN111814716A (zh) 2020-07-17 2020-07-17 印章去除方法、计算机设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010689598.5A CN111814716A (zh) 2020-07-17 2020-07-17 印章去除方法、计算机设备和可读存储介质

Publications (1)

Publication Number Publication Date
CN111814716A true CN111814716A (zh) 2020-10-23

Family

ID=72865395

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010689598.5A Withdrawn CN111814716A (zh) 2020-07-17 2020-07-17 印章去除方法、计算机设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN111814716A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112950458A (zh) * 2021-03-19 2021-06-11 润联软件系统(深圳)有限公司 基于对抗生成网络的图像印章去除方法、装置及相关设备
CN113312982A (zh) * 2021-05-07 2021-08-27 珠海金山办公软件有限公司 一种文档还原处理方法、装置、计算机存储介质及终端
CN114550129A (zh) * 2022-01-26 2022-05-27 江苏联合职业技术学院苏州工业园区分院 一种基于数据集的机器学习模型处理方法和系统
CN114936965A (zh) * 2022-06-07 2022-08-23 上海弘玑信息技术有限公司 一种印章去除方法、装置、设备及存储介质
CN116416626A (zh) * 2023-06-12 2023-07-11 平安银行股份有限公司 圆形印章数据的获取方法、装置、设备及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112950458A (zh) * 2021-03-19 2021-06-11 润联软件系统(深圳)有限公司 基于对抗生成网络的图像印章去除方法、装置及相关设备
CN113312982A (zh) * 2021-05-07 2021-08-27 珠海金山办公软件有限公司 一种文档还原处理方法、装置、计算机存储介质及终端
CN114550129A (zh) * 2022-01-26 2022-05-27 江苏联合职业技术学院苏州工业园区分院 一种基于数据集的机器学习模型处理方法和系统
CN114936965A (zh) * 2022-06-07 2022-08-23 上海弘玑信息技术有限公司 一种印章去除方法、装置、设备及存储介质
CN116416626A (zh) * 2023-06-12 2023-07-11 平安银行股份有限公司 圆形印章数据的获取方法、装置、设备及存储介质
CN116416626B (zh) * 2023-06-12 2023-08-29 平安银行股份有限公司 圆形印章数据的获取方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111814716A (zh) 印章去除方法、计算机设备和可读存储介质
CN111615702B (zh) 一种从图像中提取结构化数据的方法、装置和设备
CN107944450B (zh) 一种车牌识别方法及装置
US11574489B2 (en) Image processing system, image processing method, and storage medium
CN111291629A (zh) 图像中文本的识别方法、装置、计算机设备及计算机存储介质
US11983910B2 (en) Image processing system, image processing method, and storage medium each for obtaining pixels of object using neural network
CN107886082B (zh) 图像中数学公式检测方法、装置、计算机设备及存储介质
CN113822116A (zh) 文本识别方法、装置、计算机设备和存储介质
CN105701489A (zh) 一种新型的数字提取和识别的方法及系统
CN110569856A (zh) 样本标注方法及装置、损伤类别的识别方法及装置
CN112396047B (zh) 训练样本生成方法、装置、计算机设备和存储介质
CN112381092B (zh) 跟踪方法、装置及计算机可读存储介质
CN111291741B (zh) 单据识别方法、装置、计算机设备和存储介质
CN111291704A (zh) 干扰去除方法、装置、计算机设备和存储介质
CN111488883A (zh) 车架号识别方法、装置、计算机设备和存储介质
CN114429636A (zh) 图像扫描识别方法、装置及电子设备
CN110796145A (zh) 基于智能决策的多证件分割关联方法及相关设备
CN110781811A (zh) 异常工单识别方法、装置、可读存储介质和计算机设备
CN114187598B (zh) 手写数字识别方法、设备及计算机可读存储介质
CN117351505A (zh) 信息码的识别方法、装置、设备及存储介质
CN115953744A (zh) 一种基于深度学习的车辆识别追踪方法
CN110956174A (zh) 一种器件编号的识别方法
CN113128496B (zh) 一种从图像中提取结构化数据的方法、装置和设备
CN113610090A (zh) 印章图像识别分类方法、装置、计算机设备和存储介质
CN114630102A (zh) 检测数据采集设备角度变化的方法、装置和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20201023