CN116386048A - 一种印章去除方法、装置、设备及存储介质 - Google Patents
一种印章去除方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116386048A CN116386048A CN202310354894.3A CN202310354894A CN116386048A CN 116386048 A CN116386048 A CN 116386048A CN 202310354894 A CN202310354894 A CN 202310354894A CN 116386048 A CN116386048 A CN 116386048A
- Authority
- CN
- China
- Prior art keywords
- seal
- target
- pixel point
- image
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 239000013598 vector Substances 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 239000003086 colorant Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
- G06V30/1448—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18105—Extraction of features or characteristics of the image related to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19107—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请公开了一种印章去除方法、装置、设备及存储介质,可以用于去除目标文件中的覆盖在黑色文字上的红色印章,具体的,将目标文件中的印章区域的RGB图像转化为LAB图像,根据LAB图像中的各像素点的颜色空间特征,将像素点划分成红色印章体、红色印章边缘、背景和黑色文字四类,根据像素点的颜色空间特征,尤其是A通道值和L通道值,在属于红色印章的各像素点中确定目标像素点,其中,各目标像素点组成的集合,对应的是印章与黑色文字的非重叠部分,在印章区域的RGB图像中保留重叠部分,并利用设定颜色填充非重叠部分,既保留了文本信息,又减少了印章干扰,因此,对本方案处理后的目标文件进行文本识别,可以提高文本识别的准确性。
Description
技术领域
本申请涉及图像处理技术领域,更具体的说,是涉及一种印章去除方法、装置、设备及存储介质。
背景技术
在对合同等文件材料进行自动审核时,一般先将纸质的文件材料扫描成图片态的电子文件,而后利用OCR等文本识别装置对电子文件进行文本识别,根据文本识别的结果进行审核,因此,文本识别的准确性高低决定了自动审核任务能否实现。然而在实际场景下,常常会遇到页面上的文字被印章覆盖的情况,并且印章的覆盖区域可能是文件的核心内容区域,被印章覆盖的重叠文字部分可能纹理复杂、颜色深浅不一,印章的干扰使得文本识别的效果不佳、准确性较差。
虽然可以利用存在印章干扰的训练样本对文本识别装置进行再训练,从而提高文本识别装置对存在印章干扰的电子文件的文本识别准确性,但是实际场景中印章干扰的情况复杂多样,难以模拟出大量的训练样本,并且文本识别装置的再训练难度也较大,因此难以解决由印章干扰造成的文本识别准确性较差的问题。
发明内容
鉴于上述问题,提出了本申请以便提供一种印章去除方法、装置、设备及存储介质,以去除文件中的印章,减少印章对文本识别的干扰,提高文本识别的准确性。
具体方案如下:
第一方面,提供了一种印章去除方法,该方法包括:
获取目标文件中的印章区域的RGB图像;
对所述印章区域的RGB图像进行颜色空间转换,得到LAB图像;
在所述LAB图像中的各像素点的最大A通道值大于预设阈值的情况下,基于所述LAB图像中各像素点的颜色空间特征,对各像素点进行聚类,得到4个聚类簇及其聚类中心,所述聚类簇分别用于表征红色印章体、红色印章边缘、背景和黑色文字;
在A通道值最大和次最大的聚类中心对应的聚类簇中,查找L通道值大于设定的L通道基准值的各目标像素点;
在所述印章区域的RGB图像中,利用设定颜色填充与各所述目标像素点对应的像素点,得到所述印章区域的目标RGB图像。
第二方面,提供了一种印章去除装置,该装置包括:
印章图像获取单元,用于获取目标文件中的印章区域的RGB图像;
颜色空间转换单元,用于对所述印章区域的RGB图像进行颜色空间转换,得到LAB图像;
像素点聚类单元,用于在所述LAB图像中的各像素点的最大A通道值大于预设阈值的情况下,基于所述LAB图像中各像素点的颜色空间特征,对各像素点进行聚类,得到4个聚类簇及其聚类中心,所述聚类簇分别用于表征红色印章体、红色印章边缘、背景和黑色文字;
目标像素点确定单元,用于在A通道值最大和次最大的聚类中心对应的聚类簇中,查找L通道值大于设定的L通道基准值的各目标像素点;
目标像素点填充单元,用于在所述印章区域的RGB图像中,利用设定颜色填充与各所述目标像素点对应的像素点,得到所述印章区域的目标RGB图像。
第三方面,提供了一种印章去除设备,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现上述的印章去除方法的各个步骤。
第四方面,提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述的印章去除方法的各个步骤。
借由上述技术方案,本申请可以适用于去除目标文件中的覆盖在黑色文字上的红色印章。具体的,首先获取目标文件中的印章区域的RGB图像;对所述印章区域的RGB图像进行颜色空间转换,得到LAB图像,LAB通道中的A通道可以凸显红色特征,L通道可以凸显黑色特征;基于此,若所述LAB图像中的各像素点的最大A通道值大于预设阈值,则可以表征所述LAB图像中存在红色印章,而后基于所述LAB图像中各像素点的颜色空间特征,对各像素点进行聚类,得到4个聚类簇及其聚类中心,所述聚类簇分别用于表征红色印章体、红色印章边缘、背景和黑色文字,需要说明的是,所述背景指的是具备较高的L通道值和较低的A通道值的一类像素点,所述黑字文字指的是具备较低的L通道值的一类像素点,或者说是趋近于黑色的一类像素点;而后,在A通道值最大和次最大的聚类中心对应的聚类簇中,即与红色印章体和红色印章边缘对应的聚类簇中,查找L通道值大于设定的L通道基准值的各目标像素点,所述目标像素点为不属于红色印章与黑色文字的重叠部分的像素点;最后,在所述印章区域的RGB图像中,利用设定颜色填充与各所述目标像素点对应的像素点,得到所述印章区域的目标RGB图像,可以在保留印章与文字的重叠部分的情况下,去除印章区域的RGB图像中的非重叠部分,既保留了文本信息,又减少了印章干扰,因此,应用本申请方案对目标文件中的印章区域进行处理,而后对处理后的目标文件进行文本识别,可以提高对存在印章干扰的目标文件的文本识别准确性。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本申请实施例提供的一种印章去除方法的流程示意图;
图2为本申请实施例提供的另一种印章去除方法的流程示意图;
图3为本申请实施例提供的再一种印章去除方法的流程示意图;
图4a示出了文本被印章覆盖的印章区域图像;
图4b示出了去除印章后的印章区域图像;
图5为本申请实施例提供的一种印章去除装置的结构示意图;
图6为本申请实施例提供的印章去除设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请公开了一种印章去除方法、装置、设备及存储介质,可以实现对目标文件中的覆盖在黑色文字上的红色印章的去除任务。
对于LAB颜色空间,L通道值代表的是亮度,其取值范围可以对应着由黑色到白色的区间,A通道值的取值范围对应的是由绿色到红色的区间,B通道的取值范围对应的是由蓝色到黄色的区间。基于此,通过LAB图像中的像素点的A通道值,可以将红色特征凸显出来,通过像素点的L通道值可以将黑色特征凸显出来,通过像素点的B通道值可以将蓝色特征凸显出来。在实际场景中,合同、报表等文档材料通常为白底黑字,印章通常为红色,借助LAB颜色空间可以将文档材料中的黑色文本、白色背景和红色印章区别开,以便去除文档材料中的红色印章。
本申请方案可以基于具备数据处理能力的终端实现,该终端可以是电脑、服务器、云端等。
图1是根据本申请实施例示出的一种印章去除方法的流程示意图,如图1所示,该方法可以包括如下步骤:
步骤S101、获取目标文件中的印章区域的RGB图像。
其中,所述印章区域的RGB图像可以是指包含有印章的目标文件的RGB图像,也可以是指从所述目标文件的RGB图像中裁减出来的印章的RGB图像。需要说明的是,所述目标文件的RGB图像的像素点数量远大于所述印章的RGB图像的像素点数量,因此,相较于对所述目标文件的RGB图像的执行后续步骤的方案,对所述印章的RGB图像执行后续步骤可以减少计算量,提高印章去除的效率。
步骤S102、对所述印章区域的RGB图像进行颜色空间转换,得到LAB图像。
需要说明的是,将RGB图像转化为LAB图像,需要借助XYZ颜色空间,具体的,将所述印章区域的RGB图像转换成对应的XYZ图像,再将XYZ图像转换为LAB图像。
图像的像素点的数量等于图像长height与图像宽width的乘积,图像中的各个像素点都具备各自的颜色空间特征,即RGB图像中的像素点具备RGB颜色空间特征,LAB图像中的像素点具备LAB颜色空间特征,其中,对于RGB颜色空间特征,其中的各通道的取值范围均为[0,255],对于LAB颜色空间特征,其中的L通道的取值范围为[0,100],A通道和B通道的取值范围均为[-128,127]。
步骤S103、判断所述LAB图像中的各像素点的最大A通道值是否大于预设阈值,若是,则执行步骤S104。
需要说明的是,若所述LAB图像中的各像素点的A通道值中的最大值超过预设阈值,则可以表征所述LAB图像中存在红色特征,根据所述LAB图像为印章区域的图像且印章大多为红色,可以确定所述LAB图像中存在红色印章,对于所述LAB图像中的各像素点的A通道值中的最大值不超过预设阈值的情况,可以认为所述LAB图像中不存在红色印章,不执行后续步骤,示例性的,不对目标文件中的黑色印章执行后续步骤。
步骤S104、基于所述LAB图像中各像素点的颜色空间特征,对各像素点进行聚类,得到4个聚类簇及其聚类中心。
需要说明的是,如果设置的是3个聚类簇,各聚类簇分别表征红色印章、黑色文字和背景,由于构成红色印章边缘的像素点的颜色空间特征并不明显,可能被划分到红色印章一类,也可能被划分到黑色文字一类,从而难以得到准确的聚类簇,使得印章的去除效果较差。基于此,设置聚类簇的数量为4,各聚类簇分别用于表征红色印章体、红色印章边缘、背景和黑色文字,所述背景指的可以是具备较高的L通道值和较低的A通道值的一类像素点,所述黑字文字指的可以是具备较低的L通道值的一类像素点,或者说是趋近于黑色的一类像素点。
可选的,可以应用K-means++聚类算法,以各像素点的颜色空间特征之间的距离为衡量标准,确定4个聚类中心,并将特征相似的像素点归为一个聚类簇。
步骤S105、在A通道值最大和次最大的聚类中心对应的聚类簇中,查找L通道值大于设定的L通道基准值的各目标像素点。
需要说明的是,A通道值最大的聚类中心对应的聚类簇表征的是红色印章体,A通道值次最大的聚类中心对应的聚类簇表征的是红色印章边缘,由红色印章体和红色印章边缘可以构成红色印章。但是,这两类聚类簇中可能包含有印章和文字的重叠部分,在去除印章时,需要保留印章和文字的重叠部分,以及去除非重叠部分,以避免文字缺失和减少印章干扰。由于像素点的L通道值代表的是亮度,L通道值越小,该像素点的颜色越趋近于黑色,该像素点属于黑色文字的可能性越大,基于此,在表征红色印章的聚类簇中,查找出的L通道值比L通道基准值大的像素点,即为欲去除的目标像素点。
步骤S106、在所述印章区域的RGB图像中,利用设定颜色填充与各所述目标像素点对应的像素点,得到所述印章区域的目标RGB图像。
需要说明的是,本申请是采用以设定颜色填充印章和文字的非重叠区域的方式实现的印章去除任务。可选的,所述设定颜色可以根据所述目标文件的背景设定的,示例性的,考虑实际应用中,待去除印章的目标文件的背景通常是白色,所述设定颜色可以是白色。
上述的印章去除方法,首先获取目标文件中的印章区域的RGB图像;对所述印章区域的RGB图像进行颜色空间转换,得到LAB图像,LAB通道中的A通道可以凸显红色特征,L通道可以凸显黑色特征;基于此,若所述LAB图像中的各像素点的最大A通道值大于预设阈值,则可以表征所述LAB图像中存在红色印章,而后基于所述LAB图像中各像素点的颜色空间特征,对各像素点进行聚类,得到4个聚类簇及其聚类中心,所述聚类簇分别用于表征红色印章体、红色印章边缘、背景和黑色文字;而后,在A通道值最大和次最大的聚类中心对应的聚类簇中,即与红色印章体和红色印章边缘对应的聚类簇中,查找L通道值大于设定的L通道基准值的各目标像素点,所述目标像素点属于红色印章与黑色文字的非重叠部分;最后,在所述印章区域的RGB图像中,利用设定颜色填充与各所述目标像素点对应的像素点,得到所述印章区域的目标RGB图像,可以在保留印章与文字的重叠部分的情况下,去除印章区域的RGB图像中的非重叠部分,既保留了文本信息,又减少了印章干扰,因此,应用本申请方案对目标文件中的印章区域进行处理,而后对处理后的目标文件进行文本识别,可以提高对存在印章干扰的目标文件的文本识别准确性。
在本申请提供的一些实施例中,上述的步骤S104、基于所述LAB图像中各像素点的颜色空间特征,对各像素点进行聚类,得到4个聚类簇及其聚类中心,可以包括:
步骤S11、根据所述LAB图像中的各像素点的颜色空间特征之间的距离,利用聚类算法确定4个聚类中心。
步骤S12、根据所述LAB图像中的各像素点与4个所述聚类中心之间的颜色空间特征的距离,确定各像素点所属的聚类中心,得到4个聚类簇。
可选的,可以在步骤S11和步骤S12之间,对所述LAB图像是否存在红色印章进行判断,具体的,判断4个聚类中心的A通道值中的最大值是否大于预设阈值,若是,则表征所述LAB图像中存在红色印章,执行后续步骤,否则不执行后续步骤。示例性的,所述预设阈值可以设置为20。
在本申请提供的一些实施例中,上述的步骤S12、根据所述LAB图像中的各像素点与4个所述聚类中心之间的颜色空间特征的距离,确定各像素点所属的聚类中心,得到4个聚类簇,可以包括如下步骤:
步骤S21、获取由所述LAB图像中的各像素点的颜色空间特征向量构成的特征矩阵和4个所述聚类中心各自的颜色空间特征向量。
其中,所述颜色空间特征向量是颜色空间特征的向量表示,所述特征矩阵可以表示为X,聚类中心i的颜色空间特征向量可以表示为Ci,i=0,1,2,3。
步骤S22、对于每一个聚类中心Ci,i=0,1,2,3,采用矩阵运算的方式,根据所述特征矩阵和所述聚类中心Ci的颜色空间特征向量,计算得到所述LAB图像中的各个像素点和所述聚类中心之间的颜色空间特征的距离。
可选的,可以通过矩阵运算工具numpy实现上述的步骤S22,示例性的,所述LAB图像中的各个像素点和聚类中心i(i=0,1,2,3)之间的颜色空间特征的距离Di的计算公式为:Di=np.sqrt(np.sum(np.power(X-Ci,2))).reshape((1,-1)),其中,np.power(X-Ci,2)计算的是LAB图像的像素点的各通道的颜色空间特征和聚类中心Ci的各通道的颜色空间特征的距离的平方,np.sum()计算的平方和,np.sqrt()计算的是平方根,其计算结果是,由各像素点和聚类中心Ci的颜色空间特征的欧氏距离构成的数组,对该数组进行.reshape()运算,可以得到[1,n]维度的向量,以便后续向量融合,参数n为LAB图像中的像素点数量。
需要说明的是,虽然可以采用对所有像素点和所有聚类中心进行双循环遍历的方式计算得到所述LAB图像中的各个像素点和各个聚类中心之间的颜色空间特征的距离,但是该计算方法的时间复杂度较高。通过将各像素点的颜色空间特征表示成一个特征矩阵,而后采用矩阵运算的方式来实现所有像素点的计算任务,可以提高计算速度。
步骤S23、对于所述LAB图像中的每一个像素点,在所述像素点与4个所述聚类中心之间的颜色空间特征的距离中,查找出数值最小的目标距离,将与所述目标距离对应的聚类中心确定为所述像素点所属的聚类中心,得到4个聚类簇。
可选的,可以通过矩阵运算工具numpy实现上述的步骤S23,具体的,LAB图像的各像素点所对应的聚类中心的类别L的计算公式为:L=np.argsort(np.concatenate((D0,D1,D2,D3),axis=0),axis=0)[0],其中,np.concatenate((D0,D1,D2,D3),axis=0)表示的是将向量D0、D1、D2和D3按行合并,np.argsort(,axis=0)表示的是将向量按列排序,L为各像素点的目标距离对应的聚类中心,即与最小距离对应的聚类中心。
示例性的,可以根据4个聚类中心的A通道值确定所述聚类中心对应的聚类簇,随着A通道值的增加,4个聚类中心对应的聚类簇表征的依次是背景、黑色文字、红色印章边缘和红色印章体。
在本申请提供的一些实施例中,所述印章去除方法还可以包括:
在4个所述聚类中心中,查找L通道值最大的第二聚类中心,根据与所述第二聚类中心对应的聚类簇中的各像素点的颜色空间特征,确定所述目标文件的背景色。
需要说明的是,一般的文件背景大多趋近于白色或灰色等具备着较大的亮度值的颜色,因此,可以根据L通道值确定背景色。
可选的,可以将L通道值最大的第二聚类中心的颜色,确定为背景色。
在上述的基础上,所述在所述印章区域的RGB图像中,利用设定颜色填充与各所述目标像素点对应的像素点,可以包括:
在所述印章区域的RGB图像中,利用所述背景色填充与各所述目标像素点对应的像素点。
需要说明的是,将根据表征背景的聚类簇确定的背景色作为填充颜色,可以得到更加协调的目标RGB图像,有利于后续的文字识别。
图2是根据本申请实施例示出的另一种印章去除方法的流程示意图,结合图2所示,该方法可以包括如下步骤:
步骤S201、在目标文件的RGB图像中,确定印章区域的目标位置。
对于目标文件的RGB图像,可以用图像数组的形式来表示,示例性的,可以通过对文件base64流的目标文件进行解码转换的方式,生成用于表征所述目标文件的RGB图像的图像数组;或者,可以通过对输入路径为本地文件路径的图片类型或PDF类型的目标文件进行读取,具体的,可以根据目标文件的扩展名确定目标文件的类型,对于扩展名为jpg、jpeg或png的目标文件,直接对其进行图片读取,对于扩展名为pdf的目标文件,将所述目标文件的各页拆分成对应的图片,再对每一张图片进行读取,得到用于表征所述目标文件的RGB图像的图像数组。
可选的,上述的步骤S201可以通过预训练的印章检测模型实现,在将所述目标文件的RGB图像输入到所述印章检测模型之前,需要对所述目标文件的RGB图像进行预处理,所述预处理包括:
第一步、将所述目标文件的RGB图像缩放成标准尺寸,所述标准尺寸是由所述印章检测模型的输入尺寸决定的,示例性的,所述标准尺寸可以是608*608像素。
第二步、对缩放后的图像进行标准化处理,需要说明的是,经过标准化处理的图像,其颜色空间特征的分布更加均匀,具体的,实现所述标准化处理的公式为(Xi-μ)/σ,Xi为RGB图像的各通道值除以255得到的缩放值,μ为由图片网络ImageNet数据集计算得到的均值,σ为由图片网络ImageNet数据集计算得到的方差。本步进行标准化处理的原因在于,在训练印章检测模型时对图像样本进行了标准化处理,通过将图像的颜色空间特征的取值分布由[0,255]降低为[-1,1],可以令颜色空间特征的分布更加集中均匀,可以提高模型泛化能力。
第三步、对标准化处理后的图像进行数组排列变换,将高度宽度通道维度顺序HWC转为通道高度宽度CHW,进行所述数组排列变换的原因在于,所述印章检测模型可以是神经网络模型,示例性的,可以是以Darknet53为主干网络的YOLOV3网络,而在神经网络模型的输入数据中,通道维度一般位于高度宽度的前面。
利用所述印章检测模型对所述目标文件的RGB图像进行处理,可以得到印章的目标类别、目标位置坐标和目标置信度,其中,所述目标类别可以包括圆章、椭圆章、矩形章和方章,若得到的目标置信度大于设定的阈值,则输出该印章的目标位置坐标,所述目标位置坐标可以表征所述目标位置,否则舍弃该印章目标。需要说明的是,利用所述印章检测模型可以实现一个页面中的至少一个印章的检测任务,也就是说,可以同时的输出若干个目标位置坐标。
步骤S202、根据所述目标位置对所述目标文件的RGB图像进行裁减,得到所述印章区域的RGB图像。
步骤S203-S207与上述的步骤S102-S106一致,在此不再赘述。
步骤S208、将所述目标文件的RGB图像中的所述印章区域的RGB图像,替换成所述印章区域的目标RGB图像。
上述的印章去除方法,可以实现页面级的印章去除任务,具体的,对于同一页面中存在至少一个印章区域的情况,可以对各个印章区域分别执行步骤S203-S208,最终得到了去除了全部印章的图像,将该对象输入到现有的文本识别装置中,可以得到更准确的文本识别结果。
在本申请提供的一些实施例中,上述的步骤S201、在目标文件的RGB图像中,确定印章区域的目标位置,可以包括如下步骤:
步骤S31、对目标文件的RGB图像中的各像素点的RGB值进行标准化处理,得到目标文件图像。
其中,对标准化处理的表述可以参照上文描述。
步骤S32、根据所述目标文件图像,确定印章区域的目标位置。
图3是根据本申请实施例示出的再一种印章去除方法的流程示意图,结合图3所示,该方法可以包括如下步骤:
步骤S301-S304与上述的步骤S101-S104一致,在此不再赘述。
步骤S305、根据4个所述聚类中心的L通道值最小的第一聚类中心对应的聚类簇中的各像素点的颜色空间特征,确定L通道基准值。
具体的,在4个所述聚类中心中,查找L通道值最小的第一聚类中心,将所述第一聚类中心对应的聚类簇中的各像素点的L通道值中的最大值,确定为L通道基准值。
或,将4个所述聚类中心的L通道值中的最小值,确定为L通道基准值。
需要说明的是,在表征黑色文字的聚类簇中,各像素点的L通道值大多较为集中,因此根据所述第一聚类中心对应的聚类簇中的各像素点的L通道值,可以确定出能够反应所述目标文件中的一般黑色文字的L通道值的L通道基准值,具体的,所述L通道基准值可以是表征黑色文字的聚类簇中的最大L通道值,也可以是表征黑色文字的聚类簇中的各像素点的L通道值的中间值,即所述第一聚类中心的L通道值。
需要说明的是,在一些目标文件中,可能存在着部分黑色文字虚化、不够清晰、亮度有亮有暗等情况,因此,在印章去除时可能会有一些属于重叠区域的离群像素点未能被保留。
步骤S306、在A通道值最大和次最大的聚类中心对应的聚类簇中,查找L通道值大于所述L通道基准值的各目标像素点。
所述步骤S306的其他表述可以参照上述的步骤S105。
步骤S307与上述的步骤S106一致,在此不再赘述。
示例性的,图4a示出了一种文本被印章覆盖的印章区域图像,图4b示出了,应用本申请方案对图4a所示的印章区域图像进行处理,得到的印章去除后的印章区域图像。
下面对本申请实施例提供的印章去除装置进行描述,下文描述的印章去除装置与上文描述的印章去除方法可相互对应参照。
参见图5,图5为本申请实施例公开的一种印章去除装置的结构示意图。
如图5所示,该装置可以包括:
印章图像获取单元11,用于获取目标文件中的印章区域的RGB图像;
颜色空间转换单元12,用于对所述印章区域的RGB图像进行颜色空间转换,得到LAB图像;
像素点聚类单元13,用于在所述LAB图像中的各像素点的最大A通道值大于预设阈值的情况下,基于所述LAB图像中各像素点的颜色空间特征,对各像素点进行聚类,得到4个聚类簇及其聚类中心,所述聚类簇分别用于表征红色印章体、红色印章边缘、背景和黑色文字;
目标像素点确定单元14,用于在A通道值最大和次最大的聚类中心对应的聚类簇中,查找L通道值大于设定的L通道基准值的各目标像素点;
目标像素点填充单元15,用于在所述印章区域的RGB图像中,利用设定颜色填充与各所述目标像素点对应的像素点,得到所述印章区域的目标RGB图像。
在本申请提供的一些实施例中,所述像素点聚类单元13基于所述LAB图像中各像素点的颜色空间特征,对各像素点进行聚类,得到4个聚类簇及其聚类中心的过程,可以包括:
根据所述LAB图像中的各像素点的颜色空间特征之间的距离,利用聚类算法确定4个聚类中心;
根据所述LAB图像中的各像素点与4个所述聚类中心之间的颜色空间特征的距离,确定各像素点所属的聚类中心,得到4个聚类簇。
在本申请提供的一些实施例中,所述像素点聚类单元13根据所述LAB图像中的各像素点与4个所述聚类中心之间的颜色空间特征的距离,确定各像素点所属的聚类中心,得到4个聚类簇的过程,可以包括:
获取由所述LAB图像中的各像素点的颜色空间特征向量构成的特征矩阵和4个所述聚类中心各自的颜色空间特征向量,所述颜色空间特征向量是颜色空间特征的向量表示;
对于每一个聚类中心,采用矩阵运算的方式,根据所述特征矩阵和所述聚类中心的颜色空间特征向量,计算得到所述LAB图像中的各个像素点和所述聚类中心之间的颜色空间特征的距离;
对于所述LAB图像中的每一个像素点,在所述像素点与4个所述聚类中心之间的颜色空间特征的距离中,查找出数值最小的目标距离,将与所述目标距离对应的聚类中心确定为所述像素点所属的聚类中心,得到4个聚类簇。
在本申请提供的一些实施例中,所述印章图像获取单元11获取目标文件中的印章区域的RGB图像的过程,可以包括:
在目标文件的RGB图像中,确定印章区域的目标位置;
根据所述目标位置对所述目标文件的RGB图像进行裁减,得到所述印章区域的RGB图像;
在上述的基础上,该装置还可以包括图像复原单元,用于在得到所述印章区域的目标RGB图像之后,将所述目标文件的RGB图像中的所述印章区域的RGB图像,替换成所述印章区域的目标RGB图像。
在本申请提供的一些实施例中,所述印章图像获取单元11在目标文件的RGB图像中,确定印章区域的目标位置的过程,可以包括:
对目标文件的RGB图像中的各像素点的RGB值进行标准化处理,得到目标文件图像;
根据所述目标文件图像,确定印章区域的目标位置。
在本申请提供的一些实施例中,所述印章去除装置还可以包括L通道基准值确定单元,用于将4个所述聚类中心的L通道值中的最小值,确定为L通道基准值,或,在4个所述聚类中心中,查找L通道值最小的第一聚类中心,将所述第一聚类中心对应的聚类簇中的各像素点的L通道值中的最大值,确定为L通道基准值。
在本申请提供的一些实施例中,所述印章去除装置还可以包括填充颜色确定单元,用于在4个所述聚类中心中,查找L通道值最大的第二聚类中心,根据与所述第二聚类中心对应的聚类簇中的各像素点的颜色空间特征,确定所述目标文件的背景色。
在上述的基础上,所述目标像素点填充单元15在所述印章区域的RGB图像中,利用设定颜色填充与各所述目标像素点对应的像素点的过程,可以包括:
在所述印章区域的RGB图像中,利用所述背景色填充与各所述目标像素点对应的像素点。
本申请实施例提供的印章去除装置可应用于印章去除设备,如终端:手机、电脑等。可选的,图6示出了印章去除设备的硬件结构框图,参照图6,印章去除设备的硬件结构可以包括:至少一个处理器1,至少一个通信接口2,至少一个存储器3和至少一个通信总线4;
在本申请实施例中,处理器1、通信接口2、存储器3、通信总线4的数量为至少一个,且处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;
处理器1可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;
存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory)等,例如至少一个磁盘存储器;
其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:
获取目标文件中的印章区域的RGB图像;
对所述印章区域的RGB图像进行颜色空间转换,得到LAB图像;
在所述LAB图像中的各像素点的最大A通道值大于预设阈值的情况下,基于所述LAB图像中各像素点的颜色空间特征,对各像素点进行聚类,得到4个聚类簇及其聚类中心,所述聚类簇分别用于表征红色印章体、红色印章边缘、背景和黑色文字;
在A通道值最大和次最大的聚类中心对应的聚类簇中,查找L通道值大于设定的L通道基准值的各目标像素点;
在所述印章区域的RGB图像中,利用设定颜色填充与各所述目标像素点对应的像素点,得到所述印章区域的目标RGB图像。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种存储介质,该存储介质可存储有适于处理器执行的程序,所述程序用于:
获取目标文件中的印章区域的RGB图像;
对所述印章区域的RGB图像进行颜色空间转换,得到LAB图像;
在所述LAB图像中的各像素点的最大A通道值大于预设阈值的情况下,基于所述LAB图像中各像素点的颜色空间特征,对各像素点进行聚类,得到4个聚类簇及其聚类中心,所述聚类簇分别用于表征红色印章体、红色印章边缘、背景和黑色文字;
在A通道值最大和次最大的聚类中心对应的聚类簇中,查找L通道值大于设定的L通道基准值的各目标像素点;
在所述印章区域的RGB图像中,利用设定颜色填充与各所述目标像素点对应的像素点,得到所述印章区域的目标RGB图像。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种印章去除方法,其特征在于,包括:
获取目标文件中的印章区域的RGB图像;
对所述印章区域的RGB图像进行颜色空间转换,得到LAB图像;
在所述LAB图像中的各像素点的最大A通道值大于预设阈值的情况下,基于所述LAB图像中各像素点的颜色空间特征,对各像素点进行聚类,得到4个聚类簇及其聚类中心,所述聚类簇分别用于表征红色印章体、红色印章边缘、背景和黑色文字;
在A通道值最大和次最大的聚类中心对应的聚类簇中,查找L通道值大于设定的L通道基准值的各目标像素点;
在所述印章区域的RGB图像中,利用设定颜色填充与各所述目标像素点对应的像素点,得到所述印章区域的目标RGB图像。
2.根据权利1所述的方法,其特征在于,基于所述LAB图像中各像素点的颜色空间特征,对各像素点进行聚类,得到4个聚类簇及其聚类中心,包括:
根据所述LAB图像中的各像素点的颜色空间特征之间的距离,利用聚类算法确定4个聚类中心;
根据所述LAB图像中的各像素点与4个所述聚类中心之间的颜色空间特征的距离,确定各像素点所属的聚类中心,得到4个聚类簇。
3.根据权利要求2所述的方法,其特征在于,根据所述LAB图像中的各像素点与4个所述聚类中心之间的颜色空间特征的距离,确定各像素点所属的聚类中心,得到4个聚类簇,包括:
获取由所述LAB图像中的各像素点的颜色空间特征向量构成的特征矩阵和4个所述聚类中心各自的颜色空间特征向量,所述颜色空间特征向量是颜色空间特征的向量表示;
对于每一个聚类中心,采用矩阵运算的方式,根据所述特征矩阵和所述聚类中心的颜色空间特征向量,计算得到所述LAB图像中的各个像素点和所述聚类中心之间的颜色空间特征的距离;
对于所述LAB图像中的每一个像素点,在所述像素点与4个所述聚类中心之间的颜色空间特征的距离中,查找出数值最小的目标距离,将与所述目标距离对应的聚类中心确定为所述像素点所属的聚类中心,得到4个聚类簇。
4.根据权利要求1所述的方法,其特征在于,所述获取目标文件中的印章区域的RGB图像,包括:
在目标文件的RGB图像中,确定印章区域的目标位置;
根据所述目标位置对所述目标文件的RGB图像进行裁减,得到所述印章区域的RGB图像;
在所述得到所述印章区域的目标RGB图像之后,该方法还包括:
将所述目标文件的RGB图像中的所述印章区域的RGB图像,替换成所述印章区域的目标RGB图像。
5.根据权利要求4所述的方法,其特征在于,所述在目标文件的RGB图像中,确定印章区域的目标位置,包括:
对目标文件的RGB图像中的各像素点的RGB值进行标准化处理,得到目标文件图像;
根据所述目标文件图像,确定印章区域的目标位置。
6.根据权利要求1-5中任一项所述的方法,其特征在于,在所述对各像素点进行聚类之后,且在所述查找L通道值大于设定的L通道基准值的各目标像素点之前,该方法还包括:
在4个所述聚类中心中,查找L通道值最小的第一聚类中心,将所述第一聚类中心对应的聚类簇中的各像素点的L通道值中的最大值,确定为L通道基准值;
或,将4个所述聚类中心的L通道值中的最小值,确定为L通道基准值。
7.根据权利要求1-5中任一项所述的方法,其特征在于,该方法还包括:
在4个所述聚类中心中,查找L通道值最大的第二聚类中心,根据与所述第二聚类中心对应的聚类簇中的各像素点的颜色空间特征,确定所述目标文件的背景色;
所述在所述印章区域的RGB图像中,利用设定颜色填充与各所述目标像素点对应的像素点,包括:
在所述印章区域的RGB图像中,利用所述背景色填充与各所述目标像素点对应的像素点。
8.一种印章去除装置,其特征在于,包括:
印章图像获取单元,用于获取目标文件中的印章区域的RGB图像;
颜色空间转换单元,用于对所述印章区域的RGB图像进行颜色空间转换,得到LAB图像;
像素点聚类单元,用于在所述LAB图像中的各像素点的最大A通道值大于预设阈值的情况下,基于所述LAB图像中各像素点的颜色空间特征,对各像素点进行聚类,得到4个聚类簇及其聚类中心,所述聚类簇分别用于表征红色印章体、红色印章边缘、背景和黑色文字;
目标像素点确定单元,用于在A通道值最大和次最大的聚类中心对应的聚类簇中,查找L通道值大于设定的L通道基准值的各目标像素点;
目标像素点填充单元,用于在所述印章区域的RGB图像中,利用设定颜色填充与各所述目标像素点对应的像素点,得到所述印章区域的目标RGB图像。
9.一种印章去除设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要1-7中任一项所述的印章去除方法的各个步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-7中任一项所述的印章去除方法的各个步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310354894.3A CN116386048A (zh) | 2023-04-04 | 2023-04-04 | 一种印章去除方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310354894.3A CN116386048A (zh) | 2023-04-04 | 2023-04-04 | 一种印章去除方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116386048A true CN116386048A (zh) | 2023-07-04 |
Family
ID=86972749
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310354894.3A Pending CN116386048A (zh) | 2023-04-04 | 2023-04-04 | 一种印章去除方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116386048A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117671694A (zh) * | 2023-12-04 | 2024-03-08 | 合肥大智慧财汇数据科技有限公司 | 一种基于检测和融合的文档印章预处理方法 |
-
2023
- 2023-04-04 CN CN202310354894.3A patent/CN116386048A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117671694A (zh) * | 2023-12-04 | 2024-03-08 | 合肥大智慧财汇数据科技有限公司 | 一种基于检测和融合的文档印章预处理方法 |
CN117671694B (zh) * | 2023-12-04 | 2024-06-14 | 合肥大智慧财汇数据科技有限公司 | 一种基于检测和融合的文档印章预处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10803554B2 (en) | Image processing method and device | |
US8989437B2 (en) | Salient object detection by composition | |
JP5008572B2 (ja) | 画像処理方法、画像処理装置およびコンピュータ可読媒体 | |
US20160259973A1 (en) | Systems and methods for classifying objects in digital images captured using mobile devices | |
CN116188805B (zh) | 海量图像的图像内容分析方法、装置和图像信息网络 | |
CN110136198A (zh) | 图像处理方法及其装置、设备和存储介质 | |
CN111273905B (zh) | 基于界面草图的应用检索方法和装置 | |
CN114169381A (zh) | 图像标注方法、装置、终端设备及存储介质 | |
WO2021175040A1 (zh) | 视频处理方法及相关装置 | |
CN116386048A (zh) | 一种印章去除方法、装置、设备及存储介质 | |
US20120002938A1 (en) | Learned cognitive system | |
CN115393635A (zh) | 一种基于超像素分割以及数据增强的红外小目标检测方法 | |
CN111967449A (zh) | 文本检测方法、电子设备及计算机可读介质 | |
US20220189133A1 (en) | Detection of annotated regions of interest in images | |
CN113822871A (zh) | 基于动态检测头的目标检测方法、装置、存储介质及设备 | |
CN112668675A (zh) | 一种图像处理方法、装置、计算机设备及存储介质 | |
US10991085B2 (en) | Classifying panoramic images | |
CN108369559B (zh) | 应用了图像处理的文档结构分析装置 | |
JP2005275854A (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体 | |
CN114511862B (zh) | 表格识别方法、装置及电子设备 | |
Jyothi et al. | Computational color naming for human-machine interaction | |
CN113947529A (zh) | 图像增强方法、模型训练方法、构件识别方法及相关设备 | |
CN112232390A (zh) | 一种高像素大图像的识别方法和系统 | |
JP2006195536A (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN112825141B (zh) | 识别文本的方法、装置、识别设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |