背景技术
在政务无纸化推行的过程中,会涉及到大量的证明、合同、政府批文和报告等,而上述各类电子文件需要利用电子印章合成电子文件,需要从文档中识别并抠出印章图像,可以说,电子印章是正式的电子文件中必不可少的一部分,因此,需从文档资料中分割出印章图像。
目前以较为成熟的图像分割模型主要是以神经网络为主,但该分割方式在训练模型时一是需要准备充足的数据,对数据的质量和数量的要求较高,二是在做图像分割时,阴影和光照对印章类图像分割效果有极大的影响。
公开号CN109636825A的中国专利申请印章图形分割方法、装置及计算机可读存储介质揭露了一种印章图形分割方法,识别出印章的印文文件中的所有封闭区域;根据印模参数,从所述封闭区域中识别出预选印章图形;及利用双阈值颜色分离法从所述预选印章图形中分割出印章图形。通过红色所属聚类针对红色印章进行分割提取,采用一个第一预设阈值获取绝对属于印章的像素,并构成印章像素点集;扩大取值范围,采用第二预设阈值范围来判定印章像素点集内各点的相邻点是否属于印章,以此来补充印章像素点集,保证印章图形的完整性。该方法通过阈值获取印章像素点,没有考虑光照和阴影对图像分割效果的影响,印章分割准确率低。
公开号CN110533047A的中国发明专利申请一种针对古籍图片的去噪和二值化方法,提供一种针对古籍图片的去噪和二值化方法,采用非局部均值滤波算法对古籍图像进行去噪处理;确定阈值,通过图像的水平坐标和垂直坐标计算方形邻域窗口内经高斯滤波后的像素灰度值,通过局部自适应二值化算法对去噪后的灰度图像进行二值化处理。能够较好的适应古籍图像中光照不均,污染严重的情况,能在更好地降低噪声的同时保留图像中的文本区域和细节。该方法计算复杂度高,处理数据量大,容易损失分割图像细节等重要信息。
公开号为CN110889415A的中国发明专利用于不同反光率表面的压印序列号字符分割方法,一种用于不同反光率表面的压印序列号字符分割方法,通过将待分割彩色图像进行灰度化处理后生成列灰度值分布图,经迭代滤波后得到平滑分布图,以其中的灰度值波谷位置作为分割线进行纵向分割从而得到独立的字符图像;利用灰度波形图波峰波谷确定字符分割位置,采用迭代滤波的方式,依据先验经验及待识别压印序列号字符编排规律设置迭代滤波的迭代次数约束函数,设置滤波算法的滤波邻域范围p以及滤波算子的计算权重ki。能够有效解决在压印序列号字符与背景对比度较差,图像字符质量较低的情况下的字符分割与识别问题,且字符分割效果不受二值化阈值影响。该方法需要依赖先验经验,计算复杂度高,且分割准确率不高等问题。
发明内容
本发明所要解决的问题是针对现有技术的上述缺陷,提供了一种简单高效的基于局部二值化的印章图像分割方法。以减小光照和阴影对最终分割图像的影响。
本发明解决上述技术问题的技术方案是,提出一种基于局部二值化的印章图像分割方法,包括步骤,利用双边滤波对印章图片进行平滑处理,保留边界信息的同时平滑区域信息获得滤波图像;确定二值化分割阈值,根据分割阈值在局部窗口中对滤波图像进行二值化分割,得到二值化掩模图像,通过模板对二值化掩模图进行膨胀和腐蚀,填充孔洞得到闭操作图像;同时,将印章图像RGB颜色空间转换为HSV颜色空间,在HSV颜色空间中,进行白色和灰色掩模,获得去除白色和灰色的掩模图像,将闭操作图像与掩模图像做差集,得到分割的印章图像。
进一步地,根据公式:
计算局部二值化分割阈值T(x,y),对于局部窗口中在滤波图像中任一坐标位置(x,y)的像素点的值I
filter(x,y),根据公式:
确定二值化结果B(x,y),根据B(x,y)对滤波图像进行分割,其中,k为给定偏差,δ(x,y)为在局部窗口的标准差,R为标准差的动态范围。
进一步地,对印章图片进行平滑处理具体为,提取印章图片中像素点的RGB值,以任意一个像素点p为基准点,计算其他像素点q与基准像素点的空间距离,确定两个像素点空间位置的高斯滤波核
根据像素点p、q的RGB值I
p、I
q,确定像素点p、q的RGB值差距的高斯滤波核
调用公式:
对像素点q进行双边滤波,完成所有像素点的双边滤波,得到滤波图像I
filter。
进一步地,利用模板B,调用公式
对二值掩模图I
binary进行膨胀和腐蚀,对二值化掩模图进行闭操作以填充孔洞,其中,I
binary表示二值掩模图像,
表示对二值化的结果进行膨胀,Θ表示对结果进行腐蚀。获得在HSV颜色空间中去除白色和灰色的掩模图像I
mask具体为,根据HSV颜色空间中的像素点在H,S,V通道上的值,及其上限和下限确定像素点的白色掩模
和灰色掩模
根据公式
获得该像素点的掩膜结果。
进一步地,将闭操作后得到的图像Iclose与掩模图像Imask做交集得到的最终掩模结果Ifinal_mask,将掩模结果Ifinal_mask与原印章图像进行矩阵点乘,根据公式Ifinal=I*Ifinal_mask获得最终的分割印章图像Ifinal。
进一步地,本发明还请求保护一种电子设备,该电子设备包括:一个或多个处理器,存储器,一个或多个应用程序,其被存储在所述存储器中并被配置为由所述一个或多个处理器加载和运行以便执行所述的印章图像分割方法。
本发明还请求保护一种计算机可读存储介质,其上存储有计算机程序,该程序能够被处理器加载和运行以执行所述的印章图像分割方法。
本发明基于局部二值化的印章图像分割方法,可以快速准确的分割出图片中的印章图像,操作简洁,高效,鲁棒性好,在光照和阴影不均匀的情况下均能够快速、有效的检测,能够自动准确的分割出图片中的印章掩模,具有较高的鲁棒性,尤其是在阴影情况下均能够较好的分割出印章。
具体实施方式
为了清楚地说明本发明的技术方案,下面通过实施例和附图对本发明的实施作详细介绍,显而易见地,为便于理解本发明,下面描述中采用的实施例,并不限定本发明的保护范围。所述实施例只是本发明实施方式的一种,本邻域的技术人员在本发明技术方案范围内进行的常规变化和替换都应包含在本发明的范围内。
图1为基于局部二值化印章图像分割处理流程图。包括,平滑印章图片区域,利用双边滤波对印章图片进行平滑处理,保留边界信息的同时平滑区域信息;局部二值化,利用局部二值化方法对印章图片进行二值化操作,得到最初的二值化掩模结果;对二值化掩模结果进行闭操作,以填充孔洞;剔除白色和灰色,将填补孔洞剔除白色灰色后图像的RGB(红Red-绿Green-蓝Blue)颜色空间转换为HSV(色调Hue,饱和度Saturation,明度Value)颜色空间,在HSV颜色空间中,进行白色和灰色的掩模,掩膜处理的图像与闭操作填补孔洞的图像做差集,得到最终结果。
具体包括,双边滤波对图片进行平滑处理,保留边界信息的同时平滑区域信息。提取印章图片中像素点的RGB值,计算印章图片任意两个像素点的空间距离,在空间位置进行高斯核滤波,对每个像素点进行双边滤波。如,对于原图像I中任意像素点p,q,以其中一个像素点为基准点,另一个为待滤波像素点(如选p为基准点,q为待滤波像素点)获取像素点q的RGB值为I
q,像素点p的RGB值为I
p,根据公式||p-q||计算像素点p和q在空间上的距离,确定像素点p和q在空间位置上的高斯滤波核
像素点p和q的RGB值的差距的高斯滤波核
根据公式:
对图像中的像素点q进行双边滤波,由此完成对图像中每个像素的滤波。其中,
表示归一化因子,S表示像素点q的邻域,BF[I]
q表示像素点q经过双边滤波的结果,则原图像I经过双边滤波,得到滤波图像I
filter。也可采用本领域熟知的其他滤波方式对印章图像进行平滑处理,相比于高斯滤波,中值滤波等低通滤波器,双边滤波器在平滑区域的同时保留了边缘信息,这为后续局部二值化提供了极大的方便。
如图2所示为二值化阈值分割示意图。设置局部窗口,确定二值化分割阈值,根据分割阈值对局部窗口内的滤波图像进行二值化处理。在局部窗口中利用局部二值化对滤波后的图像I
filter进行分割,以减少阴影和光照对分割的影响。本发明通过分割阈值对滤波图像进行二值化,也可采用其他局部二值化方式包括Niblack,Bernsen算法等,全局二值化OSTU算法。二值化的效果的关键在于阈值的选择,通常不同的局部二值化方法T(x,y)的计算方式不同。本发明针对印章图像的特点,需要考虑印章的真实性和光照阴影的影响,获得好的效果,本发明最优采用如下方式确定二值化阈值。根据公式:
计算窗口内滤波后的图像任意像素点I
filter(x,y)局部二值化分割阈值T(x,y)。k为给定偏差,一般取正值,m(x,y)表示局部窗口的均值,δ(x,y)为在局部窗口的标准差,R为标准差的动态范围。
对于滤波图像I
filter中的每一像素点(x,y),根据公式:
获得二值化结果,其中,I
filter(x,y)表示在滤波图像I
filter中(x,y)位置的像素点对应的值,B(x,y)表示像素点I
filter(x,y)二值化结果。通过阈值判定根据二值化结果获得I
filter二值化后的二值掩模图I
binary。
由于纹理或光照的原因,所得二值掩模图会有大量的孔洞产生。图像的小孔洞填充用膨胀和闭操作处理。对二值掩模图进行闭操作以填充孔洞,利用模板对二值掩模图进行膨胀和腐蚀,闭操作后得到的填补了孔洞的图像为I
close(即I
binary·B),具体公式可为:
其中,I
binary表示二值掩模图,B表示模板,
表示对二值化的结果进行膨胀,Θ表示对结果进行腐蚀。通常情况下,模板B为预定大小尺寸的模板,根据精度进行尺寸设置,一般可为3*3的模板。
将印章图像RGB颜色空间转换为HSV颜色空间,在HSV颜色空间中,进行白色和灰色的掩模,获得在HSV颜色空间中去除白色和灰色的掩模图像I
mask。设I
hsv表示RGB颜色空间中原图像I转换为HSV颜色空间后的图像,其中(x,y)坐标点的像素点为I
hsv(x,y),其中,I
h(x,y),I
s(x,y),I
v(x,y)分别表示像素点I
hsv(x,y)在H,S,V通道上的值,白色在HSV三个通道的上限和下限分别表示为
那么像素点I
hsv(x,y)的白色掩模
可以表示为:
其中,∧表示逻辑且。同理,可得像素点I
hsv(x,y)的灰色掩模为:
对满足条件白色掩模或灰色掩模再取反,根据公式:
得到掩模结果I
mask(x,y)。
对所有像素点进行如上的处理,得到掩膜图像I
mask。其中,
表示灰色在HSV三个通道上的上下限
表示逻辑非,∨表示逻辑或。
通常情况下,SV颜色空间的分量范围见下表一。
表一:颜色分量范围
将闭操作后得到的图像Iclose与掩模图像Imask做交集,根据公式:Ifinal_mask=Imask∩Iclose得到的最终掩模结果Ifinal_mask,由此,获得最终的分割印章图像Ifinal为:Ifinal=I*Ifinal_mask。其中,*表示矩阵点乘。
本发明能准确提取印章图像能广泛用于需要印章的电子公文处理。