CN113012059A - 一种文字图像的阴影消除方法、装置及电子设备 - Google Patents

一种文字图像的阴影消除方法、装置及电子设备 Download PDF

Info

Publication number
CN113012059A
CN113012059A CN202110171517.7A CN202110171517A CN113012059A CN 113012059 A CN113012059 A CN 113012059A CN 202110171517 A CN202110171517 A CN 202110171517A CN 113012059 A CN113012059 A CN 113012059A
Authority
CN
China
Prior art keywords
image
shadow
gray level
gray
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110171517.7A
Other languages
English (en)
Other versions
CN113012059B (zh
Inventor
邓元策
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cienet Technologies (beijing) Co ltd
Original Assignee
Cienet Technologies (beijing) Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cienet Technologies (beijing) Co ltd filed Critical Cienet Technologies (beijing) Co ltd
Priority to CN202110171517.7A priority Critical patent/CN113012059B/zh
Publication of CN113012059A publication Critical patent/CN113012059A/zh
Priority to PCT/CN2022/074888 priority patent/WO2022166865A1/zh
Priority to US18/446,446 priority patent/US20230386002A1/en
Application granted granted Critical
Publication of CN113012059B publication Critical patent/CN113012059B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • G06T5/75Unsharp masking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/94Dynamic range modification of images or parts thereof based on local image properties, e.g. for local contrast enhancement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种文字图像的阴影消除方法、装置及电子设备。该阴影消除方法包括如下步骤:将待处理的文字图像转化为第一灰度图像;对第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;对背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示;对第一灰度图像进行背景增强,得到第二灰度图像;根据阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。本发明可以避免现有技术中阴影遮挡的部分的内容完全丢失的情况,提升了浏览和打印的阅读效果。

Description

一种文字图像的阴影消除方法、装置及电子设备
技术领域
本发明涉及一种文字图像的阴影消除方法,同时涉及相应的阴影消除装置及电子设备,属于图像处理技术领域。
背景技术
随着信息技术和数码相机、手机等拍摄设备的普及,在工作或者生活中,人们经常使用拍摄设备,如手机、平板电脑、数码相机等拍摄文字图像(如书本、报纸、文本打印件等),然后直接存储,或者打印出来、发邮件、通过即时通信软件等分享给他人让信息共享变的更加便利。
但是目前在使用拍摄设备进行拍摄的过程中,在某些场景下,可能因为拍摄设备自身或者其他物体遮挡的缘故,导致拍摄出来的文字图像明暗不一,甚至有大片的阴影。特别是夜间,在室内单一光源照明的情况下,拍摄设备在没有打开闪光灯的情况下,拍摄文字图像会出现图像的明暗不一,阴影遮挡等情况。典型情况,如图1所示,图示为晚上,在室内单一光源的情况下,用拍摄设备拍摄文本打印件所得文字图像,将该文字图像直接打印出的效果可能会如图2所示,被阴影遮挡的部分的内容完全丢失,这种文字图像较为影响浏览和打印出来的阅读效果,甚至因为无法识别,导致部分信息丢失。
发明内容
本发明所要解决的技术问题在于提供一种文字图像的阴影消除方法。
本发明所要解决的另一技术问题在于提供一种文字图像的阴影消除装置及电子设备。
为了实现上述目的,本发明采用下述技术方案:
根据本发明实施例的第一方面,提供一种文字图像的阴影消除方法,包括:
将待处理的文字图像转化为第一灰度图像;
对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;
对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示;
对第一灰度图像进行背景增强,得到第二灰度图像;
根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。
其中较优地,在将待处理的文字图像转化为第一灰度图像之前,包括:
获得至少一幅文字图像,确定各幅文字图像的阴影区域信息;
根据各幅文字图像的阴影区域信息,从所述至少一幅文字图像中筛选得到待处理的文字图像。
其中较优地,所述根据各幅文字图像的阴影区域信息,从所述至少一幅文字图像中筛选得到待处理的文字图像,包括:
根据各幅文字图像的阴影区域面积,从所述至少一幅文字图像中筛选阴影区域面积大于预先设置的面积阈值的文字图像作为待处理的文字图像。
其中较优地,所述根据各幅文字图像的阴影区域信息,从所述至少一幅文字图像中筛选得到待处理的文字图像,包括:
根据各幅文字图像的阴影区域占整幅图像的面积比例,从所述至少一幅文字图像中筛选面积比例大于预先设置的比例阈值的文字图像作为待处理的文字图像。
其中较优地,对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值,包括:
对所述第一灰度图像进行直方图统计;
计算直方图统计后每个灰度区间的凸高度,并对凸高度进行排序;
提取凸高度最大的n个灰度区间,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;其中,n为预先设置的个数值。
其中较优地,对所述第一灰度图像进行直方图统计,包括:
将所述第一灰度图像中的所有元素通过直方图统计的方式进行分布估计,形成分布估计序列
Figure BDA0002939021330000031
确定分布估计序列
Figure BDA0002939021330000032
中各元素对应的分布概率密度λk;其中,
Figure BDA0002939021330000033
其中λk为分布估计序列
Figure BDA0002939021330000034
的第k个元素对应的分布概率密度;θk为落入区间[(k-1)*ρ,k*ρ]的取值数;Θ为所述第一灰度图像的元素个数;ρ为统计间隔,ρ=255/Z,Z为预先设置的统计区间总数;
根据各元素对应的分布概率密度λk,使用一阶差分和符号判断方法,得到一阶差分符号序列
Figure BDA0002939021330000035
其中
Figure BDA0002939021330000036
Figure BDA0002939021330000037
的第i个元素,1D表示一阶差分;其中,
Figure BDA0002939021330000038
根据
Figure BDA0002939021330000039
中的元素
Figure BDA00029390213300000310
计算二阶差分极值标记序列
Figure BDA00029390213300000311
其中
Figure BDA00029390213300000312
Figure BDA00029390213300000313
第j个元素,2D表示二阶差分;其中,
Figure BDA00029390213300000314
其中较优地,计算直方图统计后每个灰度区间的凸高度,并对凸高度进行排序,包括:
确定分布估计序列
Figure BDA00029390213300000315
对应的凸高度序列H;其中,凸高度序列H的长度和分布估计序列
Figure BDA00029390213300000316
的二阶差分极值标记序列
Figure BDA00029390213300000317
相同,且在序列
Figure BDA00029390213300000318
为零的位置上,凸高度序列H对应的值也为零;
对分布估计序列
Figure BDA00029390213300000319
中二阶差分极值标记序列非零位置上的元素
Figure BDA00029390213300000320
计算其对应的凸区间以及凸高度;其中,凸区间的计算包括:左凸区间和右凸区间的计算;其中,左凸区间为极值位置到上一个更高极值所在位置或信号起始位置;右凸区间为极值位置到下一个更高极值所在位置或信号结束位置;
对于满足其对应位置上二阶差分极值标记序列的值非零的元素λt,0≤t≤Z-2,其左凸区间的起始位置αL和右凸区间的结束位置αR的计算方式如下:
Figure BDA0002939021330000041
确定元素λt的左凸区间和右凸区间分别为[αL,t]和[t,αR];
计算左凸区间和右凸区间内的最小值的较大值作为凸高度的参考点λref
Figure BDA0002939021330000042
其中,
Figure BDA0002939021330000043
算符为求序列ψ在区间[a,b]中的最小值;
确定元素λt对应的凸高度为:
Ht=λtref
对凸高度序列H进行排序。
其中较优地,所述提取凸高度最大的n个灰度区间,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值,包括:
从凸高度序列H中从大到小取出n个元素,对应的索引依次为{τ012,…,τn-1},分别取出分布估计序列
Figure BDA0002939021330000047
对应位置上的值,确定第一灰度图像的背景灰度分割阈值μb和第一灰度图像的阴影区域内的文字灰度分割阈值μst;其中,
Figure BDA0002939021330000044
其中,Δ为分割阈值的预设偏移量。
其中较优地,所述对第一灰度图像进行背景增强,得到第二灰度图像,包括:
确定背景增强并保留阴影区域内的文字的第二灰度图像
Figure BDA0002939021330000045
其中,
Figure BDA0002939021330000046
其中
Figure BDA0002939021330000051
Figure BDA0002939021330000052
分别是第二灰度图像
Figure BDA0002939021330000053
和第一灰度图像Dg第i行第j列的元素。
其中较优地,所述方法还包括:
对第一灰度图像进行阴影边界增强,得到第三灰度图像
Figure BDA0002939021330000054
其中,
Figure BDA0002939021330000055
其中
Figure BDA0002939021330000056
是第三灰度图像
Figure BDA0002939021330000057
第i行第j列的元素。
其中较优地,对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示,包括:
对第三灰度图像进行空间域的平滑滤波处理,之后进行二值化处理得到非阴影区域的掩膜表示;
对非阴影区域的掩膜表示的灰度值进行翻转,获得阴影区域的掩膜表示。
其中较优地,所述根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像,包括:
将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。
根据本发明实施例的第二方面,提供一种文字图像的阴影消除装置,包括:
灰度图像转化单元,用于将待处理的文字图像转化为第一灰度图像;
灰度分割阈值确定单元,用于对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;
掩膜表示确定单元,用于对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示;
背景增强单元,用于对第一灰度图像进行背景增强,得到第二灰度图像;
区域融合单元,用于根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。
根据本发明实施例的第三方面,提供一种电子设备,包括处理器,所述处理器与存储器耦合,用于执行所述存储器中的程序或指令,以使所述电子设备实现如上述第一方面所述的方法。
根据本发明实施例的第四方面,提供一种计算机可读存储介质,所述可读存储介质上存储有指令,当其在计算机上运行时,使得所述计算机执行如上述第一方面所述的方法。
根据本发明实施例的第五方面,提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得所述计算机执行如上述第一方面所述的方法。
本发明所提供的文字图像的阴影消除方法、装置及电子设备,能够将待处理的文字图像转化为第一灰度图像;对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示;对第一灰度图像进行背景增强,得到第二灰度图像;根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。通过本发明实施例,可以获得阴影消除后的文字图像,避免现有技术中阴影遮挡的部分的内容完全丢失的情况,提升了浏览或打印的阅读效果。
附图说明
图1为用拍摄设备拍摄文件所得图像的示意图;
图2为将拍摄设备拍摄文件所得图像进行打印所得效果图像示意图;
图3为本发明实施例提供的一种文字图像的阴影消除方法的流程图一;
图4为本发明实施例的应用环境示意图;
图5为本发明实施例提供的一种文字图像的阴影消除方法的流程图二;
图6为本发明实施例中的直方图统计曲线的凸高度计算示例示意图;
图7为采用本发明实施例进行阴影区域消除的结果示意图;
图8为本发明实施例提供的一种文字图像的阴影消除装置的结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明的技术内容做进一步的详细说明。
为了避免当前通过拍摄设备拍摄图像时,在存在阴影遮挡情况下,所得到的图像存在一大块阴影,影像最终图像的质量,特别是将图像在电子设备上进行浏览以及将图像打印时,图像清晰度较差,甚至造成图形、文字等的丢失。为了克服上述问题,如图3所示,本发明实施例提供一种文字图像的阴影消除方法,包括:
步骤S101:将待处理的文字图像转化为第一灰度图像。
步骤S102:对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值。
步骤S103:对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示。
步骤S104:对第一灰度图像进行背景增强,得到第二灰度图像。
步骤S105:根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。
为了使本领域的技术人员更好的了解本发明,下面结合具体的应用环境,列举一个更为详细的实施例。如图4所示,用户手持手机201想要拍摄一个文件202,但是其背对光源203,因此用户的手机201挡住了光源203,在文件202上出现了一个手机201留下的阴影204。以下本发明实施例将提供一种文字图像的阴影消除方法,来针对如图4所示的场景。
此处,如图5所示,本发明实施例提供一种文字图像的阴影消除方法,包括:
步骤S301:获得至少一幅文字图像,确定各幅文字图像的阴影区域信息。
此处,需要说明的是,执行本文字图像的阴影消除方法的电子设备可以是图像采集装置,例如手机、照相机等,还可以是后端处理装置,例如用于图像处理的计算机,服务器等,但不仅局限于此。而确定各幅文字图像的阴影区域信息可以是通过文字图像的灰度信息实现的,一般情况下,若文字图像不存在阴影区域,则整幅图像的灰度分布主要集中在两个部分,且两者灰度值差异较大,灰度值较大区域为背景区域,灰度值较小区域为文字区域。当灰度分布明显集中在多个部分时,可以确定该文字图像存在阴影区域。
步骤S302:根据各幅文字图像的阴影区域信息,从所述至少一幅文字图像中筛选得到待处理的文字图像。
此处,该步骤S302可以采用如下任一方式实现,例如:
根据各幅文字图像的阴影区域面积,从所述至少一幅文字图像中筛选阴影区域面积大于预先设置的面积阈值的文字图像作为待处理的文字图像。即在某些文字图像的阴影区域面积较小时(例如小于面积阈值),该较小的阴影区域可能并不影响文字信息的浏览和打印,则无需进行处理。而在某些文字图像的阴影区域面积较大时(例如大于面积阈值),该较大的阴影区域可能影响文字信息的浏览和打印,则将其作为待处理的文字图像。这样可以避免全量的文字图像都进行处理,而造成的浪费计算资源的问题。
或者,根据各幅文字图像的阴影区域占整幅图像的面积比例,从所述至少一幅文字图像中筛选面积比例大于预先设置的比例阈值的文字图像作为待处理的文字图像。即在某些文字图像的阴影区域面积较小时(例如阴影区域占整幅图像的面积比例小于比例阈值),该较小的阴影区域可能并不影响文字信息的浏览和打印,则无需进行处理。而在某些文字图像的阴影区域面积较大时(例如阴影区域占整幅图像的面积比例大于比例阈值),该较大的阴影区域可能影响文字信息的浏览和打印,则将其作为待处理的文字图像。这样可以避免全量的文字图像都进行处理,而造成的浪费计算资源的问题。
步骤S303:将待处理的文字图像转化为第一灰度图像。
此处,该步骤S303可以采用如下方式实现,例如:
首先该待处理的文字图像为Do,一般情况下,设定待处理的文字图像对应数据矩阵Do的维度为m×n×3,其中m和n分别为图像的高度和宽度对应的像素点的个数。一般而言,待处理的文字图像Do由r/g/b三个颜色通道的数据表示,其维度都为m×n。按下式将彩色图像转化为第一灰度图像:
Dg=0.2989*R+0.5870*G+0.1140*B
其中,R、G、B为原彩色图像Do中的红色、绿色以及蓝色分量,其矩阵各个元素取值和原彩色图像关系如下
Figure BDA0002939021330000091
其中r(i,j),g(i,j)和b(i,j)分别表示R/G/B矩阵中的第i行第j列的元素。
步骤S304:对第一灰度图像进行直方图统计。
此处,该步骤S304可以采用如下方式实现:
将第一灰度图像中的所有元素通过直方图统计的方式进行分布估计,形成分布估计序列
Figure BDA0002939021330000092
确定分布估计序列
Figure BDA0002939021330000093
中各元素对应的分布概率密度λk;其中,
Figure BDA0002939021330000094
其中λk为分布估计序列
Figure BDA0002939021330000095
的第k个元素对应的分布概率密度;θk为落入区间[(k-1)*ρ,k*ρ]的取值数;Θ为所述第一灰度图像Dg的元素个数,满足Θ=m×n;ρ为统计间隔,ρ=255/Z,Z为预先设置的统计区间总数,例如可以为125;
根据各元素对应的分布概率密度λk,使用一阶差分和符号判断方法,得到一阶差分符号序列
Figure BDA0002939021330000096
其中
Figure BDA0002939021330000097
Figure BDA0002939021330000098
的第i个元素;其中,
Figure BDA0002939021330000099
根据
Figure BDA00029390213300000910
中的元素
Figure BDA00029390213300000911
计算二阶差分极值标记序列
Figure BDA00029390213300000912
其中
Figure BDA00029390213300000913
Figure BDA00029390213300000914
第j个元素;其中,
Figure BDA00029390213300000915
步骤S305:计算直方图统计后每个灰度区间的凸高度,并对凸高度进行排序。
此处,该步骤S305可以采用如下方式实现:
确定分布估计序列
Figure BDA0002939021330000101
对应的凸高度序列H;其中,凸高度序列H的长度和分布估计序列
Figure BDA0002939021330000102
的二阶差分极值标记序列
Figure BDA0002939021330000103
相同,且在序列
Figure BDA0002939021330000104
为零的位置上,凸高度序列H对应的值也为零。
对分布估计序列
Figure BDA0002939021330000105
中二阶差分极值标记序列非零位置上的元素
Figure BDA0002939021330000106
计算其对应的凸区间以及凸高度;其中,凸区间的计算包括:左凸区间和右凸区间的计算;其中,左凸区间为极值位置到上一个更高极值所在位置或信号起始位置;右凸区间为极值位置到下一个更高极值所在位置或信号结束位置;
对于满足其对应位置上二阶差分极值序列的值非零的元素λt,0≤t≤Z-2,其左凸区间的起始位置αL和右凸区间的结束位置αR的计算方式如下:
Figure BDA0002939021330000107
确定满足其对应位置上二阶差分极值序列的值非零的元素λt的左凸区间和右凸区间分别为[αL,t]和[t,αR];
计算左凸区间和右凸区间内的最小值的较大值作为凸高度的参考点λref
Figure BDA0002939021330000108
其中,
Figure BDA0002939021330000109
算符为求序列ψ在区间[a,b]中的最小值;
确定元素λt对应的凸高度为:
Ht=λtref
对凸高度序列H进行排序。
步骤S306:提取凸高度最大的n个灰度区间,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值。
其中,n为预先设置的个数值,推荐n取值为4。
此处,该步骤S306可以采用如下方式实现:
从凸高度序列H中从大到小取出n个元素,对应的索引依次为{τ012,…,τn-1},例如当n=4时,对应的索引依次为{τ0123},分别取出分布估计序列
Figure BDA0002939021330000111
对应位置上的值,确定第一灰度图像的背景灰度分割阈值μb和第一灰度图像的阴影区域内的文字灰度分割阈值μst;其中,
Figure BDA0002939021330000112
其中,Δ为分割阈值的预设偏移量,属于可调参数,例如可以取值50。
步骤S307:对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示。
此处,该步骤S307可以采用如下方式实现:
为了提出出更平滑的阴影区域,对第三灰度图像
Figure BDA0002939021330000113
进行空间域的平滑滤波处理,之后进行二值化处理得到非阴影区域的掩膜表示
Figure BDA0002939021330000114
其中,
Figure BDA0002939021330000115
其中,
Figure BDA0002939021330000116
为二维卷积运算符;P为预先设置的空间滤波的滤波器系数,维度σ×ω,本实施例中主要用来平滑边缘和消除区域内的“孤岛”灰度尖峰,所以一般可以使用归一化的幺矩阵,即幺矩阵需要乘以1/(σ×ω)。滤波器系数矩阵的维度为可调参数,本实施例中一般使用σ=ω=10,
Figure BDA0002939021330000117
为图像二值化算子;
对非阴影区域的掩膜表示
Figure BDA0002939021330000118
的灰度值进行翻转,获得阴影区域的掩膜表示
Figure BDA0002939021330000119
其中,
Figure BDA00029390213300001110
其中1表示和
Figure BDA00029390213300001111
同维度的幺矩阵。
步骤S308:对第一灰度图像进行背景增强,得到第二灰度图像。
此处,该步骤S308可以采用如下方式实现:
确定背景增强并保留阴影区域内的文字的第二灰度图像
Figure BDA00029390213300001112
其中,
Figure BDA0002939021330000121
其中
Figure BDA0002939021330000122
Figure BDA0002939021330000123
分别是第二灰度图像
Figure BDA0002939021330000124
和第一灰度图像Dg第i行第j列的元素。
步骤S309:对第一灰度图像进行阴影边界增强,得到第三灰度图像
Figure BDA0002939021330000125
其中,
Figure BDA0002939021330000126
其中
Figure BDA0002939021330000127
是第三灰度图像
Figure BDA0002939021330000128
第i行第j列的元素。
步骤S310:根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。
此处,该步骤S310可以采用如下方式实现:
将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像
Figure BDA0002939021330000129
其中,
Figure BDA00029390213300001210
通过上述步骤S301至步骤S310,本方案实施例进行了仿真处理,过程如下:
如图1和图4所示,在晚上,室内单一光源且手机没有打开闪光灯的情况下,图像上存在大量阴影区域。阴影区域内的文字已经难以辨认。如果直接对原图进行二值化,如图2所示,阴影区域内的文字信息完全丢失。根据本实施例,首先对灰度化的图像进行直方图统计。然后计算每个灰度区间的凸高度,如图6所示,提取凸高度最大的4个灰度区间作为后续阴影区域文字和背景的灰度参考值。然后通过灰度值的阈值分割,空间平滑滤波和二值化,分别获得阴影区域和非阴影区域的掩膜表示。最后基于掩膜表示将背景增强的阴影区域和原灰度图像的非阴影区域进行融合,并通过二值化均衡整体的灰度平衡,最终得到祛除阴影后的文字图像。通过本方法实施例处理后,如图7所示,阴影区域基本被消除,并且文字没有被明显破坏,文字比图2更加清晰可见。
另外,如图8所示,本发明实施例还提供一种文字图像的阴影消除装置,包括:
灰度图像转化单元41,用于将待处理的文字图像转化为第一灰度图像。
灰度分割阈值确定单元42,用于对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值。
掩膜表示确定单元43,用于对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示。
背景增强单元44,用于对第一灰度图像进行背景增强,得到第二灰度图像。
区域融合单元45,用于根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。
需要强调的是,本发明中,文字图像不是狭义的字面表达意思,其包括但不限于具有文字、符号、数字等各种各样信息的图像,只要出现明暗不一,阴影遮挡等情况的图像均适用于本发明的阴影消除方法。
另外,本发明实施例还提供一种电子设备,包括处理器,所述处理器与存储器耦合,用于执行所述存储器中的程序或指令,以使所述电子设备实现如上述图3或图5所述的方法。
另外,本发明实施例还提供一种计算机可读存储介质,所述可读存储介质上存储有指令,当其在计算机上运行时,使得所述计算机执行如上述图3或图5所述的方法。
另外,本发明实施例还提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得所述计算机执行如上述图3或图5所述的方法。
本发明所提供的文字图像的阴影消除方法、装置及电子设备,能够将待处理的文字图像转化为第一灰度图像;对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示;对第一灰度图像进行背景增强,得到第二灰度图像;根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。通过本发明实施例,可以获得阴影消除后的文字图像,避免现有技术中阴影遮挡的部分的内容完全丢失的情况,提升了浏览和打印的阅读效果。
以上对本发明所提供的文字图像的阴影消除方法、装置及电子设备进行了详细的说明。对本领域的一般技术人员而言,在不背离本发明实质内容的前提下对它所做的任何显而易见的改动,都将属于本发明专利权的保护范围。

Claims (14)

1.一种文字图像的阴影消除方法,其特征在于,包括:
将待处理的文字图像转化为第一灰度图像;
对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;
对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示;
对第一灰度图像进行背景增强,得到第二灰度图像;
根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。
2.如权利要求1所述的阴影消除方法,其特征在于,在将待处理的文字图像转化为第一灰度图像之前,包括:
获得至少一幅文字图像,确定各幅文字图像的阴影区域信息;
根据各幅文字图像的阴影区域信息,从所述至少一幅文字图像中筛选得到待处理的文字图像。
3.如权利要求2所述的阴影消除方法,其特征在于,所述根据各幅文字图像的阴影区域信息,从所述至少一幅文字图像中筛选得到待处理的文字图像,包括:
根据各幅文字图像的阴影区域面积,从所述至少一幅文字图像中筛选阴影区域面积大于预先设置的面积阈值的文字图像作为待处理的文字图像。
4.如权利要求2所述的阴影消除方法,其特征在于,所述根据各幅文字图像的阴影区域信息,从所述至少一幅文字图像中筛选得到待处理的文字图像,包括:
根据各幅文字图像的阴影区域占整幅图像的面积比例,从所述至少一幅文字图像中筛选面积比例大于预先设置的比例阈值的文字图像作为待处理的文字图像。
5.如权利要求1所述的阴影消除方法,其特征在于,对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值,包括:
对所述第一灰度图像进行直方图统计;
计算直方图统计后每个灰度区间的凸高度,并对凸高度进行排序;
提取凸高度最大的n个灰度区间,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;其中,n为预先设置的个数值。
6.如权利要求5所述的阴影消除方法,其特征在于,对所述第一灰度图像进行直方图统计,包括:
将所述第一灰度图像中的所有元素通过直方图统计的方式进行分布估计,形成分布估计序列
Figure FDA0002939021320000021
确定分布估计序列
Figure FDA0002939021320000022
中各元素对应的分布概率密度λk;其中,
Figure FDA0002939021320000023
其中λk为分布估计序列
Figure FDA0002939021320000024
的第k个元素对应的分布概率密度;θk为落入区间[(k-1)*ρ,k*ρ]的取值数;Θ为所述第一灰度图像的元素个数;ρ为统计间隔,ρ=255/Z,Z为预先设置的统计区间总数;
根据各元素对应的分布概率密度λk,使用一阶差分和符号判断方法,得到一阶差分符号序列
Figure FDA0002939021320000025
其中
Figure FDA0002939021320000026
Figure FDA0002939021320000027
的第i个元素;其中,
Figure FDA0002939021320000028
根据
Figure FDA0002939021320000029
中的元素
Figure FDA00029390213200000210
计算二阶差分极值标记序列
Figure FDA00029390213200000211
其中
Figure FDA00029390213200000212
Figure FDA00029390213200000213
第j个元素;其中,
Figure FDA00029390213200000214
7.如权利要求6所述的阴影消除方法,其特征在于,计算直方图统计后每个灰度区间的凸高度,并对凸高度进行排序,包括:
确定分布估计序列
Figure FDA00029390213200000215
对应的凸高度序列H;其中,凸高度序列H的长度和分布估计序列
Figure FDA00029390213200000216
的二阶差分极值标记序列
Figure FDA00029390213200000217
相同,且在序列
Figure FDA0002939021320000031
为零的位置上,凸高度序列H对应的值也为零;
对分布估计序列
Figure FDA0002939021320000032
中二阶差分极值标记序列非零位置上的元素
Figure FDA0002939021320000033
计算其对应的凸区间以及凸高度;其中,凸区间的计算包括:左凸区间和右凸区间的计算;其中,左凸区间为极值位置到上一个更高极值所在位置或信号起始位置;右凸区间为极值位置到下一个更高极值所在位置或信号结束位置;
对于满足其对应位置上二阶差分极值序列的值非零的元素λt,0≤t≤Z-2,其左凸区间的起始位置αL和右凸区间的结束位置αR的计算方式如下:
Figure FDA0002939021320000034
确定满足其对应位置上二阶差分极值序列的值非零的元素λt的左凸区间和右凸区间分别为[αL,t]和[t,αR];
计算左凸区间和右凸区间内的最小值的较大值作为凸高度的参考点λref
Figure FDA0002939021320000035
其中,
Figure FDA0002939021320000036
算符为求序列ψ在区间[a,b]中的最小值;
确定元素λt对应的凸高度为:
Ht=λtref
对凸高度序列H进行排序。
8.如权利要求7所述的阴影消除方法,其特征在于,所述提取凸高度最大的n个灰度区间,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值,包括:
从凸高度序列H中从大到小取出n个元素,对应的索引依次为{τ012,…,τn-1},分别取出分布估计序列
Figure FDA0002939021320000037
对应位置上的值,确定第一灰度图像的背景灰度分割阈值μb和第一灰度图像的阴影区域内的文字灰度分割阈值μst;其中,
Figure FDA0002939021320000041
其中,Δ为分割阈值的预设偏移量。
9.如权利要求8所述的阴影消除方法,其特征在于,所述对第一灰度图像进行背景增强,得到第二灰度图像,包括:
确定背景增强并保留阴影区域内的文字的第二灰度图像
Figure FDA0002939021320000042
其中,
Figure FDA0002939021320000043
其中
Figure FDA0002939021320000044
Figure FDA0002939021320000045
分别是第二灰度图像
Figure FDA0002939021320000046
和第一灰度图像Dg第i行第j列的元素。
10.如权利要求9所述的阴影消除方法,其特征在于还包括:
对第一灰度图像进行阴影边界增强,得到第三灰度图像
Figure FDA0002939021320000047
其中,
Figure FDA0002939021320000048
其中
Figure FDA0002939021320000049
是第三灰度图像
Figure FDA00029390213200000410
第i行第j列的元素。
11.如权利要求10所述的阴影消除方法,其特征在于,对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示,包括:
对第三灰度图像进行空间域的平滑滤波处理,之后进行二值化处理得到非阴影区域的掩膜表示;
对非阴影区域的掩膜表示的灰度值进行翻转,获得阴影区域的掩膜表示。
12.如权利要求11所述的阴影消除方法,其特征在于,所述根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像,包括:
将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。
13.一种文字图像的阴影消除装置,其特征在于,包括:
灰度图像转化单元,用于将待处理的文字图像转化为第一灰度图像;
灰度分割阈值确定单元,用于对所述第一灰度图像进行直方图统计和凸高度排序处理,确定第一灰度图像的背景灰度分割阈值和第一灰度图像的阴影区域内的文字灰度分割阈值;
掩膜表示确定单元,用于对所述背景灰度分割阈值和文字灰度分割阈值进行处理,分别获得阴影区域掩膜表示和非阴影区域掩膜表示;
背景增强单元,用于对第一灰度图像进行背景增强,得到第二灰度图像;
区域融合单元,用于根据所述阴影区域掩膜表示和非阴影区域掩膜表示将第二灰度图像中背景增强的阴影区域和第一灰度图像中的非阴影区域进行融合处理,获得阴影消除后的文字图像。
14.一种电子设备,其特征在于包括处理器,所述处理器与存储器耦合,用于执行所述存储器中的程序或指令,以使所述电子设备实现如权利要求1-12中任意一项所述的阴影消除方法。
CN202110171517.7A 2021-02-08 2021-02-08 一种文字图像的阴影消除方法、装置及电子设备 Active CN113012059B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110171517.7A CN113012059B (zh) 2021-02-08 2021-02-08 一种文字图像的阴影消除方法、装置及电子设备
PCT/CN2022/074888 WO2022166865A1 (zh) 2021-02-08 2022-01-29 一种文字图像的阴影消除方法、装置及电子设备
US18/446,446 US20230386002A1 (en) 2021-02-08 2023-08-08 Shadow elimination method and apparatus for text image, and electronic device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110171517.7A CN113012059B (zh) 2021-02-08 2021-02-08 一种文字图像的阴影消除方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN113012059A true CN113012059A (zh) 2021-06-22
CN113012059B CN113012059B (zh) 2024-07-26

Family

ID=76383835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110171517.7A Active CN113012059B (zh) 2021-02-08 2021-02-08 一种文字图像的阴影消除方法、装置及电子设备

Country Status (3)

Country Link
US (1) US20230386002A1 (zh)
CN (1) CN113012059B (zh)
WO (1) WO2022166865A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114022383A (zh) * 2021-11-05 2022-02-08 瞬联软件科技(北京)有限公司 一种文字图像的摩尔纹祛除方法、装置及电子设备
WO2022166865A1 (zh) * 2021-02-08 2022-08-11 瞬联软件科技(北京)有限公司 一种文字图像的阴影消除方法、装置及电子设备
CN115183698A (zh) * 2022-07-13 2022-10-14 湖南大学 一种条纹阴影定位的方法、装置、介质及设备

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116612052B (zh) * 2023-07-17 2023-09-22 青岛瑞源工程集团有限公司 一种建筑施工安全信息管理方法及系统
CN116682112B (zh) * 2023-07-28 2023-10-17 青岛虹竹生物科技有限公司 一种多糖测试数据存储及数字化方法
CN116703888B (zh) * 2023-07-28 2023-10-20 菏泽城建新型工程材料有限公司 一种钻孔灌注桩施工辅助异常检测方法及其系统
CN116779114B (zh) * 2023-08-24 2023-11-03 邹城市人民医院 一种抗肿瘤医疗mri图像信息智能管理系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059870A (zh) * 2007-05-23 2007-10-24 华中科技大学 一种基于属性直方图的图像分割方法
CN106815587A (zh) * 2015-11-30 2017-06-09 浙江宇视科技有限公司 图像处理方法及装置
CN106951811A (zh) * 2017-03-20 2017-07-14 深圳市金立通信设备有限公司 一种图像处理方法及终端
CN107862667A (zh) * 2017-11-23 2018-03-30 武汉大学 一种基于高分辨率遥感影像的城市阴影检测与去除方法
US20190266706A1 (en) * 2018-02-28 2019-08-29 Adobe Inc. Removal of shadows from document images while preserving fidelity of image contents
CN110428380A (zh) * 2019-08-01 2019-11-08 重庆师范大学 紫色土土壤图像阴影增强方法
CN111915509A (zh) * 2020-07-03 2020-11-10 三峡大学 基于图像处理去阴影优化的保护压板状态辨识方法
CN112241737A (zh) * 2020-11-12 2021-01-19 瞬联软件科技(北京)有限公司 文字图像校正方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101621607A (zh) * 2009-07-24 2010-01-06 天津三星光电子有限公司 数码相机消除影像阴影的方法
CN106296666B (zh) * 2016-08-01 2019-03-01 北京大学深圳研究生院 一种彩色图像去阴影方法和应用
CN113012059B (zh) * 2021-02-08 2024-07-26 瞬联软件科技(北京)有限公司 一种文字图像的阴影消除方法、装置及电子设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059870A (zh) * 2007-05-23 2007-10-24 华中科技大学 一种基于属性直方图的图像分割方法
CN106815587A (zh) * 2015-11-30 2017-06-09 浙江宇视科技有限公司 图像处理方法及装置
CN106951811A (zh) * 2017-03-20 2017-07-14 深圳市金立通信设备有限公司 一种图像处理方法及终端
CN107862667A (zh) * 2017-11-23 2018-03-30 武汉大学 一种基于高分辨率遥感影像的城市阴影检测与去除方法
US20190266706A1 (en) * 2018-02-28 2019-08-29 Adobe Inc. Removal of shadows from document images while preserving fidelity of image contents
CN110428380A (zh) * 2019-08-01 2019-11-08 重庆师范大学 紫色土土壤图像阴影增强方法
CN111915509A (zh) * 2020-07-03 2020-11-10 三峡大学 基于图像处理去阴影优化的保护压板状态辨识方法
CN112241737A (zh) * 2020-11-12 2021-01-19 瞬联软件科技(北京)有限公司 文字图像校正方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
于东方;殷建平;张国敏;: "一种基于灰度直方图的遥感影像阴影自动检测方法", 计算机工程与科学, no. 12 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022166865A1 (zh) * 2021-02-08 2022-08-11 瞬联软件科技(北京)有限公司 一种文字图像的阴影消除方法、装置及电子设备
CN114022383A (zh) * 2021-11-05 2022-02-08 瞬联软件科技(北京)有限公司 一种文字图像的摩尔纹祛除方法、装置及电子设备
CN115183698A (zh) * 2022-07-13 2022-10-14 湖南大学 一种条纹阴影定位的方法、装置、介质及设备

Also Published As

Publication number Publication date
CN113012059B (zh) 2024-07-26
WO2022166865A1 (zh) 2022-08-11
US20230386002A1 (en) 2023-11-30

Similar Documents

Publication Publication Date Title
CN113012059A (zh) 一种文字图像的阴影消除方法、装置及电子设备
EP2605186B1 (en) Method and apparatus for recognizing a character based on a photographed image
CN114283156B (zh) 一种用于去除文档图像颜色及手写笔迹的方法及装置
CN109214996B (zh) 一种图像处理方法及装置
Meng et al. Nonparametric illumination correction for scanned document images via convex hulls
CN110390643A (zh) 一种车牌增强方法、装置及电子设备
CN113487473B (zh) 一种添加图像水印的方法、装置、电子设备及存储介质
CN109598270B (zh) 扭曲文字的识别方法及装置、存储介质及处理器
CN113033558B (zh) 一种用于自然场景的文本检测方法及装置、存储介质
CN110599532A (zh) 图像的深度估计模型优化、深度估计处理方法及装置
CN110942435B (zh) 一种文档图像处理的方法和装置
CN110210467B (zh) 一种文本图像的公式定位方法、图像处理装置、存储介质
CN111080723A (zh) 基于Unet网络的图像元素分割方法
CN109242750B (zh) 图片签名方法、图片匹配方法、装置、设备及存储介质
CN112837329B (zh) 一种藏文古籍文档图像二值化方法及系统
CN113554615B (zh) 一种图像精细化处理方法、装置、电子设备及存储介质
JP2007334876A (ja) 文書イメージ処理システムおよび文書イメージ処理方法
Murali et al. Detection Of digital photo image forgery
RU2383924C2 (ru) Способ адаптивного повышения резкости цифровых фотографий в процессе печати
Singh et al. Noise Removal Technique for Document Images
CN114267035A (zh) 一种文档图像处理方法、系统、电子设备及可读介质
CN111932470A (zh) 基于视觉选择融合的图像复原方法、装置、设备和介质
CN114596210A (zh) 噪声估计方法、装置、终端设备及计算机可读存储介质
CN112598694B (zh) 视频图像处理方法、电子装置及存储介质
CN114240988B (zh) 一种基于非线性尺度空间的图像分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant