CN107766014A - 文字增强方法及装置 - Google Patents

文字增强方法及装置 Download PDF

Info

Publication number
CN107766014A
CN107766014A CN201711080626.8A CN201711080626A CN107766014A CN 107766014 A CN107766014 A CN 107766014A CN 201711080626 A CN201711080626 A CN 201711080626A CN 107766014 A CN107766014 A CN 107766014A
Authority
CN
China
Prior art keywords
pixel
black
value
white
shading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711080626.8A
Other languages
English (en)
Other versions
CN107766014B (zh
Inventor
马杨晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Pantum Electronics Co Ltd
Original Assignee
Zhuhai Pantum Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Pantum Electronics Co Ltd filed Critical Zhuhai Pantum Electronics Co Ltd
Priority to CN201711080626.8A priority Critical patent/CN107766014B/zh
Publication of CN107766014A publication Critical patent/CN107766014A/zh
Priority to PCT/CN2018/106761 priority patent/WO2019085672A1/zh
Application granted granted Critical
Publication of CN107766014B publication Critical patent/CN107766014B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1202Dedicated interfaces to print systems specifically adapted to achieve a particular effect
    • G06F3/1203Improving or facilitating administration, e.g. print management
    • G06F3/1208Improving or facilitating administration, e.g. print management resulting in improved quality of the output result, e.g. print layout, colours, workflows, print preview

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种文字增强方法及装置,通过根据预设底纹模板,对文稿进行底纹检测;根据底纹检测结果,对文稿中的像素点进行划分,得到底纹区域与文字区域;对文字区域内的像素点进行白底黑字或黑底白字的识别;对识别得到的白底黑字或黑底白字的像素点进行文字增强处理,得到文字增强处理后的文稿。从而实现了对文稿中底纹的有效识别,通过对去除或减弱底纹之后的黑底白字或白底黑字的文字进行增强处理,提高了打印文稿中文字的呈现清晰度。

Description

文字增强方法及装置
技术领域
本发明涉及图像处理技术,尤其涉及一种文字增强方法及装置。
背景技术
所谓文字增强,指的是让打印文稿中的文字呈现出更加清晰的显示效果。
现有技术中对打印文稿中的文字进行增强的处理方法是先将文稿中的非重叠的图像与文字进行分离,再对文字进行增强处理;或者是调整整张文稿的显示亮度而达到凸显文字的目的。
然而,若采用上述现有技术的方法对带有底纹的白底黑字和/或黑底白字的文稿进行处理,文字很容易受到底纹的干扰,图1举例示意了各种底纹的呈现形式。因此,对于存在底纹的白底黑字和/或黑底白字的文稿,其文字增强处理后的打印清晰度不高,导致文稿的整体打印质量达不到满意的效果。
发明内容
本发明提供一种文字增强方法及装置,以解决现有技术中对带有底纹的黑底白字和/或白底黑字文稿的文字增强效果不理想的技术问题。
本发明一个方面提供一种文字增强方法,包括:
根据预设底纹模板,对文稿进行底纹检测;
根据底纹检测结果,对所述文稿中的像素点进行划分,得到底纹区域与文字区域;
对所述文字区域内的像素点进行白底黑字或黑底白字的识别;
对识别得到的所述白底黑字或所述黑底白字的像素点进行文字增强处理,得到文字增强处理后的文稿。
可选的,所述预设底纹模板包含N×N个检测值,其中,N为整数;
每个所述检测值具有预设值p(i0,j0)=0或者p(i0,j0)=1,其中,i0,j0为每个所述检测值的坐标变量;i0,j0均为整数;
所述根据预设底纹模板,对文稿进行底纹检测包括:
将所述文稿中的每个像素点分别与所述预设底纹模板的中心检测值对准;其中,与所述中心检测值对准的像素点的像素值为s(i,j),在所述预设底纹模板的N×N邻域范围内的所述文稿中的其他像素点的像素值为s(i+i0,j+j0);其中,i∈[0,w],j∈[0,l],i,j均为整数,w为所述文稿的宽度,l为所述文稿的长度,且w×l=X,X为所述文稿中包含的像素点的总数量;
在所述预设底纹模板的N×N邻域范围内,统计满足p(i0,j0)=1且s(i+i0,j+j0)=255的像素点的个数;
将所述与所述中心检测值对准的像素点的像素值s(i,j)更新为所述个数的数值m,得到所述文稿中每个像素点更新后的像素值s'(i,j);其中,所述数值m∈[0,n],n为所述预设底纹模板中包含的预设值p(i0,j0)=1的检测值的个数。
可选的,所述根据底纹检测结果,对所述文稿中的像素点进行划分,得到底纹区域与文字区域,包括:
根据确定像素值阈值b的数值;其中,Xa为更新后的像素值s'(i,j)为a的像素点的个数;b小于n;
根据确定的所述像素值阈值b,对所述文稿中的像素点进行划分,若s'(i,j)<b,则确定所述像素点归属文字区域;若s'(i,j)>=b,则确定所述像素点归属底纹区域。
可选的,所述对所述文字区域内的像素点进行白底黑字或黑底白字的识别,包括:
以所述文字区域中的每个像素点作为中心划分出一个M×M邻域范围,其中,M为整数;
根据所述M×M邻域内每个像素点的像素值s(i,j),统计黑色像素点的数量;
对所述M×M邻域内的像素点进行0度、45度、和90度方向的梯度检测;
根据检测后得到的0度、45度、和90度方向的梯度值,计算得到所述M×M邻域的中心像素点的梯度强度值;
根据统计得到的所述黑色像素点的数量和所述中心像素点的梯度强度值,确定作为所述M×M邻域中心的像素点为白底黑字或黑底白字。
可选的,所述根据统计得到的所述黑色像素点的数量和所述中心像素点的梯度强度值,确定作为所述M×M邻域中心的像素点为白底黑字或黑底白字,包括:
若满足所述中心像素点的梯度强度值不等于0,且所述M×M邻域内的所述黑色像素点的数量小于预设阈值Y的条件,则确定作为所述M×M邻域中心的像素点为白底黑字;
若不满足所述中心像素点的梯度强度值不等于0,且所述M×M邻域内的所述黑色像素点的数量小于预设阈值Y的条件,则确定作为所述M×M邻域中心的像素点为黑底白字;其中,所述预设阈值Y∈[0,M×M]。
可选的,所述对识别得到的所述白底黑字或所述黑底白字进行文字增强处理,包括:
若识别得到白底黑字的像素点,则对所述白底黑字的像素点进行膨胀处理;
若识别得到黑底白字的像素点,则对所述黑底白字的像素点进行腐蚀处理。
本发明另一个方面提供一种文字增强装置,包括:
检测模块,用于根据预设底纹模板,对文稿进行底纹检测;
划分模块,用于根据底纹检测结果,对所述文稿中的像素点进行划分,得到底纹区域与文字区域;
识别模块,用于对所述文字区域内的像素点进行白底黑字或黑底白字的识别;
处理模块,用于对识别得到的所述白底黑字或所述黑底白字的像素点进行文字增强处理,得到文字增强处理后的文稿。
可选的,所述预设底纹模板包含N×N个检测值,其中,N为整数;
每个所述检测值具有预设值p(i0,j0)=0或者p(i0,j0)=1,其中,i0,j0为每个所述检测值的坐标变量;i0,j0均为整数;
所述检测模块,包括:
对准子模块,用于将所述文稿中的每个像素点分别与所述预设底纹模板的中心检测值对准;其中,与所述中心检测值对准的像素点的像素值为s(i,j),在所述预设底纹模板的N×N邻域范围内的所述文稿中的其他像素点的像素值为s(i+i0,j+j0);其中,i∈[0,w],j∈[0,l],i,j均为整数,w为所述文稿的宽度,l为所述文稿的长度,且w×l=X,X为所述文稿中包含的像素点的总数量;
第一检测子模块,用于在所述预设底纹模板的N×N邻域范围内,统计满足p(i0,j0)=1且s(i+i0,j+j0)=255的像素点的个数;
更新子模块,用于将所述与所述中心检测值对准的像素点的像素值s(i,j)更新为所述个数的数值m,得到所述文稿中每个像素点更新后的像素值s'(i,j);其中,所述数值m∈[0,n],n为所述预设底纹模板中包含的预设值p(i0,j0)=1的检测值的个数。
可选的,所述划分模块,包括:
第一确定子模块,用于根据确定像素值阈值b的数值;其中,Xa为更新后的像素值s'(i,j)为a的像素点的个数;b小于n;
第一划分子模块,用于根据确定的所述像素值阈值b,对所述文稿中的像素点进行划分,若s'(i,j)<b,则确定所述像素点归属文字区域;若s'(i,j)>=b,则确定所述像素点归属底纹区域。
可选的,所述识别模块,包括:
第二划分子模块,用于以所述文字区域中的每个像素点作为中心划分出一个M×M邻域范围,其中,M为整数;
统计子模块,用于根据所述M×M邻域内每个像素点的像素值s(i,j),统计黑色像素点的数量;
第二检测子模块,用于对所述M×M邻域内的像素点进行0度、45度、和90度方向的梯度检测;
计算子模块,用于根据检测后得到的0度、45度、和90度方向的梯度值,计算得到所述M×M邻域的中心像素点的梯度强度值;
第二确定子模块,用于根据统计得到的所述黑色像素点的数量和所述中心像素点的梯度强度值,确定作为所述M×M邻域中心的像素点为白底黑字或黑底白字。
可选的,所述第二确定子模块,具体用于当满足所述中心像素点的梯度强度值不等于0,且所述M×M邻域内的所述黑色像素点的数量小于预设阈值Y的条件时,确定作为所述M×M邻域中心的像素点为白底黑字;当不满足所述中心像素点的梯度强度值不等于0,且所述M×M邻域内的所述黑色像素点的数量小于预设阈值Y的条件时,确定作为所述M×M邻域中心的像素点为黑底白字;其中,所述预设阈值Y∈[0,M×M]。
可选的,所述处理模块,包括:
膨胀处理子模块,用于当识别得到白底黑字的像素点时,对所述白底黑字的像素点进行膨胀处理;
腐蚀处理子模块,用于当识别得到黑底白字的像素点时,对所述黑底白字的像素点进行腐蚀处理。
由上述技术方案可知,本发明提供的文字增强方法及装置,通过根据预设底纹模板,对文稿进行底纹检测;根据底纹检测结果,对文稿中的像素点进行划分,得到底纹区域与文字区域;对文字区域内的像素点进行白底黑字或黑底白字的识别;对识别得到的白底黑字或黑底白字的像素点进行文字增强处理,得到文字增强处理后的文稿。从而实现了对文稿中底纹的有效识别,通过对去除或减弱底纹之后的黑底白字和白底黑字的文字进行增强处理,提高了打印文稿中文字的呈现清晰度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为文稿中底纹的示意图;
图2为本发明一示例性实施例示出的文字增强方法的流程图;
图3为本发明另一示例性实施例示出的文字增强方法的流程图;
图4a为图3所示实施例的预设底纹模板的结构示意图;
图4b为另一种预设底纹模板的结构示意图;
图5a为图3所示实施例的90度的prewitte算子的结构示意图;
图5b为图3所示实施例的45度的prewitte算子的结构示意图;
图5c为图3所示实施例的0度的prewitte算子的结构示意图;
图6为本发明一示例性实施例示出的文字增强装置的示意图;
图7为本发明另一示例性实施例示出的文字增强装置的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图2为本发明一示例性实施例示出的文字增强方法的流程图,本发明方法可以应用在任何对带有底纹的文稿进行处理的电子设备内,包括但不限于,打印机、扫描仪、复印机、传真机、多功能一体机、电脑、手机、PAD等,以下实施例中仅以打印机为例进行方案的阐述。如图2所示,本实施例提供一种文字增强方法,包括:
步骤201、根据预设底纹模板,对文稿进行底纹检测。
在本步骤中,通常来说常用的底纹都具有一定的规律性,如图1中举例示出的多种底纹呈现形式,其具有黑白点交叉分布、且黑白点按照相同的频率进行排列,以线性、点状两种排列为主的规律性。因此预设的底纹模板可以用来检测和区分上述具有一定规律性的底纹。
步骤202、根据底纹检测结果,对文稿中的像素点进行划分,得到底纹区域与文字区域。
在本步骤中,在带有底纹的文稿中,文字是浮于底纹之上其与底纹具有重叠性,因此,通过步骤201对底纹进行识别后,还需要将底纹与文字进行分离。无论是底纹还是文字,其都是由各个像素点形成的,因此,通过对像素点的属性进行区分,将归属于底纹的像素点划分到底纹区域,将归属于文字的像素点划分到文字区域,以使后续可以仅对文字区域进行文字增强处理,达到弱化底纹效果,强调文字效果,以提高整体文稿中文字的呈现清晰度。
步骤203、对文字区域内的像素点进行白底黑字或黑底白字的识别。
在本步骤中,通过步骤202识别得到了属于文字区域的像素点后,可以对像素点的文字属性进行识别,以确定该文字是白底黑字,还是黑底白字,再采用不同的文字增强方式,强化白底黑字中的黑字边缘,或者强化黑底白字中的白字边缘,因此,需要对文字区域内的像素点的文字属性进行识别,以对文字采用对应的增强处理方案。
步骤204、对识别得到的白底黑字或黑底白字的像素点进行文字增强处理,得到文字增强处理后的文稿。
在本步骤中,由于文字增强处理中其处理对象是黑色像素点,因此,若为黑底白字,则需要对白字边缘的黑色像素点进行处理,以增强白字的显示效果;若为白底黑字,则需要对黑字边缘的黑色像素点进行处理,以增强黑字的显示效果;通过步骤203对文字区域内的像素点的文字属性进行识别,以针对性对白底黑字或黑底白字中的边缘像素点进行不同的增强处理,实现文字被增强的显示效果。
本实施例提供的文字增强方法,通过根据预设底纹模板,对文稿进行底纹检测;根据底纹检测结果,对文稿中的像素点进行划分,得到底纹区域与文字区域;对文字区域内的像素点进行白底黑字或黑底白字的识别;对识别得到的白底黑字或黑底白字的像素点进行文字增强处理,得到文字增强处理后的文稿。从而实现了对文稿中底纹的有效识别,通过对去除或减弱底纹之后的黑底白字和白底黑字的文字进行增强处理,提高了打印文稿中文字的呈现清晰度。
图3为本发明另一示例性实施例示出的文字增强方法的流程图,如图3所示,基于上述实施例,本实施例提供一种文字增强方法,包括:
步骤301、将文稿中的每个像素点分别与预设底纹模板的中心检测值对准。
在本步骤中,图4a举例示出一种预设底纹模板的结构,需要说明的是,图4a所示仅为一种预设模板的格式举例,本领域技术人员可以根据底纹构成的结构特征设置与之匹配的底纹模板,以实现底纹模板对底纹的检测。预设底纹模板可以包含N×N个检测值,其中,N为整数。底纹模板中的每个检测值具有预设值p(i0,j0)=0或者p(i0,j0)=1,i0,j0为每个检测值的坐标变量,i0,j0均为整数。其中,与中心检测值对准的像素点的像素值为s(i,j),在预设底纹模板的N×N邻域范围内的文稿中的其他像素点的像素值为s(i+i0,j+j0);其中,i∈[0,w],j∈[0,l],i,j均为整数,w为文稿的宽度,l为文稿的长度,且w×l=X,X为文稿中包含的像素点的总数量。
如图4a中,在4个边角上的3个检测值的取值为1,其余检测值的取值为0。可见图4a中的0与1布局构成一菱形结构,可用于对诸如黑白点交叉分布、并按照相同频率进行排列的规律性底纹进行识别。以图4a为例,N=5构成了5×5邻域大小的底纹模板,该底纹模板可用于对文稿中的5×5邻域大小内的像素进行检测,其中,i0∈[-2,2],j0∈[-2,2],中心检测值的坐标为(0,0),其预设值p(0,0)=0。
以图4b为例,N=4构成了4×4邻域大小的底纹模板,该底纹模板可用于对文稿中的4×4邻域大小内的像素进行检测,其中,中心检测值的坐标为(0,0),根据选择4×4邻域大小的底纹模板内不同位置的检测值作为中心检测值,则i0和j0的取值范围有所不同,例如,当中心检测值为o1时,则i0∈[-1,2],j0∈[-1,2],如果中心检测值为o2,则i0∈[-1,2],j0∈[-2,1],若中心检测值为o3时,则i0∈[-2,1],j0∈[-2,1],若中心检测值为o4时,则i0∈[-2,1],j0∈[-1,2]。由此可见,当N为奇数整数时,则
当N为偶数整数时,则i0,j0根据中心检测值的位置变化而有不同的取值范围,例如可以是[-N/2,(N-2)/2]或者[-(N-2)/2,-N/2]。
步骤302、在预设底纹模板的N×N邻域范围内,统计满足p(i0,j0)=1且s(i+i0,j+j0)=255的像素点的个数。
在本步骤中,以图4a所示的底纹模板进行说明,在图4a所示的5×5邻域内,若检测到底纹模板的检测值的取值p(i0,j0)=1且对应的文稿中的像素点的像素值s(i+i0,j+j0)=255,则将满足上述条件的像素点的个数值加1,直至对5×5领域内的像素点检测完毕,统计5×5邻域内满足上述条件的像素点的总个数,根据图4a所示的底纹模板,满足上述条件的像素点的总个数最多为12个。其中,黑白色像素点的像素值称为“灰度等级”,范围一般从0到255,白色为255,黑色为0,则上述条件为检测出5×5邻域中与底纹模板中取值为1对应的白色像素点的个数,即文稿中5×5邻域内包含的底纹白点的数量。
步骤303、将与中心检测值对准的像素点的像素值s(i,j)更新为步骤302中满足条件的像素点的个数的数值m,得到文稿中每个像素点更新后的像素值s'(i,j)。
在本步骤中,满足条件的像素点的个数的数值m∈[0,n],其中,n为预设底纹模板中包含的预设值p(i0,j0)=1的检测值的个数。将统计得到的文稿中每个像素点对应的N×N邻域内包含的满足条件的像素点的个数数值赋值给该像素点的像素值,使该像素点的像素值由其原始像素值s(i,j)变更为该个数数值,得到新的像素值s'(i,j)。以打印文稿的所有像素点作为中心像素点重复上述各个步骤的操作,使得整个文稿中的每个像素点被重新赋予像素值。对于文稿边缘区域的像素点,由于其位于边缘位置,在其与底纹模板中的中心检测值点对准后,文稿中的像素点可能未能与底纹模板中的检测值点完全重叠,则此时可以仅对重叠部分的像素点进行统计,或者对底纹中未能重叠的空白像素点进行预设值的填充后进行统计,或者还可以对位于文稿边缘位置的像素点,直接赋予预设的像素值;其中,前述的各种预设的像素值都可由本领域技术人员自行设置,本申请对此不作限定。以图4a为例,由于m∈[0,n],而n最大为12,可知重新赋值后的打印文稿整体变为像素值介于0和12之间的近乎全黑的文稿。本实施例不限于5×5邻域大小的底纹模板,还可以为N×N邻域大小的底纹模板,通过N×N邻域大小的底纹模板使N×N邻域大小内的中心像素点的像素值等于N×N邻域大小内的底纹白点的数量。
步骤304、根据(公式1),确定像素值阈值b的数值。
在本步骤中,Xa为更新后的像素值s'(i,j)为a的像素点的个数;b小于n。也就是说,对整个打印文稿的像素值分布进行直方图的统计,其中,像素总量为X,X为正整数,以图4a为例,根据步骤303可知,重新赋值后的像素值s'(i,j)分布在0-12之间,则像素值为0的像素数量为X0,像素值为1的像素数量为X1,以此类推,像素值为12的像素数量为X12;当X0+X1+X2+……+Xb∈[80%X,90%X],即把像素值0到b对应的像素数量X0到Xb相加,相加得到的总数达到像素总量X的80%、90%,或相加得到的总数达到像素总量X的80%到90%之间的任一个值时,以像素值b作为阈值,对整个打印文稿的像素点进行分割,分割的目的是用于区分打印文稿中的文字和底纹,也就是说将底纹从文稿中去除或减弱底纹对文字的影响。
步骤305、根据确定的像素值阈值b,对文稿中的像素点进行划分;若s'(i,j)<b,则确定像素点归属文字区域;若s'(i,j)>=b,则确定像素点归属底纹区域。
在本步骤中,当s'(i,j)<b,则像素点属于文字区域,当s'(i,j)>=b,则像素点属于底纹区域。其中,i∈[0,w],j∈[0,l],i,j均为整数,w为文稿的宽度,l为文稿的长度,且w×l=X,X为文稿中包含的像素点的总数量。从而实现将文稿中像素点划分为两类:文字区域的像素点和底纹区域的像素点。
步骤306、以文字区域中的每个像素点作为中心划分出一个M×M邻域范围。
在本步骤中,M为整数。例如,设置一个7×7邻域,将归属于文字区域的每个像素点作为该7×7邻域的中心,然后对该领域内所包含的黑点数量和白点数量进行统计,分别记为black_num和white_num。
步骤307、根据M×M邻域内每个像素点的像素值s(i,j),统计黑色像素点的数量。
在本步骤中,可以按照下列公式进行统计:如果当前像素点像素值为0,则black_num++,即black_num加1;如果当前像素点像素值为255,则white_num++,即white_num加1。本申请实施例不限于7×7邻域内对黑白点数量的统计,可以在M×M邻域内对黑白点数量的统计。需要注意的是,此处统计的像素值是各个归属文字区域的像素点的原始像素值,也就是s(i,j),而不是根据步骤303中更新后的像素值s'(i,j)进行统计。
步骤308、对M×M邻域内的像素点进行0度、45度、和90度方向的梯度检测。
在本步骤中,在上述7×7邻域内,分别使用边缘算子法prewitte算子进行0度、90度和45度方向的梯度检测。图5a为90度的prewitte算子,90度的梯度值为edge_90=a(-3,3)×s(i-3,j+3)+a(-3,-3)×s(i-3,j-3)+a(3,3)×s(i+3,j+3)+a(3,-3)×s(i+3,j-3)=s(i-3,j+3)+s(i-3,j-3)-s(i+3,j+3)-s(i+3,j-3),其中,a(-3,3)、a(-3,-3)、a(3,3)、a(3,-3)分别为90度的prewitte算子中四个边角位置的取值。图5b为45度的prewitte算子,45度的梯度值edge_45=b(-3,3)×s(i-3,j+3)+b(-3,-3)×s(i-3,j-3)+b(3,3)×s(i+3,j+3)+b(3,-3)×s(i+3,j-3)=s(i-3,j+3)-s(i-3,j-3)-s(i+3,j+3)+s(i+3,j-3),其中b(-3,3)、b(-3,-3)、b(3,3)、b(3,-3)分别为45度的prewitte算子中四个边角位置的取值。图5c为0度的prewitte算子,0度的梯度值edge_0=c(-3,3)×s(i-3,j+3)+c(-3,-3)×s(i-3,j-3)+c(3,3)×s(i+3,j+3)+c(3,-3)×s(i+3,j-3)=s(i-3,j+3)-s(i-3,j-3)+s(i+3,j+3)-s(i+3,j-3),其中c(-3,3)、c(-3,-3)、c(3,3)、c(3,-3)分别为0度的prewitte算子中四个边角位置的取值。本申请实施例不限于在7×7邻域内进行0度、90度和45度方向的梯度检测,可以在M×M邻域内使用prewitte算子进行0度、90度和45度方向的梯度检测,则
其中,p,q均为整数,p,q为M×M邻域内的坐标变量。具体地,
,其中,分别为M×M领域大小的90度的prewitte算子中四个边角位置的取值;
,其中,分别为M×M大小的45度的prewitte算子中四个边角位置的取值;
,其中,分别为M×M大小的0度的prewitte算子中四个边角位置的取值。
上述的描述以M为奇数整数为例,同样本实施例中,M也可以为偶数整数。当M为偶数整数时,依据在M×M邻域内确定中心的位置不同,而p,q的取值范围也不同,例如可以是[-M/2,(M-2)/2]或者[-(M-2)/2,M/2]。无论M是奇数还是偶数,p和q的取值范围都在[-M/2,M/2]内。
步骤309、根据检测后得到的0度、45度、和90度方向的梯度值,计算得到M×M邻域的中心像素点的梯度强度值。
在本步骤中,根据检测后得到的0度、45度、和90度方向的梯度值按照公式(2)求取M×M邻域内中心像素点(i,j)的梯度强度值,记为Edge_strength(i,j);
公式(2),Edge_strength(i,j)=abs(edge_0)+abs(edge_90)+abs(edge_45),其中,abs表示取绝对值。
步骤310、根据统计得到的黑色像素点的数量和中心像素点的梯度强度值,确定作为M×M邻域中心的像素点为白底黑字或黑底白字。
在本步骤中,若满足中心像素点的梯度强度值不等于0,且M×M邻域内的黑色像素点的数量小于预设阈值Y的条件,则确定作为M×M邻域中心的像素点为白底黑字。
若不满足中心像素点的梯度强度值不等于0,且M×M邻域内的黑色像素点的数量小于预设阈值Y的条件,则确定作为M×M邻域中心的像素点为黑底白字;其中,预设阈值Y∈[0,M×M]。
以7×7邻域为例,
if(Edge_strength(i,j)!=0&black_num<25),此像素为白底黑字
else此像素为黑底白字。
即若满足中心像素点的梯度强度值不等于0,且7×7邻域内的黑色像素点的数量小于预设阈值Y=25的条件,则此像素为白底黑字;其中,该阈值Y的数值大小可由本领域技术人员自行设定,本申请对此不作具体限定。即,当中心像素点的梯度强度值Edge_strength(i,j)不等于0且黑点数量小于25时,表示该像素为白底黑字,否则此像素为黑底白字。
步骤311、若识别得到白底黑字的像素点,则对白底黑字的像素点进行膨胀处理;若识别得到黑底白字的像素点,则对黑底白字的像素点进行腐蚀处理;得到文字增强处理后的文稿。
在本步骤中,若当前像素标记为白底黑字,则进行膨胀处理,即使用膨胀算法将黑字的边缘扩大些;若当前像素标记为黑底白字,则进行腐蚀处理,即使用腐蚀算法将与白字相邻的黑色边缘腐蚀掉。完成增强处理后,输出图像,使得打印文稿中的白底黑字和黑底白字不受底纹的干扰,呈现更为清晰的打印效果。
图6为本发明一示例性实施例示出的文字增强装置示意图,如图6所示,该文字增强装置,包括:
检测模块1,用于根据预设底纹模板,对文稿进行底纹检测;
划分模块2,用于根据底纹检测结果,对文稿中的像素点进行划分,得到底纹区域与文字区域;
识别模块3,用于对文字区域内的像素点进行白底黑字或黑底白字的识别;
处理模块4,用于对识别得到的白底黑字或黑底白字的像素点进行文字增强处理,得到文字增强处理后的文稿。
该实施例的实现原理与上述图2所示方法实施例的实现原理相似,在此不再赘述。
本实施例提供的文字增强装置,通过根据预设底纹模板,对文稿进行底纹检测;根据底纹检测结果,对文稿中的像素点进行划分,得到底纹区域与文字区域;对文字区域内的像素点进行白底黑字或黑底白字的识别;对识别得到的白底黑字或黑底白字的像素点进行文字增强处理,得到文字增强处理后的文稿。从而实现了对文稿中底纹的有效识别,通过对去除或减弱底纹之后的黑底白字和白底黑字的文字进行增强处理,提高了打印文稿中文字的呈现清晰度。
图7为本发明另一示例性实施例示出的文字增强装置示意图,如图7所示,在上述实施例的基础上,
可选的,预设底纹模板包含N×N个检测值,其中,N为整数;
每个检测值具有预设值p(i0,j0)=0或者p(i0,j0)=1,其中,i0,j0为每个检测值的坐标变量;i0,j0均为整数;
检测模块1,包括:
对准子模块11,用于将文稿中的每个像素点分别与预设底纹模板的中心检测值对准;其中,与中心检测值对准的像素点的像素值为s(i,j),在预设底纹模板的N×N邻域范围内的文稿中的其他像素点的像素值为s(i+i0,j+j0);其中,i∈[0,w],j∈[0,l],i,j均为整数,w为文稿的宽度,l为文稿的长度,且w×l=X,X为文稿中包含的像素点的总数量;
第一检测子模块12,用于在预设底纹模板的N×N邻域范围内,统计满足p(i0,j0)=1且s(i+i0,j+j0)=255的像素点的个数;
更新子模块13,用于将与中心检测值对准的像素点的像素值s(i,j)更新为个数的数值m,得到文稿中每个像素点更新后的像素值s'(i,j);其中,数值m∈[0,n],n为预设底纹模板中包含的预设值p(i0,j0)=1的检测值的个数。
可选的,划分模块2,包括:
第一确定子模块21,用于根据确定像素值阈值b的数值;其中,Xa为更新后的像素值s'(i,j)为a的像素点的个数;b小于n;
第一划分子模块22,用于根据确定的像素值阈值b,对文稿中的像素点进行划分,若s'(i,j)<b,则确定像素点归属文字区域;若s'(i,j)>=b,则确定像素点归属底纹区域。
可选的,识别模块3,包括:
第二划分子模块31,用于以文字区域中的每个像素点作为中心划分出一个M×M邻域范围,其中,M为整数;
统计子模块32,用于根据M×M邻域内每个像素点的像素值s(i,j),统计黑色像素点的数量;
第二检测子模块33,用于对M×M邻域内的像素点进行0度、45度、和90度方向的梯度检测;
计算子模块34,用于根据检测后得到的0度、45度、和90度方向的梯度值,计算得到M×M邻域的中心像素点的梯度强度值;
第二确定子模块35,用于根据统计得到的黑色像素点的数量和中心像素点的梯度强度值,确定作为M×M邻域中心的像素点为白底黑字或黑底白字。
可选的,第二确定子模块35,具体用于当满足中心像素点的梯度强度值不等于0,且M×M邻域内的黑色像素点的数量小于预设阈值Y的条件时,确定作为M×M邻域中心的像素点为白底黑字;当不满足中心像素点的梯度强度值不等于0,且M×M邻域内的黑色像素点的数量小于预设阈值Y的条件时,确定作为M×M邻域中心的像素点为黑底白字;其中,预设阈值Y∈[0,M×M]。
可选的,处理模块4,包括:
膨胀处理子模块41,用于当识别得到白底黑字的像素点时,对白底黑字的像素点进行膨胀处理;
腐蚀处理子模块42,用于当识别得到黑底白字的像素点时,对黑底白字的像素点进行腐蚀处理。
该实施例的实现原理与上述图3所示方法实施例的实现原理相似,在此不再赘述。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (12)

1.一种文字增强方法,其特征在于,包括:
根据预设底纹模板,对文稿进行底纹检测;
根据底纹检测结果,对所述文稿中的像素点进行划分,得到底纹区域与文字区域;
对所述文字区域内的像素点进行白底黑字或黑底白字的识别;
对识别得到的所述白底黑字或所述黑底白字的像素点进行文字增强处理,得到文字增强处理后的文稿。
2.根据权利要求1所述的方法,其特征在于,
所述预设底纹模板包含N×N个检测值,其中,N为整数;
每个所述检测值具有预设值p(i0,j0)=0或者p(i0,j0)=1,其中,i0,j0为每个所述检测值的坐标变量;i0,j0均为整数;
所述根据预设底纹模板,对文稿进行底纹检测包括:
将所述文稿中的每个像素点分别与所述预设底纹模板的中心检测值对准;其中,与所述中心检测值对准的像素点的像素值为s(i,j),在所述预设底纹模板的N×N邻域范围内的所述文稿中的其他像素点的像素值为s(i+i0,j+j0);其中,i∈[0,w],j∈[0,l],i,j均为整数,w为所述文稿的宽度,l为所述文稿的长度,且w×l=X,X为所述文稿中包含的像素点的总数量;
在所述预设底纹模板的N×N邻域范围内,统计满足p(i0,j0)=1且s(i+i0,j+j0)=255的像素点的个数;
将所述与所述中心检测值对准的像素点的像素值s(i,j)更新为所述个数的数值m,得到所述文稿中每个像素点更新后的像素值s'(i,j);其中,所述数值m∈[0,n],n为所述预设底纹模板中包含的预设值p(i0,j0)=1的检测值的个数。
3.根据权利要求2所述的方法,其特征在于,所述根据底纹检测结果,对所述文稿中的像素点进行划分,得到底纹区域与文字区域,包括:
根据确定像素值阈值b的数值;其中,Xa为更新后的像素值s'(i,j)为a的像素点的个数;b小于n;
根据确定的所述像素值阈值b,对所述文稿中的像素点进行划分,若s'(i,j)<b,则确定所述像素点归属文字区域;若s'(i,j)>=b,则确定所述像素点归属底纹区域。
4.根据权利要求3所述的方法,其特征在于,所述对所述文字区域内的像素点进行白底黑字或黑底白字的识别,包括:
以所述文字区域中的每个像素点作为中心划分出一个M×M邻域范围,其中,M为整数;
根据所述M×M邻域内每个像素点的像素值s(i,j),统计黑色像素点的数量;
对所述M×M邻域内的像素点进行0度、45度、和90度方向的梯度检测;
根据检测后得到的0度、45度、和90度方向的梯度值,计算得到所述M×M邻域的中心像素点的梯度强度值;
根据统计得到的所述黑色像素点的数量和所述中心像素点的梯度强度值,确定作为所述M×M邻域中心的像素点为白底黑字或黑底白字。
5.根据权利要求4所述的方法,其特征在于,所述根据统计得到的所述黑色像素点的数量和所述中心像素点的梯度强度值,确定作为所述M×M邻域中心的像素点为白底黑字或黑底白字,包括:
若满足所述中心像素点的梯度强度值不等于0,且所述M×M邻域内的所述黑色像素点的数量小于预设阈值Y的条件,则确定作为所述M×M邻域中心的像素点为白底黑字;
若不满足所述中心像素点的梯度强度值不等于0,且所述M×M邻域内的所述黑色像素点的数量小于预设阈值Y的条件,则确定作为所述M×M邻域中心的像素点为黑底白字;其中,所述预设阈值Y∈[0,M×M]。
6.根据权利要求1~5任一项所述的方法,其特征在于,所述对识别得到的所述白底黑字或所述黑底白字进行文字增强处理,包括:
若识别得到白底黑字的像素点,则对所述白底黑字的像素点进行膨胀处理;
若识别得到黑底白字的像素点,则对所述黑底白字的像素点进行腐蚀处理。
7.一种文字增强装置,其特征在于,包括:
检测模块,用于根据预设底纹模板,对文稿进行底纹检测;
划分模块,用于根据底纹检测结果,对所述文稿中的像素点进行划分,得到底纹区域与文字区域;
识别模块,用于对所述文字区域内的像素点进行白底黑字或黑底白字的识别;
处理模块,用于对识别得到的所述白底黑字或所述黑底白字的像素点进行文字增强处理,得到文字增强处理后的文稿。
8.根据权利要求7所述的装置,其特征在于,
所述预设底纹模板包含N×N个检测值,其中,N为整数;
每个所述检测值具有预设值p(i0,j0)=0或者p(i0,j0)=1,其中,i0,j0为每个所述检测值的坐标变量;i0,j0均为整数;
所述检测模块,包括:
对准子模块,用于将所述文稿中的每个像素点分别与所述预设底纹模板的中心检测值对准;其中,与所述中心检测值对准的像素点的像素值为s(i,j),在所述预设底纹模板的N×N邻域范围内的所述文稿中的其他像素点的像素值为s(i+i0,j+j0);其中,i∈[0,w],j∈[0,l],i,j均为整数,w为所述文稿的宽度,l为所述文稿的长度,且w×l=X,X为所述文稿中包含的像素点的总数量;
第一检测子模块,用于在所述预设底纹模板的N×N邻域范围内,统计满足p(i0,j0)=1且s(i+i0,j+j0)=255的像素点的个数;
更新子模块,用于将所述与所述中心检测值对准的像素点的像素值s(i,j)更新为所述个数的数值m,得到所述文稿中每个像素点更新后的像素值s'(i,j);其中,所述数值m∈[0,n],n为所述预设底纹模板中包含的预设值p(i0,j0)=1的检测值的个数。
9.根据权利要求8所述的装置,其特征在于,所述划分模块,包括:
第一确定子模块,用于根据确定像素值阈值b的数值;其中,Xa为更新后的像素值s'(i,j)为a的像素点的个数;b小于n;
第一划分子模块,用于根据确定的所述像素值阈值b,对所述文稿中的像素点进行划分,若s'(i,j)<b,则确定所述像素点归属文字区域;若s'(i,j)>=b,则确定所述像素点归属底纹区域。
10.根据权利要求9所述的装置,其特征在于,所述识别模块,包括:
第二划分子模块,用于以所述文字区域中的每个像素点作为中心划分出一个M×M邻域范围,其中,M为整数;
统计子模块,用于根据所述M×M邻域内每个像素点的像素值s(i,j),统计黑色像素点的数量;
第二检测子模块,用于对所述M×M邻域内的像素点进行0度、45度、和90度方向的梯度检测;
计算子模块,用于根据检测后得到的0度、45度、和90度方向的梯度值,计算得到所述M×M邻域的中心像素点的梯度强度值;
第二确定子模块,用于根据统计得到的所述黑色像素点的数量和所述中心像素点的梯度强度值,确定作为所述M×M邻域中心的像素点为白底黑字或黑底白字。
11.根据权利要求10所述的装置,其特征在于,
所述第二确定子模块,具体用于当满足所述中心像素点的梯度强度值不等于0,且所述M×M邻域内的所述黑色像素点的数量小于预设阈值Y的条件时,确定作为所述M×M邻域中心的像素点为白底黑字;当不满足所述中心像素点的梯度强度值不等于0,且所述M×M邻域内的所述黑色像素点的数量小于预设阈值Y的条件时,确定作为所述M×M邻域中心的像素点为黑底白字;其中,所述预设阈值Y∈[0,M×M]。
12.根据权利要求7~11任一项所述的装置,其特征在于,所述处理模块,包括:
膨胀处理子模块,用于当识别得到白底黑字的像素点时,对所述白底黑字的像素点进行膨胀处理;
腐蚀处理子模块,用于当识别得到黑底白字的像素点时,对所述黑底白字的像素点进行腐蚀处理。
CN201711080626.8A 2017-11-06 2017-11-06 文字增强方法及装置 Active CN107766014B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201711080626.8A CN107766014B (zh) 2017-11-06 2017-11-06 文字增强方法及装置
PCT/CN2018/106761 WO2019085672A1 (zh) 2017-11-06 2018-09-20 文字增强方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711080626.8A CN107766014B (zh) 2017-11-06 2017-11-06 文字增强方法及装置

Publications (2)

Publication Number Publication Date
CN107766014A true CN107766014A (zh) 2018-03-06
CN107766014B CN107766014B (zh) 2019-12-10

Family

ID=61273337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711080626.8A Active CN107766014B (zh) 2017-11-06 2017-11-06 文字增强方法及装置

Country Status (2)

Country Link
CN (1) CN107766014B (zh)
WO (1) WO2019085672A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019085672A1 (zh) * 2017-11-06 2019-05-09 珠海奔图电子有限公司 文字增强方法及装置
CN110473498A (zh) * 2018-05-11 2019-11-19 京东方科技集团股份有限公司 用于调节显示亮度的方法、设备、显示装置和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1471302A (zh) * 2002-07-27 2004-01-28 ���ǵ�����ʽ���� 用于提高数字图像质量的方法和装置
CN1728159A (zh) * 2004-07-27 2006-02-01 明基电通股份有限公司 文件图像的文字区域识别方法及计算机存储媒体以及系统
US20070084928A1 (en) * 2005-10-14 2007-04-19 Ackley Jonathan M Systems and methods for decoding an image to determine a digital identifier
CN101021905A (zh) * 2006-02-15 2007-08-22 中国科学院自动化研究所 一种文档图像二值化方法
CN101577832A (zh) * 2008-05-06 2009-11-11 联咏科技股份有限公司 用于加强文字显示效果的图像处理电路及其方法
CN102270340A (zh) * 2011-09-05 2011-12-07 上海果壳电子有限公司 基于笔画算子的文本图像增强方法及系统
US20130044952A1 (en) * 2011-08-18 2013-02-21 Jiyun Du Image processing apparatus, image processing method, and computer-readable, non-transitory medium
US8761535B2 (en) * 2009-03-30 2014-06-24 The Neat Company, Inc. Image background enhancement for color images

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1296865C (zh) * 2003-09-29 2007-01-24 致伸科技股份有限公司 单色文字增强方法
CN105654072B (zh) * 2016-03-24 2019-03-01 哈尔滨工业大学 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法
CN107766014B (zh) * 2017-11-06 2019-12-10 珠海奔图电子有限公司 文字增强方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1471302A (zh) * 2002-07-27 2004-01-28 ���ǵ�����ʽ���� 用于提高数字图像质量的方法和装置
CN1728159A (zh) * 2004-07-27 2006-02-01 明基电通股份有限公司 文件图像的文字区域识别方法及计算机存储媒体以及系统
US20070084928A1 (en) * 2005-10-14 2007-04-19 Ackley Jonathan M Systems and methods for decoding an image to determine a digital identifier
CN101021905A (zh) * 2006-02-15 2007-08-22 中国科学院自动化研究所 一种文档图像二值化方法
CN101577832A (zh) * 2008-05-06 2009-11-11 联咏科技股份有限公司 用于加强文字显示效果的图像处理电路及其方法
US8761535B2 (en) * 2009-03-30 2014-06-24 The Neat Company, Inc. Image background enhancement for color images
US20130044952A1 (en) * 2011-08-18 2013-02-21 Jiyun Du Image processing apparatus, image processing method, and computer-readable, non-transitory medium
CN102270340A (zh) * 2011-09-05 2011-12-07 上海果壳电子有限公司 基于笔画算子的文本图像增强方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019085672A1 (zh) * 2017-11-06 2019-05-09 珠海奔图电子有限公司 文字增强方法及装置
CN110473498A (zh) * 2018-05-11 2019-11-19 京东方科技集团股份有限公司 用于调节显示亮度的方法、设备、显示装置和存储介质

Also Published As

Publication number Publication date
CN107766014B (zh) 2019-12-10
WO2019085672A1 (zh) 2019-05-09

Similar Documents

Publication Publication Date Title
JP5455038B2 (ja) 画像処理装置、画像処理方法、及びプログラム
US9349237B2 (en) Method of authenticating a printed document
JP5974589B2 (ja) 画像処理装置およびプログラム
CN107659799B (zh) 摄像装置、图像处理方法和存储介质
JP2010218420A (ja) 文字認識装置、画像読取装置、およびプログラム
US20160292503A1 (en) Computer-readable storage medium storing image processing program, image processing device, and image processing method
JP6122988B1 (ja) 画像処理装置、画像処理方法、および、プログラム
JP2016162420A (ja) 注目領域検出装置、注目領域検出方法及びプログラム
CN107766014B (zh) 文字增强方法及装置
US8477988B2 (en) Image processing apparatus, image forming apparatus and computer readable medium
JP2008210387A (ja) 文書画像の2値化性能を改善するノイズ除去装置及びノイズ除去プログラム
JP2014107685A (ja) 画像処理装置
US20160292532A1 (en) Computer-readable storage medium storing image processing program, image processing device, and image processing method
CN111445402A (zh) 一种图像去噪方法及装置
JP5975945B2 (ja) 画像処理装置
US9977984B2 (en) Computer-readable storage medium storing image processing program, image processing device, and image processing method
US10185907B2 (en) Information bearing devices
CN109460745B (zh) 一种直线滤除方法、装置、设备及存储介质
CN109643451B (zh) 线检测方法
US20100238470A1 (en) Document image processing system and document image processing method
US8452104B2 (en) Image determination apparatus, computer readable medium storing program, and method
JP7370574B2 (ja) コマ抽出方法及びプログラム
JP7377435B2 (ja) 画像処理装置
CN116597462B (zh) 一种基于ocr的证件识别方法
JP2007081793A (ja) 画像形成装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant