CN106022329B - 一种字符识别过程中的字符降噪处理方法 - Google Patents
一种字符识别过程中的字符降噪处理方法 Download PDFInfo
- Publication number
- CN106022329B CN106022329B CN201610313294.2A CN201610313294A CN106022329B CN 106022329 B CN106022329 B CN 106022329B CN 201610313294 A CN201610313294 A CN 201610313294A CN 106022329 B CN106022329 B CN 106022329B
- Authority
- CN
- China
- Prior art keywords
- character
- character pixels
- pixels point
- point
- pixel value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/225—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
本发明公开了一种字符识别过程中的字符降噪处理方法,用于提高字符识别的成功率。本发明提供一种字符识别过程中的字符降噪处理方法,包括:获取识别出字符特征的字符图像;从所述字符图像中提取出字符点阵,所述字符点阵包括:对应于所述字符图像的多个字符像素点;根据第一字符像素点的像素值与该第一字符像素点对应的周边字符像素点的像素值判断所述第一字符像素点是否是噪声像素点,所述第一字符像素点为所述字符点阵中的任意一个字符像素点;若确定所述第一字符像素点是所述噪声像素点,根据所述第一字符像素点对应的周边字符像素点的像素值对所述第一字符像素点进行像素值补偿。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种字符识别过程中的字符降噪处理方法。
背景技术
近年来,因为信息技术的进步,图像字符识别的应用需求越来越多,例如包括车牌识别、图像文档字符识别、网站字符验证码识别等都得到了广泛的应用。无论是基于字符模板的匹配识别还是基于机器学习识别,都需要对图像进行字符分割和字符识别,但是图像字符经过在进行字符识别的过程中,很多字符会由于字符边缘模糊等情况出现大量“锯齿、毛边、缺少、多余”等情况,而这会极大的影响字符识别的成功率。
发明内容
本发明的目的在于提供一种字符识别过程中的字符降噪处理方法,用于提高字符识别的成功率。
为了达到上述目的,本发明采用这样的如下技术方案:
本发明提供一种字符识别过程中的字符降噪处理方法,包括:
获取识别出字符特征的字符图像;
从所述字符图像中提取出字符点阵,所述字符点阵包括:对应于所述字符图像的多个字符像素点;
根据第一字符像素点的像素值与该第一字符像素点对应的周边字符像素点的像素值判断所述第一字符像素点是否是噪声像素点,所述第一字符像素点为所述字符点阵中的任意一个字符像素点;
若确定所述第一字符像素点是所述噪声像素点,根据所述第一字符像素点对应的周边字符像素点的像素值对所述第一字符像素点进行像素值补偿。
采用上述技术方案后,本发明提供的技术方案将有如下优点:
本发明实施例中,首先获取到识别出字符特征的字符图像,然后从字符图像中提取出字符点阵,字符点阵包括:对应于字符图像的多个字符像素点,以第一字符像素点为字符点阵中的任意一个字符像素点来说明本发明实施例中对字符像素点的降噪处理,根据第一字符像素点的像素值与该第一字符像素点对应的周边字符像素点的像素值判断第一字符像素点是否是噪声像素点,在确定第一字符像素点是噪声像素点的情况下,根据第一字符像素点对应的周边字符像素点的像素值对第一字符像素点进行像素值补偿。本发明实施例可以从字符图像中提取出字符点阵,对于字符点阵中的所有字符像素点都可以根据字符像素点的像素值以及周边字符像素点的像素值来判断每个字符像素点是噪声像素点,从而通过周边字符像素点进行像素值补偿,对于噪声像素点进行像素值补偿后可以使得字符图像更容易识别,从而减少“锯齿、毛边、缺少、多余”等情况对字符的干扰,因此,可以提高字符识别的成功率。
附图说明
图1为本发明实施例提供一种字符识别过程中的字符降噪处理方法的流程方框示意图;
图2为本发明实施例提供的未进行锐角补偿的字符点阵示意图;
图3是本发明实施例提供的进行锐角补偿后的字符点阵示意图;
图4是进行锐角补偿前后字符识别的成功率对比示意图。
具体实施方式
本发明实施例提供了一种字符识别过程中的字符降噪处理方法,用于提高字符识别的成功率。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域的技术人员所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,这仅仅是描述本发明的实施例中对相同属性的对象在描述时所采用的区分方式。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。
以下分别进行详细说明。本发明字符识别过程中的字符降噪处理方法的一个实施例,可应用于在字符识别过程中对字符的自动降噪处理,请参阅图1所示,本发明提供的字符识别过程中的字符降噪处理方法,可以包括如下步骤:
101、获取识别出字符特征的字符图像。
在本发明实施例中,图像可包含字符信息,对图像进行字符特征提取之后,可以确定该图像是字符图像,在字符图像中包括有已经识别出的字符特征,该字符特征指示了字符图像是包含有字符信息的。例如本发明实施例中获取到的字符图像可以是获取网站网页中的待识别验证码图像,也可以是包括车牌号码信息的图像,在此不做限定。
另外本发明的一些实施例中,步骤101获取识别出字符特征的字符图像之前,本发明提供的字符识别过程中的字符降噪处理方法还包括:
步骤A1、对字符图像进行阈值处理和图片降噪处理。
其中,在获取到字符图像之前,还可以对该字符图像进行阈值处理和图片降噪处理,从而对字符图像进行字符识别,在字符识别过程中,对字符图像的阈值处理和图片降噪处理,从而识别出的字符图像都不可避免的会加剧字符边缘模板的情况,例如,通常会出现“锯齿、毛边、缺少、多余”等情况。需要说明的是,在本发明的一些实施例中,除了对字符图像进行阈值处理和图片降噪处理之外,还可以进行字符的分割等操作,本发明实施例中对于字符识别过程中进行的字符优化方式可以有多种,不做限定。举例说明如下,进一步的,步骤A1对字符图像进行阈值处理和图片降噪处理,可以包括如下步骤:
A11、判断字符图像中每个图像像素点的像素值是否大于第一预设阈值,若图像像素点的像素值大于第一预设阈值,则设置图像像素点的像素值为第一数值,若图像像素点的像素值不大于第一预设阈值,则设置图像像素点的像素值为第二数值;和,
A12、对字符图像中的各个图像像素点进行亮度降噪处理,得到降噪后的字符图像。
具体地,以字符图像为验证码图像为例,步骤A11中字符图像中每个图像像素点的像素值进行二值化处理,第一预设阈值为一个预配置的数值或者是根据仿真实践确定的数值,将获取的待识别验证码图像转换为灰度图像后,判断图像像素点的像素值是否大于设定的第一预设阈值,若是,则将图像像素点用1表示,若小于第一预设阈值,则图像像素点用0表示,从而得到二值表示后的待识别验证码图像。当然,第一数值和第二数值可以不局限于上述举例的1、0。在步骤A12中对字符图像的图片降噪处理可以是在亮度上进行降噪,从而使得亮度对字符识别的影响减小。
102、从字符图像中提取出字符点阵,字符点阵包括:对应于字符图像的多个字符像素点。
在本发明实施例中,获取到字符图像之后,对于字符图像可以提取出字符点阵,字符点阵包括有多个字符像素点,在一个字符图像中显示出来的多个字符像素点可以构成字符点阵,字符点阵中多个字符像素点的不同像素值可以表示出该字符点阵对应的字符信息。举例说明如下,字符点阵是把每一个字符都分成N×M个点,然后用每个点的虚实(虚实可以用0或者1来表示0)来表示字符的轮廓。字符点阵也叫位图字符,其中每个字形都以一组二维像素信息表示。在计算机和电信技术中,一个字符是一个单位的字形、类字形单位或符号的基本信息。在本发明实施例中,进行字符降噪处理的最小单位为字符点阵中的字符像素点,通过步骤102可以得到一个字符图像中的所有字符像素点。
103、根据第一字符像素点的像素值与该第一字符像素点对应的周边字符像素点的像素值判断第一字符像素点是否是噪声像素点,第一字符像素点为字符点阵中的任意一个字符像素点。
在本发明实施例中,步骤103和步骤104中描述了按照本发明的方法实现的字符降噪处理,其中步骤103和步骤104中以对第一字符像素点的降噪处理为例,不限定的是,本发明实施例中对于字符点阵中的其它像素点的降噪处理过程都可以参阅对第一字符像素点的降噪处理,因此本发明实施例中不再对字符点阵中的其它像素点进行逐一举例说明。
在本发明实施例中,在判断第一字符像素点是否噪声像素点时,只需要根据字符点阵中字符像素点的像素值,详细的,需要采样第一字符像素点的像素值以及该第一字符像素点的周边字符像素点的像素值。其中,周边字符像素点指的是处于第一字符像素点的周围位置的其它字符像素点,噪声像素点指的是在字符点阵中像素值出现差错的字符像素点,一旦将某个字符像素点确定为噪声像素点,就需要对噪声像素点进行差错点补偿。本发明实施例中基于字体设计时通常采用的字符点阵边缘平滑思路,参考本字符像素点的像素值以及该字符像素点的周边字符像素点的像素值,通常对像素值的取值变化分析来确定某个字符像素点是否是噪声像素点,这样的判断思路也可以称为基于锐角补偿实现的字符降噪处理过程。
本发明实施例中,在进行字符识别时,对字符图像进行阈值处理、图片降噪处理之后,也会加剧出现大量“锯齿、毛边、缺少、多余”等情况。对当前设计的字体进行研究发现,尤其是字母、数字等字符,会对字符边沿进行平滑处理,字符点阵边沿相对比较平滑,而处于字符点阵中心的像素点又与周边的像素点保持一致,本发明实施例中以目前的字体设计的平滑特点,对字符像素点可以采用基于锐角补偿实现字符降噪处理,其中锐角补偿指的是从字符图像的整体来看,字符图像的边沿走向保持平滑趋势,从而对不满足和平滑的趋势的像素点定义为噪声像素点,噪声像素点即为按照本发明需要进行基于锐角补偿的字符像素点。按照本发明实施例对字符像素点进行锐角补偿,以达到更容易识别的效果,提高后续字符识别的成功率。如图2所示,为本发明实施例提供的未进行锐角补偿的字符点阵示意图。例如在图2中展示了在进行锐角补偿前的多个字符点阵,对于每个字符点阵中包括的字符像素点都基于锐角补偿的思路来判断是否噪声像素点。对于图2中有的字符点阵中字符像素点的锯齿、毛边会影响该字符点阵的最终字符识别结果,例如图2中第一行第四个字符图像,就会出现锯齿、毛边等情况,从而会影响字符识别的成功率。
在本发明的一些实施例中,步骤103根据第一字符像素点的像素值与该第一字符像素点对应的周边字符像素点的像素值判断第一字符像素点是否是噪声像素点,包括如下步骤:
B1、按照字符点阵中字符像素点的横纵向分布从第一字符像素点对应的周边字符像素点中获取到在横向分布上与第一字符像素点相邻的前后两个横向字符像素点;
B2、分别判断第一字符像素点的像素值与前后两个横向字符像素点的像素值是否相同,若前后两个横向字符像素点的像素值相同、且第一字符像素点的像素值与前后两个横向字符像素点的像素值不相同,则确定第一字符像素点是噪声像素点,否则确定第一字符像素点不是噪声像素点。
其中,对于第一字符像素点的噪声判断,可以采用字符点阵横向分布的特定,按照横向分布取与第一字符像素点相邻的前后两个横向字符像素点,对字符点阵进行横向补偿,如果字符点阵中连续的三个横向像素点中,只有中间点与其他两个像素点的像素值不同,则确定这个中间点就是噪声像素点,若中间点与其他两个像素点的像素值都相同,则确定这个中间点不是噪声像素点。
在本发明的另一些实施例中,步骤103根据第一字符像素点的像素值与该第一字符像素点对应的周边字符像素点的像素值判断第一字符像素点是否是噪声像素点,包括如下步骤:
C1、按照字符点阵中字符像素点的横纵向分布从第一字符像素点对应的周边字符像素点中获取到在纵向分布上与第一字符像素点相邻的上下两个纵向字符像素点;
C2、分别判断第一字符像素点的像素值与上下两个纵向字符像素点的像素值是否相同,若上下两个纵向字符像素点的像素值相同、且第一字符像素点的像素值与上下两个纵向字符像素点的像素值不相同,则确定第一字符像素点是噪声像素点,否则确定第一字符像素点不是噪声像素点。
其中,对于第一字符像素点的噪声判断,也可以采用字符点阵纵向分布的特定,按照纵向分布取与第一字符像素点相邻的上下两个纵向字符像素点,对字符点阵进行纵向补偿,如果字符点阵中连续的三个纵向像素点中,只有中间点与其他两个像素点的像素值不同,则确定这个中间点就是噪声像素点,若中间点与其他两个像素点的像素值都相同,则确定这个中间点不是噪声像素点。
在本发明的另一些实施例中,步骤103根据第一字符像素点的像素值与该第一字符像素点对应的周边字符像素点的像素值判断第一字符像素点是否是噪声像素点,包括:
D1、判断第一字符像素点为边沿字符像素点,或非边沿字符像素点;
D2、若第一字符像素点是边沿字符像素点,进一步判断第一字符像素点是否为字符点阵中的角点字符像素点,若第一字符像素点是角点字符像素点,获取到在全方位上与第一字符像素点相邻的三个周边字符像素点,判断第一字符像素点的像素值与三个周边字符像素点中像素值相同的至少两个周边字符像素点的像素值是否相同,若不相同则确定第一字符像素点是噪声像素点,否则确定第一字符像素点不是噪声像素点;若第一字符像素点不是角点字符像素点,获取到在全方位上与第一字符像素点相邻的五个周边字符像素点,判断第一字符像素点的像素值与五个周边字符像素点中像素值相同的至少三个周边字符像素点的像素值是否相同,若不相同则确定第一字符像素点是噪声像素点,否则确定第一字符像素点不是噪声像素点;
D3、若第一字符像素点是非边沿字符像素点,获取到在全方位上与第一字符像素点相邻的八个周边字符像素点,判断第一字符像素点的像素值与八个周边字符像素点中像素值相同的至少五个周边字符像素点的像素值是否相同,若不相同则确定第一字符像素点是噪声像素点,否则确定第一字符像素点不是噪声像素点。
其中,在前述实施例中可以按照横向、纵向分布对字符点阵进行噪声像素点的判断,不限定的是,在其它实施例中还可以采用全方位分布对字符点阵进行噪声像素点,例如,首先执行步骤D1,判断第一字符像素点为边沿字符像素点,或非边沿字符像素点。其中,边沿字符像素点是指在字符点阵中处于边缘位置的字符像素点,相反的,没有处于边缘位置的字符像素点就是非边沿字符像素点。如果第一字符像素点是非边沿字符像素点,可以执行步骤D3,如果第一字符像素点是边沿字符像素点,进一步的执行步骤D2,还需要区分第一字符像素点是否是角点字符像素点。其中,角点字符像素点指的是在字符点阵中处于边角位置的字符像素点。在步骤D2至步骤D3中都执行的是周边补偿的判断,通常字符点阵中非边沿点的周边会有八个像素点,字符点阵边沿的点周边会有五个像素点,字符点阵四个角点周边有三个像素点,如果第一字符像素点的周围有超过半数的像素点与这个第一字符像素点的值不同,则确定第一字符像素点是噪声像素点。
104、若确定第一字符像素点是噪声像素点,根据第一字符像素点对应的周边字符像素点的像素值对第一字符像素点进行像素值补偿。
在本发明实施例中,在确定第一字符像素点是噪声像素点的情况下,基于字符点阵的平滑思路,可以参考第一字符像素点对应的周边字符像素点的像素值进行第一字符像素点的像素值补偿,将第一字符像素点的像素值修改,从而可以解决字符边缘模糊的情况。
在本发明的一些实施例中,在前述执行步骤B1至B2的实现场景下,步骤104根据第一字符像素点对应的周边字符像素点的像素值对第一字符像素点进行像素值补偿,包括:
E1、将第一字符像素点的像素值修改为前后两个横向字符像素点的像素值。
其中,对字符点阵进行横向补偿,如果字符点阵中连续的三个横向像素点中,只有中间点与其他两个像素点的像素值不同,则确定这个中间点就是噪声像素点,则修正中间点的值与其他两个值相同。
在本发明的一些实施例中,在前述执行步骤C1至C2的实现场景下,步骤104根据第一字符像素点对应的周边字符像素点的像素值对第一字符像素点进行像素值补偿,包括:
F1、将第一字符像素点的像素值修改为上下两个纵向字符像素点的像素值。
其中,对于第一字符像素点的噪声判断,也可以采用字符点阵纵向分布的特定,按照纵向分布取与第一字符像素点相邻的上下两个纵向字符像素点,对字符点阵进行纵向补偿,如果字符点阵中连续的三个纵向像素点中,只有中间点与其他两个像素点的像素值不同,则确定这个中间点就是噪声像素点,则修正中间点的值与其他两个值相同。
在本发明的一些实施例中,在前述执行步骤D1至D3的实现场景下,根据第一字符像素点对应的周边字符像素点的像素值对第一字符像素点进行像素值补偿,包括:
G1、若第一字符像素点的像素值与三个周边字符像素点中像素值相同的至少两个周边字符像素点的像素值不相同,则将第一字符像素点的像素值修改为三个周边字符像素点中像素值相同的至少两个周边字符像素点的像素值;
G2、若第一字符像素点的像素值与五个周边字符像素点中像素值相同的至少三个周边字符像素点的像素值不相同,则将第一字符像素点的像素值修改为五个周边字符像素点中像素值相同的至少三个周边字符像素点的像素值;
G3、若第一字符像素点的像素值与八个周边字符像素点中像素值相同的至少五个周边字符像素点的像素值不相同,则将第一字符像素点的像素值修改为八个周边字符像素点中像素值相同的至少五个周边字符像素点的像素值。
其中,步骤G1中是对第一字符像素点是角点字符像素点时产生噪声的修正,步骤G2中是对第一字符像素点不是角点字符像素点时产生噪声的修正,步骤G3中是对第一字符像素点是非边沿字符像素点时产生噪声的修正,简单说明可知,修正此第一字符像素点的值为超过半数点的像素值。
需要说明的是,在本发明的前述实施例中通过多种不同的实现场景对噪声像素点进行基于锐角的补偿,从而能够对字符图像进行有效的补偿,使之在后续字符识别时的正确率提高。如图3所示,图3是本发明实施例提供的进行锐角补偿后的字符点阵示意图,对于图3中有的字符点阵中字符像素点进行降噪补偿后可以显著减少锯齿、毛边会影响,例如图3中第一行第四个字符图像,降噪补偿后就会减少锯齿、毛边等情况,从而提高字符识别的成功率。如图2中显示,经过阈值处理后,部分字符点阵中出现大量失真。图3中,部分丢失点经过锐角补偿处理后被找回,如果有多余点,部分也会被消除。字符正常锐角多余补偿出的点在训练后,字符识别时不会对识别成功率有不利影响。如图4所示,是进行锐角补偿前后字符识别的成功率对比示意图。图4中,显示了使用100个样本时2次字符识别正确率对比,在第一次正确率比对过程中,使用锐角补偿之前,字符识别的正确率为94%,使用锐角补偿之后,字符识别的正确率为98%。在第二次正确率比对过程中,使用锐角补偿之前,字符识别的正确率为95%,使用锐角补偿之后,字符识别的正确率为99%。本发明实施例可以基于锐角补偿进行字符点阵的优化,完成对字符点阵进行优化补偿,可有效提升字符识别的正确率。在本发明的一些应用场景中,可以在图像字符阈值、降噪处理之后,字符识别之前使用,使用模板或机器学习方式识别字符时,需要使用对锐角补偿处理后的字符作为模板或学习样本,以免字符正常锐角与补偿后的字符差异造成的正确率下降。
通过前述实施例对本发明的举例说明可知,首先获取到识别出字符特征的字符图像,然后从字符图像中提取出字符点阵,字符点阵包括:对应于字符图像的多个字符像素点,以第一字符像素点为字符点阵中的任意一个字符像素点来说明本发明实施例中对字符像素点的降噪处理,根据第一字符像素点的像素值与该第一字符像素点对应的周边字符像素点的像素值判断第一字符像素点是否是噪声像素点,在确定第一字符像素点是噪声像素点的情况下,根据第一字符像素点对应的周边字符像素点的像素值对第一字符像素点进行像素值补偿。本发明实施例可以从字符图像中提取出字符点阵,对于字符点阵中的所有字符像素点都可以根据字符像素点的像素值以及周边字符像素点的像素值来判断每个字符像素点是噪声像素点,从而通过周边字符像素点进行像素值补偿,对于噪声像素点进行像素值补偿后可以使得字符图像更容易识别,从而减少“锯齿、毛边、缺少、多余”等情况对字符的干扰,因此,可以提高字符识别的成功率。
在实际应用中,为便于更好的理解和实施本发明实施例的上述方案,本发明实施例提供的一种字符识别过程中的字符降噪处理方法可以由字符识别过程中的字符降噪处理装置来实现,在该装置中可以设置具体的单元模块以实现前述方法中的各个步骤。另外需说明的是,装置实施例可以有多种实现方式,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本发明而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘、U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
综上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照上述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对上述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (7)
1.一种字符识别过程中的字符降噪处理方法,其特征在于,包括:
获取识别出字符特征的字符图像;
从所述字符图像中提取出字符点阵,所述字符点阵包括:对应于所述字符图像的多个字符像素点;
根据第一字符像素点的像素值与该第一字符像素点对应的周边字符像素点的像素值判断所述第一字符像素点是否是噪声像素点,所述第一字符像素点为所述字符点阵中的任意一个字符像素点;
其中,所述根据第一字符像素点的像素值与该第一字符像素点对应的周边字符像素点的像素值判断所述第一字符像素点是否是噪声像素点,包括:判断所述第一字符像素点为边沿字符像素点,或非边沿字符像素点;若所述第一字符像素点是所述边沿字符像素点,进一步判断所述第一字符像素点是否为所述字符点阵中的角点字符像素点,若所述第一字符像素点是所述角点字符像素点,获取到在全方位上与所述第一字符像素点相邻的三个周边字符像素点,判断所述第一字符像素点的像素值与所述三个周边字符像素点中像素值相同的至少两个周边字符像素点的像素值是否相同,若不相同则确定所述第一字符像素点是噪声像素点,否则确定所述第一字符像素点不是噪声像素点;若所述第一字符像素点不是所述角点字符像素点,获取到在全方位上与所述第一字符像素点相邻的五个周边字符像素点,判断所述第一字符像素点的像素值与所述五个周边字符像素点中像素值相同的至少三个周边字符像素点的像素值是否相同,若不相同则确定所述第一字符像素点是噪声像素点,否则确定所述第一字符像素点不是噪声像素点;若所述第一字符像素点是所述非边沿字符像素点,获取到在全方位上与所述第一字符像素点相邻的八个周边字符像素点,判断所述第一字符像素点的像素值与所述八个周边字符像素点中像素值相同的至少五个周边字符像素点的像素值是否相同,若不相同则确定所述第一字符像素点是噪声像素点,否则确定所述第一字符像素点不是噪声像素点;
若确定所述第一字符像素点是所述噪声像素点,根据所述第一字符像素点对应的周边字符像素点的像素值对所述第一字符像素点进行像素值补偿;
其中,所述根据所述第一字符像素点对应的周边字符像素点的像素值对所述第一字符像素点进行像素值补偿,包括:若所述第一字符像素点的像素值与所述三个周边字符像素点中像素值相同的至少两个周边字符像素点的像素值不相同,则将所述第一字符像素点的像素值修改为所述三个周边字符像素点中像素值相同的至少两个周边字符像素点的像素值;若所述第一字符像素点的像素值与所述五个周边字符像素点中像素值相同的至少三个周边字符像素点的像素值不相同,则将所述第一字符像素点的像素值修改为所述五个周边字符像素点中像素值相同的至少三个周边字符像素点的像素值;若所述第一字符像素点的像素值与所述八个周边字符像素点中像素值相同的至少五个周边字符像素点的像素值不相同,则将所述第一字符像素点的像素值修改为所述八个周边字符像素点中像素值相同的至少五个周边字符像素点的像素值。
2.根据权利要求1所述的一种字符识别过程中的字符降噪处理方法,其特征在于,所述根据第一字符像素点的像素值与该第一字符像素点对应的周边字符像素点的像素值判断所述第一字符像素点是否是噪声像素点,包括:
按照所述字符点阵中字符像素点的横纵向分布从所述第一字符像素点对应的周边字符像素点中获取到在横向分布上与所述第一字符像素点相邻的前后两个横向字符像素点;
分别判断所述第一字符像素点的像素值与所述前后两个横向字符像素点的像素值是否相同,若所述前后两个横向字符像素点的像素值相同、且所述第一字符像素点的像素值与所述前后两个横向字符像素点的像素值不相同,则确定所述第一字符像素点是噪声像素点,否则确定所述第一字符像素点不是噪声像素点。
3.根据权利要求2所述的一种字符识别过程中的字符降噪处理方法,其特征在于,所述根据所述第一字符像素点对应的周边字符像素点的像素值对所述第一字符像素点进行像素值补偿,包括:
将所述第一字符像素点的像素值修改为所述前后两个横向字符像素点的像素值。
4.根据权利要求1所述的一种字符识别过程中的字符降噪处理方法,其特征在于,所述根据第一字符像素点的像素值与该第一字符像素点对应的周边字符像素点的像素值判断所述第一字符像素点是否是噪声像素点,包括:
按照所述字符点阵中字符像素点的横纵向分布从所述第一字符像素点对应的周边字符像素点中获取到在纵向分布上与所述第一字符像素点相邻的上下两个纵向字符像素点;
分别判断所述第一字符像素点的像素值与所述上下两个纵向字符像素点的像素值是否相同,若所述上下两个纵向字符像素点的像素值相同、且所述第一字符像素点的像素值与所述上下两个纵向字符像素点的像素值不相同,则确定所述第一字符像素点是噪声像素点,否则确定所述第一字符像素点不是噪声像素点。
5.根据权利要求4所述的一种字符识别过程中的字符降噪处理方法,其特征在于,所述根据所述第一字符像素点对应的周边字符像素点的像素值对所述第一字符像素点进行像素值补偿,包括:
将所述第一字符像素点的像素值修改为所述上下两个纵向字符像素点的像素值。
6.根据权利要求1的一种字符识别过程中的字符降噪处理方法,其特征在于,所述获取识别出字符特征的字符图像之前,所述方法还包括:
对所述字符图像进行阈值处理和图片降噪处理。
7.根据权利要求6的一种字符识别过程中的字符降噪处理方法,其特征在于,所述对所述字符图像进行阈值处理和图片降噪处理,包括:
判断所述字符图像中每个图像像素点的像素值是否大于第一预设阈值,若图像像素点的像素值大于所述第一预设阈值,则设置所述图像像素点的像素值为第一数值,若图像像素点的像素值不大于所述第一预设阈值,则设置所述图像像素点的像素值为第二数值;和,
对所述字符图像中的各个图像像素点进行亮度降噪处理,得到降噪后的所述字符图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610313294.2A CN106022329B (zh) | 2016-05-12 | 2016-05-12 | 一种字符识别过程中的字符降噪处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610313294.2A CN106022329B (zh) | 2016-05-12 | 2016-05-12 | 一种字符识别过程中的字符降噪处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106022329A CN106022329A (zh) | 2016-10-12 |
CN106022329B true CN106022329B (zh) | 2019-09-20 |
Family
ID=57100057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610313294.2A Active CN106022329B (zh) | 2016-05-12 | 2016-05-12 | 一种字符识别过程中的字符降噪处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106022329B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108022429B (zh) * | 2016-11-04 | 2021-08-27 | 浙江大华技术股份有限公司 | 一种车辆检测的方法及装置 |
CN108376218B (zh) * | 2018-02-28 | 2021-01-22 | 北京奇艺世纪科技有限公司 | 图像验证码的生成方法、装置及验证方法、装置与系统 |
CN110348185B (zh) * | 2018-04-04 | 2022-05-10 | 中国移动通信集团重庆有限公司 | 验证码的实现方法、装置、设备和计算机存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101119502A (zh) * | 2007-08-22 | 2008-02-06 | 北京中星微电子有限公司 | 图像处理装置及方法 |
CN101304485A (zh) * | 2008-05-26 | 2008-11-12 | 北京中星微电子有限公司 | 一种坏点补偿的方法及装置 |
CN103905747A (zh) * | 2012-12-26 | 2014-07-02 | 深圳市蓝韵实业有限公司 | 医学图像中坏像素点的修补方法及系统 |
CN104899588A (zh) * | 2015-06-26 | 2015-09-09 | 小米科技有限责任公司 | 识别图像中的字符的方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0512319D0 (en) * | 2005-06-16 | 2005-07-27 | Angiomed Ag | Catheter device variable pusher |
-
2016
- 2016-05-12 CN CN201610313294.2A patent/CN106022329B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101119502A (zh) * | 2007-08-22 | 2008-02-06 | 北京中星微电子有限公司 | 图像处理装置及方法 |
CN101304485A (zh) * | 2008-05-26 | 2008-11-12 | 北京中星微电子有限公司 | 一种坏点补偿的方法及装置 |
CN103905747A (zh) * | 2012-12-26 | 2014-07-02 | 深圳市蓝韵实业有限公司 | 医学图像中坏像素点的修补方法及系统 |
CN104899588A (zh) * | 2015-06-26 | 2015-09-09 | 小米科技有限责任公司 | 识别图像中的字符的方法及装置 |
Non-Patent Citations (2)
Title |
---|
快速视频编码器控制算法研究及应用;闫科;《中国优秀硕士学位论文全文数据库 信息科技辑》;20160215(第2期);I136-354 * |
旧式文本的OCR二值化和图像预处理研究;Maya R.Gupta等;《图象识别与自动化》;20071231;第14-22页 * |
Also Published As
Publication number | Publication date |
---|---|
CN106022329A (zh) | 2016-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10817741B2 (en) | Word segmentation system, method and device | |
CN106951832B (zh) | 一种基于手写字符识别的验证方法及装置 | |
CN110619274A (zh) | 基于印章和签名的身份验证方法、装置和计算机设备 | |
CN106022329B (zh) | 一种字符识别过程中的字符降噪处理方法 | |
CN111680690B (zh) | 一种文字识别方法及装置 | |
CN103455814B (zh) | 用于文档图像的文本行分割方法和系统 | |
CN105631486A (zh) | 图像文字识别方法及装置 | |
WO2021237909A1 (zh) | 一种表格还原方法、装置、设备及存储介质 | |
CN103824373B (zh) | 一种票据图像金额分类方法及系统 | |
CN109670491A (zh) | 鉴别人脸图像的方法、装置、设备和存储介质 | |
CN110969046B (zh) | 人脸识别方法、设备及计算机可读存储介质 | |
CN104992152A (zh) | 一种基于模板字符库的字符识别方法及字符识别系统 | |
CN113569863B (zh) | 一种单据稽查的方法、系统、电子设备及存储介质 | |
CN113591866A (zh) | 基于db与crnn的特种作业证件检测方法及系统 | |
CN112507782A (zh) | 文本图像的识别方法及装置 | |
CN112990220A (zh) | 一种图像中目标文本智能识别方法及系统 | |
CN111199186A (zh) | 图像质量评分模型训练方法、装置、设备及存储介质 | |
CN109741273A (zh) | 一种手机拍照低质图像的自动处理与评分方法 | |
CN113920038A (zh) | 一种割轮廓提取方法、装置系统及介质 | |
WO2009067022A1 (en) | A method for resolving contradicting output data from an optical character recognition (ocr) system, wherein the output data comprises more than one recognition alternative for an image of a character | |
CN111507181B (zh) | 票据图像的矫正方法、装置及计算机设备 | |
CN106886996A (zh) | 基于数学运算验证码图像的分割方法和装置 | |
CN115311691B (zh) | 一种基于腕部静脉和腕部纹理的联合识别方法 | |
CN108509960B (zh) | 一种文本朝向检测方法及装置 | |
CN110728276B (zh) | 一种车牌识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |