CN104239909B - 一种图像的识别方法和装置 - Google Patents

一种图像的识别方法和装置 Download PDF

Info

Publication number
CN104239909B
CN104239909B CN201410392614.9A CN201410392614A CN104239909B CN 104239909 B CN104239909 B CN 104239909B CN 201410392614 A CN201410392614 A CN 201410392614A CN 104239909 B CN104239909 B CN 104239909B
Authority
CN
China
Prior art keywords
images
recognized
wire
pixel value
value difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410392614.9A
Other languages
English (en)
Other versions
CN104239909A (zh
Inventor
李健
兰志才
张连毅
武卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing InfoQuick SinoVoice Speech Technology Corp.
Original Assignee
JIETONG HUASHENG SPEECH TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JIETONG HUASHENG SPEECH TECHNOLOGY Co Ltd filed Critical JIETONG HUASHENG SPEECH TECHNOLOGY Co Ltd
Priority to CN201410392614.9A priority Critical patent/CN104239909B/zh
Publication of CN104239909A publication Critical patent/CN104239909A/zh
Application granted granted Critical
Publication of CN104239909B publication Critical patent/CN104239909B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明实施例提供了一种图像的识别方法和装置,以解决由于图像质量较差导致光学字符识别错误的问题。所述的方法包括:获取待识别图像,并从所述待识别图像中检测出各字符的边界轮廓;分别查找每个字符的边界轮廓上的轮廓像素点,检测每个所述轮廓像素点的像素差值;对所述待识别图像中各字符的边界轮廓上各轮廓像素点的像素差值进行统计;依据所述像素差值的统计结果对所述待识别图像的清晰度进行判断,并在判断所述待识别图像清晰后对待识别图像进行光学字符识别。在执行光学字符识别前就排除了不清晰的待识别图像,后续可以对清晰的待识别图像执行光学字符识别,避免了由于图像自身清晰度而导致识别结果错误的问题,提高了识别效率。

Description

一种图像的识别方法和装置
技术领域
本发明涉及图像处理技术,特别是涉及一种图像的识别方法和装置。
背景技术
OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
光学字符识别一般包括预处理、字符二值化、版面分析、字符切分、识别核心等过程。但是有时图像的质量较差,导致光学字符识别的识别效果较差,常常出现错误的识别结果。
发明内容
本发明实施例提出一种图像的识别方法,以解决由于图像质量较差而导致的光学字符识别中识别错误的问题。
相应的,本发明实施例还提供了一种图像的识别装置,用以保证上述方法的实现及应用。
为了解决上述问题,本发明公开了一种图像的识别方法,包括:获取待识别图像,并从所述待识别图像中检测出各字符的边界轮廓;分别查找每个字符的边界轮廓上的轮廓像素点,检测每个所述轮廓像素点的像素差值;对所述待识别图像中各字符的边界轮廓上各轮廓像素点的像素差值进行统计;依据所述像素差值的统计结果对所述待识别图像的清晰度进行判断,并在判断所述待识别图像清晰后对待识别图像进行光学字符识别。
可选的,所述从所述待识别图像中检测出各字符的边界轮廓,包括:对所述待识别图像进行图像边缘检测,确定所述待识别图像中的各轮廓像素点和所述轮廓像素点的边缘信息,其中,所述边缘信息包括强度信息和方向信息;依据所述各轮廓像素点的边缘信息确定所述待识别图像中各字符的边界轮廓。
可选的,检测所述每个轮廓像素点的像素差值,包括:分别以每个轮廓像素点为中心扩展n个像素点,建立(2n+1)*(2n+1)的点阵集合;分别在所述每个点阵集合中查找像素点的像素最大值和像素最小值;分别计算所述每个点阵集合中像素最大值和像素最小值的像素差值,作为所述轮廓像素点的像素差值。
可选的,对所述待识别图像中各字符的边界轮廓上各轮廓像素点的像素差值进行统计,包括:获取所述待识别图像中各字符的边界轮廓上各轮廓像素点的像素差值;分别统计每个像素差值对应的轮廓像素点的个数,并构成像素差值的统计结果,其中,所述统计结果包括以下至少一项:由各像素差值及其对应轮廓像素点的个数构成的数值结果,和依据所述数值结果建立的像素差值分布图。
可选的,依据所述像素差值的统计结果对待识别图像的清晰度进行判断,包括:将所述像素差值的统计结果中各轮廓像素点的像素差值与第一阈值进行比较,确定轮廓像素点的像素差值达到所述第一阈值的个数;当所述达到第一阈值的个数超过第二阈值时,判断所述待识别图像清晰。
相应的,本发明还公开了一种图像的识别装置,包括:获取模块,用于获取待识别图像;边界识别模块,用于从所述待识别图像中检测出各字符的边界轮廓;查找并检测模块,用于分别查找每个字符的边界轮廓上的轮廓像素点,检测每个所述轮廓像素点的像素差值;统计模块,用于对所述待识别图像中各字符的边界轮廓上各轮廓像素点的像素差值进行统计;清晰度判断模块,用于依据所述像素差值的统计结果对所述待识别图像的清晰度进行判断;识别模块,用于在判断所述待识别图像清晰后对待识别图像进行光学字符识别。
可选的,所述边界识别模块,用于对所述待识别图像进行图像边缘检测,确定所述待识别图像中的各轮廓像素点和所述轮廓像素点的边缘信息,其中,所述边缘信息包括强度信息和方向信息;依据所述各轮廓像素点的边缘信息确定所述待识别图像中各字符的边界轮廓。
可选的,所述查找并检测模块,用于分别以每个轮廓像素点为中心扩展n个像素点,建立(2n+1)*(2n+1)的点阵集合;分别在所述每个点阵集合中查找像素点的像素最大值和像素最小值;分别计算所述每个点阵集合中像素最大值和像素最小值的像素差值,作为所述轮廓像素点的像素差值。
可选的,所述统计模块,用于获取所述待识别图像中各字符的边界轮廓上各轮廓像素点的像素差值;分别统计每个像素差值对应的轮廓像素点的个数,并构成像素差值的统计结果,其中,所述统计结果包括以下至少一项:由各像素差值及其对应轮廓像素点的个数构成的数值结果,和依据所述数值结果建立的像素差值分布图。
可选的,所述清晰度判断模块,用于将所述像素差值的统计结果中各轮廓像素点的像素差值与第一阈值进行比较,确定轮廓像素点的像素差值达到所述第一阈值的个数;当所述达到第一阈值的个数超过第二阈值时,判断所述待识别图像清晰。
与现有技术相比,本发明实施例包括以下优点:
在执行光学字符识别前先对待识别图像的清晰度进行判断,即从所述待识别图像中检测出各字符的边界轮廓,再检测每个字符的边界轮廓上的轮廓像素点的像素差值,并对待识别图像中各轮廓像素点的像素差值进行统计,依据统计结果确定所述待识别图像的清晰度,即依据待识别图像中各字符的边界轮廓特性确定待识别图像清晰与否,并在确定待识别图像清晰后对待识别图像进行光学字符识别,从而在执行光学字符识别前就排除了不清晰的待识别图像,后续可以对清晰的待识别图像执行光学字符识别,避免了由于图像自身清晰度而导致识别结果错误的问题,提高了识别效率。
附图说明
图1是本发明的一种图像的识别方法实施例的步骤流程图;
图2是本发明的一种图像的识别方法可选实施例的步骤流程图;
图3A是本发明实施例提供的模糊图像;
图3B是本发明实施例提供的模糊图像的像素差值分布图;
图3C是本发明实施例提供的模糊图像的字符轮廓图;
图4A是本发明实施例提供的清晰图像;
图4B是本发明实施例提供的清晰图像的像素差值分布图;
图4C是本发明实施例提供的清晰图像的字符轮廓图;
图5是本发明一种图像的识别装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明实施例的核心构思之一在于,提出一种图像的识别方法以解决由于图像质量较差而导致的光学字符识别中识别错误的问题。本发明实施例在执行光学字符识别前先对待识别图像的清晰度进行判断,即从所述待识别图像中检测出各字符的边界轮廓,再检测每个字符的边界轮廓上的轮廓像素点的像素差值,并对待识别图像中各轮廓像素点的像素差值进行统计,依据统计结果确定所述待识别图像的清晰度,即依据待识别图像中各字符的边界轮廓特性确定待识别图像清晰与否,并在确定待识别图像清晰后对待识别图像进行光学字符识别,从而在执行光学字符识别前就排除了不清晰的待识别图像,后续可以对清晰的待识别图像执行光学字符识别,避免了由于图像自身清晰度而导致识别结果错误的问题,提高了识别效率。
实施例一
参照图1,示出了本发明的一种图像的识别方法实施例的步骤流程图,具体可以包括如下步骤:
步骤102,获取待识别图像,并从所述待识别图像中检测出各字符的边界轮廓。
本发明实施例在对待识别图像进行光学字符识别之前,先对该待识别图像的清晰度进行判断,从而对清晰的待识别图像进行识别。
首先获取该待识别图像,由于光学字符识别主要是从待识别图像中识别字符并翻译转换成文字,因此要对该待识别图像进行检测,以从待识别图像中识别出各字符的边界轮廓,通过各字符的边界轮廓确定字符的清晰度进而确定图像的清晰度。
步骤104,分别查找每个字符的边界轮廓上的轮廓像素点,检测每个所述轮廓像素点的像素差值。
一个待识别图像中可以存在多个字符,每个字符的边界轮廓上包含多个轮廓像素点,因此分别查找每个字符的边界轮廓上的每个轮廓像素点,分别检测每个轮廓像素点四周的像素差值。其中像素差值指的是轮廓像素点四周其他像素点的像素值的差值,用以标识该轮廓像素点四周的亮度变化。
步骤106,对所述待识别图像中各字符的边界轮廓上各轮廓像素点的像素差值进行统计。
对所述待识别图像中各字符的边界轮廓上各轮廓像素点,即对所述待识别图像中的所有轮廓像素点的像素差值进行统计,如统计所述待识别图像中每个像素差值对应轮廓像素点个数,又如所述待识别图像或其中的每个字符对应轮廓像素点的像素差值分布等,从而得到对应的统计结果。
步骤108,依据所述像素差值的统计结果对所述待识别图像的清晰度进行判断,并在判断所述待识别图像清晰后对待识别图像进行光学字符识别。
依据像素差值的统计结果对待识别图像的清晰度进行判断,如依据待识别图像或其中的每个字符对应轮廓像素点的像素差值分布,确定其像素差值分布的主要区域,进而确定该待识别图像或其中的字符四周的亮度变化,依据该亮度变化确定字符以及待识别图像清晰与否。如若轮廓像素点的像素差值大部分分布在差值较大的区域,则字符四周的亮度变化比较明显,图像比较清晰。
若判断所述待识别图像清晰,则对该待识别图像进行光学字符识别,对清晰的图像进行光学字符识别可以得到比较准确的识别结果。若判断所述待识别图像不清晰,则忽略该待识别图像,则不对其执行光学字符识别,如可以提醒用户该图片不清洗,请重新扫描、上传图片等操作。
综上所述,在执行光学字符识别前先对待识别图像的清晰度进行判断,即从所述待识别图像中检测出各字符的边界轮廓,再检测每个字符的边界轮廓上的轮廓像素点的像素差值,并对待识别图像中各轮廓像素点的像素差值进行统计,依据统计结果确定所述待识别图像的清晰度,即依据待识别图像中各字符的边界轮廓特性确定待识别图像清晰与否,并在确定待识别图像清晰后对待识别图像进行光学字符识别,从而在执行光学字符识别前就排除了不清晰的待识别图像,后续可以对清晰的待识别图像执行光学字符识别,避免了由于图像自身清晰度而导致识别结果错误的问题,提高了识别效率。
实施例二
在上述实施例的基础上,本实施例进一步论述该图像的识别方法。
参照图2,示出了本发明的一种图像的识别方法可选实施例的步骤流程图,具体可以包括如下步骤:
步骤202,获取待识别图像。
步骤204,对所述待识别图像进行图像边缘检测,确定所述待识别图像中的各轮廓像素点和所述轮廓像素点的边缘信息。
步骤206,依据所述各轮廓像素点的边缘信息确定所述待识别图像中各字符的边界轮廓。
采用图像边缘检测方法对待识别图像进行检测,其中,图像边缘检测用于定位二维或三维图像中的对象的边缘,本实施例中待识别图像中的对象为字符,则通过图像边缘检测可以检测待识别图像中字符的边界轮廓。
图像中对象的边缘以局部特征不连续性反映的,通常可以通过除噪、增强、检测、定位等一系列处理操作确定出字符的边界轮廓。如通过除噪和增强处理后,对待识别图像进行检测计算,得到轮廓像素点以及该轮廓像素点的边缘信息,其中边缘信息包括强度信息和方向信息。从而采用各轮廓像素点的边缘信息确定所述待识别图像中各字符的边界轮廓,即通过轮廓像素点的强度信息以及方向信息可以确定出字符边缘上的灰度变化,进而确定字符的边界轮廓。
步骤208,分别以每个轮廓像素点为中心扩展n个像素点,建立(2n+1)*(2n+1)的点阵集合。
步骤210,分别在所述每个点阵集合中查找像素点的像素最大值和像素最小值。
步骤212,分别计算所述每个点阵集合中像素最大值和像素最小值的像素差值,作为所述轮廓像素点的像素差值。
对于待识别图像中的所有轮廓像素点,分别以每个轮廓像素点为中心,向该轮廓像素点的四周扩展n个像素点,获取(2n+1)*(2n+1)的像素点方阵,构成(2n+1)*(2n+1)的点阵集合,该点阵集合中可以记录各像素点的位置以及其像素值,如向该轮廓像素点的四周扩展2个像素点,则构成5*5的点阵集合。
然后获取该点阵集合中每个像素点的像素值,分别查找像素值最大的像素点和像素值最小的像素点,并将对应像素值分别记录为该点阵集合中像素点的像素最大值和像素最小值。
将该点阵集合中像素点的像素最大值和像素最小值相减,差值的绝对值即为该点阵集合中像素点的像素差值,作为所述轮廓像素点的像素差值。
通过上述操作步骤可以获取轮廓像素点的像素差值,从而对每个轮廓像素点分别执行上述操作,可以得到该待识别图像中所有轮廓像素点的像素差值。
步骤214,获取所述待识别图像中各字符的边界轮廓上各轮廓像素点的像素差值。
步骤216,分别统计每个像素差值对应的轮廓像素点的个数,并构成像素差值的统计结果。
获取待识别图像中所有轮廓像素点的像素差值,然后以像素差值为基准,统计每个像素差值对应的轮廓像素点的个数,并构成像素差值的统计结果。其中,所述统计结果包括以下至少一项:由各像素差值及其对应轮廓像素点的个数构成的数值结果,和依据所述数值结果建立的像素差值分布图。
例如,可以采用数据表保存各像素差值及其对应轮廓像素点的个数,从而通过数值确定该待识别图像中各轮廓像素点的像素差值的分布情况。又如依据所述数值结果建立的像素差值分布图,通过分布图中像素差值的分布情况直观的显示像素差值的分布情况。通过各轮廓像素点的像素差值的分布情况可以确定该待识别图像中字符边界轮廓是否清晰,从而确定该图片是否清晰。
如图3和图4分别展示了模糊图像和清晰图像的相关示意图,其中图3A为模糊图像,图3B为模糊图像的像素差值分布图,图3C为模糊图像的字符轮廓图;图4A为清晰图像,图4B为清晰图像的像素差值分布图,图4C为清晰图像的字符轮廓图。其中,图3B和图4B的像素差值分布图中,横坐标表示像素差值,纵坐标表示轮廓像素点的个数。
对上述图3和图4提供的图像分别进行图像边缘检测,确定出各字符的边界轮廓,以及各边界轮廓上的轮廓像素点。然后通过像素点扩展确定点阵集合,计算出每个轮廓像素点的像素差值,通过统计确定上述图3B和图4B所示的像素差值分布图。
步骤218,将所述像素差值的统计结果中各轮廓像素点的像素差值与第一阈值进行比较,确定轮廓像素点的像素差值达到所述第一阈值的个数。
步骤220,检测所述轮廓像素点的像素差值达到所述第一阈值的个数是否大于第二阈值。
本发明实施例中预设了对图像清晰度进行判断的第一阈值和第二阈值,其中第一阈值用于对轮廓像素点的像素差值进行筛选,通过第一阈值筛选出轮廓像素点的像素差值较大,即强度变化比较明显轮廓像素点。第二阈值用于对筛选出的轮廓像素点的像素差值进一步确定图像清晰与否,即通过强度变化比较明显轮廓像素点的数量确定图像中字符的边缘是否变化明显,即该图像清晰与否。如将第一阈值设为60~70以上,若以百分比进行比较可以将第二阈值设为50%以上,或70%以上等,可以依据实际需求确定。
因此首先从统计结果中获取各像素差值及其对应轮廓像素点的个数,统计轮廓像素点的像素差值达到所述第一阈值的轮廓像素点的个数,或者确定轮廓像素点的像素差值达到所述第一阈值的轮廓像素点占所有轮廓像素点的百分比。然后再将达到所述第一阈值的轮廓像素点的个数与第二阈值进行比较,或者采用上述百分比与第二阈值进行比较,确定其是否大于第二阈值。
若是,即所述轮廓像素点的像素差值达到所述第一阈值的个数大于第二阈值,则执行步骤222;若否,即所述轮廓像素点的像素差值达到所述第一阈值的个数不大于第二阈值,执行步骤224。
步骤222,判断所述待识别图像清晰,并对待识别图像进行光学字符识别。
当达到所述第一阈值的轮廓像素点的个数或百分比大于第二阈值时,可以认为该待识别图像比较清晰,然后对该待识别图像进行光学字符识别。
如上述图4中的清晰图像,通过像素差值分布图以及相应的数值数据确定出该待识别图像是清晰的,从而可以对图4的图像进行光学字符识别。后续可以将识别结果反馈给用户。
步骤224,反馈所述待识别图像不清晰。
当达到所述第一阈值的轮廓像素点的个数或百分比不大于第二阈值时,可以认为该待识别图像比较不清晰(模糊),可以忽略该待识别图像,不对其进行光学字符识别,也可以进一步提醒用户该待识别图像不清晰,请用户重新扫描、上传图像。
如上述图3中的模糊图像,通过像素差值分布图以及相应的数值数据确定出该待识别图像是模糊的,从而不对图3的图像进行光学字符识别,后续可以将对用户进行提示。
通常模糊图像的像素差值分布在像素差值比较小的区域,而清晰图像的像素差值分布在像素差值比较大的区域。因此在进行字符识别过程之前,可以根据像素差值的分布来判断待识别图像的清晰度。如果像素差值大部分分布在数值比较小的区域,则待识别图像是模糊的,就不执行字符识别过程,可以将图像模糊的提示信息提供给用户。而如果像素差值大部分分布在数值比较大的区域,则认为待识别图像是清晰的,可以继续执行字符识别过程,最后把识别结果提供给用户。因此上述第一阈值和第二阈值的比较方法进行对统计结果进行判定的一种实施例,实际处理中还可以依据像素差值分布图直接对清晰度进行判断,上述仅用于举例说明依据所述像素差值的统计结果对所述待识别图像的清晰度进行判断的方法,不应理解为是对本发明实施例的限制。
综上所述,以每个轮廓像素点为中心进行扩展确定相应的像素点方阵构成点阵集合,通过该点阵集合中像素点的像素最大值和像素最小值确定轮廓像素点的像素差值,从而可以确定出轮廓像素点四周的强度变化,便于后续确定字符轮廓清晰与否。
其次,通过对待识别图像中所有轮廓像素点的像素差值进行统计,可以确定待识别图像中各轮廓像素点的像素差值的分布情况,依据该分布情况确定图像的清晰度,从而仅对清晰的待识别图像进行光学字符识别。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
实施例三
在上述实施例的基础上,本实施例还提供了一种图像的识别装置。
参照图5,示出了本发明一种图像的识别装置实施例的结构框图,具体可以包括如下模块:
获取模块502,用于获取待识别图像。
边界识别模块504,用于从所述待识别图像中检测出各字符的边界轮廓。
查找并检测模块506,用于分别查找每个字符的边界轮廓上的轮廓像素点,检测每个所述轮廓像素点的像素差值。
统计模块508,用于对所述待识别图像中各字符的边界轮廓上各轮廓像素点的像素差值进行统计。
清晰度判断模块510,用于依据所述像素差值的统计结果对所述待识别图像的清晰度进行判断。
识别模块512,用于在判断所述待识别图像清晰后对待识别图像进行光学字符识别。
综上所述,在执行光学字符识别前先对待识别图像的清晰度进行判断,即从所述待识别图像中检测出各字符的边界轮廓,再检测每个字符的边界轮廓上的轮廓像素点的像素差值,并对待识别图像中各轮廓像素点的像素差值进行统计,依据统计结果确定所述待识别图像的清晰度,即依据待识别图像中各字符的边界轮廓特性确定待识别图像清晰与否,并在确定待识别图像清晰后对待识别图像进行光学字符识别,从而在执行光学字符识别前就排除了不清晰的待识别图像,后续可以对清晰的待识别图像执行光学字符识别,避免了由于图像自身清晰度而导致识别结果错误的问题,提高了识别效率。
本发明一个可选实施例中,所述边界识别模块504,用于对所述待识别图像进行图像边缘检测,确定所述待识别图像中的各轮廓像素点和所述轮廓像素点的边缘信息,其中,所述边缘信息包括强度信息和方向信息;依据所述各轮廓像素点的边缘信息确定所述待识别图像中各字符的边界轮廓。
所述查找并检测模块506,用于分别以每个轮廓像素点为中心扩展n个像素点,建立(2n+1)*(2n+1)的点阵集合;分别在所述每个点阵集合中查找像素点的像素最大值和像素最小值;分别计算所述每个点阵集合中像素最大值和像素最小值的像素差值,作为所述轮廓像素点的像素差值。
所述统计模块508,用于获取所述待识别图像中各字符的边界轮廓上各轮廓像素点的像素差值;分别统计每个像素差值对应的轮廓像素点的个数,并构成像素差值的统计结果,其中,所述统计结果包括以下至少一项:由各像素差值及其对应轮廓像素点的个数构成的数值结果,和依据所述数值结果建立的像素差值分布图。
所述清晰度判断模块510,用于将所述像素差值的统计结果中各轮廓像素点的像素差值与第一阈值进行比较,确定轮廓像素点的像素差值达到所述第一阈值的个数;当所述达到第一阈值的个数超过第二阈值时,判断所述待识别图像清晰。
综上所述,以每个轮廓像素点为中心进行扩展确定相应的像素点方阵构成点阵集合,通过该点阵集合中像素点的像素最大值和像素最小值确定轮廓像素点的像素差值,从而可以确定出轮廓像素点四周的强度变化,便于后续确定字符轮廓清晰与否。
其次,通过对待识别图像中所有轮廓像素点的像素差值进行统计,可以确定待识别图像中各轮廓像素点的像素差值的分布情况,依据该分布情况确定图像的清晰度,从而仅对清晰的待识别图像进行光学字符识别。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种图像的识别方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种图像的识别方法,其特征在于,包括:
获取待识别图像,并从所述待识别图像中检测出各字符的边界轮廓;
分别查找每个字符的边界轮廓上的轮廓像素点,检测每个所述轮廓像素点的像素差值;
对所述待识别图像中各字符的边界轮廓上各轮廓像素点的像素差值进行统计;
依据所述像素差值的统计结果对所述待识别图像的清晰度进行判断,并在判断所述待识别图像清晰后对待识别图像进行光学字符识别;
检测所述每个轮廓像素点的像素差值,包括:
分别以每个轮廓像素点为中心扩展n个像素点,建立(2n+1)*(2n+1)的点阵集合;
分别在所述每个点阵集合中查找像素点的像素最大值和像素最小值;
分别计算所述每个点阵集合中像素最大值和像素最小值的像素差值,作为所述轮廓像素点的像素差值。
2.根据权利要求1所述的方法,其特征在于,所述从所述待识别图像中检测出各字符的边界轮廓,包括:
对所述待识别图像进行图像边缘检测,确定所述待识别图像中的各轮廓像素点和所述轮廓像素点的边缘信息,其中,所述边缘信息包括强度信息和方向信息;
依据所述各轮廓像素点的边缘信息确定所述待识别图像中各字符的边界轮廓。
3.根据权利要求1所述的方法,其特征在于,对所述待识别图像中各字符的边界轮廓上各轮廓像素点的像素差值进行统计,包括:
获取所述待识别图像中各字符的边界轮廓上各轮廓像素点的像素差值;
分别统计每个像素差值对应的轮廓像素点的个数,并构成像素差值的统计结果,其中,所述统计结果包括以下至少一项:由各像素差值及其对应轮廓像素点的个数构成的数值结果,和依据所述数值结果建立的像素差值分布图。
4.根据权利要求1所述的方法,其特征在于,依据所述像素差值的统计结果对待识别图像的清晰度进行判断,包括:
将所述像素差值的统计结果中各轮廓像素点的像素差值与第一阈值进行比较,确定轮廓像素点的像素差值达到所述第一阈值的个数;
当所述达到第一阈值的个数超过第二阈值时,判断所述待识别图像清晰。
5.一种图像的识别装置,其特征在于,包括:
获取模块,用于获取待识别图像;
边界识别模块,用于从所述待识别图像中检测出各字符的边界轮廓;
查找并检测模块,用于分别查找每个字符的边界轮廓上的轮廓像素点,检测每个所述轮廓像素点的像素差值;
统计模块,用于对所述待识别图像中各字符的边界轮廓上各轮廓像素点的像素差值进行统计;
清晰度判断模块,用于依据所述像素差值的统计结果对所述待识别图像的清晰度进行判断;
识别模块,用于在判断所述待识别图像清晰后对待识别图像进行光学字符识别;
所述查找并检测模块,用于分别以每个轮廓像素点为中心扩展n个像素点,建立(2n+1)*(2n+1)的点阵集合;分别在所述每个点阵集合中查找像素点的像素最大值和像素最小值;分别计算所述每个点阵集合中像素最大值和像素最小值的像素差值,作为所述轮廓像素点的像素差值。
6.根据权利要求5所述的装置,其特征在于:
所述边界识别模块,用于对所述待识别图像进行图像边缘检测,确定所述待识别图像中的各轮廓像素点和所述轮廓像素点的边缘信息,其中,所述边缘信息包括强度信息和方向信息;依据所述各轮廓像素点的边缘信息确定所述待识别图像中各字符的边界轮廓。
7.根据权利要求5所述的装置,其特征在于:
所述统计模块,用于获取所述待识别图像中各字符的边界轮廓上各轮廓像素点的像素差值;分别统计每个像素差值对应的轮廓像素点的个数,并构成像素差值的统计结果,其中,所述统计结果包括以下至少一项:由各像素差值及其对应轮廓像素点的个数构成的数值结果,和依据所述数值结果建立的像素差值分布图。
8.根据权利要求5所述的装置,其特征在于:
所述清晰度判断模块,用于将所述像素差值的统计结果中各轮廓像素点的像素差值与第一阈值进行比较,确定轮廓像素点的像素差值达到所述第一阈值的个数;当所述达到第一阈值的个数超过第二阈值时,判断所述待识别图像清晰。
CN201410392614.9A 2014-08-11 2014-08-11 一种图像的识别方法和装置 Active CN104239909B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410392614.9A CN104239909B (zh) 2014-08-11 2014-08-11 一种图像的识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410392614.9A CN104239909B (zh) 2014-08-11 2014-08-11 一种图像的识别方法和装置

Publications (2)

Publication Number Publication Date
CN104239909A CN104239909A (zh) 2014-12-24
CN104239909B true CN104239909B (zh) 2018-03-16

Family

ID=52227932

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410392614.9A Active CN104239909B (zh) 2014-08-11 2014-08-11 一种图像的识别方法和装置

Country Status (1)

Country Link
CN (1) CN104239909B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106373121A (zh) * 2016-09-18 2017-02-01 广东小天才科技有限公司 模糊图像识别方法和装置
CN106530289B (zh) * 2016-11-03 2019-04-30 刘国勇 一种基于点阵的喷码清晰度机器视觉检测方法
CN106874909B (zh) * 2017-01-18 2019-10-11 深圳怡化电脑股份有限公司 一种图像字符的识别方法及其装置
CN107545251A (zh) * 2017-08-31 2018-01-05 北京图铭视界科技有限公司 人脸质量判别及图片增强的方法及装置
CN108664973A (zh) * 2018-03-28 2018-10-16 北京捷通华声科技股份有限公司 文本处理方法和装置
CN108491843B (zh) * 2018-04-12 2022-11-18 腾讯科技(深圳)有限公司 一种图像处理方法、装置及存储介质
WO2019227300A1 (zh) * 2018-05-29 2019-12-05 优视科技新加坡有限公司 版面元素的处理方法、装置、存储介质及电子设备/终端/服务器
CN110378248B (zh) * 2019-06-25 2023-07-21 平安科技(深圳)有限公司 饼状图识别方法、装置、设备及计算机可读存储介质
CN113191360A (zh) * 2020-01-14 2021-07-30 深圳怡化电脑股份有限公司 票据的字符轮廓定位方法和装置
CN114387500A (zh) * 2020-10-16 2022-04-22 苏州科瓴精密机械科技有限公司 应用于自行走设备的图像识别方法、系统、自行走设备及可读存储介质
CN113283416A (zh) * 2020-12-29 2021-08-20 深圳怡化电脑股份有限公司 一种字符轮廓识别方法、装置、电子设备、机器可读介质
CN112686919B (zh) * 2020-12-29 2022-10-21 上海闻泰信息技术有限公司 物体边界线确定方法、装置、电子设备及存储介质
CN112669290A (zh) * 2020-12-30 2021-04-16 稿定(厦门)科技有限公司 图像比对方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0677820A2 (en) * 1994-04-14 1995-10-18 Hewlett-Packard Company Magnifying digital image using edge mapping
US6516097B1 (en) * 1999-07-16 2003-02-04 Lockheed Martin Corporation Image segmentation system
CN101527842A (zh) * 2008-03-07 2009-09-09 瑞昱半导体股份有限公司 过滤区块效应的图像处理方法及装置
CN103020967A (zh) * 2012-12-07 2013-04-03 青岛经纬蓝图信息技术有限公司 基于海岛边缘特征的无人机航拍图像精确匹配方法
CN103034831A (zh) * 2011-09-30 2013-04-10 无锡爱丁阁信息科技有限公司 线性条码识别方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0677820A2 (en) * 1994-04-14 1995-10-18 Hewlett-Packard Company Magnifying digital image using edge mapping
US6516097B1 (en) * 1999-07-16 2003-02-04 Lockheed Martin Corporation Image segmentation system
CN101527842A (zh) * 2008-03-07 2009-09-09 瑞昱半导体股份有限公司 过滤区块效应的图像处理方法及装置
CN103034831A (zh) * 2011-09-30 2013-04-10 无锡爱丁阁信息科技有限公司 线性条码识别方法和系统
CN103020967A (zh) * 2012-12-07 2013-04-03 青岛经纬蓝图信息技术有限公司 基于海岛边缘特征的无人机航拍图像精确匹配方法

Also Published As

Publication number Publication date
CN104239909A (zh) 2014-12-24

Similar Documents

Publication Publication Date Title
CN104239909B (zh) 一种图像的识别方法和装置
CN105913093B (zh) 一种用于文字识别处理的模板匹配方法
CN108898047B (zh) 基于分块遮挡感知的行人检测方法及系统
CN114140679B (zh) 一种缺陷融合方法、装置、识别系统及存储介质
CN105453153B (zh) 交通灯检测
CN103439348B (zh) 基于差影法的遥控器按键缺陷检测方法
CN110008809A (zh) 表格数据的获取方法、装置和服务器
CN110619333B (zh) 一种文本行分割方法、文本行分割装置及电子设备
CN104794479B (zh) 基于局部笔画宽度变换的自然场景图片中文本检测方法
CN104463138B (zh) 基于视觉结构属性的文本定位方法及系统
CN103971087B (zh) 一种实时搜索及识别交通标志的方法及装置
CN104751097A (zh) 一种车辆识别码的检测处理方法及装置
CN108537787B (zh) 一种人脸图像的质量判定方法
CN105718931B (zh) 用于确定采集图像中的杂斑的系统和方法
CN103308523B (zh) 多尺度瓶口缺陷检测方法及装置
CN106033535A (zh) 电子阅卷方法
CN110199317A (zh) 使用手持设备对木板的自动检测、计数和测量
CN109949227A (zh) 图像拼接方法、系统及电子设备
CN104598907A (zh) 一种基于笔画宽度图的图像中文字数据提取方法
CN102930251A (zh) 两维收藏品数据收录与甄别的装置和方法
CN110599453A (zh) 一种基于图像融合的面板缺陷检测方法、装置及设备终端
CN106022379A (zh) 检测屏幕新旧度的方法和装置
CN103034833A (zh) 条码定位方法及装置
CN115082776A (zh) 一种基于图像识别的电能表自动检测系统及方法
CN103699876A (zh) 一种基于线阵ccd图像识别车号的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 100193 Haidian District, Beijing, Northeast China, Beijing Zhongguancun Software Park incubator 2 floor 1.

Patentee after: Beijing InfoQuick SinoVoice Speech Technology Corp.

Address before: 100193 two, 206-1, Zhongguancun Software Park, 8 Northeast Northeast Road, Haidian District, Beijing, 206-1

Patentee before: Jietong Huasheng Speech Technology Co., Ltd.

CP03 Change of name, title or address
CP02 Change in the address of a patent holder

Address after: Building 2102, building 1, Haidian District, Beijing

Patentee after: BEIJING SINOVOICE TECHNOLOGY Co.,Ltd.

Address before: 100193 Haidian District, Beijing, Northeast China, Beijing Zhongguancun Software Park incubator 2 floor 1.

Patentee before: BEIJING SINOVOICE TECHNOLOGY Co.,Ltd.

CP02 Change in the address of a patent holder