CN107239784A - 一种图片识别方法、装置、电子设备及可读存储介质 - Google Patents
一种图片识别方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN107239784A CN107239784A CN201710533242.0A CN201710533242A CN107239784A CN 107239784 A CN107239784 A CN 107239784A CN 201710533242 A CN201710533242 A CN 201710533242A CN 107239784 A CN107239784 A CN 107239784A
- Authority
- CN
- China
- Prior art keywords
- picture
- character
- identified
- value
- color parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
本发明实施例提供了一种图片识别方法、装置、电子设备及可读存储介质,其中,所述方法包括:通过所有像素点的颜色参数值中出现次数最多的预设数量个颜色参数值中、出现次数少的颜色参数值,对待识别图片中的像素点重新赋值,进而根据重新赋值后的待识别图片中所有像素点对应的数值的分布,分割提取待识别图片中所有字符中每个字符对应的字符图片,并获得每个字符图片中像素点对应的数组;最终通过数组转换的字符串与预先存储的模板字符串进行比对,根据对比的相似度,识别出待识别图片中的字符。通过本发明实施例提供的图片识别方法、装置、电子设备及可读存储介质,能够实现在背景与字符颜色接近的图片中,准确识别出图片中的字符。
Description
技术领域
本发明涉及图像处理技术领域,特别是涉及一种图片识别方法、装置、电子设备及可读存储介质。
背景技术
随着信息技术的不断发展,信息的形式不断多样化,图片作为信息载体中的一种重要形式,在日常生活中越来越常用。图片中经常会包括一些重要的字符信息,例如,行驶证中的车牌号和发动机号码、图片验证码中的数字等。为了使用图片中的这些信息,需要识别图片中的文字、数字等信息,将这些信息转换为可编辑的字符。
而为了提高图片识别的效率,现有的方法中会采用将图片对应的字符串与预先存储的模板字符串进行比对的方法,识别图片中的数字等信息。具体地通过将色度值125作为阈值对待识别图片进行二值化,例如,色度值大于125的像素点赋值为1,色度值小于125的像素点赋值为0。如此,得到待识别图片对应的0和1组成的数组;然后去除数组中连续为0的部分,从而分割提取出数组中待识别图片中字符对应的数组部分;将该待识别图片中字符对应的数组转换为字符串,最终将该字符串与预先存储的字符的模板字符串进行比对,并根据比对的相似度识别待识别字符图片中的字符。
但是实际应用的一些图片中,背景与字符是由颜色接近且色度值都大于或者小于125的颜色组成,可以看出,通过现有的图片识别方法中将固定的色度值125作为阈值对待识别图像进行二值化,最终无法识别出待识别图片中的字符。
发明内容
本发明实施例的目的在于提供一种图片识别方法、装置、电子设备及可读存储介质,以实现在背景与字符颜色接近的图片中,准确识别出图片中的字符。具体技术方案如下:
第一方面,本发明实施例提供了一种图片识别方法,包括:
确定待识别图片中所有像素点的颜色参数值;
选取所有像素点的颜色参数值中出现次数最多的预设数量个颜色参数值中、出现次数少的第一颜色参数值;
对所述第一颜色参数值对应的像素点重新赋值为第一数值,对所有颜色参数值中除所述第一颜色参数值对应的像素点重新赋值为第二数值;
根据所述待识别图片中所有像素点对应的所述第一数值和所述第二数值的分布,分割提取所述待识别图片中所有字符中每个字符对应的字符图片,并获得每个字符图片中像素点对应的所述第一数值和所述第二数值组成的数组;
将每个字符图片对应的数组转换为每个字符图片对应的字符串;
将每个字符图片对应的字符串与预先存储的模板字符串进行比对,根据对比的相似度,识别出所述待识别图片中的字符。
可选的,在所述将每个字符图片对应的字符串与预先存储的模板字符串进行比对,之前,所述方法还包括:
缩放每个字符图片的尺寸,使得每个字符图片的尺寸与所述预先存储的模板字符串对应的模板字符图片的尺寸相同。
可选的,所述将每个字符图片对应的字符串与预先存储的模板字符串进行比对,根据对比的相似度,识别出所述待识别图片中的字符,包括:
分别将每个字符图片对应的字符串与所有的模板字符串进行比对;
确定比对相似度最高时对应的模板字符串对应的字符为每个字符图片对应的字符。
可选的,所述第一数值为1,所述第二数值为0,所述模板字符串表示为0和1组成的字符串;
所述分别将每个字符图片对应的字符串与所有的模板字符串进行比对,包括:
分别将每个字符图片对应的0和1组成的字符串、与所有的所述模板字符串进行比对。
可选的,所述第一数值为1,所述第二数值为0,所述数组为0和1组成的数组;
所述根据所述待识别图片中所有像素点对应的所述第一数值和所述第二数值的分布,分割提取所述待识别图片中所有字符中每个字符对应的字符图片,包括:
分别按照行、列顺序删除所述数组中的全0部分,得到所述待识别图片中所有字符中每个字符对应的字符图片,其中,全0部分表示所述数组中全0的行或列。
可选的,在所述确定待识别图片中所有像素点的颜色参数值之前,所述方法还包括:
确定所述待识别图片的图片类型;
所述确定待识别图片中所有像素点的颜色参数值,包括:
根据所述待识别图片的图片类型确定所述图片类型对应的解析函数;
根据不同图片类型对应的不同解析函数,确定不同图片类型的所述待识别图片的中所有像素点的所述颜色参数值,其中,所述颜色参数值包括RGB值。
第二方面,本发明实施例提供了一种图片识别装置,包括:
确定模块,用于确定待识别图片中所有像素点的颜色参数值;
选取模块,用于选取所有像素点的颜色参数值中出现次数最多的预设数量个颜色参数值中、出现次数少的第一颜色参数值;
赋值模块,用于对所述第一颜色参数值对应的像素点重新赋值为第一数值,对所有颜色参数值中除所述第一颜色参数值对应的像素点重新赋值为第二数值;
分割模块,用于根据所述待识别图片中所有像素点对应的所述第一数值和所述第二数值的分布,分割提取所述待识别图片中所有字符中每个字符对应的字符图片,并获得每个字符图片中像素点对应的所述第一数值和所述第二数值组成的数组;
转换模块,用于将每个字符图片对应的数组转换为每个字符图片对应的字符串;
识别模块,用于将每个字符图片对应的字符串与预先存储的模板字符串进行比对,根据对比的相似度,识别出所述待识别图片中的字符。
可选的,所述装置还包括:
缩放模块,用于缩放每个字符图片的尺寸,使得每个字符图片的尺寸与所述预先存储的模板字符串对应的模板字符图片的尺寸相同。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现第一方面所述的方法步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的方法步骤。
本发明实施例提供的图片识别方法、装置、电子设备及可读存储介质,可以通过所有像素点的颜色参数值中出现次数最多的预设数量个颜色参数值中、出现次数少的颜色参数值,对待识别图片中的像素点重新赋值,进而根据重新赋值后的的待识别图片中所有像素点对应的数值的分布,分割提取待识别图片中所有字符中每个字符对应的字符图片,并获得每个字符图片中像素点对应的数组;将每个字符图片对应的数组转换为每个字符图片对应的字符串;将每个字符图片对应的字符串与预先存储的模板字符串进行比对,根据对比的相似度,识别出待识别图片中的字符。通过本发明实施例提供的图片识别方法、装置、电子设备及可读存储介质,能够实现在背景与字符颜色接近的图片中,准确识别出图片中的字符。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的图片识别方法的流程图;
图2为本发明实施例中待识别图片颜色分布示意图;
图3为本发明实施例中对待识别图片中像素点赋值后的示意图;
图4为本发明实施例中分割字符图片过程示意图;
图5为本发明实施例具体实施过程的流程图;
图6为本发明实施例提供的图片识别装置的结构示意图;
图7为本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的图片识别方法,将待识别图片用对应的数组表示,进而分割提取出待识别图片中每个字符对应的字符图片,并将每个字符图片对应的数组转化为字符串,最后将每个字符图片对应的字符串与预先存储的模板字符串进行比对,识别出待识别图片中的字符。
图1为本发明实施例提供的图片识别方法的流程图,参照图1对本发明实施例提供的图片识别方法进行详细说明,包括:
步骤101,确定待识别图片中所有像素点的颜色参数值。
本发明实施例提供的图片识别方法可以应用于电子设备,其中,该电子设备可以包括台式计算机、便携式计算机、智能移动终端等。其中,待识别图片可以是行驶证中的车牌号、图片验证码等。
图像的颜色模式有很多种,例如:RGB模式、CMYK模式、HSB模式、灰度模式、双色调模式等。每一种颜色模式都有其自身表示颜色的参数,所以本发明实施例中可以通过多种颜色模式下表示图像颜色的颜色参数值,确定该待识别图片中所有像素点的颜色参数值,例如,可以确定RGB模式下待识别图片中所有像素点的RGB值。
步骤102,选取所有像素点的颜色参数值中出现次数最多的预设数量个颜色参数值中、出现次数少的第一颜色参数值。
实际应用过程中,待识别图片中可能包括多种颜色,其中,一般出现最多的两种颜色就是背景部分对应的颜色和待识别图片中字符对应的颜色,而背景部分占的比例一般情况下比字符部分占的比例大。所以本发明实施例提供的图片识别方法,选取所有像素点的颜色参数值中出现次数最多的预设数量个颜色参数值中、出现次数少的第一颜色参数值,即选取出待识别图片中字符对应的颜色参数值。如图2所示,图中的每种填充分别表示不同的颜色,其中颜色201对应的填充部分所占的面积最大,也就是背景部分对应的颜色。图中的文字的颜色为颜色202,这样,在图2中,出现次数最多的颜色即为颜色201和颜色202。在颜色201和颜色202中,颜色202出现的次数又较少,因此可以将第一颜色参数值确定为颜色201。
步骤103,对第一颜色参数值对应的像素点重新赋值为第一数值,对所有颜色参数值中除第一颜色参数值对应的像素点重新赋值为第二数值。
确定出待识别图片中所有像素点对应的颜色参数值,具体地,可以是待识别图片中所有像素点的RGB值,并选取出待识别图片中字符对应的颜色参数值后,如此是为了将待识别图片中的字符部分与除字符部分之外的其他部分区分开。本发明实施例一种可选的实施方式中,根据每个像素点对应的颜色参数值重新对像素点进行进行赋值,从而实现将字符部分与除字符之外的其他部分区分开的目的。
具体地,对第一颜色参数值对应的像素点重新赋值为第一数值,对所有颜色参数值中除第一颜色参数值对应的像素点重新赋值为第二数值,如此完成,将字符对应的像素点重新赋值为第一数值,除字符之外的其他部分对应的像素点重新赋值为第二数值,其中,第一数值和第二数值可以是0、1等。例如对图2进行重新赋值处理,对图2中颜色202对应的像素点重新赋值为第一数值:1,对除颜色202之外的其他部分对应的像素点重新赋值为第二数值:0,对图2进行上述处理之后,得到如图3所示的效果,如此能够实现将待识别图片中的数字与其他部分区分开。
步骤104,根据待识别图片中所有像素点对应的第一数值和第二数值的分布,分割提取待识别图片中所有字符中每个字符对应的字符图片,并获得每个字符图片中像素点对应的第一数值和第二数值组成的数组。
对待识别图片中所有像素点进行重新赋值后,在待识别图片中字符部分对应的像素点与除字符之外的其他部分对应的像素点明显区分开来,且分别对应于第一数值和第二数值,如此通过第一数值和第二数值的分布,则可以分割提取待识别图片中所有字符中每个字符对应的字符图片。同时,还可以确定每个字符图片中所有像素点对应的第一数值和第二数值组成的数组。
在本发明实施例一种可选的实现方式中,为了计算简便且方便理解,第一数值为1、第二数值为0,最终得到的每个字符图片中所有像素点对应的数组为0和1组成的数组。
根据待识别图片中所有像素点对应的第一数值和第二数值的分布,分割提取待识别图片中所有字符中每个字符对应的字符图片,包括:
分别按照行、列顺序删除数组中的全0部分,得到待识别图片中所有字符中每个字符对应的字符图片,其中,全0部分表示数组中全0的行或列。
具体地,待识别图片中所有像素点对应的第一数值和第二数值的分布可以看作是第一数值和第二数值组成的数组,其中,第一数值表示字符对应的像素点对应的值,第二数值表示除字符之外的其他部分对应的像素点对应的值。通过在该数组中查找全是第二数值的行、列,在本发明实施例一种可选的实施方式中,即通过查找全是0的行、列,分割提取待识别图片中所有字符中每个字符对应的字符图片。如图4所示,首先,删除第一列、第二列、第六列、第十列,得到竖线401和402组成的第一部分,和竖线403和404组成的第二部分;然后删除第一部分中的第一行、第六行,得到竖线401和402,以及横线405和406组成的第一区域,删除第二部分中的第一行、第二行、第六行,得到竖线403和404,以及横线407和408组成的第二区域,其中,第一区域为一个字符对应的部分、第二区域为另一个字符对应的部分,按照第一区域对应的像素点和第二区域对应的像素点,则可以将两个字符分割开。如此对整个待识别图片进行处理,分割提取待识别图片中所有字符中每个字符对应的字符图片。
步骤105,将每个字符图片对应的数组转换为每个字符图片对应的字符串。
上述步骤确定出的数组是按像素点的分布对应的数组,而预先存储的模板中是以字符串的形式,所以为了能够与模板进行匹配,所以需要将每个字符图片对应的数组转换为对应的字符串,例如,得到字符图片的数组为可以按行将数组转换为一维向量,如此将数组转换为字符串{111111000110001000111111}。
步骤106,将每个字符图片对应的字符串与预先存储的模板字符串进行比对,根据对比的相似度,识别出待识别图片中的字符。
预先存储的模板字符串可以存储在数据库中,具体地可以存储字符与字符对应的模板字符串的对应关系,确定出一个模板字符串后即可以唯一确定出一个字符。
将上述确定出的每个字符图片对应的字符串与预先存储的所有模板字符串分别进行对比,并根据比对的相似度,识别出待识别图片中的字符。具体地,将每个字符图片对应的字符串与预先存储的所有模板字符串分别进行对比,分别确定每个字符图片对应的字符串与预先存储的每一个模板字符串对比的相似度,选取出相似度最高时对应的模板字符串,例如,相似度最高时对应的模板字符串,可以为与字符图片中相同的字符数量大于预设数量阈值的模板字符串;然后,查找预先存储的字符与字符对应的模板字符串的对应关系,找出相似度最高时对应的模板字符串对应的字符,如此确定该比对相似度最高时对应的模板字符串对应的字符为每个字符图片对应的字符。例如,字符图片对应的字符串为{111111000110001000111111},确定出相似度最高时对应的字符串为{111111000100001000111111},而相似度最高时对应的字符串{111111000100001000111111}对应的字符为2,则识别出字符图片对应的字符为2。需要说明的是,这里所说的待识别图片中的字符可以是数字、字母等。
本发明实施例一种可选的实施方式中,第一数值为1,第二数值为0,模板字符串表示为0和1组成的字符串。
分别将每个字符图片对应的字符串与所有的模板字符串进行比对,包括:
分别将每个字符图片对应的0和1组成的字符串、与所有的模板字符串进行比对。
本发明实施例提供的图片识别方法,可以通过所有像素点的颜色参数值中出现次数最多的预设数量个颜色参数值中、出现次数少的颜色参数值,对待识别图片中的像素点重新赋值,进而根据重新赋值后的的待识别图片中所有像素点对应的数值的分布,分割提取待识别图片中所有字符中每个字符对应的字符图片,并获得每个字符图片中像素点对应的数组;将每个字符图片对应的数组转换为每个字符图片对应的字符串;将每个字符图片对应的字符串与预先存储的模板字符串进行比对,根据对比的相似度,识别出待识别图片中的字符。通过本发明实施例提供的图片识别方法,能够实现在背景与字符颜色接近的图片中,准确识别出图片中的字符。
为了能够识别待识别图片中字符大小不统一的字符,本发明实施例一种可选的实施方式中,预先存储的模板字符串可以是根据标准大小的模板字符图片确定的。如此,在将每个字符图片对应的字符串与预先存储的模板字符串进行比对,之前,可以对分割提取待识别图片中所有字符中每个字符对应的字符图片进行缩放,使得每个字符图片的尺寸与预先存储的模板字符串对应的模板字符图片的尺寸相同。
另外,实际的应用过程中,待识别图片可以是多种类型的图片,例如后缀为.jpg、.png、.jpeg等格式。而不同类型的待识别图片处理的方式也有所不同。本发明实施例一种可选的实施方式中,在确定待识别图片中所有像素点的颜色参数值之前,还可以确定待识别图片的图片类型。如此可以针对不同类型的待识别图片进行处理。具体地,确定待识别图片中所有像素点的颜色参数值,包括:
根据待识别图片的图片类型确定图片类型对应的解析函数;
根据不同图片类型对应的不同解析函数,确定不同图片类型的待识别图片的中所有像素点的颜色参数值,其中,颜色参数值包括RGB值。
下面通过具体的示例对本发明实施例提供的图片识别方法进行详细说明,如图5所示。下面描述的过程是在PHP(Hypertext Preprocessor,超文本处理语言)的基础上进行的。
首先,使用exif_imagetype函数判断待识别图片类型,每种图片类型都有相对应的解析函数,判断待识别图片的类型对应的可以确定待识别图像的类型对应的解析函数,例如,获取待识别图片长、宽的解析函数。
然后,使用getimagesize获取待识别图片的长和宽;使用imagecreatefrompng将输入的待识别图片图片,转换成php中的基本画布,赋值$rgb;以长、宽为坐标单位,定位待识别图片中每个像素点;使用imagecolorat将$rgb中的每个像素点的索引提取出来,再使用imagecolorsforindex分别分离出它的RGB的值。作为子项数组,储存入总数组$imgcolor;对总数组$imgcolor内的数值进行比较,筛选出最多的两种颜色,并确定两者中颜色最深的;将总数组$imgcolor中代表颜色最深的子数组中的值重新赋值为1,除代表颜色最深的子数组之外的其余子数组中的值赋值成0。
接着,删除待识别图片横向上的多余空白处。具体地,检查重新赋值后的数组$imgcolor并将其中都是0的数组剔除出来,并记录下剔除完空白数组的值到$y中,与全部剔除完空白数组的$imgcolor的数组的个数记录在$yl中;删除纵向上的多余空白图片。具体地,将数组的键名进行对调,之后再次去除$imgcolor中的全0数组,并且在每次去除时将到达非全0数组时的键名记录下来赋值给$x,非全0数组总个数赋值给$xl。如此重复,这样与分别上面$y,$yl组合成数组$imgblock1,$imgblock2……。其中包含的信息有待识别图片中字符的起始点(x,y)与字块的长宽。并且得到每个字符对应的数组$imgzi1、$imgzi2、……等。
再者,利用获取的$imgblock1,$imgblock2……,将待识别图片进行分割得到每个字符单独对应的字符图片,并储存该字符图片。
然后,分别识别每个字符图片中的字符,将字符图片的宽缩放到标准150。按照上述的过程得到字符图片对应的0、1数组;将该0、1数组装换成字符串。
最后,将该字符串与预先存储的标准数字图片在宽150情况下对应的模板字符串进行对比,选取其中相似度最高时模板字符串对应的字符为识别出的该字符图片的结果。如此对每个字符图片进行上述处理,识别出待识别图片中的所有字符。
本发明实施例提供了一种图片识别装置,参照图6,对本发明实施例提供的图片识别装置进行详细说明,包括:
确定模块601,用于确定待识别图片中所有像素点的颜色参数值。
选取模块602,用于选取所有像素点的颜色参数值中出现次数最多的预设数量个颜色参数值中、出现次数少的第一颜色参数值。
赋值模块603,用于对第一颜色参数值对应的像素点重新赋值为第一数值,对所有颜色参数值中除第一颜色参数值对应的像素点重新赋值为第二数值。
分割模块604,用于根据待识别图片中所有像素点对应的第一数值和第二数值的分布,分割提取待识别图片中所有字符中每个字符对应的字符图片,并获得每个字符图片中像素点对应的第一数值和第二数值组成的数组。
转换模块605,用于将每个字符图片对应的数组转换为每个字符图片对应的字符串。
识别模块606,用于将每个字符图片对应的字符串与预先存储的模板字符串进行比对,根据对比的相似度,识别出待识别图片中的字符。
本发明实施例提供的图片识别装置,可以通过所有像素点的颜色参数值中出现次数最多的预设数量个颜色参数值中、出现次数少的颜色参数值,对待识别图片中的像素点重新赋值,进而根据重新赋值后的的待识别图片中所有像素点对应的数值的分布,分割提取待识别图片中所有字符中每个字符对应的字符图片,并获得每个字符图片中像素点对应的数组;将每个字符图片对应的数组转换为每个字符图片对应的字符串;将每个字符图片对应的字符串与预先存储的模板字符串进行比对,根据对比的相似度,识别出待识别图片中的字符。通过本发明实施例提供的图片识别装置,能够实现在背景与字符颜色接近的图片中,准确识别出图片中的字符。
可选的,该装置还包括:缩放模块,用于缩放每个字符图片的尺寸,使得每个字符图片的尺寸与预先存储的模板字符串对应的模板字符图片的尺寸相同。
可选的,识别模块606包括:
比对子模块,用于分别将每个字符图片对应的字符串与所有的模板字符串进行比对。
确定子模块,用于确定比对相似度最高时对应的模板字符串对应的字符为每个字符图片对应的字符。
可选的,第一数值为1,第二数值为0,模板字符串表示为0和1组成的字符串;
比对子模块具体用于分别将每个字符图片对应的0和1组成的字符串、与所有的模板字符串进行比对。
可选的,第一数值为1,第二数值为0,数组为0和1组成的数组;
分割模块604具体用于分别按照行、列顺序删除数组中的全0部分,得到待识别图片中所有字符中每个字符对应的字符图片,其中,全0部分表示数组中全0的行或列。
可选的,该装置还用于确定待识别图片的图片类型。
确定模块601具体用于根据待识别图片的图片类型确定图片类型对应的解析函数;根据不同图片类型对应的不同解析函数,确定不同图片类型的待识别图片的中所有像素点的颜色参数值,其中,颜色参数值包括RGB值。
需要说明的是,本发明实施例的图片识别装置是应用上述图片识别方法的装置,则上述图片识别方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
本发明实施例还提供了一种电子设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信。
存储器703,用于存放计算机程序;
处理器701,用于执行存储器703上所存放的程序时,实现如下步骤:
确定待识别图片中所有像素点的颜色参数值;
选取所有像素点的颜色参数值中出现次数最多的预设数量个颜色参数值中、出现次数少的第一颜色参数值;
对第一颜色参数值对应的像素点重新赋值为第一数值,对所有颜色参数值中除第一颜色参数值对应的像素点重新赋值为第二数值;
根据待识别图片中所有像素点对应的第一数值和第二数值的分布,分割提取待识别图片中所有字符中每个字符对应的字符图片,并获得每个字符图片中像素点对应的第一数值和第二数值组成的数组;
将每个字符图片对应的数组转换为每个字符图片对应的字符串;
将每个字符图片对应的字符串与预先存储的模板字符串进行比对,根据对比的相似度,识别出待识别图片中的字符。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例提供的电子设备,可以通过所有像素点的颜色参数值中出现次数最多的预设数量个颜色参数值中、出现次数少的颜色参数值,对待识别图片中的像素点重新赋值,进而根据重新赋值后的的待识别图片中所有像素点对应的数值的分布,分割提取待识别图片中所有字符中每个字符对应的字符图片,并获得每个字符图片中像素点对应的数组;将每个字符图片对应的数组转换为每个字符图片对应的字符串;将每个字符图片对应的字符串与预先存储的模板字符串进行比对,根据对比的相似度,识别出待识别图片中的字符。通过本发明实施例提供的电子设备,能够实现在背景与字符颜色接近的图片中,准确识别出图片中的字符。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现如下方法步骤:
确定待识别图片中所有像素点的颜色参数值;
选取所有像素点的颜色参数值中出现次数最多的预设数量个颜色参数值中、出现次数少的第一颜色参数值;
对第一颜色参数值对应的像素点重新赋值为第一数值,对所有颜色参数值中除第一颜色参数值对应的像素点重新赋值为第二数值;
根据待识别图片中所有像素点对应的第一数值和第二数值的分布,分割提取待识别图片中所有字符中每个字符对应的字符图片,并获得每个字符图片中像素点对应的第一数值和第二数值组成的数组;
将每个字符图片对应的数组转换为每个字符图片对应的字符串;
将每个字符图片对应的字符串与预先存储的模板字符串进行比对,根据对比的相似度,识别出待识别图片中的字符。
本发明实施例提供的计算机可读存储介质,可以通过所有像素点的颜色参数值中出现次数最多的预设数量个颜色参数值中、出现次数少的颜色参数值,对待识别图片中的像素点重新赋值,进而根据重新赋值后的的待识别图片中所有像素点对应的数值的分布,分割提取待识别图片中所有字符中每个字符对应的字符图片,并获得每个字符图片中像素点对应的数组;将每个字符图片对应的数组转换为每个字符图片对应的字符串;将每个字符图片对应的字符串与预先存储的模板字符串进行比对,根据对比的相似度,识别出待识别图片中的字符。通过本发明实施例提供的计算机可读存储介质,能够实现在背景与字符颜色接近的图片中,准确识别出图片中的字符。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (10)
1.一种图片识别方法,其特征在于,包括:
确定待识别图片中所有像素点的颜色参数值;
选取所有像素点的颜色参数值中出现次数最多的预设数量个颜色参数值中、出现次数少的第一颜色参数值;
对所述第一颜色参数值对应的像素点重新赋值为第一数值,对所有颜色参数值中除所述第一颜色参数值对应的像素点重新赋值为第二数值;
根据所述待识别图片中所有像素点对应的所述第一数值和所述第二数值的分布,分割提取所述待识别图片中所有字符中每个字符对应的字符图片,并获得每个字符图片中像素点对应的所述第一数值和所述第二数值组成的数组;
将每个字符图片对应的数组转换为每个字符图片对应的字符串;
将每个字符图片对应的字符串与预先存储的模板字符串进行比对,根据对比的相似度,识别出所述待识别图片中的字符。
2.根据权利要求1所述的方法,其特征在于,在所述将每个字符图片对应的字符串与预先存储的模板字符串进行比对,之前,所述方法还包括:
缩放每个字符图片的尺寸,使得每个字符图片的尺寸与所述预先存储的模板字符串对应的模板字符图片的尺寸相同。
3.根据权利要求1或2所述的方法,其特征在于,所述将每个字符图片对应的字符串与预先存储的模板字符串进行比对,根据对比的相似度,识别出所述待识别图片中的字符,包括:
分别将每个字符图片对应的字符串与所有的模板字符串进行比对;
确定比对相似度最高时对应的模板字符串对应的字符为每个字符图片对应的字符。
4.根据权利要求3所述的方法,其特征在于,所述第一数值为1,所述第二数值为0,所述模板字符串表示为0和1组成的字符串;
所述分别将每个字符图片对应的字符串与所有的模板字符串进行比对,包括:
分别将每个字符图片对应的0和1组成的字符串、与所有的所述模板字符串进行比对。
5.根据权利要求1或2所述的方法,其特征在于,所述第一数值为1,所述第二数值为0,所述数组为0和1组成的数组;
所述根据所述待识别图片中所有像素点对应的所述第一数值和所述第二数值的分布,分割提取所述待识别图片中所有字符中每个字符对应的字符图片,包括:
分别按照行、列顺序删除所述数组中的全0部分,得到所述待识别图片中所有字符中每个字符对应的字符图片,其中,全0部分表示所述数组中全0的行或列。
6.根据权利要求1或2所述的方法,其特征在于,在所述确定待识别图片中所有像素点的颜色参数值之前,所述方法还包括:
确定所述待识别图片的图片类型;
所述确定待识别图片中所有像素点的颜色参数值,包括:
根据所述待识别图片的图片类型确定所述图片类型对应的解析函数;
根据不同图片类型对应的不同解析函数,确定不同图片类型的所述待识别图片的中所有像素点的所述颜色参数值,其中,所述颜色参数值包括RGB值。
7.一种图片识别装置,其特征在于,包括:
确定模块,用于确定待识别图片中所有像素点的颜色参数值;
选取模块,用于选取所有像素点的颜色参数值中出现次数最多的预设数量个颜色参数值中、出现次数少的第一颜色参数值;
赋值模块,用于对所述第一颜色参数值对应的像素点重新赋值为第一数值,对所有颜色参数值中除所述第一颜色参数值对应的像素点重新赋值为第二数值;
分割模块,用于根据所述待识别图片中所有像素点对应的所述第一数值和所述第二数值的分布,分割提取所述待识别图片中所有字符中每个字符对应的字符图片,并获得每个字符图片中像素点对应的所述第一数值和所述第二数值组成的数组;
转换模块,用于将每个字符图片对应的数组转换为每个字符图片对应的字符串;
识别模块,用于将每个字符图片对应的字符串与预先存储的模板字符串进行比对,根据对比的相似度,识别出所述待识别图片中的字符。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
缩放模块,用于缩放每个字符图片的尺寸,使得每个字符图片的尺寸与所述预先存储的模板字符串对应的模板字符图片的尺寸相同。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710533242.0A CN107239784A (zh) | 2017-07-03 | 2017-07-03 | 一种图片识别方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710533242.0A CN107239784A (zh) | 2017-07-03 | 2017-07-03 | 一种图片识别方法、装置、电子设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107239784A true CN107239784A (zh) | 2017-10-10 |
Family
ID=59990382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710533242.0A Pending CN107239784A (zh) | 2017-07-03 | 2017-07-03 | 一种图片识别方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107239784A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108875727A (zh) * | 2018-06-29 | 2018-11-23 | 龙马智芯(珠海横琴)科技有限公司 | 图文标识的检测方法及装置、存储介质、处理器 |
CN109063076A (zh) * | 2018-07-24 | 2018-12-21 | 维沃移动通信有限公司 | 一种图片生成方法及移动终端 |
CN109933748A (zh) * | 2019-03-21 | 2019-06-25 | 武汉轻工大学 | 椭球面方程的模型识别方法、装置、终端设备及可读存储介质 |
CN110717483A (zh) * | 2019-09-19 | 2020-01-21 | 浙江善政科技有限公司 | 网络图像识别处理方法,计算机可读存储介质和移动终端 |
CN111091128A (zh) * | 2019-12-18 | 2020-05-01 | 北京数衍科技有限公司 | 字符图片分类方法、装置和电子设备 |
CN111444904A (zh) * | 2020-03-23 | 2020-07-24 | Oppo广东移动通信有限公司 | 内容识别方法、装置以及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120087587A1 (en) * | 2008-11-12 | 2012-04-12 | Olga Kacher | Binarizing an Image |
CN102750530A (zh) * | 2012-05-31 | 2012-10-24 | 信帧电子技术(北京)有限公司 | 一种字符识别方法及装置 |
CN103034855A (zh) * | 2012-12-05 | 2013-04-10 | 曙光信息产业(北京)有限公司 | 在图像中识别字符区域的方法 |
CN105160304A (zh) * | 2015-08-10 | 2015-12-16 | 中山大学 | 一种基于机器视觉的标志文字识别方法及其装置 |
CN106203435A (zh) * | 2016-07-13 | 2016-12-07 | 广州安望信息科技有限公司 | 图文识别方法及其装置 |
CN106599889A (zh) * | 2016-12-17 | 2017-04-26 | 北京小米移动软件有限公司 | 一种识别字符的方法和装置 |
-
2017
- 2017-07-03 CN CN201710533242.0A patent/CN107239784A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120087587A1 (en) * | 2008-11-12 | 2012-04-12 | Olga Kacher | Binarizing an Image |
CN102750530A (zh) * | 2012-05-31 | 2012-10-24 | 信帧电子技术(北京)有限公司 | 一种字符识别方法及装置 |
CN103034855A (zh) * | 2012-12-05 | 2013-04-10 | 曙光信息产业(北京)有限公司 | 在图像中识别字符区域的方法 |
CN105160304A (zh) * | 2015-08-10 | 2015-12-16 | 中山大学 | 一种基于机器视觉的标志文字识别方法及其装置 |
CN106203435A (zh) * | 2016-07-13 | 2016-12-07 | 广州安望信息科技有限公司 | 图文识别方法及其装置 |
CN106599889A (zh) * | 2016-12-17 | 2017-04-26 | 北京小米移动软件有限公司 | 一种识别字符的方法和装置 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108875727A (zh) * | 2018-06-29 | 2018-11-23 | 龙马智芯(珠海横琴)科技有限公司 | 图文标识的检测方法及装置、存储介质、处理器 |
CN108875727B (zh) * | 2018-06-29 | 2019-08-30 | 龙马智芯(珠海横琴)科技有限公司 | 图文标识的检测方法及装置、存储介质、处理器 |
CN109063076A (zh) * | 2018-07-24 | 2018-12-21 | 维沃移动通信有限公司 | 一种图片生成方法及移动终端 |
CN109933748A (zh) * | 2019-03-21 | 2019-06-25 | 武汉轻工大学 | 椭球面方程的模型识别方法、装置、终端设备及可读存储介质 |
CN109933748B (zh) * | 2019-03-21 | 2023-05-12 | 武汉轻工大学 | 椭球面方程的模型识别方法、装置、终端设备及可读存储介质 |
CN110717483A (zh) * | 2019-09-19 | 2020-01-21 | 浙江善政科技有限公司 | 网络图像识别处理方法,计算机可读存储介质和移动终端 |
CN110717483B (zh) * | 2019-09-19 | 2023-04-18 | 浙江善政科技有限公司 | 网络图像识别处理方法,计算机可读存储介质和移动终端 |
CN111091128A (zh) * | 2019-12-18 | 2020-05-01 | 北京数衍科技有限公司 | 字符图片分类方法、装置和电子设备 |
CN111091128B (zh) * | 2019-12-18 | 2023-09-22 | 北京数衍科技有限公司 | 字符图片分类方法、装置和电子设备 |
CN111444904A (zh) * | 2020-03-23 | 2020-07-24 | Oppo广东移动通信有限公司 | 内容识别方法、装置以及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107239784A (zh) | 一种图片识别方法、装置、电子设备及可读存储介质 | |
CN107358596A (zh) | 一种基于图像的车辆定损方法、装置、电子设备及系统 | |
CN105528614B (zh) | 一种漫画图像版面的识别方法和自动识别系统 | |
CN107590447A (zh) | 一种文字标题识别方法及装置 | |
CN108052653A (zh) | 图像特征描述符的获取方法、装置、存储介质、终端及图像检索方法 | |
CN102880726B (zh) | 一种图像过滤方法及系统 | |
CN104899586B (zh) | 对图像中包含的文字内容进行识别方法及装置 | |
CN106650615B (zh) | 一种图像处理方法及终端 | |
CN105426899B (zh) | 车辆识别方法、装置和客户端 | |
CN104778238B (zh) | 一种视频显著性的分析方法及装置 | |
CN105260428A (zh) | 图片处理方法和装置 | |
CN109903210B (zh) | 水印的去除方法、装置和服务器 | |
CN112287912A (zh) | 基于深度学习的车道线检测方法以及装置 | |
CN113012059A (zh) | 一种文字图像的阴影消除方法、装置及电子设备 | |
CN111598076B (zh) | 一种标签图像中日期检测处理方法及装置 | |
CN110209630A (zh) | Dxf文件信息处理方法、装置、计算机设备和存储介质 | |
CN108830275A (zh) | 点阵字符、点阵数字的识别方法及装置 | |
CN109447117A (zh) | 双层车牌识别方法、装置、计算机设备及存储介质 | |
CN107657251A (zh) | 确定身份证件显示表面的设备及方法,图像识别方法 | |
CN113920038A (zh) | 一种割轮廓提取方法、装置系统及介质 | |
CN108648189A (zh) | 图像模糊检测方法、装置、计算设备及可读存储介质 | |
CN110490250A (zh) | 一种人工智能训练集的获取方法及装置 | |
CN105354228A (zh) | 相似图搜索方法及装置 | |
CN108877030B (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN110210467A (zh) | 一种文本图像的公式定位方法、图像处理装置、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20171010 |
|
WD01 | Invention patent application deemed withdrawn after publication |