CN108197644A - 一种图像识别方法和装置 - Google Patents
一种图像识别方法和装置 Download PDFInfo
- Publication number
- CN108197644A CN108197644A CN201711452323.4A CN201711452323A CN108197644A CN 108197644 A CN108197644 A CN 108197644A CN 201711452323 A CN201711452323 A CN 201711452323A CN 108197644 A CN108197644 A CN 108197644A
- Authority
- CN
- China
- Prior art keywords
- image
- images
- recognized
- characteristic information
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/446—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering using Haar-like filters, e.g. using integral image techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种图像识别方法和装置,其中方法包括:获取待识别图像;对待识别图像进行预处理;根据预处理后的待识别图像中的特征信息进行分类,得到待识别图像的图像类别;通过将特征信息与图像类别相对应的数据库中模板图像的特征信息进行比对,确定待识别图像对应的识别结果,其中,不同的图像类别分别对应不同的数据库。能够快速精准的提取图像特征,使得根据该特征信息识别出的图像内容更加准确,即使对于特征点不明显的简单图像也能够快速准确的识别出来,有效的提高了图像的识别率。
Description
技术领域
本发明涉及图像处理领域,尤其是涉及到一种图像识别方法和装置。
背景技术
随着科技的飞速发展,图像识别技术越来越成熟,目前在很多领域都能应用到图像识别技术,例如,对人脸图像进行识别验证,或者对用户的签名字迹进行验证等都应用到了图像识别技术。
现在的图像识别技术,主要是对图像中明显的色彩和矩角位置进行记录,然后根据记录的色彩和矩角位置对图像进行识别,例如现有市场上的民用级增强现实(AugmentedReality,AR)产品和图像识别产品。这种图像识别方式,适用于色彩和矩角明显的复杂图像,识别的准确率会比较高。
但是,对于色彩和矩角不明显的简单图像,由于图像中的识别点太少,利用色彩和矩角位置来进行识别,会使识别的准确率下降,影响用户的使用。
发明内容
本发明实施例提供了一种图像识别方法和装置,解决了目前的图像识别技术在对简单图像进行识别时,识别的准确率较低的问题。
依据本申请的第一方面,提供了一种图像识别方法,所述方法包括:
获取待识别图像;
对所述待识别图像进行预处理;
根据预处理后的待识别图像中的特征信息进行分类,得到所述待识别图像的图像类别;
通过将所述特征信息与所述图像类别相对应的数据库中模板图像的特征信息进行比对,确定所述待识别图像对应的识别结果,其中,不同的图像类别分别对应不同的数据库。
依据本申请的第二方面,提供了一种图像识别装置,所述装置包括:
获取单元,用于获取待识别图像;
预处理单元,用于对所述待识别图像进行预处理;
分类单元,用于根据预处理后的待识别图像中的特征信息进行分类,得到所述待识别图像的图像类别;
识别单元,用于通过将所述特征信息与所述图像类别相对应的数据库中模板图像的特征信息进行比对,确定所述待识别图像对应的识别结果,其中,不同的图像类别分别对应不同的数据库。
依据本申请的第三方面,提供了一种存储设备,其上存储有计算机程序,所述程序被处理器执行时实现第一方面所述的图像识别方法。
依据本申请的第四方面,提供了一种图像识别装置,所述装置包括存储设备和处理器,
所述存储设备,用于存储计算机程序;
所述处理器,用于执行所述计算机程序以实现第一方面所述的图像识别方法。
借由上述技术方案,本申请提供的一种图像识别方法和装置,将待识别图像进行预处理,将干扰因素去除,使待识别图像变成一副清晰的点线图,以便提取待识别图像中的特征信息,并根据该特征信息确定待识别图像的图像类别,从该图像类别对应的数据中获取相应的模板图像的特征信息,将两个特征信息进行匹配,若匹配成功,证明待识别图像与模板图像相近,可以将模板图像的内容赋予待识别图像,进而完成对待识别图像的识别过程。通过上述方案,与目前现在的图像识别技术相比,能够快速精准的提取图像特征,使得根据该特征信息识别出的图像内容更加准确,即使对于特征点不明显的简单图像也能够快速准确的识别出来,有效的提高了图像的识别率。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本申请的图像识别方法的一个实施例的流程图;
图2为复杂图像的实例示意图;
图3为简单图像的实例示意图;
图4为本申请的图像识别装置的一个实施例的结构框图;
图5为本申请的图像识别装置的实体结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本申请实施例提供了一种图像识别方法,能够通过对图像进行预处理和分类之后,将图像与相应的模板图像进行对比,使得根据对比得到的图像识别结果,能够更加准确。
如图1所示,本实施例的方法的步骤包括:
步骤101,获取待识别图像。
用户可以从图库中直接调取待识别图像,或者利用相机直接拍摄待识别图像。
步骤102,对待识别图像进行预处理。
为了能够更好更准确的识别待识别图像中的内容,需要先将待识别图像进行预处理。预处理的目的是对待识别图像进行去噪处理,使待识别图像变成一副清晰的点线图。以便将待识别图像中能够用来进行图像识别的一些特征信息提取出来。
步骤103,根据预处理后的待识别图像中的特征信息进行分类,得到待识别图像的图像类别。
在上述技术方案中,将能够充分表示待识别图像唯一性的特征用数值的形式表示出来。其中唯一性的特征可以是某种内容对应的图形形状、色彩或者分布位置等。有效的将待识别图像的能够真正表示图像内容的特征信息提取出来,而将其他会干扰图像识别的特征过滤出去。
不同的特征信息对应不同的图像类别,图像类别可以按照下列任意一种或多种方式进行划分:数字、文字、符号、动物、植物、物品。例如,按照数字划分时,可以将图像类别分为“0”至“9”十种类别。
步骤104,通过将特征信息与图像类别相对应的数据库中模板图像的特征信息进行比对,确定待识别图像对应的识别结果,其中,不同的图像类别分别对应不同的数据库。
在上述技术方案中,根据待识别图像的图像类别查找对应的数据库,该数据库中保存有一个或多个模板图像的特征信息。将待识别图像的特征信息与数据库中的所有模板图像的特征信息进行一一比对,当待识别图像的特征信息与任意一个模板图像的特征信息的相似度超过一定阈值(例如,80%)时,则确定该待识别图像中的内容为该模板图像对应的内容,进而完成对待识别图像的识别过程。
通过上述方案,能够快速精准的提取图像特征,使得根据该特征信息识别出的图像内容更加准确,即使对于特征点不明显的简单图像也能够快速准确的识别出来,有效的提高了图像的识别率。
在具体实施例中,步骤104具体包括:
步骤1041,提取预处理后的待识别图像中特征信息包含的输入细节点特征集合;及提取与图像类别相对应的数据库中模板图像的特征信息包含的模板细节点特征集合。
其中,对应的细节点特征集合为对应的特征信息中各个像素的色彩进行模数转化后得到的数字序列。
步骤1042,将输入细节点特征集合与模板细节点特征集合进行比对。
即,将输入细节点特征集合对应的数字序列与模板细节点特征集合对应的数字序列进行比对。
步骤1043,统计输入细节点特征集合与模板细节点特征集合中,相匹配的细节点的数目,并计算匹配分值。
在上述技术方案中,根据相匹配的细节点的数目占总的细节点数目的比例计算匹配分值;或者根据每个细节点的匹配程度乘以相应的权重值,并将所有匹配细节点的对应权重值进行累加计算匹配分值。
步骤1044,将匹配分值大于等于预定阈值的模板图像,确定为待识别图像对应的识别结果。
在上述技术方案中,当对应的数据库中有至少一个模板图像时,计算待识别图像与每个模板图像的匹配分值,并提取匹配分值大于等于预定阈值的模板图像对应的内容,则识别成功,并将该内容作为识别出的结果;若计算出的匹配分值均小于预定阈值,则识别失败。
在具体实施例中,步骤102具体包括:
步骤1021,计算待识别图像的方向图。
步骤1022,根据方向图,对待识别图像依次进行分割处理、图像增强处理、二值化处理和细化处理。
在上述技术方案中,方向图具有真实性,并且能够以简化的形式直观的反应图像中最基本的形态特征,因此在对图像进行进一步处理之前先计算待识别图像的方向图。然后再根据该方向图进行分割处理,将待识别图像中的非特征部分分割出去,对图像中的特征部分进行图形增强处理。处理完成后将待识别图像进行二值化处理,将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。再然后选出图像纹线的边界点并删除使得整个图像的线条比较清晰进而完成细化处理的过程。
在具体实施例中,步骤1021具体包括:
步骤10211,将待识别图像拆分成多个图像片段。例如,将图像分为16*16的非重叠的图像片段。
步骤10212,计算每个图像片段中各个像素点对应的梯度值,剃度值包括横轴梯度和纵轴梯度。
在上述技术方案中,根据每个图像片段建立平面坐标图,利用图像边缘检测算法(例如sobel算子)计算图像片段中的各个像素点对应的横轴梯度和纵轴梯度(即,x方向梯度和y方向梯度),计算公式如下:
其中,dx(i,j)为x方向梯度,dy(i,j)为y方向梯度,Sx和Sy均为sobel算子,f(i,j)表示图像片段中各像素的灰度值。
步骤10213,根据梯度值计算每个图像片段的方向图。具体计算公式如下:
其中θ(i,j)=π/2,Vx(i,j)=0,w表示图像片段的宽度。
例如,w=16,得到θ后再将其量化为8个方向,进而得到每个图像片段的方向图。
通过上述技术方案将每个图像片段转化成相应的方向图,利用方向图代表每个图像片段的形态特征,进而方便图像片段的进一步处理以及特征提取。
在具体实施例中,步骤1022具体包括:
步骤10221,将待识别图像的背景区域分割出去,保留前景区域。
步骤10222,将前景区域的模糊区域分割出去,保留清晰区域。
步骤10223,将清晰区域中不可恢复区域分割出去,保留可恢复区域。
传统的图像分割方法包括灰度方差法分割和局部灰度差法等,但是传统的图像分割方法对于图像的分割效果不够准确。以及利用方向图进行图像分割,由于方向图的分割效果依赖于所求图像的方向图的可靠性,而对图像对比度的高低并不敏感,对于单一灰度区域的分割难以达到理想的分割效果。也可以使用基于D-S(Dempster/Shafer)证据理论的图像分割方法进行图像分割,但是只利用这一种方式进行图像分割,分割的效果也不够理想。因此本申请采用多种方法结合的方式对待识别图像进行图像分割。
在上述技术方案中,将待识别图像分为:背景区域、清晰区域、模糊区域、不可恢复区域和可恢复区域。利用灰度方差法、局部灰度差法、方向图分割法和基于D-S(Dempster/Shafer)证据理论的图像分割法中的至少一种来分别执行上述步骤10221、步骤10222、步骤10223,进而将待识别图像中的背景区域、模糊区域和不可恢复区域等无效信息区域分割出去,进而保证后期能够快速的进一步处理。
在具体实施例中,步骤1022具体还包括:
步骤10224,利用线性滤波器对分割处理后的待识别图像进行滤波图像增强处理;和/或利用傅里叶滤波算法,对分割处理后的待识别图像进行低质量图像增强处理。
在上述技术方案中,可以单一利用线性滤波器或者傅里叶滤波算法对图像进行增强处理,也可以利用上述两种方式来对图像进行增强处理。
其中,利用线性滤波器(基于Gabor函数的滤波器)对分割处理后的待识别图像进行滤波图像增强处理,具体为:
Gabor滤波增强的基本出发点是基于图像的数学模型,具体公式如下:
其中δx表示x轴方向的标准差,δy表示y轴方向的标准差,G(x,y)表示Gabor函数。
要将Gabor滤波器用于图像的处理,需要将偶Gabor函数改变为数字滤波器,这样将Gabor函数的实部作为模板得到的滤波器更真实接近图像的特征。
公式为:其中,v表示Gabor滤波的波长,u表示Gabor核函数的方向。
通过上述技术方案,能够综合考虑图像的方向特性和频率特征,这样整体滤波效果比较好,进而提高图像增强处理的效果。
在具体实施例中,步骤1022具体还包括:
步骤10225,获取方向图的动态阈值,根据动态阈值对图像增强处理后的待识别图像进行二值化处理。
步骤10226,利用细化算法对二值化处理后的待识别图像进行细化处理。
传统的二值化算法有静态算法和动态算法。动态算法比静态算法的效果更好,静态算法对质量差的图像区域会产生大量的伪特征点,动态算法能够在一定程度上弥补静态算法的这种缺陷,但动态算法会引入更多的噪声,增加图像识别的难度。
因此,本申请直接从待识别图像的方向图中获取动态阈值,进而根据该动态阈值完成二值化处理。然后在对二值化处理后的待识别图像进行细化处理,找出图像纹线的边界点并逐步删除,使得图像更加清晰。
具体的细化方法包括但不限于下列至少之一:
经典快速细化算法、R.W.Hall细化算法、Rosenfeld细化算法、Zhang&Suen细化算法、基于形态学处理的快速细化算法、OPTA算法及OPTA改进形式算法。
在具体实施例中,步骤103具体包括:
利用特征提取模板对预处理后的待识别图像进行端点和分歧点的特征提取,提取出待识别图像的特征点;记录特征点的类型和位置,并根据特征点的类型和位置对待识别图像进行分类,得到待识别图像的图像类别。
例如,利用一个3*3的特征提取模板对预处理后的待识别图像进行端点和分歧点的特征提取,选取特征提取模板中的中心值作为待检测的点,沿顺时针方向,检测各个邻域点对应的灰度值。利用上述方式遍历整个待识别图像,完成特征提取和分类的过程。这样根据提取的特征信息和相应的分类,能够快速准确的识别出待识别图像中的内容。
为了更好的理解上述实施例的具体实施过程,提出了完整的图像识别方案,具体包括:
一、图像的预处理
预处理是图像自动识别系统中非常重要的一步,它的好坏直接影响图像识别的效果。预处理的目的是去除图像中的噪声,把它变成一幅清晰的点线图,以便于提取正确的图像特征。
1.1方向图的计算
方向图因具有真实性且能以简化的形式直观地反映图像最基本的形态特征,因此广泛应用于图像增强、图像特征的提取、图像的自动分类、方向模版匹配等图像识别的关键处理环节。提取方向图的方法为:
(1)将图像分割成足够小的图像片段。例如将图像分为16×l6的非重叠的图像片段。
(2)对每个图像片段的每一个像素点利用Sobel算子分别计算其x方向梯度和y方向梯度。
x方向梯度:
y方向梯度:
上式中Sx,Sy表示Sobel算子;f(i,j)表示各像素的灰度值。
(3)根据上式计算的梯度值,计算每个图像片段的方向图公式如下:
上式中:w表示图像片段的宽度,这里取值为16,得到θ后再将其量化为8个方向,从而得到每个图像片段的方向图。
1.2图像分割
传统的图像分割方法包括灰度方差法分割和局部灰度差法等,但是这两种方法对于图像分割效果往往不准确。或者利用图像具有较强的方向性的方向图分割法,方向图分割法的分割效果依赖于所求图像的方向图的可靠性,而对于图像对比度的高低并不敏感,这样针对单一灰度的区域,方向图分割法难以取得令人满意的分割效果。也可以基于D-S证据理论的图像分割方法对图像进行分割,但是分割效果也不够理想。
各个图像分割的方法均各有利弊,采用单一的图像分割方法难以达到理想的分割效果。因此本实施例将多种方法结合起来充分利用,使用上述一种或多种分割方法对图像进行多级分割。
例如,对于一幅图像,把它分为四类图像区域:背景区域、不可恢复区域、清晰区域、可恢复区域。采用三级分割的方法保留上述后两类区域,而去除前两类的区域。具体为:第一级分割出背景区域;第二级从前景中分割出模糊区域;第三级从模糊区域分割出:不可恢复部分。经过这样的处理不仅节省了运算时间,而且有效提高了分割的可靠性。
1.3图像的增强
基于Gabor滤波的增强方法和基于傅里叶滤波的低质量图像增强算法进行图像增强处理。其中Gabor滤波的增强方法基于图像的数学模型进行图像增强,公式如下:
基于上述公式,将Gabor滤波用于图像的处理,需要将偶Gabor函数改变为数字滤波器,如下式所示,这样将Gabor函数的实部作为模板得到的滤波器,对图像进行滤波增强处理后的得到的特征,能够更接近图像的真实特征。
该方法综合考虑到了图像的方向特性和频率特性,具有较好的滤波增强效果。
1.4二值和细化
根据图像的灰度分布,统计其最佳的阈值是二值化算法研究的核心。传统的二值化算法有静态算法和动态算法。动态算法比静态算法有着较好的效果,静态算法对质量差的图像区域会产生大量的伪特征点,动态算法能够在一定程度上弥补静态算法的这种缺陷,但会引入更多的噪声,影响图像的特征提取。
为了避免这种情况,本实施例采用基于方向图的动态阈值图像二值化方法。该方法直接从图像的灰度图像中获取动态阈值对图像进行二值化处理,然后一次性完成图像预处理中的分离无效区域、滤波、增强、二值化的过程。
有以下几种细化算法:经典快速细化算法、R.W.Hall细化算法、Rosenfeld细化算法、Zhang&Suen细化算法、基于形态学处理的快速细化算法、OPTA算法及OPTA改进形式算法。
其中,基于形态学处理的快速细化算法为4连通并行细化算法,原理是判断出图像纹线的边界点并逐步删除。
二、图像的特征提取和分类
传统的直接从图像原始灰度图提取特征,效率高,但容易提取出大量的伪特征信息。以及基于全局结构特征的分类方法,通过提取和分析方向图、奇异点等全局结构特征来实现分类。这种采用模仿人类进行图像分类的做法,对图像的变形有较强的鲁棒性,如果图像质量较差时很难提取可靠的结构特征。
为了解决传统这些特征提取和分类的问题,本实施例的特征提取和分类算法是基于局部细节特征的算法。局部细节特征提取的算法如下:
利用一个3×3的模版来对细化后的图像进行端点和分歧点的特征提取,例如3×3的模版如下:
P8 P1 P2
P7 M P3
P6 P5 P4
其中M是待检测的点,沿顺时针排列的P1,P2,P3,···P8是它的8个邻域点,R(1),R(2),R(3)···R(8)分别是P1,P2,P3,···P8的灰度值。如果M是端点,则邻域点满足下式:
如果M分支点,则邻域点满足下式:
利用上述方案对图像进行遍历。可以找到图像的所有特征点,同时记录特征点的类型和位置。
三、图像匹配
本实施例采用细节模式匹配的方式,从与图像的特征和分类相对应的数据库中查找模板图像,提取模板图像的模板细节点特征向量集合,以及待识别图像的输入细节点特征向量集合并分别表示为:
其中模板细节点特征集合P包括M个细节点,输入细节点特征集合Q包括N个细节点。
细节点匹配过程为:搜索P和Q中点之间的最佳对应关系,统计相对应细节点的数目,根据细节点数目计算匹配分值MS。将得到的MS并与阈值T比较,如果MS≥T,则待识别图像与模板图像的细节点匹配成功,认为模板图像对应的内容为待识别图像的内容;如果MS<T,则待识别图像与模板图像的细节点匹配失败。
例如,图2和图3中方块选中的区域为特征点,由图2可知,图2的图像比较复杂,对应的特征点较多,因此传统的方法对于图2这种图像的识别效率比较高,但是对于图3中特征点较少的图像传统的方式识别率比较低,而通过本申请的上述技术方案,进行识别时,不但能够准确识别图2中的复杂图像,也能够快速准确的识别出图3中的简单图像。
通过上述技术方案,可以根据提取的图像的特征信息,与对应的模板图像进行色彩分布比对,进而识别出图像的内容,即使对于特征点不强的简单图像也能够快速准确的识别出来,有效的提高了图像的识别率。
进一步的,作为图1方法的具体实现,本申请实施例提供了一种图像识别装置,如图4所示,该装置包括:获取单元21、预处理单元22、分类单元23和识别单元24。
获取单元21,用于获取待识别图像;
预处理单元22,用于对待识别图像进行预处理;
分类单元23,用于根据预处理后的待识别图像中的特征信息进行分类,得到待识别图像的图像类别;
识别单元24,用于通过将特征信息与图像类别相对应的数据库中模板图像的特征信息进行比对,确定待识别图像对应的识别结果,其中,不同的图像类别分别对应不同的数据库。
在具体实施例中,识别单元24具体包括:
提取模块,用于提取预处理后的待识别图像中特征信息包含的输入细节点特征集合;及提取与图像类别相对应的数据库中模板图像的特征信息包含的模板细节点特征集合;
比对模块,用于将输入细节点特征集合与模板细节点特征集合进行比对;
计算模块,用于统计输入细节点特征集合与模板细节点特征集合中,相匹配的细节点的数目,并计算匹配分值;
匹配模块,用于将匹配分值大于等于预定阈值的模板图像,确定为待识别图像对应的识别结果。
在具体实施例中,预处理单元22具体包括:
方向图计算模块,用于计算待识别图像的方向图;
预处理模块,用于根据方向图,对待识别图像依次进行分割处理、图像增强处理、二值化处理和细化处理。
在具体实施例中,方向图计算模块具体包括:
拆分模块,用于将待识别图像拆分成多个图像片段;
梯度计算模块,用于计算每个图像片段中各个像素点对应的梯度值,剃度值包括横轴梯度和纵轴梯度;以及根据梯度值计算每个图像片段的方向图。
在具体实施例中,预处理模块具体包括:
分割模块,用于将待识别图像的背景区域分割出去,保留前景区域;将前景区域的模糊区域分割出去,保留清晰区域;将清晰区域中不可恢复区域分割出去,保留可恢复区域。
在具体实施例中,预处理模块具体还包括:
图像增强模块,用于利用线性滤波器对分割处理后的待识别图像进行滤波图像增强处理;和/或利用傅里叶滤波算法,对分割处理后的待识别图像进行低质量图像增强处理。
在具体实施例中,预处理模块具体还包括:
二值化处理模块,用于获取方向图的动态阈值,根据动态阈值对图像增强处理后的待识别图像进行二值化处理;
细化处理模块,用于利用细化算法对二值化处理后的待识别图像进行细化处理。
在具体实施例中,分类单元23具体包括:
特征提取模块,用于利用特征提取模板对预处理后的待识别图像进行端点和分歧点的特征提取,提取出待识别图像的特征点;
分类模块,用于记录特征点的类型和位置,并根据特征点的类型和位置对待识别图像进行分类,得到待识别图像的图像类别。
基于上述图1所示方法,相应的,本申请实施例还提供了一种存储设备,其上存储有计算机程序,程序被处理器执行时实现图1所示方法对应的步骤。
基于上述图1所示方法和图4所示装置的实施例,本申请实施例还提供了一种图像识别装置,如图5所示,包括存储设备32和处理器31,其中存储设备32和处理器31均设置在总线33上。
存储设备32,用于存储计算机程序;
处理器31,用于执行计算机程序以实现图1所示方法对应的步骤。
通过本申请的上述技术方案,能够快速精准的提取图像特征,使得根据该特征信息识别出的图像内容更加准确,即使对于特征点不明显的简单图像也能够快速准确的识别出来,有效的提高了图像的识别率。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。
本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。
以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。
Claims (10)
1.一种图像识别方法,其特征在于,所述方法包括:
获取待识别图像;
对所述待识别图像进行预处理;
根据预处理后的待识别图像中的特征信息进行分类,得到所述待识别图像的图像类别;
通过将所述特征信息与所述图像类别相对应的数据库中模板图像的特征信息进行比对,确定所述待识别图像对应的识别结果,其中,不同的图像类别分别对应不同的数据库。
2.根据权利要求1所述的方法,其特征在于,所述通过将所述特征信息与所述图像类别相对应的数据库中模板图像的特征信息进行比对,确定所述待识别图像对应的识别结果,具体包括:
提取所述预处理后的待识别图像中特征信息包含的输入细节点特征集合;及
提取与所述图像类别相对应的数据库中模板图像的特征信息包含的模板细节点特征集合;
将所述输入细节点特征集合与所述模板细节点特征集合进行比对;
统计所述输入细节点特征集合与所述模板细节点特征集合中,相匹配的细节点的数目,并计算匹配分值;
将匹配分值大于等于预定阈值的模板图像,确定为所述待识别图像对应的识别结果。
3.根据权利要求1所述的方法,其特征在于,对所述待识别图像进行预处理,具体包括:
计算所述待识别图像的方向图;
根据所述方向图,对所述待识别图像依次进行分割处理、图像增强处理、二值化处理和细化处理。
4.根据权利要求3所述的方法,其特征在于,计算所述待识别图像的方向图,具体包括:
将所述待识别图像拆分成多个图像片段;
计算每个图像片段中各个像素点对应的梯度值,所述剃度值包括横轴梯度和纵轴梯度;
根据所述梯度值计算每个图像片段的方向图。
5.根据权利要求3所述的方法,其特征在于,对所述待识别图像进行分割处理,具体包括:
将所述待识别图像的背景区域分割出去,保留前景区域;
将所述前景区域的模糊区域分割出去,保留清晰区域;
将所述清晰区域中不可恢复区域分割出去,保留可恢复区域。
6.根据权利要求5所述的方法,其特征在于,对分割处理后的待识别图像进行图像增强处理,具体包括:
利用线性滤波器对所述分割处理后的待识别图像进行滤波图像增强处理;和/或
利用傅里叶滤波算法,对所述分割处理后的待识别图像进行低质量图像增强处理。
7.根据权利要求6所述的方法,其特征在于,对图像增强处理后的待识别图像进行二值化处理和细化处理,具体包括:
获取所述方向图的动态阈值,根据所述动态阈值对所述图像增强处理后的待识别图像进行二值化处理;
利用细化算法对二值化处理后的待识别图像进行细化处理。
8.根据权利要求1至7中任一项所述的方法,其特征在于,所述根据预处理后的待识别图像中的特征信息进行分类,得到所述待识别图像的图像类别,具体包括:
利用特征提取模板对所述预处理后的待识别图像进行端点和分歧点的特征提取,提取出待识别图像的特征点;
记录所述特征点的类型和位置,并根据所述特征点的类型和位置对所述待识别图像进行分类,得到所述待识别图像的图像类别。
9.一种存储设备,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至8任一项所述的图像识别方法。
10.一种图像识别装置,其特征在于,所述装置包括存储设备和处理器,
所述存储设备,用于存储计算机程序;
所述处理器,用于执行所述计算机程序以实现权利要求1至8任一项所述的图像识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711452323.4A CN108197644A (zh) | 2017-12-27 | 2017-12-27 | 一种图像识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711452323.4A CN108197644A (zh) | 2017-12-27 | 2017-12-27 | 一种图像识别方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108197644A true CN108197644A (zh) | 2018-06-22 |
Family
ID=62584840
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711452323.4A Pending CN108197644A (zh) | 2017-12-27 | 2017-12-27 | 一种图像识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108197644A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109034069A (zh) * | 2018-07-27 | 2018-12-18 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
CN109376746A (zh) * | 2018-10-25 | 2019-02-22 | 黄子骞 | 一种图片识别方法及系统 |
CN109919208A (zh) * | 2019-02-25 | 2019-06-21 | 中电海康集团有限公司 | 一种外观图像相似度比对方法和系统 |
CN109947977A (zh) * | 2019-03-13 | 2019-06-28 | 广东小天才科技有限公司 | 一种结合图像的意图识别方法及装置、终端设备 |
CN110074045A (zh) * | 2019-04-26 | 2019-08-02 | 深圳市光特亿科技有限公司 | 一种鱼缸控制方法、装置以及系统 |
CN110532944A (zh) * | 2019-08-28 | 2019-12-03 | 河北冀云气象技术服务有限责任公司 | 一种智能图像识别天气现象系统及方法 |
CN110647648A (zh) * | 2019-09-19 | 2020-01-03 | 广东小天才科技有限公司 | 纸质书本的页码识别方法、装置、家教机及存储介质 |
CN110781952A (zh) * | 2019-10-23 | 2020-02-11 | 泰康保险集团股份有限公司 | 图像识别风险提示方法、装置、设备及存储介质 |
CN111310703A (zh) * | 2020-02-26 | 2020-06-19 | 深圳市巨星网络技术有限公司 | 基于卷积神经网络的身份识别方法、装置、设备及介质 |
CN112183194A (zh) * | 2020-08-19 | 2021-01-05 | 中国南方电网有限责任公司超高压输电公司广州局 | 非接触式换流站工作站设备参数识别方法及系统 |
CN113610801A (zh) * | 2021-08-05 | 2021-11-05 | 上海众壹云计算科技有限公司 | 基于最小单元图形的缺陷分类方法及装置、电子设备和存储介质 |
CN115238081A (zh) * | 2022-06-14 | 2022-10-25 | 杭州原数科技有限公司 | 一种文物智能识别方法、系统及可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915432A (zh) * | 2012-09-11 | 2013-02-06 | 北京铁道工程机电技术研究所有限公司 | 一种车载微机图像视频数据提取方法及装置 |
CN106709450A (zh) * | 2016-12-23 | 2017-05-24 | 上海斐讯数据通信技术有限公司 | 一种指纹图像识别方法及系统 |
-
2017
- 2017-12-27 CN CN201711452323.4A patent/CN108197644A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915432A (zh) * | 2012-09-11 | 2013-02-06 | 北京铁道工程机电技术研究所有限公司 | 一种车载微机图像视频数据提取方法及装置 |
CN106709450A (zh) * | 2016-12-23 | 2017-05-24 | 上海斐讯数据通信技术有限公司 | 一种指纹图像识别方法及系统 |
Non-Patent Citations (1)
Title |
---|
李成进: "图像识别的关键技术与展望", 《科技广场》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109034069B (zh) * | 2018-07-27 | 2021-04-09 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
CN109034069A (zh) * | 2018-07-27 | 2018-12-18 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
CN109376746A (zh) * | 2018-10-25 | 2019-02-22 | 黄子骞 | 一种图片识别方法及系统 |
CN109919208A (zh) * | 2019-02-25 | 2019-06-21 | 中电海康集团有限公司 | 一种外观图像相似度比对方法和系统 |
CN109947977A (zh) * | 2019-03-13 | 2019-06-28 | 广东小天才科技有限公司 | 一种结合图像的意图识别方法及装置、终端设备 |
CN110074045A (zh) * | 2019-04-26 | 2019-08-02 | 深圳市光特亿科技有限公司 | 一种鱼缸控制方法、装置以及系统 |
CN110074045B (zh) * | 2019-04-26 | 2021-07-30 | 深圳市光特亿科技有限公司 | 一种鱼缸控制方法、装置以及系统 |
CN110532944A (zh) * | 2019-08-28 | 2019-12-03 | 河北冀云气象技术服务有限责任公司 | 一种智能图像识别天气现象系统及方法 |
CN110647648A (zh) * | 2019-09-19 | 2020-01-03 | 广东小天才科技有限公司 | 纸质书本的页码识别方法、装置、家教机及存储介质 |
CN110781952A (zh) * | 2019-10-23 | 2020-02-11 | 泰康保险集团股份有限公司 | 图像识别风险提示方法、装置、设备及存储介质 |
CN111310703A (zh) * | 2020-02-26 | 2020-06-19 | 深圳市巨星网络技术有限公司 | 基于卷积神经网络的身份识别方法、装置、设备及介质 |
CN112183194A (zh) * | 2020-08-19 | 2021-01-05 | 中国南方电网有限责任公司超高压输电公司广州局 | 非接触式换流站工作站设备参数识别方法及系统 |
CN112183194B (zh) * | 2020-08-19 | 2024-01-19 | 中国南方电网有限责任公司超高压输电公司广州局 | 非接触式换流站工作站设备参数识别方法及系统 |
CN113610801A (zh) * | 2021-08-05 | 2021-11-05 | 上海众壹云计算科技有限公司 | 基于最小单元图形的缺陷分类方法及装置、电子设备和存储介质 |
CN115238081A (zh) * | 2022-06-14 | 2022-10-25 | 杭州原数科技有限公司 | 一种文物智能识别方法、系统及可读存储介质 |
CN115238081B (zh) * | 2022-06-14 | 2024-04-30 | 杭州原数科技有限公司 | 一种文物智能识别方法、系统及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108197644A (zh) | 一种图像识别方法和装置 | |
CN110414507B (zh) | 车牌识别方法、装置、计算机设备和存储介质 | |
Prakash et al. | Detection of copy-move forgery using AKAZE and SIFT keypoint extraction | |
Türkyılmaz et al. | License plate recognition system using artificial neural networks | |
CN103456003A (zh) | 对象跟踪装置及方法以及错误特征点剔除装置及方法 | |
CN110334709B (zh) | 基于端到端多任务深度学习的车牌检测方法 | |
US20120057791A1 (en) | Information processing apparatus and control method thereof | |
CN109740572A (zh) | 一种基于局部彩色纹理特征的人脸活体检测方法 | |
CN107464245B (zh) | 一种图像结构边缘的定位方法及装置 | |
CN110738216A (zh) | 基于改进surf算法的药品识别方法 | |
CN112686248B (zh) | 证件增减类别检测方法、装置、可读存储介质和终端 | |
CN110852327A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN104123554A (zh) | 基于mmtd的sift图像特征提取方法 | |
CN111275070B (zh) | 一种基于局部特征匹配的签名验证方法及设备 | |
Forczmański et al. | Stamps detection and classification using simple features ensemble | |
Wicht et al. | Camera-based sudoku recognition with deep belief network | |
CN112070116B (zh) | 一种基于支持向量机的艺术画作自动分类系统及方法 | |
Thajeel et al. | Detection copy-move forgery in image via quaternion polar harmonic transforms | |
CN112200789B (zh) | 一种图像识别的方法及装置、电子设备和存储介质 | |
Kim et al. | Image-based coin recognition using rotation-invariant region binary patterns based on gradient magnitudes | |
CN114241463A (zh) | 签名验证方法、装置、计算机设备和存储介质 | |
CN111127407B (zh) | 一种基于傅里叶变换的风格迁移伪造图像检测装置及方法 | |
Tsai et al. | Recognition of Vehicle License Plates from a Video Sequence. | |
CN112101283A (zh) | 一种交通标志智能识别方法及系统 | |
Dhar et al. | Interval type-2 fuzzy set and human vision based multi-scale geometric analysis for text-graphics segmentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180622 |