CN103034844B - 图像识别方法与装置 - Google Patents

图像识别方法与装置 Download PDF

Info

Publication number
CN103034844B
CN103034844B CN201210529322.6A CN201210529322A CN103034844B CN 103034844 B CN103034844 B CN 103034844B CN 201210529322 A CN201210529322 A CN 201210529322A CN 103034844 B CN103034844 B CN 103034844B
Authority
CN
China
Prior art keywords
lattice
image
scoring
identified
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210529322.6A
Other languages
English (en)
Other versions
CN103034844A (zh
Inventor
钟海兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GUANGDONG TUTUSOU NETWORK TECHNOLOGY Co Ltd
Original Assignee
GUANGDONG TUTUSOU NETWORK TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GUANGDONG TUTUSOU NETWORK TECHNOLOGY Co Ltd filed Critical GUANGDONG TUTUSOU NETWORK TECHNOLOGY Co Ltd
Priority to CN201210529322.6A priority Critical patent/CN103034844B/zh
Publication of CN103034844A publication Critical patent/CN103034844A/zh
Application granted granted Critical
Publication of CN103034844B publication Critical patent/CN103034844B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种图像识别方法与装置,预先建立基于形态估计的模型,该模型与待识别对象相适应并由各部位组成,将图像划分为若干小方格,先利用局部评分找出与模型中各部位较匹配的小方格,再对各个小方格进行组合,得到各种可能的待识别对象,剔除不符合空间逻辑关系的组合,从剩余组合中找出全局评分最高的组合,若其全局评分超过阈值,则判定图像中存在待识别对象。由于本方法与装置利用基于形态估计的模型作为参照,对图像进行划分再组合,通过局部评分和全局评分两层筛选来确定图像中是否存在待识别对象,能够识别人或物等形态特征复杂的对象,同时具有较高的准确度和精确度。

Description

图像识别方法与装置
技术领域
本发明涉及数字图像处理技术领域,特别是涉及一种图像识别方法与装置。
背景技术
图像识别是通过图像中的语义信息对图像进行识别的技术,其应用领域非常广阔,例如,交通标识识别,车牌识别,人脸识别,医学图像识别。
传统的图像识别方法大都基于视觉词典模型,此类方法首先需要提取图像局部特征,然后对局部特征进行聚类分析建立视觉词汇。这样就可以将图像表示为一个基于视觉词汇的直方图。最后,采用机器学习的方法来训练出预测图像的识别器。
上述方法适用于特征较简单的待识别对象,当待识别对象的形态多变时,例如人体,上述方法的识别效果不甚理想。
发明内容
基于上述问题,本发明提供一种图像识别方法与装置,以识别形态特征复杂的对象。
本发明提出的图像识别方法,包括如下步骤:
对图像进行划分,提取划分后每个小方格的梯度直方图特征,划分的个数在本图像识别方法的识别效率和识别精度间取平衡;
建立与待识别对象相适应的基于形态估计的模型,该模型由各个部位组成,根据所述梯度直方图特征计算每个小方格对应于该模型的各个部位的局部评分;
针对所述模型的各个部位,筛选几个局部评分较高的小方格,筛选的个数在本图像识别方法的识别效率和识别精度间取平衡;
对针对所述模型不同部位筛选出的小方格进行组合,结合组合中每个小方格的局部评分和小方格间的空间逻辑关系,计算每种小方格组合的全局评分;
将最高的全局评分与阈值比较,若超出所述阈值则判定图像中存在所述待识别对象。
本发明提出的图像识别装置,包括:
图像划分模块,用于对图像进行划分,并提取划分后每个小方格的梯度直方图特征,划分的个数在本图像识别装置的识别效率和识别精度间取平衡;
局部评分计算模块,用于建立与待识别对象相适应的基于形态估计的模型,该模型由各个部位组成,根据所述梯度直方图特征计算每个小方格对应于该模型的各个部位的局部评分;
小方格筛选模块,用于针对所述模型的各个部位,筛选几个局部评分较高的小方格,筛选的个数在本图像识别装置的识别效率和识别精度间取平衡;
全局评分计算模块,用于对针对所述模型不同部位筛选出的小方格进行组合,结合组合中每个小方格的局部评分和小方格间的空间逻辑关系,计算每种小方格组合的全局评分;
判定模块,用于将最高的全局评分与阈值比较,若超出所述阈值则判定图像中存在所述待识别对象。
本发明的图像识别方法与装置,预先建立基于形态估计的模型,该模型与待识别对象相适应并由各部位组成,将图像划分为若干小方格,先利用局部评分找出与模型中各部位较匹配的小方格,再对各个小方格进行组合,得到各种可能的待识别对象,剔除不符合空间逻辑关系的组合,从剩余组合中找出全局评分最高的组合,若其全局评分超过阈值,则判定图像中存在待识别对象。由于本方法与装置利用基于形态估计的模型作为参照,对图像进行划分再组合,通过局部评分和全局评分两层筛选来确定图像中是否存在待识别对象,能够识别人或物等形态特征复杂的对象,同时具有较高的准确度和精确度。
附图说明
图1为本发明图像识别方法实施例一的流程示意图;
图2为本发明图像识别装置实施例一的结构示意图。
具体实施方式
为了更为具体地描述本发明,下面先结合附图及具体实施方式对图像识别方法进行详细说明。
实施例一
本实施例的图像识别方法,如图1所示,包括如下步骤:
步骤S101、对图像进行划分,提取划分后每个小方格的梯度直方图特征,划分的个数在本图像识别方法的识别效率和识别精度间取平衡。假设每幅图像被划分为m个小方格,则m个小方格记为gi,i=1,2…m.
步骤S102、建立与待识别对象相适应的基于形态估计的模型,该模型由各个部位组成。例如,整个模型由k个部位构成,则每个部位表示为pk,k=1,2…K。根据所述梯度直方图特征计算每个小方格对应于该模型的各个部位的局部评分。
局部评分公式为:Sk(I,gi,pk)=wk*φ(I,gi)+bk
其中,I表示当前图像,φ(I,gi)表示当前图像I中小方格gi的梯度直方图特征,wk和bk是一组控制小方格gi与部位pk的相似程度的模型参数特征。
步骤S103、针对所述模型的各个部位,筛选几个局部评分较高的小方格,筛选的个数在本图像识别方法的识别效率和识别精度间取平衡;
步骤S104、对针对所述模型不同部位筛选出的小方格进行组合,结合组合中每个小方格的局部评分和小方格间的空间逻辑关系,计算每种小方格组合的全局评分;
全局评分公式:
S ( I ) = Σ k S k ( I , g k , p k ) + Σ k i , k j ( w k i k j * ψ ( g k i - g k j ) + b k i k j )
其中,Sk(I,gk,pk)表示对应于所述模型中第k个部位的筛选出的较高的局部评分,为小方格gki和gkj的空间逻辑关系组成的一组特征向量(δxδyδx2δy2), (xki,yki),(xkj,ykj)分别为gki和gkj的在图像I中的坐标。是一组控制小方格gki和gkj空间关系的模型参数。
步骤S105、将最高的全局评分与阈值比较,若超出所述阈值则判定图像中存在所述待识别对象。
如上所述,本实施例先将整幅图像划分为一个个小方格,再以小方格为操作对象进行后续步骤。小方格划分的越多,最终的识别结果越准确,但同时带来计算量大的问题,致使识别效率低下。因此,可根据需求将图像划分为合适个数的小方格。提取每个小方格的梯度直方图特征可以是先在RGB三个通道下分别提取梯度直方图特征,再以其中最大的梯度直方图特征作为该小方格的梯度直方图特征。
本实施例可以预先建立与待识别对象相适应的模型,该模型是基于形态估计的且由各部位组成,如待识别对象是人体,则模型由头、颈、肩等各部位组成,再如待识别对象是桌子,则模型由桌面和四条桌腿组成。针对每个部位计算每个小方格的局部评分,局部评分的计算与小方格的梯度直方图特征及所针对部位的模型参数有关,局部评分越高说明该小方格与该部位相似度越高。将针对每个部位局部评分较低的小方格剔除掉,局部评分较高的小方格筛选出来,再将针对不同部位的筛选出的小方格相互组合,得到各种可能的待识别对象。由于待识别对象各部位是存在空间逻辑关系的,因此,将每种组合下各个小方格的局部评分与空间逻辑关系得分相加得到该组合的全局评分。全局评分越高说明越接近待识别对象,但最高的全局评分对应的小方格组合不一定就是待识别对象。因此本实施例预先设置了阈值即全局评分的下限,只有当最高的全局评分超过该阈值时,才说明图像中存在待识别对象,否则认为不存在。
本实施例由于是基于形态估计的模型,因此特别适用于结构特征易于辨识的人或物作为待识别对象。
例如,图像被划分为16个小方格,待识别对象为人体上半身,所建立的人体上半身的模型包括头部、颈部、躯干和上肢。经过步骤S103筛选出对应于模型中的头部的局部评分较高的小方格包括第2、3个小方格,对应于模型中颈部的局部评分较高的小方格包括第6、7个小方格,对应于模型中躯干的局部评分较高小方格包括第10、11、14、15个小方格,对应于模型中上肢的局部评分较高的小方格包括第9、13、12、16个小方格。可知,针对不同的部位,筛选的小方格的个数可以不同。从上述筛选出的针对四个部位的四组小方格中,各选一个小方格进行组合,按照各种可能的位置关系,组合成各种可能的待识别对象,再计算每种组合的全局评分,全局评分包括组合中每个小方格局部评分之和与小方格组合的空间逻辑关系得分。从中选取最高的全局评分与阈值比较,超出则判定为图像中存在待识别的人体上半身。
实施例二
为了进一步完善识别结果,本实施例在实施例一的基础上还增加了对待识别对象位置的判断,具体地是在判定图像中存在待识别对象后,再依据全局评分最高的小方格组合中小方格的坐标确定所述待识别对象在图像中的位置。如此,可以在图像中将相应位置的小方格组合作为待识别对象标识出来,供用户参考。
本实施例的其他技术特征与实施例一相同,在此不予赘述。
实施例三
若图像的尺寸与模型的尺寸不匹配,则可能造成误识别的后果。因此,本实施例还可以对图像进行降采样,并对降采样后的每幅图像分别执行S101到S104的步骤,则每幅图像都有一个最高的全局评分,再从中选取最高的全局评分与阈值比较尽兴判定。降采样后得到的各种尺寸的图像,即图像金字塔,其中至少有一种尺寸的图像是与模型的尺寸匹配的。因此,采用本实施例可以进一步增加图像识别的准确性与精度。
本实施例进行的降采样,级数越多越精细,则识别效果越准确,但牺牲了识别效率,因此降采样的级数也是由需求而定,优选地为十级。另外,对图像进行降采样的方式优选地采用线性插值法。
本实施例的其他技术特征与实施例二相同,在此不予赘述。
下面介绍本发明图像识别装置的实施例
实施例一
本实施例的图像识别装置,如图2所示,包括:
图像划分模块,用于对图像进行划分,并提取划分后每个小方格的梯度直方图特征,划分的个数在本图像识别装置的识别效率和识别精度间取平衡。假设每幅图像被划分为m个小方格,则m个小方格记为gi,i=1,2…m.
局部评分计算模块,用于建立与待识别对象相适应的基于形态估计的模型,该模型由各个部位组成,例如,整个模型由k个部位构成,则每个部位表示为pk,k=1,2…K。根据所述梯度直方图特征计算每个小方格对应于该模型的各个部位的局部评分。
局部评分公式为:Sk(I,gi,pk)=wk*φ(I,gi)+bk
其中,I表示当前图像,φ(I,gi)表示当前图像I中小方格gi的梯度直方图特征,wk和bk是一组控制小方格gi与部位pk的相似程度的模型参数特征。
小方格筛选模块,用于针对所述模型的各个部位,筛选几个局部评分较高的小方格,筛选的个数在本图像识别装置的识别效率和识别精度间取平衡;
全局评分计算模块,用于对针对所述模型不同部位筛选出的小方格进行组合,结合组合中每个小方格的局部评分和小方格间的空间逻辑关系,计算每种小方格组合的全局评分。
全局评分公式:
S ( I ) = Σ k S k ( I , g k , p k ) + Σ k i , k j ( w k i k j * ψ ( g k i - g k j ) + b k i k j )
其中,Sk(I,gk,pk)表示对应于所述模型中第k个部位的筛选出的较高的局部评分,为小方格gki和gkj的空间逻辑关系组成的一组特征向量(δxδyδx2δy2), (xki,yki),(xkj,ykj)分别为gki和gkj的在图像I中的坐标。是一组控制小方格gki和gkj空间关系的模型参数。
判定模块,用于将最高的全局评分与阈值比较,若超出所述阈值则判定图像中存在所述待识别对象。
上述各模块之间的连接关系的一种实施例如图2所示,图像划分模块、局部评分计算模块、小方格筛选模块、全局评分计算模块和判定模型依次相连,组成了本装置。
本实施例的各个模块相互配合所执行的工作流程,对应于上述图像识别方法的各步骤,在此不予赘述。
实施例二
在本实施例中,所述判定模块还用于在判定图像中存在待识别对象后,依据全局评分最高的小方格组合中小方格的坐标确定所述待识别对象在图像中的位置,从而可以将所确定的位置标识出来,便于用户进一步确认识别结果是否正确。
本实施例的其他技术特征与实施例一相同,在此不予赘述。
实施例三
本实施例的图像识别装置还包括降采样模块,用于对图像进行降采样,所述图像划分模块、局部评分计算模块、小方格筛选模块和全局评分计算模块依次对降采样后的每幅图像进行处理,所述判定模块用于将降采样后的所有图像中最高的全局评分与所述阈值比较,若超出所述阈值则判定图像中存在所述待识别对象。
所述降采样模块对图像进行降采样的级数优选地为十级,对图像进行降采样的方式优选地采用线性插值法。
本实施例的其他技术特征与实施例二相同,在此不予赘述。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (12)

1.一种图像识别方法,其特征在于,包括如下步骤:
对图像进行划分,提取划分后每个小方格的梯度直方图特征,划分的个数在本图像识别方法的识别效率和识别精度间取平衡;
建立与待识别对象相适应的基于形态估计的模型,该模型由各个部位组成,根据所述梯度直方图特征计算每个小方格对应于该模型的各个部位的局部评分;
采用下式计算每个小方格对应于所述模型的各个部位的局部评分:
Sk(I,gi,pk)=wk*φ(I,gi)+bk
其中,I表示当前图像,gi表示当前图像I中第i个小方格,pk表示所述模型的第k个部位,φ(I,gi)表示当前图像I中小方格gi的梯度直方图特征,wk和bk是一组控制小方格gi与部位pk的相似程度的模型参数特征;
针对所述模型的各个部位,筛选几个局部评分较高的小方格,筛选的个数在本图像识别方法的识别效率和识别精度间取平衡;
对针对所述模型不同部位筛选出的小方格进行组合,结合组合中每个小方格的局部评分和小方格间的空间逻辑关系,计算每种小方格组合的全局评分;
将最高的全局评分与阈值比较,若超出所述阈值则判定图像中存在所述待识别对象。
2.根据权利要求1所述的图像识别方法,其特征在于,判定图像中存在待识别对象后,还依据全局评分最高的小方格组合中小方格的坐标确定所述待识别对象在图像中的位置。
3.根据权利要求1所述的图像识别方法,其特征在于,对图像进行降采样,对降采样后的每幅图像分别执行从对图像进行划分到计算每种小方格组合的全局评分的步骤,再将所有图像中最高的全局评分与所述阈值比较,若超出所述阈值则判定图像中存在所述待识别对象。
4.根据权利要求3所述的图像识别方法,其特征在于,
对图像进行降采样的级数为十级;
和/或
对图像进行降采样的方式为线性插值法。
5.根据权利要求1所述的图像识别方法,其特征在于,每个小方格的所述梯度直方图特征为该小方格在RGB三个通道下最大的梯度直方图特征。
6.根据权利要求1所述的图像识别方法,其特征在于,所述待识别对象为结构特征易于辨识的人或物。
7.一种图像识别装置,其特征在于,包括:
图像划分模块,用于对图像进行划分,并提取划分后每个小方格的梯度直方图特征,划分的个数在本图像识别装置的识别效率和识别精度间取平衡;
局部评分计算模块,用于建立与待识别对象相适应的基于形态估计的模型,该模型由各个部位组成,根据所述梯度直方图特征计算每个小方格对应于该模型的各个部位的局部评分;
所述局部评分计算模块采用下式计算每个小方格对应于所述模型的各个部位的局部评分:
Sk(I,gi,pk)=wk*φ(I,gi)+bk
其中,I表示当前图像,gi表示当前图像I中第i个小方格,pk表示所述模型的第k个部位,φ(I,gi)表示当前图像I中小方格gi的梯度直方图特征,wk和bk是一组控制小方格gi与部位pk的相似程度的模型参数特征;
小方格筛选模块,用于针对所述模型的各个部位,筛选几个局部评分较高的小方格,筛选的个数在本图像识别装置的识别效率和识别精度间取平衡;
全局评分计算模块,用于对针对所述模型不同部位筛选出的小方格进行组合,结合组合中每个小方格的局部评分和小方格间的空间逻辑关系,计算每种小方格组合的全局评分;
判定模块,用于将最高的全局评分与阈值比较,若超出所述阈值则判定图像中存在所述待识别对象。
8.根据权利要求7所述的图像识别装置,其特征在于,所述判定模块还用于在判定图像中存在待识别对象后,依据全局评分最高的小方格组合中小方格的坐标确定所述待识别对象在图像中的位置。
9.根据权利要求7所述的图像识别装置,其特征在于,还包括降采样模块,用于对图像进行降采样,所述图像划分模块、局部评分计算模块、小方格筛选模块和全局评分计算模块依次对降采样后的每幅图像进行处理,所述判定模块用于将降采样后的所有图像中最高的全局评分与所述阈值比较,若超出所述阈值则判定图像中存在所述待识别对象。
10.根据权利要求9所述的图像识别装置,其特征在于,
所述降采样模块对图像进行降采样的级数为十级;
和/或
所述降采样模块对图像进行降采样的方式为线性插值法。
11.根据权利要求7所述的图像识别装置,其特征在于,每个小方格的所述梯度直方图特征为该小方格在RGB三个通道下最大的梯度直方图特征。
12.根据权利要求7所述的图像识别装置,其特征在于,所述待识别对象为结构特征易于辨识的人或物。
CN201210529322.6A 2012-12-10 2012-12-10 图像识别方法与装置 Expired - Fee Related CN103034844B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210529322.6A CN103034844B (zh) 2012-12-10 2012-12-10 图像识别方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210529322.6A CN103034844B (zh) 2012-12-10 2012-12-10 图像识别方法与装置

Publications (2)

Publication Number Publication Date
CN103034844A CN103034844A (zh) 2013-04-10
CN103034844B true CN103034844B (zh) 2016-04-27

Family

ID=48021723

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210529322.6A Expired - Fee Related CN103034844B (zh) 2012-12-10 2012-12-10 图像识别方法与装置

Country Status (1)

Country Link
CN (1) CN103034844B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103824085B (zh) * 2014-03-19 2018-02-02 苏州比特速浪电子科技有限公司 图像处理、图像识别及图像分类的装置及其方法
CN106898353A (zh) * 2017-03-23 2017-06-27 东华理工大学 一种智能家居语音控制系统及其语音识别方法
DE102017212426A1 (de) * 2017-07-20 2019-01-24 Robert Bosch Gmbh Verfahren und Vorrichtung zum Reduzieren einer Anzahl von Detektionskandidaten eines Objekterkennungsverfahrens
CN109657714A (zh) * 2018-12-11 2019-04-19 深圳先进技术研究院 数据处理方法、装置及电子设备
CN111402364A (zh) * 2018-12-27 2020-07-10 北京字节跳动网络技术有限公司 一种图像生成方法、装置、终端设备及存储介质
CN113781187B (zh) * 2021-07-22 2022-07-12 国网物资有限公司 一种适用于电力物资招标采购的分包方法及分包工具

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1996346A (zh) * 2005-12-29 2007-07-11 电子科技大学 基于轮廓的车型识别方法
CN101488187A (zh) * 2008-01-18 2009-07-22 Mv科技软件有限责任公司 可变形对象识别系统和方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8478055B2 (en) * 2007-04-09 2013-07-02 Nec Corporation Object recognition system, object recognition method and object recognition program which are not susceptible to partial concealment of an object

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1996346A (zh) * 2005-12-29 2007-07-11 电子科技大学 基于轮廓的车型识别方法
CN101488187A (zh) * 2008-01-18 2009-07-22 Mv科技软件有限责任公司 可变形对象识别系统和方法

Also Published As

Publication number Publication date
CN103034844A (zh) 2013-04-10

Similar Documents

Publication Publication Date Title
CN103034844B (zh) 图像识别方法与装置
CN106127684B (zh) 基于双向递归卷积神经网络的图像超分辨率增强方法
CN109685115A (zh) 一种双线性特征融合的细粒度概念模型及学习方法
CN103810506B (zh) 一种手写汉字笔画识别方法
CN104199840B (zh) 基于统计模型的智能地名识别技术
CN105956560A (zh) 一种基于池化多尺度深度卷积特征的车型识别方法
CN107871101A (zh) 一种人脸检测方法及装置
CN107808129A (zh) 一种基于单个卷积神经网络的面部多特征点定位方法
CN108681692A (zh) 一种基于深度学习的遥感图像内新增建筑识别方法
CN110532897A (zh) 零部件图像识别的方法和装置
CN108090429A (zh) 一种分级前脸卡口车型识别方法
CN103456013B (zh) 一种表示超像素以及度量超像素之间相似性的方法
CN106919897A (zh) 一种基于三级残差网络的人脸图像年龄估计方法
CN104134071A (zh) 一种基于颜色描述的可变形部件模型物体检测方法
CN104240256A (zh) 一种基于层次化稀疏建模的图像显著性检测方法
CN103049446A (zh) 一种图像检索方法及装置
CN106127108A (zh) 一种基于卷积神经网络的人手图像区域检测方法
CN105389550A (zh) 一种基于稀疏指引与显著驱动的遥感目标检测方法
CN101908153B (zh) 低分辨率图像处理中的头部姿态估计的方法
CN103235947B (zh) 一种手写体数字识别方法及装置
CN110516554A (zh) 一种多场景多字体中文文字检测识别方法
CN107818321A (zh) 一种用于车辆年检的水印日期识别方法
CN108564120A (zh) 基于深度神经网络的特征点提取方法
CN107704888A (zh) 一种基于联合聚类深度学习神经网络的数据识别方法
CN111881716A (zh) 一种基于多视角生成对抗网络的行人重识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160427

Termination date: 20161210

CF01 Termination of patent right due to non-payment of annual fee