CN106156707B - 图像识别方法及装置 - Google Patents

图像识别方法及装置 Download PDF

Info

Publication number
CN106156707B
CN106156707B CN201510167313.0A CN201510167313A CN106156707B CN 106156707 B CN106156707 B CN 106156707B CN 201510167313 A CN201510167313 A CN 201510167313A CN 106156707 B CN106156707 B CN 106156707B
Authority
CN
China
Prior art keywords
image
rectangular integration
feature
characteristic value
domain rectangular
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510167313.0A
Other languages
English (en)
Other versions
CN106156707A (zh
Inventor
吴冠林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Spreadtrum Communications Shanghai Co Ltd
Original Assignee
Spreadtrum Communications Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Spreadtrum Communications Shanghai Co Ltd filed Critical Spreadtrum Communications Shanghai Co Ltd
Priority to CN201510167313.0A priority Critical patent/CN106156707B/zh
Publication of CN106156707A publication Critical patent/CN106156707A/zh
Application granted granted Critical
Publication of CN106156707B publication Critical patent/CN106156707B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

图像识别方法及装置,所方法包括:获取原始图像;以预设大小的窗口扫描所述原始图像,得到多个候选区域;采用预设的特征学习模型,计算当前候选区域的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值;采用串接式决策分类器中按照复杂度顺序排列的多个强分类器,根据所得到的当前候选区域的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值,分别计算当前候选区域的特征分值;当计算得出的当前区域的特征分值分别大于相应强分类器的分值阈值时,确定当前候选区域为目标对象的图像。上述的方案可以提高图像识别的准确率,并降低运算量,提高图像识别的速度。

Description

图像识别方法及装置
技术领域
本发明涉及图像识别技术领域,特别是涉及一种图像识别方法及装置、移动终端。
背景技术
图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。
现有技术中的对人脸、物件等目标对象的图像识别方法,采用较为简单的矩形特征模板作为对象的特征表征,然而,这种识别方法的识别准确性不高;同时,较为简单的矩形特征模板也使得最终选出的代表性矩形特征模板较多,导致分类时需要进行较多的运算。因此,现有技术中的图像识别方法存在着识别准确率低及运算量大的问题。
发明内容
本发明实施例解决的问题是如何提高图像识别的准确率,并降低运算量。
为解决上述问题,本发明实施例提供了一种图像识别方法,所述方法包括:
获取原始图像;
以预设大小的窗口扫描所述原始图像,得到多个候选区域;
采用预设的特征学习模型,计算当前候选区域的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值;其中,所述特征学习模型中包括具有分类意义的矩形影像域矩形积分影像特征对应的弱分类器及其权重、及影像梯度域矩形积分影像特征对应的弱分类器及其权重的信息;
采用串接式决策分类器中按照复杂度顺序排列的多个强分类器,根据所得到的当前候选区域的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值,分别计算当前候选区域的特征分值;其中,采用自适应增强算法对所述特征学习模型中包括具有分类意义的矩形影像域矩形积分影像特征对应的弱分类器及其权重、及影像梯度域矩形积分影像特征对应的弱分类器及其权重进行训练得到所述多个强分类器;
当计算得出的当前区域的特征分值分别大于相应强分类器的分值阈值时,确定当前候选区域为目标对象的图像;
其中,所述影像梯度域矩形积分影像特征的特征值采用如下的公式计算得到:
其中,f1表示影像梯度域矩形积分影像特征的特征值,T1’表示特征值为正的影像梯度域矩形积分影像的个数,T1”表示特征值为负的影像梯度域矩形积分影像的个数,表示第m个特征值为正数的影像梯度域矩形积分影像的特征值,表示第n个特征值为负数的影像梯度域矩形积分影像的特征值;其中:
rii1(x,y)=∑x≤x′≤M1,y≤y′≤N1 ii1(x′,y′),其中,rii1(x,y)表示位置(x,y)为影像梯度域矩形积分影像特征的特征值,ii1(x′,y′)表示(x′,y′)对应的梯度值,M1、N1分别表示影像域矩形积分影像中x方向和y方向上的最大位置坐标。
可选地,所述采用自适应增强算法对所述特征学习模型中包括具有分类意义的矩形影像域矩形积分影像特征对应的弱分类器及其权重、及影像梯度域矩形积分影像特征对应的弱分类器及其权重进行训练得到所述多个强分类器,包括:
采用目标对象与非目标对象的影像集,计算得到对应的影像梯度域矩形积分影像和影像域矩形积分影像;
分别采用所得到的影像梯度域矩形积分影像和影像域矩形积分影像,计算得到相应的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值,构成所述影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值的训练样本集;
采用机器学习的方法对所述训练样本集中的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值进行训练,得到各个影像梯度域矩形积分影像特征对应的弱分类器及其权重,及影像梯度域矩形积分影像特征对应的弱分类器及其权重;
采用自适应增强算法从所构建的弱分类器中选取具有分类意义的弱分类器进行线性组合,构建得到所述多个强分类器。
可选地,所述影像域矩形积分影像特征包括至少一个影像域矩形积分影像。
可选地,当所述影像域矩形积分影像特征包括两个以上的影像域矩形积分影像时,各个影像域矩形积分影像的尺寸相同。
可选地,当所述影像域矩形积分影像特征包括两个以上的影像域矩形积分影像时,各个影像域矩形积分影像的尺寸不同。
可选地,所述影像域矩形积分影像特征的特征值采用如下的公式计算得到:
其中,f2表示影像域矩形积分影像特征的特征值,T2’表示特征值为正的影像域矩形积分影像的个数,T2”表示特征值为负的影像域矩形积分影像的个数,表示第m个特征值为正数的影像域矩形积分影像的特征值,表示第n个特征值为负数的影像域矩形积分影像的特征值;其中:
rii2(x,y)=∑x≤x′≤M2,y≤y′≤N2 ii2(x′,y′);其中,rii2(x,y)表示位置(x,y)对应的影像域矩形积分影像特征的特征值,ii2(x′,y′)表示(x′,y′)对应的梯度值,M2、N2分别表示影像域矩形积分影像中x方向和y方向上的最大位置坐标。
可选地,所述影像梯度域矩形积分影像包括至少一个影像梯度域矩形积分影像。
可选地,当所述影像梯度域矩形积分影像特征包括两个以上的影像梯度域矩形积分影像时,各个影像梯度域矩形积分影像的尺寸相同。
可选地,当所述影像梯度域矩形积分影像特征包括两个以上的影像梯度域矩形积分影像时,各个梯度域矩形积分影像的尺寸不同。
可选地,所述梯度值为垂直方向上或水平方向上相邻的两个影像梯度域矩形积分影像的像素值之间的差值。
本发明实施例还提供了一种图像识别装置,所述装置包括:
获取单元,适于获取原始图像;
候选区域选取单元,适于以预设大小的窗口扫描所述原始图像,得到多个候选区域;
建模单元,适于采用机器学习的方法对目标对象和非目标对象的影像对应的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值进行训练,得到预设的特征学习模型;所述特征学习模型中包括具有分类意义的矩形影像域矩形积分影像特征对应的弱分类器及其权重、及影像梯度域矩形积分影像特征对应的弱分类器及其权重的信息;
运算单元,适于采用预设的特征学习模型,计算当前候选区域的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值;
串接式决策分类单元,适于采用串接式决策分类器中按照复杂度顺序排列的多个强分类器,根据所得到的当前候选区域的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值,分别计算当前候选区域的特征分值;当计算得出的当前区域的特征分值分别大于相应强分类器的分值阈值时,确定当前候选区域为目标对象的图像;
所述建模单元还适于所述特征学习模型中的具有分类意义的矩形影像域矩形积分影像特征对应的弱分类器及其权重、及影像梯度域矩形积分影像特征对应的弱分类器及其权重进行训练得到所述多个强分类器;
其中,所述影像梯度域矩形积分影像特征的特征值采用如下的公式计算得到:
其中,f1表示影像梯度域矩形积分影像特征的特征值,T1’表示特征值为正的影像梯度域矩形积分影像的个数,T1”表示特征值为负的影像梯度域矩形积分影像的个数,表示第m个特征值为正数的影像梯度域矩形积分影像的特征值,表示第n个特征值为负数的影像梯度域矩形积分影像的特征值;其中:
rii1、(x,y)=∑x≤x′≤M1,y≤y′≤N1 ii1(x′,y′),其中,rii1(x,y)表示位置(x,y)为影像梯度域矩形积分影像特征的特征值,ii1(x′,y′)表示(x′,y′)对应的梯度值,M1、N1分别表示影像域矩形积分影像中x方向和y方向上的最大位置坐标。
可选地,所述建模单元包括:
第一运算子单元,适于采用目标对象与非目标对象的影像集,计算得到对应的影像梯度域矩形积分影像和影像域矩形积分影像;
第二运算子单元,适于分别采用所得到的影像梯度域矩形积分影像和影像域矩形积分影像,计算得到相应的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值,构成所述影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值的训练样本集;
机器学习子单元,适于采用机器学习的方法对所述训练样本集中的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值进行训练,得到各个影像梯度域矩形积分影像特征对应的弱分类器及其权重,及影像梯度域矩形积分影像特征对应的弱分类器及其权重;
强分类器构建子单元,适于采用自适应增强算法从所构建的弱分类器中选取具有分类意义的弱分类器进行线性组合,构建得到所述多个强分类器。
可选地,所述影像域矩形积分影像特征包括至少一个影像域矩形积分影像。
可选地,所述影像梯度域矩形积分影像包括至少一个影像梯度域矩形积分影像。
与现有技术相比,本发明的技术方案具有以下的优点:
上述的方案,通过包含影像域矩形积分影像特征和影像梯度域矩形积分影像特征训练得到特征学习模型和强分类器,与仅采用影像域矩形积分影像特征进行训练相比,提取了更多的特征信息,因而所得到的特征学习模型和强分类器可以更加准确地表征目标对象,因此,可以提高图像识别的准确率。同时,更为准确的特征学习模型也使得最终选出的影像域矩形积分影像特征和影像梯度域矩形积分影像特征的数量减少,因而可以降低最终分类时的运算量,提高图像识别的速度。
进一步地,由于影像域矩形积分影像特征可包含由单个或多个不同尺寸的影像域矩形积分影像组成,可以采用更加多样的特征组合成相应的影像域矩形积分影像特征,使得训练得到的特征学习模型更加符合目标对象的特征,因而可以进一步提高图像识别的正确率。
进一步地,由于影像梯度域矩形积分影像特征可包含由单个或多个不同尺寸的影像域矩形积分影像组成,可以采用更加多样的特征组合成相应的影像梯度域矩形积分影像特征,使得训练得到的特征学习模型更加符合目标对象的特征,因而可以进一步提高图像识别的正确率。
附图说明
图1是本发明实施例中的一种采用机器训练法训练得到预设的特征学习模型的流程图;
图2是本发明实施例中的包括一个影像域矩形积分影像的影像域矩形积分影像特征的示意图;
图3是本发明实施例中的本发明实施例中的包括两个影像域矩形积分影像的影像域矩形积分影像特征的示意图;
图4是本发明实施例中的本发明实施例中的包括三个影像域矩形积分影像的影像域矩形积分影像特征的示意图;
图5是本发明实施例中的本发明实施例中的包括四个影像域矩形积分影像的影像域矩形积分影像特征的示意图;
图6是本发明实施例中的包括一个影像梯度域矩形积分影像的影像梯度域矩形积分影像特征的示意图;
图7是本发明实施例中的本发明实施例中的包括两个影像梯度域矩形积分影像的影像梯度域矩形积分影像特征示意图;
图8是本发明实施例中的本发明实施例中的包括三个影像梯度域矩形积分影像的影像梯度域矩形积分影像特征示意图;
图9是本发明实施例中的本发明实施例中的包括四个影像梯度域矩形积分影像的影像梯度域矩形积分影像特征示意图;
图10是本发明实施例中一种图像识别方法的流程图;
图11是本发明实施例中的一种图像识别装置的结构示意图。
具体实施方式
对象侦测与辨识可应用于很多领域,以人脸侦测为例,近年来,已有许多关于人脸侦测的技术研究被发表,其中使用的方法约略可分为基于经验(knowledge-based),基于特征(feature-based)、样本匹配(template matching)和基于统计(statistical-based)等图像识别方法。但是,上述的图像识别方法一般存在着识别准确率低或者运算复杂的问题。
为克服上述问题,现有技术中提出了一种基于积分影像(Integral Image)特征的自适应增强(AdaBoost)方法,使用一些矩形特征来侦测人脸,可以消除人脸的五官会因光照产生明或暗的区块对图像识别的造成影响,可以提高人脸识别的准确率。
具体而言,这种图像识别方法将矩形作为人脸侦测的特征向量(又称矩形特征),将积分影像概念应用到矩形特征值的计算上,由Haar小波转换延伸出Haar-like矩形特征,定义许多矩形特征影像(Retangle Integal Image)模板。然后,以Adaboost算法来训练特征值,得到各个阶层分类器判断时用到门槛值。换句话说,该方法会为某一特有的矩形特征做Adaboost建模得到相应的强分类器,并将训练得到的强分类器按照复杂程度从低到高的方式串接起来,构成所谓的串接式决策分类器(Cascade Classifier)。
但是,这种方法采用较为简单的矩形特征模板。作为人脸或物件的特征表征,造成识别准确性不高;同时,较为简单的矩形特征模板也使得最终选出的代表性矩形特征模板较多,使得在最终进行分类时需要进行大量的运算。因此,现有技术中的图像识别方法存在着识别准确率低其运算量大的问题。
为解决现有技术中存在的上述问题,本发明实施例采用的技术方案通过包含影像域矩形积分影像特征和影像梯度域矩形积分影像特征训练得到特征学习模型和强分类器,可以提高图像识别的准确率。同时,更为准确的特征学习模型可以降低最终分类时的运算量,提高图像识别的速度。
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
为了便于理解,首先对于本发明实施例中的如何通过离线训练得到相应的特征学习模型和串接式决策分类器中的强分类器的过程做详细的介绍。
图1示出了本发明实施例中的采用自适应增强算法对影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值训练样本集进行训练得到所述强分类器的流程图。
如图1所示,采用自适应增强算法对影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值训练样本集进行训练,可以得到所述多个强分类器,具体可以包括如下步骤:
步骤S101:采用目标对象与非目标对象的影像集,计算得到对应的影像梯度域矩形积分影像和影像域矩形积分影像。
在具体实施中,可以获取目标对象与非目标对象的影像集中的目标对象的影像和非目标对象的影像,通过计算,得到对应的影像梯度域矩形积分影像和影像域矩形积分影像。
步骤S102:分别采用所得到的影像梯度域矩形积分影像和影像域矩形积分影像,计算得到相应的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值,构成所述影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值的训练样本集。
在本发明实施例中,所选取的特征可以包括影像域矩形积分影像特征和影像梯度域矩形积分影像特征。
在具体实施中,影像域矩形积分影像特征可以包括一个以上的影像域矩形积分影像。其中,各个影像域矩形积分影像特征中包括的影像域矩形积分影像的尺寸和位置也不做具体的限定,可以根据实际的需要进行设置。这样通过将不同尺寸、数量和相对位置的影像域矩形积分影像进行组合,便可以得到更多样的影像域矩形积分影像特征,因而使得训练得出的特征学习模型可以更加准确地代表目标对象,从而可以进一步提高图像识别的正确率。
请参见图2-5所示,影像域矩形积分影像特征200包括一个影度域矩形积分影像21、影像域矩形积分影像特征301-306分别包括了两个影像域矩形积分影像31a、32a、31b、32b、31c、32c、31d、32d、31e、32e、31f、32f,影像域矩形积分影像特征401-406分别包括三个影像域矩形积分影像41a、42a、43a、41b、42b、43b、41c、42c、43c、41d、42d、43d、41e、42e、43e、41f、42f、83f,影像域矩形积分影像特征501-506分别包括四个影像域矩形积分影像51a、52a、53a、54a、51b、52b、53b、54b、51c、52c、53c、54c、51d、52d、53d、54d、51e、52e、53e、54e、51f、52f、53f、54f。其中,空白的影像域矩形积分影像表示特征值为正的影像域矩形积分影像,填充有斜线的影像域矩形积分影像为特征值为负的影像域矩形积分影像。
其中,影像域矩形积分影像特征的特征值可以采用如下的公式计算得到:
其中,f2表示影像域矩形积分影像特征的特征值,T2’表示特征值为正的影像域矩形积分影像的个数,T2”表示特征值为负的影像域矩形积分影像的个数,表示第m个特征值为正数的影像域矩形积分影像的特征值,表示第n个特征值为负数的影像域矩形积分影像的特征值。
其中,各个影像域矩形积分影像特征中的影像域矩形积分影像的特征值采用如下的公式计算得到:
rii2(x,y)=∑x≤x′≤M2,y≤y′≤N2 ii2(x′,y′) (2)
其中,rii2(x,y)表示位置(x,y)对应的影像域矩形积分影像特征的特征值,(x′,y′)表示位于位置(x,y)右下方的像素位置,ii2(x′,y′)表示(x′,y′)对应的像素值,M2、N2分别表示影像域矩形积分影像中x方向和y方向上的最大位置坐标。
与影像域矩形积分影像特征相类似地,影像梯度域矩形积分影像特征可以包括一个以上的影像梯度域矩形积分影像。其中,各个影像梯度域矩形积分影像特征中包括的影像梯度域矩形积分影像的尺寸和位置也不做具体的限定,可以根据实际的需要进行设置。这样通过将不同尺寸、数量和相对位置的影像梯度域矩形积分影像进行组合得到更多样的影像梯度域矩形积分影像特征,因而使得训练得出的特征学习模型可以更加准确地代表目标对象,从而可以进一步提高图像识别的正确率。
请参见图6-9所示,影像梯度域矩形积分影像61的影像梯度域矩形积分影像特征600、影像梯度域矩形积分影像特征701-706分别包括了两个影像梯度域矩形积分影像71a、72a、71b、72b、71c、72c、71d、72d、71e、72e、71f、72f,影像梯度域矩形积分影像特征801-806分别包括三个影像梯度域矩形积分影像81a、82a、83a、81b、82b、83b、81c、82c、83c、81d、82d、83d、81e、82e、83e、81f、82f、83f,影像梯度域矩形积分影像特征901-906包括四个影像梯度域矩形积分影像91a、92a、93a、94a、91b、92b、93b、94b、91c、92c、93c、94c、91d、92d、93d、94d、91e、92e、93e、94e、91f、92f、93f、94f。其中,空白的影像梯度域矩形积分影像表示特征值为正的影像梯度域矩形积分影像,填充有斜线的影像梯度域矩形积分影像为特征值为负的影像梯度域矩形积分影像。
其中,影像梯度域矩形积分影像特征的特征值采用如下的公式计算得到:
其中,f1表示影像梯度域矩形积分影像特征的特征值,T1’表示特征值为正的影像梯度域矩形积分影像的个数,T1”表示特征值为负的影像梯度域矩形积分影像的个数,表示第m个特征值为正数的影像梯度域矩形积分影像的特征值,表示第n个特征值为负数的影像梯度域矩形积分影像的特征值。
其中,各个影像梯度域矩形积分影像特征中的影像域矩形积分影像的特征值可以采用如下的公式计算得到:
rii1(x,y)=∑x≤x′≤M1,y≤y′≤N1 ii1(x′,y′) (4)
其中,rii1(x,y)表示位置(x,y)对应的影像梯度域矩形积分影像特征的特征值,(x′,y′)表示位于(x,y)右下方的像素点,ii1(x′,y′)表示(x′,y′)对应的梯度值,M1、N1分别表示x方向和y方向上的最大像素点的位置坐标。
其中,本发明实施例中使用到的梯度值可以采用多种方法计算得到。在本发明实施例中,为了节省计算资源,所使用的梯度值可以采用垂直或者水平梯度值,即垂直或者水平方向上相邻两个影像像素值之差。
在具体实施中,在各个影像域矩形积分影像特征中所包括的影像域矩形积分影像的个数和尺寸(长和宽),各个影像梯度域矩形积分影像特征中所包括的影像梯度域矩形积分影像的个数和尺寸,均可以根据实际的需要进行设置。
这样,在通过目标对象与非目标对象的影像集,得到对应的影像梯度域矩形积分影像和影像域矩形积分影像之后,便可以采用上述的方式计算得到数量众多的影像域矩形积分影像特征和特征值,以及影像梯度域矩形积分影像特征和特征值。
步骤S103:采用机器学习的方法对所述训练样本集中的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值进行训练,得到各个影像梯度域矩形积分影像特征对应的弱分类器及其权重,及影像梯度域矩形积分影像特征对应的弱分类器及其权重。
在具体实施中,当得到数量众多的影像域矩形积分影像特征和特征值,以及影像梯度域矩形积分影像特征和特征值之后,便可以采用机器学习的方法对所得到的影像域矩形积分影像特征和特征值,以及影像梯度域矩形积分影像特征和特征值进行训练,得到对于目标对象的识别具有分类意义的影像梯度域矩形积分影像特征和影像梯度域矩形积分影像特征对应的弱分类器及其权重。
例如,开始训练时使用到的影像域矩形积分影像特征和影像梯度域矩形积分影像特征的个数为10000个。那么经过机器学习后,便可以从10000个影像域矩形积分影像特征和影像梯度域矩形积分影像特征中,选取对于目标对象的图像识别具有分类意义的100个影像域矩形积分影像特征和影像梯度域矩形积分影像特征组成对应的弱分类器及其权重。
其中,本发明实施例中的弱分类器为包括一个或者多个影像域矩形积分影像特征和影像梯度域矩形积分影像特征的分类器,其性能略好于随机分类器。
步骤S104:采用自适应增强算法从所构建的弱分类器中选取具有分类意义的弱分类器进行线性组合,构建得到所述多个强分类器。
在具体实施中,当得到对于目标对象的识别具有分类意义的影像梯度域矩形积分影像特征对应的弱分类器及其权重,及影像梯度域矩形积分影像特征对应的弱分类器及其权重时,可以通过自适应增强算法,如AdaBoost算法从对目标对象的识别具有分类意义的影像梯度域矩形积分影像特征对应的弱分类器及其权重,及影像梯度域矩形积分影像特征对应的弱分类器及其权重进行相应的迭代运算,得到对应的强分类器。
其中,各个所述强分类器可表示为:
H=sign(∑t=0 to Iαtht-b) (5)
其中,H表示强分类器,I为迭代的次数,αt为AdaBoost迭代过程中得到各个弱分类器的权重值,ht为第t次迭代的弱分类器,b为预设的阈值。
当给定一个待识别的图像时,便可以使用上述得到相应的特征学习模型和串接式的多个强分类器,对图像进行识别,具体请参见图10所示。
图10示出了本发明实施例中的一种图像识别方法的流程图。如图10所示的图像识别方法,可以包括:
步骤S1001:获取原始图像。
在具体实施中,所获取的原始图像为待识别的图像。
步骤S1002:以预设大小的窗口扫描所述原始图像,得到多个候选区域。
在具体实施中,可以以N*N窗口扫描所述原始图像,每扫描一次所得到的子窗口图像,作为一个候选区域。例如,以20*20窗口扫描原始图像得到锁个候选区域。其中,扫描得到的多个候选区域中相邻的候选区域之间部分重叠。
步骤S1003:采用预设的特征学习模型,计算当前候选区域的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值。
在具体实施中,所述特征学习模型中包括具有分类意义的矩形影像域矩形积分影像特征对应的弱分类器及其权重、及影像梯度域矩形积分影像特征对应的弱分类器及其权重的信息。那么使用对应的特征学习模型便可以确定相应的矩形影像域矩形积分影像特征和影像梯度域矩形积分影像特征,通过所确定的影像域矩形积分影像特征和影像梯度域矩形积分影像特征,便可以采用公式(1)-(4)计算得到相应的影像域矩形积分影像特征值和影像梯度域矩形积分影像特征值。
步骤S1004:采用串接式决策分类器中按照复杂度顺序排列的多个强分类器,根据所得到的当前候选区域的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值,分别计算当前候选区域的特征分值。
在具体实施中,所述串接式决策分类器中按照复杂度顺序排列的多个强分类器,即所述串接式决策分类器包括多个串联连接的强分类器,其中,位序在先的强分类器为采用较少的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值进行训练得到,对于目标对象的图像的识别能力较低。位于位序在后的强分类器为采用较多的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值进行训练得到,对于目标对象的图像的识别能力较低。
在获取到相应的候选区域时,串接式决策分类器中各个强分类器,按照顺序将当前候选区域中与当前强分类器对应的各个影像域矩形积分影像特征值和各个影像梯度域矩形积分影像特征值,分别与相应的权重进行乘法运算后再进行相加,得到当前强分类器的特征分值。
步骤S1005:当计算得出的当前区域的特征分值分别大于相应强分类器的分值阈值时,确定当前候选区域为目标对象的图像。
在具体实施中,串接式决策分类器中的各个强分类器在计算得出对应的特征分值时,将计算得出的特征分值与当自身的分值阈值进行比较。当计算得出的特征分值大于对应的分值阈值时,便可以接着由下一个强分类器按照同样的方式对当前候选区域的运算。这样通过各个强分类器的层层判定,确定各个强分类器计算得出的分值阈值均大于对应的分值阈值时,便可以确定当前候选区域为目标对象的图像。反之,在当前强分类器计算得出的特征分值小于对应的分值阈值时,则终止,后续的强分类器将不再对当前候选区域进行判定,并可以确定当前候选区域为非目标对象的图像。
图11示出了本发明实施例中的一种图像识别装置的结构示意图。如图11所示的图像识别装置1100,可以包括获取单元1101、候选区域选取单元1102、建模单元1103、运算单元1104和串接式决策分类单元1105,其中:
获取单元1101,适于获取原始图像。
候选区域选取单元1102,适于以预设大小的窗口扫描所述原始图像,得到多个候选区域。
建模单元1103,适于采用机器学习的方法对目标对象和非目标对象的影像对应的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值进行训练,得到预设的特征学习模型;所述特征学习模型中包括具有分类意义的矩形影像域矩形积分影像特征对应的弱分类器及其权重、及影像梯度域矩形积分影像特征对应的弱分类器及其权重的信息;还适于采用自适应增强算法对特征学习模型中包括具有分类意义的矩形影像域矩形积分影像特征对应的弱分类器及其权重、及影像梯度域矩形积分影像特征对应的弱分类器及其权重进行训练得到所述多个强分类器。
运算单元1104,适于采用预设的特征学习模型,计算当前候选区域的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值。
串接式决策分类单元1105,适于采用串接式决策分类器中按照复杂度顺序排列的多个强分类器,根据所得到的当前候选区域的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值,分别计算当前候选区域的特征分值;当计算得出的当前区域的特征分值分别大于相应强分类器的分值阈值时,确定当前候选区域为目标对象的图像。其中,采用自适应增强算法对影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值的训练样本集进行训练得到所述多个强分类器。
其中,所述影像梯度域矩形积分影像特征的特征值采用如下的公式计算得到:
其中,f1表示影像梯度域矩形积分影像特征的特征值,T1’表示特征值为正的影像梯度域矩形积分影像的个数,T1”表示特征值为负的影像梯度域矩形积分影像的个数,表示第m个特征值为正数的影像梯度域矩形积分影像的特征值,表示第n个特征值为负数的影像梯度域矩形积分影像的特征值;其中:
rii1(x,y)=∑x≤x′≤M1,y≤y′≤N1 ii1(x′,y′),其中,rii1(x,y)表示位置(x,y)为影像梯度域矩形积分影像特征的特征值,ii1(x′,y′)表示(x′,y′)对应的梯度值,M1、N1分别表示影像域矩形积分影像中x方向和y方向上的最大位置坐标
在具体实施中,所述建模单元1103可以包括::
第一运算子单元11031,适于采用目标对象与非目标对象的影像集,计算得到对应的影像梯度域矩形积分影像和影像域矩形积分影像;
第二运算子单元11032,适于分别采用所得到的影像梯度域矩形积分影像和影像域矩形积分影像,计算得到相应的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值,构成所述影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值的训练样本集;
机器学习子单元11033,适于采用机器学习的方法对所述训练样本集中的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值进行训练,得到各个影像梯度域矩形积分影像特征对应的弱分类器及其权重,及影像梯度域矩形积分影像特征对应的弱分类器及其权重;
强分类器构建子单元11034,适于采用自适应增强算法从所构建的弱分类器中选取具有分类意义的弱分类器进行线性组合,构建得到所述多个强分类器。
在具体实施中,所述影像域矩形积分影像特征包括至少一个影像域矩形积分影像,所述影像梯度域矩形积分影像包括至少一个影像梯度域矩形积分影像。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上对本发明实施例的方法及系统做了详细的介绍,本发明并不限于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (14)

1.一种图像识别方法,其特征在于,包括:
获取原始图像;
以预设大小的窗口扫描所述原始图像,得到多个候选区域;
采用预设的特征学习模型,计算当前候选区域的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值;其中,所述特征学习模型中包括具有分类意义的矩形影像域矩形积分影像特征对应的弱分类器及其权重、及影像梯度域矩形积分影像特征对应的弱分类器及其权重的信息;
采用串接式决策分类器中按照复杂度顺序排列的多个强分类器,根据所得到的当前候选区域的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值,分别计算当前候选区域的特征分值;其中,采用自适应增强算法对所述特征学习模型中的具有分类意义的矩形影像域矩形积分影像特征对应的弱分类器及其权重、及影像梯度域矩形积分影像特征对应的弱分类器及其权重进行训练得到所述多个强分类器;
当计算得出的当前区域的特征分值分别大于相应强分类器的分值阈值时,确定当前候选区域为目标对象的图像;
其中,所述影像梯度域矩形积分影像特征的特征值采用如下的公式计算得到:
其中,f1表示影像梯度域矩形积分影像特征的特征值,T1’表示特征值为正的影像梯度域矩形积分影像的个数,T1”表示特征值为负的影像梯度域矩形积分影像的个数,表示第m个特征值为正数的影像梯度域矩形积分影像的特征值,表示第n个特征值为负数的影像梯度域矩形积分影像的特征值;其中:
rii1(x,y)=∑x≤x′≤M1,y≤y′≤N1ii1(x′,y′),其中,rii1(x,y)表示位置(x,y)为影像梯度域矩形积分影像特征的特征值,ii1(x′,y′)表示(x′,y′)对应的梯度值,M1、N1分别表示影像域矩形积分影像中x方向和y方向上的最大位置坐标。
2.根据权利要求1所述的图像识别方法,其特征在于,所述采用自适应增强算法对所述特征学习模型中的具有分类意义的矩形影像域矩形积分影像特征对应的弱分类器及其权重、及影像梯度域矩形积分影像特征对应的弱分类器及其权重进行训练得到所述多个强分类器,包括:
采用目标对象与非目标对象的影像集,计算得到对应的影像梯度域矩形积分影像和影像域矩形积分影像;
分别采用所得到的影像梯度域矩形积分影像和影像域矩形积分影像,计算得到相应的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值,构成所述影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值的训练样本集;
采用机器学习的方法对所述训练样本集中的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值进行训练,得到各个影像梯度域矩形积分影像特征对应的弱分类器及其权重,及影像梯度域矩形积分影像特征对应的弱分类器及其权重;
采用自适应增强算法从所构建的弱分类器中选取具有分类意义的弱分类器进行线性组合,构建得到所述多个强分类器。
3.根据权利要求2所述的图像识别方法,其特征在于,所述影像域矩形积分影像特征包括至少一个影像域矩形积分影像。
4.根据权利要求3所述的图像识别方法,其特征在于,当所述影像域矩形积分影像特征包括两个以上的影像域矩形积分影像时,各个影像域矩形积分影像的尺寸相同。
5.根据权利要求3所述的图像识别方法,其特征在于,当所述影像域矩形积分影像特征包括两个以上的影像域矩形积分影像时,各个影像域矩形积分影像的尺寸不同。
6.根据权利要求5所述的图像识别方法,其特征在于,所述影像域矩形积分影像特征的特征值采用如下的公式计算得到:
其中,f2表示影像域矩形积分影像特征的特征值,T2’表示特征值为正的影像域矩形积分影像的个数,T2”表示特征值为负的影像域矩形积分影像的个数,表示第m个特征值为正数的影像域矩形积分影像的特征值,表示第n个特征值为负数的影像域矩形积分影像的特征值;其中:
rii2(x,y)=∑x≤x′≤M2,y≤y′≤N2ii2(x′,y′);其中,rii2(x,y)表示位置(x,y)对应的影像域矩形积分影像特征的特征值,ii2(x′,y′)表示位置(x′,y′)对应的像素值,表示对应的梯度值,M2、N2分别表示影像域矩形积分影像中x方向和y方向上的最大位置坐标。
7.根据权利要求2所述的图像识别方法,其特征在于,所述影像梯度域矩形积分影像包括至少一个影像梯度域矩形积分影像。
8.根据权利要求7所述的图像识别方法,其特征在于,当所述影像梯度域矩形积分影像特征包括两个以上的影像梯度域矩形积分影像时,各个影像梯度域矩形积分影像的尺寸相同。
9.根据权利要求7所述的图像识别方法,其特征在于,当所述影像梯度域矩形积分影像特征包括两个以上的影像梯度域矩形积分影像时,各个梯度域矩形积分影像的尺寸不同。
10.根据权利要求1所述的图像识别方法,其特征在于,所述梯度值为垂直方向上或水平方向上相邻的两个影像梯度域矩形积分影像的像素值之间的差值。
11.一种图像识别装置,其特征在于,包括:
获取单元,适于获取原始图像;
候选区域选取单元,适于以预设大小的窗口扫描所述原始图像,得到多个候选区域;
建模单元,适于采用机器学习的方法对目标对象和非目标对象的影像对应的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值进行训练,得到预设的特征学习模型;所述特征学习模型中包括具有分类意义的矩形影像域矩形积分影像特征对应的弱分类器及其权重、及影像梯度域矩形积分影像特征对应的弱分类器及其权重的信息;
运算单元,适于采用预设的特征学习模型,计算当前候选区域的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值;
串接式决策分类单元,适于采用串接式决策分类器中按照复杂度顺序排列的多个强分类器,根据所得到的当前候选区域的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值,分别计算当前候选区域的特征分值;当计算得出的当前区域的特征分值分别大于相应强分类器的分值阈值时,确定当前候选区域为目标对象的图像;
所述建模单元还适于所述特征学习模型中的具有分类意义的矩形影像域矩形积分影像特征对应的弱分类器及其权重、及影像梯度域矩形积分影像特征对应的弱分类器及其权重进行训练得到所述多个强分类器;
其中,所述影像梯度域矩形积分影像特征的特征值采用如下的公式计算得到:
其中,f1表示影像梯度域矩形积分影像特征的特征值,T1’表示特征值为正的影像梯度域矩形积分影像的个数,T1”表示特征值为负的影像梯度域矩形积分影像的个数,表示第m个特征值为正数的影像梯度域矩形积分影像的特征值,表示第n个特征值为负数的影像梯度域矩形积分影像的特征值;其中:
rii1(x,y)=∑x≤x′≤M1,y≤y′≤N1ii1(x′,y′),其中,rii1(x,y)表示位置(x,y)为影像梯度域矩形积分影像特征的特征值,ii1(x′,y′)表示(x′,y′)对应的梯度值,M1、N1分别表示影像域矩形积分影像中x方向和y方向上的最大位置坐标。
12.根据权利要求11所述的图像识别装置,其特征在于,所述建模单元包括:
第一运算子单元,适于采用目标对象与非目标对象的影像集,计算得到对应的影像梯度域矩形积分影像和影像域矩形积分影像;
第二运算子单元,适于分别采用所得到的影像梯度域矩形积分影像和影像域矩形积分影像,计算得到相应的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值,构成所述影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值的训练样本集;
机器学习子单元,适于采用机器学习的方法对所述训练样本集中的影像域矩形积分影像特征和特征值,及影像梯度域矩形积分影像特征和特征值进行训练,得到各个影像梯度域矩形积分影像特征对应的弱分类器及其权重,及影像梯度域矩形积分影像特征对应的弱分类器及其权重;
强分类器构建子单元,适于采用自适应增强算法从所构建的弱分类器中选取具有分类意义的弱分类器进行线性组合,构建得到所述多个强分类器。
13.根据权利要求12所述的图像识别装置,其特征在于,所述影像域矩形积分影像特征包括至少一个影像域矩形积分影像。
14.根据权利要求12所述的图像识别装置,其特征在于,所述影像梯度域矩形积分影像包括至少一个影像梯度域矩形积分影像。
CN201510167313.0A 2015-04-09 2015-04-09 图像识别方法及装置 Active CN106156707B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510167313.0A CN106156707B (zh) 2015-04-09 2015-04-09 图像识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510167313.0A CN106156707B (zh) 2015-04-09 2015-04-09 图像识别方法及装置

Publications (2)

Publication Number Publication Date
CN106156707A CN106156707A (zh) 2016-11-23
CN106156707B true CN106156707B (zh) 2019-06-14

Family

ID=57335635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510167313.0A Active CN106156707B (zh) 2015-04-09 2015-04-09 图像识别方法及装置

Country Status (1)

Country Link
CN (1) CN106156707B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874835B (zh) * 2016-12-28 2018-04-03 深圳云天励飞技术有限公司 一种图像处理方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682287A (zh) * 2012-04-17 2012-09-19 电子科技大学 基于显著度信息的行人检测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5950441B2 (ja) * 2012-02-01 2016-07-13 日本電産エレシス株式会社 画像認識装置、画像認識方法および画像認識プログラム
JP2013161126A (ja) * 2012-02-01 2013-08-19 Honda Elesys Co Ltd 画像認識装置、画像認識方法および画像認識プログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682287A (zh) * 2012-04-17 2012-09-19 电子科技大学 基于显著度信息的行人检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Multi-view Human Head Detection in Static Images;Maolin Chen et.al;《MVA2005 IAPR Conference on Machine VIsion Applications》;20050518;第100-103页
基于HOG和Haar_like融合特征的车辆检测;杨慧;《中国优秀硕士学位论文全文数据库 信息科技辑》;20140515(第05期);第8-9、23-42页

Also Published As

Publication number Publication date
CN106156707A (zh) 2016-11-23

Similar Documents

Publication Publication Date Title
CN110348319B (zh) 一种基于人脸深度信息和边缘图像融合的人脸防伪方法
CN106874894B (zh) 一种基于区域全卷积神经网络的人体目标检测方法
JP5025893B2 (ja) 情報処理装置および方法、記録媒体、並びにプログラム
JP4517633B2 (ja) 対象物検出装置及び方法
CN103810490B (zh) 一种确定人脸图像的属性的方法和设备
US8320643B2 (en) Face authentication device
JP6398979B2 (ja) 映像処理装置、映像処理方法および映像処理プログラム
CN112418074A (zh) 一种基于自注意力的耦合姿态人脸识别方法
US20150036879A1 (en) Posture estimating apparatus, posture estimating method and storing medium
CN107633226B (zh) 一种人体动作跟踪特征处理方法
CN107680119A (zh) 一种基于时空上下文融合多特征及尺度滤波的跟踪算法
Zheng et al. Attention-based spatial-temporal multi-scale network for face anti-spoofing
CN109800682B (zh) 驾驶员属性识别方法及相关产品
JP4553044B2 (ja) 集団学習装置及び方法
CN103366171A (zh) 物体检测方法和物体检测装置
CN103971112B (zh) 图像特征提取方法及装置
CN106778687A (zh) 基于局部评估和全局优化的注视点检测方法
CN105023253A (zh) 基于视觉底层特征的图像增强方法
CN101470809A (zh) 一种基于扩展混合高斯模型的运动目标检测方法
CN106780727B (zh) 一种车头检测模型重建方法及装置
CN111091147B (zh) 一种图像分类方法、装置及设备
TW201224955A (en) System and method for face detection using face region location and size predictions and computer program product thereof
CN102236786B (zh) 一种光照自适应的人体肤色检测方法
CN107944437A (zh) 一种基于神经网络和积分图像的人脸定位方法
CN111274964B (zh) 一种基于无人机视觉显著性分析水面污染物的检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant