CN109583482B - 一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法 - Google Patents

一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法 Download PDF

Info

Publication number
CN109583482B
CN109583482B CN201811345537.6A CN201811345537A CN109583482B CN 109583482 B CN109583482 B CN 109583482B CN 201811345537 A CN201811345537 A CN 201811345537A CN 109583482 B CN109583482 B CN 109583482B
Authority
CN
China
Prior art keywords
feature
clbp
kernel
training sample
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811345537.6A
Other languages
English (en)
Other versions
CN109583482A (zh
Inventor
王鑫
张鑫
宁晨
黄凤辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN201811345537.6A priority Critical patent/CN109583482B/zh
Publication of CN109583482A publication Critical patent/CN109583482A/zh
Application granted granted Critical
Publication of CN109583482B publication Critical patent/CN109583482B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands

Abstract

本发明公开了一种基于多特征融合与多核迁移学习的红外人体目标识别方法。首先,基于红外图像特殊的成像机理,对红外场景中的目标提取一种改进的CLBP特征‑‑MSF‑CLBP来表达纹理信息,以及一种改进的局部HOG特征‑‑HOG‑FV来表达形状信息,以发掘目标中的有效特征;其次,针对上述提取到的两种异构特征,采用串联融合的方法进行特征融合,使得对目标特征信息的描述更为客观全面。最后,设计了一种融合多核分类与TrAdaBoost迁移学习框架的分类器,有效地解决了带标签的红外样本图像匮乏的问题,同时增强了待分类数据的区分性,以获取更优的识别效果。该方法从特征提取的改进和分类器的设计两方面着手,改善了特征信息的表达,提升了复杂背景下红外人体目标识别的性能。

Description

一种基于多特征融合与多核迁移学习的红外人体目标图像识 别方法
技术领域
本发明属于红外图像处理和模式识别技术领域,尤其涉及一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法。
背景技术
红外场景下的人体目标识别是红外图像处理和模式识别领域中一个重要的研究分支,其已广泛应用于视频监控,目标跟踪和汽车辅助驾驶系统等实际应用中。为了实现红外图像中人体目标的有效识别,关键在于对人体目标进行准确且全面的特征提取,以及设计合理的分类器来进行分类识别。
首先,在红外图像目标特征提取方面,一直以来,众多学者们提出并改进了很多优秀的特征提取算法,如改进的方向梯度直方图(Histogram of Oriented Gradient,HOG)特征,改进的局部二值模式特征(Local Binary Pattern,LBP),局部强度差异直方图(Histograms of Local Intensity Differences,HLID)特征以及强度自相似(IntensitySelf Similarity,ISS)特征等等。上述的方法通过对红外人体目标提取某单一方面的特征如形状特征或者纹理特征来进行特征表示,这种特征提取的不全面性在一定程度上影响着后续的识别性能。为此,研究者们又提出对红外人体目标图像进行多特征的提取和融合,以提高特征表示的全面性,比如采用HOG与LBP特征来分别表达形状信息和纹理信息,将CSLBP(Center-Symmetric Local Binary Pattern)特征与FPGT特征(Fused Phase,Ggradientand Texture features)进行融合,使用HOG特征与Edgelet特征来分别表达图像中目标的形状特性等等,最终获取的识别性能均优于使用单一特征时的性能。基于以上的分析,可以得出一些结论:首先,采用多特征提取和融合来挖掘图像的特征信息相较于单特征提取方法而言,确实可以提高红外人体目标特征表示的准确性;其次,针对红外人体目标而言,通过HOG特征来表达形状信息以及LBP特征来表达纹理信息已被证明是一种有效的特征表达方式;最后,虽然目前有很多方法提出提取红外人体目标的多种特征,但是这些特征仍然可能属于同一种类型,如Edgelet和HOG特征都属于形状特征,仍然没有从不同的角度对目标进行描述。此外,提取出的特征多为图像的底层特征,缺少了必要的语义信息,限制了识别性能的进一步提升。
其次,在分类器设计环节,针对红外人体目标的识别,常用的分类器有支持向量机(Support Vector Machine,SVM)、基于Adaboost的分类器、基于KNN(K-Nearest Neighbor)的分类器等等。这些分类算法属于传统的机器学习算法,虽然性能可以得到保证,但是它们的训练样本需要满足严格的条件限制:(1)训练样本与测试样本需要满足独立同分布的条件;(2)需要有足够多可利用的训练样本才可能学习得到一个较好的分类模型。然而,在红外图像目标识别分类的实际应用中可以发现,这两个条件一般都很难满足。首先,由于红外图像特殊的成像原理,不同的周围环境对目标图像的分布及语义都极易引起较大的偏差。其次,相比于可见光图像,可利用的带标签的红外样本图像数量少得多,而获取大量新的有效样本则需要付出很大的代价。因此,如何利用少量的带标签训练样本,最终建立一个可靠的模型对目标进行预测和分类显得尤为重要。
迁移学习为解决上述问题提供了新的思路。作为机器学习领域一个新的分支,迁移学习放宽了传统机器学习需要满足的两个基本假设,其目的是通过迁移已有的知识来解决目标领域中仅有少量带标签样本数据的学习问题。现阶段,迁移学习在包括遥感图像目标识别,SAR目标识别等目标识别与分类问题上已经有了成功的应用。因此,当有效的带标签样本数量较少时,利用迁移学习的思想来构造高效的分类器是一种可取的选择。
公开号为CN201611029651.9的基于红外图像的行人检测系统,它在其目标识别单元中将MCS与LBP模式特征进行了特征融合,建立了一个2D的人体概率模型,最后利用分类器进行判定识别。尽管该方法采用了两种特征来进行描述,但这两种特征均属于纹理特征,特征提取的完备性并未得到有效的满足,特征表示的全面性依然可以进一步提升。此外,模型的训练仍然需要大量有效的红外样本图像,加大了成本的投入。
Davis M等人(Davis M,Sahin F.HOG feature human detection system[C]//Systems,Man,and Cybernetics(SMC),2016IEEE International Conference on.IEEE,2016:002878-002883.)使用了HOG与HOD(Histograms of Oriented Depths)两种特征来对红外热图像中的人体目标进行特征表示,提高了特征提取的准确性,并设计了一种多级联分类器来进行识别分类。该方法在一定程度上改善了识别的性能,但是融合的两种特征同属于梯度信息特征,实质上并未从多角度来对图像进行描述,因此仍然存在一定的改进空间。
对于现有的,常用的红外人体目标识别方法,其存在的局限性主要表现在:
(1)在特征提取方面,尽管图像目标单一特征的提取已经可以较好地挖掘出目标在某一方面的特性,但特征信息的不全面事实上降低了图像特征提取的准确性。此外,诸多的多特征提取与融合方法表面上增强了特征描述的完备性,但实际上是对同类型信息的重复描述,相对于单特征提取方法而言确实有一定程度的提升,但多角度的目标特征提取与融合仍然没有得到非常好的实现,后续的识别性能因此可以进一步地提升。
(2)在分类器设计方面,虽然基于传统机器学习算法的分类器在目标分类识别的应用上取得了很多的成果,但是它们严格的使用条件限制阻碍了其在红外人体目标图像的实际应用。如何利用已有的少量带标签红外样本图像以及大量的可见光图像,训练得到一个可靠的模型仍然是一个难点问题。
发明内容
发明目的:针对以上问题,本发明提出一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法,改进了红外人体目标特征的提取,完善了目标的特征表达;将多核分类与TrAdaBoost算法进行了融合,解决了带标签的红外人体目标样本图像匮乏等问题,提高了红外场景下人体目标识别的准确性和鲁棒性。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法,该方法包括如下步骤:
(1)采用红外图像构建训练样本集,可见光图像构建辅助训练样本集;
(2)对训练样本集和辅助训练样本集中的样本图像,提取出经单演信号滤波后进行CLBP特征提取得到特征MSF-CLBP;
(3)对训练样本集和辅助训练样本集中的样本图像,提取出图像的局部HOG特征后进行Fisher Vector编码得到特征HOG-FV;
(4)将上述提取出特征MSF-CLBP与HOG-FV进行串联融合;
(5)设计融合SVM多核分类器,用TrAdaBoost迁移学习框架通过融合所得到的样本特征完成分类器的训练;
(6)利用训练好的分类器对待识别的红外图像进行分类识别,得到识别结果。
进一步的,步骤(1)中,所述可见光图像的数目是红外图像数目的2-3倍。
进一步的,步骤(2)中,对练样本集和辅助训练样本集中的样本图像,提取出经单演信号滤波后进行CLBP特征提取得到特征MSF-CLBP,方法如下:
(2.1)单演信号滤波以原信号的Riesz变换为基础,对于训练样本集中的任意一幅样本图像f(z),坐标为z=(x,y),对应的Riesz变换可表示为:
Figure BDA0001863645580000031
其中,x,y表示的是像素点在x轴和y轴方向上的坐标;z=(x,y),z指的是像素点在二维坐标系中的坐标,包括x轴和y轴两个方向;
则对于图像f(z),经过单演信号滤波后的信号可以表示为:
fM(z)=(f(z),fx(z),fy(z))=(f(z),Rx(z)*f(z),Ry(z)*f(z))
其中,*代表卷积运算。通过计算局部幅值A,局部相位φ以及局部方向θ来对图像进行解析,对应的计算公式如下:
Figure BDA0001863645580000041
(2.2)对上述经单演信号滤波后的图像进行CLBP特征提取,来获取图像的纹理特征MSF-CLBP,通过对图像中圆形子窗口中的像素值进行CLBP_SP,R,CLBP_MP,R以及CLBP_CP,R三种算子的运算以获取像素间差值的符号信息和差量信息以及中心像素点的灰度信息,对应的计算方法如下:
Figure BDA0001863645580000042
Figure BDA0001863645580000043
Figure BDA0001863645580000044
其中,
Figure BDA0001863645580000045
P为所选图像子窗口中像素点的个数;R为所选圆形子窗口的半径;gp为子窗口中像素点的灰度值,gc为中心像素点的灰度值,gn为图像中像素点的灰度值,N为子窗口的个数;
(2.3)将CLBP_SP,R与CLBP_MP,R进行串联,建立一个二维联合直方图,降为一维之后再与CLBP_CP,R进行串联,处理之后所得的特征即为样本图像的MSF-CLBP特征;
(2.4)通过上述方法计算得到源训练样本集与辅助训练样本集的MSF-CLBP特征集,可以分别表示为SMC与DMC
进一步的,步骤(3)中,对练样本集和辅助训练样本集中的样本图像,提取出图像的局部HOG特征后进行Fisher Vector编码得到特征HOG-FV,方法如下:
(3.1)对于一幅样本图像I,在提取局部HOG特征时,首先利用梯度算子[-1,0,1]求取每个像素点的横向梯度和纵向梯度H(x,y)和V(x,y),像素点的梯度幅值M(x,y)和方向O(x,y)通过下列公式计算:
Figure BDA0001863645580000051
O(x,y)=tan-1[V(x,y)/H(x,y)]
(3.2)将I分成若干小单元,该小单元包含了若干个像素点的正方形区域,大小为2*2或4*4,将每个单元划分为9个梯度方向,得到一个9维的向量,把相邻的4个小单元组成一个块,得到一个36维的HOG块向量,然后,通过L2归一化对所得块向量进行处理,并使用PCA方法将特征向量降至30维;
(3.3)对提取出的局部HOG特征向量进行Fisher Vector编码:设样本图像有T个待编码的局部HOG特征描述子,表示为X={xt},t=1,2...,T,其中xt的维数为D维;λ={wii,∑i},i=1,2,...N为GMM的参数集,N为GMM中所选高斯核的个数,wi,μi,∑i分别代表了第i个高斯核的权重,均值向量和协方差矩阵,在GMM中,假设xt,t=1,2,...,T满足独立同分布,则定义:
Figure BDA0001863645580000052
其中,xt相对于GMM的概率密度分布可以表示为:
Figure BDA0001863645580000053
Pi为xt对应于GMM中第i个高斯核的概率分布函数,且xt恰好由第i个高斯核生成的概率为:
Figure BDA0001863645580000054
通过对L(Xλ)求取偏导数,对应于均值μ和方差σ'的梯度向量分别为:
Figure BDA0001863645580000061
Figure BDA0001863645580000062
其中,μi指的是第i个高斯核对应的均值,σi'指的是第i个高斯核对应的方差;
(3.4)将上述所得的两组向量进行串联,即可得到样本图像的HOG-FV特征,通过上述方法得到源训练样本集与辅助训练样本集的HOG-FV特征集,分别表示为SHF与DHF
进一步的,步骤(4)中,将上述提取出特征MSF-CLBP与HOG-FV进行串联融合,方法如下:将前述源训练样本集与辅助训练样本集提取出的MSF-CLBP与HOG-FV特征集进行串联融合,分别得到源训练样本特征集与辅助训练样本特征集Ts=[SMC,SHF],Td=[DMC,DHF]。
进一步的,步骤(5)中,设计融合SVM多核分类器,用TrAdaBoost迁移学习框架通过融合所得到的样本特征完成分类器的训练,方法如下:
(5.1)上述已得源训练样本特征集和辅助训练样本特征集为Ts和Td,则训练样本特征集表示为T=[Ts,Td],源训练样本和辅助训练样本数分别为m和n;
(5.2)选择高斯核径向基核函数作为基本核函数来集成多尺度内核与SVM结合实现多核分类,高斯核径向基函数可以定义为:
Figure BDA0001863645580000063
其中,σ表示高斯核的径向宽度,xi,xj∈T,表示的是T中第i与第j个样本特征,其中,i,j=1,2,...,m+n,遍历所有样本特征,两两样本之间进行计算,并且i≠j;
在进行多核分类时,首先初始化σ的范围[σminmax],选择k个尺度的核函数,其对应的σ满足:σmin≤σ1<σ2<...<σk≤σmax
其次,计算
Figure BDA0001863645580000064
d为待分类特征的维数。
然后,计算σi与σm的距离:
dmi=|σmi|
通过距离dmi的大小来确定和调整对应的系数αi,i=1,2,...,k,距离越小则对应的系数值越大:
Figure BDA0001863645580000071
再对αi进行归一化,得到最终的系数:
Figure BDA0001863645580000072
最后,由确定的核函数以及对应的系数得到需要的多尺度内核K,计算方法如下:
Figure BDA0001863645580000073
其中,Ki表示第i个基本核函数。
(5.3)选取SVM作为TrAdaBoost框架中初始的弱分类器,将集成的多尺度内核K作为SVM的核函数,SVM训练的迭代次数为NI
训练过程的具体操作如下:
首先,初始化权重向量:
Figure BDA0001863645580000074
设置辅助域样本权重调整因子为
Figure BDA0001863645580000075
之后,进行分类器的迭代训练,在第t,1≤t≤NI次迭代过程中:
第一,归一化样本的权重向量:
Figure BDA0001863645580000076
第二,通过当前的SVM分类器对训练样本特征集T中的所有样本特征进行分类,得到样本特征集的分类映射ht:T→Y,Y为样本特征集经分类得到的标签集;
接着,计算ht在Ts上的识别错误率:
Figure BDA0001863645580000081
其中,
Figure BDA0001863645580000082
表示训练样本xi的真实标签,当εt≥0.5时,εt调整为0.499;当εt=0时,εt调整为0.001;
最后,计算源域样本权重调整因子
Figure BDA0001863645580000083
更新训练样本的权重,对分类器进行迭代训练:
Figure BDA0001863645580000084
在完成上述的迭代训练后,可以得到所选SVM最终的分类器映射
Figure BDA0001863645580000085
进一步的,步骤(6)中,利用训练好的分类器对待识别的红外图像进行分类识别,得到识别结果,方法如下:对于一幅待识别红外图像,首先提取出其对应的上述两种MSF-CLBP与HOG-FV异构特征并完成融合,记为feature,利用训练好的分类器进行分类识别,得到最终的识别结果:
Figure BDA0001863645580000086
有益效果:与现有技术相比,本发明的技术方案具有以下有益技术效果:
(1)提出了一种有效的特征提取策略。针对红外人体目标单一特征提取或者多特征提取方法提取信息不全的问题,从纹理信息的角度改进了CLBP特征提取方法,获得了更为健壮的纹理特征表示,从形状信息的角度改进了局部HOG特征,丰富了特征的语义信息表达,对于后续分类识别准确性和效率的提升有着积极的影响。
(2)利用少量的带标签红外样本图像以及大量的可见光图像,借助于TrAdaBoost迁移学习框架,建立了一个可靠的模型完成红外人体目标的识别,较好地解决了传统的机器方法由于带标签的红外人体目标样本数据匮乏、训练样本和测试样本的分布及语义存在偏差而带来的泛化性能差等问题。
附图说明
图1为本发明实施例的框架图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法,该方法包括如下步骤:
第一步,在训练模块中,分别采用红外图像构建源训练样本集,可见光图像构建辅助训练样本集。其中,源训练样本集中由数量较少的红外图像构成,比如400-500张红外图像;辅助训练样本集中含有数量较多的可见光图像,如可见光样本图像的数量为源训练样本集中红外图像数量的2-3倍以上,并且,红外图像包括红外人体图像和红外非人体图像,可见光人体图像包括可见光人体图像和可见光非人体图像。其操作过程如下:
使用LSI Far Infrared Pedestrian Dataset和INRIA Person Dataset这两个公共图像数据集构建源训练样本集和辅助训练样本集。其中,源训练样本集和测试集中的红外图像均来自于LSI Far Infrared Pedestrian Dataset中的Classification Dataset,而辅助训练样本集中的可见光图像来源于INRIA数据集,且辅助训练样本的数量远多于是源训练样本的数量;例如2-3倍以上,并且训练样本图像的大小均应保持一致。
第二步,对于源训练样本集和辅助训练样本集中的样本图像,首先提取出其经单演信号滤波后再进行CLBP特征提取所得的特征MSF-CLBP。
其中,对于源训练样本集中的红外样本图像以及辅助训练样本集中的可见光样本图像,提取出对应的MSF-CLBP特征。MSF-CLBP特征定义为:对样本图像进行单演信号滤波后,通过CLBP特征提取方法所得到的特征。
首先,单演信号滤波以原信号的Riesz变换为基础。对于训练样本集中的任意一幅样本图像f(z),坐标为z=(x,y),对应的Riesz变换可表示为:
Figure BDA0001863645580000091
其中,x,y表示的是像素点在x轴和y轴方向上的坐标;z=(x,y),z指的是像素点在二维坐标系中的坐标,包括x轴和y轴两个方向。
则对于图像f(z),经过单演信号滤波后的信号可以表示为:
fM(z)=(f(z),fx(z),fy(z))=(f(z),Rx(z)*f(z),Ry(z)*f(z))
这里,*代表卷积运算。通过计算局部幅值A,局部相位φ以及局部方向θ来对图像进行解析,对应的计算公式如下:
Figure BDA0001863645580000101
然后,对上述经单演信号滤波后的图像进行CLBP特征提取,来获取图像的纹理特征。通过对图像中圆形子窗口中的像素值进行CLBP_SP,R,CLBP_MP,R以及CLBP_CP,R三种算子的运算以获取像素间差值的符号信息和差量信息以及中心像素点的灰度信息,对应的计算方法如下:
Figure BDA0001863645580000102
Figure BDA0001863645580000103
Figure BDA0001863645580000104
其中,
Figure BDA0001863645580000105
P为所选图像子窗口中像素点的个数;R为所选圆形子窗口的半径;gp为子窗口中像素点的灰度值,gc为中心像素点的灰度值,gn为图像中像素点的灰度值,N为子窗口的个数。
CLBP_SP,R与CLBP_MP,R包含着互补信息,将二者进行串联,建立一个二维联合直方图,降为一维之后再与CLBP_CP,R进行串联,处理之后所得的特征即为样本图像的MSF-CLBP特征。
最终,可以得到源训练样本集与辅助训练样本集的MSF-CLBP特征集,可以分别表示为SMC与DMC
第三步,对于样本集中的样本图像,再提取出图像的局部HOG特征进行FisherVector编码后所得的特征HOG-FV。其中,对训练样本集中的每一幅样本图像提取出其对应的HOG-FV特征。HOG-FV特征定义为:对样本图像的局部HOG特征进行FisherVector编码后所得到的特征,对于一幅样本图像I,在提取局部HOG特征时,首先利用梯度算子[-1,0,1]求取每个像素点的横向梯度和纵向梯度H(x,y)和V(x,y),像素点的梯度幅值M(x,y)和方向O(x,y)可以通过下列公式得到:
Figure BDA0001863645580000111
O(x,y)=tan-1[V(x,y)/H(x,y)]
然后,将I分成若干小单元,该小单元包含了若干个像素点的正方形区域,大小可以取2*2或4*4,每个单元划分为9个梯度方向,可以得到一个9维的向量。把相邻的4个小单元组成一个块,可以得到一个36维的HOG块向量。然后,通过L2归一化对所得块向量进行处理,并使用PCA方法将特征向量降至30维。
接下来,对提取出的局部HOG特征向量进行Fisher Vector编码:设样本图像有T个待编码的局部HOG特征描述子,可表示为X={xt},t=1,2...,T,其中xt的维数为D维。λ={wii,∑i},i=1,2,...N为GMM的参数集,N为GMM中所选高斯核的个数,wi,μi,∑i分别代表了第i个高斯核的权重,均值向量和协方差矩阵,在GMM中,假设xt,t=1,2,...,T满足独立同分布,则可以定义:
Figure BDA0001863645580000112
其中,xt相对于GMM的概率密度分布可以表示为:
Figure BDA0001863645580000113
Pi为xt对应于GMM中第i个高斯核的概率分布函数,且xt恰好由第i个高斯核生成的概率为:
Figure BDA0001863645580000114
通过对L(Xλ)求取偏导数,对应于均值μ和方差σ'的梯度向量分别为:
Figure BDA0001863645580000121
Figure BDA0001863645580000122
其中,μi指的是第i个高斯核对应的均值,σi'指的是第i个高斯核对应的方差。
将上述所得的两组向量进行串联,即可得到样本图像的HOG-FV特征。最终,可以得到源训练样本集与辅助训练样本集的HOG-FV特征集,可以分别表示为SHF与DHF
第四步将前述提取出的两种改进后的特征MSF-CLBP与HOG-FV进行串联融合。
其中,将前述源训练样本集与辅助训练样本集提取出的MSF-CLBP与HOG-FV特征集进行串联融合,分别得到源训练样本特征集与辅助训练样本特征集Ts=[SMC,SHF],Td=[DMC,DHF]。
第五步设计融合多核SVM与TrAdaBoost迁移学习框架的TrAdaBoost_MK分类器,并通过融合所得到的样本特征完成分类器的训练。上述已得源训练样本特征集和辅助训练样本特征集为Ts和Td,则训练样本特征集可以表示为T=[Ts,Td],源训练样本和辅助训练样本数分别为m和n。
首先,选择高斯核径向基核函数作为基本核函数来集成多尺度内核与SVM结合实现多核分类。高斯核径向基函数可以定义为:
Figure BDA0001863645580000123
其中,σ表示高斯核的径向宽度,xi,xj∈T,表示的是T中第i与第j个样本特征,其中,i,j=1,2,...,m+n,遍历所有样本特征,两两样本之间进行计算,并且i≠j。
在进行多核分类时,首先初始化σ的范围[σminmax],选择k个尺度的核函数,其对应的σ满足:σmin≤σ1<σ2<...<σk≤σmax
其次,计算
Figure BDA0001863645580000124
d为待分类特征的维数。
然后,计算σi与σm的距离,i=1,2,...,k:
dmi=|σmi|
通过距离dmi的大小来确定和调整对应的系数αi,i=1,2,...,k,距离越小则对应的系数值越大。
Figure BDA0001863645580000131
再对αi进行归一化,得到最终的系数:
Figure BDA0001863645580000132
最后,由确定的核函数以及对应的系数得到需要的多尺度内核K,计算方法如下:
Figure BDA0001863645580000133
其中,Ki表示第i个基本核函数。
选取SVM作为TrAdaBoost框架中初始的弱分类器,将集成的多尺度内核K作为SVM的核函数,SVM训练的迭代次数为NI
在训练过程中,对于Ts中某个样本的特征,如果在迭代过程中被错误分类,通过更新得到的源域样本权重调整因子βt,1≤t≤NI,增大它的权重,使得其后续分类正确的概率变大;而对于Td中的样本特征,如果在训练过程中被错误分类,通过辅助域样本权重调整因子β,减小对应样本的权重,以降低其对分类模型的负面影响,而正确分类的样本获得了更大的权重,作为有效的辅助样本帮助分类模型的训练。
训练过程的具体操作如下:
首先,初始化权重向量:
Figure BDA0001863645580000134
设置辅助域样本权重调整因子为
Figure BDA0001863645580000141
之后,进行分类器的迭代训练,在第t,1≤t≤NI次迭代过程中:
第一,归一化样本的权重向量:
Figure BDA0001863645580000142
第二,通过当前的SVM分类器对训练样本特征集T中的所有样本特征进行分类,可以得到样本特征集的分类映射ht:T→Y,Y为样本特征集经分类得到的标签集;
接着,计算ht在Ts上的识别错误率:
Figure BDA0001863645580000143
其中,
Figure BDA0001863645580000144
表示训练样本xi的真实标签。当εt≥0.5时,εt调整为0.499;当εt=0时,εt调整为0.001。
最后,计算源域样本权重调整因子
Figure BDA0001863645580000145
更新训练样本的权重,对分类器进行迭代训练:
Figure BDA0001863645580000146
在完成上述的迭代训练后,可以得到所选SVM最终的分类器映射
Figure BDA0001863645580000147
第六步在测试识别模块中,对于一幅待识别红外图像,同样首先提取出其对应的上述两种异构特征并完成融合,记为feature。最后利用训练模块中训练好的分类器进行分类识别,得到最终的识别结果:
Figure BDA0001863645580000148

Claims (6)

1.一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法,其特征在于,该方法包括以下步骤:
(1)采用红外图像构建训练样本集,可见光图像构建辅助训练样本集;
(2)对训练样本集和辅助训练样本集中的样本图像,经单演信号滤波后进行CLBP特征提取得到特征MSF-CLBP;
(3)对训练样本集和辅助训练样本集中的样本图像,提取出图像的局部HOG特征后进行Fisher Vector编码得到特征HOG-FV;
(4)将上述提取出的特征MSF-CLBP与HOG-FV进行串联融合;
(5)设计融合SVM多核分类器,并用TrAdaBoost迁移学习框架对融合所得到的样本特征完成分类器的训练;
(6)利用训练好的分类器对待识别的红外图像进行分类识别,得到识别结果;
步骤(2)中,对练样本集和辅助训练样本集中的样本图像,经单演信号滤波后进行CLBP特征提取得到特征MSF-CLBP,方法如下:
(2.1)单演信号滤波以原信号的Riesz变换为基础,对于训练样本集中的任意一幅样本图像f(z),坐标为z=(x,y),对应的Riesz变换表示为:
Figure FDA0003717358740000011
其中,x,y表示的是像素点在x轴和y轴方向上的坐标;z=(x,y),z指的是像素点在二维坐标系中的坐标,包括x轴和y轴两个方向;
对于图像f(z),经过单演信号滤波后的信号表示为:
fM(z)=(f(z),fx(z),fy(z))=(f(z),Rx(z)*f(z),Ry(z)*f(z))
其中,*代表卷积运算,通过计算局部幅值A,局部相位φ以及局部方向θ来对图像进行解析,对应的计算公式如下:
Figure FDA0003717358740000012
(2.2)对上述经单演信号滤波后的图像进行CLBP特征提取,来获取图像的纹理特征MSF-CLBP,通过对图像中圆形子窗口中的像素值进行CLBP_SP,R,CLBP_MP,R以及CLBP_CP,R三种算子的运算以获取像素间差值的符号信息和差量信息以及中心像素点的灰度信息,对应的计算方法如下:
Figure FDA0003717358740000021
Figure FDA0003717358740000022
Figure FDA0003717358740000023
其中,
Figure FDA0003717358740000024
P为所选图像子窗口中像素点的个数;R为所选圆形子窗口的半径;gp为子窗口中像素点的灰度值,gc为中心像素点的灰度值,gn为图像中像素点的灰度值,N为子窗口的个数;
(2.3)将CLBP_SP,R与CLBP_MP,R进行串联,建立一个二维联合直方图,降为一维之后再与CLBP_CP,R进行串联,处理之后所得的特征即为样本图像的MSF-CLBP特征;
(2.4)通过上述方法计算得到训练样本集与辅助训练样本集的MSF-CLBP特征集,分别表示为SMC与DMC
2.根据权利要求1所述的一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法,其特征在于,步骤(1)中,所述可见光图像的数目是红外图像数目的2-3倍。
3.根据权利要求1所述的一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法,其特征在于,步骤(3)中,对练样本集和辅助训练样本集中的样本图像,提取出图像的局部HOG特征后进行Fisher Vector编码得到特征HOG-FV,方法如下:
(3.1)对于一幅样本图像I,在提取局部HOG特征时,首先利用梯度算子[-1,0,1]求取每个像素点的横向梯度和纵向梯度H(x,y)和V(x,y),像素点的梯度幅值M(x,y)和方向O(x,y)通过下列公式计算:
Figure FDA0003717358740000031
O(x,y)=tan-1[V(x,y)/H(x,y)]
(3.2)将I分成若干单元,该单元包含了若干个像素点的正方形区域,正方形区域大小为2*2或4*4,将每个单元划分为9个梯度方向,得到一个9维的向量,把相邻的4个单元组成一个块,得到一个36维的HOG块向量,然后,通过L2归一化对所得块向量进行处理,并使用PCA方法将特征向量降至30维;
(3.3)对提取出的局部HOG特征向量进行Fisher Vector编码,设样本图像有T个待编码的局部HOG特征描述子,表示为X={xt},t=1,2...,T,其中xt的维数为D维;λ={wii,∑i},i=1,2,...N为GMM的参数集,N为GMM中所选高斯核的个数,wi,μi,∑i分别代表了第i个高斯核的权重,均值向量和协方差矩阵,在GMM中,假设xt,t=1,2,...,T满足独立同分布,则定义:
Figure FDA0003717358740000032
其中,xt相对于GMM的概率密度分布可以表示为:
Figure FDA0003717358740000033
Pi为xt对应于GMM中第i个高斯核的概率分布函数,且xt恰好由第i个高斯核生成的概率为:
Figure FDA0003717358740000034
通过对L(X|λ)求取偏导数,对应于均值μ和方差σ'的梯度向量分别为:
Figure FDA0003717358740000035
Figure FDA0003717358740000036
其中,μi指的是第i个高斯核对应的均值,σ'i指的是第i个高斯核对应的方差;
(3.4)将上述所得的两组向量进行串联,即可得到样本图像的HOG-FV特征,通过上述方法得到训练样本集与辅助训练样本集的HOG-FV特征集,分别表示为SHF与DHF
4.根据权利要求1所述的一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法,其特征在于,步骤(4)中,将上述提取出特征MSF-CLBP与HOG-FV进行串联融合,方法如下:将前述训练样本集与辅助训练样本集提取出的MSF-CLBP与HOG-FV特征集进行串联融合,分别得到训练样本特征集与辅助训练样本特征集Ts=[SMC,SHF],Td=[DMC,DHF]。
5.根据权利要求4所述的一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法,其特征在于,步骤(5)中,设计融合SVM多核分类器,并用TrAdaBoost迁移学习框架对融合所得到的样本特征完成分类器的训练,方法如下:
(5.1)上述已得训练样本特征集和辅助训练样本特征集为Ts和Td,则训练样本特征集表示为T=[Ts,Td],源训练样本和辅助训练样本数分别为m和n;
(5.2)选择高斯核径向基核函数作为基本核函数来集成多尺度内核与SVM结合实现多核分类,高斯核径向基函数可以定义为:
Figure FDA0003717358740000041
其中,σ表示高斯核的径向宽度,xi,xj∈T,表示的是T中第i与第j个样本特征,其中,i,j=1,2,...,m+n,遍历所有样本特征,两两样本之间进行计算,并且i≠j;
在进行多核分类时,首先初始化σ的范围[σminmax],选择k个尺度的核函数,其对应的σ满足:σmin≤σ1<σ2<...<σk≤σmax
其次,计算
Figure FDA0003717358740000042
d为待分类特征的维数;
然后,计算σi与σm的距离:
dmi=|σmi|
通过距离dmi的大小来确定和调整对应的系数αi,i=1,2,...,k,距离越小则对应的系数值越大:
Figure FDA0003717358740000051
再对αi进行归一化,得到最终的系数:
Figure FDA0003717358740000052
最后,由确定的核函数以及对应的系数得到需要的多尺度内核K,计算方法如下:
Figure FDA0003717358740000053
其中,Ki表示第i个基本核函数;
(5.3)选取SVM作为TrAdaBoost框架中初始的弱分类器,将集成的多尺度内核K作为SVM的核函数,SVM训练的迭代次数为NI
训练过程的具体操作如下:
首先,初始化权重向量:
Figure FDA0003717358740000054
设置辅助域样本权重调整因子为
Figure FDA0003717358740000055
进行分类器的迭代训练,在第t,1≤t≤NI次迭代过程中:
第一,归一化样本的权重向量:
Figure FDA0003717358740000056
第二,通过当前的SVM分类器对训练样本特征集T中的所有样本特征进行分类,得到样本特征集的分类映射ht:T→Y,Y为样本特征集经分类得到的标签集;
接着,计算ht在Ts上的识别错误率:
Figure FDA0003717358740000057
其中,
Figure FDA0003717358740000058
表示训练样本xi的真实标签,当εt≥0.5时,εt调整为0.499;当εt=0时,εt调整为0.001;
最后,计算源域样本权重调整因子
Figure FDA0003717358740000061
更新训练样本的权重,对分类器进行迭代训练:
Figure FDA0003717358740000062
在完成上述的迭代训练后,可以得到所选SVM最终的分类器映射
Figure FDA0003717358740000064
6.根据权利要求1所述的一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法,其特征在于,步骤(6)中,利用训练好的分类器对待识别的红外图像进行分类识别,得到识别结果,方法如下:对于一幅待识别红外图像,首先提取出其对应的上述两种MSF-CLBP与HOG-FV异构特征并完成融合,记为feature,利用训练好的分类器进行分类识别,得到最终的识别结果:
Figure FDA0003717358740000063
CN201811345537.6A 2018-11-13 2018-11-13 一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法 Active CN109583482B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811345537.6A CN109583482B (zh) 2018-11-13 2018-11-13 一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811345537.6A CN109583482B (zh) 2018-11-13 2018-11-13 一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法

Publications (2)

Publication Number Publication Date
CN109583482A CN109583482A (zh) 2019-04-05
CN109583482B true CN109583482B (zh) 2022-08-16

Family

ID=65922090

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811345537.6A Active CN109583482B (zh) 2018-11-13 2018-11-13 一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法

Country Status (1)

Country Link
CN (1) CN109583482B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110309870A (zh) * 2019-06-24 2019-10-08 北京工业大学 一种图像分类的方法
CN110427875B (zh) * 2019-07-31 2022-11-11 天津大学 基于深度迁移学习和极限学习机的红外图像目标检测方法
CN110728304B (zh) * 2019-09-12 2021-08-17 西安邮电大学 现场勘验刀具图像识别方法
JP7305501B2 (ja) * 2019-09-25 2023-07-10 株式会社日立国際電気 撮像装置および機械学習処理方法
CN110851783B (zh) * 2019-11-12 2021-10-08 华中科技大学 一种用于脑机接口校准的异构标签空间迁移学习方法
CN111026897A (zh) * 2019-11-19 2020-04-17 武汉大学 一种基于Lie-Fisher遥感图像的场景分类方法和系统
CN111242318B (zh) * 2020-01-13 2024-04-26 拉扎斯网络科技(上海)有限公司 基于异构特征库的业务模型训练方法及装置
CN111553893A (zh) * 2020-04-24 2020-08-18 成都飞机工业(集团)有限责任公司 一种飞机线束自动布线切断标识识别方法
CN111783837B (zh) * 2020-06-05 2023-08-15 西安电子科技大学 一种基于多核学习的特征融合方法
CN111832627B (zh) * 2020-06-19 2022-08-05 华中科技大学 抑制标签噪声的图像分类模型训练方法、分类方法及系统
CN112364859B (zh) * 2020-11-05 2024-03-19 哈尔滨工业大学 一种基于特征优选与融合的多谱段红外目标识别方法
CN112598022A (zh) * 2020-11-30 2021-04-02 北京化工大学 基于集成学习方法的改进fda流程工业故障诊断方法
CN112766180B (zh) * 2021-01-22 2022-07-12 重庆邮电大学 一种基于特征融合和多核学习的行人再识别方法
CN114783072B (zh) * 2022-03-17 2022-12-30 哈尔滨工业大学(威海) 一种基于远域迁移学习的图像识别方法
CN114936252B (zh) * 2022-04-24 2023-01-31 贵州财经大学 一种基于语义特征组的信用卡客户流失数据降维可视化分析方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102011055458A1 (de) * 2010-12-08 2012-06-14 GM Global Technology Operations LLC Adaptierungstechnik zur Erkennung einer freien Fahrbahn mittels verlässlicher lokaler Modellkalibrierung
CN107292246A (zh) * 2017-06-05 2017-10-24 河海大学 基于hog‑pca和迁移学习的红外人体目标识别方法
CN108564130A (zh) * 2018-04-24 2018-09-21 南京师范大学 一种基于单演特征与多核学习的红外目标识别方法
CN108681696A (zh) * 2018-04-28 2018-10-19 河海大学 融合多特征降维和迁移学习的红外目标稳健性识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102011055458A1 (de) * 2010-12-08 2012-06-14 GM Global Technology Operations LLC Adaptierungstechnik zur Erkennung einer freien Fahrbahn mittels verlässlicher lokaler Modellkalibrierung
CN107292246A (zh) * 2017-06-05 2017-10-24 河海大学 基于hog‑pca和迁移学习的红外人体目标识别方法
CN108564130A (zh) * 2018-04-24 2018-09-21 南京师范大学 一种基于单演特征与多核学习的红外目标识别方法
CN108681696A (zh) * 2018-04-28 2018-10-19 河海大学 融合多特征降维和迁移学习的红外目标稳健性识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Enhanced people counting system based head-shoulder detection in dense crowd scenario;HASSAN M A;《 Proceedings of the 6th International Conference on Intelligent and Advanced Systems》;20170113;第1-7页 *
复杂背景下红外人体目标检测算法研究;马也等;《红外技术》;20171120(第11期);第70-76页 *

Also Published As

Publication number Publication date
CN109583482A (zh) 2019-04-05

Similar Documents

Publication Publication Date Title
CN109583482B (zh) 一种基于多特征融合与多核迁移学习的红外人体目标图像识别方法
CN111814584B (zh) 基于多中心度量损失的多视角环境下车辆重识别方法
Hu et al. Vehicle color recognition with spatial pyramid deep learning
WO2019169816A1 (zh) 一种用于精细化识别车辆属性的深度神经网络及训练方法
Su et al. Learning a dense multi-view representation for detection, viewpoint classification and synthesis of object categories
Bai et al. Subset based deep learning for RGB-D object recognition
CN108520226B (zh) 一种基于躯体分解和显著性检测的行人重识别方法
Wang et al. A survey of vehicle re-identification based on deep learning
CN114220124A (zh) 一种近红外-可见光跨模态双流行人重识别方法及系统
JP2008310796A (ja) コンピュータにより実施される、訓練データから分類器を構築し、前記分類器を用いてテストデータ中の移動物体を検出する方法
CN104021375A (zh) 一种基于机器学习的车型识别方法
CN108596195B (zh) 一种基于稀疏编码特征提取的场景识别方法
Caglayan et al. Volumetric object recognition using 3-D CNNs on depth data
Wu et al. Improving pedestrian detection with selective gradient self-similarity feature
Zhang et al. Category modeling from just a single labeling: Use depth information to guide the learning of 2d models
Ren et al. Object detection using boosted local binaries
CN112784722B (zh) 基于YOLOv3和词袋模型的行为识别方法
Sun et al. Multiple-kernel, multiple-instance similarity features for efficient visual object detection
Zhao et al. Learning saliency features for face detection and recognition using multi-task network
Chen et al. Multi-pose face ensemble classification aided by Gabor features and deep belief nets
CN113887509B (zh) 一种基于图像集合的快速多模态视频人脸识别方法
Xu et al. Extended hierarchical Gaussianization for scene classification
Shen et al. A novel distribution-based feature for rapid object detection
Mahmoodzadeh Human Activity Recognition based on Deep Belief Network Classifier and Combination of Local and Global Features
Liu et al. Mixed region covariance discriminative learning for image classification on riemannian manifolds

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant