CN109271833A - 基于栈式稀疏自编码器的目标识别方法、装置及电子设备 - Google Patents
基于栈式稀疏自编码器的目标识别方法、装置及电子设备 Download PDFInfo
- Publication number
- CN109271833A CN109271833A CN201810772591.2A CN201810772591A CN109271833A CN 109271833 A CN109271833 A CN 109271833A CN 201810772591 A CN201810772591 A CN 201810772591A CN 109271833 A CN109271833 A CN 109271833A
- Authority
- CN
- China
- Prior art keywords
- feature
- lbp
- hog
- encoding encoder
- sparse self
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于栈式稀疏自编码器的目标识别方法、装置及电子设备,该方法包括:对包含目标物体的图像,依次进行灰度化处理和归一化处理,获取标准目标物体图像;对标准目标物体图像,分别采用方向梯度直方图特征提取算法,提取HOG特征,并采用局部二值模式特征提取算法,提取LBP特征;将HOG特征和LBP特征进行拼接,获取HOG‑LBP特征,并利用主成分分析法,对HOG‑LBP特征进行降维处理,获取HOG‑LBP‑PCA特征;基于HOG‑LBP‑PCA特征,利用预先建立的三层栈式稀疏自编码器和Logistic分类器,检测目标物体。本发明能够更有效地提取图像的高层次、抽象特征,从而更有效提高目标识别结果的可靠性和准确率。
Description
技术领域
本发明涉及数字图像处理技术领域,更具体地,涉及一种基于栈式稀疏自编码器的目标识别方法、装置及电子设备。
背景技术
目前,图像识别是机器视觉处理的热门课题,被广泛应用于养殖行业中目标的检测与跟踪,以给出养殖管理决策。图像检测的难点在于保证算法的鲁棒性和准确性,SIFT算法、SURF算法及HOG算法等,均能在一定条件下有效的提取图像特征。但是,上述提取的图像特征均是单一的人工特征,该特征能有效的用于简单的图像分类和识别,而由于实际情况通常较为复杂,图像的目标遮挡较为严重或图像的噪声比较大时,单一的采用传统算法往往无法有效区分图像。
近年来,深度学习法成为一种新的目标分类与识别方法,其具有大规模并行处理能力、良好的自适应性以及较强的学习能力等优势。自编码神经网络是一种无监督的深度学习算法,其采用反向传播算法来使目标值等于输入值。自编码器由编码器和解码器组成,在图像处理应用中,利用编码器提取养殖图像的高层次特征,并利用解码器将提取的高层次特征近似地还原回原图像数据,从而实现目标识别。
采用自编码神经网络进行养殖图像的处理时,提取养殖图像的高层次特征来对图像进行分析,能够在一定程度上提高对目标的识别精度。但是,实际养殖图像,如生猪图像,普遍存在背景复杂、光线变化以及目标遮挡等干扰问题,直接利用上述图像检测算法进行目标识别时,普遍存在可靠性较差、准确率较低等的问题。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明提供一种基于栈式稀疏自编码器的目标识别方法、装置及电子设备,用以更好的适应养殖图像的背景、光线等的干扰问题,从而有效提高目标识别结果的可靠性和准确率。
第一方面,本发明提供一种基于栈式稀疏自编码器的目标识别方法,包括:对包含目标物体的图像,依次进行灰度化处理和归一化处理,并以归一化处理的结果作为标准目标物体图像;对所述标准目标物体图像,分别采用方向梯度直方图特征提取算法,提取HOG特征,并采用局部二值模式特征提取算法,提取LBP特征;将所述HOG特征和所述LBP特征进行拼接,获取HOG-LBP特征,并利用主成分分析法,对所述HOG-LBP特征进行降维处理,获取HOG-LBP-PCA特征;基于所述HOG-LBP-PCA特征,利用预先建立的三层栈式稀疏自编码器和Logistic分类器,检测所述目标物体。
第二方面,本发明提供一种基于栈式稀疏自编码器的目标识别装置,包括:预处理模块,用于对包含目标物体的图像,依次进行灰度化处理和归一化处理,并以归一化处理的结果作为标准目标物体图像;特征提取模块,用于对所述标准目标物体图像,分别采用方向梯度直方图特征提取算法,提取HOG特征,并采用局部二值模式特征提取算法,提取LBP特征;降维处理模块,用于将所述HOG特征和所述LBP特征进行拼接,获取HOG-LBP特征,并利用主成分分析法,对所述HOG-LBP特征进行降维处理,获取HOG-LBP-PCA特征;识别模块,用于基于所述HOG-LBP-PCA特征,利用预先建立的三层栈式稀疏自编码器和Logistic分类器,检测所述目标物体。
第三方面,本发明提供一种电子设备,包括:至少一个存储器、至少一个处理器、通信接口和总线;所述存储器、所述处理器和所述通信接口通过所述总线完成相互间的通信,所述通信接口用于所述电子设备与包含目标物体的图像的采集或者存储设备之间的信息传输;所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上所述的基于栈式稀疏自编码器的目标识别方法。
第四方面,本发明提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如上所述的基于栈式稀疏自编码器的目标识别方法。
本发明提供的一种基于栈式稀疏自编码器的目标识别方法、装置及电子设备,通过对数据集的HOG特征和LBP特征分别进行提取并组合,得到HOG-LBP特征,并采用PCA算法,将高维图像的HOG-LBP降维,再设计三层栈式稀疏自编码器,根据HOG-LBP-PCA对图像中的目标物体进行识别,能够更有效地提取图像的高层次、抽象特征,从而更好的适应养殖图像的背景、光线等的干扰问题,有效提高目标识别结果的可靠性和准确率。
附图说明
图1为本发明实施例一种基于栈式稀疏自编码器的目标识别方法的流程图;
图2为根据本发明实施例一种基于栈式稀疏自编码器的目标识别方法中模型训练的流程图;
图3为根据本发明实施例一种基于栈式稀疏自编码器的目标识别方法中提取HOG特征的流程图;
图4为根据本发明实施例一种基于栈式稀疏自编码器的目标识别方法中提取LBP特征的流程图;
图5为根据本发明实施例一种基于栈式稀疏自编码器的目标识别方法中获取HOG-LBP-PCA特征的流程图;
图6为根据本发明实施例一种基于栈式稀疏自编码器的目标识别方法中训练三层栈式稀疏自编码器的流程图;
图7为根据本发明实施例一种基于栈式稀疏自编码器的目标识别方法中训练Logistic分类器的流程图;
图8为本发明实施例一种基于栈式稀疏自编码器的目标识别装置的结构示意图;
图9为本发明实施例一种电子设备的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
在实际的图像处理进行目标识别的过程中,实际图像,如生猪图像,普遍存在背景复杂、光线变化以及目标遮挡等干扰问题,而直接采用现有技术的处理算法,仅能对图像的单一的人工特征或者一些高层次特征进行提取,这些特征并不能完全体现图像特征,因此普遍存在可靠性较差、准确率较低等的问题。
针对上述问题,本发明实施例提供一种解决思路:通过有效地提取图像数据高层次、抽象特征,并进行多特征的融合,如颜色、纹理及边缘等,实现对图像中目标物体更可靠、更准确的识别。另外,为了减少训练样本的特征数据,采用无监督的栈式稀疏自编码器进行数据融合,并采用逐层贪婪训练方法对栈式稀疏自编码器进行训练。
即,在实际复杂场景中(如光照变化、背景复杂、前景遮挡等)能够实现生猪有效地检测。通过对数据集HOG和LBP特征提取和组合,采用PCA算法,将高维图像的HOG-LBP降维,再设计三层栈式稀疏自编码器训练HOG-LBP-PCA,对生猪图像进行检测。
具体而言,针对包含目标物体的图像,如生猪图像,普遍存在背景复杂、光线变化及目标遮挡等干扰问题,本发明实施例通过采用方向梯度直方图(HOG)特征提取算法,提取生猪图像HOG特征,并利用局部二值模式(LBP)特征提取算法,提取LBP特征,然后将LBP特征和HOG特征进行拼接,形成HOG-LBP。
之后,利用主成分分析(PCA)算法对HOG-LBP特征进行降维,形成HOG-LBP-PCA,最后结合栈式稀疏自编码器对HOG-LBP-PCA进行网络训练,对其重要的参数进行优化更新,建立三层栈式稀疏自编码器网络。通过用训练好的网络检测生猪,解决目前图像检测算法中普遍存在的可靠性与准确性差等问题,能够较好地适应环境的变化,为实现机器人代替人工完成生猪的预防接种,提供接种目标检测方法。
为更便于理解、更形象的描述本发明的技术方案,本发明实施例以下以对图像中的生猪检测为例进行说明,但不因此限制本发明的保护范围。
作为本发明实施例的一个方面,本实施例提供一种基于栈式稀疏自编码器的目标识别方法,参考图1,为本发明实施例一种基于栈式稀疏自编码器的目标识别方法的流程图,包括:
S101,对包含目标物体的图像,依次进行灰度化处理和归一化处理,并以归一化处理的结果作为标准目标物体图像。
可以理解为,在通过图像分析进行目标物体识别之前,事先已经获取包含该目标物体的图像,即包含目标物体的图像。本步骤首先对包含目标物体的图像进行灰度化处理,得到灰度化处理的结果,再对该灰度化处理的结果进行归一化处理,得到归一化处理的结果,则以该归一化处理的结果作为标准目标物体图像。
S102,对标准目标物体图像,分别采用方向梯度直方图特征提取算法,提取HOG特征,并采用局部二值模式特征提取算法,提取LBP特征。
可以理解为,对于上述步骤获取的标准目标物体图像,采用方向梯度直方图特征提取算法,提取该标准目标物体图像的方向梯度直方图(Histogram of OrientedGradient,HOG)特征,也就是HOG特征。HOG特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。HOG特征通过计算和统计图像局部区域的梯度方向直方图来构成特征。在本发明实施例中,则通过计算和统计标准目标物体图像的局部区域的梯度方向直方图,来构成图像中目标物体的特征描述。
同时,对于上述步骤获取的标准目标物体图像,采用局部二值模式特征提取算法,提取该标准目标物体图像的局部二值模式(LocalBinary Patterns,LBP)特征,也就是LBP特征。LBP特征是一种用来描述图像局部特征的算子,具有灰度不变性和旋转不变性等显著优点。LBP算子定义为在像素3×3的邻域内,以邻域中心像素为阈值,相邻的8个像素的灰度值与邻域中心的像素值进行比较,若周围像素大于中心像素值,则该像素点的位置被标记为1,否则为0。这样,3×3邻域内的8个点经过比较可产生8位二进制数,将这8位二进制数依次排列形成一个二进制数字,这个二进制数字就是中心像素的LBP值。
在本发明实施例中,则表示通过比较标准目标物体图像中各像素点与该像素点给定尺寸领域内其余像素点的灰度值,确定图像中各像素点的LBP值,并在此基础上,计算构成整个标准目标物体图像的LBP特征。
S103,将HOG特征和LBP特征进行拼接,获取HOG-LBP特征,并利用主成分分析法,对HOG-LBP特征进行降维处理,获取HOG-LBP-PCA特征。
可以理解为,在上述步骤获取HOG特征和LBP特征的基础上,将HOG特征和LBP特征进行拼接,构成拼接后的特征,作为HOG-LBP特征。可以理解的是,构成的HOG特征和LBP特征可以以向量的形式表示,则将HOG特征和LBP特征进行拼接的方式,可以为串联的方式拼接,得到HOG+LBP。例如,设图像HOG特征为(a1,a2,a3,…,an),LBP特征为(b1,b2,b3,…,bn),拼接后的HOG-LBP特征为(a1,a2,a3,…,an,b1,b2,b3,…,bn),每个图像对应这样一个串联的特征。
之后,将HOG-LBP特征利用主成分分析法进行降维处理,得到降维后的特征,作为HOG-LBP-PCA特征。主成分分析法也称主分量分析法,旨在利用降维的思想,把多指标转化为少数几个综合指标(即主成分),其中每个主成分都能够反映原始变量的大部分信息,且所含信息互不重复。在本发明实施例中则表示,对于从标准目标物体图像中获取的多个HOG-LBP特征,为了在不影响目标识别结果的有效性的基础上降低运算规模,对多个HOG-LBP特征进行分析,确定对目标物体识别起主要作用的主分量综合指标。
S104,基于HOG-LBP-PCA特征,利用预先建立的三层栈式稀疏自编码器和Logistic分类器,检测目标物体。
可以理解为,在上述步骤获取待处理标准目标物体图像的HOG-LBP-PCA特征的基础上,将该HOG-LBP-PCA特征输入到预先建立的三层栈式稀疏自编码器的输入端。该三层栈式稀疏自编码器的最后一层隐含层连接训练好的Logistic分类器,则经过三层栈式稀疏自编码器和Logistic分类器的分级运算,由Logistic分类器的输出端输出对目标物体的检测结果。
本发明实施例提供的一种基于栈式稀疏自编码器的目标识别方法,通过对数据集的HOG特征和LBP特征分别进行提取并组合,得到HOG-LBP特征,并采用PCA算法,将高维图像的HOG-LBP降维,再设计三层栈式稀疏自编码器,根据HOG-LBP-PCA对图像中的目标物体进行识别,能够更有效地提取图像的高层次、抽象特征,从而更好的适应养殖图像的背景、光线等的干扰问题,有效提高目标识别结果的可靠性和准确率。
其中,在一个实施例中,在利用预先建立的三层栈式稀疏自编码器和Logistic分类器,检测目标物体的步骤之前,该方法还包括如图2所示处理流程,图2为根据本发明实施例一种基于栈式稀疏自编码器的目标识别方法中模型训练的流程图,包括:
S201,采集关于目标物体的正样本和负样本,并按照第一给定比例,对正样本和负样本均划分出训练样本和测试样本,正样本表示包含目标物体的样本,负样本表示包含非目标物体的样本。
可以理解为,在根据上述实施例利用检测模型对标准目标物体图像进行目标物体识别之前,先要建立该检测模型。该检测模型即为三层栈式稀疏自编码器和Logistic分类器的结合,其中三层栈式稀疏自编码器的最后一层隐含层连接Logistic分类器的输入端。
在建立检测模型时,需要利用训练样本对该模型进行训练,并在训练完成后,对该模型利用测试样本进行测试。因此,本步骤首先对关于目标物体的正样本和负样本进行采集,并分别将两种样本按照第一给定比例进行训练样本和测试样本的划分。
例如,对于生猪检测,首先采集生猪的正、负样本,正样本是生猪图像,负样本是非生猪图像。之后将其中的80%的样本作为训练样本,另外20%作为测试样本。
S202,按照第二给定比例,从训练样本中选取部分训练样本,并对该部分训练样本使用标签进行标记。
可以理解为,本步骤在根据上述步骤划分出训练样本和测试样本之后,对样本中部分训练样本打标签,即使用标签进行标记,则进行标记后的样本成为使用标签标记的训练样本。其中在选择样本进行打标签时,按照第二给定比例在训练样本中进行选取。其中第一给定比例和第二给定比例中的第一和第二,仅仅为了区别两个划分比例,不影响该两个划分比例的实际取值。
S203,分别获取训练样本的HOG-LBP-PCA特征,作为训练HOG-LBP-PCA特征,并获取测试样本的HOG-LBP-PCA特征,作为测试HOG-LBP-PCA特征。
可以理解为,对于划分出的训练样本和测试样本,可以采用与上述实施例类似的方法,分别对训练样本和测试样本进行HOG-LBP-PCA特征的提取。即对于训练样本,进行HOG-LBP-PCA特征的提取,所提取的HOG-LBP-PCA特征作为训练HOG-LBP-PCA特征。同时,对于测试样本,进行HOG-LBP-PCA特征的提取,所提取的HOG-LBP-PCA特征作为测试HOG-LBP-PCA特征。
S204,初始化设置三层栈式稀疏自编码器,并利用训练HOG-LBP-PCA特征,采用逐层贪婪训练法,训练初始化设置的三层栈式稀疏自编码器,确定三层栈式稀疏自编码器中各层编码器的权值和偏移量。
可以理解为,本发明实施例利用三层栈式稀疏自编码器对图形的HOG-LBP-PCA特征进行运算、融合。则在模型建立时先要对三层栈式稀疏自编码器进行初始化设置,得到初始化设置结果,作为初始化设置的三层栈式稀疏自编码器。
之后,利用上述步骤获取的训练HOG-LBP-PCA特征,对初始化设置的三层栈式稀疏自编码器进行基于逐层贪婪训练法的多次训练,得到三层栈式稀疏自编码器中各层编码器的权值和偏移量。也就是说,将训练HOG-LBP-PCA特征作为三层栈式稀疏自编码器的输入,通过逐层贪婪训练,得到模型第二层和第三层自编码器的权值和偏移量。
也就是说,构建三层栈式稀疏自编码器网络,将HOG-LBP-PCA作为栈式自编码器的输入,通过逐层贪婪训练得到第二层和第三层自编码器的权值和偏移量。
其中,逐层贪婪算法的主要思路是每次只训练网络中的一层,即首先训练一个只含一个隐藏层的网络,仅当这层网络训练结束之后才开始训练有两个隐藏层的网络,以此类推。在每一步中,把已经训练好的前k-1层固定,然后增加第k层(也就是将已经训练好的前k-1的输出作为输入)。每一层的训练使用无监督方法进行训练。这些各层单独训练所得到的权重被用来初始化最终的深度网络的权重,最后对整个网络进行微调(即把所有层放在一起来优化有标签训练集上的训练误差)即可。在本发明实施例中,则利用训练HOG-LBP-PCA特征,依次对三层栈式稀疏自编码器的第一层、第二层和第三层进行训练。
S205,初始化设置与三层栈式稀疏自编码器的最后一层隐含层连接的Logistic分类器,并利用使用标签标记的训练样本,对初始化设置的Logistic分类器进行训练,确定Logistic分类器的连接权重并微调三层栈式稀疏自编码器中各层编码器的权值和偏移量。
可以理解为,在根据上述步骤对三层栈式稀疏自编码器训练完成后,将该自编码器固定,以该自编码器最后一层隐含层作为Logistic分类器的输入,进行Logistic分类器的初始化设置,得到初始化设置的Logistic分类器。
之后,将使用标签标记的训练样本的训练HOG-LBP-PCA特征以及各样本对应的标签输入固定的自编码器,利用Logistic分类器进行运算输出,并通过误差的反向传播运算,进行Logistic分类器的训练和三层栈式稀疏自编码器中各层编码器的权值和偏移量的微调。从而可以确定Logistic分类器的连接权重。
也就是说,使用具有标签的HOG-LBP-PCA输入到预训练好的自编码器网络里,得到自编码器最后一层的输出,有监督地训练Logistic分类器,并用反向传播算法微调整个自编码器网络参数。
S206,基于微调后的第二层隐含层和第三层隐含层的权值和偏移量,以及Logistic分类器的连接权重,确定训练好的三层栈式稀疏自编码器和Logistic分类器。
可以理解为,在根据上述步骤确定Logistic分类器的连接权重,并对三层栈式稀疏自编码器中各层编码器的权值和偏移量进行微调之后,将微调后的权值和偏移量,以及Logistic分类器的连接权重作为检测模型最终的网络参数,确定最终的检测模型,即作为训练好的三层栈式稀疏自编码器和Logistic分类器。
S207,利用测试HOG-LBP-PCA特征,对训练好的三层栈式稀疏自编码器和Logistic分类器进行网络性能测试。
可以理解为,利用根据上述步骤获取的测试HOG-LBP-PCA特征,输入训练好的三层栈式稀疏自编码器和Logistic分类器,运算输出测试输出结果,并将该测试输出结果与参考进行比对,实现对检测模型的网络性能测试。
本发明实施例提供的一种基于栈式稀疏自编码器的目标识别方法,通过事先采集样本,并通过对样本进行HOG-LBP-PCA特征的提取,来对检测模型进行基于逐层贪婪算法的训练和测试,可以学习到特征间更加复杂的函数关系,提高检测准确性。
其中,根据上述实施例可选的,对标准目标物体图像,采用方向梯度直方图特征提取算法,提取HOG特征的进一步处理步骤参考图3,为根据本发明实施例一种基于栈式稀疏自编码器的目标识别方法中提取HOG特征的流程图,包括:
S301,计算标准目标物体图像中每个像素点的梯度方向。
可以理解为,对于标准目标物体图像中的任一像素点(x,y),分别计算其水平方向和垂直方向的梯度如下:
水平方向:Gx(x,y)=H(x+1,y)-H(x-1,y);
垂直方向:Gy(x,y)=H(x,y+1)-H(x,y-1);
式中,Gx(x,y)、Gy(x,y)和H(x,y)分别表示标准目标物体图像中像素点(x,y)处的水平方向梯度、垂直方向梯度和像素值。
则像素点(x,y)处的梯度幅值和梯度方向分别为:
S302,按照相同的规格尺寸,将标准目标物体图像划分成多个子图像方块,并基于子图像方块中每个像素点的梯度方向,构建每个子图像方块的多维梯度方向直方图。
可以理解为,本步骤首先对标准目标物体图像按照像素点进行等尺寸划分,得到划分出的子图像。每个子图像由一个多像素的方块构成,形成一个子图像方块,也可称作细胞单元。则,经过子图像划分,标准目标物体图像划分成多个子图像方块,或者称为细胞单元。
之后,对每个子图像方块,确定梯度方向直方图的维度,并根据该子图像方块中每个像素点的梯度方向及该维度,构建该子图像方块的多维梯度方向直方图。
例如,将标准目标物体图像划分成若干个细胞单元,即Cell,每个Cell为6×6个像素。采用9个通道(bin)的直方图来统计这6×6个像素的梯度信息,也就是将Cell的梯度方向360度分成9个方向块,如果这个像素的梯度方向是20度到40度之间,直方图第2个bin的计数就加一。这样,对Cell内每个像素用梯度方向在直方图中进行加权投影(映射到固定的角度范围),就得到这个Cell的梯度方向直方图,就是该Cell对应的9维梯度方向直方图,构成9维特征向量。
S303,按照设定数量,将标准目标物体图像中每相邻的多个子图像方块组合成一个大方块,并将大方块中每个子图像方块的多维梯度方向直方图进行串联,获取每个大方块的HOG特征。
可以理解为,把相邻的几个子图像方块组合成一个大的块,作为一个大方块,则完整的标准目标物体图像内可以组合成多个大方块。则对组成大方块的所有子图像方块,将其多维梯度方向直方图进行串联,获取该大方块的HOG特征。即,把细胞单元组合成大的块(block),块内归一化梯度直方图。一个block内所有Cell的特征向量串联起来便得到该block的HOG特征。
S304,将标准目标物体图像中所有大方块的HOG特征进行串联,获取标准目标物体图像的HOG特征。
可以理解为,对于一幅标准目标物体图像中无重叠划分的多个大方块block,将所有block的HOG特征,可以是特征向量,串联起来就是整幅标准目标物体图像的HOG特征。
本发明实施例提供的一种基于栈式稀疏自编码器的目标识别方法,针对传统图像目标检测精度低、遮挡时分类性能差等问题,提高了图像检测与分类的鲁棒性,具有很高的实用性。
其中,根据上述实施例可选的,对标准目标物体图像,采用局部二值模式特征提取算法,提取LBP特征的进一步处理步骤参考图4,为根据本发明实施例一种基于栈式稀疏自编码器的目标识别方法中提取LBP特征的流程图,包括:
S401,将标准目标物体图像按照给定规格尺寸,划分为多个子图像方块。
可以理解为,对于标准目标物体图像,按照像素点进行给定规格尺寸的等尺寸划分,得到划分出的子图像。每个子图像由一个多像素的方块构成,形成一个子图像方块,也可称作细胞单元。则,经过子图像划分,标准目标物体图像划分成多个子图像方块,或者称为细胞单元,简称Cell。
S402,对于任一子图像方块,分别将该子图像方块中每个像素点作为中心像素点,通过比较中心像素点的灰度与中心像素点3×3邻域内其余像素点的灰度的大小,构建子图像方块的LBP直方图。
可以理解为,根据上述实施例,LBP描述的基本原理是比较中心像素与其邻域像素之间的灰度值大小,用布尔型函数来表示结果,纹理特征的LBP值计算公式为:
式中,gi(i=1,…,N)表示以gc为中心的圆域的N个像素点,R为圆域的半径。
则,利用LBP算法进行特征提取之后,图像f(x,y)的特征是以直方图表示的,即:
式中,Hi表示像素LBP特征值为i的像素个数,f(x,y)表示像素坐标为(x,y)的LBP值。
则对于标准目标物体图像中的每个子图像方块,利用上述计算方法得到该子图像方块的LBP直方图,即每个数字出现的频率。
S403,对每个子图像方块的LBP直方图进行归一化处理,并将所有归一化处理后的LBP直方图进行串联,获取标准目标物体图像的LBP特征。
可以理解为,在上述步骤计算的基础上,对每个子图像方块的LBP直方图进行归一化处理。最后将得到的标准目标物体图像中每个Cell的LBP统计直方图进行串联,成为一个特征向量,也就是整幅标准目标物体图像的LBP特征。
本发明实施例提供的一种基于栈式稀疏自编码器的目标识别方法,通过对标准目标物体图像进行网格划分,并计算每个网格单元的LBP统计直方图,实现标准目标物体图像LBP特征的提取,为图像中目标物体的更准确的检测提供依据。
其中,根据上述实施例可选的,利用主成分分析法,对HOG-LBP特征进行降维处理,获取HOG-LBP-PCA特征的进一步处理步骤参考图5,为根据本发明实施例一种基于栈式稀疏自编码器的目标识别方法中获取HOG-LBP-PCA特征的流程图,包括:
S501,以HOG-LBP特征构成的向量作为HOG-LBP特征向量,计算所有HOG-LBP特征向量的协方差矩阵。
可以理解为,假设有L个训练样本,就有L个HOG-LBP特征。设每个HOG-LBP特征的维数是N,则由L个HOG-LBP构成的样本集为X={x1,x2,...,xL},该样本集的均值向量计算公式如下:
基于该样本集的均值向量计算样本集的协方差矩阵如下:
S502,采用奇异值分解法,求解协方差矩阵的特征值和特征向量,并将特征值按从大到小的顺序进行排列,构成特征值序列。
可以理解为,在上述步骤计算的基础上,得到维数为N×N协方差矩阵S,令且S=AAT。则,采用奇异值分解法,求解S=AAT,得到协方差矩阵S的特征值λi和各特征值λi对应的特征向量v。将求得的协方差矩阵S的所有特征值按从大到小的顺序进行排列,构成一个序列,作为特征值序列。
S503,计算所有特征值之和,并确定最小取值d,使d满足:在特征值序列中,前d个特征值之和对所有特征值之和的占比不小于设定阈值。
可以理解为,对于特征值序列中的所有特征值进行求和,得到所有特征值之和。之后,设定一个设定阈值,并从特征值序列中前数第一个特征值开始,计算前k个特征值之和,并计算该前k个特征值之和与所有特征值之和的比值,即前k个特征值之和对所有特征值之和的占比。设前d个特征值与总的特征值的比值为δ,则其计算公式为:
判断前k个特征值之和对所有特征值之和的占比是否大于上述设定阈值,若该占比不小于上述设定阈值,则认为已经选出主要成分,停止计算。否则,对特征值序列中前k+1个特征值进行求和,并采用上述同样的运算流程,计算前k+1个特征值之和对所有特征值之和的占比,并判断该占比小于上述设定阈值时,循环执行上述占比计算和比较过程,直至前k+i个特征值之和对所有特征值之和的占比不小于上述设定阈值。则,以此时的k+i作为满足条件的最小取值d。
可以理解的是,在上述特征值序列中,当λi≥0时,在对前k个特征值求和并求对所有特征值之和的占比时,当根据某个k值计算得到的占比不小于上述设定阈值,则前k+1、k+2、...、L个特征值计算得到的占比也会不小于上述设定阈值。因此,此时即选择k值作为满足条件的最小取值d。
S504,选取特征值序列中的前d个特征值及前d个特征值分别对应的特征向量,并基于前d个特征值分别对应的特征向量和HOG-LBP特征向量,获取HOG-LBP-PCA特征。
可以理解为,在上述步骤的基础上,获取前d个特征值所对应的特征子空间。令δ≥80%得到的前d个特征值为λi(i=1,…,d),且λ1≥λ2≥…≥λd>0以及对应的特征向量νi(i=1,…,d)。则,降维后的投影特征矩阵为:
ν={ν1,ν2,ν3,…,νd};
式中,vi表示特征值λi对应的特征向量。
之后,基于特征值序列中前d个特征值分别对应的特征向量λ1,λ2,…,λd和HOG-LBP特征向量X,输出降维后降维后的特征HOG-LBP-PCA特征如下:
Z=vTX。
本发明实施例提供的一种基于栈式稀疏自编码器的目标识别方法,通过主成份分析法,对获得的图像特征进行降维处理,能够在不影响检测结果有效性的基础上,有效减小运算量,提高目标检测效率。
其中,根据上述实施例可选的,利用训练HOG-LBP-PCA特征,采用逐层贪婪训练法,训练初始化设置的三层栈式稀疏自编码器,确定三层栈式稀疏自编码器中各层编码器的权值和偏移量的进一步处理步骤参考图6,为根据本发明实施例一种基于栈式稀疏自编码器的目标识别方法中训练三层栈式稀疏自编码器的流程图,包括:
S601,从三层栈式稀疏自编码器的第一层编码器开始,对于任一层编码器,将训练HOG-LBP-PCA特征输入三层栈式稀疏自编码器的输入端,获取该层编码器的映射输出。
可以理解为,首先构建第一层稀疏自编码器,对于训练HOG-LBP-PCA特征X={x1,x2,...,xL}∈RN1,其中N1为输入层神经元数,即xi的维度。通过线性函数和激活函数f(·),将该训练HOG-LBP-PCA特征映射到隐含层得到编码结果N2是隐含层神经元数,则有:
之后,通过与上述同样的映射方式将H映射到输出层,得到网络输出Y,则有:
Y=f(W2H+B2);
式中,H为输入数据集X的特征表达,W1,B1,W2,B2分别表示输入层与隐含层的连接权重,输入层与隐含层的偏移量,隐含层与输出层的连接权重,隐含层与输出层的偏移量。
同样,对于三层栈式稀疏自编码器的第二层编码器和第三层编码器,采用与上述同样的方式进行计算。
S602,基于训练HOG-LBP-PCA特征和该层编码器的映射输出,计算该层编码器的损失函数。
可以理解为,在上述步骤的基础上,对于三层栈式稀疏自编码器的各层编码器,计算稀疏自编码器的损失函数,表达式如下:
式中,λ,β是正则项和稀疏惩罚项的权重系数,是正则项,L是样本个数,表示稀疏惩罚项,其中分别表示稀疏性参数和隐含层第j个神经元的平均激活度。
其中,惩罚因子有如下性质,当时并且随着与ρ之间的差异增大而单调递增。
则根据上述损失函数,通过调整W1,W2,B1,B2,可使上述步骤中X与Y近似。
S603,采用循环迭代算法,通过逐步优化损失函数,确定该层编码器的权值和偏移量。
可以理解为,通过迭代算法优化上述损失函数,从而更新W1,W2,B1,B2,直到算法收敛,得到的训练参数和编码器结果如下:
式中,X(k),Y(k)表示第k个原始数据和输出数据,α表示学习率。
可以理解的是,在根据上述处理过程完成第一层编码器的训练后,将第一层编码器的输出层去掉,把隐含层的输出作为下一层编码器的输入,采用与第一层相同的方法构建第二层和第三层,逐层贪婪训练便能够得到三层栈式稀疏自编码器。
本发明实施例提供的一种基于栈式稀疏自编码器的目标识别方法,通过逐层训练栈式稀疏自编码器的各层自编码器,逐步优化损失函数,从而获取运算精度更高,检测效果最好的栈式稀疏自编码器。
其中,根据上述实施例可选的,利用使用标签标记的训练样本,对初始化设置的Logistic分类器进行训练,确定Logistic分类器的连接权重并微调三层栈式稀疏自编码器中各层编码器的权值和偏移量的进一步处理步骤参考图7,为根据本发明实施例一种基于栈式稀疏自编码器的目标识别方法中训练Logistic分类器的流程图,包括:
S701,将使用标签标记的训练样本和对应标签输入到三层栈式稀疏自编码器的输入端,计算初始化设置的Logistic分类器的输出。
可以理解为,本实施例在进行Logistic分类器的训练时,首先将具有标签的HOG-LBP-PCA输入到设计好的三层栈式稀疏自编码器中,得到输出{O1,O2,…,Or},而特征对应的真实标签为{y1,y2,y3,…,yr}。设三层栈式稀疏自编码器最后一层隐藏层与Logistic分类器的连接权值为θ=(θ0,θ1,θ2,θ3,…,θp),则Logistic分类器输入为:
式中,表示地i个样本的第p维。
则,Logistic分类器的输出为G'i=f(Gi),其中,
S702,基于标签和初始化设置的Logistic分类器的输出,计算样本的交叉熵。
可以理解为,在上述步骤计算的基础上,得到Logistic分类器的输出G'i,将该输出与对应特征的标签yi进行比较,计算样本的交叉熵如下:
式中,ξ表示交叉熵函数,r表示输入的样本数量,yi表示第i个样本标签,G'i表示第i个样本编码器的输出,θ表示编码器隐藏层和logistics分类器的连接权值。
S703,采用循环迭代算法,逐步优化交叉熵,确定Logistic分类器的连接权重。
可以理解为,在获取上述样本的交叉熵的基础上,采用循环迭代算法对该交叉熵进行逐步优化。具体在每步优化中,计算交叉熵对网络参数的导数为:
式中,θj表示第j个参数分量,表示第i个样本的第j维。
通过令上述导数值为零,计算优化后的θ为:
式中,α表示学习率。
S704,基于Logistic分类器的连接权重,利用反向传播算法,微调三层栈式稀疏自编码器中各层编码器的权值和偏移量。
可以理解为,在获取优化的θ后,利用数据的反向传播法,按照同样的策略,更新三层栈式稀疏自编码器的参数,即三层栈式稀疏自编码器。
本发明实施例在深度卷积神经网络的基础上,对多种特征作相应融合后,选择最优分类器作为输入。通过多尺度卷积神经网络,提取图像特征向量,提取的特征向量包含纹理、形状等信息,融合多种特征使特征之间取长补短,在实际复杂跟踪场景中,如光照变化、背景复杂、前景遮挡及目标快速运动等,也能够保证目标识别的准确性和可靠性。
作为本发明实施例的另一个方面,本发明实施例根据上述实施例提供一种基于栈式稀疏自编码器的目标识别装置,该装置用于在上述各实施例中实现基于栈式稀疏自编码器的目标识别。因此,在上述各实施例的基于栈式稀疏自编码器的目标识别方法中的描述和定义,可以用于本发明实施例中各个执行模块的理解,具体可参考上述实施例,此处不在赘述。
根据本发明实施例的一个实施例,基于栈式稀疏自编码器的目标识别装置的结构如图8所示,为本发明实施例一种基于栈式稀疏自编码器的目标识别装置的结构示意图,包括:预处理模块801、特征提取模块802、降维处理模块803和识别模块804。
其中,预处理模块801用于对包含目标物体的图像,依次进行灰度化处理和归一化处理,并以归一化处理的结果作为标准目标物体图像;特征提取模块802用于对标准目标物体图像,分别采用方向梯度直方图特征提取算法,提取HOG特征,并采用局部二值模式特征提取算法,提取LBP特征;降维处理模块803用于将HOG特征和LBP特征进行拼接,获取HOG-LBP特征,并利用主成分分析法,对HOG-LBP特征进行降维处理,获取HOG-LBP-PCA特征;识别模块804用于基于HOG-LBP-PCA特征,利用预先建立的三层栈式稀疏自编码器和Logistic分类器,检测目标物体。
进一步的,在上述实施例的基础上,基于栈式稀疏自编码器的目标识别装置还包括模型训练模块,用于:
采集关于目标物体的正样本和负样本,并按照第一给定比例,对正样本和负样本均划分出训练样本和测试样本,正样本表示包含目标物体的样本,负样本表示包含非目标物体的样本;
按照第二给定比例,从训练样本中选取部分训练样本,并对该部分训练样本使用标签进行标记;
分别获取训练样本的HOG-LBP-PCA特征,作为训练HOG-LBP-PCA特征,并获取测试样本的HOG-LBP-PCA特征,作为测试HOG-LBP-PCA特征;
初始化设置三层栈式稀疏自编码器,并利用训练HOG-LBP-PCA特征,采用逐层贪婪训练法,训练初始化设置的三层栈式稀疏自编码器,确定三层栈式稀疏自编码器中各层编码器的权值和偏移量;
初始化设置与三层栈式稀疏自编码器的最后一层隐含层连接的Logistic分类器,并利用使用标签标记的训练样本,对初始化设置的Logistic分类器进行训练,确定Logistic分类器的连接权重并微调三层栈式稀疏自编码器中各层编码器的权值和偏移量;
基于微调后的第二层隐含层和第三层隐含层的权值和偏移量,以及Logistic分类器的连接权重,确定训练好的三层栈式稀疏自编码器和Logistic分类器;
利用测试HOG-LBP-PCA特征,对训练好的三层栈式稀疏自编码器和Logistic分类器进行性能测试。
其中可选的,特征提取模块进一步用于:计算标准目标物体图像中每个像素点的梯度方向;按照相同的规格尺寸,将标准目标物体图像划分成多个子图像方块,并基于子图像方块中每个像素点的梯度方向,构建每个子图像方块的多维梯度方向直方图;按照设定数量,将标准目标物体图像中每相邻的多个子图像方块组合成一个大方块,并将大方块中每个子图像方块的多维梯度方向直方图进行串联,获取每个大方块的HOG特征;将标准目标物体图像中所有大方块的HOG特征进行串联,获取标准目标物体图像的HOG特征。
其中可选的,特征提取模块进一步用于:将标准目标物体图像按照给定规格尺寸,划分为多个子图像方块;对于任一子图像方块,分别将该子图像方块中每个像素点作为中心像素点,通过比较中心像素点的灰度与中心像素点3×3邻域内其余像素点的灰度的大小,构建子图像方块的LBP直方图;对每个子图像方块的LBP直方图进行归一化处理,并将所有归一化处理后的LBP直方图进行串联,获取标准目标物体图像的LBP特征。
其中可选的,降维处理模块进一步用于:以HOG-LBP特征构成的向量作为HOG-LBP特征向量,计算所有HOG-LBP特征向量的协方差矩阵;采用奇异值分解法,求解协方差矩阵的特征值和特征向量,并将特征值按从大到小的顺序进行排列,构成特征值序列;计算所有特征值之和,并确定最小取值d,使d满足:在特征值序列中,前d个特征值之和对所有特征值之和的占比不小于设定阈值;选取特征值序列中的前d个特征值及前d个特征值分别对应的特征向量,并基于前d个特征值分别对应的特征向量和HOG-LBP特征向量,获取HOG-LBP-PCA特征。
其中可选的,模型训练模块进一步用于:从三层栈式稀疏自编码器的第一层编码器开始,对于任一层编码器,将训练HOG-LBP-PCA特征输入三层栈式稀疏自编码器的输入端,获取该层编码器的映射输出;基于训练HOG-LBP-PCA特征和该层编码器的映射输出,计算该层编码器的损失函数;采用循环迭代算法,通过逐步优化损失函数,确定该层编码器的权值和偏移量。
其中可选的,模型训练模块进一步用于:利用使用标签标记的训练样本,对初始化设置的Logistic分类器进行训练,确定Logistic分类器的连接权重并微调三层栈式稀疏自编码器中各层编码器的权值和偏移量的步骤进一步包括:将使用标签标记的训练样本和对应标签输入到三层栈式稀疏自编码器的输入端,计算初始化设置的Logistic分类器的输出;基于标签和初始化设置的Logistic分类器的输出,计算样本的交叉熵;采用循环迭代算法,逐步优化交叉熵,确定Logistic分类器的连接权重;基于Logistic分类器的连接权重,利用反向传播算法,微调三层栈式稀疏自编码器中各层编码器的权值和偏移量。
可以理解的是,本发明实施例各基于栈式稀疏自编码器的目标识别装置产生的有益效果与对应的上述各方法实施例相同,可以参考上述各方法实施例,此处不再赘述。
作为本发明实施例的又一个方面,本实施例根据上述实施例提供一种电子设备,参考图9,为本发明实施例一种电子设备的结构框图,包括:至少一个存储器901、至少一个处理器902、通信接口903和总线904。
其中,存储器901、处理器902和通信接口903通过总线904完成相互间的通信,通信接口903用于该电子设备与包含目标物体的图像的采集或者存储设备之间的信息传输;存储器901中存储有可在处理器902上运行的计算机程序,处理器902执行所述计算机程序时,实现如上述实施例的基于栈式稀疏自编码器的目标识别方法。
可以理解为,该电子设备中至少包含存储器901、处理器902、通信接口903和总线904,且存储器901、处理器902和通信接口903通过总线904形成相互间的通信连接,并可完成相互间的通信。
通信接口903实现该电子设备与包含目标物体的图像的采集或者存储设备之间的通信连接,并可完成相互间信息传输,如通过通信接口903实现对包含目标物体的图像的获取等。
电子设备运行时,处理器902调用存储器901中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:对标准目标物体图像,分别采用方向梯度直方图特征提取算法,提取HOG特征,并采用局部二值模式特征提取算法,提取LBP特征;以及对每个子图像方块的LBP直方图进行归一化处理,并将所有归一化处理后的LBP直方图进行串联,获取标准目标物体图像的LBP特征等。
本发明另一个实施例中,提供一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令使计算机执行如上述实施例的基于栈式稀疏自编码器的目标识别方法。
可以理解为,上述的计算机指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。或者,实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例提供的一种电子设备和一种非暂态计算机可读存储介质,通过对数据集的HOG特征和LBP特征分别进行提取并组合,得到HOG-LBP特征,并采用PCA算法,将高维图像的HOG-LBP降维,再设计三层栈式稀疏自编码器,根据HOG-LBP-PCA对图像中的目标物体进行识别,能够更有效地提取图像的高层次、抽象特征,从而更好的适应养殖图像的背景、光线等的干扰问题,有效提高目标识别结果的可靠性和准确率。
可以理解的是,以上所描述的装置、电子设备的实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,既可以位于一个地方,或者也可以分布到不同网络单元上。可以根据实际需要选择其中的部分或全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上实施方式的描述,本领域的技术人员可以清楚地了解,各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如U盘、移动硬盘、ROM、RAM、磁碟或者光盘等,包括若干指令,用以使得一台计算机设备(如个人计算机,服务器,或者网络设备等)执行上述各方法实施例或者方法实施例的某些部分所述的方法。
另外,本领域内的技术人员应当理解的是,在本发明的申请文件中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明的说明书中,说明了大量具体细节。然而应当理解的是,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本发明公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。
然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于栈式稀疏自编码器的目标识别方法,其特征在于,包括:
对包含目标物体的图像,依次进行灰度化处理和归一化处理,并以归一化处理的结果作为标准目标物体图像;
对所述标准目标物体图像,分别采用方向梯度直方图特征提取算法,提取HOG特征,并采用局部二值模式特征提取算法,提取LBP特征;
将所述HOG特征和所述LBP特征进行拼接,获取HOG-LBP特征,并利用主成分分析法,对所述HOG-LBP特征进行降维处理,获取HOG-LBP-PCA特征;
基于所述HOG-LBP-PCA特征,利用预先建立的三层栈式稀疏自编码器和Logistic分类器,检测所述目标物体。
2.根据权利要求1所述的方法,其特征在于,在所述利用预先建立的三层栈式稀疏自编码器和Logistic分类器,检测所述目标物体的步骤之前,还包括:
采集关于所述目标物体的正样本和负样本,并按照第一给定比例,对所述正样本和负样本均划分出训练样本和测试样本,所述正样本表示包含目标物体的样本,所述负样本表示包含非目标物体的样本;
按照第二给定比例,从所述训练样本中选取部分训练样本,并对该部分训练样本使用标签进行标记;
分别获取所述训练样本的HOG-LBP-PCA特征,作为训练HOG-LBP-PCA特征,并获取所述测试样本的HOG-LBP-PCA特征,作为测试HOG-LBP-PCA特征;
初始化设置三层栈式稀疏自编码器,并利用所述训练HOG-LBP-PCA特征,采用逐层贪婪训练法,训练初始化设置的三层栈式稀疏自编码器,确定三层栈式稀疏自编码器中各层编码器的权值和偏移量;
初始化设置与所述三层栈式稀疏自编码器的最后一层隐含层连接的Logistic分类器,并利用使用标签标记的训练样本,对初始化设置的Logistic分类器进行训练,确定Logistic分类器的连接权重并微调所述三层栈式稀疏自编码器中各层编码器的权值和偏移量;
基于微调后的第二层隐含层和第三层隐含层的权值和偏移量,以及所述Logistic分类器的连接权重,确定训练好的三层栈式稀疏自编码器和Logistic分类器;
利用所述测试HOG-LBP-PCA特征,对所述训练好的三层栈式稀疏自编码器和Logistic分类器进行网络性能测试。
3.根据权利要求1所述的方法,其特征在于,所述对所述标准目标物体图像,采用方向梯度直方图特征提取算法,提取HOG特征的步骤进一步包括:
计算所述标准目标物体图像中每个像素点的梯度方向;
按照相同的规格尺寸,将所述标准目标物体图像划分成多个子图像方块,并基于所述子图像方块中每个像素点的梯度方向,构建每个所述子图像方块的多维梯度方向直方图;
按照设定数量,将所述标准目标物体图像中每相邻的多个所述子图像方块组合成一个大方块,并将所述大方块中每个所述子图像方块的多维梯度方向直方图进行串联,获取每个所述大方块的HOG特征;
将所述标准目标物体图像中所有所述大方块的HOG特征进行串联,获取所述标准目标物体图像的HOG特征。
4.根据权利要求1所述的方法,其特征在于,所述对所述标准目标物体图像,采用局部二值模式特征提取算法,提取LBP特征的步骤进一步包括:
将所述标准目标物体图像按照给定规格尺寸,划分为多个子图像方块;
对于任一所述子图像方块,分别将该子图像方块中每个像素点作为中心像素点,通过比较所述中心像素点的灰度与所述中心像素点3×3邻域内其余像素点的灰度的大小,构建所述子图像方块的LBP直方图;
对每个所述子图像方块的LBP直方图进行归一化处理,并将所有归一化处理后的LBP直方图进行串联,获取所述标准目标物体图像的LBP特征。
5.根据权利要求1所述的方法,其特征在于,所述利用主成分分析法,对所述HOG-LBP特征进行降维处理,获取HOG-LBP-PCA特征的步骤进一步包括:
以所述HOG-LBP特征构成的向量作为HOG-LBP特征向量,计算所有所述HOG-LBP特征向量的协方差矩阵;
采用奇异值分解法,求解所述协方差矩阵的特征值和特征向量,并将所述特征值按从大到小的顺序进行排列,构成特征值序列;
计算所有所述特征值之和,并确定最小取值d,使d满足:在所述特征值序列中,前d个特征值之和对所有所述特征值之和的占比不小于设定阈值;
选取所述特征值序列中的前d个特征值及所述前d个特征值分别对应的特征向量,并基于所述前d个特征值分别对应的特征向量和所述HOG-LBP特征向量,获取所述HOG-LBP-PCA特征。
6.根据权利要求2所述的方法,其特征在于,所述利用所述训练HOG-LBP-PCA特征,采用逐层贪婪训练法,训练初始化设置的三层栈式稀疏自编码器,确定三层栈式稀疏自编码器中各层编码器的权值和偏移量的步骤进一步包括:
从所述三层栈式稀疏自编码器的第一层编码器开始,对于任一层编码器,将所述训练HOG-LBP-PCA特征输入所述三层栈式稀疏自编码器的输入端,获取该层编码器的映射输出;
基于所述训练HOG-LBP-PCA特征和该层编码器的映射输出,计算该层编码器的损失函数;
采用循环迭代算法,通过逐步优化所述损失函数,确定该层编码器的所述权值和偏移量。
7.根据权利要求2所述的方法,其特征在于,所述利用使用标签标记的训练样本,对初始化设置的Logistic分类器进行训练,确定Logistic分类器的连接权重并微调所述三层栈式稀疏自编码器中各层编码器的权值和偏移量的步骤进一步包括:
将所述使用标签标记的训练样本和对应标签输入到所述三层栈式稀疏自编码器的输入端,计算所述初始化设置的Logistic分类器的输出;
基于所述标签和所述初始化设置的Logistic分类器的输出,计算样本的交叉熵;
采用循环迭代算法,逐步优化所述交叉熵,确定所述Logistic分类器的连接权重;
基于所述Logistic分类器的连接权重,利用反向传播算法,微调所述三层栈式稀疏自编码器中各层编码器的权值和偏移量。
8.一种基于栈式稀疏自编码器的目标识别装置,其特征在于,包括:
预处理模块,用于对包含目标物体的图像,依次进行灰度化处理和归一化处理,并以归一化处理的结果作为标准目标物体图像;
特征提取模块,用于对所述标准目标物体图像,分别采用方向梯度直方图特征提取算法,提取HOG特征,并采用局部二值模式特征提取算法,提取LBP特征;
降维处理模块,用于将所述HOG特征和所述LBP特征进行拼接,获取HOG-LBP特征,并利用主成分分析法,对所述HOG-LBP特征进行降维处理,获取HOG-LBP-PCA特征;
识别模块,用于基于所述HOG-LBP-PCA特征,利用预先建立的三层栈式稀疏自编码器和Logistic分类器,检测所述目标物体。
9.一种电子设备,其特征在于,包括:至少一个存储器、至少一个处理器、通信接口和总线;
所述存储器、所述处理器和所述通信接口通过所述总线完成相互间的通信,所述通信接口用于所述电子设备与包含目标物体的图像的采集或者存储设备之间的信息传输;
所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1至7中任一所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810772591.2A CN109271833A (zh) | 2018-07-13 | 2018-07-13 | 基于栈式稀疏自编码器的目标识别方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810772591.2A CN109271833A (zh) | 2018-07-13 | 2018-07-13 | 基于栈式稀疏自编码器的目标识别方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109271833A true CN109271833A (zh) | 2019-01-25 |
Family
ID=65148155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810772591.2A Pending CN109271833A (zh) | 2018-07-13 | 2018-07-13 | 基于栈式稀疏自编码器的目标识别方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109271833A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113505695A (zh) * | 2021-07-09 | 2021-10-15 | 上海工程技术大学 | 一种基于aehal特征的轨道扣件状态检测方法 |
CN115242293A (zh) * | 2022-07-15 | 2022-10-25 | 广州瀚信通信科技股份有限公司 | 一种图片特征的传输方法、装置、电子设备及存储介质 |
CN117853453A (zh) * | 2024-01-10 | 2024-04-09 | 苏州矽行半导体技术有限公司 | 一种基于梯度提升树的缺陷过滤方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408469A (zh) * | 2014-11-28 | 2015-03-11 | 武汉大学 | 基于图像深度学习的烟火识别方法及系统 |
CN107578007A (zh) * | 2017-09-01 | 2018-01-12 | 杭州电子科技大学 | 一种基于多特征融合的深度学习人脸识别方法 |
-
2018
- 2018-07-13 CN CN201810772591.2A patent/CN109271833A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408469A (zh) * | 2014-11-28 | 2015-03-11 | 武汉大学 | 基于图像深度学习的烟火识别方法及系统 |
CN107578007A (zh) * | 2017-09-01 | 2018-01-12 | 杭州电子科技大学 | 一种基于多特征融合的深度学习人脸识别方法 |
Non-Patent Citations (2)
Title |
---|
XIAOYU WANG ET.AL.: "An HOG-LBP Human Detector with Partial Occlusion Handling", 《IEEE》 * |
陈浩翔 等: "手写数字深度特征学习与识别", 《计算机技术与发展》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113505695A (zh) * | 2021-07-09 | 2021-10-15 | 上海工程技术大学 | 一种基于aehal特征的轨道扣件状态检测方法 |
CN115242293A (zh) * | 2022-07-15 | 2022-10-25 | 广州瀚信通信科技股份有限公司 | 一种图片特征的传输方法、装置、电子设备及存储介质 |
CN115242293B (zh) * | 2022-07-15 | 2023-11-03 | 广州瀚信通信科技股份有限公司 | 一种图片特征的传输方法、装置、电子设备及存储介质 |
CN117853453A (zh) * | 2024-01-10 | 2024-04-09 | 苏州矽行半导体技术有限公司 | 一种基于梯度提升树的缺陷过滤方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110443143B (zh) | 多分支卷积神经网络融合的遥感图像场景分类方法 | |
Zhang et al. | A GANs-based deep learning framework for automatic subsurface object recognition from ground penetrating radar data | |
CN110555399B (zh) | 手指静脉识别方法、装置、计算机设备及可读存储介质 | |
CN106503727B (zh) | 一种高光谱图像分类的方法及装置 | |
CN111709311A (zh) | 一种基于多尺度卷积特征融合的行人重识别方法 | |
CN110633708A (zh) | 一种基于全局模型和局部优化的深度网络显著性检测方法 | |
CN109033978B (zh) | 一种基于纠错策略的cnn-svm混合模型手势识别方法 | |
CN108596195B (zh) | 一种基于稀疏编码特征提取的场景识别方法 | |
CN104751175B (zh) | 基于增量支持向量机的sar图像多类标场景分类方法 | |
Wang et al. | Hand-drawn electronic component recognition using deep learning algorithm | |
CN113095370A (zh) | 图像识别方法、装置、电子设备及存储介质 | |
CN109271833A (zh) | 基于栈式稀疏自编码器的目标识别方法、装置及电子设备 | |
CN111582337A (zh) | 基于小样本细粒度图像分析的草莓畸形状态检测方法 | |
CN109325407B (zh) | 基于f-ssd网络滤波的光学遥感视频目标检测方法 | |
CN115311502A (zh) | 基于多尺度双流架构的遥感图像小样本场景分类方法 | |
CN115620160A (zh) | 基于多分类器对抗主动迁移学习的遥感图像分类方法 | |
CN113065409A (zh) | 一种基于摄像分头布差异对齐约束的无监督行人重识别方法 | |
CN110263855A (zh) | 一种利用共基胶囊投影进行图像分类的方法 | |
CN113011243A (zh) | 基于胶囊网络的面部表情分析方法 | |
CN113657414A (zh) | 一种物体识别方法 | |
CN112329771A (zh) | 一种基于深度学习的建筑材料样本识别方法 | |
CN116935100A (zh) | 一种基于特征融合和自注意力机制的多标签图像分类方法 | |
CN114187506B (zh) | 视点意识的动态路由胶囊网络的遥感图像场景分类方法 | |
Maharani et al. | Deep features fusion for KCF-based moving object tracking | |
Zhan et al. | Computational colour constancy based on convolutional neural networks with a cross‐level architecture |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190125 |