WO2020224221A1

WO2020224221A1 - 跟踪方法、装置、电子设备及存储介质

Info

Publication number: WO2020224221A1
Application number: PCT/CN2019/118008
Authority: WO
Inventors: 车宏伟
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-05-06
Filing date: 2019-11-13
Publication date: 2020-11-12
Also published as: CN110222572A; CN110222572B

Abstract

一种跟踪方法、装置、电子设备及存储介质，所述跟踪方法能够当接收到跟踪指令时，获取含有人体的图像（S10），对所述图像进行预处理，得到待识别图像（S11），将所述待识别图像输入到预先训练的神经网络模型中，得到带有关键点标记的标记图像（S12），采用上下感知显著区域检测算法，基于关键点标记对所述标记图像进行分割，得到人物图像（S13），提取所述人物图像的特征向量（S14），采用支持向量机学习算法对所述特征向量进行处理，识别出所述人物图像中的目标人物（S15），从而基于图像处理技术实现对人物的准确跟踪，有效避免环境的干扰。

Description

跟踪方法、装置、电子设备及存储介质

本申请要求于2019年5月6日提交中国专利局，申请号为201910370526.1、发明名称为“跟踪方法、装置、电子设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及图像处理技术领域，尤其涉及一种跟踪方法、装置、电子设备及存储介质。

背景技术

对于当今大多数智能视频监控系统来说，场景中所出现的人或车等目标是关注的焦点，而行人目标作为监控场景中最活跃和最重要的因素，自然需要更精确地对其进行识别。

然而，对于行人的精确识别还存有很多问题，如应用场景多数比较复杂，背景的局部动态变化、光照不均造成目标阴影，以及大风等恶劣天气会增加识别的难度。另外，行人是非刚性目标，拥有丰富的姿态特征，同一行人所处不同的姿态，在检测和识别中往往差别很大。

发明内容

鉴于以上内容，有必要提供一种跟踪方法、装置、电子设备及存储介质，能够基于图像处理技术实现对人物的准确跟踪，有效避免环境的干扰。

一种跟踪方法，所述方法包括：当接收到跟踪指令时，获取含有人体的图像；对所述图像进行预处理，得到待识别图像；将所述待识别图像输入到预先训练的神经网络模型中，得到带有关键点标记的标记图像；采用上下感知显著区域检测算法，基于关键点标记对所述标记图像进行分割，得到人物图像；提取所述人物图像的特征向量；采用支持向量机学习算法对所述特征向量进行处理，识别出所述人物图像中的目标人物。

一种电子设备，所述电子设备包括：存储器，存储至少一个指令；及处理器，执行所述存储器中存储的指令以实现所述跟踪方法。

一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一个指令，所述至少一个指令被电子设备中的处理器执行以实现所述跟踪方法。

由以上技术方案可以看出，本申请能够当接收到跟踪指令时，获取含有人体的图像，并对所述图像进行预处理，得到待识别图像，进一步将所述待识别图像输入到预先训练的神经网络模型中，得到带有关键点标记的标记图像，使图像识别更加准确，采用上下感知显著区域检测算法，基于关键点标记对所述标记图像进行分割，得到人物图像，并提取所述人物图像的特征向量，进一步采用支持向量机学习算法对所述特征向量进行处理，识别出所述人物图像中的目标人物，从而基于图像处理技术实现对人物的准确跟踪，有效避免环境的干扰。

附图说明

图1是本申请跟踪方法的较佳实施例的流程图。

图2是本申请跟踪装置的较佳实施例的功能模块图。

图3是本申请实现跟踪方法的较佳实施例的电子设备的结构示意图。

主要元件符号说明

电子设备	1
存储器	12
处理器	13
跟踪装置	11
获取单元	110
预处理单元	111
输入单元	112
分割单元	113
提取单元	114
识别单元	115
降维单元	116
下采样单元	117
发送单元	118

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面结合附图和具体实施例对本申请进行详细描述。

如图1所示，是本申请跟踪方法的较佳实施例的流程图。根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。

所述跟踪方法应用于一个或者多个电子设备中，所述电子设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述电子设备可以是任何一种可与用户进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant， PDA)、游戏机、交互式网络电视(Internet Protocol Television，IPTV)、智能式穿戴式设备等。

所述电子设备还可以包括网络设备和/或用户设备。其中，所述网络设备包括，但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云。

所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network，VPN)等。

S10，当接收到跟踪指令时，获取含有人体的图像。

在本申请的至少一个实施例中，所述跟踪指令可以由任何人触发，本申请不限制。

在一些特定应用场景中，所述跟踪指令可以由警务人员等触发。

在本申请的至少一个实施例中，所述含有人体的图像可以通过与所述电子设备相通信的摄像装置拍摄，所述摄像装置包括，但不限于马路上的摄像头等。

S11，对所述图像进行预处理，得到待识别图像。

在本申请的至少一个实施例中，所述电子设备对所述图像进行预处理，得到待识别图像包括：

所述电子设备对所述图像进行灰度化处理，得到灰度图像，并对所述灰度图像进行二值化处理，得到黑白图像，进一步对所述黑白图像进行降噪处理，得到所述待识别图像。

具体地，所述电子设备将彩色图像转换为灰度图的操作，运用的是各比例法，即设当前像素的三分量分别为R，G，B，然后利用如下公式得到转换后的像素分量值：0.30*R+0.59*G+0.11*B。

进一步地，所述电子设备对所述图像进行二值化操作。图像的二值化处理就是将图像上的像素设置为0或255，也就是使整个图像呈现出明显的黑白效果。

更进一步地，所述电子设备通过设计自适应图像降噪滤波器对所述黑白图像进行降噪，这样可以很好的滤除“椒盐”噪声，并且可以很大程度的保护图像的细节。

其中，椒盐噪声是图像中一种随机出现的白点或黑点，而自适应图像降噪滤波器便是信号抽取器，它的作用是从被噪声污染的信号中抽取原来的信号。

具体地，假设输入的待处理图像为f(x，y)，在退化函数H的作用下，由于受到噪声η(x，y)的影响，最终得到一个退化图像g(x，y)。这时得到一个图像退化公式：g(x，y)＝η(x，y)+f(x，y)，并利用Adaptive Filter方法对图像进行降噪，其方法的核心思想是：

其中，

是整张图像的噪声方差，

是点(x，y)附近的一个窗口内的像素灰度均值，

是点(x，y)附近一个窗口内的像素灰度的方差。

可以理解的是，采集的图像中包含很多无效特征和干扰特征，此外，行人身材和衣着的不同也会导致行人的外观有很大差异，这样将严重影响识别精度，而被污染的图像对后续的图像分析和处理存在不可预知的影响，自适应图像降噪滤波器可以减少噪声对输入图像的影响。

在本申请的至少一个实施例中，在对所述图像进行预处理，得到待识别图像前，所述方法还包括：

所述电子设备对所述图像进行降维处理。

可以理解的是，由于所获得数据维度过高，在处理这样的数据时耗时过大，因此首先对高维数据进行降维的处理。

具体地，所述电子设备采用主成分分析算法对所述图像进行降维处理。

其中，主成分分析算法是一种通过正交变换将一组可能存在相关性的变量转换为一组线性不相关变量的方法。

S12，将所述待识别图像输入到预先训练的神经网络模型中，得到带有关键点标记的标记图像。

在本申请的至少一个实施例中，所述电子设备将所述待识别图像输入到预先训练的神经网络模型中，得到带有关键点标记的标记图像包括：

所述电子设备将所述待识别图像依次输入一个7*7的卷积层、一个3*3的最大值池化层及4个卷积模块，得到所述带有关键点标记的标记图像。

具体地，卷积神经网络(Convolutional Neural Networks，CNN)是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，其基本结构包括两层，其一为特征提取层，每个神经元的输入与前一层的局部接受域相连，并提取该局部的特征。一旦该局部特征被提取后，它与其它特征间的位置关系也随之确定下来；其二是特征映射层，网络的每个计算层由多个特征映射组成，每个特征映射是一个平面，平面上所有神经元的权值相等。特征映射结构采用sigmoid函数作为卷积网络的激活函数，使得特征映射具有位移不变性。此外，由于一个映射面上的神经元共享权值，因而减少了网络自由参数的个数。卷积神经网络中的每一个卷积层都紧跟着一个用来求局部平均与二次提取的计算层，这种特有的两次特征提取结构减小了特征分辨率。

具体地，所述方法还包括：

在所述最大值池化层，所述电子设备对所述待识别图像在空间维度上进行下采样处理。

所述电子设备对所述待识别图像在空间维度上进行下采样操作，使得输入的待识别图像的长和宽变为原来的一半。

进一步地，每个卷积模块从具有线性投影的构建块开始，随后是具有本体映射的不同数量的构建块，最后输出所述标记图像。

通过上述实施方式，卷积神经网络的多层网络结构能自动提取输入数据的深层特征，不同层次的网络可以学习到不同层次的特征，从而大大提高对图像处理的准确率，并且，卷积神经网络通过局部感知和权值共享，保留了图像间的关联信息，并且大大减少了所需参数的数量。通过最大池化层技术，进一步缩减网络参数数量，提高模型的鲁棒性，可以让模型持续地扩展深度，继续增加隐层，从而更高效地对图像进行处理。

S13，采用上下感知显著区域检测算法(Context-Aware，CA)，基于关键点标记对所述标记图像进行分割，得到人物图像。

可以理解的是，通常检测出的行人是用矩形框标记的，在矩形框中会含有部分背景噪声区域，而在后期的匹配算法中需要精确的目标，分割的质量直接影响到后期的识别效果。

在本实施例中，采用上下感知显著区域检测算法对所述标记图像进行分割，该算法联系周围的环境，并将吸引人类视觉注意力的点分割出来。显著区域总是与周围区域有明显的颜色、亮度等特征的差异，由于显著区域的位置、大小等不确定性因素，无论从局部还是全局都无法确定显著区域的整体位置信息，只能从局部一一考虑。因此，在本实施例中，将图像划分为许多小块，然后计算每两个块之间的相似性，由于显著区域在空间上有一定程度的聚集特性，则同属于一个显著区域的块之间具有特征相似性和空间聚集性，即根据图像中特征相似块在图像中的散布程度来确定显著区域。其具体过程如下：

(1)单一尺度显著值计算。

具体地，将图像I分成大小相等的n个小块，p _i和p _j分别表示中心点在第i和j像素点位置处的小块，然后提取该块的局部特征，选用对人眼视觉感受最灵敏的彩色L*a*b空间，计算每两个块p _i和p _j之间的距离d _color(p _i,p _j)作为衡量块是否相似的标准，且做相应的归一化处理。如果像素i与图像中的任何一个像素J之间的距离d _color(p _i,p _j)都很大，则i为显著点。如果某个块与其相似的块分布在该块附近时，该块被认为是显著的；相反，如果与其相似的块零散的分布在图像的各个地方，则该块被认为是非显著的。d _position(p _i,p _j)表示两个块之间的空间欧氏距离。结合特征距离和空间距离，使d(p _i,p _j)来衡量两个块之间的相似性：

其中，c作为参数。通常对于某一块的显著度进行计算时，只需考虑与该块最相似的K个块，在当前尺度下划分的当前像素点i的显著度计算公式为：

(2)图像上下文感知的显著值计算。

显著的区域总有一个或几个聚类中心，则可得到初始显著值矩阵进行中心聚集化操作。假设显著区域的聚类中心已知，则越靠近聚类中心的区域显著性越强，越远离聚类中心的区域显著性越弱。经过上式显著度计算公式得到的归一化后的显著值矩阵中，将

的像素点视为图像中显著区域的聚类中心。根据得到的这些聚类中心，将图像中的非聚类中心点的显著值按照下式进行更新：

(3)根据图像关键点，利用二值化去噪方法进行像素级分割，从而得到分割后的人物图像。

S14，提取所述人物图像的特征向量。

在本申请的至少一个实施例中，所述电子设备提取所述人物图像的特征向量包括：

所述电子设备采用尺度不变特征变换算法，提取所述人物图像的方向梯度直方图特征(Histogram of Oriented Gradient,HOG)。

具体地，所述方向梯度直方图是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。HOG特征通过计算和统计图像局部区域的梯度方向直方图来构成特征，而提取HOG特征流程如下：

计算每张人物图像的每个像素点(x,y)的梯度幅值G(x,y)和梯度方向σ(x,y)，形成图像的梯度矩阵，梯度矩阵中每一个元素都是向量，第一个分量是梯度幅值，第二、三个分量组合起来表示梯度方向。图像矩阵分为小的细胞单元，每个细胞单元为4*4像素，每2*2个细胞单元构成一个块，将0°到180°的角度平均分为9个通道。计算细胞单元中的每个像素点的梯度大小和方向，然后进行投票，统计出梯度方向直方图。梯度方向直方图共有9个方向通道，梯度方向直方图的每一个通道累加出像素的梯度大小的和，最终得到一组由各个通道像素梯度累加和构成的向量。把细胞单元组成块，在每一个块内部对特征向量归一化。将经过归一化处理后的所有特征向量连接起来，形成检测图像的HOG特征。

进一步地，所述尺度不变特征变换算法即为在尺度空间进行特征检测，并确定关键点的位置和尺度，再使用关键点邻域梯度的主方向作为该点的特征，从而实现尺度不变特征变换算法对方向和尺度无关性。

所述尺度不变特征变换算法的步骤为尺度空间极值检测、关键点位置及确定、关键点方向确定和特征向量生成。由于在本实施例中，关键点已被确认，因此，只需采用主成分分析算法对图像进行降维处理，得到稳定的尺度不变特征变换算法。主成分分析算法是一种通过正交变换将一组可能存在相关性的变量转换为一组线性不相关变量的方法。

S15，采用支持向量机学习算法对所述特征向量进行处理，识别出所述人物图像中的目标人物。

在本申请的至少一个实施例中，所述电子设备根据每种特征在实际检测过程中所占比重的不同设置了不同的权值，并通过支持向量机学习算法对特征向量进行分类，假设训练样本的数据集合为{(x _i,y _i)|x _i∈R ⁿ,y _i∈R}，其中，样本数据x _i是n维空间的向量，这些向量描述了待分类数据的特征，被称为特征向量，y _i代表样本数据的类别，根据y _i的正负来将样本分为正样本和负样本，在本实施例中，每一个样本的特征向量都可作为一个点把正负样本分开，假设在此空间存在一个超平面

其中符号<>是向量的内积运算符，w是已知的向量，b是已知的实数，因此，其最优分类函数为：

其中，sgn代表符号函数，符号函数判断自变量是否小于零，小于零则函数值为-1，大于或者等于零，则函数值为1。

更进一步地，所述电子设备识别出所述人物图像中的目标人物。

在本申请的至少一个实施例中，在采用支持向量机学习算法对所述特征向量进行处理，识别出所述人物图像中的目标人物后，所述方法还包括：

所述电子设备获取所述目标人物的位置坐标，并将所述人物图像及所述位置坐标发送至配置服务器。

其中，所述配置服务器可以是任意服务器，本申请不限制。

例如；当所述配置服务器为公安机关的服务器时，可以辅助警务人员进行人物的搜索。

如图2所示，是本申请跟踪装置的较佳实施例的功能模块图。所述跟踪装置11包括获取单元110、预处理单元111、输入单元112、分割单元113、提取单元114、识别单元115、降维单元116、下采样单元117及发送单元118。本申请所称的模块/单元是指一种能够被处理器13所执行，并且能够完成固定功能的一系列计算机程序段，其存储在存储器12中。在本实施例中，关于各模块/单元的功能将在后续的实施例中详述。

当接收到跟踪指令时，获取单元110获取含有人体的图像。

在本申请的至少一个实施例中，所述含有人体的图像可以通过与电子设备相通信的摄像装置拍摄，所述摄像装置包括，但不限于马路上的摄像头等。

预处理单元111对所述图像进行预处理，得到待识别图像。

在本申请的至少一个实施例中，所述预处理单元111对所述图像进行预处理，得到待识别图像包括：

所述预处理单元111对所述图像进行灰度化处理，得到灰度图像，并对所述灰度图像进行二值化处理，得到黑白图像，进一步对所述黑白图像进行降噪处理，得到所述待识别图像。

具体地，所述预处理单元111将彩色图像转换为灰度图的操作，运用的是各比例法，即设当前像素的三分量分别为R，G，B，然后利用如下公式得到转换后的像素分量值：0.30*R+0.59*G+0.11*B。

进一步地，所述预处理单元111对所述图像进行二值化操作。图像的二值化处理就是将图像上的像素设置为0或255，也就是使整个图像呈现出明显的黑白效果。

更进一步地，所述预处理单元111通过设计自适应图像降噪滤波器对所述黑白图像进行降噪，这样可以很好的滤除“椒盐”噪声，并且可以很大程度的保护图像的细节。

其中，

是整张图像的噪声方差，

是点(x，y)附近的一个窗口内的像素灰度均值，

是点(x，y)附近一个窗口内的像素灰度的方差。

降维单元116对所述图像进行降维处理。

具体地，所述降维单元116采用主成分分析算法对所述图像进行降维处理。

输入单元112将所述待识别图像输入到预先训练的神经网络模型中，得到带有关键点标记的标记图像。

在本申请的至少一个实施例中，所述输入单元112将所述待识别图像输入到预先训练的神经网络模型中，得到带有关键点标记的标记图像包括：

所述输入单元112将所述待识别图像依次输入一个7*7的卷积层、一个3*3的最大值池化层及4个卷积模块，得到所述带有关键点标记的标记图像。

具体地，所述方法还包括：

在所述最大值池化层，下采样单元117对所述待识别图像在空间维度上进行下采样处理。

所述下采样单元117对所述待识别图像在空间维度上进行下采样操作，使得输入的待识别图像的长和宽变为原来的一半。

分割单元113采用上下感知显著区域检测算法(Context-Aware，CA)，基于关键点标记对所述标记图像进行分割，得到人物图像。

(1)单一尺度显著值计算。

(2)图像上下文感知的显著值计算。

提取单元114提取所述人物图像的特征向量。

在本申请的至少一个实施例中，所述提取单元114提取所述人物图像的特征向量包括：

所述提取单元114采用尺度不变特征变换算法，提取所述人物图像的方向梯度直方图特征(Histogram of Oriented Gradient,HOG)。

识别单元115采用支持向量机学习算法对所述特征向量进行处理，识别出所述人物图像中的目标人物。

在本申请的至少一个实施例中，所述识别单元115根据每种特征在实际检测过程中所占比重的不同设置了不同的权值，并通过支持向量机学习算法对特征向量进行分类，假设训练样本的数据集合为{(x _i,y _i)|x _i∈R ⁿ,y _i∈R}，其中，样本数据x _i是n维空间的向量，这些向量描述了待分类数据的特征，被称为特征向量，y _i代表样本数据的类别，根据y _i的正负来将样本分为正样本和负样本，在本实施例中，每一个样本的特征向量都可作为一个点把正负样本分开，假设在此空间存在一个超平面

更进一步地，所述识别单元115识别出所述人物图像中的目标人物。

所述获取单元110获取所述目标人物的位置坐标，发送单元118将所述人物图像及所述位置坐标发送至配置服务器。

其中，所述配置服务器可以是任意服务器，本申请不限制。

如图3所示，是本申请实现跟踪方法的较佳实施例的电子设备的结构示意图。

所述电子设备1是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述电子设备1还可以是但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant，PDA)、游戏机、交互式网络电视(Internet Protocol Television，IPTV)、智能式穿戴式设备等。

所述电子设备1还可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。

所述电子设备1所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network，VPN)等。

在本申请的一个实施例中，所述电子设备1包括，但不限于，存储器12、处理器13，以及存储在所述存储器12中并可在所述处理器13上运行的计算机程序，例如跟踪程序。

本领域技术人员可以理解，所述示意图仅仅是电子设备1的示例，并不构成对电子设备1的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述电子设备1还可以包括输入输出设备、网络接入设备、总线等。

所述处理器13可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器13是所述电子设备1的运算核心和控制中心，利用各种接口和线路连接整个电子设备1的各个部分，及执行所述电子设备1的操作系统以及安装的各类应用程序、程序代码等。

所述处理器13执行所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个跟踪方法实施例中的步骤，例如图1所示的步骤S10、S11、S12、S13、S14、S15。

或者，所述处理器13执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能，例如：当接收到跟踪指令时，获取含有人体的图像；对所述图像进行预处理，得到待识别图像；将所述待识别图像输入到预先训练的神经网络模型中，得到带有关键点标记的标记图像；采用上下感知显著区域检测算法，基于关键点标记对所述标记图像进行分割，得到人物图像；提取所述人物图像的特征向量；采用支持向量机学习算法对所述特征向量进行处理，识别出所述人物图像中的目标人物。

示例性的，所述计算机程序可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器12中，并由所述处理器13执行，以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序在所述电子设备1中的执行过程。例如，所述计算机程序可以被分割成获取单元110、预处理单元111、输入单元112、分割单元113、提取单元114、识别单元115、降维单元116、下采样单元117及发送单元118。

所述存储器12可用于存储所述计算机程序和/或模块，所述处理器13通过运行或执行存储在所述存储器12内的计算机程序和/或模块，以及调用存储在存储器12内的数据，实现所述电子设备1的各种功能。所述存储器12可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器12可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

所述存储器12可以是电子设备1的外部存储器和/或内部存储器。进一步地，所述存储器12可以是集成电路中没有实物形式的具有存储功能的电路，如RAM(Random-Access Memory，随机存取存储器)、FIFO(First In First Out，)等。或者，所述存储器12也可以是具有实物形式的存储器，如内存条、TF卡(Trans-flash Card)等等。

所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。

其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

结合图1，所述电子设备1中的所述存储器12存储多个指令以实现一种跟踪方法，所述处理器13可执行所述多个指令从而实现：当接收到跟踪指令时，获取含有人体的图像；对所述图像进行预处理，得到待识别图像；将所述待识别图像输入到预先训练的神经网络模型中，得到带有关键点标记的标记图像；采用上下感知显著区域检测算法，基于关键点标记对所述标记图像进行分割，得到人物图像；提取所述人物图像的特征向量；采用支持向量机学习算法对所述特征向量进行处理，识别出所述人物图像中的目标人物。

根据本申请优选实施例，所述处理器13执行多个指令包括：

对所述图像进行灰度化处理，得到灰度图像；

对所述灰度图像进行二值化处理，得到黑白图像；

对所述黑白图像进行降噪处理，得到所述待识别图像。

根据本申请优选实施例，所述处理器13还执行多个指令包括：

对所述图像进行降维处理。

将所述待识别图像依次输入一个7*7的卷积层、一个3*3的最大值池化层及4个卷积模块，得到所述带有关键点标记的标记图像。

在所述最大值池化层，对所述待识别图像在空间维度上进行下采样处理。

采用尺度不变特征变换算法，提取所述人物图像的方向梯度直方图特征。

获取所述目标人物的位置坐标；

将所述人物图像及所述位置坐标发送至配置服务器。

具体地，所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述，在此不赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其他的具体形式实现本申请。

因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。

此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本申请的技术方案而非限制，尽管参照较佳实施例对本申请进行了详细说明，本领域的普通技术人员应当理解，可以对本申请的技术方案进行修改或等同替换，而不脱离本申请技术方案的精神和范围。

Claims

一种跟踪方法，其特征在于，所述方法包括：

当接收到跟踪指令时，获取含有人体的图像；

对所述图像进行预处理，得到待识别图像；

将所述待识别图像输入到预先训练的神经网络模型中，得到带有关键点标记的标记图像；

采用上下感知显著区域检测算法，基于关键点标记对所述标记图像进行分割，得到人物图像；

提取所述人物图像的特征向量；

采用支持向量机学习算法对所述特征向量进行处理，识别出所述人物图像中的目标人物。
如权利要求1所述的跟踪方法，其特征在于，所述对所述图像进行预处理，得到待识别图像包括：

对所述图像进行灰度化处理，得到灰度图像；

对所述灰度图像进行二值化处理，得到黑白图像；

对所述黑白图像进行降噪处理，得到所述待识别图像。
如权利要求2所述的跟踪方法，其特征在于，在对所述图像进行预处理，得到待识别图像前，所述方法还包括：

对所述图像进行降维处理。
如权利要求1所述的跟踪方法，其特征在于，所述将所述待识别图像输入到预先训练的神经网络模型中，得到带有关键点标记的标记图像包括：

将所述待识别图像依次输入一个7*7的卷积层、一个3*3的最大值池化层及4个卷积模块，得到所述带有关键点标记的标记图像。
如权利要求4所述的跟踪方法，其特征在于，所述方法还包括：

在所述最大值池化层，对所述待识别图像在空间维度上进行下采样处理。
如权利要求1所述的跟踪方法，其特征在于，所述提取所述人物图像的特征向量包括：

采用尺度不变特征变换算法，提取所述人物图像的方向梯度直方图特征。
如权利要求1所述的跟踪方法，其特征在于，在采用支持向量机学习算法对所述特征向量进行处理，识别出所述人物图像中的目标人物后，所述方法还包括：

获取所述目标人物的位置坐标；

将所述人物图像及所述位置坐标发送至配置服务器。
一种电子设备，其特征在于，所述电子设备包括：

存储器，存储至少一个指令；及处理器，执行所述存储器中存储的指令以实现如下步骤：

当接收到跟踪指令时，获取含有人体的图像；

对所述图像进行预处理，得到待识别图像；

将所述待识别图像输入到预先训练的神经网络模型中，得到带有关键点标记的标记图像；

采用上下感知显著区域检测算法，基于关键点标记对所述标记图像进行分割，得到人物图像；

提取所述人物图像的特征向量；

采用支持向量机学习算法对所述特征向量进行处理，识别出所述人物图像中的目标人物。
如权利要求8所述的电子设备，其特征在于，所述对所述图像进行预处理，得到待识别图像包括：

对所述图像进行灰度化处理，得到灰度图像；

对所述灰度图像进行二值化处理，得到黑白图像；

对所述黑白图像进行降噪处理，得到所述待识别图像。
如权利要求9所述的电子设备，其特征在于，在对所述图像进行预处理，得到待识别图像前，还包括：

对所述图像进行降维处理。
如权利要求8所述的电子设备，其特征在于，所述将所述待识别图像输入到预先训练的神经网络模型中，得到带有关键点标记的标记图像包括：

将所述待识别图像依次输入一个7*7的卷积层、一个3*3的最大值池化层及4个卷积模块，得到所述带有关键点标记的标记图像。
如权利要求11所述的电子设备，其特征在于，还包括：

在所述最大值池化层，对所述待识别图像在空间维度上进行下采样处理。
如权利要求8所述的电子设备，其特征在于，所述提取所述人物图像的特征向量包括：

采用尺度不变特征变换算法，提取所述人物图像的方向梯度直方图特征。
如权利要求8所述的电子设备，其特征在于，在采用支持向量机学习算法对所述特征向量进行处理，识别出所述人物图像中的目标人物后，还包括：

获取所述目标人物的位置坐标；

将所述人物图像及所述位置坐标发送至配置服务器。
一种计算机可读存储介质，其特征在于：所述计算机可读存储介质中存储有至少一个指令，所述至少一个指令被电子设备中的处理器执行以实现如下步骤：

当接收到跟踪指令时，获取含有人体的图像；

对所述图像进行预处理，得到待识别图像；

将所述待识别图像输入到预先训练的神经网络模型中，得到带有关键点标记的标记图像；

采用上下感知显著区域检测算法，基于关键点标记对所述标记图像进行分割，得到人物图像；

提取所述人物图像的特征向量；

采用支持向量机学习算法对所述特征向量进行处理，识别出所述人物图像中的目标人物。
如权利要求15所述的计算机可读存储介质，其特征在于，所述对所述图像进行预处理，得到待识别图像包括：

对所述图像进行灰度化处理，得到灰度图像；

对所述灰度图像进行二值化处理，得到黑白图像；

对所述黑白图像进行降噪处理，得到所述待识别图像。
如权利要求16所述的计算机可读存储介质，其特征在于，在对所述图像进行预处理，得到待识别图像前，还包括：

对所述图像进行降维处理。
如权利要求15所述的计算机可读存储介质，其特征在于，所述将所述待识别图像输入到预先训练的神经网络模型中，得到带有关键点标记的标记图像包括：

将所述待识别图像依次输入一个7*7的卷积层、一个3*3的最大值池化层及4个卷积模块，得到所述带有关键点标记的标记图像。
如权利要求18所述的计算机可读存储介质，其特征在于，还包括：

在所述最大值池化层，对所述待识别图像在空间维度上进行下采样处理。
如权利要求15所述的计算机可读存储介质，其特征在于，所述提取所述人物图像的特征向量包括：

采用尺度不变特征变换算法，提取所述人物图像的方向梯度直方图特征。