CN110555463B - 一种基于步态特征的身份识别方法 - Google Patents

一种基于步态特征的身份识别方法 Download PDF

Info

Publication number
CN110555463B
CN110555463B CN201910718693.0A CN201910718693A CN110555463B CN 110555463 B CN110555463 B CN 110555463B CN 201910718693 A CN201910718693 A CN 201910718693A CN 110555463 B CN110555463 B CN 110555463B
Authority
CN
China
Prior art keywords
data
model
training
user
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910718693.0A
Other languages
English (en)
Other versions
CN110555463A (zh
Inventor
刘家佳
张海宾
李坤林
郭鸿志
孙文
谭欢
文博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN201910718693.0A priority Critical patent/CN110555463B/zh
Publication of CN110555463A publication Critical patent/CN110555463A/zh
Application granted granted Critical
Publication of CN110555463B publication Critical patent/CN110555463B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • G06F18/2193Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/245Classification techniques relating to the decision surface
    • G06F18/2453Classification techniques relating to the decision surface non-linear, e.g. polynomial classifier

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Nonlinear Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于步态特征的身份识别方法,包括以下步骤:步骤1,采集数据;步骤2,基于互信息模型对数据去冗余;步骤3,使用PCA模型对训练数据集进行降维;步骤4,训练SVDD模型;步骤5,训练集成神经网络;步骤6,在完成SVDD模型与集成神经网络模型的构建后,使用这两个模型组成联合模型来对用户身份进行精确的判断。本发明采用智能手机采集数据,避免了额外使用传感器采集数据的需求,数据采集过程更方便,成本也更低。

Description

一种基于步态特征的身份识别方法
技术领域
本发明属于身份识别技术领域,特别涉及一种基于步态特征的身份识别方法。
背景技术
研究表明,每个人在行走时的步态特征都是独一无二的,可以用来进行身份信息的识别。步态识别是近些年发展出的基于步态特征的身份识别方法,相较于传统的身份识别方法,更加灵活、智能和安全。现有步态识别方法,主要分为基于视觉图像和基于可穿戴物联网设备来进行身份识别。基于视觉图像的步态识别方法主要通过摄像机来获取人走路时的图像,提取其中的步态特征并通过人工智能算法来实现身份认证,但这种步态识别方法所需的数据采集设备笨重且成本高,数据采集过程易受环境的干扰。基于可穿戴物联网设备通过采集人体不同部位在运动时的速度和加速度数据,提取其中的步态特征来进行身份识别。基于可穿戴物联网设备的步态识别方法因为成本低、数据采集简单、应用范围广的特点,日益得到重视。现有的基于可穿戴物联网设备的步态识别技术,需要专门的传感器设备来采集数据,这给使用者带来了额外的开销。此外,现有的步态识别技术仅仅使用朴素贝叶斯模型、KNN模型等简单模型来对步态特征进行处理,缺乏在无监督环境下对异常用户的识别方法;同时在多个合法用户需要识别的场景下,现有技术存在识别准确率较低的缺点。
发明内容
本发明的目的在于提供一种基于步态特征的身份识别方法,以解决上述问题。
为实现上述目的,本发明采用以下技术方案:
一种基于步态特征的身份识别方法,包括以下步骤:
步骤1,采用智能设备采集人走路时大腿的速度和加速度数据,对采集到的数据进行预处理,选取加速度数据的最大值、最小值、平均值和标准差作为与用户身份相关的特征属性;
步骤2,对步骤1中采集到的属性,基于互信息模型对数据去冗余,确定属性的依赖系数值,设定阈值,如果属性的依赖系数值小于阈值,则认为是冗余属性;
步骤3,在步骤2使用互信息模型去除数据集中的一些冗余特征后,使用PCA模型对训练数据集进行降维,生成一组新的维度较低的训练样本数据;
步骤4,训练SVDD模型:通过SVDD模型学习算法找到一个超球面,该超球面将训练数据紧密地封装在球面D中;
步骤5,训练集成神经网络:使用不同的训练样本训练多个神经网络分类器,然后使用Adaboost算法来完成集成神经网络模型的训练;Adaboost算法用于完成对集成模型权重的学习;
步骤6,在完成SVDD模型与集成神经网络模型的构建后,使用这两个模型组成联合模型来对用户身份进行精确的判断。
进一步的,步骤1中具体包括:
1)使用智能手机采集人走路时大腿的速度和加速度数据;
2)对步骤1.1所采集到的数据进行预处理,选取13个属性来进行下一步的处理,分别是x,y,z轴方向上加速度数据的最大值axMax,ayMax,azMax;加速度数据的最小值axMin,ayMin,azMin;加速度的平均值axAvg,ayAvg,azAvg;加速度数据的标准差axSd,aySd,azSd;以及速度v;其中,axAvg和axSd通过以下两个公式得到:
Figure GDA0003460522190000021
Figure GDA0003460522190000022
其他类似属性也以同样的方式得到结果。
进一步的,步骤2中具体包括:通过依次计算用户属性与加速度相关的12个特征属性之间的依赖系数,选择与用户属性高度相关的特征,并根据依赖系数去除训练数据中的冗余属性,得到依赖系数值在0.1处会出现断层,设定阈值为0.1;如果属性的依赖系数小于阈值,则认为是冗余属性;通过特征选择,保留7个特征属性:在x,y,z轴方向上的加速度最大值axMax,ayMax,azMax;在x轴方向上的加速度平均值axAvg;在y轴方向上的加速度最小值ayMin;在y,z轴方向上的加速度标准差aySd,azSd。
进一步的,步骤3中具体包括:在使用PCA模型对训练样本集进行降维时,需使用样本中的部分数据生成主成分矩阵,通过将原数据集组成的矩阵与主成分矩阵相乘便得到降维矩阵;
首先从原始数据集中抽取n条数据,假设这些数据在降维前具有m个与加速度相关的属性,那么使用这些数据便组成一个n行m列的矩阵;该矩阵可以表示为X={xij|0≤i<n,0≤j<m};主成分矩阵求解步骤如下所示:
步骤一:计算数据集中每列数据的平均值:
Figure GDA0003460522190000031
步骤二:对所有样本进行中心化;即每一列的数据减去该列上数据的均值,使得每一列的均值均为0;
步骤三:计算样本的协方差矩阵X′;第i列与第j列数据的协方差为cov(i,j),根据协方差矩阵计算公式可得
Figure GDA0003460522190000032
cov(i,j)由以下公式得到
Figure GDA0003460522190000033
步骤四:求协方差矩阵X′的特征值(λ1,…,λm)以及各个特征值对应的特征向量(w1,…,wm);
步骤五:选取最大的m′个特征值对应的特征向量,并将这些特征向量依次排列,组成主成分矩阵W*=(w1,w2,…,wm′);m′与设定的阈值有关,选择满足以下公式的最小m′值:
Figure GDA0003460522190000041
δ设定为0.95;
步骤六:计算降维后的主成分矩阵W2=W1*W*,W1是降维前的矩阵;计算出降维后的主成分矩阵后,对训练集数据进行降维,构成最终的训练数据集。
进一步的,步骤4中具体包括:SVDD模型学习算法用于找到一个超球面,该超球面将训练数据紧密地封装在D={xi|1≤i≤n}中;为此,分别用R和O表示将所有样本包起来的球面D的半径和坐标,由解决SVDD模型学习算法的任务得到,该学习算法的任务如下:
Figure GDA0003460522190000042
其中C是惩罚因子,C越大,超球面外的样本就越少;ai是拉格朗日乘子,K(·)代表了核函数;这里用到的核函数是RBF核函数,
Figure GDA0003460522190000043
通过在训练集数据中解决上述凸优化问题,计算得到球面坐标矢量o和球面半径R,然后利用判别函数对异常样本进行检测:
f(x)=sgn(R2-||x-o||2)
如果函数值大于0,则判定该样本为正常,否则为异常样本;完成了SVDD模型的训练后,将待检测数据输入到构建的模型中,并结合训练集中的数据,通过计算离群概率粗略判断用户是否在比较库中。
进一步的,步骤5中具体包括:
步骤5.1,对多个神经网络分类器进行训练;先构建神经网络模型,神经网络模型由输入层,输出层和隐藏层组成;输入层神经元的个数表示为m,其大小取决于降维后数据集中属性特征的个数;输出层神经元的个数表示为n,其大小与训练集中用户的个数N有关:
Figure GDA0003460522190000051
隐藏层神经元的个数表示为l,由Kolmogorov经验公式来确定:
Figure GDA0003460522190000052
其中c为一个常量,它的值所在区间为[1,10],取c的值为2;神经网络模型的激活函数采用sigmoid(x)函数:
Figure GDA0003460522190000053
步骤5.2,集成模型权重学习;在多个神经网络分类器训练完毕后,需要根据每个弱分类器的权重来构建集成神经网络模型,形成一个分类精度较高的强分类器;使用Adaboost算法完成对集成模型权重的学习,具体步骤如下:
a:从训练数据中提取n组样本构成训练集D,并初始化其中数据的权重分布;D中的每个数据在开始时都分配了相同的权值1/n;
b:然后选取分类误差率最小的分类器
Figure GDA0003460522190000054
并对该分类器的权值进行训练;如果某些训练数据被
Figure GDA0003460522190000055
分类器准确分类,那么这些数据的权重将会被降低;相反,如果某个训练样本点被错误的分类,那么这些数据的权重就应该增大;根据错误数据权重的大小来更新数据与分类器
Figure GDA0003460522190000056
的权重;
c:最后将各个弱分类器按照训练得到的权重进行组合,从而得到一个强分类器;利用这个强分类器对样本进行分类,判断集成模型的错误率是否达到了最小点,如果继续迭代时错误率会上升,那么停止迭代,反之则继续迭代;
在完成对集成模型中各个神经网络分类器的权重训练后,使用构建好的集成模型来对合法用户的身份进行一个初步的分类,从而判定其在比对库中的身份标签;集成神经网络模型每次对用户身份的判定都相当于在模型内部进行一次带加权投票表决,使用一个数组vote[N]来统计比对库中N个合法用户中每个用户的得票数目;集成模型内部在某个权重为α的神经网络分类器判定待检测用户为比对库中标签为yi的用户时,更新该用户的得票数:
vote[i]=vote[i]+α
在使用集成模型内多个神经网络分类器投票表决结束后,选择出数组vote的最大值vote[i],那么i便为待检测用户在比对库中的身份标签。
进一步的,步骤6中具体包括:
在进行识别时选取3组数据输入至联合模型中进行判别;待检测用户的三组数据为d1,d2,d3,分为两个决策机制:
决策机制1主要使用SVDD模型在无监督环境下对异常用户进行识别;将3组数据输入到训练好的SVDD模型中,使用π1(di)代表SVDD模型对于di组数据的识别结果;SVDD模型的决策结果π1(di)将输入数据分为异常数据和正常数据;如果有两组或两组以上输入数据被确定为异常数据,则待检测用户被SVDD模型识别为非法用户;
决策机制2主要使用集成神经网络模型来识别未被SVDD模型识别的非法用户和在合法用户在比较库中的身份标签;使用π2(di)表示集成神经网络的决策结果,并用Ω表示决策机制2的最终结果;Ω由π2(di)的多数派来决定;但是当三组输入数据的决策结果不同时,Ω=-1;当Ω取值为-1时,联合模型判定该用户是非法用户;当Ω取值在0到N-1时,联合模型判定该用户的身份标签为Ω。
与现有技术相比,本发明有以下技术效果:
本发明提供了一种基于步态特征的身份识别方法,通过智能手机采集用户在运动时的速度和加速度数据,在经过互信息模型和PCA模型对数据处理后,构建并训练一个SVDD模型与集成神经网络模型的联合模型来对用户进行身份识别。本发明的优点在于:
第一:本发明采用智能手机采集数据,避免了额外使用传感器采集数据的需求,数据采集过程更方便,成本也更低;
第二:本发明使用互信息模型对采集到的数据去冗余,同时使用PCA模型对数据进行降维,在保留了数据中步态特征的同时,降低了模型训练的复杂度和计算量;
第三:本发明使用SVDD模型与集成神经网络模型的联合模型来进行身份识别,SVDD模型实现了无监督环境下的异常用户识别,相较于现有技术,识别准确率更高;集成神经网络模型实现了对多个合法用户的识别,相较于现有技术,识别准确率,应用范围更广。
附图说明
图1为本发明实例中基于步态特征的身份识别方法流程步骤图。
图2为本发明实例中联合模型的身份识别流程图。
具体实施方式
以下结合附图对本发明进一步说明:
步骤1,采集数据。
步骤1.1,使用智能手机采集人走路时大腿的速度和加速度数据。现有的技术都是利用专门的速度、加速度、压力传感器来采集人运动时的步态数据,这给用户带来了额外的开销。本发明利用智能手机内部的三轴加速度传感器来采集x,y,z轴方向的加速度数据,智能手机内部的GPS速度传感器来采集人运动时的速度数据。相较于现有技术,本发明的数据采集过程更为简单,成本更低。因为三轴加速度传感器和GPS速度传感器采样频率不同,在一秒内采集到一组速度数据时,需要采集多组加速度数据。假设一秒钟内收集了k个加速度数据{a1,···,ak},需要从这些加速度数据中提取与最终训练数据中速度数据对应的相关特征。
步骤1.2,对步骤1.1所采集到的数据进行预处理,选取加速度数据的最大值、最小值、平均值和标准差作为与用户身份相关的特征属性。在获取加速度数据和速度数据后,为了更好的提取步态特征,我们选取13个属性来进行下一步的处理,分别是x,y,z轴方向上加速度数据的最大值axMax,ayMax,azMax;加速度数据的最小值axMin,ayMin,azMin;加速度的平均值axAvg,ayAvg,azAvg;加速度数据的标准差axSd,aySd,azSd;以及速度v。其中,axAvg和axSd通过以下两个公式得到:
Figure GDA0003460522190000081
Figure GDA0003460522190000082
其他类似属性也以同样的方式得到结果。
步骤2,基于互信息模型对数据去冗余。
经步骤1采集后的原始数据中有13个属性,会产生相当规模的数据冗余。冗余属性的存在降低了分类模型的效率和准确性,不利于身份识别,因此需要使用互信息模型去除冗余属性。互信息是信息论中的一个基本概念,该方法被用来评估任意两个变量之间的相互依赖关系。我们通过依次计算用户属性与加速度相关的12个特征属性之间的依赖系数,选择与用户属性高度相关的特征,并根据依赖系数去除训练数据中的冗余属性。实验表明,依赖系数值在0.1处会出现断层,因此我们设定阈值为0.1;如果属性的依赖系数小于阈值,则认为是冗余属性。通过特征选择,我们保留7个特征属性:在x,y,z轴方向上的加速度最大值axMax,ayMax,azMax;在x轴方向上的加速度平均值axAvg;在y轴方向上的加速度最小值ayMin;在y,z轴方向上的加速度标准差aySd,azSd。
步骤3,PCA模型对数据降维。
在步骤2使用互信息模型去除数据集中的一些冗余特征后,数据集的维度仍然较高。高维度的数据集会严重影响模型的训练,提高模型训练的复杂度,造成一定的维度灾难。所以需要对使用PCA模型对训练数据集进行降维,生成一组新的维度较低的训练样本数据,从而对模型的训练数据样本做进一步的优化。在使用PCA模型对训练样本集进行降维时,需使用样本中的部分数据生成主成分矩阵,通过将原数据集组成的矩阵与主成分矩阵相乘便得到降维矩阵。
为了生成主成分矩阵,首先从原始数据集中抽取n条数据。假设这些数据在降维前具有m个与加速度相关的属性,那么我们使用这些数据便组成一个n行m列的矩阵。该矩阵可以表示为X={xij|0≤i<n,0≤j<m}。主成分矩阵求解步骤如下所示:
步骤一:计算数据集中每列数据的平均值:
Figure GDA0003460522190000091
步骤二:对所有样本进行中心化;即每一列的数据减去该列上数据的均值,使得每一列的均值均为0;
步骤三:计算样本的协方差矩阵X′;第i列与第j列数据的协方差为cov(i,j),根据协方差矩阵计算公式可得
Figure GDA0003460522190000092
cov(i,j)由以下公式得到
Figure GDA0003460522190000093
步骤四:求协方差矩阵X′的特征值(λ1,…,λm)以及各个特征值对应的特征向量(w1,…,wm);
步骤五:选取最大的m′个特征值对应的特征向量,并将这些特征向量依次排列,组成主成分矩阵W*=(w1,w2,…,wm′);m′与设定的阈值有关,选择满足以下公式的最小m′值:
Figure GDA0003460522190000094
δ设定为0.95;
步骤六:计算降维后的主成分矩阵W2=W1*W*,W1是降维前的矩阵;计算出降维后的主成分矩阵后,我们对训练集数据进行降维,构成最终的训练数据集。最终的训练集消除了不少冗余属性,并且维度低,采样密度大,为构建一个精准的用户身份识别模型提供了数据保障。
步骤4,训练SVDD模型。
SVDD模型学习算法的主要任务是找到一个超球面,该超球面将训练数据紧密地封装在D={xi|1≤i≤n}中。为此,我们分别用R和o表示将所有样本包起来的球面D的半径和坐标,由解决SVDD模型学习算法的任务得到,该学习算法的任务如下:
Figure GDA0003460522190000101
其中C是惩罚因子,C越大,超球面外的样本就越少;ai是拉格朗日乘子,K(·)代表了核函数;这里用到的核函数是RBF核函数,
Figure GDA0003460522190000102
通过在训练集数据中解决上述凸优化问题,计算得到球面坐标矢量o和球面半径R,然后利用判别函数对异常样本进行检测:
f(x)=sgn(R2-||x-o||2)
如果函数值大于0,则判定该样本为正常,否则为异常样本;完成了SVDD模型的训练后,将待检测数据输入到构建的模型中,并结合训练集中的数据,通过计算离群概率粗略判断用户是否在比较库中。
步骤5,训练集成神经网络。
在使用SVDD模型进行粗略判断后,需要用一种精确的分类模型来判断待检测用户的身份,从而识别出其在比对库中的身份标签。常用的分类模型有决策树,神经网络,SVM模型。利用传统办法训练这些模型时使用训练样本单一,这样训练出来的分类器容易出现过拟合,为了提高分类模型的准确性,本发明使用集成神经模型来进行用户身份识别。在使用集成分类模型时,我们首先要使用不同的训练样本训练多个神经网络分类器,然后使用Adaboost算法来完成集成神经网络模型的训练。
步骤5.1,对多个神经网络分类器进行训练;先构建神经网络模型,神经网络模型由输入层,输出层和隐藏层组成;输入层神经元的个数表示为m,其大小取决于降维后数据集中属性特征的个数;输出层神经元的个数表示为n,其大小与训练集中用户的个数N有关:
Figure GDA0003460522190000111
隐藏层神经元的个数表示为l,由Kolmogorov经验公式来确定:
Figure GDA0003460522190000112
其中c为一个常量,它的值所在区间为[1,10],取c的值为2;神经网络模型的激活函数采用sigmoid(x)函数:
Figure GDA0003460522190000113
步骤5.2,集成模型权重学习;在多个神经网络分类器训练完毕后,需要根据每个弱分类器的权重来构建集成神经网络模型,形成一个分类精度较高的强分类器;使用Adaboost算法完成对集成模型权重的学习,具体步骤如下:
a:从训练数据中提取n组样本构成训练集D,并初始化其中数据的权重分布;D中的每个数据在开始时都分配了相同的权值1/n;
b:然后选取分类误差率最小的分类器
Figure GDA0003460522190000115
并对该分类器的权值进行训练;如果某些训练数据被
Figure GDA0003460522190000116
分类器准确分类,那么这些数据的权重将会被降低;相反,如果某个训练样本点被错误的分类,那么这些数据的权重就应该增大;根据错误数据权重的大小来更新数据与分类器
Figure GDA0003460522190000117
的权重;
c:最后将各个弱分类器按照训练得到的权重进行组合,从而得到一个强分类器;利用这个强分类器对样本进行分类,判断集成模型的错误率是否达到了最小点,如果继续迭代时错误率会上升,那么停止迭代,反之则继续迭代;
在完成对集成模型中各个神经网络分类器的权重训练后,使用构建好的集成模型来对合法用户的身份进行一个初步的分类,从而判定其在比对库中的身份标签;集成神经网络模型每次对用户身份的判定都相当于在模型内部进行一次带加权投票表决,使用一个数组vote[N]来统计比对库中N个合法用户中每个用户的得票数目;集成模型内部在某个权重为α的神经网络分类器判定待检测用户为比对库中标签为yi的用户时,更新该用户的得票数:
vote[i]=vote[i]+α
在使用集成模型内多个神经网络分类器投票表决结束后,选择出数组vote的最大值vote[i],那么i便为待检测用户在比对库中的身份标签。
步骤6,使用联合模型进行身份识别。
在完成SVDD模型与集成神经网络模型的构建后,使用这两个模型组成联合模型来对用户身份进行精确的判断。为了减少误判率,更加精确的判断用户身份,我们每次在进行识别时选取3组数据输入至联合模型中进行判别。待检测用户的三组数据为d1,d2,d3,使用联合模型识别待检测用户身份的过程如图2所示。
决策机制1主要使用SVDD模型在无监督环境下对异常用户进行识别。将3组数据输入到训练好的SVDD模型中,我们使用π1(di)代表SVDD模型对于di组数据的识别结果。SVDD模型的决策结果π1(di)将输入数据分为异常数据和正常数据。如果有两组或两组以上输入数据被确定为异常数据,则待检测用户被SVDD模型识别为非法用户。
决策机制2主要使用集成神经网络模型来识别未被SVDD模型识别的非法用户和在合法用户在比较库中的身份标签。我们使用π2(di)表示集成神经网络的决策结果(对于N个用户,取值0,1,2,…,N-1),并用Ω表示决策机制2的最终结果。Ω由π2(di)的多数派来决定;但是当三组输入数据的决策结果不同时,Ω=-1。当Ω取值为-1时,联合模型判定该用户是非法用户。当Ω取值在0到N-1时,联合模型判定该用户的身份标签为Ω。
本发明在识别比较库中多个合法用户身份场景上,相较于现有技术,有着更好的性能。我们选用了10名用户来进行实验,其中8名用户作为合法用户,2名作为非法用户。对于无监督环境下的异常身份识别,作为对比,我们选择了局部离群因子(LOF)模型,该模型也可以通过诊断对比数据库中离群因子对应的数据来进行非法用户识别。为了评价两种方案的比较性能,我们首先从测试样本中选择120个合法用户数据和120个非法用户数据,然后将这些数据输入到由SVDD模型和集成神经网络模型组成的联合模型中以及LOF模型中分别识别是否为合法用户。两种方案每次使用3个数据进行识别,总共执行80次。为了评价识别性能,我们采用了识别精度Ac、误报率FA和漏报率MA三个指标。联合模型与LOF模型的性能对比如下表1所示:
表1
模型 A<sub>c</sub> F<sub>A</sub> M<sub>A</sub>
联合模型 0.925 0.05 0.1
LOF模型 0.813 0.2 0.175
由SVDD模型和集成神经网络模型组成的联合模型比LOF模型具有更高的精度、更低的误报率和更低的漏报率。
对于多个合法用户的身份识别场景,我们将每个合法用户对应的90条数据输入到集成神经网络模型中,对实验结果进行评估。因为用户数据中的噪声数据的干扰,我们依据决策机制2中的实验流程,采用三组数据作为一个识别单元;集成模型对每个用户的3条数据进行一次识别,对每个合法用户分别给出30个识别结果,以降低噪声数据的干扰,进一步提高识别精度,实验结果如下表2所示:
表2
Figure GDA0003460522190000131
Figure GDA0003460522190000141

Claims (6)

1.一种基于步态特征的身份识别方法,其特征在于,包括以下步骤:
步骤1,采用智能设备采集人走路时大腿的速度和加速度数据,对采集到的数据进行预处理,选取加速度数据的最大值、最小值、平均值和标准差作为与用户身份相关的特征属性;
步骤2,对步骤1中采集到的属性,基于互信息模型对数据去冗余,确定属性的依赖系数值,设定阈值,如果属性的依赖系数值小于阈值,则认为是冗余属性;
步骤3,在步骤2使用互信息模型去除数据集中的一些冗余特征后,使用PCA模型对训练数据集进行降维,生成一组新的维度较低的训练样本数据;
步骤4,训练SVDD模型:通过SVDD模型学习算法找到一个超球面,该超球面将训练数据紧密地封装在球面D中;
步骤5,训练集成神经网络:使用不同的训练样本训练多个神经网络分类器,然后使用Adaboost算法来完成集成神经网络模型的训练;Adaboost算法用于完成对集成模型权重的学习;
步骤6,在完成SVDD模型与集成神经网络模型的构建后,使用这两个模型组成联合模型来对用户身份进行精确的判断;
步骤6中具体包括:
在进行识别时选取3组数据输入至联合模型中进行判别;待检测用户的三组数据为d1,d2,d3,分为两个决策机制:
决策机制1使用SVDD模型在无监督环境下对异常用户进行识别;将3组数据输入到训练好的SVDD模型中,使用π1(di)代表SVDD模型对于di组数据的识别结果;SVDD模型的决策结果π1(di)将输入数据分为异常数据和正常数据;如果有两组或两组以上输入数据被确定为异常数据,则待检测用户被SVDD模型识别为非法用户;
决策机制2使用集成神经网络模型来识别未被SVDD模型识别的非法用户和合法用户在比较库中的身份标签;使用π2(di)表示集成神经网络的决策结果,并用Ω表示决策机制2的最终结果;Ω由π2(di)的多数派来决定;但是当三组输入数据的决策结果不同时,Ω=-1;当Ω取值为-1时,联合模型判定该用户是非法用户;当Ω取值在0到N-1时,联合模型判定该用户的身份标签为Ω;N为训练集中用户的个数。
2.根据权利要求1所述的一种基于步态特征的身份识别方法,其特征在于,步骤1中具体包括:
1)使用智能手机采集人走路时大腿的速度和加速度数据;
2)对步骤1.1所采集到的数据进行预处理,选取13个属性来进行下一步的处理,分别是x,y,z轴方向上加速度数据的最大值axMax,ayMax,azMax;加速度数据的最小值axMin,ayMin,azMin;加速度的平均值axAvg,ayAvg,azAvg;加速度数据的标准差axSd,aySd,azSd;以及速度v;其中,axAvg和axSd通过以下两个公式得到:
Figure FDA0003485921770000021
Figure FDA0003485921770000022
其他类似属性也以同样的方式得到结果。
3.根据权利要求2所述的一种基于步态特征的身份识别方法,其特征在于,步骤2中具体包括:通过依次计算用户属性与加速度相关的12个特征属性之间的依赖系数,选择与用户属性高度相关的特征,并根据依赖系数去除训练数据中的冗余属性,得到依赖系数值在0.1处会出现断层,设定阈值为0.1;如果属性的依赖系数小于阈值,则认为是冗余属性;通过特征选择,保留7个特征属性:在x,y,z轴方向上的加速度最大值axMax,ayMax,azMax;在x轴方向上的加速度平均值axAvg;在y轴方向上的加速度最小值ayMin;在y,z轴方向上的加速度标准差aySd,azSd。
4.根据权利要求1所述的一种基于步态特征的身份识别方法,其特征在于,步骤3中具体包括:在使用PCA模型对训练样本集进行降维时,需使用样本中的部分数据生成主成分矩阵,通过将原数据集组成的矩阵与主成分矩阵相乘便得到降维矩阵;
首先从原始数据集中抽取n条数据,假设这些数据在降维前具有m个与加速度相关的属性,那么使用这些数据便组成一个n行m列的矩阵;该矩阵可以表示为x={xij|0≤i<n,0≤j<m};主成分矩阵求解步骤如下所示:
步骤一:计算数据集中每列数据的平均值:
Figure FDA0003485921770000031
步骤二:对所有样本进行中心化;即每一列的数据减去该列上数据的均值,使得每一列的均值均为0;
步骤三:计算样本的协方差矩阵X′;第i列与第j列数据的协方差为cov(i,j),根据协方差矩阵计算公式可得
Figure FDA0003485921770000032
cov(i,j)由以下公式得到
Figure FDA0003485921770000033
步骤四:求协方差矩阵X′的特征值(λ1,…,λm)以及各个特征值对应的特征向量(w1,…,wm);
步骤五:选取最大的m′个特征值对应的特征向量,并将这些特征向量依次排列,组成主成分矩阵W*=(w1,w2,...,wm′);m′与设定的阈值有关,选择满足以下公式的最小m′值:
Figure FDA0003485921770000034
δ设定为0.95;
步骤六:计算降维后的主成分矩阵W2=W1*W*,W1是降维前的矩阵;计算出降维后的主成分矩阵后,对训练集数据进行降维,构成最终的训练数据集。
5.根据权利要求1所述的一种基于步态特征的身份识别方法,其特征在于,步骤4中具体包括:SVDD模型学习算法用于找到一个超球面,该超球面将训练数据紧密地封装在D={xi|1≤i≤n}中;为此,分别用R和0表示将所有样本包起来的球面D的半径和坐标,由解决SVDD模型学习算法的任务得到,该学习算法的任务如下:
Figure FDA0003485921770000041
其中C是惩罚因子,C越大,超球面外的样本就越少;ai是拉格朗日乘子,K(·)代表了核函数;这里用到的核函数是RBF核函数,
Figure FDA0003485921770000042
通过在训练集数据中解决上述凸优化问题,计算得到球面坐标矢量o和球面半径R,然后利用判别函数对异常样本进行检测:
f(x)=sgn(R2-||x-o||2)
如果函数值大于0,则判定该样本为正常,否则为异常样本;完成了SVDD模型的训练后,将待检测数据输入到构建的模型中,并结合训练集中的数据,通过计算离群概率粗略判断用户是否在比较库中。
6.根据权利要求1所述的一种基于步态特征的身份识别方法,其特征在于,步骤5中具体包括:
步骤5.1,对多个神经网络分类器进行训练;先构建神经网络模型,神经网络模型由输入层,输出层和隐藏层组成;输入层神经元的个数表示为m,其大小取决于降维后数据集中属性特征的个数;输出层神经元的个数表示为n,其大小与训练集中用户的个数N有关:
Figure FDA0003485921770000043
隐藏层神经元的个数表示为l,由Kolmogorov经验公式来确定:
Figure FDA0003485921770000044
其中c为一个常量,它的值所在区间为[1,10],取c的值为2;神经网络模型的激活函数采用sigmoid(x)函数:
Figure FDA0003485921770000045
步骤5.2,集成模型权重学习;在多个神经网络分类器训练完毕后,需要根据每个弱分类器的权重来构建集成神经网络模型,形成一个分类精度较高的强分类器;使用Adabo ost算法完成对集成模型权重的学习,具体步骤如下:
a:从训练数据中提取n组样本构成训练集D,并初始化其中数据的权重分布;D中的每个数据在开始时都分配了相同的权值1/n;
b:然后选取分类误差率最小的分类器
Figure FDA0003485921770000051
并对该分类器的权值进行训练;如果某些训练数据被
Figure FDA0003485921770000052
分类器准确分类,那么这些数据的权重将会被降低;相反,如果某个训练样本点被错误的分类,那么这些数据的权重就应该增大;根据错误数据权重的大小来更新数据与分类器
Figure FDA0003485921770000053
的权重;
c:最后将各个弱分类器按照训练得到的权重进行组合,从而得到一个强分类器;利用这个强分类器对样本进行分类,判断集成模型的错误率是否达到了最小点,如果继续迭代时错误率会上升,那么停止迭代,反之则继续迭代;
在完成对集成模型中各个神经网络分类器的权重训练后,使用构建好的集成模型来对合法用户的身份进行一个初步的分类,从而判定其在比对库中的身份标签;集成神经网络模型每次对用户身份的判定都相当于在模型内部进行一次带加权投票表决,使用一个数组vote[N]来统计比对库中N个合法用户中每个用户的得票数目;集成模型内部在某个权重为α的神经网络分类器判定待检测用户为比对库中标签为yi的用户时,更新该用户的得票数:
vote[i]=vote[i]+α
在使用集成模型内多个神经网络分类器投票表决结束后,选择出数组vote的最大值vote[i],那么i便为待检测用户在比对库中的身份标签。
CN201910718693.0A 2019-08-05 2019-08-05 一种基于步态特征的身份识别方法 Active CN110555463B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910718693.0A CN110555463B (zh) 2019-08-05 2019-08-05 一种基于步态特征的身份识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910718693.0A CN110555463B (zh) 2019-08-05 2019-08-05 一种基于步态特征的身份识别方法

Publications (2)

Publication Number Publication Date
CN110555463A CN110555463A (zh) 2019-12-10
CN110555463B true CN110555463B (zh) 2022-05-03

Family

ID=68737137

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910718693.0A Active CN110555463B (zh) 2019-08-05 2019-08-05 一种基于步态特征的身份识别方法

Country Status (1)

Country Link
CN (1) CN110555463B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111177669A (zh) * 2019-12-11 2020-05-19 宇龙计算机通信科技(深圳)有限公司 终端的识别方法、装置、终端及存储介质
CN112257559A (zh) * 2020-10-20 2021-01-22 江南大学 一种基于生物个体步态信息的身份识别方法
CN113065468B (zh) * 2021-04-02 2023-04-07 西安电子科技大学 基于用户坐标系与gru网络的步态认证方法
CN114840834B (zh) * 2022-04-14 2024-06-11 浙江大学 一种基于步态特征的隐式身份认证方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107403084A (zh) * 2017-07-21 2017-11-28 中国计量大学 一种基于步态数据的身份识别方法
CN108848068A (zh) * 2018-05-29 2018-11-20 上海海事大学 基于深度信念网络-支持向量数据描述的apt攻击检测方法
CN108960056A (zh) * 2018-05-30 2018-12-07 西南交通大学 一种基于姿态分析和支持向量数据描述的跌倒检测方法
CN109697463A (zh) * 2018-12-13 2019-04-30 中国航空工业集团公司上海航空测控技术研究所 基于支持向量数据描述集成学习的齿轮故障识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9830558B1 (en) * 2016-05-03 2017-11-28 Sas Institute Inc. Fast training of support vector data description using sampling
EP3478174A1 (en) * 2016-07-01 2019-05-08 L.I.F.E. Corporation S.A. Biometric identification by garments having a plurality of sensors

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107403084A (zh) * 2017-07-21 2017-11-28 中国计量大学 一种基于步态数据的身份识别方法
CN108848068A (zh) * 2018-05-29 2018-11-20 上海海事大学 基于深度信念网络-支持向量数据描述的apt攻击检测方法
CN108960056A (zh) * 2018-05-30 2018-12-07 西南交通大学 一种基于姿态分析和支持向量数据描述的跌倒检测方法
CN109697463A (zh) * 2018-12-13 2019-04-30 中国航空工业集团公司上海航空测控技术研究所 基于支持向量数据描述集成学习的齿轮故障识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NOVELTY DETECTION FOR PREDICTING FALLS RISK USING SMARTPHONE GAIT DATA;Matthew Martinez et al.;《ICASSP 2017》;20171231;第2202-2206页 *
基于相关熵和距离方差的支持向量数据描述选择性集成;邢红杰 等;《计算机科学》;20160530;第43卷(第5期);第252-264页 *

Also Published As

Publication number Publication date
CN110555463A (zh) 2019-12-10

Similar Documents

Publication Publication Date Title
CN110555463B (zh) 一种基于步态特征的身份识别方法
CN107403084B (zh) 一种基于步态数据的身份识别方法
CN103279768B (zh) 一种基于增量学习人脸分块视觉表征的视频人脸识别方法
CN110659665B (zh) 一种异维特征的模型构建方法及图像识别方法、装置
CN103218609B (zh) 一种基于隐最小二乘回归的多姿态人脸识别方法及其装置
CN102938070B (zh) 一种基于动作子空间与权重化行为识别模型的行为识别方法
CN106529504B (zh) 一种复合时空特征的双模态视频情感识别方法
CN107944356B (zh) 综合多类型特征的层次主题模型掌纹图像识别的身份认证方法
CN107122752A (zh) 一种人体动作比对方法及装置
CN104616316A (zh) 基于阈值矩阵和特征融合视觉单词的人物行为识别方法
CN108564040B (zh) 一种基于深度卷积特征的指纹活性检测方法
CN104573672B (zh) 一种基于邻域保持的鉴别嵌入人脸识别方法
CN105023006B (zh) 基于增强型非参数最大边缘准则的人脸识别方法
CN109190698B (zh) 一种网络数字虚拟资产的分类识别系统及方法
Sayed Biometric Gait Recognition Based on Machine Learning Algorithms.
Meena et al. Gender recognition using in-built inertial sensors of smartphone
Zuobin et al. Feature regrouping for cca-based feature fusion and extraction through normalized cut
Gavisiddappa et al. Multimodal biometric authentication system using modified ReliefF feature selection and multi support vector machine
Mehmood et al. Human gait recognition: A deep learning and best feature selection framework
Arandjelovic Weighted linear fusion of multimodal data: A reasonable baseline?
CN112241680A (zh) 基于静脉相似图像知识迁移网络的多模态身份认证方法
CN107122780A (zh) 基于时空特征点的互信息与时空分布熵的行为识别方法
Gona et al. Multimodal biometric reorganization system using deep learning convolutional neural network
Cappelli et al. The state of the art in fingerprint classification
Dar Neural networks (CNNs) and VGG on real time face recognition system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant