背景技术
生物特征识别是通过各种高科技信息检测手段、利用人体所固有的生理或行为特征来进行个人身份鉴定。生物特征主要包括生理特征和行为特征两种:生理特征是指与生俱来的,先天性的人体物理特征,如指纹、虹膜、掌形、人脸等;行为特征是指从人所执行的运动中提取出来的特征,多为后天性的,如笔迹、击键、步态等。在2001年的MIT Technology Review杂志中,生物特征识别技术被列为10项最有可能改变世界的技术之一。并预计在不远的将来,生物认证技术将深入到我们生活的方方面面,其综合影响力将不亚于互联网。
从信息科学角度来看,生物特征识别属于传统的模式识别问题,它不依赖各种人造的和附加的物品,认定的是人本身。每个人的生物特征具有与其他人不同的唯一性和在一定时期内不变的稳定性,不易伪造和假冒,所以利用生物识别技术进行身份认定,具有安全、可靠、准确等优点。
然而,没有一种生物特征是完美的,各种生物特征的识别方式都有其一定的适用范围和要求,单一的生物特征识别系统在实际应用中显现出各自的局限性。使用较广的指纹、人脸、虹膜及掌形识别等第一代生物识别技术,大多需要被监测对象的配合,有时甚至需要被监测对象完成必要的动作才能实现。这些做法比较烦琐,识别速度较慢且使用不便,不易被用户接受。指纹识别的可靠性比较高但是需要实际的物理接触;人脸与虹膜识别不需要物理接触,然而在实际应用时却受到较多的环境限制。研究显示,用明胶制成的假手指就可以轻而易举地骗过指纹识别系统,患白内障的人虹膜会发生变化,在隐形眼镜上蚀刻出的虚假眼虹膜特征也可以让虹膜识别系统真假难辨等等。随着犯罪手段的不断智能化、科技化,第一代身份识别技术将面临防伪、防盗的挑战。因此迫切的需要新的生物认证方法的提出。
较之传统的生物特征识别方法,基于脑电(Flectroencephalogram,EEG)的身份识别是一种比较新的思路。其实,早在1960年,神经生理学家和精神病学家就提出并验证了“人的脑电信号与携带的基因信息之间存在某种相关性”的论断。然而早期的大部分研究多致力于病理分析和临床诊断;直到近年来,研究者们才将更多的精力投入到健康人体,试图建立个体的某种脑电特征与其所携带的基因信息之间的一一对应关系,从而将脑电作为一种有效的特征用于身份识别,开启该领域的新思路。
作为一种有效的生物特征应至少满足以下几点要求:1)普遍性;2)唯一性;3)稳定性;4)可采极性。除此之外,脑电(EEG)还具有其他显著而独特的优势,体现在:
(1)由于脑电来源于大脑的思维活动,难以在压力或胁迫下重现,因而不容易被复制或仿造,系统鲁棒性强。
(2)脑电具有高度的个体依赖性。对于同一个外部刺激或者主体在思考同一件事的时候,不同的个体也会产生不同的脑电信号。
(3)脑电存在于每一个具有生理功能的活体中,且受损的可能性很小,相对稳定。与之相比,某些传统的生物特征(如指纹或声音),可能会由于意外损伤(如手部的皮肤烧伤或失声)而丧失本身具有的识别功能。
(4)脑电有且只有在活体中存在,故只能用于在体的检测,相对于指纹等外在的特征更加难以复制和伪造。
目前,基于脑电信号的身份识别技术在国内外均属起步阶段。1999年,M.Poulos等人首次提出脑电用于身份识别的设想,采集受试者静息状态的脑电信号,并建立AR(Auto-Regressive)模型提取脑电特征参数,通过学习矢量量化(LVQ)的方法对4个样本进行分类,达到了72%-84%的识别结果。虽然静息状态的脑电信号的确具有个体差异性,但是往往不够明显,于是随后的研究中引入了各种类型的刺激或者任务,希望能获得更具可分性的脑电特征。想象动作模式广泛应用于脑机接口系统中。然而脑机接口系统面临的一个很大的瓶颈就是脑电的个体差异性,这必然会导致系统设计复杂程度的增加。
发明内容
为克服现有技术的不足,提供一种可实现将想象动作模式下的脑电信号作为一种生物特征来实现身份识别,准确性高,迅速快捷。为达到上述目的,本发明采用的技术方案是:基于融合特征的想象动作脑电身份识别方法,包括下列步骤:在受试者执行想象动作的过程中,采集相应的脑电信号;经过去噪等预处理后,分别提取单一通道的脑电特征和大脑半球对侧跨通道脑电特征,将二者进行融合;随后对融合特征进行降维操作以优化重组;最后送入分类器进行分类学习与测试,达到身份识别的目的。
所述在受试者执行想象动作的过程中,采集相应的脑电信号,包括下列步骤:
(1)受试者佩戴电极帽,选择舒适的姿势坐在椅子上;
(2)受试者共进行四种不同的想象动作,分别是:
A.数学计算,给受试者一道普通的乘法计算题,如56*78,要求受试者在心中默算其结果,此过程中不能发声或有任何其他身体运动;
B.几何图像旋转,给受试者30s的时间去观察一个特殊的三维几何体,之后移除图像,让受试者想象该几何体沿着某一个轴去旋转,采集这个想象过程中的脑电信号;
C.打腹稿,让受试者想象给一位朋友写信,不能发出声音,只在心里默默撰写,每次实验可从上次中止的地方开始,也就是要保证内容不重复;
D.视觉计数,受试者想象有一个黑板,在上面计数,写完前一个数字后擦去,接着写下一个,整个过程受试者不能发出声音,均为想象动作;
(3)在国际标准10/20导联电极放置系统定义下,选取C3,C4,P3,P4,01,02六个导联采集脑电信号,C3,P3,01分布于大脑半球一侧,C4,P4,02对称的分布于大脑半球另一侧,外加A1,A2作为参考电极;
(4)对于四种不同的想象动作,分别采集持续10s内的脑电信号,采样频率是256Hz;每组实验重复10次,保证充足的数据量。
所述分别提取单一通道的脑电特征和大脑半球对侧跨通道脑电特征,将二者进行融合,进一步的细化步骤是:
单一通道的特征提取步骤为:对经过去噪等预处理后的脑电信号采用简化的BL(p,0,k,m)模型进行描述:
其中,xt是由有用信号,{et}是噪声,{ai,i=1,2,…,p},{ci,i=1,2,…,q}以及{bij,i=1,2,…,k;j=1,2,…,m}是未知的随时间变化的系数,也是所要提取的特征参数;
采用的AIC准则,AIC为Akaike Information Criterion的缩写,表述如下:
其中,
N是数据的长度,M是模型的最大阶数,(N-M)是用来计算似然函数的样本数,r是BL(p,0,k,m)模型中的独立参数,最优阶数r*是使得AIC(r)达最小时对应的阶数,进而得到BL(p,0,k,m)模型的最优阶数组合,然后借助标准最小二乘法的线性最小化来估计模型参数{ai,bij};
大脑半球对侧跨通道脑电特征线性复杂度提取采取的步骤是,所述在受试者执行想象动作的过程中,采集相应的脑电信号,是在国际标准10/20导联电极放置系统定义下,选取C3,C4,P3,P4,01,02六个导联采集脑电信号,C3,P3,01分布于大脑半球一侧,C4,P4,02对称的分布于大脑半球另一侧,对于C通道信号,线性复杂度的定义如下:
其中:
即εi是对λi的标准化,而λi是由C通道脑电信号协方差矩阵计算出的特征值,
这里取C=2,即衡量来自对侧大脑半球的两个通道脑电信号的线性复杂度;
将上述单一通道的特征和跨通道特征连接起来,构成维数是单一通道的特征维数与跨通道特征的维数之和的融合特征。
所述降维操作以优化重组包括如下步骤:
(1)原始数据标准化:
矩阵中的每个元素减去所在列的均值,然后除以所在列的标准差,使得每个变量标准化为均值为0,方差为1的矩阵X,即:
X=[X1,X2,...Xn]T=[xij](n×p) (8)
其中,
i=1,2,...n,j=1,2,...p
(2)计算相关系数矩阵:
R是实对称矩阵(即rij=rji),其中rij(i,j=1,2,...,p)是标准化后的变量Xi,Xj的相关系数,其定义是变量协方差除以变量的标准差(方差),计算公式为:
式中:
分别表示原矩阵中X
i和X
j列各向量的均值;
(3)特征分解,求特征值与特征向量:
解特征方程|R-λE|=0,求出相关系数矩阵R的特征值λi(i=1,2,...p),并将其按从大到小的顺序排列,即λ1≥λ2≥…≥λp然后分别得到每个特征值λi对应的特征向量Ui(i=1,2,...p),
(4)通过累计贡献率确定主成分:
累计贡献率的计算公式为:
当累计贡献率达到某一阈值(本发明取95%)时,将此时所有前m个特征值λ1,λ2,...λm(m≤p)以及它们对应的特征向量保留下来,作为主成分,其余的均舍弃;
(5)计算得分矩阵
主成分特征值所对应的特征向量U=[U1,U2,...Um]构成新的矢量空间,作为新变量(主成分)的坐标轴,又称为载荷轴。利用下式计算得分矩阵:
F(n×m)=X(n×p)·U(p×m) (13)
其中,X是原数据矩阵,U是主成分载荷,得分矩阵F即为PCA降维后所得到的最终结果。
本发明具有如下特点:
1、想象动作脑电与个体的思维活动密切相关,携带着个体可分性的信息,实验得到的识别率结果验证了其能够作为一种生物特征用于身份识别的可行性。由于个体的思维活动存在差异,对于不同的想象动作表现出不同的敏感程度,所以将多种想象动作结合起来会进一步改善识别效果;
2、本发明提出一种新的基于想象动作脑电的身份识别方法,是对传统脑电应用领域(如脑机接口技术)的拓展,也为生物特征识别开启新的思路;
3、本发明可弥补传统生物特征识别技术的不足,因其高精度和难以复制等显著优势,作为一种有力的补充,可集成应用于军事领域或某些高安全性要求的机构和场所,创造更为安全和谐的社会生活环境,并有望获得可观的社会效益和公共安全服务的提升。
具体实施方式
提出了一种利用融合特征的想象动作脑电进行身份识别的方法,所涉及到的关键技术包括:脑电信号的采集,信号处理,特征提取以及分类识别等。其技术流程为:让受试者执行某种想象动作,在此过程中选择适当的头皮导联电极采集受试者的脑电信号,本发明选用两两对称的六个导联采集脑电信号(如图2所示),并对原始脑电信号进行了去噪等预处理。
为了充分考虑各导联脑电信号的特性和相关性,本发明不仅提取了单一导联的脑电特征,还对位于大脑半球对侧的两个对称导联的脑电信号进行了研究,并提取相应的相关性特征;随后将两种特征进行了融合。主成分分析算法(PCA)被用来对融合特征进行降维处理,在降低特征向量维度的同时有效的提高了识别效率。最后通过支持向量机(SVM)对优化后的特征进行分类学习与测试,以实现身份的识别。较之其他的生物特征识别技术,基于脑电的身份识别思路新颖,具有独特而显著的优势,是对传统脑电研究的突破,也为今后探索更多元而有效的身份识别方法提供了新思路。
基于脑电的身份识别方法包括以下基本步骤:脑电信号采集、信号预处理、特征提取、信号后处理以及分类识别等,图1所示为本发明的技术流程图:在受试者执行想象动作的过程中,采集相应的脑电信号;经过去噪等预处理后,分别提取单一通道的脑电特征和大脑半球对侧跨通道脑电特征,将二者进行融合;随后对融合特征进行降维操作以优化重组;最后送入分类器进行分类学习与测试,达到身份识别的目的。
1脑电信号的采集
本发明采用的想象动作模式是由Keirn和Aunon设计的,选择这些想象模式的理由是它们涉及半球脑电波的不对称性,同时也体现着个体间的差异性,可用作身份识别。
实验设计与数据采集:
(5)受试者佩戴电极帽,选择舒适的姿势坐在椅子上。
(6)受试者共进行四种不同的想象动作,分别是:
E.数学计算。给受试者一道普通的乘法计算题,如56*78,要求受试者在心中默算其结果,此过程中不能发声或有任何其他身体运动。需要说明的是,题目不能有重复,也就意味着受试者不能在短时间内迅速给出答案。经过实验验证,受试者均不能在10s内给出正确答案;
F.几何图像旋转。给受试者30s的时间去观察一个特殊的三维几何体,之后移除图像,让受试者想象该几何体沿着某一个轴去旋转,采集这个想象过程中的脑电信号;
G.打腹稿。让受试者想象给一位朋友写信,不能发出声音,只在心里默默撰写。每次实验可从上次中止的地方开始,也就是要保证内容不重复;
H.视觉计数。受试者想象有一个黑板,在上面计数,写完前一个数字后擦去,接着写下一个。整个过程受试者不能发出声音,均为想象动作。
(7)在国际标准10/20导联电极放置系统定义下,选取C3,C4,P3,P4,01,02六个导联采集脑电信号,它们对称的分布于大脑半球两侧。外加A1,A2作为参考电极,如图2所示。
(8)对于四种不同的想象动作,分别采集持续10s内的脑电信号,采样频率是256Hz。每组实验重复10次,保证充足的数据量。
2原始脑电信号的预处理
在提取特征之前对原始脑电信号进行预处理分为两个步骤:
(1)去噪,即去除眨眼等引入的噪声。夹杂在原始脑电中的眨眼信号不具备识别能力,属于噪声,应当将其去除。由于眨眼信号通常持续250ms,信号幅值在100-200μV之间,而有用脑电信号的幅值远小于此,故可通过一个100μV的低通滤波器将眨眼信号滤除。
(2)滤波,即特定波段的选择。本发明通过巴特沃斯滤波器对原始脑电信号进行了滤波,仅保留其中与想象动作等思维活动最相关的α与β波段(8-30Hz)进行研究。
3脑电特征的提取与融合
5.3.1单一通道特征提取——双线性模型
脑电信号中既有线性成分也有非线性成分。描述线性成分通常采用基于ARMA(Auto-Regression and Moving Average)的模型:
即将采集的脑电信号视为有用信号和随机噪声的叠加,其中c0=1,{et}表示噪声,{ai,i=1,2,…,p}是未知的随时间变化的系数。
为了进一步挖掘脑电信号中可能存在的非线性成分,可将上述模型稍作引申,得到如下表达形式:
其中,c
0=1,{e
t}是噪声,{a
i,i=1,2,…,p},{c
i,i=1,2,…,q}以及{b
ij,i=1,2,…,k;j=1,2,…,m}是未知的随时间变化的系数,也是我们所要提取的特征参数。可以看到,(2)式是在(1)式的基础上增加了
项,于是构成包含线性和非线性成分的复合模型,记为BL(p,q,k,m)。
为了简化参数估计,本发明去掉了MA部分,即采用以下简化的BL(p,0,k,m)模型:
模型阶数的确定通常利用信息理论准则,如本发明采用的AIC准则(Akaike InformationCriterion),表述如下:
其中,
N是数据的长度,M是模型的最大阶数,(N-M)是用来计算似然函数的样本数,r是模型中的独立参数。最优阶数r*是使得AIC(r)达最小时对应的阶数。
由此得到本发明所建立的模型的最优阶数组合为p=8,k=2,m=3。对于给定的(p,k,m),借助标准最小二乘法的线性最小化来估计模型参数{ai,bij}。这样,通过ARMA模型得到的特征参数共有84维(14*6),其中每个通道的特征维数为14(8+2*3)。
5.3.2跨(大脑半球)通道特征提取——线性复杂度
对于C通道信号,线性复杂度的定义如下:
其中:
即εi是对λi的标准化,而λi是由C通道脑电信号协方差矩阵计算出的特征值。
这里取C=2,即衡量来自对侧大脑半球的两个通道脑电信号的线性复杂度。Ω可以粗略的作为一种空间同步性的度量,Ω越大,表示通道之间信号的相关性程度越低,反之亦然。对于本发明而言,六个脑电电极两两对称,共有9种不同的组合
故该特征维数为9。
5.3.2特征融合策略
将上述单一通道的特征和跨通道特征连接起来,构成93维(84+9)的融合特征,从而更加全面的描述脑电信号中包含的具有可分性的个体信息。
4信号后处理
主成分分析(PCA)广泛应用于数据降维算法中,作为一种有效的手段,它能够在保留原始大部分信息量的基础上优化重组。由原始脑电信号提取的特征维度较高,且包含很多冗余信息,这些信息并不具有可分性,反而降低了识别效果,因而有必要对这些特征进行筛选和优化重组。
PCA降维过程的具体步骤可归纳如下:
(6)原始数据标准化:
为了消除数据间不同量纲、不同数量级的影响,需要对原始数据进行标准化处理,使其具有可比性。本发明标准化的方法为:矩阵中的每个元素减去所在列的均值,然后除以所在列的标准差,使得每个变量标准化为均值为0,方差为1的矩阵X,即:
X=[X1,X2,...Xn]T=[xij](n×p) (8)
其中,
i=1,2,...n,j=1,2,...p
(7)计算相关系数矩阵:
R是实对称矩阵(即rij=rji),其中rij(i,j=1,2,...p)是标准化后的变量Xi,Xj的相关系数。其定义是变量协方差除以变量的标准差(方差),计算公式为:
式中:
分别表示原矩阵中X
i和X
j列各向量的均值。
(8)特征分解,求特征值与特征向量:
解特征方程|R-λE|=0,求出相关系数矩阵R的特征值λi(i=1,2,...p),并将其按从大到小的顺序排列,即λ1≥λ2≥…≥λp;然后分别得到每个特征值λi对应的特征向量Ui(i=1,2,...p)。
(9)通过累计贡献率确定主成分:
累计贡献率的计算公式为:
当累计贡献率达到某一阈值(本发明取95%)时,将此时所有前m个特征值λ1,λ2,...λm(m≤p)以及它们对应的特征向量保留下来,作为主成分,其余的均舍弃。
(10)计算得分矩阵
主成分特征值所对应的特征向量U=[U1,U2,...Um]构成新的矢量空间,作为新变量(主成分)的坐标轴,又称为载荷轴。利用下式计算得分矩阵:
F(n×m)=X(n×p)·U(p×m) (13)
其中,X是原数据矩阵,U是主成分载荷,得分矩阵F即为PCA降维后所得到的最终结果。它的每一行相当于原数据矩阵的所有行(即原始变量构成的向量)在主成分坐标轴(载荷轴)上的投影,这些新的投影构成的向量就是主成分得分向量。
通过上面的步骤可以看出,PCA算法通过几个最大的主成分得分来近似反映原始数据阵的全部信息。这样做不仅达到降维的目的,而且大大减小了数据间的相关性,使数据得到优化重组。经PCA降维后,本发明提取的特征由原来的93维降到了36维。
5基于支持向量机(SVM)的身份识别
支持向量机(Support Vector Machines,SVM)通过结构风险最小化原则建模,将期望风险降至最低,使其模型识别力显著提高。该识别方法在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势。支持向量机的主要思想是:寻找一个满足分类要求的最优分类超平面,使得该超平面在保证分类精度的同时,能够使超平面的间隔最大化。从理论上说,支持向量机能够实现对线性可分数据的最优分类。
步态识别是一个多类别的分类问题,支持向量机方法是针对二类别的分类而提出的,不能直接应用于多类别分类问题。对于多类模式识别问题,支持向量机方法可通过两类问题的组合来实现。本发明采用“一对一”策略,即一个分类器每次完成二选一,该方法对N类训练数据两两组合,构建
个支持向量机。最后分类时采取“投票”方式决定分类结果。假设待识别的步态有m类,记为S
1,S
2,…,S
m,每一类中随机选取其中一个样本S
ij(其中i为类别,j为该类中的样本序号)进行训练,其它样本S
it(j≠t)用于测试。测试时,将测试样本S
it输入到经过训练得到的分类器中,如果输出为i,则将该样本判为第i类;如果输出为j,则判定为识别错误。
有益效果:本发明提出的方案在40个样本组成的数据库上进行了测试,表1所示为单一想象动作实验的识别率结果:
表1单一想象动作
结果表明,四种想象动作以“打腹稿”的识别效果最好。表2所示为四中想象动作结合起来得到的识别率结果:
表2四种想象动作结合
结果表明,多种想象动作结合起来识别效果较之单一想象动作有显著的提高。
想象动作脑电与个体的思维活动密切相关,携带着个体可分性的信息,实验得到的识别率结果验证了其能够作为一种生物特征用于身份识别的可行性。由于个体的思维活动存在差异,对于不同的想象动作表现出不同的敏感程度,所以将多种想象动作结合起来会进一步改善识别效果。
脑电不仅能用于病理分析和医疗诊断,而且作为一种有效的生物特征,它的产生与人的思维活动密切相关,表现出高度的个体依赖性。作为脑电中的一种,想象动作脑电是在个体想象某种动作或进行特定的思维活动时产生的脑电信号,体现着明显的个体差异性。
基于此,本发明提出一种新的基于想象动作脑电的身份识别方法,是对传统脑电应用领域(如脑机接口技术)的拓展,也为生物特征识别开启新的思路。该项发明可弥补传统生物特征识别技术的不足,因其高精度和难以复制等显著优势,作为一种有力的补充,可集成应用于军事领域或某些高安全性要求的机构和场所,创造更为安全和谐的社会生活环境,并有望获得可观的社会效益和公共安全服务的提升。最佳实施方案拟采用专利转让、技术合作或产品开发。