CN109800651B - 一种基于双规则主动超限学习机的多类脑电分类方法 - Google Patents

一种基于双规则主动超限学习机的多类脑电分类方法 Download PDF

Info

Publication number
CN109800651B
CN109800651B CN201811577681.2A CN201811577681A CN109800651B CN 109800651 B CN109800651 B CN 109800651B CN 201811577681 A CN201811577681 A CN 201811577681A CN 109800651 B CN109800651 B CN 109800651B
Authority
CN
China
Prior art keywords
sample
samples
similarity
steps
electroencephalogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811577681.2A
Other languages
English (en)
Other versions
CN109800651A (zh
Inventor
佘青山
陈康
席旭刚
罗志增
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201811577681.2A priority Critical patent/CN109800651B/zh
Publication of CN109800651A publication Critical patent/CN109800651A/zh
Application granted granted Critical
Publication of CN109800651B publication Critical patent/CN109800651B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

本发明提出了一种基于双规则主动超限学习机的多类脑电分类方法。本发明方法采用主动学习核心思想,首先依据超限学习机分类器评价无标签样本的不确定性,其次根据余弦相似规则剔除了相似性高的无标签样本,得到最有价值的少量无标签样本进行标注,然后利用这些筛选出的数据对超限学习机进行训练,最大化利用有标签脑电信号内部信息,从而减少对有标签脑电数据的依赖,并获得较高的运动想象任务多分类的准确性。该方法在脑‑机接口领域具有广阔的应用前景。

Description

一种基于双规则主动超限学习机的多类脑电分类方法
技术领域
本发明属于模式识别领域,涉及一种运动想象脑电信号模式识别方法,特别涉及一种用于智能康复辅具控制和康复训练的多类运动想象任务分类方法。
背景技术
大脑作为控制人类的思想、行为、情绪等活动的中枢,分析处理从外部环境获取的信息,通过神经肌肉通路完成与外界的交流。然而,不少异常疾病,如脊髓损伤、肌萎缩侧索硬化症、脑中风等,都能损伤或削弱控制肌肉的神经通路以及肌肉本身的功能。病情严重的患者可能完全丧失自主控制的能力,甚至影响说话等功能,完全没有办法用传统的方式表达意愿或与外界交流。我国乃至全世界有成百上千万人受此类疾病困扰,尽管现代生命支持技术可以维持部分患者的生命,但是由此给患者、家庭和社会带来了无尽的痛苦和沉重的负担。从人体运动的源头出发,直接提取大脑信号解读患者的意愿,或将大脑信号解读成相应的命令来实现与外部世界的交流和控制,实现脑-机交互。基于运动感觉的自发节律(SMR)的运动想象脑电信号分析被广泛应用于脑-机接口(Brain-computer interface,BCI)领域。
模式分类是BCI系统中的关键技术,目前最常用的分类算法有K近邻法、人工神经网络、朴素贝叶斯、支持向量机等算法。
目前,基于传统模式识别算法的BCI系统依赖于充裕的已标定脑电数据,这不仅要求患者接受长时间、多批次的脑电信号采集,并且要求专家对这些原始脑电信号进行人工标定,费时耗力。此外,由于患者个体差异,导致采集的脑电信号也呈现不同的生物学规律,脑电信号信噪比低、易受外界干扰等特征,这些因素进一步加剧了训练一个具有良好鲁棒性的BCI系统的代价。
近年来,为了减少对大量标定好的脑电数据的依赖,大量学者考虑将主动学习(Active Learning)这一思想融入到BCI系统分类器训练中。Chen等人提出一种最近类别平均距离(Nearest average-class distance,NACD)主动学习算法并将其成功应用到多分类BCI系统中。Tomida等人采用Sparsity-aware方法构建主动学习筛选数据的策略,并将其引入到运动想象脑电信号分类中,获得较好的分类效果。这些研究表明,将主动学习思想引入到BCI系统分类器的训练中,具有巨大的优势和潜力。
超限学习机(Extreme learning machines,ELM)是近年来发展很快的一种机器学习算法,本质上是一种单隐层前馈神经网络,具有结构简单、学习速度快、非线性处理能力和全局搜索性能良好等优势,目前已有大量学者致力于其在BCI系统中的应用,并取得了良好的分类效果。
利用ELM学习速度快、良好的逼近能力等优势,并引入主动学习对复杂的脑电信号进行数据挖掘,将有良好的愿景与重大的社会意义。
综上所述,针对随机、非平稳的运动想象脑电信号,如何有机结合主动学习思想、超限学习机算法构造一个具有强鲁棒性的BCI分类器,这一问题还没有得到有效的解决。
发明内容
本发明针对现有技术的不足,提出一种基于双规则主动超限学习机的多类脑电分类方法(D-AL-ELM)。该方法采用双规则主动学习思想,一方面利用ELM评价无标签样本的不确定性,另一方面以余弦相似规则剔除了相似性高的无标签样本,选取最具有价值的无标签样本进行人工标注,避免了大量标注脑电信号的成本,最终凭借ELM优异的分类性能,训练出一个良好泛化性能、速度快的BCI分类器。
本发明方法采用主动学习核心思想,首先依据超限学习机分类器评价无标签样本的不确定性,其次根据余弦相似规则剔除了相似性高的无标签样本,得到最有价值的少量无标签样本进行标注,然后利用这些筛选出的数据对超限学习机进行训练,最大化利用有标签脑电信号内部信息,从而减少对有标签脑电数据的依赖,并获得较高的运动想象任务多分类的准确性。
为了实现以上目的,本发明方法主要包括以下步骤:
步骤(1)对脑电信号进行特征提取
采用一对多共空间模式(One-versus-rest common spatial pattern,OVR-CSP)算法对原始脑电信号进行特征提取,得到新的脑电信号样本。
步骤(2)训练初始ELM分类器
根据少量有标签训练样本{Xl,Yl},计算出初始输出权重β0,得到初始ELM分类器。
步骤(3)计算出输出后验概率
根据预先训练好的ELM分类器,计算无标签样本的输出后验概率。
步骤(4)计算无标签样本的不确定性
根据步骤(3)计算得到的后验概率值,利用最大次大原则(Best-versus-second-best,BvSB)原则评价无标签样本的不确定性。
步骤(5)评价无标签样本的相似性
根据步骤(4)挑出不确定性度最小的h个样本,分别计算出这h个样本之间的相似性及与有标签样本Xl之间的相似性。
步骤(6)选取最有价值的无标签样本
结合步骤(4)和步骤(5),挑选出m个最有价值的无标签样本步骤。
步骤(7)更新有标签训练集及无标签训练集
将步骤(6)挑选出的m个样本进行人工标注,添加到有标签样本集,并将其从无标签样本集中剔除。
步骤(8)更新超限学习机分类模型
利用扩展后的有标签数据集,得出新的输出权值矩阵βnew,更新ELM分类器。
步骤(9)迭代选取最有价值的无标签数据
重复步骤(3)至步骤(8),直至分类器性能稳定或者标定数据达到原始无标签数据集数量的80%,得到最终的ELM分类器。
步骤(10)预测测试集的类别标签
对于测试样本,根据步骤(9)的最终ELM分类器计算得到对应的类别标签。
本发明创新处在于:构造出一个双规则主动学习方法,一方面评价了无标签样本的不确定性,另一方面评价了无标签样本的综合相似性。将两种规则有机融合,选取最具有价值的无标签样本进行标定,大大减少人工标注的压力与代价。同时,将主动学习思想与超限学习机算法相结合并应用到脑电分类领域中,不仅减少受试者训练的时间与次数,而且减少了专家标注信号的成本,最终获得良好的脑电分类效果。本发明方法可以较好地满足智能轮椅等康复辅具控制中的多模式识别要求,在脑-机接口、脑疾病诊断领域具有广阔的应用前景。
附图说明
图1为本发明脑电信号预处理流程图;
图2为本发明双规则主动学习超限学习机训练流程图;
图3为本发明脑电信号测试流程图。
具体实施方式
下面结合附图详细描述本发明基于双规则主动超限学习机的运动想象脑电分类方法。
下面逐一对各步骤进行详细说明。
步骤一:对脑电信号进行特征提取,如图1所示;
具体是:采用一对多共空间模式(OVR-CSP)算法对原始的多类脑电信号进行特征提取,得到新的脑电特征样本{X,Y}={{Xl,Yl},Xu},其中X为全部的训练样本;
Figure BDA0001914048280000041
Xl为nl个有标记训练样本;Yl为nl个有标记训练样本对应的标签;
Figure BDA0001914048280000042
Xu为nu个无标记训练样本。
步骤二:训练初始超限学习机(ELM)分类器,如图2所示;
具体是:根据少量有标签训练样本{Xl,Yl},计算出初始输出权重β0,得到初始ELM分类器。
步骤三:根据预先训练好的ELM分类器,计算无标签样本的输出后验概率;
具体是:依据预先训练好的ELM分类器,得到无标签样本的输出值f(x)。对于多分类信号,其输出后验概率公式为:
Figure BDA0001914048280000043
Figure BDA0001914048280000044
其中,fi(x)表示对于样本x的第i个输出节点的实际输出值,p(y=1|fi(x))表示第i类的原始输出后验概率,q为总类别数。
步骤四:根据步骤三计算得到的后验概率值,利用最大次大原则(BvSB)评价无标签样本的不确定性;
具体是:计算出无标签样本x的后验概率值,其次按照由大到小的顺序进行排序,然后选出后验概率最大及次大值,最后进行作差处理,具体表示为:
f(x)BvSB=p(ybest|x)-p(ysecond-best|x) (3)
其中,p(ybest|x)和p(ysecond-best|x)分别表示为无标签样本x的最大及次大后验概率值,f(x)BvSB表示无标签样本x的不确定性度,其值越小,表示其越不确定。
步骤五:依据步骤四,挑出不确定性度最小的h个样本,分别计算出这h个样本之间的相似性及与有标签样本Xl之间的相似性;
具体是:对于样本xi和xj,他们之间的相似性表示如下:
Figure BDA0001914048280000051
这里,S(xi,xj)越大表示样本xi和xj越相似。
对于样本集
Figure BDA0001914048280000052
值越小,表示对于无标签样本x与样本集W之间的相似性越小。
根据步骤四,挑选出不确定性最小的h个样本,首先计算这h个样本之间的相似性:
Figure BDA0001914048280000053
式中,H={x1,x2,...,xh},x,xj∈H,x≠xj;然后,计算出这h个样本与有标签本集Xl的相似度:
Figure BDA0001914048280000054
最后,根据公式(5)和(6),得到样本x最终的综合相似度值:
Div(x)=div(x,H)+div(x,Xl) (7)
步骤六:结合步骤四和步骤五,挑选出m个最有价值的无标签样本;
具体是:结合公式(3)和(7),评价样本x的价值性:
Figure BDA0001914048280000055
其中,
Figure BDA0001914048280000056
为最终挑选的无标签样本。按照公式(8)挑选出m个最有价值的样本
Figure BDA0001914048280000057
λ为平衡系数。
步骤七:将步骤六挑选出的m个样本进行人工标注,添加到有标签样本集Xl,并将其从无标签样本集Xu中剔除;
步骤八:利用扩展后的有标签数据集Xl,得出新的输出权值矩阵βnew,更新ELM分类器;
步骤九:重复步骤三至步骤八,直至分类器性能稳定或者标定数据达到原始无标签数据集数量的80%,得到最终的ELM分类器;
步骤十:采用训练好的双规则主动超限学习机分类模型判别测试样本的类标签,如图3所示;
具体是:对于含有L个样本的测试数据集B,依据步骤九训练好的ELM分类器,采用公式(9)预测出其类别标签Ypredict
Figure BDA0001914048280000061
其中,βi表示第i个隐层节点与输出节点之间的输出权重,ai表示第i个隐层节点和所有输入节点的连接权值,bi表示第i个隐节点的阈值,g(·)表示激活函数,M表示隐层节点的个数。
为了验证本发明方法的有效性,本实施方案采用Graz科技大学提供的闹-机接口国际竞赛数据集Datasets 2a进行实验验证,并与同类型的几种方法比较。Datasets 2a数据集包含9名健康受试者,每位受试者执行四类运动想象任务,即左手,右手,脚和舌头想象运动。每位受试者要求完成多次运动想象实验,每次采集22个通道的脑电信号,采样频率为250HZ,一共获得576组样本。
本方法(D-AL-ELM)与被动学习超限学习机(PL-ELM)、主动学习超限学习机(AL_ELM)、基于信息熵主动超限学习机(ELM-Entropy)三种算法进行比较。为避免偶然性的影响,重复十次实验,得出分类的平均准确率和平均耗时,以便进行结果分析。实验结果如下:
表一 四种方法在BCI IV 2a数据集上平均正确率
Figure BDA0001914048280000062
Figure BDA0001914048280000071
表二 四种方法在BCI IV 2a数据集上训练耗时(单位:秒)
Figure BDA0001914048280000072
通过表一可以看,本发明算法在S1,S4,S5,S6,S9上获得最高的分类准确率,并且对于9组数据的平均分类准确率,本发明方法获得71.36%准确性,高于AL-ELM(70.92%),高于ELM-Entropy(70.34%),高于PL-ELM(70.51%)。这表明本发明方法确实能够凭借双规则策略来提高主动学习的效果,既筛选出不确定性样本,又能剔除相似性样本,从而获得最有价值的样本信息。
表二展示了不同算法之间的计算效率,可以看出几种算法计算效率大致相当,本发明方法较其他三种算法耗时略微高一点,但相对于提高的分类性能来说,微弱的耗时增加是值得的。
为了进一步显示不同算法在学习过程中的表现,本实验采取区域曲线法(Areaunder the learning curve,ALC)评价标准,对四种算法进行深入评测,实验结果如下:
表三 四种方法的ALC值
Figure BDA0001914048280000073
Figure BDA0001914048280000081
通过表三看出,本发明方法在绝大多数数据集上获得最优的学习效果,并且始终优于ELM-Entropy方法,优于PL-ELM算法(除了S2数据集)。本发明方法在S1,S4,S5,S6,S9上获得最高ALC值,而AL-ELM在S3,S7,S8获得最好效果。这些实验结果进一步验证了本发明方法的学习过程中的优越性。

Claims (1)

1.一种基于双规则主动超限学习机的多类脑电分类方法,其特征在于,该方法包括如下步骤:
步骤一:对脑电信号进行特征提取;
具体是:采用一对多共空间模式算法对原始的多类脑电信号进行特征提取,得到新的脑电特征样本{X,Y}={{Xl,Yl},Xu},其中X为全部的训练样本;
Figure FDA0002609599630000011
Xl为nl个有标记训练样本,Yl为nl个有标记训练样本对应的标签;
Figure FDA0002609599630000012
Xu为nu个无标记训练样本;
步骤二:训练初始超限学习机分类器;
具体是:根据少量有标签训练样本{Xl,Yl},计算出初始输出权重β0,得到初始ELM分类器;
步骤三:根据预先训练好的ELM分类器,计算无标签样本的输出后验概率;
具体是:依据预先训练好的ELM分类器,得到无标签样本的输出值f(x);对于多分类信号,其输出后验概率公式为:
Figure FDA0002609599630000013
Figure FDA0002609599630000014
其中,fi(x)表示对于样本x的第i个输出节点的实际输出值,p(y=1|fi(x))表示第i类的原始输出后验概率,q为总类别数;
步骤四:根据步骤三计算得到的后验概率值,利用最大次大原则BvSB评价无标签样本的不确定性;
具体是:计算出无标签样本x的后验概率值,然后按照由大到小的顺序进行排序,选出后验概率最大及次大值,最后进行作差处理,具体表示为:
f(x)BvSB=p(ybest|x)-p(ysecond-best|x) (3)
其中,p(ybest|x)和p(ysecond-best|x)分别表示为无标签样本x的最大及次大后验概率值,f(x)BvSB表示无标签样本x的不确定性度,其值越小,表示其越不确定;
步骤五:依据步骤四,挑出不确定性度最小的h个样本,分别计算出这h个样本之间的相似性及与有标签样本Xl之间的相似性;
具体是:对于样本xi和xj,他们之间的相似性表示如下:
Figure FDA0002609599630000021
这里,S(xi,xj)越大表示样本xi和xj越相似;
对于样本集W={w1,w2,…,wn},
Figure FDA0002609599630000022
值越小,表示对于无标签样本x与样本集W之间的相似性越小;
根据步骤四,挑选出不确定性最小的h个样本,首先计算这h个样本之间的相似性:
Figure FDA0002609599630000023
式中,H={x1,x2,...,xh},x,xj∈H,x≠xj;然后,计算出这h个样本与有标签样本集Xl的相似度:
Figure FDA0002609599630000024
最后,根据公式(5)和(6),得到无标签样本x最终的综合相似度值:
Div(x)=div(x,H)+div(x,Xl) (7)
步骤六:结合步骤四和步骤五,挑选出m个最有价值的无标签样本;
具体是:结合公式(3)和(7),评价样本x的价值性:
Figure FDA0002609599630000025
其中,
Figure FDA0002609599630000026
为最终挑选的无标签样本;按照公式(8)挑选出m个最有价值的样本
Figure FDA0002609599630000027
λ为平衡系数;
步骤七:将步骤六挑选出的m个样本进行人工标注,添加到有标签样本集Xl,并将其从无标签样本集Xu中剔除;
步骤八:利用扩展后的有标签数据集Xl,得出新的输出权值矩阵βnew,更新ELM分类器;
步骤九:重复步骤三至步骤八,直至分类器性能稳定或者标定数据达到原始无标签数据集数量的80%,得到最终的ELM分类器;
步骤十:采用训练好的双规则主动超限学习机分类模型判别测试样本的类标签;
具体是:对于含有L个样本的测试数据集B,依据步骤九训练好的ELM分类器,采用公式(9)预测出其类别标签Ypredict
Figure FDA0002609599630000031
其中,βi表示第i个隐层节点与输出节点之间的输出权重,ai表示第i个隐层节点和所有输入节点的连接权值,bi表示第i个隐节点的阈值,g(·)表示激活函数,M表示隐层节点的个数。
CN201811577681.2A 2018-12-20 2018-12-20 一种基于双规则主动超限学习机的多类脑电分类方法 Active CN109800651B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811577681.2A CN109800651B (zh) 2018-12-20 2018-12-20 一种基于双规则主动超限学习机的多类脑电分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811577681.2A CN109800651B (zh) 2018-12-20 2018-12-20 一种基于双规则主动超限学习机的多类脑电分类方法

Publications (2)

Publication Number Publication Date
CN109800651A CN109800651A (zh) 2019-05-24
CN109800651B true CN109800651B (zh) 2020-10-27

Family

ID=66557332

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811577681.2A Active CN109800651B (zh) 2018-12-20 2018-12-20 一种基于双规则主动超限学习机的多类脑电分类方法

Country Status (1)

Country Link
CN (1) CN109800651B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114841216B (zh) * 2022-05-24 2024-02-20 合肥工业大学 一种基于模型不确定性学习的脑电信号分类方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106803081A (zh) * 2017-01-25 2017-06-06 东南大学 一种基于多分类器集成的脑电分类方法
CN108122004A (zh) * 2017-12-19 2018-06-05 杭州电子科技大学 基于Fisher判别稀疏超限学习机的脑电分类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106803081A (zh) * 2017-01-25 2017-06-06 东南大学 一种基于多分类器集成的脑电分类方法
CN108122004A (zh) * 2017-12-19 2018-06-05 杭州电子科技大学 基于Fisher判别稀疏超限学习机的脑电分类方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
AL-ELM: Oneuncertainty-basedactivelearningalgorithm using extremelearningmachine;Hualong Yu 等;《Neurocomputing》;20150425;全文 *
Scalable Active Learning for Multiclass Image Classification;Ajay J. Joshi 等;《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》;20121130;全文 *
改进的极限学习机在癫痫脑电分类中的应用;王杰 等;《计算机仿真》;20140630;全文 *

Also Published As

Publication number Publication date
CN109800651A (zh) 2019-05-24

Similar Documents

Publication Publication Date Title
Zhu et al. Separated channel convolutional neural network to realize the training free motor imagery BCI systems
Jiao et al. Sparse group representation model for motor imagery EEG classification
CN110693493B (zh) 一种基于卷积与循环神经网络结合时间多尺度的癫痫脑电预测特征提取方法
Dutta et al. Deep learning-based multi-head self-attention model for human epilepsy identification from EEG signal for biomedical traits
CN111544855B (zh) 基于蒸馏学习和深度学习纯意念控制智能康复方法及应用
CN111476158B (zh) 一种基于pso-pca-svm的多通道生理信号体感手势识别方法
CN110175510B (zh) 基于脑功能网络特征的多模式运动想象识别方法
Zhang et al. Instance transfer subject-dependent strategy for motor imagery signal classification using deep convolutional neural networks
Rejer EEG feature selection for BCI based on motor imaginary task
CN112733774A (zh) 一种基于BiLSTM与串并多尺度CNN结合的轻量化ECG分类方法
Thenmozhi et al. Feature selection using extreme gradient boosting Bayesian optimization to upgrade the classification performance of motor imagery signals for BCI
CN113180692A (zh) 一种基于特征融合和注意力机制的脑电信号分类识别方法
Zhang et al. Multiview unsupervised shapelet learning for multivariate time series clustering
CN114595725B (zh) 一种基于加法网络和监督对比学习的脑电信号分类方法
Guan Application of logistic regression algorithm in the diagnosis of expression disorder in Parkinson's disease
CN109800651B (zh) 一种基于双规则主动超限学习机的多类脑电分类方法
CN114305453A (zh) 多源流形脑电特征迁移学习方法
Li et al. Facial emotion recognition via stationary wavelet entropy and Biogeography-based optimization
CN116821764A (zh) 一种基于知识蒸馏的多源域适应的eeg情绪状态分类方法
CN116522106A (zh) 一种基于迁移学习并行多尺度滤波器组时域卷积的运动想象脑电信号分类方法
CN112084935B (zh) 一种基于扩充高质量脑电样本的情绪识别方法
Castro et al. Development of a deep learning-based brain-computer interface for visual imagery recognition
CN114254676A (zh) 多源脑电迁移的源域选择方法
CN114936583A (zh) 基于教师-学生模型的双步领域自适应的跨用户肌电模式识别方法
He et al. Emotion classification using eeg data in a brain-inspired spiking neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20190524

Assignee: HANGZHOU DUKANG TECHNOLOGY CO.,LTD.

Assignor: HANGZHOU DIANZI University

Contract record no.: X2022330000025

Denomination of invention: A multi class EEG classification method based on double rule active transfinite learning machine

Granted publication date: 20201027

License type: Common License

Record date: 20220128

EE01 Entry into force of recordation of patent licensing contract