CN116211320A - 基于集成学习的运动想象脑机接口的模式识别方法 - Google Patents
基于集成学习的运动想象脑机接口的模式识别方法 Download PDFInfo
- Publication number
- CN116211320A CN116211320A CN202310255013.2A CN202310255013A CN116211320A CN 116211320 A CN116211320 A CN 116211320A CN 202310255013 A CN202310255013 A CN 202310255013A CN 116211320 A CN116211320 A CN 116211320A
- Authority
- CN
- China
- Prior art keywords
- model
- brain
- motor imagery
- electroencephalogram
- computer interface
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012567 pattern recognition method Methods 0.000 title claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 41
- 238000000034 method Methods 0.000 claims abstract description 39
- 210000004556 brain Anatomy 0.000 claims abstract description 22
- 238000007427 paired t-test Methods 0.000 claims abstract description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 35
- 238000012360 testing method Methods 0.000 claims description 34
- 230000006870 function Effects 0.000 claims description 16
- 238000007477 logistic regression Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 12
- 238000007637 random forest analysis Methods 0.000 claims description 12
- 238000012795 verification Methods 0.000 claims description 11
- 210000003141 lower extremity Anatomy 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 9
- 230000010354 integration Effects 0.000 claims description 8
- 238000012706 support-vector machine Methods 0.000 claims description 8
- 210000000629 knee joint Anatomy 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 6
- 238000007619 statistical method Methods 0.000 claims description 6
- 210000000544 articulatio talocruralis Anatomy 0.000 claims description 5
- 238000003066 decision tree Methods 0.000 claims description 5
- 238000012880 independent component analysis Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 239000013598 vector Substances 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 238000000692 Student's t-test Methods 0.000 claims description 3
- 238000013461 design Methods 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 210000004761 scalp Anatomy 0.000 claims description 3
- 238000012353 t test Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000013145 classification model Methods 0.000 abstract description 2
- 238000011156 evaluation Methods 0.000 abstract 1
- 238000002474 experimental method Methods 0.000 description 13
- 210000002414 leg Anatomy 0.000 description 6
- 238000003909 pattern recognition Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000005315 distribution function Methods 0.000 description 2
- 229920008347 Cellulose acetate propionate Polymers 0.000 description 1
- 210000003423 ankle Anatomy 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000006998 cognitive state Effects 0.000 description 1
- 238000009470 controlled atmosphere packaging Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 210000003414 extremity Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
- A61B5/369—Electroencephalography [EEG]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
- A61B5/7267—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Veterinary Medicine (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Heart & Thoracic Surgery (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Theoretical Computer Science (AREA)
- Psychiatry (AREA)
- Evolutionary Computation (AREA)
- Pathology (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physiology (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Fuzzy Systems (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Psychology (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Rehabilitation Tools (AREA)
Abstract
本发明属于脑机接口技术领域,具体涉及一种基于集成学习的运动想象脑机接口的模式识别方法,所述方法包括以下步骤:获取脑电信号数据集;进行预处理;提取脑电信号特征;模型训练:基于集成学习策略构建基模型和元模型进行训练和预测;性能评估:采用精确率、准确率、召回率和F1‑score值四种指标和配对t检验系统地、定量地评估模型性能;在线应用:将集成学习模型预测的结果传输至康复机器人的上位机中驱动机器人动作,从而辅助被试进行康复训练,本发明引入集成策略构建分类模型,能够有效提升运动想象脑机接口的分类精度和鲁棒性。
Description
技术领域
本发明属于脑机接口技术领域,具体涉及一种基于集成学习的运动想象脑机接口的模式识别方法。
背景技术
脑机接口(Brain Computer Interface,BCI)通过在动物脑或人类大脑与外部设备之间建立信息传输通道实现大脑与外界的信息交互。目前的脑机接口系统主要包括侵入式和非侵入式脑机接口两大类,它们分别通过大脑植入式电极和头皮电极采集脑电(Electroencephalography,EEG)信号,解码脑电信号中的思维和意图,并通过算法将其转化为控制外界设备的指令。
运动想象(Motor Imagery,MI)是指被试通过执行特定的运动想象任务自发产生的运动意识EEG信号,通过经过一段时间的训练得到分类模型,实际应用时通过被试实时输出的EEG信号来控制外部设备。作为脑机接口经典范式之一,运动想象在医疗诊断、康复训练等方面获得越来越多的关注和认可。
对特征提取、特征选择后的混合特征向量进行分类是脑电信号处理最关键的步骤。目前脑电信号的模式识别算法主要包括监督学习、无监督学习、深度学习、黎曼几何、集成学习和迁移学习,在MI-BCI在线应用方面,分类准确性、鲁棒性、效率以及面向复合肢体和复杂动作的分类其真正落地的关键指标。在确保分类准确率的同时,必须要降低算法的计算复杂度,减少被试个体差异性的影响,降低被试在实验时认知状态变化对信号的影响,寻找面向应用场景的复杂运动分类方法。
因此,结合不同算法的特点与优势,探索更优的MI分类算法仍是MI-BCI系统拓展到日常应用的关键一步。
发明内容
针对上述技术方案的不足,本发明提出一种基于集成学习的运动想象脑机接口的模式识别方法,该方法能够根据根据下肢运动想象脑电特征判定动作类别,并具有较高的分类精度和较强的鲁棒性。
为实现上述技术目的,达到上述技术效果,本发明是通过以下技术方案实现:
基于集成学习的运动想象脑机接口的模式识别方法,包括以下步骤:
1)获取脑电信号数据集:设计运动想象脑电实验范式,在伦理审查获得批准后,招募被试采集头皮脑电信号获取自采数据集;
2)进行预处理:对自采数据集和公开数据集进行滤波、独立分量分析方法去除电磁干扰和生理伪迹;
3)提取脑电信号特征:基于运动想象脑电信号的随机性、非线性特点,采用滤波组共空间模式方法在多个频带和全通道对运动想象脑电信号进行特征提取;
4)模型训练:采用Stacking算法作为集成策略构建预测模型,采用五种机器学习算法,即支持向量机、K近邻、逻辑回归、随机森林和轻量梯度提升树作为基模型,采用逻辑回归作为元模型;预测模型共两层,第一层为五种基模型,它们分别对脑电特征集进行分类预测,并输出预测标签;第二层为元模型,元模型把第一层的输出结果作为本层的输入特征再进行预测,得到最终分类结果;
5)性能分析:采用精确率、准确率、召回率和F1-score值四种指标系统地、定量地评估集成模型的分类性能;
6)在线应用:基于以上步骤,构建下肢运动想象脑机接口康复系统,将集成学习模型预测的结果传输至康复机器人的上位机中驱动机器人动作,从而辅助被试进行康复训练。
进一步地,步骤1)中,获取脑电信号数据集过程:基于左腿膝关节和踝关节低频低幅联动,以及右腿膝关节和踝关节高频高幅联动的二分类运动想象脑电实验范式,并自主采集多名被试的样本数据作为自采数据集。
进一步地,自主采集12名被试共1920条样本数据作为自采数据集,两类样本各占50%。
进一步地,步骤2)中,进行预处理过程:对数据集中的原始脑电信号进行3-33Hz带通滤波、50Hz陷波和独立分量分析去除信号中的高频噪声、工频干扰和眼电生理伪迹。
进一步地,步骤3)中,提取脑电信号特征过程:采用滤波组共空间模式进行特征提取,首先对多通道脑电信号进行分频处理,将4-36Hz的脑电信号划分为8个子带,带宽为4Hz,然后对不同子带进行共空间模式变换。
进一步地,步骤4)中,模型训练的架构采用Stacking集成策略构建模型,将数据集划分训练集、测试集,并在第一层对一个基模型训练时,将训练集等分为验证集分别训练出五个模型,即利用五折交叉验证法对模型进行训练和预测。
进一步地,步骤4)中,模型训练的第一层基模型及其参数选择为:
a.支持向量机(Support Vector Machine,SVM):核函数选用径向基核函数,惩罚系数设定为0.8,参数gamma设定为1/EEGFeatures,其中EEGFeatures为运动想象脑电信号特征值维数,其他参数为默认值;
b.K近邻(K-Nearest Neighbor,KNN):K值设置为7,距离度量方式为欧式距离;
c.逻辑回归(Logistic Regression,LR):逻辑回归算法的主要思想是寻找一个分类超平面将两类数据分开,该分类超平面的决策函数通过对样本特征进行线性加权后再利用sigimoid函数进行映射而得到,正则化项选择L2范式,即为参数向量中的每个参数的平方和的开方值,正则化系数设置为1;
d.随机森林(Random Forest,RF):随机森林算法通过随机选择样本形成多个决策树组成森林结构,将决策树数量设置为50,随机选择的脑电特征值数量为其中EEGFeatures为运动想象脑电信号特征值维数;
e.轻量梯度提升树(Light Gradient Boosting Machine,LightGBM):该算法通过在损失函数中增加二阶导数项使得算法的收敛速度加快,并且使用直方图算法减少中间运算步骤和存储空间,学习率设置为0.1,迭代次数设置为100。
进一步地,步骤4)中,模型训练的第二层元模型及其参数选择为:Stacking集成模型的第二层分类结构,需要对第一层基模型的预测结果进行二次分类,为避免过拟合问题,元模型采用算法比较简单的模型,选择逻辑回归作为元模型算法,参数选择与上述基模型一致。
进一步地,步骤5)中,性能分析过程:采用准确率(Accuracy)、精确率(Precision)、召回率(Recall)和F1-score值四种指标系统地、定量地评估集成模型的分类性能,其计算公式为:
其中,TP代表真阳性,即高频高幅类样本被正确检测为高频高幅类样本;FP代表假阳性,即低频低幅样本类被错误检测为高频高幅类样本;TN代表真阴性,即低频低幅类样本被正确检测为低频低幅类样本;FN代表假阴性,即高频高幅类样本被错误检测为低频低幅类样本;
采用配对t检验验对相同脑电数据集经过不同方法的分类结果进行统计分析,t检验是用于检验小样本的两类平均值差异的统计方法,它通过t分布推断两类样本发生的概率,从而判定两类样本的均值是否有显著性差异,其主要公式如下:
设两类方法对同一组数据集进行分类的分类结果分别为总体T1和总体T2,T1~N(μ1,σ1),T2~N(μ2,σ2);设(Z11,Z21),(Z12,Z22),…,(Z1n,Z2n)为配对样本,其差值di=Z1i-Z2i(i=1,2,…,n),假设两类总体没有显著性差异,即
H0:μ1-μ2=0
在H0假设条件成立的情况下,差值d的均值为零,构造t统计量:
其中S为样本差值的标准差,当μ1-μ2=0时,t统计量服从自由度为n-1的t分布,在给定H0假设条件下,将检验值μ1-μ2=0带入t统计量,计算得到检验统计量的观测值,之后根据t分布函数计算出概率值p,当检验统计量的概率值p小于显著性水平时,拒绝假设H0,判定两类样本数据具有显著性差异;反之则接受假设H0,判定两类样本没有显著性差异。
进一步地,步骤6)中,在线应用过程:信号采集时联合Brain vision recorder软件和EEGLAB实时记录、读取被试运动想象脑电信号;将预测标签通过虚拟专用网络传输至多位姿下肢康复机器人的上位机,并采用膝关节角度变化曲线与预测标签进行比较。
本发明的有益效果是:
1、本发明将Stacking集成学习策略引入运动想象脑机接口中,从而降低分类偏差和方差,能够有效提升下肢运动想象脑电信号的模式识别分类精度和鲁棒性。
2、本发明提供的技术方案能够为运动想象脑机接口的在线应用提供帮助。
当然,实施本发明的任一产品并不一定需要同时达到以上的所有优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中基于集成学习的运动想象脑机接口的模式识别方法架构图;
图2为本发明实施例中Stacking集成策略的第一层模型进行训练和预测的原理图;
图3为本发明实施例中在线实验的被试2模式识别结果示意图;
图4为本发明实施例中多位姿康复机器人踝关节角度变化图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本实施例提供一种基于集成学习的运动想象脑机接口的模式识别方法,具体步骤包括:
步骤(一)获取脑电信号数据集:
首先设计运动想象脑电实验范式,实验范式为运动观察、运动执行和运动想象组成的混合范式,实验内容为被试根据实验方案自主想象预定的动作,实时采集其脑电信号。运动观察和运动执行阶段是为了使被试熟悉实验内容并激发其运动神经回路,具体实验次数根据被试实验状态确定,运动想象阶段包括8个实验组,每个实验组有20次实验,包含左腿低频低幅运动和右腿高频高幅运动各10次,二者的顺序随机出现。在伦理审查获得批准后,招募被试按照实验方案进行实验,被试在实验前签署知情同意书和实验协议。
本实施例信号采集所用的硬件设备主要包括德国Brain product(BP)公司设计开发的Brain CAP脑电帽、Brain Amp脑电信号放大器以及台式计算机主机两台、显示屏三台。一次实验时长14s,其中运动想象时长为6s,脑电采集设备采样频率为500Hz,通道数为31,即一次实验可获得大小为3000×31的脑电数据。本实施例共采集了12名被试(8名男性,4名女性)共计1920个样本数据,脑电数据大小为1920×3000×31。
步骤(二)预处理:
由于脑电信号具有的非线性和非平稳性,因此脑电信号处理的第一步是预处理,通过预处理可以去除大部分电磁噪声干扰和生理伪迹。根据运动想象脑电信号频率分布范围为3~33Hz,本实施例采用3~33Hz的IIR数字滤波器以去除高频噪声干扰,阶数为4阶,根据工频干扰的特点,选用50Hz陷波器以去除脑电信号中工频干扰,采用独立分量分析方法去除眼电、心电等生理伪迹。
步骤(三)提取脑电信号特征:
基于运动想象脑电信号的随机性、非线性特点,采用滤波组共空间模式方法在多个频带和全通道对运动想象脑电信号进行特征提取,下面简要介绍特征提取算法的原理:
(i)共空间模式特征提取算法
共空间模式(Common Spatial Pattern,FBCSP)主要关注不同运动模式下EEG空间能量的分布差异。其基本方法是:首先,对两个实对称矩阵协方差矩阵对角化;其次,利用主成分分析法和空域子空间分析获取两类任务的空间成分;最后,根据获取到的空间成分构建空间滤波器使两类别差异最大,从而实现两类运动想象脑电信号的特征提取。
(ii)滤波组共空间模式特征提取算法
滤波器组共空间模式(Filter Bank Common Spatial Pattern,FBCSP)是对共空间模式算法的改进,它使用滤波器组把原始的多通道脑电信号切片成多个频率子带,然后对每个子带的信号进行CSP变换,并提取对数方差特征。把每个子带的CSP特征级联成一个特征向量,再使用特征选择方法选择最优的频带特征,最后使用分类器对选择得到的特征子集进行分类,FBCSP从多个频率子带中找到最具判别性的CSP特征,从而弥补了CSP的频域信息。
本实施例通过带通滤波器和CSP变换构建FBCSP特征,如图1所示,利用8个子带通滤波器的滤波器组数据集进行滤波切片,这些子带通滤波器是IIR数字滤波器,阶数为4阶,起始频率为4Hz,子带宽为4Hz(4-8Hz,8-12Hz,12-16Hz,16-20Hz,20-24Hz,24-28Hz,28-32Hz,32-36Hz),最后得到1920×32的特征矩阵。
步骤(四)模型训练:
采用Stacking算法作为集成策略构建预测模型,采用五种机器学习算法,即支持向量机、K近邻、逻辑回归、随机森林和轻量梯度提升树作为基模型,采用逻辑回归作为元模型;预测模型共两层,第一层为五种基模型,它们分别对脑电特征集进行分类预测,并输出预测标签;第二层为元模型,元模型把第一层的输出结果作为本层的输入特征再进行预测,得到最终分类结果。
如图1和图2所示,为更清楚地说明Stacking集成策略的架构中,下面详细阐述第一层基模型、第二层元模型的训练和预测过程过程,具体步骤如下:
步骤4.1:划分数据集,将步骤(三)中得到的FBCSP特征矩阵划分为训练集和测试集,划分比例为7:3,分别记为DTrain和DTset,然后将训练集DTrain等分为五个互斥的子集,每次训练时选择其中一个为验证集,记为Di(i=1,2,3,4,5),其余四个组成新的训练集。
步骤4.2:训练第一层基模型,本实施例中共有五个基模型,包括SVM、KNN、LR、RF和LightGBM,分别记为Mn(n=1,2,3,4,5),然后根据不同的新组成的训练集对模型分别进行训练。
具体地,对于同一基模型算法Mn,五个不同的新训练集能够训练出五个参数不同的模型Modelni。
步骤4.3:基模型预测验证集,利用训练好的模型Modelni预测与之对应的验证集Di,得到预测结果集合Pni,取预测结果的并集作为第二层元模型的训练集,记为Pn;利用训练好的模型Modelni预测原始测试集Dtest,得到预测结果集合Qni。
具体地,利用训练出五个参数不同的模型Modelni预测Di和Dtest可分别得到五个不同的Pni和Qni,由步骤4.1划分数据集原理可知,最终得到的Pn和Qn与原始训练集DTrain和测试集DTset样本容量一致,动作标签一致。
步骤4.4:训练所有基模型,循环重复步骤4.2和4.3,分别训练五个基模型,并将训练好基模型对验证集和测试集进行预测,得到预测结果集合。
具体地,对于五个基模型,分别按照分割后的新训练集和验证集进行训练和预测,最终每个模型均可以得到验证集预测结果的并集Pn,再取它们的并集得到五个模型的所有预测结果,记为P,显然其样本容量大小为原始训练集的五倍。
步骤4.5:处理基模型的测试集结果,由步骤4.3和4.4可知,五个基模型分别对原始测试集Dtest进行预测,可以得到五个不同的预测结果集合Qni,取所有预测集合的加权平均概率投票结果作为第二层元模型的测试集,记为Qn,显然,其样本容量大小与原始测试集Dtest保持一致。
步骤4.6:训练第二层元模型,将步骤4.4中得到的所有基模型对不同验证集的预测结果集合Pn作为元模型的训练集进行训练,可得到训练好的元模型。
步骤4.7:元模型预测测试集,将步骤4.5中得到的所有基模型对原始测试集的预测标签的加权平均概率投票结果Qn作为元模型的预测集,得到最终的预测结果。
基于Stacking集成策略的第一层基模型及其参数选择为:
(1)支持向量机(Support Vector Machine,SVM):核函数选用径向基核函数,惩罚系数设定为0.8,参数gamma设定为1/EEGFeatures,其中EEGFeatures为运动想象脑电信号特征值维数,其他参数为默认值;
(2)K近邻(K-Nearest Neighbor,KNN):K值设置为7,距离度量方式为欧式距离;
(3)逻辑回归(Logistic Regression,LR):逻辑回归算法的主要思想是寻找一个分类超平面将两类数据分开,该分类超平面的决策函数通过对样本特征进行线性加权后再利用sigimoid函数进行映射而得到,本发明中正则化项选择L2范式,即为参数向量中的每个参数的平方和的开方值,正则化系数设置为1;
(4)随机森林(Random Forest,RF):随机森林算法通过随机选择样本形成多个决策树组成森林结构,本发明中将决策树数量设置为50,随机选择的脑电特征值数量为其中EEGFeatures为运动想象脑电信号特征值维数;
(5)轻量梯度提升树(Light Gradient Boosting Machine,LightGBM):该算法通过在损失函数中增加二阶导数项使得算法的收敛速度加快并且使用直方图算法减少了中间运算步骤和存储空间,本发明学习率设置为0.1,迭代次数设置为100。
步骤(五)性能分析:
采用准确率(Accuracy)、精确率(Precision)、召回率(Recall)和F1-score值四种指标系统地、定量地评估集成模型的分类性能,其计算公式为:
其中,TP代表真阳性,即高频高幅类样本被正确检测为高频高幅类样本;FP代表假阳性,即低频低幅样本类被错误检测为高频高幅类样本;TN代表真阴性,即低频低幅类样本被正确检测为低频低幅类样本;FN代表假阴性,即高频高幅类样本被错误检测为低频低幅类样本。
采用配对t检验验对相同脑电数据集经过不同方法的分类结果进行统计分析,t检验是用于检验小样本的两类平均值差异的统计方法,它通过t分布推断两类样本发生的概率,从而判定两类样本的均值是否有显著性差异,其主要公式如下:
设两类方法对同一组数据集进行分类的分类结果分别为总体T1和总体T2,T1~N(μ1,σ1),T2~N(μ2,σ2)。设(Z11,Z21),(Z12,Z22),…,(Z1n,Z2n)为配对样本,其差值di=Z1i-Z2i(i=1,2,…,n),假设两类总体没有显著性差异,即
H0:μ1-μ2=0
在H0假设条件成立的情况下,差值d的均值为零,构造t统计量:
其中S为样本差值的标准差,当μ1-μ2=0时,t统计量服从自由度为n-1的t分布,在给定H0假设条件下,将检验值μ1-μ2=0带入t统计量,计算得到检验统计量的观测值,之后根据t分布函数计算出概率值p,当检验统计量的概率值p小于显著性水平时,拒绝假设H0,判定两类样本数据具有显著性差异;反之则接受假设H0,判定两类样本没有显著性差异。
具体地,对自采数据集经过集成策略模型训练和分类后,12名被试的平均分类准确率为89.9%,对Stacking集成模型分类准确率与其他基分类器模型基分类器的分类准确率进行配对t检验,得到概率统计值p为:0.003(SVM),3×10-6(KNN),0.045(LR),8×10-4(LightGBM),2×10-5(RF),配对t检验结果表明Stacking集成模型的平均分类准确率显著优于所有基模型,较最优基模型提升2.51%(p=0.045),较最差基模型提升16.14%(p=3×10-6)。
步骤(六)在线应用:构建下肢运动想象脑机接口康复系统进行在线模式识别,在线模式识别与前述步骤(一)至步骤(五)不同的是,在线实验过程中信号采集、预处理、特征提取、模式识别和在线应用都是实时的。基于上述步骤,分别建立脑电信号采集系统、信号处理系统、指令传输系统和应用设备。如图1所示,首先按照实验范式采集实时被试下肢运动想象脑电信号,经前述预处理、特征提取算法处理后得到FBCSP特征矩阵,将特征矩阵输入步骤4中训练好的Stacking集成学习模型,即可得到预测标签值,将预测标签经过虚拟专用网络传输至多位姿康复机器人的上位机中驱动机器人动作,从而辅助被试进行康复训练。
具体地,本实施例招募三名被试按照实验范式进行在线实验,每名被试进行20次实验,左腿低频低幅运动和右腿高频高幅运动各10次,间次按顺序进行,最终在线实验的模式识别平均准确率为75%。如图3所示,被试2的在线模式识别准确率为80%,图3反映了Stacking集成模型的模式识别结果,当二者一致时表明预测正确,反之则预测错误。图4展示了下肢康复机器人进行运动时踝关节机构角度变化情况,其中蓝色实线表示康复机器人识别到正确的指令并作出相应的动作,红色实线表明预测标签错误,显然,所有膝关节的角度变化情况与实际预测的标签是保持一致的。
综上所述,本发明基于集成学习方法对运动想象脑机接口的进行模式识别和在线应用,本发明能够有效提升下肢运动想象脑电信号的分类精度,并且在在线应用中具有较高的鲁棒性,能够有效地获取区分不同运动想象任务的信息,为脑机接口在更广泛的领域应用提供了帮助。
本实施例的一个具体应用为:。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (10)
1.基于集成学习的运动想象脑机接口的模式识别方法,其特征在于,包括以下步骤:
1)获取脑电信号数据集:设计运动想象脑电实验范式,在伦理审查获得批准后,招募被试采集头皮脑电信号获取自采数据集;
2)进行预处理:对自采数据集和公开数据集进行滤波、独立分量分析方法去除电磁干扰和生理伪迹;
3)提取脑电信号特征:基于运动想象脑电信号的随机性、非线性特点,采用滤波组共空间模式方法在多个频带和全通道对运动想象脑电信号进行特征提取;
4)模型训练:采用Stacking算法作为集成策略构建预测模型,采用五种机器学习算法,即支持向量机、K近邻、逻辑回归、随机森林和轻量梯度提升树作为基模型,采用逻辑回归作为元模型;预测模型共两层,第一层为五种基模型,它们分别对脑电特征集进行分类预测,并输出预测标签;第二层为元模型,元模型把第一层的输出结果作为本层的输入特征再进行预测,得到最终分类结果;
5)性能分析:采用精确率、准确率、召回率和F1-score值四种指标系统地、定量地评估集成模型的分类性能;
6)在线应用:基于以上步骤,构建下肢运动想象脑机接口康复系统,将集成学习模型预测的结果传输至康复机器人的上位机中驱动机器人动作,从而辅助被试进行康复训练。
2.根据权利要求1所述的基于集成学习的运动想象脑机接口的模式识别方法,其特征在于,步骤1)中,获取脑电信号数据集过程:基于左腿膝关节和踝关节低频低幅联动,以及右腿膝关节和踝关节高频高幅联动的二分类运动想象脑电实验范式,并自主采集多名被试的样本数据作为自采数据集。
3.根据权利要求1所述的基于集成学习的运动想象脑机接口的模式识别方法,其特征在于,自主采集12名被试共1920条样本数据作为自采数据集,两类样本各占50%。
4.根据权利要求1所述的基于集成学习的运动想象脑机接口的模式识别方法,其特征在于,步骤2)中,进行预处理过程:对数据集中的原始脑电信号进行3-33Hz带通滤波、50Hz陷波和独立分量分析去除信号中的高频噪声、工频干扰和眼电生理伪迹。
5.根据权利要求1所述的基于集成学习的运动想象脑机接口的模式识别方法,其特征在于,步骤3)中,提取脑电信号特征过程:采用滤波组共空间模式进行特征提取,首先对多通道脑电信号进行分频处理,将4-36Hz的脑电信号划分为8个子带,带宽为4Hz,然后对不同子带进行共空间模式变换。
6.根据权利要求1所述的基于集成学习的运动想象脑机接口的模式识别方法,其特征在于,步骤4)中,模型训练的架构采用Stacking集成策略构建模型,将数据集划分训练集、测试集,并在第一层对一个基模型训练时,将训练集等分为验证集分别训练出五个模型,即利用五折交叉验证法对模型进行训练和预测。
7.根据权利要求1所述的基于集成学习的运动想象脑机接口的模式识别方法,其特征在于,步骤4)中,模型训练的第一层基模型及其参数选择为:
a.支持向量机:核函数选用径向基核函数,惩罚系数设定为0.8,参数gamma设定为1/EEGFeatures,其中EEGFeatures为运动想象脑电信号特征值维数,其他参数为默认值;
b.K近邻:K值设置为7,距离度量方式为欧式距离;
c.逻辑回归:逻辑回归算法的主要思想是寻找一个分类超平面将两类数据分开,该分类超平面的决策函数通过对样本特征进行线性加权后再利用sigimoid函数进行映射而得到,正则化项选择L2范式,即为参数向量中的每个参数的平方和的开方值,正则化系数设置为1;
e.轻量梯度提升树:该算法通过在损失函数中增加二阶导数项使得算法的收敛速度加快,并且使用直方图算法减少中间运算步骤和存储空间,学习率设置为0.1,迭代次数设置为100。
8.根据权利要求1所述的基于集成学习的运动想象脑机接口的模式识别方法,其特征在于,步骤4)中,模型训练的第二层元模型及其参数选择为:Stacking集成模型的第二层分类结构,需要对第一层基模型的预测结果进行二次分类,为避免过拟合问题,元模型采用算法比较简单的模型,选择逻辑回归作为元模型算法,参数选择与上述基模型一致。
9.根据权利要求1所述的基于集成学习的运动想象脑机接口的模式识别方法,其特征在于,步骤5)中,性能分析过程:采用准确率、精确率、召回率和F1-score值四种指标系统地、定量地评估集成模型的分类性能,其计算公式为:
其中,TP代表真阳性,即高频高幅类样本被正确检测为高频高幅类样本;FP代表假阳性,即低频低幅样本类被错误检测为高频高幅类样本;TN代表真阴性,即低频低幅类样本被正确检测为低频低幅类样本;FN代表假阴性,即高频高幅类样本被错误检测为低频低幅类样本;
采用配对t检验验对相同脑电数据集经过不同方法的分类结果进行统计分析,t检验是用于检验小样本的两类平均值差异的统计方法,它通过t分布推断两类样本发生的概率,从而判定两类样本的均值是否有显著性差异,其主要公式如下:
设两类方法对同一组数据集进行分类的分类结果分别为总体T1和总体T2,T1~N(μ1,σ1),T2~N(μ2,σ2);设(Z11,Z21),(Z12,Z22),…,(Z1n,Z2n)为配对样本,其差值di=Z1i-Z2i(i=1,2,…,n),假设两类总体没有显著性差异,即
H0:μ1-μ2=0
在H0假设条件成立的情况下,差值d的均值为零,构造t统计量:
其中S为样本差值的标准差,当μ1-μ2=0时,t统计量服从自由度为n-1的t分布,在给定H0假设条件下,将检验值μ1-μ2=0带入t统计量,计算得到检验统计量的观测值,之后根据t分布函数计算出概率值p,当检验统计量的概率值p小于显著性水平时,拒绝假设H0,判定两类样本数据具有显著性差异;反之则接受假设H0,判定两类样本没有显著性差异。
10.根据权利要求1所述的基于集成学习的运动想象脑机接口的模式识别方法,其特征在于,步骤6)中,在线应用过程:信号采集时联合Brain vision recorder软件和EEGLAB实时记录、读取被试运动想象脑电信号;将预测标签通过虚拟专用网络传输至多位姿下肢康复机器人的上位机,并采用膝关节角度变化曲线与预测标签进行比较。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310255013.2A CN116211320A (zh) | 2023-03-16 | 2023-03-16 | 基于集成学习的运动想象脑机接口的模式识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310255013.2A CN116211320A (zh) | 2023-03-16 | 2023-03-16 | 基于集成学习的运动想象脑机接口的模式识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116211320A true CN116211320A (zh) | 2023-06-06 |
Family
ID=86571214
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310255013.2A Pending CN116211320A (zh) | 2023-03-16 | 2023-03-16 | 基于集成学习的运动想象脑机接口的模式识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116211320A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117338313A (zh) * | 2023-09-15 | 2024-01-05 | 武汉纺织大学 | 基于堆叠集成技术的多维度特征脑电信号识别方法 |
CN117574329A (zh) * | 2024-01-15 | 2024-02-20 | 南京信息工程大学 | 基于集成学习的二氧化氮精细化空间分布方法 |
-
2023
- 2023-03-16 CN CN202310255013.2A patent/CN116211320A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117338313A (zh) * | 2023-09-15 | 2024-01-05 | 武汉纺织大学 | 基于堆叠集成技术的多维度特征脑电信号识别方法 |
CN117338313B (zh) * | 2023-09-15 | 2024-05-07 | 武汉纺织大学 | 基于堆叠集成技术的多维度特征脑电信号识别方法 |
CN117574329A (zh) * | 2024-01-15 | 2024-02-20 | 南京信息工程大学 | 基于集成学习的二氧化氮精细化空间分布方法 |
CN117574329B (zh) * | 2024-01-15 | 2024-04-30 | 南京信息工程大学 | 基于集成学习的二氧化氮精细化空间分布方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ay et al. | Automated depression detection using deep representation and sequence learning with EEG signals | |
Yildirim et al. | Automated detection of diabetic subject using pre-trained 2D-CNN models with frequency spectrum images extracted from heart rate signals | |
George et al. | Classification of epileptic EEG signals using PSO based artificial neural network and tunable-Q wavelet transform | |
Li et al. | Inter-patient arrhythmia classification with improved deep residual convolutional neural network | |
Hassan et al. | Fusion of multivariate EEG signals for schizophrenia detection using CNN and machine learning techniques | |
CN116211320A (zh) | 基于集成学习的运动想象脑机接口的模式识别方法 | |
Fang et al. | Dual-channel neural network for atrial fibrillation detection from a single lead ECG wave | |
Liu et al. | Classification of EEG signals for epileptic seizures using feature dimension reduction algorithm based on LPP | |
Yao et al. | Interpretation of electrocardiogram heartbeat by CNN and GRU | |
Sajjad et al. | An early diagnosis of brain tumor using fused transfer learning | |
CN113392733A (zh) | 基于标签对齐的多源域自适应跨被试eeg认知状态评估方法 | |
Prakash et al. | A system for automatic cardiac arrhythmia recognition using electrocardiogram signal | |
CN115081486A (zh) | 一种癫痫发作前期颅内脑电网络定位癫痫灶系统及方法 | |
Ji et al. | An intelligent diagnostic method of ECG signal based on Markov transition field and a ResNet | |
Muthumayil et al. | A big data analytical approach for prediction of cancer using modified k-nearest neighbour algorithm | |
Kuila et al. | ECG signal classification to detect heart arrhythmia using ELM and CNN | |
Karri et al. | A real-time cardiac arrhythmia classification using hybrid combination of delta modulation, 1D-CNN and blended LSTM | |
Liu et al. | Automated Machine Learning for Epileptic Seizure Detection Based on EEG Signals. | |
Harrane et al. | Classification of ECG heartbeats using deep neural networks | |
CN116595434A (zh) | 一种基于维度和分类算法的测谎方法 | |
CN116662782A (zh) | 一种基于MSFF-SENet的运动想象脑电图解码方法 | |
CN115530846A (zh) | 头皮脑电图棘波检测方法及系统 | |
Tran et al. | A predictive model for ECG signals collected from specialized IoT devices using deep learning | |
Fan et al. | Group feature learning and domain adversarial neural network for aMCI diagnosis system based on EEG | |
Lu et al. | A New Multichannel Parallel Network Framework for the Special Structure of Multilead ECG |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |