CN112001305A - 基于梯度提升决策树的特征优化ssvep异步识别方法 - Google Patents
基于梯度提升决策树的特征优化ssvep异步识别方法 Download PDFInfo
- Publication number
- CN112001305A CN112001305A CN202010852569.6A CN202010852569A CN112001305A CN 112001305 A CN112001305 A CN 112001305A CN 202010852569 A CN202010852569 A CN 202010852569A CN 112001305 A CN112001305 A CN 112001305A
- Authority
- CN
- China
- Prior art keywords
- decision tree
- model
- training
- gbdt
- loss function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Signal Processing (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
基于梯度提升决策树的特征优化SSVEP异步识别方法,先通过设计离线实验采集被试者的异步脑电原始数据,用滑移窗的形式截取脑电信号,形成原始时域数据集;然后对原始时域数据集用典型相关分析进行降维滤波处理,取特定频段的CCA系数作为训练数据集;然后训练GBDT模型,更新GBDT模型参数,同时根据特征重要度指标对初始特征进行优化,得到最终训练模型;最后用最终训练模型对新的脑电信号进行分类,判断是NC状态和IC状态;本发明利用梯度提升决策树对被试者的训练数据进行模型训练,并根据决策树方法的特征重要度进行特征优化选取,提高方法识别准确率,降低方法计算成本并且解决了被试者个性化差异问题。
Description
技术领域
本发明涉及生物医学工程中神经工程及脑-机接口技术领域,具体涉及一种基于梯度提升决策树的特征优化SSVEP异步识别方法。
背景技术
脑-机接口(Brain Computer Interface)技术是一种不依赖于正常的肌肉-神经通路的通讯技术,它提供了一条大脑与外部设备直接交互和通讯的途径,这些外部设备包括计算机、康复机器人、假肢、语音合成器等。稳态视觉诱发电位(SSVEP)是大脑枕区在接受视觉刺激后产生的周期性信号,与其他脑电接口形式如P300和运动想象相比,具有周期稳定、特征明显且不需要训练的特点,具有很好的实际运用价值。
脑机接口的控制模式有同步模式和异步模式之分。同步的脑控方法主要特征是使用者在预定的时间内,根据系统同步提示进行特定的意念控制任务,换言之计算机处理的每一段脑电信号都是控制意图状态(Intentional Control,IC)的信号,而不涉及到对空闲状态(No Control,NC)信号的处理。与同步模式不同,异步模式的运作过程中没有同步提示刺激,使用者具有自主思维的控制能力,脑控方法需要对IC状态和NC状态进行有效的区分。
现实生活中应用都具有异步控制模式的需求,然而目前大部分的脑控应用都采用同步控制模式,对异步控制的研究很少。现有的SSVEP异步识别方法存在以下缺点:识别时间长,识别准确率低,方法计算成本高,没有考虑到被试者的个性化差异问题。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种基于梯度提升决策树(Gradient Boosting Decision Tree,GBDT)的特征优化SSVEP异步识别方法,利用梯度提升决策树对被试者的训练数据进行模型训练,并基于决策树方法的特征重要度进行特征优化选取,识别时间短,提高识别准确率,降低方法计算成本且解决被试者个体化差异问题。
为了达到上述目的,本发明采取的技术方案是:
基于梯度提升决策树(GBDT)的特征优化SSVEP异步识别方法,包括以下步骤:
1)采集被试者的异步脑电信号EEG:设计离线实验,采集被试者异步脑电数据,异步脑电数据为IC状态的时域EEG信号和NC状态的时域EEG信号;采用滑移窗的形式,按照设定窗长和窗长滑移量进行EEG信号的截取,形成原始时域EEG数据集D:D={D1,D2,D3,…,DT},其中T为数据集的数量;
2)原始时域EEG数据预处理:采用典型相关分析CCA对原始时域EEG数据集进行降维滤波处理,生成EEG频域信息CCA系数谱;选取5Hz-15Hz,频率分辨率为0.1Hz的CCA系数作为初始特征以及每段IC状态和NC状态数据的标签L,得到GBDT的训练数据集S:S1={ρ1,ρ2,…,ρ101,L1},S2={ρ1,ρ2,…,ρ101,L2},…,ST={ρ1,ρ2,…,ρ101,LT},其中ρ为CCA系数,T为数据集的数量;
3)模型训练:根据GBDT的训练数据集S={S1,S2,…,ST},训练梯度提升决策树GBDT模型,更新决策树GBDT模型的参数,最终获取最优参数;
4)特征优化:根据决策树GBDT的特征重要度指标对初始特征进行优化,得到最终的GBDT训练模型;
5)信号分类:使用GBDT训练模型对新的脑电信号进行分类,输出的分类结果为标签L;如果分类结果为IC状态,再通过比较步骤2中的CCA系数大小,取最大CCA系数对应的刺激范式频率,确定子控制意图状态IC1、IC2、IC3、...。
所述的步骤3)中梯度提升决策树的方法是一种以CART回归树为基函数,用梯度下降法近似损失函数残差的Boosting算法,其原理如下:
梯度提升决策树的模型F(x;w)本质上是个加法模型:
其中x为输入样本,w是分类回归树的参数,T为生成的CART回归树数量,α为每个树的权重,h为分类回归树;每一轮树的学习目的都是为了拟合上一轮学习结果的残差;
算法的目标是最小化损失函数L来求解最优模型F*:
其中y是目标值,损失函数L是平方损失函数、指数损失函数、绝对损失函数或Huber损失函数;采用平方损失函数,残差rim的公式为:
其实质为泰勒公式展开的一阶导项。
本发明的有益效果为:
(1)本发明具有高的识别准确率和低的识别时间。
(2)本发明基于被试的训练数据训练模型,有效解决了个体差异性的问题。
(3)本发明采用特征优化的方案,有效地降低了计算成本,提高了方法的运算效率。
附图说明
图1是本发明方法流程图。
图2是本发明实施例的离线实验设计界面。
图3是本发明实施例的脑电信号采集电极安放位置图。
图4是本发明实施例离线实验流程以及脑电信号截取示意图。
图5是本发明初始特征选取示意图。
图6是本发明训练模型部分的流程图。
具体实施方式
以下结合附图对本发明进一步的详细说明。
如图1所示,基于梯度提升决策树的特征优化SSVEP异步识别方法,包括以下内容:
1)采集被试者的异步脑电信号(EEG):设计离线实验,界面如图2所示4个刺激单元呈现在屏幕上,以左右上下的顺序依次为8Hz、8.6Hz、9.2Hz以及10Hz的运动频率,分别对应子控制意图状态IC1、IC2、IC3和IC4;屏幕中有5个标签进行标记:Left、Right、Up、Down分别对应4个刺激范式,中间的IDLE标签对应灰色背景区域;采集过程中,被试者按照绿色标签的提示依次注视左右上下的刺激目标,每个刺激目标持续注视7s,在每两个目标注视的过程中存在一个7s的空闲,即NC状态,被试者要求在该过程中注视中间的绿色标签,表示处于空闲NC状态;如图3所示,按照国际标准导联10-20系统,通过脑电帽将脑电信号测量电极安放到使用者头部视觉枕区PO3、POz、PO4、O1、Oz和O2位置,在前额的Fpz位置安放地电极,在任一耳垂位置A1或A2安放参考电极,采集离线实验中的脑电信号;如图4所示,采用滑移窗的形式,按照设定窗长2s和窗长滑移量0.5s进行EEG信号的截取,形成原始时域EEG数据集D,D={D1,D2,D3,…,DT},其中T为数据集的数量;
2)原始时域EEG数据预处理:采用典型相关分析(CCA)对原始时域EEG数据集进行降维滤波处理,生成EEG频域信息CCA系数谱;如图5所示,选取5Hz-15Hz间隔0.1Hz的CCA系数作为初始特征以及每段数据的标签L(IC状态和NC状态),得到GBDT的训练数据集S1={ρ1,ρ2,…,ρ101,L1},S2={ρ1,ρ2,…,ρ101,L2},…,ST={ρ1,ρ2,…,ρ101,LT},其中ρ为CCA系数,T为数据集的数量;
3)模型训练:如图6所示,把GBDT的训练数据集S={S1,S2,…,ST}分为训练数据和测试数据;首先初始化参数,然后在训练数据的基础上用5折交叉验证的方式训练模型,接着用测试数据评估模型泛化能力,最终获取最优参数;
4)特征优化:根据决策树GBDT的特征重要度指标对初始特征进行优化,得到最终的GBDT训练模型;
计算每个特征的重要度Pi公式如下:
其中Si表示该特征在所有决策树中被当成内部节点(InternalNode)的次数,分母表示所有内部节点的总和,其含义为一个特征被当成内部节点次数所占比越大表明其重要度越高;
其特征优化的步骤为:
4.1)计算每一个特征的重要度P,并对m个特征按照重要度从大到小排序;
4.2)遍历排序后每一个重要度值Pi,并将其设定阈值,对重要度大于Pi值的特征进行组合;按照新的特征组合重新训练并计算其正确率;
4.3)权衡特征数和正确率,选择最优特征组合,
5)信号分类:使用GBDT训练模型对新的脑电信号进行分类,输出的分类结果为标签L,分为IC状态和NC状态;如果分类结果为IC(控制意图)状态,再通过比较步骤2中的CCA系数大小,取最大CCA系数对应的刺激范式频率,确定子控制意图状态IC1、IC2、IC3、IC4等。
所述的步骤3)中梯度提升决策树的方法是一种以CART回归树为基函数,用梯度下降法近似损失函数残差的Boosting算法,其原理如下:
梯度提升决策树的模型F(x;w)本质上是个加法模型:
其中x为输入样本,w是分类回归树的参数,T为生成的CART回归树数量,α为每个树的权重,h为分类回归树;每一轮树的学习目的都是为了拟合上一轮学习结果的残差;
算法的目标是最小化损失函数L来求解最优模型F*:
其中y是目标值,损失函数L可以是平方损失函数、指数损失函数、绝对损失函数或Huber损失函数;这里用的是平方损失函数,残差rim的公式为:
其实质为泰勒公式展开的一阶导项。
Claims (2)
1.基于梯度提升决策树的特征优化SSVEP异步识别方法,其特征在于,包括以下步骤:
1)采集被试者的异步脑电信号EEG:设计离线实验,采集被试者异步脑电数据,异步脑电数据为IC状态的时域EEG信号和NC状态的时域EEG信号;采用滑移窗的形式,按照设定窗长和窗长滑移量进行EEG信号的截取,形成原始时域EEG数据集D:D={D1,D2,D3,…,DT},其中T为数据集的数量;
2)原始时域EEG数据预处理:采用典型相关分析CCA对原始时域EEG数据集进行降维滤波处理,生成EEG频域信息CCA系数谱;选取5Hz-15Hz,频率分辨率为0.1Hz的CCA系数作为初始特征以及每段IC状态和NC状态数据的标签L,得到GBDT的训练数据集:S1={ρ1,ρ2,…,ρ101,L1},S2={ρ1,ρ2,…,ρ101,L2},…,ST={ρ1,ρ2,…,ρ101,LT},其中ρ为CCA系数;
3)模型训练:根据GBDT的训练数据集S={S1,S2,…,ST},训练梯度提升决策树GBDT模型,更新决策树GBDT模型的参数,最终获取最优参数;
4)特征优化:根据决策树GBDT的特征重要度指标对初始特征进行优化,得到最终的GBDT训练模型;
5)信号分类:使用GBDT训练模型对新的脑电信号进行分类,输出的分类结果为标签L;如果分类结果为IC状态,再通过比较步骤2中的CCA系数大小,取最大CCA系数对应的刺激范式频率,确定子控制意图状态IC1、IC2、IC3、...。
2.根据权利要求1所述的基于梯度提升决策树的特征优化SSVEP异步识别方法,其特征在于:所述的步骤3)中梯度提升决策树的方法是一种以CART回归树为基函数,用梯度下降法近似损失函数残差的Boosting算法,其原理如下:
梯度提升决策树的模型F(x;w)本质上是个加法模型:
其中x为输入样本,w是分类回归树的参数,T为生成的CART回归树数量,α为每个树的权重,h为分类回归树;每一轮树的学习目的都是为了拟合上一轮学习结果的残差;
算法的目标是最小化损失函数L来求解最优模型F*:
其中y是目标值,损失函数L是平方损失函数、指数损失函数、绝对损失函数或Huber损失函数;采用平方损失函数,残差rim的公式为:
其实质为泰勒公式展开的一阶导项。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010852569.6A CN112001305B (zh) | 2020-08-21 | 2020-08-21 | 基于梯度提升决策树的特征优化ssvep异步识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010852569.6A CN112001305B (zh) | 2020-08-21 | 2020-08-21 | 基于梯度提升决策树的特征优化ssvep异步识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112001305A true CN112001305A (zh) | 2020-11-27 |
CN112001305B CN112001305B (zh) | 2022-08-05 |
Family
ID=73473180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010852569.6A Active CN112001305B (zh) | 2020-08-21 | 2020-08-21 | 基于梯度提升决策树的特征优化ssvep异步识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112001305B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113360788A (zh) * | 2021-05-07 | 2021-09-07 | 深圳依时货拉拉科技有限公司 | 一种地址推荐方法、装置、设备及存储介质 |
CN113919387A (zh) * | 2021-08-18 | 2022-01-11 | 东北林业大学 | 基于gbdt-lr模型的脑电信号情感识别 |
CN117752345A (zh) * | 2024-02-22 | 2024-03-26 | 南京信息工程大学 | 基于脑电信号的人体兴奋程度评估方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102789441A (zh) * | 2012-08-09 | 2012-11-21 | 上海海事大学 | 基于稳态诱发电位的异步脑机接口系统及其实现方法 |
US20150269336A1 (en) * | 2014-03-24 | 2015-09-24 | Beijing University Of Technology | method for selecting features of EEG signals based on decision tree |
CN109582131A (zh) * | 2018-10-29 | 2019-04-05 | 中国航天员科研训练中心 | 一种异步混合脑机接口方法及系统 |
US20190247662A1 (en) * | 2017-12-04 | 2019-08-15 | Neuroenhancement Lab, LLC | Method and apparatus for neuroenhancement to facilitate learning and performance |
CN110245802A (zh) * | 2019-06-20 | 2019-09-17 | 杭州安脉盛智能技术有限公司 | 基于改进梯度提升决策树的卷烟空头率预测方法及系统 |
CN110309771A (zh) * | 2019-06-28 | 2019-10-08 | 南京丰厚电子有限公司 | 一种基于gbdt-insgaii的eas声磁系统标签识别算法 |
CN111310860A (zh) * | 2020-03-26 | 2020-06-19 | 清华大学深圳国际研究生院 | 改进梯度提升决策树性能的方法及计算机可读存储介质 |
CN111507768A (zh) * | 2020-04-17 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 一种潜在用户的确定方法、模型训练的方法及相关装置 |
-
2020
- 2020-08-21 CN CN202010852569.6A patent/CN112001305B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102789441A (zh) * | 2012-08-09 | 2012-11-21 | 上海海事大学 | 基于稳态诱发电位的异步脑机接口系统及其实现方法 |
US20150269336A1 (en) * | 2014-03-24 | 2015-09-24 | Beijing University Of Technology | method for selecting features of EEG signals based on decision tree |
US20190247662A1 (en) * | 2017-12-04 | 2019-08-15 | Neuroenhancement Lab, LLC | Method and apparatus for neuroenhancement to facilitate learning and performance |
CN109582131A (zh) * | 2018-10-29 | 2019-04-05 | 中国航天员科研训练中心 | 一种异步混合脑机接口方法及系统 |
CN110245802A (zh) * | 2019-06-20 | 2019-09-17 | 杭州安脉盛智能技术有限公司 | 基于改进梯度提升决策树的卷烟空头率预测方法及系统 |
CN110309771A (zh) * | 2019-06-28 | 2019-10-08 | 南京丰厚电子有限公司 | 一种基于gbdt-insgaii的eas声磁系统标签识别算法 |
CN111310860A (zh) * | 2020-03-26 | 2020-06-19 | 清华大学深圳国际研究生院 | 改进梯度提升决策树性能的方法及计算机可读存储介质 |
CN111507768A (zh) * | 2020-04-17 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 一种潜在用户的确定方法、模型训练的方法及相关装置 |
Non-Patent Citations (3)
Title |
---|
QIANQIAN LIU ET AL: "Efficient representations of EEG signals for SSVEP frequency recognition based on deep multiset CCA", 《NEUROCOMPUTING》 * |
马乐乐等: "一种基于梯度提升树的肌电信号最优通道选择方法", 《信息与控制》 * |
鲁湘涌: "基于混合式脑机接口的信号处理及应用研究", 《中国优秀博硕士学位论文全文数据库(硕士) 基础科学辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113360788A (zh) * | 2021-05-07 | 2021-09-07 | 深圳依时货拉拉科技有限公司 | 一种地址推荐方法、装置、设备及存储介质 |
CN113919387A (zh) * | 2021-08-18 | 2022-01-11 | 东北林业大学 | 基于gbdt-lr模型的脑电信号情感识别 |
CN117752345A (zh) * | 2024-02-22 | 2024-03-26 | 南京信息工程大学 | 基于脑电信号的人体兴奋程度评估方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112001305B (zh) | 2022-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112001305B (zh) | 基于梯度提升决策树的特征优化ssvep异步识别方法 | |
CN108304917B (zh) | 一种基于lstm网络的p300信号检测方法 | |
CN107844755B (zh) | 一种结合dae和cnn的脑电信号特征提取与分类方法 | |
CN114052735B (zh) | 一种基于深度领域自适应的脑电情绪识别方法及系统 | |
Coyle et al. | A time-series prediction approach for feature extraction in a brain-computer interface | |
CN109299751B (zh) | 基于emd数据增强的卷积神经模型的ssvep脑电分类方法 | |
CN112244873A (zh) | 一种基于混合神经网络的脑电时空特征学习与情感分类方法 | |
CN114533086B (zh) | 一种基于空域特征时频变换的运动想象脑电解码方法 | |
CN110399846A (zh) | 一种基于多通道肌电信号相关性的手势识别方法 | |
CN110135244B (zh) | 一种基于脑-机协同智能的表情识别方法 | |
CN113011330B (zh) | 一种基于多尺度神经网络和空洞卷积的脑电信号分类方法 | |
CN113128353B (zh) | 面向自然人机交互的情绪感知方法及其系统 | |
CN109726662A (zh) | 基于卷积和循环组合神经网络的多类别人体姿态识别方法 | |
CN114305452B (zh) | 一种基于脑电和领域适配的跨任务认知负荷识别方法 | |
CN112932501B (zh) | 一种基于一维卷积神经网络自动识别失眠方法 | |
CN113069117A (zh) | 一种基于时间卷积神经网络的脑电情绪识别方法及系统 | |
CN111012340A (zh) | 一种基于多层感知机的情绪分类方法 | |
CN113558644A (zh) | 一种3d矩阵与多维卷积网络的情感分类方法、介质和设备 | |
CN114595725B (zh) | 一种基于加法网络和监督对比学习的脑电信号分类方法 | |
CN109009098A (zh) | 一种运动想象状态下的脑电信号特征识别方法 | |
Lv et al. | Cognitive computing for brain–computer interface-based computational social digital twins systems | |
CN115273236A (zh) | 一种多模态的人体步态情感识别方法 | |
Peng et al. | Epileptic seizure prediction in scalp EEG using an improved HIVE-COTE model | |
CN114129163A (zh) | 基于脑电信号的多视图深度学习的情绪分析方法和系统 | |
CN107174203B (zh) | 一种脑电信号的识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |