CN111008590B - 基于多维特征提取无监督eeg信号分类方法 - Google Patents
基于多维特征提取无监督eeg信号分类方法 Download PDFInfo
- Publication number
- CN111008590B CN111008590B CN201911218482.7A CN201911218482A CN111008590B CN 111008590 B CN111008590 B CN 111008590B CN 201911218482 A CN201911218482 A CN 201911218482A CN 111008590 B CN111008590 B CN 111008590B
- Authority
- CN
- China
- Prior art keywords
- data
- algorithm
- dimension
- eeg signal
- classifying
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000000605 extraction Methods 0.000 title claims abstract description 9
- 230000009467 reduction Effects 0.000 claims abstract description 21
- 230000000694 effects Effects 0.000 claims abstract description 17
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 16
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 238000001228 spectrum Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 230000004424 eye movement Effects 0.000 claims description 3
- 238000005065 mining Methods 0.000 claims description 3
- 230000003183 myoelectrical effect Effects 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims 1
- 230000035945 sensitivity Effects 0.000 abstract description 8
- 238000004364 calculation method Methods 0.000 abstract description 6
- 238000001514 detection method Methods 0.000 abstract description 4
- 238000013144 data compression Methods 0.000 abstract description 3
- 230000001105 regulatory effect Effects 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 7
- 238000013145 classification model Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于多维特征提取无监督EEG信号分类方法,包括:步骤1,基于脑电采集设备采集EEG信号;步骤2,对采集到的EEG信号进行预处理;步骤3,进行数据维度判定,若当数据维度过大,分类类数比较小,先使用降维算法,进行数据压缩,然后基于聚类算法进行分类;若数据维度不多,且最终分出的类别较多,采用数据分解算法,将数据进行扩充,再进行无监督分类。本发明不依赖于硬件设备的灵敏度,对采集信号的质量要求低;允许可控范围的延时效果,对时间的灵敏度要求不算高。计算速度快,相比于传统的监督学习模型,收敛可控。阈值自己可以人工注入,检测需求可以根据适用的实际环境进行调控。
Description
技术领域
本发明属于EEG信号分类技术领域,具体涉及一种基于多维特征提取无监督EEG信号分类方法。
背景技术
目前EEG信号多用于有监督的特征学习,但是由于生理信号取样困难,而且EEG信号取样时间要求十分严格,样本中误差较大且存在大量冗余数据。在监督学习过程中,一旦误差较大的样本被作为验证集数据计算损失函数,效果误差十分严重,生成模型将没有任何意义。
发明内容
本发明的目的是提一种基于多维特征提取无监督EEG信号分类方法,以减少EEG信息的冗余,并便于利用EEG信号的内在连续性属性,更好的提高分类的正确率。
本发明提供了一种基于多维特征提取无监督EEG信号分类方法,包括:
步骤1,基于脑电采集设备采集EEG信号;
步骤2,对采集到的EEG信号进行预处理;
步骤3,进行数据维度判定,若当数据维度过大,分类类数比较小,先使用降维算法,进行数据压缩,然后基于聚类算法进行分类;若数据维度不多,且最终分出的类别较多,采用数据分解算法,将数据进行扩充,再进行无监督分类。
进一步地,所述步骤1包括:
采用脑电采集设备,采集64个点位的脑电信号,采样频率为1 000Hz,电极阻抗要求均控制在50kΩ以下。
进一步地,所述步骤2包括:
将EEG信号通过0.5~40Hz的带通滤波器;去除伪迹和噪声,伪迹包括眼动伪迹、肌电伪迹、心电伪迹,噪声为50HZ工频干扰;进行基线校正;将EEG信号截取成非重叠的若干段,进行滤波,按照频谱提取alpha(8-13Hz)、beta(13-30Hz)、theta(4-7Hz)。
进一步地,所述步骤3包括:
根据分类需求进行预分类处理,基于分类效果建模,进行预判断,并基于该分类效果,进行特征挖掘,若数据分的开,有部分冗余,进行降维处理,以使聚类效果更加明显。
进一步地,所述步骤3还包括:
基于小波分解算法分解EEG信号,提取高频和低频信息量;
基于EMD本征模态分解提取EEG信号的多层边缘信息。
进一步地,步骤3中所述聚类算法采用SOM神经网络聚类算法。
与现有技术相比本发明的有益效果是:
分类模型不依赖于硬件设备的灵敏度,对采集信号的质量要求低;允许可控范围的延时效果,对时间的灵敏度要求不算高。计算速度快,相比于传统的监督学习模型,收敛可控。阈值自己可以人工注入,检测需求可以根据适用的实际环境进行调控。
附图说明
图1是本发明基于多维特征提取无监督EEG信号分类方法的流程图;
图2是本发明数据预处理流程图。
图3为本发明使用的两种类型的降维算法流程图。
具体实施方式
下面结合附图所示的各实施方式对本发明进行详细说明,但应当说明的是,这些实施方式并非对本发明的限制,本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替代,均属于本发明的保护范围之内。
参图1所示,无监督EEG信号分类模型,首先要采集大量EEG信号,进行预处理,当数据维度过于大,分类类数比较小,可以使用先降维的方法,进行数据压缩,然后再进行分类,当数据维度并不多,且最终分出的类别较多,可采用数据分解,可以将数据进行扩充,最后再进行无监督分类。分类模型不依赖于硬件设备的灵敏度,对采集信号的质量要求低;允许可控范围的延时效果,对时间的灵敏度要求不算高。计算速度快,相比于传统的监督学习模型,收敛可控。阈值自己可以人工注入,检测需求可以根据适用的实际环境进行调控,例如,设备故障检测上可以将灵敏度调大,有类似反应可以作为反馈信号,医学上运用可以将灵敏度调小,有明显的信号才可以作为一个正确分类效果。
具体包括:
1、多通道EEG数据采集
采用Neuroscan的脑电采集设备,采集64个点位的脑电信号,采样频率为1 000Hz,电极阻抗要求均控制在50kΩ以下。实验在安静环境内进行,实验室的温度控制在(23±2)℃,采集时要求手机关机,避免电磁干扰。
测试者头戴采集设备,打开软件,进行数据采集。同时记录下测试者的心理状态。
将标签和EEG数据保存在同一个文件夹下,文件名要相互关联。
2、数据预处理
参图2所示,将所采集数据进行预处理。首先将EEG信号通过0.5~40Hz的带通滤波器;其次去除干扰也就是各种伪迹和噪声,伪迹主要包括眼动伪迹、肌电伪迹、心电伪迹,噪声主要是50HZ工频干扰;之后再进行基线校正;然后将EEG信号截取成非重叠的若干段,最后进行滤波,按照频谱提取alpha(8-13Hz)、beta(13-30Hz)、theta(4-7Hz)。
3、数据维度判定
根据分类需求,首先进行预分类处理,针对分类效果,进行建模,进行一个预判断,针对该分类效果,进行特征挖掘;倘若数据分的开,有部分冗余,可进行降维处理,使得聚类效果更加明显。
4、降维算法
所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。降维的本质是学习一个映射函数f:x->y,其中x是原始数据点的表达,目前最多使用向量表达形式。y是数据点映射后的低维向量表达,通常y的维度小于x的维度(当然提高维度也是可以的)。f可能是显式的或隐式的、线性的或非线性的。
目前大部分降维算法处理向量表达的数据,也有一些降维算法处理高阶张量表达的数据。之所以使用降维后的数据表示是因为在原始的高维空间中,包含有冗余信息以及噪音信息,在实际应用例如图像识别中造成了误差,降低了准确率;而通过降维,可以减少冗余信息所造成的误差,提高识别(或其他应用)的精度,并通过降维算法寻找数据内部的本质结构特征。
降维算法分为线性降维和非线性降维,本实施使用的两种类型的降维算法如图3所示。
5、分解算法
分解算法主要增加数据信息量,从而增加数据维度,便于在聚类过程中产生更好的聚类效果。将小波分解用于EEG分解,提取高频和低频信息量,通过EMD本征模态分解提取EEG信号的多层边缘信息。
6、聚类算法
将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。在许多应用中,一个簇中的数据对象可以被作为一个整体来对待。
聚类是一种机器学习技术,它涉及到数据点的分组。给定一组数据点,本实施例使用聚类算法将每个数据点划分为一个特定的组。理论上,同一组中的数据点应该具有相似的属性和/或特征,而不同组中的数据点应该具有高度不同的属性和/或特征。聚类是一种无监督学习的方法。
K-means算法是一种最基本的基于距离的划分的聚类算法。K-means算法在对所给数据集进行聚类时,采用的是“非此即彼”的硬聚类方式。
FCM算法是一种基于划分的模糊聚类算法。该算法是采用隶属度来确定每个数据点属于某个聚类程度的一种方法。相比于K-means算法,FCM则是一种柔性的模糊划分法。
Canopy算法是不需要事先指定聚类数目的粗聚类方法。在对聚类的精度要求相对较低,速度要求相对较高的情况下,可直接采用Canopy聚类算法直接对数据样本进行处理。或者有精度要求的情况下,可以用它来作为K-means或FCM聚类算法的预处理步骤,先得到K值,再进行精确的聚类。所以Canopy算法具有很高的实际应用价值。
层次聚类算法是将所有的数据集自底向上合并成一棵树或自顶向下分裂成一棵树的过程,这两种方式分别称为凝聚和分裂。对凝聚层次聚类算法,在初始阶段,将每个样本点分别当作其类簇,然后合并这些原子类簇直到达到预期的类簇数或者其他终止条件;而对于分裂层次的聚类算法,在初始阶段,将所有的样本点当作同一类簇,然后分裂这个大类簇直至达到预期的类簇数或者其他终止条件。
LDA文本聚类算法基于LDA主题模型。LDA主题模型是一种概率生成模型。LDA主题模型是一个生成性的三层贝叶斯网络,将词和文章通过潜在主题相关联。与许多其他的概率模型类似,LDA中也做了词袋假设,即在模型中不考虑特征词的顺序,只考虑它们的出现次数。
DBSCAN算法是一种基于密度的空间聚类算法。该算法要求聚类空间中的一定区域内所包含对象(点或其他空间对象)的数目不小于某一给定领域密当改变聚类的数目时,不需要再次计算数据点的归属。度阈值,即将具有足够密度的区域划分为簇,并在具有噪声的空间数据库中发现任意形状的簇,它将簇定义为密度相连点的最大集合。
EM算法是在EM算法容易陷入局部最优解;概率模型中寻找参数最大似然估计的方法。其中概率模型依赖于无法观测的隐藏变量。
本发明具有如下技术效果:
1.排除干扰能力强。可以排除掉采集的电磁噪声污染。
2.计算速度快,效率较高。基于聚类算法,由于其速度与数据对象的个数无关,而只依赖于数据空间中每个维上单元的个数,所以计算速度较快,而且对硬件设备要求不会太高。
3.提取有用信息效率高。数据降维,直观地好处是维度降低了,便于计算和可视化,其更深层次的意义在于有效信息的提取综合及无用信息的摈弃。
4.可以挖掘出新的特征因素。分解算法,不同属性的小波分解,还有本征模态分解。都可以较强发掘隐含的信息量。
5.SOM神经网络聚类,是针对EEG信号专门的聚类算法。SOM神经网络其本质是由输入层以及输出层这两层神经元网络组合构成的,SOM神经网络的神经元的节点全部都在一个层面上,并且呈现出一种规则的排列。在一些EEG聚类方面去有一些显著效果。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
Claims (1)
1.一种基于多维特征提取无监督EEG信号分类方法,其特征在于,包括:
步骤1,基于脑电采集设备采集EEG信号,包括:采用脑电采集设备,采集64个点位的脑电信号,采样频率为1 000Hz,电极阻抗要求均控制在50kΩ以下;
步骤2,对采集到的EEG信号进行预处理,包括:将EEG信号通过0.5~40Hz的带通滤波器;去除伪迹和噪声,伪迹包括眼动伪迹、肌电伪迹、心电伪迹,噪声为50HZ工频干扰;进行基线校正;将EEG信号截取成非重叠的若干段,进行滤波,按照频谱提取alpha的频段是8-13Hz、beta的频段是13-30Hz、theta的频段是4-7Hz;
步骤3,进行数据维度判定,若数据维度过大,分类类数比较小,先使用降维算法,进行数据压缩,然后基于聚类算法进行分类,所述聚类算法采用SOM神经网络聚类算法;若数据维度不多,且最终分出的类别较多,采用数据分解算法,将数据进行扩充,再进行无监督分类,包括:
根据分类需求进行预分类处理,基于分类效果建模,进行预判断,并基于该分类效果,进行特征挖掘,若数据分得开,有部分冗余,进行降维处理,以使聚类效果更加明显;
基于小波分解算法分解EEG信号,提取高频和低频信息量;
基于EMD本征模态分解提取EEG信号的多层边缘信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911218482.7A CN111008590B (zh) | 2019-12-03 | 2019-12-03 | 基于多维特征提取无监督eeg信号分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911218482.7A CN111008590B (zh) | 2019-12-03 | 2019-12-03 | 基于多维特征提取无监督eeg信号分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111008590A CN111008590A (zh) | 2020-04-14 |
CN111008590B true CN111008590B (zh) | 2023-10-31 |
Family
ID=70113727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911218482.7A Active CN111008590B (zh) | 2019-12-03 | 2019-12-03 | 基于多维特征提取无监督eeg信号分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111008590B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113159222A (zh) * | 2021-05-17 | 2021-07-23 | 西交利物浦大学 | 脑电信号分类方法、装置及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104035563A (zh) * | 2014-06-19 | 2014-09-10 | 北京工业大学 | 基于w-pca和无监督ghsom的脑电信号识别方法 |
CN106503733A (zh) * | 2016-10-13 | 2017-03-15 | 杭州电子科技大学 | 基于na‑memd和gmm聚类的有用信号识别方法 |
CN110013248A (zh) * | 2018-01-08 | 2019-07-16 | 上海交通大学 | 脑电张量模式识别技术与脑机交互康复系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IN2013MU03025A (zh) * | 2013-09-19 | 2015-07-03 | Tata Consultancy Services Ltd |
-
2019
- 2019-12-03 CN CN201911218482.7A patent/CN111008590B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104035563A (zh) * | 2014-06-19 | 2014-09-10 | 北京工业大学 | 基于w-pca和无监督ghsom的脑电信号识别方法 |
CN106503733A (zh) * | 2016-10-13 | 2017-03-15 | 杭州电子科技大学 | 基于na‑memd和gmm聚类的有用信号识别方法 |
CN110013248A (zh) * | 2018-01-08 | 2019-07-16 | 上海交通大学 | 脑电张量模式识别技术与脑机交互康复系统 |
Non-Patent Citations (1)
Title |
---|
刘纪红 等.一种基于FPGA的脑电分类算法实现.现代电子技术.2012,第35卷(第20期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111008590A (zh) | 2020-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Song et al. | Adapting fisher vectors for histopathology image classification | |
Chaovalit et al. | Discrete wavelet transform-based time series analysis and mining | |
Guo et al. | Automatic feature extraction using genetic programming: An application to epileptic EEG classification | |
CN112949533B (zh) | 一种基于相对小波包熵脑网络和改进版lasso的运动想象脑电识别方法 | |
CN114224360B (zh) | 一种基于改进emd-ica的eeg信号处理方法、设备及存储介质 | |
CN106709469A (zh) | 基于脑电和肌电多特征的自动睡眠分期方法 | |
CN113191225B (zh) | 一种基于图注意力网络的情绪脑电识别方法及系统 | |
Al-Salman et al. | Detection of EEG K-complexes using fractal dimension of time frequency images technique coupled with undirected graph features | |
CN109598222B (zh) | 基于eemd数据增强的小波神经网络运动想象脑电分类方法 | |
CN107411739A (zh) | 基于双树复小波的脑电信号情绪识别特征提取方法 | |
CN104573630A (zh) | 基于双支持向量机概率输出的多类脑电模式在线识别方法 | |
CN108567418A (zh) | 一种基于PCANet的脉搏信号亚健康检测方法及检测系统 | |
CN110399846A (zh) | 一种基于多通道肌电信号相关性的手势识别方法 | |
CN113558644B (zh) | 一种3d矩阵与多维卷积网络的情感分类方法、介质和设备 | |
CN115221969A (zh) | 基于emd数据增强和并行scn的运动想象脑电信号识别方法 | |
CN111310656A (zh) | 基于多线性主成分分析的单次运动想象脑电信号识别方法 | |
Al-Salman et al. | An efficient approach for EEG sleep spindles detection based on fractal dimension coupled with time frequency image | |
Fernández-Blanco et al. | Classification of signals by means of genetic programming | |
Asghar et al. | Semi-skipping layered gated unit and efficient network: hybrid deep feature selection method for edge computing in EEG-based emotion classification | |
CN111008590B (zh) | 基于多维特征提取无监督eeg信号分类方法 | |
CN116211319A (zh) | 一种基于图注意力网络和稀疏编码的静息态多通道脑电信号识别方法 | |
CN114676720A (zh) | 基于图神经网络的心理状态识别方法及系统 | |
Wang et al. | Improved brain–computer interface signal recognition algorithm based on few-channel motor imagery | |
Wu et al. | EEG signal processing based on multivariate empirical mode decomposition and common spatial pattern hybrid algorithm | |
CN113780134A (zh) | 一种基于ShuffleNetV2网络的运动想象脑电解码方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |