CN111428580A - 基于深度学习的个体信号识别算法及系统 - Google Patents
基于深度学习的个体信号识别算法及系统 Download PDFInfo
- Publication number
- CN111428580A CN111428580A CN202010143701.6A CN202010143701A CN111428580A CN 111428580 A CN111428580 A CN 111428580A CN 202010143701 A CN202010143701 A CN 202010143701A CN 111428580 A CN111428580 A CN 111428580A
- Authority
- CN
- China
- Prior art keywords
- channel
- data
- signal
- layer
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及信号识别技术领域,具体的说是一种基于深度学习的个体信号识别算法及系统,其特征在于设有多通道数据采集单元、数据预处理单元、通道选择单元、CNN‑HMM混合分类器搭建训练单元、结果判别单元,其中所述多通道数据采集单元所获取的同一测试者在多个测试条件下产生的多个类型原始数据以多通道形式输出至数据预处理单元;所述数据预处理单元将预处理后的数据以多通道形式输出至通道选择单元,本发明解决了传统算法设计方案过程中对信号采集通道个数的限制,发明了一种自适应信号通道的算法,通过前期简易算法设计,筛选具体通道信号,既避免了传入模型信息的繁杂,简化了模型结构,又充分利用了有效的信号资源。
Description
技术领域:
本发明涉及信号识别技术领域,具体的说是一种能够自适应信号通道,通过筛选具体通道信号,既简化了模型结构,又充分利用了有效的信号资源的基于深度学习的个体信号识别算法及系统。
背景技术:
随着社会的发展、科技水平的提升,各行各业都在充分利用大量的数据信息,革新智能化产品,以提升人们生活幸福感。
人工智能技术利用现有的仪器采集序列信号,对其进行自动分析和诊断。有效的机器学习方法,如支持向量机、多层感知机、决策树、随机森林、梯度提升树等等,都能够对信号进行分类判别,这些方法在建模前,都要进行信号的预处理,从信号中提取人工特征(具体有小波包分析、功率谱估计、能量熵、梅尔功率谱、傅里叶分析等等),用于实现最终的分类任务。
这些人工提取的信号特征能够展现信号某方面的形态,但却很难利用信号序列的全部特征信息,对于特定的分类任务,人工提取的特征可能不能满足机器智能学习此分类任务的需求。在处理信号分类的问题上,自动的特征提取和代表性方法被证实更加具有可扩展性,且能够做到更加精准的预测,从原始信号序列出发,充分利用信号的全部信息,构建端到端的深度学习框架,它能够允许机器学习最适合其所需特定分类任务的特征。
在研究信号识别算法领域里,基于机器学习与深度学习分类器的算法有很多,通过设计网络结构及分类器参数,能够对特定领域信号类型进行有效的识别。在信号采集后片段的处理上,通常采取两种方案,第一,将多个通道的信号并为一个单通道信号,进行模型的搭建与分类,第二,将多个通道同一时刻采集上来的信号一起作为模型的输入端,经过简单预处理后,进行模型的搭建与分类,极少数现有方案中对信号数据进行复杂的预处理,虽然分类效果是有效可靠的,但方法的泛化性不高。此外,目前大部分技术手段中,具体算法的迁移能力(迁移能力是指将算法迁移到另一相近领域进行准确识别的能力)不能够保证;当发明的具体算法需要多个通道数据的支持时,对于具体产品而言,也会给工程实施带来一定的限制。
发明内容:
本发明针对现有技术对于信号序列分析的缺陷,提出了一种能够对有效信号进行高效利用,缩减输入信号通道,简化网络模型复杂度,提升计算效率的基于深度学习的个体信号识别算法及系统。
本发明通过以下措施达到:
一种基于深度学习的个体信号识别算法,其特征在于包括以下步骤:
步骤1:采集同一测试者在不同测试要求下的多通道原始信号数据,并进行信号预处理;
步骤2:对多个信号通道内多个类别的原始数据,分别进行类别间差异性计算,并对计算结果按大小排序,选取结果最大的通道作为输入信号通道;
步骤3:搭建并训练CNN-HMM混合分类器,采用卷积神经网络对信号进行特征提取,然后每个类别下分别训练一个HMM模型,利用每个类别的HMM参数的运算确定落入每个类别的概率,最终确定分类结果;若分类结果不满足要求,采取重复迭代的方式,添加步骤2中排序第二的通道信号,使排序第二的通道信号与排序第一的通道信号合并,重新训练,直至获得训练后的CNN-HMM混合分类器;
步骤4:对步骤1中的同一测试者所提供的其他待分类数据依次执行步骤1、2后,利用步骤3中获得的CNN-HMM混合分类器,计算信号在每个类别下的概率大小,输出分类结果。
本发明步骤1中所述多通道原始信号数据的通道数与采集设备相关,若采用N路电极进行原始数据的采集,则获取当前测试要求下的N通道原始信号数据。
本发明步骤1中所述预处理为:对所采集的信号利用独立成分分析法,进行降噪处理,按规定频率段进行信号提取,然后截取预设长度数据,并对所截取的数据进行归一化处理。
本发明所述步骤2中多个类别的原始数据是指多个测试要求下的原始数据。
本发明步骤2对各自通道内不同类别间的信号进行类别间差异性计算是指进行样本距离或类间距离或序列相关性的计算,所述样本距离包括以下距离:点对点欧氏距离、区间对区间欧氏距离等;类间距离包括:最小值距离、最大值距离、均值距离等;序列相关性计算方法包括:独立性检验(如均值-方差检验)、相关性检验(如Spearman检验)以及系列非参数检验等。
本发明步骤3具体包括以下步骤:
步骤3-1:建立CNN-Relu深度学习网络模型,对信号进行特征的自提取,首先令信号进入CNN卷积神经网络,在每一层卷积层后均跟着一个Relu激励函数,再通过各个网络连接层,最后通过SoftMax层计算最终结果;
步骤3-2:运用交叉熵损失函数计算步骤3-1中网络模型的损失,直至模型损失小于阈值0.1,则模型训练结束,否则,利用Adam对模型参数进行优化;
步骤3-3:输出经过步骤3-1、步骤3-2后得到的网络模型连接层的中间结果,在不同类别下,分别训练每个类别的HMM参数,用测试集进行分类效果的测试,并进行参数的保存;
步骤3-4:若步骤3-1中的网络模型及步骤3-3中的HMM训练的参数的分类效果达不到理想状态,则继续进行通道的选择与串行叠加,重新进行步骤3-1至步骤3-3的训练。
本发明步骤3-1中首先令信号进入一维卷积层,滤波器个数为8-64,步长为1-20,卷积和大小为5-20,后面紧跟着一个Relu激励函数层,接着进入一层池化层,池化层步长为1-20,池化尺寸为5-20,重复以上网络结构一次,共搭建两层卷积网络,再依次通过各个网络连接层,通过计算得到最终结果;其中网络连接层的结构共六层,依次设置一层全连接层,一层的密集层,一层激活函数,一层密集层,一层随机失活层,一层Softmax层。
本发明步骤3-2在训练网络的过程中,采用Softmax输出层上的二分类交叉熵作为整个网络的损失函数,为了训练网络,采用Adam优化方法。
本发明步骤3-3中提取随机失活层的中间结果,有关每个类别下HMM参数的训练,具体为:将每个类别下样本所提取出的随机失活层数据进行整数化处理,按照四舍五入的原则将数据统一转化为整数,分类别训练并保存参数信息。
本发明具体包括以下步骤:
步骤A:获取同一测试者的多类型多通道脑电数据,脑电数据集包含多个通道、执行心算任务和未执行心算任务的脑电信号,分为两类。
步骤B:对步骤A所采集的多通道信号利用独立成分分析法进行降噪处理,并对其进行规定频率段内信号提取,然后,截取固定长度数据并进行归一化处理;即得到多个通道、集中注意力前后的两类脑电数据后,提取预设频率段信号,然后将脑电信号截取为片段,截取预设长度,对于集中注意力前后两类脑电数据,采取统一截取方式进行对应,对所截取出的所有脑波片段进行归一化处理,便于后期进行有效计算。
步骤C:确定输入信号通道,具体包括以下步骤:
步骤C1:对多个通道中各自通道内不同类别间的信号进行类别间差异性计算,即对于经过信号提取模块预处理过的脑电信号,以时间为顺序,一一计算两类脑电截取片段样本间的欧氏距离,将两样本点对点的欧氏距离与区间对区间的欧氏距离进行平均,得到最终的距离;
步骤C2:对步骤C1中获取的类间距离按大小进行排序,选取类间距离最大的通道作为输入信号通道;若后期应用的通道信号达不到分类效果,可进行通道的二次选择;
步骤C3:利用通道选择单元获取的数据集作为训练测试对象,通过CNN-HMM混合分类器搭建训练单元搭建深度学习网络模型,具体包括:
步骤C3-1:建立CNN-Relu深度学习网络模型,对信号进行特征的自提取;
步骤C3-2:运用交叉熵损失函数计算步骤1中网络模型的损失,直至模型损失小于阈值0.1,则模型训练结束,否则,利用Adam对模型参数进行优化;
步骤C3-3:输出经过步骤C3-1、步骤C3-2后得到的网络模型连接层的中间结果,在不同类别下,分别训练每个类别的HMM参数,用测试集进行分类效果的测试,并进行参数的保存;
步骤C3-4:若通过以上步骤训练的参数的分类效果达不到理想状态,则继续进行通道的选择与串行叠加,重新进行训练。
其中:
步骤C3-1中搭建CNN-Relu模型进行序列的简化,提取重要的序列特征,首先,令信号进入一维卷积层,滤波器个数为8-64,步长为1-20,卷积和大小为5-20,后面紧跟着一个Relu激励函数层,接着进入一层池化层,池化层步长为1-20,池化尺寸为5-20,重复以上网络结构一次,共搭建两层卷积网络,再依次通过各个网络连接层计算得到最终结果,其中网络连接层为六层结构;
步骤C3-3中提取随机失活层的中间结果,其中每个样本长度为预设长度,有关每个类别下HMM参数的训练,具体如下:将每个类别下样本所提取出的随机失活层数据进行整数化处理,按照四舍五入的原则将数据统一转化为整数,分类别训练并保存参数信息;对于未进行心算任务状态下的脑电波信号,首先,设置隐含状态个数和迭代次数,其次,生成随机数的方式设置初始状态概率矩阵,利用前向-后向算法计算概率矩阵的最优值,从而得到参数信息;对于进行心算任务状态下的脑电波信号,设置隐含状态个数和迭代次数,参照相同训练方法,得到参数;对于预测任务,计算样本在各个类别下的输出概率,概率较大者,即为样本最终的输出类别。
本发明还提出了一种利用上述基于深度学习的个体信号识别算法的系统,其特征在于设有多通道数据采集单元、数据预处理单元、通道选择单元、CNN-HMM混合分类器搭建训练单元、结果判别单元,其中所述多通道数据采集单元所获取的同一测试者在多个测试条件下产生的多个类型原始数据以多通道形式输出至数据预处理单元;所述数据预处理单元将预处理后的数据以多通道形式输出至通道选择单元。
所述通道选择单元中依次设有类别间差异性比较模块、比较结果排序模块、输入信号通道确定模块,类别间差异性比较模块对接收到的多通道数据的每一通道内数据进行类间距离或样本距离或序列相关性计算,并将计算结果送入比较结果排序模块;比较结果排序模块对多通道的类别间差异性结果按大小排序,并将排序结果送入输入信号通道确定模块;输入信号通道确定模块将类别间差异性结果最大的通道确定为输入信号通道。
所述CNN-HMM混合分类器搭建训练单元利用测试集数据搭建并训练获得CNN-HMM混合分类器。
所述结果判别单元获取依次经过多通道数据采集单元、数据预处理单元、通道选择单元、CNN-HMM混合分类器的数据的分类结果。
本发明所述数据预处理单元可以设有降噪处理模块、用于从规定频率段内提取信号的信号提取模块、用于截取预设信号长度的数据截取模块、用于对数据进行归一化处理的归一化处理模块。
本发明相对于现有技术,具有以下优点:(1)通过设置采集通道选择机制,对于个体信号的采集通道个数据具有自适应性,当多通道信号同时采集时,能够对信号进行有效甄选,避免了信号多通道信息的繁杂而导致的分类效果下降等问题,同时也简化了分类器的结构与计算速度;(2)改变了原始训练集测试集样本的采集标准,通过对有具体需要的某个单体进行信号的采集与分析,能够避免因个体差异化而引起的分类效果下降等问题;(3)利用CNN-HMM混合的分类器采取了一种模式选择的方式预测分类结果,通过卷积神经网络进行信号特征的提取,然后每个类别下均训练一个HMM模型,利用每个类别的HMM参数的运算确定落入每个类别的概率大小,最终确定分类;综上,本发明解决了传统算法设计方案过程中对信号采集通道个数的限制,发明了一种自适应信号通道的算法,通过前期简易算法设计,筛选具体通道信号,既避免了传入模型信息的繁杂,简化了模型结构,又充分利用了有效的信号资源。
附图说明:
附图1是本发明的流程图。
附图2是本发明的系统框图。
具体实施方式:
下面结合附图和实施例对本发明作进一步的说明。
如附图1所示,本发明首先提出了一种基于深度学习的个体信号识别算法,具体包括以下步骤:
步骤1:采集同一测试者在不同测试要求下的多通道原始信号数据,(其中每一测试条件对应产生一个类别的原始数据),并进行信号预处理。
步骤2:对多个信号通道内多个类别的原始数据,分别进行类别间差异性计算,并对计算结果按大小排序,选取结果最大的通道作为输入信号通道。
步骤3:搭建并训练CNN-HMM混合分类器,采用卷积神经网络对信号进行特征提取,然后每个类别下分别训练一个HMM模型,利用每个类别的HMM参数的运算确定落入每个类别的概率,最终确定分类结果;若分类结果不满足要求,采取重复迭代的方式,添加步骤2中排序第二的通道信号,使排序第二的通道信号与排序第一的通道信号合并,重新训练,直至获得训练后的CNN-HMM混合分类器。
步骤4:对步骤1中的同一测试者所提供的其他待分类数据依次执行步骤1、2后,利用步骤3中获得的CNN-HMM混合分类器,计算信号在每个类别下的概率大小,输出分类结果。
本发明步骤1中所述多通道原始信号数据的通道数与采集设备相关,若采用N路电极进行原始数据的采集,则获取当前测试要求下的N通道原始信号数据。
本发明步骤1中所述预处理为:对所采集的信号利用独立成分分析法,进行降噪处理,按规定频率段进行信号提取,然后截取预设长度数据,并对所截取的数据进行归一化处理。
本发明步骤2对各自通道内不同类别间的信号进行的类别间差异性计算是指:样本距离或类间距离或序列相关性的计算;所述样本距离包括以下距离:点对点欧氏距离、区间对区间欧氏距离等;类间距离包括:最小值距离、最大值距离、均值距离等;序列相关性计算方法包括:独立性检验(如均值-方差检验)、相关性检验(如Spearman检验)以及系列非参数检验等。
本发明步骤3具体包括以下步骤:
步骤3-1:建立CNN-Relu深度学习网络模型,对信号进行特征的自提取,首先令信号进入CNN卷积神经网络,在每一层卷积层后均跟着一个Relu激励函数,再通过各个网络连接层,最后通过SoftMax层计算最终结果;
步骤3-2:运用交叉熵损失函数计算步骤3-1中网络模型的损失,直至模型损失小于阈值0.1,则模型训练结束,否则,利用Adam对模型参数进行优化;
步骤3-3:输出经过步骤3-1、步骤3-2后得到的网络模型连接层的中间结果,在不同类别下,分别训练每个类别的HMM参数,用测试集进行分类效果的测试,并进行参数的保存;
步骤3-4:若步骤3-1中的网络模型及步骤3-3中的HMM训练的参数的分类效果达不到理想状态,则继续进行通道的选择与串行叠加,重新进行步骤3-1至步骤3-3的训练。
如附图2所示,本发明还提出了一种利用上述基于深度学习的个体信号识别算法的系统,设有多通道数据采集单元、数据预处理单元、通道选择单元、CNN-HMM混合分类器搭建训练单元、结果判别单元,其中所述多通道数据采集单元所获取的同一测试者在不同测试条件下产生的多个类型原始数据以多通道形式输出至数据预处理单元;
所述数据预处理单元将预处理后的数据以多通道形式输出至通道选择单元。
所述通道选择单元中依次设有类别间差异性比较模块、比较结果排序模块、输入信号通道确定模块,类别间差异性比较模块对接收到的多通道数据的每一通道内数据进行类间距离或样本距离或序列相关性计算,并将计算结果送入比较结果排序模块;比较结果排序模块对多通道的类别间差异性结果按大小排序,并将排序结果送入输入信号通道确定模块;输入信号通道确定模块将类别间差异性结果最大的通道确定为输入信号通道。
所述CNN-HMM混合分类器搭建训练单元利用测试集数据搭建并训练获得CNN-HMM混合分类器。
所述结果判别单元获取依次经过多通道数据采集单元、数据预处理单元、通道选择单元、CNN-HMM混合分类器的数据的分类结果。本发明所述数据预处理单元可以设有降噪处理模块、用于从规定频率段内提取信号的信号提取模块、用于截取预设信号长度的数据截取模块、用于对数据进行归一化处理的归一化处理模块。
实施例1:
本例运用本发明提出的基于深度学习的个体性信号识别算法和系统对个体脑电信号进行处理:
步骤1:通过多通道数据采集单元获取同一测试者的多类型多通道脑电数据,具体为:通过采集脑电信号的仪器,采集单个测试者在不同条件(即不同类别)下产生的多个通道原始脑电信号;此处使用PhysioNet Database(Neuroelectric and MyoelectricDatabases)上关于心算注意力的个体数据集作为标记的脑电数据进行分析,脑电数据集包含22个通道、执行心算任务和未执行心算任务的脑电信号,分为两类。
步骤2:通过数据预处理单元,对步骤1所采集的多通道信号利用独立成分分析法进行降噪处理,并对其进行规定频率段内信号提取,然后,截取固定长度数据(长度根据具体信号类型择优选择),并进行归一化处理;本例中数据集上已经经过处理,因此此处不再赘述,得到22个通道、集中注意力前后的两类脑电数据后,提取30-50Hz频率段信号,然后将脑电信号截取为片段,截取长度为3000,对于集中注意力前后两类脑电数据,采取统一截取方式进行对应,对所截取出的所有脑波片段进行归一化处理,便于后期进行有效计算。
数据与处理单元对采集的脑电信号进行信号预处理后,能够明显提升最后的分类准确度与判别结果,如果长达几十秒的脑电数据不经过预处理(降噪、提取固定频率段信号)与固定长度的截取,那么对下面通道选择模块类间距离的计算准确性造成影响,从而影响最有价值样本通道的选择,使分类判别结果出现偏差。
步骤3:脑电信号样本集的整理与标注,对步骤2中所获取的信号片段进行标注。
步骤4:通过通道选择单元确定输入信号通道,具体包括以下步骤:
步骤4-1:对22个通道中各自通道内不同类别间的信号进行类别间差异性计算,即对于经过信号提取模块预处理过的脑电信号,以时间为顺序,一一计算两类样本(脑电截取片段)间的欧氏距离,将两样本点对点的欧氏距离与区间对区间(区间长度为10,取区间的均值作为区间的代表值)的欧氏距离进行平均,得到最终的距离;
步骤4-2:对步骤4-1中获取的类间距离按大小进行排序,选取类间距离最大的通道作为输入信号通道;若后期应用的通道信号达不到分类效果,可进行通道的二次选择。
在本环节中,通道选择单元确定中的类别间差异性比较模块能够把多通道数据中不同类型的最有差别的信号找出来,选择具体通道的信号数据作为输入信号,从而避免传入分类器模型信息的繁杂,提升分类的效果,也简化了模型的结构,使CNN模型不需要设计多个输入头,在没有本模块的处理下,经过样本提取模块后直接进入混合分类器搭建模块,最终的分类判别效果在个体数据集上仅有60%,从22个通道的信号上看,或许由于个体接收测试不标准,或单个个体在集中注意力与分散注意力时的脑电信号差异不明显,有接近50%的通道信号属于无效信号,单独抽取出来做网络模型的训练效果比较不理想。
通过通道选择单元的处理,能够使信号通道个数具备自适应性,无论实际应用条件下采集信号通道个数是多少,总能找到通道信号的差异性排序,因此可以做到择优选择,利用本发明中搭建好的网络框架就能够直接进行分类预测,使算法的普适性更强。
步骤5:利用通道选择单元获取的数据集作为训练测试对象,通过CNN-HMM混合分类器搭建训练单元搭建深度学习网络模型,具体包括:
步骤5-1:建立CNN-Relu深度学习网络模型,对信号进行特征的自提取;
步骤5-2:运用交叉熵损失函数计算步骤1中网络模型的损失,直至模型损失小于阈值0.1,则模型训练结束,否则,利用Adam对模型参数进行优化;
步骤5-3:输出经过步骤1、步骤2后得到的网络模型连接层的中间结果,在不同类别下,分别训练每个类别的HMM参数,用测试集进行分类效果的测试,并进行参数的保存;
步骤5-4:若通过以上步骤训练的参数的分类效果达不到理想状态,则继续进行通道的选择与串行叠加,重新进行训练。
其中:
步骤5-1中搭建CNN-Relu模型进行序列的简化,提取重要的序列特征,首先,令信号进入一维卷积层,滤波器个数为16,步长为5,卷积和大小为10,后面紧跟着一个Relu激励函数层,接着进入一层池化层,池化层步长为2,池化尺寸为10,重复以上网络结构一次,共搭建两层卷积网络,再依次通过各个网络连接层(一层全连接层,一层密集层(神经元个数为128),一层激活函数,一层密集层(神经元个数为64),一层随机失活层(阈值设定为0.5),一层Softmax层(神经元个数为2),共六层),通过计算得到最终结果。
步骤5-2所述运用交叉熵损失函数计算步骤5-1中网络模型的损失;在训练网络的过程中,采用Softmax输出层上的二分类交叉熵作为整个网络的损失函数,为了训练网络,采用Adam优化方法,学习率learning-rate=0.001,beta1=0.9,beta2=0.999,设置epochs为50,batch_size为20,网络的收敛性质较好,训练网络的时间在合理范围内。
步骤5-3中提取随机失活层的中间结果(每个样本长度为64),有关每个类别下HMM参数的训练,具体描述如下:将每个类别下样本所提取出的随机失活层数据进行整数化处理,按照四舍五入的原则将数据统一转化为整数,分类别训练并保存参数信息。
对于未进行心算任务状态下(非注意)的脑电波信号,首先,设置隐含状态个数为4(此隐含状态个数为利用多个状态值寻找最优使模型损失最小的方法得出),迭代次数为100,其次,生成随机数的方式设置初始状态概率矩阵,利用前向-后向算法(EM算法的改进,网上已有开源的方法详解)计算概率矩阵的最优值,从而得到参数信息。对于进行心算任务状态下(注意)的脑电波信号,设置隐含状态个数为32,迭代次数为100,参照相同训练方法,得到参数。
对于预测任务(分类效果检测),计算样本在各个类别下的输出概率,概率较大者,即为样本最终的输出类别。
步骤5-4中设置一种迭代功能,若分类器训练结果满足不了要求,可进行增加有用输入信息提升模型效果的补救措施,当分类效果不理想时,进行通道的二次选择,获得多一倍的信号进行重新训练与预测。
通过CNN-HMM混合分类器搭建与训练单元,能够使得经过处理的脑电信号得到一个分类标准;通过卷积神经网络,在其中加入部分激励函数的网络结构,对脑电波数据进行有效的信息提取,相比于其他分类方法,在保证一定分类效果的前提下,网络结构更加的简单,网络训练速度很快;加入隐马尔可夫模型的计算,提升了脑电波信号的分类效果。
为进行单个功能单元的比较,在同样经过本发明中数据预处理单元与通道选择单元处理后,参照相似专利的分类方法,总结以下几种分类器在此应用实施例上的效果:
1、采用经典卷积神经网络分类器,卷积、池化层各2层,每层卷积后均跟着一个池化层,参数与本发明中卷积池化层相同,直接对脑电波数据进行分类识别,分类准确度达到92.4%;
2、采用卷积神经网络与长短时记忆网络相结合的分类器,卷积、池化层参数与层数与本发明相同,长短时记忆网络的层数为1层,节点个数为64,对脑电数据进行分类识别,分类准确度达到94.1%。
步骤6:利用结果判别单元获得针对单个个体的分类结果;具体为对单个个体训练得到CNN的中间结果,而后训练得到HMM参数后,当收集到此个体的信号后,选择通过通道选择单元所具体确定的通道信号,通过训练后的CNN-HMM混合分类器,计算信号在每个类别下的概率大小(利用HMM参数),输出分类结果。
本方法在个体脑电信号分类方面的技术效果:对于脑电信号的分类诊断,本算法通过以上设计能够使得PhysioNet Database(Neuroelectric and MyoelectricDatabases)上关于心算注意力的个体数据集上脑电信号的分类准确度达到93%。
本发明相对于现有技术,具有以下优点:(1)通过设置采集通道选择机制,对于个体信号的采集通道个数据具有自适应性,当多通道信号同时采集时,能够对信号进行有效甄选,避免了信号多通道信息的繁杂而导致的分类效果下降等问题,同时也简化了分类器的结构与计算速度;(2)改变了原始训练集测试集样本的采集标准,通过对有具体需要的某个单体进行信号的采集与分析,能够避免因个体差异化而引起的分类效果下降等问题;(3)利用CNN-HMM混合的分类器采取了一种模式选择的方式预测分类结果,通过卷积神经网络进行信号特征的提取,然后每个类别下均训练一个HMM模型,利用每个类别的HMM参数的运算确定落入每个类别的概率大小,最终确定分类;综上,本发明解决了传统算法设计方案过程中对信号采集通道个数的限制,发明了一种自适应信号通道的算法,通过前期简易算法设计,筛选具体通道信号,既避免了传入模型信息的繁杂,简化了模型结构,又充分利用了有效的信号资源。
Claims (10)
1.一种基于深度学习的个体信号识别算法,其特征在于包括以下步骤:
步骤1:采集同一测试者在不同测试条件下产生的多个信号通道内多个类别的原始数据,并进行信号预处理;
步骤2:对多个信号通道内多个类别的原始数据,分别进行类别间差异性计算,并对计算结果按大小排序,选取结果最大的通道作为输入信号通道;
步骤3:搭建并训练CNN-HMM混合分类器,采用卷积神经网络对信号进行特征提取,然后每个类别下分别训练一个HMM模型,利用每个类别的HMM参数的运算确定落入每个类别的概率,最终确定分类结果;若分类结果不满足要求,采取重复迭代的方式,添加步骤2中排序第二的通道信号,使排序第二的通道信号与排序第一的通道信号合并,重新训练,直至获得训练后的CNN-HMM混合分类器;
步骤4:对步骤1中的同一测试者所提供的其他待分类数据依次执行步骤1、2后,利用步骤3中获得的CNN-HMM混合分类器,计算信号在每个类别下的概率大小,输出分类结果。
2.根据权利要求1所述的一种基于深度学习的个体信号识别算法,其特征在于步骤1中所述预处理为:对所采集的信号利用独立成分分析法,进行降噪处理,按规定频率段进行信号提取,然后截取预设长度数据,并对所截取的数据进行归一化处理。
3.根据权利要求1所述的一种基于深度学习的个体信号识别算法,其特征在于步骤2对各自通道内不同类别间的信号进行类别间差异性计算是指进行样本距离或类间距离或序列相关性的计算,所述样本距离包括以下距离:点对点欧氏距离、区间对区间欧氏距离;类间距离包括:最小值距离、最大值距离、均值距离;序列相关性计算方法包括:独立性检验、相关性检验或系列非参数检验。
4.根据权利要求1所述的一种基于深度学习的个体信号识别算法,其特征在于步骤3具体包括以下步骤:
步骤3-1:建立CNN-Relu深度学习网络模型,对信号进行特征的自提取,首先令信号进入CNN卷积神经网络,在每一层卷积层后均跟着一个Relu激励函数,再通过各个网络连接层,最后通过SoftMax层计算最终结果;
步骤3-2:运用交叉熵损失函数计算步骤3-1中网络模型的损失,直至模型损失小于阈值0.1,则模型训练结束,否则,利用Adam对模型参数进行优化;
步骤3-3:输出经过步骤3-1、步骤3-2后得到的网络模型连接层的中间结果,在不同类别下,分别训练每个类别的HMM参数,用测试集进行分类效果的测试,并进行参数的保存;
步骤3-4:若步骤3-1中的网络模型及步骤3-3中的HMM训练的参数的分类效果达不到理想状态,则继续进行通道的选择与串行叠加,重新进行步骤3-1至步骤3-3的训练。
5.根据权利要求4所述的一种基于深度学习的个体信号识别算法,其特征在于步骤3-1中首先令信号进入一维卷积层,滤波器个数为8-64,步长为1-20,卷积和大小为5-20,后面紧跟着一个Relu激励函数层,接着进入一层池化层,池化层步长为1-20,池化尺寸为5-20,重复以上网络结构一次,共搭建两层卷积网络,再依次通过各个网络连接层,通过计算得到最终结果;其中网络连接层的结构共六层,依次设置一层全连接层,一层的密集层,一层激活函数,一层密集层,一层随机失活层,一层Softmax层。
6.根据权利要求4所述的一种基于深度学习的个体信号识别算法,其特征在于步骤3-2在训练网络的过程中,采用Softmax输出层上的二分类交叉熵作为整个网络的损失函数,为了训练网络,采用Adam优化方法。
7.根据权利要求4所述的一种基于深度学习的个体信号识别算法,其特征在于步骤3-3中提取随机失活层的中间结果,有关每个类别下HMM参数的训练,具体为:将每个类别下样本所提取出的随机失活层数据进行整数化处理,按照四舍五入的原则将数据统一转化为整数,分类别训练并保存参数信息。
8.根据如权利要求1-7中任意一项所述的一种基于深度学习的个体信号识别算法,其特征在于包括以下步骤:
步骤A:获取同一测试者的多类型多通道脑电数据,脑电数据集包含多个通道、执行心算任务和未执行心算任务的两类脑电信号;
步骤B:对步骤A所采集的多通道信号利用独立成分分析法进行降噪处理,并对其进行规定频率段内信号提取,然后,截取固定长度数据并进行归一化处理;即对得到多个通道、执行心算任务和未执行心算任务的两类脑电信号后,提取预设频率段信号,然后将脑电信号截取为片段,截取预设长度,对于两类脑电数据,采取统一截取方式进行对应,对所截取出的所有脑波片段进行归一化处理,便于后期进行有效计算;
步骤C:确定输入信号通道,具体包括以下步骤:
步骤C1:对多个通道中各自通道内不同类别间的信号进行类别间差异性计算,即对于经过信号提取模块预处理过的脑电信号,以时间为顺序,一一计算两类脑电截取片段样本间的欧氏距离,将两样本点对点的欧氏距离与区间对区间的欧氏距离进行平均,得到最终的距离;
步骤C2:对步骤C1中获取的类间距离按大小进行排序,选取类间距离最大的通道作为输入信号通道;若后期应用的通道信号达不到分类效果,可进行通道的二次选择;
步骤C3:利用通道选择单元获取的数据集作为训练测试对象,通过CNN-HMM混合分类器搭建训练单元搭建深度学习网络模型,具体包括:
步骤C3-1:建立CNN-Relu深度学习网络模型,对信号进行特征的自提取;
步骤C3-2:运用交叉熵损失函数计算步骤1中网络模型的损失,直至模型损失小于阈值0.1,则模型训练结束,否则,利用Adam对模型参数进行优化;
步骤C3-3:输出经过步骤C3-1、步骤C3-2后得到的网络模型连接层的中间结果,在不同类别下,分别训练每个类别的HMM参数,用测试集进行分类效果的测试,并进行参数的保存;
步骤C3-4:若通过以上步骤训练的参数的分类效果达不到理想状态,则继续进行通道的选择与串行叠加,重新进行训练;
其中:
步骤C3-1中搭建CNN-Relu模型进行序列的简化,提取重要的序列特征,首先,令信号进入一维卷积层,滤波器个数为8-64,步长为1-20,卷积和大小为5-20,后面紧跟着一个Relu激励函数层,接着进入一层池化层,池化层步长为1-20,池化尺寸为5-20,重复以上网络结构一次,共搭建两层卷积网络,再依次通过各个网络连接层计算得到最终结果,其中网络连接层为六层结构;
步骤C3-3中提取随机失活层的中间结果,其中每个样本长度为预设长度,有关每个类别下HMM参数的训练,具体如下:将每个类别下样本所提取出的随机失活层数据进行整数化处理,按照四舍五入的原则将数据统一转化为整数,分类别训练并保存参数信息;对于未进行心算任务状态下的脑电波信号,首先,设置隐含状态个数和迭代次数,其次,生成随机数的方式设置初始状态概率矩阵,利用前向-后向算法计算概率矩阵的最优值,从而得到参数信息;对于进行心算任务状态下的脑电波信号,设置隐含状态个数和迭代次数,参照相同训练方法,得到参数;对于预测任务,计算样本在各个类别下的输出概率,概率较大者,即为样本最终的输出类别。
9.一种利用如权利要求1-8中任意一项所述的基于深度学习的个体信号识别算法的系统,其特征在于设有多通道数据采集单元、数据预处理单元、通道选择单元、CNN-HMM混合分类器搭建训练单元、结果判别单元,其中所述多通道数据采集单元所获取的同一测试者在多个测试条件下产生的多个类型原始数据以多通道形式输出至数据预处理单元;
所述数据预处理单元将预处理后的数据以多通道形式输出至通道选择单元;
所述通道选择单元中依次设有类别间差异性比较模块、比较结果排序模块、输入信号通道确定模块,类别间差异性比较模块对接收到的多通道数据的每一通道内数据进行类间距离或样本距离或序列相关性计算,并将计算结果送入比较结果排序模块;比较结果排序模块对多通道的类别间差异性结果按大小排序,并将排序结果送入输入信号通道确定模块;输入信号通道确定模块将类别间差异性结果最大的通道确定为输入信号通道;
所述CNN-HMM混合分类器搭建训练单元利用测试集数据搭建并训练获得CNN-HMM混合分类器;
所述结果判别单元获取依次经过多通道数据采集单元、数据预处理单元、通道选择单元、CNN-HMM混合分类器的数据的分类结果。
10.根据权利要求9所述的一种基于深度学习的个体信号识别算法的系统,其特征在于所述数据预处理单元设有降噪处理模块、用于从规定频率段内提取信号的信号提取模块、用于截取预设信号长度的数据截取模块、用于对数据进行归一化处理的归一化处理模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010143701.6A CN111428580A (zh) | 2020-03-04 | 2020-03-04 | 基于深度学习的个体信号识别算法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010143701.6A CN111428580A (zh) | 2020-03-04 | 2020-03-04 | 基于深度学习的个体信号识别算法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111428580A true CN111428580A (zh) | 2020-07-17 |
Family
ID=71551541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010143701.6A Pending CN111428580A (zh) | 2020-03-04 | 2020-03-04 | 基于深度学习的个体信号识别算法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111428580A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112263253A (zh) * | 2020-11-18 | 2021-01-26 | 山东大学 | 基于深度学习与心电信号的抑郁症识别系统、介质及设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654063A (zh) * | 2016-01-08 | 2016-06-08 | 东南大学 | 基于人工蜂群时频参数优化的运动想象脑电模式识别方法 |
CN106886792A (zh) * | 2017-01-22 | 2017-06-23 | 北京工业大学 | 一种基于分层机制构建多分类器融合模型的脑电情感识别方法 |
CN108836269A (zh) * | 2018-05-10 | 2018-11-20 | 电子科技大学 | 一种融合心率呼吸体动的自动睡眠分期方法 |
CN110097755A (zh) * | 2019-04-29 | 2019-08-06 | 东北大学 | 基于深度神经网络的高速公路交通流量状态识别方法 |
CN110309797A (zh) * | 2019-07-05 | 2019-10-08 | 齐鲁工业大学 | 融合CNN-BiLSTM模型和概率协作的运动想象识别方法及系统 |
CN110503082A (zh) * | 2019-08-30 | 2019-11-26 | 腾讯科技(深圳)有限公司 | 一种基于深度学习的模型训练方法以及相关装置 |
CN110522444A (zh) * | 2019-09-03 | 2019-12-03 | 西安邮电大学 | 一种基于Kernel-CNN的心电信号识别分类方法 |
-
2020
- 2020-03-04 CN CN202010143701.6A patent/CN111428580A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654063A (zh) * | 2016-01-08 | 2016-06-08 | 东南大学 | 基于人工蜂群时频参数优化的运动想象脑电模式识别方法 |
CN106886792A (zh) * | 2017-01-22 | 2017-06-23 | 北京工业大学 | 一种基于分层机制构建多分类器融合模型的脑电情感识别方法 |
CN108836269A (zh) * | 2018-05-10 | 2018-11-20 | 电子科技大学 | 一种融合心率呼吸体动的自动睡眠分期方法 |
CN110097755A (zh) * | 2019-04-29 | 2019-08-06 | 东北大学 | 基于深度神经网络的高速公路交通流量状态识别方法 |
CN110309797A (zh) * | 2019-07-05 | 2019-10-08 | 齐鲁工业大学 | 融合CNN-BiLSTM模型和概率协作的运动想象识别方法及系统 |
CN110503082A (zh) * | 2019-08-30 | 2019-11-26 | 腾讯科技(深圳)有限公司 | 一种基于深度学习的模型训练方法以及相关装置 |
CN110522444A (zh) * | 2019-09-03 | 2019-12-03 | 西安邮电大学 | 一种基于Kernel-CNN的心电信号识别分类方法 |
Non-Patent Citations (1)
Title |
---|
YASHAS MALUR SAIDUTTA ET AL.: "Increasing the learning Capacity of BCI Systems via CNN-HMM models" * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112263253A (zh) * | 2020-11-18 | 2021-01-26 | 山东大学 | 基于深度学习与心电信号的抑郁症识别系统、介质及设备 |
CN112263253B (zh) * | 2020-11-18 | 2021-09-17 | 山东大学 | 基于深度学习与心电信号的抑郁症识别系统、介质及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111914883B (zh) | 一种基于深度融合网络的主轴轴承状态评估方法及装置 | |
CN110287552B (zh) | 基于改进随机森林算法的电机轴承故障诊断方法及系统 | |
CN112284736A (zh) | 一种基于多通道注意力模块的卷积神经网络故障诊断方法 | |
CN108256556A (zh) | 基于深度信念网络的风力发电机组齿轮箱故障诊断方法 | |
CN113837000A (zh) | 一种基于任务排序元学习的小样本故障诊断方法 | |
CN110455512B (zh) | 基于深度自编码器dae的旋转机械多集成故障诊断方法 | |
CN113076878B (zh) | 基于注意力机制卷积网络结构的体质辨识方法 | |
CN112528774B (zh) | 一种复杂电磁环境下未知雷达信号智能分选系统及方法 | |
CN114358124A (zh) | 基于深度对抗卷积神经网络的旋转机械新故障诊断方法 | |
CN110659682A (zh) | 一种基于MCWD-KSMOTE-AdaBoost-DenseNet算法的数据分类方法 | |
CN113158984A (zh) | 基于复Morlet小波和轻量级卷积网络的轴承故障诊断方法 | |
CN113255591A (zh) | 一种基于随机森林和融合特征的轴承故障诊断方法 | |
CN117076955A (zh) | 一种高压变频器的故障检测方法及系统 | |
CN114118219A (zh) | 基于数据驱动的长期加电设备健康状态实时异常检测方法 | |
CN111428580A (zh) | 基于深度学习的个体信号识别算法及系统 | |
CN114330430A (zh) | 一种基于大数据特征分析的电梯故障判断方法及系统 | |
CN117233547A (zh) | 一种油纸绝缘局部放电的融合识别方法及系统 | |
CN117150337A (zh) | 基于分诊制的化工过程故障诊断方法 | |
CN114383846B (zh) | 基于故障标签信息向量的轴承复合故障诊断方法 | |
CN116484206A (zh) | 基于seim的未知辐射源个体识别方法及系统 | |
CN116032790A (zh) | 调度自动化系统海量数据流异常辨识、诊断和预测方法、装置和系统 | |
CN111490945A (zh) | 一种基于深度学习方法和dfi的vpn隧道流量识别方法 | |
CN115700104A (zh) | 基于多尺度原型学习的本身可解释的脑电信号分类方法 | |
CN115587299A (zh) | 一种可迁移的多尺度旋转机械故障诊断方法及系统 | |
CN106709467A (zh) | 一种适合硬件实现的实时峰电位检测和分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |