CN117093918A - 一种基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法 - Google Patents
一种基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法 Download PDFInfo
- Publication number
- CN117093918A CN117093918A CN202311347683.3A CN202311347683A CN117093918A CN 117093918 A CN117093918 A CN 117093918A CN 202311347683 A CN202311347683 A CN 202311347683A CN 117093918 A CN117093918 A CN 117093918A
- Authority
- CN
- China
- Prior art keywords
- spike
- overlapped
- data
- overlapping
- angle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012549 training Methods 0.000 claims abstract description 46
- 238000013145 classification model Methods 0.000 claims description 17
- 238000011176 pooling Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 8
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 210000002569 neuron Anatomy 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000000052 comparative effect Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000004880 explosion Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 229920002148 Gellan gum Polymers 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 210000005013 brain tissue Anatomy 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000007427 paired t-test Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于格拉姆角和场和CBAM‑Resnet34的重叠尖锋识别方法,首先使用已有的尖锋数据来制作重叠尖锋模板训练集,接着采用格拉姆角和场方法将一维尖锋序列转换成二维图像,用于训练CBAM‑Resnet34模型。经过训练后,该模型可以准确地对重叠尖锋进行分类,不仅节省了大量时间和人力成本,而且其平均准确率达到了92.737%,超过了传统方法。结果表明该方法可以有效地区分重叠尖锋。综上所述,GASF‑CBAM‑Resnet34模型的重叠尖锋分类方法是一种有效的解决重叠尖锋问题和提高分类准确性的方法。
Description
技术领域
本发明涉及重叠尖锋分类领域,具体涉及一种基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法。
背景技术
在进行神经科学的研究中,分析获取的神经元细胞外记录是其中的一项关键步骤。将电极放置在脑组织中,靠近电极的神经元细胞在和其他神经元细胞进行电信号传递时,电信号被电极尖端所测量,由于电信号呈现尖锋波形而被称为尖锋。为了便于研究,通常需要将产生尖锋的神经元种类和尖锋波形记录下来。而这种检测和分配尖锋的过程被称为尖锋排序。
现在多电极技术可以同时记录上千个神经元的尖锋发放。多个神经元在微电极周围同时进行放电,此时所记录的尖锋可能是数个神经元锋电位的叠加。这样叠加后的尖锋形状与任意单独的尖锋的形状不同。重叠尖锋常常会导致尖锋排序出现偏差,降低尖锋排序的性能。因此如何处理重叠尖锋分类问题将会变得尤为重要。
目前,模板匹配法、稀疏优化法、最大后验估计法是相对有效地解决重叠尖锋的方法。模板匹配法,通过构建多种重叠模板,对重叠尖锋进行匹配。但当由相似模板的神经元发生重叠的时候,自动尖锋分类器仍然容易出错。稀疏优化法,为连续值尖锋的时间估计提供了一个统一的过程,即便过程中存在尖锋重叠的情况,也能进行尖锋排序,这样侧面的解决重叠尖锋问题。但是该方法很少被使用,主要是因为解决稀疏线性逆问题非常困难。最大后验估计法,将尖锋排序的过程表述为统计估计问题,将测量值与估计的数量相关联,并指定相邻的神经元进行线性叠加,便能额外识别出重叠尖锋,已达到处理重叠尖锋的目的。
随着深度学习在计算机视觉、自然语言处理的蓬勃发展,深度学习方法已在许多复杂应用中证明了它的强大与精准。根据现有技术显示,仅有通过一维CNN+LSTM的模型对重叠尖锋进行分类,然而,CNN+LSTM模型中,CNN模型部分随着网络的加深,出现梯度弥散、梯度消失这种非常严重的问题,而且由于基于一维CNN模型基于时间序列的深度模型均采用一维卷积核,模型的泛化性能和适用性有待进一步提高;而LSTM模型会消耗大量计算资源、难以进行并行化处理、依赖性可能会被忽略或丢失。不仅如此,采用深度学习方法对于模型的训练样本有一定要求,需要训练样本尽可能的丰富,而且不同种类样本应该尽可能地分布均匀。然而,在尖锋的数据集中,通常非重叠尖锋数量会远远多于重叠尖锋数量,这样将会不利于重叠尖锋分类模型进行训练。
发明内容
针对现有技术中的上述不足,本发明提供了一种基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法。
为了达到上述发明目的,本发明采用的技术方案为:
一种基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法,包括如下步骤:
S1、构建基于格拉姆角和场和CBAM-Resnet34的重叠尖锋分类模型;
S2、对原始尖峰数据集分为重叠尖峰和非重叠尖峰,对分类得到的重叠尖峰数据和非重叠尖峰数据进行预处理,得到重叠尖峰数据训练集、重叠尖峰数据训练模板以及尖峰数据训练集,并利用重叠尖峰数据构建测试集;
S3、将重叠尖峰数据训练集中的一维尖峰数据转换为二维图像,并将得到的二维图像作为输入数据传入S1所构建的重叠尖锋分类模型进行训练,同时将测试集中的一维尖峰数据转换为二维图像,并输入到训练完毕的重叠尖锋分类模型进行分类;
S4、对分类结果进行评估。
进一步的,所述S2中预处理的具体方式为:将非重叠尖锋随机分为三个部分:
第一个部分与选出的重叠尖锋组成重叠尖峰数据训练集;
第二个部分根据对应的聚类标签,构建不同的重叠尖峰数据训练模板;
第三个部分与重叠尖锋训练模板组成尖峰数据训练集。
进一步的,所述S3中重叠尖峰数据训练集和测试集中的一维尖峰数据转换为二维图像的具体方式为:
S31、对实际观测的多个尖峰数据时间序列进行编码,并将编码的尖峰数据时间序列进行缩放;
S32、将缩放后的时间尖峰数据时间序列的值编码为角余弦,并将其对应的时间戳编码为半径映射至极坐标系下;
S33、定义格拉姆角和场并利用所定义的格拉姆角和场提取缩放后的尖峰数据时间序列中时间间隔之间的相关关系,根据所提取的尖峰数据时间序列中时间间隔之间的相关关系进行重叠尖峰分类。
进一步的,所述S31中将编码的尖峰数据时间序列进行缩放的具体方式为:
其中,为缩放后的尖峰数据时间序列中第i个元素,/>为尖峰数据时间序列中的第i个元素,/>为尖峰数据时间序列。
进一步的,所述S32中将缩放后的时间尖峰数据时间序列的值编码为角余弦,并将其对应的时间戳编码为半径映射至极坐标系下的具体方式为:
其中,为时间序列/>映射在极坐标中的角度,/>为极坐标半径,为时间戳,/>为规范极坐标系跨度的常数因子,/>为缩放后的尖峰数据时间序列,/>为缩放后的尖峰数据时间序列元素。
进一步的,所述S33中格拉姆角和场表示为:
其中,为缩放后的尖峰数据时间序列映射在极坐标中的角度,/>为每一个格拉姆角和场图像的像素,/>为缩放后的尖峰数据时间序列的索引。
进一步的,所述S3中重叠尖锋分类模型包括一个卷积核大小为11的卷积层、一个批归一化层、一个池化层、一个ReLU激活函数层和四个残差块,每个残差块包含两个卷积核大小为3/>3卷积层、一个注意力模块、和两个卷积层之间的批归一化层和ReLU激活函数层。
进一步的,所述注意力模块包括通道注意力模块和时空注意力模块,其中,通道注意力模块表示为:
式中,为sigmoid函数,/>为平均池化的权重,/>为最大池化的权重,/>为输入特征,/>为输入特征,/>为通道注意力模块平均池化后的输入特征,/>为通道注意力模块最大池化后的输入特征;
时空注意力模块表示为:
式中,为时空注意力模块平均池化后的输入特征;/>为时空注意力模块最大池化后的输入特征。
本发明具有以下有益效果:
该方法相比于传统的时域和频域特征提取的方法增强了时间序列的可视化表达,保留了时间序列的原始信息,对于噪声和异常值具有一定的鲁棒性和特征可解释性。该方式已经被广泛的应于其他EEG领域。证明了深度学习的应用可以适用于重叠尖锋分类的过程中,未来还可以探索去除嘈杂单元,合并过度分裂单元和分裂单元簇等方向。
附图说明
图1为基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法流程示意图。
图2为本发明实施例整体框架示意图。
图3为本发明实施例重叠尖锋数据集构建示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
一种基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法,如图1所示,包括如下步骤:
S1、构建基于格拉姆角和场和CBAM-Resnet34的重叠尖锋分类模型;
GASF-CBAM-Resnet34主要由两个部分构成,第一个部分是将一维的尖锋数据转化成二维的图像。第二个部分是将转化后的图像通过CBAM-Resnet34进行重叠尖锋分类,深度残差网络(Resnet)通过引入深度残差学习的方式解决了梯度弥散和梯度爆炸的问题,在计算机视觉领域取得了巨大的成功。本实施例中用于研究的深度残差网络结构如图2所示。网络包含一个卷积核大小为11的卷积层、一个批归一化层、一个池化层、一个ReLU激活函数层和四个残差块。如图3所示,每个残差块包含两个卷积核大小为3/>3卷积层、一个注意力模块、和两个卷积层之间的批归一化层和ReLU激活函数层,保证模型收敛。最后通过两个全连接层的到六分类结果。分类模型的具体结构如下表1:
表1分类模型的具体结构
卷积注意模块(CBAM)由通道注意力模块和时空注意力模块组成,该模块关注重要特征,抑制不必要特征。
通道注意力模块通过特征的通道间关系来生成一个通道注意图,通道注意力关注图像中最具有意义的部分。该模块将输入特征同时进行平均池化和最大池化操作,生成两个不同的空间上下文描述,然后将空间上下文描述送入多层感知机中,最终使用元素求和合并输出特征向量,以生成通道注意图。通道注意力模块的描述如下:
其中为sigmoid函数,/>为平均池化的权重,/>为最大池化的权重,/>为输入特征,/>为输入特征。
时空注意力模块通过输入特征的空间关系来生成一个空间注意图,空间注意力关注图像中最具有意义的位置,是通道注意力模块的补充。该模块通过将最大池化和平均池化串行操作,聚合成一个特征图,然后通过卷积生成空间注意图。空间注意力模块的描述如下:
其中为sigmoid函数,/>为卷积操作。
S2、对原始尖峰数据集分为重叠尖峰和非重叠尖峰,并对分类得到的重叠尖峰数据和非重叠尖峰数据进行预处理,得到重叠尖峰数据训练集、重叠尖峰数据训练模板以及尖峰数据训练集;
该模型首先利用格拉姆角和场将尖锋这种一维的时序信号转变成二维图像作为模型的输入。引入格拉姆角和场,旨在解决一维CNN模型相较于二维CNN模型泛化性弱以及依赖性不强的问题。格拉姆角和场是一种用于时间序列分析的特征提取方法。它将时间序列归一化后,计算时间序列中所有点对之间的差异,并使用这些差异计算每对点之间的余弦相似度,并得到相似性矩阵,最后通过相似矩阵的每个值映射到单位元上来构建格拉姆角和场矩阵。具体而言:
根据原始的尖锋数据集,需要将数据进行分类,分为重叠尖锋和非重叠尖锋两类。然后将非重叠尖锋随机分为三个部分。第一个部分与之前选出的重叠尖锋组成训练集。第二个部分需要根据它们的聚类标签,构建不同的重叠尖锋训练模板。第三个部分需要与重叠尖锋训练模板一起组成训练集。
本实施例以“Wave_clus”中提供的模拟数据集为基础,构建重叠尖锋训练模板。该数据集由594个不同的平均尖锋形状组成,叠加背景噪音,在随机时间和幅度上进行采样,采样率为24000Hz。表2列出了“Wave_clus”数据集中不同类别的尖锋数量,其中Overlap1、Overlap2、Overlap3分别表示Cluster1和Cluster2重叠的尖锋、Cluster1和Cluster3重叠的尖锋、Cluster2和Cluster3重叠的尖锋。所有重叠尖锋数据均不包含25个采样点后的数据,因为25个采样点足以分离两个尖锋的主波形。因此,该类尖锋数据,既不包含在非重叠尖锋数据中,也不包含在重叠尖锋数据中。
表2 “Wave_clus”数据集中不同类别的尖锋数量
以构建“Wave_clus”中C_Difficult01_noise_01的重叠尖锋分类训练模板为例。首先,从数据集中筛选出包含重叠尖锋和非重叠尖锋的数据,每个尖锋数据包括64个采样点。接着,从C_Difficult01_noise_01中筛选出没有重叠的非重叠尖锋。再从这个非重叠尖锋集合中随机选取两种不同类别的尖锋,在随机采样点位置进行线性叠加,构建重叠尖锋模板。根据原始尖锋的类别标签,将两个原始类别标签相加以得到重叠尖锋模板的标签。通过多次构建重叠尖锋模板,完成训练集的构建。由于模板构建中所有随机选择均服从均匀分布,因此有效解决了训练样本少和训练样本分布不均的问题。所有随机数采用Pythonrandom库中的randint()函数生成随机整数,旨在指定范围内返回随机整数。
S3、将重叠尖峰数据训练集中的一维尖峰数据转换为二维图像,并将得到的二维图像作为输入数据传入S1所构建的重叠尖锋分类模型进行训练,同时将测试集中的一维尖峰数据转换为二维图像,并输入到训练完毕的重叠尖锋分类模型进行分类;
要用格拉姆角和场的方法,将重叠尖锋训练集中的一维尖锋数据转换成二维图像。这些图像将构成图片集,并作为输入数据传入 GASF-CBAM-Resnet34 模型进行训练。接着,我们可以将测试集中的数据也按照同样的方式转换为二维图像,并输入到已经训练完毕的 GASF-CBAM-Resnet34 模型中进行分类,以得到分类结果。
格拉姆角场分为格拉姆角总和场(GASF)和格拉姆角差分场(GADF)。这两种格拉姆角场均采用极坐标系表示时间序列,而非典型的笛卡尔坐标,使编码过程能够可视化,同时编码后的图片保存了时间依赖性和与原始数据的关联性,该方式使得一些具有时间依赖性的时序数据如EEG、EOG、ECG也可以运用最新的计算机视觉模型,以达到更好的效果。
格拉姆角和场算法具体实现如下:假定个实质观测的时间序列,将/>进行缩放使得所有值都落在[0,1]的区间中:
将进行缩放使得所有值都落在[0,1]的区间中:
其中,为缩放后的尖峰数据时间序列元素,/>为尖峰数据时间序列中的元素,/>为尖峰数据时间序列;
然后我们将缩放后的时间序列将值编码为角余弦,时间戳编码为半径映射在极坐标系中,公式如下:
其中,为时间序列/>映射在极坐标中的角度,/>为极坐标半径,为时间戳,/>为规范极坐标系跨度的常数因子,/>为缩放后的尖峰数据时间序列,/>为缩放后的尖峰数据时间序列元素。
时间序列经过放缩后在[0,1]的范围内,该范围内的格拉姆角场具有准确的逆映射。而且这种极坐标系表示方法将时间尺度的变化映射为极坐标系的半径随时间的推移,振幅的变化映射为极坐标系的角度。通过计算三角函数的和或者差值,来识别不同时间间隔内的时间相关性。格拉姆和角场(GASF)被定义如下:
值得注意的是,该方式将时间序列数据编码到极坐标后,可以很容易地提取时间间隔之间的相关系数。由于保留了局部时间关系这种特征,因此能够更加准确地进行重叠尖锋分类。
S4、对分类结果进行评估。
非重叠尖锋和重叠尖锋之间存在着数据不平衡性,且重叠尖锋的数据太少,如果直接采用现有的重叠尖锋数据无法对于重叠尖锋分类模型进行有效地训练。看到通过重叠尖锋模板生成的训练集,有效地解决了原始重叠尖锋少,训练数据不平衡问题。
为了验证GASF-CBAM-Resnet34重叠尖锋分类模型的可行性,我们在“Wave_clus”中提供的4个模拟数据集C_Easy1、C_Easy2、C_Difficult1、C_Difficult2中进行了一系列重叠尖锋分类实验,详细的实验结果如下表3。
表3对比模型的参数设置
然后,我们对比了格拉姆角和场(GASF)相较于递归图(RP)、马尔科夫变迁场(MTF)、格拉姆角差场(GADF)来凸显格拉姆角和场相较于其他转化算法更能提高分类的准确率。我们对原始数据集进行了相同的处理,并全都采用基于CBAM-Resnet34作为重叠尖锋分类器进行实验,如表4所示。
表4实验结果对比
可以看到除了数据集C_Easy1_040、C_Easy2_005、C_Easy2_010、C_Easy1_035上,运用格拉姆角和场将一维尖锋数据转变为二维图像,可以明显地提高模型的准确率。格拉姆角和场对比递归图、格拉姆角差场和马尔科夫变迁场模型准确率提高了2.0%、2.2%和9.2%。验证了格拉姆角和场相较于其他转变方法的优越性。
为了验证不同的注意力机制模块对于模型准确率的影响。我们首先选取了没有引入任何注意力机制的Resnet34模型、ECA-Resnet34(Resnet34集成ECA模块)模型和仅仅用了CBAM模型块中的通道注意力模块的Spatial-Resnet34模型作为CBAM-Resnet34模型的对比模型。所有的模型均采用格拉姆角和场将一维尖锋数据转变为二维图像的方式进行对比实验。和CBAM注意力机制模块类似,ECA模块是一种通道注意力模块,他只涉及少量参数,就能给模型带来明显提升,常常被应用在视觉模型中,而且还不会改变输入特征图的大小,如表5所示。
表5模型准确率和配对t检验结果
CBAM-Resnet34相较于原始的Resnet34和ECA-Resnet34上均较为明显地提升,而相较于Spatial-Resnet34没有明显提升且差异不显著。对比不同的注意力机制,我们发现在数据集C_Difficult1上提升最明显,分别提升了3.8%、5.5%、1.0%。C_Easy1上提升较为不明显,分别提升了1.5%、3.1%、0.65%。
为了进一步证明提出的GASF-CBAM-Resnet34方法的优越性,将所提出的方法与其他方法进行了比较。Liu使用一维CNN+Lstm的方式对于重叠尖锋进行分类。但是在Liu的工作中,将重叠尖锋分类为构成重叠尖锋的原始尖锋也为正确分类。我们并没有采取这种思路,而是将重叠尖锋单独作为一个类别,这样旨在训练出一个更加精确的重叠尖锋分类模型,更加验证我们模型的准确率更高,鲁棒性更强。不仅在低级别噪音下,我们的模型有着更加优秀的表现,而且在一些高噪声的数据集上,也有着不俗的表现。因为difficult数据集每个类别之间的相似度在99%以上,为重叠尖锋分类带来不小的挑战,如表6所示。
表6对比模型的参数设置
我们采用“wave_clus”的模拟数据集构建重叠尖锋训练集,并在用数据集中的重叠尖峰来对这三个部分进行评价。
首先,当数据集严重倾斜时,可能导致高假阴性。而且分类器会更关注多数类。此时,分类器在多数类别上实现高度准确,在少数类别上表现不佳[[i]]。由表1中可知,重叠尖锋的数量是远远低于非重叠尖锋数量的。所以我们提出了重叠尖锋模板以构建训练集。虽然构建方法简单,但是解决原始数据集分布不均匀这个问题。然而,这个方法也存在着一定的缺陷,由于“wave_clus”模拟数据集,类别少,所以重叠尖锋绝大部分是两类叠加,因此,无法处理多类别叠加的重叠尖锋问题。但是,这种构建重叠尖锋模板的思路可以沿用,可以构建基于不同概率分布的模板。从多类别中根据概率密度选取类别进行叠加,构建重叠尖锋模板。
然后,当前深度学习在spike sorting主要采用1D-CNN,虽然取得不错的性能,但由于一维CNN模型相较于二维CNN模型泛化性弱、适用性不强,因此本实施例采用了2D-CNN构建模型。特别是本实施例通过格拉姆角和场的方式将一维的尖锋序列转变为二维的图片作为模型的输入,在不改变尖锋数据前后时序关系的前提下,该方式能将更多的当前领域火爆的CV模型运用到重叠尖锋分类中。结果表明,通过格拉姆角和场将一维尖锋序列转变为二维图像一定程度上提高了重叠尖锋分类的准确率。说明这种将一维数据转变为二维数据的方式,可以将数据中隐藏的信息呈现出来,更加全面地反映数据的特征。
最后,对于重叠尖锋分类过程中出现在一些数据集上或一些方式上准确率提升不明显进行讨论。模型在分类C_Easy2数据集的重叠尖锋时,准确率在一维输入和二维输入上差别不明显,我们首先怀疑是CBAM模块对于一维输入的Resnet34提升明显,所以我们对于两种模型同时去掉CBAM模块,再次进行了对比实验,实验结果如表7。
表7 对比实验结果
可见在去掉CBAM模块之后,分类准确率没有明显区别。所以我们怀疑C_Easy2数据集本身过于简单,导致无法凸显我们方法的优势,为了验证我们怀疑,我们对于其他数据集做了相同的实验。实验结果如表8-10所示。
表8对比实验结果1
表9对比实验结果2
表10 对比实验结果3
可见当采用C_Difficult1和C_Difficult2这种困难数据集时,对于分类准确率提升效果更加明显,而对于C_Easy1和C_Easy2这种简单数据集时,效果提升不明显。
其次,相较于Spatial-Resnet34没有明显提升且差异不显著,是因为由于尖锋数据本身是单通道数据,只有空间特征,几乎没有通道特征。但是将尖锋数据进行卷积操作之后,原本单通道数据变为多通道数据,但这种通道特征不明显,数据主要特征还是空间特征。所以这也是CBAM-Resnet34模型分类准确率和Spatial-Resnet34模型分类准确率差别不大,而只采用通道注意力机制的ECA-Resnet34的分类准确率远不如前两者的合理原因。但考虑到神经科学的不断进步,尖锋数据更为可能是多通道数据,因此选择CBAM模块作为模型的注意力模块更为合理。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (8)
1.一种基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法,其特征在于,包括如下步骤:
S1、构建基于格拉姆角和场和CBAM-Resnet34的重叠尖锋分类模型;
S2、对原始尖峰数据集分为重叠尖峰和非重叠尖峰,对分类得到的重叠尖峰数据和非重叠尖峰数据进行预处理,得到重叠尖峰数据训练集、重叠尖峰数据训练模板以及尖峰数据训练集,并利用重叠尖峰数据构建测试集;
S3、将重叠尖峰数据训练集中的一维尖峰数据转换为二维图像,并将得到的二维图像作为输入数据传入S1所构建的重叠尖锋分类模型进行训练,同时将测试集中的一维尖峰数据转换为二维图像,并输入到训练完毕的重叠尖锋分类模型进行分类;
S4、对分类结果进行评估。
2.根据权利要求1所述的基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法,其特征在于,所述S2中预处理的具体方式为:将非重叠尖锋随机分为三个部分:
第一个部分与选出的重叠尖锋组成重叠尖峰数据训练集;
第二个部分根据对应的聚类标签,构建不同的重叠尖峰数据训练模板;
第三个部分与重叠尖锋训练模板组成尖峰数据训练集。
3.根据权利要求1所述的基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法,其特征在于,所述S3中重叠尖峰数据训练集和测试集中的一维尖峰数据转换为二维图像的具体方式为:
S31、对实际观测的多个尖峰数据时间序列进行编码,并将编码的尖峰数据时间序列进行缩放;
S32、将缩放后的时间尖峰数据时间序列的值编码为角余弦,并将其对应的时间戳编码为半径映射至极坐标系下;
S33、定义格拉姆角和场并利用所定义的格拉姆角和场提取缩放后的尖峰数据时间序列中时间间隔之间的相关关系,根据所提取的尖峰数据时间序列中时间间隔之间的相关关系进行重叠尖峰分类。
4.根据权利要求3所述的基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法,其特征在于,所述S31中将编码的尖峰数据时间序列进行缩放的具体方式为:
其中,为缩放后的尖峰数据时间序列中第i个元素,/>为尖峰数据时间序列中的第i个元素,/>为尖峰数据时间序列。
5.根据权利要求3所述的基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法,其特征在于,所述S32中将缩放后的时间尖峰数据时间序列的值编码为角余弦,并将其对应的时间戳编码为半径映射至极坐标系下的具体方式为:
其中,为时间序列/>映射在极坐标中的角度,/>为极坐标半径,/>为时间戳,/>为规范极坐标系跨度的常数因子,/>为缩放后的尖峰数据时间序列,/>为缩放后的尖峰数据时间序列元素。
6.根据权利要求3所述的基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法,其特征在于,所述S33中格拉姆角和场表示为:
其中,为缩放后的尖峰数据时间序列映射在极坐标中的角度,/>为每一个格拉姆角和场图像的像素,/>为缩放后的尖峰数据时间序列的索引。
7.根据权利要求1所述的基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法,其特征在于,所述S3中重叠尖锋分类模型包括一个卷积核大小为的卷积层、一个批归一化层、一个池化层、一个ReLU激活函数层和四个残差块,每个残差块包含两个卷积核大小为卷积层、一个注意力模块、和两个卷积层之间的批归一化层和ReLU激活函数层。
8.根据权利要求7所述的基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法,其特征在于,所述注意力模块包括通道注意力模块和时空注意力模块,其中,通道注意力模块表示为:
式中,为sigmoid函数,/>为平均池化的权重,/>为最大池化的权重,/>为输入特征,为通道注意力模块平均池化后的输入特征,/>为通道注意力模块最大池化后的输入特征,/>为平均池化,/>为最大池化;
时空注意力模块表示为:
式中,为时空注意力模块平均池化后的输入特征;/>为时空注意力模块最大池化后的输入特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311347683.3A CN117093918A (zh) | 2023-10-18 | 2023-10-18 | 一种基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311347683.3A CN117093918A (zh) | 2023-10-18 | 2023-10-18 | 一种基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117093918A true CN117093918A (zh) | 2023-11-21 |
Family
ID=88783633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311347683.3A Pending CN117093918A (zh) | 2023-10-18 | 2023-10-18 | 一种基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117093918A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113313059A (zh) * | 2021-06-16 | 2021-08-27 | 燕山大学 | 一种一维光谱分类方法及系统 |
CN115617159A (zh) * | 2021-07-12 | 2023-01-17 | 香港科技大学 | 用于脑机接口的基于强化学习的自适应状态观测 |
CN116127409A (zh) * | 2023-02-28 | 2023-05-16 | 湘潭大学 | 基于格拉姆角差场特征融合的非侵入式负荷识别方法 |
CN116338628A (zh) * | 2023-05-16 | 2023-06-27 | 中国地质大学(武汉) | 一种基于学习架构的激光雷达测深方法、装置及电子设备 |
-
2023
- 2023-10-18 CN CN202311347683.3A patent/CN117093918A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113313059A (zh) * | 2021-06-16 | 2021-08-27 | 燕山大学 | 一种一维光谱分类方法及系统 |
CN115617159A (zh) * | 2021-07-12 | 2023-01-17 | 香港科技大学 | 用于脑机接口的基于强化学习的自适应状态观测 |
CN116127409A (zh) * | 2023-02-28 | 2023-05-16 | 湘潭大学 | 基于格拉姆角差场特征融合的非侵入式负荷识别方法 |
CN116338628A (zh) * | 2023-05-16 | 2023-06-27 | 中国地质大学(武汉) | 一种基于学习架构的激光雷达测深方法、装置及电子设备 |
Non-Patent Citations (3)
Title |
---|
MINGXIN LIU 等: "Classification of overlapping spikes using convolutional neural networks and long short term memory", 《COMPUTERS IN BIOLOGY AND MEDICINE》, vol. 148, no. 105888, pages 1 - 10 * |
YIZHU SHI 等: "A Hybrid Method for Identifying the Spring Energy Storage State of Operating Mechanism in Circuit Breakers", 《IEEE TRANSACTIONS ON INSTRUMENTATION AND MEASUREMENT》, vol. 72, no. 3506809, pages 1 - 9 * |
YUNFEI ZENG 等: "A novel approach to tool condition monitoring based on multi-sensor data fusion imaging and an attention mechanism", 《MEASUREMENT SCIENCE AND TECHNOLOGY》, vol. 32, no. 055601, pages 1 - 17 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108573225B (zh) | 一种局部放电信号模式识别方法及系统 | |
CN110361778B (zh) | 一种基于生成对抗网络的地震数据重建方法 | |
CN109948647A (zh) | 一种基于深度残差网络的心电图分类方法及系统 | |
CN112633382B (zh) | 一种基于互近邻的少样本图像分类方法及系统 | |
CN112294341B (zh) | 一种基于轻量卷积神经网络的睡眠脑电纺锤波识别方法及系统 | |
CN116137036B (zh) | 基于机器学习的基因检测数据智能处理系统 | |
CN113516638B (zh) | 一种神经网络内部特征重要性可视化分析及特征迁移方法 | |
CN111134664A (zh) | 一种基于胶囊网络的癫痫放电识别方法、系统和存储介质 | |
CN114067915A (zh) | 一种基于深度对抗变分自编码器的scRNA-seq数据降维方法 | |
CN115204231A (zh) | 基于eeg脑电多维特征的数字化人机界面认知负荷评估方法 | |
CN113421546A (zh) | 基于跨被试多模态的语音合成方法及相关设备 | |
CN113762151A (zh) | 一种故障数据处理方法、系统及故障预测方法 | |
CN111863135B (zh) | 一种假阳性结构变异过滤方法、存储介质及计算设备 | |
CN111127407B (zh) | 一种基于傅里叶变换的风格迁移伪造图像检测装置及方法 | |
CN111931757A (zh) | 基于mdlbp分块直方图和pca降维的指静脉快速排序方法及装置 | |
CN117093918A (zh) | 一种基于格拉姆角和场和CBAM-Resnet34的重叠尖锋识别方法 | |
CN114239757B (zh) | 一种电磁时间序列数据的去噪方法及系统 | |
CN114387524B (zh) | 基于多层级二阶表征的小样本学习的图像识别方法和系统 | |
CN115308705A (zh) | 一种基于生成对抗网络的多姿态极窄脉冲回波生成方法 | |
CN114496099A (zh) | 细胞功能注释方法、装置、设备及介质 | |
Wiling | Locust Genetic Image Processing Classification Model-Based Brain Tumor Classification in MRI Images for Early Diagnosis | |
CN112579670A (zh) | 一种精细油藏分布的勘察数据分析方法及系统 | |
CN114886440B (zh) | 癫痫样放电分类模型训练及识别方法、系统及电子设备 | |
CN111581640A (zh) | 一种恶意软件检测方法、装置及设备、存储介质 | |
Rabbani et al. | Topological signatures as complementary features for deep learning model: A survey |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |