CN116831594A - 一种基于迭代图卷积神经网络的癫痫脑电分类方法 - Google Patents

一种基于迭代图卷积神经网络的癫痫脑电分类方法 Download PDF

Info

Publication number
CN116831594A
CN116831594A CN202310623456.2A CN202310623456A CN116831594A CN 116831594 A CN116831594 A CN 116831594A CN 202310623456 A CN202310623456 A CN 202310623456A CN 116831594 A CN116831594 A CN 116831594A
Authority
CN
China
Prior art keywords
node
channel
graph
new
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310623456.2A
Other languages
English (en)
Inventor
张玉乾
付永江
彭玉娇
张玉麟
牛嵩云
程婕
程远
崔婧
隋毅
于永强
孙仁诚
吴舜尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Shipbuilding Human Factors Engineering Research Institute Qingdao Co ltd
Original Assignee
China Shipbuilding Human Factors Engineering Research Institute Qingdao Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Shipbuilding Human Factors Engineering Research Institute Qingdao Co ltd filed Critical China Shipbuilding Human Factors Engineering Research Institute Qingdao Co ltd
Priority to CN202310623456.2A priority Critical patent/CN116831594A/zh
Publication of CN116831594A publication Critical patent/CN116831594A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/369Electroencephalography [EEG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/369Electroencephalography [EEG]
    • A61B5/372Analysis of electroencephalograms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4076Diagnosing or monitoring particular conditions of the nervous system
    • A61B5/4094Diagnosing or monitoring seizure diseases, e.g. epilepsy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7253Details of waveform analysis characterised by using transforms
    • A61B5/7257Details of waveform analysis characterised by using transforms using Fourier transforms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Psychiatry (AREA)
  • Physiology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Signal Processing (AREA)
  • Neurology (AREA)
  • Neurosurgery (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Psychology (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Fuzzy Systems (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

本发明公开了基于迭代图卷积神经网络的癫痫脑电分类方法,通过计算癫痫脑电数据节点相似性和距离相似性作为原始图结构,引入多头图注意力机制进行节点相似性度量学习,迭代优化图结构和图卷积神经网络的参数,寻找最优的图结构并且达到最优的癫痫脑电分类效果。在TUEP双极和单极蒙太奇数据集,以及TUAB和MPI LEMON联合数据集进行实验,验证了所提方法的有效性。其具有更好的癫痫脑电分类效果,获取更准确的脑电图结构。

Description

一种基于迭代图卷积神经网络的癫痫脑电分类方法
技术领域:
本发明属于脑电处理技术领域,具体涉及一种基于迭代图卷积神经网络的癫痫脑电分类方法。
背景技术:
大脑的神经元通过电信号相互通信,当神经元过度或不适当放电超过了大脑的控制能力时,会导致包括肢体抽搐、口吐白沫、眼球上翻、短暂的意识混乱或失去意识等危害身体健康的症状,称为癫痫(Epilepsy)。癫痫是人类已知的最古老疾病之一,据世界卫生组织的统计(数据截止至2022年2月9日),全球大约有6500万人受癫痫的影响,其中近80%的患者居住在低收入和中等收入的发展中国家,大约每1000人中会有4至10人患有活动性癫痫。目前,对癫痫疾病的诊断通常通过采集和分析自发脑电活动信号进行,即在没有外界刺激的情况下,使用采集设备在头皮特定位置(电极通道)记录大脑细胞在一段时间范围内的放电活动的频率和振幅,构成随时间变化的脑电波形图(Electroencephalogram,EEG)。对EEG脑电数据进行特征分析和建模分析,有效提取脑电数据特征,识别癫痫脑电信号,可辅助医生快速做出更为准确的诊断,具有十分重要的临床应用价值。
EEG不同通道脑电数据之间具有时间和空间相关性,现有研究通常将电极通道抽象为节点,通道之间的相关性抽象为连边,以图的形式表达EEG脑电数据,已有研究表明癫痫患者EEG脑电的图拓扑与健康人相比发生了显著改变,这为基于图模型的EEG癫痫脑电信号分类研究提供了重要依据。图卷积神经网络(Graph Convolutional Network,GCN)是一种用于处理图结构的深度学习模型,它对节点和其邻居节点进行消息传递,然后对传递后的信息进行聚合,GCN模型通过堆叠多个卷积层来提高模型的性能,可用于节点分类和图分类,在许多实际应用中具有出色的表现。目前,已有学者将GCN用于癫痫脑电疾病的分类。Chen等提出了基于图卷积网络的癫痫脑电自动检测模型(E-GCN),该模型具有5层图卷积结构,在公共数据集Boon和CHB-MIT进行实验,结果表明E-GCN在分类精度上有较好提升。Zeng等提出使用层次图卷积网络(Hierarchical Graph Convolution Networks,HGCN)对原始脑电信号进行处理,并将从中提取的多个时域和频域特征作为网络的输入。HGCN利用了每个单电极之间的拓扑关系,在CHBMIT数据集上的准确率提高了5.77%,在TUH数据集上的灵敏度和特异性分别提高了2.43%。Yang等提出了一种时空-谱层次图卷积网络和一种主动阵前间隔学习方案,用于患者特异性脑电图发作预测。Yanna等提出了一种基于线性图卷积网络(LGCN)的癫痫发作检测模型,增强了癫痫发作和非癫痫发作期间原始EEG信号的特征嵌入,在CHB-MIT数据集上进行实验取得了较好的效果。
虽然GCN在癫痫脑电分类任务中表现出色,但前提条件是用于训练的数据的图拓扑是非常准确的,GCN输入的图拓扑通常是根据专家经验手动定义和计算生成的。由于图拓扑是由数据的原始特征空间构造出来的,而这种构造方式并不能反映出数据的真实拓扑结构,必然会影响GCN的性能。另一方面,在训练过程中,GCN通常依赖于一个固定的图拓扑,并不能根据分类任务优化图拓扑以达到更好支持分类任务的目的。迭代深度图学习(Iterative Deep Graph Learning,IDGL)是一种在训练过程中迭代更新图以寻找最优图结构用于分类的新型图神经网络模型。该模型使用余弦相似度进行图相似度度量以学习图的结构,分类性能存在一定不足。
发明内容:
针对上述问题,本发明的目的在于提出一种基于迭代图卷积神经网络的癫痫脑电分类方法,通过计算癫痫脑电数据节点相似性和距离相似性作为原始图结构,引入多头图注意力机制进行节点相似性度量学习,迭代优化图结构和图卷积神经网络的参数,寻找最优的图结构并且达到最优的癫痫脑电分类效果。在TUEP双极和单极蒙太奇数据集,以及TUAB和MPI LEMON联合数据集进行实验,验证了所提方法的有效性。
为了实现上述目的,本发明涉及的基于迭代图卷积神经网络的癫痫脑电分类方法,具体包括以下步骤:
(1)采集脑电数据,计算癫痫脑电多通道的多特征矩阵作为原始脑电通道节点特征init_node,根据原始脑电节点特征计算癫痫脑电节点相似性作为原始图结构init_adj,两部分共同组成GCN可用的图数据,作为E-IGCN的输入;
具体地,步骤(1)中对原始脑电图通过进行频域分析、时频分析和非线性动力学分析等分析方法提取功率谱密度等特征作为原始脑电通道节点特征。
具体地,步骤(1)中原始图结构init_adj能够由电极通道的相对位置和原始特征空间计算得出,分别是通道i与通道j之间的空间距离关系和通道i与通道j之间频谱相关性/>具体通过公式(4)-(6)计算,所有节点的相似性组成相似性矩阵D,即为init_adj,
其中,(xi,yi,zi)与(xj,yj,zj)分别是通道i和通道j在笛卡尔坐标空间中定位到半径为r的球面上的点,xi(f)和xj(f)分别为通道i和通道j的时间序列和/>的傅里叶变换,/> 为xj(f)的复共轭。
(2)将init_node和init_adj输入到相似度度量学习模块,更新图结构为第一层new_adj,或将第t-1层new_node和new_adj输入到相似度度量学习模块,更新图结构为第t层new_adj,t为迭代层数,是大于等于2的正整数;
步骤(2)具体包括:
(201)脑电通道i和脑电通道j在输入图中是相邻的两个节点,对于这两个脑电通道的嵌入向量和/>和/>是原始节点特征init_node,或上一层GCN训练后的节点嵌入new_node,计算它们的注意力值eij,计算方法如公式(7)所示。
其中,W是一个可学习的权重向量,借助W对通道特征和/>进行数据增维,对高维嵌入向量进行特征拼接,最后借助α()将拼接后的高维向量映射为一个标量,得到通道i对于通道j的注意力得分;
(202)将该脑电通道i的每个邻居的注意力值eij进行归一化操作,将每个邻居的注意力分数和除以所有邻居的注意力分数之和,归一化后的注意力权重作为最终的通道相似性得分,具体做法如公式(8)所示,
其中,Ni表示通道i的所有邻居节点,eio表示脑电通道i和脑电通道o的注意力值;
(203)根据公式(9),将相似性度量函数修改为多头注意力机制,采用平均法整合多头结果,得到节点i和j的相似性Aij,所有节点的相似性组成非负边权矩阵A;
(204)设置一个非负阈值ε,将A中那些小于ε的元素设置为0,得到一个非对称稀疏非负邻接矩阵A*,令A(t)=A*,从而实现了对图拓扑的稀疏化处理,其中ε设置为0.1;
(205)按照公式(10),将A(1)与init_adj进行加权,得到第一层new_adj,或将A(t)与第一层new_adj进行加权,得到第t层new_adj;
A*(t)=λL(0)+(1-λ){ηf(A(t))+(1-η)f(A(1))} (10)
其中,A*(t)表示每一层最终得到的新的图结构,表示初始图的归一化邻接矩阵,A(0)即init_adj;A(t)和A(1)是在第t次和第1次迭代时计算出的两个邻接矩阵,A(1)是根据原始节点特征计算出来的,而A(t)是根据t-1次迭代更新的节点嵌入Zt-1(即上一层的new_node)计算得出的。f()是归一化方法,将计算得出的邻接矩阵进行归一化处理,计算方法如公式(11)所示,其中Ni表示节点i的所有邻居节点。
(3)随后同时将init_node和第一层new_adj作为图卷积神经网络GCN的输入,根据公式(12),借助新的图结构聚合邻居节点信息,更新节点特征为第一层new_node;
或将第t-1层new_node和第t层new_adj作为图卷积神经网络GCN的输入,根据公式(12),借助新的图结构聚合邻居节点信息,更新节点特征为第t层new_node,依次迭代,直到达到最好的癫痫脑电分类效果;
其中H(t)表示t层的特征向量矩阵(即init_node或对应new_node),I是单位矩阵,D是A(t)的度矩阵,/>σ是非线性激活函数,W(l)表示的是l层卷积变换的可训练的参数矩阵。
与现有技术相比,本发明具有以下有益效果:具有更好的癫痫脑电分类效果,获取更准确的脑电图结构。
附图说明:
图1为IDGL的总体架构图。
图2为E-IGCN方法整体框架图。
图3为E-IGCN方法工作流程图。
图4为E-IGCN迭代过程示意图。
图5为训练前后的边权热图,其中(a)为训练前边权热图,(b)为训练后边权热图。
图6为训练前后网络拓扑图,其中(a)为训练前网络拓扑图,(b)为训练后网络拓扑图。
图7为所选8通道训练前后网络拓扑图,其中(a)为训练前所选8通道网络拓扑图,(b)为训练后所选8通道网络拓扑图。
图8为参数λ对模型性能的影响变化图。
图9为参数η对模型性能的影响变化图。
图10为训练前后的边权热图,其中(a)为训练前边权热图,(b)为训练后边权热图。
图11为训练前后网络拓扑图,其中(a)为训练前网络拓扑图,(b)训练后网络拓扑图。
具体实施方式:
下面通过实施例对本发明作进一步描述。
实施例1:
一、迭代深度图学习模型
IDGL是一个端到端的迭代深度图学习模型,用于迭代学习图结构和图嵌入。IDGL提供了一种基于图神经网络优化网络图拓扑的迭代学习的思路,基于更好的节点嵌入学习更好的图结构,反过来基于更好的图结构学习更好的节点嵌入。当学习到的图结构接近下游预测任务优化的图时,迭代方法动态停止。
图1展示了IDGL模型的整体思想。IDGL使用相似度学习基于原始节点特征学习新的图结构。IDGL认为虽然初始图可能是有噪声的,但它通常仍然携带着关于真实图拓扑的丰富和有用的信息,将学习到的图结构作为原始图拓扑的补充,二者加权从而得到一个针对下游任务的GCN的优化图。GNN使用优化图进行卷积之后产生的节点嵌入作为输入特征回传到相似度学习中,构成迭代循环。在所有迭代之后,IDGL通过联合任务预测损失Lpred和图正则化损失LG得到混合损失L进行反向传播,以更新模型参数,如公式(1)所示。
L=Lpred+LG(1)
IDGL采用多头加权余弦相似度作为图相似度度量函数,如公式(2)所示。⊙表示哈达玛积,Wp是一个可学习的相似度权重向量,vi和vj表示相同形状的输入向量。采用多个权重向量计算不同的相似度系数矩阵进行加权,计算方法如公式(3)所示。
二、基于改进IDGL的癫痫脑电信号分类模型
为了解决癫痫脑电的GCN研究中普遍存在问题,即训练输入的图结构被设置成完美的且在训练过程中不再改变,基于IDGL进行改进,改进余弦相似度对于图的表示能力有限的缺点,重新设计多头图注意力机制为新的图相似度度量函数,提出了一个基于迭代图卷积神经网络的癫痫脑电分类方法(Classification method of epileptic EEG basedon iterative graph convolutional neural network,E-IGCN)。E-IGCN旨在搜索一个最优癫痫脑电图结构,以增强癫痫脑电的图表示能力和最终的疾病分类效果。
如图2所示,模型输入分为两部分,由图init_node和init_adj表示,前者是计算癫痫脑电多通道的多特征矩阵作为原始脑电通道节点特征,后者是根据原始脑电节点特征计算癫痫脑电节点相似性作为原始图结构,两部分共同组成GCN可用的图数据,作为E-IGCN的输入。E-IGCN迭代学习部分由两方面组成,分别是图相似度度量学习GLearn和图卷积神经网络GCN。
图3展示了E-IGCN的整体工作流程,获取脑电数据,然后提取的图数据并放入迭代学习模型中,图数据经过多轮GLearn和GCN的迭代后,得到了高质量的特征表示和图拓扑结构,最后对癫痫脑电进行整图分类。具体包括以下几个方面:
(1)脑电数据的图处理
采集一段时长(一般为十几分钟)的脑M通道的电波数据,将受试者的脑电数据以连续10秒为单位划分为N个切片。每个受试者的脑电图数据被划分成若干个时长为10s的M通道脑电数据。定义无向全连接图Gn=(V,En),表示切片n的通道之间的相互作用关系。其中V表示M(M=|V|)个通道的集合,表示节点集V之间的无向边的集合,用一个加权邻接矩阵/>来表示,其中每个节点的自连边Aii=1,i=1,2,...,M。
对于任一个切片,原始图结构可以由电极通道的相对位置和原始特征空间计算得出,分别是通道i与通道j之间的空间距离关系和通道i与通道j之间频谱相关性/>根据10-20国际标准导联系统各个通道的位置信息,得到通道在笛卡尔坐标系中的具体坐标值。通道i和通道j在笛卡尔坐标空间中定位到半径为r的球面上的点(xi,yi,zi)与(xj,yj,zj)之间的测地线距离/>定义为:
设xi(f)和xj(f)分别为通道i和通道j的时间序列和/>的傅里叶变换。交叉谱定义为/> 为xj(f)的复共轭。通道i和通道j的频谱相关性定义为归一化交叉谱的绝对值,如公式(5)所示。
节点i和j的相似性Dij由空间距离关系和频谱相关性加权得到,计算公式为:
所有节点(通道)的相似性组成相似性矩阵D,即为init_adj。
(2)相似度度量学习
使用图注意力机制作为相似度度量函数,结合输入图的拓扑结构,通过学习每个节点与邻居节点的关系,从而为每个节点赋予不同的注意力权重,以便更好地捕捉节点之间的关系和图结构特征。
首先,脑电通道i和脑电通道j在输入图中是相邻的两个节点,对于这两个脑电通道的嵌入向量和/>(这两个向量可以是原始节点特征,也可以是GCN训练后的节点嵌入),计算它们的注意力值eij,计算方法如公式(7)所示。
其中,W是一个可学习的权重向量,借助W对通道特征和/>进行数据增维,对高维嵌入向量进行特征拼接,最后借助α()将拼接后的高维向量映射为一个标量,得到通道i对于通道j的注意力得分。对通道i所有的邻居节点都要计算它们的注意力得分,其中对于通道j还需要重新计算其对通道i的注意力得分,需要注意的是,拼接操作导致eij≠eji,即整图的注意力矩阵是非对称的。最后将该脑电通道的每个邻居的注意力进行归一化操作,将每个邻居的注意力得分和除以所有邻居的注意力得分之和,归一化后的注意力权重作为最终的通道相似性得分,具体做法如公式(8)所示,Ni表示通道i的所有邻居节点,eio表示脑电通道i和脑电通道o的注意力值。
为了稳定学习过程并增加模型表达能力,如公式(9)所示,将相似性度量函数修改为多头注意力机制,采用平均法整合多头结果。具体来说,对于K头图注意力机制,每一头都有它独立的权重参数向量Wk,使用公式(8)计算K个独立的相似度矩阵,并将它们的平均值作为最终注意力得分,组成非负边权矩阵A。
其中,Aij表示相似度度量学习过程中得到的节点i和j的相似性,相似度度量学习过程中得到的所有节点的相似性组成非负边权矩阵A。
在许多网络中,底层图结构通常比全连通图要稀疏得多。由于全连通图计算成本大,可能存在不重要的边作为噪声被引入到数据中,进而影响最终的分类准确率。因此引入图拓扑稀疏化的思想到图相似度度量学习中,具体地做法是设置一个非负阈值ε,将A中那些小于ε的元素设置为0,得到一个非对称稀疏非负邻接矩阵A*,从而实现了对图拓扑的稀疏化处理,其中ε设置为0.1。
(3)迭代优化参数
迭代学习是一种逐步优化模型的方法,它通过反复迭代训练和调整模型参数,以最小化损失函数并提高模型性能。图4展示了E-IGCN的迭代过程,
(301)原始脑电图数据经过数据预处理和特征工程等前期操作后获得原始节点数据init_node和原始图结构init_adj;
(302)将init_node和init_adj输入到相似度度量学习模块(GLearn),得到第一层迭代GLearn产生的图结构,即对应非对称稀疏非负邻接矩阵A*,令A(1)=A*,按照公式(10)将第一层迭代GLearn产生的图结构(A(1))与init_adj(A(0))进行加权,更新图结构为new_adj(1层),即A*(1),令A(1)=A*(1)
A*(t)=λL(0)+(1-λ){ηf(A(t))+(1-η)f(A(1))} (10)
其中,A*(t)表示每一层最终得到的新的图结构,L(0)=D(0)-1/ 2A(0)D(0)-1/2表示初始图的归一化邻接矩阵,A(0)即init_adj;A(t)和A(1)是在第t次和第1次迭代时计算出的两个邻接矩阵,A(1)是根据原始节点特征计算出来的,而A(t)是根据t-1次迭代更新的节点嵌入Zt-1(即上一层的new_node)计算得出的。f()是归一化方法,将计算得出的邻接矩阵进行归一化处理,计算方法如公式(11)所示,其中Ni表示节点i的所有邻居节点。
(303)随后将同时init_node(H(0))和new_adj(1层),作为图卷积神经网络GCN的输入,根据公式(12),借助新的图结构聚合邻居节点信息,更新节点特征为new_node(1层),即H(1)
其中H(t)表示t层的特征向量矩阵(即init_node或对应new_node),I是单位矩阵,D是A(t)的度矩阵,/>σ是非线性激活函数,W(l)表示的是l层卷积变换的可训练的参数矩阵。
(304)将第一层迭代产生的new_node(1层)和new_adj(1层)输入到相似度度量学习模块(GLearn),得到第二层迭代GLearn产生的图结构,即对应非对称稀疏非负邻接矩阵A*,令A(2)=A*,按照公式(10)将第二层迭代GLearn产生的图结构(A(2))与new_adj(1层)(A(1))进行加权,更新图结构为new_adj(2层),即A*(2),令A(2)=A*(2)
(305)随后将同时new_node(1层)和new_adj(2层)作为图卷积神经网络的输入,借助新的图结构聚合邻居节点信息,根据公式(12),更新节点特征为new_node(2层);
(306)将第一层迭代产生的new_node(2层)和new_adj(2层)输入到相似度度量学习模块(GLearn),更新图结构为new_adj(3层);
(307)随后将同时new_node(2层)和new_adj(3层)作为图卷积神经网络的输入,借助新的图结构聚合邻居节点信息,更新节点特征为new_node(3层)
(308)依次迭代,直到达到最好的癫痫脑电分类效果。
其中,只有第一次迭代会直接用到init_node和init_adj,如图4中虚线1-3所示,后续迭代只需要借助更新的节点特征和图结构,如图中实线4-9所示。
考虑到原始图结构init_adj仍然携带着关于真实图拓扑的丰富和有用的信息,因此,第一层迭代GLearn产生的图结构需要与init_adj进行加权,用于保留原始图结构的部分信息,使用参数λ平衡权重,得到最终第一层迭代GCN可用的new_adj。按照此方式依次进行后续迭代,其中与第一次不同的是,后续迭代在加权过程中,首先需要将本次迭代GLearn产生的图结构与第一次迭代时保存的new_adj进行加权,使用参数η平衡,随后再与原始图结构init_adj进行加权。
网络搭建以及参数设置
使用pytorch框架搭建E-IGCN模型。经多次实验和调试,选择效果最优的一组超参数,优化器选择Adam,学习率为0.001,样本批次大小为32。其他重要的超参数的具体设置见表1,其中hidden_size为GCN中隐藏层的神经元个数,max_iter为最大迭代次数(如果在迭代过程中验证集效果不再优化,可提前跳出迭代),node_num为脑电图节点的个数,epoch为训练轮数,gl_dropout为节点相似度学习的丢弃率,graph_skip_conn和update_adj_ratio分别为原始图结构和第一层优化图结构的加权参数λ和η。
表1超参数值设置
有效性验证
为了验证E-IGCN所生成的图结构对于原始图的改进能力以及模型对于癫痫脑电分类的准确性,将设置两层图卷积的图卷积神经网络作为普通GCN对照组,记为E-GCNN,其中两层图卷积层的设计的模型输入均与E-IGCN保持一致,并且使用TUEP双极蒙太奇通道数据集对E-IGCN模型进行验证。为了验证E-IGCN所使用的多头图注意力机制对于余弦相似度在节点相似性计算的性能优劣,选择迭代深度图学习模型IDGL作为迭代模型对照组,与E-IGCN进行方法性能比较。
为避免E-IGCN模型在单一数据集上的随机性,进一步确保E-IGCN方法的泛化能力和可靠性,还使用了其他数据集进行验证,包括TUEP单极蒙太奇通道数据集以及TUAB和MPILEMON联合数据集。通过在不同数据集上进行测试和验证,可以更全面地评估E-IGCN方法的性能和应用价值,同时也可以确定其在不同数据集的适用性,为癫痫检测和诊断提供更加准确和可靠的工具。
E-IGCN与对照组模型E-GCNN和IDGL分别都采用了准确率(Accuracy),精确率(Precision),召回率(Recall),F1分数(F1-Score),AUC(Area Under Curve)等评价指标对模型进行综合评价。
TUEP双极蒙太奇通道数据集
TUH脑电数据集(https://isip.piconepress.com/projects/tuh_eeg/html/downloads.shtml)由10874个单独的受试者的16986个会话组成,每个会话包含至少一个EDF文件(受长期监控会话中包含更多EDF文件)和一个医生报告。为方便研究者下载数据集,该网站将来自每个患者的所有数据存储为单独的gzip文件,平均文件大小为4.1MB,总文件大小330GB(Obeid I,Picone J.The temple university hospital EEG data corpus[J].Frontiers in neuroscience,2016,10:196)。受试者为51%的女性,年龄从1岁以下到90岁以上,每个患者的平均治疗次数为1.56次。数据集中记录文件包含的通道数量最常见的为31个(53%),有些病例只有28个(30%)或23个(17%)该数据统计截止到v0.6版本,2022年12月17日已全面更新至v3.0版本(Obeid I,Picone J.The temple universityhospital EEG data corpus[J].Frontiers in neuroscience,2016,10:196)。
TUEP(The TUH EEG Epilepsy Corpus)是来自TUH脑电资料库的一个子集,下载地址为https://isip.piconepress.com/projects/tuh_eeg/downloads/tuh_eeg_epilepsy/。该数据集共有237名受试者的脑电信息,其中包含133名癫痫病患者在病发状态下的1360个脑电信号记录文件和104名受试者(为了平衡语料库,有些受试者是不患癫痫病的普通人)在静息状态所获取的288个脑电信号记录文件,共计1648个脑电信号文件(Veloso L,McHugh J,von Weltin E,et al.Big data resources for EEGs:Enablingdeep learning research[C]//2017IEEE Signal Processing in Medicine and BiologySymposium(SPMB).IEEE,2017:1-3)。数据采集过程中共有三种单极电极的记录参考,分别为:01_tcp_AR,02_tcp_LE,03_tcp_AR_a。该数据集中所有样例全部以EDF的格式存储,使用的TUEP数据集版本为v1.3.0。
针对TUEP数据集,选择双极通道集合["O1-T5","T5-T3","T3-F7","F7-FP1","O1-P3","P3-C3","C3-F3","F3-FP1","O2-P4","P4-C4","C4-F3","F4-FP2","O2-T6","T6-T4","T4-F8","F8-Fp2"],提取功率谱密度、小波能量和、小波能量比、小波能量熵、近似熵和香农熵特征进行组合作为节点特征,计算通道间的距离相关性和频谱相关性作为原始图结构,
表2展示了E-IGCN与对照组的两个模型在受试者级别的效果。E-IGCN在受试者级别的准确率、精确率、召回率、F1分数和AUC效果达到了0.947、0.967、0.926、0.946和0.948,全面优于其他两个的模型。其中,E-IGCN相较于作为普通GCN对照组的E-GCNN,各评价指标均提升了4%-11%,提升最大的指标为召回率,提升了10.8%。E-IGCN对使用余弦相似度的IDGL模型也有较为明显的提升,提升幅度在1%-3%之间。
表2E-IGCN与对照组在受试者级别的效果
为了观察图邻接矩阵在训练前后的变化,图5选择展示了某个受试者切片在训练前和训练后的边权关系热图,对角线的数字1表示节点跟自己本身的相似度为100%。由图5可以看到训练前后边权发生了较为明显的改变,可以认为右图是优化之后的图结构。
为了更加直观的查看训练前后的网络拓扑结构的优化效果,以“10590”号受试者的1号切片为例,图6展示了此切片在训练前和训练后的网络拓扑图。节点表示脑电通道,连边的粗细程度与边权重的大小成正相关,线越粗,边的权重越大。由图6看到该切片的网络拓扑图从训练前的全连接图优化成一个非对称稀疏图。
由于图7展示了全部通道图拓扑结构,为了便于说明,选择“10590”号受试者1号切片的"O1-T5"、"T5-T3"、"T3-F7"、"F7-FP1"、"O1-P3"、"P3-C3"、"C3-F3"和"F3-FP1"8个双极通道用于展示网络的局部拓扑结构。绘制这8个通道训练前后的网络拓扑图,如图7所示。由于训练后某些节点之间的相似性权重小于设置阈值ε,包括边"O1-T5"-"C3-F3"、边"T3-F7"-"O1-P3"和边"O1-P3"-"F3-FP"在内的10余条边被取消。
在E-IGCN方法的迭代过程中,参数η和参数λ是两个非常重要的参数。为了研究这两个参数对E-IGCN方法性能的影响,首先将参数λ设为0.5,然后调整参数η的值,以找到最佳的η值。接着将参数η设置为0.5,调整参数λ的值,以找到最佳的λ值。如图8和图9所示,可以看到当参数λ等于0.3,参数η等于0.4时,E-IGCN方法表现最佳。
TUEP单极蒙太奇通道数据集
对TUEP数据集不进行通道的选择和双极通道的组合,直接采用原始电极信号与参考电极信号之间的电势差,对数据进行预处理和特征提取等前期操作,以消除任何因双极通道组合引起的数据偶然性。选择全部单极蒙太奇通道组成集合["FP1-REF","FP2-REF","F3-REF","F4-REF","C3-REF","C4-REF","P3-REF","P4-REF","O1-REF","O2-REF","F7-REF","F8-REF","T3-REF","T4-REF","T5-REF","T6-REF","A1-REF","A2-REF","FZ-REF","CZ-REF","PZ-REF"],提取功率谱密度、小波能量和、小波能量比、小波能量熵、近似熵和香农熵特征作为节点特征,计算节点的频谱相似度作为边特征。对数据进行切片后,将原始数据集打乱顺序,将其中70%的样本随机抽取作为训练集,剩下30%的样本作为测试集。
使用TUEP的单极蒙太奇通道数据集,分别使用E-GCNN、IDGL和E-IGCN进行训练,测试集效果如表3所示。E-IGCN的受试者级别的Accuracy、Precision、Recall、F1-Score和AUC分别达到了0.974、0.979、0.968、0.973和0.976,全面优于E-GCNN和IDGL的效果,提升幅度在2%-10%之间。其中,E-IGCN相较于E-GCNN,各个指标分别提升了9.8%、5.5%、12.3%、9.0%和6.4%,相较于IDGL分别提升了1.2%、0.1%、2.2%、1.1%和0.8%。
表3E-IGCN与对照组在受试者级别的效果
TUAB和MPI LEMON联合数据集
TUAB是来自TUH脑电资料库的另一个子集,被称为TUH脑电图异常语料库,作为一个派生数据集发布,下载链接为https://isip.piconepress.com/projects/tuh_eeg/downloads/tuh_eeg_abnormal/。MPI LEMON是来自德国莱比锡的227位健康受试者的脑电样本数据集,下载地址为http://fcon_1000.projects.nitrc.org/indi/retro/MPI_LEMON/。该数据集采用10-10国际标准导联系统进行采集,采集电极为62个,采样率为2500Hz,每个受试者的数据采集窗口由16次试验组成,每次试验长60秒(Babayan A,ErbeyM,Kumral D,et al.A mind-brain-body dataset of MRI,EEG,cognition,emotion,andperipheral physiology in young and old adu lts[J].Scientific data,2019,6(1):1-21)。表4展示了TUAB数据集的样本分布情况。
表4TUAB数据集的样本分布情况
在验证实验中,参考Wagh等人(Wagh N,Varatharajah Y.Eeg-gcnn:Augmentingelectroencephalogram-based neurological disease diagnosis using a domain-guided graph convolutional neural network[C]//Machine Learning forHealth.PMLR,2020:367-378)的方法,从MPI LEMON数据集的受试者中得到了一组有用的健康脑电图,有些受试者的原始数据被破坏,将其排除在外。将得到的MPI LEMON数据集作为正样本,负样本来自于TUAB数据集,只使用了标注为normal的脑电记录,忽略了那些标注为abnormal的记录,总共得到了来自1385名不同患者的1385个脑电图。负样本数据采用10-20国际标准导联系统,选择其14个原始通道:["F7-REF","F3-REF","F8-REF","F4-REF","T7-REF","C3-REF","T8-REF","C4-REF","P7-REF","P3-REF","P8-REF","P4-REF","O1-REF","O2-REF"],由于来自MPI LEMON的正样本是采用10-10国际标准导联系统采集到的,按照其在头皮的相对位置,为其选择了一个与10-20系统电极位置相匹配的通道子集。每位受试者组成8个双极通道的脑电图数据(每个半球4个双极电极):F7-F3、F8-F4、T7-C3、T8-C4、P7-P3、P8-P4、O1-P3和O2-P4。将所有记录文件按照10秒为单位进行切分,切片正样本和负样本的比例为1:9。为了缓解正负样本不平衡对模型训练的影响,使用随机的方法选取部分负样本(避免人为选择对模型的干扰),将其与正样本组成最终的数据集。数据集中的节点特征是从每个脑电切片中提取的功率谱密度,节点之间的边特征是通道之间的频谱相关性,二者构成了图结构数据作为输入数据。
表5展示了E-GCNN、E-IGCN和IDGL在TUAB和MPI LEMON联合数据集的测试集上的效果。由表5可以看到,图结构可学习的IDGL和E-IGCN在TUAB和MPI LEMON联合数据集的效果要大幅优于使用图结构不可更新的图卷积神经网络E-GCNN。E-IGCN在受试者级的Accuracy、Precision、Recall、F1-Score和AUC分别为0.979、0.995、0.965、0.980和0.996,达到了非常优秀的分类准确性,略高于IDGL,差距在1%左右。
表5E-IGCN与对照组在受试者级别的效果
随机挑选"000009017"号受试者的第13号切片作为样例,图10和图11分别展示了该切片在训练前后的边权热图和网络拓扑图。由图10(a)和图11(a)可以看到训练前的脑电网络的初始图为全连接图,边权矩阵是对称关系,节点自连边的权重为1。图10(b)和图11(b)是经过E-IGCN训练后网络结构,可以看到网络结构由原来的全连接图变为非对称稀疏图。由图11(b)可以看到,该切片初始图通道"F8-F4"有7个邻居节点,优化后除其本身之外只剩下一个邻居节点,边"F8-F4"-"T7-C3"、边"F8-F4"-"P7-P3"、边"F8-F4"-"P8-P4"、边"F8-F4"-"O1-P3"、边"F8-F4"-"O2-P4"和边"F8-F4"-"F7-F3"低于阈值被删除。

Claims (2)

1.一种基于迭代图卷积神经网络的癫痫脑电分类方法,其特征在于,具体包括以下步骤:
(1)采集脑电数据,计算癫痫脑电多通道的多特征矩阵作为原始脑电通道节点特征init_node,根据原始脑电节点特征计算癫痫脑电节点相似性作为原始图结构init_adj;
(2)将init_node和init_adj输入到相似度度量学习模块,更新图结构为第一层new_adj,或将第t-1层new_node和new_adj输入到相似度度量学习模块,更新图结构为第t层new_adj,t为迭代层数,是大于等于2的正整数;
步骤(2)包括:
(201)脑电通道i和脑电通道j在输入图中是相邻的两个节点,对于这两个脑电通道的嵌入向量和/> 和/>是原始节点特征init_node,或上一层GCN训练后的节点嵌入new_node,计算它们的注意力值eij,计算方法如公式(7)所示;
其中,W是一个可学习的权重向量,借助W对通道特征和/>进行数据增维,对高维嵌入向量进行特征拼接,最后借助α(·)将拼接后的高维向量映射为一个标量,得到通道i对于通道j的注意力得分;
(202)将该脑电通道i的每个邻居的注意力值eij进行归一化操作,将每个邻居的注意力分数和除以所有邻居的注意力分数之和,归一化后的注意力权重作为最终的通道相似性得分,具体做法如公式(8)所示,
其中,Ni表示通道i的所有邻居节点,eio表示脑电通道i和脑电通道o的注意力值;
(203)根据公式(9),将相似性度量函数修改为多头注意力机制,采用平均法整合多头结果,得到节点i和j的相似性Aij,所有节点的相似性组成非负边权矩阵A;
其中,表示第k头独立的αij
(204)设置一个非负阈值ε,将A中那些小于ε的元素设置为0,得到一个非对称稀疏非负邻接矩阵A*,令A(t)=A*,从而实现了对图拓扑的稀疏化处理,其中ε设置为0.1;
(205)按照公式(10),将A(1)与init_adj进行加权,得到第一层new_adj,或将A(t)与第一层new_adj进行加权,得到第t层new_adj;
A*(t)=λL(0)+(1-λ){ηf(A(t))+(1-η)f(A(1))} (10)
其中,A*(t)表示每一层最终得到的新的图结构,L(0)=D(0)-1/2A(0)D(0)-1/2表示初始图的归一化邻接矩阵,A(0)即init_adj;A(t)和A(1)是在第t次和第1次迭代时计算出的两个邻接矩阵,A(1)是根据原始节点特征计算出来的,而A(t)是根据t-1次迭代更新的节点嵌入Zt-1(即上一层的new_node)计算得出的,f()是归一化方法,将计算得出的邻接矩阵进行归一化处理,计算方法如公式(11)所示,其中Ni表示节点i的所有邻居节点;
(3)随后同时将init_node和第一层new_adj作为图卷积神经网络GCN的输入,根据公式(12),借助新的图结构聚合邻居节点信息,更新节点特征为第一层new_node;
或将第t-1层new_node和第t层new_adj作为图卷积神经网络GCN的输入,根据公式(12),借助新的图结构聚合邻居节点信息,更新节点特征为第t层new_node,依次迭代(如迭代100次),直到达到最好的癫痫脑电分类效果;
其中H(t)表示t层的特征向量矩阵(即init_node或对应new_node),I是单位矩阵, D是A(t)的度矩阵,/>σ是非线性激活函数,W(l)表示的是l层卷积变换的可训练的参数矩阵。
2.根据权利要求1所述的基于迭代图卷积神经网络的癫痫脑电分类方法,其特征在于,步骤(1)中原始图结构init_adj能够由电极通道的相对位置和原始特征空间计算得出,分别是通道i与通道j之间的空间距离关系和通道i与通道j之间频谱相关性/>具体通过公式(4)-(6)计算,所有节点的相似性组成相似性矩阵D,即为init_adj,
其中,(xi,yi,zi)与(xj,yj,zj)分别是通道i和通道j在笛卡尔坐标空间中定位到半径为r的球面上的点,xi(f)和xj(f)分别为通道i和通道j的时间序列和/>的傅里叶变换,/> 为xj(f)的复共轭。
CN202310623456.2A 2023-05-30 2023-05-30 一种基于迭代图卷积神经网络的癫痫脑电分类方法 Pending CN116831594A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310623456.2A CN116831594A (zh) 2023-05-30 2023-05-30 一种基于迭代图卷积神经网络的癫痫脑电分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310623456.2A CN116831594A (zh) 2023-05-30 2023-05-30 一种基于迭代图卷积神经网络的癫痫脑电分类方法

Publications (1)

Publication Number Publication Date
CN116831594A true CN116831594A (zh) 2023-10-03

Family

ID=88158973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310623456.2A Pending CN116831594A (zh) 2023-05-30 2023-05-30 一种基于迭代图卷积神经网络的癫痫脑电分类方法

Country Status (1)

Country Link
CN (1) CN116831594A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117520779A (zh) * 2023-11-17 2024-02-06 河海大学 基于多指标图注意力网络的水电机转轮状态关联分析方法
CN118044826A (zh) * 2024-04-16 2024-05-17 小舟科技有限公司 一种基于时频分析的跨被试脑电信号对齐方法及相关设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117520779A (zh) * 2023-11-17 2024-02-06 河海大学 基于多指标图注意力网络的水电机转轮状态关联分析方法
CN118044826A (zh) * 2024-04-16 2024-05-17 小舟科技有限公司 一种基于时频分析的跨被试脑电信号对齐方法及相关设备

Similar Documents

Publication Publication Date Title
CN110693493B (zh) 一种基于卷积与循环神经网络结合时间多尺度的癫痫脑电预测特征提取方法
Lim et al. Analysis of single-electrode EEG rhythms using MATLAB to elicit correlation with cognitive stress
CN116831594A (zh) 一种基于迭代图卷积神经网络的癫痫脑电分类方法
Shaban Automated screening of Parkinson's disease using deep learning based electroencephalography
Bugeja et al. A novel method of EEG data acquisition, feature extraction and feature space creation for early detection of epileptic seizures
Soni et al. Graphical representation learning-based approach for automatic classification of electroencephalogram signals in depression
CN117503057B (zh) 基于高阶张量分解构建脑网络的癫痫发作检测装置及介质
Mohdiwale et al. Statistical wavelets with harmony search-based optimal feature selection of EEG signals for motor imagery classification
Mouleeshuwarapprabu et al. Nonlinear vector decomposed neural network based EEG signal feature extraction and detection of seizure
CN114699093A (zh) 一种基于卷积神经网络和长短期记忆的脑电癫病发作信号检测方法
Kumar et al. Comparison of Machine learning models for Parkinson’s Disease prediction
Chanu et al. An automated epileptic seizure detection using optimized neural network from EEG signals
Pandey et al. Epileptic seizure classification using battle royale search and rescue optimization-based deep LSTM
US20230181120A1 (en) System and method for testing for sars-cov-2/covid-19 based on wearable medical sensors and neural networks
CN116807491A (zh) 应用于实时心电监测设备的心肌梗死全局导联重建方法
Parija et al. Autoencoder-based improved deep learning approach for schizophrenic EEG signal classification
Singh et al. Automated atrial fibrillation classification based on denoising stacked autoencoder and optimized deep network
Geng et al. Multi-input, multi-output neuronal mode network approach to modeling the encoding dynamics and functional connectivity of neural systems
Elen et al. A hybrid machine learning model for classifying time series
Du et al. EEG-based epileptic seizure detection model using CNN feature optimization
Liu et al. Epileptic seizure prediction based on EEG using pseudo-three-dimensional CNN
Li Electroencephalography Signal Analysis and Classification Based on Deep Learning
Li et al. Hearing loss detection in complex setting by stationary wavelet Renyi entropy and three-segment biogeography-based optimization
Wang et al. An efficient EEG signal fading processing framework based on the cognitive limbic system and deep learning
Chandra et al. Optimum Feature Selection for the Analysis of Effects of Electroencephalography on Applied Pressure Physiotherapy

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination