CN117679047B - 一种多尺度轻量化网络系统的高效癫痫检测方法及系统 - Google Patents
一种多尺度轻量化网络系统的高效癫痫检测方法及系统 Download PDFInfo
- Publication number
- CN117679047B CN117679047B CN202410147319.0A CN202410147319A CN117679047B CN 117679047 B CN117679047 B CN 117679047B CN 202410147319 A CN202410147319 A CN 202410147319A CN 117679047 B CN117679047 B CN 117679047B
- Authority
- CN
- China
- Prior art keywords
- convolution
- data
- quantization
- lty
- cnn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001037 epileptic effect Effects 0.000 title claims abstract description 41
- 238000001514 detection method Methods 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 claims abstract description 114
- 238000012545 processing Methods 0.000 claims abstract description 35
- 230000007246 mechanism Effects 0.000 claims abstract description 29
- 238000013461 design Methods 0.000 claims abstract description 20
- 206010010904 Convulsion Diseases 0.000 claims description 68
- 238000013139 quantization Methods 0.000 claims description 60
- 230000006870 function Effects 0.000 claims description 53
- 230000008569 process Effects 0.000 claims description 43
- 230000010339 dilation Effects 0.000 claims description 38
- 210000004556 brain Anatomy 0.000 claims description 37
- 206010015037 epilepsy Diseases 0.000 claims description 37
- 238000000605 extraction Methods 0.000 claims description 34
- 239000011159 matrix material Substances 0.000 claims description 34
- 238000012549 training Methods 0.000 claims description 28
- 238000013136 deep learning model Methods 0.000 claims description 25
- 238000000513 principal component analysis Methods 0.000 claims description 21
- 239000013598 vector Substances 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000000694 effects Effects 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 14
- 238000012360 testing method Methods 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 12
- 230000035945 sensitivity Effects 0.000 claims description 12
- 238000005457 optimization Methods 0.000 claims description 11
- 238000005516 engineering process Methods 0.000 claims description 9
- 230000009467 reduction Effects 0.000 claims description 8
- 230000003213 activating effect Effects 0.000 claims description 7
- 208000028329 epileptic seizure Diseases 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 6
- 230000008447 perception Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 5
- 230000000007 visual effect Effects 0.000 claims description 5
- 230000007177 brain activity Effects 0.000 claims description 4
- 238000002790 cross-validation Methods 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 2
- 238000003379 elimination reaction Methods 0.000 claims description 2
- 239000012526 feed medium Substances 0.000 claims 2
- 239000002609 medium Substances 0.000 claims 1
- 230000008901 benefit Effects 0.000 abstract description 9
- 238000000537 electroencephalography Methods 0.000 description 35
- 238000004458 analytical method Methods 0.000 description 12
- 238000013527 convolutional neural network Methods 0.000 description 12
- 230000001965 increasing effect Effects 0.000 description 12
- 238000004590 computer program Methods 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 8
- 230000036541 health Effects 0.000 description 7
- 238000011176 pooling Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000010223 real-time analysis Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- HPTJABJPZMULFH-UHFFFAOYSA-N 12-[(Cyclohexylcarbamoyl)amino]dodecanoic acid Chemical compound OC(=O)CCCCCCCCCCCNC(=O)NC1CCCCC1 HPTJABJPZMULFH-UHFFFAOYSA-N 0.000 description 1
- ZMOQBTRTDSZZRU-UHFFFAOYSA-N 2-(1,2-dichloroethyl)pyridine;hydrochloride Chemical compound Cl.ClCC(Cl)C1=CC=CC=N1 ZMOQBTRTDSZZRU-UHFFFAOYSA-N 0.000 description 1
- 241001048891 Jatropha curcas Species 0.000 description 1
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 208000003443 Unconsciousness Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000005182 global health Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000000008 neuroelectric effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003121 nonmonotonic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明属于医学数据信息检测技术领域,公开了一种多尺度轻量化网络系统的高效癫痫检测方法及系统。该方法结合并行卷积结构和多头注意力机制,并提出不同卷积核膨胀率对信号感受野的影响,这在癫痫检测中具有重要作用。通过调整卷积核的膨胀率,可以更有效地捕捉EEG信号中的关键特征,从而提高癫痫检测的准确性。本发明中的轻量型网络结构优点在于其高效性和适用性。通过采用轻量化设计,LTY‑CNN模型不仅能够有效减少计算资源的需求,还能在不牺牲精度的前提下加快处理速度。这使得该模型尤其适用于资源有限的环境。
Description
技术领域
本发明属于医学数据信息检测技术领域,尤其涉及一种多尺度轻量化网络系统的高效癫痫检测方法及系统。
背景技术
癫痫是一种全球性健康问题,根据世界卫生组织的数据,全球约有6000万人受到该疾病的影响。此疾病以不可预测的神经电活动异常为特征,导致各种程度的发作。癫痫患者会经历突发性的神经电活动异常,这些异常活动会导致不同程度的发作,从轻微的注意力分散到全面的意识丧失。这种疾病的不可预知性给患者带来了严重的生理和心理负担,并且限制了他们的社会参与和生活质量。脑电图(EEG)作为一种监测脑电活动的有效工具,已经成为癫痫研究中不可或缺的一部分。随着深度学习和其他先进机器学习技术的兴起,EEG信号的分析和理解水平得到了显著提升。通过从这些信号中提取关键特征并进行有效分类,研究人员可以更好地预测癫痫发作,进而为患者提供更及时的干预。
近年来,人工智能领域的技术进步为患者带来了新的希望。特别是通过多尺度特征提取和多域特征分析,现代预测模型能够更全面地捕捉EEG信号的复杂性。这些模型不仅提高了预测的准确性,还扩展了对癫痫及其发作机制的理解。
现有论文Ra,J.S.,Li,T., et al.: A novel epileptic seizure predictionmethod based onsynchroextracting transform and 1-dimensional convolutionalneural network.Computer Methods and Programs in Biomedicine 240,107678(2023),Jee等人的方法利用同步提取变换(SET)和1D-CNN,专注于提取时间序列数据的特征。这种方法在特定数据集上可能表现良好,但其性能的稳定性在不同的应用环境中可能会受到挑战,限制了其广泛适用性。建立在Jee等人工作的基础上,现有论文Ma,Y. Huang,Z.,Su,J.,Shi,H.Wang, D.,Jia,S.,Li,W.: A multi-channelfeature fusion cnn-bi-lstm epilepsy eeg classification and prediction model basedon attentionmechanism.IEEE Access (2023),Ma等人提出的CNN-Bi-LSTM模型专为捕捉和理解时间序列数据中的长期依赖关系而设计。这种结合了卷积神经网络和双向长短时记忆网络的方法,虽然提升了对复杂时序模式的识别能力,却也相应增加了模型的计算负担。进一步扩展到多维特征提取,
现有论文Lu, X.,Wen,A.,Sun,L., Wang, H.,Guo,Y., Ren,Y.: An epilepticseizure pre-diction method based on cbam-3d cnn-lstm model.IEEE Journal ofTranslationalEngineering in Health and Medicine (2023),Lu等人的CBAM-3D CNN-LSTM模型融合了空间和时间特征,采用3D CNN捕获空间属性,LSTM捕获时间属性。然而,这种方法在处理多尺度特征时可能存在局限,尤其是在EEG数据的复杂性方面。
现有论文Guo,L.,Yu, T.,Zhao,S.,Li,X.,Liao,X.,Li,Y.: Clep: Contrastivelearningfor epileptic seizure prediction using a spatio-temporal-spectralnetwork.IEEETransactions on Neural Systems and Rehabilitation Engineering(2023),Guo等人提出的CLEP方法使用时空-谱网络(STS-Net)进行癫痫预测,是一个在特征提取方面非常先进的解决方案。尽管如此,其模型结构的复杂性可能会影响解释性,特别是在需要高解释能力的应用场景中。在技术深度和复杂性进一步增加的情况下,现有论文Wang,Y.,Cui, W.,Yu, T.,Li,X.,Liao,X.,Li,Y.: Dynamic multi-graph con-volutionbased channel-weighted transformer feature fusion network forepilepticseizure prediction. IEEE ‘Transactions on Neural Systems andRehabilitationEngineering (2023),Wang等人利用多分支动态多图卷积和通道加权策略,来处理EEG信号中的多域动态变化。这种深度结构虽然功能强大,但可能导致技术复杂性和维护成本的增加。当考虑到特定数据处理需求时,现有论文Liu,S.,Wang,J.,Li,S.,Cai,L: Epileptic seizure detection and prediction ineegs using power spectradensity parameterization.IEEE Transactions on NeuralSystems andRehabilitation Engineering (2023),Liu等人通过功率谱密度参数化方法进行癫痫信号分类和预测,这一方法对周期性与非周期性成分的分离效果显著。然而,对于噪声较大的EEG信号,这种方法可能会受到限制。
现有论文Shyu,K.-K.,Huang, S.-C., Lee,L.-H.,Lee, P.-L:Lessparameterization inception-based end to end cnn model for eeg seizuredetection.IEEE Access (2023),Shyu等人的参数优化Inception端到端CNN模型在EEG癫痫检测方面取得了显著成果,但这种端到端的模型在实际应用的灵活性和调整性上可能会面临挑战。
通过上述分析,现有技术存在的问题及缺陷为:现有技术中不能有效地捕捉EEG信号中的关键特征,使得癫痫数据信息检测的准确比较低。
发明内容
为克服相关技术中存在的问题,本发明公开实施例提供了一种多尺度轻量化网络系统的高效癫痫检测方法及系统。
所述技术方案如下:多尺度轻量化网络系统的高效癫痫检测方法,其特征在于,该方法包括:
S1,提取癫痫预发作期与非发作期的数据并进行标记,对输入的脑电波信号进行数据预处理,去除脑电波信号采集时的噪音,基于去除噪音后的脑电波信号进行降维;
S2,通过集成多尺度特征提取和多头注意力机制,构建深度学习模型LTY-CNN;
S3,将标记的癫痫预发作期与非发作期的数据输入构建的深度学习模型LTY-CNN,获取癫痫是否发作的结果,并进行可视化示出。
在步骤S1中,所述标记包括:癫痫预发作期标记为0,非发作期标记为1;
所述数据预处理包括:
(1)通过带阻滤波技术消除电源线和电器设备引入的噪声;
(2)应用高通滤波器排除慢波动造成的信号干扰;
(3)采用主成分分析PCA进行数据的降维;
(4)应用奇异值分解SVD,捕捉去除噪声后脑电波信号的变异性。
在步骤S2中,所述多尺度特征提取包括:进行并行卷积结构优化,量化卷积和膨胀增强特征提取,并在量化卷积中引入膨胀卷积。
进一步,所述并行卷积结构优化包括:
并行利用宽卷积核,中等卷积核,窄卷积核处理相同的EEG信号输入中的不同特征,实现对信号不同特征的捕获;
并行卷积结构的输出经过整合形成综合特征,表达式为:
。
式中,为最终生成的特征集,/>为连接操作,用于将不同尺度的特征向量合并成一个单一的特征向量,/>为应用于宽尺度的特征向量激活函数,/>为应用于中等尺度的特征向量激活函数,/>为应用于窄尺度的特征向量激活函数;为激活函数,用于增加非线性并帮助捕获更复杂的特征;
并行卷积结构多个卷积操作同时进行,时间复杂度为:
;
式中,为时间复杂度,/>为单个卷积操作中最大的时间复杂度;
在多核心硬件的支持下,处理时间为:
;
式中,为在并行化设计下的有效处理时间。
进一步,所述量化卷积和膨胀增强特征提取包括:采用量化感知训练网络QAT,在训练过程中模拟量化效果,通过引入量化误差的梯度调整量化感知训练网络QAT参数,使量化感知训练网络QAT参数适应量化后的表示,在反向传播过程中考虑量化的影响,表达式为:
;
式中,为表示量化误差/>关于输入/>的偏导数,/>为量化误差的期望值,/>为量化过程中的误差,/>为原始输入或原始参数,/>为/>变量的一个量化函数;
量化卷积层的输出表示为量化后的权重/>和激活/>的卷积:
;
式中,*为卷积操作,为数据A的量化结果,/>为权重/>的量化结果。
进一步,所述在量化卷积中引入膨胀卷积包括:
膨胀卷积引入膨胀率,用于定义卷积核中元素的间隔,膨胀卷积的输出/>通过以下公式计算:
;
式中,为膨胀卷积操作的输出,/>为一个双重求和操作,/>表示输入信号A在经过膨胀操作后的位置,其中,/>和/>是当前处理的像素位置,/>和/>是卷积核的索引,/>为卷积核的权重,/>为膨胀率;
当时,膨胀卷积退化为标准卷积;随着/>的增加,感受野/>随之增大,计算公式为:
;
式中,为感受野,/>为卷积核的尺寸;
结合量化卷积,膨胀卷积在量化网络中进行特征提取,量化卷积层的输出通过膨胀卷积为:
;
式中,表示量化函数,/>为输入信号。
在步骤S2中,多头注意力机制在不同的表示空间中,独立地关注输入数据的不同特征,捕捉预处理的脑电波信号数据的时间序列数据;不同的表示空间为多头注意力层配置的多个注意力头;
所述多头注意力层的操作表示为:
;
式中,为多头注意力机制的输出,/>为将所有头的输出连接起来,为示第N个头的输出,/>为是一个可学习的参数矩阵;
每个头的计算为:
;
式中,为第/>个头的输出,/>为应用于查询Q、键K和值/>的注意力函数;/>为在查询矩阵中可学习的参数矩阵,/>为在键矩阵中可学习的参数矩阵,/>为在值矩阵中可学习的参数矩阵,/>为查询矩阵,/>为键矩阵,/>为值矩阵;
注意力函数定义为:
;
式中,为这是注意力权重的计算方式。
在步骤S2中,所述深度学习模型LTY-CNN包括:
数据输入和处理层,用于输入脑电波数据,通过多个过滤器捕捉大脑活动的不同方面信息;
量化技术的使用层,用于通过进行并行卷积结构优化,量化卷积和膨胀增强特征提取,在量化卷积中引入膨胀卷积,进行癫痫数据信息的检测;
融合和关注细节层,用于将不同的过滤器的结果组合起来,以获得全面的大脑活动图像,通过多头的注意力机制寻找数据,关注上下文信号的信息;
简化和决策层,用于通过平均池化简化信息,通过线性层作出决定,判断是否有癫痫发作的迹象。
进一步,构建深度学习模型LTY-CNN后,还需进行训练,包括:
使用torch.optim.Adam作为优化器,采用5折交叉验证,进行损失函数nn.BCEWithLogitsLoss训练;
记录训练和测试的损失、准确率、敏感性、特异性指标;
训练深度学习模型LTY-CNN后还需进行性能评估和结果记录:
评估指标计算:准确率、召回率、F1分数、敏感性、特异性、假阳性计数、AUROC;
基于测试准确率指标选择最佳模型;
结果可视化,绘制损失和准确率随epoch变化的曲线图;
结果保存,将训练和测试的结果保存到CSV文件中。
本发明的另一目的在于提供一种多尺度轻量化网络系统的高效癫痫检测系统,该系统实施所述多尺度轻量化网络系统的高效癫痫检测方法,该系统包括:
数据预处理模块,用于提取癫痫预发作期与非发作期的数据并进行标记,对输入的脑电波信号进行数据预处理,去除脑电波信号采集时的噪音,基于去除噪音后的脑电波信号进行降维;
深度学习模型LTY-CNN构建模块,用于通过集成多尺度特征提取和多头注意力机制,构建深度学习模型LTY-CNN;
癫痫检测模块,用于将标记的癫痫预发作期与非发作期的数据输入构建的深度学习模型LTY-CNN,获取癫痫是否发作的结果,并进行可视化示出。
结合上述的所有技术方案,本发明所具备的有益效果为:本发明结合了并行卷积结构和多头注意力机制,并首次提出了不同卷积核膨胀率对信号感受野的影响,这在癫痫检测中具有重要作用。通过调整卷积核的膨胀率,可以更有效地捕捉EEG信号中的关键特征,从而提高癫痫检测的准确性。对不同数据集具有显著的适应性和鲁棒性,代表了自动化癫痫检测领域的创新。该发明中的轻量型网络结构优点在于其高效性和适用性。通过采用轻量化设计,LTY-CNN模型不仅能够有效减少计算资源的需求,还能在不牺牲精度的前提下加快处理速度。这使得该模型尤其适用于资源有限的环境,如远程医疗和移动健康应用,同时保持了高准确性和鲁棒性,有效提高了癫痫检测的可行性和普及性。轻量型网络的这些优势显著提升了癫痫检测的整体性能。
相比于现有技术,本发明进一步提高了癫痫检测的准确性以提升个体化癫痫治疗:利用LTY-CNN模型的高准确性来改善癫痫的诊断过程,从而为患者提供更精准、个性化的治疗方案。这有助于提高治疗效果。
在资源有限的环境中实现高效性能来促进广泛的临床应用:本发明旨在通过轻量化设计的LTY-CNN模型,即便在资源受限的环境下也能保持高效性能,从而促进其在更广泛的临床环境中的应用。这有助于提升癫痫管理的整体水平,特别是在资源有限的医疗环境中。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理;
图1是本发明实施例提供的多尺度轻量化网络系统的高效癫痫检测方法流程图;
图2是本发明实施例提供的多尺度轻量化网络系统的高效癫痫检测方法原理图;
图3是本发明实施例提供的多尺度轻量化网络系统的高效癫痫检测系统示意图;
图中:1、数据预处理模块;2、深度学习模型LTY-CNN构建模块;3、时间序列信息标记模块。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其他方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
本发明实施例提供的多尺度轻量化网络系统的高效癫痫检测方法及系统创新点在于:本发明提供的多尺度轻量化网络系统(LTY-CNN)在癫痫检测方法及系统方面的创新之处体现在其独特的集成了多尺度特征提取和多头注意力机制的结构上,使其能够更深入且全面地分析和处理脑电图(EEG)信号。这种设计不仅提高了对复杂脑电波形的理解能力,还增强了模型捕捉时间序列数据的精准度,特别是在关键时刻预测癫痫发作方面。此外,其轻量化和高效的架构优化使得模型能够在计算资源受限的环境中运行,从而拓宽了其在移动和远程医疗设备中的应用范围。这些创新不仅提高了癫痫管理的准确性和效率,还为癫痫患者提供了更及时、更个性化的医疗干预方案,标志着在癫痫检测技术领域的一个重大进步。
示例性的,本发明提出了一种创新的深度学习模型——“Lightweight TriscaleYielding Convolutional Neural Network”(LTY-CNN),专为EEG信号分析而设计。该模型结合了并行卷积结构和多头注意力机制,以在多个尺度上捕捉复杂的EEG信号特征,并提升对时间序列数据的处理效率。LTY-CNN的轻量化设计使其能在计算资源有限的环境中维持高效的性能,同时保持模型的可解释性和可维护性。
在SWEC_ETHZ和CHB-MIT数据集上的测试中,LTY-CNN显示出了卓越的性能。在SWEC_ETHZ数据集上,LTY-CNN达到了99.9%的准确率、0.99的AUROC、99.9%的敏感性和99.8%的特异性,而在CHB-MIT数据集上,准确率为99%、AUROC为0.932、99.1%的敏感性和93.2%的特异性。这些成绩标志着LTY-CNN在区分癫痫发作和非发作事件方面的显著能力。与现有的其他癫痫检测分类器相比,LTY-CNN展现了更高的准确性和灵敏度。
还有,LTY-CNN模型的高准确性和灵敏度在癫痫管理中具有重要潜力,特别是在预测和缓解癫痫发作方面。其在个体化治疗和广泛临床应用中的价值体现了深度学习在医疗健康领域的广阔应用前景,同时也突显了技术创新在提升患者生活质量方面的重要作用。
实施例1,如图1所示,本发明实施例提供的多尺度轻量化网络系统的高效癫痫检测方法包括:
S1,提取癫痫预发作期与非发作期的数据并进行标记,对输入的脑电波信号进行数据预处理,去除脑电波信号采集时的噪音,基于去除噪音后的脑电波信号进行降维;
所述标记包括:癫痫预发作期标记为0,非发作期标记为1;降维后,剔除癫痫预发作期与非发作期不重要数据以及可去除脑电波信号不重要数据。
S2,通过集成多尺度特征提取和多头注意力机制,构建深度学习模型LTY-CNN;
S3,将标记的癫痫预发作期与非发作期的数据输入构建的深度学习模型LTY-CNN,获取癫痫是否发作的结果,并进行可视化示出。
在本发明实施例步骤S1中,数据预处理:本发明采取了精确的滤波措施:通过带阻滤波技术去除了117至123赫兹及57至63赫兹的频率成分,目的是消除电源线和其他电器设备可能引入的噪声。带阻滤波器表示为:
;
式中,是滤波器的传递函数,/>是带阻滤波器中阻带的传递函数,该阻带被设计为在特定的频率区域内将信号衰减至很低的水平。应用了高通滤波器来排除所有低于1赫兹的频率,以减少由于慢波动造成的信号干扰。高通滤波器表示为:
;
式中,是信号的频率,/>是高通滤波器的截止频率,这里设为1赫兹。
信号处理工作涉及到了将连续EEG记录分割成64秒的窗口,使得每个数据段内有16384个采样点。利用这些数据片段,生成了具有精确时间分辨率的频谱图,进一步提高了对脑电活动动态的识别能力。每个频谱图具有127个时间分辨率单位和114个频率分辨率单位,这样的分辨率使得能够细致地分析时间序列数据,捕获频率分布的微妙变化。
在数据的深入分析和LTY-CNN模型构建中,本发明进一步采用了主成分分析(PCA)来实现数据的有效降维。PCA的基本原理是通过正交变换将原始数据转换到一个新的坐标系统中,使得这个新坐标系统的第一维度上的数据方差最大。具体的PCA变换表示为:
;
其中,是中心化后的原始数据矩阵,/>是从原始数据中提取的主成分组成的矩阵,而/>是转换后的数据,其中包含了包含方差占比大的输入脑电波的通道。通过应用奇异值分解(SVD)技术,原始数据被投影到由64个主轴组成的低维空间中,此过程捕捉了信号的变异性,确保了信息的精准提取和降维的优化平衡。
;
其中,和/>是正交矩阵,而/>是对角矩阵,对角线上的元素是奇异值,表示数据在各个主成分方向上的方差大小。通过系统的交叉验证,确认了这些选定的主成分能够充分捕获信号的主要变异性,从而验证了信息损失与数据简化之间达到了一种精妙的平衡。
可以理解,主要变异性在统计和数据分析中通常指的是数据集中最显著的变化或差异。在使用主成分分析(PCA)或奇异值分解(SVD)时,主要变异性可以具体包括:
方差最大的方向:在PCA中,第一个主成分是数据方差最大的方向。这意味着数据在这个方向上有最大的扩散或分散。
数据的主要特征:接下来的主成分表示数据在与前面主成分正交的方向上的最大方差。这些方向捕获了数据中剩余的主要特征或模式。
重要信息的总结:主成分分析通过减少数据维度来总结重要信息。前几个主成分通常包含了数据集大部分的信息,尽管它们只是原始数据维度的一部分。
数据压缩和噪声过滤:在许多情况下,主要变异性对应于数据的结构化部分,而较小的变异性可能代表噪声。通过保留主要变异性并忽略较小的变异性,PCA可以用于数据压缩和噪声过滤。
解释数据中的关键趋势:PCA通过这些主成分揭示数据中的关键趋势和模式,有助于更好地理解数据集的结构。
数据集的结构包括:
数据降维:PCA是一种常用的降维技术,它通过正交变换将数据转换到一个新的坐标系统,使得转换后的第一个坐标轴上的数据方差最大,第二个坐标轴上的数据方差次之,以此类推。这种转换有助于减少数据集的复杂性,同时保留最重要的特征。
揭示关键趋势和模式:通过分析主成分,PCA可以揭示数据中最重要的结构和模式。例如,在EEG信号分析中,PCA可以帮助识别影响信号变化的主要因素,这些因素可能是与癫痫发作相关的关键特征。
去除噪声和冗余:PCA通过保留数据中方差最大的部分来减少噪声和冗余信息的影响。这对于清晰地识别和解释数据中的关键信息非常有用。
增强模型性能:在机器学习和模式识别任务中,使用PCA降维后的数据可以提高算法的效率和性能。例如,在LTY-CNN模型中,应用PCA可以减少处理时间和计算资源的需求,同时保持高准确率。
可视化和解释:PCA可以将高维数据转换为二维或三维,便于可视化和解释。这对于理解复杂数据集(如EEG信号)中的关键特征和模式非常有帮助。
在本发明实施例步骤S2中,本发明采纳了一种创新性的启发式重叠采样技术,即并行卷积结构,具体包括:
并行利用宽卷积核,中等卷积核,窄卷积核处理相同的EEG信号输入中的不同特征,从而实现对信号不同特征的捕获。这三种不同大小的卷积核并行工作,相互补充,形成一个全面的特征提取策略。
并行卷积层的输出经过整合形成综合特征表示:
;
式中,为最终生成的特征集,是为进一步分析和分类准备的综合特征表示,为连接操作,用于将不同尺度的特征向量合并成一个单一的特征向量,/>为应用于宽尺度的特征向量激活函数,是深度学习中用于引入非线性的函数,/>为应用于中等尺度的特征向量激活函数,/>为应用于窄尺度的特征向量激活函数;/>为激活函数,用于增加非线性并帮助捕获更复杂的特征;
,/>,/>分别代表模型中不同尺度的特征向量。在LTY-CNN模型中,“/>宽”、“/>中等"和"/>窄"尺度可能分别对应于不同大小的卷积窗口或不同层次的特征提取,以捕捉EEG信号中的不同频率和时间尺度的信息;
并行卷积结构优化了卷积层的计算过程,减少了时间复杂度。在传统的串行卷积网络中,特征提取的时间复杂度是各层时间复杂度的总和:
;
式中,为总层数,/>为第/>层量化卷积层的输出。
但在并行化设计中,由于多个卷积操作可以同时进行,时间复杂度可以大幅度降低:
;
其中,是单个卷积操作中最大的时间复杂度。在多核心硬件的支持下,理论上可以实现的处理时间接近于:
;
式中,为在并行化设计下的有效处理时间;在这种情况下LTY-CNN模型在并行化框架下运行时,理论上可以达到的处理时间。
通过这样的并行卷积设计,本发明能够在保持对EEG信号全面特征提取能力的同时,显著提升处理速度,使得模型更适用于实时分析场景。
在本发明量化卷积和膨胀增强特征提取(Enhanced Feature Extraction withQuantized Convolution and Dilation)中,量化卷积是一种优化神经网络以适应资源受限环境的技术,它通过将权重和激活/>的精度从32位浮点数降低到/>-位定点数来实现。这一过程可以通过量化函数Q来描述,该函数将连续的输入值映射到离散的量化级别。量化函数可以定义为:
;
式中,是量化步长,它决定了量化的粒度,通常与量化位宽/>相关,通过以下公式确定:
;
式中,表示输入/>的最大绝对值,确保量化后的值能够覆盖输入值的动态范围。量化过程中的误差/>通过量化误差的期望值来量化:
;
为了减少量化引入的误差,通常会采用量化感知训练(Quantization-AwareTraining,QAT),在训练过程中模拟量化效果,以此来调整网络参数,使其适应量化后的表示。这可以通过引入量化误差的梯度来实现,从而在反向传播过程中考虑量化的影响:
;
式中,为表示量化误差E关于输入z的偏导数。在优化神经网络时,了解量化误差如何随输入变化是至关重要的,因为它帮助调整模型参数,以减少量化过程中的整体误差,为量化误差的期望值,量化过程不可避免地会引入一定的误差,因为它涉及将连续值近似为离散值,这个期望值反映了量化误差的平均大小,E为量化过程中的误差。在深度学习模型中,尤其是在对神经网络进行优化以适应资源受限环境(LTY-CNN模型)时,量化是一个关键步骤。量化涉及将模型参数(如权重和激活函数)从高精度(如32位浮点数)转换为低精度(如定点数)表示;/>为原始输入或原始参数,/>为一个量化函数,它将连续的输入值/>映射到离散的量化级别,可能涉及将神经网络的权重或激活值转换为低精度的格式,以减少模型的大小和计算需求;/>表示量化函数。
此外,量化卷积层的输出可以表示为量化后的权重/>和激活/>的卷积:
;
式中,*表示卷积操作。为数据A的量化结果,/>为权重W的量化结果。通过这种方式,量化卷积层能够在保持网络性能的同时,显著降低模型的存储需求和计算复杂性。
本发明在量化卷积中引入膨胀卷积(Dilated Convolution),这是一种特殊类型的卷积操作,它通过在卷积核的相邻元素之间引入空洞来扩大感受野,而不增加额外的计算负担。这种策略允许网络在更深层次上捕获更广泛的上下文信息,而不显著增加参数数量。
可以理解,在量化卷积神经网络(CNN)中引入膨胀卷积(dilated convolution)可以带来一些明显的效果和好处。膨胀卷积是一种特殊类型的卷积,通过在标准卷积核的元素之间引入空间间隔(称为膨胀率)来增加其感受野。引入膨胀卷积后,可以实现以下效果:
增加感受野(Receptive Field):膨胀卷积通过在卷积核元素之间插入空格来扩大其覆盖的输入区域,从而在不增加参数数量的情况下增加网络的感受野。这意味着网络可以更有效地捕捉到输入数据中的更大范围的上下文信息。
保持空间分辨率:与池化层(如最大池化)相比,膨胀卷积在增加感受野的同时不会降低特征图的空间分辨率。这对于需要细粒度空间信息的任务(如图像分割)尤为重要。
减少参数和计算量:因为膨胀卷积可以在不增加额外参数和显著增加计算负担的情况下增大感受野,所以它在资源受限的量化网络中特别有用。
改善小目标检测和细节捕捉:在处理小目标或需要高分辨率细节的任务时,膨胀卷积可以帮助网络更好地识别和处理这些细节。
避免信息丢失:在一些深层网络中,重复的池化操作可能导致信息丢失。膨胀卷积可以在不丢失信息的情况下提供更广泛的感受野。
提高网络的多尺度处理能力:通过使用不同膨胀率的膨胀卷积,网络可以在多个尺度上捕捉特征,这对于理解具有多种尺寸和形状的对象特别有益。
示例性的,膨胀卷积引入了膨胀率,它定义了卷积核中元素的间隔。因此,膨胀卷积的输出/>通过以下公式计算:
;
式中,为膨胀卷积操作的输出,在LTY-CNN模型中,这个输出是通过在EEG信号上应用膨胀卷积得到的。这个输出用于捕获EEG数据中更广泛的上下文信息。
为一个双重求和操作,表示对所有卷积核元素的遍历。
表示输入信号A在经过膨胀操作后的位置。其中i和j是当前处理的像素位置,m和n是卷积核W的索引;
为卷积核的权重,在这里代表膨胀卷积核中的一个元素;
为膨胀率,用于控制卷积核中元素的间隔。当d=1时,膨胀卷积就变成了标准卷积。随着d的增加,卷积核覆盖的区域变得更大,从而能够捕获更广泛的上下文信息,而不显著增加计算复杂度。
感受野也随之增大,其计算公式为:
;
其中,是卷积核的尺寸。
膨胀卷积通过这种方式增加感受野,而不是通过增加卷积核的尺寸或增加网络的深度,从而在不显著增加计算复杂度的情况下,提高了网络对于输入数据的理解能力。
结合量化卷积,膨胀卷积可以在量化网络中实现更有效的特征提取。量化卷积层的输出通过膨胀卷积修改为:
;
通过膨胀卷积和量化卷积的结合,可以在保持网络精度的同时,提高网络对于大尺寸输入数据的处理能力。
在本发明实施例步骤S2中,利用多头注意力捕捉时间序列(Capturing TimeSeries with Multi-Head Attention)中,分析了多头注意力机制在改进癫痫预测模型中的应用。多头注意力机制的引入是为了增强对时间序列数据的捕捉能力。多头注意力层配置了四个注意力头,每个头都能够独立地关注输入数据的不同特征。每个头的嵌入维度被设置为64,这样的维度选择有助于在保持模型复杂度的同时,捕获足够的特征信息。
多头注意力层的操作可以表示为:
;
其中每个头的计算为:
;
注意力函数定义为:
;
式中,为多头注意力机制的输出,它结合了N个不同的"头”(head)的输出,/>为表示将所有头的输出连接起来。每个头对输入数据的不同表示进行操作,捕获不同的信息,/>为示第N个头的输出,/>为是一个可学习的参数矩阵,用于将连接后的头输出转换成最终的输出,/>为第i个头的输出,/>为应用于查询Q、键K和值/>的注意力函数,每个头都有自己的一组参数矩阵/>,/>,/>,/>为这是注意力权重的计算方式。QKT表示查询和键的乘积,用于评估输入数据的不同部分之间的相似度。除以/>(dx是键的维度)是为了缩放,避免在计算softmax时出现数值稳定性问题,/>为在查询矩阵中可学习的参数矩阵,/>为在键矩阵中可学习的参数矩阵,/>为在值矩阵中可学习的参数矩阵,/>为查询(/>矩阵,/>为键(key)矩阵,/>为值(value)矩阵,这些矩阵代表了输入数据的不同方面。
通过这种设计,本发明预期能够更加精细地捕捉EEG信号中的时序动态,尤其是在预测癫痫发作的关键时刻方面。多头注意力机制的并行处理能力使得本发明有潜力在不同的表示空间中捕捉到更丰富的时序信息,这对于理解EEG信号的复杂性至关重要。本发明加入多头注意力机制在预测准确性上表现出优势,尤其是在捕捉那些细微的、可能预示着癫痫发作的信号变化方面。
作为另一种实施方式,图2是本发明实施例提供的多尺度轻量化网络系统的高效癫痫检测方法原理图;
通过上述实施例可知,本发明的技术方案转化后的预期收益和商业价值为:
a.提高癫痫管理效率和准确性:LTY-CNN模型在癫痫发作预测上的高准确率和高灵敏度示着其在临床应用中能显著地提高诊断和干预的效率和准确性。这对于提升癫痫患者的生活质量和减少医疗干预的延误具有重要意义。
b.减轻医疗系统负担:由于LTY-CNN的高效性和可靠性,它能够减少错误诊断和不必要的治疗,从而降低医疗成本和系统负担。
c.个性化治疗和远程监控:该技术的引入能够促进个性化医疗的发展,尤其是在遥感健康监控和远程医疗领域,提供更加定制化的患者护理方案。
d.商业化潜力:由于其在癫痫预测中的高性能,LTY-CNN模型具有强大的商业化潜力,可能吸引医疗设备制造商和医疗健康应用开发者的关注。
e.技术推广和应用:此模型可以被集成到多种医疗设备中,如可穿戴设备或智能手机应用程序,为用户提供实时健康监测和预警系统。
本发明的技术方案填补了外业内技术空白:
a.创新的模型设计:LTY-CNN通过结合并行卷积结构和多头注意力机制,提供了一种新颖的EEG信号分析方法。这种独特的结构在现有技术中是罕见的。
b.高效的资源利用:由于其轻设计,LTY-CNN能够在计算资源受限的环境中保持高性能,这在现有的癫痫预测技术中是一个显著的进步。
c.多尺度特征提取:该模型能够捕获EEG信号中的复杂特征,这一点在以往的方法中往往未被充分利用。LTY-CNN通过其多尺度特征提取能力,提供了更加全面的数据分析。
d.实时分析能力:LTY-CNN的设计使其适合于实时分析场景,这对于紧急医疗响应和及时治疗癫痫发作至关重要。
e.数据处理和预测的精确性:与现有技术相比,LTY-CNN在数据处理和癫痫发作预测方面展现出更高的精确性和可靠性。
f.适用性和标准化:LTY-CNN模型的设计考虑到了全球应用和标准化,这使其能够跨越不同地区和人群,提供普遍适用的解决方案。
本发明的技术方案解决了人们一直渴望解决、但始终未能获得成功的技术难题:
a.高精度癫痫发作预测:癫痫管理领域长期面临的一个主要挑战是提高发作预测的准确性。LTY-CNN模型通过其创新的设计,实现了99.9%的准确率,有效解决了这一难题。
b.实时监测和预警:另一个长期存在的问题是如何实时监测并及时预警患者即将发生的癫痫发作。LTY-CNN模型的实时处理能力为此提供了可靠的解决方案。
c.资源受限的环境下的应用:在资源有限的医疗环境中,许多现有技术由于复杂度高和资源需求大而难以应用。LTY-CNN的轻量级设计解决了这一问题,使其在这些环境中也能高效运行。
d.EEG信号的综合分析:以往的方法在处理和分析EEG信号的复杂性方面存在局限。LTY-CNN通过其多尺度特征提取和多头注意力机制,有效地解决了模型参数规模、搜索能力和处理速度三者之间难以达到平衡这个问题
本发明的技术方案克服了技术偏见:
a.克服对传统方法的依赖:此前,许多癫痫预测方法依赖于传统的统计学或简单的机器学习技术。LTY-CNN引入了先进的深度学习技术,打破了对传统方法的依赖。
b.解决数据处理的局限性:传统EEG数据处理方法往往忽略了信号中的某些关键特征。LTY-CNN通过并行卷积和多头注意力机制,克服了这一技术偏见,提供了更全面的数据分析。
c.提高可访问性和实用性:过去的一些高级解决方案由于复杂性和成本限制,难以普及。LTY-CNN模型的轻量级和高效性能克服了这些偏见,使其在更广泛的环境中具有实用价值。
d.跨越患者差异性的挑战:面对不同患者的EEG信号差异,许多方法难以适应。LTY-CNN通过其设计灵活性,成功克服了这一技术偏见,提供了个性化和适应性强的解决方案。
实施例2,作为本发明的另一种实施方式,本发明实施例提供的多尺度轻量化网络系统的高效癫痫检测方法操作流程包括:
步骤一,系统初始化和配置。
(1)导入库和工具:包括`pyedflib`,`numpy`,`pandas`,`scipy`, `torch`,`matplotlib`等。
(2)设置全局参数:
EEG通道数:18;
采样率:256Hz;
窗口大小:64秒;
批大小(bS):64;
学习率:0.001;
训练轮数(num_epoch):150。
(3)初始化CUDA环境。
步骤二,数据处理和特征提取。
(1)EEG数据导入:使用`numpy.load`从指定路径加载.npy格式的数据文件。
(2)数据预处理:(具体细节在上面的预处理)。
带阻滤波器:使用`butter`和`lfilter`创建带阻滤波器,频率范围117-123Hz和57-63Hz,滤波器阶数为6。
高通滤波器:截止频率1Hz,滤波器阶数为6。
窗口分割和频谱图生成:窗口大小为64秒,采样率256Hz。
(3)特征提取:
数据重塑为二维形式后,应用因子分析,选择64个主成分。
步骤三,构建和训练神经网络模型。
(a)模型设计;
(b)数据集准备:
数据标签:预发作期(preictal)标记为0,非发作期(interictal)标记为1。
随机打乱并划分数据。
(c)模型训练:
使用`torch.optim.Adam`作为优化器;
采用5折交叉验证;
损失函数:`nn.BCEWithLogitsLoss`;
记录训练和测试的损失、准确率、敏感性、特异性等指标。
步骤四,性能评估和结果记录:
评估指标计算:准确率、召回率、F1分数、敏感性、特异性、假阳性计数、AUROC;
最佳模型选择:基于测试准确率等指标选择最佳LTY-CNN模型;
结果可视化:绘制损失和准确率随epoch变化的曲线图;
结果保存:将训练和测试的结果保存到CSV文件中。
步骤五,系统优化和调整:
参数调优:根据性能结果调整网络结构和训练参数;
特征选择:分析不同特征对LTY-CNN模型性能的影响;
代码优化:优化代码以提高效率。
步骤六,实际应用和测试:
实际数据测试:在新的EEG数据集上评估LTY-CNN模型性能;
系统部署:将模型集成到实际的EEG分析系统中;
用户反馈收集:用于进一步改进LTY-CNN模型和系统。
实施例3,如图3所示,本发明提供一种多尺度轻量化网络系统的高效癫痫检测系统,包括:
数据预处理模块1,用于用于提取癫痫预发作期与非发作期的数据并进行标记,对输入的脑电波信号进行数据预处理,去除脑电波信号采集时的噪音,基于去除噪音后的脑电波信号进行降维;所述标记包括:癫痫预发作期标记为0,非发作期标记为1;
深度学习模型LTY-CNN构建模块2,用于通过集成多尺度特征提取和多头注意力机制构建深度学习模型LTY-CNN;
癫痫检测模块3,用于将标记的癫痫预发作期与非发作期的数据输入构建的所述深度学习模型LTY-CNN,获取癫痫是否发作的结果,并进行可视化示出。
通过上述实施例可知,本发明高效轻量化设计:LTY-CNN采用了一种创新的轻量化架构,减少了模型的计算负担和资源需求,使其适用于计算资源受限的环境。
多尺度特征提取能力:该模型能有效地捕捉和分析EEG信号中的复杂模式,通过并行卷积结构和多头注意力机制,提高了对多尺度特征的识别和分析能力。
高准确性和鲁棒性:在CHB-MIT等多个数据集上的测试结果表明,LTY-CNN在癫痫预测方面具有高准确率、灵敏度和特异性,表现出极强的鲁棒性和适应性。
在癫痫预测的领域,尽管现有的许多模型功能强大,它们却往往难以在参数规模、搜索能力和处理速度三者之间达到平衡,尤其是在实时处理和资源受限的环境下的应用。为了解决这些问题,本发明提出了一种名为“Lightweight Triscale YieldingConvolutional Neural Network”(LTY-CNN)的模型,它以轻量级的架构设计脱颖而出。LTY-CNN采用独特的并行卷积结构在多个不同尺度上捕捉EEG信号特征,确保模型能够全面整合关键信息。通过量化技术,模型的参数数量得以大幅度减少,计算效率得到显著提升,内存需求也随之降低。集成的多头注意力机制进一步增强了对时间序列数据的处理能力,提高了模型的预测准确性。这种创新设计使得LTY-CNN即使在计算资源有限的环境下也能保持出色的性能,并在模型的可解释性和可维护性方面具有明显的优势。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
上述装置/单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程。
本发明实施例还提供了一种计算机设备,该计算机设备包括:至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意各个方法实施例中的步骤。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述各个方法实施例中的步骤。
本发明实施例还提供了一种信息数据处理终端,所述信息数据处理终端用于实现于电子装置上执行时,提供用户输入接口以实施如上述各方法实施例中的步骤,所述信息数据处理终端不限于手机、电脑、交换机。
本发明实施例还提供了一种服务器,所述服务器用于实现于电子装置上执行时,提供用户输入接口以实施如上述各方法实施例中的步骤。
本发明实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行时可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random AccessMemory,RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。
本发明的多尺度轻量化网络系统的高效癫痫检测方法程序的目的是识别癫痫病发作的迹象。它通过分析医疗数据(脑电波)来完成这项工作。具体包括:
步骤1,数据输入和处理。
输入:首先,输入脑电波数据。这些数据就像是大脑活动的快照。
卷积层:程序中有三个特殊的过滤器(称为卷积层)。这些过滤器可以捕捉大脑活动的不同方面。
步骤2,量化技术的使用。
使用了一种特殊的技术,称为“量化”。这意味着它在处理信息时使用较少的细节。这就像是用更少的颜色来画一幅画,虽然细节减少了,但画面的整体形状和意义仍然保持不变。这样做可以使LTY-CNN模型运行得更快,更高效;
在量化卷积与多头注意力数据传输中利用了Swish激活函数,具有以下技术作用:
Swish激活函数是一种用于深度学习模型中的激活函数,由谷歌大脑团队在2017年提出。Swish函数被设计来作为传统ReLU(Rectified Linear Unit)激活函数的替代,目的是在某些场景下提供更好的性能。Swish函数的数学表达式和特点如下:
数学表达式:
Swish函数的公式为:,其中,/>是输入,/>是Sigmoid函数,即/>,而/>是一个可训练的参数或固定值(在最初的提议中,/>被设置为1)。
特点:
平滑性:与ReLU相比,Swish函数是平滑且连续的,这有助于优化过程中的梯度流动。
非单调性:在负输入值区域,Swish函数是非单调的。这种特性在某些情况下可以帮助提升网络的性能。
自适应性:当β是可训练的参数时,Swish函数可以在训练过程中自适应地调整其形状,以适应特定的数据集和任务;
有界的负区域:Swish函数在负无穷大时趋近于0,这可以减少激活函数的死区(dead zones)。
性能:
在多个实验和应用中,Swish函数显示出了优于或至少等同于ReLU的性能。
它特别适用于深度神经网络,因为它的平滑性质有助于缓解梯度消失的问题。
使用场景:Swish激活函数可以在几乎所有使用ReLU的场景中使用,包括卷积神经网络(CNNs)和循环神经网络(RNNs)。
总体而言,Swish激活函数是一种有效的激活函数,因其平滑性和非单调性,在特定的深度学习任务中可能优于传统的ReLU函数。然而,它是否提供改进也取决于特定的应用和网络架构。
步骤3,融合和关注细节。
融合处理:这些不同的视角(即过滤器的结果)被组合起来,以获得更全面的大脑活动图像。
注意力机制:使用一种“多头注意力”的技术。通过集中注意力,去寻找数据中最重要的部分。更关注上下文信号的信息;
步骤4,简化和决策。
平均池化:然后,通过“平均池化”简化信息。这就像是从一长串数字中找出平均值,以便更容易理解整体情况。
平均池化后进行特征度量(Feature Mapping):特征度量类似于一种翻译,它将复杂的数据(如图片或声音,本文是脑电信号转化的数字信息)转换成一种新的语言,这种语言由数字组成,能更容易地揭示数据中的模式和关联。这个过程就像是使用特殊的滤镜来查看世界,通过这些滤镜,可以更清楚地看到某些特定的模式或形状。
扁平化层(Flattening Layer):扁平化层的作用就像是将一本多页的书重新排版成一张长长的纸带。在神经网络中,扁平化层将多维的数据结构(如二维的图片像素)转换成一维的长串数字。这样做是为了简化信息,让它能够被网络的下一层(通常是全连接层)更容易地处理。
丢弃层(Dropout Layer):丢弃层就像是在整理信息时故意忽略掉一些细节,以防止大脑过于依赖某些特定的信息片段。在神经网络中,这个层次随机地“关闭”一部分神经元的活动,这有助于使网络更加健壮,防止过分依赖训练数据中的某些特定模式(这个现象称为过拟合)。
决策制作:最后,通过一系列简化步骤(称为线性层),作出决定,判断是否有癫痫发作的迹象。
以上所述,仅为本发明较优的具体的实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (4)
1.一种多尺度轻量化网络系统的高效癫痫检测方法,其特征在于,该方法包括:
S1,提取癫痫预发作期与非发作期的数据并进行标记,对输入的脑电波信号进行数据预处理,去除脑电波信号采集时的噪音,基于去除噪音后的脑电波信号进行降维;
S2,通过集成多尺度特征提取和多头注意力机制,构建深度学习模型LTY-CNN;
S3,将标记的癫痫预发作期与非发作期的数据输入构建的深度学习模型LTY-CNN,获取癫痫是否发作的结果,并进行可视化示出;
在步骤S2中,所述多尺度特征提取包括:进行并行卷积结构优化,量化卷积和膨胀增强特征提取,并在量化卷积中引入膨胀卷积;
所述并行卷积结构优化包括:
并行利用宽卷积核,中等卷积核,窄卷积核处理相同的EEG信号输入中的不同特征,实现对信号不同特征的捕获;
并行卷积结构的输出经过整合形成综合特征,表达式为:
Ftotal=Concat[Act(Fwide),Act(Fmedium),Act(Fnarrow)]
式中,Ftotal为最终生成的特征集,Concat[]为连接操作,用于将不同尺度的特征向量合并成一个单一的特征向量,Act(Fwide)为应用于宽尺度的特征向量激活函数,Act(Fmedium)为应用于中等尺度的特征向量激活函数,Act(Fnarrow)为应用于窄尺度的特征向量激活函数;Act()为激活函数,用于增加非线性并帮助捕获更复杂的特征;
并行卷积结构多个卷积操作同时进行,时间复杂度Oparallel为:
Oparallel=Omax
式中,Oparallel为时间复杂度,Omax为单个卷积操作中最大的时间复杂度;
在多核心硬件的支持下,处理时间为:
Tefficient≈Omax
式中,Tefficient为在并行化设计下的有效处理时间;
所述量化卷积和膨胀增强特征提取包括:采用量化感知训练网络QAT,在训练过程中模拟量化效果,通过引入量化误差的梯度调整量化感知训练网络QAT参数,使量化感知训练网络QAT参数适应量化后的表示,在反向传播过程中考虑量化的影响,表达式为:
式中,为表示量化误差E关于输入z的偏导数,/>为量化误差的期望值,E为量化过程中的误差,x为原始输入或原始参数,Q(x)为x变量的一个量化函数;
量化卷积层的输出O表示为量化后的权重Wq和激活Aq的卷积:
O=Q(A)*Q(W)
式中,*为卷积操作,Q(A)为数据A的量化结果,Q(W)为权重W的量化结果;
所述在量化卷积中引入膨胀卷积包括:
膨胀卷积引入膨胀率d,用于定义卷积核中元素的间隔,膨胀卷积的输出Od通过以下公式计算:
式中,Od(i,j)为膨胀卷积操作的输出,∑m∑n为一个双重求和操作,A(i+d·m,j+d·n)表示输入信号A在经过膨胀操作后的位置,其中,i和j是当前处理的像素位置,m和n是卷积核W的索引,W(m,n)为卷积核的权重,d为膨胀率;
当d=1时,膨胀卷积退化为标准卷积;随着d的增加,感受野R随之增大,计算公式为:
R=k+(k-1)·(d-1)
式中,R为感受野,k为卷积核的尺寸;
结合量化卷积,膨胀卷积在量化网络中进行特征提取,量化卷积层的输出Oq通过膨胀卷积为:
式中,Q()表示量化函数,A为输入信号;
在步骤S2中,多头注意力机制在不同的表示空间中,独立地关注输入数据的不同特征,捕捉预处理的脑电波信号数据的时间序列数据;不同的表示空间为多头注意力层配置的多个注意力头;
所述多头注意力层的操作表示为:
MultiHead(Q,K,V)=Concat(hesd1,...,headN)WO
式中,MultiHead()为多头注意力机制的输出,Concat()为将所有头的输出连接起来,headN为示第N个头的输出,WO为是一个可学习的参数矩阵;
每个头的计算为:
headi=Attention(QWi Q,KWi K,VWi V)
式中,headi为第i个头的输出,Attention(QWi Q,KWi K,VWi V)为应用于查询Q、键K和值V的注意力函数;Wi Q为在查询矩阵中可学习的参数矩阵,Wi K为在键矩阵中可学习的参数矩阵,Wi V为在值矩阵中可学习的参数矩阵,Q为查询矩阵,K为键矩阵,V为值矩阵;
注意力函数定义为:
式中,为这是注意力权重的计算方式;
在步骤S2中,所述深度学习模型LTY-CNN包括:
数据输入和处理层,用于输入脑电波数据,通过多个过滤器捕捉大脑活动的不同方面信息;
量化技术的使用层,用于通过进行并行卷积结构优化,量化卷积和膨胀增强特征提取,在量化卷积中引入膨胀卷积,进行癫痫数据信息的检测;
融合和关注细节层,用于将不同的过滤器的结果组合起来,以获得全面的大脑活动图像,通过多头的注意力机制寻找数据,关注上下文信号的信息;
简化和决策层,用于通过平均池化简化信息,通过线性层作出决定,判断是否有癫痫发作的迹象。
2.根据权利要求1所述的多尺度轻量化网络系统的高效癫痫检测方法,其特征在于,在步骤S1中,所述标记包括:癫痫预发作期标记为0,非发作期标记为1;
所述数据预处理包括:
(1)通过带阻滤波技术消除电源线和电器设备引入的噪声;
(2)应用高通滤波器排除慢波动造成的信号干扰;
(3)采用主成分分析PCA进行数据的降维;
(4)应用奇异值分解SVD,捕捉去除噪声后脑电波信号的变异性。
3.根据权利要求1所述的多尺度轻量化网络系统的高效癫痫检测方法,其特征在于,构建深度学习模型LTY-CNN后,还需进行训练,包括:
使用torch.optim.Adam作为优化器,采用5折交叉验证,进行损失函数nn.BCEWithLogitsLoss训练;
记录训练和测试的损失、准确率、敏感性、特异性指标;
训练深度学习模型LTY-CNN后还需进行性能评估和结果记录:
评估指标计算:准确率、召回率、F1分数、敏感性、特异性、假阳性计数、AUROC;
基于测试准确率指标选择最佳模型;
结果可视化,绘制损失和准确率随epoch变化的曲线图;
结果保存,将训练和测试的结果保存到CSV文件中。
4.一种多尺度轻量化网络系统的高效癫痫检测系统,其特征在于,该系统实施如权利要求1至3任意一项所述多尺度轻量化网络系统的高效癫痫检测方法,该系统包括:
数据预处理模块(1),用于提取癫痫预发作期与非发作期的数据并进行标记,对输入的脑电波信号进行数据预处理,去除脑电波信号采集时的噪音,基于去除噪音后的脑电波信号进行降维;
深度学习模型LTY-CNN构建模块(2),用于通过集成多尺度特征提取和多头注意力机制,构建深度学习模型LTY-CNN;
癫痫检测模块(3),用于将标记的癫痫预发作期与非发作期的数据输入构建的深度学习模型LTY-CNN,获取癫痫是否发作的结果,并进行可视化示出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410147319.0A CN117679047B (zh) | 2024-02-02 | 2024-02-02 | 一种多尺度轻量化网络系统的高效癫痫检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410147319.0A CN117679047B (zh) | 2024-02-02 | 2024-02-02 | 一种多尺度轻量化网络系统的高效癫痫检测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117679047A CN117679047A (zh) | 2024-03-12 |
CN117679047B true CN117679047B (zh) | 2024-04-05 |
Family
ID=90128567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410147319.0A Active CN117679047B (zh) | 2024-02-02 | 2024-02-02 | 一种多尺度轻量化网络系统的高效癫痫检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117679047B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102363159A (zh) * | 2011-10-26 | 2012-02-29 | 北京科技大学 | 一种单张板精密冷轧板厚测量系统的厚度控制方法 |
CN102429658A (zh) * | 2011-12-20 | 2012-05-02 | 华南理工大学 | 基于脑电慢皮层电位小波分析的术中运动区功能定位系统 |
CN113907706A (zh) * | 2021-08-29 | 2022-01-11 | 北京工业大学 | 基于多尺度卷积和自注意力网络的脑电信号的癫痫发作预测方法 |
CN114569141A (zh) * | 2022-03-07 | 2022-06-03 | 南京邮电大学 | 一种基于特征通道融合和深度学习的癫痫预测系统 |
CN114913231A (zh) * | 2022-05-27 | 2022-08-16 | 聚时科技(上海)有限公司 | 基于机器视觉的行车目标物定位方法 |
CN114997230A (zh) * | 2022-06-01 | 2022-09-02 | 清华大学深圳国际研究生院 | 面向信号的特征定位展示与量化分析方法及其装置 |
CN115530847A (zh) * | 2022-09-30 | 2022-12-30 | 哈尔滨理工大学 | 一种基于多尺度注意力的脑电信号自动睡眠分期方法 |
-
2024
- 2024-02-02 CN CN202410147319.0A patent/CN117679047B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102363159A (zh) * | 2011-10-26 | 2012-02-29 | 北京科技大学 | 一种单张板精密冷轧板厚测量系统的厚度控制方法 |
CN102429658A (zh) * | 2011-12-20 | 2012-05-02 | 华南理工大学 | 基于脑电慢皮层电位小波分析的术中运动区功能定位系统 |
CN113907706A (zh) * | 2021-08-29 | 2022-01-11 | 北京工业大学 | 基于多尺度卷积和自注意力网络的脑电信号的癫痫发作预测方法 |
CN114569141A (zh) * | 2022-03-07 | 2022-06-03 | 南京邮电大学 | 一种基于特征通道融合和深度学习的癫痫预测系统 |
CN114913231A (zh) * | 2022-05-27 | 2022-08-16 | 聚时科技(上海)有限公司 | 基于机器视觉的行车目标物定位方法 |
CN114997230A (zh) * | 2022-06-01 | 2022-09-02 | 清华大学深圳国际研究生院 | 面向信号的特征定位展示与量化分析方法及其装置 |
CN115530847A (zh) * | 2022-09-30 | 2022-12-30 | 哈尔滨理工大学 | 一种基于多尺度注意力的脑电信号自动睡眠分期方法 |
Non-Patent Citations (1)
Title |
---|
"检测脑电癫痫的多头自注意力机制神经网络";仝航等;《计算机科学与探索》;20210518;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117679047A (zh) | 2024-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Roy | Adaptive transfer learning-based multiscale feature fused deep convolutional neural network for EEG MI multiclassification in brain–computer interface | |
Pannu et al. | Deep learning based image classification for intestinal hemorrhage | |
Hassan et al. | Fusion of multivariate EEG signals for schizophrenia detection using CNN and machine learning techniques | |
She et al. | Improved domain adaptation network based on wasserstein distance for motor imagery EEG classification | |
Raman et al. | Convolutional neural networks explain tuning properties of anterior, but not middle, face-processing areas in macaque inferotemporal cortex | |
Hatipoglu et al. | A signal-to-image transformation approach for EEG and MEG signal classification | |
CN113240655A (zh) | 一种自动检测眼底图像类型的方法、存储介质及装置 | |
Diwan et al. | Model hybridization & learning rate annealing for skin cancer detection | |
Kumar et al. | Vegetable plant leaf image classification using machine learning models | |
Mane et al. | StressNet: Hybrid model of LSTM and CNN for stress detection from electroencephalogram signal (EEG) | |
Laghari et al. | Deep residual-dense network based on bidirectional recurrent neural network for atrial fibrillation detection | |
Li et al. | N-Omniglot, a large-scale neuromorphic dataset for spatio-temporal sparse few-shot learning | |
CN117679047B (zh) | 一种多尺度轻量化网络系统的高效癫痫检测方法及系统 | |
Li et al. | GCNs–FSMI: EEG recognition of mental illness based on fine-grained signal features and graph mutual information maximization | |
Olmez et al. | PS-VTS: particle swarm with visit table strategy for automated emotion recognition with EEG signals | |
Dsouza et al. | Real Time Facial Emotion Recognition Using CNN | |
Bhise et al. | Review on deep learning-based plant disease detection | |
Kailash et al. | Deep learning based detection of mobility aids using yolov5 | |
Ye et al. | Facial expression recognition method based on shallow small convolution kernel capsule network | |
CN112489012A (zh) | 一种用于ct图像识别的神经网络架构方法 | |
Wasatkar et al. | Case Study Medical Images Analysis and Classification with Data-Centric Approach | |
Mathur et al. | Weighted Vector Visibility based Graph Signal Processing (WVV-GSP) for Neural Decoding of Motor Imagery EEG signals | |
Key et al. | Advancing EEG-based gaze prediction using depthwise separable convolution and enhanced pre-processing | |
Omar et al. | Enhancing EEG signals classification using LSTM‐CNN architecture | |
CN116304558B (zh) | 癫痫脑磁图棘波检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |