CN115486814A - 基于多模态癫痫数据智能融合分析与处理方法 - Google Patents

基于多模态癫痫数据智能融合分析与处理方法 Download PDF

Info

Publication number
CN115486814A
CN115486814A CN202211162248.9A CN202211162248A CN115486814A CN 115486814 A CN115486814 A CN 115486814A CN 202211162248 A CN202211162248 A CN 202211162248A CN 115486814 A CN115486814 A CN 115486814A
Authority
CN
China
Prior art keywords
modal
data
follows
frequency
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211162248.9A
Other languages
English (en)
Inventor
曹九稳
葛炀彬
郑润泽
蒋铁甲
高峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202211162248.9A priority Critical patent/CN115486814A/zh
Publication of CN115486814A publication Critical patent/CN115486814A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4076Diagnosing or monitoring particular conditions of the nervous system
    • A61B5/4094Diagnosing or monitoring seizure diseases, e.g. epilepsy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/05Detecting, measuring or recording for diagnosis by means of electric currents or magnetic fields; Measuring using microwaves or radio waves 
    • A61B5/053Measuring electrical impedance or conductance of a portion of the body
    • A61B5/0531Measuring skin impedance
    • A61B5/0533Measuring galvanic skin response
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/369Electroencephalography [EEG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/369Electroencephalography [EEG]
    • A61B5/372Analysis of electroencephalograms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/389Electromyography [EMG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/389Electromyography [EMG]
    • A61B5/397Analysis of electromyograms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/725Details of waveform analysis using specific filters therefor, e.g. Kalman or adaptive filters
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B2503/00Evaluating a particular growth phase or type of persons or animals
    • A61B2503/06Children, e.g. for attention deficit diagnosis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Artificial Intelligence (AREA)
  • Psychiatry (AREA)
  • Physiology (AREA)
  • Neurology (AREA)
  • Neurosurgery (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Psychology (AREA)
  • Dermatology (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于多模态癫痫数据智能融合分析与处理方法。本发明步骤:1、对多模态数据与脑电数据进行对标,检索多模态数据缺失值进行插值,对多模态数据进行预处理;2、对多模态信号总共8通道,分别以5s步长和0重复率的滑动窗口分割样本,再将所有样本计算时域、频域、以及非线性特征;然后通过T检验以及方差检验筛选出差异特征,最后使用mRMR来实现最优多模态特征组合;3、将得到不同模态信号的最优特征组合,排列组合后放置于不同的分类器,通过改变分类器不同的核函数得到癫痫发作的分类结果。本发明能够实现对多模态癫痫数据进行智能融合分析,对各模态数据进行优化组合,以及筛选不同域的特征,从而达到了更好的癫痫检测效果。

Description

基于多模态癫痫数据智能融合分析与处理方法
技术领域
本发明是属于便携式设备癫痫发作检测领域,涉及一种基于多模态信息处理的儿童癫痫智能检测辅助分析方法。
背景技术
癫痫是最常见的神经系统疾病之一,影响全球约0.6%的人口。其中癫痫发作的不可预测性和明显的随机性是癫痫最令人烦恼的方面之一。能够检测癫痫发作的方法或设备可能有助于防止受伤甚至死亡,并显著提高生活质量。近70%的癫痫患者对适当的治疗有反应,但要成功治疗癫痫,医生需要知道癫痫是否以及何时发作。虽然现在通过便携式设备来采集生理信号来分析癫痫发作已经很普遍,但是仍然对于癫痫的发作难以精确识别诊断。其中主要原因包括:在硬件方面上,相关的便携式设备性能不佳以及没有有效的癫痫初期检查与智能辅助诊疗系统;所采用的生理信号类型较少,单一的生理信号无法全面刻画癫痫发作;在软件方面上,对多模态信号之间关联信息挖掘不够完善。因此,为便携式设备提出一种多模态癫痫数据智能融合分析与处理方法具有很强的社会现实意义与经济效益。
多模态生理信号能从多角度刻画癫痫发作,大部分儿童癫痫发作都会表现出肢体的异常抽搐,因此可以通过肌电信号以及姿态信号和皮肤电信号来进行检测和诊断。当前主要的研究集中关注在下列几个方向:
癫痫分期及检测:利用收集的癫痫患者的临床多模态信号,将多模态信号划分为不发作和发作期不同的阶段,在完成分期的基础上对患者的癫痫发作进行检测。
与癫痫发作脑电信号所需佩戴设备不同,便携式设备能提供信号采集的便利性以及采集生理信号的多样性,在相关癫痫的临床诊断和辅助分析有着巨大的潜力,在非脑电图癫痫监测设备中,结合多个传感器的系统最有希望提高癫痫检测灵敏度,此外通过多个传感器的生理数据能够从多角度刻画癫痫发作,为临床提供更多的数据支持。但当前对便携式设备的研究还存在以下几个主要问题:1)便携式设备所采集的信号较为单一,无法全面的刻画癫痫发作的特点以及准确识别癫痫发作;2)同时对于不同模态下信号下的特征组合,构建不够明确;3)已有的机器学习方法选用较为单一。另外,多模态信号组合间的关联信息也没有挖掘充分。
发明内容
本发明提供一种基于便携式设备的癫痫数据智能分析和发作识别方法,以解决癫痫发作在临床中的具体应用问题。主要创新如下:
1)针对儿童的多模态癫痫信息,提出了一种多模态信号智能信息融合的特征筛选方法。
2)引入比较多种分类器和多模态信号组合模块,可以更好刻画儿童癫痫发作。
本发明中,首先对原始采集的多模态生理信号数据与脑电数据进行时间对标,使用检验癫痫发作的黄金标准——视频脑电图来检验后续发作的准确率,再对多模态生理信号数据进行切分,截取发作时的生理信号,再分别采用不同的预处理得到干扰少的多模态生理信号。预处理过程包括:对于肌电数据使用中心化,然后使用带通滤波器选择20Hz至60Hz频段,再在使用间隔频率为4hz的梳妆滤波器消除设备所产生的干扰。对于皮肤电信号,首先使用中值滤波和平滑滤波器剔除外界的干扰使其变得平滑。对于6轴加速度信号,首先使其中心化,再使用中值滤波器去除干扰。再对各模态数据采样5s的滑动窗口以及0重叠率切割方法。计算每个窗口的特征,通过计算18个时域特征,5个频域特征,以及3个非线性特征。将各个模态的特征使用T检验、方差检验、箱线图等一系列统计方法来验证癫痫发作与否的差别,以及在儿童不同的年龄段发作差异,对于不同的性别下发作差异。通过实验得出的典型特征,再对其使用mRMR来去除冗余的特征。得到的特征作为输入分别导入不同的分类器支持向量机、决策树、朴素贝叶斯、集成学习等,比较结果最后得到分类结果。
本发明的技术方案主要包括以下几个步骤:
步骤1、对多模态数据与脑电数据进行对标,检索多模态数据缺失值进行插值,对多模态数据进行预处理;
步骤2、对多模态信号总共8通道(EMG,EDA,3轴加速度,3轴陀螺仪),分别以5s步长和0重复率的滑动窗口分割样本,再将所有样本计算时域、频域、以及非线性特征;然后通过T检验以及方差检验筛选出差异特征,最后使用mRMR来实现最优多模态特征组合。
步骤3、将得到不同模态信号的最优特征组合,排列组合后放置于不同的分类器:逻辑回归、贝叶斯、KNN、支持向量机、集成学习以及决策树,通过改变分类器不同的核函数得到癫痫发作的分类结果。
所述步骤1的具体步骤如下:
将多模态信号与脑电信号进行时间对标,排除信号缺失成分较大的数据,截取发作期的多模态生理信号,首先将1通道、采样频率为200Hz的EMG信号;对于获取的EMG信号,首先进行中心化,进行基准线校准,再使用带通滤波器选择20Hz至60Hz频段的EMG数据,最后使用间隔为4Hz的梳状滤波器剔除设备采集的信号干扰,最终得到干扰少的肌电信号。其次将一通道、采样频率为4Hz的EDA信号;对于获取的EDA信号,首先使用1阶中值滤波器剔除奇异值,最后使用移动平滑滤波器窗口设置为5,最终得到干扰少的皮肤电信号。最后将6通道,采样频率为50Hz的GYR以及ACC信号,对于获取的GYR和ACC信号,首先进行中心化,进行基准线校准,去除0Hz分量,其次使用不同宽度的中值滤波器剔除干扰,最终得到干扰的6轴加速度信号。
所述步骤2的具体步骤如下:
2-1、将得到的多模态信号按每5s一段进行切分,首先考虑对加速度以及陀螺仪三个轴向的数据综合处理,对三通道的GYR以及ACC数据求取2-范数,其定义如下:
Figure BDA0003860175270000031
然后对10通道信号在时域、频域、以及非线性域下提取特征,得到每个样本以MAT文件格式储存。
2-2、提了最大值、最小值、峰峰值、均值、方根幅值、标准差、有效均方根、峭度、偏度、波形因子、峰值因子、脉冲因子、裕度因子以及间隙因子等时域特征。其中最大值Max和最小值Min分别为信号幅值的最大值及最小值,P2P值是信号幅值在区间内极大值和极小值的差异,平均值Mean为多模态信号幅值趋势,公式如下:
Figure BDA0003860175270000032
其中,f(t)代表数据每个样本点的幅值大小、N表示每个样本所包含样本点的数量。下述公式中f(t)、N都表示相同含义。
标准差SD反映每个采样点的幅值和平均值之间的差异,公式如下:
Figure BDA0003860175270000041
其中,
Figure BDA0003860175270000042
表示该样本的平均值。
峭度Kur代表数据频率分布曲线的峰值水平,用于描述变量的分布,公式如下:
Figure BDA0003860175270000043
其中,μ表示总体样本均值,σ表示样本的方差。μ、σ下述公式表示相同含义。
偏度Skew表示多模态信号幅值不对称程度的特征,公式如下:
Figure BDA0003860175270000044
波形因子Form factor表示多模态信号的有效值(RMS)与整流平均值的比值,公式如下:
Figure BDA0003860175270000045
峰值因子Peaking factor表示多模态信号在波形中的极端程度,公式如下:
Figure BDA0003860175270000046
其中,Peak表示样本的区间内的极大值。
脉冲因子Pulse factor表示多模态信号峰值与整流平均值(绝对值的平均值)的比值,表示信号受到剧烈浮动,公式如下:
Figure BDA0003860175270000047
裕度因子Margin factor表示多模态信号峰值与方根幅值的比值。公式如下:
Figure BDA0003860175270000048
接下提取多模态信号频域特征参数包括,平均频率,重心频率,均方根频率,以及频率标准差和平均功率谱密度。其中平均频率Average frequency用来描述信号在频谱内的变化趋势,其公式如下:
Figure BDA0003860175270000049
其中,f(ω)表示样本经过傅里叶变换之后的幅值。下述公式中f(ω)都表示相同含义。
重心频率Barycenter frequency描述信号在频谱中分量较大的信号成分的频率,反映信号功率谱的分布情况。其公式如下:
Figure BDA0003860175270000051
均方根频率RMSF表示信号频率平方的加权平均,同样以功率谱的幅值为权。
Figure BDA0003860175270000052
频率标准差FSD表示功率谱能量分布的分散程度频率标准差是重若重心附近的频谱幅值较大,则频率标准差较小;若重心附近的频谱较小,则频率标准差较大。其公式如下:
Figure BDA0003860175270000053
其中,FC表示样本的重心频率。
平均功率谱密度APSD表示了多模态信号功率随着频率的变化情况,即信号功率在频域的分布状况,其公式如下:
Figure BDA0003860175270000054
其中,K表示切分的数据段数目,M表示每段数据的长度。U表示窗函数ω(n)的能量,xi(n)表示输入的多模态生理数据。其中APSD再对其求平均即可。
最后提取多模态生理信号非线性特征参数包括,样本熵,近似熵,模糊熵。其中近似熵是一个随机复杂度,反应序列相邻的m个点所连成折线段的模式的互相近似的概率与由m+1个点所连成的折线段的模式相互近似的概率之差。用来描述复杂系统的不规则性,越是不规则的时间序列对应的近似熵越大。反应维数改变时产生的新的模式的可能性的大小。其公式如下:
ApEn=φm(t)-φm+1(t) (15)
其中,φm(t)表示样本间的相似度量值。下述公式中φm(t)都表示相同含义。
样本熵(SampEn)是基于近似熵(ApEn)的一种用于度量时间序列复杂性的改进方法,样本熵的计算不依赖数据长度;样本熵具有更好的一致性,即参数m和r的变化对样本熵的影响程度是相同的.其公式如下:
SampEn=lnφm(t)-lnφm+1(t) (16)
模糊熵(FuzzyEn)衡量的也是新模式产生的概率大小(Fuzzy思想,给出概率而不是定论),测度值越大,新模式产生的概率越大,即序列复杂度越大。其公式如下:
FuzzyEn=lnφm(t)-lnφm+1(t) (17)
2-3、将获取多模态信号特征根据是否为发作数据分成两类样本,再将这两类样本进行正态检验采用W检验法,W检验法选取指标量为:
Figure BDA0003860175270000061
其中,n为样本容量,X(k)为样本升序排列,ak为计算系数,W检验法的拒绝域为W≤Wa,α为显著性水平。
接下来,采用两正态总体均值的T检验法对发作样本和不发作样本进行一致性分析,具体过程为:
两正态总体均值的T检验:原假设H01=μ2,备择假设H11≠v2,检验统计量的计算公式如下:
Figure BDA0003860175270000062
其中检验水平α条件下的拒绝域为
Figure BDA0003860175270000063
其中
Figure BDA0003860175270000064
为t检验拒绝的临界点。已知检验水平α,查t分表得到
Figure BDA0003860175270000065
若检验统计量t落在拒绝域内,则拒绝H0,认为仿真模型是不可信的;否则接受H0认为仿真模型是可信的。
通过多模态信号特征进行T检验,根据T检验所得到p值,将获得两样本差异较大的特征进行筛选。组成新的特征表。
2-4、将获得T检验后的多模态信号特征,使用最小冗余最大相关性(mRMR),选择与分类变量拥有最高相关度的前10个变量。互信息计算每一个所述指标数据,利用指标边缘概率密度与指标联合概率密度计算互信息,其公式如下:
Figure BDA0003860175270000071
其中,I(X,Y)为特征变量X与Y间的互信息量,x、y为数据变量,p(x)和p(y)分别是x和y的边缘概率分布函数,p(x,y)表示x和y的联合概率密度函数。
利用前向排序法依次计算所述指标数据间的相关性与冗余性,其公式如下:
Figure BDA0003860175270000072
Figure BDA0003860175270000073
其中,S表示特征变量的一个子集,c表示目标变量,fi为第i个指标变量,D(S,c)为互信息的平均值。R(S)为特征子集的最小冗余度量。
计算所述指标数据与目标数据的mRMR特征值及排序包括,其公式如下:
Figure BDA0003860175270000074
其中,mRMR为综合最大互信息与最小冗余度的度量。
步骤(3)具体方法如下:
3-1、将提取时域、频域以及非线性特征的特征分为测试集和训练集,通过mRMR在EDA、EMG、ACC与GYR信号中获得了10个最优特征。现在将上述4种多模态信号,进行排列组合后分别输入到不同的分类器中,通过测试逻辑回归,邻近算法,支持向量机,集成学习,决策树,朴素贝叶斯等机器学习分类器方法。通过训练上述分类器,综合准确率最高的作为最终的分类器。
然后对训练集使用5折交叉验证,其步骤为:将所有训练集分为5份,不重复地每次取其中一份做测试集,用其他四份做训练集训练模型,之后计算该模型在测试集上的MSEi,然后不断重复实验,将5次的MSEi取平均得到最后的MSE,其公式如下:
Figure BDA0003860175270000081
3-2、分类器训练效果采用Precision、Specificity展示。各参数计算公式如下:
Figure BDA0003860175270000082
Figure BDA0003860175270000083
其中TP表示被模型预测为正类的正样本,TN表示被模型预测为负类的负样本,FP表示被模型预测为正类的负样本,FN表示被模型预测为负类的正样本。Precision表示精确度,代表各个类别的识别率,针对单个样本而言。Specificity表示特异度,数值越高,误诊率越低。
本发明有益效果如下:
采用便携式设备的儿童癫痫数据的智能分析方法,其优势主要包括,1)使用便携式设备对儿童的检测可以避免使用视频脑电图的诸多不利。2)使用多模态信号组合,可以充分挖掘信号之间的关联性,可以更好的发挥多通道多维度的价值。3)提供了一种针对癫痫检测的多模态信号特征筛选方法,该方法能有效提升检测的结果。
本发明对原始多模态生理数据截取发作期多模态生理信号并分别进行了滤波等一系列预处理,提取了时域、频域以及非线性特征,并使用了正态检验、T检验以及rMRM来对特征进行降维和重组,再分布使用逻辑回归,邻近算法,支持向量机,集成学习,决策树,朴素贝叶斯等机器学习分类器方法。通过使用癫痫患者数据集进行实验,对于没有进行特征筛选的检测,其准确率相对提高了5%左右;对于传统的PCA筛选特征方法,其准确率相对提高了2%左右。通过本发明能够实现对多模态癫痫数据进行智能融合分析,对各模态数据进行优化组合,以及筛选不同域的特征,从而达到了相比于常规特征筛选方法更好的癫痫检测效果。
附图说明
图1为本发明实施例的流程图。
具体实现方式
下面结合附图详细说明本发明的具体实施方式。
如图1所示,基于便携式设备的癫痫数据处理与智能分析,包括如下步骤:
步骤1、对多模态数据进行与脑电数据进行对标,对多模态数据缺失值进行插值,对多模态数据进行预处理:
将多模态信号与脑电信号进行时间对标,排除信号缺失成分较大的数据,截取发作期的多模态生理信号,首先将1通道、采样频率为200Hz的EMG信号;对于获取的EMG信号,首先进行中心化,进行基准线校准,再使用带通滤波器选择20Hz至60Hz频段的EMG数据,最后使用间隔为4Hz的梳状滤波器剔除设备采集的信号干扰,最终得到干扰少的肌电信号。其次将一通道、采样频率为4Hz的EDA信号;对于获取的EDA信号,首先使用1阶中值滤波器剔除奇异值,最后使用移动平滑滤波器窗口设置为5,最终得到干扰少的皮肤电信号。最后将6通道,采样频率为50Hz的GYR以及ACC信号,对于获取的GYR和ACC信号,首先进行中心化,进行基准线校准,去除0Hz分量,其次使用不同宽度的中值滤波器剔除干扰,最终得到干扰的6轴加速度信号。
步骤2、对多模态信号总共8通道(EMG,EDA,3轴加速度,3轴陀螺仪),分别以5s步长和0重复率的滑动窗口分割样本,再将所有样本计算时域,频域,以及非线性特征;然后同过统计分析:T检验以及方差检验筛选出差异特征,最后使用mRMR来实现最优多模态特征组合:
2-1、将得到的多模态生理数据按每5s一段进行切分,首先考虑对加速度以及陀螺仪三个轴向的数据综合处理,我们对三通道的GYR以及ACC数据求取2-范数,其定义如下:
Figure BDA0003860175270000091
然后对10通道信号在时域,频域,以及非线性域下提取特征,得到每个样本以MAT文件格式储存。
2-2、进一步的,提取了最大值、最小值、峰峰值、均值、方根幅值,标准差,有效均方根,峭度、偏度、波形因子、峰值因子、脉冲因子、裕度因子以及间隙因子等时域特征。其中最大值Max和最小值Min分别为信号幅值的最大值及最小值,P2P值是信号幅值在区间内极大值和极小值的差异,平均值Mean为多模态信号幅值趋势,公式如下:
Figure BDA0003860175270000101
标准差SD反映每个采样点的幅值和平均值之间的差异,公式如下:
Figure BDA0003860175270000102
峭度Kur代表数据频率分布曲线的峰值水平,用于描述变量的分布,公式如下:
Figure BDA0003860175270000103
偏度Skew表示多模态信号幅值不对称程度的特征,公式如下:
Figure BDA0003860175270000104
波形因子Form factor表示多模态信号的有效值(RMS)与整流平均值的比值,公式如下:
Figure BDA0003860175270000105
峰值因子Peaking factor表示多模态信号在波形中的极端程度,公式如下:
Figure BDA0003860175270000106
脉冲因子Pulse factor表示多模态信号峰值与整流平均值(绝对值的平均值)的比值,表示信号受到剧烈浮动,公式如下:
Figure BDA0003860175270000107
裕度因子Margin factor表示多模态信号峰值与方根幅值的比值。公式如下:
Figure BDA0003860175270000108
接下提取多模态信号频域特征参数包括,平均频率,重心频率,均方根频率,以及频率标准差和平均功率谱密度。其中平均频率Average frequency用来描述信号在频谱内的变化趋势,其公式如下:
Figure BDA0003860175270000109
重心频率Barycenter frequency描述信号在频谱中分量较大的信号成分的频率,反映信号功率谱的分布情况。其公式如下:
Figure BDA0003860175270000111
均方根频率RMSF表示信号频率平方的加权平均,同样以功率谱的幅值为权。
Figure BDA0003860175270000112
频率标准差FSD表示功率谱能量分布的分散程度频率标准差是重若重心附近的频谱幅值较大,则频率标准差较小;若重心附近的频谱较小,则频率标准差较大。其公式如下:
Figure BDA0003860175270000113
平均功率谱密度APSD表示了多模态信号功率随着频率的变化情况,即信号功率在频域的分布状况,其公式如下:
Figure BDA0003860175270000114
其中,K表示切分的数据段数目,M表示每段数据的长度。U表示窗函数w(n)的能量,xi(n)表示输入的多模态生理数据。其中APSD再对其求平均即可。
最后提取多模态生理信号非线性特征参数包括,样本熵,近似熵,模糊熵。其中近似熵是一个随机复杂度,反应序列相邻的m个点所连成折线段的模式的互相近似的概率与由m+1个点所连成的折线段的模式相互近似的概率之差。用来描述复杂系统的不规则性,越是不规则的时间序列对应的近似熵越大。反应维数改变时产生的新的模式的可能性的大小。其公式如下:
ApEn=φm(t)-φm+1(t) (15)
样本熵(SampEn)是基于近似熵(ApEn)的一种用于度量时间序列复杂性的改进方法,样本熵的计算不依赖数据长度;样本熵具有更好的一致性,即参数m和r的变化对样本熵的影响程度是相同的.其公式如下:
SampEn=lnφm(t)-lnφm+1(t) (16)
模糊熵(FuzzyEn)衡量的也是新模式产生的概率大小(Fuzzy思想,给出概率而不是定论),测度值越大,新模式产生的概率越大,即序列复杂度越大。其公式如下:
FuzzyEn=lnφm(t)-lnφm+1(t) (17)
2-3、将获取多模态生理信号特征根据是否为发作数据分成两类样本,首先对这两类样本进行正态检验采用W检验法,W检验法选取指标量为:
Figure BDA0003860175270000121
其中,n为样本容量,X(k)为样本升序排列,ak为计算系数,W检验法的拒绝域为W≤Wa,α为显著性水平。
接下来,采用两正态总体均值的t检验法对发作样本和不发作样本进行一致性分析,具体过程为:
两正态总体均值的t检验:原假设H01=μ2,备择假设H11≠μ2,检验统计量的计算公式如下:
Figure BDA0003860175270000122
其中检验水平α条件下的拒绝域为
Figure BDA0003860175270000123
其中
Figure BDA0003860175270000124
为t检验拒绝的临界点。已知检验水平α,查t分表得到
Figure BDA0003860175270000125
若检验统计量t落在拒绝域内,则拒绝H0,认为仿真模型是不可信的;否则接受H0认为仿真模型是可信的。
通过多模态信号特征进行T检验,根据T检验所得到p值,将获得两样本差异较大的特征进行筛选。组成新的特征表。
2-4、将获得T检验后的多模态信号特征,使用最小冗余最大相关性(mRMR),选择与分类变量拥有最高相关度的前10个变量。互信息计算每一个所述指标数据,利用指标边缘概率密度与指标联合概率密度计算互信息,其公式如下:
Figure BDA0003860175270000126
其中,I(X,Y)为特征变量X与Y间的互信息量,x、y为数据变量,p(x)和p(y)分别是x和y的边缘概率分布函数,p(x,y)表示x和y的联合概率密度函数。
利用前向排序法依次计算所述指标数据间的相关性与冗余性,其公式如下:
Figure BDA0003860175270000131
Figure BDA0003860175270000132
其中,S表示特征变量的一个子集,c表示目标变量,fi为第i个指标变量,D(S,c)为互信息的平均值。R(S)为特征子集的最小冗余度量。
计算所述指标数据与目标数据的mRMR特征值及排序包括,其公式如下:
Figure BDA0003860175270000133
其中,mRMR为综合最大互信息与最小冗余度的度量。
步骤3、将得到不同模态信号的最优特征组合,排列组合后放置于不同的机器学习分类器:逻辑回归,贝叶斯,KNN,支持向量机,集成学习以及决策树,通过改变分类器不同的核函数得到癫痫发作的分类结果:
3-1、将提取时域、频域以及非线性特征的特征分为测试集和训练集,通过mRMR在EDA、EMG、ACC与GYR信号中获得了10个最优特征。现在将上述4种多模态信号,进行排列组合后分别输入到不同的分类器中,通过测试逻辑回归,邻近算法,支持向量机,集成学习,决策树,朴素贝叶斯等机器学习分类器方法。通过训练上述分类器,综合准确率最高的作为最终的分类器。
然后对训练集使用5折交叉验证,其步骤为:将所有训练集分为5份,不重复地每次取其中一份做测试集,用其他四份做训练集训练模型,之后计算该模型在测试集上的MSEi,然后不断重复实验,将5次的MSEi取平均得到最后的MSE,其公式如下:
Figure BDA0003860175270000134
3-2、分类器训练效果采用Precision、Specificity展示。各参数计算公式如下:
Figure BDA0003860175270000141
Figure BDA0003860175270000142
其中TP表示被模型预测为正类的正样本,TN表示被模型预测为负类的负样本,FP表示被模型预测为正类的负样本,FN表示被模型预测为负类的正样本。Precision表示精确度,代表各个类别的识别率,针对单个样本而言。Specificity表示特异度,数值越高,误诊率越低。
本发明还提供基于便携式设备的癫痫数据处理与智能分析系统,具体包括多模态数据信号处理模块、特征提取模块和分类识别模块;
所述的多模态信号数据信号处理模块具体实现:对多模态信号总共8通道(EMG,EDA,3轴加速度,3轴陀螺仪),分别以5s步长和0重复率的滑动窗口分割样本,再将所有样本计算时域,频域,以及非线性特征;将多模态信号与脑电信号进行时间对标,排除信号缺失成分较大的数据,截取发作期的多模态生理信号,首先将1通道、采样频率为200Hz的EMG信号;对于获取的EMG信号,首先进行中心化,进行基准线校准,再使用带通滤波器选择20Hz至60Hz频段的EMG数据,最后使用间隔为4Hz的梳状滤波器剔除设备采集的信号干扰,最终得到干扰少的肌电信号等操作。
所述的特征提取模块具体实现:对多模态信号总共8通道(EMG,EDA,3轴加速度,3轴陀螺仪),分别以5s步长和0重复率的滑动窗口分割样本,再将所有样本计算时域,频域,以及非线性特征;然后同过统计分析:T检验以及方差检验筛选出差异特征,最后使用mRMR来实现最优多模态特征组合。
所述的分类识别模块具体实现:将得到不同模态信号的最优特征组合,排列组合后放置于不同的机器学习分类器:逻辑回归,贝叶斯,KNN,支持向量机,集成学习以及决策树,通过改变分类器不同的核函数得到癫痫发作的分类结果。
本发明对原始多模态生理数据截取发作期多模态生理信号并分别进行了滤波等一系列预处理,提取了时域、频域以及非线性特征,并使用了正态检验、T检验以及rMRM来对特征进行降维和重组,再分别使用逻辑回归,邻近算法,支持向量机,集成学习,决策树,朴素贝叶斯等机器学习分类器方法。通过使用癫痫患者数据集进行实验,对于没有进行特征筛选的检测,其准确率相对提高了5%左右;对于传统的PCA筛选特征方法,其准确率相对提高了2%左右。通过本发明能够实现对多模态癫痫数据进行智能融合分析,对各模态数据进行优化组合,以及筛选不同域的特征,从而达到了相比于常规特征筛选方法更好的癫痫检测效果。

Claims (4)

1.基于多模态癫痫数据智能融合分析与处理方法,其特征在于包括如下步骤:
步骤1、对多模态数据与脑电数据进行对标,检索多模态数据缺失值进行插值,对多模态数据进行预处理;
步骤2、对多模态信号总共8通道,分别以5s步长和0重复率的滑动窗口分割样本,再将所有样本计算时域、频域、以及非线性特征;然后通过T检验以及方差检验筛选出差异特征,最后使用mRMR来实现最优多模态特征组合;
步骤3、将得到不同模态信号的最优特征组合,排列组合后放置于不同的分类器:逻辑回归、贝叶斯、KNN、支持向量机、集成学习以及决策树,通过改变分类器不同的核函数得到癫痫发作的分类结果。
2.根据权利要求1所述的基于多模态癫痫数据智能融合分析与处理方法,其特征在于所述步骤1的具体步骤如下:
将多模态信号与脑电信号进行时间对标,排除信号缺失成分较大的数据,截取发作期的多模态生理信号,首先将1通道、采样频率为200Hz的EMG信号;对于获取的EMG信号,首先进行中心化,进行基准线校准,再使用带通滤波器选择20Hz至60Hz频段的EMG数据,最后使用间隔为4Hz的梳状滤波器剔除设备采集的信号干扰,最终得到干扰少的肌电信号;其次将一通道、采样频率为4Hz的EDA信号;对于获取的EDA信号,首先使用1阶中值滤波器剔除奇异值,最后使用移动平滑滤波器窗口设置为5,最终得到干扰少的皮肤电信号;最后将6通道,采样频率为50Hz的GYR以及ACC信号,对于获取的GYR和ACC信号,首先进行中心化,进行基准线校准,去除0Hz分量,其次使用不同宽度的中值滤波器剔除干扰,最终得到干扰的6轴加速度信号。
3.根据权利要求1所述的基于多模态癫痫数据智能融合分析与处理方法,其特征在于所述步骤2的具体步骤如下:
2-1、将得到的多模态信号按每5s一段进行切分,首先考虑对加速度以及陀螺仪三个轴向的数据综合处理,对三通道的GYR以及ACC数据求取2-范数,其定义如下:
Figure FDA0003860175260000011
然后对10通道信号在时域、频域、以及非线性域下提取特征,得到每个样本以MAT文件格式储存;
2-2、提取最大值、最小值、峰峰值、均值、方根幅值、标准差、有效均方根、峭度、偏度、波形因子、峰值因子、脉冲因子、裕度因子以及间隙因子的时域特征;其中最大值Max和最小值Min分别为信号幅值的最大值及最小值,P2P值是信号幅值在区间内极大值和极小值的差异,平均值Mean为多模态信号幅值趋势,公式如下:
Figure FDA0003860175260000021
其中,f(t)代表数据每个样本点的幅值大小、N表示每个样本所包含样本点的数量;下述公式中f(t)、N都表示相同含义;
标准差SD反映每个采样点的幅值和平均值之间的差异,公式如下:
Figure FDA0003860175260000022
其中,
Figure FDA0003860175260000023
表示该样本的平均值;
峭度Kur代表数据频率分布曲线的峰值水平,用于描述变量的分布,公式如下:
Figure FDA0003860175260000024
其中,μ表示总体样本均值,σ表示样本的方差;μ、σ下述公式表示相同含义;
偏度Skew表示多模态信号幅值不对称程度的特征,公式如下:
Figure FDA0003860175260000025
波形因子表示多模态信号的有效值与整流平均值的比值,公式如下:
Figure FDA0003860175260000026
峰值因子表示多模态信号在波形中的极端程度,公式如下:
Figure FDA0003860175260000027
其中,Peak表示样本的区间内的极大值;
脉冲因子表示多模态信号峰值与整流平均值的比值,表示信号受到剧烈浮动,公式如下:
Figure FDA0003860175260000031
裕度因子Margin factor表示多模态信号峰值与方根幅值的比值;公式如下:
Figure FDA0003860175260000032
接下提取多模态信号频域特征参数包括,平均频率,重心频率,均方根频率,以及频率标准差和平均功率谱密度;其中平均频率用来描述信号在频谱内的变化趋势,其公式如下:
Figure FDA0003860175260000033
其中,f(ω)表示样本经过傅里叶变换之后的幅值;下述公式中f(ω)都表示相同含义;
重心频率描述信号在频谱中分量较大的信号成分的频率,反映信号功率谱的分布情况;其公式如下:
Figure FDA0003860175260000034
均方根频率RMSF表示信号频率平方的加权平均,同样以功率谱的幅值为权;
Figure FDA0003860175260000035
频率标准差FSD表示功率谱能量分布的分散程度频率标准差是重若重心附近的频谱幅值较大,则频率标准差较小;若重心附近的频谱较小,则频率标准差较大;其公式如下:
Figure FDA0003860175260000036
其中,FC表示样本的重心频率;
平均功率谱密度APSD表示了多模态信号功率随着频率的变化情况,即信号功率在频域的分布状况,其公式如下:
Figure FDA0003860175260000037
其中,K表示切分的数据段数目,M表示每段数据的长度;U表示窗函数ω(n)的能量,xi(n)表示输入的多模态生理数据;其中APSD再对其求平均即可;
最后提取多模态生理信号非线性特征参数包括样本熵、近似熵、模糊熵;其中近似熵公式如下:
ApEn=φm(t)-φm+1(t) (15)
其中,φm(t)表示样本间的相似度量值;下述公式中φm(t)都表示相同含义;
样本熵公式如下:
SampEn=lnφm(t)-lnφm+1(t) (16)
模糊熵公式如下:
FuzzyEn=lnφm(t)-lnφm+1(t) (17)
2-3、将获取多模态信号特征根据是否为发作数据分成两类样本,再将这两类样本进行正态检验采用W检验法,W检验法选取指标量为:
Figure FDA0003860175260000041
其中,n为样本容量,X(k)为样本升序排列,ak为计算系数,W检验法的拒绝域为W≤Wa,α为显著性水平;
然后采用两正态总体均值的T检验法对发作样本和不发作样本进行一致性分析,具体过程为:
两正态总体均值的T检验:原假设H0:μ1=μ2,备择假设H1:μ1≠μ2,检验统计量的计算公式如下:
Figure FDA0003860175260000042
其中检验水平α条件下的拒绝域为
Figure FDA0003860175260000043
其中
Figure FDA0003860175260000044
为t检验拒绝的临界点;已知检验水平α,查t分表得到
Figure FDA0003860175260000045
若检验统计量t落在拒绝域内,则拒绝H0,认为仿真模型是不可信的;否则接受H0认为仿真模型是可信的;
通过多模态信号特征进行T检验,根据T检验所得到p值,将获得两样本差异较大的特征进行筛选;组成新的特征表;
2-4、将获得T检验后的多模态信号特征,使用最小冗余最大相关性,选择与分类变量拥有最高相关度的前10个变量;互信息计算每一个所述指标数据,利用指标边缘概率密度与指标联合概率密度计算互信息,其公式如下:
Figure FDA0003860175260000051
其中,I(X,Y)为特征变量X与Y间的互信息量,x、y为数据变量,p(x)和p(y)分别是x和y的边缘概率分布函数,p(x,y)表示x和y的联合概率密度函数;
利用前向排序法依次计算所述指标数据间的相关性与冗余性,其公式如下:
Figure FDA0003860175260000052
Figure FDA0003860175260000053
其中,S表示特征变量的一个子集,c表示目标变量,fi为第i个指标变量,D(S,c)为互信息的平均值;R(S)为特征子集的最小冗余度量;
计算所述指标数据与目标数据的mRMR特征值及排序包括,其公式如下:
Figure FDA0003860175260000054
其中,mRMR为综合最大互信息与最小冗余度的度量。
4.根据权利要求1所述的基于多模态癫痫数据智能融合分析与处理方法,其特征在于所述步骤3的具体步骤如下:
3-1、将提取时域、频域以及非线性特征的特征分为测试集和训练集,通过mRMR在EDA、EMG、ACC与GYR信号中获得10个最优特征;然后将上述4种多模态信号,进行排列组合后分别输入到不同的分类器中,通过测试逻辑回归、邻近算法、支持向量机、集成学习、决策树、朴素贝叶斯训练分类器,综合准确率最高的作为最终的分类器;
然后对训练集使用5折交叉验证,其步骤为:将所有训练集分为5份,不重复地每次取其中一份做测试集,用其他四份做训练集训练模型,之后计算该模型在测试集上的MSEi,然后不断重复实验,将5次的MSEi取平均得到最后的MSE,其公式如下:
Figure FDA0003860175260000061
3-2、分类器训练效果采用Precision、Specificity展示,各参数计算公式如下:
Figure FDA0003860175260000062
Figure FDA0003860175260000063
其中TP表示被模型预测为正类的正样本,TN表示被模型预测为负类的负样本,FP表示被模型预测为正类的负样本,FN表示被模型预测为负类的正样本;Precision表示精确度,代表各个类别的识别率,针对单个样本而言;Specificity表示特异度,数值越高,误诊率越低。
CN202211162248.9A 2022-09-23 2022-09-23 基于多模态癫痫数据智能融合分析与处理方法 Pending CN115486814A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211162248.9A CN115486814A (zh) 2022-09-23 2022-09-23 基于多模态癫痫数据智能融合分析与处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211162248.9A CN115486814A (zh) 2022-09-23 2022-09-23 基于多模态癫痫数据智能融合分析与处理方法

Publications (1)

Publication Number Publication Date
CN115486814A true CN115486814A (zh) 2022-12-20

Family

ID=84470376

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211162248.9A Pending CN115486814A (zh) 2022-09-23 2022-09-23 基于多模态癫痫数据智能融合分析与处理方法

Country Status (1)

Country Link
CN (1) CN115486814A (zh)

Similar Documents

Publication Publication Date Title
Wang et al. Detection analysis of epileptic EEG using a novel random forest model combined with grid search optimization
Hussain et al. Epileptic seizure detection using 1 D-convolutional long short-term memory neural networks
CN110338786B (zh) 一种癫痫样放电的识别与分类方法、系统、装置和介质
Sharmila Epilepsy detection from EEG signals: A review
Exarchos et al. EEG transient event detection and classification using association rules
Kumari et al. Seizure detection in EEG using time frequency analysis and SVM
CN110598676B (zh) 基于置信度得分模型的深度学习手势肌电信号识别方法
CN103190904B (zh) 基于缺项特征的脑电图分类检测装置
Bagheri et al. A fast machine learning approach to facilitate the detection of interictal epileptiform discharges in the scalp electroencephalogram
CN108937916A (zh) 一种心电信号检测方法、装置及存储介质
CN111000555B (zh) 一种癫痫脑电信号的训练数据生成方法、自动识别模型建模方法和自动识别方法
WO2022135449A1 (zh) 癫痫患者发作间期痫样电活动检测装置和方法
Sharanreddy et al. Detection of primary brain tumor present in EEG signal using wavelet transform and neural network
Prakash et al. A system for automatic cardiac arrhythmia recognition using electrocardiogram signal
Yang et al. Automated intra-patient and inter-patient coronary artery disease and congestive heart failure detection using EFAP-Net
Kaur et al. Multi-class support vector machine classifier in EMG diagnosis
Chumrit et al. Ecg-based arrhythmia detection using average energy and zero-crossing features with support vector machine
CN115486814A (zh) 基于多模态癫痫数据智能融合分析与处理方法
CN115054266A (zh) 一种神经信号处理方法、装置、设备及存储介质
Übeyli Implementing eigenvector methods/probabilistic neural networks for analysis of EEG signals
Bagheri et al. Classifier cascade to aid in detection of epileptiform transients in interictal EEG
Liang et al. Abnormal discharge detection using adaptive neuro-fuzzy inference method with probability density-based feature and modified subtractive clustering
Kumar Heart disease detection using radial basis function classifier
Farashi Spike detection using a multiresolution entropy based method
Shankar et al. Epilepsy Detection Using Embedded Machine Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination