CN109645990B - 一种癫痫患者脑电信号的计算机模式识别方法 - Google Patents
一种癫痫患者脑电信号的计算机模式识别方法 Download PDFInfo
- Publication number
- CN109645990B CN109645990B CN201811569002.7A CN201811569002A CN109645990B CN 109645990 B CN109645990 B CN 109645990B CN 201811569002 A CN201811569002 A CN 201811569002A CN 109645990 B CN109645990 B CN 109645990B
- Authority
- CN
- China
- Prior art keywords
- random forest
- parameters
- optimal
- model
- recognition model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
- A61B5/369—Electroencephalography [EEG]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/40—Detecting, measuring or recording for evaluating the nervous system
- A61B5/4076—Diagnosing or monitoring particular conditions of the nervous system
- A61B5/4094—Diagnosing or monitoring seizure diseases, e.g. epilepsy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
- A61B5/7267—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Surgery (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Heart & Thoracic Surgery (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Neurology (AREA)
- Animal Behavior & Ethology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Veterinary Medicine (AREA)
- Psychiatry (AREA)
- Neurosurgery (AREA)
- Physiology (AREA)
- Psychology (AREA)
- Evolutionary Computation (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
本发明公开了一种癫痫患者脑电信号的计算机模式识别方法,涉及脑科学、癫痫发作临床数据识别技术领域。所述方法首先构建随机森林识别模型,然后对随机森林识别模型进行训练,生成最优的随机森林识别模型;将优化后的随机森林模型在测试集上进行不同程度病况的癫痫患者脑电信号的模式识别测试。本发明实现了计算机自动识别癫痫患者脑电信号的功能,为医疗工作者耗时耗力的诊断提供技术支持。本发明引入网格搜索优化方法,以可变步长的形式重复过滤参数来加速搜索参数的最佳组合,加快随机森林模型的运行效率,使得训练出来的随机森林识别模型达到最优效果,对于与三种不同病况的癫痫病情的模式识别准确率能达到96%以上。
Description
技术领域
本发明涉及脑科学、癫痫发作临床数据识别技术领域,具体是一种癫痫患者脑电信号的计算机模式识别方法。
背景技术
癫痫病的发作是脑内神经元阵发性异常超同步化电活动的临床表现,具有反复性、突发性和暂时性等特点。脑电信号作为研究癫痫疾病的重要工具,它所实时反映的发作信息是其它生理学方法所不能提供的。目前,在癫痫患者的脑电信号的分析研究中,机器学习为癫痫脑电信号识别的强有力工具,但是多数机器学习方法识别脑电信号具有较复杂的计算过程,无法保证识别方法的准确性和实效性。基于计算机的模式识别方法有很多,例如K近邻方法、支持向量机方法、神经网络方法等。这些方法在不同脑疾病的数据集上识别的准确性不同,对于计算机的脑电模式识别方法本身仍然存在着不适用性。此外对于识别方法的参数选择依靠于具有丰富经验研究人员进行人工调参,不能完全保证生成的参数为识别方法的模型最优参数。
发明内容
本发明为了克服现有方法的不足,针对癫痫病患者的脑电信号识别问题,提出一种癫痫患者脑电信号的计算机模式识别方法。
本发明提供的一种癫痫患者脑电信号的计算机模式识别方法,包括如下几个步骤:
步骤一:采集癫痫患者的脑电信号,并对所述的脑电信号进行预处理及脑电特征提取。
步骤二、构建随机森林识别模型,利用步骤一提取出来的脑电特征对随机森林识别模型进行训练,生成最优的随机森林识别模型;
具体步骤如下:
步骤201、将提取的脑电特征进行归一化处理;
步骤202、将归一化处理后的脑电特征分成三部分,分别为训练集、测试集以及用于防止随机森林识别模型过拟合的验证集;
步骤203、对不同程度病况的癫痫脑电信号进行时间同步的分帧,得到多级导联的脑电信号;
步骤204、对癫痫患者的发作期、间歇期和健康期这三类脑电信号的进行打标签处理:发作期“0”、间歇期“1”、健康期“-1”;
步骤205、采用重采样方法,从训练集的数据中随机抽取bootstrap样本,一共选取k个样本数据,作为新的训练集数据。
步骤206、以上述205步骤中新的训练集数据为训练数据,建立k个决策树Tj(j=1,2,…,k),从决策树的每一个节点的特征集合中随机选择一个包含k个特征的子集。
步骤207、通过对决策树的每个终端节点递归地重复步骤206,将随机林树生长为增强绑定数据,直到这决策树能够准确地对训练数据集进行识别,同时达到最小节点大小。
步骤208、集合所有决策树,对于一个输入样本,k个决策树有k个识别结果,随机森林继承了所有的识别投票结果;
步骤209、在新的节点上进行预测,投票数目最多的识别作为输出;
步骤210、采用网格搜索的优化方法对随机森林方法进行优化;所述的网格搜索包括粗搜索和精确搜索两部分;
(A)粗搜索超参数;所述的超参数包括决策树数量k、分裂特征数m、叶子节点最少样本数以及惩罚参数;
所述的粗搜索超参数具体为:
首先,在较大范围内用大步长划分网格,设置搜索步长为10,进行粗搜索选择出最优参数;在一次最优参数附近利用小步长划分网格,使网格划分更加密集,再次进行搜索选择出二次最优参数;在二次最优参数附近再次进行网格划分和搜索,直至网格间距或目标函数变化量小于给定值。如果有多组参数使得随机森林的方法达到最优,则从这些组参数中选出使得惩罚函数最小的那组参数为最优参数;
(B)对随机森林方法得到的最优参数进行精确搜索,减小搜索范围,即减小网格搜索优化方法的搜索步长,此时步长一般设置为0.1,也可以根据随机森林模型的实际情况,调整步长大小,使得惩罚参数最小化是最佳参数组;将最佳参数组中的超参数作为最终的超参数。
步骤211、得出对随机森林进行网格搜索优化后的参数,采用10重交叉验证去识别该随机森林识别模型的准确性;
步骤212、改变节点数,再随机打乱数据,选择验证集进行模型识别;
步骤213、重复步骤212,直至交叉验证准确性最高;
步骤214、此时的节点数认为是最优节点数;训练出的最终的超参数为随机森林识别模型的最优超参数,优化后的随机森林识别模型确定;
步骤215、将优化后的随机森林模型在测试集上进行不同程度病况的癫痫患者脑电信号的模式识别测试;
根据多种测试指标来评估随机森林模型的泛化能力,包括:
对识别测试的实验结果采用准确性ACC曲线指标进行评估。
对识别测试的实验结果采用真阳性率和假阳性率指标进行评估,生成的受试者工作特征曲线ROC和AUC值等评价值指标,进行优化的随机森林模型的评估。
本发明的优点在于:
(1)本发明一种癫痫患者脑电信号的计算机模式识别方法,设计了一种ICU病房中不同程度病况的癫痫患者脑电信号识别方法。由于随机森林识别方法的高度并行化,提高了运行效率,实现了计算机自动识别癫痫患者脑电信号的功能,为医疗工作者耗时耗力的诊断提供技术支持。
(2)本发明一种癫痫患者脑电信号的计算机模式识别方法,随机森林识别方法在训练过程中会产生大量的超参数,仅依靠程序员长期调节参数的经验进行人工调试这些生成的参数是很难计算出识别模型的最佳参数的。本发明引入网格搜索优化方法可以通过所述计算机以可变步长的形式重复过滤参数来加速搜索参数的最佳组合。加快随机森林模型的运行效率,使得训练出来的随机森林识别模型达到最优效果。本发明提高了基于优化随机森林的计算机模式识别方法来处理ICU病房中癫痫患者脑电信号的准确率,对于与三种不同病况的癫痫病情的模式识别准确率能达到96%以上。
(3)本发明一种癫痫患者脑电信号的计算机模式识别方法,在使用网格搜索优化方法对随机森林进行优化的过程中,同时利用计算机对实验脑电信号数据进行10重交叉验证,避免了惩罚函数过高及过学习状态的发生,实现了网格搜索优化方法对随机森林识别模型优化的同时,提升了该模式识别方法的性能,为实现后续有新的脑电信号输入到该模型中也能精确的进行计算机识别,对医生在医疗诊断过程中进行辅助支持与决策。
附图说明
图1是本发明的癫痫患者脑电信号的计算机模式识别方法流程图;
图2是本发明基于优化随机森林模型的构建过程示意图;
图3是本发明基于改进的网格搜索方法的随机森林模型的超参数寻优流程图;
图4是本发明基于网格搜索优化方法的随机森林模型与原始随机森林算法的准确性指标对比曲线;
图5是本发明利用计算机进行模型训练过程中10重交叉验证产生的准确性结果;
图6是本发明基于改进的网格搜索优化方法的随机森林的ROC曲线和AUC值指标的评价结果。
具体实施方式
下面结合附图和实施例对本发明进行详细说明。
本发明提供一种癫痫患者脑电信号的计算机模式识别方法,所述方法首先通过对ICU病房中不同程度病况的癫痫病患者(癫痫发作期、癫痫间歇期、健康期)进行长时间段、多通道脑电信号的采集取样,并对不同程度病况癫痫患者的脑电信号进行标记(打标签);对脑电信号进行预处理操作和脑电特征提取等操作。构建基于机器学习技术的随机森林识别模型,通过网格搜索优化方法对随机森林识别模型生成的参数进行优化处理,同时,将预处理后的脑电信号导入到构建并优化好的随机森林识别模型中,进行识别处理。本发明提供的优化的随机森林识别模型基于机器学习技术,利用层层决策树相关运算得到脑电信号不同病况模式的深度抽象,实现对不同程度病况癫痫患者脑电信号的模式进行自动识别,为ICU病房中医生对脑电的后续诊断提供技术支持。
本发明提供一种癫痫患者脑电信号的计算机模式识别方法,该方法用于临床,通过识别癫痫患者发作期、间歇期和健康期的脑电信号,建立优化的随机森林识别模型,将所述的优化的随机森林识别模型应用于ICU病房中实时记录到的癫痫原始脑电信号中,将识别中生成的参数指标辅助及支持医生及其他医疗工作者对不同病况癫痫患者的识别工作,避免在ICU病房中医疗工作者的长时间留守病房的低效率工作。
本发明提供的一种癫痫患者脑电信号的计算机模式识别方法,如图1所示流程,具体包括如下步骤:
步骤一、采集癫痫患者的脑电信号,并对采集的脑电信号进行预处理及脑电特征提取。
对于ICU病房中采集的癫痫患者的脑电信号,通过计算机进行脑电信号的预处理,其中预处理是指对所采集的脑电信号进行滤波、剔除坏道、基线校正和重参考等操作;同时,对所述的脑电信号采用独立成分分析法去除多种类型的伪迹。
步骤二、构建随机森林识别模型,利用计算机对提取出来的脑电特征进行大量训练,生成最优的随机森林识别模型。
随机森林识别模型是由决策树组合的一种有效的集成机器学习方法,随机森林识别模型适用于高维数据并且运行速度快。但是运行过程中会产生大量的超参数,为了得到更高的识别癫痫脑电信号的精度,需要对随机森林识别模型的参数进行优化。目前,对随机森林识别模型中的参数进行优化选择的方法相对较少,通常是依靠经验进行人工参数选择。尤其是随机森林识别模型中决策树数量k对随机森林识别模型性能的影响比较大,并且对于不同的类别的数据而言,当随机森林识别模型的性能达到最优时的k值是不一样的。仅仅通过经验进行选定随机森林识别模型的参数,通常无法得到性能最优的随机森林识别模型。本发明利用改进的网格搜索方法,对随机森林识别模型中的决策树数量k、分裂特征数m、叶子节点最少样本数和惩罚参数进行参数优化,同时利用机器学习中10重交叉验证的方法更加有效地避免了训练出的随机森林识别模型的过拟合问题。通过ICU病房中的原始癫痫脑电信号的仿真结果表明,本发明利用网格搜索方法优化得到的参数能够使随机森林识别模型的识别效果得到很大程度的提高。
具体的,所述的最优的随机森林识别模型的生成步骤如下:
步骤201、对步骤一中提取的脑电特征进行归一化处理;
步骤202、将归一化后的脑电特征分成三组,分别为训练集、测试集以及用于防止随机森林识别模型过拟合的验证集;
步骤203、对不同程度病况的癫痫患者的脑电特征进行时间同步的分帧,得到多导联的脑电特征信号;
步骤204、对癫痫患者发作期、间歇期和健康期的脑电信号的进行标记:发作期“1”、间歇期“0”、健康期“-1”;
步骤205、如图2所示流程,从训练集的数据M中随机选取一个bootstrap训练样本Mi,并且是有放回地进行k次抽取,从而得到一个随机生成的训练集M*={M1,M2,…,Mk},i=1,2,…,k;
步骤206、以上述205步骤中随机生成的训练集M*为训练数据,建立k个决策树Tj,j=1,2,…,k,从决策树的每一个节点的特征集合中随机选择一个包含k个特征的子集,从所述子集中随机选取m个最优特征的分化作为识别特征,这里面的k控制了随机程度的大小;进入步骤207;
步骤207、通过对决策树的每个终端节点递归地重复步骤206上述步骤,将随机森林决策树生长为增强绑定数据,直到该决策树能够准确地对训练集M*进行识别,同时达到最小节点大小。
在模型训练的过程中,采用识别回归树CART方法分裂节点,基尼指数GINI值作为分裂节点的依据。训练集M*含有k个不同的特征,则此训练集M*的基尼指数为:
其中pi为第i个特征的出现概率。{M1,M2,…,Mk}对应的特征数分别为{n1,n2,…,nk},则分裂的基尼指数为:
其中,n表示n1+n2+…+nk,i=1,2,…,k。GINI(Mi)表示样本Mi的GINI指数。
步骤208、集合所有决策树,对于一个输入样本Mi,k个决策树有k个识别结果,随机森林继承了所有的识别投票结果;
步骤209、在新的节点上进行预测,投票数目最多的识别是输出,进入步骤210;
随机森林方法如下:
步骤210、采用网格搜索的优化方法对随机森林模型进行优化;
网格搜索优化方法是指将变量区域进行网格化,遍历所有的网格点,求解满足约束条件的目标函数值,选出最优数值。遍历网格上所有参数需要大量训练时间,为了提高训练速度,本发明提出了一种基于改进的网格搜索的随机森林参数优化方法。
步骤211、首先粗搜索超参数:决策树数量k、分裂特征数m、叶子节点最少样本数以及惩罚参数;进入步骤212;
首先,在较大范围内用大步长划分网格,设置搜索步长为10,进行粗搜索选择出一次最优参数。
步骤212、然后在一次最优参数附近利用小步长划分网格,使网格划分更加密集,再次进行搜索选择出二次最优参数;所述小步长(当次小步长指的是上一次步长的一半)是相对于大步长而言的相对量,略小即可,一般选取5~10范围的步长。
步骤213、重复步骤212,在二次最优参数附近利用小步长划分网格和搜索参数,直至网格间距或目标函数变化量小于给定值;
为了提高计算机程序的模式识别性能,需要同时考虑单个决策树的识别正确率和决策树的多样性,然而两者之间也存在着一定关系。本发明针对随机森林方法中决策树的个数k和候选分裂特征数m为离散值的特点,采用网格搜索方法进行参数优化。本发明提出的基于改进的网格搜索的随机森林参数优化的目标函数值选用未被抽中的训练数据即袋外数据估计的识别准确性。由于随机森林在构建过程中的随机性,识别准确性可能会在一定范围内波动,因此为减小不确定性对参数选择产生的影响,本发明在求识别准确性时选用多个随机森林模型识别准确性的平均值。
步骤214、如果有多组参数使得随机森林的方法达到最优,则从这些组参数中选出使得惩罚函数最小的那组参数为最优参数;
步骤215、对随机森林方法得到的参数进行精确搜索,减小搜索范围,即减小网格搜索优化方法的搜索步长,此时步长一般设置为0.1,也可以根据随机森林识别模型的实际情况,调整步长大小,使得惩罚参数最小化是最佳参数组;具体步骤如下:
确定决策树数量k和分裂特征数m的范围,设定步长,在决策树数量k和分裂特征数m坐标系上建立二维网格,网格节点就是相应的决策树数量k和分裂特征数m的参数对;
对网格节点上的每一组参数构建随机森林识别模型,并利用袋外数据评估识别的准确性;
选择识别准确性最高的参数k和m,若识别准确性或者步长满足要求,则输出最优参数和识别准确率;否则,缩小步长,继续精确搜索。上述基于改进的网格搜索方法的随机森林参数寻优流程图由图3所示。
步骤216、得出对随机森林进行网格搜索优化后的参数,同过计算机采用10重交叉验证去识别该随机森林识别模型的准确性;对于给定的训练集进行样本采样,产生出10个不同的子集,再从每个子集中训练出来一个属于该子集的随机森林识别子模型,这样通过不同子集训练出来的随机森林识别子模型具有比较大的差异,从而有效地避免随机森林模型的过拟合问题。同时为获得更优的随机森林识别模型,还希望每个随机森林识别子模型不能太差,如果分化出的子集过于多,只能通过小部分数据进行训练,这样的模型不足以成为好的随机森林识别子模型,为此本发明考虑使用以一种相互交叠的方式对训练集进行采样。
步骤217、改变节点数,再随机打乱数据,选择一个全新的验证集进行随机森林识别模型计算机识别;
步骤218、重复步骤217,直至交叉验证准确性最高;
步骤219、此时的节点数认为是最优节点数;训练出的参数为随机森林识别模型的最优参数,模型确定;
步骤220、将优化后的随机森林识别模型在测试集上进行不同程度病况的癫痫患者脑电信号的模式识别测试;
步骤三、根据多种测试指标来评判随机森林这个计算机自动识别方法的性能;评估随机森林模型的泛化能力。
首先,确定随机森林计算机模式识别算法的所有参数及取值;
然后,通过网格搜索优化算法对随机森林识别模型生成的所有参数进行粗搜索,限定参数的局部范围;在此局部范围的基础上进行小步长的二次寻优,得到随机森林模型的最优参数;
最后,将最优参数输入到随机森林计算机模式识别模型中,生成最优的识别模型,用于对癫痫患者的脑电信号进行计算机识别,从而为医生进行癫痫病况诊断提供技术支持和辅助。
实验结果
采用的脑电数据来源于德国波恩癫痫实验室。该数据分为O、Z、F、N、S共5组脑电信号,每组数据中包含100个样本,受试者均为5人,每个样本包含4097个采样点,信号记录采用标准10-20系统,采样频率为173.61Hz,采样时间为23.6s。5组脑电数据集的具体信息如下。
本发明分成O/Z、F/N、S这3组数据集对脑电信号进行识别。其中数据集O/Z为健康人处于清醒睁眼状态下头皮表面的脑电信号,数据集F/N为癫痫患者未发作处于间期致病灶内区域的颅内EEG信号,数据集S为癫痫患者处于发作期致病灶内区域的颅内脑电信号,分别记为健康期、发作间歇期和发作期脑电信号。
步骤301、对实验结果采用准确性ACC曲线指标进行评估。
步骤302、对实验结果采用真阳性率和假阳性率指标进行评估,生成的受试者工作特征曲线ROC和AUC值等评价值指标根据得到的识别结果优化的随机森林方法的评估。
本次实验一共采用四个评价指标,包括癫痫脑电信号模式识别方法的准确性、真阳性概率(True positive rate,TPR)和假阳性概率(False positive rate,FPR),假阳性概率为横轴,真阳性概率为纵轴所组成的坐标图,从而生成的受试者工作特征曲线ROC和ROC曲线下方的面积AUC值两个评估指标。
其中TP,FP,TN,FN分别表示真阳个数、假阳个数、真阴个数和假阴个数。
改进前后的随机森林识别方法的准确性结果如图4,通过网格搜索优化后的随机森林模型的准确率达到了96.7%,比单独使用随机森林方法准确率提升了近10个百分点。对训练集做10重交叉验证的模型精度变化如图5所示,应用改进的随机森林优化方法的另两个评价指标ROC和AUC的结果如图6所示,其中AUC取得了99%的高准确率。
本发明将改进的随机森林计算机识别方法应用于癫痫患者的脑电信号的自动识别过程中,实现不同程度病况癫痫患者脑电信号的识别,同时设计了网格搜索的优化方法对随机森林识别方法进行优化,实现了计算机运行计算结果准确率的提升和程序运行过程的加速,辅助广大的医疗工作者在为癫痫病患诊断的过程中提供技术支持和服务,对有潜在发病的癫痫患者消除和控制发病几率。
Claims (1)
1.一种癫痫患者脑电信号的识别模型的构建方法,包括如下步骤,
步骤一:采集癫痫患者的脑电信号,并对所述的脑电信号进行预处理及脑电特征提取;
对于ICU病房中采集的癫痫患者的脑电信号,通过计算机进行脑电信号的预处理,其中预处理是指对所采集的脑电信号进行滤波、剔除坏道、基线校正和重参考操作;同时,对所述的脑电信号采用独立成分分析法去除多种类型的伪迹;
步骤二、构建随机森林识别模型,利用步骤一提取出来的脑电特征对随机森林识别模型进行训练,生成最优的随机森林识别模型;
步骤三、根据多种测试指标来评判随机森林这个计算机自动识别方法的性能;评估随机森林识别模型的泛化能力;
首先,确定随机森林识别模型的所有参数及取值;
然后,通过网格搜索优化算法对随机森林识别模型生成的所有参数进行粗搜索,限定参数的局部范围;在此局部范围的基础上进行小步长的二次寻优,得到随机森林识别模型的最优参数;
最后,将最优参数输入到随机森林识别模型中,生成最优的识别模型,用于对癫痫患者的脑电信号进行计算机识别,从而为医生进行癫痫病况诊断提供技术支持和辅助;
其特征在于:对于步骤二的生成最优的随机森林识别模型的具体步骤如下:
步骤201、对步骤一中提取的脑电特征进行归一化处理;
步骤202、将归一化处理后的脑电特征分成三部分,分别为训练集、测试集以及用于防止随机森林识别模型过拟合的验证集;
步骤203、对不同程度病况的癫痫脑电信号进行时间同步的分帧,得到多级导联的脑电信号;
步骤204、对癫痫患者的发作期、间歇期和健康期这三类脑电信号的进行打标签处理:发作期“1”、间歇期“0”、健康期“-1”;
步骤205、采用重采样方法,从训练集的数据M中随机抽取bootstrap训练样本Mi,并且是有放回地进行k次抽取,从而得到一个随机生成的训练集M*={M1,M2,…,Mk},i=1,2,…,k;一共选取k个样本数据,作为新的训练集数据;
步骤206、以上述步骤205中随机生成的训练集M*为训练数据,建立k个决策树Tj,j=1,2,…,k,从决策树的每一个节点的特征集合中随机选择一个包含k个特征的子集;从所述子集中随机选取m个最优特征的分化作为识别特征,这里面的k控制了随机程度的大小;进入步骤207;
步骤207、通过对决策树的每个终端节点递归地重复执行步骤206,将随机森林决策树生长为增强绑定数据,直到这决策树能够准确地对训练集M*进行识别,同时达到最小节点大小;
在模型训练的过程中,采用识别回归树CART方法分裂节点,基尼指数GINI值作为分裂节点的依据;训练集M*含有k个不同的特征,则此训练集M*的基尼指数为:
其中pi为第i个特征的出现概率;{M1,M2,…,Mk}对应的特征数分别为{n1,n2,…,nk},则分裂的基尼指数为:
其中,n表示n1+n2+…+nk,i=1,2,…,k;GINI(Mi)表示样本Mi的GINI指数;
步骤208、集合所有决策树,对于一个输入样本Mi,k个决策树有k个识别结果,随机森林继承了所有的识别投票结果;
步骤209、在新的节点上进行预测,投票数目最多的识别是输出;进入步骤210的随机森林方法处理;
步骤210、采用网格搜索的优化方法对随机森林识别模型进行优化;
网格搜索优化方法是指将变量区域进行网格化,遍历所有的网格点,求解满足约束条件的目标函数值,选出最优数值;遍历网格上所有参数需要大量训练时间,为了提高训练速度,使用改进的网格搜索的随机森林参数优化方法;
步骤211、首先粗搜索超参数:决策树数量k、分裂特征数m、叶子节点最少样本数以及惩罚参数;进入步骤212;
用大步长划分网格,设置搜索步长为10,进行粗搜索选择出一次最优参数;
步骤212、然后在一次最优参数附近利用小步长划分网格,使网格划分更加密集,再次进行搜索选择出二次最优参数;所述小步长是相对于大步长而言的相对量,选取步长为5;改变节点数,再随机打乱数据,选择验证集进行模型识别;
步骤213、重复步骤212,在二次最优参数附近利用小步长划分网格和搜索参数,直至网格间距或目标函数变化量小于给定值;
步骤214、如果有多组参数使得随机森林的方法达到最优,则从这些组参数中选出使得惩罚函数最小的那组参数为最优参数;
步骤215、对随机森林方法得到的参数进行精确搜索,减小搜索范围,即减小网格搜索优化方法的搜索步长,此时步长设置为0.1;
根据随机森林识别模型的实际情况,调整步长大小,使得惩罚参数最小化是最佳参数组;具体步骤如下:
确定决策树数量k和分裂特征数m的范围,设定步长,在决策树数量k和分裂特征数m坐标系上建立二维网格,网格节点就是相应的决策树数量k和分裂特征数m的参数对;
对网格节点上的每一组参数构建随机森林识别模型,并利用袋外数据评估识别的准确性;
选择识别准确性最高的参数k和m,若识别准确性或者步长满足要求,则输出最优参数和识别准确率;否则,缩小步长,继续精确搜索;
步骤216、得出对随机森林进行网格搜索优化后的参数,同时计算机采用10重交叉验证去识别该随机森林识别模型的准确性;对于给定的训练集进行样本采样,产生出10个不同的子集,再从每个子集中训练出来一个属于该子集的随机森林识别子模型,这样通过不同子集训练出来的随机森林识别子模型具有比较大的差异,从而有效地避免随机森林识别模型的过拟合问题;同时为获得更优的随机森林识别模型,还希望每个随机森林识别子模型不能太差,如果分化出的子集过于多,只能通过小部分数据进行训练,这样的模型不足以成为好的随机森林识别子模型,为此使用以一种相互交叠的方式对训练集进行采样;
步骤217、改变节点数,再随机打乱数据,选择一个全新的验证集进行随机森林识别模型计算机识别;
步骤218、重复步骤217,直至交叉验证准确性最高;
步骤219、此时的节点数认为是最优节点数;训练出的参数为随机森林识别模型的最优参数,模型确定;
步骤220、将优化后的随机森林识别模型在测试集上进行不同程度病况的癫痫患者脑电信号的模式识别测试。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811001968 | 2018-08-30 | ||
CN2018110019680 | 2018-08-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109645990A CN109645990A (zh) | 2019-04-19 |
CN109645990B true CN109645990B (zh) | 2020-11-27 |
Family
ID=66115374
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811569002.7A Active CN109645990B (zh) | 2018-08-30 | 2018-12-21 | 一种癫痫患者脑电信号的计算机模式识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109645990B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111134664B (zh) * | 2019-12-18 | 2022-11-01 | 武汉工程大学 | 一种基于胶囊网络的癫痫放电识别方法、系统和存储介质 |
CN113554048B (zh) * | 2020-04-26 | 2024-02-02 | 中移(成都)信息通信科技有限公司 | 数据识别方法、装置、设备及存储介质 |
CN113709747B (zh) * | 2020-05-09 | 2023-10-13 | 中国移动通信集团有限公司 | 一种骚扰号码识别方法、装置、计算机设备和存储介质 |
CN112336310B (zh) * | 2020-11-04 | 2024-03-08 | 吾征智能技术(北京)有限公司 | 一种基于fcbf和svm融合的心脏疾病诊断系统 |
CN113662560B (zh) * | 2020-12-22 | 2022-05-24 | 北京航空航天大学 | 发作间期痫样放电的检测方法、存储介质和设备 |
CN112741638B (zh) * | 2021-01-05 | 2022-04-08 | 北京航空航天大学 | 一种基于eeg信号的医疗诊断辅助系统 |
CN113397567B (zh) * | 2021-05-19 | 2023-03-21 | 中国航天科工集团第二研究院 | 一种人类行为脑电信号分类方法及系统 |
CN113397482B (zh) * | 2021-05-19 | 2023-01-06 | 中国航天科工集团第二研究院 | 一种人类行为分析方法及系统 |
CN113729709B (zh) * | 2021-09-23 | 2023-08-11 | 中科效隆(深圳)科技有限公司 | 神经反馈设备、神经反馈方法及计算机可读存储介质 |
CN113729710A (zh) * | 2021-09-26 | 2021-12-03 | 华南师范大学 | 一种融合多生理模态的实时注意力评估方法及系统 |
CN114098764B (zh) * | 2021-11-05 | 2024-02-20 | 北京大学 | 数据处理方法、装置、电子设备和存储介质 |
CN117909886B (zh) * | 2024-03-18 | 2024-05-24 | 南京海关工业产品检测中心 | 一种基于优化随机森林模型的锯齿棉品级分类方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140243613A1 (en) * | 2010-10-01 | 2014-08-28 | Flint Hills Scientific, L.L.C. | Detecting, assessing and managing epilepsy using a multi-variate, metric-based classification analysis |
CN105956623A (zh) * | 2016-05-04 | 2016-09-21 | 太原理工大学 | 一种基于模糊熵的癫痫脑电信号分类方法 |
-
2018
- 2018-12-21 CN CN201811569002.7A patent/CN109645990B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140243613A1 (en) * | 2010-10-01 | 2014-08-28 | Flint Hills Scientific, L.L.C. | Detecting, assessing and managing epilepsy using a multi-variate, metric-based classification analysis |
CN105956623A (zh) * | 2016-05-04 | 2016-09-21 | 太原理工大学 | 一种基于模糊熵的癫痫脑电信号分类方法 |
Non-Patent Citations (6)
Title |
---|
EEG signal analysis for Seizure detection using Discrete Wavelet Transform and Random Forest;Suvadeep Bose et al.;《2017 International Conference on Computer and Applications (ICCA)》;20171023;全文 * |
基于改进网格搜索算法的随机森林参数优化;温博文 等;《计算机工程与应用》;20180620;第154-157页 * |
基于非线性动力学特征指标的癫痫脑电信号分类、定位与预测方法研究;李冬梅;《中国优秀硕士学位论文全文数据库 医药卫生科技辑》;20170915(第9期);第8-36页 * |
改进网格搜索的支持向量机参数优化研究及应用;顾凯成;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170115(第1期);第16-48页 * |
癫痫发作脑电信号的相位幅度调制研究;曹春雨 等;《中国生物医学工程学报》;20180228;第37卷(第1期);全文 * |
随机森林算法优化研究;曹正风;《中国博士学位论文全文数据库 社会科学II辑》;20140815(第8期);第18-35页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109645990A (zh) | 2019-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109645990B (zh) | 一种癫痫患者脑电信号的计算机模式识别方法 | |
Aslan et al. | Automatic Detection of Schizophrenia by Applying Deep Learning over Spectrogram Images of EEG Signals. | |
Rubin et al. | Recognizing abnormal heart sounds using deep learning | |
CN109389059B (zh) | 一种基于cnn-lstm网络的p300检测方法 | |
US20200337580A1 (en) | Time series data learning and analysis method using artificial intelligence | |
CN109480833A (zh) | 基于人工智能的癫痫患者脑电信号的预处理和识别方法 | |
Townsend et al. | A comparison of common spatial patterns with complex band power features in a four-class BCI experiment | |
CN103034837B (zh) | 特征参数与脉象要素的关联 | |
CN111134664B (zh) | 一种基于胶囊网络的癫痫放电识别方法、系统和存储介质 | |
CN110321783A (zh) | 一种基于1d卷积神经网络的meg棘波检测方法及系统 | |
CN112450947B (zh) | 一种针对情绪唤醒度的动态脑网络分析方法 | |
CN110598676A (zh) | 基于置信度得分模型的深度学习手势肌电信号识别方法 | |
CN113128585B (zh) | 一种基于多尺寸卷积核的深度神经网络实现心电异常检测分类方法 | |
CN110575141A (zh) | 一种基于生成对抗网络的癫痫检测方法 | |
CN113208593A (zh) | 基于相关性动态融合的多模态生理信号情绪分类方法 | |
CN116898455B (zh) | 一种基于深度学习模型的睡眠脑电信号检测方法及系统 | |
KR102691350B1 (ko) | 단일 뇌전도 기반 수면단계 분류방법 및 수면단계 분류장치 | |
CN113288157A (zh) | 基于深度可分离卷积和改进损失函数的心律失常分类方法 | |
CN117064389A (zh) | 基于XGBoost算法的EEG信号抑郁症识别系统及方法 | |
Motin et al. | Detecting Parkinson’s disease from electroencephalogram signals: an explainable machine learning approach | |
CN110991428A (zh) | 基于多尺度熵的呼吸信号情绪识别方法及系统 | |
CN113974627A (zh) | 一种基于脑机生成对抗的情绪识别方法 | |
Wulsin et al. | Parsing epileptic events using a Markov switching process model for correlated time series | |
CN112869743A (zh) | 一种考虑认知分心的运动起始意图神经解析方法 | |
Qiu et al. | A Novel EEG-based Parkinson’s Disease Detection Model using Multiscale Convolutional Prototype Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |