CN117898682A - 基于胃肠电信号的癫痫预测系统及构建方法 - Google Patents

基于胃肠电信号的癫痫预测系统及构建方法 Download PDF

Info

Publication number
CN117898682A
CN117898682A CN202410309483.7A CN202410309483A CN117898682A CN 117898682 A CN117898682 A CN 117898682A CN 202410309483 A CN202410309483 A CN 202410309483A CN 117898682 A CN117898682 A CN 117898682A
Authority
CN
China
Prior art keywords
data
meal
stomach
intestine
epileptic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410309483.7A
Other languages
English (en)
Other versions
CN117898682B (zh
Inventor
陈蕾
季舒铭
刘著
黄子介
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
West China Hospital of Sichuan University
Original Assignee
West China Hospital of Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by West China Hospital of Sichuan University filed Critical West China Hospital of Sichuan University
Priority to CN202410309483.7A priority Critical patent/CN117898682B/zh
Publication of CN117898682A publication Critical patent/CN117898682A/zh
Application granted granted Critical
Publication of CN117898682B publication Critical patent/CN117898682B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/389Electromyography [EMG]
    • A61B5/392Detecting gastrointestinal contractions
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/389Electromyography [EMG]
    • A61B5/397Analysis of electromyograms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4076Diagnosing or monitoring particular conditions of the nervous system
    • A61B5/4094Diagnosing or monitoring seizure diseases, e.g. epilepsy

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Neurology (AREA)
  • Neurosurgery (AREA)
  • Physiology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明涉及疾病预测领域,具体涉及一种基于胃肠电信号的癫痫预测系统及构建方法。本发明提供了一种癫痫预测系统,包括:数据库,用于存储数据,所述数据的类型包括胃肠电信号数据;所述胃肠电信号数据包括餐前胃部的导联时间差、餐前肠部的导联时间差、餐前肠部的主功率比、餐前肠部的正常慢波百分比、餐后胃部的波形平均频率、餐后肠部的导联时间差和餐前餐后胃部的主功率比差值;预测模块,用以预测所述受试者发生癫痫的概率。本发明还提供了上述癫痫预测系统的构建方法。本发明提供的癫痫预测系统,只需要受试者的上述胃肠电信号数据,无创、程序简单、价格低廉,有利于癫痫的大规模筛查的推广,并为癫痫的诊断提供辅助性诊断依据。

Description

基于胃肠电信号的癫痫预测系统及构建方法
技术领域
本发明涉及疾病预测领域,具体涉及一种基于胃肠电信号的癫痫预测系统及构建方法。
背景技术
癫痫是中枢神经系统疾病中最常见的发作性疾病之一,发病率高,全球患者超过7000万。
正确的诊断是有效治疗的前提,目前,癫痫的诊断主要依赖患者的病史资料(例如,在临床问诊过程中需要详细地了解患者的既往诊治病史,特别是发作史)以及脑电图(EGG)、磁共振图像(MRI)等检查。然而,上述癫痫的标准的诊断方式却难以在癫痫的大规模筛查(例如社区初筛)中广泛应用。一方面,在大规模筛查中,即使是经验丰富的临床医生,仅靠受试者对“癫痫”发作症状的口头描述,也难以在时间紧张又缺乏诊断依据的情况下,判断该受试者是否为癫痫患者。另一方面,脑电图(EGG)、磁共振图像(MRI)等检查需要特定的仪器,因此难以在大规模筛查中使用。倘若直接让受试者前往医院去接受脑电图、磁共振图像等检查,其费用高昂,增加受试者经济和心理负担的同时,受试者还可能出现不愿前往医院的抵触心理。出于以上种种原因,癫痫的大规模筛查难以普及。
发明内容
第一方面,本发明提供了一种基于胃肠电信号的癫痫预测系统,其特征在于,包括:
数据库,用于存储数据,所述数据的类型为胃肠电信号数据,所述胃肠电信号数据包括餐前胃部的导联时间差、餐前肠部的导联时间差、餐前肠部的主功率比、餐前肠部的正常慢波百分比、餐后胃部的波形平均频率、餐后肠部的导联时间差和餐前餐后胃部的主功率比差值;所述数据包括来自样本人群的样本数据和来自受试者的受试者数据;
数据获取模块,用于获取所述数据,并将所述数据存储于所述数据库;
模型训练模块,所述模型训练模块利用机器学习算法对所述样本数据进行训练学习,从而确定癫痫发生风险预测模型;
预测模块,所述预测模块通过所述数据获取模块获取所述受试者数据,并调用所述癫痫发生风险预测模型对所述受试者数据进行分析,用以预测所述受试者发生癫痫的概率。
在一些实施例中,所述样本数据以7:3的比例被分为训练集和验证集。
在一些实施例中,所述胃肠电信号数据通过分别位于胃体、胃窦、小弯、大弯、升结肠、横结肠、降结肠和直肠的导联同时采集并取平均值得到。
在一些实施例中,所述系统进一步包括验证模块,所述验证模块用于利用所述验证集来评价所述癫痫发生风险预测模型的准确性,所述评价的评价指标包括区分度和/或临床实用性。
在一些实施例中,所述受试者为小于50岁的成年人。
第二方面,本发明提供了一种基于胃肠电信号的癫痫预测系统的构建方法,其特征在于,所述基于胃肠电信号的癫痫预测系统包括癫痫发生风险预测模型,所述方法包括以下步骤:
S1 获取来自样本人群的样本数据,所述样本数据的类型为胃肠电信号数据;
S2 对所述样本数据进行预训练以筛选出预测变量,所述筛选出的预测变量包括餐前胃部的导联时间差、餐前肠部的导联时间差、餐前肠部的主功率比、餐前肠部的正常慢波百分比、餐后胃部的波形平均频率、餐后肠部的导联时间差和餐前餐后胃部的主功率比差值;
S3 基于所述筛选出的预测变量,利用机器学习算法对所述样本数据进行训练学习,以建立所述癫痫发生风险预测模型,进而构建所述基于胃肠电信号的癫痫预测系统。
在一些实施例中,所述样本数据以7:3的比例被分为训练集和验证集。
在一些实施例中,所述预训练包括第一轮变量筛选和第二轮变量筛选;所述第一轮变量筛选包括LASSO回归分析,所述第二轮变量筛选包括逻辑回归分析和逐步回归分析。
在一些实施例中,所述方法进一步包括S4利用所述验证集来评价所述癫痫发生风险预测模型的准确性,所述评价的评价指标包括区分度和/或临床实用性。
在一些实施例中,所述预训练包括岭回归或随机森林模型。
与现有技术相比,本发明的有益效果至少包括以下方面:
本发明提供了一种基于胃肠电信号的癫痫预测系统及构建方法。本发明在采集并计算餐前(或餐后)胃部(或肠部)的波形平均幅值、波形平均频率、电节律紊乱百分比、波形反应面积、导联时间差、主频率、主功率比、正常慢波百分比、偶联百分比的36个指标基础之上,创造性地设计并引入了餐前餐后胃部(或肠部)的波形平均幅值、波形平均频率、胃(肠)电节律紊乱百分比、波形反应面积、导联时间差、主频率、主功率比、正常慢波百分比或偶联百分比的差值作为胃肠电信号的新指标(共计18个,简称为差值指标)。基于此,本发明通过LASSO回归分析、逻辑回归分析和逐步回归分析对样本数据中这54个特征变量进行预训练(特征筛选),最终保留了“餐前胃部的导联时间差、餐前肠部的导联时间差、餐前肠部的主功率比、餐前肠部的正常慢波百分比、餐后胃部的波形平均频率、餐后肠部的导联时间差和餐前餐后胃部的主功率比差值”这7个预测变量,并基于上述7个预测变量构建了癫痫发生风险预测模型。结果显示,本发明的餐前餐后胃部(或肠部)的差值指标的引入,能够一定程度上反映癫痫患者与健康人群的差异,进而有助于提升癫痫发生风险预测模型的准确性和通用性。
癫痫的大规模筛查至关重要。部分癫痫患者的癫痫发作频率不高(例如一年发作几次)又症状轻微,因此很容易忽略自己的癫痫发作症状。而另一部分患者,其可能患有非癫痫的发作性疾病(例如神经症性发作、短暂性脑缺血发作),却时常担心自己患有癫痫,因此通常具有较高的心理负担。现有的癫痫的诊断主要依赖患者的病史资料以及脑电图、磁共振图像等检查。然而,出于时间、人力资源、经费有限等原因,这种标准的癫痫诊断方式无法应用至癫痫的大规模筛查。本发明提供的癫痫预测系统和方法所基于的癫痫发生风险预测模型,只需要受试者的上述胃肠电指标数据,无创、程序简单、价格低廉,且无需额外的检查,即可对受试者的癫痫发生风险进行预测,因此受试者接受度和配合度高,有利于癫痫的大规模筛查的推广,并为癫痫的诊断提供辅助性诊断依据。
此外,本发明提供的癫痫预测系统不受受试者年龄、文化程度的限制,也不受就诊过程中沟通和理解上的障碍、医生个人经验的影响,在无需采集详细的病史资料的情况下,能够相对客观和无创地对受试者数据进行分析和预测,尤其适用于对较大人群(例如社区、体检中心)进行癫痫的初步、大规模筛查。
综上所述,本发明提供的癫痫预测系统和方法,不仅有助于辅助临床评价,而且有助于个体化预测,适用于多种应用场景(例如,基层医疗机构、家庭、医院、体检中心)和人群。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中导联的放置部位的示意图;
图2为本发明实施例一的受试者基线信息和胃肠电指标的总结图;
图3为本发明实施例一的第二轮变量筛选的结果图;
图4为本发明实施例一的最优逻辑回归模型的列线图的示意图;
图5为本发明实施例一的测试集的预测模型ROC曲线的示意图;
图6为本发明实施例一的验证集的预测模型ROC曲线的示意图;
图7为本发明实施例一的测试集的决策曲线的示意图;
图8为本发明实施例一的验证集的决策曲线的示意图;
图9为本发明实施例提供的预测系统的架构示意图;
图10为本发明实施例提供的预测系统的模块示意图。
100为预测系统,102为数据获取模块,104为模型构建模块,106为数据库,108为模型训练模块,110为验证模块,112为预测模块,202为第一终端,204为第二终端,206为网络,601为胃体,602为小弯,603为大弯,604为胃窦,605为升结肠,606为横结肠,607为降结肠,608为直肠。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本文中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
本文中,术语“上”、“下”、“内”、“外”、“前”、“后”、“一端”、“另一端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本文中“和/或”包括任何和所有一个或多个列出的相关项的组合。
本文中“多个”意指两个或两个以上,即其包含两个、三个、四个、五个等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
如在本说明书中使用的,术语“大约”,典型地表示为所述值的+/-5%,更典型的是所述值的+/-4%,更典型的是所述值的+/-3%,更典型的是所述值的+/-2%,甚至更典型的是所述值的+/-1%,甚至更典型的是所述值的+/-0.5%。
在本说明书中,某些实施方式可能以一种处于某个范围的格式公开。应该理解,这种“处于某个范围”的描述仅仅是为了方便和简洁,且不应该被解释为对所公开范围的僵化限制。因此,范围的描述应该被认为是已经具体地公开了所有可能的子范围以及在此范围内的独立数字值。例如,范围1〜6的描述应该被看作已经具体地公开了子范围如从1到3,从1到4,从1到5,从2到4,从2到6,从3到6等,以及此范围内的单独数字,例如1,2,3,4,5和6。无论该范围的广度如何,均适用以上规则。
实施例一:胃肠电信号与癫痫发生风险预测模型
1.1 方法
受试者:在四川大学华西医院神经内科招募癫痫患者与健康受试者,对其开展简易智力状态检查量表(MMSE)评测和胃肠电图检查。
所有受试者均自愿参与研究并签署知情同意书。所有受试者均要求为年龄小于50岁的成年人,并接受规范的癫痫诊断,诊断标准参考(国际抗癫痫联盟(ILAE)的癫痫诊断标准(2014版),并自愿接受一次完整的餐前餐后胃肠电图(EGEG)检查,所有受试者被告知戒酒并遵循清淡饮食3天,以完成准确的EGEG测试。
排除标准包括:1)半年内被诊断为胃炎、炎症性肠病、肠易激综合征等胃肠道疾病或伴慢性腹泻、便秘等胃肠不适者;2)伴有严重的心、肝、肾等重大器官功能不全或合并糖尿病、甲状腺功能亢进等代谢性疾病者;3)简易认知功能评估量表(MMSE)小于24分或无法有效配合完成量表采集及胃肠电图检测者;4)排除在检查前1周内服用过任何药物的受试者。
本实施例采集了所有受试者包括年龄、性别、BMI在内的基本信息、癫痫诊断结果和详细的EGEG检查结果。
EGEG检查:用8通道胃肠电图仪测量并采集胃肠道肌电活动信号(XDJ-S8, HefeiKaili Co., Hefei, China)。所有受试者均被告知在3天内避免饮酒和辛辣或刺激性食物,并在检查前禁食至少6小时。测量时取仰卧位。在腹部皮肤上放置4个胃电极(导联分别放置在胃体601、小弯602、大弯603、胃窦604处)和4个肠电极(导联分别放置在升结肠605、横结肠606、降结肠607、直肠608处)(Hanjie Co. Ltd., Shanghai, China)(图1)。参比电极位于右手手腕内侧,接地电极位于右腿内踝。检查过程中,嘱咐受试者避免任何动作和说话。在6分钟的餐前EGEG记录后,进行进餐功能负荷实验。摄入约200 kcal的标准食物后,再记录6分钟的餐后胃肠电信号。导联的放置部位如图1所示:胃体601:剑突与脐连线中点向左旁开三至五厘米,往上一厘米;胃窦604:剑突与脐连线中点向右旁开二至四厘米;小弯602:剑突与脐连线中点向上1/2处;大弯603:剑突与脐连线中点向下1/2处。升结肠605:与脐持平向右旁开二至四厘米;横结肠606:脐下一厘米;降结肠607:与脐持平向左旁开二至四厘米;直肠608:背部尾骨部下。
EGEG数据处理:EGEG采样频率为1 Hz、滤波频率为0.008 Hz-0.1 Hz,以滤除包括心跳在内的背景噪声。在检测伪影后,由检查仪配套软件计算出原始的EGEG电位数据,并通过软件进行频谱分析,分别导出上述8个导联的如下参数:(1)波形平均幅值(AA);(2)波形平均频率(AF);(3)胃(肠)电节律紊乱百分比(RD);(4)波形反应面积(RA);(5)导联时间差(TD);(6)主频率(MF);(7)主功率比(MPR);(8)正常慢波百分比(PNSW);(9)偶联百分比(CP)。
基于上述的胃肠道电生理信号,根据电极安放位置和采集时间(餐前或餐后),对上述8个导联的餐前或餐后的参数指标数据取平均值,分别代表胃部餐前的导联信号指标、胃部餐后的导联信号指标、肠部餐前的导联信号指标和肠部餐后的导联信号指标。采用将多个导联放置在多个位置同时进行信号采集,然后再取平均值的做法可以更好地捕捉胃部和肠部的整体运动规律,以便更有效地获取能够反映胃部和肠部整体真实状态的信号。除此之外,本发明创造性地设计并引入了餐前餐后差值指标,即通过将上述8个导联的餐后的参数指标数据减去相应的导联的餐前的参数指标数据,再取平均值,分别代表胃部餐前餐后差值的导联信号指标和肠部餐前餐后差值的导联信号指标。也就是说,在本发明中,胃部或肠部的电生理信号由餐前、餐后、以及餐前餐后的差值三个部分组成,共计54个指标。
预测模型的构建:考虑到胃肠道电生理信号的指标复杂性,本发明采用基于LASSO的变量筛选过程与逐步最优逻辑回归相结合的两阶段分析策略来实现风险预测模型的构建。首先,为了获得预测因子子集,使用正则化算法之一的LASSO回归分析来进行第一轮变量筛选。此外,LASSO回归分析运行10倍交叉验证,对所包含的变量进行集中化和规范化处理,并选择"lambda.min"作为最佳性能。按照7:3的随机比例,将受试者随机分为训练集和验证集。此外,为了均衡受试者的基本特征对癫痫发生风险的潜在影响,将受试者的年龄、性别、BMI三项特征以逆概率加权的方式纳入后续的所有分析过程。然后,采用逐步多变量逻辑回归分析对LASSO回归模型中筛选出的预测因子,进行第二轮变量筛选,并利用保留的具有统计学意义的预测因子(本发明中,“预测因子”与“预测变量”表示相同含义)来建立预测模型。逐步逻辑回归过程使用AIC(赤池信息量准则)最小化原则进行模型优化,最终建立的模型使用比值比(OR)和95%置信区间(CI)来定义预测因子的贡献并生成癫痫发生风险的列线图预测模型。应当理解,还可以使用本领域已知的其他适宜算法,例如随机森林方法、其他正则化方法(例如岭回归)、神经网络等。
此外,通过使用训练集和验证集的数据,分别采用了几种验证方法来评估癫痫发生风险预测模型的准确性,包括:ROC曲线,ROC曲线下的面积用于辨别癫痫发生风险列线图的质量,以区分真阳性和假阳性(即区分度);决策曲线,决策曲线分析用于确定癫痫发生风险列线图的临床实用性,其依据是自然人群队列中不同阈值概率下的净收益。所有的分析都使用R 4.1.3版本的软件包glmnet和rms,显著性水平被设定为双尾α<0.1。
1.2 结果
受试者数据信息:
共计283例受试者完成了全部的相关检查,包括男性101例和女性182例,其中诊断为癫痫的受试者的人数为112人(男性52例,女性60例)。
如图2所示,本发明比较了整体数据、健康人群(非癫痫受试者)和癫痫受试者三组间的每个变量。本发明发现,在癫痫受试者与非癫痫受试者之间年龄和性别存在统计学非常显著的差异(P<0.01)。对此,采用逆概率加权(IPTW)的方式纳入年龄、性别和BMI三项基本特征指标。对比各组的各项胃肠电指标,本发明发现,在0.1的水平上,餐前胃部、餐前肠部、餐后肠部的导联时间差和主功率比均存在组间差异。相较于健康人群,癫痫受试者在餐前胃部、餐前肠部、餐后肠部的导联时间差均出现不同程度的下降。另外,餐前肠部和餐后肠部的主功率比均表现为癫痫受试者小于健康人群,然而,在餐前胃部和餐后胃部的主功率中,癫痫受试者却大于健康人群。
独立风险因素的筛选:
采用基于LASSO回归的非零系数特征变量筛选方法,54个相关的特征变量(在本发明中也可以被称为自变量(Independent Variable, IV))中,本发明的技术方案最终选择保留了25个特征变量作为癫痫发生风险模型的潜在的预测变量对响应变量(在本发明中也可以被称为结局变量(Dependent Variable, DV))(即癫痫发生风险)进行预测。
LASSO(Least Absolute Shrinkage and Selection Operator,最小绝对收缩和选择算子)回归分析是一种线性回归模型的收缩和特征变量选择方法。为了获得预测因子子集,LASSO回归分析通过对模型参数施加约束,使一些特征变量的回归系数向零缩减,从而使响应变量的预测误差最小化。在收缩过程后,回归系数等于零的特征变量被排除在模型之外,而回归系数为非零的特征变量则与响应变量有最强的关联。换句话说,第一轮特征变量筛选主要排除了54个相关的特征变量中回归系数容易缩减至零的特征变量,保留了25个特征变量作为预测模型的预测变量。
进一步地,为了对基于25个预测变量的预测模型的性能有更准确的评估,基于对数似然函数(-2log-likelihood)和二元因变量(可以理解为变量是“是/否”)的类型参量(即交叉验证选取模型时希望最小化的目标参量),本发明的技术方案采用LASSO回归分析运行10倍交叉验证(cross validation),对所包含的54个特征变量进行集中化和规范化处理。本发明的技术方案通过使用“Lambda.min”,以构建具有性能最佳、准确率最高的预测模型。
预测模型的开发:
本发明的技术方案通过引入LASSO回归模型中选择的特征变量,使用逐步多变量逻辑回归分析来建立预测模型。然后,引入所选择的特征变量并分析特征变量的统计学显著性水平,将具有统计学意义的部分特征变量作为预测变量/预测因子,用于建立癫痫发生风险的预测模型。
接下来,本发明采用逻辑回归模型对第一轮变量筛选出的25个预测变量进行分析,并进行逐步法选择最优预测变量,最终保留7个预测变量(每个预测变量均在0.05检验水平上有统计学显著性)。这7个预测变量分别是餐前胃部的导联时间差、餐前肠部的导联时间差、餐前肠部的主功率比、餐前肠部的正常慢波百分比、餐后胃部的波形平均频率、餐后肠部的导联时间差和餐前餐后胃部的主功率比差值(图3)。
本发明的技术方案使用多种统计学手段检验了上述7个特征变量,其中着重分析了这些特征变量的比值比(odds ratio(OR),又称优势比)。OR值是量化两个事件之间关联强度的统计量,表示暴露(在本发明中即所检验的特征变量,下同)后发生的结果与不存在相同暴露时发生结果的几率的比率。OR值在本发明中具体可以理解为:癫痫(即响应变量)与暴露之间的关联强度,表示暴露者的癫痫发生风险(也可以理解为疾病危险度)为非暴露者的倍数。如果所检验的特征变量的OR值>1,则说明癫痫发生风险因暴露而增加,该特征变量与癫痫之间为“正”关联;如果所检验的特征变量的OR值<1,则说明癫痫发生风险因暴露而减少,该特征变量与癫痫之间为“负”关联;如果所检验的特征变量的OR值=1,则说明癫痫与该特征变量无关联。95%置信区间(95% Confidence Interval(CI))提供了对通过检验得到的OR值的准确性的估计(estimate),其描述了总体真实值可能在通过检验得到的OR值的95%置信区间内波动,且置信区间越小,通过检验得到的OR值越准确、稳健。图3显示了保留的7个预测变量的比值比(OR)及其95%置信区间,表明这些预测变量都与癫痫存在一定的关联,因此被应用至本发明的癫痫发生风险预测模型。这7个预测变量均与癫痫的风险增高相关联,且呈负关联。
另外,在图3中,回归系数β:经逻辑回归模型分析获得的预测变量与响应变量相关的偏回归系数,表示每单位量的上升给响应变量带来的影响大小及方向(偏回归系数经标准化后可以比较,所检验的预测变量的回归系数β是一种估计值)。标准误:即所检验的预测变量的回归系数β的标准误,表示回归系数的准确性(标准误越大,所检验的预测变量的准确性越低)。Z值:z统计量,即所检验的预测变量的回归系数β除以其对应的标准误,主要用于判断所检验的预测变量的P值。P值:对应于所检验的预测变量的z统计量的P值(P值越小,所检验的预测变量对响应变量来说越重要)。
基于上述7个预测变量,本实施例构建了癫痫发生风险预测模型,并通过绘制相应的列线图(nomogram)以将构建的癫痫发生风险预测模型更好地可视化,参见图4。
图4中,每个变量(例如,“餐前胃部的导联时间差”、“餐前肠部的导联时间差”等)对应的线段上都标注了刻度,其代表该变量的取值范围;而线段的长度反映该变量对结局事件(即癫痫发生)的贡献大小。在不同取值下,每个变量可以在图4最上方的“分数”处得到相应的单项分数。取值后,将所有变量对应的单项分数相加,可以得到“总分”。根据总分,可以在图4最下方的“癫痫的预测概率”处获得癫痫的发生概率。作为示例,在图4中,如果某个受试者的总分为350,则其发生癫痫的风险为大约0.4(40%)。
预测模型的验证:
本发明使用训练集和验证集的数据,绘制了相应的受试者工作特征(ROC)曲线来评价构建的预测模型的灵敏度(也可以理解为真阳性率)和特异性(也可以理解为真阴性率)。在图5和图6中,x轴表示“假阳性率”,即“1-特异性”;y轴表示“真阳性率”,即“灵敏度”;ROC曲线(即图5和图6中的实线)下的面积(AUC,即ROC曲线下与坐标轴围成的面积)分析用于辨别风险列线图的质量,以将真阳性从假阳性中区分出。
对于建立的癫痫发生风险预测模型,列线图ROC曲线下的面积(AUC)均在0.65以上(即大于虚线下的面积):在训练集中为0.718(95%CI(置信区间):0.646-0.791)(图5),在验证集中为0.651(95%CI:0.530-0.774)(图6),说明本发明构建的模型表现出良好的稳健性和识别癫痫患者的能力。此外,在训练集中,建立的癫痫发生风险预测模型的准确率为0.693(95%CI:0.691-0.696),敏感性为0.671(95%CI:0.567-0.775),特异性为0.708(95%CI:0.672-0.790)。在验证集中,建立的癫痫发生风险预测模型的准确率为0.667(95%CI:0.661-0.672),敏感性为0.667(95%CI:0.506-0.828),特异性为0.667(95%CI:0.537-0.790)。
更进一步的,决策曲线分析(DCA)表明,在训练集中,本实施例的列线图能够准确地预测癫痫发生风险的阈值范围为在0.40和0.67之间(图7);在验证集中,阈值范围为在0.39和0.61之间(图8)。由此可见,上述两个数据集的阈值概率在0.39和0.61之间重叠。训练集和验证集在DCA曲线的阈值概率范围的重叠部分可以理解为,训练集和验证集在此重叠范围内均能够表现出有效的净获益,即将风险概率超过阈值概率的患者判定为真阳性患者并施加干预时,在训练集和验证集中均能够取得为正的净获益。换句话说,预测概率高于0.61(61%)的患者被认为有更大的癫痫发生风险,这是一个具有净效益的临床参考阈值。这也说明,将风险概率阈值取在此重叠范围时具有更高的实际应用价值,其获益大小可以通过获益率进行比较。
实施例二:使用上述癫痫发生风险预测模型,预测受试者发生癫痫风险的概率
参见图9,图9是本发明实施例提供的预测系统的一个可选的架构示意图。为实现支撑一个示例性应用,终端(示例性示出了第一终端202和第二终端204)通过网络连接预测系统。本发明涉及的网络可以是广域网或者局域网,或者是二者的组合,使用无线链路实现数据传输。本发明涉及的终端可以为智能手机、平板电脑、笔记本电脑等各种类型的用户终端。终端可以用于显示输入受试者数据和/或样本数据的界面,以及显示预测系统的预测结果的界面。
下面说明预测系统的示例性结构,在一些实施例中,如图10所示,预测系统100可以包括:
数据库106,用于存储数据,所述数据的类型为胃肠电信号数据,所述数据包括来自样本人群的样本数据和来自受试者的受试者数据;
数据获取模块102,用于获取所述数据,并将所述数据存储于所述数据库106;
模型训练模块108,所述模型训练模块108利用机器学习算法对所述样本数据进行训练学习,从而确定癫痫发生风险预测模型;
预测模块112,所述预测模块112通过所述数据获取模块102获取所述受试者数据,并调用所确定的癫痫发生风险预测模型对所述受试者数据进行分析,用以预测所述受试者发生癫痫的概率。
预测系统100还可以包括验证模块110,所述验证模块110用于评价所确定的癫痫发生风险预测模型的准确性,所述评价的评价指标包括区分度和/或临床实用性。
其中,所述数据库106、所述模型训练模块108和所述验证模块110可以整合为模型构建模块104。
作为示例,在癫痫预测系统中,所述胃肠电信号数据具体包括餐前胃部的导联时间差、餐前肠部的导联时间差、餐前肠部的主功率比、餐前肠部的正常慢波百分比、餐后胃部的波形平均频率、餐后肠部的导联时间差和餐前餐后胃部的主功率比差值。
下面给出本发明的一个具体应用场景。
A社区正在开展社区体检活动,采集社区内目标人群(例如,A社区的全体居民)的胃肠电信号数据,并通过第一终端202将受试者数据输入。A社区的B患者曾经出现过几次类似癫痫发作的症状,时常担心自己是潜在的癫痫患者。在社区体检活动中,A社区将受试者数据经网络206传输至预测系统100的数据获取模块102。数据获取模块102获取来自受试者的受试者数据并将其存储在数据库106中。
预测模块112获取所述受试者数据并调用已建立的癫痫发生风险预测模型,以对所述受试者数据进行分析,并预测所述受试者发生癫痫的概率。
作为输出,预测模块112可生成提示所述受试者发生癫痫的风险的报告,并将预测结果通过网络206传输至第一终端202。A社区可以提前设置癫痫发生风险阈值(例如,癫痫发生概率为40%)。当B患者被预测的癫痫的发生风险超过设置的风险阈值时(例如,发生概率为50%),A社区应当对B患者或其家属发出提醒并建议前往推荐或合作的医院就诊,并进行详尽的检查,以确定B患者是否为癫痫患者。B患者前往医院就诊时,医院会对B患者进行进一步的问诊和检查,以判断该患者是否患有被提示的癫痫。医生可以将B患者的诊断结果,通过第二终端204传输至预测系统100。B患者的数据(受试者数据+诊断结果)可以作为新的样本数据,用于进一步训练癫痫发生风险预测模型。当然,B患者的诊断结果也可以通过第一终端202传输至预测系统100,换句话说,传输B患者的诊断结果的终端可以是相同或不同的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台计算机终端(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (10)

1.一种基于胃肠电信号的癫痫预测系统,其特征在于,包括:
数据库,用于存储数据,所述数据的类型为胃肠电信号数据,所述胃肠电信号数据包括餐前胃部的导联时间差、餐前肠部的导联时间差、餐前肠部的主功率比、餐前肠部的正常慢波百分比、餐后胃部的波形平均频率、餐后肠部的导联时间差和餐前餐后胃部的主功率比差值;所述数据包括来自样本人群的样本数据和来自受试者的受试者数据;
数据获取模块,用于获取所述数据,并将所述数据存储于所述数据库;
模型训练模块,所述模型训练模块利用机器学习算法对所述样本数据进行训练学习,从而确定癫痫发生风险预测模型;
预测模块,所述预测模块通过所述数据获取模块获取所述受试者数据,并调用所述癫痫发生风险预测模型对所述受试者数据进行分析,用以预测所述受试者发生癫痫的概率。
2.如权利要求1所述的系统,其特征在于,所述样本数据以7:3的比例被分为训练集和验证集。
3.如权利要求1所述的系统,其特征在于,所述胃肠电信号数据通过分别位于胃体、胃窦、小弯、大弯、升结肠、横结肠、降结肠和直肠的导联同时采集并取平均值得到。
4.如权利要求2所述的系统,其特征在于,所述系统进一步包括验证模块,所述验证模块用于利用所述验证集来评价所述癫痫发生风险预测模型的准确性,所述评价的评价指标包括区分度和/或临床实用性。
5.如权利要求1所述的系统,其特征在于,所述受试者为小于50岁的成年人。
6.一种基于胃肠电信号的癫痫预测系统的构建方法,其特征在于,所述基于胃肠电信号的癫痫预测系统包括癫痫发生风险预测模型,所述方法包括以下步骤:
S1 获取来自样本人群的样本数据,所述样本数据的类型为胃肠电信号数据;
S2 对所述样本数据进行预训练以筛选出预测变量,所述筛选出的预测变量包括餐前胃部的导联时间差、餐前肠部的导联时间差、餐前肠部的主功率比、餐前肠部的正常慢波百分比、餐后胃部的波形平均频率、餐后肠部的导联时间差和餐前餐后胃部的主功率比差值;
S3 基于所述筛选出的预测变量,利用机器学习算法对所述样本数据进行训练学习,以建立所述癫痫发生风险预测模型,进而构建所述基于胃肠电信号的癫痫预测系统。
7.如权利要求6所述的方法,其特征在于,所述样本数据以7:3的比例被分为训练集和验证集。
8.如权利要求6所述的方法,其特征在于,所述预训练包括第一轮变量筛选和第二轮变量筛选;所述第一轮变量筛选包括LASSO回归分析,所述第二轮变量筛选包括逻辑回归分析和逐步回归分析。
9.如权利要求7所述的方法,其特征在于,所述方法进一步包括S4利用所述验证集来评价所述癫痫发生风险预测模型的准确性,所述评价的评价指标包括区分度和/或临床实用性。
10.如权利要求6所述的方法,其特征在于,所述预训练包括岭回归或随机森林模型。
CN202410309483.7A 2024-03-19 2024-03-19 基于胃肠电信号的癫痫预测系统及构建方法 Active CN117898682B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410309483.7A CN117898682B (zh) 2024-03-19 2024-03-19 基于胃肠电信号的癫痫预测系统及构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410309483.7A CN117898682B (zh) 2024-03-19 2024-03-19 基于胃肠电信号的癫痫预测系统及构建方法

Publications (2)

Publication Number Publication Date
CN117898682A true CN117898682A (zh) 2024-04-19
CN117898682B CN117898682B (zh) 2024-05-17

Family

ID=90684192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410309483.7A Active CN117898682B (zh) 2024-03-19 2024-03-19 基于胃肠电信号的癫痫预测系统及构建方法

Country Status (1)

Country Link
CN (1) CN117898682B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110306846A1 (en) * 2010-06-15 2011-12-15 Ivan Osorio Systems approach to disease state and health assessment
US20190246990A1 (en) * 2017-07-25 2019-08-15 Seer Medical Pty Ltd Methods and systems for forecasting seizures
US20190336758A1 (en) * 2018-05-04 2019-11-07 Purdue Research Foundation Prevention of reflux induced laryngospasm
CN112842358A (zh) * 2019-11-26 2021-05-28 阿里健康信息技术有限公司 脑部生理数据的处理系统、方法、设备及存储介质
CN113539472A (zh) * 2021-04-01 2021-10-22 西湖大学 生物信号处理器
WO2021246923A1 (ru) * 2020-06-05 2021-12-09 ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "СберМедИИ" Способ детектирования фокальных эпилептиформных разрядов в длительной записи ээг
CN114431829A (zh) * 2020-11-05 2022-05-06 四川大学华西医院 一种癫痫发作判断模型的建模方法、癫痫监控方法及装置
DE202022103434U1 (de) * 2022-06-20 2022-06-24 Khyati Chopra Ein auf einem Enzephalogramm (EEG) basierendes Gerät zur Erkennung von epileptischen Anfällen
US11564591B1 (en) * 2021-11-29 2023-01-31 Physcade, Inc. System and method for diagnosing and treating biological rhythm disorders

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110306846A1 (en) * 2010-06-15 2011-12-15 Ivan Osorio Systems approach to disease state and health assessment
US20190246990A1 (en) * 2017-07-25 2019-08-15 Seer Medical Pty Ltd Methods and systems for forecasting seizures
US20190336758A1 (en) * 2018-05-04 2019-11-07 Purdue Research Foundation Prevention of reflux induced laryngospasm
CN112842358A (zh) * 2019-11-26 2021-05-28 阿里健康信息技术有限公司 脑部生理数据的处理系统、方法、设备及存储介质
WO2021246923A1 (ru) * 2020-06-05 2021-12-09 ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "СберМедИИ" Способ детектирования фокальных эпилептиформных разрядов в длительной записи ээг
CN114431829A (zh) * 2020-11-05 2022-05-06 四川大学华西医院 一种癫痫发作判断模型的建模方法、癫痫监控方法及装置
CN113539472A (zh) * 2021-04-01 2021-10-22 西湖大学 生物信号处理器
US11564591B1 (en) * 2021-11-29 2023-01-31 Physcade, Inc. System and method for diagnosing and treating biological rhythm disorders
DE202022103434U1 (de) * 2022-06-20 2022-06-24 Khyati Chopra Ein auf einem Enzephalogramm (EEG) basierendes Gerät zur Erkennung von epileptischen Anfällen

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZINKIN N T, 等: "Peppercorn M A. Abdominal epilepsy", BEST PRACTICE & RESEARCH CLINICAL GASTROENTEROLOGY, 14 April 2005 (2005-04-14) *
周伟,等: "生物医用电极制造技术及应用研究进展", 《科学通报》, 30 May 2015 (2015-05-30) *

Also Published As

Publication number Publication date
CN117898682B (zh) 2024-05-17

Similar Documents

Publication Publication Date Title
CN111133526B (zh) 发掘可用于机器学习技术中的新颖特征,例如用于诊断医疗状况的机器学习技术
RU2768581C2 (ru) Устройства, системы и способы для прогнозирования, скрининга и контроля энцефалопатии/делирия
CN115517682B (zh) 基于胃肠电信号的认知功能障碍预测系统及构建方法
KR20090024808A (ko) 치매 및 치매성 장애의 평가
Gutiérrez-Tobal et al. Ensemble-learning regression to estimate sleep apnea severity using at-home oximetry in adults
Jouk et al. A reduced scoring system for the Clock Drawing Test using a population-based sample
Ariani et al. Quantitative CT indexes are significantly associated with exercise oxygen desaturation in interstitial lung disease related to systemic sclerosis
Kumar et al. An investigation of the contextual distribution of false positives in a deep learning-based atrial fibrillation detection algorithm
CN116584962B (zh) 一种基于胃肠电信号的睡眠障碍预测系统及其构建方法
CN115886818B (zh) 一种基于胃肠电信号的抑郁焦虑障碍预测系统及其构建方法
Reljin et al. Machine learning model based on transthoracic bioimpedance and heart rate variability for lung fluid accumulation detection: prospective clinical study
CN103093112B (zh) 预警装置
Raghunath et al. Artificial intelligence–enabled mobile electrocardiograms for event prediction in paroxysmal atrial fibrillation
CN117898682B (zh) 基于胃肠电信号的癫痫预测系统及构建方法
Lucena et al. The Performance of Short‐Term Heart Rate Variability in the Detection of Congestive Heart Failure
KR20210085750A (ko) 딥러닝 기반의 심리생리검사 시스템 및 방법
Deepa et al. Experimental evaluation of artificial intelligence assisted heart disease prediction using deep learning principle
CN118448058B (zh) 基于胃肠电信号的糖尿病和高血压的预测系统及构建方法
Naseri et al. Data-efficient machine learning methods in the ME-TIME study: Rationale and design of a longitudinal study to detect atrial fibrillation and heart failure from wearables
Huang et al. Application of heart rate variability during blood pressure measurement in patients with somatic symptom disorder
CN113066547B (zh) 一种基于常规无创参数的ards早期动态预警方法与系统
Mazloom A new approach for digestive disease diagnosis: Dynamics of gastrointestinal electrical activity
Azimi et al. Identifying sleep biomarkers to evaluate cognition in HIV
De et al. Alz-sense: A novel non-invasive pre-clinical testing to differentiate dementia from mci
Batool et al. Intelligent framework for diagnosis of frozen shoulder using cross sectional survey and case studies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant