CN116584962A - 一种基于胃肠电信号的睡眠障碍预测系统及其构建方法 - Google Patents

一种基于胃肠电信号的睡眠障碍预测系统及其构建方法 Download PDF

Info

Publication number
CN116584962A
CN116584962A CN202310089412.6A CN202310089412A CN116584962A CN 116584962 A CN116584962 A CN 116584962A CN 202310089412 A CN202310089412 A CN 202310089412A CN 116584962 A CN116584962 A CN 116584962A
Authority
CN
China
Prior art keywords
data
meal
sleep disorder
stomach
gastrointestinal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310089412.6A
Other languages
English (en)
Other versions
CN116584962B (zh
Inventor
陈蕾
季舒铭
李百川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
West China Hospital of Sichuan University
Original Assignee
West China Hospital of Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by West China Hospital of Sichuan University filed Critical West China Hospital of Sichuan University
Publication of CN116584962A publication Critical patent/CN116584962A/zh
Application granted granted Critical
Publication of CN116584962B publication Critical patent/CN116584962B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/389Electromyography [EMG]
    • A61B5/392Detecting gastrointestinal contractions
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4806Sleep evaluation
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本发明涉及疾病预测领域,具体涉及一种基于胃肠电信号的睡眠障碍预测系统及其构建方法。本发明提供了一种睡眠障碍预测系统,包括:数据库,用于存储数据,所述数据的类型包括胃肠电信号数据和临床数据,所述胃肠电信号数据包括餐前胃肠电信号数据和餐后胃肠电信号数据;所述餐前胃肠电信号数据包括餐前胃部的正常慢波百分比和餐前胃部的导联时间差,所述餐后胃肠电信号数据包括餐后胃部的主功率比、餐后肠部的主频率和餐后肠部的偶联百分比,所述临床数据包括年龄和性别;数据获取模块;模型训练模块;预测模块,用以预测所述受试者发生睡眠障碍的概率。另一方面,本发明还提供了上述系统所基于的睡眠障碍预测模型的构建方法。

Description

一种基于胃肠电信号的睡眠障碍预测系统及其构建方法
优先权申请
本申请要求2022年11月25日提交的中国发明专利申请【CN2022115031721】、名称为“一种基于胃肠电信号的睡眠障碍预测系统及其构建方法”的优先权,该优先权发明专利申请以引用方式全文并入。
技术领域
本发明涉及疾病预测领域,具体涉及一种基于胃肠电信号的睡眠障碍预测系统及其构建方法。
背景技术
疾病的早期检测至关重要。据认为,疾病被诊断出的时间越早,疾病被治愈(或成功控制)以及患者获得较好的预后的可能性就越大。如果可以对疾病进行早期筛查和治疗,那么疾病的进一步恶化可以被预防或延缓,治疗效果可以被提高(例如延长患者生命、提高患者的生活质量)等。
近年来,我国慢性神经系统疾病患者数量持续上升。然而,由于早期症状不明显、患者自身的认识程度不高、检查流程繁琐及费用高等原因,某些慢性神经系统疾病(例如认知功能障碍、睡眠障碍、焦虑或抑郁)往往发展到较为难以干预和治疗的阶段时才被诊断出。因此,需要对目标人群(例如中老年人)进行大规模筛查,以实现疾病的早期检测。然而,大规模筛查需要处理的数据量大且通常依赖人工分析,整个过程费时费力、成本高昂,且数据分析的结果主观性强、复杂且难以量化。因此,很多疾病的大规模筛查难以普及,特别体现在睡眠障碍的早期检测中。
睡眠是补充白天活动消耗的能量、恢复因身体活动而积累的疲劳、分泌人类生长必不可少的生长激素的重要过程,也是大脑的休息时间。但是,随着经济社会的发展和生活节奏的加快,人们的生活压力越来越大,患有睡眠障碍的人群也逐年增加。睡眠障碍主要表现为失眠、嗜睡症、对睡眠质量的不满和阻塞性睡眠呼吸暂停(OSA)综合征。据统计,近四分之一的成年人自述存在失眠,而老年人的情况更为严重,相关流行病学调查认为老年人睡眠障碍的患病率可能接近50%。睡眠障碍严重影响身体健康,例如高血压、心脏病、糖尿病、中风、肥胖和降低的免疫力。此外,睡眠障碍还可能影响精神健康,例如抑郁症和焦虑症。有证据表明,睡眠障碍还是帕金森病、阿尔茨海默病等疾病的独立危险因素。
现有技术中,睡眠障碍的诊断方式包括基本临床症状评估、睡眠评估量表评估、睡眠监测等。具体地,患者通常表现出深受睡眠障碍困扰时,自己或其家属才会前往医院就诊。问诊时,医生通常会给予患者纸质量表(组合)并根据患者的测试结果进行初步评估,进而筛选出疑似睡眠障碍的患者。由此可见,整个过程复杂繁琐,耗时久、工作量大、效率低以及受医生个人经验的影响。此外,患者还可能出现对睡眠障碍认识程度和诊断配合度较低,由于听力、视力、理解能力衰退、文化程度较低等原因,无法独立与医生交流及完成量表而依赖家属转达等情况,这使得睡眠障碍的早期检测(特别是在基层、较广人群中大规模筛查)和及时的针对性治疗与预防的难度较大。
现有技术存在依赖智能监控设备对用户进行长期监控的睡眠障碍预测系统,但是其不仅没有解决程序复杂、耗时、成本高等问题,而且尤其不适合文化程度较低、理解能力较差、不会使用电子设备的人群使用,应用范围仍然受限。
发明内容
第一方面,本发明提供了一种睡眠障碍预测系统,其特征在于,包括:
数据库,用于存储数据,所述数据的类型包括胃肠电信号数据和临床数据,所述胃肠电信号数据包括餐前胃肠电信号数据和餐后胃肠电信号数据;所述餐前胃肠电信号数据包括餐前胃部的正常慢波百分比和餐前胃部的导联时间差,所述餐后胃肠电信号数据包括餐后胃部的主功率比、餐后肠部的主频率和餐后肠部的偶联百分比,所述临床数据包括年龄和性别;所述数据包括来自样本人群的样本数据和来自受试者的受试者数据;
数据获取模块,用于获取所述数据,并将所述数据存储于所述数据库;
模型训练模块,所述模型训练模块利用机器学习算法对所述样本数据进行训练学习,从而确定睡眠障碍预测模型;
预测模块,所述预测模块通过所述数据获取模块获取所述受试者数据,并调用所述睡眠障碍预测模型对所述受试者数据进行分析,用以预测所述受试者发生睡眠障碍的概率。
在一些实施例中,所述样本数据以7:3的比例被分为训练集和验证集。
在一些实施例中,所述胃肠电信号数据通过分别位于胃体、胃窦、小弯、大弯、升结肠、横结肠、降结肠和直肠的导联同时采集得到。
在一些实施例中,所述系统进一步包括验证模块,所述验证模块用于利用所述验证集来评价所述睡眠障碍预测模型的准确性。
在一些实施例中,所述评价的评价指标包括校准度、区分度和临床实用性中的一种或多种。
在一些实施例中,所述餐后胃肠电信号数据还包括餐后胃部的主频率和/或餐后胃部的电节律紊乱百分比。
第二方面,本发明提供了一种睡眠障碍预测模型的构建方法,其特征在于,包括以下步骤:
S1获取来自样本人群的样本数据,所述样本数据的类型包括胃肠电信号数据和临床数据;S2对所述样本数据进行预训练以筛选出预测变量,所述筛选出的预测变量包括餐前胃部的正常慢波百分比、餐前胃部的导联时间差、餐后胃部的主功率比、餐后肠部的主频率和餐后肠部的偶联百分比、年龄和性别;
S3基于所述筛选出的预测变量,利用机器学习算法对所述样本数据进行训练学习,以建立所述睡眠障碍预测模型。
在一些实施例中,所述样本数据以7:3的比例被分为训练集和验证集。
在一些实施例中,所述预训练包括第一轮变量筛选和第二轮变量筛选;所述第一轮变量筛选包括LASSO回归分析,所述第二轮变量筛选包括逻辑回归分析和逐步回归分析。
在一些实施例中,所述方法进一步包括S4利用所述验证集来评价所述睡眠障碍预测模型的准确性,所述评价的评价指标包括校准度、区分度和临床实用性中的一种或多种。
在一些实施例中,所述预训练包括岭回归或随机森林模型。
在一些实施例中,所述筛选出的预测变量还包括餐后胃部的主频率和/或餐后胃部的电节律紊乱百分比。
与现有技术相比,本发明的有益技术效果:
本发明提供了一种基于胃肠电信号的睡眠障碍预测系统及构建方法。本发明通过LASSO回归分析、逻辑回归分析和逐步回归对样本数据中46个特征变量进行预训练(特征筛选),最终保留“餐前胃部的正常慢波百分比、餐前胃部的导联时间差、餐后胃部的主功率比、餐后肠部的主频率和餐后肠部的偶联百分比、年龄和性别”这7个预测变量,并基于上述7个预测变量构建了睡眠障碍预测模型。
现有技术目前主要依赖睡眠量表来评估患者的行为,进而实现睡眠障碍的诊断。当患者或者其周围人士意识到患者本人可能患有睡眠障碍时,该患者可能发展到较为难以干预和治疗的阶段(例如,已经发展成严重睡眠障碍,或发展成睡眠障碍与其他精神疾病并发)。患者在早期阶段表现出的症状往往难以察觉,因此可能错过介入治疗的较优时期(据认为,睡眠障碍从发病到介入治疗,这中间经历的时间越短,患者康复的几率可能越大)。另一方面,有些患者即使察觉到某些症状,也不会将其归因于或承认自己为睡眠障碍患者,而是选择忽视或前往内科(例如神经内科)寻求医疗帮助。基于此,本发明提供的睡眠障碍预测系统和方法所基于的睡眠障碍预测模型,只需要受试者的胃肠电部分指标和基础临床信息(例如年龄、性别),无需多种检查和量表,即可对受试者的睡眠障碍发生风险进行预测,有利于睡眠障碍的早期筛查,也为睡眠障碍的介入治疗提供了时间。
由于本发明提供的睡眠障碍预测系统和方法不涉及体液检查、影像学检查等费用较高(甚至可能是侵入性的)检查,也无需受试者填写量表,程序简单、价格低廉,因此受试者接受度和配合度高。本发明提供的睡眠障碍预测系统和方法,不受年龄、文化程度的限制,也不受就诊过程中沟通和理解上的障碍、医生个人经验的影响,能够相对客观和无创地对受试者数据进行分析和预测,尤其适用于对较大人群(例如社区、体检中心)进行睡眠障碍的初步筛查和早期检测。综上所述,本发明提供的睡眠障碍预测系统和方法,不仅有助于辅助临床评价,而且有助于个体化预测,适用于多种应用场景(例如,基层医疗机构、家庭、医院、体检中心)和人群。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1A示出了本发明实施例一的LASSO回归模型;
图1B示出了本发明实施例一的十折交叉验证结果;
图2A示出了本发明实施例一的最优逻辑回归模型的列线图;
图2B示出了本发明实施例一的最优逻辑回归模型的动态列线图;
图3A示出了本发明实施例一的测试集的预测模型ROC曲线;
图3B示出了本发明实施例一的验证集的预测模型ROC曲线;
图4A示出了本发明实施例一的测试集的校正曲线;
图4B示出了本发明实施例一的验证集的校正曲线;
图5A示出了本发明实施例一的测试集的决策曲线;
图5B示出了本发明实施例一的验证集的决策曲线;
图6示出了本发明实施例中导联的放置部位;
图7示出了本发明实施例提供的预测系统的架构示意图;
图8示出了本发明实施例提供的预测系统的模块示意图;
图9A示出了本发明实施例二的LASSO回归模型;
图9B示出了本发明实施例二的十折交叉验证结果;
图10A示出了本发明实施例二的最优逻辑回归模型的列线图;
图10B示出了本发明实施例二的最优逻辑回归模型的动态列线图;
图11A示出了本发明实施例二的测试集的预测模型ROC曲线;
图11B示出了本发明实施例二的验证集的预测模型ROC曲线;
图12A示出了本发明实施例二的测试集的校正曲线;
图12B示出了本发明实施例二的验证集的校正曲线;
图13A示出了本发明实施例二的测试集的决策曲线;
图13B示出了本发明实施例二的验证集的决策曲线。
100为预测系统,102为数据获取模块,104为模型构建模块,106为数据库,108为模型训练模块,110为验证模块,112为预测模块,202为第一终端,204为第二终端,206为网络,601为胃体,602为小弯,603为大弯,604为胃窦,605为升结肠,606为横结肠,607为降结肠,608为直肠。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本文中“和/或”包括任何和所有一个或多个列出的相关项的组合。
本文中“多个”意指两个或两个以上,即其包含两个、三个、四个、五个等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
如在本说明书中使用的,术语“大约”,典型地表示为所述值的+/-5%,更典型的是所述值的+/-4%,更典型的是所述值的+/-3%,更典型的是所述值的+/-2%,甚至更典型的是所述值的+/-1%,甚至更典型的是所述值的+/-0.5%。
在本说明书中,某些实施方式可能以一种处于某个范围的格式公开。应该理解,这种“处于某个范围”的描述仅仅是为了方便和简洁,且不应该被解释为对所公开范围的僵化限制。因此,范围的描述应该被认为是已经具体地公开了所有可能的子范围以及在此范围内的独立数字值。例如,范围1~6的描述应该被看作已经具体地公开了子范围如从1到3,从1到4,从1到5,从2到4,从2到6,从3到6等,以及此范围内的单独数字,例如1,2,3,4,5和6。无论该范围的广度如何,均适用以上规则。
实施例一:胃肠电信号与睡眠障碍预测模型
1.1方法
受试者:在中国西部地区的60个社区,招募40岁以上自愿参与研究并签署知情同意书的社区人群,并采集受试者的年龄、性别、婚姻状况、文化水平、生活方式、饮食习惯等一般资料,以及开展血常规、匹兹堡睡眠量表(PSQI)评测和胃肠电图检测。排除标准为:排除耳聋眼盲者、半年内被诊断为胃炎、胃溃疡等胃肠道疾病或有腹泻、便秘等胃肠不适者;排除有严重的心肝肾等重大器官功能不全或有糖尿病等代谢性疾病者,以及重大精神疾病的患者;为降低药物对胃肠电图检测影响,排除在检查前1周服用过任何药物者;有既往吸毒史者。
睡眠状态评估:采取匹兹堡睡眠量表(PSQI)来评估患者的睡眠状况。该量表在评价睡眠质量方面具有较好的信度和效度。该量表是受试者在两名专业人员安静的缓解下,采用统一的术语指导填写。采用PSQI评估一个月内的睡眠质量和睡眠障碍。该量表包括19个与自我相关的问题和5个应该由室友回答的问题。最后5个问题仅用于临床信息,不在评分中列出。19个与自我相关问题分为7个组成部分,评分范围为从0到3。组成部分如下:1.主观睡眠质量;2.睡眠潜伏期;3.睡眠持续时间;4.习惯性睡眠效率;5.睡眠障碍;6.安眠药的使用;7.日间功能障碍。这些组成部分的总和产生一个总体得分,范围为从0到21,其中分数越高,表示睡眠质量越差。总体得分超过8分表示睡眠质量差。
EGEG记录:用8通道胃肠电图仪测量并采集胃肠道肌电活动信号(XDJ-S8,HefeiKaili Co.,Hefei,China)。所有受试者均被告知在3天内避免饮酒和辛辣或刺激性食物,并在检查前禁食至少6小时。测量时取仰卧位。在腹部皮肤上放置4个胃电极(导联分别放置在胃体601、小弯602、大弯603、胃窦604处)和4个肠电极(导联分别放置在升结肠605、横结肠606、降结肠607、直肠608处)(Hanjie Co.Ltd.,Shanghai,China)(图6)。检查过程中,嘱咐受试者避免任何动作和说话。在6分钟的餐前EGEG记录后,进行进餐功能负荷实验。摄入约200kcal的标准食物后,再记录6分钟的餐后胃肠电信号。导联的放置部位如图6所示:胃体601:剑突与脐连线中点向左旁开三至五厘米,往上一厘米;胃窦604:剑突与脐连线中点向右旁开二至四厘米;小弯602:剑突与脐连线中点向上1/2处;大弯603:剑突与脐连线中点向下1/2处。升结肠605:与脐持平向右旁开二至四厘米;横结肠606:脐下一厘米;降结肠607:与脐持平向左旁开二至四厘米;直肠608:背部尾骨部下。
胃肠电指标:EGEG采样频率为1Hz、滤波频率为0.008Hz-0.1Hz,以滤除包括心跳在内的背景噪声。在检测伪影后,由检查仪配套软件计算出原始的EGEG电位数据,并通过软件进行频谱分析,分别导出上述8个导联的如下参数:(1)波形平均幅值;(2)波形平均频率;(3)胃(肠)电节律紊乱百分比;(4)波形反应面积;(5)导联时间差;(6)主频率;(7)主功率比;(8)正常慢波百分比;(9)偶联百分比。
其他指标:每位受试者均接受了血糖血脂指标(也可以理解为“血液学参数”)的测定,包括葡萄糖、甘油三酯、胆固醇、高密度脂蛋白、低密度脂蛋白。还向每位受试者收集了基本的个人特征指标,包括性别、年龄、吸烟史、饮酒史、BMI。
预测模型的构建:首先,为了获得预测因子子集,使用正则化算法之一的LASSO回归分析来进行第一轮变量筛选。此外,LASSO回归分析运行10倍交叉验证,对所包含的变量进行集中化和规范化处理,并选择“lambda.min”作为最佳性能。按照7:3的随机比例,将受试者随机分为训练集和验证集。然后,采用逐步多变量逻辑回归分析对LASSO回归模型中筛选出的预测因子,进行第二轮变量筛选,并利用保留的具有统计学意义的预测因子(本发明中,“预测因子”与“预测变量”表示相同含义)来建立预测模型。最后,将建立的预测模型应用于睡眠障碍风险的预测和建立列线图预测模型。应当理解,还可以使用本领域已知的其他适宜算法,例如随机森林方法、其他正则化方法(例如岭回归)、神经网络等。
此外,通过使用训练集和验证集的数据,分别采用了几种验证方法来评估风险预测模型的准确性,包括:ROC曲线,ROC曲线下的面积用于辨别睡眠障碍风险列线图的质量,以区分真阳性和假阳性(即区分度);校准曲线,校准曲线用于评估睡眠障碍风险列线图的校准度,同时进行Hosmer-Lemeshow检验;决策曲线,决策曲线分析用于确定睡眠障碍列线图的临床实用性,其依据是自然人群队列中不同阈值概率下的净收益。所有的分析都使用R4.1.3版本的软件包glmnet和rms,显著性水平被设定为双尾α<0.1。
1.2结果
受试者数据信息:
共计有914例受试者完成了全部的相关检查,包括男性275例和女性639例,其中诊断为睡眠障碍的人数为301人(男性77例,女性224例)。受试者的胃肠电指标是通过将上述8个导联的餐前或餐后的参数指标数据取平均值得到的,分别代表胃部餐前的导联信号指标、胃部餐后的导联信号指标、肠部餐前的导联信号指标和肠部餐后的导联信号指标。采用将多个导联放置在多个位置同时进行信号采集,然后再取平均值的做法可以更好地捕捉胃部和肠部的整体运动规律,以便更有效地获取能够反映胃部和肠部整体真实状态的信号。并且,本发明预实验的测试发现,通过上述方式进行的多点信号采集所获得的信号指标也较为稳定,有利于模型的建立,并且所建立的模型对大规模人群也具有更好的通用性。
所有受试者按7:3的随机抽样比例分配,639例和275例受试者分别被分配到训练集与验证集中。
独立风险因素的筛选:
采用基于LASSO回归的非零系数特征变量筛选,在纳入的46个相关的特征变量(表1)中,本实施例的技术方案最终选择保留了13个特征变量作为人工智能模型的潜在的预测变量(图1A和图1B)对响应变量(在本发明中也可以被称为结局变量(Dependent Variable,DV)(即睡眠障碍发生风险)进行预测,包括:年龄、性别、低密度脂蛋白、餐前胃部的正常慢波百分比、餐前胃部的导联时间差、餐前胃部的主频率、餐前肠部的主功率比、餐后胃部的波形反应面积、餐后胃部的主功率比、餐后胃部的偶联百分比、餐后肠部的主功率比、餐后肠部的主频率和餐后肠部的偶联百分比(表3)。而受试者的个体特征、血液学参数和胃肠电指标的信息如下表2所示。
表1:46个相关的特征变量(参数指标)
表2:受试者的个体特征、血液学参数和胃肠电指标信息
备注:*P<0.10;**P<0.05;***P<0.01。
表3:实施例一的第一轮变量筛选(通过二元LASSO回归保留的变量)
本实施例的技术方案所采用的LASSO(Least Absolute Shrinkage andSelection Operator,最小绝对收缩和选择算子)回归分析是一种线性回归模型的收缩和特征变量选择方法。为了获得预测因子子集,LASSO回归分析通过对模型参数施加约束,使一些特征变量的回归系数(在图1A中简写为“系数”)向零缩减,从而使响应变量的预测误差最小化。在收缩过程后,回归系数等于零的特征变量被排除在模型之外,而回归系数为非零的特征变量则与响应变量有最强的关联。参数λ用于调整LASSO回归的复杂程度。具体地,λ越大,对特征变量较多的线性回归模型的惩罚力度就越大,从而最终获得特征变量较少且这些特征变量均与响应变量关联性较强的模型(即预测性能最优的模型)。具体如图1A所示,图中每一条曲线分别代表了对应的特征变量回归系数的变化轨迹;其中纵坐标表示回归系数的值,下横坐标表示log(λ),上横坐标表示此时模型中非零回归系数的个数。具体地,例如图1A中的m所指示的自变量,其在λ值较大时就有非零的回归系数,且随着λ值的变小而不断变大。换句话说,第一轮特征变量筛选主要排除了46个相关的特征变量中回归系数容易缩减至零的特征变量,而保留了上述13个特征变量作为预测模型的预测变量。
进一步地,为了对基于上述13个预测变量的预测模型的性能有更准确的评估,基于对数似然函数(-2log-likelihood)和二元因变量(可以理解为变量是“是/否”)的类型参量(即交叉验证选取模型时希望最小化的目标参量),本实施例的技术方案采用LASSO回归分析运行10倍交叉验证(cross validation),对所包含的46个特征变量进行集中化和规范化处理,然后挑选出最佳λ值。如图1B所示,由于交叉验证,对于每一个λ值,黑点表示目标参量的均值,黑点上下的实线表示该目标参量的置信区间;两条虚线分别指示了两个特殊的λ值(即Lambda.min和Lambda.1se),在这两个λ值之间的λ都可以被认为是合适的。使用Lambda.1se(Lambda.1se表示在Lambda.min的一个方差范围内,得到最简单的模型的λ值)构建的模型最简单(即使用的预测变量数量最少);而使用Lambda.min(Lambda.min表示在所有的λ值中目标参量均值最小)构建的模型准确率更高,因此本实施例的技术方案使用“Lambda.min”,以构建具有性能最佳、准确率最高的预测模型。
预测模型的开发:
本实施例的技术方案通过使用LASSO回归分析来分析训练集中的数据,以在46个相关的特征变量中选择较佳的预测变量。然后,通过引入LASSO回归模型中选择的特征变量,使用逐步多变量逻辑回归分析来建立预测模型。然后,引入所选择的特征变量并分析特征变量的统计学显著性水平,将具有统计学意义的部分特征变量作为预测变量/预测因子,用于建立睡眠障碍风险的预测模型。应当理解,还可以使用本领域已知的其他适宜算法,例如随机森林方法、其他正则化方法(例如岭回归)、神经网络等。
本实施例的技术方案再采用逻辑回归模型对上述13个预测变量进行分析,并进行逐步法选择最优特征变量,最终保留7个预测变量(每个预测变量均在0.1检验水平上有统计学显著性)。这7个预测变量分别是年龄、性别、餐前胃部的正常慢波百分比、餐前胃部的导联时间差、餐后胃部的主功率比、餐后肠部的主频率和餐后肠部的偶联百分比(表4)。
表4:实施例一的第二轮变量筛选
本实施例的技术方案使用多种统计学手段检验了上述7个特征变量,其中着重分析了这些特征变量的比值比(odds ratio(OR),又称优势比)。OR值是量化两个事件之间关联强度的统计量,表示暴露(在本发明中即所检验的特征变量,下同)后发生的结果与不存在相同暴露时发生结果的几率的比率。OR值在实施例中具体可以理解为:睡眠障碍(即响应变量)与暴露之间的关联强度,表示暴露者的睡眠障碍发生风险(也可以理解为疾病危险度)为非暴露者的倍数。如果所检验的特征变量的OR值>1,则说明睡眠障碍发生风险因暴露而增加,该特征变量与睡眠障碍之间为“正”关联;如果所检验的特征变量的OR值<1,则说明睡眠障碍发生风险因暴露而减少,该特征变量与睡眠障碍之间为“负”关联;如果所检验的特征变量的OR值=1,则说明睡眠障碍与该特征变量无关联。95%置信区间(95%Confidence Interval(CI))提供了对通过检验得到的OR值的准确性的估计(estimate),其描述了总体真实值可能在通过检验得到的OR值的95%置信区间内波动,且置信区间越小,通过检验得到的OR值越准确、稳健。表4中的OR(上)和OR(下)表示所检验的特征变量的OR值的置信区间(95%CI)。表4显示了保留的7个预测变量的比值比(OR)及其95%置信区间,表明这些预测变量都与睡眠障碍存在一定的关联,因此被应用至本实施例的睡眠障碍预测模型。
另外,在表4中,回归系数β:经逻辑回归模型分析获得的预测变量与响应变量相关的偏回归系数,表示每单位量的上升给响应变量带来的影响大小及方向(偏回归系数经标准化后可以比较,所检验的预测变量的回归系数β是一种估计值)。标准误:即所检验的预测变量的回归系数β的标准误,表示回归系数的准确性(标准误越大,所检验的预测变量的准确性越低)。Z值:z统计量,即所检验的预测变量的回归系数β除以其对应的标准误,主要用于判断所检验的预测变量的P值。P值:对应于所检验的预测变量的z统计量的P值(P值越小,所检验的预测变量对响应变量来说越重要)。
结果发现,睡眠障碍患者与健康对照在部分胃肠电指标上存在显著差异,主要表现在餐前胃部的正常慢波百分比、餐前胃部的导联时间差、餐后肠部的主频率、餐后肠部的偶联百分比以及餐后胃部的主功率比。除了餐后胃部的主功率比之外,其他的参数值越低则意味着越高的睡眠障碍风险。
基于上述7个预测变量,本实施例构建了睡眠障碍的风险预测模型,并通过绘制相应的列线图(nomogram)以将构建的睡眠障碍预测模型更好地可视化,参见图2A和图2B。图2A和图2B是本实施例构建的睡眠障碍预测模型的列线图的不同表现形式。图2A和图2B中,每个变量(例如,“年龄”、“性别”等)对应的线段上都标注了刻度,其代表该变量的取值范围;而线段的长度反映该变量对结局事件(即睡眠障碍发生)的贡献大小。在不同取值下,每个变量可以在图2A或图2B最上方的“分数”或“回归系数β”处得到相应的单项分数。取值后,将所有变量对应的单项分数相加,可以得到“总分”。根据总分,可以在图2A或图2B最下方的“睡眠障碍的风险”或“睡眠障碍的概率”处获得睡眠障碍的发生概率。作为示例,在图2A中,如果某个受试者的总分为300,则其发生睡眠障碍的风险大约为0.58(58%)。另外,在图2B所示的动态列线图中,每个变量对应的线段上的黑点分别表示某个受试者的实际取值,而线段上方的波形图显示了各变量的具体分布情况。可以根据黑点的位置,在上方的“回归系数β”处得到相应的单项分数,然后计算总分并获得对应的睡眠障碍的概率(在图2B的示例中,该受试者发生睡眠障碍的概率为0.28)。
预测模型的验证:
本实施例使用训练集和验证集的数据,绘制了相应的受试者工作特征(ROC)曲线来评价构建的预测模型的灵敏度(也可以理解为真阳性率)和特异性(也可以理解为真阴性率)。在图3A和图3B中,横坐标表示“假阳性率”,即“1-特异性”;纵坐标表示“真阳性率”,即“灵敏度”;ROC曲线(即图3A和图3B中的实线)下的面积(AUC,即ROC曲线下与坐标轴围成的面积)分析用于辨别风险列线图的质量,以将真阳性从假阳性中区分出。对于建立的预测模型,列线图ROC曲线下的面积(AUC)均在0.6以上(即大于虚线下的面积):训练集中列线图ROC曲线下的面积为65.04%(95%CI:60.66%-69.43%)(图3A),在验证集中为63.04%(95%CI:56.31%-69.76%)(图3B),说明本实施例构建的模型具有良好的稳健性、表现出稳健的预测能力。校准曲线用于观察预测概率是否与实际概率接近。在两种数据集的列线图校准曲线上,也显示出良好的一致性(图4A和图4B,虚线曲线(如d指示)表示实际观察到的睡眠障碍发生概率,实线曲线(如c指示)则表示预测模型预测的睡眠障碍发生概率)。综合上述验证结果可知,本实施例构建的睡眠障碍预测模型具有较好的预测能力。
更进一步的,决策曲线分析(DCA)表明,在训练集中,本实施例的列线图能够准确地预测睡眠障碍发生风险的阈值范围为在35%和60%之间(图5A);在验证集中,阈值范围为在30%和38%之间(图5B)。由此可见,上述两个数据集的阈值概率在35%和38%之间重叠。训练集和验证集在DCA曲线的阈值概率范围的重叠部分可以理解为,训练集和验证集在此重叠范围内均能够表现出有效的净获益,即将风险概率超过阈值概率的患者判定为真阳性患者并施加干预时,在训练集和验证集中均能够取得为正的净获益。换句话说,根据模型的决策曲线,在筛查中对睡眠障碍风险概率超过0.35的患者被认为有更大的睡眠障碍发生风险,建议进行睡眠障碍的确诊或干预将拥有临床获益。这也说明,将风险概率阈值取在此重叠范围时具有更高的实际应用价值,其获益大小可以通过获益率进行比较。
实施例二:
2.1方法
受试者:在中国西部地区的60个社区,招募40岁以上自愿参与研究并签署知情同意书的社区人群,并采集受试者的年龄、性别、婚姻状况、文化水平、生活方式、饮食习惯等一般资料,以及开展匹兹堡睡眠量表(PSQI)评测和胃肠电图检测。排除标准为:排除耳聋眼盲者、半年内被诊断为胃炎、胃溃疡等胃肠道疾病或有腹泻、便秘等胃肠不适者;排除有严重的心肝肾等重大器官功能不全或有糖尿病等代谢性疾病者,以及重大精神疾病的患者;为降低药物对胃肠电图检测影响,排除在检查前1周服用过任何药物者。
睡眠状态评估:采取匹兹堡睡眠量表(PSQI)来评估患者的睡眠状况。该量表在评价睡眠质量方面具有较好的信度和效度。该量表是受试者在两名专业人员安静的缓解下,采用统一的术语指导填写。
EGEG记录:用8通道胃肠电图仪测量并采集胃肠道肌电活动信号(XDJ-S8,HefeiKaili Co.,Hefei,China)。所有受试者均被告知在3天内避免饮酒和辛辣或刺激性食物,并在检查前禁食至少6小时。测量时取仰卧位。在腹部皮肤上放置4个胃电极(导联分别放置在胃体601、小弯602、大弯603、胃窦604处)和4个肠电极(导联分别放置在升结肠605、横结肠606、降结肠607、直肠608处)(Hanjie Co.Ltd.,Shanghai,China)(图6)。检查过程中,嘱咐受试者避免任何动作和说话。在6分钟的餐前EGEG记录后,进行进餐功能负荷实验。摄入约200kcal的标准食物后,再记录6分钟的餐后胃肠电信号。导联的放置部位如图6所示:胃体601:剑突与脐连线中点向左旁开三至五厘米,往上一厘米;胃窦604:剑突与脐连线中点向右旁开二至四厘米;小弯602:剑突与脐连线中点向上1/2处;大弯603:剑突与脐连线中点向下1/2处。升结肠605:与脐持平向右旁开二至四厘米;横结肠606:脐下一厘米;降结肠607:与脐持平向左旁开二至四厘米;直肠608:背部尾骨部下。
胃肠电指标:EGEG采样频率为1Hz、滤波频率为0.008Hz-0.1Hz,以滤除包括心跳在内的背景噪声。在检测伪影后,由检查仪配套软件计算出原始的EGEG电位数据,并通过软件进行频谱分析,分别导出上述8个导联的如下参数:(1)波形平均幅值;(2)波形平均频率;(3)胃(肠)电节律紊乱百分比;(4)波形反应面积;(5)导联时间差;(6)主频率;(7)主功率比;(8)正常慢波百分比;(9)偶联百分比。
其他指标:每位受试者均接受了血糖血脂指标的测定,包括葡萄糖、甘油三酯、胆固醇、高密度脂蛋白、低密度脂蛋白。还向每位受试者收集了基本的个人特征指标,包括性别、年龄、吸烟史、饮酒史、BMI。
预测模型的构建:首先,为了获得预测因子子集,使用正则化算法之一的LASSO回归分析来进行第一轮变量筛选。此外,LASSO回归分析运行10倍交叉验证,对所包含的变量进行集中化和规范化处理,并选择"lambda.min"作为最佳性能。按照7:3的随机比例,将受试者随机分为训练集和验证集。然后,采用逐步多变量逻辑回归分析对LASSO回归模型中筛选出的预测因子,进行第二轮变量筛选,并利用保留的具有统计学意义的预测因子(本发明中,“预测因子”与“预测变量”表示相同含义)来建立预测模型。最后,将建立的预测模型应用于睡眠障碍风险的预测和建立列线图预测模型。应当理解,还可以使用本领域已知的其他适宜算法,例如随机森林方法、其他正则化方法(例如岭回归)、神经网络等。
此外,通过使用训练集和验证集的数据,分别采用了几种验证方法来评估风险预测模型的准确性,包括:ROC曲线,ROC曲线下的面积用于辨别睡眠障碍风险列线图的质量,以区分真阳性和假阳性(即区分度);校准曲线,校准曲线用于评估睡眠障碍风险列线图的校准度,同时进行Hosmer-Lemeshow检验;决策曲线,决策曲线分析用于确定睡眠障碍列线图的临床实用性,其依据是自然人群队列中不同阈值概率下的净收益。所有的分析都使用R4.1.3版本的软件包glmnet和rms,显著性水平被设定为双尾α<0.1。
2.2结果
受试者数据信息:
共计有914例受试者完成了全部的相关检查,包括男性275例和女性639例,其中诊断为睡眠不良(睡眠障碍)的人数为204人(男性159例,女性45例)。受试者的胃肠电指标是通过将上述8个导联的餐前或餐后的参数指标数据取平均值得到的,分别代表胃部餐前的导联信号指标、胃部餐后的导联信号指标、肠部餐前的导联信号指标和肠部餐后的导联信号指标。采用将多个导联放置在多个位置同时进行信号采集,然后再取平均值的做法可以更好地捕捉胃部和肠部的整体运动规律,以便更有效地获取能够反映胃部和肠部整体真实状态的信号。并且,本发明预实验的测试发现,通过上述方式进行的多点信号采集所获得的信号指标也较为稳定,有利于模型的建立,并且所建立的模型对大规模人群也具有更好的通用性。
所有受试者按7:3的随机抽样比例分配,639例和275例受试者分别被分配到训练集与验证集中。
独立风险因素的筛选:
采用基于LASSO回归的非零系数特征变量筛选,在纳入的46个相关的特征变量(表1)中,本实施例的技术方案最终选择保留了10个特征变量作为人工智能模型的潜在的预测变量(图9A和图9B)对响应变量(即睡眠障碍发生风险)进行预测,包括:年龄、性别、血糖、餐前胃部的正常慢波百分比、餐前胃部的导联时间差、餐前肠部的反应面积、餐后胃部的主频率、餐后胃部的电节律紊乱百分比、餐后肠部的主频率和餐后肠部的偶联百分比(表5)。
表5:实施例二的第一轮变量筛选
本实施例的技术方案所采用的LASSO回归分析是一种线性回归模型的收缩和特征变量选择方法。为了获得预测因子子集,LASSO回归分析通过对模型参数施加约束,使一些特征变量的回归系数向零缩减,从而使响应变量的预测误差最小化。在收缩过程后,回归系数等于零的特征变量被排除在模型之外,而回归系数为非零的特征变量则与响应变量有最强的关联。参数λ用于调整LASSO回归的复杂程度。具体地,λ越大,对特征变量较多的线性回归模型的惩罚力度就越大,从而最终获得特征变量较少且这些特征变量均与响应变量关联性较强的模型(即预测性能最优的模型)。具体如图9A所示,图中每一条曲线分别代表了对应的特征变量回归系数的变化轨迹;其中纵坐标表示回归系数的值,下横坐标表示log(λ),上横坐标表示此时模型中非零回归系数的个数。具体地,例如图9A中的自变量“10”,其在λ值较大时就有非零的回归系数,且随着λ值的变小而不断变大。换句话说,第一轮特征变量筛选主要排除了46个相关的特征变量中回归系数容易缩减至零的特征变量,而保留了上述10个特征变量作为预测模型的预测变量。
进一步地,为了对基于上述10个预测变量的预测模型的性能有更准确的评估,基于对数似然函数(-2log-likelihood)和二元因变量(可以理解为变量是“是/否”)的类型参量(即交叉验证选取模型时希望最小化的目标参量),本实施例的技术方案采用LASSO回归分析运行10倍交叉验证(cross validation),对所包含的46个特征变量进行集中化和规范化处理,然后挑选出最佳λ值。如图9B所示,由于交叉验证,对于每一个λ值,黑点表示目标参量的均值,黑点上下的实线表示该目标参量的置信区间;两条虚线分别指示了两个特殊的λ值(即Lambda.min和Lambda.1se),在这两个λ值之间的λ都可以被认为是合适的。使用Lambda.1se(Lambda.1se表示在Lambda.min的一个方差范围内,得到最简单的模型的λ值)构建的模型最简单(即使用的预测变量数量最少);而使用Lambda.min(Lambda.min表示在所有的λ值中目标参量均值最小)构建的模型准确率更高,因此本实施例的技术方案使用“Lambda.min”,以构建具有性能最佳、准确率最高的预测模型。
预测模型的开发:
本实施例的技术方案通过引入LASSO回归模型中选择的特征变量,使用逐步多变量逻辑回归分析来建立预测模型。然后,引入所选择的特征变量并分析特征变量的统计学显著性水平,将具有统计学意义的部分特征变量作为预测变量/预测因子,用于建立睡眠障碍风险的预测模型。
本实施例的技术方案再采用逻辑回归模型对上述10个预测变量进行分析,并进行逐步法选择最优特征变量,最终保留8个预测变量(每个预测变量均在0.1检验水平上有统计学显著性)。这8个预测变量分别是年龄、性别、餐前胃部的正常慢波百分比、餐前胃部的导联时间差、餐后胃部的主频率、餐后胃部的电节律紊乱百分比、餐后肠部的主频率和餐后肠部的偶联百分比(表6)。本实施例的技术方案使用多种统计学手段检验了上述8个特征变量,其中着重分析了这些特征变量的比值比(odds ratio(OR),又称优势比)。OR值是量化两个事件之间关联强度的统计量,表示暴露(在本发明中即所检验的特征变量,下同)后发生的结果与不存在相同暴露时发生结果的几率的比率。OR值在实施例中具体可以理解为:睡眠障碍(即响应变量)与暴露之间的关联强度,表示暴露者的睡眠障碍发生风险(也可以理解为疾病危险度)为非暴露者的倍数。如果所检验的特征变量的OR值>1,则说明睡眠障碍发生风险因暴露而增加,该特征变量与睡眠障碍之间为“正”关联;如果所检验的特征变量的OR值<1,则说明睡眠障碍发生风险因暴露而减少,该特征变量与睡眠障碍之间为“负”关联;如果所检验的特征变量的OR值=1,则说明睡眠障碍与该特征变量无关联。95%置信区间(95%Confidence Interval(CI))提供了对通过检验得到的OR值的准确性的估计(estimate),其描述了总体真实值可能在通过检验得到的OR值的95%置信区间内波动,且置信区间越小,通过检验得到的OR值越准确、稳健。表6中的OR(上)和OR(下)表示所检验的特征变量的OR值的置信区间(95%CI)。表6显示了保留的8个预测变量的比值比(OR)及其95%置信区间,表明这些预测变量都与睡眠障碍存在一定的关联,因此被应用至本实施例的睡眠障碍预测模型。
表6:实施例二的第二轮变量筛选
基于上述8个预测变量,本实施例构建了睡眠障碍的风险预测模型,并通过绘制相应的列线图(nomogram)以将构建的睡眠障碍预测模型更好地可视化,参见图10A和图10B。图10A和图10B是本实施例构建的睡眠障碍预测模型的列线图的不同表现形式。作为示例,在图10A中,如果某个受试者的总分为300,则其发生睡眠障碍的风险大约为0.28(28%)。在图10B的示例中,该受试者发生睡眠障碍的概率为0.617。
预测模型的验证:
本实施例使用训练集和验证集的数据,绘制了相应的受试者工作特征(ROC)曲线来评价构建的预测模型的灵敏度(也可以理解为真阳性率)和特异性(也可以理解为真阴性率)。在图11A和图11B中,横坐标表示“假阳性率”,即“1-特异性”;纵坐标表示“真阳性率”,即“灵敏度”;ROC曲线(即图11A和图11B中的实线)下的面积(AUC,即ROC曲线下与坐标轴围成的面积)分析用于辨别风险列线图的质量,以将真阳性从假阳性中区分出。对于建立的预测模型,列线图ROC曲线下的面积(AUC)均在0.6以上(即大于虚线下的面积):在训练集中为69.42%(95%CI:64.56%-74.27%)(图11A),在验证集中为63.95%(95%CI:56.37%-71.54%)(图11B),说明本实施例构建的模型表现出良好的稳健性。校准曲线用于观察预测概率是否与实际概率接近。在两种数据集的列线图校准曲线上,也显示出良好的一致性(图12A和图12B,虚线曲线表示实际观察到的睡眠障碍发生概率,实线曲线则表示预测模型预测的睡眠障碍发生概率)。综合上述验证结果可知,本实施例构建的睡眠障碍预测模型具有较好的预测能力。
更进一步的,决策曲线分析(DCA)表明,在训练集中,本实施例的列线图能够准确地预测睡眠障碍发生风险的阈值范围为在20%和40%之间(图13A);在验证集中,阈值范围为在25%和60%之间(图13B)。由此可见,上述两个数据集的阈值概率在25%和40%之间重叠。训练集和验证集在DCA曲线的阈值概率范围的重叠部分可以理解为,训练集和验证集在此重叠范围内均能够表现出有效的净获益,即将风险概率超过阈值概率的患者判定为真阳性患者并施加干预时,在训练集和验证集中均能够取得为正的净获益。换句话说,预测概率高于0.4(40%)的患者被认为有更大的睡眠障碍发生风险,这是一个具有净效益的临床参考阈值。这也说明,将风险概率阈值取在此重叠范围时具有更高的实际应用价值,其获益大小可以通过获益率进行比较。
实施例三:使用上述睡眠障碍预测模型,预测受试者睡眠障碍发生风险的概率
参见图7,图7是本发明实施例提供的预测系统的一个可选的架构示意图。为实现支撑一个示例性应用,终端(示例性示出了第一终端202和第二终端204)通过网络连接预测系统。本发明涉及的网络可以是广域网或者局域网,或者是二者的组合,使用无线链路实现数据传输。本发明涉及的终端可以为智能手机、平板电脑、笔记本电脑等各种类型的用户终端。终端可以用于显示输入受试者数据和/或样本数据的界面,以及显示预测系统的预测结果的界面。
下面说明预测系统的示例性结构,在一些实施例中,如图8所示,预测系统100可以包括:
数据库106,用于存储数据,所述数据的类型包括胃肠电信号数据和临床数据,所述数据包括来自样本人群的样本数据和来自受试者的受试者数据;
数据获取模块102,用于获取所述数据,并将所述数据存储于所述数据库106;
模型训练模块108,所述模型训练模块108利用机器学习算法对所述样本数据进行训练学习,从而确定预测模型(例如,睡眠障碍预测模型);
预测模块112,所述预测模块112通过所述数据获取模块102获取所述受试者数据,并调用所确定的预测模型(例如,睡眠障碍预测模型)对所述受试者数据进行分析,用以预测所述受试者发生睡眠障碍的概率。
预测系统100还可以包括验证模块110,所述验证模块110用于评价所确定的预测模型(例如,睡眠障碍预测模型)的准确性,所述评价的评价指标包括校准度、区分度和临床实用性中的一种或多种。
其中,所述数据库106、所述模型训练模块108和所述验证模块110可以整合为模型构建模块104。
作为示例,在实施例一的睡眠障碍预测系统中,所述胃肠电信号数据具体包括餐前胃部的正常慢波百分比、餐前胃部的导联时间差、餐后胃部的主功率比、餐后肠部的主频率和餐后肠部的偶联百分比,所述临床数据具体包括年龄和性别。
作为示例,在实施例二的睡眠障碍预测系统中,所述胃肠电信号数据具体包括餐前胃部的正常慢波百分比、餐前胃部的导联时间差、餐后胃部的主频率、餐后胃部的电节律紊乱百分比、餐后肠部的主频率和餐后肠部的偶联百分比,所述临床数据具体包括年龄和性别。
下面给出本发明的一个具体应用场景。
X社区开展睡眠障碍的大规模筛查活动,采集社区内目标人群(例如,中老年人)的胃肠电信号数据、血糖血脂数据和个体特征数据(后二者统称为“临床数据”),并通过第一终端202将受试者数据输入。受试者数据经网络206传输至预测系统100的数据获取模块102。数据获取模块102获取来自受试者的受试者数据并将其存储在数据库106中。
预测模块112获取所述受试者数据并调用已建立的睡眠障碍预测模型,以对所述受试者数据进行分析,并预测所述受试者睡眠障碍的概率。
作为输出,预测模块112可生成提示所述受试者发生睡眠障碍的风险的报告,并将预测结果通过网络206传输至第一终端202。X社区可以提前设置睡眠障碍发生风险阈值(例如,睡眠障碍发生概率为30%)。当某个患者(例如,Y患者)被预测的睡眠障碍的发生风险超过设置的风险阈值时(例如,发生概率为35%),X社区应当对Y患者或其家属发出提醒并建议前往推荐或合作的医院就诊。Y患者前往医院就诊时,医院会对Y患者进行进一步的、更详尽的检查,以判断该患者是否患有被提示的睡眠障碍。医生可以将Y患者的诊断结果,通过第二终端204传输至预测系统100。Y患者的数据(受试者数据+诊断结果)可以作为新的样本数据,用于进一步训练睡眠障碍预测模型。当然,Y患者的诊断结果也可以通过第一终端202传输至预测系统100,换句话说,传输Y患者的诊断结果的终端可以是相同或不同的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到,上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台计算机终端(可以是手机、计算机、服务器、或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (10)

1.一种睡眠障碍预测系统,其特征在于,包括:
数据库,用于存储数据,所述数据的类型包括胃肠电信号数据和临床数据,所述胃肠电信号数据包括餐前胃肠电信号数据和餐后胃肠电信号数据;所述餐前胃肠电信号数据包括餐前胃部的正常慢波百分比和餐前胃部的导联时间差,所述餐后胃肠电信号数据包括餐后胃部的主功率比、餐后肠部的主频率和餐后肠部的偶联百分比,所述临床数据包括年龄和性别;所述数据包括来自样本人群的样本数据和来自受试者的受试者数据;
数据获取模块,用于获取所述数据,并将所述数据存储于所述数据库;
模型训练模块,所述模型训练模块利用机器学习算法对所述样本数据进行训练学习,从而确定睡眠障碍预测模型;
预测模块,所述预测模块通过所述数据获取模块获取所述受试者数据,并调用所述睡眠障碍预测模型对所述受试者数据进行分析,用以预测所述受试者发生睡眠障碍的概率。
2.如权利要求1所述的系统,其特征在于,所述样本数据以7:3的比例被分为训练集和验证集。
3.如权利要求1所述的系统,其特征在于,所述胃肠电信号数据通过分别位于胃体、胃窦、小弯、大弯、升结肠、横结肠、降结肠和直肠的导联同时采集得到。
4.如权利要求2所述的系统,其特征在于,所述系统进一步包括验证模块,所述验证模块用于利用所述验证集来评价所述睡眠障碍预测模型的准确性。
5.如权利要求4所述的系统,其特征在于,所述评价的评价指标包括校准度、区分度和临床实用性中的一种或多种。
6.一种睡眠障碍预测模型的构建方法,其特征在于,包括以下步骤:
S1获取来自样本人群的样本数据,所述样本数据的类型包括胃肠电信号数据和临床数据;
S2对所述样本数据进行预训练以筛选出预测变量,所述筛选出的预测变量包括餐前胃部的正常慢波百分比、餐前胃部的导联时间差、餐后胃部的主功率比、餐后肠部的主频率和餐后肠部的偶联百分比、年龄和性别;
S3基于所述筛选出的预测变量,利用机器学习算法对所述样本数据进行训练学习,以建立所述睡眠障碍预测模型。
7.如权利要求6所述的方法,其特征在于,所述样本数据以7:3的比例被分为训练集和验证集。
8.如权利要求6所述的方法,其特征在于,所述预训练包括第一轮变量筛选和第二轮变量筛选;所述第一轮变量筛选包括LASSO回归分析,所述第二轮变量筛选包括逻辑回归分析和逐步回归分析。
9.如权利要求7所述的方法,其特征在于,所述方法进一步包括S4利用所述验证集来评价所述睡眠障碍预测模型的准确性,所述评价的评价指标包括校准度、区分度和临床实用性中的一种或多种。
10.如权利要求6所述的方法,其特征在于,所述预训练包括岭回归或随机森林模型。
CN202310089412.6A 2022-11-25 2023-01-17 一种基于胃肠电信号的睡眠障碍预测系统及其构建方法 Active CN116584962B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202211503172 2022-11-25
CN2022115031721 2022-11-25

Publications (2)

Publication Number Publication Date
CN116584962A true CN116584962A (zh) 2023-08-15
CN116584962B CN116584962B (zh) 2023-11-21

Family

ID=87594292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310089412.6A Active CN116584962B (zh) 2022-11-25 2023-01-17 一种基于胃肠电信号的睡眠障碍预测系统及其构建方法

Country Status (1)

Country Link
CN (1) CN116584962B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004002307A2 (en) * 2002-06-28 2004-01-08 Oridion Breathid Ltd. Management of gastro-intestinal disorders
CN201968675U (zh) * 2011-01-21 2011-09-14 李玉霞 基于arm的体表胃电信号采集分析仪
US20170164907A1 (en) * 2015-12-14 2017-06-15 Samsung Electronics Co., Ltd. Method and system for monitoring continuous biomedical signal
CN107249441A (zh) * 2015-02-16 2017-10-13 三星电子株式会社 用于测量生物信息的电子装置和方法
US20190099009A1 (en) * 2014-05-09 2019-04-04 Sleepnea Llc Wearable Technology for Sleep Environment Modification
CN110074765A (zh) * 2019-04-29 2019-08-02 中山大学 一种sahs筛查及睡眠分期的判别方法
CN112190240A (zh) * 2020-09-21 2021-01-08 四川大学华西医院 一种基于物联网的老年人健康监测报警设备及方法
WO2022061346A1 (en) * 2020-09-16 2022-03-24 Northwestern University Classification of functional lumen imaging probe data
US20220233252A1 (en) * 2021-01-22 2022-07-28 Ethicon Llc Pre-surgical and surgical processing for surgical data context
US20220238216A1 (en) * 2021-01-22 2022-07-28 Ethicon Llc Machine learning to improve artificial intelligence algorithm iterations
US20220241028A1 (en) * 2021-01-22 2022-08-04 Ethicon Llc Prediction of blood perfusion difficulties based on biomarker monitoring
US20220240869A1 (en) * 2021-01-22 2022-08-04 Ethicon Llc Hysterectomy surgery post-surgical monitoring
US20220241474A1 (en) * 2021-01-22 2022-08-04 Ethicon Llc Thoracic post-surgical monitoring and complication prediction
CN115105020A (zh) * 2022-05-30 2022-09-27 兰州大学第二医院 一种患者睡眠状态监测系统

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004002307A2 (en) * 2002-06-28 2004-01-08 Oridion Breathid Ltd. Management of gastro-intestinal disorders
CN201968675U (zh) * 2011-01-21 2011-09-14 李玉霞 基于arm的体表胃电信号采集分析仪
US20190099009A1 (en) * 2014-05-09 2019-04-04 Sleepnea Llc Wearable Technology for Sleep Environment Modification
CN107249441A (zh) * 2015-02-16 2017-10-13 三星电子株式会社 用于测量生物信息的电子装置和方法
US20170164907A1 (en) * 2015-12-14 2017-06-15 Samsung Electronics Co., Ltd. Method and system for monitoring continuous biomedical signal
CN110074765A (zh) * 2019-04-29 2019-08-02 中山大学 一种sahs筛查及睡眠分期的判别方法
WO2022061346A1 (en) * 2020-09-16 2022-03-24 Northwestern University Classification of functional lumen imaging probe data
CN112190240A (zh) * 2020-09-21 2021-01-08 四川大学华西医院 一种基于物联网的老年人健康监测报警设备及方法
US20220233252A1 (en) * 2021-01-22 2022-07-28 Ethicon Llc Pre-surgical and surgical processing for surgical data context
US20220238216A1 (en) * 2021-01-22 2022-07-28 Ethicon Llc Machine learning to improve artificial intelligence algorithm iterations
US20220241028A1 (en) * 2021-01-22 2022-08-04 Ethicon Llc Prediction of blood perfusion difficulties based on biomarker monitoring
US20220240869A1 (en) * 2021-01-22 2022-08-04 Ethicon Llc Hysterectomy surgery post-surgical monitoring
US20220241474A1 (en) * 2021-01-22 2022-08-04 Ethicon Llc Thoracic post-surgical monitoring and complication prediction
CN115105020A (zh) * 2022-05-30 2022-09-27 兰州大学第二医院 一种患者睡眠状态监测系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
代瑞红;廖晓阳;: "失眠与紧张性头痛及其诱因间关系的研究进展", 中国全科医学, no. 36 *
杭杲;杨文澜;徐孝华;蔡迎庆;黄海英;: "儿童多通道胃电图检测在功能性便秘诊断的临床价值", 医学研究杂志, no. 05 *
王茂贵: "儿童功能性胃肠病与胃肠动力疾病", 实用儿科临床杂志, no. 07 *

Also Published As

Publication number Publication date
CN116584962B (zh) 2023-11-21

Similar Documents

Publication Publication Date Title
Buettner et al. Efficient machine learning based detection of heart disease
Groeneweg et al. Screening of subclinical hepatic encephalopathy
Ornstein et al. The problem with “problem behaviors”: a systematic review of the association between individual patient behavioral and psychological symptoms and caregiver depression and burden within the dementia patient–caregiver dyad
Li et al. Non-invasive monitoring of three glucose ranges based on ECG by using DBSCAN-CNN
KR20170061222A (ko) 건강데이터 패턴의 일반화를 통한 건강수치 예측 방법 및 그 장치
KR102302071B1 (ko) 우울증 발병 예측 방법 및 이를 이용한 우울증 발병 예측 디바이스
US20190076098A1 (en) Artificial Neural Network Based Sleep Disordered Breathing Screening Tool
CN109770921B (zh) 自闭症儿童早期语言与认知能力筛查的方法及装置
Kodama et al. Ability of current machine learning algorithms to predict and detect hypoglycemia in patients with diabetes mellitus: meta-analysis
Aimie-Salleh et al. Fusion of heart rate variability and salivary cortisol for stress response identification based on adverse childhood experience
CN111508607B (zh) 一种基于bp神经网络的肥胖症预测系统
van Wamelen et al. Digital health technology for non-motor symptoms in people with Parkinson's disease: Futile or future?
Gutiérrez-Tobal et al. Ensemble-learning regression to estimate sleep apnea severity using at-home oximetry in adults
Li et al. A model for obstructive sleep apnea detection using a multi-layer feed-forward neural network based on electrocardiogram, pulse oxygen saturation, and body mass index
Bilgin et al. Investigation of the relationship between anxiety and heart rate variability in fibromyalgia: A new quantitative approach to evaluate anxiety level in fibromyalgia syndrome
Whittingslow et al. Knee acoustic emissions as a digital biomarker of disease status in juvenile idiopathic arthritis
Juang et al. Explainable fuzzy neural network with easy-to-obtain physiological features for screening obstructive sleep apnea-hypopnea syndrome
Dakhale et al. An automatic sleep-scoring system in elderly women with osteoporosis fractures using frequency localized finite orthogonal quadrature Fejer Korovkin kernels
CN116584962B (zh) 一种基于胃肠电信号的睡眠障碍预测系统及其构建方法
CN115886818B (zh) 一种基于胃肠电信号的抑郁焦虑障碍预测系统及其构建方法
CN115517682B (zh) 基于胃肠电信号的认知功能障碍预测系统及构建方法
Azimi et al. Identifying sleep biomarkers to evaluate cognition in HIV
Zheng et al. Estimation of hypertension risk from lifestyle factors and health profile: a case study
Huang et al. Application of heart rate variability during blood pressure measurement in patients with somatic symptom disorder
Phabphal et al. Identifying obstructive sleep apnea in patients with epilepsy: A cross-sectional multicenter study

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant