CN117153412A - 患病风险筛查方法、设备及存储介质 - Google Patents

患病风险筛查方法、设备及存储介质 Download PDF

Info

Publication number
CN117153412A
CN117153412A CN202311010156.3A CN202311010156A CN117153412A CN 117153412 A CN117153412 A CN 117153412A CN 202311010156 A CN202311010156 A CN 202311010156A CN 117153412 A CN117153412 A CN 117153412A
Authority
CN
China
Prior art keywords
screening
osa
model
risk
questionnaire
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311010156.3A
Other languages
English (en)
Inventor
赵东兴
张挪富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Affiliated Hospital of Guangzhou Medical University
Original Assignee
First Affiliated Hospital of Guangzhou Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Affiliated Hospital of Guangzhou Medical University filed Critical First Affiliated Hospital of Guangzhou Medical University
Priority to CN202311010156.3A priority Critical patent/CN117153412A/zh
Publication of CN117153412A publication Critical patent/CN117153412A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/27Regression, e.g. linear or logistic regression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明公开了一种患病风险筛查方法、设备及存储介质,属于医疗领域。该方法包括:接收病患信息问卷;将所述病患信息问卷输入预先创建的OSA患病风险筛查模型中进行风险筛查,输出筛查结果,其中,OSA患病风险筛查模型是针对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查模型,所述OSA患病风险筛查模型基于双核OSA筛查算法模型创建,所述双核OSA筛查算法模型包括OSA改良筛查问卷模型和OSA自动诊断模型。通过OSA患病风险筛查模型进行风险筛查,实现了阻塞性睡眠呼吸暂停通气综合征的快速筛查,并能实现远程的病情评估,及时提醒患者就诊治疗,避免错过最佳治疗时机。相较于现有技术,具有更便捷、更高效、低成本、适用范围广的优势。

Description

患病风险筛查方法、设备及存储介质
技术领域
本发明涉及医疗领域,尤其涉及一种患病风险筛查方法、设备及存储介质。
背景技术
阻塞性睡眠呼吸暂停低通气综合征(Obstructive sleep apnea hypopneasyndrome,OSAHS)是一种常见的慢性呼吸系统疾病,以睡眠状态下反复发生上气道完全或部分闭塞为特征,造成间歇性低氧、高碳酸血症、胸腔内压波动和微觉醒,导致白天嗜睡和生活质量下降。阻塞性睡眠呼吸暂停(Obstructive Sleep Apnea,OSA)是一种睡眠呼吸暂停的疾病。它是由于上呼吸道阻塞或狭窄而导致的呼吸暂停,在睡眠时会出现间歇性的呼吸暂停,导致缺氧和高碳酸血症,引起多种健康问题。其中,OSAHS是OSA的一种类型。OSA发病率高,致死率和病残率高,危害性极大。流行病学资料显示,全球30-69岁人群中OSAHS的患病率为7.8-77.2%。OSA可引起全身多个系统的损害,包括心血管系统、呼吸系统、神经系统等,严重的心血管事件,OSAHS与多种不良心血管疾病相关,包括恶性高血压、心律失常、冠心病、心肌梗死等,是导致OSA死亡最主要原因,OSA发病率和死亡率高,对健康危害大,疾病负担重,而目前的诊断及防治水平低,特别是基层医院技术和诊疗设备均缺乏。
目前,多导睡眠图(PSG)是诊断睡眠呼吸障碍性疾病的“金标准”,但检查耗时、操作复杂、价格昂贵、需专业的睡眠监测室及专门技术人员等因素限制了它的广泛应用,在基层医院很难普及。由于睡眠监测等诊断工具缺乏、患者及基层医务人员对疾病的知晓率低及重视程度不足等原因,导致漏诊率高,而治疗率低,因此,大量患者未能得及时和恰当的诊治。部分已接受治疗的患者由于随访及评估设备缺乏,其依从性很差,常导致治疗中断或停止,因而达不到治疗效果。
发明内容
本发明的主要目的在于提供一种患病风险筛查方法、设备及存储介质,旨在解决无法及时和恰当地诊治阻塞性睡眠呼吸暂停低通气综合征的问题。
为实现上述目的,本发明提供一种患病风险筛查方法,所述患病风险筛查方法包括以下步骤:
接收病患信息问卷;
将所述病患信息问卷输入预先创建的OSA患病风险筛查模型中进行风险筛查,输出筛查结果,其中,所述OSA患病风险筛查模型是针对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查模型,所述OSA患病风险筛查模型基于双核OSA筛查算法模型创建,所述双核OSA筛查算法模型包括OSA改良筛查问卷模型和OSA自动诊断模型。
可选地,所述接收病患信息问卷的步骤之前,还包括:
基于所述双核OSA筛查算法模型,创建所述OSA患病风险筛查模型。
可选地,所述基于所述双核OSA筛查算法模型,创建所述OSA患病风险筛查模型的步骤包括:
建立OSA病患研究队列,收集所述OSA病患研究队列的筛查数据;
根据所述筛查数据,创建所述OSA改良筛查问卷模型;
根据所述筛查数据,训练所述OSA自动诊断模型。
可选地,所述根据所述筛查数据,创建所述OSA改良筛查问卷模型的步骤包括:
获取所述OSA病患研究队列的诊断信息;
根据所述筛查数据和所述诊断信息,获取所述第一筛查参数;
根据所述第一筛查参数,建立所述OSA改良筛查问卷模型。
可选地,所述根据所述第一筛查参数,建立所述OSA改良筛查问卷模型步骤包括:
根据所述第一筛查参数,获取筛查指标,所述筛查指标包括性别、年龄、体质指数、打鼾、呼吸暂停、嗜睡、高血压、糖尿病、冠心病、脑血管疾病及鼻咽部疾病中的一种或几种;
基于受试者工作特征曲线和约登指数,分析所述筛查指标中年龄和体质指数的截断值;
基于多元Logistic回归分析和所述受试者工作特征曲线,对所述筛查指标和所述截断值进行筛选,得到目标筛选指标和目标截断值;
根据所述目标筛选指标和所述目标截断值,建立所述OSA改良筛查问卷模型。
可选地,所述根据所述筛查数据,训练所述OSA自动诊断模型的步骤包括:
对所述筛查数据进行数据清洗,获得训练数据,所述训练数据包括训练集数据、验证集数据、测试集数据;
基于LightGBM算法模型,对所述训练集数据进行训练;
基于交叉验证,通过所述验证集数据对训练后的所述OSA自动诊断模型进行验证,获取最优验证模型;
通过所述最优验证模型,对所述测试集数据进行预测并调整参数,获取所述OSA自动诊断模型。
可选地,所述将所述病患信息问卷输入预先创建的OSA患病风险筛查模型中进行风险筛查,得到筛查结果的步骤包括:
将所述病患信息问卷输入所述OSA患病风险筛查模型;
根据所述病患信息问卷,获取第二筛查参数;
将所述第二筛查参数输入所述双核OSA筛查算法模型进行筛查,得到所述筛查结果并输出。
可选地,所述将所述第二筛查参数输入所述双核OSA筛查算法模型进行筛查,得到所述筛查结果并输出的步骤包括:
基于所述OSA改良筛查问卷模型,输出OSA患病风险等级及就诊建议;
基于所述OSA自动诊断模型,输出OSA患病风险概率。
可选地,所述基于所述OSA改良筛查问卷模型,输出OSA患病风险等级及就诊建议的步骤包括:
通过所述OSA改良筛查问卷模型,生成OSA改良筛查问卷,所述OSA改良筛查问卷包括若干题目,每道题目对应一个衡量指标;
根据所述第二筛查参数,获取衡量指标数据;
根据所述衡量指标数据,为每个所述衡量指标赋予权重分数;
将所有所述衡量指标的权重分数相加,得到OSA改良筛查问卷的总分值;
根据所述OSA改良筛查问卷的总分值,输出所述OSA患病风险等级及就诊建议。
此外,为实现上述目的,本发明还提供一种患病风险筛查装置,所述患病风险筛查装置包括:
接收模块,接收病患信息问卷;
筛查模块,将所述病患信息问卷输入预先创建的OSA患病风险筛查模型中进行风险筛查,输出筛查结果,其中,所述OSA患病风险筛查模型是针对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查模型,所述OSA患病风险筛查模型基于双核OSA筛查算法模型创建,所述双核OSA筛查算法模型包括OSA改良筛查问卷模型和OSA自动诊断模型。
本发明实施例还提出一种终端设备,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的患病风险筛查程序,所述患病风险筛查程序被所述处理器执行时实现如上所述的患病风险筛查方法的步骤。
本发明实施例还提出一种计算器可读存储介质,所述计算机可读存储介质上存储有患病风险筛查程序,所述患病风险筛查程序被处理器执行时实现如上所述的患病风险筛查方法的步骤。
本发明实施例提出的一种患病风险筛查方法、装置、设备及存储介质,通过接收病患信息问卷;将所述病患信息问卷输入预先创建的OSA患病风险筛查模型中进行风险筛查,输出筛查结果,其中,所述OSA患病风险筛查模型是针对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查模型,所述OSA患病风险筛查模型基于双核OSA筛查算法模型创建,所述双核OSA筛查算法模型包括OSA改良筛查问卷模型和OSA自动诊断模型。通过OSA患病风险筛查模型进行风险筛查,实现了阻塞性睡眠呼吸暂停通气综合征的快速筛查,并能实现远程的病情评估,及时提醒患者就诊治疗,避免错过最佳治疗时机。相较于现有技术,具有更便捷、更高效、低成本、适用范围广的优势。
附图说明
图1为本发明患病风险筛查装置所属终端设备的功能模块示意图;
图2为本发明患病风险筛查方法第一示例性实施例的流程示意图;
图3为本发明患病风险筛查方法第二示例性实施例的流程示意图;
图4为本发明患病风险筛查方法第三示例性实施例的流程示意图;
图5为本发明患病风险筛查方法第四示例性实施例的流程示意图;
图6为本发明患病风险筛查方法第五示例性实施例的流程示意图;
图7为本发明患病风险筛查方法第六示例性实施例的流程示意图;
图8为本发明患病风险筛查方法中训练OSA自动诊断模型的流程示意图;
图9为本发明患病风险筛查方法第七示例性实施例的流程示意图;
图10为本发明患病风险筛查方法第八示例性实施例的流程示意图;
图11为本发明患病风险筛查方法第九示例性实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:接收病患信息问卷;将所述病患信息问卷输入预先创建的OSA患病风险筛查模型中进行风险筛查,输出筛查结果,其中,所述OSA患病风险筛查模型是针对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查模型,所述OSA患病风险筛查模型基于双核OSA筛查算法模型创建,所述双核OSA筛查算法模型包括OSA改良筛查问卷模型和OSA自动诊断模型。通过OSA患病风险筛查模型进行风险筛查,实现了阻塞性睡眠呼吸暂停通气综合征的快速筛查,并能实现远程的病情评估,及时提醒患者就诊治疗,避免错过最佳治疗时机。由此,实现了对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查。相较于现有技术,具有更便捷、更高效、低成本、适用范围广的优势。
本发明实施例涉及的技术术语:
OSA;OSAHS;双核OSA筛查算法;Logistic回归;决策树;受试者工作特征曲线,ROC;约登指数;数据清洗;LightGBM;交叉验证。
OSA是阻塞性睡眠呼吸暂停(Obstructive Sleep Apnea)的缩写,是一种睡眠呼吸暂停的疾病。它是由于上呼吸道阻塞或狭窄而导致的呼吸暂停,在睡眠时会出现间歇性的呼吸暂停,导致缺氧和高碳酸血症,引起多种健康问题。
OSA的症状包括夜间打鼾、频繁醒来、口干、头痛、睡眠不深、白天疲劳、嗜睡等。如果不及时治疗,还会增加患上心脏疾病、高血压、糖尿病等疾病的风险。
诊断OSA通常需要进行多通道睡眠监测,检测患者的睡眠质量、呼吸状况和心血管变化等指标。根据监测结果,医生可以评估病情的严重程度,并制定相应的治疗方案。
治疗OSA的方法包括生活方式改善、口腔支架、持续气道正压通气(CPAP)等,选择的治疗方法应该根据患者的病情和健康状况来确定。在治疗过程中,患者还需要注意保持充足的睡眠和健康的生活方式,以维护口腔和上呼吸道的健康,预防并减轻OSA的发生和症状。
OSAHS是指阻塞性睡眠呼吸暂停低通气综合症(Obstructive Sleep ApneaHypopnea Syndrome),是一种常见的睡眠障碍性疾病。它的主要症状是在睡眠过程中出现反复的呼吸暂停或者低通气,导致缺氧和高碳酸血症,影响睡眠质量和生活质量。
OSAHS的主要原因是上呼吸道收缩或阻塞,导致空气无法顺畅进入肺部。常见的危险因素包括肥胖、颈部脂肪堆积、颈椎病变、鼻部畸形等。
OSAHS的诊断主要基于睡眠监测和评估。通常采用多导睡眠监测仪对患者进行夜间睡眠监测,并根据呼吸事件指数(Apnea-Hypopnea Index,AHI)来确定病情的严重程度。
OSAHS的治疗方法包括非药物治疗和药物治疗两种。非药物治疗主要是通过调整生活方式、改善睡眠环境、使用口腔或颈部支架、行为疗法等方法来缓解症状。药物治疗主要是通过使用呼吸刺激剂、催眠药物等药物来减轻症状。
对于病情较严重的患者,还可以采用持续气道正压通气(Continuous PositiveAirway Pressure,CPAP)治疗,即在睡眠时口内戴上面罩,通过压力将空气送入呼吸道,防止其闭塞和阻塞,从而达到治疗的效果。
双核OSA筛查算法,是一种用于睡眠呼吸暂停综合症(OSA)筛查的算法。其基本思路是分别利用心电信号和呼吸流量信号来判定患者是否存在OSA。
具体而言,在心电信号方面,该算法通过分析心电图数据,提取心率变异性(HRV)特征,并结合胸骨导联呼吸信号,建立了一个基于支持向量机(SVM)的分类器。该分类器可以对患者的睡眠呼吸暂停进行分类,判断其是否存在OSA。
在呼吸流量信号方面,该算法则采用了时间尺度分析方法,包括基于小波变换和分形几何分析的方法。这些方法可以有效地评估呼吸流量信号的复杂性和规律性,以及患者的呼吸模式。
将两个信号的筛查结果进行综合,可以得到一个更加准确的OSA筛查判断结果。利用双核OSA筛查算法,可以实现快速、准确地对睡眠呼吸暂停综合症进行筛查,有望为OSA的早期诊断和治疗提供重要的参考依据。
Logistic回归是一种二元分类算法,用于预测某个事件的发生概率。这种算法的基本思想是通过对输入数据进行线性组合,然后通过sigmoid函数将结果映射到[0,1]区间内,以得到事件的概率估计值。
Logistic回归的训练过程通常采用最大化似然函数的方法,即选择使样本观测到的事件概率最高的参数。在实际应用中,通常采用梯度下降等优化算法来求解最优参数。
除了二元分类问题,Logistic回归也可以推广到多元分类问题上,这时候需要引入Softmax函数来进行分类。Softmax函数可以将线性组合的结果映射为一个概率分布,从而实现多元分类。
总之,Logistic回归是一种简单但有效的分类算法,适用于二元和多元分类问题,并且易于解释和实现。因此,在许多领域中得到了广泛的应用。
决策树是一种基于树形结构的分类模型,它通过对样本数据的分析,将数据集划分为多个小的子集,并根据划分规则对样本进行分类。决策树算法适用于分类和回归问题,并且可以用于处理离散型和连续性特征的数据。
决策树的学习过程分为两个阶段,分别是决策树的生成和决策树的剪枝。
决策树的生成过程通过递归地选择最优特征作为节点,按照该特征的取值不同将数据集分成不同的子集,并以此生成一棵完整的决策树。如何选择最优特征可采用信息增益、信息增益比、基尼系数等度量指标来衡量,确保每一次划分都能让分类信息更加纯确。在实践中,可以使用CART(Classification and Regression Tree)算法等来生成决策树。
决策树的剪枝过程是为了避免决策树过拟合,即在训练集上表现良好,但在测试集上表现差的情况。决策树的剪枝过程就是通过去掉一些容易引起过拟合的节点及其分支,从而达到减小决策树复杂度,优化模型性能的目的。
决策树的优点主要包括分类速度快、准确性高、易于理解和解释等。在实际应用中,决策树算法与其它算法结合使用,构成了诸如随机森林、GBDT(Gradient BoostingDecision Tree)等强大的机器学习模型,可以应用于各种分类和回归问题中。
受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC曲线)是一种用于评价二元分类模型性能的图形化表达方法。在ROC曲线上,横坐标是1-特异度(False Positive Rate,FPR),纵坐标是灵敏度(True Positive Rate,TPR),通过调整分类模型的阈值,可以得到不同的FPR和TPR,从而得到ROC曲线。
ROC曲线的生成过程需要一个概率预测模型,该模型可以预测每个样本属于正例的概率,如逻辑回归、支持向量机等分类器。以逻辑回归为例,它会给出一个基于给定输入变量的预测概率,此时可以根据不同的阈值将预测概率转换为二元分类输出结果(0或1)。
ROC曲线的绘制过程中,先将所得到的预测概率按照从大到小进行排序,并将阈值设为预测概率最大值,此时所有样本都被判为正例,此时FPR和TPR均为1;然后将阈值逐渐减小,对每一个阈值计算相应的FPR和TPR,最终得到的ROC曲线就是FPR与TPR关系的图形表示。
ROC曲线的特点是能够有效的表示分类器的性能,并能通过曲线下面积(Areaunder the Curve,AUC)来量化分类器性能的优劣,AUC的取值范围在0.5至1之间,AUC越接近1表示分类器性能越好。ROC曲线可以帮助我们选择适当的分类器阈值,以达到更优的分类性能,同时也常被用于评价医学诊断、检测和计算机视觉等领域中的二分类模型性能。
约登指数(Jaccard Index),又称为Jaccard相似系数,是一种用于比较两个样本集合相似度的度量方法。其计算方法是将两个集合的交集大小除以它们的并集大小,即J(A,B)=|A∩B|/|A∪B|。
在机器学习任务中,约登指数可以用来衡量两组数据之间的相似度或相似程度。例如,在聚类算法中,可以使用约登指数来评价不同的聚类结果之间的相似性。此外,在文本挖掘任务中,也可以使用约登指数来比较两个文档的相似度。
值得注意的是,当集合A和集合B完全相同时,约登指数为1;当它们没有任何共同元素时,约登指数为0。因此,约登指数越高表示两个样本集合越相似,越低则表示差异越大。此外,约登指数也具有对称性,即J(A,B)=J(B,A),适用于各种类型的数据,具有广泛的应用场景。
数据清洗是指在数据处理的过程中,对于数据中存在的不完整、不规范或矛盾等问题进行检测和修正,以提高数据质量和可信度的过程。通常包括以下几个方面:
1、缺失值处理:缺失值是指在数据采集或传输过程中出现的遗漏现象。数据缺失可能会影响到数据分析的结果,需要对缺失值进行处理。处理方法包括删除缺失数据、插补式填补缺失值、模型预测法、多重插补法等。
2、异常值处理:异常值是指与其他观测值相差较大的数据点,它们可能是采集错误或者是真实存在的异常数据。对于这类数据,可以采用删除或者替换的方式进行处理。
3、重复值处理:数据集中可能存在完全相同的记录或者部分相同的记录,这些记录称为重复值。重复值会影响到数据的准确性和可靠性,需要对其进行去重处理。
4、数据格式转换:数据来自不同来源,可能存在不同数据格式的情况,如日期格式、数字格式等。在数据清洗过程中,需要将不同格式的数据统一转换成相同格式,以便后续处理。
5、数据标准化:不同数据的单位或者数值范围可能不同,需要对数据进行标准化处理,使得数据具有可比性。
数据清洗是数据处理过程中非常重要且必要的一步,只有通过有效的数据清洗方法处理好数据,才能保证后续数据分析和建模过程的可靠性和准确性。
LightGBM是一种高效的梯度提升决策树(Gradient Boosting Decision Tree,GBDT)框架。它由微软公司的工程师开发,广泛应用于机器学习,数据挖掘和推荐系统等领域。
相对于传统的GBDT算法,LightGBM具有以下优点:
1、更快的训练速度。LightGBM支持并行化训练、直方图算法、按叶子节点的增长方式等特点,使得训练速度非常快。
2、更低的内存消耗。LightGBM通过压缩特征空间的方式将特征存储在RAM中,降低了内存消耗。
3、更高的准确率。LightGBM采用了leaf-wise生长策略,该策略可更好地拟合数据分布,从而提高模型准确率。
4、更好的调参效果。LightGBM可以自动选择更好的超参数,如树的深度、学习率、特征子采样比例、正则化系数等。
LightGBM在机器学习和数据挖掘领域的应用非常广泛,可用于二分类、多分类、回归和排序等问题,尤其适用于大规模特征维度和数据量的场景,是当前流行的机器学习框架之一。
交叉验证是一种常用的机器学习模型评估方法,通常用于选择最优参数、模型比较和模型选择。它将数据集分为k个近似大小的子集,然后进行k次训练和测试,每次使用一个子集作为测试集,其余子集作为训练集。这样可以避免在仅使用一次划分时可能出现的过拟合或欠拟合问题,并且可以利用所有数据进行模型训练和测试。
常用的交叉验证方法包括:
1、简单交叉验证:将数据集随机分为训练集和测试集,然后仅使用一次划分进行模型训练和测试。
2、K折交叉验证:将数据集分为K个近似大小的子集,然后进行K次训练和测试,每次使用一个子集作为测试集,其余子集作为训练集。
3、留一交叉验证:将数据集中的每个样本单独作为测试集,其余样本作为训练集进行模型训练和测试。
4、随机交叉验证:随机从数据集中选择训练和测试样本,进行多次模型训练和测试,以避免数据集顺序引起的影响。
交叉验证可以有效地评估模型的性能和泛化能力,并且可以帮助选择最优的模型参数,提高模型的准确性和稳定性。同时,交叉验证也是机器学习中的一项基本技术,需要在实际应用时认真考虑数据集大小、分布以及训练时间等因素。
本发明实施例考虑到,使用相关技术方案针对阻塞性睡眠呼吸暂停通气综合征进行患病风险筛查时,操作复杂、检查耗时、价格昂贵,且需要专业的设备场地和技术人员,因而难以推广普及。
OSAHS目前比较普遍使用的筛查方法主要有两种,问卷量表筛查和基于各类便携式睡眠监测仪器/设备获取睡眠呼吸参数进行的筛查。
问卷量表筛查,常见量表有Berlin、STOP和STOP-Bang(SBQ)等,Epworth嗜睡量表(ESS)作为评估患者主观日间嗜睡严重程度的量表,也被作为筛选OSAHS的工具。上述量表灵敏度与特异度各有差别,量表题目数量较多,且较复杂,更重要的是,这些量表都是基于欧美人群的体质特征和生活习惯设计的,并不完全适用于中国人群,因此使用该类量表的可行性偏低,患者依从性也会影响量表结果的准确性。此外,线下常使用纸质化量表进行筛查,需要人工计算,效率较低。
便携式睡眠监测仪筛查,是利用睡眠监测仪器,通过监测记录使用者的睡眠呼吸情况的指标参数如:口鼻气流、胸腹部运动及血氧饱和度等来评估使用者患OSAHS的风险,常见的检测仪有:单通道或双通道鼻气流压力传感器(SleepView、ApneaStrip、ApneaLink)、便携式心率传感器联合手腕带型血氧检测仪和新型的睡眠监测面罩,以及使用手机的应用程序利用手机内部传感器和外部脉搏血氧计来记录睡眠期间的音频、活动、体位和氧饱和度等。相比较单纯问卷筛查,便携式仪器的监测能获取到部分睡眠呼吸参数,其对OSAHS的敏感度较高,可达94.8%~100%,特异度为60%~80%。但相较于PSG,其无法提供用于并请评估的更详细的信息,也不能排除使用者心肺疾病的影响。此外,便携式睡眠监测仪的单次使用成本较高,对于病情评估价值有限。
鉴于OSA发病率和死亡率高,对健康危害大,疾病负担重,而目前的诊断及防治水平低,特别是基层医院技术和诊疗设备均缺乏,因此,迫切需要开发适宜我国国情的高效、便捷的,适宜推广的OSA筛查评估方法与系统,以实现OSA早发现、早诊断,同时能实现病情评估及严重并发症预警,为OSA的早期、精准治疗提供科学依据,避免疾病的进展及严重并发症的发生,减少死亡率。
基于此,本发明实施例提出一种解决方案,可以实现对OSA患病风险的快速筛查,解决了对OSA的筛查操作复杂的技术问题,使对OSA的患病风险筛查更容易普及。
具体地,参照图1,图1为本发明患病风险筛查装置所属终端设备的功能板块示意图。该患病风险筛查装置可以独立于终端设备的、能够进行患病风险筛查的装置,其可以通过硬件或者软件的形式承载于终端设备上。该终端设备可以为手机、平板电脑等具有数据处理功能的智能移动设备,还可以为具有数据处理功能的固定终端设备或服务器等。
在本实施例中,该患病风险筛查装置所属终端设备至少包括输出模块110、处理器120、存储器130以及通信模块140。
存储器130中存储有操作系统以及患病风险筛查程序,患病风险筛查装置可以通过接收病患信息问卷;将所述病患信息问卷输入预先创建的OSA患病风险筛查模型中进行风险筛查,输出筛查结果,其中,所述OSA患病风险筛查模型是针对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查模型,所述OSA患病风险筛查模型基于双核OSA筛查算法模型创建,所述双核OSA筛查算法模型包括OSA改良筛查问卷模型和OSA自动诊断模型。通过该患病风险筛查程序对OSA进行患病风险筛查,选取筛查参数等信息存储于该存储器130中;输出模块110可为显示屏等。通信模块140可以包括WIFI模块、移动通信模块以及蓝牙模块等,通过通信模块140与外部设备或服务器进行通信。
其中存储器130中的患病风险筛查程序被处理器执行时实现以下步骤:
接收病患信息问卷;
将所述病患信息问卷输入预先创建的OSA患病风险筛查模型中进行风险筛查,输出筛查结果,其中,所述OSA患病风险筛查模型是针对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查模型,所述OSA患病风险筛查模型基于双核OSA筛查算法模型创建,所述双核OSA筛查算法模型包括OSA改良筛查问卷模型和OSA自动诊断模型。
进一步地,存储器130中的患病风险筛查程序被处理器执行时还实现以下步骤:
基于所述双核OSA筛查算法模型,创建所述OSA患病风险筛查模型。
进一步地,存储器130中的患病风险筛查程序被处理器执行时还实现以下步骤:
建立OSA病患研究队列,收集所述OSA病患研究队列的筛查数据;
根据所述筛查数据,创建所述OSA改良筛查问卷模型;
根据所述筛查数据,训练所述OSA自动诊断模型。
进一步地,存储器130中的患病风险筛查程序被处理器执行时还实现以下步骤:
获取所述OSA病患研究队列的诊断信息;
根据所述筛查数据和所述诊断信息,获取所述第一筛查参数;
根据所述第一筛查参数,建立所述OSA改良筛查问卷模型。
进一步地,存储器130中的患病风险筛查程序被处理器执行时还实现以下步骤:
根据所述第一筛查参数,获取筛查指标,所述筛查指标包括性别、年龄、体质指数、打鼾、呼吸暂停、嗜睡、高血压、糖尿病、冠心病、脑血管疾病及鼻咽部疾病中的一种或几种;
基于受试者工作特征曲线和约登指数,分析所述筛查指标中年龄和体质指数的截断值;
基于多元Logistic回归分析和所述受试者工作特征曲线,对所述筛查指标和所述截断值进行筛选,得到目标筛选指标和目标截断值;
根据所述目标筛选指标和所述目标截断值,建立所述OSA改良筛查问卷模型。
进一步地,存储器130中的患病风险筛查程序被处理器执行时还实现以下步骤:
对所述筛查数据进行数据清洗,获得训练数据,所述训练数据包括训练集数据、验证集数据、测试集数据;
基于LightGBM算法模型,对所述训练集数据进行训练;
基于交叉验证,通过所述验证集数据对训练后的所述OSA自动诊断模型进行验证,获取最优验证模型;
通过所述最优验证模型,对所述测试集数据进行预测并调整参数,获取所述OSA自动诊断模型。
进一步地,存储器130中的患病风险筛查程序被处理器执行时还实现以下步骤:
将所述病患信息问卷输入所述OSA患病风险筛查模型;
根据所述病患信息问卷,获取第二筛查参数;
将所述第二筛查参数输入所述双核OSA筛查算法模型进行筛查,得到所述筛查结果并输出。
进一步地,存储器130中的患病风险筛查程序被处理器执行时还实现以下步骤:
基于所述OSA改良筛查问卷模型,输出OSA患病风险等级及就诊建议;
基于所述OSA自动诊断模型,输出OSA患病风险概率。
进一步地,存储器130中的患病风险筛查程序被处理器执行时还实现以下步骤:
通过所述OSA改良筛查问卷模型,生成OSA改良筛查问卷,所述OSA改良筛查问卷包括若干题目,每道题目对应一个衡量指标;
根据所述第二筛查参数,获取衡量指标数据;
根据所述衡量指标数据,为每个所述衡量指标赋予权重分数;
将所有所述衡量指标的权重分数相加,得到OSA改良筛查问卷的总分值;
根据所述OSA改良筛查问卷的总分值,输出所述OSA患病风险等级及就诊建议。
本实施例通过上述方案,具体通过接收病患信息问卷;将所述病患信息问卷输入预先创建的OSA患病风险筛查模型中进行风险筛查,输出筛查结果,其中,所述OSA患病风险筛查模型是针对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查模型,所述OSA患病风险筛查模型基于双核OSA筛查算法模型创建,所述双核OSA筛查算法模型包括OSA改良筛查问卷模型和OSA自动诊断模型。通过OSA患病风险筛查模型进行风险筛查,实现了阻塞性睡眠呼吸暂停通气综合征的快速筛查,并能实现远程的病情评估,及时提醒患者就诊治疗,避免错过最佳治疗时机。由此,实现了对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查。相较于现有技术,具有更便捷、更高效、低成本、适用范围广的优势。
基于上述终端设备架构但不限于上述架构,提出本发明方法实施例。
参照图2,图2为本发明患病风险筛查方法第一示例性实施例的流程示意图。所述患病风险筛查方法包括:
步骤S101,接收病患信息问卷;
本实施例方法的执行主体是一种患病风险筛查系统,还可以是一种患病风险筛查装置,也可以是一种患病风险筛查设备,本实施例以患病风险筛查装置进行举例,该患病风险筛查装置可以集成在具有数据处理功能的设备上。
为了解决当前对OSA进行风险筛查效率低下的问题,提高OSA的筛查效率显得尤为重要,为了实现对OSA患病风险的快速筛查,采取以下步骤实现:
首先,设置特殊的患病风险筛查装置集成在具有数据处理功能的设备上,通过患病风险筛查装置能对OSA进行患病风险筛查。
最后,通过患病风险筛查装置,接收关于OSA疑似患者的生理信息问卷。
其中,生理信息主要包括OSA疑似患者的体征信息、睡眠情况信息如打鼾、嗜睡、呼吸暂停,以及其他疾病信息如,高血压。
步骤S102,将所述病患信息问卷输入预先创建的OSA患病风险筛查模型中进行风险筛查,输出筛查结果,其中,所述OSA患病风险筛查模型是针对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查模型,所述OSA患病风险筛查模型基于双核OSA筛查算法模型创建,所述双核OSA筛查算法模型包括OSA改良筛查问卷模型和OSA自动诊断模型。
首先,将OSA疑似患者的生理信息问卷输入到预先创建的OSA患病风险筛查模型;
最后,根据OSA疑似患者的生理信息,通过双核OSA筛查算法模型,输出OSA疑似患者的筛查结果。
其中,OSA患病风险筛查模型是针对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查模型,OSA患病风险筛查模型基于双核OSA筛查算法模型创建,双核OSA筛查算法模型包括OSA改良筛查问卷模型和OSA自动诊断模型,筛查结果包括OSA患病风险概率、OSA患病风险等级及就诊建议。
本实施例通过上述方案,具体通过接收病患信息问卷;将所述病患信息问卷输入预先创建的OSA患病风险筛查模型中进行风险筛查,输出筛查结果,其中,所述OSA患病风险筛查模型是针对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查模型,所述OSA患病风险筛查模型基于双核OSA筛查算法模型创建,所述双核OSA筛查算法模型包括OSA改良筛查问卷模型和OSA自动诊断模型。通过OSA患病风险筛查模型进行风险筛查,实现了阻塞性睡眠呼吸暂停通气综合征的快速筛查,并能实现远程的病情评估,及时提醒患者就诊治疗,避免错过最佳治疗时机。由此,实现了对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查。相较于现有技术,具有更便捷、更高效、低成本、适用范围广的优势。
参照图3,图3为本发明患病风险筛查方法第二示例性实施例的流程示意图。
基于上述图2所示的实施例,所述步骤S101,接收病患信息问卷之前包括:
步骤S001,基于所述双核OSA筛查算法模型,创建所述OSA患病风险筛查模型。
具体地,在接收OSA疑似患者的生理信息问卷之前,先创建OSA患病风险筛查模型,采取以下步骤实现:
首先,患病风险筛查装置接收大量的与OSA相关的病例数据;
然后,患病风险筛查装置对接收到的病例数据进行特征处理;
最后,患病风险筛查装置将特征处理后的病例数据输入双核OSA筛查算法模型,进行模型训练。
其中,双核OSA筛查算法模型包括OSA改良筛查问卷模型和OSA自动诊断模型,病例数据包括睡眠监测数据、生理指标数据等。
本实施例通过上述方案,具体通过基于所述双核OSA筛查算法模型,创建所述OSA患病风险筛查模型。通过双核OSA筛查算法模型,创建了OSA患病风险筛查模型。由此,建立了OSA患病风险筛查模型,为后续的OSA患病风险筛查提供了支持。
参照图4,图4为本发明患病风险筛查方法第三示例性实施例的流程示意图。
基于上述图3所示的实施例,所述步骤S001,基于所述双核OSA筛查算法模型,创建所述OSA患病风险筛查模型包括:
步骤S0011,建立OSA病患研究队列,收集所述OSA病患研究队列的筛查数据;
步骤S0012,根据所述筛查数据,创建所述OSA改良筛查问卷模型;
步骤S0013,根据所述筛查数据,训练所述OSA自动诊断模型。
具体地,在接收OSA疑似患者的生理信息问卷之前,收集筛查数据,创建OSA改良筛查问卷模型,训练OSA自动诊断模型,采取以下步骤实现:
首先,患病风险筛查装置通过OSA患病风险筛查模型建立OSA疑似患者研究队列,回归性收集OSA疑似患者研究队列的基本生理信息,得到筛查数据;
其次,患病风险筛查装置将筛查数据输入到双核OSA筛查算法模型中,并对筛查数据进行分析,建立OSA改良筛查问卷模型;
最后,患病风险筛查装置通过筛查数据,训练OSA自动诊断模型。
其中,OSA病患研究队列的筛查数据包括:1)人口学特征:年龄、性别、身高、体重;(2)既往史:高血压、糖尿病、心脑血管疾病、鼻咽部疾病等相关病史;(3)OSA相关症状,如响亮的喊声(大于说话声音,或者隔着房门能听到)、呼吸暂停(被目击)、嗜睡(白天疲倦和打瞌睡)等症状。
本实施例通过上述方案,具体通过建立OSA病患研究队列,收集所述OSA病患研究队列的筛查数据;根据所述筛查数据,创建所述OSA改良筛查问卷模型;根据所述筛查数据,训练所述OSA自动诊断模型。通过收集OSA病患研究队列的筛查数据,建立了OSA改良筛查问卷模型,训练了OSA自动诊断模型。由此,建立了OSA患病风险筛查模型,为后续的OSA患病风险筛查提供了支持。
参照图5,图5为本发明患病风险筛查方法第四示例性实施例的流程示意图。
基于上述图4所示的实施例,所述步骤S0012,根据所述筛查数据,创建所述OSA改良筛查问卷模型包括:
步骤S00121,获取所述OSA病患研究队列的诊断信息;
步骤S00122,根据所述筛查数据和所述诊断信息,获取所述第一筛查参数;
步骤S00123,根据所述第一筛查参数,建立所述OSA改良筛查问卷模型。
具体地,在得到筛查数据后,接收OSA病患研究队列的诊断信息,根据筛查数据和诊断信息建立OSA改良筛查问卷模型,采取以下步骤实现:
首先,患病风险筛查装置通过OSA患病风险筛查模型接收OSA疑似患者研究队列的整夜PSG诊断记录,获取OSA疑似患者研究队列的诊断信息;
其次,患病风险筛查装置对筛查数据和诊断数据进行统计学分析,获取建立OSA改良筛查问卷模型所需的第一筛查参数;
最后,患病风险筛查装置对第一筛查参数进行数据处理,建立OSA改良筛查问卷模型。
其中,整夜PSG诊断记录依据“阻塞性睡眠呼吸暂停低通气综合征诊治指南”得出。
本实施例通过上述方案,具体通过获取所述OSA病患研究队列的诊断信息;根据所述筛查数据和所述诊断信息,获取所述第一筛查参数;根据所述第一筛查参数,建立所述OSA改良筛查问卷模型。根据OSA病患研究队列的筛查数据和诊断信息,建立OSA改良筛查问卷模型。由此,完善了OSA患病风险筛查模型的部分框架,为后续的OSA患病风险筛查提供了支持。
参照图6,图6为本发明患病风险筛查方法第五示例性实施例的流程示意图。
基于上述图5所示的实施例,所述步骤S00123,根据所述第一筛查参数,建立所述OSA改良筛查问卷模型包括:
步骤S001231,根据所述第一筛查参数,获取筛查指标,所述筛查指标包括性别、年龄、体质指数、打鼾、呼吸暂停、嗜睡、高血压、糖尿病、冠心病、脑血管疾病及鼻咽部疾病中的一种或几种;
步骤S001232,基于受试者工作特征曲线和约登指数,分析所述筛查指标中年龄和体质指数的截断值;
步骤S001233,基于多元Logistic回归分析和所述受试者工作特征曲线,对所述筛查指标和所述截断值进行筛选,得到目标筛选指标和目标截断值;
步骤S001234,根据所述目标筛选指标和所述目标截断值,建立所述OSA改良筛查问卷模型。
具体地,对第一筛查参数进行数据处理,建立OSA改良筛查问卷模型,采取以下步骤实现:
首先,患病风险筛查装置对第一筛查参数进行统计学分析,纳入若干项筛查变量;
然后,患病风险筛查装置通过logistic回归分析得出上述筛查变量的比值比(OR),并选取具有统计学意义的筛查变量作为筛查指标;
然后,患病风险筛查装置使用受试者工作特征曲线(ROC)及约登指数分析年龄及体质指数的截断值;
然后,患病风险筛查装置通过多元logistic回归分析得出筛查指标调整后的OR值,并根据权重进行相应的赋分,获得目标筛查指标;
然后,患病风险筛查装置通过ROC曲线对筛查模型进行评估,根据敏感度及特异度选取筛查OSA的截断值,获取目标截断值;
最后,根据确定有显著统计学意义的目标筛选指标和目标截断值,建立改良筛查问卷模型。
其中,筛查指标包括性别、年龄、体质指数、打鼾、呼吸暂停、嗜睡、高血压、糖尿病、冠心病、脑血管疾病及鼻咽部疾病中的一种或几种。
本实施例通过上述方案,具体通过根据所述第一筛查参数,获取筛查指标,所述筛查指标包括性别、年龄、体质指数、打鼾、呼吸暂停、嗜睡、高血压、糖尿病、冠心病、脑血管疾病及鼻咽部疾病中的一种或几种;基于受试者工作特征曲线和约登指数,分析所述筛查指标中年龄和体质指数的截断值;基于多元Logistic回归分析和所述受试者工作特征曲线,对所述筛查指标和所述截断值进行筛选,得到目标筛选指标和目标截断值;根据所述目标筛选指标和所述目标截断值,建立所述OSA改良筛查问卷模型。根据第一筛查参数,建立OSA改良筛查问卷模型。由此,完善了OSA患病风险筛查模型的部分框架,为后续的OSA患病风险筛查提供了支持。
参照图7,图7为本发明患病风险筛查方法第六示例性实施例的流程示意图。
基于上述图4所示的实施例,所述步骤S0013,根据所述筛查数据,训练所述OSA自动诊断模型包括:
步骤S00131,对所述筛查数据进行数据清洗,获得训练数据,所述训练数据包括训练集数据、验证集数据、测试集数据;
步骤S00132,基于LightGBM算法模型,对所述训练集数据进行训练;
步骤S00133,基于交叉验证,通过所述验证集数据对训练后的所述OSA自动诊断模型进行验证,获取最优验证模型;
步骤S00134,通过所述最优验证模型,对所述测试集数据进行预测并调整参数,获取所述OSA自动诊断模型。
具体地,在得到筛查数据后,对筛查数据进行进一步数据处理,根据进一步书处理后的筛查数据训练得出OSA自动诊断模型,采取以下步骤实现:
首先,患病风险筛查装置对筛查数据进行数据清洗,去除不必要的信息和异常值,以保留有效的特征和样本,得到训练数据;
其次,患病风险筛查装置将训练数据划分成训练集数据、验证集数据、测试集数据三部分;
然后,患病风险筛查装置通过基于决策树的LightGBM算法模型,利用增量算法和直方图技术等对训练集数据进行训练,有效处理训练集数据;
然后,患病风险筛查装置采用交叉验证方法,利用验证集数据对训练后的所述OSA自动诊断模型进行验证,解决过拟合和欠拟合的问题,得到最优验证模型;
最后,患病风险筛查装置通过最优验证模型对测试集数据进行预测并评估模型的性能和泛化能力,如果模型的性能不佳,则需要重新调整参数和优化模型,直到得到满意的结果,获取OSA自动诊断模型。
其中,数据清洗包括统一数据记录格式、对空缺特征值进行插补等。
参照图8,图8为本发明患病风险筛查方法中训练OSA自动诊断模型的流程示意图。
以筛查数据是临床受试者数据为例。
首先,患病风险筛查装置收集临床受试者数据;
其次,患病风险筛查装置对临床受试者数据进行数据清洗,如统一数据记录格式、对空缺特征值进行插补,得到训练数据;
然后,患病风险筛查装置将训练数据划分成训练集数据、验证集数据、测试集数据三部分;
然后,患病风险筛查装置选择LightGBM作为基础模型对训练集数据进行训练;
然后,采用验证集数据,使用交叉验证对模型进行验证,保存验证集上ROC-AUC表现最好的模型;
最后,得到表现最好的模型后,再用该模型对测试集上的数据进行预测。最终不断调整参数,得到最优预测模型,即OSA自动诊断模型。
其中,临床受试者数据包括:1)人口学特征:年龄、性别、身高、体重;(2)既往史:高血压、糖尿病、心脑血管疾病、鼻咽部疾病等相关病史;(3)OSA相关症状,如响亮的喊声(大于说话声音,或者隔着房门能听到)、呼吸暂停(被目击)、嗜睡(白天疲倦和打瞌睡)等症状。既往史及OSA相关症状以“有”或“无”作答。临床受试者数据为患者能够自我报告的OSA危险因素,是用于构建初步筛查模型的初始变量。
本实施例通过上述方案,具体通过对所述筛查数据进行数据清洗,获得训练数据,所述训练数据包括训练集数据、验证集数据、测试集数据;基于LightGBM算法模型,对所述训练集数据进行训练;基于交叉验证,通过所述验证集数据对训练后的所述OSA自动诊断模型进行验证,获取最优验证模型;通过所述最优验证模型,对所述测试集数据进行预测并调整参数,获取所述OSA自动诊断模型。根据第一筛查参数,训练得到了OSA自动诊断模型。由此,完善了OSA患病风险筛查模型的部分框架,为后续的OSA患病风险筛查提供了支持。
参照图9,图9为本发明患病风险筛查方法第七示例性实施例的流程示意图。
基于上述图2所示的实施例,所述步骤S102,将所述病患信息问卷输入预先创建的OSA患病风险筛查模型中进行风险筛查,输出筛查结果,其中,所述OSA患病风险筛查模型是针对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查模型,所述OSA患病风险筛查模型基于双核OSA筛查算法模型创建,所述双核OSA筛查算法模型包括OSA改良筛查问卷模型和OSA自动诊断模型包括:
步骤S1021,将所述病患信息问卷输入所述OSA患病风险筛查模型;
步骤S1022,根据所述病患信息问卷,获取第二筛查参数;
步骤S1023,将所述第二筛查参数输入所述双核OSA筛查算法模型进行筛查,得到所述筛查结果并输出。
具体地,在接收病患信息问卷后,对病患信息问卷中的数据进行预处理,获取第二筛查参数,并根据第二筛查参数获取筛查结果,采取以下步骤实现:
首先,患病风险筛查装置将接收到的病患信息问卷输入到OSA患病风险筛查模型中;
其次,患病风险筛查装置通过OSA患病风险筛查模型,提取OSA疑似患者的生理信息,并对OSA疑似患者的生理信息进行处理,获取第二筛查参数;
最后,OSA患病风险筛查模型将第二筛查参数输入到双核OSA筛查算法模型中进行筛查,通过双核OSA筛查算法模型中的OSA改良筛查问卷模型和OSA自动诊断模型,得到筛查结果并输出。
其中,筛查结果包括OSA患病风险概率、OSA患病风险等级及就诊建议。
本实施例通过上述方案,具体通过将所述病患信息问卷输入所述OSA患病风险筛查模型;根据所述病患信息问卷,获取第二筛查参数;将所述第二筛查参数输入所述双核OSA筛查算法模型进行筛查,得到所述筛查结果并输出。通过OSA患病风险筛查模型进行风险筛查,实现了阻塞性睡眠呼吸暂停通气综合征的快速筛查,并能实现远程的病情评估,及时提醒患者就诊治疗,避免错过最佳治疗时机。由此,实现了对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查。相较于现有技术,具有更便捷、更高效、低成本、适用范围广的优势。
参照图10,图10为本发明患病风险筛查方法第八示例性实施例的流程示意图。
基于上述图9所示的实施例,所述步骤S1023,将所述第二筛查参数输入所述双核OSA筛查算法模型进行筛查,得到所述筛查结果并输出包括:
步骤S10231,基于所述OSA改良筛查问卷模型,输出OSA患病风险等级及就诊建议;
步骤S10232,基于所述OSA自动诊断模型,输出OSA患病风险概率。
具体地,在得到第二筛查参数后,患病风险筛查装置通过OSA改良筛查问卷模型和OSA自动诊断模型,得出OSA患病风险概率、OSA患病风险等级及就诊建议,采取以下步骤实现:
首先,双核OSA筛查算法模型将第二筛查参数输入到OSA改良筛查问卷模型中,并对第二筛查参数进行处理,获取OSA患病风险等级及就诊建议;
最后,双核OSA筛查算法模型将第二筛查参数输入到OSA自动诊断模型中,并对第二筛查参数进行处理,获取OSA患病风险概率。
其中,筛查结果包括OSA患病风险概率、OSA患病风险等级及就诊建议。OSA患病风险概率以百分比的计算结果进行提示;OSA患病风险等级根据总分情况分为低风险、高风险与极高风险,对应分值与提示。
本实施例通过上述方案,具体通过基于所述OSA改良筛查问卷模型,输出OSA患病风险等级及就诊建议;基于所述OSA自动诊断模型,输出OSA患病风险概率。通过OSA改良筛查问卷模型和OSA自动诊断模型,得到了筛查结果,实现了阻塞性睡眠呼吸暂停通气综合征的快速筛查,并能实现远程的病情评估,及时提醒患者就诊治疗,避免错过最佳治疗时机。由此,实现了对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查。相较于现有技术,具有更便捷、更高效、低成本、适用范围广的优势。
参照图11,图11为本发明患病风险筛查方法第九示例性实施例的流程示意图。
基于上述图10所示的实施例,所述步骤S10231,基于所述OSA改良筛查问卷模型,输出OSA患病风险等级及就诊建议包括:
步骤S102311,通过所述OSA改良筛查问卷模型,生成OSA改良筛查问卷,所述OSA改良筛查问卷包括若干题目,每道题目对应一个衡量指标;
步骤S102312,根据所述第二筛查参数,获取衡量指标数据;
步骤S102313,根据所述衡量指标数据,为每个所述衡量指标赋予权重分数;
步骤S102314,将所有所述衡量指标的权重分数相加,得到OSA改良筛查问卷的总分值;
步骤S102315,根据所述OSA改良筛查问卷的总分值,输出所述OSA患病风险等级及就诊建议。
具体地,在得到第二筛查参数后,患病风险筛查装置通过OSA改良筛查问卷模型,得出OSA患病风险等级及就诊建议,采取以下步骤实现:
首先,双核OSA筛查算法模型将第二筛查参数输入到OSA改良筛查问卷模型中;
其次,患病风险筛查模型通过OSA改良筛查问卷模型,生成OSA改良筛查问卷;
然后,OSA改良筛查问卷模型根据OSA改良筛查问卷中的衡量指标,对第二筛查指数进行筛查,获取筛查指标数据;
然后,OSA改良筛查问卷模型利用预设条件,根据衡量指标数据,为每个衡量指标赋予权重分数;
然后,OSA改良筛查问卷模型将所有衡量指标的权重分数相加,得到OSA改良筛查问卷的总分值;
最后,OSA改良筛查问卷模型利用预设条件,根据OSA改良筛查问卷的总分值,输出OSA患病风险等级及就诊建议。
其中,OSA患病风险等级根据总分情况分为低风险、高风险与极高风险,对应分值与提示。
例如,OSA患病风险等级和就诊建议可以设为;
若总得分<13.5分,OSA风险为低风险,建议无需行PSG明确诊断;
若13.5分≤总得分<14.5分,OSA风险为高风险,建议行PSG明确诊断;
若总得分≥14.5分,OSA风险为极高风险,则强烈建议行PSG明确诊断。
对改良筛查问卷模型与GOAL问卷的筛查效果进行比较,主要采用ROC曲线进行比较分析,结果表明改良筛查问卷选取的筛查截断值与GOLA相比,具有良好的敏感度、特异度以及约登指数的综合表现。
本实施例通过上述方案,具体通过所述OSA改良筛查问卷模型,生成OSA改良筛查问卷,所述OSA改良筛查问卷包括若干题目,每道题目对应一个衡量指标;根据所述第二筛查参数,获取衡量指标数据;根据所述衡量指标数据,为每个所述衡量指标赋予权重分数;将所有所述衡量指标的权重分数相加,得到OSA改良筛查问卷的总分值;根据所述OSA改良筛查问卷的总分值,输出所述OSA患病风险等级及就诊建议。通过OSA改良筛查问卷模型,得出了OSA患病风险等级及就诊建议。由此,得到了OSA患病风险筛查的部分结果,为对阻塞性睡眠呼吸暂停通气综合征的筛查和诊断提供了支持。
此外,本发明还提供一种患病风险筛查装置,所述患病风险筛查装置包括:
接收模块,接收病患信息问卷;
筛查模块,将所述病患信息问卷输入预先创建的OSA患病风险筛查模型中进行风险筛查,输出筛查结果,其中,所述OSA患病风险筛查模型是针对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查模型,所述OSA患病风险筛查模型基于双核OSA筛查算法模型创建,所述双核OSA筛查算法模型包括OSA改良筛查问卷模型和OSA自动诊断模型。
本实施例实现患病风险筛查的原理请参照上述各实施例,在此不再赘述。
此外,本发明实施例还提出一种终端设备,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的患病风险筛查程序,所述患病风险筛查程序被所述处理器执行时实现如上所述的患病风险筛查方法的步骤。
由于患病风险筛查程序被处理器执行时,采用了前述所有实施例的全部技术方案,因此至少具有前述所有实施例的全部技术方案所带来的所有有益效果,在此不再一一赘述。
本发明实施例还提出一种计算器可读存储介质,所述计算机可读存储介质上存储有患病风险筛查程序,所述患病风险筛查程序被处理器执行时实现如上所述的患病风险筛查方法的步骤。
由于本患病风险筛查程序被处理器执行时,采用了前述所有实施例的全部技术方案,因此至少具有前述所有实施例的全部技术方案所带来的所有有益效果,在此不再一一赘述。
相比现有技术,本发明实施例提出的患病风险筛查方案,通过接收病患信息问卷;将所述病患信息问卷输入预先创建的OSA患病风险筛查模型中进行风险筛查,输出筛查结果,其中,所述OSA患病风险筛查模型是针对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查模型,所述OSA患病风险筛查模型基于双核OSA筛查算法模型创建,所述双核OSA筛查算法模型包括OSA改良筛查问卷模型和OSA自动诊断模型。从而解决了现有的对阻塞性睡眠呼吸暂停通气综合征进行患病风险筛查效率低下的问题。基于本发明方案,从真实世界对阻塞性睡眠呼吸暂停通气综合征进行患病风险筛查效率太低的问题出发,设计了一种患病风险筛查方案,并在基于双核OSA筛查算法模型的OSA患病风险筛查模型上验证了本发明的患病风险筛查方法的有效性,最后经过本发明方法对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查效率更高。
和现有的技术相比,本发明实施例方案具有以下优点:
1、实现了OSA患病风险的快速筛查。
2、更便捷,无需专业技术人员操作。
3、低成本,无需专业场地或设备。
4、适合在各级医疗机构推广普及。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,被控终端,或者网络设备等)执行本发明每个实施例的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种患病风险筛查方法,其特征在于,所述患病风险筛查方法包括以下步骤:
接收病患信息问卷;
将所述病患信息问卷输入预先创建的OSA患病风险筛查模型中进行风险筛查,输出筛查结果,其中,所述OSA患病风险筛查模型是针对阻塞性睡眠呼吸暂停通气综合征的患病风险筛查模型,所述OSA患病风险筛查模型基于双核OSA筛查算法模型创建,所述双核OSA筛查算法模型包括OSA改良筛查问卷模型和OSA自动诊断模型。
2.如权利要求1所述的患病风险筛查方法,其特征在于,所述接收病患信息问卷的步骤之前,还包括:
基于所述双核OSA筛查算法模型,创建所述OSA患病风险筛查模型;具体包括:
建立OSA病患研究队列,收集所述OSA病患研究队列的筛查数据;
根据所述筛查数据,创建所述OSA改良筛查问卷模型;
根据所述筛查数据,训练所述OSA自动诊断模型。
3.如权利要求2所述的患病风险筛查方法,其特征在于,所述根据所述筛查数据,创建所述OSA改良筛查问卷模型的步骤包括:
获取所述OSA病患研究队列的诊断信息;
根据所述筛查数据和所述诊断信息,获取第一筛查参数;
根据所述第一筛查参数,建立所述OSA改良筛查问卷模型。
4.如权利要求3所述的患病风险筛查方法,其特征在于,所述根据所述第一筛查参数,建立所述OSA改良筛查问卷模型步骤包括:
根据所述第一筛查参数,获取筛查指标,所述筛查指标包括性别、年龄、体质指数、打鼾、呼吸暂停、嗜睡、高血压、糖尿病、冠心病、脑血管疾病及鼻咽部疾病中的一种或几种;
基于受试者工作特征曲线和约登指数,分析所述筛查指标中年龄和体质指数的截断值;
基于多元Logistic回归分析和所述受试者工作特征曲线,对所述筛查指标和所述截断值进行筛选,得到目标筛选指标和目标截断值;
根据所述目标筛选指标和所述目标截断值,建立所述OSA改良筛查问卷模型。
5.如权利要求2所述的患病风险筛查方法,其特征在于,所述根据所述筛查数据,训练所述OSA自动诊断模型的步骤包括:
对所述筛查数据进行数据清洗,获得训练数据,所述训练数据包括训练集数据、验证集数据、测试集数据;
基于LightGBM算法模型,对所述训练集数据进行训练;
基于交叉验证,通过所述验证集数据对训练后的所述OSA自动诊断模型进行验证,获取最优验证模型;
通过所述最优验证模型,对所述测试集数据进行预测并调整参数,获取所述OSA自动诊断模型。
6.如权利要求1所述的患病风险筛查方法,其特征在于,所述将所述病患信息问卷输入预先创建的OSA患病风险筛查模型中进行风险筛查,得到筛查结果的步骤包括:
将所述病患信息问卷输入所述OSA患病风险筛查模型;
根据所述病患信息问卷,获取第二筛查参数;
将所述第二筛查参数输入所述双核OSA筛查算法模型进行筛查,得到所述筛查结果并输出。
7.如权利要求6所述的患病风险筛查方法,其特征在于,所述将所述第二筛查参数输入所述双核OSA筛查算法模型进行筛查,得到所述筛查结果并输出的步骤包括:
基于所述OSA改良筛查问卷模型,输出OSA患病风险等级及就诊建议;
基于所述OSA自动诊断模型,输出OSA患病风险概率。
8.如权利要求7所述的患病风险筛查方法,其特征在于,所述基于所述OSA改良筛查问卷模型,输出OSA患病风险等级及就诊建议的步骤包括:
通过所述OSA改良筛查问卷模型,生成OSA改良筛查问卷,所述OSA改良筛查问卷包括若干题目,每道题目对应一个衡量指标;
根据所述第二筛查参数,获取衡量指标数据;
根据所述衡量指标数据,为每个所述衡量指标赋予权重分数;
将所有所述衡量指标的权重分数相加,得到OSA改良筛查问卷的总分值;
根据所述OSA改良筛查问卷的总分值,输出所述OSA患病风险等级及就诊建议。
9.一种终端设备,其特征在于,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的患病风险筛查程序,所述患病风险筛查程序被所述处理器执行时实现如权利要求1-8中任一项所述的患病风险筛查方法的步骤。
10.一种计算器可读存储介质,其特征在于,所述计算机可读存储介质上存储有患病风险筛查程序,所述患病风险筛查程序被处理器执行时实现如权利要求1-8中任一项所述的患病风险筛查方法的步骤。
CN202311010156.3A 2023-08-10 2023-08-10 患病风险筛查方法、设备及存储介质 Pending CN117153412A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311010156.3A CN117153412A (zh) 2023-08-10 2023-08-10 患病风险筛查方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311010156.3A CN117153412A (zh) 2023-08-10 2023-08-10 患病风险筛查方法、设备及存储介质

Publications (1)

Publication Number Publication Date
CN117153412A true CN117153412A (zh) 2023-12-01

Family

ID=88907127

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311010156.3A Pending CN117153412A (zh) 2023-08-10 2023-08-10 患病风险筛查方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117153412A (zh)

Similar Documents

Publication Publication Date Title
JP5388580B2 (ja) ヒトの健康に関する残差ベースの管理
JP2021524958A (ja) 呼吸器系の音に基づく呼吸状態の管理
CN106714682B (zh) 用于评估加重和/或入院的风险的装置、系统、方法和计算机程序
US20190076098A1 (en) Artificial Neural Network Based Sleep Disordered Breathing Screening Tool
Andres-Blanco et al. Assessment of automated analysis of portable oximetry as a screening test for moderate-to-severe sleep apnea in patients with chronic obstructive pulmonary disease
JP2023536514A (ja) 使用者の睡眠環境で測定されたデータに基づいて睡眠状態を予測するためのコンピューティング装置
WO2018158430A1 (en) Method for providing a wearable device, method for predicting an acute exacerbation and system for predicting an acute exacerbation
Li et al. A deep learning-based algorithm for detection of cortical arousal during sleep
Banfi et al. Efficient embedded sleep wake classification for open-source actigraphy
WO2017083735A1 (en) System and methods for extubation device utilization following liberation from mechanical ventilation
Zhang et al. Auto-annotating sleep stages based on polysomnographic data
Juang et al. Explainable fuzzy neural network with easy-to-obtain physiological features for screening obstructive sleep apnea-hypopnea syndrome
US20240038383A1 (en) Health Monitoring System
Wu et al. Developing and evaluating a machine-learning-based algorithm to predict the incidence and severity of ARDS with continuous non-invasive parameters from ordinary monitors and ventilators
WO2019075520A1 (en) INDICATOR OF RESPIRATORY CONDITION
Mendonça et al. A method for sleep quality analysis based on CNN ensemble with implementation in a portable wireless device
AU2021363110A1 (en) Method and system for personalized prediction of infection and sepsis
CN116739037A (zh) 具有人格特征的人格模型构建方法及装置
Karimi Moridani An automated method for sleep apnoea detection using HRV
Sarlabous et al. Development and validation of a sample entropy-based method to identify complex patient-ventilator interactions during mechanical ventilation
Wang et al. Method of non-invasive parameters for predicting the probability of early in-hospital death of patients in intensive care unit
Abineza et al. A machine-learning-based prediction method for easy COPD classification based on pulse oximetry clinical use
WO2022272057A1 (en) Devices, systems, and methods for mental health assessment
CN117153412A (zh) 患病风险筛查方法、设备及存储介质
Xie et al. Prediction of chronic obstructive pulmonary disease exacerbation using physiological time series patterns

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination