CN111599465A - 儿童社区获得性肺炎病原学类型预测方法、装置、终端及介质 - Google Patents
儿童社区获得性肺炎病原学类型预测方法、装置、终端及介质 Download PDFInfo
- Publication number
- CN111599465A CN111599465A CN202010402593.XA CN202010402593A CN111599465A CN 111599465 A CN111599465 A CN 111599465A CN 202010402593 A CN202010402593 A CN 202010402593A CN 111599465 A CN111599465 A CN 111599465A
- Authority
- CN
- China
- Prior art keywords
- count
- model
- blood cell
- etiology
- acquired pneumonia
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本申请提供儿童社区获得性肺炎病原学类型预测方法、装置、终端及介质,旨在利用医院临床数据,对儿童社区获得性肺炎(childhood community‑acquired pneumonia,CAP)患者的特征数据和诊疗数据进行模型训练分析,根据提取的临床数据建立病原体预测的多分类机器学习模型,对不同的分析结果匹配不同的感染源集分类,即对病毒、支原体、细菌及百日咳感染源进行分类,并将这一模型通过接口调用的方式与相应的产品页面结合,从而将病原感染源预测信息恰当、高效地传递给医生用户,以利用机器学习实现智能分诊,针对不同病原合理用药。通过构建这样的一整套病原预测系统,可以给予年资较浅的临床医生更多的临床诊疗支持,减少抗生素滥用的发生,提高合理用药管理。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及儿童社区获得性肺炎病原学类型预测方法、装置、终端及介质。
背景技术
儿童社区获得性肺炎(childhood community-acquired pneumonia,CAP)是一种高发且严重的儿科疾病,威胁儿童健康和生命。据统计,全世界有超过95%的儿童患肺炎,并且在部分发展中国家有99%的儿童肺炎患者继发死亡。
不同地区和人群病原谱分布具有显著差异性,在广谱抗生素的使用过程中,细菌的耐药性不断增加,且多重耐药也呈上升趋势。例如:肺炎链球菌和其他病原体之间对大环内酯类药物的耐药性增加,导致疾病负担增加,人口结构发生变化,合并症的患病率更高。因此,鉴定不同感染源的肺炎对于减少抗生素滥用有很重要的临床意义,同时有助于个体化治疗策略的开展,从而达到有效管理、合理用药的目的。
然,过往的研究多集中于具体某类病原体相关的风险因素分析,有少数研究针对不同病原体建立预测模型。其中有一部分研究将临床特征纳入研究变量,那些未将临床特征纳入的研究,则需要检测临床上不常规使用的额外的生物标志物,这在临床应用场景中难以实现。而在利用临床特征预测病原的研究中,模型表现一般,AUC基本在0.9以下,不仅如此,在这些模型中,大多数只能将病原区分为病毒或细菌,还未出现过尝试多种病原分类的智能模型,进一步限制了其在临床上的推广和使用;而且,现有技术中的建模大多基于常规的统计学方法,模型建立不够高效和精准。
申请内容
鉴于以上所述现有技术的缺点,本申请的目的在于提供儿童社区获得性肺炎病原学类型预测方法、装置、终端及介质,用于解决现有技术中的模型建立不够高效和精准的问题。
为实现上述目的及其他相关目的,本申请的第一方面提供一种儿童社区获得性肺炎病原学类型预测方法,包括:构建儿童社区获得性肺炎数据集,据以构建儿童社区获得性肺炎病原学类型预测模型;训练所述病原学类型预测模型并进行准确性测试,并根据准确性测试结果选取最优预测模型;将所述最优预测模型适配于医疗应用端中的临床辅助决策系统,并在待诊患者符合预设触发条件时,利用所述最优预测模型对所述待诊患者进行诊断,并输出至少包括儿童社区获得性肺炎类型信息的预测结果。
于本申请的第一方面的一些实施例中,所述儿童社区获得性肺炎病原学类型预测模型的构建方式包括:根据预设条件选取样本人群并采集源数据;从所述源数据中抽取病例组和对照组并进行预处理;基于预处理后的数据,为每一类型病原体选取对应的入模特征变量并构建对应的病原学类型预测模型。
于本申请的第一方面的一些实施例中,所述病原体的类型包括:原体;所述支原体对应的入模特征变量包括:身高、体温、脉搏、收缩压、呼吸频率、舒张压、嗜酸性粒细胞占白细胞百分比、嗜碱性粒细胞计数、C-反应蛋白、白细胞计数、中性粒细胞计数、淋巴细胞计数、红细胞计数、血小板计数、单核细胞计数、红细胞比容测定、平均红细胞Hb浓度、平均红细胞体积、平均血小板体积、红细胞体积分布-W、血小板体积分布-W、淋巴细胞占白细胞百分比、发热、哮鸣音、啰音、肺实变、模糊影、大环内酯类抗生素;病毒;所述病毒对应的入模特征变量包括:呼吸频率、脉搏、收缩压、舒张压、呼吸频率、中性粒细胞计数、平均红细胞Hb浓度、红细胞体积分布-W、淋巴细胞占白细胞百分比、淋巴细胞计数、白细胞计数、嗜碱性粒细胞计数、平均红细胞Hb含量、平均红细胞Hb浓度、平均红细胞体积、单核细胞计数;细菌;所述细菌对应的入模特征变量包括:年龄、收缩压、舒张压、体温、脉搏、白细胞计数、单核细胞计数、红细胞比容测定、红细胞体积分布-W、淋巴细胞计数、淋巴细胞占白细胞百分比、平均红细胞Hb含量、平均红细胞体积、嗜碱性粒细胞计数、血小板计数、中性粒细胞计数、发热、哮鸣音、肺实变、模糊影、青霉素类及其复方制剂抗生素;百日咳;所述百日咳对应的入模特征变量包括:年龄、呼吸频率、脉搏、舒张压、体温、降钙素原、C-反应蛋白、白细胞计数、单核细胞计数、红细胞比容测定、红细胞计数、红细胞体积分布-W、淋巴细胞计数、淋巴细胞占白细胞百分比、平均红细胞Hb含量、平均红细胞Hb浓度、平均红细胞体积、平均血小板体积、嗜碱性粒细胞计数、嗜碱性粒细胞占白细胞百分比、嗜酸性粒细胞计数、嗜酸性粒细胞占白细胞百分比、血小板计数、血小板体积分布-W、中性粒细胞计数、青霉素类及其复方制剂抗生素、头孢菌素类抗生素、激素。
于本申请的第一方面的一些实施例中,每个所述入模特征变量有多个取值,所述方法还包括基于时间窗对所述入模特征变量进行聚合衍生处理,以获取单个入模特征变量的多个取值之间的关联关系。
于本申请的第一方面的一些实施例中,所述聚合衍生处理的方式包括:有无判断、计数、取最大值、取最小值、取平均值、取最末值、取最早值、取平均发展速度值、取标准差值、取最大增幅值中的任意一种或多种的组合。
于本申请的第一方面的一些实施例中,所述单个入模特征变量的多个取值之间的关联关系包括多个取值之间的变换、趋势、分布关系中的任意一种或多种的组合。
于本申请的第一方面的一些实施例中,对病原学类型预测模型进行准确性测试的方式包括:计算每个模型的AUC值,并取AUC值最大的预测模型作为所述最优预测模型。
于本申请的第一方面的一些实施例中,所述预设触发条件包括:患者被诊断为社区获得性肺炎,以及患者的年龄>28天且≤18岁。
于本申请的第一方面的一些实施例中,所述预测模型的输出结果包括:病原体单纯感染的概率值、病原体混合感染中优势病原体的概率值、预测结果的支持因素和不支持因素、模型说明;其中,所述模型说明包括适用人群说明、模型启动条件说明、预测结果含义的解释说明。
为实现上述目的及其他相关目的,本申请的第二方面提供一种儿童社区获得性肺炎病原学类型预测装置,包括:模型构建模块,用于构建儿童社区获得性肺炎数据集,据以构建儿童社区获得性肺炎病原学类型预测模型;模型测试模块,用于训练所述病原学类型预测模型并进行准确性测试,并根据准确性测试结果选取最优预测模型;模型使用模块,用于将所述最优预测模型适配于医疗应用端中的临床辅助决策系统,并在待诊患者符合预设触发条件时,利用所述最优预测模型对所述待诊患者进行诊断,并输出至少包括儿童社区获得性肺炎类型信息的预测结果。
为实现上述目的及其他相关目的,本申请的第三方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述儿童社区获得性肺炎病原学类型预测方法。
为实现上述目的及其他相关目的,本申请的第四方面提供一种计算机设备,包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行所述儿童社区获得性肺炎病原学类型预测方法。
如上所述,本申请的儿童社区获得性肺炎病原学类型预测方法、装置、终端及介质,具有以下有益效果:本发明旨在利用医院临床数据,对儿童社区获得性肺炎(childhoodcommunity-acquired pneumonia,CAP)患者的特征数据和诊疗数据进行模型训练分析,根据提取的临床数据建立病原体预测的多分类机器学习模型,对不同的分析结果匹配不同的感染源集分类,即对病毒、支原体、细菌及百日咳感染源进行分类,并将这一模型通过接口调用的方式与相应的产品页面结合,从而将病原感染源预测信息恰当、高效地传递给医生用户,以利用机器学习实现智能分诊,针对不同病原合理用药。通过构建这样的一整套病原预测系统,可以给予年资较浅的临床医生更多的临床诊疗支持,减少抗生素滥用的发生,提高合理用药管理。
附图说明
图1显示为本申请一实施例中儿童社区获得性肺炎病原学类型预测方法的流程示意图。
图2显示为本申请一实施例中儿童社区获得性肺炎病原学类型预测模型构建流程示意图。
图3显示为本申请一实施例中儿童社区获得性肺炎病原学类型预测模型输出结果示意图。
图4显示为本申请一实施例中儿童社区获得性肺炎病原学类型预测装置的结构示意图。
图5显示为本申请一实施例中计算机设备的结构示意图。
具体实施方式
以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,在下述描述中,参考附图,附图描述了本申请的若干实施例。应当理解,还可使用其他实施例,并且可以在不背离本申请的精神和范围的情况下进行机械组成、结构、电气以及操作上的改变。下面的详细描述不应该被认为是限制性的,并且本申请的实施例的范围仅由公布的专利的权利要求书所限定。这里使用的术语仅是为了描述特定实施例,而并非旨在限制本申请。空间相关的术语,例如“上”、“下”、“左”、“右”、“下面”、“下方”、“下部”、“上方”、“上部”等,可在文中使用以便于说明图中所示的一个元件或特征与另一元件或特征的关系。
在本申请中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”、“固持”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
本发明旨在利用医院临床数据,对儿童社区获得性肺炎(childhood community-acquired pneumonia,CAP)患者的特征数据和诊疗数据进行模型训练分析,根据提取的临床数据建立病原体预测的多分类机器学习模型,对不同的分析结果匹配不同的感染源集分类,即对病毒、支原体、细菌及百日咳感染源进行分类,并将这一模型通过接口调用的方式与相应的产品页面结合,从而将病原感染源预测信息恰当、高效地传递给医生用户,以利用机器学习实现智能分诊,针对不同病原合理用药。通过构建这样的一整套病原预测系统,可以给予年资较浅的临床医生更多的临床诊疗支持,减少抗生素滥用的发生,提高合理用药管理。
为了使本发明的目的、技术方案及优点更加清楚明白,通过下述实施例并结合附图,对本发明实施例中的技术方案的进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定发明。
实施例一:
如图1所示,展示了本发明一实施例中儿童社区获得性肺炎病原学类型预测方法的流程示意图,由主要的子步骤S11~S13构成。
需说明的是,本实施例的预测方法可应用于计算机设备,所述计算机设备包括但不限于如台式电脑、笔记本电脑、平板电脑、智能手机、智能电视、个人数字助理(PersonalDigital Assistant,简称PDA)等个人电脑。在另一些实施方式中,所述预测方法也可应用于服务器,所述服务器可以根据功能、负载等多种因素布置在一个或多个实体服务器上,也可以由分布的或集中的服务器集群构成,本实施例不作限定。
步骤S11:构建儿童社区获得性肺炎数据集,据以构建儿童社区获得性肺炎病原学类型预测模型;本步骤的子步骤如图2所示,包括子步骤S111~S113。
步骤S111,根据预设条件选取样本人群并采集源数据。举例来说,可选取某儿童医学中心在一段时间内有痰液核酸检测结果且经过医生标注的不同病原(支原体、病毒、细菌、百日咳)的患者作为样本人群。源数据是驱动决策的基础,数据越全推荐的内容越完整,本实施例涉及的源数据包括但不限于患者的基本信息数据、药品医嘱信息数据、检查检验信息数据、手术及处理信息数据、护理及体征数据等。
步骤S112,从所述源数据中抽取病例组和对照组并进行预处理。本实施例涉及的预处理包括但不限于对抽取出的病例组和对照组的相关资料进行检查、整理以及数据清洗等处理;其中的数据清洗主要是对异常值进行检视修复,对缺失率较高(例如缺失率>50%)的变量予以删除。应理解的是,所述病例组是指正类样本(y=1),即有相应感染的样本;所述对照组是指负类样本(y=0),即没有相应感染的样本。
步骤S113,基于预处理后的数据,为每一类型病原体选取对应的入模特征变量并构建对应的病原学类型预测模型。
具体来说,由于病原体的类型包括支原体、病毒、细菌、百日咳等,而每种病原体相关的参数都是不同的,因此需要为每一类型病原体选取适用的参数并建立相应的预测模型。为便于本领域技术人员理解,下文将结合表1~4来展示各类病原体关联的参数;表1是支原体的入模特征变量,表2是病毒的入模特征变量,表3是细菌的入模特征变量,表4是百日咳的入模特征变量。
表1—支原体的入模特征变量
表2—病毒的入模特征变量
变量名 | 来源 |
呼吸频率 | 护理记录 |
脉搏 | 护理记录 |
收缩压 | 护理记录 |
舒张压 | 护理记录 |
呼吸频率 | 护理记录 |
中性粒细胞计数 | 检验 |
平均红细胞Hb浓度 | 检验 |
红细胞体积分布-W | 检验 |
淋巴细胞占白细胞百分比 | 检验 |
淋巴细胞计数 | 检验 |
白细胞计数 | 检验 |
嗜碱性粒细胞计数 | 检验 |
平均红细胞Hb含量 | 检验 |
平均红细胞Hb浓度 | 检验 |
平均红细胞体积 | 检验 |
单核细胞计数 | 检验 |
表3—细菌的入模特征变量
表4—百日咳的入模特征变量
在本实施例优选的实现方式中,所述病原学类型预测模型包括但不限于Xgboost模型、Scorecard模型、Neural Network模型、SVM模型、Logistic Regression模型、Decision Tree模型、Random Forest模型等等。
在本实施例可选的实现方式中,由于入模特征变量往往有很多个值,例如某患者的体温特征,在入院时需要测量体温而且之后每日都需要测量一次体温,因此无法给预测模型输入稳定的变量,而且也无法体现单个参数变量内不同值之间的关系。有鉴于此,本实施例的技术方案基于时间窗对入模特征变量进行聚合衍生处理,以达到给预测模型输入稳定的变量的目的,也能体现单个入模特征变量中不同值之间的关联关系,例如不同值之间的变换、趋势、分布等情况。
首先确定时间窗,例如可根据医学逻辑为每个入模特征变量指定时间窗来确定取值的时间范围,例如8小时内、16小时内、1天内、2天内、3天内、1周内、1个月内、1年内,甚或全历史等等,本实施例不作限定。
其次在确定时间窗后,部分甚至全部的入模特征变量往往会取到多个不同的值,因此将这些不同的值进行聚合,从而体现出这些值之间的变换、趋势、分布等关系,最终基于医学逻辑及模型效果,给相应入模特征变量配上最适合的聚合方式,固化并进入模型。
本实施例涉及的聚合衍生处理包括但不限于如下方式:
1)有无判断:有则为1,否则为0;
2)计数:计算所有被标记为出现的次数;
3)取最大值:取系列中最大的一个值;
4)取最小值:取系列中最小的一个值;
5)取平均值:取系列中的算术平均值;
6)取最末值:取系列中对应绝对时间最大的一个值;
7)取最早值:取系列中对应绝对时间最小的一个值;
8)取平均发展速度值:用于衡量该特征变量在指定时间窗内的整体平局增长速度;
9)取标准差值:用于衡量该特征变量在指定时间窗内的整体平局增长速度;
10)取最大增幅值:用于衡量该特征变量在指定时间窗内的的最大变化幅度。
步骤S12:训练所述病原学类型预测模型并进行准确性测试,并根据准确性测试结果选取最优预测模型。
具体来说,由于机器学习算法有多种,因此本发明在机器学习系统中会对多种机器学习算法进行批量的实验,并完成超参数自动化搜索,对每个模型进行逐轮的算法准确性测试,从中选择准确性最优的模型使用。举例来说,可在机器学习中对Xgboost模型、Scorecard模型、Neural Network模型、SVM模型、Logistic Regression模型、DecisionTree模型、Random Forest模型等进行批量的实验,对每个模型进行算法准确性测试,最终选择准确性最高的Xgboost模型使用。
在本实施例可选的实现方式中,对每个模型的准确性评价采用AUC(Area UnderCurve),即ROC曲线下的面积,取值通常接于0.1~1之间,AUC值可直观地评价分类器的好坏,值越大越好。AUC的计算公式如下式1)所示:
其中,M表示正类样本的数量;N为负类样本的数量;n表示样本总数(M+N)。AUC值的计算原理如下:首先是对所有样本的得分(score)从大到小进行排序,然后令得分最大的样本的排序(rank)为n,并令得分第二大的样本的排序(rank)为n-1,以此类推;其次是把所有的正类样本的排序相加,再减去(M-1)种两个样本组合的情况,得到的就是所有样本中有多少对正类样本的得分大于负类样本的得分,然后再除以(M×N)。
步骤S13:将所述最优预测模型适配于医疗应用端中的临床辅助决策系统,并在待诊患者符合预设触发条件时,利用所述最优预测模型对所述待诊患者进行诊断,并输出至少包括儿童社区获得性肺炎类型信息的预测结果。
具体来说,可将最优预测模型开发成软件接口,并和医疗服务器中的临床辅助决策系统(CDSS)对接,当患者信息符合临床辅助决策系统(CDSS)设置的预设触发条件时,对这名患者进行AI模型诊断,即利用最优预测模型来进行诊断,并通过通讯工具将AI模型输出的风险结果及相关说明传送给相关的终端医生。
在本实施例可选的实现方式中,所述预设触发条件包括:被诊断为社区获得性肺炎的患儿,年龄>28天且≤18岁,在入院24小时后所述最优预测模型启动至少一次。
在本实施例可选的实现方式中,所述最优预测模型输出的预测结果包括但不限于:病原体(支原体、细菌、病毒、百日咳)单纯感染的概率值、病原体(支原体、细菌、病毒、百日咳)混合感染中优势病原体的概率值、预测结果的支持因素和不支持因素、模型说明(如适用人群、模型启动条件、预测结果含义的解释等)。
为便于本领域技术人员理解,现结合图3来对本发明提供的AI模型的输出结果进行图示解释。在图3中,区域A展示了4类病原体(支原体、细菌、病毒、百日咳)单纯感染的概率或者混合感染中优势病原体的概率值;例如病原体是病毒的概率为14%、病原体是百日咳的概率为0.8%、病原体是支原体的概率是92%、病原体是细菌的概率是23%。区域B展示了预测结果的支持因素和不支持因素;例如支持因素有15天内中性粒细胞计数变化幅度(10^9/L)<0.19,2天内中性粒细胞计数末次值(10^9/L)<6.00,或者1天内舒张压平均值(mmHg)>65等;不支持因素有1天内淋巴细胞占白细胞百分比平均值(%)≤35.2,15天内白细胞计数平均值(10^9/L)>9.2,或者1天内脉搏标准差(次/分)>9.2等等。区域C展示了模型说明,例如对适用人群进行的说明“诊断为社区获得性肺炎的患儿(年龄>28天,且≤18岁)”,对模型启动条件的说明,对预测结果含义的解释等,本实施例不做限定。
本领域技术人员应理解的是,以上实施例中AI模型输出界面中的各展示区域的排布,以及各展示区域内的内容,都只作为示例而非用于限定本发明的范围。
实施例二:
如图4所示,展示了本发明一实施例中的儿童社区获得性肺炎病原学类型预测装置的结构示意图。本实施例中的预测装置包括模型构建模块41、模型测试模块42和模型使用模块43。
具体而言,模型构建模块41用于构建儿童社区获得性肺炎数据集,据以构建儿童社区获得性肺炎病原学类型预测模型。模型测试模块42用于训练所述病原学类型预测模型并进行准确性测试,并根据准确性测试结果选取最优预测模型。模型使用模块43用于将所述最优预测模型适配于医疗应用端中的临床辅助决策系统,并在待诊患者符合预设触发条件时,利用所述最优预测模型对所述待诊患者进行诊断,并输出至少包括儿童社区获得性肺炎类型信息的预测结果。
需要说明的是,本实施例提供的装置和上文中的方法的实施方式类似,故不再赘述。另外需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,模型构建模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上模型构建模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital signal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
实施例三:
如图5所示,展示了本申请实施例提供的再一种计算机设备的结构示意图。本实例提供的计算机设备,包括:处理器51、存储器52、通信器53;存储器52通过系统总线与处理器51和通信器53连接并完成相互间的通信,存储器52用于存储计算机程序,通信器53用于和其他设备进行通信,处理器51用于运行计算机程序,使计算机设备执行如上儿童社区获得性肺炎病原学类型预测方法的各个步骤。
上述提到的系统总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
实施例四:
本实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述儿童社区获得性肺炎病原学类型预测方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,本申请提供儿童社区获得性肺炎病原学类型预测方法、装置、终端及介质,旨在利用医院临床数据,对儿童社区获得性肺炎(childhood community-acquiredpneumonia,CAP)患者的特征数据和诊疗数据进行模型训练分析,根据提取的临床数据建立病原体预测的多分类机器学习模型,对不同的分析结果匹配不同的感染源集分类,即对病毒、支原体、细菌及百日咳感染源进行分类,并将这一模型通过接口调用的方式与相应的产品页面结合,从而将病原感染源预测信息恰当、高效地传递给医生用户,以利用机器学习实现智能分诊,针对不同病原合理用药。通过构建这样的一整套病原预测系统,可以给予年资较浅的临床医生更多的临床诊疗支持,减少抗生素滥用的发生,提高合理用药管理。所以,本申请有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本申请的原理及其功效,而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。
Claims (12)
1.一种儿童社区获得性肺炎病原学类型预测方法,其特征在于,包括:
构建儿童社区获得性肺炎数据集,据以构建儿童社区获得性肺炎病原学类型预测模型;
训练所述病原学类型预测模型并进行准确性测试,并根据准确性测试结果选取最优预测模型;
将所述最优预测模型适配于医疗应用端中的临床辅助决策系统,并在待诊患者符合预设触发条件时,利用所述最优预测模型对所述待诊患者进行诊断,并输出至少包括儿童社区获得性肺炎类型信息的预测结果。
2.根据权利要求1所述的方法,其特征在于,所述儿童社区获得性肺炎病原学类型预测模型的构建方式包括:
根据预设条件选取样本人群并采集源数据;
从所述源数据中抽取病例组和对照组并进行预处理;
基于预处理后的数据,为每一类型病原体选取对应的入模特征变量并构建对应的病原学类型预测模型。
3.根据权利要求2所述的方法,其特征在于,所述病原体的类型包括:
支原体;所述支原体对应的入模特征变量包括:身高、体温、脉搏、收缩压、呼吸频率、舒张压、嗜酸性粒细胞占白细胞百分比、嗜碱性粒细胞计数、C-反应蛋白、白细胞计数、中性粒细胞计数、淋巴细胞计数、红细胞计数、血小板计数、单核细胞计数、红细胞比容测定、平均红细胞Hb浓度、平均红细胞体积、平均血小板体积、红细胞体积分布-W、血小板体积分布-W、淋巴细胞占白细胞百分比、发热、哮鸣音、啰音、肺实变、模糊影、大环内酯类抗生素;
病毒;所述病毒对应的入模特征变量包括:呼吸频率、脉搏、收缩压、舒张压、呼吸频率、中性粒细胞计数、平均红细胞Hb浓度、红细胞体积分布-W、淋巴细胞占白细胞百分比、淋巴细胞计数、白细胞计数、嗜碱性粒细胞计数、平均红细胞Hb含量、平均红细胞Hb浓度、平均红细胞体积、单核细胞计数;
细菌;所述细菌对应的入模特征变量包括:年龄、收缩压、舒张压、体温、脉搏、白细胞计数、单核细胞计数、红细胞比容测定、红细胞体积分布-W、淋巴细胞计数、淋巴细胞占白细胞百分比、平均红细胞Hb含量、平均红细胞体积、嗜碱性粒细胞计数、血小板计数、中性粒细胞计数、发热、哮鸣音、肺实变、模糊影、青霉素类及其复方制剂抗生素;
百日咳;所述百日咳对应的入模特征变量包括:年龄、呼吸频率、脉搏、舒张压、体温、降钙素原、C-反应蛋白、白细胞计数、单核细胞计数、红细胞比容测定、红细胞计数、红细胞体积分布-W、淋巴细胞计数、淋巴细胞占白细胞百分比、平均红细胞Hb含量、平均红细胞Hb浓度、平均红细胞体积、平均血小板体积、嗜碱性粒细胞计数、嗜碱性粒细胞占白细胞百分比、嗜酸性粒细胞计数、嗜酸性粒细胞占白细胞百分比、血小板计数、血小板体积分布-W、中性粒细胞计数、青霉素类及其复方制剂抗生素、头孢菌素类抗生素、激素。
4.根据权利要求2所述的方法,其特征在于,每个所述入模特征变量有多个取值,所述方法还包括基于时间窗对所述入模特征变量进行聚合衍生处理,以获取单个入模特征变量的多个取值之间的关联关系。
5.根据权利要求4所述的方法,其特征在于,所述聚合衍生处理的方式包括:有无判断、计数、取最大值、取最小值、取平均值、取最末值、取最早值、取平均发展速度值、取标准差值、取最大增幅值中的任意一种或多种的组合。
6.根据权利要求4所述的方法,其特征在于,所述单个入模特征变量的多个取值之间的关联关系包括多个取值之间的变换、趋势、分布关系中的任意一种或多种的组合。
7.根据权利要求1所述的方法,其特征在于,对病原学类型预测模型进行准确性测试的方式包括:计算每个模型的AUC值,并取AUC值最大的预测模型作为所述最优预测模型。
8.根据权利要求1所述的方法,其特征在于,所述预设触发条件包括:患者被诊断为社区获得性肺炎,以及患者的年龄>28天且≤18岁。
9.根据权利要求1所述的方法,其特征在于,所述预测模型的输出结果包括:病原体单纯感染的概率值、病原体混合感染中优势病原体的概率值、预测结果的支持因素和不支持因素、模型说明;其中,所述模型说明包括适用人群说明、模型启动条件说明、预测结果含义的解释说明。
10.一种儿童社区获得性肺炎病原学类型预测装置,其特征在于,包括:
模型构建模块,用于构建儿童社区获得性肺炎数据集,据以构建儿童社区获得性肺炎病原学类型预测模型;
模型测试模块,用于训练所述病原学类型预测模型并进行准确性测试,并根据准确性测试结果选取最优预测模型;
模型使用模块,用于将所述最优预测模型适配于医疗应用端中的临床辅助决策系统,并在待诊患者符合预设触发条件时,利用所述最优预测模型对所述待诊患者进行诊断,并输出至少包括儿童社区获得性肺炎类型信息的预测结果。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述儿童社区获得性肺炎病原学类型预测方法。
12.一种计算机设备,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行如权利要求1至9中任一项所述儿童社区获得性肺炎病原学类型预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010402593.XA CN111599465A (zh) | 2020-05-13 | 2020-05-13 | 儿童社区获得性肺炎病原学类型预测方法、装置、终端及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010402593.XA CN111599465A (zh) | 2020-05-13 | 2020-05-13 | 儿童社区获得性肺炎病原学类型预测方法、装置、终端及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111599465A true CN111599465A (zh) | 2020-08-28 |
Family
ID=72192319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010402593.XA Pending CN111599465A (zh) | 2020-05-13 | 2020-05-13 | 儿童社区获得性肺炎病原学类型预测方法、装置、终端及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111599465A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112382395A (zh) * | 2020-11-11 | 2021-02-19 | 上海森亿医疗科技有限公司 | 基于机器学习的一体化建模系统 |
CN112485448A (zh) * | 2020-11-20 | 2021-03-12 | 浙江大学 | Nmi蛋白作为生物靶标在制备成人社区获得性肺炎严重程度及预后评估试剂盒的应用 |
CN112786207A (zh) * | 2021-01-28 | 2021-05-11 | 联仁健康医疗大数据科技股份有限公司 | 数据筛选模型建立及数据筛选方法、装置、设备和介质 |
CN113436749A (zh) * | 2021-03-10 | 2021-09-24 | 北京思特奇信息技术股份有限公司 | 基于线性回归理论的肺炎感染预测方法及系统 |
CN116864119A (zh) * | 2023-05-22 | 2023-10-10 | 中国医学科学院北京协和医院 | 一种基于感染时期的肺炎风险预测方法、设备、系统及可存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108877925A (zh) * | 2018-03-30 | 2018-11-23 | 杭州依图医疗技术有限公司 | 一种肺炎病原的确定方法及装置 |
CN109065157A (zh) * | 2018-08-01 | 2018-12-21 | 中国人民解放军第二军医大学 | 一种疾病诊断标准化编码推荐列表确定方法及系统 |
CN110533526A (zh) * | 2019-08-13 | 2019-12-03 | 深圳追一科技有限公司 | 一种黑标客户的识别方法、装置、计算机设备和存储介质 |
CN110827993A (zh) * | 2019-11-21 | 2020-02-21 | 北京航空航天大学 | 基于集成学习的早期死亡风险评估模型建立方法及装置 |
-
2020
- 2020-05-13 CN CN202010402593.XA patent/CN111599465A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108877925A (zh) * | 2018-03-30 | 2018-11-23 | 杭州依图医疗技术有限公司 | 一种肺炎病原的确定方法及装置 |
CN109065157A (zh) * | 2018-08-01 | 2018-12-21 | 中国人民解放军第二军医大学 | 一种疾病诊断标准化编码推荐列表确定方法及系统 |
CN110533526A (zh) * | 2019-08-13 | 2019-12-03 | 深圳追一科技有限公司 | 一种黑标客户的识别方法、装置、计算机设备和存储介质 |
CN110827993A (zh) * | 2019-11-21 | 2020-02-21 | 北京航空航天大学 | 基于集成学习的早期死亡风险评估模型建立方法及装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112382395A (zh) * | 2020-11-11 | 2021-02-19 | 上海森亿医疗科技有限公司 | 基于机器学习的一体化建模系统 |
CN112382395B (zh) * | 2020-11-11 | 2021-10-15 | 上海森亿医疗科技有限公司 | 基于机器学习的一体化建模系统 |
CN112485448A (zh) * | 2020-11-20 | 2021-03-12 | 浙江大学 | Nmi蛋白作为生物靶标在制备成人社区获得性肺炎严重程度及预后评估试剂盒的应用 |
CN112485448B (zh) * | 2020-11-20 | 2021-08-24 | 浙江大学 | Nmi蛋白作为生物靶标在制备成人社区获得性肺炎严重程度及预后评估试剂盒的应用 |
CN112786207A (zh) * | 2021-01-28 | 2021-05-11 | 联仁健康医疗大数据科技股份有限公司 | 数据筛选模型建立及数据筛选方法、装置、设备和介质 |
CN113436749A (zh) * | 2021-03-10 | 2021-09-24 | 北京思特奇信息技术股份有限公司 | 基于线性回归理论的肺炎感染预测方法及系统 |
CN116864119A (zh) * | 2023-05-22 | 2023-10-10 | 中国医学科学院北京协和医院 | 一种基于感染时期的肺炎风险预测方法、设备、系统及可存储介质 |
CN116864119B (zh) * | 2023-05-22 | 2024-03-05 | 中国医学科学院北京协和医院 | 一种基于感染时期的肺炎风险预测方法、设备、系统及可存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111599465A (zh) | 儿童社区获得性肺炎病原学类型预测方法、装置、终端及介质 | |
US8145582B2 (en) | Synthetic events for real time patient analysis | |
CN111599466A (zh) | 儿童血液肿瘤患者脓毒性休克预测方法、装置、终端及介质 | |
US20210295996A1 (en) | Machine learning models for diagnosis suspecting | |
WO2022060949A1 (en) | Systems and methods for automatically identifying a candidate patient for enrollment in a clinical trial | |
Pujianto et al. | Comparison of Naïve Bayes Algorithm and Decision Tree C4. 5 for Hospital Readmission Diabetes Patients using HbA1c Measurement. | |
CN107767960A (zh) | 临床检测项目的数据处理方法、装置及电子设备 | |
CN112967803A (zh) | 基于集成模型的急诊患者早期死亡率预测方法及系统 | |
CN113470816A (zh) | 一种基于机器学习的糖尿病肾病预测方法、系统和预测装置 | |
Al-Mualemi et al. | A deep learning-based sepsis estimation scheme | |
CN114783580B (zh) | 一种医疗数据质量评估方法及系统 | |
CN112836730A (zh) | 用于用户妊娠状态分类的方法、装置、电子设备及介质 | |
Kaur et al. | Diagnosis and detection of congenital diseases in new-borns or fetuses using artificial intelligence techniques: a systematic review | |
CN114093524A (zh) | 一种儿童抗菌药物使用评估系统、计算机可读存储介质及终端 | |
Gozdzikiewicz | Zwoli nska, D.; Polak-Jonkisz, D. The Use of Artificial Intelligence Algorithms in the Diagnosis of Urinary Tract Infections—A Literature Review | |
Wang et al. | Enhancing model interpretability and accuracy for disease progression prediction via phenotype-based patient similarity learning | |
Yagmur et al. | A new computer‐aided diagnostic method for classifying anaemia disease: Hybrid use of Tree Bagger and metaheuristics | |
CN112967789A (zh) | 一种口腔类专科病种的资源消耗计算测定方法 | |
CN117198532A (zh) | 一种基于机器学习的icu患者脓毒症风险预测方法及系统 | |
Asghar et al. | Automatic classification of 10 blood cell subtypes using transfer learning via pre-trained convolutional neural networks | |
Jabbar et al. | Risks of chronic kidney disease prediction using various data mining algorithms | |
CN113436745A (zh) | 一种基于数据库分析的人工智能辅助诊断方法 | |
Magade et al. | Automating Decision Process of Overnight Patient Care Using Hybrig Machine Learning Algorithms | |
Kumar et al. | Machine Learning Observation on the Prediction of Diabetes Mellitus Disease | |
Dong et al. | Using Natural Language Processing to Screen Patients with Active Heart Failure: An Exploration for Hospital-wide Surveillance |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200828 |