CN115684570A - 传染病检测装置、设备、系统、介质及程序产品 - Google Patents

传染病检测装置、设备、系统、介质及程序产品 Download PDF

Info

Publication number
CN115684570A
CN115684570A CN202210922162.5A CN202210922162A CN115684570A CN 115684570 A CN115684570 A CN 115684570A CN 202210922162 A CN202210922162 A CN 202210922162A CN 115684570 A CN115684570 A CN 115684570A
Authority
CN
China
Prior art keywords
training
infectious disease
model
detection
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210922162.5A
Other languages
English (en)
Other versions
CN115684570B (zh
Inventor
王清涛
周睿
郑华荣
王尉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Chaoyang Hospital
Original Assignee
Beijing Chaoyang Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Chaoyang Hospital filed Critical Beijing Chaoyang Hospital
Priority to CN202210922162.5A priority Critical patent/CN115684570B/zh
Publication of CN115684570A publication Critical patent/CN115684570A/zh
Application granted granted Critical
Publication of CN115684570B publication Critical patent/CN115684570B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请提供了一种传染病检测装置、设备、系统、介质及程序产品,该装置包括:获取模块,用于获取对健康人群以及传染病的感染人群的血液检测信息,以及医疗机构的实时检测数据;训练模块,用于:根据血液检测信息确定训练指标;根据检测信息以及训练指标确定训练数据集;根据训练数据集对预设的传染病识别模型进行训练,确定目标识别模型;检测模块,用于:利用目标识别模型对实时检测数据进行识别检测,判断识别结果是否满足预设提示条件,若是,则输出提示信息。实现了对非典型临床症状的传染病患者进行自动化早期检测识别,并在传播早期筛查出传染病的隐性感染者。

Description

传染病检测装置、设备、系统、介质及程序产品
技术领域
本申请涉及传染病检测设备领域,尤其涉及一种传染病检测装置、设备、系统、介质及程序产品。
背景技术
近年来各种类型的传染病在世界各地传播,损害人类和动植物的健康,妨碍社会经济发展。由于部分传染病传播的隐匿性强,现有的医疗卫生体系在其传播初期难以对其进行有效识别,进而导致传染病大范围流行传播。
现有的传染病防控,主要依赖于医务人员凭借其自身的医学知识和工作经验来识别传染病,或者是需要依赖大量的专门检测来反复确认。而这样就必然会使得传染病的防控措施被延迟,进一步加重传染病所带来的人身健康和社会经济损失。
因此,如何实现对非典型临床症状的传染病患者进行自动化早期检测识别,并在传播早期筛查出传染病的隐性感染者成为了亟待解决问题。
发明内容
本申请提供一种传染病检测装置、设备、系统、介质及程序产品,以解决如何实现对非典型临床症状的传染病患者进行自动化早期检测识别,并在传播早期筛查出传染病的隐性感染者的技术问题。
第一个方面,本申请提供一种传染病检测装置,包括:
获取模块,用于获取对健康人群以及传染病的感染人群的血液检测信息;
训练模块,用于:根据血液检测信息确定训练指标;根据血液检测信息以及训练指标确定训练数据集;根据训练数据集对预设的传染病识别模型进行训练,确定目标识别模型;
获取模块,还用于获取医疗机构的实时检测数据;
检测模块,用于:利用目标识别模型对实时检测数据进行识别检测,判断识别结果是否满足预设提示条件,若是,则输出提示信息,提示信息用于提示检测到实时检测数据对应的人员感染了传染病,且人员处于感染早期阶段。
在一种可能的设计中,传染病识别模型为神经网络模型,训练模块,还用于:
将血液检测信息作为先验知识数据输入传染病识别模型的隐藏层中,以提高传染病识别模型的训练效率和识别准确度。
在一种可能的设计中,血液检测信息包括血常规数据,训练模块,用于:
根据血常规数据确定训练指标,其中,训练指标包括:中性粒细胞淋巴细胞比率以及血小板淋巴细胞比率。
在一种可能的设计中,训练模块,还用于:
利用预设测试模型,计算训练数据集中各项数据之间的共线性度,并测试各项数据的训练贡献度;根据共线性度、训练贡献度,从训练数据集中去除冗余数据;其中,冗余数据对传染病识别模型的训练的影响程度不满足预设训练要求。
在一种可能的设计中,训练模块,还用于:利用预设测试模型,计算训练数据集中各项数据之间的共线性度,并测试各项数据的训练贡献度;根据共线性度、训练贡献度,从训练数据集中去除冗余数据,包括:
计算血常规数据中任意两个检测项目之间的共线性度;
判断共线性度是否大于预设线性阈值;
若否,则将共线性度对应的两个检测项目都加入训练数据集中;
若是,则利用预设测试模型,测试各个检测项目的训练贡献度;若训练贡献度大于预设训练阈值,则将对应的检测项目保留在训练数据集中;
其中,在对不同的感染人群对应的传染病识别模型进行训练时,同一个检测项目对应的训练贡献度的大小不相同,训练数据集中包含的检测项目的数量也不相同。
在一种可能的设计中,感染人群包括:急性期患者。
在一种可能的设计中,训练数据集包括:嗜碱粒细胞绝对值。
在一种可能的设计中,训练数据集还包括:性别、年龄。
在一种可能的设计中,训练数据集还包括:嗜碱粒细胞绝对值、红细胞分布变异系数、嗜酸粒细胞绝对值、红细胞、单核细胞百分比、嗜碱粒细胞百分比、平均红细胞体积、单核细胞绝对值、血小板、平均红细胞血红蛋白浓度、淋巴细胞绝对值、中性粒细胞绝对值、淋巴细胞百分比。
在一种可能的设计中,训练模块,用于:根据训练数据集对预设的传染病识别模型进行训练,确定目标识别模型,包括:
利用预设划分方式,将训练数据集划分成多个第一训练集和至少一个第一测试集;
利用预设训练算法,根据各个第一训练集,对传染病识别模型进行循环训练;
在训练结束后,根据第一测试集对得到的待测试模型进行验证测试,判断待测试模型是否满足预设要求;
若是,则重新利用预设划分方式,将训练数据集划分成多个第一训练集和至少一个第一测试集;
若否,则确定待测试模型为目标识别模型。
在一种可能的设计中,训练模块,用于:利用预设训练算法,根据各个第一训练集,对传染病识别模型进行循环训练,包括:
利用预设划分方式,将每个第一训练集划分成多个第二训练集和至少一个第二测试集;
循环利用每个第一训练集中的各个第二训练集对传染病识别模型进行训练,确定第一训练结果;
在每次训练后,根据第二测试集对第一训练结果进行验证测试,确定第一测试结果,并根据第一测试结果对下一次训练中的参数进行调整。
在一种可能的设计中,训练模块,还用于:
在利用预设划分方式,将训练数据集划分成多个第一训练集和至少一个第一测试集之前,利用预设均衡模型,对训练数据集中的阴性数据和阳性数进行数据平衡处理,以均衡训练数据集中阴性数据和阳性数据的数量。
在一种可能的设计中,传染病识别模型包括多个不同类型的原始识别模型,每个原始识别模型经过训练模块的训练后,得到对应的待选识别模型,传染病检测装置还包括:
模型选择模块,用于根据训练数据集中的测试集,确定各个待选识别模型的识别准确率;
根据识别准确率从各个待选识别模型中确定至少一个目标识别模型。
第二方面,本申请提供一种传染病检测系统,包括:数据接收器、模型训练器、传染病检测器;
数据接收器获取对健康人群以及传染病的感染人群的血液检测信息,并将检测信息发送给模型训练器;
模型训练器根据血液检测信息确定训练指标,并根据检测信息以及训练指标确定训练数据集;模型训练器根据训练数据集对预设的传染病识别模型进行训练,确定目标识别模型,并将目标识别模型发送给传染病检测器;
数据接收器获取医疗机构的实时检测数据,并将实时检测数据发送给传染病检测器;
传染病检测器利用目标识别模型对实时检测数据进行识别检测,判断识别结果是否满足预设提示条件,若是,则输出提示信息,提示信息用于提示检测到实时检测数据对应的人员感染了传染病,且人员处于感染早期阶段。
在一种可能的设计中,传染病识别模型为神经网络模型,模型训练器还用于:
将血液检测信息作为先验知识数据输入传染病识别模型的隐藏层中,以提高传染病识别模型的训练效率和识别准确度。
在一种可能的设计中,血液检测信息包括血常规数据,模型训练器根据血液检测信息确定训练指标,包括:
模型训练器根据血常规数据确定训练指标,其中,训练指标包括:中性粒细胞淋巴细胞比率以及血小板淋巴细胞比率。
在一种可能的设计中,模型训练器利用预设测试模型,计算训练数据集中各项数据之间的共线性度,并测试各项数据的训练贡献度;根据共线性度、训练贡献度,从训练数据集中去除冗余数据;其中,冗余数据对传染病识别模型的训练的影响程度不满足预设训练要求。
在一种可能的设计中,模型训练器利用预设测试模型,计算训练数据集中各项数据之间的共线性度,并测试各项数据的训练贡献度;根据共线性度、训练贡献度,从训练数据集中去除冗余数据,包括:
计算血常规数据中任意两个检测项目之间的共线性度;
判断共线性度是否大于预设线性阈值;
若否,则将共线性度对应的两个检测项目都加入训练数据集中;
若是,则利用预设测试模型,测试各个检测项目的训练贡献度;若训练贡献度大于预设训练阈值,则将对应的检测项目保留在训练数据集中;
其中,在对不同的感染人群对应的传染病识别模型进行训练时,同一个检测项目对应的训练贡献度的大小不相同,训练数据集中包含的检测项目的数量也不相同。
在一种可能的设计中,感染人群包括:急性期患者。
在一种可能的设计中,训练数据集包括:嗜碱粒细胞绝对值。
在一种可能的设计中,训练数据集还包括:性别、年龄。
在一种可能的设计中,训练数据集还包括:嗜碱粒细胞绝对值、红细胞分布变异系数、嗜酸粒细胞绝对值、红细胞、单核细胞百分比、嗜碱粒细胞百分比、平均红细胞体积、单核细胞绝对值、血小板、平均红细胞血红蛋白浓度、淋巴细胞绝对值、中性粒细胞绝对值、淋巴细胞百分比。
在一种可能的设计中,模型训练器根据训练数据集对预设的传染病识别模型进行训练,确定目标识别模型,包括:
模型训练器利用预设划分方式,将训练数据集划分成多个第一训练集和至少一个第一测试集;
模型训练器利用预设训练算法,根据各个第一训练集,对传染病识别模型进行循环训练;
在训练结束后,模型训练器根据第一测试集对得到的待测试模型进行验证测试,判断待测试模型是否满足预设要求;
若是,则模型训练器重新利用预设划分方式,将训练数据集划分成多个第一训练集和至少一个第一测试集;
若否,则确定待测试模型为目标识别模型。
在一种可能的设计中,模型训练器利用预设训练算法,根据各个第一训练集,对传染病识别模型进行循环训练,包括:
模型训练器利用预设划分方式,将每个第一训练集划分成多个第二训练集和至少一个第二测试集;
模型训练器循环利用每个第一训练集中的各个第二训练集对传染病识别模型进行训练,确定第一训练结果;
在每次训练后,模型训练器根据第二测试集对第一训练结果进行验证测试,确定第一测试结果,并根据第一测试结果对下一次训练中的参数进行调整。
在一种可能的设计中,模型训练器在利用预设划分方式,将训练数据集划分成多个第一训练集和至少一个第一测试集之前,模型训练器利用预设均衡模型,对训练数据集中的阴性数据和阳性数进行数据平衡处理,以均衡训练数据集中阴性数据和阳性数据的数量。
在一种可能的设计中,传染病识别模型包括多个不同类型的原始识别模型,每个原始识别模型经过训练模块的训练后,得到对应的待选识别模型,传染病检测系统还包括:模型选择器;
模型选择器根据训练数据集中的测试集,确定各个待选识别模型的识别准确率;
模型选择器根据识别准确率从各个待选识别模型中确定至少一个目标识别模型。
第三个方面,本申请提供一种电子设备,包括:
存储器,用于存储程序指令;
处理器,用于调用并执行所述存储器中的程序指令,执行第一方面所提供的任意一种可能的传染病检测装置中各模块所执行的逻辑步骤。
第四个方面,本申请提供一种存储介质,可读存储介质中存储有计算机程序,计算机程序用于执行第一方面所提供的任意一种可能的传染病检测装置中各模块所执行的逻辑步骤。
第五方面,本申请还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面所提供的任意一种可能的传染病检测装置中各模块所执行的逻辑步骤。
本申请提供了一种传染病检测装置、设备、系统、介质及程序产品,该传染病检测装置包括:获取模块,用于获取对健康人群以及传染病的感染人群的血液检测信息,以及医疗机构的实时检测数据;训练模块,用于:根据检测信息中的血常规数据确定训练指标;根据检测信息以及训练指标确定训练数据集;根据训练数据集对预设的传染病识别模型进行训练,确定目标识别模型;检测模块,用于:利用目标识别模型对实时检测数据进行识别检测,判断识别结果是否满足预设提示条件,若是,则输出提示信息,提示信息用于提示检测到实时检测数据对应的人员感染了传染病,且人员处于感染早期阶段。解决了如何实现对非典型临床症状的传染病患者进行自动化早期检测识别,并在传播早期筛查出传染病的隐性感染者的技术问题。达到了辅助医务人员及时发现传染病感染者,尽快采取防疫措施阻断疫情传播的技术效果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为本申请实施例提供的一种传染病检测装置的结构示意图;
图2为本申请实施例提供的训练数据集中各项训练数据对训练贡献程度的shap图;
图3a为本申请实施例提供的采用A类人群训练后各个模型的识别灵敏度特性曲线图;
图3b为本申请实施例提供的采用B类人群训练后各个模型的识别灵敏度特性曲线图;
图3c为本申请实施例提供的采用C类人群训练后各个模型的识别灵敏度特性曲线图;
图4为本申请实施例提供的一种布病识别模型训练时采用急性期患者作为训练数据时各项训练数据的贡献度示意图;
图5为本申请实施例提供的另一种传染病检测装置的结构示意图;
图6为本申请实施例提供的各种传染病识别模型的识别准确率统计图;
图7为本申请实施例提供的各种传染病识别模型的ROC曲线统计图;
图8为本申请实施例提供的一种医疗质控数据处理系统的结构示意图;
图9为本申请提供的一种电子设备的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,包括但不限于对多个实施例的组合,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
结核病(TB)是一种由结核分枝杆菌(MTB)引起的易感染人类疾病,是全球主要的死亡原因之一。结核病通常影响肺部,因此被称为肺结核(PTB),占所有结核病的80%以上。PTB表现为持续发作、晚上出汗、发烧或体重意外减轻。结核病还会影响其他部位,例如大脑、骨骼、肠道、皮肤、肾脏、淋巴结或脊柱。它被称为肺外结核病(EPTB),表现为MTB感染肺外器官或组织引起的各种临床症状。
但是,如果能早期诊断出传染性患者,就可以预防结核病的传播。因此,迫切需要一种温和、方便、快速的结核病诊断工具[1]。然而,目前的结核病诊断工具极具挑战性。抗酸杆菌(AFB)涂片镜检在分枝杆菌感染的早期诊断中发挥着重要作用,在发展中国家往往是唯一可用的诊断方法,除此之外,方法之间的敏感性在20%到80%之间。结核分枝杆菌(MTB)培养被认为是最佳标准,用于结核病的确诊诊断,其敏感性高于涂片显微镜检查,但其较长的周转时间(TAT)存在缺陷,大约为4至8周。核酸扩增试验 (NAAT)检测需要大量费用、熟练的实验室人员和高水平的基础设施。到目前为止,还没有一个可靠的检测方法可用于诊断TB。因此,更有效和节省成本的策略对于结核病患者的早期诊断和适当的疾病管理是极其必要的。此外,在“终结结核病战略”的框架下,世卫组织强调理想和准确地确定患者的结核病,并建议使用可以在发展中国家早期诊断结核病方面发挥重要作用的计算机辅助技术。常用检测方法需要计算机借助医学影像数据进行结核病检测。
但是本申请发明人发现基于常规实验室检测项目的筛查程序或模型,比借助医学影像数据进行结核病检测更有优势,其具有提高结核病早期发现率、规范治疗和帮助“终结结核病战略”的潜力。
布鲁氏菌病(下文简称布病)是一种由布鲁氏菌感染引起的人畜共患的传染病。人群对布鲁氏菌普遍易感,患病的动物是主要的传染源,含有布鲁氏菌的污染物及食物均可成为传播媒介。
布病属于我国《传染病防治法》规定的乙类传染病,根据临床病程可分为:急性期和慢性期。急性期临患者床表现为非特异性的发热(包括低热)、乏力、多汗、肌肉、关节疼痛等症状,常易与其他发热性疾病,如:发烧,感冒、风湿病和结核病等混淆,临床难以早期诊断,这不仅使临床干预时间窗缩短,而且增大了转为慢性期并引发严重并发症的风险。
另外,早期发现布病隐性感染者,亦是传染性疾病面临的挑战。目前,布病临床整体诊断准确性不高,相关研究显示,实验室确诊布病诊断准确性为87.1%,医务人员对疑似病例和临床诊断病例的判定正确率不足60%,临床诊断准确性仅为13.3%。
因此,布病防控工作是全球公共卫生系统的挑战。全球每年上报布病确诊病例逾50万,在发达国家中控制较好,部分发展中国家流行较为严重。我国布病常规监测系统依赖于各级各类医疗机构、疾病预防控制机构、卫生检疫机构的医务人员发现疑似、临床诊断或实验室确诊的布病病例。然而,在医疗保健水平落后和诊断能力较差的地区,布病的发病率明显被低估。
布病是由布鲁氏菌属感染引起的人畜共患传染病。患病家畜(羊、牛、猪、狗等)为主要感染源。最新研究发现新物种及不同谱系动物(海豹、鲸鱼、赤狐等)亦携带非典型布鲁氏菌菌株。已知菌株在不断适应环境变化的情况下,布病的流行病学仍不十分明朗。另一方面,布鲁氏菌感染人体后主要寄生于巨噬细胞内,其发病机制在急性期时是细菌及毒素起主要作用,慢性期则以迟发型变态反应为主,可引起菌血症、毒血症并侵犯多个器官。布病患者也因感染的病原体、病程阶段和累及器官系统的不同而异,呈现复杂多样的临床表现,易与其他感染性和非感染性疾病混淆,难以早期发现。特别是布病患者不会产生持久免疫,再感染情况多见。在许多国家和地区,由于临床医生对布病的认知度较低,经常导致误诊或诊断延误,使患者由急性期转为慢性期,出现骨骼系统、生殖系统、中枢神经系统、肝脏、心脏和肺部等组织器官的并发症,使患者身心遭受严重打击,不仅影响患者的生活质量,还会大量耗费医疗资源,增加社会和患者的经济负担。由此可见,布病的早发现,早诊断、早治疗对于布病防控意义重大。
上述对结核病和布病的防疫所遇到的技术问题,可以代表人类在面临传染病防疫时所遇到的技术问题。纵观人类历史,传染病一直威胁着人类的健康,并且每隔一段时间就会出现新的传染病,甚至引发传染病大流行。并且近年来,传染病病原体变异速度加快,使得传染病流行的间隔逐渐缩短。
为此,如何实现对非典型临床症状的传染病患者进行自动化早期检测识别,并在传播早期筛查出传染病的隐性感染者成为了亟待解决问题。
为解决上述技术问题,本申请的发明构思是:
引入新型的传染病检测装置或系统,通过在装置或系统中构建传染病识别模型,并利用其对医疗机构的常规检测项目进行监控,即使发现隐形感染者或早期感染者,并向医务人员发出提示信息。
下面对本申请中出现的专业名词作介绍和解释:
血常规数据(CBC):通过血细胞分析仪,对外周血中各种血细胞的数量、形态、比例进行检查的一种常用的检查数据,包括22个检测项目:白细胞计数(WBC)、中性粒细胞百分比(NEUT%)、中性粒细胞绝对值 (NEUT#)、淋巴细胞百分比(LYMPH%)、淋巴细胞绝对值(LYM PH#)、单核细胞百分比(MONO%)、单核细胞绝对值(MONO#)、第一嗜酸粒细胞百分比(BASO%)、第二嗜酸粒细胞百分比(EO%)、第一嗜碱粒细胞绝对值(BASO#)、第二嗜碱粒细胞绝对值(EO#)、红细胞计数(RBC)、血红蛋白(HGB)、红细胞压积(HCT)、红细胞平均体积(MCV)、平均血红蛋白量(MCH)、平均血红蛋白浓度(MCHC)、红细胞分布变异系数(R-CV)、血小板计数(PLT)、平均血小板体积(MPV)、血小板分布宽度(PDW)、血小板压积(PCT)。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1为本申请实施例提供的一种传染病检测装置的结构示意图。该传染病检测装置100可以通过软件、硬件或者两者的结合实现。
如图1所示,该传染病检测装置100包括:获取模块101、训练模块 102以及检测模块103。
获取模块101,用于获取对健康人群以及传染病的感染人群的血液检测信息以及医疗机构的实时检测数据。
在本实施例中,血液检测信息包括:性别、年龄、临床诊断信息和血常规数据。
需要说明的是,本申请并没有采用医学影像数据或者其它非常规的检测项目,而是采用了最为常见的血常规数据,因其在临床上很容易获得,血常规数据在各级各类医疗机构都可以进行检测,具备广泛应用基础,同时血常规结果比其他检验结果仪器稳定性高、结果更可靠和标准化程度好。
具体的,本实施例中的血液检测信息来源于医疗机构信息系统数据库。采集于2011年5月9日至2021年11月29日,首都医科大学附属北京地坛医院门诊、住院确诊为布病的患者数据作为病例组即感染人群;首都医科大学附属北京朝阳医院表观健康人的检验数据作为对照组(即健康人群的检测信息)。并对上述检测信息进行了脱敏处理。
在一种可能的设计中,在获取到血液检测信息后,还需要对血液检测信息进行数据结构化处理和数据标准化处理。
数据结构化处理:将所有特征进行数值化处理(性别、年龄、血常规22 项),添加训练标签,最终形成可进行机器学习训练的具有预设数据格式的结构数据。
数据标准化处理:对所有参与传染病识别模型构建的训练数据进行正态标准化,统一计量尺度即统一数值单位,减少不同计量尺度的数据特征在算法内部运算过程带来的不利影响,提高传染病识别模型的识别精度及迭代速度。
训练模块102,用于:
根据血液检测信息确定训练指标;根据血液检测信息以及训练指标确定训练数据集;根据训练数据集对预设的传染病识别模型进行训练,确定目标识别模型。
在一种可能的设计中,传染病识别模型为神经网络模型,训练模块102,还用于:
将血液检测信息作为先验知识数据输入传染病识别模型的隐藏层中,以提高传染病识别模型的训练效率和识别准确度。
由于某些传染病,比如结核病,其检测项目的线性相关性较弱,模型训练难度加大,模型复杂度增加。为了提高模型的整体性能,降低模型训练难度,加快模型收敛,避免陷入局部最优解,可以设计一个神经网络模型,结合了医学上关于传染病如结核TB的先验知识进行训练。
具体的,对于目标疾病,可以观察到一些测试项目的值高于或低于健康人群的值。计算这些测试项目的超出部分,然后以表格形式添加到神经网络模型的第一个隐藏层的神经元。在这些神经元和输入层之间,只连接了测试项目的对应节点。采用了一种称为relu的激活函数,有效地传输了更多的信息。通过这种方式,优化了神经网络框架并改进了它的学习过程。
在一种可能的设计中,血液检测信息包括血常规数据CBC,训练模块102,用于:
根据血常规数据确定训练指标,其中,训练指标包括:中性粒细胞淋巴细胞比率以及血小板淋巴细胞比率。
需要说明的是,现有技术中认为:中性粒细胞/淋巴细胞比值 (neutrophil/ymphocyte ratio,NLR),血小板/淋巴细胞比值(platelet /lymphocyte ratio,PLR)与多种肿瘤病理参数和预后相关。也有文献探讨,重症新型冠状肺炎死亡风险与淋巴细胞/白细胞比值(lymphocyte/leukocyte ratio, LWR),中性粒细胞与淋巴细胞比值(NLR),淋巴细胞/单核细胞比值 (lymphocyte/monocyte ratio,LMR),血小板/淋巴细胞比值(platelet/lymphocyte ratio,PLR)及D-二聚体/血小板比值(d-dimer/platelet,DPR)相关性,但是上述指标是用于重症晚期患者的风险预测,虽然有上述2项比值,但是单项和组合效果均不理想。
本申请将NLR和PLR首次联合应用于传染病早期预测,也是首次将上述两项指标组合应用于人工智能预测模型。中性粒细胞是白细胞群体中多数细胞群体,主要作用是吞噬病原体,淋巴细胞则代表机体免疫系统功能。
这两项比值联合使用可综合反映机体炎症反应和免疫状态之间的平衡关系,提高对于传染性疾病早期识别的灵敏度、特异性和准确度,属于指标的新用途。理由如下:
第一,单一上述指标(即NLR和PLR中的任意一个)在个体内和个体间均存在差异度大,波动幅度大,且受到各种因素影响的问题。两项指标的联合应用可以实现对患者个体内和个体间混淆因素的自校正。这两个比值均以淋巴细胞为分母,可作为个体内自校正;两个比值分别以中性粒细胞和血小板两项血液指标中不同源的两类细胞,实现个体间的校正功能。
第二,指标疾病组和正常组可能无显著统计学差异,但是当计算比值时,由于不同指标对同一疾病变化程度不同,所以比值可以更为敏感的反应疾病的变化,而我们的模型选择的是疾病早期指标中性粒细胞和血小板,更能较好反应疾病早期的病生理改变
第三,由于基于人工智能的算法模型可以学习指标间的弱关联和非线性关联关系,通过与疾病知识结合,有效地特征选择能够提高模型的鲁棒性和泛化性,所以较统计学分析结果,能更准确且更早地找出与疾病的关联关系,我们的研究结果也进一步佐证了该假设。
综上,中性粒细胞淋巴细胞比率和血小板和淋巴细胞比率在相关技术中,一般用于对肿瘤或癌症的临床医学研究,例如甲状腺癌、直肠癌、乳腺癌、川崎病等,本申请打破了这一惯性,将这两个指标运用到传染病的早期识别和隐性感染者的识别中来,提高了传染病识别模型的识别准确度,使得在相同训练轮次数的基础上,传染病识别模型的识别准确度更高,收到了意料之外的技术效果。
在本实施例中,训练数据集包括:中性粒细胞淋巴细胞比率和血小板和淋巴细胞比率、22项血常规检测数据、性别以及年龄。
预设的传染病识别模型是初始的未经训练的模型,包括:神经网络模型、决策树模型(decision tree,DT)、随机森林模型(random forest,RF)、朴素贝叶斯模型、逻辑回归(Logistics Regression)模型和支持向量机模型(Support Vector Machine,SVM)中的至少一种。
检测模块103,用于:利用目标识别模型对实时检测数据进行识别检测,判断识别结果是否满足预设提示条件,若是,则输出提示信息,提示信息用于提示检测到实时检测数据对应的人员感染了传染病,且人员处于感染早期阶段。
上述实施例中,训练模块102使用了所有22项血常规数据,将其加入到了训练数据集当中。对于本领域人员来说,采用大数据的方式训练模型,数据量越大其所得到的训练结果就越好。但是本申请发明人在对传染病识别模型进行训练的过程中发现,训练数据量并非越大越好,血常规数据当中部分项目之间存在高相关性,这部分数据在训练时的贡献是重复的,这反而是使得训练效率下降,为了提高训练效率,下面的实施例中仅挑选血常规数据中的部分项目加入训练数据集当中。
即,在一种可能的设计中,训练模块102,还用于:
(1)利用预设测试模型,计算训练数据集中各项数据之间的共线性度,并测试各项数据的训练贡献度。
在本步骤中,首先计算血常规数据中任意两个检测项目之间的共线性度,其作用是识别任意两个检测项目之间的相关性,即通过共线性度可以判断任意两个检测项目是否高度相关,判断方式包括:判断共线性度是否大于预设线性阈值;若否,则证明这两个检测项目相互独立,可以将共线性度对应的两个检测项目都加入训练数据集中;若是,则证明这两个检测项目高度相关,需要从这两个检测项目中选择贡献度更大的检测项目,具体实施方式包括:利用预设测试模型,测试各个检测项目的训练贡献度;若训练贡献度大于预设训练阈值,则将对应的检测项目保留在训练数据集中。可选的,预设测试模型包括:基于随机森林的递归特征消除算法模型。
(2)根据共线性度、训练贡献度,从训练数据集中去除冗余数据。
在本步骤中,冗余数据对传染病识别模型的训练的影响程度不满足预设训练要求。
图2为本申请实施例提供的训练数据集中各项训练数据对训练贡献程度的shap图。如图2所示,横轴是shap-value即影响的权重。纵轴是各训练数据的名称。各训练数据的大小对训练结果的影响通过不同灰度的描点表示。描点的颜色越黑贡献度越大,颜色越浅贡献度越小。描点区域分布越宽,该训练数据对于模型的贡献度越大。以布病早期诊断模型为例,图中第一个项目血小板分布宽度(PDW)的贡献度最大,PDW结果高(黑色)对布病的识别结果是负向影响,PDW结果低(灰色)对布病的识别结果是正向影响。还需要说明的是,图2中sex代表性别,age代表年龄。
需要说明的是,在对不同的感染人群对应的传染病识别模型进行训练时,同一个检测项目对应的训练贡献度的大小不相同,训练数据集中包含的检测项目的数量也不相同。因为本申请发明人发现,由于传染病具有其自身的特点,可以划分为:急性期和慢性期,因此在构建传染病识别模型时,可以把感染人群划分为三种:A、包含所有急性期患者和慢性期患者;B、仅包含急性期患者;C、仅包含慢性期患者。
需要说明的是,三种感染人群对应的训练数据集都能够得到对应的传染病识别模型,本领域技术人员的惯性思维是A类人群所对应的传染病识别模型的识别准确性应该最高,因为其包含了所有的患者数据,但是本申请发明人在对三种传染病识别模型进行测试后发现,结果出乎意料,B类人群对应的传染病识别模型的识别准确性最高。
并且上述三类人群对应的训练数据集中血常规数据中的检测项目的数量也不相同,A类人群对应22项血常规数据,B类人群对应16项血常规数据, C类人群对应21项血常规数据。从模型训练效率上看B类人群所需要的训练数据较少,训练效率最高,其识别准确率也最高。
图3a为本申请实施例提供的采用A类人群训练后各个模型的识别灵敏度特性曲线图。
图3b为本申请实施例提供的采用B类人群训练后各个模型的识别灵敏度特性曲线图。
图3c为本申请实施例提供的采用C类人群训练后各个模型的识别灵敏度特性曲线图。
如图3a-3c所示,RF代表随机森林模型,GBM代表梯度提升机模型, SVM代表支持向量机模型,NNET代表神经网络模型,XGB代表极端梯度提升模型,RPART代表递归分割树模型,GLM代表广义线性模型。AUC表示曲线下面积,ACC为准确度,Recall为召回率,F1为统计学中用来衡量二分类模型精确度的一种指标,SP为特异度(Specific),SE为灵敏度(Sensitivity)。
B类人群对应的传染病识别模型,以GBM(Gradient Boosting Machine,梯度提升机)算法模型作为基础模型的准确率最高(曲线下面积AUC=0.997,准确度为95%,CI置信区间为0.994-0.999),特异性/敏感性分别为89.6%/99.8%,阳性预测值(PPV)/阴性预测值(NPV)为99.4%/96.7%。这些指标都比A类人群和C类人群对应的传染病识别模型要高。
因此,优选的,在对传染病识别模型进行训练时,所选择的感染人群包括:急性期患者。
图4为本申请实施例提供的一种布病识别模型训练时采用急性期患者作为训练数据时各项训练数据的贡献度示意图。如图3所示,根据贡献度大小由上到下依次排序为:嗜碱粒细胞绝对值(BASO.va)、红细胞分布变异系数 (R.CV)、嗜酸粒细胞绝对值(EO.va)、红细胞(RBC)、单核细胞百分比 (MONO.pcg)、嗜碱粒细胞百分比(BASO.pcg)、平均红细胞体积(MCV)、性别(sex)、单核细胞绝对值(MONO.va)、年龄(age)、血小板(PLT)、平均红细胞血红蛋白浓度(MCHC)、淋巴细胞绝对值(LYMPH.va)、中性粒细胞绝对值(NEUT.va)、淋巴细胞百分比(LYMPH.pcg)、中性粒细胞淋巴细胞比率(NLR)。
通过图2和图4,我们发现嗜碱粒细胞绝对值对布病识别准确性的贡献度最大,即在一种可能的设计中,训练数据集包括:嗜碱粒细胞绝对值。
在一种可能的设计中,训练数据集还包括:性别、年龄。
在一种可能的设计中,训练数据集还包括:嗜碱粒细胞绝对值、红细胞分布变异系数、嗜酸粒细胞绝对值、红细胞、单核细胞百分比、嗜碱粒细胞百分比、平均红细胞体积、单核细胞绝对值、血小板、平均红细胞血红蛋白浓度、淋巴细胞绝对值、中性粒细胞绝对值、淋巴细胞百分比。
图5为本申请实施例提供的另一种传染病检测装置的结构示意图。该传染病检测装置500可以通过软件、硬件或者两者的结合实现。
如图5所示,该传染病检测装置500包括:获取模块501、训练模块502、模型选择模块503以及检测模块505。
获取模块501,用于获取对健康人群以及传染病的感染人群的血液检测信息以及医疗机构的实时检测数据。
在本实施例中,血液检测信息包括:性别、年龄、临床诊断信息和血常规数据。
需要说明的是,本申请实施例中感染人群,仅包括布病急性期患者。
具体的,本实施例中的血液检测信息来源于医疗机构信息系统数据库。采集于2011年5月9日至2021年11月29日,首都医科大学附属北京地坛医院门诊、住院确诊为布病的患者数据作为病例组即感染人群;首都医科大学附属北京朝阳医院表观健康人的检验数据作为对照组(即健康人群的血液检测信息)。并对上述血液检测信息进行了脱敏处理。
在获取到血液检测信息后,还需要对血液检测信息进行数据结构化处理和数据标准化处理。具体可以参考图1所示实施例中获取模块101中的对应内容,在此不再赘述。
训练模块502,用于:
(1)根据血液检测信息中的血常规数据确定训练指标。
在本步骤中,训练指标包括:中性粒细胞淋巴细胞比率以及血小板淋巴细胞比率。
(2)利用预设测试模型,计算训练数据集中各项数据之间的共线性度,并测试各项数据的训练贡献度。
(3)根据共线性度、训练贡献度,去除血液检测信息中的冗余数据,其中,冗余数据对传染病识别模型的训练的影响程度不满足预设训练要求。
在步骤(2)和(3)中,计算血常规数据中任意两个检测项目之间的共线性度;判断共线性度是否大于预设线性阈值;若否,则将共线性度对应的两个检测项目都加入训练数据集中;若是,则利用预设测试模型,测试各个检测项目的训练贡献度;若训练贡献度大于预设训练阈值,则将对应的检测项目加入训练数据集中。
在本实施例中,利用基于随机森林的递归特征消除算法模型,对布病急性期患者的22项血常规数据和其它血液检测信息进行共线性度和训练贡献度筛查,选出16项训练数据,包括:嗜碱粒细胞绝对值(BASO.va)、红细胞分布变异系数(R.CV)、嗜酸粒细胞绝对值(EO.va)、红细胞(RBC)、单核细胞百分比(MONO.pcg)、嗜碱粒细胞百分比(BASO.pcg)、平均红细胞体积(MCV)、性别(sex)、单核细胞绝对值(MONO.va)、年龄(age)、血小板(PLT)、平均红细胞血红蛋白浓度(MCHC)、淋巴细胞绝对值 (LYMPH.va)、中性粒细胞绝对值(NEUT.va)、淋巴细胞百分比(LYMPH.pcg)、中性粒细胞淋巴细胞比率(NLR)。
(4)根据剩余的血液检测信息以及训练指标确定训练数据集。
在本步骤中,将去除冗余数据后剩余的血液检测信息与训练指标一起组成训练数据集。
(5)利用预设均衡模型,对训练数据集中的阴性数据和阳性数进行数据平衡处理,以均衡训练数据集中阴性数据和阳性数据的数量。
(6)利用预设划分方式,将训练数据集划分成多个第一训练集和至少一个第一测试集。
在本步骤中,使用十折交叉方式(10-fold cross validation)将数据集按照9: 1划分为9个第一训练集和一个第一测试集。这样可以避免数据抽取的随机性引起的数据分布不均的问题。
(7)利用预设训练算法,根据各个第一训练集,对一个或多个传染病识别模型进行循环训练。
在本步骤中,利用预设划分方式,将每个第一训练集划分成多个第二训练集和至少一个第二测试集;循环利用每个第一训练集中的各个第二训练集对一个或多个传染病识别模型进行训练,确定第一训练结果;在每次训练后,根据第二测试集对第一训练结果进行验证测试,确定第一测试结果,并根据第一测试结果对下一次训练中的参数进行调整。
具体的,本申请发明人发现,虽然第(6)步骤中,已经进行了一次十折交叉方式划分,但是仍然会出现数据抽取时随机性引起的数据分布不均的问题,为了进一步避免该问题,本申请实施例再一次使用十折交叉方式对第一训练集进行划分,将其中9份作为第二训练集,1份作为第二测试集。循环9 次进行训练,并用第二测试集对每次训练进行验证。
在每个第一训练集的训练完成后,都用第一测试集对训练结果进行再次测试,以提高训练后的传染病识别模型的识别准确性。
需要说明的是,未经训练的传染病识别模型即原始模型的类型包括:随机森林模型、朴素贝叶斯模型、决策树模型、逻辑回归模型、支持向量机模型、梯度提升机模型等等。
(8)在训练结束后,根据第一测试集对得到的待测试模型进行验证测试,判断待测试模型是否满足预设要求。
在本步骤中,若是,则重新利用预设划分方式,将训练数据集划分成多个第一训练集和至少一个第一测试集;若否,则确定待测试模型为目标识别模型。
模型选择模块503,用于:根据训练数据集中的测试集,确定各个待选识别模型的识别准确率;根据识别准确率从各个待选识别模型中确定至少一个目标识别模型。
在本实施例中,采用第一测试集中的数据将随机森林模型、朴素贝叶斯模型、决策树模型、逻辑回归模型、支持向量机模型这5种算法模型训练后的传染病识别模型进行比较,选出受试者工作特征(receiver operating characteristic curve,ROC)曲线的线下面积(area under curve,AUC)最大的模型。
图6为本申请实施例提供的各种传染病识别模型的识别准确率统计图。如图6所示,支持向量机模型的识别准确率最高,其次为随机森林模型,接下来是逻辑回归模型,然后是决策树模型,最后则是朴素贝叶斯模型。
图7为本申请实施例提供的各种传染病识别模型的ROC曲线统计图。如图7所示,支持向量机模型的识别准确性最优,AUC为0.991,准确度为95.55%,表现出良好的诊断效能。且该方法准确度结果测试集与验证集准确性(96.02%) 结果接近,模型稳定。具体的对比结果如表一所示:
Figure RE-GDA0003978008570000171
表一
其中,ACC为准确度,Recall为召回率,F1-Score为F1分数,是统计学中用来衡量二分类模型精确度的一种指标,Specific为特异度,Precision为灵敏度,AUC为曲线下面积。
检测模块504,用于:利用目标识别模型对实时检测数据进行识别检测,判断识别结果是否满足预设提示条件,若是,则输出提示信息,提示信息用于提示检测到实时检测数据对应的人员感染了传染病,且人员处于感染早期阶段。
图8为本申请实施例提供的一种传染病检测系统的结构示意图。该传染病检测系统800可以通过软件、硬件或者两者的结合实现。
如图8所示,该传染病检测系统800包括:
数据接收器801、模型训练器802、传染病检测器803;
数据接收器801获取对健康人群以及传染病的感染人群的血液检测信息,并将血液检测信息发送给模型训练器802;
模型训练器802根据血液检测信息确定训练指标,并根据血液检测信息以及训练指标确定训练数据集;模型训练器802根据训练数据集对预设的传染病识别模型进行训练,确定目标识别模型,并将目标识别模型发送给传染病检测器803;
数据接收器801获取医疗机构的实时检测数据,并将实时检测数据发送给传染病检测器803;
传染病检测器803利用目标识别模型对实时检测数据进行识别检测,判断识别结果是否满足预设提示条件,若是,则输出提示信息,提示信息用于提示检测到实时检测数据对应的人员感染了传染病,且人员处于感染早期阶段。
在一种可能的设计中,传染病识别模型为神经网络模型,模型训练器802 还用于:
将血液检测信息作为先验知识数据输入传染病识别模型的隐藏层中,以提高传染病识别模型的训练效率和识别准确度。
在一种可能的设计中,血液检测信息包括血常规数据,模型训练器802 根据血液检测信息确定训练指标,包括:
模型训练器802根据血常规数据确定训练指标,其中,训练指标包括:中性粒细胞淋巴细胞比率以及血小板淋巴细胞比率。
在一种可能的设计中,模型训练器802利用预设测试模型,计算训练数据集中各项数据之间的共线性度,并测试各项数据的训练贡献度;根据共线性度、训练贡献度,从训练数据集中去除冗余数据;其中,冗余数据对传染病识别模型的训练的影响程度不满足预设训练要求。
在一种可能的设计中,模型训练器802利用预设测试模型,计算训练数据集中各项数据之间的共线性度,并测试各项数据的训练贡献度;根据共线性度、训练贡献度,从训练数据集中去除冗余数据,包括:
计算血常规数据中任意两个检测项目之间的共线性度;
判断共线性度是否大于预设线性阈值;
若否,则将共线性度对应的两个检测项目都加入训练数据集中;
若是,则利用预设测试模型,测试各个检测项目的训练贡献度;若训练贡献度大于预设训练阈值,则将对应的检测项目保留在训练数据集中;
其中,在对不同的感染人群对应的传染病识别模型进行训练时,同一个检测项目对应的训练贡献度的大小不相同,训练数据集中包含的检测项目的数量也不相同。
在一种可能的设计中,感染人群包括:急性期患者。
在一种可能的设计中,训练数据集包括:嗜碱粒细胞绝对值。
在一种可能的设计中,训练数据集还包括:性别、年龄。
在一种可能的设计中,训练数据集还包括:嗜碱粒细胞绝对值、红细胞分布变异系数、嗜酸粒细胞绝对值、红细胞、单核细胞百分比、嗜碱粒细胞百分比、平均红细胞体积、单核细胞绝对值、血小板、平均红细胞血红蛋白浓度、淋巴细胞绝对值、中性粒细胞绝对值、淋巴细胞百分比。
在一种可能的设计中,模型训练器802根据训练数据集对预设的传染病识别模型进行训练,确定目标识别模型,包括:
模型训练器802利用预设划分方式,将训练数据集划分成多个第一训练集和至少一个第一测试集;
模型训练器802利用预设训练算法,根据各个第一训练集,对传染病识别模型进行循环训练;
在训练结束后,模型训练器802根据第一测试集对得到的待测试模型进行验证测试,判断待测试模型是否满足预设要求;
若是,则模型训练器802重新利用预设划分方式,将训练数据集划分成多个第一训练集和至少一个第一测试集;
若否,则确定待测试模型为目标识别模型。
在一种可能的设计中,模型训练器802利用预设训练算法,根据各个第一训练集,对传染病识别模型进行循环训练,包括:
模型训练器802利用预设划分方式,将每个第一训练集划分成多个第二训练集和至少一个第二测试集;
模型训练器802循环利用每个第一训练集中的各个第二训练集对传染病识别模型进行训练,确定第一训练结果;
在每次训练后,模型训练器802根据第二测试集对第一训练结果进行验证测试,确定第一测试结果,并根据第一测试结果对下一次训练中的参数进行调整。
在一种可能的设计中,模型训练器802在利用预设划分方式,将训练数据集划分成多个第一训练集和至少一个第一测试集之前,模型训练器802利用预设均衡模型,对训练数据集中的阴性数据和阳性数进行数据平衡处理,以均衡训练数据集中阴性数据和阳性数据的数量。
在一种可能的设计中,传染病识别模型包括多个不同类型的原始识别模型,每个原始识别模型经过训练模块的训练后,得到对应的待选识别模型,传染病检测系统还包括:模型选择器804;
模型选择器804根据训练数据集中的测试集,确定各个待选识别模型的识别准确率;
模型选择器804根据识别准确率从各个待选识别模型中确定至少一个目标识别模型。
值得说明的是,图8所示实施例提供的系统,可以执行上述任一装置实施例中对应模块的功能,其具体实现原理、技术特征、专业名词解释以及技术效果类似,在此不再赘述。
图9为本申请实施例提供的一种电子设备的结构示意图。如图9所示,该电子设备900,可以包括:至少一个处理器901和存储器902。图9示出的是以一个处理器为例的电子设备。
存储器902,用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。
存储器902可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
处理器901用于执行存储器902存储的计算机执行指令,以实现以上各方法实施例所述的方法。
其中,处理器901可能是一个中央处理器(central processing unit,简称为CPU),或者是特定集成电路(application specific integrated circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
可选地,存储器902既可以是独立的,也可以跟处理器901集成在一起。当所述存储器902是独立于处理器901之外的器件时,所述电子设备900,还可以包括:
总线903,用于连接所述处理器901以及所述存储器902。总线可以是工业标准体系结构(industry standard architecture,简称为ISA)总线、外部设备互连(peripheralcomponent,PCI)总线或扩展工业标准体系结构 (extended industry standardarchitecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器902和处理器901集成在一块芯片上实现,则存储器902和处理器901可以通过内部接口完成通信。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random accessmemory,RAM)、磁盘或者光盘等各种可以存储程序代码的介质,具体的,该计算机可读存储介质中存储有程序指令,程序指令用于实现上述各装置实施例中各模块所对应的逻辑功能。
本申请实施例还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由本申请的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (10)

1.一种传染病检测装置,其特征在于,包括:
获取模块,用于获取对健康人群以及传染病的感染人群的血液检测信息;
训练模块,用于:根据所述血液检测信息确定训练指标;根据所述血液检测信息以及所述训练指标确定训练数据集;根据所述训练数据集对预设的传染病识别模型进行训练,确定目标识别模型;
所述获取模块,还用于获取医疗机构的实时检测数据;
检测模块,用于:利用所述目标识别模型对所述实时检测数据进行识别检测,判断识别结果是否满足预设提示条件,若是,则输出提示信息,所述提示信息用于提示检测到所述实时检测数据对应的人员感染了所述传染病,且所述人员处于感染早期阶段。
2.根据权利要求1所述的传染病检测装置,其特征在于,所述传染病识别模型为神经网络模型,所述训练模块,还用于:
将所述血液检测信息作为先验知识数据输入所述传染病识别模型的隐藏层中,以提高所述传染病识别模型的训练效率和识别准确度。
3.根据权利要求1所述的传染病检测装置,其特征在于,所述血液检测信息包括血常规数据,所述训练模块,用于:
根据所述血常规数据确定所述训练指标,所述训练指标包括:中性粒细胞淋巴细胞比率以及血小板淋巴细胞比率。
4.根据权利要求3所述的传染病检测装置,其特征在于,所述训练模块,还用于:
利用预设测试模型,计算所述训练数据集中各项数据之间的共线性度,并测试各项所述数据的训练贡献度;根据所述共线性度、所述训练贡献度,从所述训练数据集中去除冗余数据;其中,所述冗余数据对所述传染病识别模型的训练的影响程度不满足预设训练要求。
5.根据权利要求4所述的传染病检测装置,其特征在于,所述训练模块,还用于:利用预设测试模型,计算所述训练数据集中各项数据之间的共线性度,并测试各项所述数据的训练贡献度;根据所述共线性度、所述训练贡献度,从所述训练数据集中去除冗余数据,包括:
计算所述血常规数据中任意两个检测项目之间的所述共线性度;
判断所述共线性度是否大于预设线性阈值;
若否,则将所述共线性度对应的两个所述检测项目都加入所述训练数据集中;
若是,则利用所述预设测试模型,测试各个所述检测项目的所述训练贡献度;若所述训练贡献度大于预设训练阈值,则将对应的所述检测项目保留在所述训练数据集中;
其中,在对不同的所述感染人群对应的所述传染病识别模型进行训练时,同一个所述检测项目对应的所述训练贡献度的大小不相同,所述训练数据集中包含的所述检测项目的数量也不相同。
6.根据权利要求3-5中任一项所述的传染病检测装置,其特征在于,所述感染人群包括:急性期患者。
7.根据权利要求3所述的传染病检测装置,其特征在于,所述训练数据集包括:嗜碱粒细胞绝对值。
8.根据权利要求6所述的传染病检测装置,其特征在于,所述训练数据集还包括:性别、年龄。
9.根据权利要求8所述的传染病检测装置,其特征在于,所述训练数据集还包括:嗜碱粒细胞绝对值、红细胞分布变异系数、嗜酸粒细胞绝对值、红细胞、单核细胞百分比、嗜碱粒细胞百分比、平均红细胞体积、单核细胞绝对值、血小板、平均红细胞血红蛋白浓度、淋巴细胞绝对值、中性粒细胞绝对值、淋巴细胞百分比。
10.根据权利要求3所述的传染病检测装置,其特征在于,所述训练模块,用于:根据所述训练数据集对预设的传染病识别模型进行训练,确定目标识别模型,包括:
利用预设划分方式,将所述训练数据集划分成多个第一训练集和至少一个第一测试集;
利用预设训练算法,根据各个所述第一训练集,对所述传染病识别模型进行循环训练;
在训练结束后,根据所述第一测试集对得到的待测试模型进行验证测试,判断所述待测试模型是否满足预设要求;
若是,则重新利用预设划分方式,将所述训练数据集划分成多个所述第一训练集和至少一个所述第一测试集;
若否,则确定所述待测试模型为所述目标识别模型。
CN202210922162.5A 2022-08-02 2022-08-02 传染病检测装置、设备、系统、介质及程序产品 Active CN115684570B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210922162.5A CN115684570B (zh) 2022-08-02 2022-08-02 传染病检测装置、设备、系统、介质及程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210922162.5A CN115684570B (zh) 2022-08-02 2022-08-02 传染病检测装置、设备、系统、介质及程序产品

Publications (2)

Publication Number Publication Date
CN115684570A true CN115684570A (zh) 2023-02-03
CN115684570B CN115684570B (zh) 2024-04-12

Family

ID=85061520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210922162.5A Active CN115684570B (zh) 2022-08-02 2022-08-02 传染病检测装置、设备、系统、介质及程序产品

Country Status (1)

Country Link
CN (1) CN115684570B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110584618A (zh) * 2019-08-15 2019-12-20 济南市疾病预防控制中心 基于人工智能的传染病机器识别系统
CN110957034A (zh) * 2018-09-26 2020-04-03 金敏 疾病预测系统
CN111524594A (zh) * 2020-06-12 2020-08-11 山东大学 目标人群血液系统恶性肿瘤筛查系统
CN112712181A (zh) * 2020-12-30 2021-04-27 深圳前海微众银行股份有限公司 模型构建优化方法、装置、设备和可读存储介质
CN113257428A (zh) * 2021-04-29 2021-08-13 深圳市儿童医院 一种川崎病丙球无反应预测方法、存储介质及终端设备
CN113539475A (zh) * 2021-05-14 2021-10-22 内蒙古卫数数据科技有限公司 一种仅使用血常规检验数据的疾病筛查和诊断方法
CN113611420A (zh) * 2021-08-11 2021-11-05 季凯 一种基于血液检查指标的疾病筛查方法和系统
CN114400087A (zh) * 2022-01-12 2022-04-26 内蒙古卫数数据科技有限公司 基于检验数据与知识图谱诊断布鲁氏菌病的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110957034A (zh) * 2018-09-26 2020-04-03 金敏 疾病预测系统
CN110584618A (zh) * 2019-08-15 2019-12-20 济南市疾病预防控制中心 基于人工智能的传染病机器识别系统
CN111524594A (zh) * 2020-06-12 2020-08-11 山东大学 目标人群血液系统恶性肿瘤筛查系统
CN112712181A (zh) * 2020-12-30 2021-04-27 深圳前海微众银行股份有限公司 模型构建优化方法、装置、设备和可读存储介质
CN113257428A (zh) * 2021-04-29 2021-08-13 深圳市儿童医院 一种川崎病丙球无反应预测方法、存储介质及终端设备
CN113539475A (zh) * 2021-05-14 2021-10-22 内蒙古卫数数据科技有限公司 一种仅使用血常规检验数据的疾病筛查和诊断方法
CN113611420A (zh) * 2021-08-11 2021-11-05 季凯 一种基于血液检查指标的疾病筛查方法和系统
CN114400087A (zh) * 2022-01-12 2022-04-26 内蒙古卫数数据科技有限公司 基于检验数据与知识图谱诊断布鲁氏菌病的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
钟小丽;任金霞;肖峰;徐海波;: "基于LASSO方法智能诊断新冠肺炎重症与非重症", 北京生物医学工程, no. 05, 14 October 2020 (2020-10-14), pages 499 - 505 *
钟小丽;任金霞;肖峰;徐海波;: "基于LASSO方法智能诊断新冠肺炎重症与非重症", 北京生物医学工程, no. 05, pages 499 - 505 *
陈振华;刘彬彬;陈忠南;谭云洪;: "病原学阴性初治肺结核患者诊断模型的建立及初步评价", 中国防痨杂志, no. 03, 10 March 2020 (2020-03-10), pages 266 - 271 *
陈振华;刘彬彬;陈忠南;谭云洪;: "病原学阴性初治肺结核患者诊断模型的建立及初步评价", 中国防痨杂志, no. 03, pages 266 - 271 *

Also Published As

Publication number Publication date
CN115684570B (zh) 2024-04-12

Similar Documents

Publication Publication Date Title
JP2022507861A (ja) 脳機能地図のサル-ヒト種間移行に基づいて精神疾患の個別的予測を行う方法およびシステム
Nasimov et al. A new approach to classifying myocardial infarction and cardiomyopathy using deep learning
Mahbub et al. Mobapp4infectiousdisease: Classify covid-19, pneumonia, and tuberculosis
CN113057587A (zh) 一种病症预警方法、装置、电子设备及存储介质
Zhu et al. Deep learning in the classification of stage of liver fibrosis in chronic hepatitis b with magnetic resonance ADC images
CN115684570B (zh) 传染病检测装置、设备、系统、介质及程序产品
US20230060794A1 (en) Diagnostic Tool
Perng et al. Analysis of the 72-h mortality of emergency room septic patients based on a deep belief network
Rosales et al. Vital Signs Evaluator and Blood Type Identification using Deep Learning for Blood Donation
Patel et al. Impact analysis of the complete blood count parameter using Naive Bayes
Raghav et al. Autism Spectrum Disorder Detection in Children Using Transfer Learning Techniques
RU2650212C1 (ru) Способ оценки гипердиагностики инфаркта миокарда
Jasim A Review of COVID-19 Diagnosis and Detection Using Artificial Intelligence
CN113555118B (zh) 一种病症程度的预测方法、装置、电子设备及存储介质
YAŞAR et al. A Proposed Model Can Classify the Covid-19 Pandemic Based on the Laboratory Test Results
Yu et al. Leukemia can be Effectively Early Predicted in Routine Physical Examination with the Assistance of Machine Learning Models
Sonarra et al. Detection and Classification of COVID-19 Chest X-rays by the Deep Learning Technique
FR3084508A1 (fr) Procede de prediction d’un bilan biologique
Liu et al. Improved PSP-net segmentation network for automatic detection of neovascularization in color fundus images
Lokuarachchi et al. Prediction of CKDu using KDQOL score, Ankle Swelling and Risk Factor Analysis using Neural Networks
Saravanakumar et al. Speed Efficient Fast Fourier Transform for Signal Processing of Nucleotides to Detect Diabetic Retinopathy Using Machine Learning
Vanam et al. A Complete Analysis of Alzheimer's Disease Detection Using Machine Learning Techniques
CN115758155A (zh) 一种基于随机森林算法的细菌性脑膜炎的智能诊断系统
Sivasangari et al. Diabetic Retinopathy Detection Using Convolution Neural Network
Meenakshi et al. An Efficient way of Predicting Covid-19 using Machine and Deep Learning Algorithms

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant