CN113555118A - 一种病症程度的预测方法、装置、电子设备及存储介质 - Google Patents

一种病症程度的预测方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113555118A
CN113555118A CN202110842349.XA CN202110842349A CN113555118A CN 113555118 A CN113555118 A CN 113555118A CN 202110842349 A CN202110842349 A CN 202110842349A CN 113555118 A CN113555118 A CN 113555118A
Authority
CN
China
Prior art keywords
clinical samples
biochemical
clinical
symptoms
indexes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110842349.XA
Other languages
English (en)
Other versions
CN113555118B (zh
Inventor
孙德俊
俞兰
王爱兰
杨家亮
田埂
刘晓玲
靳文
高丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Geneis Beijing Co ltd
Inner Mongolia Peoples Hospital
Original Assignee
Geneis Beijing Co ltd
Inner Mongolia Peoples Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Geneis Beijing Co ltd, Inner Mongolia Peoples Hospital filed Critical Geneis Beijing Co ltd
Priority to CN202110842349.XA priority Critical patent/CN113555118B/zh
Publication of CN113555118A publication Critical patent/CN113555118A/zh
Application granted granted Critical
Publication of CN113555118B publication Critical patent/CN113555118B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请公开了一种病症程度的预测方法、装置、电子设备及存储介质,能够解决现有技术中无法对特定疾病所对应的轻微病症与普通病症进行针对性预测的问题。病症程度的预测方法包括:获取待预测的临床样本;将待预测的临床样本输入到预先训练的预测模型,其中,预测模型基于表征为轻微症状的M个临床样本以及表征为普通症状的N个临床样本训练所得,M个临床样本中每个临床样本以及N个临床样本中每个临床样本均至少包括W个目标生化指标,每个目标生化指标在表征轻微病症与普通病症时存在显著性差异,M、N与W均为不小于1的正整数;输出待预测的临床样本所对应的病症程度。

Description

一种病症程度的预测方法、装置、电子设备及存储介质
技术领域
本申请涉及疾病诊断技术领域,具体而言,涉及一种病症程度的预测方法、装置、电子设备及存储介质。
背景技术
现有技术中,针对特定疾病而言,例如,新冠肺炎(COVID-19),主要针对新冠肺炎的重度病症进行预测,但是表征为重度病症的患者在全部患者中毕竟所占比例较小,绝大多数患者为表征为轻微病症或者普通病症的患者,而针对重度病症的预测方法并不适用于预测轻微病症或普通病症。即现有技术中缺乏针对于轻微病症与普通病症进行预测的方法。
发明内容
本申请实施例提供了一种病症程度的预测方法、装置、电子设备及存储介质,能够解决现有技术中无法对特定疾病所对应的轻微病症与普通病症进行针对性预测的问题。
第一方面,本申请实施例提供了一种病症程度的预测方法,所述预测方法包括:
获取待预测的临床样本;
将所述待预测的临床样本输入到预先训练的预测模型,其中,所述预测模型基于表征为轻微症状的M个临床样本以及表征为普通症状的N个临床样本训练所得,所述M个临床样本中每个临床样本以及所述N个临床样本中每个临床样本均至少包括W个目标生化指标,每个目标生化指标在表征轻微病症与普通病症时存在显著性差异,M、N与W均为不小于1的正整数;
输出所述待预测的临床样本所对应的病症程度。
本申请实施例中,预先训练的预测模型是基于表征为轻微症状的M个临床样本以及表征为普通症状的N个临床样本训练所得,并且M个临床样本中每个临床样本以及N个临床样本中每个临床样本均至少包括W个目标生化指标,W个目标生化指标中每个目标生化指标在表征轻微病症与普通病症时均具有显著性差异,因此当将待预测的临床样本输入到上述预测模型中时,可以准确的输出当前待测的临床样本所对应的病症程度,例如,病症程度为轻微病症、普通病症或者其他病症。
可选的,所述预测模型为集成模型,所述集成模型中采用岭回归分类器作为基学习器。
本申请实施例中,预测模型采用集成模型,并且该集成模型中采用岭回归分类器作为基学习器,使得最终的预测准确性较高。
可选的,在将所述待预测的临床样本输入到预先训练的预测模型之前,所述方法还包括:
获取表征为轻微症状的所述M个临床样本以及表征为普通症状的所述N个临床样本,其中,所述M个临床样本中每个临床样本与所述N个临床样本中的每个临床样本均包括P个生化指标,P不小于W的正整数;
基于所述M个临床样本与所述N个临床样本从所述P个生化指标中确定出Y个备选生化指标,所述Y个备选生化指标中任一备选生化指标在表征轻微病症与普通病症时存在显著性差异,Y为不大于P的正整数;
基于RFECV算法从所述Y个备选生化指标中确定出所述W个目标生化指标,Y为不小于W的正整数;
基于包含有所述W个目标生化指标的M个临床样本以及N个临床样本对预先建立的所述预测模型进行训练,获得已训练的所述预测模型。
本申请实施例中,所获取的表征为轻微病症的M个临床样本以及表征为普通病症的N个临床样本中每个临床样本均具有P个生化指标,首先可以从这P个生化指标中筛选出在表征轻微病症与普通病症时存在显著性差异的Y个备选生化指标,然后基于RFECV算法再从上述Y个备选生化指标中筛选出W个目标生化指标,这W个目标生化指标可以认为是能够使预测模型达到较高性能所需的最少生化指标的组合,那么利用包含有这W个目标生化指标的M个临床样本与N个临床样本来对预先建立的预测模型进行训练,可以使得训练完成后的预测模型具有较高的性能。
可选的,基于所述M个临床样本与所述N个临床样本从所述P个生化指标中确定出Y个备选生化指标包括:
随机从所述M个临床样本与所述N个临床样本各自抽取Q个临床样本,基于两组所述Q个临床样本对所述P个生化指标进行筛选,获得所述Y个备选生化指标,Q为不大于M与N中任一数的正整数,X为不小于1的正整数。
本申请实施例中,可以分别从表征轻微病症的M个临床样本以及表征为普通病症的N个临床样本中各自抽取Q个临床样本,然后基于两组独立的Q个临床样本来对P个生化指标进行筛选,从而筛选出Y个备选生化指标。该方法是基于部分临床样本来对P个生化指标进行筛选,从而减少了筛选过程的处理任务量。
可选的,基于两组所述Q个临床样本对所述P个生化指标进行筛选,获得所述Y个备选生化指标包括:
针对所述P个生化指标中的任一生化指标,对所述任一生化指标所对应两组所述Q个临床样本进行T检验,所述T检验的结果用于表征所述任一生化指标在表征轻微病症与普通病症时是否存在显著性差异;
若是,则将所述任一生化指标作为备选生化指标,以获得所述Y个备选生化指标。
本申请实施例中,针对P个生化指标中的任一生化指标而言,对来自不同临床样本总体的两组相互独立的临床样本进行T检验,若T检验的结果表明上述任一生化指标在表征轻微病症与普通病症时具有显著性差异,那么就将其作为备选生化指标,从而获得Y个备选生化指标。该方法中通过T检验的方式对P个生化指标进行逐一筛选,从而可以较为准确的确定出Y个备选生化指标。
可选的,从所述M个临床样本与所述N个临床样本各自抽取Q个临床样本采用有放回的抽取方式,且所述有放回的抽取方式被实施X次,X为不小于2的正整数。
本申请实施例中,可以多次有放回的从M个临床样本抽取Q个临床样本,以及从N个临床样本中抽取Q个子样本,那么每次都能够基于两组相互独立的Q个临床样本确定出Y个备选生化指标,以及基于Y个备选生化指标确定出W个目标生化指标,以便于从多组W个目标生化指标中进一步来确定出我们所需的W个目标生化指标。上述多次抽样的方式有利于从P个生化指标中筛选出对于预测模型最为重要的若干个目标生化指标,那么在基于该若干个目标生化指标所训练的预测模型的泛化性能力较高。
可选的,所述W个目标生化指标包括:白细胞数、血清中的乳酸脱氢酶数量、纤维蛋白原的重量、白蛋白/球蛋白的数量比值、平均血小板体积、血小板压积。
本申请实施例中,W个目标生化指标均为一些常规检查中涉及的生化指标,那么通过常规检查就可以判断对新型冠状肺炎的轻微病症与普通病症进行预测,而无需依赖于复杂的检查,能够适用于医疗资源较为匮乏的场景。
第二方面,本申请实施例提供了一种病症程度的预测装置,所述预测装置包括:
第一获取单元,用于获取待预测的临床样本;
输入单元,用于将所述待预测的临床样本输入到预先训练的预测模型,其中,所述预测模型基于表征为轻微症状的M个临床样本以及表征为普通症状的N个临床样本训练所得,所述M个临床样本中每个临床样本以及所述N个临床样本中每个临床样本均包括W个目标生化指标,每个目标生化指标在表征轻微病症与普通病症时存在显著性差异,M、N与W均为不小于1的正整数;
输出单元,用于输出所述待预测的临床样本所对应的病症程度。
可选的,所述预测模型为集成模型,所述集成模型中采用岭回归分类器作为基学习器。
可选的,所述预测装置还包括:
第二获取单元,用于获取表征为轻微症状的所述M个临床样本以及表征为普通症状的所述N个临床样本,其中,所述M个临床样本中每个临床样本与所述N个临床样本中的每个临床样本均包括P个生化指标,P不小于W的正整数;
第一筛选单元,用于基于所述M个临床样本与所述N个临床样本从所述P个生化指标中确定出Y个备选生化指标,所述Y个备选生化指标中任一备选生化指标在表征轻微病症与普通病症时存在显著性差异,Y为不大于P的正整数;
第二筛选单元,用于基于RFECV算法从所述Y个备选生化指标中确定出所述W个目标生化指标,Y为不小于W的正整数;
训练单元,用于基于包含有所述W个目标生化指标的M个临床样本以及N个临床样本对预先建立的所述预测模型进行训练,获得已训练的所述预测模型。
可选的,所述第一筛选单元具体用于:
随机从所述M个临床样本与所述N个临床样本各自抽取Q个临床样本,基于两组所述Q个临床样本对所述P个生化指标进行筛选,获得所述Y个备选生化指标,Q为不大于M与N中任一数的正整数,X为不小于1的正整数。
可选的,所述第一筛选单元具体还用于:
针对所述P个生化指标中的任一生化指标,对所述任一生化指标所对应两组所述Q个临床样本进行T检验,所述T检验的结果用于表征所述任一生化指标在表征轻微病症与普通病症时是否存在显著性差异;
若是,则将所述任一生化指标作为备选生化指标,以获得所述Y个备选生化指标。
可选的,从所述M个临床样本与所述N个临床样本各自抽取Q个临床样本采用有放回的抽取方式,且所述有放回的抽取方式被实施X次,X为不小于2的正整数。
可选的,所述W个目标生化指标包括:白细胞数、血清中的乳酸脱氢酶数量、纤维蛋白原的重量、白蛋白/球蛋白的数量比值、平均血小板体积、血小板压积。
第三方面,本申请实施例了提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现如第一方面任一实施例所述方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一实施例所述方法的步骤。
附图说明
图1为本申请实施例提供的一种病症程度的预测方法的流程示意图;
图2为本申请实施例提供的一种病症程度的预测装置的结构示意图;
图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。
现有技术中,针对特定疾病而言,例如,新冠肺炎(COVID-19),主要针对新冠肺炎的重度病症进行预测,而针对重度病症的预测方法并不适用于预测轻微病症或普通病症,即现有技术中缺乏针对于轻微病症与普通病症进行预测的方法。
鉴于此,本申请实施例中提供了一种病症程度的预测方法,该方法中,所使用的预测模型基于表征为轻微症状的M个临床样本以及表征为普通症状的N个临床样本训练所得,并且M个临床样本中每个临床样本以及N个临床样本中每个临床样本均至少包括W个目标生化指标,W个目标生化指标中每个目标生化指标在表征轻微病症与普通病症时均具有显著性差异,因此当将待预测的临床样本输入到上述预测模型中时,可以准确的输出当前待测的临床样本所对应的病症程度。
下面结合附图本申请实施例提供的技术方案进行介绍。请参见图1,本申请实施例提供了一种病症程度的预测方法,该方法的流程描述如下:
步骤101:获取待预测的临床样本。
本申请实施例中,当需要对特定疾病的疑似患者进行诊断时,例如,新冠肺炎的疑似患者,可以获得与该疑似患者相对应的临床样本。作为一种可能的实施方式,可以获取待预测的临床样本。
步骤102:将待预测的临床样本输入到预先训练的预测模型,预测模型基于表征为轻微症状的M个临床样本以及表征为普通症状的N个临床样本训练所得,M个临床样本中每个临床样本以及N个临床样本中每个临床样本均至少包括W个目标生化指标,每个目标生化指标在表征轻微病症与普通病症时存在显著性差异,M、N与W均为不小于1的正整数。
考虑到现有技术中主要针对特定疾病(例如新冠肺炎)的重度病症进行预测,而缺乏针对轻微病症与普通病症的预测方法。
鉴于此,本申请实施例中,可以利用包含有能够对轻微病症与普通病症的进行有效区分的生化指标的临床样本来对预先构建的预测模型进行训练,从而能够较为准确的对特定疾病所对应的轻微病症与普通病症进行预测。
作为一种可能的实施方式,所使用的预测模型基于表征为轻微症状的M个临床样本以及表征为普通症状的N个临床样本训练所得,并且M个临床样本中每个临床样本以及N个临床样本中每个临床样本均至少包括W个目标生化指标,W个目标生化指标中每个目标生化指标在表征轻微病症与普通病症时均具有显著性差异,那么可以认为该预测模型针对轻微病症与普通病症具有较好的预测性能。例如,W个目标生化指标包括:白细胞数、血清中的乳酸脱氢酶数量、纤维蛋白原的重量、白蛋白/球蛋白的数量比值、平均血小板体积、血小板压积。上述目标生化指标均为常规检查中所涉及的生化指标,即通过常规检查就可以判断对新型冠状肺炎的轻微病症与普通病症进行预测,而无需依赖于复杂的检查,能够适用于医疗资源较为匮乏的场景。应理解,M、N与W均为不小于1的正整数。
当需要对特定疾病(例如,新冠肺炎)的疑似患者进行诊断时,可以将该疑似患者所对应的待预测的临床样本输入到上述预测模型中。例如,上述预测模型采用可以集成模型,并且该集成模型中采用岭回归分类器作为基学习器,使得最终的预测准确性较高。
下面针对如何训练预测模型进行具体说明。
步骤一:筛选出W个目标生化指标。
首先可以获取表征为轻微病症的M个临床样本以及表征为普通病症的N个临床样本,该M个临床样本中每个临床样本以及N个临床样本中每个临床样本均包括有P个生化指标,P为不小于W的正整数。应理解,若上述临床样本中存在部分生化指标缺失的问题,可以进行填补,例如,可以基于K近邻算法进行填补,当然也可以基于其他方式进行填补,此处不做特别限制。
然后可以基于M个临床样本与N个临床样本从P个生化指标出筛选出Y个备选生化指标,该Y个备选生化指标中任一备选生化指标在表征轻微病症与普通病症时存在显著性差异,Y为不大于P的正整数。
具体的,考虑到所采集的表征为轻微症状的M个临床样本与表征为普通病症的N个临床样本的数量可能不相同,且M个临床样本与N个临床样本的数据量较大,筛选过程的处理的数据量较大,因此,本申请实施例中,可以分别从M个临床样本以及N个临床样本中各自抽取相同数量的临床样本来对P个生化指标进行筛选。
作为一种可能的实施方式,可以随机从M个临床样本与N个临床样本中各自抽取Q个临床样本,基于两组相互独立的Q个临床样本来对P个生化指标进行筛选,从而获得Y个备选生化指标,Q为不大于M与N中任一数的正整数。
具体的,针对P个生化指标中的任一生化指标,对与该任一生化指标所对应的两组相互独立的Q个临床样本进行T检验,T检验的结果可以表明该任一生化指标在表征轻微病症与普通病症时是否存在显著性差异。若确定T检测的结果为存在显著性差异,则可以将该任一生化指标作为备选生化指标。那么通过对上述P个生化指标中每个生化指标进行逐一或同时筛选,并可以得到Y个备选生化指标。
考虑到从P个生化指标中筛选出Y个备选生化指标后,该Y个备选生化指标的组合不一定能够使预测模型达到较好的性能,因此,可以对Y个备选生化指标中最佳的备选生化指标的组合进行筛选。
作为一种可能的实施方式,可以基于RFECV算法来从Y个备选生化指标中筛选出W个目标生化指标,Y为不小于W的正整数。应理解,基于RFECV算法所获得的W个目标生化指标可以认为是能够使预测模型达到较高性能所需的最少生化指标的组合,那么利用包含有这W个目标生化指标的M个临床样本与N个临床样本来对预先建立的预测模型进行训练,可以使得训练完成后的预测模型具有较高的性能。
步骤二:基于W个目标生化指标对预先构建的预测模型进行训练。
本申请实施例中,在从P个生化指标中筛选出W个目标生化指标之后,便可以利用包含有这W个目标生化指标的临床样本对预先构建的预测模型进行训练。
作为一种可能的实施方式,可以基于包括有W个目标生化指标的M个临床样本(表征轻微病症)以及包括有W个目标生化指标的N个临床样本(表征普通病症)来对预先建立的预测模型进行训练,从而获得已训练的预测模型。
在一些实施例中,考虑到仅基于一次抽样便从P个生化指标中确定出Y个备选生化指标可能具有偶然性,进而使得从Y个备选生化指标中所筛选出的W个目标生化指标的组合可能并非是最佳的,因此,本申请实施例中,可以多次从M个临床样本以及N个临床样本各自抽取出Q个临床样本,来对P个生化指标进行筛选,从而降低偶然性。
作为一种可能的实施方式,当从M个临床样本与N个临床样本各自抽取Q个临床样本可以采用有放回的抽取方式,例如,有放回的抽取方式可以被实施X次,X为不小于2的正整数。那么就可以基于每次所抽取出的两组相互独立的Q个临床样本,获得Y个备选生化指标,即可以到获得多组Y个备选生化指标。应理解,这多组Y个备选生化指标中,每组Y个备选生化指标之间可能存在部分生化指标不相同。在此基础上,可以基于RFECV算法对每组Y个备选生化指标进行筛选,从而获得多组W个目标生化指标,然后统计每个目标生化指标在多组W个目标生化指标中出现的次数,将多组W个目标生化指标中出现次数超过设定阈值的目标生化指标筛选出来,构成最终的W个目标生化指标。
例如,通过10次有放回的抽取,获得了10组W个目标生化指标,并且设定的阈值为8,然后统计每个目标生化指标在10次筛选过程中的出现次数,若某一目标生化指标出现的次数为9大于8(设定阈值),就将该目标生化指标作为最终的目标生化指标之一。上述多次抽取临床样本的方式有利于从P个生化指标中筛选出对于预测模型最为重要的若干个目标生化指标,那么在基于该若干个目标生化指标所训练的预测模型的泛化性能力较高。
步骤103:输出待预测的临床样本所对应的病症程度。
本申请实施例中,在将特定疾病(例如新冠肺炎)的疑似患者所对应的待预测临床样本输入到预先训练的预测模型之后,该预测模型便可以输出与该待预测的临床样本相对应的病症程度。例如,该疑似患者的病症程度为轻微病症或普通病症。
应理解,本申请中所提出的病症程度的预测方法,不仅适用于对新冠肺炎中轻微病症与普通病症进行预测,还适用于其他疾病中不同病症程度的预测,此处不做特别限制。另外,本申请中预测模型所输出的预测结果(轻微病症或普通病症)只是作为一种辅助信息,医生可以在此基础上,综合其他因素来得出最终的诊断结果,从而尽量减少出现误诊的情况。
请参见图2,基于同一发明构思,本申请实施例提供了一种病症程度的预测装置,该预测装置包括:第一获取单元201、输入单元202以及输出单元203。
第一获取单元201,用于获取待预测的临床样本;
输入单元202,用于将待预测的临床样本输入到预先训练的预测模型,其中,预测模型基于表征为轻微症状的M个临床样本以及表征为普通症状的N个临床样本训练所得,M个临床样本中每个临床样本以及N个临床样本中每个临床样本均包括W个目标生化指标,每个目标生化指标在表征轻微病症与普通病症时存在显著性差异,M、N与W均为不小于1的正整数;
输出单元203,用于输出待预测的临床样本所对应的病症程度。
可选的,预测模型为集成模型,集成模型中采用岭回归分类器作为基学习器。
可选的,该预测装置还包括:
第二获取单元,用于获取表征为轻微症状的M个临床样本以及表征为普通症状的N个临床样本,其中,M个临床样本中每个临床样本与N个临床样本中的每个临床样本均包括P个生化指标,P不小于W的正整数;
第一筛选单元,用于基于M个临床样本与N个临床样本从P个生化指标中确定出Y个备选生化指标,Y个备选生化指标中任一备选生化指标在表征轻微病症与普通病症时存在显著性差异,Y为不大于P的正整数;
第二筛选单元,用于基于RFECV算法从Y个备选生化指标中确定出所述W个目标生化指标,Y为不小于W的正整数;
训练单元,用于基于包含有W个目标生化指标的M个临床样本以及N个临床样本对预先建立的预测模型进行训练,获得已训练的预测模型。
可选的,第一筛选单元具体用于:
随机从M个临床样本与N个临床样本各自抽取Q个临床样本,基于两组所述Q个临床样本对P个生化指标进行筛选,获得Y个备选生化指标,Q为不大于M与N中任一数的正整数,X为不小于1的正整数。
可选的,第一筛选单元具体还用于:
针对P个生化指标中的任一生化指标,对任一生化指标所对应两组Q个临床样本进行T检验,T检验的结果用于表征任一生化指标在表征轻微病症与普通病症时是否存在显著性差异;
若是,则将任一生化指标作为备选生化指标,以获得Y个备选生化指标。
可选的,从M个临床样本与N个临床样本各自抽取Q个临床样本采用有放回的抽取方式,且有放回的抽取方式被实施X次,X为不小于2的正整数。
可选的,W个目标生化指标包括:白细胞数、血清中的乳酸脱氢酶数量、纤维蛋白原的重量、白蛋白/球蛋白的数量比值、平均血小板体积、血小板压积。
请参见图3,基于同一发明构思,本申请实施例还提供一种电子设备,该电子设备包括至少一个处理器301,处理器301用于执行存储器中存储的计算机程序,实现本申请实施例提供的如图1所示的病症程度的预测方法的步骤。
可选的,处理器301具体可以是中央处理器、特定ASIC,可以是一个或多个用于控制程序执行的集成电路。
可选的,该电子设备还可以包括与至少一个处理器301连接的存储器302,存储器302可以包括ROM、RAM和磁盘存储器。存储器302用于存储处理器301运行时所需的数据,即存储有可被至少一个处理器301执行的指令,至少一个处理器301通过执行存储器302存储的指令,执行如图1所示的方法。其中,存储器302的数量为一个或多个。其中,存储器302在图3中一并示出,但需要知道的是存储器302不是必选的功能模块,因此在图3中以虚线示出。
其中,第一获取单元201、输入单元202以及输出单元203所对应的实体设备均可以是前述的处理器301。该电子设备可以用于执行图1所示的实施例所提供的方法。因此关于该电子设备中各功能模块所能够实现的功能,可参考图1所示的实施例中的相应描述,不多赘述。
本申请实施例还提供一种计算机存储介质,其中,计算机存储介质存储有计算机指令,当计算机指令在计算机上运行时,使得计算机执行如图1所述的方法。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种病症程度的预测方法,其特征在于,所述预测方法包括:
获取待预测的临床样本;
将所述待预测的临床样本输入到预先训练的预测模型,其中,所述预测模型基于表征为轻微症状的M个临床样本以及表征为普通症状的N个临床样本训练所得,所述M个临床样本中每个临床样本以及所述N个临床样本中每个临床样本均至少包括W个目标生化指标,每个目标生化指标在表征轻微病症与普通病症时存在显著性差异,M、N与W均为不小于1的正整数;
输出所述待预测的临床样本所对应的病症程度。
2.如权利要求1所述的预测方法,其特征在于,所述预测模型为集成模型,所述集成模型中采用岭回归分类器作为基学习器。
3.如权利要求1所述的预测方法,其特征在于,在将所述待预测的临床样本输入到预先训练的预测模型之前,所述方法还包括:
获取表征为轻微症状的所述M个临床样本以及表征为普通症状的所述N个临床样本,其中,所述M个临床样本中每个临床样本与所述N个临床样本中的每个临床样本均包括P个生化指标,P不小于W的正整数;
基于所述M个临床样本与所述N个临床样本从所述P个生化指标中筛选出Y个备选生化指标,所述Y个备选生化指标中任一备选生化指标在表征轻微病症与普通病症时存在显著性差异,Y为不大于P的正整数;
基于RFECV算法从所述Y个备选生化指标中筛选出所述W个目标生化指标,Y为不小于W的正整数;
基于包含有所述W个目标生化指标的M个临床样本以及N个临床样本对预先建立的所述预测模型进行训练,获得已训练的所述预测模型。
4.如权利要求3所述的预测方法,其特征在于,基于所述M个临床样本与所述N个临床样本从所述P个生化指标中确定出Y个备选生化指标包括:
随机从所述M个临床样本与所述N个临床样本各自抽取Q个临床样本,基于两组所述Q个临床样本对所述P个生化指标进行筛选,获得所述Y个备选生化指标,Q为不大于M与N中任一数的正整数,X为不小于1的正整数。
5.如权利要求4所述的预测方法,其特征在于,基于两组所述Q个临床样本对所述P个生化指标进行筛选,获得所述Y个备选生化指标包括:
针对所述P个生化指标中的任一生化指标,对所述任一生化指标所对应两组所述Q个临床样本进行T检验,所述T检验的结果用于表征所述任一在表征轻微病症与普通病症时是否存在显著性差异;
若是,则将所述任一生化指标作为备选生化指标,以获得所述Y个备选生化指标。
6.如权利要求4所述的预测方法,其特征在于,从所述M个临床样本与所述N个临床样本各自抽取Q个临床样本采用有放回的抽取方式,且所述有放回的抽取方式被实施X次,X为不小于2的正整数。
7.如权利要求1所述的预测方法,其特征在于,所述W个目标生化指标包括:白细胞数、血清中的乳酸脱氢酶数量、纤维蛋白原的重量、白蛋白/球蛋白的数量比值、平均血小板体积、血小板压积。
8.一种病症程度的预测装置,其特征在于,所述预测装置包括:
第一获取单元,用于获取待预测的临床样本;
输入单元,用于将所述待预测的临床样本输入到预先训练的预测模型,其中,所述预测模型基于表征为轻微症状的M个临床样本以及表征为普通症状的N个临床样本训练所得,所述M个临床样本中每个临床样本以及所述N个临床样本中每个临床样本均包括W个目标生化指标,每个目标生化指标在表征轻微病症与普通病症时存在显著性差异,M、N与W均为不小于1的正整数;
输出单元,用于输出所述待预测的临床样本所对应的病症程度。
9.一种电子设备,其特征在于,所述电子设备包括至少一个处理器以及与所述至少一个处理器连接的存储器,所述至少一个处理器用于执行存储器中存储的计算机程序时实现如权利要求1-7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行是实现如权利要求1-7任一项所述方法的步骤。
CN202110842349.XA 2021-07-26 2021-07-26 一种病症程度的预测方法、装置、电子设备及存储介质 Active CN113555118B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110842349.XA CN113555118B (zh) 2021-07-26 2021-07-26 一种病症程度的预测方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110842349.XA CN113555118B (zh) 2021-07-26 2021-07-26 一种病症程度的预测方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113555118A true CN113555118A (zh) 2021-10-26
CN113555118B CN113555118B (zh) 2023-03-31

Family

ID=78104381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110842349.XA Active CN113555118B (zh) 2021-07-26 2021-07-26 一种病症程度的预测方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113555118B (zh)

Citations (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130082551A (ko) * 2011-12-08 2013-07-22 한국전자통신연구원 임상 자료 분석 장치 및 그것의 임상 자료 분석 방법
US20140344272A1 (en) * 2013-05-17 2014-11-20 Lawrence Sirovich Method for identifying and employing high risk genomic markers for the prediction of specific diseases
US20150239982A1 (en) * 2014-02-26 2015-08-27 Mochida Pharmaceutical Co., Ltd. Novel anti-presepsin antibody
CN105200043A (zh) * 2015-06-26 2015-12-30 宋尔卫 一种用于评估乳腺癌预后风险的试剂盒
CN107463798A (zh) * 2017-08-02 2017-12-12 南京高新生物医药公共服务平台有限公司 预测结肠腺癌预后的12‑基因表达分类器及其构建方法
CN108241057A (zh) * 2017-12-04 2018-07-03 深圳市第三人民医院 一种用来评估h7n9感染患者预后的标记物及其制备方法
CN108364687A (zh) * 2018-01-10 2018-08-03 北京郁金香伙伴科技有限公司 眼球状态预测方法及预测模型构建方法和设备
CN108531569A (zh) * 2017-03-03 2018-09-14 上海伯豪医学检验所有限公司 用于强迫症与精神分裂症、抑郁症甄别的基因标志物及其应用
CN108997499A (zh) * 2018-09-12 2018-12-14 首都医科大学附属北京胸科医院 一种抗人pd-l1抗体及其应用
US20190030078A1 (en) * 2017-07-25 2019-01-31 Insilico Medicine, Inc. Multi-stage personalized longevity therapeutics
US20190034581A1 (en) * 2017-07-25 2019-01-31 Insilico Medicine. Inc. Deep transcriptomic markers of human biological aging and methods of determining a biological aging clock
CN109326350A (zh) * 2018-09-25 2019-02-12 福建中医药大学 脑梗死临床诊疗系统
CN109423515A (zh) * 2017-08-18 2019-03-05 上海生物芯片有限公司 一组用于肝癌检测的基因标志物及其应用
CN109447183A (zh) * 2018-11-27 2019-03-08 东软集团股份有限公司 模型训练方法、装置、设备以及介质
CN109700434A (zh) * 2018-12-28 2019-05-03 武汉中旗生物医疗电子有限公司 基于心电图诊断的元学习模型训练方法、系统和设备
CN109841281A (zh) * 2017-11-29 2019-06-04 郑州大学第一附属医院 基于共表达相似性识别肺腺癌早期诊断标识及风险预测模型的构建方法
CN109858886A (zh) * 2019-02-18 2019-06-07 国网吉林省电力有限公司电力科学研究院 一种基于集成学习的费控成功率提升分析方法
CN110111886A (zh) * 2019-05-16 2019-08-09 闻康集团股份有限公司 一种基于XGBoost疾病预测的智能问诊系统及方法
CN110699454A (zh) * 2019-10-25 2020-01-17 北京艾迪康医学检验实验室有限公司 检测样本中mll5基因相对表达量的寡核苷酸、方法和试剂盒
CN110880369A (zh) * 2019-10-08 2020-03-13 中国石油大学(华东) 基于径向基函数神经网络的气体标志物检测方法及应用
CN110957049A (zh) * 2019-11-21 2020-04-03 武汉明德生物科技股份有限公司 基于医疗大数据的卒中救治网络系统及其应用方法
CN111110224A (zh) * 2020-01-17 2020-05-08 武汉中旗生物医疗电子有限公司 一种基于多角度特征提取的心电图分类方法及装置
CN111202511A (zh) * 2020-01-17 2020-05-29 武汉中旗生物医疗电子有限公司 一种心电数据标注的推荐分发方法及装置
CN111383770A (zh) * 2020-03-09 2020-07-07 北京大学 一种临床研究与随访融合系统和方法
CN111383766A (zh) * 2018-12-28 2020-07-07 中山大学肿瘤防治中心 计算机数据处理方法、装置、介质及电子设备
CN111524599A (zh) * 2020-04-24 2020-08-11 中国地质大学(武汉) 一种基于机器学习的新冠肺炎数据处理方法及预测系统
CN111564223A (zh) * 2020-07-20 2020-08-21 医渡云(北京)技术有限公司 传染病生存概率的预测方法、预测模型的训练方法及装置
CN111681757A (zh) * 2020-06-03 2020-09-18 广西壮族自治区人民医院 一种基于25(oh)d水平的新冠肺炎疾病严重程度的预测系统及其构建与使用方法
CN111681774A (zh) * 2020-08-11 2020-09-18 南京云联数科科技有限公司 用于流行性传染病预测的方法、计算设备和介质
CN111883258A (zh) * 2020-04-30 2020-11-03 浙江大学山东工业技术研究院 一种构建ohss分度分型预测模型的方法
CN112102945A (zh) * 2020-11-09 2020-12-18 电子科技大学 一种用于预测covid-19病患重症化的装置
CN112117006A (zh) * 2020-09-23 2020-12-22 重庆医科大学 基于集成学习的2型糖尿病肾脏疾病患病风险评估系统
CN112116957A (zh) * 2020-08-20 2020-12-22 澳门科技大学 基于小样本的疾病亚型预测方法、系统、装置及介质
CN112201318A (zh) * 2020-09-28 2021-01-08 无锡市第五人民医院 实验室指标模型在covid-19患者危险分层中的应用方法
CN112345750A (zh) * 2020-11-03 2021-02-09 上海市公共卫生临床中心 一种新冠肺炎病程预测和监控的分子标志物及其应用
CN112420192A (zh) * 2020-11-26 2021-02-26 清华大学 融合多维诊疗信息的疾病分型方法及相关设备
CN112798679A (zh) * 2020-10-16 2021-05-14 北京毅新博创生物科技有限公司 用于诊断新冠肺炎的试剂盒
CN112883180A (zh) * 2021-02-24 2021-06-01 挂号网(杭州)科技有限公司 模型训练方法、装置、电子设备和存储介质
CN112967810A (zh) * 2021-05-07 2021-06-15 四川大学华西医院 一种新冠病毒肺炎重症化预测系统及方法

Patent Citations (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130082551A (ko) * 2011-12-08 2013-07-22 한국전자통신연구원 임상 자료 분석 장치 및 그것의 임상 자료 분석 방법
US20140344272A1 (en) * 2013-05-17 2014-11-20 Lawrence Sirovich Method for identifying and employing high risk genomic markers for the prediction of specific diseases
US20150239982A1 (en) * 2014-02-26 2015-08-27 Mochida Pharmaceutical Co., Ltd. Novel anti-presepsin antibody
EP3112463B1 (en) * 2014-02-26 2019-09-04 Mochida Pharmaceutical Co., Ltd. Novel anti-presepsin antibody
CN105200043A (zh) * 2015-06-26 2015-12-30 宋尔卫 一种用于评估乳腺癌预后风险的试剂盒
CN108531569A (zh) * 2017-03-03 2018-09-14 上海伯豪医学检验所有限公司 用于强迫症与精神分裂症、抑郁症甄别的基因标志物及其应用
US20190034581A1 (en) * 2017-07-25 2019-01-31 Insilico Medicine. Inc. Deep transcriptomic markers of human biological aging and methods of determining a biological aging clock
US20190030078A1 (en) * 2017-07-25 2019-01-31 Insilico Medicine, Inc. Multi-stage personalized longevity therapeutics
CN107463798A (zh) * 2017-08-02 2017-12-12 南京高新生物医药公共服务平台有限公司 预测结肠腺癌预后的12‑基因表达分类器及其构建方法
CN109423515A (zh) * 2017-08-18 2019-03-05 上海生物芯片有限公司 一组用于肝癌检测的基因标志物及其应用
CN109841281A (zh) * 2017-11-29 2019-06-04 郑州大学第一附属医院 基于共表达相似性识别肺腺癌早期诊断标识及风险预测模型的构建方法
CN108241057A (zh) * 2017-12-04 2018-07-03 深圳市第三人民医院 一种用来评估h7n9感染患者预后的标记物及其制备方法
CN108364687A (zh) * 2018-01-10 2018-08-03 北京郁金香伙伴科技有限公司 眼球状态预测方法及预测模型构建方法和设备
CN108997499A (zh) * 2018-09-12 2018-12-14 首都医科大学附属北京胸科医院 一种抗人pd-l1抗体及其应用
CN109326350A (zh) * 2018-09-25 2019-02-12 福建中医药大学 脑梗死临床诊疗系统
CN109447183A (zh) * 2018-11-27 2019-03-08 东软集团股份有限公司 模型训练方法、装置、设备以及介质
CN109700434A (zh) * 2018-12-28 2019-05-03 武汉中旗生物医疗电子有限公司 基于心电图诊断的元学习模型训练方法、系统和设备
CN111383766A (zh) * 2018-12-28 2020-07-07 中山大学肿瘤防治中心 计算机数据处理方法、装置、介质及电子设备
CN109858886A (zh) * 2019-02-18 2019-06-07 国网吉林省电力有限公司电力科学研究院 一种基于集成学习的费控成功率提升分析方法
CN110111886A (zh) * 2019-05-16 2019-08-09 闻康集团股份有限公司 一种基于XGBoost疾病预测的智能问诊系统及方法
CN110880369A (zh) * 2019-10-08 2020-03-13 中国石油大学(华东) 基于径向基函数神经网络的气体标志物检测方法及应用
CN110699454A (zh) * 2019-10-25 2020-01-17 北京艾迪康医学检验实验室有限公司 检测样本中mll5基因相对表达量的寡核苷酸、方法和试剂盒
CN110957049A (zh) * 2019-11-21 2020-04-03 武汉明德生物科技股份有限公司 基于医疗大数据的卒中救治网络系统及其应用方法
CN111110224A (zh) * 2020-01-17 2020-05-08 武汉中旗生物医疗电子有限公司 一种基于多角度特征提取的心电图分类方法及装置
CN111202511A (zh) * 2020-01-17 2020-05-29 武汉中旗生物医疗电子有限公司 一种心电数据标注的推荐分发方法及装置
CN111383770A (zh) * 2020-03-09 2020-07-07 北京大学 一种临床研究与随访融合系统和方法
CN111524599A (zh) * 2020-04-24 2020-08-11 中国地质大学(武汉) 一种基于机器学习的新冠肺炎数据处理方法及预测系统
CN111883258A (zh) * 2020-04-30 2020-11-03 浙江大学山东工业技术研究院 一种构建ohss分度分型预测模型的方法
CN111681757A (zh) * 2020-06-03 2020-09-18 广西壮族自治区人民医院 一种基于25(oh)d水平的新冠肺炎疾病严重程度的预测系统及其构建与使用方法
CN111564223A (zh) * 2020-07-20 2020-08-21 医渡云(北京)技术有限公司 传染病生存概率的预测方法、预测模型的训练方法及装置
CN111681774A (zh) * 2020-08-11 2020-09-18 南京云联数科科技有限公司 用于流行性传染病预测的方法、计算设备和介质
CN112116957A (zh) * 2020-08-20 2020-12-22 澳门科技大学 基于小样本的疾病亚型预测方法、系统、装置及介质
CN112117006A (zh) * 2020-09-23 2020-12-22 重庆医科大学 基于集成学习的2型糖尿病肾脏疾病患病风险评估系统
CN112201318A (zh) * 2020-09-28 2021-01-08 无锡市第五人民医院 实验室指标模型在covid-19患者危险分层中的应用方法
CN112798679A (zh) * 2020-10-16 2021-05-14 北京毅新博创生物科技有限公司 用于诊断新冠肺炎的试剂盒
CN112858454A (zh) * 2020-10-16 2021-05-28 北京毅新博创生物科技有限公司 用于诊断新冠肺炎的特征多肽组合物
CN112345750A (zh) * 2020-11-03 2021-02-09 上海市公共卫生临床中心 一种新冠肺炎病程预测和监控的分子标志物及其应用
CN112102945A (zh) * 2020-11-09 2020-12-18 电子科技大学 一种用于预测covid-19病患重症化的装置
CN112420192A (zh) * 2020-11-26 2021-02-26 清华大学 融合多维诊疗信息的疾病分型方法及相关设备
CN112883180A (zh) * 2021-02-24 2021-06-01 挂号网(杭州)科技有限公司 模型训练方法、装置、电子设备和存储介质
CN112967810A (zh) * 2021-05-07 2021-06-15 四川大学华西医院 一种新冠病毒肺炎重症化预测系统及方法

Also Published As

Publication number Publication date
CN113555118B (zh) 2023-03-31

Similar Documents

Publication Publication Date Title
WO2020103683A1 (zh) 基于脑功能图谱的猴-人跨物种迁移进行精神疾病的个体化预测方法和系统
CN113053535B (zh) 一种医疗信息预测系统及医疗信息预测方法
JP7286863B2 (ja) 医療データの自動化された検証
CN112669960B (zh) 一种基于机器学习方法的肝脏纤维化预测模型的构建方法、预测系统、设备和存储介质
CN108511055A (zh) 基于分类器融合及诊断规则的室性早搏识别系统及方法
JP2013131211A (ja) 疾患診断のための最適の診断要素セット決定装置及び方法
CN111276203B (zh) 一种肿瘤自动登记分析方法及系统
CN111834017A (zh) 一种精神药物治疗效果预测方法,系统和装置
CN112786203A (zh) 一种机器学习糖尿病视网膜病变发病风险预测方法及应用
CN114242245A (zh) 一种基于电子病历记录数据预测糖尿病肾病发生风险的机器学习方法、系统和装置
Wang et al. Bone metabolic biomarker-based diagnosis of type 2 diabetes osteoporosis by support vector machine
KR20160072677A (ko) 의료 영상 진단 장치 및 방법
CN113555118B (zh) 一种病症程度的预测方法、装置、电子设备及存储介质
CN111081374B (zh) 基于共同注意力范式的孤独症辅助诊断装置
CN112784924A (zh) 基于分组聚合深度学习模型的肋骨骨折ct图像分类方法
CN107194918B (zh) 数据分析方法及装置
CN114707608A (zh) 医疗质控数据处理方法、装置、设备、介质及程序产品
CN109711467B (zh) 数据处理装置及方法、计算机系统
CN114121288A (zh) 基于ct的慢性阻塞性肺预测模型的生成装置、方法和介质
CN113469227A (zh) 一种用力呼气总量预测方法
CN113066549A (zh) 基于人工智能的医疗器械的临床有效性评估方法及系统
CN116741384B (zh) 一种基于床旁护理的重症急性胰腺炎临床数据管理方法
CN115132351B (zh) 基于真实世界研究的诊断数据反馈评价系统及方法
CN109948732B (zh) 基于非平衡学习的异常细胞远处转移分类方法及系统
Ndirangu et al. Support vector machine based disease diagnostic assistant

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant