CN116936087A - 尿毒症预测模型的训练方法、装置、电子设备及存储介质 - Google Patents

尿毒症预测模型的训练方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116936087A
CN116936087A CN202210348785.6A CN202210348785A CN116936087A CN 116936087 A CN116936087 A CN 116936087A CN 202210348785 A CN202210348785 A CN 202210348785A CN 116936087 A CN116936087 A CN 116936087A
Authority
CN
China
Prior art keywords
training
data
nephritis
privilege information
support vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210348785.6A
Other languages
English (en)
Inventor
段立新
刘丹蕾
夏虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guoxin Youe Data Co Ltd
Original Assignee
Guoxin Youe Data Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guoxin Youe Data Co Ltd filed Critical Guoxin Youe Data Co Ltd
Priority to CN202210348785.6A priority Critical patent/CN116936087A/zh
Publication of CN116936087A publication Critical patent/CN116936087A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请提供了一种尿毒症预测模型的训练方法、装置、电子设备及存储介质,其中,该方法包括:获取训练样本数据;训练样本数据包括第一类肾炎患者的患病标签训练数据、临床病理训练数据和基因训练数据;患病标签训练数据用于表征第一类肾炎患者是否患有尿毒症;生成第一类肾炎患者的临床病理训练数据对应的训练特征向量,以及基因训练数据对应的特权信息向量;根据训练特征向量、特权信息向量,以及患病标签训练数据,对待训练的基于特权信息的支持向量机模型进行训练,得到训练好的基于特权信息的支持向量机模型;训练好的基于特权信息的支持向量机模型用于预测肾炎患者是否患有尿毒症。通过该方法,有利于提高尿毒症预测模型预测的准确率。

Description

尿毒症预测模型的训练方法、装置、电子设备及存储介质
技术领域
本申请涉及计算机技术领域,尤其是涉及一种尿毒症预测模型的训练方法、装置、电子设备及存储介质。
背景技术
肾炎是一种肾脏疾病,肾炎如果发展到了肾衰竭晚期,则就是人们所讲的尿毒症。现有技术中,在对尿毒症预测模型进行训练时,通常仅使用临床病理数据对尿毒症预测模型进行训练,而尿毒症不仅仅与临床病理数据有关,因此,当仅使用临床病理数据对尿毒症预测模型进行训练时,会出现该模型预测的准确率低的问题。
发明内容
有鉴于此,本申请的目的在于提供一种尿毒症预测模型的训练方法、装置、电子设备及存储介质,以提高尿毒症预测模型进行预测的准确率。
第一方面,本申请实施例提供了一种尿毒症预测模型的训练方法,包括:
获取训练样本数据;所述训练样本数据包括第一类肾炎患者的患病标签训练数据,以及,每个所述第一类肾炎患者的临床病理训练数据和基因训练数据;所述患病标签训练数据用于表征所述第一类肾炎患者是否患有尿毒症;
针对每一个所述第一类肾炎患者,生成该第一类肾炎患者的临床病理训练数据对应的训练特征向量,以及,基因训练数据对应的特权信息向量;
根据每个所述第一类肾炎患者对应的所述训练特征向量、所述特权信息向量,以及,所述第一类肾炎患者的患病标签训练数据,对待训练的基于特权信息的支持向量机模型进行训练,得到训练好的基于特权信息的支持向量机模型;所述训练好的基于特权信息的支持向量机模型用于预测肾炎患者是否患有尿毒症。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,还包括:
获取测试样本数据;所述测试样本数据包括第二类肾炎患者的临床病理测试数据和患病标签测试数据;所述患病标签测试数据用于表征所述第二类肾炎患者是否患有尿毒症;
根据所述测试样本数据,确定所述训练好的基于特权信息的支持向量机模型的准确度;
根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新。
结合第一方面的第一种可能的实施方式,本申请实施例提供了第一方面的第二种可能的实施方式,其中,所述确定所述训练好的基于特权信息的支持向量机模型的准确度,包括:
针对每个所述第二类肾炎患者,生成该第二类肾炎患者的临床病理测试数据对应的测试特征向量;
针对每个所述第二类肾炎患者,将该第二类肾炎患者对应的所述测试特征向量作为所述训练好的基于特权信息的支持向量机模型的输入,得到对应的该第二类肾炎患者患有尿毒症的预测结果;
根据每个所述第二类肾炎患者患有尿毒症的预测结果以及每个所述第二类肾炎患者的患病标签测试数据,确定所述训练好的基于特权信息的支持向量机模型的准确度。
结合第一方面的第一种可能的实施方式,本申请实施例提供了第一方面的第三种可能的实施方式,其中,所述根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新,包括:
若所述准确度大于设定阈值,则确定所述训练好的基于特权信息的支持向量机模型为最优的基于特权信息的支持向量机模型;
若所述准确度不大于设定阈值,则对所述训练好的基于特权信息的支持向量机模型中的参数进行调整,并重复执行第一方面和第一方面的第一种可能的实施方式中记载的步骤。
结合第一方面,本申请实施例提供了第一方面的第四种可能的实施方式,其中,还包括:
获取待预测的目标肾炎患者的目标临床病理数据;
将用于表征所述目标临床病理数据的目标临床病理特征向量输入到所述训练好的基于特权信息的支持向量机模型中,得到所述目标肾炎患者患有尿毒症的目标预测结果;
根据所述目标肾炎患者的个人身份信息和所述目标预测结果,生成所述目标肾炎患者的目标检查报告;
将所述目标检查报告同步至检查报告查询系统。
结合第一方面的第四种可能的实施方式,本申请实施例提供了第一方面的第五种可能的实施方式,其中,还包括:
确定获取到所述目标肾炎患者的基因数据时,将所述目标肾炎患者的基因数据、临床病理数据以及患病标签作为训练样本数据。
第二方面,本申请实施例还提供一种尿毒症预测模型的训练装置,包括:第一获取模块,用于获取训练样本数据;所述训练样本数据包括第一类肾炎患者的患病标签训练数据,以及,每个所述第一类肾炎患者的临床病理训练数据和基因训练数据;所述患病标签训练数据用于表征所述第一类肾炎患者是否患有尿毒症;
第一生成模块,用于针对每一个所述第一类肾炎患者,生成该第一类肾炎患者的临床病理训练数据对应的训练特征向量,以及,基因训练数据对应的特权信息向量;
训练模块,用于根据每个所述第一类肾炎患者对应的所述训练特征向量、所述特权信息向量,以及,所述第一类肾炎患者的患病标签训练数据,对待训练的基于特权信息的支持向量机模型进行训练,得到训练好的基于特权信息的支持向量机模型;所述训练好的基于特权信息的支持向量机模型用于预测肾炎患者是否患有尿毒症。
结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,其中,还包括:
第二获取模块,用于获取测试样本数据;所述测试样本数据包括第二类肾炎患者的临床病理测试数据和患病标签测试数据;所述患病标签测试数据用于表征所述第二类肾炎患者是否患有尿毒症;
第一确定模块,用于根据所述测试样本数据,确定所述训练好的基于特权信息的支持向量机模型的准确度;
更新模块,用于根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新。
结合第二方面的第一种可能的实施方式,本申请实施例提供了第二方面的第二种可能的实施方式,其中,所述第一确定模块在用于确定所述训练好的基于特权信息的支持向量机模型的准确度时,具体用于:
针对每个所述第二类肾炎患者,生成该第二类肾炎患者的临床病理测试数据对应的测试特征向量;
针对每个所述第二类肾炎患者,将该第二类肾炎患者对应的所述测试特征向量作为所述训练好的基于特权信息的支持向量机模型的输入,得到对应的该第二类肾炎患者患有尿毒症的预测结果;
根据每个所述第二类肾炎患者患有尿毒症的预测结果以及每个所述第二类肾炎患者的患病标签测试数据,确定所述训练好的基于特权信息的支持向量机模型的准确度。
结合第二方面的第一种可能的实施方式,本申请实施例提供了第二方面的第三种可能的实施方式,其中,所述更新模块在用于根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新时,具体用于:
若所述准确度大于设定阈值,则确定所述训练好的基于特权信息的支持向量机模型为最优的基于特权信息的支持向量机模型;
若所述准确度不大于设定阈值,则对所述训练好的基于特权信息的支持向量机模型中的参数进行调整,并重复调用第二方面和第二方面的第一种可能的实施方式中记载的装置。
结合第二方面,本申请实施例提供了第二方面的第四种可能的实施方式,其中,还包括:
第三获取模块,用于获取待预测的目标肾炎患者的目标临床病理数据;
输入模块,用于将用于表征所述目标临床病理数据的目标临床病理特征向量输入到所述训练好的基于特权信息的支持向量机模型中,得到所述目标肾炎患者患有尿毒症的目标预测结果;
第二生成模块,用于根据所述目标肾炎患者的个人身份信息和所述目标预测结果,生成所述目标肾炎患者的目标检查报告;
同步模块,用于将所述目标检查报告同步至检查报告查询系统。
结合第二方面的第四种可能的实施方式,本申请实施例提供了第二方面的第五种可能的实施方式,其中,还包括:
第二确定模块,用于确定获取到所述目标肾炎患者的基因数据时,将所述目标肾炎患者的基因数据、临床病理数据以及患病标签作为训练样本数据。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面中任一种可能的实施方式中的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面中任一种可能的实施方式中的步骤。
本申请实施例提供的一种尿毒症预测模型的训练方法、装置、电子设备及存储介质,考虑到尿毒症与遗传有一定的关系,因此本申请通过使用临床病理训练数据和基因训练数据对待训练的基于特权信息的支持向量机模型进行训练,相比于现有技术中仅使用临床病理数据对预测模型进行训练的方式,本方法有利于提高模型预测的准确率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种尿毒症预测模型的训练方法的流程图;
图2示出了本申请实施例所提供的另一种尿毒症预测模型的训练方法的流程图;
图3示出了本申请实施例所提供的一种尿毒症预测模型的训练装置的结构示意图;
图4示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
考虑到当仅使用临床病理数据对尿毒症预测模型进行训练时,会使得该模型预测的准确率不高的问题,基于此,本申请实施例提供了一种尿毒症预测模型的训练方法、装置、电子设备及存储介质,以提高尿毒症预测模型进行预测的准确率,下面通过实施例进行描述。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种尿毒症预测模型的训练方法进行详细介绍。图1示出了本申请实施例所提供的一种尿毒症预测模型的训练方法的流程图,如图1所示,包括以下步骤S101-S101-S103:
S101:获取训练样本数据;训练样本数据包括第一类肾炎患者的患病标签训练数据,以及,每个第一类肾炎患者的临床病理训练数据和基因训练数据;患病标签训练数据用于表征第一类肾炎患者是否患有尿毒症。
第一类肾炎患者为患有肾炎的患者,其中,第一类肾炎患者有多个,第一类肾炎患者中包括已经发展为尿毒症的患者,还包括未发展到尿毒症的患者。临床病理训练数据包括临床训练数据和病理训练数据,其中,临床训练数据为对第一类肾炎患者进行临床检查后得到的临床检查数据,临床检查可以为血液检查、尿液检查等,示例性的,临床训练数据包括血压数据、血糖数据、白蛋白数据、尿蛋白数据等。病理训练数据为对第一类肾炎患者进行病理检查后得到的病理检查数据,病理检查可以为肾穿刺活检术(即肾活检),即需要切下来一小块肾脏的切片进行活体检测。
基因训练数据是对第一类肾炎患者进行基因检测后得到的基因检测数据,在对第一类肾炎患者进行基因检测时,具体检测与肾脏疾病相关的基因,观察它们是否产生变异以及变异情况。
在一种可能的实施方式中,在第一类肾炎患者进行完临床检查、病理检查以及基因检测,得到该第一类肾炎患者的临床检查数据、病理检查数据以及基因检测数据之后,先对该第一类肾炎患者的临床检查数据、病理检查数据以及基因检测数据进行筛选,将与肾病无关的数据删除,只将与肾病有关的数据筛选出来,根据筛选出来的与肾病有关的数据生成该第一类肾炎患者的临床病理训练数据和基因训练数据。
S102:针对每一个第一类肾炎患者,生成该第一类肾炎患者的临床病理训练数据对应的训练特征向量,以及,基因训练数据对应的特权信息向量。
在一个可能的实施方式中,在获取到第一类肾炎患者的临床病理训练数据和基因训练数据后,判断该第一类肾炎患者的临床病理训练数据和基因训练数据是否为有效数据,示例性的,当该第一类肾炎患者的临床病理训练数据和基因训练数据中存在数据缺失、数据遗漏等情况,则该第一类肾炎患者的临床病理训练数据和基因训练数据属于无效数据。
当该第一类肾炎患者的临床病理训练数据和基因训练数据为有效数据时,根据该第一类肾炎患者的临床病理训练数据生成训练特征向量,以及根据该第一类肾炎患者的基因训练数据生成特权信息向量。即本实施例中,将基因训练数据作为特权信息。
S103:根据每个第一类肾炎患者对应的训练特征向量、特权信息向量,以及,第一类肾炎患者的患病标签训练数据,对待训练的基于特权信息的支持向量机模型进行训练,得到训练好的基于特权信息的支持向量机模型;训练好的基于特权信息的支持向量机模型用于预测肾炎患者是否患有尿毒症。
在本实施例中,根据每个第一类肾炎患者对应的训练特征向量、特权信息向量,以及,第一类肾炎患者的患病标签训练数据,对待训练的基于特权信息的支持向量机模型进行训练时,具体可以为,将第一类肾炎患者对应的训练特征向量和特权信息向量输入到待训练的基于特权信息的支持向量机模型(基于特权信息学习SVM+模型)中,输出该第一类肾炎患者患有尿毒症的预测结果,其中该预测结果可以为第一类肾炎患者患有尿毒症的概率值。使用该第一类肾炎患者患有尿毒症的预测结果和患病标签训练数据进行损失函数计算,得到损失值,并利用该损失值对待训练的基于特权信息的支持向量机模型进行反向传播训练,以对待训练的基于特权信息的支持向量机模型中的可学习参数进行调整,直至所有的训练样本数据使用完毕,停止训练,得到训练好的基于特权信息的支持向量机模型。
本申请实施例提供的一种尿毒症预测模型的训练方法,考虑到尿毒症与遗传有一定的关系,某些遗传变异会导致这个某些人更容易得病,因此本申请将基因数据作为预测尿毒症的因素之一;本申请通过使用临床病理训练数据和基因训练数据对待训练的基于特权信息的支持向量机模型进行训练,相比于现有技术中仅使用临床病理数据对预测模型进行训练的方式,本方法有利于提高模型预测的准确率。
然而,在实际应用中,由于基因检测费用较高等原因,很多患者不会选择进行该项的检测,导致基因数据的获取比较困难且数据量较小。基于此,在实际应用中,大部分患者仅有临床病理数据。因此,本申请实施例在对预测模型进行训练时,将基因训练数据作为模型训练时的特权信息,将临床病理训练数据作为模型训练时的训练数据,使用该特权信息和训练数据对待训练的基于特权信息的支持向量机模型进行训练。这样后期应用该训练好的基于特权信息的支持向量机模型进行尿毒症预测时,只需要输入患者的临床病理数据对应的临床病理特征向量即可,无需患者的基因数据,从而即提高了预测准确率,又能够在一定程度上降低患者检测的成本。
在一种可能的实施方式中,图2示出了本申请实施例所提供的另一种尿毒症预测模型的训练方法的流程图,在执行完步骤S103得到训练好的基于特权信息的支持向量机模型之后,如图2所示,还可以按照以下步骤执行:
S1041:获取测试样本数据;测试样本数据包括第二类肾炎患者的临床病理测试数据和患病标签测试数据;患病标签测试数据用于表征第二类肾炎患者是否患有尿毒症。
在训练完基于特权信息的支持向量机模型后,为了保证该基于特权信息的支持向量机模型预测的准确度,本实施例中,使用测试样本数据对训练好的基于特权信息的支持向量机模型进行测试,以确定训练好的基于特权信息的支持向量机模型的准确度。
其中,第二类肾炎患者为患有肾炎的患者,第二类肾炎患者有多个,第二类肾炎患者中包括已经发展为尿毒症的患者,还包括未发展到尿毒症的患者。临床病理测试数据包括临床测试数据和病理测试数据,其中临床测试数据为对第二类肾炎患者进行临床检查后得到的临床检查数据;病理测试数据为对第二类肾炎患者进行病理检查后得到病理检查数据。
S1042:根据测试样本数据,确定训练好的基于特权信息的支持向量机模型的准确度。
具体地,针对每个第二类肾炎患者,生成该第二类肾炎患者的临床病理测试数据对应的测试特征向量。
针对每个第二类肾炎患者,将该第二类肾炎患者对应的测试特征向量作为训练好的基于特权信息的支持向量机模型的输入,得到对应的该第二类肾炎患者患有尿毒症的预测结果。其中,该第二类肾炎患者患有尿毒症的预测结果具体可以为第二类肾炎患者患有尿毒症的概率值,当该概率值大于预设概率值时,表示该第二类肾炎患者患有尿毒症,当该概率值不大于预设概率值时,表示该第二类肾炎患者未患有尿毒症。
根据每个第二类肾炎患者患有尿毒症的预测结果以及每个第二类肾炎患者的患病标签测试数据,确定训练好的基于特权信息的支持向量机模型的准确度。其中,准确度可以为:训练好的基于特权信息的支持向量机模型输出准确预测结果的个数与第二类肾炎患者总个数的比值(下文简称该比值为准确预测比值),和/或,AUC值(Area under the Curveof ROC,ROC曲线下方的面积)。
S1043:根据准确度,对训练好的基于特权信息的支持向量机模型进行更新。
在该实施例中,若准确度大于设定阈值,则表示该训练好的基于特权信息的支持向量机模型的准确度较高,此时确定训练好的基于特权信息的支持向量机模型为最优的基于特权信息的支持向量机模型。
若准确度不大于设定阈值,则对训练好的基于特权信息的支持向量机模型中的参数进行调整,并重复执行步骤S101-S103和/或S1041-S1043。
在该实施例中,若准确度不大于设定阈值,则表示该训练好的基于特权信息的支持向量机模型的准确度较低,此时需要重新对基于特权信息的支持向量机模型进行训练,和/或,重新对训练好的基于特权信息的支持向量机模型进行测试,直至训练好的基于特权信息的支持向量机模型的准确度大于设定阈值时停止。
在第一种可能的实施方式中,在执行步骤S1043根据准确度,对训练好的基于特权信息的支持向量机模型进行更新时,具体可以按照以下步骤执行:
根据准确预测比值和AUC值,对训练好的基于特权信息的支持向量机模型进行更新。
具体地,若准确预测比值大于设定第一阈值,并且,AUC值大于预设第二阈值,则确定训练好的基于特权信息的支持向量机模型为最优的基于特权信息的支持向量机模型。若准确预测比值不大于设定第一阈值,和/或,AUC值不大于预设第二阈值,则对训练好的基于特权信息的支持向量机模型中的参数进行调整,并重复执行步骤S101-S103以及S1041-S1043。
在第二种可能的实施方式中,在执行步骤S1043根据准确度,对训练好的基于特权信息的支持向量机模型进行更新时,具体可以按照以下步骤执行:
根据准确预测比值,对训练好的基于特权信息的支持向量机模型进行更新。
具体地,若准确预测比值大于设定第一阈值,则确定训练好的基于特权信息的支持向量机模型为最优的基于特权信息的支持向量机模型。若准确预测比值不大于设定第一阈值,则对训练好的基于特权信息的支持向量机模型中的参数进行调整,并重复执行步骤S101-S103以及S1041-S1043。
在第三种可能的实施方式中,在执行步骤S1043根据准确度,对训练好的基于特权信息的支持向量机模型进行更新时,具体可以按照以下步骤执行:
根据AUC值,对训练好的基于特权信息的支持向量机模型进行更新。
具体地,若AUC值大于预设第二阈值时,则确定训练好的基于特权信息的支持向量机模型为最优的基于特权信息的支持向量机模型。若AUC值不大于预设第二阈值时,则对训练好的基于特权信息的支持向量机模型中的参数进行调整,并重复执行步骤S101-S103以及S1041-S1043。
在一种可能的实施方式中,还可以按照以下步骤执行:
S1051:获取待预测的目标肾炎患者的目标临床病理数据。
在使用训练完的基于特权信息的支持向量机模型对目标肾炎患者进行预测过程中,其中,目标肾炎患者为患有肾炎的患者,目标临床病理数据包括目标临床数据和目标病理数据。目标临床数据是目标肾炎患者进行临床检查后得到的临床检查数据,目标病理数据是目标肾炎患者进行病理检查后得到的病理检查数据。
S1052:将用于表征目标临床病理数据的目标临床病理特征向量输入到训练好的基于特权信息的支持向量机模型中,得到目标肾炎患者患有尿毒症的目标预测结果。
根据目标临床病理数据生成目标临床病理特征向量,并将目标临床病理特征向量作为训练好的基于特权信息的支持向量机模型的输入,输出目标肾炎患者患有尿毒症的目标预测结果。其中,目标预测结果具体可以为目标肾炎患者患有尿毒症的概率值。
S1053:根据目标肾炎患者的个人身份信息和目标预测结果,生成目标肾炎患者的目标检查报告。
个人身份信息可以包括目标肾炎患者的姓名、身份证号码、手机号码等用于表征目标肾炎患者的个人身份的信息。
S1054:将目标检查报告同步至检查报告查询系统。
将目标检查报告同步至检查报告查询系统后,目标肾炎患者可以通过终端设备登录该检查报告查询系统,根据自己的个人身份信息查询得到自己的目标检查报告。
在一种可能的实施方式中,本发明实施例提供的方法还包括:
确定获取到目标肾炎患者的基因数据时,将目标肾炎患者的基因数据、临床病理数据以及患病标签作为训练样本数据。
由于基因检测需要花费患者的很多金钱和时间,因此不是每一个患者都会选择做基因检测,即基因数据较为难得,本实施例中,当目标肾炎患者做了基因检测时,可以获取目标肾炎患者的基因数据,将目标肾炎患者的基因数据、临床病理数据以及患病标签作为训练样本数据,以丰富训练样本数据的数量。
在一个可能的实施方式中,本实施例将采集和筛选出来的基因数据集中起来,建立一个基因数据库,该数据库可以联网方便全国范围内使用。具体地,将训练样本数据中的第一类肾炎患者的基因训练数据上传至基因数据库,以及当确定获取到目标肾炎患者的基因数据时,将目标肾炎患者的基因数据上传至基因数据库;当基因数据库中上传的目标肾炎患者的基因数据的数量达到预设数量时,使用第一类肾炎患者的基因训练数据、临床病理训练数据、患病标签训练数据以及目标肾炎患者的基因数据、临床病理数据、患病标签作为新的训练样本数据;并使用该新的训练样本数据对基于特权信息的支持向量机模型进行重新训练。
实施例二:
基于相同的技术构思,本申请实施例还提供了一种尿毒症预测模型的训练装置,图3示出了本申请实施例所提供的一种尿毒症预测模型的训练装置的结构示意图,如图3所示,该装置包括:
第一获取模块301,用于获取训练样本数据;所述训练样本数据包括第一类肾炎患者的患病标签训练数据,以及,每个所述第一类肾炎患者的临床病理训练数据和基因训练数据;所述患病标签训练数据用于表征所述第一类肾炎患者是否患有尿毒症;
第一生成模块302,用于针对每一个所述第一类肾炎患者,生成该第一类肾炎患者的临床病理训练数据对应的训练特征向量,以及,基因训练数据对应的特权信息向量;
训练模块303,用于根据每个所述第一类肾炎患者对应的所述训练特征向量、所述特权信息向量,以及,所述第一类肾炎患者的患病标签训练数据,对待训练的基于特权信息的支持向量机模型进行训练,得到训练好的基于特权信息的支持向量机模型;所述训练好的基于特权信息的支持向量机模型用于预测肾炎患者是否患有尿毒症。
可选的,还包括:
第二获取模块,用于获取测试样本数据;所述测试样本数据包括第二类肾炎患者的临床病理测试数据和患病标签测试数据;所述患病标签测试数据用于表征所述第二类肾炎患者是否患有尿毒症;
第一确定模块,用于根据所述测试样本数据,确定所述训练好的基于特权信息的支持向量机模型的准确度;
更新模块,用于根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新。
可选的,所述第一确定模块在用于确定所述训练好的基于特权信息的支持向量机模型的准确度时,具体用于:
针对每个所述第二类肾炎患者,生成该第二类肾炎患者的临床病理测试数据对应的测试特征向量;
针对每个所述第二类肾炎患者,将该第二类肾炎患者对应的所述测试特征向量作为所述训练好的基于特权信息的支持向量机模型的输入,得到对应的该第二类肾炎患者患有尿毒症的预测结果;
根据每个所述第二类肾炎患者患有尿毒症的预测结果以及每个所述第二类肾炎患者的患病标签测试数据,确定所述训练好的基于特权信息的支持向量机模型的准确度。
可选的,所述更新模块在用于根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新时,具体用于:
若所述准确度大于设定阈值,则确定所述训练好的基于特权信息的支持向量机模型为最优的基于特权信息的支持向量机模型;
若所述准确度不大于设定阈值,则对所述训练好的基于特权信息的支持向量机模型中的参数进行调整,并重复调用第二方面和第二方面的第一种可能的实施方式中记载的装置。
可选的,还包括:
第三获取模块,用于获取待预测的目标肾炎患者的目标临床病理数据;
输入模块,用于将用于表征所述目标临床病理数据的目标临床病理特征向量输入到所述训练好的基于特权信息的支持向量机模型中,得到所述目标肾炎患者患有尿毒症的目标预测结果;
第二生成模块,用于根据所述目标肾炎患者的个人身份信息和所述目标预测结果,生成所述目标肾炎患者的目标检查报告;
同步模块,用于将所述目标检查报告同步至检查报告查询系统。
可选的,还包括:
第二确定模块,用于确定获取到所述目标肾炎患者的基因数据时,将所述目标肾炎患者的基因数据、临床病理数据以及患病标签作为训练样本数据。
关于具体执行的方法步骤和原理参见实施例一的说明,在此不再详细赘述。
实施例三:
基于相同的技术构思,本申请实施例还提供一种电子设备,图4示出了本申请实施例所提供的一种电子设备的结构示意图,如图4所示,该电子设备400包括:处理器401、存储器402和总线403,存储器存储有处理器可执行的机器可读指令,当电子设备运行时,处理器401与存储器402之间通过总线403通信,处理器401执行机器可读指令,以执行实施例一中所述的方法步骤。
关于具体执行的方法步骤和原理参见实施例一的说明,在此不再详细赘述。
实施例四:
基于相同的技术构思,本申请实施例四还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行实施例一中所述的方法步骤。
关于具体执行的方法步骤和原理参见实施例一的说明,在此不再详细赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种尿毒症预测模型的训练方法,其特征在于,包括:
获取训练样本数据;所述训练样本数据包括第一类肾炎患者的患病标签训练数据,以及,每个所述第一类肾炎患者的临床病理训练数据和基因训练数据;所述患病标签训练数据用于表征所述第一类肾炎患者是否患有尿毒症;
针对每一个所述第一类肾炎患者,生成该第一类肾炎患者的临床病理训练数据对应的训练特征向量,以及,基因训练数据对应的特权信息向量;
根据每个所述第一类肾炎患者对应的所述训练特征向量、所述特权信息向量,以及,所述第一类肾炎患者的患病标签训练数据,对待训练的基于特权信息的支持向量机模型进行训练,得到训练好的基于特权信息的支持向量机模型;所述训练好的基于特权信息的支持向量机模型用于预测肾炎患者是否患有尿毒症。
2.根据权利要求1所述的训练方法,其特征在于,还包括:
获取测试样本数据;所述测试样本数据包括第二类肾炎患者的临床病理测试数据和患病标签测试数据;所述患病标签测试数据用于表征所述第二类肾炎患者是否患有尿毒症;
根据所述测试样本数据,确定所述训练好的基于特权信息的支持向量机模型的准确度;
根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新。
3.根据权利要求2所述的训练方法,其特征在于,所述确定所述训练好的基于特权信息的支持向量机模型的准确度,包括:
针对每个所述第二类肾炎患者,生成该第二类肾炎患者的临床病理测试数据对应的测试特征向量;
针对每个所述第二类肾炎患者,将该第二类肾炎患者对应的所述测试特征向量作为所述训练好的基于特权信息的支持向量机模型的输入,得到对应的该第二类肾炎患者患有尿毒症的预测结果;
根据每个所述第二类肾炎患者患有尿毒症的预测结果以及每个所述第二类肾炎患者的患病标签测试数据,确定所述训练好的基于特权信息的支持向量机模型的准确度。
4.根据权利要求2所述的训练方法,其特征在于,所述根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新,包括:
若所述准确度大于设定阈值,则确定所述训练好的基于特权信息的支持向量机模型为最优的基于特权信息的支持向量机模型;
若所述准确度不大于设定阈值,则对所述训练好的基于特权信息的支持向量机模型中的参数进行调整,并重复执行权利要求1-2记载的步骤。
5.根据权利要求1所述的训练方法,其特征在于,还包括:
获取待预测的目标肾炎患者的目标临床病理数据;
将用于表征所述目标临床病理数据的目标临床病理特征向量输入到所述训练好的基于特权信息的支持向量机模型中,得到所述目标肾炎患者患有尿毒症的目标预测结果;
根据所述目标肾炎患者的个人身份信息和所述目标预测结果,生成所述目标肾炎患者的目标检查报告;
将所述目标检查报告同步至检查报告查询系统。
6.根据权利要求5所述的训练方法,其特征在于,还包括:
确定获取到所述目标肾炎患者的基因数据时,将所述目标肾炎患者的基因数据、临床病理数据以及患病标签作为训练样本数据。
7.一种尿毒症预测模型的训练装置,其特征在于,包括:
第一获取模块,用于获取训练样本数据;所述训练样本数据包括第一类肾炎患者的患病标签训练数据,以及,每个所述第一类肾炎患者的临床病理训练数据和基因训练数据;所述患病标签训练数据用于表征所述第一类肾炎患者是否患有尿毒症;
第一生成模块,用于针对每一个所述第一类肾炎患者,生成该第一类肾炎患者的临床病理训练数据对应的训练特征向量,以及,基因训练数据对应的特权信息向量;
训练模块,用于根据每个所述第一类肾炎患者对应的所述训练特征向量、所述特权信息向量,以及,所述第一类肾炎患者的患病标签训练数据,对待训练的基于特权信息的支持向量机模型进行训练,得到训练好的基于特权信息的支持向量机模型;所述训练好的基于特权信息的支持向量机模型用于预测肾炎患者是否患有尿毒症。
8.根据权利要求7所述的训练装置,其特征在于,还包括:
第二获取模块,用于获取测试样本数据;所述测试样本数据包括第二类肾炎患者的临床病理测试数据和患病标签测试数据;所述患病标签测试数据用于表征所述第二类肾炎患者是否患有尿毒症;
第一确定模块,用于根据所述测试样本数据,确定所述训练好的基于特权信息的支持向量机模型的准确度;
更新模块,用于根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至6任一所述的训练方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至6任一所述的训练方法的步骤。
CN202210348785.6A 2022-04-01 2022-04-01 尿毒症预测模型的训练方法、装置、电子设备及存储介质 Pending CN116936087A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210348785.6A CN116936087A (zh) 2022-04-01 2022-04-01 尿毒症预测模型的训练方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210348785.6A CN116936087A (zh) 2022-04-01 2022-04-01 尿毒症预测模型的训练方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116936087A true CN116936087A (zh) 2023-10-24

Family

ID=88385045

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210348785.6A Pending CN116936087A (zh) 2022-04-01 2022-04-01 尿毒症预测模型的训练方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116936087A (zh)

Similar Documents

Publication Publication Date Title
JP6611873B2 (ja) 生物学的経路の調節相互作用の学習および同定用のシステムならびに方法
US20180144244A1 (en) Distributed clinical workflow training of deep learning neural networks
WO2020181805A1 (zh) 糖尿病的预测方法及装置、存储介质、计算机设备
CN113053535B (zh) 一种医疗信息预测系统及医疗信息预测方法
US11529105B2 (en) Digital twin updating
US20220215899A1 (en) Affinity prediction method and apparatus, method and apparatus for training affinity prediction model, device and medium
Ni et al. Variable selection for case-cohort studies with failure time outcome
CN115938590A (zh) 结直肠癌术后lars预测模型的构建方法及预测系统
Song et al. Bayesian hierarchical models for high‐dimensional mediation analysis with coordinated selection of correlated mediators
CN111430037A (zh) 相似病历查找方法及系统
CN111161884A (zh) 针对不平衡数据的疾病预测方法、装置、设备及介质
CN113192627A (zh) 一种基于病人与疾病二部图的再入院预测方法及系统
CN117290509A (zh) 电子病历文本分类模型训练方法、装置、电子设备及介质
CN116936087A (zh) 尿毒症预测模型的训练方法、装置、电子设备及存储介质
CN116302870A (zh) 基于进化图的机械硬盘健康评估方法、系统和存储介质
Chang et al. To cut or not to cut? Assessing the modular structure of brain networks
CN113678147A (zh) 搜索方法以及信息处理系统
CN114360732B (zh) 医疗数据分析方法、装置、电子设备及存储介质
CN113782092B (zh) 一种生存期预测模型的生成方法及装置、存储介质
JP6625840B2 (ja) 健康管理支援装置、健康管理支援システム及び健康管理支援方法
CN108831554B (zh) 医疗信息处理方法及装置
JP2021135603A (ja) 判定装置、モデル生成装置、判定方法及び判定プログラム
JP7313165B2 (ja) アルツハイマー病生存分析装置及びアルツハイマー病生存分析プログラム
CN111210910A (zh) 猪只疾病诊断方法及系统
CN113223677A (zh) 针对患者的医生匹配方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination