CN116936087A - 尿毒症预测模型的训练方法、装置、电子设备及存储介质 - Google Patents
尿毒症预测模型的训练方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116936087A CN116936087A CN202210348785.6A CN202210348785A CN116936087A CN 116936087 A CN116936087 A CN 116936087A CN 202210348785 A CN202210348785 A CN 202210348785A CN 116936087 A CN116936087 A CN 116936087A
- Authority
- CN
- China
- Prior art keywords
- training
- data
- nephritis
- privilege information
- support vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 171
- 208000037157 Azotemia Diseases 0.000 title claims abstract description 80
- 208000009852 uremia Diseases 0.000 title claims abstract description 80
- 238000000034 method Methods 0.000 title claims abstract description 48
- 201000008383 nephritis Diseases 0.000 claims abstract description 178
- 238000012706 support-vector machine Methods 0.000 claims abstract description 111
- 230000007170 pathology Effects 0.000 claims abstract description 74
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 60
- 239000013598 vector Substances 0.000 claims abstract description 52
- 201000010099 disease Diseases 0.000 claims abstract description 47
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 47
- 238000012360 testing method Methods 0.000 claims description 63
- 238000007689 inspection Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 3
- 230000001575 pathological effect Effects 0.000 description 14
- 238000001514 detection method Methods 0.000 description 12
- 230000002068 genetic effect Effects 0.000 description 5
- 208000017169 kidney disease Diseases 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000001574 biopsy Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 102000009027 Albumins Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 206010023435 Kidney small Diseases 0.000 description 1
- 208000001647 Renal Insufficiency Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000004159 blood analysis Methods 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000011862 kidney biopsy Methods 0.000 description 1
- 201000006370 kidney failure Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本申请提供了一种尿毒症预测模型的训练方法、装置、电子设备及存储介质,其中,该方法包括:获取训练样本数据;训练样本数据包括第一类肾炎患者的患病标签训练数据、临床病理训练数据和基因训练数据;患病标签训练数据用于表征第一类肾炎患者是否患有尿毒症;生成第一类肾炎患者的临床病理训练数据对应的训练特征向量,以及基因训练数据对应的特权信息向量;根据训练特征向量、特权信息向量,以及患病标签训练数据,对待训练的基于特权信息的支持向量机模型进行训练,得到训练好的基于特权信息的支持向量机模型;训练好的基于特权信息的支持向量机模型用于预测肾炎患者是否患有尿毒症。通过该方法,有利于提高尿毒症预测模型预测的准确率。
Description
技术领域
本申请涉及计算机技术领域,尤其是涉及一种尿毒症预测模型的训练方法、装置、电子设备及存储介质。
背景技术
肾炎是一种肾脏疾病,肾炎如果发展到了肾衰竭晚期,则就是人们所讲的尿毒症。现有技术中,在对尿毒症预测模型进行训练时,通常仅使用临床病理数据对尿毒症预测模型进行训练,而尿毒症不仅仅与临床病理数据有关,因此,当仅使用临床病理数据对尿毒症预测模型进行训练时,会出现该模型预测的准确率低的问题。
发明内容
有鉴于此,本申请的目的在于提供一种尿毒症预测模型的训练方法、装置、电子设备及存储介质,以提高尿毒症预测模型进行预测的准确率。
第一方面,本申请实施例提供了一种尿毒症预测模型的训练方法,包括:
获取训练样本数据;所述训练样本数据包括第一类肾炎患者的患病标签训练数据,以及,每个所述第一类肾炎患者的临床病理训练数据和基因训练数据;所述患病标签训练数据用于表征所述第一类肾炎患者是否患有尿毒症;
针对每一个所述第一类肾炎患者,生成该第一类肾炎患者的临床病理训练数据对应的训练特征向量,以及,基因训练数据对应的特权信息向量;
根据每个所述第一类肾炎患者对应的所述训练特征向量、所述特权信息向量,以及,所述第一类肾炎患者的患病标签训练数据,对待训练的基于特权信息的支持向量机模型进行训练,得到训练好的基于特权信息的支持向量机模型;所述训练好的基于特权信息的支持向量机模型用于预测肾炎患者是否患有尿毒症。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,还包括:
获取测试样本数据;所述测试样本数据包括第二类肾炎患者的临床病理测试数据和患病标签测试数据;所述患病标签测试数据用于表征所述第二类肾炎患者是否患有尿毒症;
根据所述测试样本数据,确定所述训练好的基于特权信息的支持向量机模型的准确度;
根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新。
结合第一方面的第一种可能的实施方式,本申请实施例提供了第一方面的第二种可能的实施方式,其中,所述确定所述训练好的基于特权信息的支持向量机模型的准确度,包括:
针对每个所述第二类肾炎患者,生成该第二类肾炎患者的临床病理测试数据对应的测试特征向量;
针对每个所述第二类肾炎患者,将该第二类肾炎患者对应的所述测试特征向量作为所述训练好的基于特权信息的支持向量机模型的输入,得到对应的该第二类肾炎患者患有尿毒症的预测结果;
根据每个所述第二类肾炎患者患有尿毒症的预测结果以及每个所述第二类肾炎患者的患病标签测试数据,确定所述训练好的基于特权信息的支持向量机模型的准确度。
结合第一方面的第一种可能的实施方式,本申请实施例提供了第一方面的第三种可能的实施方式,其中,所述根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新,包括:
若所述准确度大于设定阈值,则确定所述训练好的基于特权信息的支持向量机模型为最优的基于特权信息的支持向量机模型;
若所述准确度不大于设定阈值,则对所述训练好的基于特权信息的支持向量机模型中的参数进行调整,并重复执行第一方面和第一方面的第一种可能的实施方式中记载的步骤。
结合第一方面,本申请实施例提供了第一方面的第四种可能的实施方式,其中,还包括:
获取待预测的目标肾炎患者的目标临床病理数据;
将用于表征所述目标临床病理数据的目标临床病理特征向量输入到所述训练好的基于特权信息的支持向量机模型中,得到所述目标肾炎患者患有尿毒症的目标预测结果;
根据所述目标肾炎患者的个人身份信息和所述目标预测结果,生成所述目标肾炎患者的目标检查报告;
将所述目标检查报告同步至检查报告查询系统。
结合第一方面的第四种可能的实施方式,本申请实施例提供了第一方面的第五种可能的实施方式,其中,还包括:
确定获取到所述目标肾炎患者的基因数据时,将所述目标肾炎患者的基因数据、临床病理数据以及患病标签作为训练样本数据。
第二方面,本申请实施例还提供一种尿毒症预测模型的训练装置,包括:第一获取模块,用于获取训练样本数据;所述训练样本数据包括第一类肾炎患者的患病标签训练数据,以及,每个所述第一类肾炎患者的临床病理训练数据和基因训练数据;所述患病标签训练数据用于表征所述第一类肾炎患者是否患有尿毒症;
第一生成模块,用于针对每一个所述第一类肾炎患者,生成该第一类肾炎患者的临床病理训练数据对应的训练特征向量,以及,基因训练数据对应的特权信息向量;
训练模块,用于根据每个所述第一类肾炎患者对应的所述训练特征向量、所述特权信息向量,以及,所述第一类肾炎患者的患病标签训练数据,对待训练的基于特权信息的支持向量机模型进行训练,得到训练好的基于特权信息的支持向量机模型;所述训练好的基于特权信息的支持向量机模型用于预测肾炎患者是否患有尿毒症。
结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,其中,还包括:
第二获取模块,用于获取测试样本数据;所述测试样本数据包括第二类肾炎患者的临床病理测试数据和患病标签测试数据;所述患病标签测试数据用于表征所述第二类肾炎患者是否患有尿毒症;
第一确定模块,用于根据所述测试样本数据,确定所述训练好的基于特权信息的支持向量机模型的准确度;
更新模块,用于根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新。
结合第二方面的第一种可能的实施方式,本申请实施例提供了第二方面的第二种可能的实施方式,其中,所述第一确定模块在用于确定所述训练好的基于特权信息的支持向量机模型的准确度时,具体用于:
针对每个所述第二类肾炎患者,生成该第二类肾炎患者的临床病理测试数据对应的测试特征向量;
针对每个所述第二类肾炎患者,将该第二类肾炎患者对应的所述测试特征向量作为所述训练好的基于特权信息的支持向量机模型的输入,得到对应的该第二类肾炎患者患有尿毒症的预测结果;
根据每个所述第二类肾炎患者患有尿毒症的预测结果以及每个所述第二类肾炎患者的患病标签测试数据,确定所述训练好的基于特权信息的支持向量机模型的准确度。
结合第二方面的第一种可能的实施方式,本申请实施例提供了第二方面的第三种可能的实施方式,其中,所述更新模块在用于根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新时,具体用于:
若所述准确度大于设定阈值,则确定所述训练好的基于特权信息的支持向量机模型为最优的基于特权信息的支持向量机模型;
若所述准确度不大于设定阈值,则对所述训练好的基于特权信息的支持向量机模型中的参数进行调整,并重复调用第二方面和第二方面的第一种可能的实施方式中记载的装置。
结合第二方面,本申请实施例提供了第二方面的第四种可能的实施方式,其中,还包括:
第三获取模块,用于获取待预测的目标肾炎患者的目标临床病理数据;
输入模块,用于将用于表征所述目标临床病理数据的目标临床病理特征向量输入到所述训练好的基于特权信息的支持向量机模型中,得到所述目标肾炎患者患有尿毒症的目标预测结果;
第二生成模块,用于根据所述目标肾炎患者的个人身份信息和所述目标预测结果,生成所述目标肾炎患者的目标检查报告;
同步模块,用于将所述目标检查报告同步至检查报告查询系统。
结合第二方面的第四种可能的实施方式,本申请实施例提供了第二方面的第五种可能的实施方式,其中,还包括:
第二确定模块,用于确定获取到所述目标肾炎患者的基因数据时,将所述目标肾炎患者的基因数据、临床病理数据以及患病标签作为训练样本数据。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面中任一种可能的实施方式中的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面中任一种可能的实施方式中的步骤。
本申请实施例提供的一种尿毒症预测模型的训练方法、装置、电子设备及存储介质,考虑到尿毒症与遗传有一定的关系,因此本申请通过使用临床病理训练数据和基因训练数据对待训练的基于特权信息的支持向量机模型进行训练,相比于现有技术中仅使用临床病理数据对预测模型进行训练的方式,本方法有利于提高模型预测的准确率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种尿毒症预测模型的训练方法的流程图;
图2示出了本申请实施例所提供的另一种尿毒症预测模型的训练方法的流程图;
图3示出了本申请实施例所提供的一种尿毒症预测模型的训练装置的结构示意图;
图4示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
考虑到当仅使用临床病理数据对尿毒症预测模型进行训练时,会使得该模型预测的准确率不高的问题,基于此,本申请实施例提供了一种尿毒症预测模型的训练方法、装置、电子设备及存储介质,以提高尿毒症预测模型进行预测的准确率,下面通过实施例进行描述。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种尿毒症预测模型的训练方法进行详细介绍。图1示出了本申请实施例所提供的一种尿毒症预测模型的训练方法的流程图,如图1所示,包括以下步骤S101-S101-S103:
S101:获取训练样本数据;训练样本数据包括第一类肾炎患者的患病标签训练数据,以及,每个第一类肾炎患者的临床病理训练数据和基因训练数据;患病标签训练数据用于表征第一类肾炎患者是否患有尿毒症。
第一类肾炎患者为患有肾炎的患者,其中,第一类肾炎患者有多个,第一类肾炎患者中包括已经发展为尿毒症的患者,还包括未发展到尿毒症的患者。临床病理训练数据包括临床训练数据和病理训练数据,其中,临床训练数据为对第一类肾炎患者进行临床检查后得到的临床检查数据,临床检查可以为血液检查、尿液检查等,示例性的,临床训练数据包括血压数据、血糖数据、白蛋白数据、尿蛋白数据等。病理训练数据为对第一类肾炎患者进行病理检查后得到的病理检查数据,病理检查可以为肾穿刺活检术(即肾活检),即需要切下来一小块肾脏的切片进行活体检测。
基因训练数据是对第一类肾炎患者进行基因检测后得到的基因检测数据,在对第一类肾炎患者进行基因检测时,具体检测与肾脏疾病相关的基因,观察它们是否产生变异以及变异情况。
在一种可能的实施方式中,在第一类肾炎患者进行完临床检查、病理检查以及基因检测,得到该第一类肾炎患者的临床检查数据、病理检查数据以及基因检测数据之后,先对该第一类肾炎患者的临床检查数据、病理检查数据以及基因检测数据进行筛选,将与肾病无关的数据删除,只将与肾病有关的数据筛选出来,根据筛选出来的与肾病有关的数据生成该第一类肾炎患者的临床病理训练数据和基因训练数据。
S102:针对每一个第一类肾炎患者,生成该第一类肾炎患者的临床病理训练数据对应的训练特征向量,以及,基因训练数据对应的特权信息向量。
在一个可能的实施方式中,在获取到第一类肾炎患者的临床病理训练数据和基因训练数据后,判断该第一类肾炎患者的临床病理训练数据和基因训练数据是否为有效数据,示例性的,当该第一类肾炎患者的临床病理训练数据和基因训练数据中存在数据缺失、数据遗漏等情况,则该第一类肾炎患者的临床病理训练数据和基因训练数据属于无效数据。
当该第一类肾炎患者的临床病理训练数据和基因训练数据为有效数据时,根据该第一类肾炎患者的临床病理训练数据生成训练特征向量,以及根据该第一类肾炎患者的基因训练数据生成特权信息向量。即本实施例中,将基因训练数据作为特权信息。
S103:根据每个第一类肾炎患者对应的训练特征向量、特权信息向量,以及,第一类肾炎患者的患病标签训练数据,对待训练的基于特权信息的支持向量机模型进行训练,得到训练好的基于特权信息的支持向量机模型;训练好的基于特权信息的支持向量机模型用于预测肾炎患者是否患有尿毒症。
在本实施例中,根据每个第一类肾炎患者对应的训练特征向量、特权信息向量,以及,第一类肾炎患者的患病标签训练数据,对待训练的基于特权信息的支持向量机模型进行训练时,具体可以为,将第一类肾炎患者对应的训练特征向量和特权信息向量输入到待训练的基于特权信息的支持向量机模型(基于特权信息学习SVM+模型)中,输出该第一类肾炎患者患有尿毒症的预测结果,其中该预测结果可以为第一类肾炎患者患有尿毒症的概率值。使用该第一类肾炎患者患有尿毒症的预测结果和患病标签训练数据进行损失函数计算,得到损失值,并利用该损失值对待训练的基于特权信息的支持向量机模型进行反向传播训练,以对待训练的基于特权信息的支持向量机模型中的可学习参数进行调整,直至所有的训练样本数据使用完毕,停止训练,得到训练好的基于特权信息的支持向量机模型。
本申请实施例提供的一种尿毒症预测模型的训练方法,考虑到尿毒症与遗传有一定的关系,某些遗传变异会导致这个某些人更容易得病,因此本申请将基因数据作为预测尿毒症的因素之一;本申请通过使用临床病理训练数据和基因训练数据对待训练的基于特权信息的支持向量机模型进行训练,相比于现有技术中仅使用临床病理数据对预测模型进行训练的方式,本方法有利于提高模型预测的准确率。
然而,在实际应用中,由于基因检测费用较高等原因,很多患者不会选择进行该项的检测,导致基因数据的获取比较困难且数据量较小。基于此,在实际应用中,大部分患者仅有临床病理数据。因此,本申请实施例在对预测模型进行训练时,将基因训练数据作为模型训练时的特权信息,将临床病理训练数据作为模型训练时的训练数据,使用该特权信息和训练数据对待训练的基于特权信息的支持向量机模型进行训练。这样后期应用该训练好的基于特权信息的支持向量机模型进行尿毒症预测时,只需要输入患者的临床病理数据对应的临床病理特征向量即可,无需患者的基因数据,从而即提高了预测准确率,又能够在一定程度上降低患者检测的成本。
在一种可能的实施方式中,图2示出了本申请实施例所提供的另一种尿毒症预测模型的训练方法的流程图,在执行完步骤S103得到训练好的基于特权信息的支持向量机模型之后,如图2所示,还可以按照以下步骤执行:
S1041:获取测试样本数据;测试样本数据包括第二类肾炎患者的临床病理测试数据和患病标签测试数据;患病标签测试数据用于表征第二类肾炎患者是否患有尿毒症。
在训练完基于特权信息的支持向量机模型后,为了保证该基于特权信息的支持向量机模型预测的准确度,本实施例中,使用测试样本数据对训练好的基于特权信息的支持向量机模型进行测试,以确定训练好的基于特权信息的支持向量机模型的准确度。
其中,第二类肾炎患者为患有肾炎的患者,第二类肾炎患者有多个,第二类肾炎患者中包括已经发展为尿毒症的患者,还包括未发展到尿毒症的患者。临床病理测试数据包括临床测试数据和病理测试数据,其中临床测试数据为对第二类肾炎患者进行临床检查后得到的临床检查数据;病理测试数据为对第二类肾炎患者进行病理检查后得到病理检查数据。
S1042:根据测试样本数据,确定训练好的基于特权信息的支持向量机模型的准确度。
具体地,针对每个第二类肾炎患者,生成该第二类肾炎患者的临床病理测试数据对应的测试特征向量。
针对每个第二类肾炎患者,将该第二类肾炎患者对应的测试特征向量作为训练好的基于特权信息的支持向量机模型的输入,得到对应的该第二类肾炎患者患有尿毒症的预测结果。其中,该第二类肾炎患者患有尿毒症的预测结果具体可以为第二类肾炎患者患有尿毒症的概率值,当该概率值大于预设概率值时,表示该第二类肾炎患者患有尿毒症,当该概率值不大于预设概率值时,表示该第二类肾炎患者未患有尿毒症。
根据每个第二类肾炎患者患有尿毒症的预测结果以及每个第二类肾炎患者的患病标签测试数据,确定训练好的基于特权信息的支持向量机模型的准确度。其中,准确度可以为:训练好的基于特权信息的支持向量机模型输出准确预测结果的个数与第二类肾炎患者总个数的比值(下文简称该比值为准确预测比值),和/或,AUC值(Area under the Curveof ROC,ROC曲线下方的面积)。
S1043:根据准确度,对训练好的基于特权信息的支持向量机模型进行更新。
在该实施例中,若准确度大于设定阈值,则表示该训练好的基于特权信息的支持向量机模型的准确度较高,此时确定训练好的基于特权信息的支持向量机模型为最优的基于特权信息的支持向量机模型。
若准确度不大于设定阈值,则对训练好的基于特权信息的支持向量机模型中的参数进行调整,并重复执行步骤S101-S103和/或S1041-S1043。
在该实施例中,若准确度不大于设定阈值,则表示该训练好的基于特权信息的支持向量机模型的准确度较低,此时需要重新对基于特权信息的支持向量机模型进行训练,和/或,重新对训练好的基于特权信息的支持向量机模型进行测试,直至训练好的基于特权信息的支持向量机模型的准确度大于设定阈值时停止。
在第一种可能的实施方式中,在执行步骤S1043根据准确度,对训练好的基于特权信息的支持向量机模型进行更新时,具体可以按照以下步骤执行:
根据准确预测比值和AUC值,对训练好的基于特权信息的支持向量机模型进行更新。
具体地,若准确预测比值大于设定第一阈值,并且,AUC值大于预设第二阈值,则确定训练好的基于特权信息的支持向量机模型为最优的基于特权信息的支持向量机模型。若准确预测比值不大于设定第一阈值,和/或,AUC值不大于预设第二阈值,则对训练好的基于特权信息的支持向量机模型中的参数进行调整,并重复执行步骤S101-S103以及S1041-S1043。
在第二种可能的实施方式中,在执行步骤S1043根据准确度,对训练好的基于特权信息的支持向量机模型进行更新时,具体可以按照以下步骤执行:
根据准确预测比值,对训练好的基于特权信息的支持向量机模型进行更新。
具体地,若准确预测比值大于设定第一阈值,则确定训练好的基于特权信息的支持向量机模型为最优的基于特权信息的支持向量机模型。若准确预测比值不大于设定第一阈值,则对训练好的基于特权信息的支持向量机模型中的参数进行调整,并重复执行步骤S101-S103以及S1041-S1043。
在第三种可能的实施方式中,在执行步骤S1043根据准确度,对训练好的基于特权信息的支持向量机模型进行更新时,具体可以按照以下步骤执行:
根据AUC值,对训练好的基于特权信息的支持向量机模型进行更新。
具体地,若AUC值大于预设第二阈值时,则确定训练好的基于特权信息的支持向量机模型为最优的基于特权信息的支持向量机模型。若AUC值不大于预设第二阈值时,则对训练好的基于特权信息的支持向量机模型中的参数进行调整,并重复执行步骤S101-S103以及S1041-S1043。
在一种可能的实施方式中,还可以按照以下步骤执行:
S1051:获取待预测的目标肾炎患者的目标临床病理数据。
在使用训练完的基于特权信息的支持向量机模型对目标肾炎患者进行预测过程中,其中,目标肾炎患者为患有肾炎的患者,目标临床病理数据包括目标临床数据和目标病理数据。目标临床数据是目标肾炎患者进行临床检查后得到的临床检查数据,目标病理数据是目标肾炎患者进行病理检查后得到的病理检查数据。
S1052:将用于表征目标临床病理数据的目标临床病理特征向量输入到训练好的基于特权信息的支持向量机模型中,得到目标肾炎患者患有尿毒症的目标预测结果。
根据目标临床病理数据生成目标临床病理特征向量,并将目标临床病理特征向量作为训练好的基于特权信息的支持向量机模型的输入,输出目标肾炎患者患有尿毒症的目标预测结果。其中,目标预测结果具体可以为目标肾炎患者患有尿毒症的概率值。
S1053:根据目标肾炎患者的个人身份信息和目标预测结果,生成目标肾炎患者的目标检查报告。
个人身份信息可以包括目标肾炎患者的姓名、身份证号码、手机号码等用于表征目标肾炎患者的个人身份的信息。
S1054:将目标检查报告同步至检查报告查询系统。
将目标检查报告同步至检查报告查询系统后,目标肾炎患者可以通过终端设备登录该检查报告查询系统,根据自己的个人身份信息查询得到自己的目标检查报告。
在一种可能的实施方式中,本发明实施例提供的方法还包括:
确定获取到目标肾炎患者的基因数据时,将目标肾炎患者的基因数据、临床病理数据以及患病标签作为训练样本数据。
由于基因检测需要花费患者的很多金钱和时间,因此不是每一个患者都会选择做基因检测,即基因数据较为难得,本实施例中,当目标肾炎患者做了基因检测时,可以获取目标肾炎患者的基因数据,将目标肾炎患者的基因数据、临床病理数据以及患病标签作为训练样本数据,以丰富训练样本数据的数量。
在一个可能的实施方式中,本实施例将采集和筛选出来的基因数据集中起来,建立一个基因数据库,该数据库可以联网方便全国范围内使用。具体地,将训练样本数据中的第一类肾炎患者的基因训练数据上传至基因数据库,以及当确定获取到目标肾炎患者的基因数据时,将目标肾炎患者的基因数据上传至基因数据库;当基因数据库中上传的目标肾炎患者的基因数据的数量达到预设数量时,使用第一类肾炎患者的基因训练数据、临床病理训练数据、患病标签训练数据以及目标肾炎患者的基因数据、临床病理数据、患病标签作为新的训练样本数据;并使用该新的训练样本数据对基于特权信息的支持向量机模型进行重新训练。
实施例二:
基于相同的技术构思,本申请实施例还提供了一种尿毒症预测模型的训练装置,图3示出了本申请实施例所提供的一种尿毒症预测模型的训练装置的结构示意图,如图3所示,该装置包括:
第一获取模块301,用于获取训练样本数据;所述训练样本数据包括第一类肾炎患者的患病标签训练数据,以及,每个所述第一类肾炎患者的临床病理训练数据和基因训练数据;所述患病标签训练数据用于表征所述第一类肾炎患者是否患有尿毒症;
第一生成模块302,用于针对每一个所述第一类肾炎患者,生成该第一类肾炎患者的临床病理训练数据对应的训练特征向量,以及,基因训练数据对应的特权信息向量;
训练模块303,用于根据每个所述第一类肾炎患者对应的所述训练特征向量、所述特权信息向量,以及,所述第一类肾炎患者的患病标签训练数据,对待训练的基于特权信息的支持向量机模型进行训练,得到训练好的基于特权信息的支持向量机模型;所述训练好的基于特权信息的支持向量机模型用于预测肾炎患者是否患有尿毒症。
可选的,还包括:
第二获取模块,用于获取测试样本数据;所述测试样本数据包括第二类肾炎患者的临床病理测试数据和患病标签测试数据;所述患病标签测试数据用于表征所述第二类肾炎患者是否患有尿毒症;
第一确定模块,用于根据所述测试样本数据,确定所述训练好的基于特权信息的支持向量机模型的准确度;
更新模块,用于根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新。
可选的,所述第一确定模块在用于确定所述训练好的基于特权信息的支持向量机模型的准确度时,具体用于:
针对每个所述第二类肾炎患者,生成该第二类肾炎患者的临床病理测试数据对应的测试特征向量;
针对每个所述第二类肾炎患者,将该第二类肾炎患者对应的所述测试特征向量作为所述训练好的基于特权信息的支持向量机模型的输入,得到对应的该第二类肾炎患者患有尿毒症的预测结果;
根据每个所述第二类肾炎患者患有尿毒症的预测结果以及每个所述第二类肾炎患者的患病标签测试数据,确定所述训练好的基于特权信息的支持向量机模型的准确度。
可选的,所述更新模块在用于根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新时,具体用于:
若所述准确度大于设定阈值,则确定所述训练好的基于特权信息的支持向量机模型为最优的基于特权信息的支持向量机模型;
若所述准确度不大于设定阈值,则对所述训练好的基于特权信息的支持向量机模型中的参数进行调整,并重复调用第二方面和第二方面的第一种可能的实施方式中记载的装置。
可选的,还包括:
第三获取模块,用于获取待预测的目标肾炎患者的目标临床病理数据;
输入模块,用于将用于表征所述目标临床病理数据的目标临床病理特征向量输入到所述训练好的基于特权信息的支持向量机模型中,得到所述目标肾炎患者患有尿毒症的目标预测结果;
第二生成模块,用于根据所述目标肾炎患者的个人身份信息和所述目标预测结果,生成所述目标肾炎患者的目标检查报告;
同步模块,用于将所述目标检查报告同步至检查报告查询系统。
可选的,还包括:
第二确定模块,用于确定获取到所述目标肾炎患者的基因数据时,将所述目标肾炎患者的基因数据、临床病理数据以及患病标签作为训练样本数据。
关于具体执行的方法步骤和原理参见实施例一的说明,在此不再详细赘述。
实施例三:
基于相同的技术构思,本申请实施例还提供一种电子设备,图4示出了本申请实施例所提供的一种电子设备的结构示意图,如图4所示,该电子设备400包括:处理器401、存储器402和总线403,存储器存储有处理器可执行的机器可读指令,当电子设备运行时,处理器401与存储器402之间通过总线403通信,处理器401执行机器可读指令,以执行实施例一中所述的方法步骤。
关于具体执行的方法步骤和原理参见实施例一的说明,在此不再详细赘述。
实施例四:
基于相同的技术构思,本申请实施例四还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行实施例一中所述的方法步骤。
关于具体执行的方法步骤和原理参见实施例一的说明,在此不再详细赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种尿毒症预测模型的训练方法,其特征在于,包括:
获取训练样本数据;所述训练样本数据包括第一类肾炎患者的患病标签训练数据,以及,每个所述第一类肾炎患者的临床病理训练数据和基因训练数据;所述患病标签训练数据用于表征所述第一类肾炎患者是否患有尿毒症;
针对每一个所述第一类肾炎患者,生成该第一类肾炎患者的临床病理训练数据对应的训练特征向量,以及,基因训练数据对应的特权信息向量;
根据每个所述第一类肾炎患者对应的所述训练特征向量、所述特权信息向量,以及,所述第一类肾炎患者的患病标签训练数据,对待训练的基于特权信息的支持向量机模型进行训练,得到训练好的基于特权信息的支持向量机模型;所述训练好的基于特权信息的支持向量机模型用于预测肾炎患者是否患有尿毒症。
2.根据权利要求1所述的训练方法,其特征在于,还包括:
获取测试样本数据;所述测试样本数据包括第二类肾炎患者的临床病理测试数据和患病标签测试数据;所述患病标签测试数据用于表征所述第二类肾炎患者是否患有尿毒症;
根据所述测试样本数据,确定所述训练好的基于特权信息的支持向量机模型的准确度;
根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新。
3.根据权利要求2所述的训练方法,其特征在于,所述确定所述训练好的基于特权信息的支持向量机模型的准确度,包括:
针对每个所述第二类肾炎患者,生成该第二类肾炎患者的临床病理测试数据对应的测试特征向量;
针对每个所述第二类肾炎患者,将该第二类肾炎患者对应的所述测试特征向量作为所述训练好的基于特权信息的支持向量机模型的输入,得到对应的该第二类肾炎患者患有尿毒症的预测结果;
根据每个所述第二类肾炎患者患有尿毒症的预测结果以及每个所述第二类肾炎患者的患病标签测试数据,确定所述训练好的基于特权信息的支持向量机模型的准确度。
4.根据权利要求2所述的训练方法,其特征在于,所述根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新,包括:
若所述准确度大于设定阈值,则确定所述训练好的基于特权信息的支持向量机模型为最优的基于特权信息的支持向量机模型;
若所述准确度不大于设定阈值,则对所述训练好的基于特权信息的支持向量机模型中的参数进行调整,并重复执行权利要求1-2记载的步骤。
5.根据权利要求1所述的训练方法,其特征在于,还包括:
获取待预测的目标肾炎患者的目标临床病理数据;
将用于表征所述目标临床病理数据的目标临床病理特征向量输入到所述训练好的基于特权信息的支持向量机模型中,得到所述目标肾炎患者患有尿毒症的目标预测结果;
根据所述目标肾炎患者的个人身份信息和所述目标预测结果,生成所述目标肾炎患者的目标检查报告;
将所述目标检查报告同步至检查报告查询系统。
6.根据权利要求5所述的训练方法,其特征在于,还包括:
确定获取到所述目标肾炎患者的基因数据时,将所述目标肾炎患者的基因数据、临床病理数据以及患病标签作为训练样本数据。
7.一种尿毒症预测模型的训练装置,其特征在于,包括:
第一获取模块,用于获取训练样本数据;所述训练样本数据包括第一类肾炎患者的患病标签训练数据,以及,每个所述第一类肾炎患者的临床病理训练数据和基因训练数据;所述患病标签训练数据用于表征所述第一类肾炎患者是否患有尿毒症;
第一生成模块,用于针对每一个所述第一类肾炎患者,生成该第一类肾炎患者的临床病理训练数据对应的训练特征向量,以及,基因训练数据对应的特权信息向量;
训练模块,用于根据每个所述第一类肾炎患者对应的所述训练特征向量、所述特权信息向量,以及,所述第一类肾炎患者的患病标签训练数据,对待训练的基于特权信息的支持向量机模型进行训练,得到训练好的基于特权信息的支持向量机模型;所述训练好的基于特权信息的支持向量机模型用于预测肾炎患者是否患有尿毒症。
8.根据权利要求7所述的训练装置,其特征在于,还包括:
第二获取模块,用于获取测试样本数据;所述测试样本数据包括第二类肾炎患者的临床病理测试数据和患病标签测试数据;所述患病标签测试数据用于表征所述第二类肾炎患者是否患有尿毒症;
第一确定模块,用于根据所述测试样本数据,确定所述训练好的基于特权信息的支持向量机模型的准确度;
更新模块,用于根据所述准确度,对所述训练好的基于特权信息的支持向量机模型进行更新。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至6任一所述的训练方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至6任一所述的训练方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210348785.6A CN116936087A (zh) | 2022-04-01 | 2022-04-01 | 尿毒症预测模型的训练方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210348785.6A CN116936087A (zh) | 2022-04-01 | 2022-04-01 | 尿毒症预测模型的训练方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116936087A true CN116936087A (zh) | 2023-10-24 |
Family
ID=88385045
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210348785.6A Pending CN116936087A (zh) | 2022-04-01 | 2022-04-01 | 尿毒症预测模型的训练方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116936087A (zh) |
-
2022
- 2022-04-01 CN CN202210348785.6A patent/CN116936087A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6611873B2 (ja) | 生物学的経路の調節相互作用の学習および同定用のシステムならびに方法 | |
US20180144244A1 (en) | Distributed clinical workflow training of deep learning neural networks | |
WO2020181805A1 (zh) | 糖尿病的预测方法及装置、存储介质、计算机设备 | |
CN113053535B (zh) | 一种医疗信息预测系统及医疗信息预测方法 | |
US11529105B2 (en) | Digital twin updating | |
US20220215899A1 (en) | Affinity prediction method and apparatus, method and apparatus for training affinity prediction model, device and medium | |
Ni et al. | Variable selection for case-cohort studies with failure time outcome | |
CN115938590A (zh) | 结直肠癌术后lars预测模型的构建方法及预测系统 | |
Song et al. | Bayesian hierarchical models for high‐dimensional mediation analysis with coordinated selection of correlated mediators | |
CN111430037A (zh) | 相似病历查找方法及系统 | |
CN111161884A (zh) | 针对不平衡数据的疾病预测方法、装置、设备及介质 | |
CN113192627A (zh) | 一种基于病人与疾病二部图的再入院预测方法及系统 | |
CN117290509A (zh) | 电子病历文本分类模型训练方法、装置、电子设备及介质 | |
CN116936087A (zh) | 尿毒症预测模型的训练方法、装置、电子设备及存储介质 | |
CN116302870A (zh) | 基于进化图的机械硬盘健康评估方法、系统和存储介质 | |
Chang et al. | To cut or not to cut? Assessing the modular structure of brain networks | |
CN113678147A (zh) | 搜索方法以及信息处理系统 | |
CN114360732B (zh) | 医疗数据分析方法、装置、电子设备及存储介质 | |
CN113782092B (zh) | 一种生存期预测模型的生成方法及装置、存储介质 | |
JP6625840B2 (ja) | 健康管理支援装置、健康管理支援システム及び健康管理支援方法 | |
CN108831554B (zh) | 医疗信息处理方法及装置 | |
JP2021135603A (ja) | 判定装置、モデル生成装置、判定方法及び判定プログラム | |
JP7313165B2 (ja) | アルツハイマー病生存分析装置及びアルツハイマー病生存分析プログラム | |
CN111210910A (zh) | 猪只疾病诊断方法及系统 | |
CN113223677A (zh) | 针对患者的医生匹配方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |