CN115223709B - 基于布病诊断神经网络模型的缺失值填补迁移学习方法 - Google Patents
基于布病诊断神经网络模型的缺失值填补迁移学习方法 Download PDFInfo
- Publication number
- CN115223709B CN115223709B CN202210887490.6A CN202210887490A CN115223709B CN 115223709 B CN115223709 B CN 115223709B CN 202210887490 A CN202210887490 A CN 202210887490A CN 115223709 B CN115223709 B CN 115223709B
- Authority
- CN
- China
- Prior art keywords
- neural network
- network model
- disease diagnosis
- missing
- filling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 118
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 118
- 238000003745 diagnosis Methods 0.000 title claims abstract description 90
- 239000004744 fabric Substances 0.000 title claims abstract description 82
- 238000003062 neural network model Methods 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000007812 deficiency Effects 0.000 title claims abstract description 18
- 238000013508 migration Methods 0.000 title claims abstract description 12
- 230000005012 migration Effects 0.000 title claims abstract description 12
- 210000004369 blood Anatomy 0.000 claims abstract description 45
- 239000008280 blood Substances 0.000 claims abstract description 45
- 238000012549 training Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 14
- 238000013526 transfer learning Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 7
- 238000010801 machine learning Methods 0.000 abstract description 6
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 238000012360 testing method Methods 0.000 description 12
- 206010006500 Brucellosis Diseases 0.000 description 6
- 210000003979 eosinophil Anatomy 0.000 description 5
- 210000003743 erythrocyte Anatomy 0.000 description 5
- 102000001554 Hemoglobins Human genes 0.000 description 4
- 108010054147 Hemoglobins Proteins 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000003759 clinical diagnosis Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000004820 blood count Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000013399 early diagnosis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 208000034656 Contusions Diseases 0.000 description 1
- 208000006083 Hypokinesia Diseases 0.000 description 1
- 201000009906 Meningitis Diseases 0.000 description 1
- 208000009525 Myocarditis Diseases 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 210000003651 basophil Anatomy 0.000 description 1
- 206010061428 decreased appetite Diseases 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 238000003771 laboratory diagnosis Methods 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 206010029410 night sweats Diseases 0.000 description 1
- 230000036565 night sweats Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开了基于布病诊断神经网络模型的缺失值填补迁移学习方法,包括:基于训练完成的布病诊断神经网络模型,构建缺失值填充模型;将含有缺失值的血常规数据输入至缺失值填充模型中,得到缺失的血常规数据值;该方法基于机器学习实现了布病诊断过程中的缺失值填补,有助于提高布病诊断系统在临床上的应用价值。
Description
技术领域
本发明属于缺失值填补迁移技术领域,特别是基于布病诊断神经网络模型的缺失值填补迁移学习方法。
背景技术
布鲁氏菌病(简称布病)是一种由布鲁氏菌感染引起的人畜共患传染病,目前有60多种动物成为布鲁氏菌的宿主,与人类有关的动物传染源主要是羊、牛、猪等。根据相关研究资料显示,全世界每年大概有五十万人感染布病,造成的经济损失将近三十亿美元。布病的灵床表现呈弛张型低热、乏力、盗汗、食欲不振、贫血等,部分病例还会出现肺部、胃肠道等部位感染,同时布病还会伴随着一定的并发症,其中最严重的并发症为脑膜炎和心肌炎。目前,布病临床整体诊断准确性不高,相关研究显示,实验室确诊布病诊断准确性为87.1%,医务人员对疑似病例和临床诊断病例的判定正确率不足60%,临床诊断准确性仅为13.3%。为此,如何实现对非典型临床症状布病患者早期诊断以及早期筛查布病隐性感染者,是布病诊疗中亟待解决问题。
在实际场景中,血常规检测结果主要为血常规五分类,但是也存在少量医疗机构由于仪器设备的限制,只能提供血常规三分类的结果,与五分类相比缺少嗜酸性粒细胞、嗜碱性粒细胞相关的4项检验结果。这会导致用户提供的血常规数据中的检验项目与训练数据不一致,诊断模型的输入变量出现缺失值。但这4项输入特征在模型构建时起到了比较重要的作用,因此缺失值的填充对疾病预测具有重要的价值。
常见的缺失值处理方法包括直接删除法、常量填充以及模型预测填充等。直接删除法是将具有空值的行和列删除,如果行、列中有超过一半空值,则可以删除整行或整列,但该方法存在大量信息丢失等缺点。常量填充方法中有固定值填充、均值填充、中位数填充、众数填充等,这几种方法是针对同一检验指标的缺失值,所有样本均填充同一结果值,抹除了样本间的个体差异。其中平均值适用于近似正态分布数据,观测值较为均匀地散布于均值周围;中位数适用于偏态分布或者有离群点数据;众数适用于类别变量无大小、先后顺序之分的数据。模型预测填充是利用神经网络,根据非缺失值预测缺失值,进而进行填充。由此可见,现有的构建模型预测缺失值填充方法,一般是使用血常规结果做无监督学习,根据可获得的检验结果预测缺失项。虽然考虑了样本间的个体差异,但是由于没有利用疾病标签的信息,与布病诊断模型没有关联,难以准确拟合布病诊断模型推理过程中的复杂非线性关系。
随着计算机和人工智能的发展,机器学习技术(machine learning,ML) 被用于各种疾病识别,如帕金森疾病识别、心血管疾病识别等,而且机器学习在预测准确度方面也显示出强大优势,为疾病早期诊断提供的新方法。
因此,如何利用机器学习的相关技术实现布病诊断和缺失值填补,从而提高布病诊断系统在临床上的应用价值,成为当前研究的关键问题。
发明内容
鉴于上述问题,本发明提供一种至少解决上述部分技术问题的基于布病诊断神经网络模型的缺失值填补迁移学习方法,该方法基于机器学习实现了布病诊断过程中的缺失值填补,有助于提高布病诊断系统在临床上的应用价值。
本发明实施例提供了基于布病诊断神经网络模型的缺失值填补迁移学习方法,包括:
S1、基于训练完成的布病诊断神经网络模型,构建缺失值填充模型;
S2、将含有缺失值的血常规数据输入至所述缺失值填充模型中,得到缺失的血常规数据值。
进一步地,在所述S1中,布病诊断神经网络模型通过如下方法进行训练:
获取大量完整的血常规数据集和对应的布病诊断标签;
对所述血常规数据集进行标准化处理;
将标准化处理后的血常规数据集作为输入,将对应的布病诊断标签作为输出,用于训练布病诊断神经网络模型。
进一步地,所述布病诊断标签包括布病阳性标签和布病阴性标签。
进一步地,所述布病诊断神经网络模型由1层输入层、8层全连接层、8层 Dropout层以及1层输出层构成,其中Dropout层用于缓解过拟合问题。
进一步地,所述布病诊断神经网络模型的损失函数采用二元交叉熵损失函数;优化算法选择RMSProp;epoch设置为200;batch_size设置为2048。
进一步地,所述S1具体包括:
基于所述血常规数据集设置缺失项;
对所述缺失项进行遮挡处理;
将遮挡处理后的血常规数据集作为输入,将所述缺失项作为输出,并采用迁移学习法对所述布病诊断神经网络模型进行调整,基于此构建缺失值填充模型。
进一步地,所述采用迁移学习法对所述布病诊断神经网络模型进行调整,包括:采用迁移学习法将所述布病诊断神经网络模型中的前11层结构及权重导入缺失值填充模型,在此基础上增加全连接层和输出层,得到缺失值填充模型。
进一步地,所述缺失值填充模型的损失函数采用均方损失函数;Epoch设置为300。
与现有技术相比,本发明记载的基于布病诊断神经网络模型的缺失值填补迁移学习方法,具有如下有益效果:
本发明提出的缺失值填充方法与常量填充方法相比,考虑到了样本间的个体差异,没有将缺失值赋予固定值;与模型预测填充方法相比,通过迁移学习将数据与相关疾病的标签信息联合,提高了填充数据和布病标签之间的拟合程度,有效地降低了血常规样本中缺失值对布病诊断神经网络模型的推理过程产生的负面影响。基于迁移学习的缺失值填充方法对其他数据类型的缺失值填充具有一定的参考价值。
本发明使用完整血常规数据和疾病标签,训练布病诊断模型,训练过程中验证集的AUC达到0.9449。
本发明将具有缺失值的24组血常规数据作为模型的输入,遮挡项目的原始数据作为输出,定义缺失值填充模型。
本发明将布病诊断模型作为预训练(Pre-Train)模型,使用迁移学习方法进行微调(Fine-Tuning),训练缺失值填充模型。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例提供的基于布病诊断神经网络模型的缺失值填补迁移学习方法流程示意图。
图2为本发明实施例提供的基于布病诊断神经网络模型的缺失值填补迁移学习方法框架示意图。
图3为本发明实施例提供的效果分析流程示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供了基于布病诊断神经网络模型的缺失值填补迁移学习方法,具体包括如下步骤:
S1、基于训练完成的布病诊断神经网络模型,构建缺失值填充模型;
S2、将含有缺失值的血常规数据输入至所述缺失值填充模型中,得到缺失的血常规数据值。
下面结合图1和图2,分别对上述各个步骤进行详细的说明。
在上述步骤S1中,首先训练布病诊断神经网络模型,之后基于训练完成的布病诊断神经网络模型,构建缺失值填充模型;
1、训练布病诊断神经网络模型,具体训练步骤包括:
(1)获取大量完整的血常规数据集和对应的布病诊断标签;
其中,完整的血常规数据集是指血常规五分类中的22项检验项目以及年龄、性别组成的24个输入特征;具体地,22项检验项目包含白细胞计数(WBC)、中性粒细胞比率(NEUT%)、淋巴细胞比率(LYMPH%)、单核细胞比率 (MONO%)、嗜酸性粒细胞比率(EO%)、嗜碱性粒细胞比率(BASO%)、中性细胞数(NEUT#)、淋巴细胞数(LYMPH#)、单核细胞数(MONO#)、嗜酸性粒细胞数(EO#)、嗜碱性粒细胞数(BASO#)、红细胞计数(RBC)、血红蛋白(HGB)、红细胞压积(HCT)、红细胞平均体积(WCV)、平均血红蛋白量(MCH)、平均血红蛋白浓度(MCHC)、红细胞分布宽度(R-CV)、血小板(PLT)、血小板分布宽度 (PDW)、平均血小板体积(MPV)、血小板压积(PCT)等;布病诊断标签包括布病阳性标签和布病阴性标签。
(2)对血常规数据集进行标准化处理,否则训练集的准确率无法提高。
(3)将预处理后的血常规数据集作为输入,将对应的布病诊断标签作为输出,用于训练布病诊断神经网络模型;其中,布病布病诊断标签包括布病阳性标签和布病阴性标签;
该布病诊断神经网络模型由1层输入层、8层全连接层、8层Dropout层以及1层输出层构成,其中Dropout层用于缓解过拟合问题;该布病诊断神经网络模型的结构参数可参见表1所示;且该布病诊断神经网络模型的损失函数采用二元交叉熵损失函数(binary_crossentropy);优化算法选择RMSProp;epoch 设置为200;batch_size设置为2048。激活函数示意图如图3所示。
表1布病诊断神经网络模型结构参数
在本发明实施例中,在训练布病诊断神经网络模型过程中,将布病阳性标签和布病阴性标签所对应的血常规数据集分别按训练集:验证集:测试集=6:2:2 进行划分,之后阴性和阳性数据合并形成训练集、测试集和验证集,在此基础上对布病诊断神经网络模型进行训练和验证。在对遮挡后的血常规数据集进行划分时,需依照布病诊断神经网络模型的数据集,且与布病诊断神经网络模型的数据集完全相同;防止后续将填补后的数据进行布病诊断时,测试集的数据与训练集的数据出现交叉,导致对模型的泛化能力评估出现误差。由于布病阳性和阴性数据不均衡,需要在训练时需要对血常规数据集进行类别加权处理。
在本发明实施例中,经过实验表明,测试集的准确率为89.06%;特异性为89.17%;召回率为84.24%;AUC为0.9361。
2、其次,基于训练完成的布病诊断神经网络模型,构建缺失值填充模型,具体内容包括:
(1)基于所述血常规数据集设置缺失项:由于实际应用中,血常规三分类与五分类相比,五分类血常规在三分类的基础上增加了嗜酸性粒细胞比率 (EO%)、嗜碱性粒细胞比率(BASO%)、嗜酸性粒细胞数(EO#)和嗜碱性粒细胞数(BASO#),因此本发明将缺失项定为"BASO"、"BASO%"、"EO"、"EO%";
(2)对缺失项进行遮挡处理;
现有的缺失值填补模型是利用未遮挡数据预测遮挡数据,但此类模型均没有结合疾病标签进行预测,将样本与具体疾病信息分离,从而导致填补的数据与相关疾病诊断之间没有关联;因此在本发明实施例中,通过对布病诊断神经网络模型进行迁移学习,提高填补数据与相关诊断标签之间的关联性。
(3)将遮挡处理后的血常规数据集作为输入,将所述缺失项作为输出,并采用迁移学习法对所述布病诊断神经网络模型进行调整,基于此构建缺失值填充模型;
其中,为了提高填补数据与布病诊断之间的拟合程度,本发明实施例基于训练完成的布病诊断神经网络模型,利用迁移学习对布病神经网络进行微调,即利用布病诊断神经网络模型的部分结构及权重训练缺失值填充模型(即 imputerModel模型);具体步骤包括:
采用迁移学习法将所述布病诊断神经网络模型中的前11层结构及权重导入缺失值填充模型,在此基础上增加全连接层和输出层,得到缺失值填充模型。表2为缺失值填补模型的结构参数(注:表2中没有记录迁移的布病诊断模型结构)。
表2缺失值填补模型的结构参数
由于缺失值填充是回归问题,因此将输出层激活函数调整为Linear;训练时根据疾病标签对训练集进行样本加权;训练过程中,损失函数采用均方损失函数,Epoch设置为300,其余超参数与布病诊断模型的超参数一致。
经过实验仿真得出测试集的均方误差为0.1412,平均绝对误差为0.2459,拟合优度为0.8581。
最后,对本发明实施例所提供的缺失值填充模型的效果进行分析;将含有缺失值的测试数据集使用缺失值填充模型进行处理,得到缺失的血常规数据值;将该缺失的血常规数据值和上述含有缺失值的测试数据集想结合,将结合后完整的血常规数据值输出到布病诊断网络模型中进行布病诊断,其AUC1为 0.9338。作为对照,通过均值填充缺失数据的AUC2为0.8968。实验表明基于布病诊断神经网络的缺失值填补在布病诊断方面优于均值填充。
本发明实施例提供了基于布病诊断神经网络模型的缺失值填补迁移学习方法,首先需要利用完整的血常规数据和布病诊断标签训练布病诊断神经网络模型,并将训练完成的模型保存,用于构建缺失值填充模型;之后选取4种参数进行遮挡,构建具有缺失值的血常规数据集;最后将遮挡处理后的血常规数据集做为输入,将缺失项数据集作为输出,并且利用迁移学习对布病诊断模型进行微调(Fine-Tuning),充分利用布病诊断模型中的复杂非线性关系,训练缺失值填补模型。本发明将填补后的血常规数据和均值填补的血常规数据进行布病预测,结合ROC(Receiver Operating Characteristic Curve)曲线下面积大小(Area Under ROC Curve,AUC)AUC指标进行对比分析,得出利用迁移学习进行缺失值填补方法的优越性。本发明实施例所提供的基于布病诊断神经网络模型的缺失值填补迁移学习方法,与现有的模型预测方法不同的是缺失值填补模型包含了诊断模型的大部分结构和权重,重用了布病诊断模型中的布病知识,使样本间个体差异和布病诊断知识共同参与缺失值填补策略。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (6)
1.基于布病诊断神经网络模型的缺失值填补迁移学习方法,其特征在于,包括:
S1、基于训练完成的布病诊断神经网络模型,构建缺失值填充模型;
S2、将含有缺失值的血常规数据输入至所述缺失值填充模型中,得到缺失的血常规数据值;
在所述S1中,布病诊断神经网络模型通过如下方法进行训练:
获取大量完整的血常规数据集和对应的布病诊断标签;
对所述血常规数据集进行标准化处理;
将标准化处理后的血常规数据集作为输入,将对应的布病诊断标签作为输出,用于训练布病诊断神经网络模型;
所述S1具体包括:
基于所述血常规数据集设置缺失项;
对所述缺失项进行遮挡处理;
将遮挡处理后的血常规数据集作为输入,将所述缺失项作为输出,并采用迁移学习法对所述布病诊断神经网络模型进行调整,基于此构建缺失值填充模型。
2.如权利要求1所述的基于布病诊断神经网络模型的缺失值填补迁移学习方法,其特征在于,所述布病诊断标签包括布病阳性标签和布病阴性标签。
3.如权利要求1所述的基于布病诊断神经网络模型的缺失值填补迁移学习方法,其特征在于,所述布病诊断神经网络模型由1层输入层、8层全连接层、8层Dropout层以及1层输出层构成,其中Dropout层用于缓解过拟合问题。
4.如权利要求1所述的基于布病诊断神经网络模型的缺失值填补迁移学习方法,其特征在于,所述布病诊断神经网络模型的损失函数采用二元交叉熵损失函数;优化算法选择RMSProp;epoch设置为200;batch_size设置为2048。
5.如权利要求1所述的基于布病诊断神经网络模型的缺失值填补迁移学习方法,其特征在于,所述采用迁移学习法对所述布病诊断神经网络模型进行调整,包括:采用迁移学习法将所述布病诊断神经网络模型中的前11层结构及权重导入缺失值填充模型,在此基础上增加全连接层和输出层,得到缺失值填充模型。
6.如权利要求1所述的基于布病诊断神经网络模型的缺失值填补迁移学习方法,其特征在于,所述缺失值填充模型的损失函数采用均方损失函数;Epoch设置为300。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210887490.6A CN115223709B (zh) | 2022-07-26 | 2022-07-26 | 基于布病诊断神经网络模型的缺失值填补迁移学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210887490.6A CN115223709B (zh) | 2022-07-26 | 2022-07-26 | 基于布病诊断神经网络模型的缺失值填补迁移学习方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115223709A CN115223709A (zh) | 2022-10-21 |
CN115223709B true CN115223709B (zh) | 2024-01-23 |
Family
ID=83613209
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210887490.6A Active CN115223709B (zh) | 2022-07-26 | 2022-07-26 | 基于布病诊断神经网络模型的缺失值填补迁移学习方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115223709B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117423467B (zh) * | 2023-10-18 | 2024-04-19 | 广州中医药大学(广州中医药研究院) | 面向医学临床诊断的缺失值感知和容忍深度网络方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107273429A (zh) * | 2017-05-19 | 2017-10-20 | 哈工大大数据产业有限公司 | 一种基于深度学习的缺失值填充方法及系统 |
CN112164468A (zh) * | 2020-10-09 | 2021-01-01 | 北京航空航天大学 | 一种孕期检查数据的缺失数据处理方法 |
CN113539473A (zh) * | 2021-05-12 | 2021-10-22 | 内蒙古卫数数据科技有限公司 | 一种仅使用血常规检验数据诊断布氏杆菌病的方法及系统 |
CN113990487A (zh) * | 2021-10-27 | 2022-01-28 | 内蒙古卫数数据科技有限公司 | 基于血常规、生化、尿常规检验数据的恶性肿瘤识别系统 |
WO2022110719A1 (zh) * | 2020-11-24 | 2022-06-02 | 平安科技(深圳)有限公司 | 基于联邦迁移学习的神经退行性疾病建模装置及相关设备 |
-
2022
- 2022-07-26 CN CN202210887490.6A patent/CN115223709B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107273429A (zh) * | 2017-05-19 | 2017-10-20 | 哈工大大数据产业有限公司 | 一种基于深度学习的缺失值填充方法及系统 |
CN112164468A (zh) * | 2020-10-09 | 2021-01-01 | 北京航空航天大学 | 一种孕期检查数据的缺失数据处理方法 |
WO2022110719A1 (zh) * | 2020-11-24 | 2022-06-02 | 平安科技(深圳)有限公司 | 基于联邦迁移学习的神经退行性疾病建模装置及相关设备 |
CN113539473A (zh) * | 2021-05-12 | 2021-10-22 | 内蒙古卫数数据科技有限公司 | 一种仅使用血常规检验数据诊断布氏杆菌病的方法及系统 |
CN113990487A (zh) * | 2021-10-27 | 2022-01-28 | 内蒙古卫数数据科技有限公司 | 基于血常规、生化、尿常规检验数据的恶性肿瘤识别系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115223709A (zh) | 2022-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021120936A1 (zh) | 一种基于多任务学习模型的慢病预测系统 | |
Barik et al. | Analysis of prediction accuracy of diabetes using classifier and hybrid machine learning techniques | |
CN106934235B (zh) | 一种基于迁移学习的疾病领域间病人相似性度量迁移系统 | |
CN107403072A (zh) | 一种基于机器学习的2型糖尿病预测预警方法 | |
CN108511056A (zh) | 基于脑卒中患者相似性分析的治疗方案推荐方法及系统 | |
CN115223709B (zh) | 基于布病诊断神经网络模型的缺失值填补迁移学习方法 | |
Pillai et al. | Prediction of heart disease using rnn algorithm | |
Rabby et al. | Machine learning applied to kidney disease prediction: Comparison study | |
CN107767960A (zh) | 临床检测项目的数据处理方法、装置及电子设备 | |
CN112836730A (zh) | 用于用户妊娠状态分类的方法、装置、电子设备及介质 | |
Popkes et al. | Interpretable outcome prediction with sparse Bayesian neural networks in intensive care | |
Overweg et al. | Interpretable outcome prediction with sparse Bayesian neural networks in intensive care | |
CN112786190B (zh) | 一种多维数据融合的医疗健康诊疗方法 | |
Shaheen et al. | Hi-Le and HiTCLe: Ensemble Learning Approaches for Early Diabetes Detection using Deep Learning and eXplainable Artificial Intelligence | |
Deng et al. | Characterizing risk of in-hospital mortality following subarachnoid hemorrhage using machine learning: a retrospective study | |
Nakamura et al. | Potential impact of initial clinical data on adjustment of pediatric readmission rates | |
Asghar et al. | Automatic classification of 10 blood cell subtypes using transfer learning via pre-trained convolutional neural networks | |
Xie et al. | Thyroid disease diagnosis based on feature interpolation and dynamic weighting ensemble model | |
Matsushita et al. | Complete blood count and C-reactive protein to predict positive blood culture among neonates using machine learning algorithms | |
Ravaji et al. | CSChO-deep MaxNet: Cat swam chimp optimization integrated deep maxout network for heart disease detection | |
Yeruva et al. | Prediction of anemia disease using classification methods | |
Muniru et al. | Detecting Intra Ventricular Haemorrhage in Preterm Neonates Using LSTM Autoencoders | |
Fonseca et al. | Mortality prediction using medical time series on TBI patients | |
McRoy | CLASSIFICATION AND EXPLANATION OF IRON DEFICIENCY ANEMIA FROM COMPLETE BLOOD COUNT DATA USING MACHINE LEARNING | |
Sasikala et al. | Curability prediction model for anemia using machine learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |