CN113053519A - 基于遗传算法的肺结核检测模型的训练方法、装置及设备 - Google Patents

基于遗传算法的肺结核检测模型的训练方法、装置及设备 Download PDF

Info

Publication number
CN113053519A
CN113053519A CN202110359537.7A CN202110359537A CN113053519A CN 113053519 A CN113053519 A CN 113053519A CN 202110359537 A CN202110359537 A CN 202110359537A CN 113053519 A CN113053519 A CN 113053519A
Authority
CN
China
Prior art keywords
chest
positive
model
tuberculosis
detection model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110359537.7A
Other languages
English (en)
Inventor
赵雁林
吴博烔
王欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhangyin Medical Technology Co ltd
Original Assignee
Beijing Zhangyin Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhangyin Medical Technology Co ltd filed Critical Beijing Zhangyin Medical Technology Co ltd
Priority to CN202110359537.7A priority Critical patent/CN113053519A/zh
Publication of CN113053519A publication Critical patent/CN113053519A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Radiology & Medical Imaging (AREA)
  • Physiology (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Computational Linguistics (AREA)
  • Genetics & Genomics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于遗传算法的肺结核检测模型的训练方法、装置及设备,首先采集样本胸片的dcm文件,排除非正位胸片后转换为png文件;影像科专家对采集得到的正位胸片进行判断,判断其是否属于肺结核患者;影像科专家对筛选出来的属于肺结核患者的正位胸片以标注框的方式将正位胸片中的病灶标注出来;将经过标注的正位胸片以及标注框信息输入肺结核检测模型中并行训练多个模型,经过多轮迭代得到最终的肺结核检测模型。本发明能够在较少的试验次数下得到比随机调参更优的结果并且能自动化地对参数进行调整,减少人工调参对经验的依赖。

Description

基于遗传算法的肺结核检测模型的训练方法、装置及设备
技术领域
本发明涉及肺结核检测技术领域,具体涉及一种基于遗传算法的肺结核检测模型的训练方法、装置及设备。
背景技术
肺结核是我国的乙类传染病。结核病是由结核杆菌感染引起的慢性传染病。结核菌可能侵入人体全身各种器官,但主要侵犯肺脏,称为肺结核病。结核病又称为痨病和“白色瘟疫”,是一种古老的传染病,自有人类以来就有结核病。肺结核患者主要分布在我国穷困地区,由于缺乏高水平影像科专家对胸片进行准确判断,因此容易导致肺结核在穷困地区的进一步扩展。医疗影像辅助诊断设备能够在大规模检测肺结核筛查任务中发挥巨大的作用,但是医疗影像辅助诊断模型训练的超参数空间巨大,采用随机调参需要足够的算力来覆盖足够多的模型。如果采用手工调参的方式,则需要丰富的经验而且不能保证得到较为不错的结果。
发明内容
针对现有技术的不足,本发明旨在提供一种基于遗传算法的肺结核检测模型的训练方法、装置及设备。
为了实现上述目的,本发明采用如下技术方案:
一种基于遗传算法的肺结核检测模型的训练方法,具体过程如下:
S1、采集样本胸片的dcm文件,同时排除非正位胸片,筛选得到正位胸片;将采集到的正位胸片的dcm文件转换为png文件;
S2、影像科专家对采集得到的正位胸片进行判断,判断其是否属于肺结核患者,排除健康的正位胸片;
S3、影像科专家对筛选出来的属于肺结核患者的正位胸片进行标注,以标注框的方式将正位胸片中的病灶标注出来;
S4、将经过标注的正位胸片以及标注框信息输入肺结核检测模型中并行训练多个模型,各个模型开始训练前先在超参数的范围内随机选择固定数值;
S5、把训练好的各个模型在验证集上进行验证,计算模型的平均准确率作为该模型的适应值;
S6、将训练好的所有模型的超参数进行选择、交叉、变异操作,得到新一代待训练的多个模型;
S7、将经过标注的正位胸片以及标注框信息输入新一代待训练的多个模型中并行训练;
S8、计算训练得到的模型在验证集上的平均准确率作为该模型的适应值;
S9、如果当前的迭代轮数小于预设的迭代轮数上限,返回至步骤S6,否则选择适应值最高的模型作为最终的肺结核检测模型。
本发明提供一种实现上述训练方法的训练装置,包括:
胸片采集模块:用于采集样本胸片的dcm文件,同时排除非正位胸片,筛选得到正位胸片,以及将采集到的正位胸片的dcm文件转换为png文件;
胸片筛选模块:用于供影像科专家对采集得到的正位胸片进行判断,判断其是否属于肺结核患者,排除健康的正位胸片;
标注模块:用于供影像科专家对筛选出来的属于肺结核患者的正位胸片进行标注,以标注框的方式将正位胸片中的病灶标注出来;
训练模块:用于按照权利要求1所述方法的步骤S4-S9进行模型训练,得到最终的肺结核检测模型。
本发明还提供一种具有上述训练方法训练得到的肺结核检测模型的辅助诊断设备。
本发明的有益效果在于:本发明能够在较少的试验次数下得到比随机调参更优的结果并且能自动化地对参数进行调整,减少人工调参对经验的依赖。
附图说明
图1为本发明实施例1的方法流程图。
具体实施方式
以下将结合附图对本发明作进一步的描述,需要说明的是,本实施例以本技术方案为前提,给出了详细的实施方式和具体的操作过程,但本发明的保护范围并不限于本实施例。
实施例1
本实施例提供一种基于遗传算法的肺结核检测模型的训练方法,如图1所示,具体过程如下:
S1、采集样本胸片的dcm文件,同时排除非正位胸片,筛选得到正位胸片;将采集到的正位胸片的dcm文件转换为png文件;
S2、影像科专家对采集得到的正位胸片进行判断,判断其是否属于肺结核患者,排除健康的正位胸片;
S3、影像科专家对筛选出来的属于肺结核患者的正位胸片进行标注,以标注框的方式将正位胸片中的病灶标注出来;
S4、将经过标注的正位胸片以及标注框信息输入肺结核检测模型中并行训练多个模型,各个模型开始训练前先在超参数的范围内随机选择固定数值;
S5、把训练好的各个模型在验证集上进行验证,计算模型的平均准确率作为该模型的适应值;
S6、将训练好的所有模型的超参数进行选择、交叉、变异操作,得到新一代待训练的多个模型;
S7、将经过标注的正位胸片以及标注框信息输入新一代待训练的多个模型中并行训练;
S8、计算训练得到的模型在验证集上的平均准确率作为该模型的适应值;
S9、如果当前的迭代轮数小于预设的迭代轮数上限,返回至步骤S6,否则选择适应值最高的模型作为最终的肺结核检测模型。
利用所述肺结核检测模型时,将待检测的胸片输入肺结核检测模型中,肺结核检测模型对胸片进行检测并输出检测预测结果。
实施例2
本实施例提供一种实现实施例1所述训练方法的训练装置,包括:
胸片采集模块:用于采集样本胸片的dcm文件,同时排除非正位胸片,筛选得到正位胸片,以及将采集到的正位胸片的dcm文件转换为png文件;
胸片筛选模块:用于供影像科专家对采集得到的正位胸片进行判断,判断其是否属于肺结核患者,排除健康的正位胸片;
标注模块:用于供影像科专家对筛选出来的属于肺结核患者的正位胸片进行标注,以标注框的方式将正位胸片中的病灶标注出来;
训练模块:用于按照实施例1方法的步骤S4-S9进行模型训练,得到最终的肺结核检测模型。
实施例3
为了验证实施例1方法的优势,本实施例收集了4000张有临床验证的胸片并标注了其肺结核的病灶区域。将这4000张胸片分为3000张训练集,以及1000张验证集。同时还收集了10000张健康的胸片用于统计性能指标。在判断胸片是否正确检测为肺结核患者的任务上,在相同的100轮超参数调试的实验中,实施例1方法能够取得0.9461的AUC-ROC值。而随机调参的方法只能取得0.9353的AUC-ROC值。
其中超参数定义如表1所示。
表1
超参数 参数范围
学习率 1e-5~1e-1
权重衰减 0~1e-3
图像旋转角度 0~45度
图像放大系数 0~0.9
Mixup系数 0~1.0
分类项权重 0.2~4.0
定位项权重 0.2~4.0
图像左右翻转概率 0~1.0
对于本领域的技术人员来说,可以根据以上的技术方案和构思,给出各种相应的改变和变形,而所有的这些改变和变形,都应该包括在本发明权利要求的保护范围之内。

Claims (3)

1.一种基于遗传算法的肺结核检测模型的训练方法,其特征在于,具体过程如下:
S1、采集样本胸片的dcm文件,同时排除非正位胸片,筛选得到正位胸片;将采集到的正位胸片的dcm文件转换为png文件;
S2、影像科专家对采集得到的正位胸片进行判断,判断其是否属于肺结核患者,排除健康的正位胸片;
S3、影像科专家对筛选出来的属于肺结核患者的正位胸片进行标注,以标注框的方式将正位胸片中的病灶标注出来;
S4、将经过标注的正位胸片以及标注框信息输入肺结核检测模型中并行训练多个模型,各个模型开始训练前先在超参数的范围内随机选择固定数值;
S5、把训练好的各个模型在验证集上进行验证,计算模型的平均准确率作为该模型的适应值;
S6、将训练好的所有模型的超参数进行选择、交叉、变异操作,得到新一代待训练的多个模型;
S7、将经过标注的正位胸片以及标注框信息输入新一代待训练的多个模型中并行训练;
S8、计算训练得到的模型在验证集上的平均准确率作为该模型的适应值;
S9、如果当前的迭代轮数小于预设的迭代轮数上限,返回至步骤S6,否则选择适应值最高的模型作为最终的肺结核检测模型。
2.一种实现权利要求1所述训练方法的训练装置,其特征在于,包括:
胸片采集模块:用于采集样本胸片的dcm文件,同时排除非正位胸片,筛选得到正位胸片,以及将采集到的正位胸片的dcm文件转换为png文件;
胸片筛选模块:用于供影像科专家对采集得到的正位胸片进行判断,判断其是否属于肺结核患者,排除健康的正位胸片;
标注模块:用于供影像科专家对筛选出来的属于肺结核患者的正位胸片进行标注,以标注框的方式将正位胸片中的病灶标注出来;
训练模块:用于按照权利要求1所述方法的步骤S4-S9进行模型训练,得到最终的肺结核检测模型。
3.一种具有权利要求1所述方法训练得到的肺结核检测模型的辅助诊断设备。
CN202110359537.7A 2021-04-02 2021-04-02 基于遗传算法的肺结核检测模型的训练方法、装置及设备 Pending CN113053519A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110359537.7A CN113053519A (zh) 2021-04-02 2021-04-02 基于遗传算法的肺结核检测模型的训练方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110359537.7A CN113053519A (zh) 2021-04-02 2021-04-02 基于遗传算法的肺结核检测模型的训练方法、装置及设备

Publications (1)

Publication Number Publication Date
CN113053519A true CN113053519A (zh) 2021-06-29

Family

ID=76517474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110359537.7A Pending CN113053519A (zh) 2021-04-02 2021-04-02 基于遗传算法的肺结核检测模型的训练方法、装置及设备

Country Status (1)

Country Link
CN (1) CN113053519A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109448854A (zh) * 2018-09-14 2019-03-08 慧影医疗科技(北京)有限公司 一种肺结核检测模型的构建方法及应用
CN110175993A (zh) * 2019-05-27 2019-08-27 西安交通大学医学院第一附属医院 一种基于FPN的Faster R-CNN肺结核征象检测系统及方法
US20200342958A1 (en) * 2019-04-23 2020-10-29 Cedars-Sinai Medical Center Methods and systems for assessing inflammatory disease with deep learning
CN112037212A (zh) * 2020-09-04 2020-12-04 北京掌引医疗科技有限公司 一种基于深度学习的肺结核dr影像识别方法
CN112241961A (zh) * 2020-09-22 2021-01-19 深圳视见医疗科技有限公司 基于深度卷积神经网络的胸部x光片辅助诊断方法及系统
CN112259221A (zh) * 2020-10-21 2021-01-22 北京大学第一医院 基于多种机器学习算法的肺癌诊断系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109448854A (zh) * 2018-09-14 2019-03-08 慧影医疗科技(北京)有限公司 一种肺结核检测模型的构建方法及应用
US20200342958A1 (en) * 2019-04-23 2020-10-29 Cedars-Sinai Medical Center Methods and systems for assessing inflammatory disease with deep learning
CN110175993A (zh) * 2019-05-27 2019-08-27 西安交通大学医学院第一附属医院 一种基于FPN的Faster R-CNN肺结核征象检测系统及方法
CN112037212A (zh) * 2020-09-04 2020-12-04 北京掌引医疗科技有限公司 一种基于深度学习的肺结核dr影像识别方法
CN112241961A (zh) * 2020-09-22 2021-01-19 深圳视见医疗科技有限公司 基于深度卷积神经网络的胸部x光片辅助诊断方法及系统
CN112259221A (zh) * 2020-10-21 2021-01-22 北京大学第一医院 基于多种机器学习算法的肺癌诊断系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
莫珍丽 等: "《基于BP神经网络和遗传算法的肺结核发病率预测模型研究》", 《信息通信》 *

Similar Documents

Publication Publication Date Title
JPH04332548A (ja) ニューラル・ネットワークを用いた鑑別診断支援方法
Gupta Pneumonia detection using convolutional neural networks
Shen et al. Guest editorial: special issue on imaging-based diagnosis of COVID-19
CN111816314B (zh) 一种用于人工智能筛查尘肺病胸片遴选、标注及验证方法
CN111403026A (zh) 一种面瘫等级评估方法
CN116246778B (zh) 一种肺功能检测智能诊断平台
CN111445443B (zh) 早急性脑梗死检测方法和装置
Nafi’iyah et al. Lung X-ray image enhancement to identify pneumonia with CNN
Li et al. PNet: An efficient network for pneumonia detection
Arntfield et al. Development of a deep learning classifier to accurately distinguish COVID-19 from look-a-like pathology on lung ultrasound
CN117497181B (zh) 一种基于人工智能的慢性病信息管理系统
CN113053519A (zh) 基于遗传算法的肺结核检测模型的训练方法、装置及设备
CN117409016A (zh) 一种磁共振图像自动分割方法
CN108596868A (zh) 一种基于深度学习的胸部dr中肺结节识别方法及系统
CN114862865B (zh) 基于多视角冠状动脉造影序列图像的血管分割方法及系统
CN104000618A (zh) 一种用环真光子数门控方法进行呼吸运动门控校正技术
CN116452592A (zh) 脑血管病ai认知功能评测模型的构建方法、装置及系统
Tang et al. CNN-based automatic detection of bone conditions via diagnostic CT images for osteoporosis screening
CN113808105B (zh) 一种基于超声扫查的病灶检测方法
Singh PneumoXttention: A CNN compensating for Human Fallibility when Detecting Pneumonia through CXR images with Attention
Saglam et al. COVID-19 Detection from X-ray Images Using a New CNN Approach
KR102275263B1 (ko) 깊이 카메라를 이용한 호흡량 측정 시스템
CN107256544A (zh) 一种基于vcg16的前列腺癌图像诊断方法及系统
Dhanapala et al. Transfer learning techniques with SVM for covid-19 disease prediction based on chest X-ray images
Ajad et al. CV-CXR: A Method for Classification and Visualisation of Covid-19 virus using CNN and Heatmap

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210629

RJ01 Rejection of invention patent application after publication