CN109035212A - 一种肺部ct影像特殊组织的标记方法 - Google Patents
一种肺部ct影像特殊组织的标记方法 Download PDFInfo
- Publication number
- CN109035212A CN109035212A CN201810727772.3A CN201810727772A CN109035212A CN 109035212 A CN109035212 A CN 109035212A CN 201810727772 A CN201810727772 A CN 201810727772A CN 109035212 A CN109035212 A CN 109035212A
- Authority
- CN
- China
- Prior art keywords
- lung
- image
- particular tissues
- original image
- labeling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
- G06T7/0014—Biomedical image inspection using an image reference approach
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30061—Lung
- G06T2207/30064—Lung nodule
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Abstract
本发明公开了一种肺部ct影像特殊组织的标记方法,包括如下步骤:(1)、样本标记:(2)、设计语义分割模型:以像素分割的方式,在原始图像中标记出特定对象的区域,并依此建立一个U‑Net模型;(3)、特殊组织检测模型的训练:采用图像变换方法,对原始图像和掩模图像同时进行变换,以进行数据增强;(4)、计算模型性能的度量指标:模型性能的度量指标就是Dice系数,起计算公式为:本发明可以提升肺结节检查准确率。
Description
技术领域
本发明涉及肺部ct影像领域;具体涉及一种肺部ct影像特殊组织的标记方法。
背景技术
癌症,作为一直以来人类难以降服的恶疾,严重威胁着人类的生命健康。其中,肺癌在所有恶性肿瘤发病及死亡中均占首位。据统计,2012年约有160万人因肺癌死亡,另有180万新增病例被确诊。筛查肺癌对于患者的早期诊断和治疗至关重要,可以通过筛查技术来改善患者预后。肺癌筛查容易出现假阳性,由此会增加不必要的治疗成本,并给患者带来额外的压力。利用针对肺癌的计算机辅助诊断方法,能够为早期癌症筛查提供更全面的覆盖,并降低诊断中的假阳性率。
虽然发现肺结节可能并不代表确诊早期肺癌,但肺癌筛查的第一步就是检测肺结节。然而,在CT影像中的肺部,除了以结节代表的疑似肺癌外,还可能包含多种肺部疾病,例如:肺气肿、肺结核等。特别是,长期吸烟人群是多种肺部疾病的高发人群,其肺部很有可能同时存在结节和其它特殊病变组织。这就为准确检测结节,增加了额外的难度。为此,需要专门的模型,对特殊组织进行检测。
事实上,当能检测出肺部有很多“奇怪的组织”时,患者罹患癌症的机会会很高。而此时,若结节检测器没有发现任何结节,就会给出阴性的判定,这对医疗诊断有较为负面的影响。
发明内容
本发明目的在于:为了解决上述背景技术中的现有技术存在的问题,提供一种肺部ct影像特殊组织的标记方法,可以提升肺结节检查准确率。
本发明解决其技术问题所采用的技术方案是:一种肺部ct影像特殊组织的标记方法,包括如下步骤:
(1)、样本标记:LIDC-IDRI肺结节公开数据集和LUNA16肺结节检测竞赛数据集中,用传统方法,标记出肺部ct影像特殊组织样本;
(2)、设计语义分割模型:以像素分割的方式,在原始图像中标记出特定对象的区域,并依此建立一个U-Net模型;
(3)、特殊组织检测模型的训练:采用图像变换方法,对原始图像和掩模图像同时进行变换,以进行数据增强;
其中训练的batch size为4,优化方法为带动量的SGD,学习率固定为0.001。
(4)、计算模型性能的度量指标:模型性能的度量指标就是Dice系数,起计算公式为:
优选地:步骤(3)中采用的图像变换方法为随机弹性变换、随机旋转、随机翻转和随机平移。
优选地:步骤(3)中对原始图像和掩模图像进行变换时,要使用同样的变换方法和变换参数。
与现有技术相比,本发明具有以下有益效果:
本发明首先通过U-Net架构以像素分割的方式,在原始图像中标记出特定对象的区域;其次,通过使用了多种图像变换方法,包括:随机弹性变换、随机旋转、随机翻转和随机平移等对数据进行了增强,避免了用于特殊组织检测的数据集样本较少的问题。最终模型的Dice系数指标能够超过0.8,达到较高的水平。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是非结节特殊组织及其对应标记ct影像图;
图2是U-Net模型语义分割模型架构;
图3是采用随机旋转变换数据增强后ct影像对比图;
图4是特殊组织检测模型训练图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。
一种肺部ct影像特殊组织的标记方法,包括如下步骤:
(1)、样本标记:LIDC-IDRI肺结节公开数据集和LUNA16肺结节检测竞赛数据集中,用传统方法,标记出肺部ct影像特殊组织样本;
(2)、设计语义分割模型:以像素分割的方式,在原始图像中标记出特定对象的区域,并依此建立一个U-Net模型;
(3)、特殊组织检测模型的训练:采用图像变换方法,对原始图像和掩模图像同时进行变换,以进行数据增强;
其中训练的batch size为4,优化方法为带动量的SGD,学习率固定为0.001。
(4)、计算模型性能的度量指标:模型性能的度量指标就是Dice系数,起计算公式为:
其中:步骤(3)中采用的图像变换方法为随机弹性变换、随机旋转、随机翻转和随机平移。
其中:步骤(3)中对原始图像和掩模图像进行变换时,要使用同样的变换方法和变换参数。
目前权威性最高,使用最为广泛的数据集及标注方法为LIDC-IDRI肺结节公开数据集(以下简称:LIDC数据)和LUNA16肺结节检测竞赛数据集(以下简称:LUNA16数据)。
其中LIDC数据由胸部医学图像文件(如:CT、X光片)和对应的诊断结果病变标注组成。该数据是由美国国家癌症研究所发起收集的,目的是为了研究高危人群早期癌症检测。图像文件为DICOM格式,共收录了1018个研究实例。
标注方法分为两个阶段,第一阶段每位医师分别独立诊断并标注病患位置,其中会标注三种类别:1)大于等于3mm的结节,2)小于3mm的结节,3)大于等于3mm的非结节。在随后的第二阶段中,各位医师都分别独立的复审其他三位医师的标注,并给出自己最终的诊断结果。除此以外,标注中还包含检出难度(Subtlety)、分叶特征显著度(Lobulation)、毛刺特征显著度(Spiculation)、结节恶性程度(Malignancy)等多个主观特征。
在LUNA16数据集中,大于30mm的结节均未做标记。事实上,该数据集的图像中含有不少肺气肿等特殊组织样本。这些样本面积较大,与周边组织区别较大,很容易分辨。即使自己进行标注,也很容易得到较为准确的结果。而且,针对这一建模需求,已有人标记出了一些非结节特殊组织,并将标记出的子数据集共享了出来。
如图1所示,是在LIDC数据和LUNA16数据基础上做出的非结节特殊组织及其对应标记。
由于特殊组织也是肺癌检测的重要特征,因此,需要构建特殊组织检测模型,在原始CT切片中,标记出特殊组织区域。我们在此基础上,采用以下方法标注非结节的特殊影像区域。
(1)、设计语义分割模型
以像素分割的方式,在原始图像中标记出特定对象的区域,是典型的图像语音分割问题。这样的问题广泛存在于医学影像分析中。目前,针对这一问题较好的模型结构是U-Net模型。根据训练数据的特点,这里构建了一个修改版的U-Net,用于完成特殊组织检测任务。具体网络架构如图2所示。
(2)特殊组织检测模型的训练
由于用于特殊组织检测的数据集样本较少,因此需要做更多的数据增强。这里,使用了多种图像变换方法,包括:随机弹性变换、随机旋转、随机翻转和随机平移。需要注意的是,必须使用同样的变换方法和变换参数,对原始图像和掩模图像同时进行变换,图像和标注才能保持一致。以随机旋转变换为例,如图3所示,是采用随机旋转变换数据增强后ct影像对比图。
训练的batch size为4,优化方法为带动量的SGD,学习率固定为0.001。由于模型需要对每一个像素点进行判断,并与掩模图像比较,这可以视为是两个集合进行比较,并度量两个集合的相似性。Dice系数是一种集合相似度度量函数,通常用于计算两个样本的相似度,其计算公式为:
模型性能的度量指标就是Dice系数。训练时的损失函数是负的Dice系数。训练曲线如图4所示,最终,验证集上的Dice系数指标能够超过0.8。
设计语义分割模型的U-Net架构的模型也可以通过其他网络实行。但是U-NET具有结构简单,训练时间短,训练参数少等优势。但是与其它网络比,深度略显不足。一般来说,网络深度意味着特征抽象层次的复杂程度。由于这里进行的特殊组织检测任务,大部分图像分割依据来源于图像的纹理、边缘等低级别特征,因此较浅的网络也能很好地完成任务。
目前肺癌的早期诊断以肺结节为第一步,然而,在CT影像中的肺部,除了以结节外,其它特殊病变组织也与肺癌密切相关。为准确肺癌,避免假阴性,本发明设计了基于CT的影像标注模型,对肺部特殊组织进行了检测。
本发明首先通过U-Net架构以像素分割的方式,在原始图像中标记出特定对象的区域;其次,通过使用了多种图像变换方法,包括:随机弹性变换、随机旋转、随机翻转和随机平移等对数据进行了增强,避免了用于特殊组织检测的数据集样本较少的问题。最终模型的Dice系数指标能够超过0.8,达到较高的水平。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
Claims (3)
1.一种肺部ct影像特殊组织的标记方法,其特征在于,包括如下步骤:
(1)、样本标记:LIDC-IDRI肺结节公开数据集和LUNA16肺结节检测竞赛数据集中,用传统方法,标记出肺部ct影像特殊组织样本;
(2)、设计语义分割模型:以像素分割的方式,在原始图像中标记出特定对象的区域,并依此建立一个U-Net模型;
(3)、特殊组织检测模型的训练:采用图像变换方法,对原始图像和掩模图像同时进行变换,以进行数据增强;
其中训练的batch size为4,优化方法为带动量的SGD,学习率固定为0.001。
(4)、计算模型性能的度量指标:模型性能的度量指标就是Dice系数,起计算公式为:
2.如权利要求1所述的一种肺部ct影像特殊组织的标记方法,其特征在于:步骤(3)中采用的图像变换方法为随机弹性变换、随机旋转、随机翻转和随机平移。
3.如权利要求1所述的一种肺部ct影像特殊组织的标记方法,其特征在于:步骤(3)中对原始图像和掩模图像进行变换时,要使用同样的变换方法和变换参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810727772.3A CN109035212A (zh) | 2018-07-05 | 2018-07-05 | 一种肺部ct影像特殊组织的标记方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810727772.3A CN109035212A (zh) | 2018-07-05 | 2018-07-05 | 一种肺部ct影像特殊组织的标记方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109035212A true CN109035212A (zh) | 2018-12-18 |
Family
ID=65522333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810727772.3A Pending CN109035212A (zh) | 2018-07-05 | 2018-07-05 | 一种肺部ct影像特殊组织的标记方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109035212A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717060A (zh) * | 2019-09-04 | 2020-01-21 | 平安科技(深圳)有限公司 | 图像mask的过滤方法、装置及存储介质 |
CN111340827A (zh) * | 2020-05-18 | 2020-06-26 | 天津精诊医疗科技有限公司 | 一种肺部ct影像数据处理分析方法及系统 |
CN112258530A (zh) * | 2020-12-21 | 2021-01-22 | 四川大学 | 基于神经网络的计算机辅助肺结节自动分割方法 |
CN112686897A (zh) * | 2021-03-15 | 2021-04-20 | 四川大学 | 一种基于弱监督的长短轴辅助肠胃淋巴结像素标注的方法 |
-
2018
- 2018-07-05 CN CN201810727772.3A patent/CN109035212A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717060A (zh) * | 2019-09-04 | 2020-01-21 | 平安科技(深圳)有限公司 | 图像mask的过滤方法、装置及存储介质 |
CN110717060B (zh) * | 2019-09-04 | 2023-08-18 | 平安科技(深圳)有限公司 | 图像mask的过滤方法、装置及存储介质 |
CN111340827A (zh) * | 2020-05-18 | 2020-06-26 | 天津精诊医疗科技有限公司 | 一种肺部ct影像数据处理分析方法及系统 |
CN112258530A (zh) * | 2020-12-21 | 2021-01-22 | 四川大学 | 基于神经网络的计算机辅助肺结节自动分割方法 |
CN112686897A (zh) * | 2021-03-15 | 2021-04-20 | 四川大学 | 一种基于弱监督的长短轴辅助肠胃淋巴结像素标注的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109035212A (zh) | 一种肺部ct影像特殊组织的标记方法 | |
Zhang et al. | A sensor-based wrist pulse signal processing and lung cancer recognition | |
Jiang et al. | Improving breast cancer diagnosis with computer-aided diagnosis | |
Oliver et al. | A statistical approach for breast density segmentation | |
CN111243042A (zh) | 基于深度学习的超声甲状腺结节良恶性特征可视化的方法 | |
CN109003299A (zh) | 一种基于深度学习的计算脑出血量的方法 | |
CN106407664B (zh) | 呼吸气体诊断系统的领域自适应装置 | |
CN107330263A (zh) | 一种计算机辅助乳腺浸润性导管癌组织学分级的方法 | |
CN107247887A (zh) | 基于人工智能帮助肺癌筛查的方法及系统 | |
WO2021211787A1 (en) | Systems and methods for quantification of liver fibrosis with mri and deep learning | |
CN104182755B (zh) | 基于塔形pca的乳腺钼靶x线图像块特征提取方法 | |
CN109741317A (zh) | 医学影像智能评价方法 | |
CN109102899A (zh) | 基于机器学习与大数据的中医智能辅助系统及方法 | |
KR102366290B1 (ko) | 의료기계 학습 시스템 | |
CN109003269A (zh) | 一种能提高医生效率的医学影像病灶的标注提取方法 | |
CN107545143A (zh) | 疾病与人体部位的映射方法 | |
JP2019008349A (ja) | 学習データ生成支援装置および学習データ生成支援方法並びに学習データ生成支援プログラム | |
CN110352461A (zh) | 用于确定受试者中是否发生宫颈癌的方法和设备 | |
CN106778047A (zh) | 一种基于多维度医学图像的中医面诊综合系统 | |
CN111916185A (zh) | 为ai诊断模型提供影像数据的管理系统及方法 | |
CN110264460A (zh) | 一种目标检测结果的鉴别方法、装置、设备及存储介质 | |
Li et al. | End-to-end coordinate regression model with attention-guided mechanism for landmark localization in 3D medical images | |
CN110503147A (zh) | 基于相关性学习的多模图像分类系统 | |
CN113539476A (zh) | 基于人工智能的胃内窥活检拉曼图像辅助诊断方法和系统 | |
CN115607113B (zh) | 基于深度学习模型的冠心病患者手诊数据处理方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181218 |
|
WD01 | Invention patent application deemed withdrawn after publication |