CN115018852B - 一种基于半监督学习的腹部淋巴结检测方法及装置 - Google Patents
一种基于半监督学习的腹部淋巴结检测方法及装置 Download PDFInfo
- Publication number
- CN115018852B CN115018852B CN202210953335.XA CN202210953335A CN115018852B CN 115018852 B CN115018852 B CN 115018852B CN 202210953335 A CN202210953335 A CN 202210953335A CN 115018852 B CN115018852 B CN 115018852B
- Authority
- CN
- China
- Prior art keywords
- model
- lymph node
- image
- module
- sampling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
- G06V10/765—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
- G06V2201/032—Recognition of patterns in medical or anatomical images of protuberances, polyps nodules, etc.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于半监督学习的腹部淋巴结检测方法及装置,涉及基于半监督学习的腹部淋巴结的检测,其目的在于解决难以获得大量精确标注的腹部淋巴结图像数据、标注数据过少不能很好完成深度神经网络训练的问题。其先利用有限的标注好的数据输入监督学习,形成具有一定成熟度的淋巴结检测模型;然后再将淋巴结检测模型复制成教师网络、学生网络,利用弱增强的无标注数据输入教师网络并生成伪标签,再利用伪标签与强增强的无标注数据输入学生模型进行训练,并更新教师模型、学生模型的参数;重复训练并直至模型收敛。通过利用无标注数据生成伪标签用于训练,可显著减少对原始样本数据的标注工作,从而在小数据集上也能达到比较好的性能。
Description
技术领域
本发明人工智能医学技术领域,涉及胃肠淋巴结筛查领域,更具体的是涉及一种基于半监督学习的腹部淋巴结的检测。
背景技术
结直肠癌是胃肠道中的常见恶性肿瘤。我国属于结直肠癌低发地区,但今年来结直肠癌发病有显著上升趋势,发病率及死亡率日益升高。目前最有效的方式的肠镜下的组织活检,但存在一定的风险性,因此精准、无创影像学的方法成为了现在研究热门。
在智能影像学研究中,基于深度学习的淋巴结自动检测是重要的研究方向,Fast-RCNN, YOLO等深度学习领域中热门的检测算法也在肺部淋巴结智能检测中大放异彩,具有较高的准确率。另外,淋巴结检测方面的专利申请,也是越来越多。
申请号为202010261006.X的发明专利申请就公开了一种检测模型训练方法、淋巴结检测方法、装置、设备及介质,检测模型训练方法包括:基于特征提取网络构建淋巴结检测模型;获取所述淋巴结检测模型的训练样本数据,使用所述训练样本数据对所述淋巴结检测模型进行训练,得到训练好的淋巴结检测模型,其中所述训练样本数据包括样本图像、所述样本图像对应的样本检测标签,以及所述样本图像对应的样本分割标签。该模型训练方法通过使用包括样本图像、样本图像对应的样本检测标签以及样本图像对应的样本分割标签的训练样本数据对淋巴结检测模型中的不同特征层进行多分支训练,使得训练好的淋巴结检测模型能够提供较全面的淋巴结检测信息。
申请号为202110192337.7的发明专利申请就公开了一种基于先验知识的医学图像淋巴结检测方法,其包括如下步骤:数据准备与标定、数据预处理、关键帧定位模型的构建、关键区域提取和淋巴结检测模型构建;该检测方法由两个级联的深度神经网络模型构成:关键帧定位深度神经网络模型和淋巴结检测深度神经网络模型。该方法还提出了两种先验知识:用于关键帧定位模型的关键帧空间先验知识和用于淋巴结检测模型的淋巴结锚点尺度先验知识。通过这两种先验知识,可以有效提升CT关键帧定位的准确性以及淋巴结检测的效果。
申请号为202110170258.6的发明专利申请就公开了一种基于注意力机制神经网络的腹部淋巴结分区方法,其包括以下步骤:步骤1:数据准备;步骤2:掩模生成,对数据进行预处理;步骤3:构建注意力机制残差网络模型;步骤4:重复步骤3,构建并训练淋巴结相对位置分区的模型;步骤5:使用步骤3、步骤4训练好的模型对检测任务自动检测出的腹部淋巴结节进行分类。本发明中通过利用原始CT图像与掩模叠加作为输入,并引入注意力机制到深度残差神经网络,从而可以对CT图像中的腹部淋巴结节进行准确分区。
正如上述的现有技术一样,越来越多的淋巴结检测技术中使用到深度神经网络,通过深度神经网络实现淋巴结的自动识别与检测。但深度神经网络往往是需要进行训练的,且深度神经网络的训练往往需要依赖大量精确标注的数据,而在一些小数据集上难以达到比较好的性能。此外,腹部组织器官复杂,存在血管断层、神经节等在结构上与淋巴结相似的组织,医生标注数据耗时耗力,数据标注一致性也难以保证,大量精确标注的数据难以获得。在此情形下,利用有限的标注数据训练高性能模型成为了一个具有现实意义的需求。
发明内容
本发明的目的在于:为了解决难以获得大量精确标注的腹部淋巴结图像数据、标注数据过少不能很好完成深度神经网络训练的问题,本发明提供一种基于半监督学习的淋巴结检测模型训练方法,采用教师-学生模型双模型学习方式,利用无标注数据提高模型性能,减轻模型训练对于精确标注数据的依赖。
本发明为了实现上述目的具体采用以下技术方案:
一种基于半监督学习的腹部淋巴结检测方法,包括:
获取训练样本数据,训练样本数据包括无标注的腹部CT图像、标注的腹部CT图像;
基于特征提取网络构建淋巴结检测模型;
使用标注的腹部CT图像对淋巴结检测模型进行训练;
将训练后的淋巴结检测模型复制成教师模型、学生模型;
将弱增强处理后的无标注的腹部CT图像输入教师模型,教师模型输出伪标签,将伪标签以及强增强处理后的无标注的腹部CT图像输入学生模型,并更新教师模型、学生模型的权重;重复训练,直至学生模型收敛;
将实时腹部CT图像输入训练后的学生模型,输出腹部CT图像的检测结果。
优选地,对获取的训练样本数据进行预处理,预处理包括:HU归一化处理、空间归一化处理、区域分割处理、区域填充处理以及区域移除处理。
优选地,淋巴结检测模型包括下采样、上采样;
下采样包括一个卷积模块与四个降采样模块,卷积模块由两个卷积核尺寸为3*3*3的卷积层组成,降采样模块由两个卷积核尺寸为3*3*3的卷积层、一个批归一化层与一个ReLu激活层;
上采样包括两个上采样模块和RPN模块,每个上采样模块后使用反卷积模块是特征图尺寸翻倍,并于上采样的相应特征图按位相加构成跳跃连接,并得到跨层次融合特征。
优选地,无标注的腹部CT图像的弱增强处理为旋转处理;无标注的腹部CT图像的强增强处理包括旋转处理、维度交换处理、伽马变换处理、对数变换处理以及随机擦除处理。
优选地,淋巴结检测模型的损失函数为:
优选地,学生模型通过反向传播算法更新模型权值,损失函数与权值更新算法为:
一种基于半监督学习的腹部淋巴结检测装置,包括:
样本数据获取模块,用于获取训练样本数据,训练样本数据包括无标注的腹部CT图像、标注的腹部CT图像;
检测模型搭建模块,用于基于特征提取网络构建淋巴结检测模型;
模型训练模块,用于使用标注的腹部CT图像对淋巴结检测模型进行训练;
模型复制模块,用于将训练后的淋巴结检测模型复制成教师模型、学生模型;
学生模型训练模块,用于将弱增强处理后的无标注的腹部CT图像输入教师模型,教师模型输出伪标签,将伪标签以及强增强处理后的无标注的腹部CT图像输入学生模型,并更新教师模型、学生模型的权重;重复训练,直至学生模型收敛;
实时标注模块,用于将实时腹部CT图像输入训练后的学生模型,输出腹部CT图像的检测结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述方法的步骤。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述方法的步骤。
本发明的有益效果如下:
本发明中,先利用有限的标注好的数据输入监督学习,形成具有一定成熟度的淋巴结检测模型;然后再将淋巴结检测模型复制成教师网络、学生网络,利用弱增强的无标注数据输入教师网络并生成伪标签,再利用伪标签与强增强的无标注数据输入学生模型进行训练,并更新教师模型、学生模型的参数;重复训练并直至模型收敛;通过利用无标注数据生成伪标签用于训练,无需每组样本数据都进行标注处理,可显著减少对原始样本数据的标注工作,从而在小数据集上也能达到比较好的性能,从而解决了难以获得大量精确标注的腹部淋巴结图像数据、标注数据过少不能很好完成深度神经网络训练的问题,采用教师-学生模型双模型学习方式,利用无标注数据提高模型性能,减轻模型训练对于精确标注数据的依赖。
附图说明
图1是本发明的流程示意图;
图2是本发明中淋巴结检测模型的结构示意图;
图3是本发明中淋巴结检测模型的训练示意图;
图4是本发明中教师模型、学生模型的训练示意图;
图5是本发明中样本数据预处理后的可视化图像;
图6是本发明中无标注数据进行增强处理后的示意图。
具体实施方式
实施例1
本实施例提供一种基于半监督学习的腹部淋巴结检测方法,其用于对腹部CT图像进行处理后,输出其淋巴结的检测结果。如图1所示,该检测方法具体包括:
获取训练样本数据:
获取训练样本数据,该样本数据包括无标注的腹部CT图像、标注的腹部CT图像。组织医学专家对少量腹部CT图像进行精确标注,通过二级标注流程获得标注好的腹部CT图像。
对训练样本数据进行预处理,其预处理包括:HU归一化处理、空间归一化处理、区域分割处理、区域填充处理以及区域移除处理,预处理后的可视化图像如图5所示。预处理的具体为:
HU归一化处理,HU(Houndsfield Unit, HU)值是CT值的计量单位,反映组织密度。本步骤将图像HU值归一化至[-1, 1]。根据医学先验知识,使用软组织窗宽窗位[300HU,40HU],即以窗位40HU为中心,显示窗宽300HU的CT范围的图像,这意味着CT图像中大于190HU的体素点将会归一化至1,小于-110HU的体素点将归一化至-1,而后再缩放至[0,255]以满足程序的格式需求。
空间归一化处理,由于采集设备与病人体位的不同,不同CT图像之间,两相邻像素中心点之间的实际物理距离不同,这会导致相同的物体在不同CT图像上具有不同的显示大小,进而影响模型检测效果。使用最近邻插值法,将不同CT图像间距归一化至统一的[2,0.7, 0.7],即z轴上两相邻像素中心点之间的物理距离为2mm,x轴与y轴上物理距离为0.7mm,该标准是数据集内所有图像统计出的平均间距。
区域分割处理,CT图像中包含了大量非腹部图像区域,如拍摄时的背板,因此需要移除非腹部区域,以获得更好的检测性能,减少检测时的消耗。采用阈值方法分割有效区域,首先对原图像使用中值模糊方法进行图像平滑,降低噪声的同时减少阈值分割时产生空洞,弱化非有效区域的图像亮度,然后对原图像与模糊后图像分别应用阈值分割,得到两个分割结果,对两个分割结果按位取或,即可得到区域分割结果。
区域填充处理,图5 (e) 中深色部分即为分割出的非有效区域,使用预设值170填充,以区分有效与非有效区域。所谓深色部分,是指图示外围灰色部分里面的区域。
区域移除处理,在分割结果边缘分别预留出5像素的边界,以提高预处理的容错率,而后移除边界之外的像素。
搭建模型:
基于特征提取网络构建淋巴结检测模型。该淋巴结检测模型包括下采样、上采样,如图2所示;
下采样包括一个卷积模块与四个降采样模块,用于提取更强的语义特征;卷积模块由两个卷积核尺寸为3*3*3的卷积层组成,降采样模块由两个卷积核尺寸为3*3*3的卷积层、一个批归一化层与一个ReLu激活层。降采样模块中的卷积特征由短路(short-cut)连接增强,降采样模块的设计能有效提高模型深度,增强模型性能,在每个降采样模块后使用最大池化层将特征图减半。
上采样用于保存位置特征,其包括两个上采样模块和RPN模块,每个上采样模块后
使用反卷积模块是特征图尺寸翻倍,并于上采样的相应特征图按位相加构成跳跃连接,并
得到跨层次融合特征。RPN网络会输出若干5维向量,其中表示对该候选
淋巴结的预测概率,表示该候选淋巴结中心点的三维坐标,表示其直径。
由于算力、内存、显存等限制,模型训练时无法将CT立方体整体作为输入。因此,将CT立方体整体分割为多个尺寸为[128, 128, 128]的小尺寸立方体,在保持正负样本均衡的前提下,随机选择切分图像进行训练。在推理时,则将CT立方体整体切分为32个有重叠区域的小立方体,分别输入至模型中,再将模型预测结果映射至全局坐标,得到对CT整体图像的检测结果。
该框架整体分为两阶段,模型权重初始化阶段与双模型学习阶段。
模型权重初始化阶段,即淋巴结检测模型训练:
使用标注的腹部CT图像对淋巴结检测模型进行训练。如图3所示,在模型权重初始化阶段,所有有标注的腹部CT图像均将被用于训练淋巴结检测模型,通过有监督学习方法,初步优化模型权重。
复制并形成教师模型、学生模型:
在模型权重初始化阶段结束后,将所有有标注的腹部CT图像用于淋巴结检测模型训练并形成半成熟的淋巴结检测模型,然后将训练后的半成熟的淋巴结检测模型复制成教师模型、学生模型,即教师模型、学生模型的结构与淋巴结检测模型的结构一致。
双模型学习阶段,即学生模型训练:
在双模型联合学习阶段,教师模型用于生成伪标签供学生模型学习,学生模型通过伪标签学习方式更新模型权重,并将学到的知识反馈给教师模型;教师模型得到知识更新,产生更高质量伪标签,如此反复,直至模型收敛,如图4所示。具体为:
将无标注的腹部CT图像进行增强处理,增强处理方式包括两种不同的数据增强方式,即弱增强处理、强增强处理,所谓弱增强处理即为对无标注的腹部CT图像进行旋转处理;所谓强增强处理即为对无标注的腹部CT图像进行旋转处理、维度交换处理、伽马变换处理、对数变换处理以及随机擦除处理,强增强处理后的可视化展示如图6所示。
旋转处理,是指将三维立方体沿z轴随机旋转0°~180°。
维度交换处理,是指随机交换三维立方体维度。
伽马变换。使用伽马变换公式调整图像灰度。其中c与为预设常数常数,r为输入图像。
对数变换。使用对数变换公式调整图像灰度。其中c与v为预设常数,r为输入图。
随机擦除。在图像随机位置进行像素裁剪,并使用背景值170填充。
生成伪标签:
由于学生模型需要依靠教师模型产生的伪标签优化模型参数,因此伪标签质量对
于整个算法性能具有重要影响。使用教师模型对弱增强无标注数据进行检测,得到候选淋
巴结。由于模型可能存在对同一淋巴结多次重复检测,产生冗余检测边界框的问题,这对使
用伪标签方法进行半监督学习是不利的,因此在预测结果之后使用三维NMS算法对预测结
果进行后处理,得到聚合后的边界框与对应概率。本实施例中,教师模型使用阈值法,设置
超参数作为评选候选淋巴结可行度的阈值,对于某一候选淋巴结,
伪标签学习:
为利用无标注数据,教师模型将生成伪标签训练学生模型。在教师学生双模型学习机制中,教师模型使用弱增强无标注数据生成伪标签,学生模型使用强增强无标注数据学习伪标签知识。教师模型使用弱增强数据能提供更为可靠的伪标签,而改进教师模型性能的关键因素之一是需要保持学生模型与教师模型的多样性,因此使用强增强数据训练学生模型,保持学生模型与教师模型的差异性。
学生模型通过反向传播算法更新模型权值,其损失函数与权值更新算法为:
需要指出的是,无监督损失方程公式并不
包含边界框回归损失项,这是因为采用置信度阈值过滤方法生成的伪标签并不能过滤掉可
能存在的边界框回归错误,教师模型预测的置信度仅能代表其对于淋巴结分类的信心,而
不包含对边界框的信心。
双模型交互学习
为了提高教师模型性能,生成稳定可靠的伪标签,本实施例中使用EMA方法更新教师模型权重。EMA是机器学习中常见的求平滑平均值的方法,其公式如下:
在学生模型每次参数更新后,教师模型使用EMA算法更新权重,从学生模型的知识更新中得到反馈,提高自身生成的伪标签质量,进而生成更高质量伪标签供给学生训练,形成正向反馈。
将实时腹部CT图像输入训练后的学生模型,输出腹部CT图像的检测结果。
实施例2
本实施例提供一种基于半监督学习的腹部淋巴结检测装置,其用于对腹部CT图像进行处理后,输出其淋巴结的检测结果。该检测装置具体包括:
样本数据获取模块,用于获取训练样本数据,训练样本数据包括无标注的腹部CT图像、标注的腹部CT图像;
获取训练样本数据,该样本数据包括无标注的腹部CT图像、标注的腹部CT图像。组织医学专家对少量腹部CT图像进行精确标注,通过二级标注流程获得标注好的腹部CT图像。
对训练样本数据进行预处理,其预处理包括:HU归一化处理、空间归一化处理、区域分割处理、区域填充处理以及区域移除处理,预处理后的可视化图像如图5所示。预处理的具体为:
HU归一化处理,HU(Houndsfield Unit, HU)值是CT值的计量单位,反映组织密度。本步骤将图像HU值归一化至[-1, 1]。根据医学先验知识,使用软组织窗宽窗位[300HU,40HU],即以窗位40HU为中心,显示窗宽300HU的CT范围的图像,这意味着CT图像中大于190HU的体素点将会归一化至1,小于-110HU的体素点将归一化至-1,而后再缩放至[0,255]以满足程序的格式需求。
空间归一化处理,由于采集设备与病人体位的不同,不同CT图像之间,两相邻像素中心点之间的实际物理距离不同,这会导致相同的物体在不同CT图像上具有不同的显示大小,进而影响模型检测效果。使用最近邻插值法,将不同CT图像间距归一化至统一的[2,0.7, 0.7],即z轴上两相邻像素中心点之间的物理距离为2mm,x轴与y轴上物理距离为0.7mm,该标准是数据集内所有图像统计出的平均间距。
区域分割处理,CT图像中包含了大量非腹部图像区域,如拍摄时的背板,因此需要移除非腹部区域,以获得更好的检测性能,减少检测时的消耗。采用阈值方法分割有效区域,首先对原图像使用中值模糊方法进行图像平滑,降低噪声的同时减少阈值分割时产生空洞,弱化非有效区域的图像亮度,然后对原图像与模糊后图像分别应用阈值分割,得到两个分割结果,对两个分割结果按位取或,即可得到区域分割结果。
区域填充处理,图5 (e) 中深色部分即为分割出的非有效区域,使用预设值170填充,以区分有效与非有效区域。所谓深色部分,是指图示外围灰色部分里面的区域。
区域移除处理,在分割结果边缘分别预留出5像素的边界,以提高预处理的容错率,而后移除边界之外的像素。
检测模型搭建模块,用于基于特征提取网络构建淋巴结检测模型;
基于特征提取网络构建淋巴结检测模型。该淋巴结检测模型包括下采样、上采样,如图2所示;
下采样包括一个卷积模块与四个降采样模块,用于提取更强的语义特征;卷积模块由两个卷积核尺寸为3*3*3的卷积层组成,降采样模块由两个卷积核尺寸为3*3*3的卷积层、一个批归一化层与一个ReLu激活层。降采样模块中的卷积特征由短路(short-cut)连接增强,降采样模块的设计能有效提高模型深度,增强模型性能,在每个降采样模块后使用最大池化层将特征图减半。
上采样用于保存位置特征,其包括两个上采样模块和RPN模块,每个上采样模块后
使用反卷积模块是特征图尺寸翻倍,并于上采样的相应特征图按位相加构成跳跃连接,并
得到跨层次融合特征。RPN网络会输出若干5维向量,其中表示对该候选
淋巴结的预测概率,表示该候选淋巴结中心点的三维坐标,表示其直径。
由于算力、内存、显存等限制,模型训练时无法将CT立方体整体作为输入。因此,将CT立方体整体分割为多个尺寸为[128, 128, 128]的小尺寸立方体,在保持正负样本均衡的前提下,随机选择切分图像进行训练。在推理时,则将CT立方体整体切分为32个有重叠区域的小立方体,分别输入至模型中,再将模型预测结果映射至全局坐标,得到对CT整体图像的检测结果。
模型训练模块,用于使用标注的腹部CT图像对淋巴结检测模型进行训练;
使用标注的腹部CT图像对淋巴结检测模型进行训练。如图3所示,在模型权重初始化阶段,所有有标注的腹部CT图像均将被用于训练淋巴结检测模型,通过有监督学习方法,初步优化模型权重。
模型复制模块,用于将训练后的淋巴结检测模型复制成教师模型、学生模型;
在模型权重初始化阶段结束后,将所有有标注的腹部CT图像用于淋巴结检测模型训练并形成半成熟的淋巴结检测模型,然后将训练后的半成熟的淋巴结检测模型复制成教师模型、学生模型,即教师模型、学生模型的结构与淋巴结检测模型的结构一致。
学生模型训练模块,用于将弱增强处理后的无标注的腹部CT图像输入教师模型,教师模型输出伪标签,将伪标签以及强增强处理后的无标注的腹部CT图像输入学生模型,并更新教师模型、学生模型的权重;重复训练,直至学生模型收敛;
在双模型联合学习阶段,教师模型用于生成伪标签供学生模型学习,学生模型通过伪标签学习方式更新模型权重,并将学到的知识反馈给教师模型;教师模型得到知识更新,产生更高质量伪标签,如此反复,直至模型收敛,如图4所示。具体为:
将无标注的腹部CT图像进行增强处理,增强处理方式包括两种不同的数据增强方式,即弱增强处理、强增强处理,所谓弱增强处理即为对无标注的腹部CT图像进行旋转处理;所谓强增强处理即为对无标注的腹部CT图像进行旋转处理、维度交换处理、伽马变换处理、对数变换处理以及随机擦除处理,强增强处理后的可视化展示如图6所示。
旋转处理,是指将三维立方体沿z轴随机旋转0°~180°。
维度交换处理,是指随机交换三维立方体维度。
伽马变换。使用伽马变换公式调整图像灰度。其中c与为预设常数常数,r为输入图像。
对数变换。使用对数变换公式调整图像灰度。其中c与v为预设常数,r为输入图。
随机擦除。在图像随机位置进行像素裁剪,并使用背景值170填充。
生成伪标签:
由于学生模型需要依靠教师模型产生的伪标签优化模型参数,因此伪标签质量对
于整个算法性能具有重要影响。使用教师模型对弱增强无标注数据进行检测,得到候选淋
巴结。由于模型可能存在对同一淋巴结多次重复检测,产生冗余检测边界框的问题,这对使
用伪标签方法进行半监督学习是不利的,因此在预测结果之后使用三维NMS算法对预测结
果进行后处理,得到聚合后的边界框与对应概率。本实施例中,教师模型使用阈值法,设置
超参数作为评选候选淋巴结可行度的阈值,对于某一候选淋巴结,
伪标签学习:
为利用无标注数据,教师模型将生成伪标签训练学生模型。在教师学生双模型学习机制中,教师模型使用弱增强无标注数据生成伪标签,学生模型使用强增强无标注数据学习伪标签知识。教师模型使用弱增强数据能提供更为可靠的伪标签,而改进教师模型性能的关键因素之一是需要保持学生模型与教师模型的多样性,因此使用强增强数据训练学生模型,保持学生模型与教师模型的差异性。
学生模型通过反向传播算法更新模型权值,其损失函数与权值更新算法为:
需要指出的是,无监督损失方程公式并不包
含边界框回归损失项,这是因为采用置信度阈值过滤方法生成的伪标签并不能过滤掉可能
存在的边界框回归错误,教师模型预测的置信度仅能代表其对于淋巴结分类的信心,而不
包含对边界框的信心。
双模型交互学习
为了提高教师模型性能,生成稳定可靠的伪标签,本实施例中使用EMA方法更新教师模型权重。EMA是机器学习中常见的求平滑平均值的方法,其公式如下:
在学生模型每次参数更新后,教师模型使用EMA算法更新权重,从学生模型的知识更新中得到反馈,提高自身生成的伪标签质量,进而生成更高质量伪标签供给学生训练,形成正向反馈。
实时标注模块,用于将实时腹部CT图像输入训练后的学生模型,输出腹部CT图像的检测结果。
实施例3
本实施例还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述基于半监督学习的腹部淋巴结检测方法的步骤。
其中,所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器可以是所述计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,所述存储器也可以是所述计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器还可以既包括所述计算机设备的内部存储单元也包括其外部存储设备。本实施例中,所述存储器常用于存储安装于所述计算机设备的操作系统和各类应用软件,例如运行所述基于半监督学习的腹部淋巴结检测方法的的程序代码等。此外,所述存储器还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器通常用于控制所述计算机设备的总体操作。本实施例中,所述处理器用于运行所述存储器中存储的程序代码或者处理数据,例如运行所述基于半监督学习的腹部淋巴结检测方法的的程序代码。
实施例4
本实施例还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述基于半监督学习的腹部淋巴结检测方法的步骤。
其中,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行基于半监督学习的腹部淋巴结检测方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器或者网络设备等)执行本申请各个实施例所述的方法。
Claims (6)
1.一种基于半监督学习的腹部淋巴结检测方法,其特征在于,包括:
获取训练样本数据,训练样本数据包括无标注的腹部CT图像、标注的腹部CT图像;
基于特征提取网络构建淋巴结检测模型;
使用标注的腹部CT图像对淋巴结检测模型进行训练;
将训练后的淋巴结检测模型复制成教师模型、学生模型;
将弱增强处理后的无标注的腹部CT图像输入教师模型,教师模型输出伪标签,将伪标签以及强增强处理后的无标注的腹部CT图像输入学生模型,并更新教师模型、学生模型的权重;重复训练,直至学生模型收敛;
将实时腹部CT图像输入训练后的学生模型,输出腹部CT图像的检测结果;
其中,淋巴结检测模型包括下采样、上采样;
下采样包括一个卷积模块与四个降采样模块,卷积模块由两个卷积核尺寸为3*3*3的卷积层组成,降采样模块由两个卷积核尺寸为3*3*3的卷积层、一个批归一化层与一个ReLu激活层;
上采样包括两个上采样模块和RPN模块,每个上采样模块后使用反卷积模块是特征图尺寸翻倍,并于上采样的相应特征图按位相加构成跳跃连接,并得到跨层次融合特征;
淋巴结检测模型的损失函数为:
学生模型通过反向传播算法更新模型权值,损失函数与权值更新算法为:
2.如权利要求1所述的一种基于半监督学习的腹部淋巴结检测方法,其特征在于:对获取的训练样本数据进行预处理,预处理包括:HU归一化处理、空间归一化处理、区域分割处理、区域填充处理以及区域移除处理。
3.如权利要求1所述的一种基于半监督学习的腹部淋巴结检测方法,其特征在于:无标注的腹部CT图像的弱增强处理为旋转处理;无标注的腹部CT图像的强增强处理包括旋转处理、维度交换处理、伽马变换处理、对数变换处理以及随机擦除处理。
4.一种基于半监督学习的腹部淋巴结检测装置,其特征在于,包括:
样本数据获取模块,用于获取训练样本数据,训练样本数据包括无标注的腹部CT图像、标注的腹部CT图像;
检测模型搭建模块,用于基于特征提取网络构建淋巴结检测模型;
模型训练模块,用于使用标注的腹部CT图像对淋巴结检测模型进行训练;
模型复制模块,用于将训练后的淋巴结检测模型复制成教师模型、学生模型;
学生模型训练模块,用于将弱增强处理后的无标注的腹部CT图像输入教师模型,教师模型输出伪标签,将伪标签以及强增强处理后的无标注的腹部CT图像输入学生模型,并更新教师模型、学生模型的权重;重复训练,直至学生模型收敛;
实时标注模块,用于将实时腹部CT图像输入训练后的学生模型,输出腹部CT图像的检测结果;
其中,淋巴结检测模型包括下采样、上采样;
下采样包括一个卷积模块与四个降采样模块,卷积模块由两个卷积核尺寸为3*3*3的卷积层组成,降采样模块由两个卷积核尺寸为3*3*3的卷积层、一个批归一化层与一个ReLu激活层;
上采样包括两个上采样模块和RPN模块,每个上采样模块后使用反卷积模块是特征图尺寸翻倍,并于上采样的相应特征图按位相加构成跳跃连接,并得到跨层次融合特征;
淋巴结检测模型的损失函数为:
学生模型通过反向传播算法更新模型权值,损失函数与权值更新算法为:
5.一种计算机设备,其特征在于:包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至3中任一项所述方法的步骤。
6.一种计算机可读存储介质,其特征在于:存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至3中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210953335.XA CN115018852B (zh) | 2022-08-10 | 2022-08-10 | 一种基于半监督学习的腹部淋巴结检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210953335.XA CN115018852B (zh) | 2022-08-10 | 2022-08-10 | 一种基于半监督学习的腹部淋巴结检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115018852A CN115018852A (zh) | 2022-09-06 |
CN115018852B true CN115018852B (zh) | 2022-12-06 |
Family
ID=83065768
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210953335.XA Active CN115018852B (zh) | 2022-08-10 | 2022-08-10 | 一种基于半监督学习的腹部淋巴结检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115018852B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116012296B (zh) * | 2022-12-01 | 2023-10-24 | 浙江大学 | 基于超分辨率和半监督学习的装配式预制构件检测方法 |
CN116051935B (zh) * | 2023-03-03 | 2024-03-22 | 北京百度网讯科技有限公司 | 图像检测方法、深度学习模型的训练方法及装置 |
CN116385809A (zh) * | 2023-06-05 | 2023-07-04 | 山东第一医科大学附属省立医院(山东省立医院) | 一种基于半监督学习的mri脑肿瘤分类方法及系统 |
CN116824251B (zh) * | 2023-06-27 | 2024-02-13 | 博衍科技(珠海)有限公司 | 一种物体检测模型的训练方法、物体检测方法及装置 |
CN117011617B (zh) * | 2023-10-07 | 2024-03-22 | 之江实验室 | 基于二阶段教师-学生框架的肺结节检测装置及构建方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110660045A (zh) * | 2019-08-30 | 2020-01-07 | 杭州电子科技大学 | 基于卷积神经网络的淋巴结识别的半监督方法 |
CN111723666A (zh) * | 2020-05-20 | 2020-09-29 | 同济大学 | 一种基于半监督学习的信号识别方法和装置 |
CN112686897A (zh) * | 2021-03-15 | 2021-04-20 | 四川大学 | 一种基于弱监督的长短轴辅助肠胃淋巴结像素标注的方法 |
CN113298159A (zh) * | 2021-05-28 | 2021-08-24 | 平安科技(深圳)有限公司 | 目标检测方法、装置、电子设备及存储介质 |
WO2021178685A1 (en) * | 2020-03-06 | 2021-09-10 | Genentech, Inc. | Class-disparate loss function to address missing annotations in training data |
CN114188020A (zh) * | 2021-12-07 | 2022-03-15 | 厦门大学附属中山医院 | 一种基于Transformer-MIL的甲状腺乳头状癌淋巴结转移预测方法 |
CN114241285A (zh) * | 2021-11-25 | 2022-03-25 | 华南理工大学 | 一种基于知识蒸馏和半监督学习的船舶快速检测方法 |
CN114331971A (zh) * | 2021-12-08 | 2022-04-12 | 之江实验室 | 一种基于半监督自训练的超声内镜目标检测方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10719936B2 (en) * | 2017-04-27 | 2020-07-21 | Retinascan Limited | System and method for automated funduscopic image analysis |
CN114170480A (zh) * | 2021-12-15 | 2022-03-11 | 南京中设航空科技发展有限公司 | 一种基于Yolo V5的多阈值半监督道路异常病害智能检测方法 |
CN114782694B (zh) * | 2022-06-21 | 2022-09-30 | 中国科学技术大学 | 无监督异常检测方法、系统、设备及存储介质 |
-
2022
- 2022-08-10 CN CN202210953335.XA patent/CN115018852B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110660045A (zh) * | 2019-08-30 | 2020-01-07 | 杭州电子科技大学 | 基于卷积神经网络的淋巴结识别的半监督方法 |
WO2021178685A1 (en) * | 2020-03-06 | 2021-09-10 | Genentech, Inc. | Class-disparate loss function to address missing annotations in training data |
CN111723666A (zh) * | 2020-05-20 | 2020-09-29 | 同济大学 | 一种基于半监督学习的信号识别方法和装置 |
CN112686897A (zh) * | 2021-03-15 | 2021-04-20 | 四川大学 | 一种基于弱监督的长短轴辅助肠胃淋巴结像素标注的方法 |
CN113298159A (zh) * | 2021-05-28 | 2021-08-24 | 平安科技(深圳)有限公司 | 目标检测方法、装置、电子设备及存储介质 |
CN114241285A (zh) * | 2021-11-25 | 2022-03-25 | 华南理工大学 | 一种基于知识蒸馏和半监督学习的船舶快速检测方法 |
CN114188020A (zh) * | 2021-12-07 | 2022-03-15 | 厦门大学附属中山医院 | 一种基于Transformer-MIL的甲状腺乳头状癌淋巴结转移预测方法 |
CN114331971A (zh) * | 2021-12-08 | 2022-04-12 | 之江实验室 | 一种基于半监督自训练的超声内镜目标检测方法 |
Non-Patent Citations (5)
Title |
---|
Humble teachers teach better students for semi-supervised object detection;Yihe Tang等;《Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition》;20211231;第3132-3141页 * |
Semi-supervised learning with a teacher-student paradigm for histopathology classification:a resource to face data heterogeneity and lack of local annotations;Niccolo Marini等;《ICPR 2021:Pattern Recognition,ICPR International Workshops and Challenges》;20210221;第105-119页 * |
基于少样本乳腺癌腋下淋巴结病理图像的分类与检测;陈姣姣;《中国优秀硕士学位论文全文数据库 (基础科学辑)》;20210215;第E072-1656页 * |
基于平均教师模型的弱标记半监督声音事件检测;王金甲等;《复旦学报(自然科学版)》;20201231;第59卷(第5期);第540-550页 * |
子宫内膜癌淋巴结转移及预测模型研究;王轶琳等;《内蒙古医学杂志》;20191231;第51卷(第21期);第1469-1471页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115018852A (zh) | 2022-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115018852B (zh) | 一种基于半监督学习的腹部淋巴结检测方法及装置 | |
Wang et al. | RMDL: Recalibrated multi-instance deep learning for whole slide gastric image classification | |
CN108022238B (zh) | 对3d图像中对象进行检测的方法、计算机存储介质和系统 | |
US8319793B2 (en) | Analyzing pixel data by imprinting objects of a computer-implemented network structure into other objects | |
CN110276741B (zh) | 结节检测及其模型训练的方法和装置以及电子设备 | |
Zhang et al. | Automatic plant disease detection based on tranvolution detection network with GAN modules using leaf images | |
CN112699869A (zh) | 基于深度学习的肋骨骨折辅助检测方法及图像识别方法 | |
CN112183541B (zh) | 一种轮廓提取方法及装置、电子设备、存储介质 | |
US20230237763A1 (en) | Image processing method and system | |
Li et al. | Segmentation of pulmonary nodules using a GMM fuzzy C-means algorithm | |
US20210056703A1 (en) | Progressively-trained scale-invariant and boundary-aware deep neural network for the automatic 3d segmentation of lung lesions | |
KR102179090B1 (ko) | 신경망을 이용한 의료 진단 방법 | |
Zafari et al. | Resolving overlapping convex objects in silhouette images by concavity analysis and Gaussian process | |
Liu et al. | Extracting lungs from CT images via deep convolutional neural network based segmentation and two-pass contour refinement | |
CN111681204A (zh) | 基于图神经网络的ct肋骨骨折病灶关系建模方法及装置 | |
Zambrano-Vizuete et al. | Segmentation of medical image using novel dilated ghost deep learning model | |
Lv et al. | Memory‐augmented neural networks based dynamic complex image segmentation in digital twins for self‐driving vehicle | |
CN112862785B (zh) | Cta影像数据识别方法、装置及存储介质 | |
CN112862786B (zh) | Cta影像数据处理方法、装置及存储介质 | |
Yu et al. | Pyramid feature adaptation for semi-supervised cardiac bi-ventricle segmentation | |
CN115546089A (zh) | 医学图像分割方法、病理图像处理方法、装置、设备 | |
CN115588012B (zh) | 一种盆骨动脉血管分割方法、系统、存储介质及终端 | |
CN112862787B (zh) | Cta影像数据处理方法、装置及存储介质 | |
Meng et al. | Multi-granularity learning of explicit geometric constraint and contrast for label-efficient medical image segmentation and differentiable clinical function assessment | |
Qin et al. | Dynamic Target Tracking Method Based on Medical Imaging |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |