CN117649657A

CN117649657A - 基于改进Mask R-CNN的骨髓细胞检测系统

Info

Publication number: CN117649657A
Application number: CN202311381822.4A
Authority: CN
Inventors: 袁华; 罗健; 董守斌
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2023-10-23
Filing date: 2023-10-23
Publication date: 2024-03-05

Abstract

本发明公开了一种基于改进Mask R‑CNN的骨髓细胞检测系统，包括：生成伪标签模块，用于生成细胞核伪标签，用于辅助模型更加关注细胞核信息；复制粘贴模块，挑选种类个数少的细胞，随机复制到另一张显微镜图像中，以解决种类不平衡问题；改进Mask R‑CNN模型，添加语义分割分支，使模型更加关注细胞核信息，输出更准确的分类结果；训练模块，让模型从骨髓细胞数据集和细胞核伪标签中学习到有用特征，训练完成后得到权重文件；推理模块，基于权重文件对骨髓细胞显微镜图像进行检测，检测结果通过后处理模块去除冗余检测结果。本发明可有效提高细胞个数少的种类的识别准确率，解决细胞种类不平衡问题，并使模型更加关注细胞核信息，提高模型的识别准确率。

Description

基于改进Mask R-CNN的骨髓细胞检测系统

技术领域

本发明涉及骨髓细胞识别的技术领域，尤其是指一种基于改进Mask R-CNN的骨髓细胞检测系统。

背景技术

骨髓细胞形态学检查在血液病诊断中具有关键作用，可用于诊断、分期、预后评估和治疗监测。该检查包括骨髓采集、制备骨髓涂片、染色、显微镜观察、细胞计数和评估、报告和诊断等六个步骤。其中显微镜观察是核心步骤，医生通过观察细胞的大小、形状、染色性质和核型等特征，确定疾病类型、进展情况和治疗策略。然而该步骤繁琐、费时、依赖医生经验。因此研究骨髓细胞自动识别系统，可减少医生繁琐劳动，辅助医生判断，具有重大意义。

随着计算硬件的快速发展和大规模数据的积累，深度学习开始展现出强大的能力和潜力。基于深度学习的骨髓细胞识别系统有两类：一类是先分割再分类的两步方法；另一类是分割和分类一同进行，即端到端的目标检测方法，而目前这两种方法都没考虑种类不平衡的问题，因此系统对于种类个数较少的细胞种类的识别准确率不理想。对于骨髓细胞的识别，检验科医生主要是基于细胞核的形态进行分类，即细胞核的形态对细胞分类的贡献占比较大。因此，如何让系统平衡细胞种类数量和更加关注细胞核仍是很大的挑战。

发明内容

本发明的目的在于克服现有技术的缺点与不足，提供一种基于改进Mask R-CNN的骨髓细胞检测系统，可有效提高细胞个数少的种类的识别准确率，解决细胞种类不平衡问题，并更加关注细胞核信息，提高模型的识别准确率。

为实现上述目的，本发明所提供的技术方案为：基于改进Mask R-CNN的骨髓细胞检测系统，该系统是基于改进Mask R-CNN模型实现多种类骨髓细胞的精准定位与分类，其包括：

生成伪标签模块，使用OTSU阈值分割算法和轮廓检测算法从骨髓细胞数据集中检测出一张显微镜图像中所有细胞核的轮廓，并除去噪声轮廓，将所有有效轮廓组成细胞核伪标签图像，对所有显微镜图像生成细胞核伪标签，最终得到作为训练数据集的伪标签数据集；

复制粘贴模块，随机选取两张显微镜图像，把一张图像中种类个数少的细胞复制到另一张图像中，复制过程对所需复制的细胞随机地进行缩放和旋转，增加数据集中细胞种类个数少的数量和多样性；

改进Mask R-CNN模型，在Mask R-CNN模型的基础上，增加语义分割分支，通过特征提取网络和特征金字塔网络提取4种不同分辨率的特征图后，将该4种特征图融合成1个特征图，将该融合后的特征图与细胞核伪标签图像作为语义分割损失的输入，使用交叉熵损失指导模型学习更多细胞核的信息；此外，该融合后的特征图通过区域建议网络和ROI池化层提取ROI特征，该ROI特征与原本的ROI特征进行融合，使原本的ROI特征获取更丰富的细胞核信息；

训练模块，将骨髓细胞数据集和细胞核伪标签数据集送入改进Mask R-CNN模型中进行训练，训练过程在线的使用复制粘贴模块来增加数据集中种类个数少的数量，使模型不倾向于预测种类个数多的细胞，训练完成后得到权重文件；

推理模块，基于得到的权重文件对骨髓细胞显微镜图像进行检测，首先对图像进行同比例缩放到固定尺寸大小，再送入到训练好的改进Mask R-CNN模型中获取检测结果，并使用非极大值抑制NMS抑制冗余的检测结果，去除得分低于阈值的边界框，最后输出最终的检测结果。

进一步，所述生成伪标签模块从骨髓细胞数据集中读取一张显微镜图像，然后执行以下过程：根据标签在图像上获取单细胞图像，使用OTSU阈值分割算法分离出细胞核与细胞质，再使用轮廓检测算法获取所有细胞核的轮廓，去除面积小的轮廓，面积大的轮廓则为细胞核轮廓，将该显微镜图像所有细胞核轮廓组成一张图像，形成细胞核伪标签图像；将所有显微镜图像按照上述过程生成一遍，获取细胞核伪标签数据集。

进一步，所述复制粘贴模块从骨髓细胞数据集中随机读取一张源图像和一张目标图像，将源图像中种类个数少的细胞复制到目标图像中，其步骤如下：

1)统计骨髓细胞数据集的每个细胞种类的个数；

2)获取源图像中的细胞个数N，并随机获取一个数r，r在0～N范围内；

3)将种类个数少的前r个细胞进行0.8到1.2的随机缩放和360度的随机旋转；

4)将进行缩放和旋转后的细胞复制到目标图像上；

5)将目标图像的最短边同时同比例缩放到s，s从640、672、704、736、768、800中随机选择，图像以0.5的概率随机水平或垂直翻转。

进一步，所述改进Mask R-CNN模型是指在Mask R-CNN模型的基础上，增加语义分割分支；改进Mask R-CNN模型包括特征提取网络、特征金字塔网络、区域建议网络，ROI池化层、语义分割分支和细胞检测头网络，其中：

所述特征提取网络是将输入的显微镜图像经过骨干网络获取不同大小的特征图；

所述特征金字塔网络对不同大小的特征图进行多尺度融合，获取下采样4倍、下采样8倍、下采样16倍、下采样32倍的4种不同分辨率的特征图；

所述区域建议网络对特征图进行细胞区域定位，得到细胞的候选区域，也称ROI位置，该区域建议网络由3个卷积层组成，第一个卷积层的卷积核大小为3×3，另外两个卷积层的卷积核大小为1×1，其中一个卷积层的输出结果为ROI位置，另一个卷积层的输出结果为该ROI位置的得分，当得分高于0.7才认为该ROI位置包含细胞；

所述ROI池化层用于获取相同大小的ROI特征，所述区域建议网络得到的ROI位置将与4种不同分辨率的特征图输入到ROI池化层，得到相同大小的ROI特征A；

所述语义分割分支包括特征图融合网络、区域建议网络、ROI池化层；所述特征图融合网络是指将所述特征金字塔网络获取的4种不同分辨率的特征图经过3×3卷积缩放到下采样8倍的特征图，并且将缩放后的4种特征图相加融合，形成一个下采样8倍的特征图F，随后使用区域建议网络和ROI池化层对特征图F提取出ROI特征B，因为语义分割分支使用交叉熵损失指导模型学习更多细胞核的信息，所以ROI特征B具有更多细胞核信息，因此将ROI特征A与ROI特征B相加融合形成ROI特征C，使ROI特征C具有更关注细胞核信息；

所述细胞检测头网络是利用ROI特征C作为输入，经过两个全连接神经网络和一个全卷积网络后输出检测结果，该细胞检测头网络包含两个全连接神经网络和一个全卷积网络，分别用于细胞分类、边界框回归和细胞分割，两个全连接神经网络均有3层，前两层的隐藏层神经节点都是1024，细胞分类的全连接神经网络的最后一层的神经节点为细胞种类个数21，表示细胞种类个数20加上背景，边界框回归的全连接神经网络的最后一层的神经节点为4，表示细胞的中心点的横坐标、纵坐标和宽高；全卷积网络是由4个3×3卷积组成，前三个卷积的通道数为256，最后一个卷积的通道数为1，全卷积网络的输出是14×14的矩阵，代表细胞分割的结果，该矩阵的所有数值都在0到1范围内，当矩阵内的某一位置的数值大于0.5则认为该位置是细胞，反之为背景。

进一步，所述训练模块使改进Mask R-CNN模型从骨髓细胞数据集和细胞核伪标签数据集中学习到有用知识，包括以下步骤：

1)设置训练次数、初始学习率和批大小，并开始训练；

2)将图像A当作目标图像，从骨髓细胞数据集中随机挑选一张图像B当作源图像，经过复制粘贴模块，把一张图像B中种类个数少的细胞复制到图像A中，同时对应被复制的细胞中的细胞核伪标签也需从图像B对应的伪标签图像B^*复制到伪标签图像A^*中；

3)图像A经过改进Mask R-CNN模型获取检测结果；

4)改进Mask R-CNN模型通过检测结果和经过复制粘贴模块的伪标签图像计算损失Loss并反向传播更新权值，训练结束后储存最终的权重文件；其中，Loss表示为：

Loss＝L_cls+L_bbox+L_mask+L_seg

上式中，L_cls代表细胞分类损失，L_bbox代表边界框回归损失，L_mask代表单个细胞像素分割损失，L_seg代表细胞核伪标签语义分割损失；在L_cls、L_bbox、L_mask中，i为训练时采样的锚框索引，p_i代表第i个锚框中是否包含细胞，若包含，则为1，反之为0，代表第i个锚框中包含细胞的概率值，v_i代表第i个标签边框框的中心点坐标及宽高的参数化向量，/>代表第i个锚框预测的中心点坐标及宽高的参数化向量，H_mask和W_mask分别代表第i个锚框中的高和宽，j和k分别为第i个锚框的纵坐标和横坐标，y_i,j,k代表第i个锚框中位于(j,k)位置是否是细胞的像素，若是则为1，反之为0，/>代表第i个锚框中位于(j,k)位置是细胞的像素的概率值，N_cls为训练时一个迭代所采用的样本数，即锚框的数量，N_bbox和N_mask都为训练时一个迭代所采用的正样本数，即锚框中包含细胞的数量；在L_seg中，q为训练时一个迭代的伪标签图像索引，n和m分别为第q张伪标签图像的纵坐标和横坐标，x_q,n,m代表第q张伪标签图像中位于(n,m)位置是否是细胞核的像素，若是则为1，反之为0；/>代表第q张图像中位于(n,m)位置是细胞核的像素的概率值，H_seg和W_seg分别代表第q张伪标签图像的高和宽，N_seg代表训练时一个迭代的图像数量。

进一步，所述推理模块基于得到的权重文件对骨髓细胞显微镜图像进行检测，包括数据导入模块和后处理模块，包括以下步骤：

1)通过数据导入模块对输入的显微镜图像进行同比缩放，以最短边同比例缩放到480至640范围内；

2)将缩放后的显微镜图像送入训练好的改进Mask R-CNN模型获取到检测结果；

3)通过后处理模块使用非极大值抑制NMS抑制冗余的检测结果，NMS的交并比IoU阈值设置为0.5，去除得分低于0.3的边界框，最后输出最终的检测结果。

本发明与现有技术相比，具有如下优点与有益效果：

1、本发明通过生成伪标签模块，在骨髓细胞数据集上生成细胞核伪标签，形成细胞核伪标签数据集，辅助模型获取更多关于细胞核的特征。

2、本发明通过复制粘贴模块，有效地增广骨髓细胞数据集，变相在数据集中添加细胞种类少的数量，增加数据集的多样性，以解决数据集中种类不平衡问题。

3、本发明通过添加语义分割分支，改进Mask R-CNN模型获取细胞核信息的能力，使模型利用细胞核伪标签数据集和语义分割领域的交叉熵损失指导模型捕捉更多细胞核信息，从而提升模型识别准确率。

附图说明

图1是本发明系统各个模块的关系示意图。

图2是本发明提出的改进Mask R-CNN模型的结构示意图。

图3是本发明提出的训练模块的结构示意图。

图4是本发明提出的推理模块的结构示意图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

本实施例公开了一种基于改进Mask R-CNN的骨髓细胞检测系统，是使用Python语言开发的可在多平台上运行的骨髓细胞检测系统，系统各模块间关系如图1所示，它包括有：

生成伪标签模块，使用OTSU阈值分割算法和轮廓检测算法从骨髓细胞数据集中检测出一张显微镜图像中所有细胞核的轮廓，并除去噪声轮廓，将所有有效轮廓组成细胞核伪标签图像，对所有显微镜图像生成细胞核伪标签，最终得到作为训练数据集的伪标签数据集；复制粘贴模块，随机选取两张显微镜图像，把一张图像中种类个数少的细胞复制到另一张图像中，复制过程对所需复制的细胞随机地进行缩放和旋转，增加数据集中细胞种类个数少的数量和多样性；

具体地，所述生成伪标签模块从骨髓细胞数据集中读取一张显微镜图像，然后执行以下过程：根据标签在图像上获取单细胞图像，使用OTSU阈值分割算法分离出细胞核与细胞质，再使用轮廓检测算法获取所有细胞核的轮廓，获取轮廓面积的大的值S，当轮廓面积小于S的0.2倍，则认为该轮廓不是细胞核并去除该轮廓，以此达到处理轮廓噪声的问题；将该显微镜图像所有细胞核轮廓组成一张图像，形成细胞核伪标签图像；将所有显微镜图像按照上述过程检测一遍，获取细胞核伪标签数据集。

具体地，所述复制粘贴模块从骨髓细胞数据集中随机读取一张源图像、一张目标图像，将源图像中种类个数较少的细胞复制到目标图像中，其步骤如下：

1)统计骨髓细胞数据集的每个细胞种类的个数；

4)将进行缩放和旋转后的细胞复制到目标图像上；

具体地，所述改进Mask R-CNN模型是指在Mask R-CNN模型的基础上，增加语义分割分支；如图2所示，改进Mask R-CNN模型包括特征提取网络、特征金字塔网络、区域建议网络，ROI池化层、语义分割分支、细胞检测头网络，其中：

所述特征提取网络是将输入的显微镜图像经过骨干网络ResNet-50获取不同大小的特征图；

所述特征金字塔网络使用FPN对不同大小的特征图进行多尺度融合，获取下采样4倍、下采样8倍、下采样16倍、下采样32倍的4种不同分辨率的特征图；

所述语义分割分支包括特征图融合网络、区域建议网络、ROI池化层；所述特征图融合网络是指将所述特征金字塔网络获取的4种不同分辨率的特征图经过3×3卷积缩放到下采样8倍的特征图，并且将缩放后的4种特征图相加融合，形成一个下采样8倍的特征图F，随后使用区域建议网络和ROI池化层对特征图F提取出ROI特征B，该特征的通道数为256，宽高都为7，因为语义分割分支使用交叉熵损失指导模型学习更多细胞核的信息，所以ROI特征B具有更多细胞核信息，因此将ROI特征A与ROI特征B相加融合形成ROI特征C，使ROI特征C具有更关注细胞核信息，ROI特征C的通道数为256，宽高都为7；

所述细胞检测头网络是利用ROI特征C作为输入，经过两个全连接神经网络和一个全卷积网络后输出检测结果，该细胞检测头网络包含两个全连接神经网络和一个全卷积网络，分别用于细胞分类、边界框回归和细胞分割，两个全连接神经网络均有3层，前两层的隐藏层神经节点都是1024，细胞分类的全连接神经网络的最后一层的神经节点为细胞种类个数21，表示细胞种类个数20加上背景，边界框回归的全连接神经网络的最后一层的神经节点为4，表示该细胞的中心点的横坐标、纵坐标和宽高；全卷积网络是由4个3×3卷积组成，前三个的卷积通道数为256，最后一个卷积的通道数为1，全卷积网络的输出是14×14的矩阵，代表细胞分割的结果，该矩阵的所有数值都在0到1范围内，当矩阵内的某一位置的数值大于0.5则认为该位置是细胞，反之为背景。

具体地，所述训练模块使改进Mask R-CNN模型从骨髓细胞数据集和细胞核伪标签数据集中学习到有用知识，如图3所示，包括以下步骤：

1)设置训练次数为24、初始学习率为0.0025和批大小为2，并开始训练；

3)图像A经过改进Mask R-CNN模型获取检测结果；

Loss＝L_cls+L_bbox+L_mask+L_seg

上述式子中，L_cls代表细胞分类损失，L_bbox代表边界框回归损失，L_mask代表单个细胞像素分割损失，L_seg代表细胞核伪标签语义分割损失；在L_cls、L_bbox、L_mask中，i为训练时采样的锚框索引，p_i代表第i个锚框中是否包含细胞，若包含，则为1，反之为0，代表第i个锚框中包含细胞的概率值，v_i代表第i个标签边框框的中心点坐标及宽高的参数化向量，/>代表第i个锚框预测的中心点坐标及宽高的参数化向量，H_mask和W_mask分别代表第i个锚框中的高和宽，j和k分别为第i个锚框的纵坐标和横坐标，y_i,j,k代表第i个锚框中位于(j,k)位置是否是细胞的像素，若是则为1，反之为0，/>代表第i个锚框中位于(j,k)位置是细胞的像素的概率值，N_cls为训练时一个迭代所采用的样本数，即锚框的数量，N_bbox和N_mask都为训练时一个迭代所采用的正样本数，即锚框中包含细胞的数量；在L_seg中，q为训练时一个迭代的伪标签图像索引，n和m分别为第q张伪标签图像的纵坐标和横坐标，x_q,n,m代表第q张伪标签图像中位于(n,m)位置是否是细胞核的像素，若是则为1，反之为0；/>代表第q张图像中位于(n,m)位置是细胞核的像素的概率值，H_seg和W_seg分别代表第q张伪标签图像的高和宽，N_seg代表训练时一个迭代的图像数量。

具体地，所述推理模块基于得到的权重文件对骨髓细胞显微镜图像进行检测，包括数据导入模块和后处理模块，如图4所示，具体包括以下步骤：

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.基于改进Mask R-CNN的骨髓细胞检测系统，其特征在于，该系统是基于改进Mask R-CNN模型实现多种类骨髓细胞的精准定位与分类，其包括：

2.根据权利要求1所述的基于改进Mask R-CNN的骨髓细胞检测系统，其特征在于：所述生成伪标签模块从骨髓细胞数据集中读取一张显微镜图像，然后执行以下过程：根据标签在图像上获取单细胞图像，使用OTSU阈值分割算法分离出细胞核与细胞质，再使用轮廓检测算法获取所有细胞核的轮廓，去除面积小的轮廓，面积大的轮廓则为细胞核轮廓，将该显微镜图像所有细胞核轮廓组成一张图像，形成细胞核伪标签图像；将所有显微镜图像按照上述过程生成一遍，获取细胞核伪标签数据集。

3.根据权利要求2所述的基于改进Mask R-CNN的骨髓细胞检测系统，其特征在于：所述复制粘贴模块从骨髓细胞数据集中随机读取一张源图像和一张目标图像，将源图像中种类个数少的细胞复制到目标图像中，其步骤如下：

1)统计骨髓细胞数据集的每个细胞种类的个数；

4)将进行缩放和旋转后的细胞复制到目标图像上；

4.根据权利要求3所述的基于改进Mask R-CNN的骨髓细胞检测系统，其特征在于：所述改进Mask R-CNN模型是指在Mask R-CNN模型的基础上，增加语义分割分支；改进Mask R-CNN模型包括特征提取网络、特征金字塔网络、区域建议网络，ROI池化层、语义分割分支和细胞检测头网络，其中：

所述区域建议网络对特征图进行细胞区域定位，得到细胞的候选区域，也称ROI位置，该区域建议网络由3个卷积层组成，第一个卷积层的卷积核大小为3×3，另外两个卷积层的卷积核大小为1×1，其中一个卷积层的输出结果为ROI的位置，另一个卷积层的输出结果为该ROI位置的得分，当得分高于0.7才认为该ROI位置包含细胞；

5.根据权利要求4所述的基于改进Mask R-CNN的骨髓细胞检测系统，其特征在于：所述训练模块使改进Mask R-CNN模型从骨髓细胞数据集和细胞核伪标签数据集中学习到有用知识，包括以下步骤：

1)设置训练次数、初始学习率和批大小，并开始训练；

3)图像A经过改进Mask R-CNN模型获取检测结果；

Loss＝L_cls+L_bbox+L_mask+L_seg

6.根据权利要求5所述的基于改进Mask R-CNN的骨髓细胞检测系统，其特征在于：所述推理模块基于得到的权重文件对骨髓细胞显微镜图像进行检测，包括数据导入模块和后处理模块，包括以下步骤：