CN115049613A

CN115049613A - 一种基于Mask R-CNN的疟疾血涂片细胞检测和分割方法

Info

Publication number: CN115049613A
Application number: CN202210668281.2A
Authority: CN
Inventors: 陈祥; 岳昆; 吴鑫然; 董莹; 李劲
Original assignee: Yunnan University YNU
Current assignee: Yunnan University YNU
Priority date: 2022-06-14
Filing date: 2022-06-14
Publication date: 2022-09-13

Abstract

本发明公开了一种基于Mask R‑CNN的疟疾血涂片细胞检测和分割方法，实现薄血涂片图像中疟原虫及红细胞的检测和分割，包括：采用VoVNet‑57作为主干特征提取网络，以提取更加丰富的薄血涂片图像特征；改进特征金字塔网络结构，充分利用高层特征丰富的细胞分类信息来强化底层特征的表述能力；使用衰减函数对传统非极大值抑制算法进行改进，减少因细胞堆叠导致漏检的情况；重构细胞分类损失函数，改善因细胞类别不均衡导致检测精度不高的问题。本发明提出的方法能有效提升Mask R‑CNN网络模型对薄血涂片图像中细胞检测和分割的精度，为疟疾诊断提供科学依据。

Description

一种基于Mask R-CNN的疟疾血涂片细胞检测和分割方法

技术领域

本发明公开了一种基于Mask R-CNN的疟疾血涂片细胞检测和分割方法，涉及使用深度神经网络对显微镜下薄血涂片图像进行细胞检测和分割，并计算疟原虫寄生密度，属于目标检测领域。

技术背景

疟疾是一种由疟原虫寄生于人体引起的传染性和致命性疾病，其治疗方法根据感染疟原虫的种类和感染程度而有所差异，因此正确区分感染疟原虫的种类、计算疟原虫寄生密度，是对疟疾进行有效治疗的前提。通过光学显微镜对血涂片进行人工筛查，是当前疟疾诊断常用的方法。但人工检测所需步骤繁琐，需要检测人员拥有丰富的专业领域知识和工作经验，才能准确识别疟原虫并对其进行分类。由于专家知识的差异，人工检测方法可能得到片面或不够客观的检测结果。专业检测人员资源匮乏、检测任务量较大时，人工检测的方法并不可行，导致错过治疗和防疫的最佳时期。

为了辅助检测人员快速且准确地做出判断，一些公知的方法将图像处理和机器学习技术用于疟疾诊断。例如，朱远林（<学位论文>，2019）将视觉几何群（Visual GeometryGroup, VGG）网络和支持向量机（Support Vector Machine, SVM）相结合，提出基于VGG-SVM的疟原虫检测模型，可准确区分感染和未感染疟原虫图像。刘银萍等（<实验技术与管理>，2020）针对疟疾检测模型存在训练时间长、权重参数冗余等问题，缩减ResNet-50网络的宽度和深度，并将其全连接层替换为分类器，在缩短模型训练时间和减小模型参数的同时，提高了疟疾分类精度。这些方法可判断是否受到疟原虫感染，但不能有效确定疟原虫的种类、位置和个数。

使用机器学习方法实现薄血涂片图像中细胞检测和分割较为困难，而基于深度学习的通用目标检测算法由于疟原虫在图像中占比小，存在难以提取充足有效的特征、细胞排列紧密以及细胞类别不平衡等问题，易出现漏检和误检的情况，导致细胞检测和分割的效果还不够理想。

针对上述问题，一些公知的方法对通用目标检测算法进行了改进，以减少漏检和误检的情况。例如，刘乾宇（<计算机技术与发展>，2021）提出了一种基于Faster R-CNN的疟疾血涂片检测改进算法，在Faster R-CNN基础上加入卷积滤波器，采用ResNet作为主干特征提取网络，通过优化锚点属性提高疟原虫的检测能力，但未实现细胞的分割。徐明星等（<专利202110357678.5>，2021）通过YOLO V4检测出每个细胞的位置，对细胞进行放大处理后输入U-Net网络分类，通过分割、放大每个细胞，增强模型对疟原虫的检测能力，但不能有效统计红细胞个数来计算疟原虫寄生密度。沈玉红（<学位论文>，2020）提出基于FD-Mask R-CNN的细胞分割及分类方法，在Mask R-CNN的基础上引入空洞卷积扩大卷积感受野，在高层特征中较好地保留图像结构信息，提高了分割精度；在分类损失函数中加入调节因子，关注难以分类的样本，改善因细胞类别不均衡导致分类精度不高的问题，实现疟原虫分类和分割一体化，但未考虑细胞堆叠导致漏检的情况。

为克服上述公知方法的不足，本发明提出一种基于Mask R-CNN的疟疾血涂片细胞检测和分割方法，采用更适合小目标检测任务的VoVNet-57作为主干特征提取网络，以提取更加丰富的薄血涂片图像特征；改进特征金字塔网络（Feature Pyramid Network, FPN）结构，充分利用高层特征丰富的细胞分类信息来强化底层特征的表述能力；使用衰减函数对传统非极大值抑制算法进行改进，减少细胞漏检的情况；在细胞分类损失函数中加入损失权重和调节因子，改善因细胞类别不均衡导致检测精度不高的问题。

发明内容

一、本发明的目的

通用目标检测算法由于薄血涂片图像中疟原虫所占图像比例小，存在细胞排列紧密和细胞类别不均衡等问题而导致细胞漏检和误检的情况，为了对其进行改善，本发明提出一种基于Mask R-CNN的疟疾血涂片细胞检测和分割方法，实现薄血涂片图像中疟原虫及红细胞的检测和分割，并计算疟原虫寄生密度，为疟疾诊断提供科学依据。

二、本发明的步骤

本发明的执行过程分为以下四个步骤：

(1)数据预处理：在每张光学显微镜采集的薄血涂片图像上，标注不同种类、不同时期疟原虫和红细胞，对标注后的数据集进行数据增强并统一图像尺寸大小，得到薄血涂片图像训练集。

(2)特征提取和处理：构建基于改进的Mask R-CNN网络模型，对输入的薄血涂片图像进行特征提取和处理。

(3)模型训练：将步骤(1)中的薄血涂片图像训练集输入步骤(2)中的模型，计算损失函数并进行反向传播，迭代更新网络模型的权重。

(4)疟疾检测：将待检测的薄血涂片图像输入到步骤(3)中训练好的模型进行细胞检测和分割，并计算疟原虫寄生密度。

具体步骤如下：

1：数据预处理

1.1：图像标注

在采集的薄血涂片图像中标注红细胞和不同种类、不同时期的疟原虫。设采集的薄血涂片图像数据集为

，

，

为图像数据集

中未经标注的第

个原始图像。对

中红细胞和疟原虫以点的方式勾勒轮廓，形成闭合区域，并标注其所属细胞类别，将标注的轮廓、类别和图像信息存入json文件中，得到对应的标注数据

；对

中所有图像进行标注后得到标注数据集

，

；将图像数据集

和标注数据集

进行合并，得到标注的薄血涂片图像数据集

，

。

1.2：数据增强

训练过少的薄血涂片图像会导致模型出现欠拟合的情况，且采集的各种类疟原虫分布差异过大，也会导致检测和分割细胞的精度降低。为了提高模型的泛化能力，根据

中薄血涂片图像标注的疟原虫轮廓信息对疟原虫进行分割，将分割得到的疟原虫随机旋转任意角度后复制粘贴到对应图像的其它位置，扩充疟原虫样本个数的同时增加了疟原虫所处位置的多样性；对扩充疟原虫样本后的图像通过旋转和翻转的方式进行数据增强，得到扩充后的薄血涂片图像训练集

。

1.3：图像尺寸缩放

对

中的薄血涂片图像进行等比例缩放，使图像最长边为1024，并对等比例缩放后的图像用数值为0的像素填充，得到图像尺寸为1024×1024的薄血涂片图像训练集

。

2：特征提取和处理

2.1：薄血涂片图像特征提取

使用VoVNet-57提取薄血涂片图像特征，结合FPN对提取的特征进行不同尺度的融合，并在FPN的基础上增添一条右侧的连接路径，对融合后的特征图以像素叠加的方式进行再次融合，充分利用高层特征的细胞分类信息。具体步骤如下：

2.1.1：特征提取网络的搭建

针对疟原虫在薄血涂片图像中占比小所反映出的信息有限、难以提取充足有效特征的问题，采用更适合小目标检测任务的VoVNet-57替换原有的ResNet-101作为主干特征提取网络，加强模型提取特征的能力，进而提高检测和分割细胞的精度。VoVNet-57的网络结构如表1所示。

表1. VoVNet-57网络结构

VoVNet-57由Stem模块和4个阶段的OSA模块组成。其中，Stem模块由3个3×3卷积层构成，OSA模块由3×3、1×1卷积层和张量拼接层构成。每个OSA模块阶段之间采用一个步长为2的3×3最大池化层进行下采样。将VoVNet-57中第二阶段到第五阶段中各阶段最后一层输出的薄血涂片图像特征图记为

。

2.1.2：FPN特征融合

将步骤2.1.1得到的薄血涂片图像特征图

输入FPN，进行不同尺度的特征融合。FPN通过一条自顶向下的路径，将高层特征图的细胞分类信息与底层特征图的细胞定位信息相融合，可有效提高模型对细胞的检测精度。每一个自顶向下的融合过程，由一个最近邻上采样操作和一个横向连接的1×1卷积层构成，最近邻上采样操作将高层薄血涂片图像特征图分辨率放大到相邻底层薄血涂片图像特征图的尺寸，横向连接的1×1卷积层用来统一

的通道数。将最近邻上采样得到的特征图与1×1卷积层输出的特征图进行像素叠加融合，再通过3×3卷积去除最近邻上采样带来的特征混叠效应，得到融合后的薄血涂片图像特征图

。

2.1.3：新增路径特征融合

由于薄血涂片图像高层特征图

和

分辨率低，不适合细胞的检测，而只使用低层薄血涂片图像特征图

和

进行检测，则会浪费高层特征丰富的细胞分类信息。因此，改进原有的FPN结构，在FPN的基础上增添一条右侧的连接路径，将FPN融合后的薄血涂片图像特征图以像素叠加的方式再进行融合，充分利用高层特征丰富的细胞分类信息来强化底层特征的表述能力。具体步骤如下：将

通过四倍上采样后与

进行像素叠加融合，再通过3×3卷积去除上采样带来的特征混叠效应，得到薄血涂片图像特征图

；将

通过四倍上采样后与

。

2.2：细胞候选框的生成和筛选

2.2.1：细胞候选框的生成

区域候选网络（Region Proposal Network, RPN）使用3×3卷积作用于薄血涂片图像特征图

上，得到更容易区分细胞和背景的特征图，并将

上每一个像素点映射回原图，根据

设定的对应细胞候选框尺寸

和长宽比

分别生成3种不同大小的细胞候选框。将

经过3×3卷积得到的特征图输入RPN分类层和回归层：分类层通过1×1卷积生成3维特征向量来表示薄血涂片图像特征图上每个像素点对应3种不同大小细胞候选框包含细胞的置信度，记为

；回归层通过1×1卷积生成12维特征向量来表示薄血涂片图像特征图上每个像素点对应3种不同大小细胞候选框的偏移量和缩放量

，

和

表示细胞候选框的中心偏移量，

和

表示细胞候选框长和宽的缩放量。

将生成的细胞候选框根据RPN分类层输出的置信度从高到低排序，保留排名前

的细胞候选框（训练阶段

为12000，检测阶段

为6000），得到细胞候选框集合

，

。根据回归分支输出的偏移量和缩放量

，采用公式(2-1)对

中细胞候选框的位置和大小进行修正：

(2-1)

其中，

和

表示细胞候选框的中心坐标，

和

表示细胞候选框的长和宽，

和

表示修正后细胞候选框的中心坐标，

和

表示修正后细胞候选框的长和宽。

将修正后的细胞候选框参数通过公式(2-2)转化为左上角坐标和右下角坐标的表示形式：

(2-2)

其中，

和

表示细胞候选框的左上角坐标，

和

表示细胞候选框的右下角坐标。

2.2.2：细胞候选框的筛选

薄血涂片图像中存在较多堆叠的细胞，当两个细胞生成的候选框重叠部分超过给定阈值时，传统的非极大值抑制算法会将置信度较小的细胞候选框剔除，导致出现漏检的情况。使用衰减函数对传统非极大值抑制算法进行改进，可减少细胞漏检的情况，具体步骤如下：

(1) 取

中置信度最高的细胞候选框，构成对比框

，并将

移入细胞候选框结果集合

；遍历

中剩余的细胞候选框，计算当前细胞候选框

与对比框

的交并比（Intersection over Union, IoU），IoU计算公式如下：

(2-3)

其中，

为第

个细胞候选框与对比框

面积的交集，

为第

个细胞候选框与对比框

面积的并集。

(2)若细胞候选框

与对比框

的IoU值大于给定的阈值

，则不直接剔除候细胞选框

，而是根据公式(2-4)降低

的置信度为

，使原本检测出的细胞不被漏检。

(2-4)

其中，

为细胞候选框

的前景置信度得分，

为可调节置信度衰减程度的衰减系数，根据经验

取值为0.5，

为重置后的细胞候选框

的前景置信度得分。

重复执行以上步骤(1)和(2)，直到细胞候选框集合

为空，最终

留下的前

个候选框（训练阶段

为2000，检测阶段

为1000），即为去除冗余后的细胞候选框。

2.3：细胞候选框特征图的生成

将步骤2.1.3融合后的薄血涂片图像特征图

和步骤2.2.2去除冗余后的细胞候选框，输入到感兴趣区域对齐（Region of Interest Align, RoI Align）层，根据后续输出分支网络中输入大小的限制，将不同大小的细胞候选框对应的特征区域池化为7×7和14×14的固定尺寸。具体步骤如下：将细胞候选框对应的特征区域划分为7×7和14×14个单元；每个单元平均分为4个小单元，每个小单元的中心设为采样点，根据双线性插值法求出采样点的特征值；对每个单元内的采样点进行最大值池化操作，生成7×7和14×14尺寸的细胞候选框特征图。

2.4：细胞候选框的结果预测

将步骤2.3输出的固定尺寸的细胞候选框特征图输入到输出分支网络进行细胞检测和分割。输出分支网络包含分类回归网络和掩码生成网络：分类回归网络将步骤2.3得到的7×7尺寸的细胞候选框特征图展平为一维向量，再通过两个1024维的全连接层进行细胞检测；掩码生成网络将步骤2.3得到的14×14尺寸的细胞候选框特征图经过4个卷积核大小为3×3、通道数为256的卷积层，再经过2×2的反卷积操作将细胞候选框特征图尺寸扩充为28×28，最后经过1个卷积核大小为1×1、通道数为

的卷积层，得到

个28×28的细胞分割掩码，

为细胞类别数。

3：模型训练

3.1：损失函数的构建和计算

针对红细胞数量远多于疟原虫数量、存在细胞类别不均衡的问题，考虑红细胞相对于疟原虫为易分类样本，大量易分类红细胞主导梯度更新的方向，导致模型对疟原虫的检测精度较低。因此，重新构建损失函数，在细胞分类损失函数中加入损失权重和调节因子，降低红细胞对网络参数的贡献，改善细胞类别不均衡导致检测精度不高的情况。重构后的损失函数包括RPN网络中的分类损失

和检测框偏移损失

、输出分支网络的细胞分类损失

、细胞检测框偏移损失

和细胞掩码分割损失

五个部分：

(1)RPN网络分类损失

，计算公式如下：

(3-1)

其中，

为训练RPN网络时一个mini-batch中采样细胞候选框的数量；

为细胞候选框的索引；

为第

个细胞候选框的真实标签，当第

个细胞候选框含有细胞时，则

；当第

个细胞候选框不含有细胞时，则

；

为第

个细胞候选框中含有细胞的置信度。

(2)RPN网络检测框偏移损失

，计算公式如下：

(3-2)

其中，

为第

个细胞候选框与细胞检测框之间的中心偏移量和长宽缩放量，

为第

个细胞候选框与细胞真实框之间的中心偏移量和长宽缩放量，

为

函数，定义如下：

(3-3)

(3)细胞分类损失

，计算公式如下：

(3-4)

其中，

为训练输出分支网络时一个mini-batch中采样细胞候选框的数量；

为细胞类别数；

为第

类细胞的候选框数量；

表示第

个细胞候选框为第

类细胞的置信度，

表示第

个细胞候选框的真实标签，

时属于第

类细胞，

时不属于第

类细胞；

为损失权重，当某类细胞数量较少时，损失权重会相对较大，使模型更加关注数量少的细胞类别；

为调节因子，易分类的红细胞置信度

接近于1，

会接近于0，可降低红细胞对损失函数的影响，根据经验

取值为2。

(4)细胞检测框偏移损失

，计算公式如下：

(3-5)

其中，

为第

个细胞候选框的真实标签，

表示第

表示第

为

函数。

(5)细胞分割损失

，计算公式如下：

(3-6)

其中，

为细胞掩码分辨率的大小；

为细胞掩码中第

个像素的真实标签，

时属于第

类细胞，

时不属于第

类细胞；

为细胞掩码中第

个像素为第

类细胞的置信度。

(6)总体损失

是以上RPN网络中的分类损失

和检测框偏移损失

、输出网络的细胞分类损失

、细胞检测框偏移损失

以及细胞掩码分割损失

五个部分之和，计算公式如下：

(3-7)

3.2：网络权重的迭代更新

将步骤1中的薄血涂片图像训练集

输入步骤2中构建的Mask R-CNN网络模型进行训练。在训练网络模型时，首先加载预训练权重文件，作为网络模型初始化参数，并对FPN基础上增添的右侧连接路径进行随机初始化参数，接着对步骤3.1中总体损失函数的各参数计算梯度值，采用随机梯度下降算法（Stochastic Gradient Descent, SGD）迭代更新网络模型的权重参数：

(3-8)

其中，

为当前待更新的权重参数，

为学习率，

为总体损失函数关于

的梯度，

为

更新后的参数。

4：疟疾检测

4.1：细胞的检测和分割

将待检测的薄血涂片图像输入到训练好的模型，得到细胞的预测信息：检测框对应的细胞类别置信度、位置坐标和细胞掩码，设定分类阈值

，剔除细胞类别置信度达不到分类阈值的检测框，对同一类别的细胞检测框使用置信度衰减的方式进行非极大值抑制，得到最优细胞检测框。在检测的薄血涂片图像中，以矩形框的方式标注最优检测框的位置，在矩形框上方标注细胞类别和置信度，并对细胞进行像素级分割。

4.2：疟原虫寄生密度的计算

在计算疟原虫寄生密度时，需检测超过1000个红细胞，且要求使用光学显微镜采集的薄血涂片图像无视野重叠。按照步骤4.1，对采集的多张无重叠视野的薄血涂片图像进行细胞检测和分割，并统计疟原虫和红细胞的个数，根据公式(4-1)计算疟原虫的寄生密度

：

(4-1)

其中，

为检测疟原虫个数；

为检测红细胞个数；

为每微升血液中的平均红细胞数，以每微升血液中男性500万个红细胞、女性450万个红细胞进行计算。

三、本发明的目的

下面结合附图对本发明的具体实施方式进行描述，以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是，在以下的描述中，当已知功能和设计的详细描述也许会淡化本发明的主要内容时，这些描述在这里将被忽略。

实施例：间日疟原虫及红细胞的检测和分割。

1：数据预处理

按照步骤1.1，将云南省寄生虫病防治所提供的薄血涂片图像数据集

作为初始数据集，在每张图像中标注不同时期疟原虫和红细胞，得到标注的薄血涂片图像数据集

。其中数据集

共253张薄血涂片图像，由7类细胞组成，分别为间日疟原虫大滋养体、间日疟原虫环状体、间日疟原虫未成熟配子体、间日疟原虫成熟配子体、间日疟原虫未成熟裂殖体、间日疟原虫成熟裂殖体和正常红细胞。

按照步骤1.2，根据

中标注的疟原虫轮廓信息对疟原虫进行分割，将分割得到的疟原虫随机旋转任意角度后复制粘贴到对应图像的其它位置，扩充疟原虫数量，并对扩充疟原虫数量后的样本通过旋转、垂直翻转和水平翻转的方式进行数据增强，将

扩充为800张图像，得到薄血涂片图像训练集

。

按照步骤1.3，将

通过缩放和补0的方式，统一薄血涂片图像尺寸为1024×1024，得到薄血涂片图像训练集

。

2：特征提取和处理

按照步骤2.1，采用VoVNet-57与改进的FPN的网络提取薄血涂片图像特征，其结构如附图2所示，分为自底向上的路径和自顶向下的路径。

自底向上的路径通过VoVNet-57作为基础网络，将特征提取过程分为5个阶段，每个阶段输出的特征图尺寸相比于输入的薄血涂片图像

，缩小的倍数分别是

。各阶段输入、输出特征图尺寸如表2所示。

表2. VoVNet提取特征过程

自顶向下的路径通过改进的FPN网络，对输入的

进行特征融合。融合过程如表3所示。

表3. 特征融合过程

按照步骤2.2.1，RPN网络对每一层特征图

上的像素点生成3种不同大小的细胞候选框，

和

一共生成128×128×3+256×256×3=245760个细胞候选框，每个细胞候选框对应一个置信度，保留置信度最大的

（训练阶段

为12000，检测阶段

为6000）个细胞候选框，并根据公式(2-1)和(2-2)对细胞候选框进行修正。表4为某次检测阶段中经排序和修正后的部分细胞候选框编号、坐标和置信度。

表4. 经过排序和修正后的部分细胞候选框

按照步骤2.2.2，基于排序和修正后的细胞候选框，设定IoU阈值

=0.5，根据公式(2-4)以衰减细胞候选框置信度的方式进行非极大值抑制，筛选出包含细胞最好的候选框。例如，以编号为69631的细胞候选框作为对比框，其衰减细胞候选框置信度的过程如表5所示。

表5. 衰减细胞候选框置信度的过程

按照步骤2.3，将筛选后的细胞候选框输入RoI Align层，利用双线性插值法和最大值池化操作得到7×7和14×14尺寸的细胞候选框特征图。

按照步骤2.4，搭建分类回归网络和掩码生成网络。分类回归网络通过全连接层进行细胞检测，判断细胞候选框所包含的目标是红细胞、疟原虫或是背景；掩码生成网络通过全卷积神经网络对细胞进行分割，得到细胞候选框包含的细胞轮廓信息。将7×7尺寸的细胞候选框特征图输入分类回归网络进行细胞分类和目标框的定位。分类回归网络的结构如表6所示。

表6. 分类回归网络的结构

其中，分类层输出8维向量，表示7种不同细胞和背景的分类置信度，回归层输出28维向量，表示细胞候选框对应每个细胞种类的4个坐标向量。

将14×14的细胞候选框特征图输入掩码生成网络进行分割，得到细胞轮廓。掩码生成网络的结构如表7所示。

表7. 掩码生成网络的结构

3：模型训练

按照步骤3.1，将薄血涂片图像训练集

输入Mask R-CNN网络模型进行训练。将得到的预测信息与标记的真实数据对比，根据公式(3-1)和(3-2)计算RPN网络的分类损失和检测框偏移损失，根据公式(3-4)、(3-5)和(3-6)计算输出网络的分类损失、检测框偏移损失以及掩码分割损失，根据公式(3-7)计算总体损失函数

。

按照步骤3.2，设定学习率为

=0.005，根据公式（3-8），采用随机梯度下降法，迭代更新网络模型的权重，直到损失函数值收敛。

4：疟疾检测

按照步骤4.1，设定分类阈值

，对输入的薄血涂片图像进行细胞检测和分割。图3为某张薄血涂片图像细胞检测和分割的结果：每个矩形框对应一个细胞，将分割后的细胞以不同颜色显示在框内，并可根据矩形框上方的标签判断细胞所属的类别，其中

表示红细胞，

表示间日疟原虫未成熟配子体。

按照步骤4.2，统计采集的多张薄血涂片图像中红细胞和疟原虫的个数，并根据公式(4-1)计算疟原虫寄生密度。表8为某男性患者的红细胞和疟原虫的个数统计结果。

表8. 红细胞和疟原虫的个数统计

检测到红细胞的个数

为1409，疟原虫的个数

为5，男性每微升血液中含有500万个红细胞，

为

，则每微升血液中含有17743个疟原虫：

四、与现有技术相比本发明具有的优点及积极效果

(1)本发明提出一种基于Mask R-CNN模型的疟疾检测方法，采用更适合小目标检测任务的VoVNet-57作为Mask R-CNN的特征提取网络，加强模型提取特征的能力。

(2)本发明提出一种改进的FPN结构，在FPN的基础上增添一条右侧的连接路径，将FPN融合后的特征图再进行融合，丰富了底层特征层包含的细胞分类信息，进而提高模型检测细胞的精度。

(3)本发明使用衰减函数改进传统的非极大值抑制算法，对原本要舍弃的细胞候选框，根据交并比使用衰减函数进行置信度衰减而非直接剔除，能有效减少重叠细胞漏检的情况。

(4)本发明重新构建Mask R-CNN网络的分类损失函数，通过在细胞分类损失函数中加入损失权重和调节因子，使模型更加关注数量较少的疟原虫，并降低了红细胞对损失函数的影响，改善了因细胞类别不平衡导致检测精度不高的问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1：本发明的具体步骤流程图

图2：本发明中改进的特征金字塔网络结构

图3：本发明中薄血涂片图像的细胞检测和分割结果。

Claims

1.一种基于Mask R-CNN的疟疾血涂片细胞检测和分割方法，其特征在于，包括以下步骤：

S1：数据预处理，在每张光学显微镜采集的薄血涂片图像上，标注不同种类、不同时期疟原虫和红细胞，对标注后的数据集进行数据增强并统一图像尺寸大小，得到薄血涂片图像训练集；

S2：特征提取和处理，构建基于改进的Mask R-CNN网络模型，对输入的薄血涂片图像进行特征提取和处理；

S3：模型训练，将步骤S1中的薄血涂片图像训练集输入步骤S2中的模型，计算损失函数并进行反向传播，迭代更新网络模型的权重；

S4：疟疾检测，将待检测的薄血涂片图像输入到步骤S3中训练好的模型，进行细胞检测和分割，并计算疟原虫寄生密度。

2.根据权利要求1所述的一种基于Mask R-CNN的疟疾血涂片细胞检测和分割方法，其特征在于，所述步骤S1进一步包括以下具体步骤：

S1.1：图像标注

在采集的薄血涂片图像中标注红细胞和不同种类、不同时期的疟原虫，设采集的薄血涂片图像数据集为

，

，

为图像数据集

中未经标注的第

个原始图像，对

，对

中所有图像进行标注后得到标注数据集

，

，将图像数据集

和标注数据集

进行合并，得到标注的薄血涂片图像数据集

，

；

S1.2：数据增强

根据

中薄血涂片图像标注的疟原虫轮廓信息对疟原虫进行分割，将分割得到的疟原虫随机旋转任意角度后复制粘贴到对应图像的其它位置，扩充疟原虫样本个数的同时增加了疟原虫所处位置的多样性，对扩充疟原虫样本后的图像通过旋转和翻转的方式进行数据增强，得到扩充后的薄血涂片图像训练集

；

S1.3：图像尺寸缩放

对

。

3.根据权利要求1所述的一种基于Mask R-CNN的疟疾血涂片细胞检测和分割方法，其特征在于，所述步骤S2进一步包括以下具体步骤：

S2.1：薄血涂片图像特征提取

采用VoVNet-57提取薄血涂片图像特征，结合特征金字塔网络（Feature PyramidNetwork, FPN）对提取的特征进行不同尺度的融合，并在FPN的基础上增添一条右侧的连接路径，对融合后的特征图以像素叠加的方式进行再次融合，充分利用高层特征的细胞分类信息，具体步骤如下：

S2.1.1：特征提取网络的搭建

采用VoVNet-57作为特征提取网络，提取薄血涂片图像特征，VoVNet-57由Stem模块和4个阶段的OSA模块组成，其中，Stem模块由3个3×3卷积层构成，OSA模块由3×3、1×1卷积层和张量拼接层构成，每个OSA模块阶段之间采用一个步长为2的3×3最大池化层进行下采样，将VoVNet-57中第二阶段到第五阶段中各阶段最后一层输出的薄血涂片图像特征图记为

；

S2.1.2：FPN特征融合

将步骤S2.1.1得到的薄血涂片图像特征图

输入FPN，进行不同尺度的特征融合，FPN通过一条自顶向下的路径，将高层特征图的细胞分类信息与底层特征图的细胞定位信息相融合，可有效提高模型对细胞的检测精度，每一个自顶向下的融合过程，由一个最近邻上采样操作和一个横向连接的1×1卷积层构成，最近邻上采样操作将高层薄血涂片图像特征图分辨率放大到相邻底层薄血涂片图像特征图的尺寸，横向连接的1×1卷积层用来统一

的通道数，将最近邻上采样得到的特征图与1×1卷积层输出的特征图进行像素叠加融合，再通过3×3卷积去除最近邻上采样带来的特征混叠效应，得到融合后的薄血涂片图像特征图

；

S2.1.3：新增路径特征融合

在FPN的基础上增添一条右侧的连接路径，将FPN融合后的薄血涂片图像特征图以像素叠加的方式再进行融合，充分利用高层特征丰富的细胞分类信息来强化底层特征的表述能力，具体步骤如下：将

通过四倍上采样后与

，将

通过四倍上采样后与

；

S2.2：细胞候选框的生成和筛选

S2.2.1：细胞候选框的生成

上，得到更容易区分细胞和背景的特征图，并将

上每一个像素点映射回原图，根据

设定的对应细胞候选框尺寸{32 × 32,64 × 64}和长宽比

分别生成3种不同大小的细胞候选框，将

，回归层通过1×1卷积生成12维特征向量来表示薄血涂片图像特征图上每个像素点对应3种不同大小细胞候选框的偏移量和缩放量

，

和

表示细胞候选框的中心偏移量，

和

表示细胞候选框长和宽的缩放量；

的细胞候选框（训练阶段

为12000，检测阶段

为6000），得到细胞候选框集合

，

，根据回归分支输出的偏移量和缩放量

，采用公式(2-1)对

中细胞候选框的位置和大小进行修正：

(2-1)

其中，

和

表示细胞候选框的中心坐标，

和

表示细胞候选框的长和宽，

和

表示修正后细胞候选框的中心坐标，

和

表示修正后细胞候选框的长和宽；

(2-2)

其中，

和

表示细胞候选框的左上角坐标，

和

表示细胞候选框的右下角坐标；

S2.2.2：细胞候选框的筛选

为减少细胞漏检的情况，使用衰减函数改进的非极大值抑制算法进行细胞候选框的筛选，具体步骤如下：

取

中置信度最高的细胞候选框，构成对比框

，并将

移入细胞候选框结果集合

；遍历

中剩余的细胞候选框，计算当前细胞候选框

与对比框

的交并比（Intersection over Union, IoU），IoU计算公式如下：

(2-3)

其中，

为第

个细胞候选框与对比框

面积的交集，

为第

个细胞候选框与对比框

面积的并集；

若细胞候选框

与对比框

的IoU值大于给定的阈值

，则不直接剔除候细胞选框

，而是根据公式(2-4)降低

的置信度为

，使原本检测出的细胞不被漏检：

(2-4)

其中，

为细胞候选框

的前景置信度得分，

为可调节置信度衰减程度的衰减系数，根据经验

取值为0.5，

为重置后的细胞候选框

的前景置信度得分；

重复执行以上步骤(1)和(2)，直到细胞候选框集合

为空，最终

留下的前

个候选框（训练阶段

为2000，检测阶段

为1000），即为去除冗余后的细胞候选框；

S2.3：细胞候选框特征图的生成

将步骤S2.1.3融合后的薄血涂片图像特征图

和步骤2.2.2去除冗余后的细胞候选框，输入到感兴趣区域对齐（Region of Interest Align, RoI Align）层，根据后续输出分支网络中输入大小的限制，将不同大小的细胞候选框对应的特征区域池化为7×7和14×14的固定尺寸，具体步骤如下：将细胞候选框对应的特征区域划分为7×7和14×14个单元，每个单元平均分为4个小单元，每个小单元的中心设为采样点，根据双线性插值法求出采样点的特征值，对每个单元内的采样点进行最大值池化操作，生成7×7和14×14尺寸的细胞候选框特征图；

S2.4：细胞候选框的结果预测

将步骤S2.3输出的固定尺寸的细胞候选框特征图输入到输出分支网络进行细胞检测和分割，输出分支网络包含分类回归网络和掩码生成网络：分类回归网络将步骤S2.3得到的7×7尺寸的细胞候选框特征图展平为一维向量，再通过两个1024维的全连接层进行细胞检测，掩码生成网络将步骤S2.3得到的14×14尺寸的细胞候选框特征图经过4个卷积核大小为3×3、通道数为256的卷积层，再经过2×2的反卷积操作将细胞候选框特征图尺寸扩充为28×28，最后经过1个卷积核大小为1×1、通道数为

的卷积层，得到

个28×28的细胞分割掩码，

为细胞类别数。

4.根据权利要求1所述的一种基于Mask R-CNN的疟疾血涂片细胞检测和分割方法，其特征在于，所述步骤S3进一步包括以下具体步骤：

S3.1：损失函数的构建和计算

重新构建损失函数，在细胞分类损失函数中加入损失权重和调节因子，降低红细胞对网络参数的贡献，改善细胞类别不均衡导致检测精度不高的情况，重构后的损失函数包括RPN网络中的分类损失

和检测框偏移损失

、输出分支网络的细胞分类损失

、细胞检测框偏移损失

和细胞掩码分割损失

五个部分：

(1)RPN网络分类损失

，计算公式如下：

(3-1)

其中，

为训练RPN网络时一个mini-batch中采样细胞候选框的数量；

为细胞候选框的索引；

为第

个细胞候选框的真实标签，当第

个细胞候选框含有细胞时，则

；当第

个细胞候选框不含有细胞时，则

；

为第

个细胞候选框中含有细胞的置信度；

(2)RPN网络检测框偏移损失

，计算公式如下：

(3-2)

其中，

为第

为第

为

函数，定义如下：

(3-3)

(3)细胞分类损失

，计算公式如下：

(3-4)

其中，

为细胞类别数；

为第

类细胞的候选框数量；

表示第

个细胞候选框为第

类细胞的置信度，

表示第

个细胞候选框的真实标签，

时属于第

类细胞，

时不属于第

类细胞；

为调节因子，易分类的红细胞置信度

接近于1，

会接近于0，可降低红细胞对损失函数的影响，根据经验

取值为2；

(4)细胞检测框偏移损失

，计算公式如下：

(3-5)

其中，

为第

个细胞候选框的真实标签，

表示第

表示第

为

函数；

(5)细胞分割损失

，计算公式如下：

(3-6)

其中，

为细胞掩码分辨率的大小；

为细胞掩码中第

个像素的真实标签，

时属于第

类细胞，

时不属于第

类细胞；

为细胞掩码中第

个像素为第

类细胞的置信度；

(6)总体损失

是以上RPN网络中的分类损失

和检测框偏移损失

、输出网络的细胞分类损失

、细胞检测框偏移损失

以及细胞掩码分割损失

五个部分之和，计算公式如下：

(3-7)

S3.2：网络权重的迭代更新

将步骤S1中的薄血涂片图像训练集

输入步骤S2中构建的Mask R-CNN网络模型进行训练，在训练网络模型时，首先加载预训练权重文件，作为网络模型初始化参数，并对FPN基础上增添的右侧连接路径进行随机初始化参数，接着对步骤S3.1中总体损失函数的各参数计算梯度值，采用随机梯度下降算法（Stochastic Gradient Descent, SGD）迭代更新网络模型的权重参数：