WO2021027135A1

WO2021027135A1 - 细胞检测模型训练方法、装置、计算机设备及存储介质

Info

Publication number: WO2021027135A1
Application number: PCT/CN2019/117233
Authority: WO
Inventors: 郭冰雪; 楼文杰; 王季勇; 谢魏玮; 初晓
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-08-15
Filing date: 2019-11-11
Publication date: 2021-02-18
Also published as: CN110705583A; CN110705583B

Abstract

一种细胞检测模型训练方法，所述方法包括：针对每个预设的交并比阈值，训练出目标模型；确定目标模型的正确率，并根据正确率确定第一交并比阈值、第二交并比阈值以及第三交并比阈值；根据第一交并比阈值以及多个样本图像，对神经网络进行训练，获得第一参数；根据第一参数，对样本图像进行重新采样，获得第一样本；根据第二交并比阈值以及第一样本，对神经网络进行训练，获得第二参数；根据第二参数以及第三交并比阈值，对样本图像进行重新采样，获得第二样本；根据第二样本，对神经网络进行训练，获得训练好的细胞检测模型。还提供一种细胞检测模型训练装置、计算机设备以及存储介质。能提高对异常细胞的检测精度。

Description

细胞检测模型训练方法、装置、计算机设备及存储介质

本申请要求于2019年08月15日提交中国专利局，申请号为201910755143.6发明名称为“细胞检测模型训练方法、装置、计算机设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及细胞检测技术领域，尤其涉及一种细胞检测模型训练方法、装置、计算机设备及存储介质。

背景技术

宫颈癌是可以早发现并治愈的癌症，每年造成的死亡病例多数发生在宫颈癌普查率低的地区，因此，对宫颈癌细胞的检测工作非常重要。

目前，可以利用深度学习神经网络对异常细胞图像进行特征提取并训练出模型，以检测异常细胞。但在实践中发现，利用深度学习神经网络训练的模型通常是选取0.5作为交并比阈值，这样训练出来的模型在对异常细胞进行检测的时候生成的检测框不够精确。

因此，如何提高对异常细胞的检测精度是一个亟待解决的技术问题。

发明内容

鉴于以上内容，有必要提供一种细胞检测模型训练方法、装置、计算机设备及存储介质，能够提高对异常细胞的检测精度。

本申请的第一方面提供一种细胞检测模型训练方法，所述方法包括：

针对每个预设的交并比阈值，使用多个样本图像训练出目标模型，其中，所述样本图像包括含有异常细胞的图像以及不含有异常细胞的图像；

使用自由响应接收器操作特性曲线方法确定所述目标模型的正确率，并根据所述正确率确定目标交并比阈值，其中，所述目标交并比阈值包括第一交并比阈值、第二交并比阈值以及第三交并比阈值，所述第三交并比阈值大于所述第二交并比阈值，所述第二交并比阈值大于所述第一交并比阈值；

根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数；

根据所述第一参数，对所述样本图像进行重新采样，获得第一样本；

根据所述第二交并比阈值以及所述第一样本，对所述神经网络进行训练，获得第二参数；

根据所述第二参数以及所述第三交并比阈值，对所述样本图像进行重新采样，获得第二样本；

根据所述第二样本，对所述神经网络进行训练，获得训练好的细胞检测模型。

本申请的第二方面提供一种细胞检测模型训练装置，所述装置包括：

训练模块，用于针对每个预设的交并比阈值，使用多个样本图像训练出目标模型，其中，所述样本图像包括含有异常细胞的图像以及不含有异常细胞的图像；

确定模块，用于使用自由响应接收器操作特性曲线方法确定所述目标模型的正确率，并根据所述正确率确定目标交并比阈值，其中，所述目标交并比阈值包括第一交并比阈值、第二交并比阈值以及第三交并比阈值，所述第三交并比阈值大于所述第二交并比阈值，所述第二交并比阈值大于所述第一交并比阈值；

所述训练模块，还用于根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数；

采样模块，用于根据所述第一参数，对所述样本图像进行重新采样，获得第一样本；

所述训练模块，还用于根据所述第二交并比阈值以及所述第一样本，对所述神经网络进行训练，获得第二参数；

所述采样模块，还用于根据所述第二参数以及所述第三交并比阈值，对所述样本图像进行重新采样，获得第二样本；

所述训练模块，还用于根据所述第二样本，对所述神经网络进行训练，获得训练好的细胞检测模型。

本申请的第三方面提供一种计算机设备，所述计算机设备包括处理器和存储器，所述处理器用于执行所述存储器中存储的计算机可读指令时实现所述的细胞检测模型训练方法。

本申请的第四方面提供一种非易失性可读存储介质，所述非易失性可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现所述的细胞检测模型训练方法。

由以上技术方案可知，本申请通过选取目标交并比阈值，确保训练的细胞检测模型的正确率比较高，并通过提高交并比阈值对所述样本图像进行重新取样，确保正样本数量足够，避免过度拟合，从而提高细胞检测模型对异常细胞的预测框的精度，即提高了对异常细胞的检测精度。

附图说明

图1是本申请公开的一种细胞检测模型训练方法的较佳实施例的流程图。

图2是本申请公开的一种细胞检测模型训练装置的较佳实施例的功能模块图。

图3是本申请实现细胞检测模型训练方法的较佳实施例的计算机设备的结构示意图。

具体实施方式

本申请实施例的细胞检测模型训练方法应用在计算机设备中，也可以应用在计算机设备和通过网络与所述计算机设备进行连接的服务器所构成的硬件环境中，由服务器和计算机设备共同执行。网络包括但不限于：广域网、城域网或局域网。

请参见图1，图1是本申请公开的一种细胞检测模型训练方法的较佳实施例的流程图。其中，根据不同的需求，该流程图中步骤的顺序可以改变，某些步骤可以省略。

S11、计算机设备针对每个预设的交并比阈值，使用多个样本图像训练出目标模型，其中，所述样本图像包括含有异常细胞的图像以及不含有异常细胞的图像。

其中，所述交并比(Intersection over union，IOU)在目标检测类型的模型中指产生的候选框与标注框的交叠率。在设定训练的正负样本(用于训练分类以及对正样本进行坐标回归)时，主要是根据交并比阈值来确定正样本和负样本，比如，选取交并比阈值为0.5，即IOU>0.5的作为正样本。

其中，所述样本图像上标注有异常细胞的边界框(坐标信息)以及类别。

其中，所述目标模型是指使用单个交并比阈值训练出的用来检测异常细胞的模型。

本申请实施例中，可以预先设置多个交并比阈值(比如：0.3，0.4，0.5，0.6，0.7，08，0.9)，然后训练出每个交并比阈值对应的目标模型。训练的过程就是对神经网络的训练，神经网络会根据输入的样本图像生成多个候选区域，然后将候选区域的边界框跟标注的异常细胞的边界框(标注框)做比较，将交并比大于交并比阈值的候选区域确定为正样本，对正样本的边界框坐标以及类别进行回归，当损失函数的损失值达到收敛状态时，确定目标模型被训练好。一般来说，交并比阈值越高，正样本的质量越高，训练出来的模型性能越好，但是交并比阈值过高会导致正样本数量过少，从而使得训练出现过度拟合的情况，训练出的模型性能反而下降。在多个目标模型被训练好后，可以对每个目标模型进行评估，以确定性能比较好的目标模型对应的交并比阈值。

S12、计算机设备使用自由响应接收器操作特性曲线方法确定所述目标模型的正确率，并根据所述正确率确定目标交并比阈值，其中，所述目标交并比阈值包括第一交并比阈值、第二交并比阈值以及第三交并比阈值，所述第三交并比阈值大于所述第二交并比阈值，所述第二交并比阈值大于所述第一交并比阈值。

其中，所述自由响应接收器操作特性曲线(Free-response Receiver Operating Characteristic Curves，FROC)，是接收器操作特性曲线(Receiver Operating Characteristic Curves，ROC)的一个变种，通过计算ROC曲线的AUC(Area under curve，曲线下面积)值可以确定一个模型的正确率，但是ROC方法不能解决对一幅图像上多个异常进行评价，而使用FROC方法可以对一幅图像上多个异常进行评价。

其中，所述目标交并比阈值用于对样本进行优化。

本申请实施例中，可以通过FROC方法确定根据不同交并比阈值训练出来的不同的目标模型(细胞检测模型)的正确率。将正确率最高的三个目标模型对应的交并比阈值确定为目标交并比阈值：第一交并比阈值、第二交并比阈值以及第三交并比阈值，其中，所述第三交并比阈值大于所述第二交并比阈值，所述第二交并比阈值大于所述第一交并比阈值。

S13、计算机设备根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数。

其中，所述神经网络包括但不限于：残差卷积网络(residual network，ResNet)、特征金字塔网络(Feature Pyramid Networks，FPN)以及区域候选网络(Region Proposal Network，RPN)。

本申请实施例中，可以根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数，因为第一交并比阈值训练出的神经网络的探测性能比较好，可以确保后续训练出来的模型的正确率比较高。

具体的，所述根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数包括：

针对每个所述样本图像，使用残差卷积网络对所述样本图像进行特征提取，获得特征信息；

根据所述特征信息，使用特征金字塔网络生成第一特征图；

根据所述第一特征图，使用区域候选网络生成候选区域；

根据所述第一交并比阈值，对所述候选区域进行筛选，获得第一区域；

将所述第一特征图以及所述第一区域输入至感兴趣区域池化层，获得所述第一区域对应的第二特征图；

根据所述第二特征图，对所述第一区域的边界框以及类别进行回归，获得第一参数。

在该可选的实施方式中，可以使用残差卷积网络对图像进行特征提取，获取图像的特征信息，然后将图像的特征信息输入至特征金字塔网络，获得图像的特征图(第一特征图)，区域候选网络对特征图进行处理，生成多个候选区域。这时可以根据所述第一交并比阈值对所述候选区域进行筛选，获得第一区域，即正样本。可以将图像的特征图以及第一区域输入至感兴趣区域(region of interest，ROI)池化层，获得第一区域对应的特征图(第二特征图)，其中，可以使用ROI Align(感兴趣区域对齐)，实现特征图尺寸的统一化。然后，可以根据第一区域的特征图，对第一区域的边界框(坐标)以及类别进行回归，获得神经网络的参数(第一参数)。所述第一参数是指根据第一交并比阈值筛选出来的候选框，进行训练后的整个神经网络的各个参数。

S14、计算机设备根据所述第一参数，对所述样本图像进行重新采样，获得第一样本。

在本申请实施例中，通过训练出来的第一参数对所述样本图像进行重新采样，即使用训练过的神经网络对之前候选区域网络对特征图进行处理，生成的候选框(所述第一区域)进行优化，获得新的一批边界框，优化后的边界框的交并比更高，确保提高交并比阈值后，正样本的数量足够用于训练，可以提高预测框的精度并防止过度拟合。

具体的，所述根据所述第一参数，对所述样本图像进行重新采样，获得第一样本包括：

根据所述第一参数以及所述第一区域，生成第二区域；

根据所述第二交并比阈值，对所述第二区域进行筛选，获得第三区域；

将所述第一特征图以及所述第三区域输入至感兴趣区域池化层，获得所述第三区域对应的第三特征图；

将所述第三区域以及所述第三特征图确定为第一样本。

在该可选的实施方式中，神经网络可以根据所述第一参数对所述第一区域进行优化，生成第二区域，根据所述第二交并比阈值对所述第二区域进行筛选，将交并比大于所述第二交并比阈值的所述第二区域确定为第三区域，可以将图像的特征图以及第三区域输入至感兴趣区域池化层，获得第三区域对应的特征图(第三特征图)，其中，可以使用ROI Align，实现特征图尺寸的统一化。将所述第三区域以及所述第三特征图确定为第一样本(正样本)。

S15、计算机设备根据所述第二交并比阈值以及所述第一样本，对所述神经网络进行训练，获得第二参数。

本申请实施例中，可以根据第一样本中的特征图，对第一样本的边界框(坐标)以及类别进行回归，获得神经网络的参数(第二参数)，所述第二参数是指对神经网络进行再训练，得到的各个参数，是对所述第一参数进行优化后得到的参数。

S16、计算机设备根据所述第二参数以及所述第三交并比阈值，对所述样本图像进行重新采样，获得第二样本。

本申请实施例中，可以通过训练出来的第二参数对所述样本图像进行重新采样，即使用训练过的神经网络对之前产生的候选框(所述第三区域)进行优化，获得新的一批边界框，优化后得到的边界框的交并比更高，确保提高交并比阈值后，正样本的数量足够用于训练，可以继续提高预测框的精度并防止过度拟合。

具体的，所述根据所述第二参数以及所述第三交并比阈值，对所述样本图像进行重新采样，获得第二样本包括：

根据所述第二参数以及所述第三区域，生成第四区域；

根据所述第三交并比阈值，对所述第四区域进行筛选，获得第五区域；

将所述第一特征图以及所述第五区域输入至感兴趣区域池化层，获得所述第五区域对应的第四特征图；

将所述第五区域以及所述第四特征图确定为第二样本。

在该可选的实施方式中，神经网络可以根据所述第二参数对所述第三区域进行优化，生成第四区域，根据所述第三交并比阈值对所述第四区域进行筛选，将交并比大于所述第三交并比阈值的所述第四区域确定为第五区域，可以将图像的特征图以及第五区域输入至感兴趣区域池化层，获得第五区域对应的特征图(第四特征图)，其中，可以使用ROI Align，实现特征图尺寸的统一化。将所述第五区域以及所述第四特征图确定为第二样本(正样本)。

S17、计算机设备根据所述第二样本，对所述神经网络进行训练，获得训练好的细胞检测模型。

本申请实施中，可以根据所述第二样本的特征图，对所述第二样本的边框坐标以及类别进行回归，当损失函数的损失值达到收敛状态时，确定获得训练好的细胞检测模型。通过实验，如果继续增加更高的第四交并比阈值对样本图像进行重新采样(对上一个交并比阈值训练出的区域候选网络输出的候选框进行优化)训练出来的模型反而会导致模型的整体性能下降，综合考虑，采用三个交并比阈值对神经网络进行逐步优化，训练出的模型的性能可以得到较大的改善。

作为一种可选的实施方式，所述方法还包括：

获取数字病理图像；

对所述数字病理图像进行切割，获得多个图像块；

对所述多个图像块进行预处理，获得多个目标图像；

将多个所述目标图像输入至所述细胞检测模型中，获得异常细胞检测结果。

其中，所述数字病理图像是通过全自动显微镜或光学放大系统扫描采集得到高分辨数字图像，再应用计算机对得到的图像自动进行高精度多视野无缝隙拼接和处理，获得优质的可视化数据以应用于病理学的各个领域的图像。

在该可选的实施方式中，因为一般的数字病理图像的大小太大，无法直接用计算机做图像分析处理，需要使用划窗将数字病理图像切割成多个小图像块，然后再对这些图像块进行预处理，得到细胞特征更明显，噪声更少的目标图像，以提高对图像检测的准确度，将目标图像输入至训练好的细胞检测模型中，获得异常细胞检测结果，所述检测结果包括异常细胞的边界框、类别以及概率。

作为一种可选的实施方式，所述获取数字病理图像之后，以及所述对所述数字病理图像进行切割，获得多个图像块之前，所述方法还包括：

通过最大类间方差算法对所述数字病理图像进行二值化处理，获得二值化图像；

通过膨胀算法和腐蚀算法对所述二值化图像进行开运算，以及通过膨胀算法和腐蚀算法对所述二值化图像进行闭运算，获得细胞区域更明显的二值化图像；

根据所述细胞区域更明显的二值化图像，生成细胞图像掩膜并映射至所述数字病理图像。

其中，所述最大类间方差算法(ostu)是一种对图像进行二值化的高效算法，可以利用阈值将原图像分割成前景，背景两部分。其中，二值化是将图像上的像素点的灰度值设置为0或255，也就是将整个图像呈现出明显的黑白效果的过程，可以使图像中数据量大为减少，从而能凸显出目标的轮廓。

其中，膨胀算法可以将与物体接触的所有背景点合并到该物体中，使边界向外部扩张，可以用来填补物体中的空洞。其中，腐蚀算法可以消除边界点，使边界向内部收缩，可以用来消除小且无意义的物体。

其中，开运算是指先腐蚀运算，再膨胀运算；闭运算是指先膨胀运算，再腐蚀运算。

在该可选的实施方式中，可以通过最大类间方差算法对所述数字病理图像进行二值化处理，获得所述数字病理图像的二值化图像，然后通过膨胀算法和腐蚀算法对所述二值化图像进行开运算以及闭运算，可以扩充细胞内部区域，并消除孤立的小点，使得所述二值化图像中的细胞区域更加明显，轮廓更加清晰，方便生成细胞图像掩膜(细胞的轮廓)，在生成细胞图像掩膜后，可以将细胞图像掩膜映射至所述数字病理图像。可选的，可以在对所述数字病理图像进行异常细胞检测时，输出异常细胞的掩膜。

具体的，所述对所述多个图像块进行预处理，获得多个目标图像包括：

针对每个所述图像块，通过归一化算法对所述图像块的像素进行归一化，获得归一化图像；

根据预设的伽马阈值，对所述归一化图像进行伽马校正，获得目标图像。

其中，归一化是指RGB(Red Green Blue)归一化，通过对图像的RGB色彩空间进行归一化处理，可以消除一部分光照对图像的影响。

其中，伽马校正(gamma correction)是对图像的伽马曲线进行编辑，以对图像进行非线性色调编辑的方法，检出图像信号中的深色部分和浅色部分，并使两者比例增大，从而提高图像对比度效果。

在该可选的实施方式中，因为不同的图像的来源可能不同，在图像的采集中，图像往往会被不同强度的随机信号(也称噪声)所污染，这会对后续的图像分析和处理产生不可预知的影响，因此，需要对这些图像进行RGB归一化以及伽马校正，以减少噪声对图像的影响，可以提高图像检测的准确性。

在图1所描述的方法流程中，可以针对每个预设的交并比阈值，使用多个样本图像训练出目标模型，其中，所述样本图像包括含有异常细胞的图像以及不含有异常细胞的图像；使用自由响应接收器操作特性曲线方法确定所述目标模型的正确率，并根据所述正确率确定目标交并比阈值，其中，所述目标交并比阈值包括第一交并比阈值、第二交并比阈值以及第三交并比阈值，所述第三交并比阈值大于所述第二交并比阈值，所述第二交并比阈值大于所述第一交并比阈值；根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数；根据所述第一参数，对所述样本图像进行重新采样，获得第一样本；根据所述第二交并比阈值以及所述第一样本，对所述神经网络进行训练，获得第二参数；根据所述第二参数以及所述第三交并比阈值，对所述样本图像进行重新采样，获得第二样本；根据所述第二样本，对所述神经网络进行训练，获得训练好的细胞检测模型。可见，通过选取目标交并比阈值，确保训练的细胞检测模型的正确率比较高，并通过提高交并比阈值对所述样本图像进行重新取样，确保正样本数量足够，避免过度拟合，从而提高细胞检测模型对异常细胞的预测框的精度，即提高了对异常细胞的检测精度。

以上所述，仅是本申请的具体实施方式，但本申请的保护范围并不局限于此，对于本领域的普通技术人员来说，在不脱离本申请创造构思的前提下，还可以做出改进，但这些均属于本申请的保护范围。

请参见图2，图2是本申请公开的一种细胞检测模型训练装置的较佳实施例的功能模块图。

在一些实施例中，所述细胞检测模型训练装置运行于计算机设备中。所述细胞检测模型训练装置可以包括多个由程序代码段所组成的功能模块，所述程序是一系列的计算机可读指令代码。所述细胞检测模型训练装置中的各个程序段的程序代码可以存储于存储器中，并由至少一个处理器所执行，以执行图1所描述的细胞检测模型训练方法中的部分或全部步骤，具体可以参照图1所述方法中的相关描述，在此不再赘述。

本实施例中，所述细胞检测模型训练装置根据其所执行的功能，可以被划分为多个功能模块。所述功能模块可以包括：训练模块201、确定模块202及采样模块203。本申请所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机可读指令段，其存储在存储器中。

训练模块201，用于针对每个预设的交并比阈值，使用多个样本图像训练出目标模型，其中，所述样本图像包括含有异常细胞的图像以及不含有异常细胞的图像；

确定模块202，用于使用自由响应接收器操作特性曲线方法确定所述目标模型的正确率，并根据所述正确率确定目标交并比阈值，其中，所述目标交并比阈值包括第一交并比阈值、第二交并比阈值以及第三交并比阈值，所述第三交并比阈值大于所述第二交并比阈值，所述第二交并比阈值大于所述第一交并比阈值；

所述训练模块201，还用于根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数；

采样模块203，用于根据所述第一参数，对所述样本图像进行重新采样，获得第一样本；

所述训练模块201，还用于根据所述第二交并比阈值以及所述第一样本，对所述神经网络进行训练，获得第二参数；

所述采样模块203，还用于根据所述第二参数以及所述第三交并比阈值，对所述样本图像进行重新采样，获得第二样本；

所述训练模块201，还用于根据所述第二样本，对所述神经网络进行训练，获得训练好的细胞检测模型。

作为一种可选的实施方式，所述训练模块201根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数的方式具体为：

根据所述特征信息，使用特征金字塔网络生成第一特征图；

根据所述第一特征图，使用区域候选网络生成候选区域；

作为一种可选的实施方式，所述采样模块203根据所述第一参数，对所述样本图像进行重新采样，获得第一样本的方式具体为：

根据所述第一参数以及所述第一区域，生成第二区域；

将所述第三区域以及所述第三特征图确定为第一样本。

作为一种可选的实施方式，所述采样模块203根据所述第二参数以及所述第三交并比阈值，对所述样本图像进行重新采样，获得第二样本的方式具体为：

根据所述第二参数以及所述第三区域，生成第四区域；

将所述第五区域以及所述第四特征图确定为第二样本。

作为一种可选的实施方式，所述细胞检测模型训练装置还可以包括：

获取模块，用于获取数字病理图像；

切割模块，用于对所述数字病理图像进行切割，获得多个图像块；

预处理模块，用于对所述多个图像块进行预处理，获得多个目标图像；

输入模块，用于将多个所述目标图像输入至所述细胞检测模型中，获得异常细胞检测结果。

二值化模块，用于所述获取模块获取数字病理图像之后，以及所述切割模块对所述数字病理图像进行切割，获得多个图像块之前，通过最大类间方差算法对所述数字病理图像进行二值化处理，获得二值化图像；

运算模块，用于通过膨胀算法和腐蚀算法对所述二值化图像进行开运算，以及通过膨胀算法和腐蚀算法对所述二值化图像进行闭运算，获得细胞区域更明显的二值化图像；

生成模块，用于根据所述细胞区域更明显的二值化图像，生成细胞图像掩膜并映射至所述数字病理图像。

作为一种可选的实施方式，所述预处理模块对所述多个图像块进行预处理，获得多个目标图像的方式具体为：

在图2所描述的细胞检测模型训练装置中，可以针对每个预设的交并比阈值，使用多个样本图像训练出目标模型，其中，所述样本图像包括含有异常细胞的图像以及不含有异常细胞的图像；使用自由响应接收器操作特性曲线方法确定所述目标模型的正确率，并根据所述正确率确定目标交并比阈值，其中，所述目标交并比阈值包括第一交并比阈值、第二交并比阈值以及第三交并比阈值，所述第三交并比阈值大于所述第二交并比阈值，所述第二交并比阈值大于所述第一交并比阈值；根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数；根据所述第一参数，对所述样本图像进行重新采样，获得第一样本；根据所述第二交并比阈值以及所述第一样本，对所述神经网络进行训练，获得第二参数；根据所述第二参数以及所述第三交并比阈值，对所述样本图像进行重新采样，获得第二样本；根据所述第二样本，对所述神经网络进行训练，获得训练好的细胞检测模型。可见，通过选取目标交并比阈值，确保训练的细胞检测模型的正确率比较高，并通过提高交并比阈值对所述样本图像进行重新取样，确保正样本数量足够，避免过度拟合，从而提高细胞检测模型对异常细胞的预测框的精度，即提高了对异常细胞的检测精度。

如图3所示，图3是本申请实现细胞检测模型训练方法的较佳实施例的计算机设备的结构示意图。所述计算机设备3包括存储器31、至少一个处理器32、存储在所述存储器31中并可在所述至少一个处理器32上运行的计算机可读指令33及至少一条通讯总线34。

本领域技术人员可以理解，图3所示的示意图仅仅是所述计算机设备3的示例，并不构成对所述计算机设备3的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述计算机设备3还可以包括输入输出设备、网络接入设备等。

所述计算机设备3还包括但不限于任何一种可与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant，PDA)、游戏机、交互式网络电视(Internet Protocol Television，IPTV)、智能式穿戴式设备等。

所述至少一个处理器32可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。该处理器32可以是微处理器或者该处理器32也可以是任何常规的处理器等，所述处理器32 是所述计算机设备3的控制中心，利用各种接口和线路连接整个计算机设备3的各个部分。

所述存储器31可用于存储所述计算机可读指令33和/或模块/单元，所述处理器32通过运行或执行存储在所述存储器31内的计算机可读指令和/或模块/单元，以及调用存储在存储器31内的数据，实现所述计算机设备3的各种功能。所述存储器31可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据计算机设备3的使用所创建的数据(比如音频数据)等。此外，存储器31可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。

结合图1，所述计算机设备3中的所述存储器31存储多个指令以实现一种细胞检测模型训练方法，所述处理器32可执行所述多个指令从而实现：

具体地，所述处理器32对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述，在此不赘述。

在图3所描述的计算机设备3中，可以针对每个预设的交并比阈值，使用多个样本图像训练出目标模型，其中，所述样本图像包括含有异常细胞的图像以及不含有异常细胞的图像；使用自由响应接收器操作特性曲线方法确定所述目标模型的正确率，并根据所述正确率确定目标交并比阈值，其中，所述目标交并比阈值包括第一交并比阈值、第二交并比阈值以及第三交并比阈值，所述第三交并比阈值大于所述第二交并比阈值，所述第二交并比阈值大于所述第一交并比阈值；根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数；根据所述第一参数，对所述样本图像进行重新采样，获得第一样本；根据所述第二交并比阈值以及所述第一样本，对所述神经网络进行训练，获得第二参数；根据所述第二参数以及所述第三交并比阈值，对所述样本图像进行重新采样，获得第二样本；根据所述第二样本，对所述神经网络进行训练，获得训练好的细胞检测模型。可见，通过选取目标交并比阈值，确保训练的细胞检测模型的正确率比较高，并通过提高交并比阈值对所述样本图像进行重新取样，确保正样本数量足够，避免过度拟合，从而提高细胞检测模型对异常细胞的预测框的精度，即提高了对异常细胞的检测精度。

所述计算机设备3集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个非易失性可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，也可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一非易失性可读存储介质中，该计算机可读指令在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机可读指令包括计算机可读指令代码，所述计算机可读指令代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述非易失性可读介质可以包括：能够携带所述计算机可读指令代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

最后应说明的是，以上实施例仅用以说明本申请的技术方案而非限制，尽管参照较佳实施例对本申请进行了详细说明，本领域的普通技术人员应当理解，可以对本申请的技术方案进行修改或等同替换，而不脱离本申请技术方案的精神和范围。

Claims

一种细胞检测模型训练方法，其特征在于，所述方法包括：

针对每个预设的交并比阈值，使用多个样本图像训练出目标模型，其中，所述样本图像包括含有异常细胞的图像以及不含有异常细胞的图像；

使用自由响应接收器操作特性曲线方法确定所述目标模型的正确率，并根据所述正确率确定目标交并比阈值，其中，所述目标交并比阈值包括第一交并比阈值、第二交并比阈值以及第三交并比阈值，所述第三交并比阈值大于所述第二交并比阈值，所述第二交并比阈值大于所述第一交并比阈值；

根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数；

根据所述第一参数，对所述样本图像进行重新采样，获得第一样本；

根据所述第二交并比阈值以及所述第一样本，对所述神经网络进行训练，获得第二参数；

根据所述第二参数以及所述第三交并比阈值，对所述样本图像进行重新采样，获得第二样本；

根据所述第二样本，对所述神经网络进行训练，获得训练好的细胞检测模型。
根据权利要求1所述的方法，其特征在于，所述根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数包括：

针对每个所述样本图像，使用残差卷积网络对所述样本图像进行特征提取，获得特征信息；

根据所述特征信息，使用特征金字塔网络生成第一特征图；

根据所述第一特征图，使用区域候选网络生成候选区域；

根据所述第一交并比阈值，对所述候选区域进行筛选，获得第一区域；

将所述第一特征图以及所述第一区域输入至感兴趣区域池化层，获得所述第一区域对应的第二特征图；

根据所述第二特征图，对所述第一区域的边界框以及类别进行回归，获得第一参数。
根据权利要求2所述的方法，其特征在于，所述根据所述第一参数，对所述样本图像进行重新采样，获得第一样本包括：

利用所述第一参数对所述第一区域进行优化，生成第二区域；

根据所述第二交并比阈值，对所述第二区域进行筛选，获得第三区域；

将所述第一特征图以及所述第三区域输入至感兴趣区域池化层，获得所述第三区域对应的第三特征图；

将所述第三区域以及所述第三特征图确定为第一样本。
根据权利要求3所述的方法，其特征在于，所述根据所述第二参数以及所述第三交并比阈值，对所述样本图像进行重新采样，获得第二样本包括：

根据所述第二参数以及所述第三区域，生成第四区域；

根据所述第三交并比阈值，对所述第四区域进行筛选，获得第五区域；

将所述第一特征图以及所述第五区域输入至感兴趣区域池化层，获得所述第五区域对应的第四特征图；

将所述第五区域以及所述第四特征图确定为第二样本。
根据权利要求1至4中任一项所述的方法，其特征在于，所述方法还包括：

获取数字病理图像；

对所述数字病理图像进行切割，获得多个图像块；

对所述多个图像块进行预处理，获得多个目标图像；

将多个所述目标图像输入至所述细胞检测模型中，获得异常细胞检测结果。
根据权利要求5所述的方法，其特征在于，所述获取数字病理图像之后，以及所述对所述数字病理图像进行切割，获得多个图像块之前，所述方法还包括：

通过最大类间方差算法对所述数字病理图像进行二值化处理，获得二值化图像；

通过膨胀算法和腐蚀算法对所述二值化图像进行开运算，以及通过膨胀算法和腐蚀算法对所述二值化图像进行闭运算，获得细胞区域更明显的二值化图像；

根据所述细胞区域更明显的二值化图像，生成细胞图像掩膜并映射至所述数字病理图像。
根据权利要求5所述的方法，其特征在于，所述对所述多个图像块进行预处理，获得多个目标图像包括：

针对每个所述图像块，通过归一化算法对所述图像块的像素进行归一化，获得归一化图像；

根据预设的伽马阈值，对所述归一化图像进行伽马校正，获得目标图像。
一种细胞检测模型训练装置，其特征在于，所述细胞检测模型训练装置包括：

训练模块，用于针对每个预设的交并比阈值，使用多个样本图像训练出目标模型，其中，所述样本图像包括含有异常细胞的图像以及不含有异常细胞的图像；

确定模块，用于使用自由响应接收器操作特性曲线方法确定所述目标模型的正确率，并根据所述正确率确定目标交并比阈值，其中，所述目标交并比阈值包括第一交并比阈值、第二交并比阈值以及第三交并比阈值，所述第三交并比阈值大于所述第二交并比阈值，所述第二交并比阈值大于所述第一交并比阈值；

所述训练模块，还用于根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数；

采样模块，用于根据所述第一参数，对所述样本图像进行重新采样，获得第一样本；

所述训练模块，还用于根据所述第二交并比阈值以及所述第一样本，对所述神经网络进行训练，获得第二参数；

所述采样模块，还用于根据所述第二参数以及所述第三交并比阈值，对所述样本图像进行重新采样，获得第二样本；

所述训练模块，还用于根据所述第二样本，对所述神经网络进行训练，获得训练好的细胞检测模型。
一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述处理器用于执行存储器中存储的至少一个计算机可读指令以实现以下步骤：

针对每个预设的交并比阈值，使用多个样本图像训练出目标模型，其中，所述样本图像包括含有异常细胞的图像以及不含有异常细胞的图像；

使用自由响应接收器操作特性曲线方法确定所述目标模型的正确率，并根据所述正确率确定目标交并比阈值，其中，所述目标交并比阈值包括第一交并比阈值、第二交并比阈值以及第三交并比阈值，所述第三交并比阈值大于所述第二交并比阈值，所述第二交并比阈值大于所述第一交并比阈值；

根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数；

根据所述第一参数，对所述样本图像进行重新采样，获得第一样本；

根据所述第二交并比阈值以及所述第一样本，对所述神经网络进行训练，获得第二参数；

根据所述第二参数以及所述第三交并比阈值，对所述样本图像进行重新采样，获得第二样本；

根据所述第二样本，对所述神经网络进行训练，获得训练好的细胞检测模型。
根据权利要求9所述的计算机设备，其特征在于，在所述根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数时，所述处理器执行所述至少一个计算机可读指令以实现以下步骤：

针对每个所述样本图像，使用残差卷积网络对所述样本图像进行特征提取，获得特征信息；

根据所述特征信息，使用特征金字塔网络生成第一特征图；

根据所述第一特征图，使用区域候选网络生成候选区域；

根据所述第一交并比阈值，对所述候选区域进行筛选，获得第一区域；

将所述第一特征图以及所述第一区域输入至感兴趣区域池化层，获得所述第一区域对应的第二特征图；

根据所述第二特征图，对所述第一区域的边界框以及类别进行回归，获得第一参数。
根据权利要求10所述的计算机设备，其特征在于，在所述根据所述第一参数，对所述样本图像进行重新采样，获得第一样本时，所述处理器执行所述至少一个计算机可读指令以实现以下步骤：

利用所述第一参数对所述第一区域进行优化，生成第二区域；

根据所述第二交并比阈值，对所述第二区域进行筛选，获得第三区域；

将所述第一特征图以及所述第三区域输入至感兴趣区域池化层，获得所述第三区域对应的第三特征图；

将所述第三区域以及所述第三特征图确定为第一样本。
根据权利要求11所述的计算机设备，其特征在于，在所述根据所述第二参数以及所述第三交并比阈值，对所述样本图像进行重新采样，获得第二样本时，所述处理器执行所述至少一个计算机可读指令以实现以下步骤：

根据所述第二参数以及所述第三区域，生成第四区域；

根据所述第三交并比阈值，对所述第四区域进行筛选，获得第五区域；

将所述第一特征图以及所述第五区域输入至感兴趣区域池化层，获得所述第五区域对应的第四特征图；

将所述第五区域以及所述第四特征图确定为第二样本。
根据权利要求9至12中任一项所述的计算机设备，其特征在于，所述处理器执行所述至少一个计算机可读指令以实现以下步骤：

获取数字病理图像；

对所述数字病理图像进行切割，获得多个图像块；

对所述多个图像块进行预处理，获得多个目标图像；

将多个所述目标图像输入至所述细胞检测模型中，获得异常细胞检测结果。
根据权利要求13所述的计算机设备，其特征在于，在所述获取数字病理图像之后，以及所述对所述数字病理图像进行切割，获得多个图像块之前，所述处理器执行所述至少一个计算机可读指令以实现以下步骤：

通过最大类间方差算法对所述数字病理图像进行二值化处理，获得二值化图像；

通过膨胀算法和腐蚀算法对所述二值化图像进行开运算，以及通过膨胀算法和腐蚀算法对所述二值化图像进行闭运算，获得细胞区域更明显的二值化图像；

根据所述细胞区域更明显的二值化图像，生成细胞图像掩膜并映射至所述数字病理图像。
一种非易失性可读存储介质，其特征在于，所述非易失性可读存储介质存储有至少一个计算机可读指令，所述至少一个计算机可读指令被处理器执行时实现以下步骤：

针对每个预设的交并比阈值，使用多个样本图像训练出目标模型，其中，所述样本图像包括含有异常细胞的图像以及不含有异常细胞的图像；

使用自由响应接收器操作特性曲线方法确定所述目标模型的正确率，并根据所述正确率确定目标交并比阈值，其中，所述目标交并比阈值包括第一交并比阈值、第二交并比阈值以及第三交并比阈值，所述第三交并比阈值大于所述第二交并比阈值，所述第二交并比阈值大于所述第一交并比阈值；

根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数；

根据所述第一参数，对所述样本图像进行重新采样，获得第一样本；

根据所述第二交并比阈值以及所述第一样本，对所述神经网络进行训练，获得第二参数；

根据所述第二参数以及所述第三交并比阈值，对所述样本图像进行重新采样，获得第二样本；

根据所述第二样本，对所述神经网络进行训练，获得训练好的细胞检测模型。
根据权利要求15所述的存储介质，其特征在于，在所述根据所述第一交并比阈值以及所述多个样本图像，对神经网络进行训练，获得第一参数时，所述至少一个计算机可读指令被处理器执行以实现以下步骤：

针对每个所述样本图像，使用残差卷积网络对所述样本图像进行特征提取，获得特征信息；

根据所述特征信息，使用特征金字塔网络生成第一特征图；

根据所述第一特征图，使用区域候选网络生成候选区域；

根据所述第一交并比阈值，对所述候选区域进行筛选，获得第一区域；

将所述第一特征图以及所述第一区域输入至感兴趣区域池化层，获得所述第一区域对应的第二特征图；

根据所述第二特征图，对所述第一区域的边界框以及类别进行回归，获得第一参数。
根据权利要求16所述的存储介质，其特征在于，在所述根据所述第一参数，对所述样本图像进行重新采样，获得第一样本时，所述至少一个计算机可读指令被处理器执行以实现以下步骤：

利用所述第一参数对所述第一区域进行优化，生成第二区域；

根据所述第二交并比阈值，对所述第二区域进行筛选，获得第三区域；

将所述第一特征图以及所述第三区域输入至感兴趣区域池化层，获得所述第三区域对应的第三特征图；

将所述第三区域以及所述第三特征图确定为第一样本。
根据权利要求17所述的存储介质，其特征在于，在所述根据所述第二参数以及所述第三交并比阈值，对所述样本图像进行重新采样，获得第二样本时，所述至少一个计算机可读指令被处理器执行以实现以下步骤：

根据所述第二参数以及所述第三区域，生成第四区域；

根据所述第三交并比阈值，对所述第四区域进行筛选，获得第五区域；

将所述第一特征图以及所述第五区域输入至感兴趣区域池化层，获得所述第五区域对应的第四特征图；

将所述第五区域以及所述第四特征图确定为第二样本。
根据权利要求15至18中任一项所述的存储介质，其特征在于，所述至少一个计算机可读指令被处理器执行以实现以下步骤：

获取数字病理图像；

对所述数字病理图像进行切割，获得多个图像块；

对所述多个图像块进行预处理，获得多个目标图像；

将多个所述目标图像输入至所述细胞检测模型中，获得异常细胞检测结果。
根据权利要求19所述的存储介质，其特征在于，在所述获取数字病理图像之后，以及所述对所述数字病理图像进行切割，获得多个图像块之前，所述至少一个计算机可读指令被处理器执行以实现以下步骤：

通过最大类间方差算法对所述数字病理图像进行二值化处理，获得二值化图像；

通过膨胀算法和腐蚀算法对所述二值化图像进行开运算，以及通过膨胀算法和腐蚀算法对所述二值化图像进行闭运算，获得细胞区域更明显的二值化图像；

根据所述细胞区域更明显的二值化图像，生成细胞图像掩膜并映射至所述数字病理图像。