WO2021114630A1

WO2021114630A1 - 医学图像样本筛查方法、装置、计算机设备和存储介质

Info

Publication number: WO2021114630A1
Application number: PCT/CN2020/099328
Authority: WO
Inventors: 王俊; 高鹏
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-05-28
Filing date: 2020-06-30
Publication date: 2021-06-17
Also published as: CN111666993A

Abstract

一种医学图像样本筛查方法、装置、计算机设备和存储介质，涉及计算机视觉技术领域，用于对未标注的医学图像样本进行智能筛查，利用Mask-RCNN模型对已标注样本集进行模型训练，以获取病灶目标检测深度模型；根据病灶目标检测深度模型对未标注医学图像样本集进行预测，得到每个医学图像样本的预测结果并判断标注价值；选取标注价值高的医学图像样本进行标注确认后，对病灶目标检测深度模型进行迭代更新，直到病灶目标检测深度模型的性能不能继续标注新的样本时结束迭代更新。这种医学图像样本筛查方法和装置通过模拟医学专家智能学习模式去高效地诊断和决策，智能化程度高，处理速度快，有效地解决了标注效率低的问题。

Description

医学图像样本筛查方法、装置、计算机设备和存储介质

本申请要求申请号为2020104686909，申请日为2020年05月28日，发明创造名称为“医学图像样本筛查方法、装置、计算机设备和存储介质”的专利申请的优先权。

技术领域

本申请涉及计算机视觉技术领域，特别是涉及一种医学图像样本筛查方法、装置、计算机设备和存储介质。

背景技术

基于医学图像进行病灶、关键器官等目标的检测，是医疗影响人工智能辅助诊疗领域使用频率较高的任务之一，临床采集的实际医学影像数据本身具有复杂语义和目标布局，不同类型病变区域之间的遮挡使得准确有效的医学影像目标检测变得异常困难。

目前，通过深度学习为主的监督学习算法在很多计算机视觉应用领域取得了一定的效果，其需要基于大量的标注训练样本，训练数据的质量对于模型的性能影响至关重要，意味着学习到较好的特征和检测模型需要大量的标注样本。在应用到医学影像进行病灶目标检测时，标注数据需要具有相关专业知识的医生，而医生往往很难有时间来进行专门的标注工作，聘请医生或专门的标注技术人员进行标注导致标注的成本很高，判读或标注的周期都很长。

深度卷积神经网络模型凭借良好的特征表达和学习能力可处理复杂医学图像数据，但是，相比基于医学图像实现分类，比如诊断患者是否患病、病情轻重程度分级，目标检测需要进一步准确地定位出病变区域用于智能辅助诊断，因此，难度指数更高，更加需要大量标记的训练样本才能充分发挥其潜力。医学图像智能分析这类领域中，不同疾病类型和严重程度的图像纷繁复杂，需要从海量的未标注样本中优先找出价值最大的图像样本，提供足够的信息给模型学习，以用于医学图像目标检测的稳健深度学习模型训练，当病灶之间存在严重的数量不平衡的情况时，高价值样本的筛选也越发关键和重要。

因此，发明人意识到目前对于医学影像数据进行标注的成本很高，且图像判读的时间周期很长。

发明内容

基于此，有必要针对医学图像样本检测监督学习时，智能筛选样本的模型效率低下，准确率不高的问题，提出一种利用深度卷积神经网络模型智能筛选有价值的医学图像样本，并根据有价值的医学图像样本对模型进行迭代改进，以进一步提高模型智能标注病灶目标的水平。

一种医学图像样本筛查方法，用于对未标注的医学图像样本进行智能筛查，包括如下步骤：

选取针对当前医疗影像病灶目标检测任务的初始已标注样本集L，利用Mask-RCNN模型对所述初始已标注样本集L进行模型训练，以获取当前医疗影像病灶目标检测的病灶目标检测深度模型C；

根据所述初始病灶目标检测深度模型C对未标注医学图像样本集U进行逐一预测，得到所述未标注医学图像样本集U中每个医学图像样本的预测结果，并根据预测结果判断每个医学图像样本的标注价值；

选取所述未标注医学图像样本集U中标注价值高的医学图像样本进行标注确认后，对当前的病灶目标检测深度模型C进行迭代更新；

根据迭代更新后的病灶目标检测深度模型C对新的医学图像病灶样本进行验证，直到病灶目标检测深度模型C的性能不能再继续标注新的样本时，则结束迭代更新。

本申请还提出一种医学图像样本筛查装置，所述装置包括病灶目标深度模型初始化单元、未标注医学图像样本标注价值预测单元、病灶目标检测深度模型迭代单元和模型迭代更新判断单元；

所述病灶目标检测深度模型初始化单元，用于选取当前医疗影像目标检测任务的初始已标注样本集L，利用Mask-RCNN模型对所述初始已标注样本集L进行模型训练，以获取当前医疗影像病灶目标检测的病灶目标检测深度模型C；

所述未标注医学图像样本标注价值预测单元，用于根据所述病灶目标检测深度模型C对未标注医学图像样本集U进行逐一预测，得到所述未标注医学图像样本集U中每个医学图像样本的预测结果，并根据预测结果判断每个医学图像样本的标注价值；

所述病灶目标检测深度模型迭代单元，用于选取所述未标注医学图像样本集U中标注价值高的医学图像样本进行标注确认，根据选取的标注价值高的医学图像样本对当前的病灶目标检测深度模型C进行迭代更新；

所述模型迭代更新判断单元，用于根据迭代更新后的病灶目标检测深度模型C对新的医学图像病灶样本进行验证，如病灶目标检测深度模型C的性能不能再继续标注新的样本时结束迭代更新，否则所述病灶目标检测深度模型迭代单元继续根据新的样本进行迭代更新。

本申请还提供一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行包括如下步骤：

本申请还提供一种存储有计算机可读指令的存储介质，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行上述医学图像样本筛查方法的步骤。

与现有技术相比较，本申请基于主动学习策略，从未标注的大量原始医学图像中，通过挑选部分高价值样本进行标注，不需要对所有的样本进行标注，每次都挑选对改进深度学习目标检测模型最有价值的样本加入训练，在获取理想任务精度的基础上，有效地减少了标注代价和工作量，最大化样本人工标注效率。选择信息量最大的样本来加速模型训练，使用标签数据量明显降低，为深度学习降低数据集要求提供了新的实现方法，实现高效的数据和计算资源利用，节省计算资源消耗。

另外，通过结合目标检测模型的预测输出，将主动学习与主流的目标检测模型融合在一起，从而可以显著地节省训练深度神经网络目标检测器的标注成本。在此基础上可训练得到泛化能力更强更准确的医学图像目标检测模型，减少网络过拟合以更好的适应医学应用场景。本方法从已获得的标签中取得的知识以探索决策边界，在有限的计算资源或者标注成本条件下，探索性地主动挖掘抽取高价值的小数据集，以此开展模型训练并做出决定，于复杂多变的状态空间里面，通过模拟医学专家智能学习模式去高效地诊断和决策，智能化程度高，处理速度快，在保证目标检测性能的同时大大节省了训练目标检测器的数据标注成本，有效地解决了标注效率低的问题。

附图说明

图1为一个实施例中提供的医学图像样本筛查方法的实施环境图；

图2为一个实施例中计算机设备的内部结构框图；

图3为一个实施例中医学图像样本筛查方法的流程图；

图4为一个实施例中Mask-RCNN模型结构示意图；

图5为一个实施例中医学图像样本筛查方法的技术路线流程图；

图6为一个实施例中初始病灶目标检测深度模型C对未标注的医学图像样本集U进行逐一预测的流程图；

图7为一个实施例中计算病灶目标置信度值的流程图；

图8为一个实施例中病灶目标置信度检测的样本目标检测框数量柱状图；

图9为一个实施例中计算病灶目标实例抗扰动稳定度值的流程图；

图10为一个实施例中医学图像样本的目标实例检测图；

图11为一个实施例中两个医学图像样本图像示例图；

图12为一个实施例中医学图像样本筛查装置的结构框图；

图13为一个实施例中未标注医学图像样本标注价值预测单元的结构框图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

图1为一个实施例中提供的医学图像样本筛查方法的实施环境图，如图1所示，在该实施环境中，包括计算机设备110以及终端120。

计算机设备110为测试设备，例如为测试人员使用的电脑等计算机设备，计算机设备110上安装有自动化测试工具，例如可以为Appium。终端120上安装有医学图像样本筛查方法的被测应用，当需要测试时，测试人员可以在计算机设备110发出请求，该请求中携带有标识，计算机设备110接收请求，根据标识获取计算机设备110中与请求标识对应的脚本。然后利用自动化测试工具执行该脚本，对终端120上的医学图像样本筛查方法被测应用进行测试，并获取脚本对应的定位结果。

需要说明的是，终端120以及计算机设备110可为智能手机、平板电脑、笔记本电脑、台式计算机等，但并不局限于此。计算机设备110以及终端110可以通过蓝牙、USB(Universal Serial Bus，通用串行总线)或者其他通讯连接方式进行连接，本申请在此不做限制。

图2为一个实施例中计算机设备的内部结构示意图。如图2所示，该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中，该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令，数据库中可存储有控件信息序列，该计算机可读指令被处理器执行时，可使得处理器实现一种医学图像样本筛查方法。该计算机设备的处理器用于提供计算和控制能力，支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令，该计算机可读指令被处理器执行时，可使得处理器执行一种医学图像样本筛查方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解，图2中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

如图3所示，在一个实施例中，提出了一种医学图像样本筛查方法，该方法可以应用于上述的计算机设备110中，具体可以包括以下步骤302～308：

步骤302，选取针对当前医疗影像病灶目标检测任务的初始已标注样本集L，利用Mask-RCNN模型对所述初始已标注样本集L进行模型训练，以获取当前医疗影像病灶目标检测的病灶目标检测深度模型C；

在本实施例中，对于医学图像的检测模型采用目前主流的深度学习目标检测模型Mask-RCNN，图4为一个实施例中Mask-RCNN模型结构示意图，示出了该Mask-RCNN模型的结构。设存在一个原始的医学图像数据集D，对该数据集D进行随机挑选获取标签，并生成带有标签的初始化样本集L，即初始已标注样本集L。再将该已标注样本集L送入到上述Mask-RCNN模型中进行训练，训练结束后形成当前医疗影像病灶目标检测的病灶目标检测深度模型C。应当说明的是，原始的医学图像数据集D均为病灶目标相同的医学图像，比如，均为肺部的病灶医学图像。

步骤304，根据所述初始病灶目标检测深度模型C对未标注医学图像样本集U进行逐一预测，得到所述未标注医学图像样本集U中每个医学图像样本的预测结果，并根据预测结果判断每个医学图像样本的标注价值；

在本实施例中，在得到病灶目标检测深度模型C后，该病灶目标检测深度模型C即为一个建立在Mask-RCNN模型基础上的、能够初步检测相同病灶目标的深度模型，用该模型C对上述原始的医学图像数据集D中余下的没有打标签的医学图像样本，即未标注医学图像样本集U，进行逐一预测，此处，预测的结果是对未进行标签标注的医学图像样本进行初步的检测，因初始病灶目标深度检测模型C的实例学习较少，模型还不够健壮，性能较低。

图6为一个实施例中初始病灶目标检测深度模型C对未标注的医学图像样本集U进行逐一预测的流程图，具体对未标注医学图像样本集U进行逐一预测，得到所述未标注医学图像样本集U中每个医学图像样本的预测结果，并根据预测结果判断每个医学图像样本的标注价值包括步骤602～606：

在本实施例中，选择Uncertainty(预测不确定性得分)和目标实例附近重叠建议区平均交并比IOU(抗扰动稳定度得分)的综合策略衡量未标注医学图像样本中每个医学图像样本的标注价值。其中，对于医学图像样本中待检测目标的不确定性得分，是通过检测框预置置信度来进行衡量的；对于医学图像样本中目标实例附近重叠建议区平均交并比IOU(抗扰动稳定度得分)，则是采用RPN网络来生成医学样本图像中可能包含物体的区域候选框，再选择目标实例附近的重叠区域候选框，计算目标重叠区域的交并比得到抗扰动稳定度得分价值指标。

步骤602，计算未标注的医学图像样本集U中每个医学图像样本的病灶目标置信度值；

在本实施例中，选择所示图7为一个实施例中计算病灶目标置信度的流程图，计算病灶目标置信度值，具体包括步骤702～704：

步骤702，根据所述病灶目标检测深度模型C，计算未标注的医学图像样本集U中每个医学图像样本中的病灶目标的目标检测框数量；

通过病灶目标检测深度模型C对每个医学图像样本进行检测，可以得到每个医学图像样本中的目标检测框数量，即前述已经经过初始化训练的病灶目标检测深度模型对医学图像样本中每个符合深度模型训练标注的病灶目标进行区域框选。

步骤704，根据每个医学图像样本中的目标检测框数量计算出病灶目标置信度值。

对于未标注医学图像样本中待检测目标的不确定性，是通过目标检测框数量的多少，即病灶目标在医学图像样本中预测的数量，而病灶目标在医学图像样本中预测的数量越多，表示样本的不确定性越高，则可认为该样本中包含更多的改良所述病灶目标检测深度模型C的性能的知识或信息。医学图像样本中各个阶段的置信度的目标检测框数量参见图8所示，图8为一个实施例中病灶目标置信度检测的样本目标检测框数量柱状图，该柱状图显示了0～1各个置信度区间中未标注医学图像样本的数量分布情况，如置信度为0～0.2区间的目标检测框确定为样本中的背景，置信度为0.3的目标检测框则不确定是样本的前景或背景，置信度为0.8～1区间的目标检测框确认为样本中的前景，将每个医学图像样本的不确定度指标定义为Unc(x,L,u)，其中，L代表已标注样本，u代表未标注样本，对于样本中目标的预测结果越接近0.5的样本，表示当前病灶目标检测深度模型对样本中目标的信息具有较高的不确定性，即样本需要进行标注的价值就越高。

步骤604，计算未标注的医学图像样本集U中每个医学图像样本的病灶目标实例抗扰动稳定度值；

在本实施例中，所示图9为一个实施例中计算病灶目标实例抗扰动稳定度值的流程图，具体包括步骤902～906：

步骤902，根据所述病灶目标检测深度模型C，采用Mask-RCNN模型中的RPN网络来生成未标注的医学图像样本集U中每个医学图像样本中包含病灶目标的区域；

步骤904，选取与病灶目标实例最接近的两个病灶目标区域；

在本实施例中，采用RPN网络生成医学图像样本中可能包含物体的区域候选框后，保留前N个最可能包含目标的区域，优选为与病灶目标实例最接近的两个最可能包含目标的区域。参见图10所示一个实施例中医学图像样本的目标实例检测图，通过RPN网络对两个医学图像样本101、102分别进行检测得到可能包含物体的两个最接近病灶目标实例的区域候选框，医学图像样本101包含两个最接近病灶目标实例区域1011的区域候选框1012、1013，而医学图像样本102则包含两个最接近病灶目标实例区域1021的区域候选框1022、1023。

步骤906，计算病灶目标实例与两个病灶目标区重叠的交集与并集的比值，作为病灶目标实例的抗扰动稳定度值。

在本实施例中，通过计算病灶目标实例与所述两个病灶目标区域重叠的交集与并集的比值，用于检测医学图像中目标实例的抗扰动稳定度指标IOU，如果抗扰动稳定度指标区间范围更大，则说明医学图像中目标实例的周围存在更多对于模型容易混淆的信息量，这对于主动学习算法来说，样本的标注价值就非常高。如图10中左图医学图像样本101的病灶目标实例候选框1011的最大分数为0.98，两个最接近的区域候选框1012和1023的分数分别为0.92和0.91，抗扰动稳定度指标IOU的区间为0.9～1，右图医学图像样本102的病灶目标实例候选框1021的最大分数为0.98，两个最接近的区域候选框1022和1023的分数分别为0.72和0.65，病灶目标实例候选框1021与区域候选框1022、1023的交集分别为0.4和0.3，其抗扰动稳定度指标IOU的区间为0.3～0.9，相比而言，图10中右图的医学图像样本102相比左图的医学图像样本101的抗扰动稳定度指标的区间范围更大，也就是右图医学图像样本102中的周围存在了更多容易被混淆的信息量，这些信息量能够给所述病灶目标检测深度模型C带来更多的学习内容，对于主动学习算法而言样本的价值更高。

步骤606，根据所述病灶目标置信度值和病灶目标实例抗扰动稳定度值，结合主动学习算法计算出样本标注价值。

在本实施例中，根据所述病灶目标置信度和病灶目标实例抗扰动稳定度，结合主动学习算法计算出样本标注价值包括如下步骤：

选取病灶目标置信度值为0.4～0.7之间的医学图像样本，表达为max Unc(x,L,u)，其中，L表示为已标注样本，u表示为未标注样本，x为选取的医学图像样本，Unc表示为置信度；

选取抗扰动稳定度值为0.3～0.9之间的医学图像样本，表达为IOU(x,L,u)，其中，L表示为已标注样本，u表示为未标注样本，x为选取的医学图像样本，IOU表示为抗扰动稳定度值；

通过主动学习算法公式max f(x,L,u)＝max Unc(x,L,u)*IOU(x,L,u)β修正计算出每个医学图像样本的标注价值max f(x,L,u)，其中，β是调解所述抗扰动稳定度值比重的参数。

图11为一个实施例中两个未标注医学图像样本图像示例图，左图示出的医学样本图像通过上述医学图像样本的预测计算，得到样本标注价值分为0.06分，而右图示出的医学样本图像通过上述医学图像样本的预测计算，得到样本标注价值得分为0.34，显然，右图示出的未标注医学图像样本更具有标注的价值，对于病灶目标检测深度模型C的训练提升更加有效。

步骤306，选取所述未标注医学图像样本集U中标注价值高的医学图像样本进行标注确认后，对当前的病灶目标检测深度模型C进行迭代更新；

在本实施例中，通过上述步骤得到未标注医学图像样本集U中标注价值高的医学图像样本，此处标注价值高的医学图像样本可根据经验值来确认，筛选出标注价值高的医学图像样本后，可由专家对选择的样本进行标注，将标注确认后的样本放入到训练样本集中，然后更新初始的病灶目标检测深度模型C，即实现了通过主动学习算法对病灶目标检测深度模型C进行更新的目的。

步骤308，根据迭代更新后的病灶目标检测深度模型C对新的医学图像病灶样本进行验证，直到病灶目标检测深度模型C的性能不能再继续标注新的样本时，则结束迭代更新。

图5为一个实施例中医学图像样本筛查方法的技术路线流程图，从初始已标注样本集L中学习首先训练出病灶目标检测深度模型C，然后从未标注的医学图像样本集U中抽取样本，通过病灶目标检测深度模型C对样本进行逐一预测计算，计算过程包括对医学图像样本进行目标置信度和目标实例抗扰动稳定度的计算，并对预测符合要求的样本进行智能筛选，综合样本的目标置信度和目标实例抗扰动稳定度得到主动学习算法的样本价值，最后，经过对样本价值高的样本进行标签的标注确认，经过标签标注确认的医学图像样本集合，作为训练样本更新初始的病灶目标检测深度模型C，在保证任务精度的基础上，有效减少了标注代价和工作量，最大化了医学图像样本的标注效率。

上述医学图像样本筛查方法在OCT影像病灶检测、CT影像脑出血检测两个任务上进行实验表明，方法能够仅用完整数据集的大约66％的样本量实现几乎同等的性能。相比一般情况下通过随机挑选的方法挑选样本，本申请方法融合深度学习和主动学习的手段能够基于深度模型良好的特征表达能力，从未标注的大量原始医学图像样本中，通过挑选高质量的样本标注，过滤质量较低的样本，不需要对所有的样本进行标注，每次的挑选都能够对改进提升模型最有价值的样本加入训练，大大提高了模型的效率。以OCT影像病灶检测为例，通过每次逐步添加1000张样本图像进行模型训练的结果对比可以发现，主动学习策略可以在筛选出的8000张样本进行标注后训练，达到与随机挑选12000张训练的模型精度。

如图12所示，在一个实施例中，提供了一种医学图像样本筛查装置的结构框图，该装置12可以集成于上述的计算机设备110中，具体可以包括病灶目标深度模型初始化单元1201、未标注医学图像样本标注价值预测单元1202、病灶目标检测深度模型迭代单元1203和模型迭代更新判断单元1204；

所述病灶目标检测深度模型初始化单元1201，用于选取当前医疗影像目标检测任务的初始已标注样本集L，利用Mask-RCNN模型对所述初始已标注样本集L进行模型训练，以获取当前医疗影像病灶目标检测的病灶目标检测深度模型C；

所述未标注医学图像样本标注价值预测单元1202，用于根据所述病灶目标检测深度模型C对未标注医学图像样本集U进行逐一预测，得到所述未标注医学图像样本集U中每个医学图像样本的预测结果，并根据预测结果判断每个医学图像样本的标注价值；

所述病灶目标检测深度模型迭代单元1203，用于选取所述未标注医学图像样本集U 中标注价值高的医学图像样本进行标注确认，根据选取的标注价值高的医学图像样本对当前的病灶目标检测深度模型C进行迭代更新；

所述模型迭代更新判断单元1204，用于根据迭代更新后的病灶目标检测深度模型C对新的医学图像病灶样本进行验证，如病灶目标检测深度模型C的性能不能再继续标注新的样本时结束迭代更新，否则所述病灶目标检测深度模型迭代单元继续根据新的样本进行迭代更新。

图13为一个实施例中未标注医学图像样本标注价值预测单元的结构框图。所述未标注医学图像样本标注价值预测单元13包括病灶目标置信度计算模块1301、病灶目标实例抗扰动稳定度计算模块1302和主动学习策略模块1303；

所述病灶目标置信度计算模块1301用于计算未标注的医学图像样本集U中每个医学图像样本的病灶目标置信度；

所述病灶目标实例抗扰动稳定度计算模块1302用于计算未标注的医学图像样本集U中每个医学图像样本的病灶目标实例抗扰动稳定度计算模块。

所述主动学习策略模块1303用于根据所述病灶目标置信度和病灶目标实例抗扰动稳定度，结合主动学习算法计算出所述未标注医学图像样本的标注价值。

在一个实施例中，提出了一种计算机设备，所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

在一个实施例中，根据所述初始病灶目标检测深度模型C对未标注的医学图像样本集U进行逐一预测，得到所述未标注医学图像样本集U中每个医学图像样本的预测结果，并根据预测结果判断每个医学图像样本的标注价值包括如下步骤：

计算未标注的医学图像样本集U中每个医学图像样本的病灶目标置信度值；

计算未标注的医学图像样本集U中每个医学图像样本的病灶目标实例抗扰动稳定度值；

根据所述病灶目标置信度值和病灶目标实例抗扰动稳定度值，结合主动学习算法计算出样本标注价值。

在一个实施例中，所述计算未标注的医学图像样本集U中每个医学图像样本的病灶目标置信度值包括如下步骤：

根据所述病灶目标检测深度模型C，计算未标注的医学图像样本集U中每个医学图像样本中的病灶目标的目标检测框数量；

根据每个医学图像样本中的目标检测框数量计算出病灶目标置信度值。

在一个实施例中，所述计算未标注的医学图像样本集U中每个医学图像样本的病灶目标实例抗扰动稳定度值包括如下步骤：

根据所述病灶目标检测深度模型C，采用Mask-RCNN模型中的RPN网络来生成未标注的医学图像样本集U中每个医学图像样本中包含病灶目标的区域；

选取与病灶目标实例最接近的两个病灶目标区域；

计算病灶目标实例与两个病灶目标区重叠的交集与并集的比值，作为病灶目标实例的抗扰动稳定度值。

在一个实施例中，根据所述病灶目标置信度和病灶目标实例抗扰动稳定度，结合主动学习算法计算出样本标注价值包括如下步骤：

在一个实施例中，提出了一种存储有计算机可读指令的存储介质，该计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：

选取与病灶目标实例最接近的两个病灶目标区域；

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。所述计算机可读存储介质可以是非易失性，也可以是易失性。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种医学图像样本筛查方法，其中，用于对未标注的医学图像样本进行智能筛查，包括如下步骤：

选取针对当前医疗影像病灶目标检测任务的初始已标注样本集L，利用Mask-RCNN模型对所述初始已标注样本集L进行模型训练，以获取当前医疗影像病灶目标检测的病灶目标检测深度模型C；

根据所述初始病灶目标检测深度模型C对未标注医学图像样本集U进行逐一预测，得到所述未标注医学图像样本集U中每个医学图像样本的预测结果，并根据预测结果判断每个医学图像样本的标注价值；

选取所述未标注医学图像样本集U中标注价值高的医学图像样本进行标注确认后，对当前的病灶目标检测深度模型C进行迭代更新；

根据迭代更新后的病灶目标检测深度模型C对新的医学图像病灶样本进行验证，直到病灶目标检测深度模型C的性能不能再继续标注新的样本时，则结束迭代更新。
如权利要求1所述的医学图像样本筛查方法，其中，根据所述初始病灶目标检测深度模型C对未标注的医学图像样本集U进行逐一预测，得到所述未标注医学图像样本集U中每个医学图像样本的预测结果，并根据预测结果判断每个医学图像样本的标注价值包括如下步骤：

计算未标注的医学图像样本集U中每个医学图像样本的病灶目标置信度值；

计算未标注的医学图像样本集U中每个医学图像样本的病灶目标实例抗扰动稳定度值；

根据所述病灶目标置信度值和病灶目标实例抗扰动稳定度值，结合主动学习算法计算出样本标注价值。
如权利要求2所述的医学图像样本筛查方法，其中，所述计算未标注的医学图像样本集U中每个医学图像样本的病灶目标置信度值包括如下步骤：

根据所述病灶目标检测深度模型C，计算未标注的医学图像样本集U中每个医学图像样本中的病灶目标的目标检测框数量；

根据每个医学图像样本中的目标检测框数量计算出病灶目标置信度值。
如权利要求3所述的医学图像样本筛查方法，其中，

所述未标注医学图像样本中待检测目标的不确定性，通过所述病灶目标在医学图像样本中预测的数量，其中，

病灶目标在医学图像样本中预测的数量越多，表示样本的不确定性越高。
如权利要求3所述的医学图像样本筛查方法，其中，所述计算未标注的医学图像样本集U中每个医学图像样本的病灶目标实例抗扰动稳定度值包括如下步骤：

根据所述病灶目标检测深度模型C，采用Mask-RCNN模型中的RPN网络来生成未标注的医学图像样本集U中每个医学图像样本中包含病灶目标的区域；

选取与病灶目标实例最接近的两个病灶目标区域；

计算病灶目标实例与两个病灶目标区重叠的交集与并集的比值，作为病灶目标实例的抗扰动稳定度值。
如权利要求5所述的医学图像样本筛查方法，其中，采用RPN网络生成医学图像样本中可能包含物体的区域候选框后，保留前N个最可能包含目标的区域，其中，与病灶目标实例最接近的两个最可能包含目标的区域。
如权利要求5所述的医学图像样本筛查方法，其中，通过计算所述病灶目标实例与所述两个病灶目标区域重叠的交集与并集的比值，用于检测医学图像中目标实例的抗扰动稳定度指标IOU。
如权利要求5所述的医学图像样本筛查方法，其中，根据所述病灶目标置信度和病灶目标实例抗扰动稳定度，结合主动学习算法计算出样本标注价值包括如下步骤：

选取病灶目标置信度值为0.4～0.7之间的医学图像样本，表达为max Unc(x,L,u)，其中，L表示为已标注样本，u表示为未标注样本，x为选取的医学图像样本，Unc表示为置信度；

选取抗扰动稳定度值为0.3～0.9之间的医学图像样本，表达为IOU(x,L,u)，其中，L表示为已标注样本，u表示为未标注样本，x为选取的医学图像样本，IOU表示为抗扰动稳定度值；

通过主动学习算法公式max f(x,L,u)＝max Unc(x,L,u)*IOU(x,L,u)β修正计算出每个医学图像样本的标注价值max f(x,L,u)，其中，β是调解所述抗扰动稳定度值比重的参数。
如权利要求1所述的医学图像样本筛查方法，其中，所述选取所述未标注医学图像样本集U中标注价值高的医学图像样本进行标注确认后，对当前的病灶目标检测深度模型C进行迭代更新包括如下步骤：

选取所述未标注医学图像样本集U中标注价值高的医学图像样本，并进行标注确认；

将标注确认后的样本放入到训练样本集中；

通过主动学习算法对病灶目标检测深度模型C进行更新。
一种医学图像样本筛查装置，其中，所述装置包括病灶目标深度模型初始化单元、未标注医学图像样本标注价值预测单元、病灶目标检测深度模型迭代单元和模型迭代更新判断单元；

所述病灶目标检测深度模型初始化单元，用于选取当前医疗影像目标检测任务的初始已标注样本集L，利用Mask-RCNN模型对所述初始已标注样本集L进行模型训练，以获取当前医疗影像病灶目标检测的病灶目标检测深度模型C；

所述未标注医学图像样本标注价值预测单元，用于根据所述病灶目标检测深度模型C对未标注医学图像样本集U进行逐一预测，得到所述未标注医学图像样本集U中每个医学图像样本的预测结果，并根据预测结果判断每个医学图像样本的标注价值；

所述病灶目标检测深度模型迭代单元，用于选取所述未标注医学图像样本集U中标注价值高的医学图像样本进行标注确认，根据选取的标注价值高的医学图像样本对当前的病灶目标检测深度模型C进行迭代更新；

所述模型迭代更新判断单元，用于根据迭代更新后的病灶目标检测深度模型C对新的医学图像病灶样本进行验证，如病灶目标检测深度模型C的性能不能再继续标注新的样本时结束迭代更新，否则所述病灶目标检测深度模型迭代单元继续根据新的样本进行迭代更新。
一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行如下步骤：

选取针对当前医疗影像病灶目标检测任务的初始已标注样本集L，利用Mask-RCNN模型对所述初始已标注样本集L进行模型训练，以获取当前医疗影像病灶目标检测的病灶目标检测深度模型C；

根据所述初始病灶目标检测深度模型C对未标注医学图像样本集U进行逐一预测，得到所述未标注医学图像样本集U中每个医学图像样本的预测结果，并根据预测结果判断每个医学图像样本的标注价值；

选取所述未标注医学图像样本集U中标注价值高的医学图像样本进行标注确认后，对当前的病灶目标检测深度模型C进行迭代更新；

根据迭代更新后的病灶目标检测深度模型C对新的医学图像病灶样本进行验证，直到病灶目标检测深度模型C的性能不能再继续标注新的样本时，则结束迭代更新。
如权利要求11所述的计算机设备，其中，根据所述初始病灶目标检测深度模型C对未标注的医学图像样本集U进行逐一预测，得到所述未标注医学图像样本集U中每个医学图像样本的预测结果，并根据预测结果判断每个医学图像样本的标注价值包括如下步骤：

计算未标注的医学图像样本集U中每个医学图像样本的病灶目标置信度值；

计算未标注的医学图像样本集U中每个医学图像样本的病灶目标实例抗扰动稳定度值；

根据所述病灶目标置信度值和病灶目标实例抗扰动稳定度值，结合主动学习算法计算出样本标注价值。
如权利要求12所述的计算机设备，其中，所述计算未标注的医学图像样本集U中每个医学图像样本的病灶目标置信度值包括如下步骤：

根据所述病灶目标检测深度模型C，计算未标注的医学图像样本集U中每个医学图像样本中的病灶目标的目标检测框数量；

根据每个医学图像样本中的目标检测框数量计算出病灶目标置信度值。
如权利要求13所述的计算机设备，其中，所述未标注医学图像样本中待检测目标的不确定性，通过所述病灶目标在医学图像样本中预测的数量，

其中，病灶目标在医学图像样本中预测的数量越多，表示样本的不确定性越高。
如权利要求13所述的计算机设备，其中，所述计算未标注的医学图像样本集U中每个医学图像样本的病灶目标实例抗扰动稳定度值包括如下步骤：

根据所述病灶目标检测深度模型C，采用Mask-RCNN模型中的RPN网络来生成未标注的医学图像样本集U中每个医学图像样本中包含病灶目标的区域；

选取与病灶目标实例最接近的两个病灶目标区域；

计算病灶目标实例与两个病灶目标区重叠的交集与并集的比值，作为病灶目标实例的抗扰动稳定度值。
如权利要求15所述的计算机设备，其中，采用RPN网络生成医学图像样本中可能包含物体的区域候选框后，保留前N个最可能包含目标的区域，其中，与病灶目标实例最接近的两个最可能包含目标的区域。
如权利要求15所述的计算机设备，其中，通过计算所述病灶目标实例与所述两个病灶目标区域重叠的交集与并集的比值，用于检测医学图像中目标实例的抗扰动稳定度指标IOU。
如权利要求15所述的计算机设备，其中，根据所述病灶目标置信度和病灶目标实例抗扰动稳定度，结合主动学习算法计算出样本标注价值包括如下步骤：

选取病灶目标置信度值为0.4～0.7之间的医学图像样本，表达为max Unc(x,L,u)，其中，L表示为已标注样本，u表示为未标注样本，x为选取的医学图像样本，Unc表示为置信度；

选取抗扰动稳定度值为0.3～0.9之间的医学图像样本，表达为IOU(x,L,u)，其中，L表示为已标注样本，u表示为未标注样本，x为选取的医学图像样本，IOU表示为抗扰动稳定度值；

通过主动学习算法公式max f(x,L,u)＝max Unc(x,L,u)*IOU(x,L,u)β修正计算出每个医学图像样本的标注价值max f(x,L,u)，其中，β是调解所述抗扰动稳定度值比重的参数。
如权利要求11所述的计算机设备，其中，所述选取所述未标注医学图像样本集U中标注价值高的医学图像样本进行标注确认后，对当前的病灶目标检测深度模型C进行迭代更新包括如下步骤：

选取所述未标注医学图像样本集U中标注价值高的医学图像样本，并进行标注确认；

将标注确认后的样本放入到训练样本集中；

通过主动学习算法对病灶目标检测深度模型C进行更新。
一种存储有计算机可读指令的存储介质，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行如权利要求1至9中任一项权利要求所述医学图像样本筛查方法的步骤。