WO2021135330A1

WO2021135330A1 - 图像样本选择方法及相关设备

Info

Publication number: WO2021135330A1
Application number: PCT/CN2020/112238
Authority: WO
Inventors: 王俊; 高鹏
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-07-28
Filing date: 2020-08-28
Publication date: 2021-07-08
Also published as: US11972601B2; JP7288088B2; US20220230417A1; CN111860508A; JP2022534712A

Abstract

本申请涉及人工智能技术领域，提供一种图像样本选择方法及相关设备。所述图像样本选择方法用多个第一图像样本训练实例分割模型；用多个第三图像样本训练得分预测模型；基于得分预测模型计算多个第二图像样本的信息量得分；计算多个第二图像样本的特征向量；根据多个第二图像样本的特征向量对多个第二图像样本进行聚类，得到多个第二图像样本的多个样本簇；根据多个第二图像样本的信息量得分和多个样本簇从多个第二图像样本中选取多个目标图像样本。本申请从待标注图像样本中选择目标图像样本，提升样本选择的准确性。

Description

图像样本选择方法及相关设备

本申请要求于2020年07月28日提交中国专利局，申请号为202010739700.8申请名称为“图像样本选择方法及相关设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，具体涉及一种图像样本选择方法、装置、计算机设备及计算机可读存储介质。

背景技术

在人工智能技术领域中，经常需要从图像中识别实例。例如，从教学图像中识别出老师、学生、书桌等。再如，从医疗图像中识别出病灶(病变区域)。

可以使用标注后的图像样本训练实例分割模型，通过训练后的实例分割模型识别图像中的实例。图像样本的标识需要由专业人员进行。然而，发明人发现，如果选取的图像样本不适合，即使标注人员很有经验，实例分割模型的训练效果也会不好。

如何准确选取训练效果好的图像样本供专业人员进行标注，成为待解决的问题。

发明内容

鉴于以上内容，有必要提出一种图像样本选择方法、装置、计算机设备及计算机可读存储介质，其可以从待标注图像样本中选择目标图像样本。

本申请的第一方面提供一种图像样本选择方法，所述图像样本选择方法包括：

获取实例标注后的多个第一图像样本、待实例标注的多个第二图像样本和得分标注后的多个第三图像样本；

构建实例分割模型，所述实例分割模型包括第一FPN主干网络、第一区域生成网络和三分支网络；

用所述多个第一图像样本训练所述实例分割模型；

构建得分预测模型，所述得分预测模型包括与所述第一FPN主干网络共享参数和网络结构的第二FPN主干网络、与所述第一区域生成网络共享参数和网络结构的第二区域生成网络、得分预测网络；

用所述多个第三图像样本训练所述得分预测模型；

基于所述得分预测模型计算所述多个第二图像样本的信息量得分；

计算所述多个第二图像样本的特征向量；

根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类，得到所述多个第二图像样本的多个样本簇；

根据所述多个第二图像样本的信息量得分和多个样本簇从所述多个第二图像样本中选取多个目标图像样本。

本申请的第二方面提供一种图像样本选择装置，所述图像样本选择装置包括：

获取模块，用于获取实例标注后的多个第一图像样本、待实例标注的多个第二图像样本和得分标注后的多个第三图像样本；

第一构建模块，用于构建实例分割模型，所述实例分割模型包括第一FPN主干网络、第一区域生成网络和三分支网络；

第一训练模块，用于用所述多个第一图像样本训练所述实例分割模型；

第二构建模块，用于构建得分预测模型，所述得分预测模型包括与所述第一FPN主干网络共享参数和网络结构的第二FPN主干网络、与所述第一区域生成网络共享参数和网络结构的第二区域生成网络、得分预测网络；

第二训练模块，用于用所述多个第三图像样本训练所述得分预测模型；

第一计算模块，用于基于所述得分预测模型计算所述多个第二图像样本的信息量得分；

第二计算模块，用于计算所述多个第二图像样本的特征向量；

聚类模块，用于根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类，得到所述多个第二图像样本的多个样本簇；

选取模块，用于根据所述多个第二图像样本的信息量得分和多个样本簇从所述多个第二图像样本中选取多个目标图像样本。

本申请的第三方面提供一种计算机设备，所述计算机设备包括处理器，所述处理器用于执行存储器中存储的计算机可读指令以实现以下步骤：

用所述多个第一图像样本训练所述实例分割模型；

用所述多个第三图像样本训练所述得分预测模型；

计算所述多个第二图像样本的特征向量；

本申请的第四方面提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现以下步骤：

用所述多个第一图像样本训练所述实例分割模型；

用所述多个第三图像样本训练所述得分预测模型；

计算所述多个第二图像样本的特征向量；

本申请获取实例标注后的多个第一图像样本、待实例标注的多个第二图像样本和得分标注后的多个第三图像样本；构建实例分割模型，所述实例分割模型包括第一FPN主干网络、第一区域生成网络和三分支网络；用所述多个第一图像样本训练所述实例分割模型；构建得分预测模型，所述得分预测模型包括与所述第一FPN主干网络共享参数和网络结构的第二FPN主干网络、与所述第一区域生成网络共享参数和网络结构的第二区域生成网络、得分预测网络；用所述多个第三图像样本训练所述得分预测模型；基于所述得分预测模型计算所述多个第二图像样本的信息量得分；计算所述多个第二图像样本的特征向量；根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类，得到所述多个第二图像样本的多个样本簇；根据所述多个第二图像样本的信息量得分和多个样本簇从所述多个第二图像样本中选取多个目标图像样本。本申请从待标注图像样本中选择目标图像样本，提升样本选择的准确性。

附图说明

图1是本申请实施例提供的图像样本选择方法的流程图。

图2是本申请实施例提供的图像样本选择装置的结构图。

图3是本申请实施例提供的计算机设备的示意图。

具体实施方式

为了能够更清楚地理解本申请的上述目的、特征和优点，下面结合附图和具体实施例对本申请进行详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本申请，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请。

优选地，本申请的图像样本选择方法应用在一个或者多个计算机设备中。所述计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

本申请可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

实施例一

图1是本申请实施例一提供的图像样本选择方法的流程图。所述图像样本选择方法应用于计算机设备，用于从待标注图像样本中选择目标图像样本。

所述图像样本选择方法具体包括以下步骤，根据不同的需求，该流程图中步骤的顺序可以改变，某些可以省略。

101，获取实例标注后的多个第一图像样本、待实例标注的多个第二图像样本和得分标注后的多个第三图像样本。

可以从数据库读取所述多个第一图像样本、所述多个第二图像样本、所述第三图像样本；

可以接收用户上传的所述多个第一图像样本、所述多个第二图像样本、所述第三图像样本。

所述多个第一图像样本的数量较少，且没有对标注前的多个第一图像样本进行选取。将所述多个第一图像样本用于预训练时，需要较大数量的多个第一图像样本才能达到预期训练效果。

实例标注需要标注者标注第一图像样本的标注类型、标注框、标注掩膜。

得分标注需要标注者标注第三图像样本的分类标注分、框标注分、掩膜标注分、实例数量标注分。实例数量标注分是第三图像样本中实例的数量。

102，构建实例分割模型，所述实例分割模型包括第一FPN主干网络、第一区域生成网络和三分支网络。

FPN(特征金字塔网络，feature pyramid networks)包括自下至上子网络或自上至下子网络。所述第一FPN主干网络的自下至上子网络用于对图像进行特征提取，得到多个不同特征层次的图像特征表示。所述第一FPN主干网络的自下至上子网络用于结合所述多个不同特征层次的图像特征表示计算图像的特征表示。

所述第一区域生成网络包括RPN网络、RoIAlign网络等，用于生成图像的感兴趣区域。

103，用所述多个第一图像样本训练所述实例分割模型。

在一具体实施例中，所述用所述多个第一图像样本训练所述实例分割模型包括：

对于所述多个第一图像样本中的每个第一图像样本，将所述第一图像样本输入所述第一FPN主干网络，通过所述第一FPN主干网络计算所述第一图像样本的特征表示；

将所述第一图像样本的特征表示输入所述第一区域生成网络，通过所述第一区域生成网络生成所述第一图像样本的感兴趣区域；

将所述第一图像样本的感兴趣区域输入所述三分支网络，通过所述三分支网络对所述第一图像样本的感兴趣区域进行实例分割，得到第一图像样本的实例类型、实例框和实例掩膜；

基于反向传播算法根据所述第一图像样本的实例类型与标注类型、所述第一图像样本的实例框与标注框、所述第一图像样本的实例掩膜与标注掩膜的差值对所述实例分割模型的参数进行优化。

在一具体实施例中，所述通过所述第一FPN主干网络计算所述第一图像样本的特征表示包括：

基于所述第一FPN主干网络的自下至上子网络计算所述第一图像样本的中间特征表示，依计算先后顺序，所述第一图像样本的中间特征表示包括第一子中间特征、第二子中间特征、第三子中间特征、第四子中间特征；

基于所述第一FPN主干网络的自上至下子网络，对所述第四子中间特征进行降维计算，得到第四子特征；

根据所述第三子中间特征的尺寸对所述第四子特征进行上采样计算，对所述第三子中间特征和上采样后的第四子特征进行单位加计算，得到第三子特征；

根据所述第二子中间特征的尺寸对所述第三子特征进行上采样计算，对所述第二子中间特征和上采样后的第三子特征进行单位加计算，得到第二子特征；

根据所述第一子中间特征的尺寸对所述第二子特征进行上采样计算，对所述第一子中间特征和上采样后的第二子特征进行单位加计算，得到第一子特征，组合所述第四子特征、所述第三子特征、所述第二子特征、所述第一子特征，得到所述第一图像样本的特征表示。

所述通过所述第一区域生成网络生成所述第一图像样本的感兴趣区域包括：

基于RPN网络生成所述第一图像样本的多个中间感兴趣区域；基于RoIAlign网络对所述第一图像样本的每个中间感兴趣区域进行双线性插值计算，以统一所述第一图像样本的多个中间感兴趣区域的大小。

RPN网络可以专用于推荐候选区域，是一种全卷积神经网络。

在一具体实施例中，所述通过所述三分支网络对所述第一图像样本的感兴趣区域进行实例分割包括：

通过所述三分支网络中的第一RCNN分支对所述第一图像样本的感兴趣区域进行编码计算，得到所述实例类型；

通过所述三分支网络中的第二RCNN分支对所述第一图像样本的感兴趣区域进行编码计算，得到所述实例框，所述第一RCNN分支与所述第二RCNN分支具有同一个RCNN结构；

通过所述三分支网络中的掩膜分支对所述第一图像样本的感兴趣区域进行编码计算，得到所述实例掩膜。

所述同一个RCNN结构可以包括全连接结构和卷积结构。所述第一RCNN分支还包括用于实例分类的第一全连接结构；所述第二RCNN分支还包括用于实例框分类的第二全连接结构。

104，构建得分预测模型，所述得分预测模型包括与所述第一FPN主干网络共享参数和网络结构的第二FPN主干网络、与所述第一区域生成网络共享参数和网络结构的第二区域生成网络、得分预测网络。

所述得分预测模型包括与所述第一FPN主干网络共享参数和网络结构的第二FPN主干网络、与所述第一区域生成网络共享参数和网络结构的第二区域生成网络，即所述第一FPN主干网络和所述第一区域生成网络的参数发生变化时，变化后的参数会更新至所述第二FPN主干网络和所述第二区域生成网络。

105，用所述多个第三图像样本训练所述得分预测模型。

在一具体实施例中，所述用所述多个第三图像样本训练所述得分预测模型包括：

对于所述多个第三图像样本中的每个第三图像样本，将所述第三图像样本输入所述第二FPN主干网络，通过所述第二FPN主干网络计算所述第三图像样本的特征表示；

将所述第三图像样本的特征表示输入所述第二区域生成网络，通过所述第二区域生成网络生成所述第三图像样本的感兴趣区域；

将所述第三图像样本的感兴趣区域输入所述得分预测网络，通过所述得分预测网络对所述第三图像样本的感兴趣区域进行得分预测，得到分类得分、框得分、掩膜得分和实例数量得分，所述第三图像样本包括所述第三图像样本的感兴趣区域的分类标注分、框标注分、掩膜标注分、实例数量标注分；

基于反向传播算法根据所述分类得分与所述分类标注分、所述框得分与所述框标注分、所述掩膜得分与所述掩膜标注分、所述实例数量得分与实例数量标注分的差值对所述得分预测网络的参数进行优化。

所述得分预测网络可以包括分类得分预测子网络、框得分预测子网络、掩膜得分预测子网络、实例数量得分预测子网络。所述分类得分预测子网络、所述框得分预测子网络、所述掩膜得分预测子网络分别包括全连接结构和卷积结构。所述实例数量得分预测子网络包括卷积结构。具体地，所述框得分预测子网络包括两个全连接层和一个卷积层，所述掩膜得分预测子网络包括两个全连接层和一个卷积层。所述实例数量得分预测子网络包括一个卷积层。

所述分类得分预测子网络用于确定所述实例分割模型预测所述第三图像样本的实例类型的不确定性；所述框得分预测子网络用于确定所述实例分割模型预测所述第三图像样本的实例框的不确定性；所述掩膜得分预测子网络用于确定所述实例分割模型预测所述第三图像样本的实例掩膜的不确定性；所述实例数量得分预测子网络用于预测所述第三图像样本的实例数量。

106，基于所述得分预测模型计算所述多个第二图像样本的信息量得分。

在一具体实施例中，所述基于所述得分预测模型计算所述多个第二图像样本的信息量得分包括：

对于所述多个第二图像样本中的每个第二图像样本，通过所述得分预测模型计算所述第二图像样本中的多个实例的分类得分、框得分、掩膜得分和实例数量得分；

根据所述第二图像样本中的每个实例的分类得分、框得分、掩膜得分和实例数量得分计算所述第二图像样本的每个实施例的信息量子得分；

计算所述第二图像样本的所有信息量子得分的平均值，得到所述第二图像样本的信息量得分。

当所述实例分割模型输出所述第二图像样本的实例类型的预测概率时，置信度越低，所述第二图像样本的分类得分越高。当所述实例分割模型输出所述第二图像样本的实例框时，计算所述第二图像样本的实例框的IOU值，所述第二图像样本的实例框的IOU值越小，所述第二图像样本的框得分越高。当所述实例分割模型输出所述第二图像样本的实例掩膜时，计算所述第二图像样本的实例掩膜的Jaccard值，所述第二图像样本的实例掩膜的Jaccard值越大，所述第二图像样本的掩膜得分越高。当所述得分预测模型输出所述第二图像样本的实例数量标注分的预测概率时，置信度越低，所述第二图像样本的实例数量得分越高。

107，计算所述多个第二图像样本的特征向量。

在一具体实施例中，所述计算所述多个第二图像样本的特征向量包括：

通过所述第二FPN主干网络计算所述第二图像样本的特征表示，所述第二图像样本的特征表示包括多个子特征表示；

对所述第二图像样本的多个子特征表示进行全局平均池化，得到池化后的多个子特征表示；

对所述池化后的多个子特征表示进行拼接；

将拼接后的多个子特征表示转化为所述特征向量。

108，根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类，得到所述多个第二图像样本的多个样本簇。

在一具体实施例中，所述根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类包括：

基于混合高斯模型根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类；或

基于K均值模型根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类。

在一具体实施例中，所述基于混合高斯模型根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类包括：

对所述多个第二图像样本的特征向量进行归一化，得到多个目标特征向量；

初始化高斯参数，所述高斯参数包括均值向量、协方差矩阵、混合系数；

基于EM算法计算所述高斯参数；

根据所述高斯参数确定所述多个第二图像样本的多个样本簇。

109，根据所述多个第二图像样本的信息量得分和多个样本簇从所述多个第二图像样本中选取多个目标图像样本。

在一具体实施例中，所述根据所述多个第二图像样本的信息量得分和多个样本簇从所述多个第二图像样本中选取多个目标图像样本包括：

获取预设数量；

对于所述多个样本簇中的每个样本簇，基于信息量得分对所述样本簇中的第二图像样本进行从高到低排序；

从所述样本簇中依信息量得分从高到低的顺序选取预设数量个第二图像样本。

实施例一的图像样本选择方法获取实例标注后的多个第一图像样本、待实例标注的多个第二图像样本和得分标注后的多个第三图像样本；构建实例分割模型，所述实例分割模型包括第一FPN主干网络、第一区域生成网络和三分支网络；用所述多个第一图像样本训练所述实例分割模型；构建得分预测模型，所述得分预测模型包括与所述第一FPN主干网络共享参数和网络结构的第二FPN主干网络、与所述第一区域生成网络共享参数和网络结构的第二区域生成网络、得分预测网络；用所述多个第三图像样本训练所述得分预测模型；基于所述得分预测模型计算所述多个第二图像样本的信息量得分；计算所述多个第二图像样本的特征向量；根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类，得到所述多个第二图像样本的多个样本簇；根据所述多个第二图像样本的信息量得分和多个样本簇从所述多个第二图像样本中选取多个目标图像样本。实施例一从待标注图像样本中选择目标图像样本，提升样本选择的准确性。

在另一实施例中，所述图像样本选择方法还包括：

接收用户对所述多个目标图像样本的标注，得到多个标注后的目标图像样本；

用所述多个标注后的目标图像样本训练所述实例分割模型。

实施例二

图2是本申请实施例二提供的图像样本选择装置的结构图。所述图像样本选择装置20应用于计算机设备。所述图像样本选择装置20用于从待标注图像样本中选择目标图像样本，提升样本选择的准确性。

如图2所示，所述图像样本选择装置20可以包括获取模块201、第一构建模块202、第一训练模块203、第二构建模块204、第二训练模块205、第一计算模块206、第二计算模块207、聚类模块208、选取模块209。

获取模块201，用于获取实例标注后的多个第一图像样本、待实例标注的多个第二图像样本和得分标注后的多个第三图像样本。

第一构建模块202，用于构建实例分割模型，所述实例分割模型包括第一FPN主干网络、第一区域生成网络和三分支网络。

第一训练模块203，用于用所述多个第一图像样本训练所述实例分割模型。

RPN网络可以专用于推荐候选区域，是一种全卷积神经网络。

第二构建模块204，用于构建得分预测模型，所述得分预测模型包括与所述第一FPN主干网络共享参数和网络结构的第二FPN主干网络、与所述第一区域生成网络共享参数和网络结构的第二区域生成网络、得分预测网络。

第二训练模块205，用于用所述多个第三图像样本训练所述得分预测模型。

第一计算模块206，用于基于所述得分预测模型计算所述多个第二图像样本的信息量得分。

第二计算模块207，用于计算所述多个第二图像样本的特征向量。

对所述池化后的多个子特征表示进行拼接；

将拼接后的多个子特征表示转化为所述特征向量。

聚类模块208，用于根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类，得到所述多个第二图像样本的多个样本簇。

基于EM算法计算所述高斯参数；

选取模块209，用于根据所述多个第二图像样本的信息量得分和多个样本簇从所述多个第二图像样本中选取多个目标图像样本。

获取预设数量；

实施例二的图像样本选择装置20获取实例标注后的多个第一图像样本、待实例标注的多个第二图像样本和得分标注后的多个第三图像样本；构建实例分割模型，所述实例分割模型包括第一FPN主干网络、第一区域生成网络和三分支网络；用所述多个第一图像样本训练所述实例分割模型；构建得分预测模型，所述得分预测模型包括与所述第一FPN主干网络共享参数和网络结构的第二FPN主干网络、与所述第一区域生成网络共享参数和网络结构的第二区域生成网络、得分预测网络；用所述多个第三图像样本训练所述得分预测模型；基于所述得分预测模型计算所述多个第二图像样本的信息量得分；计算所述多个第二图像样本的特征向量；根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类，得到所述多个第二图像样本的多个样本簇；根据所述多个第二图像样本的信息量得分和多个样本簇从所述多个第二图像样本中选取多个目标图像样本。实施例二从待标注图像样本中选择目标图像样本，提升样本选择的准确性。

在另一实施例中，所述第一训练模块还用于接收用户对所述多个目标图像样本的标注，得到多个标注后的目标图像样本；

用所述多个标注后的目标图像样本训练所述实例分割模型。

实施例三

本实施例提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机可读指令，所述计算机可读存储介质可以是非易失性，也可以是易失性。该计算机可读指令被处理器执行时实现上述图像样本选择方法实施例中的步骤，例如图1所示的步骤101-109：

101，获取实例标注后的多个第一图像样本、待实例标注的多个第二图像样本和得分标注后的多个第三图像样本；

102，构建实例分割模型，所述实例分割模型包括第一FPN主干网络、第一区域生成网络和三分支网络；

103，用所述多个第一图像样本训练所述实例分割模型；

104，构建得分预测模型，所述得分预测模型包括与所述第一FPN主干网络共享参数和网络结构的第二FPN主干网络、与所述第一区域生成网络共享参数和网络结构的第二区域生成网络、得分预测网络；

105，用所述多个第三图像样本训练所述得分预测模型；

106，基于所述得分预测模型计算所述多个第二图像样本的信息量得分；

107，计算所述多个第二图像样本的特征向量；

108，根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类，得到所述多个第二图像样本的多个样本簇；

或者，该计算机可读指令被处理器执行时实现上述装置实施例中各模块的功能，例如图2中的模块201-209：

获取模块201，用于获取实例标注后的多个第一图像样本、待实例标注的多个第二图像样本和得分标注后的多个第三图像样本；

第一构建模块202，用于构建实例分割模型，所述实例分割模型包括第一FPN主干网络、第一区域生成网络和三分支网络；

第一训练模块203，用于用所述多个第一图像样本训练所述实例分割模型；

第二构建模块204，用于构建得分预测模型，所述得分预测模型包括与所述第一FPN主干网络共享参数和网络结构的第二FPN主干网络、与所述第一区域生成网络共享参数和网络结构的第二区域生成网络、得分预测网络；

第二训练模块205，用于用所述多个第三图像样本训练所述得分预测模型；

第一计算模块206，用于基于所述得分预测模型计算所述多个第二图像样本的信息量得分；

第二计算模块207，用于计算所述多个第二图像样本的特征向量；

聚类模块208，用于根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类，得到所述多个第二图像样本的多个样本簇；

实施例四

图3为本申请实施例四提供的计算机设备的示意图。所述计算机设备30包括存储器301、处理器302以及存储在所述存储器301中并可在所述处理器302上运行的计算机可读指令303，例如图像样本选择程序。所述处理器302执行所述计算机可读指令303时实现上述图像样本选择方法实施例中的步骤，例如图1所示的步骤101-109：

103，用所述多个第一图像样本训练所述实例分割模型；

105，用所述多个第三图像样本训练所述得分预测模型；

107，计算所述多个第二图像样本的特征向量；

示例性的，所述计算机可读指令303可以被分割成一个或多个模块，所述一个或者多个模块被存储在所述存储器301中，并由所述处理器302执行，以完成本方法。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机可读指令303在所述计算机设备30中的执行过程。例如，所述计算机可读指令303可以被分割成图2中的获取模块201、第一构建模块202、第一训练模块203、第二构建模块204、第二训练模块205、第一计算模块206、第二计算模块207、聚类模块208、选取模块209，各模块具体功能参见实施例二。

所述计算机设备30可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。本领域技术人员可以理解，所述示意图3仅仅是计算机设备30的示例，并不构成对计算机设备30的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述计算机设备30还可以包括输入输出设备、网络接入设备、总线等。

所称处理器302可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array， FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器302也可以是任何常规的处理器等，所述处理器302是所述计算机设备30的控制中心，利用各种接口和线路连接整个计算机设备30的各个部分。

所述存储器301可用于存储所述计算机可读指令303，所述处理器302通过运行或执行存储在所述存储器301内的计算机可读指令或模块，以及调用存储在存储器301内的数据，实现所述计算机设备30的各种功能。所述存储器301可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据计算机设备30的使用所创建的数据等。此外，存储器301可以包括硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)或其他非易失性/易失性存储器件。

所述计算机设备30集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是非易失性，也可以是易失性。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，也可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一计算机可读存储介质中，该计算机可读指令在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机可读指令可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括：能够携带所述计算机可读指令的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、只读存储器(ROM)、随机存取存储器(RAM)。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

上述以软件功能模块的形式实现的集成的模块，可以存储在一个计算机可读存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施例所述图像样本选择方法的部分步骤。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其他的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他模块或步骤，单数不排除复数。系统权利要求中陈述的多个模块或装置也可以由一个模块或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本申请的技术方案而非限制，尽管参照较佳实施例对本申请进行了详细说明，本领域的普通技术人员应当理解，可以对本申请的技术方案进行修改或等同替换，而不脱离本申请技术方案的精神和范围。

Claims

一种图像样本选择方法，其中，所述图像样本选择方法包括：

获取实例标注后的多个第一图像样本、待实例标注的多个第二图像样本和得分标注后的多个第三图像样本；

构建实例分割模型，所述实例分割模型包括第一FPN主干网络、第一区域生成网络和三分支网络；

用所述多个第一图像样本训练所述实例分割模型；

构建得分预测模型，所述得分预测模型包括与所述第一FPN主干网络共享参数和网络结构的第二FPN主干网络、与所述第一区域生成网络共享参数和网络结构的第二区域生成网络、得分预测网络；

用所述多个第三图像样本训练所述得分预测模型；

基于所述得分预测模型计算所述多个第二图像样本的信息量得分；

计算所述多个第二图像样本的特征向量；

根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类，得到所述多个第二图像样本的多个样本簇；

根据所述多个第二图像样本的信息量得分和多个样本簇从所述多个第二图像样本中选取多个目标图像样本。
如权利要求1所述的图像样本选择方法，其中，所述用所述多个第一图像样本训练所述实例分割模型包括：

对于所述多个第一图像样本中的每个第一图像样本，将所述第一图像样本输入所述第一FPN主干网络，通过所述第一FPN主干网络计算所述第一图像样本的特征表示；

将所述第一图像样本的特征表示输入所述第一区域生成网络，通过所述第一区域生成网络生成所述第一图像样本的感兴趣区域；

将所述第一图像样本的感兴趣区域输入所述三分支网络，通过所述三分支网络对所述第一图像样本的感兴趣区域进行实例分割，得到第一图像样本的实例类型、实例框和实例掩膜；

基于反向传播算法根据所述第一图像样本的实例类型与标注类型、所述第一图像样本的实例框与标注框、所述第一图像样本的实例掩膜与标注掩膜的差值对所述实例分割模型的参数进行优化。
如权利要求2所述的图像样本选择方法，其中，所述通过所述第一FPN主干网络计算所述第一图像样本的特征表示包括：

基于所述第一FPN主干网络的自下至上子网络计算所述第一图像样本的中间特征表示，依计算先后顺序，所述第一图像样本的中间特征表示包括第一子中间特征、第二子中间特征、第三子中间特征、第四子中间特征；

基于所述第一FPN主干网络的自上至下子网络，对所述第四子中间特征进行降维计算，得到第四子特征；

根据所述第三子中间特征的尺寸对所述第四子特征进行上采样计算，对所述第三子中间特征和上采样后的第四子特征进行单位加计算，得到第三子特征；

根据所述第二子中间特征的尺寸对所述第三子特征进行上采样计算，对所述第二子中间特征和上采样后的第三子特征进行单位加计算，得到第二子特征；

根据所述第一子中间特征的尺寸对所述第二子特征进行上采样计算，对所述第一子中间特征和上采样后的第二子特征进行单位加计算，得到第一子特征，组合所述第四子特征、所述第三子特征、所述第二子特征、所述第一子特征，得到所述第一图像样本的特征表示。
如权利要求2所述的图像样本选择方法，其中，所述三分支网络包括第一RCNN分支、第二RCNN分支和掩膜分支，所述通过所述三分支网络对所述第一图像样本的感兴趣区域进行实例分割包括：

通过所述第一RCNN分支对所述第一图像样本的感兴趣区域进行编码计算，得到所述实例类型；

通过所述第二RCNN分支对所述第一图像样本的感兴趣区域进行编码计算，得到所述实例框，所述第一RCNN分支与所述第二RCNN分支具有同一个RCNN结构；

通过所述掩膜分支对所述第一图像样本的感兴趣区域进行编码计算，得到所述实例掩膜。
如权利要求1所述的图像样本选择方法，其中，所述用所述多个第三图像样本训练所述得分预测模型包括：

对于所述多个第三图像样本中的每个第三图像样本，将所述第三图像样本输入所述第二FPN主干网络，通过所述第二FPN主干网络计算所述第三图像样本的特征表示；

将所述第三图像样本的特征表示输入所述第二区域生成网络，通过所述第二区域生成网络生成所述第三图像样本的感兴趣区域；

将所述第三图像样本的感兴趣区域输入所述得分预测网络，通过所述得分预测网络对所述第三图像样本的感兴趣区域进行得分预测，得到分类得分、框得分、掩膜得分和实例数量得分，所述第三图像样本包括所述第三图像样本的感兴趣区域的分类标注分、框标注分、掩膜标注分、实例数量标注分；

基于反向传播算法根据所述分类得分与所述分类标注分、所述框得分与所述框标注分、所述掩膜得分与所述掩膜标注分、所述实例数量得分与实例数量标注分的差值对所述得分预测网络的参数进行优化。
如权利要求1所述的图像样本选择方法，其中，所述基于所述得分预测模型计算所述多个第二图像样本的信息量得分包括：

对于所述多个第二图像样本中的每个第二图像样本，通过所述得分预测模型计算所述第二图像样本中的多个实例的分类得分、框得分、掩膜得分和实例数量得分；

根据所述第二图像样本中的每个实例的分类得分、框得分、掩膜得分和实例数量得分计算所述第二图像样本的每个实施例的信息量子得分；

计算所述第二图像样本的所有信息量子得分的平均值，得到所述第二图像样本的信息量得分。
如权利要求1所述的图像样本选择方法，其中，所述根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类包括：

基于混合高斯模型根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类；或

基于K均值模型根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类。
一种图像样本选择装置，其中，所述图像样本选择装置包括：

获取模块，用于获取实例标注后的多个第一图像样本、待实例标注的多个第二图像样本和得分标注后的多个第三图像样本；

第一构建模块，用于构建实例分割模型，所述实例分割模型包括第一FPN主干网络、第一区域生成网络和三分支网络；

第一训练模块，用于用所述多个第一图像样本训练所述实例分割模型；

第二构建模块，用于构建得分预测模型，所述得分预测模型包括与所述第一FPN主干网络共享参数和网络结构的第二FPN主干网络、与所述第一区域生成网络共享参数和网络结构的第二区域生成网络、得分预测网络；

第二训练模块，用于用所述多个第三图像样本训练所述得分预测模型；

第一计算模块，用于基于所述得分预测模型计算所述多个第二图像样本的信息量得分；

第二计算模块，用于计算所述多个第二图像样本的特征向量；

聚类模块，用于根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类，得到所述多个第二图像样本的多个样本簇；

选取模块，用于根据所述多个第二图像样本的信息量得分和多个样本簇从所述多个第二图像样本中选取多个目标图像样本。
一种计算机设备，其中，所述计算机设备包括处理器，所述处理器用于执行存储器中存储的计算机可读指令以实现以下步骤：

获取实例标注后的多个第一图像样本、待实例标注的多个第二图像样本和得分标注后的多个第三图像样本；

构建实例分割模型，所述实例分割模型包括第一FPN主干网络、第一区域生成网络和三分支网络；

用所述多个第一图像样本训练所述实例分割模型；

构建得分预测模型，所述得分预测模型包括与所述第一FPN主干网络共享参数和网络结构的第二FPN主干网络、与所述第一区域生成网络共享参数和网络结构的第二区域生成网络、得分预测网络；

用所述多个第三图像样本训练所述得分预测模型；

基于所述得分预测模型计算所述多个第二图像样本的信息量得分；

计算所述多个第二图像样本的特征向量；

根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类，得到所述多个第二图像样本的多个样本簇；

根据所述多个第二图像样本的信息量得分和多个样本簇从所述多个第二图像样本中选取多个目标图像样本。
如权利要求9所述的计算机设备，其中，所述处理器执行所述存储器中存储的计算机可读指令以实现所述用所述多个第一图像样本训练所述实例分割模型时，包括：

对于所述多个第一图像样本中的每个第一图像样本，将所述第一图像样本输入所述第一FPN主干网络，通过所述第一FPN主干网络计算所述第一图像样本的特征表示；

将所述第一图像样本的特征表示输入所述第一区域生成网络，通过所述第一区域生成网络生成所述第一图像样本的感兴趣区域；

将所述第一图像样本的感兴趣区域输入所述三分支网络，通过所述三分支网络对所述第一图像样本的感兴趣区域进行实例分割，得到第一图像样本的实例类型、实例框和实例掩膜；

基于反向传播算法根据所述第一图像样本的实例类型与标注类型、所述第一图像样本的实例框与标注框、所述第一图像样本的实例掩膜与标注掩膜的差值对所述实例分割模型的参数进行优化。
如权利要求10所述的计算机设备，其中，所述处理器执行所述存储器中存储的计算机可读指令以实现所述通过所述第一FPN主干网络计算所述第一图像样本的特征表示时，包括：

基于所述第一FPN主干网络的自下至上子网络计算所述第一图像样本的中间特征表示，依计算先后顺序，所述第一图像样本的中间特征表示包括第一子中间特征、第二子中间特征、第三子中间特征、第四子中间特征；

基于所述第一FPN主干网络的自上至下子网络，对所述第四子中间特征进行降维计算，得到第四子特征；

根据所述第三子中间特征的尺寸对所述第四子特征进行上采样计算，对所述第三子中间特征和上采样后的第四子特征进行单位加计算，得到第三子特征；

根据所述第二子中间特征的尺寸对所述第三子特征进行上采样计算，对所述第二子中间特征和上采样后的第三子特征进行单位加计算，得到第二子特征；

根据所述第一子中间特征的尺寸对所述第二子特征进行上采样计算，对所述第一子中间特征和上采样后的第二子特征进行单位加计算，得到第一子特征，组合所述第四子特征、所述第三子特征、所述第二子特征、所述第一子特征，得到所述第一图像样本的特征表示。
如权利要求10所述的计算机设备，其中，所述三分支网络包括第一RCNN分支、第二RCNN分支和掩膜分支，所述处理器执行所述存储器中存储的计算机可读指令以实现所述通过所述三分支网络对所述第一图像样本的感兴趣区域进行实例分割时，包括：

通过所述第一RCNN分支对所述第一图像样本的感兴趣区域进行编码计算，得到所述实例类型；

通过所述第二RCNN分支对所述第一图像样本的感兴趣区域进行编码计算，得到所述实例框，所述第一RCNN分支与所述第二RCNN分支具有同一个RCNN结构；

通过所述掩膜分支对所述第一图像样本的感兴趣区域进行编码计算，得到所述实例掩膜。
如权利要求9所述的计算机设备，其中，所述处理器执行所述存储器中存储的计算机可读指令以实现所述用所述多个第三图像样本训练所述得分预测模型时，包括：

对于所述多个第三图像样本中的每个第三图像样本，将所述第三图像样本输入所述第二FPN主干网络，通过所述第二FPN主干网络计算所述第三图像样本的特征表示；

将所述第三图像样本的特征表示输入所述第二区域生成网络，通过所述第二区域生成网络生成所述第三图像样本的感兴趣区域；

将所述第三图像样本的感兴趣区域输入所述得分预测网络，通过所述得分预测网络对所述第三图像样本的感兴趣区域进行得分预测，得到分类得分、框得分、掩膜得分和实例数量得分，所述第三图像样本包括所述第三图像样本的感兴趣区域的分类标注分、框标注分、掩膜标注分、实例数量标注分；

基于反向传播算法根据所述分类得分与所述分类标注分、所述框得分与所述框标注分、所述掩膜得分与所述掩膜标注分、所述实例数量得分与实例数量标注分的差值对所述得分预测网络的参数进行优化。
如权利要求9所述的计算机设备，其中，所述处理器执行所述存储器中存储的计算机可读指令以实现所述基于所述得分预测模型计算所述多个第二图像样本的信息量得分时，包括：

对于所述多个第二图像样本中的每个第二图像样本，通过所述得分预测模型计算所述第二图像样本中的多个实例的分类得分、框得分、掩膜得分和实例数量得分；

根据所述第二图像样本中的每个实例的分类得分、框得分、掩膜得分和实例数量得分计算所述第二图像样本的每个实施例的信息量子得分；

计算所述第二图像样本的所有信息量子得分的平均值，得到所述第二图像样本的信息量得分。
如权利要求9所述的计算机设备，其中，所述处理器执行所述存储器中存储的计算机可读指令以实现所述根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类时，包括：

基于混合高斯模型根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类；或

基于K均值模型根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，其中，所述计算机可读指令被处理器执行时实现以下步骤：

获取实例标注后的多个第一图像样本、待实例标注的多个第二图像样本和得分标注后的多个第三图像样本；

构建实例分割模型，所述实例分割模型包括第一FPN主干网络、第一区域生成网络和三分支网络；

用所述多个第一图像样本训练所述实例分割模型；

构建得分预测模型，所述得分预测模型包括与所述第一FPN主干网络共享参数和网络结构的第二FPN主干网络、与所述第一区域生成网络共享参数和网络结构的第二区域生成网络、得分预测网络；

用所述多个第三图像样本训练所述得分预测模型；

基于所述得分预测模型计算所述多个第二图像样本的信息量得分；

计算所述多个第二图像样本的特征向量；

根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类，得到所述多个第二图像样本的多个样本簇；

根据所述多个第二图像样本的信息量得分和多个样本簇从所述多个第二图像样本中选取多个目标图像样本。
如权利要求16所述的存储介质，其中，所述计算机可读指令被所述处理器执行以实现所述用所述多个第一图像样本训练所述实例分割模型时，包括：

对于所述多个第一图像样本中的每个第一图像样本，将所述第一图像样本输入所述第一FPN主干网络，通过所述第一FPN主干网络计算所述第一图像样本的特征表示；

将所述第一图像样本的特征表示输入所述第一区域生成网络，通过所述第一区域生成网络生成所述第一图像样本的感兴趣区域；

将所述第一图像样本的感兴趣区域输入所述三分支网络，通过所述三分支网络对所述第一图像样本的感兴趣区域进行实例分割，得到第一图像样本的实例类型、实例框和实例掩膜；

基于反向传播算法根据所述第一图像样本的实例类型与标注类型、所述第一图像样本的实例框与标注框、所述第一图像样本的实例掩膜与标注掩膜的差值对所述实例分割模型的参数进行优化。
如权利要求16所述的存储介质，其中，所述计算机可读指令被所述处理器执行以实现所述用所述多个第三图像样本训练所述得分预测模型时，包括：

对于所述多个第三图像样本中的每个第三图像样本，将所述第三图像样本输入所述第二FPN主干网络，通过所述第二FPN主干网络计算所述第三图像样本的特征表示；

将所述第三图像样本的特征表示输入所述第二区域生成网络，通过所述第二区域生成网络生成所述第三图像样本的感兴趣区域；

将所述第三图像样本的感兴趣区域输入所述得分预测网络，通过所述得分预测网络对所述第三图像样本的感兴趣区域进行得分预测，得到分类得分、框得分、掩膜得分和实例数量得分，所述第三图像样本包括所述第三图像样本的感兴趣区域的分类标注分、框标注分、掩膜标注分、实例数量标注分；

基于反向传播算法根据所述分类得分与所述分类标注分、所述框得分与所述框标注分、所述掩膜得分与所述掩膜标注分、所述实例数量得分与实例数量标注分的差值对所述得分预测网络的参数进行优化。
如权利要求16所述的存储介质，其中，所述计算机可读指令被所述处理器执行以实现所述基于所述得分预测模型计算所述多个第二图像样本的信息量得分时，包括：

对于所述多个第二图像样本中的每个第二图像样本，通过所述得分预测模型计算所述第二图像样本中的多个实例的分类得分、框得分、掩膜得分和实例数量得分；

根据所述第二图像样本中的每个实例的分类得分、框得分、掩膜得分和实例数量得分计算所述第二图像样本的每个实施例的信息量子得分；

计算所述第二图像样本的所有信息量子得分的平均值，得到所述第二图像样本的信息量得分。
如权利要求16所述的存储介质，其中，所述计算机可读指令被所述处理器执行以实现所述根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类时，包括：

基于混合高斯模型根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类；或

基于K均值模型根据所述多个第二图像样本的特征向量对所述多个第二图像样本进行聚类。