WO2021233021A1

WO2021233021A1 - 一种图像区域分割模型训练方法、分割方法和装置

Info

Publication number: WO2021233021A1
Application number: PCT/CN2021/087128
Authority: WO
Inventors: 张军; 田宽; 颜克洲; 姚建华; 韩骁
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2020-05-18
Filing date: 2021-04-14
Publication date: 2021-11-25
Also published as: US20220222932A1; CN111598900B; CN111598900A

Abstract

一种图像区域分割模型训练方法、分割方法及装置。在模型训练过程中，获取包括至少一个样本图像的样本图像集合，样本图像具有其对应的第一标注信息，该第一标注信息为可以是图像级等粒度较大的标注信息。针对样本图像集合中的目标样本图像，生成目标样本图像对应的图结构数据，图结构数据中每个顶点包括目标样本图像中至少一个像素点。通过图卷积网络模型，根据图结构数据和第一标注信息确定顶点的第二标注信息，第二标注信息的粒度小于第一标注信息的粒度。由于顶点实际上是超像素点，第二标注信息是超像素级的标注，在训练过程中，基于超像素级标注的干预可以实现较强监督，提高模型的精确性，进而提高图像分割的精确性。

Description

一种图像区域分割模型训练方法、分割方法和装置

本申请要求于2020年05月18日提交中国专利局、申请号为202010419791.7、申请名称为“一种图像区域分割模型训练方法、分割方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能领域，特别涉及图像区域分割技术。

背景技术

随着计算机技术的发展，图像分割技术的应用越来越广泛，例如，医学图像分割以及自然图像分割等。其中，图像分割技术是把图像分成若干个特定的、具有独特性质的区域，并从中提出感兴趣目标的技术。例如，在医学图像分割场景中，可以对医学图像中的病灶进行分割，以用于进一步分析。

深度学习如今在图像区域分割领域得到了广泛的应用，为了减少产生大量标注图像所耗费的时间和人工成本，相关技术中采用图像级标注的方式，利用弱监督的模式完成图像区域分割。

然而，采用图像级标签的弱监督，监督信号过弱，很难精确分割出来感兴趣的目标区域。

发明内容

为了解决上述技术问题，本申请提供了一种图像区域分割模型训练方法、图像区域分割方法和装置，在实现大规模快速标注的前提下，提高了所训练的图像区域分割模型的精确性，进而在使用训练得到的该图像区域分割模型进行图像区域分割时，提高图像分割的精确性。

本申请实施例公开了如下技术方案：

第一方面，本申请实施例提供一种图像区域分割模型训练方法，由数据处理设备执行，所述方法包括：

获取样本图像集合，所述样本图像集合包括至少一个样本图像，每个所述样本图像具有其对应的第一标注信息；

针对所述样本图像集合中的目标样本图像，生成所述目标样本图像对应的图结构数据；所述图结构数据中包括多个顶点，每个所述顶点包括所述目标样本图像中至少一个像素点；所述目标样本图像为所述样本图像集合中的任一个样本图像；

通过图卷积网络模型，根据所述目标样本图像对应的图结构数据和所述目标样本图像对应的所述第一标注信息，确定所述顶点的第二标注信息；所述第二标注信息的粒度小于所述第一标注信息的粒度；所述图卷积网络模型为所述图形区域分割模型的一部分；

根据所述第二标注信息对所述图像区域分割模型进行训练。

第二方面，本申请实施例提供一种图像区域分割模型训练装置，所述装置包括获取单元、生成单元、确定单元和训练单元：

所述获取单元，用于获取样本图像集合，所述样本图像集合包括至少一个样本图像，每个所述样本图像具有其对应的第一标注信息；

所述生成单元，用于所述针对所述样本图像集合中的目标样本图像，生成所述目标样本图像对应的图结构数据；所述图结构数据中包括多个顶点，每个所述顶点包括所述目标样本图像中至少一个像素点；所述目标样本图像为所述样本图像集合中的任一个样本图像；

所述确定单元，用于通过图卷积网络模型，根据所述目标样本图像对应的图结构数据和所述目标样本图像对应的所述第一标注信息，确定所述顶点的第二标注信息；所述第二标注信息的粒度小于所述第一标注信息的粒度；所述图卷积网络模型为所述图形区域分割模型的一部分；

所述训练单元，用于根据所述第二标注信息对所述图像区域分割模型进行训练。

第三方面，本申请实施例提供一种图像区域分割方法，由数据处理设备执行，所述方法包括：

获取待分割图像；

通过图像区域分割模型生成所述待分割图像对应的图结构数据；所述图结构数据中包括多个顶点，每个所述顶点包括所述待分割图像中至少一个像素点；所述图像区域分割模型是根据第二标注信息训练得到的，所述第二标注信息是根据样本图像对应的图结构数据和所述样本图样对应的第一标注信息确定的；所述第二标注信息的粒度小于所述第一标注信息的粒度；

通过所述图像区域分割模型，根据所述待分割图像对应的图结构数据分割得到所述待分割图像中的目标区域。

第四方面，本申请实施例提供一种图像区域分割装置，所述装置包括获取单元、生成单元和分割单元：

所述获取单元，用于获取待分割图像；

所述生成单元，用于通过图像区域分割模型生成所述待分割图像对应的图结构数据；所述图结构数据中包括多个顶点，每个所述顶点包括所述待分割图像中至少一个像素点；所述图像区域分割模型是根据第二标注信息训练得到的，所述第二标注信息是根据样本图像对应的图结构数据和所述样本图样对应的第一标注信息确定的；所述第二标注信息的粒度小于所述第一标注信息的粒度；

所述分割单元，用于通过所述图像区域分割模型，根据所述待分割图像对应的图结构数据分割得到所述待分割图像中的目标区域。

第五方面，本申请实施例提供一种医疗器械，所述医疗器械包括图像采集模组、图像处理模组和图像显示模组：

所述图像采集模组，用于获取待分割图像；所述待分割图像为包括生物组织的病理图像；

所述图像处理模组，用于通过图像区域分割模型生成所述待分割图像对应的图结构数据；所述图结构数据中包括多个顶点，每个所述顶点包括所述待分割图像中至少一个像素点；所述图像区域分割模型是根据第二标注信息训练得到的，所述第二标注信息是根据样本图像对应的图结构数据和所述样本图样对应的第一标注信息确定的；所述第二标注信息的粒度小于所述第一标注信息的粒度；通过所述图像区域分割模型，根据所述待分割图像对应的图结构数据分割得到所述待分割图像中的病灶；

所述图像显示模组，用于显示所述病灶。

第六方面，本申请实施例提供一种设备，所述设备包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行第一方面或第三方面所述的方法。

第七方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行第一方面或第三方面所述的方法。

第八方面，本申请实施例提供一种计算机程序产品，包括指令，当其在计算机上运行时，使得计算机执行第一方面或第三方面所述的方法。

由上述技术方案可以看出，本申请在模型训练过程中，获取样本图像集合，样本图像集合包括至少一个样本图像，每个样本图像具有其对应的第一标注信息，该第一标注信息可以是图像级等粒度较大的标注信息，如此易于实现大规模快速标注。针对样本图像集合中的目标样本图像(可以为样本图像集合中任一个样本图像)，生成该目标样本图像对应的图结构数据，图结构数据中包括多个顶点，每个顶点包括该目标样本图像中至少一个像素点。通过图卷积网络模型，根据目标样本图像对应的图结构数据和目标样本图像对应的第一标注信息，确定顶点的第二标注信息，第二标注信息的粒度小于第一标注信息的粒度。由于顶点实际上是超像素点，其包括至少一个像素点，也就是说，第二标注信息是超像素级的标注，这样，根据第二标注信息对包括图卷积网络模型的图像区域分割模型进行训练，基于像素级标注的干预可以实现较强监督，提高所训练的图像区域分割模型的精确性。可见，本申请在实现大规模快速标注的前提下，基于图卷积网络模型将图像级标注信息转化为超像素级标注信息，从而实现较强监督的模型训练，提高了模型的精确性，进而在使用训练得到的模型进行图像区域分割时，提高图像分割的精确性。

附图说明

图1为本申请实施例提供的一种图像区域分割模型训练方法的应用场景示意图；

图2为本申请实施例提供的一种图像区域分割模型训练方法的流程图；

图3为本申请实施例提供的图像区域分割模型训练方法的系统流程图；

图4为本申请实施例提供的一种图像区域分割方法的流程图；

图5为本申请实施例提供的一种图像区域分割方法的系统流程图；

图6A为本申请实施例提供的图像区域分割方法进行分割得到的分割效果图；

图6B为通过有监督算法进行分割得到的分割效果图；

图7为本申请实施例提供的一种图像区域分割方法的流程图；

图8为本申请实施例提供的一种图像区域分割模型训练装置的结构图；

图9为本申请实施例提供的一种图像区域分割装置的结构图；

图10为本申请实施例提供的一种终端设备的结构图；

图11为本申请实施例提供的一种服务器的结构图。

具体实施方式

下面结合附图，对本申请的实施例进行描述。

深度学习如今在图像分割领域得到了广泛的应用，为了训练好的图像区域分割模型，往往需要精确的像素级别标注，但是像素级人工标注极其耗时耗力。比如人工标注一张2048*2048的病例图片中的病灶，往往需要5-30分钟。因此，产生大量带有标注的样本图像变得非常昂贵和耗时。鉴于此，基于弱监督分割(Weakly supervised segmentation)方法应运而生。弱监督分割方法例如可以采用类激活映射(Class Activation Mapping，CAM)算法。

而相关技术中的弱监督分割方法，通常使用与分割任务相关的图像级标签(往往为图像类别)训练分类模型，进而，利用训练得到的分类模型确定需要分割的目标区域，例如在医疗领域的病灶。由于图像级标签相对于像素级标签的标注较为粗略，难以对图像进行准确的标注，没有直接地进行像素级干预，导致通过该弱监督方法训练得到的模型分割出的图像区域分割结果往往不够精确。

为此，本申请实施例提供一种图像区域分割模型训练方法，该方法仍然对样本图像采用图像级标注，但是在模型训练过程中，会基于图卷积网络模型将图像级标注信息(第一标注信息)转化为超像素级标注信息(第二标注信息)，利用第二标注信息对图像区域分割模型进行训练，从而实现较强监督的模型训练，提高了训练得到的图像区域分割模型的精确性，进而在使用该图像区域分割模型进行图像区域分割时，可以提高图像分割的精确性。

本申请实施例提供的图像区域分割模型训练方法和图像区域分割方法，可以应用于具有图形处理器(Graphics Processing Unit，GPU)的数据处理设备，该数据处理设备可以是终端设备，该终端设备例如可以是计算机、个人数字助理(Personal Digital Assistant，简称PDA)、平板电脑、智能手机等。

该数据处理设备还可以是服务器，在实际部署时，服务器可以是独立服务器，也可以是集群服务器或是云服务器。在这种情况下，可以通过服务器完成图像区域分割模型的训练，然后，利用服务器与终端设备进行交互，对从终端设备处获取到的待分割图像进行目标区域分割，并将分割结果返回至终端设备。

为了便于理解本申请的技术方案，下面结合实际应用场景对本申请实施例提供的图像区域分割模型训练方法进行介绍。

参见图1，图1为本申请实施例提供的图像区域分割模型训练方法的应用场景示意图。以数据处理设备是终端设备为例，该应用场景中包括终端设备101。

终端设备101获取样本图像集合，该样本图像集合包括多个具有第一标注信息的样本图像。样本图像中包括用户感兴趣的目标区域，样本图像可以是各种类型的图像，例如病理图像、交通监控图像等等。为了避免标注样本图像耗费大量人力和时间成本，便于实现大规模快速标注，上述第一标注信息是粒度较大的标注信息，例如图像级标注信息。

针对样本图像集合中的目标样本图像，生成该目标样本图像对应的图结构数据，其中包括多个顶点，每个顶点包括目标样本图像中至少一个像素点，该目标样本图像可以为样本图像集合中任一个样本图像。

由于图结构数据是由目标样本图像中至少一个像素点构成的，这些像素点构成的图结构数据通常是非标准几何的数据，因此需要通过图卷积网络模型对图结构数据进行处理。即，在本实施例中，可以通过图像区域分割模型中的图卷积网络模型，根据图结构数据和第一标注信息确定图结构数据中顶点的第二标注信息。

顶点实际上是超像素点，其包括目标样本图像中至少一个像素点，也就是说，第二标注信息是超像素级的标注，第二标注信息的粒度明显小于第一标注信息的粒度。这样，根据第二标注信息对包括图卷积网络模型的图像区域分割模型进行训练，基于超像素级标注的干预可以实现较强监督，提高模型的精确性。

需要说明的是，本申请实施例提供的方法可以应用于多种应用场景，例如在医疗领域对医学图像进行分割以区分人体各个组织，对病理图片中的目标区域(例如病灶)进行分割，交通领域的车辆识别等等。

接下来，将结合附图对本申请实施例提供的图像区域分割模型训练方法进行介绍。

参见图2，图2示出了一种图像区域分割模型训练方法的流程图，所述方法包括：

S201、获取样本图像集合。

样本图像集合包括多个样本图像，每个样本图像具有其对应的第一标注信息。在本实施例中，第一标注信息是粒度较大的标注信息，例如图像级标注信息。图像级标注信息仅需要对样本图像整体进行标注，一个样本图像对应一个标签，无需针对样本图像中每个像素点进行标注，可以节省因标注耗费的人力和时间成本，便于实现大规模快速标注。

图像级标注信息可以包括多种，在本实施例中，图像级标注信息例如可以是目标区域在样本图像中的面积占比，即第一标注信息包括目标区域在样本图像中的面积占比。其中，目标区域可以是样本图像中用户可能感兴趣的区域，例如病理图像中的病灶等；目标区域在样本图像中的面积占比可以是人工根据样本图像估计得到，为了避免估计误差，在标注面积占比的同时，还可以标注估计误差值，从而在后续模型训练过程中考虑该估计误差值，提高模型训练的精确性。

S202、针对所述样本图像集合中的目标样本图像，生成所述目标样本图像对应的图结构数据。

在得到样本图像集合后，生成目标样本图像(该目标样本图像可以为样本图像集合中任一样本图像)对应的图结构数据。图结构数据的顶点包括目标样本图像中至少一个像素点，每个顶点包括哪些像素点可以通过对目标样本图像中的像素点进行聚类确定，而聚类的依据可以是像素点的特征，即可以将特征相似的像素点聚类在一起作为顶点。

在一些实施例中，图像区域分割模型中可以包括全卷积网络(Fully convolutional networks，FCN)。生成图结构数据的方式可以是，通过全卷积网络对目标样本图像进行特征提取，得到该目标样本图像中每个像素点对应的特征，然后，根据像素点对应的特征对目标样本图像中的像素点进行聚类，得到超像素划分结果，根据超像素划分结果构建图结构数据，该超像素划分结果中每个超像素点作为图结构数据中的一个顶点。

生成图结构数据的方式可以参见图3所示，图3示出了图像区域分割模型训练方法的系统流程，主要包括特征提取模块301和分类模块302，其中，特征提取模块301用于将样本图像集合中的目标样本图像输入到全卷积网络，得到目标样本图像中每个像素点的特征。每个像素点对应的特征可以用N维的特征向量表示，N为全卷积网络的通道数。

其中，本申请实施例可以选取常规的全卷积网络，比如U-Net，U-Net是全卷积网络的一种网络结构，当然还可以选取其他网络结构，本实施例对全卷积网络的网络结构不做限定。

由于每个像素点都得到其对应的特征，故可以根据像素点的特征对目标样本图像中的像素点进行聚类，将特征相似的像素点聚类在一起构成一个超像素点(superpixel)，得到超像素划分结果。例如，属于同一个细胞的像素点的特征一般比较相似，可以聚类在一起形成一个超像素点；属于同一部位(例如都属于嘴部)的像素点的特征一般比较相似，可以聚类在一起形成一个超像素点，等等。

其中，超像素点划分需要指定超像素点的个数，本申请实施例采用随机数的方式赋值。聚类方法可以包括多种，例如简单的线性迭代聚类(simple linear iterative clustering，SLIC)、归一分割算法、基于梯度上升的算法等等，本申请实施例对此不做限定。

需要说明的是，由于本实施例中采用全卷积网络提取像素点的特征，超像素划分需要利用全卷积网络输出的像素点的特征作为划分依据，因此只要特征变化，超像素点的划分也会相应地改变。而在图像区域分割模型训练过程中，会对图像区域分割模型中的全卷积网络进行参数调整，从而导致输出的特征变化，进一步带动超像素划分结果发生变化，也就是说，在本实施例中得到的是动态超像素点，此类动态超像素点更有助于提高模型训练的精确性。

在得到超像素划分结果后，可以根据超像素划分结果构建图结构数据，将超像素划分结果中每个超像素点作为图结构数据中的一个顶点，进入后续分类模块302。

图结构数据中除了包括多个顶点(Node)，一些顶点之间可能还存在边(edge)以及边的权重(weight)。边表示两个顶点之间在空间位置上相邻，具有一定的关联关系；边的权重表示两个顶点之间的关联程度，权重越大，关联程度越大。

因此，在一些实施例中，根据超像素划分结果构建图结构数据的方式，可以是根据任意两个顶点所包括的像素点的位置信息确定顶点之间的边。通常情况下，如果两个超像素点(顶点)为空间相连，那么这两个超像素点之间即可建立起边的连接。判断两个超像素点(顶点)是否空间相连的方式，可以是判断这两个超像素点包括的像素点中是否存在相邻像素点。

针对任一条边，若该条边连接第一顶点和第二顶点，则根据第一顶点和第二顶点各自对应的特征之间的欧氏距离，确定边的权重。欧式距离越大，关联程度越小，权重越小。通过该方式设置权重，更能够准确地体现出超像素点之间的关联程度，从而有利于提高后续处理的准确性。

当然，还可以简化边的权重的确定方式，在一些情况下，可以将所有边的权重设置为统一的数值，例如可以将各个边的权重统一设置为1。

可以理解的是，针对图结构数据中的每个顶点，顶点对应的特征为该顶点包括像素点的特征的平均值。若像素点的特征为N维特征向量，则顶点的特征也为N维特征向量。

S203、通过图卷积网络模型，根据所述目标样本图像对应的图结构数据和所述目标样本图像对应的第一标注信息，确定所述顶点的第二标注信息。

在得到图结构数据后，即得到图卷积网络模型所需的数据后，可以将图结构数据输入至图卷积网络模型，以便对包括图卷积网络模型在内的图像区域分割模型进行训练。其中，图卷积网络模型可以由五个线性图卷积层构成，每个线性层的神经元数量分别为64，128，256，64，1。除了最后一层，为每个层加入非线性激活层(ReLu)。

参见图3中302所示，图卷积网络模型可以根据图结构数据和第一标注信息确定顶点的第二标注信息，由于图结构数据中包括多个顶点，顶点中包括至少一个像素点，因此，第二标注信息是像素级标注信息，第二标注信息的粒度小于第一标注信息的粒度。

S204、根据所述第二标注信息对所述图像区域分割模型进行训练。

在本实施例中，第一标注信息是预先标注的真实标签，而第二标注信息是伪标签，是图像区域分割模型中包括的图卷积网络模型对图结构数据进行预测，根据第一标注信息转换得到的像素级别的标注信息，与第一标注信息相比，第二标注信息能够提供较强的监督信号，因此，可以根据第二标注信息对图像区域分割模型进行训练。

在本实施例中，全卷积网络采用U-Net，特征的维度N可以设为24，超像素点个数不固定，每个迭代采用200-8000之间的随机数。可以采用适应性矩估计(Adaptive moment estimation，Adam)优化方法，学习率设为0.001。

若获取到305个样本图像，样本图像是病理图像，例如HER2图像，HER2又称为原癌基因人类表皮生长因子受体2，用于检查乳腺癌。这些样本图像来自50个全片扫描玻片，用于进行图像区域分割模型的训练。其中，采用226个样本数据用于模型训练，另外79个样本图像作为测试数据。利用训练数据基于本申请实施例提供的方法训练得到图像区域分割模型，利用测试数据对图像区域分割模型进行测试，得到分割结果的DICE系数(DICE系数是一种相似度度量函数，通常用于计算两个样本的相似度)为0.84。而采用有监督的算法(基于U-Net的全监督)训练图像区域分割模型，得到的DICE系数为0.86。可见，本申请实施例提供的图像区域分割模型的训练方法已经逼近有监督算法，证明了算法的有效性和可行性。

由上述技术方案可以看出，本申请在模型训练过程中，获取样本图像集合，样本图像集合包括至少一个样本图像，样本图像具有其对应的第一标注信息，该第一标注信息为可以是图像级等粒度较大的标注信息，如此易于实现大规模快速标注。针对样本图像集合中的目标样本图像(可以为样本图像集合中任一个样本图像)，生成该目标样本图像对应的图结构数据，图结构数据中包括多个顶点，每个顶点包括目标样本图像中至少一个像素点。通过图卷积网络模型，根据目标样本图像对应的图结构数据和目标样本图像对应的第一标注信息，确定顶点的第二标注信息，第二标注信息的粒度小于第一标注信息的粒度。由于顶点实际上是超像素点，其包括至少一个像素点，也就是说，第二标注信息是超像素级的标注，这样，根据第二标注信息对包括图卷积网络模型的图像区域分割模型进行训练，基于像素级标注的干预可以实现较强监督，提高模型的精确性。可见，本申请在实现大规模快速标注的前提下，基于图卷积网络模型将图像级标注信息转化为超像素级标注信息，从而实现较强监督的模型训练，提高了所训练的图像区域分割模型的精确性，进而在使用该图像区域分割模型进行图像区域分割时，能够提高图像分割的精确性。

在一种可能的实现方式中，第一标注信息可以包括目标区域在样本图像中的面积占比，若样本图像和图结构数据中像素点分布均匀，则面积占比也可以反映出图结构数据中属于目标区域的顶点数量在所有顶点数据中的占比，若确定出属于目标区域的顶点数量，则可以确定出哪些顶点属于目标区域，哪些顶点属于背景区域，从而确定顶点的第二标注信息。

因此，确定第二标注信息的一种可能的实现方式可以是，通过图卷积网络模型，根据图结构数据得到每个顶点的预测结果。根据面积占比和图结构数据中顶点的总数量，确定目标区域对应的第一顶点数量(即属于目标区域的顶点数量)以及背景区域对应的第二顶点数量(即属于背景区域的顶点数量)，背景区域为图像样本中除目标区域外的区域，目标区域也可以称为前景区域。接着，根据第一顶点数量、第二顶点数量和预测结果确定顶点的第二标注信息。

通常情况下，预测结果为图卷积网络模型根据图结构数据预测得到的每个顶点属于目标区域的概率值，顶点对应的概率值越高，则表示该顶点越有可能属于目标区域。在得到预测结果后，可以按照概率值的大小进行排序，例如按照概率值从大到小的顺序进行排序，或从小到大的顺序进行排序。由于属于目标区域的顶点数据为第一顶点数量，那么，仅有第一顶点数量个顶点的第二标注信息表示其属于目标区域(例如第二标注信息设为1)，剩余第二顶点数量个顶点的第二标注信息表示其属于背景区域(例如第二标注信息设为0)。由于概率值越高，顶点越有可能属于目标区域，那么，若预测结果按照概率值从大到小的顺序进行排序，可以在所有顶点中，选择排序靠前的第一顶点数量个顶点的第二标注信息表示其属于目标区域(例如第二标注信息设为1)，剩余的第二顶点数量个顶点的第二标注信息表示其属于背景区域(例如第二标注信息设为0)。

例如面积占比为p，顶点的总数量为M，那么目标区域对应的顶点数量(第一顶点数量)为p×M，背景区域对应的顶点数量(第二顶点数量)为(1-p)×M。鉴于此，若预测结果按照概率值从大到小的顺序进行排序，可以将预测结果中的前p×M个顶点的第二标注信息设为1，将后(1-p)×M个顶点的第二标注信息设为0。

在一些实施例中，为了避免估计误差，在标注面积占比的同时，还可以标注估计误差值，即第一标注信息还包括估计误差值，此时，确定第一顶点数量和第二顶点数量的方式也有所改变，确定第一顶点数量和第二顶点数量时不仅要考虑面积占比，也要考虑估计误差值。即，可以根据面积占比、估计误差值和图结构数据中顶点的总数量，确定第一顶点数量以及第二顶点数量。

例如面积占比为p，顶点的总数量为M，那么，估计出的第一顶点数量为p×M，第二顶点数量为(1-p)×M。若估计误差值为q，考虑到估计误差值，确信的第一顶点数量为(p-q)×M，确信的第二顶点数量为(1-p-q)×M。鉴于此，若预测结果按照概率值从大到小的顺序进行排序，可以将预测结果中排序靠前的(p-q)×M个顶点的第二标注信息设为1，将排序在前(p-q)×M个顶点后的(1-p-q)×M个顶点的第二标注信息设为0。而对于余下的不确信的顶点可以忽略，不进行标注，从而避免估计误差导致模型训练的不精确。

在根据第二标注信息对图像区域分割模型进行训练的过程中，可以将第二标注信息作为监督信号，例如可以根据每个顶点的预测结果和第二标注信息构建损失函数，从而根据损失函数对图像区域分割模型进行训练。该训练过程可以包括对图像区域分割模型中的图卷积网络模型、全卷积网络进行训练，直到损失函数的值最小，停止训练。

其中，构建损失函数可以包括多种方式，例如可以通过互信息熵、均方误差(MeanSquaredError，MSE)等方式构建损失函数，施加强的监督信号。

基于前述实施例提供的图像区域分割模型的训练方法，本申请实施例还提供一种图像区域分割方法，参见图4，所述方法包括：

S401、获取待分割图像。

待分割图像可以是各种类型的图像，例如病理图像、交通监控图像等等。以待分割图像是病理图像为例，则通过图像区域分割所要获取的目标区域可以为病灶，以用于后续诊断。其中，待分割图像可以参见图5中501所示。

S402、通过图像区域分割模型生成所述待分割图像对应的图结构数据。

将待分割图像输入至图像区域分割模型(如图5所示)，得到该待分割图像对应的图结构数据。其中，图结构数据中包括多个顶点，每个所述顶点包括待分割图像中至少一个像素点。

本申请实施例中所采用的图像区域分割模型是根据图2所示实施例所提供的方法训练得到的，此处不再赘述。

S403、通过所述图像区域分割模型，根据所述待分割图像对应的图结构数据分割得到目标区域。

通过图像区域分割模型对图结构数据进行预测得到预测结果，从而确定该图结构数据中哪些顶点属于目标区域，哪些顶点属于背景区域，进而确定待分割图像中哪些像素点属于目标区域，哪些像素点属于背景区域，从而分割得到目标区域。分割效果图可以参见图5中502所示，其中，白色表示目标区域，黑色表示背景区域。

通过本申请实施例提供的图像区域分割方法进行图像分割得到的分割效果与通过有监督算法进行图像分割得到的分割效果对比图，可以参见图6A和图6B所示，图6A中的图片为通过本申请实施例提供的图像区域分割方法进行分割得到的分割效果图，图6B中的图片为通过有监督算法进行分割得到的分割效果图，通过两张效果图的比对可以看出，二者的分割结果相似，可见通过本申请实施例提供的图像区域分割方法可以实现较强监督，提高模型的精确性。

接下来，将结合实际应用场景对本申请实施例提供的图像区域分割方法进行介绍。以医疗场景为例，在该应用场景中医疗器械中承载有预先训练好的图像区域分割模型，该医疗器械可以采集病人的病理图像，并对病理图像进行病灶分割。参见图7，所述方法包括：

S701、医疗器械采集病人的病理图像。

S702、医疗器械通过图像区域分割模型生成病理图像对应的图结构数据。

S703、医疗器械通过图像区域分割模型，根据图结构数据分割得到病灶。

S704、医疗器械通过显示屏显示病灶。

S705、医生根据显示的病灶进行观察、分析，以诊断疾病。

本申请实施例提供的图像区域分割模型训练方法和图像区域分割方法可以应用于多种场景，以医疗领域为例，图像区域分割模型训练方法和图像区域分割方法可以应用于医疗器械上，医疗器械可以利用该图像区域分割模型训练方法训练图像区域分割模型，进而利用训练得到的图像区域分割模型对病理图像进行区域分割，得到目标区域例如病灶，以便用于后续分析、处理。

为此，本申请实施例还提供一种医疗器械，该医疗器械可以为医学影像设备，如X光机、电子计算机断层扫描(Computed Tomography，简称CT)设备、磁共振成像(Magnetic Resonance Imaging，简称MRI)设备等，所述医疗器械包括图像采集模组、图像处理模组和图像显示模组：

所述图像处理模组，用于通过图像区域分割模型生成所述待分割图像对应的图结构数据；所述图结构数据中包括多个顶点，每个所述顶点包括所述待分割图像中至少一个像素点；所述图像区域分割模型是根据第二标注信息训练得到的，所述第二标注信息是根据样本图像对应的图结构数据和所述样本图样对应的第一标注信息确定的；所述第二标注信息的粒度小于所述第一标注信息的粒度；通过所述图像区域分割模型，根据所述图结构数据分割得到所述待分割图像中的病灶；

所述图像显示模组，用于显示所述病灶，以便医生可以通过医疗器械显示的病灶进行观察、分析等。

在一种可能的是实现方式中，所述图像采集模组，用于获取样本图像集合，所述样本图像集合包括多个样本图像，所述样本图像具有其对应的第一标注信息；

所述图像处理模组，用于：

通过图卷积网络模型，根据所述目标样本图像对应的图结构数据和所述目标样本图像对应的第一标注信息，确定所述顶点的第二标注信息；所述第二标注信息的粒度小于所述第一标注信息的粒度；所述图卷积网络模型为所述图形区域分割模型的一部分；

根据所述第二标注信息对所述图像区域分割模型进行训练。

在一种可能的是实现方式中，所述第一标注信息包括目标区域在样本图像中的面积占比，所述图像处理模组，用于：

通过图卷积网络模型，根据所述图结构数据得到每个顶点的预测结果；

根据所述面积占比和所述图结构数据中顶点的总数量，确定所述目标区域对应的第一顶点数量以及背景区域对应的第二顶点数量，所述背景区域为所述样本图像中除所述目标区域外的区域；

根据所述第一顶点数量、所述第二顶点数量和所述预测结果，确定所述顶点的第二标注信息。

在一种可能的是实现方式中，所述第一标注信息还包括估计误差值，所述图像处理模组，用于：

根据所述面积占比、所述估计误差值和所述图结构数据中顶点的总数量，确定所述目标区域对应的第一顶点数量以及背景区域对应的第二顶点数量。

在一种可能的是实现方式中，所述图像处理模组，用于：

根据每个顶点的所述预测结果和第二标注信息构建损失函数；

根据所述损失函数对所述图像区域分割模型进行训练。

在一种可能的是实现方式中，所述图像区域分割模型中包括全卷积网络，所述图像处理模组，用于：

通过全卷积网络对所述目标样本图像进行特征提取，得到所述目标样本图像中每个像素点对应的特征；

根据所述像素点对应的特征对所述目标样本图像中的像素点进行聚类，得到超像素划分结果；

根据所述超像素划分结果构建所述图结构数据，所述超像素划分结果中每个超像素点作为所述图结构数据中的一个顶点。

在一种可能的是实现方式中，所述图像处理模组，用于：

根据第一顶点和第二顶点各自包括的像素点的位置信息，确定所述第一顶点与所述第二顶点之间的边；所述第一顶点和所述第二顶点可以为任意两个顶点；

根据所述第一顶点和所述第二顶点各自对应的特征之间的欧氏距离，确定边的权重。

在一种可能的是实现方式中，针对所述图结构数据中每个顶点，顶点对应的特征为所述顶点所包括像素点的特征的平均值。

基于前述图2所对应的实施例，本申请实施例还提供一种图像区域分割模型训练装置，参见图8，所述装置包括获取单元801、生成单元802、确定单元803和训练单元804：

所述获取单元801，用于获取样本图像集合，所述样本图像集合包括至少一个样本图像，每个所述样本图像具有其对应的第一标注信息；

所述生成单元802，用于所述针对所述样本图像集合中的目标样本图像，生成所述目标样本图像对应的图结构数据；所述图结构数据中包括多个顶点，每个所述顶点包括所述目标样本图像中至少一个像素点；所述目标样本图像为所述样本图像集合中的任一个样本图像；

所述确定单元803，用于通过图卷积网络模型，根据所述目标样本图像对应的图结构数据和所述目标样本图像对应的所述第一标注信息确定所述顶点的第二标注信息；所述第二标注信息的粒度小于所述第一标注信息的粒度；所述图卷积网络模型为所述图形区域分割模型的一部分；

所述训练单元804，用于根据所述第二标注信息对所述图像区域分割模型进行训练。

在一种可能的实现方式中，所述第一标注信息包括目标区域在样本图像中的面积占比，所述确定单元803，用于：

根据所述面积占比和所述图结构数据中顶点的总数量，确定所述目标区域对应的第一顶点数量以及背景区域对应的第二顶点数量，所述背景区域为所述样本图像中出所述目标区域外的区域；

在一种可能的实现方式中，所述第一标注信息还包括估计误差值，所述确定单元803，用于：

在一种可能的实现方式中，所述训练单元804，用于：

根据所述损失函数对所述图像区域分割模型进行训练。

在一种可能的实现方式中，所述图像区域分割模型中包括全卷积网络，所述生成单元802，用于：

在一种可能的实现方式中，所述生成单元802，用于：

根据第一顶点和第二顶点各自包括的像素点的位置信息，确定所述第一顶点与所述第二顶点之间的边；所述第一顶点和所述第二顶点为任意两个顶点；

根据第一顶点和第二顶点各自对应的特征之间的欧氏距离确定边的权重。

在一种可能的实现方式中，针对所述图结构数据中每个顶点，顶点对应的特征为所述顶点包括的像素点的特征的平均值。

基于前述图4所对应的实施例，本申请实施例还一种基于人工智能的图像区域分割装置，参见图9，所述装置包括获取单元901、生成单元902和分割单元903：

所述获取单元901，用于获取待分割图像；

所述生成单元902，用于通过图像区域分割模型生成所述待分割图像对应的图结构数据；所述图结构数据中包括多个顶点，每个所述顶点包括所述待分割图像中至少一个像素点；所述图像区域分割模型是根据第二标注信息训练得到的，所述第二标注信息是根据样本图像对应的图结构数据和所述样本图样对应的第一标注信息确定的；所述第二标注信息的粒度小于所述第一标注信息的粒度；

所述分割单元903，用于通过所述图像区域分割模型，根据所述待分割图像对应的图结构数据分割得到所述待分割图像中的目标区域。

在一种可能的实现方式中，所述待分割图像为病理图像，所述目标区域为病灶。

本申请实施例还提供了一种设备，该设备可以实现上文中的图像区域分割模型训练方法或图像区域分割方法。下面结合附图对该设备进行介绍。请参见图10所示，本申请实施例提供了一种的设备1000，该设备1000还可以是终端设备，该终端设备可以为包括计算机、平板电脑、手机、个人数字助理(Personal Digital Assistant，简称PDA)、销售终端(Point of Sales，简称POS)、车载电脑等，以终端设备为手机为例：

图10示出的是与本申请实施例提供的终端设备相关的手机的部分结构的框图。参考图10，手机包括：射频(Radio Frequency，简称RF)电路1010、存储器1020、输入单元1030、显示单元1040、传感器1050、音频电路1060、无线保真(wireless fidelity，简称WiFi)模块1070、处理器1080、以及电源1090等部件。本领域技术人员可以理解，图10中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

在本实施例中，该终端设备所包括的处理器1080还具有以下功能：

获取样本图像集合，所述样本图像集合包括多个样本图像，每个所述样本图像具有其对应的第一标注信息；

根据所述第二标注信息对所述图像区域分割模型进行训练。

或，

获取待分割图像；

本申请实施例还提供服务器，请参见图11所示，图11为本申请实施例提供的服务器1100的结构图，服务器1100可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(Central Processing Units，简称CPU)1122(例如，一个或一个以上处理器)和存储器1132，一个或一个以上存储应用程序1142或数据1144的存储介质1130(例如一个或一个以上海量存储设备)。其中，存储器1132和存储介质1130可以是短暂存储或持久存储。存储在存储介质1130的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1122可以设置为与存储介质1130通信，在服务器1100上执行存储介质1130中的一系列指令操作。

服务器1100还可以包括一个或一个以上电源1126，一个或一个以上有线或无线网络接口1150，一个或一个以上输入输出接口1158，和/或，一个或一个以上操作系统1141，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

上述实施例中由服务器所执行的步骤可以基于该图11所示的服务器结构执行。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行前述各个实施例所述的方法。

本申请实施例还提供一种包括指令的计算机程序产品，当其在计算机上运行时，使得计算机执行前述各个实施例所述的方法。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种图像区域分割模型训练方法，由数据处理设备执行，所述方法包括：

获取样本图像集合，所述样本图像集合包括多个样本图像，每个所述样本图像具有其对应的第一标注信息；

针对所述样本图像集合中的目标样本图像，生成所述目标样本图像对应的图结构数据；所述图结构数据中包括多个顶点，每个所述顶点包括所述目标样本图像中至少一个像素点；所述目标样本图像为所述样本图像集合中的任一个样本图像；

通过图卷积网络模型，根据所述目标样本图像对应的图结构数据和所述目标样本图像对应的所述第一标注信息，确定所述顶点的第二标注信息；所述第二标注信息的粒度小于所述第一标注信息的粒度；所述图卷积网络模型为所述图形区域分割模型的一部分；

根据所述第二标注信息对所述图像区域分割模型进行训练。
根据权利要求1所述的方法，所述第一标注信息包括目标区域在样本图像中的面积占比；所述通过图卷积网络模型，根据所述目标样本图像对应的图结构数据和所述目标样本图像对应的所述第一标注信息，确定所述顶点的第二标注信息，包括：

通过所述图卷积网络模型，根据所述图结构数据得到每个顶点的预测结果；

根据所述面积占比和所述图结构数据中顶点的总数量，确定所述目标区域对应的第一顶点数量以及背景区域对应的第二顶点数量，所述背景区域为所述样本图像中除所述目标区域外的区域；

根据所述第一顶点数量、所述第二顶点数量和所述预测结果，确定所述顶点的第二标注信息。
根据权利要求2所述的方法，所述第一标注信息还包括估计误差值；所述根据所述面积占比和所述图结构数据中顶点的总数量，确定所述目标区域对应的第一顶点数量以及背景区域对应的第二顶点数量，包括：

根据所述面积占比、所述估计误差值和所述图结构数据中顶点的总数量，确定所述第一顶点数量以及所述第二顶点数量。
根据权利要求2所述的方法，所述根据所述第二标注信息对所述图像区域分割模型进行训练，包括：

根据每个顶点的所述预测结果和第二标注信息构建损失函数；

根据所述损失函数对所述图像区域分割模型进行训练。
根据权利要求1-4任一项所述的方法，所述图像区域分割模型中包括全卷积网络，所述针对所述样本图像集合中的目标样本图像，生成所述目标样本图像对应的图结构数据，包括：

通过所述全卷积网络对所述目标样本图像进行特征提取，得到所述目标样本图像中每个像素点对应的特征；

根据所述像素点对应的特征对所述目标样本图像中的像素点进行聚类，得到超像素划分结果；

根据所述超像素划分结果构建所述图结构数据，所述超像素划分结果中每个超像素点作为所述图结构数据中的一个顶点。
根据权利要求5所述的方法，所述根据所述超像素划分结果构建所述图结构数据，包括：

根据第一顶点和第二顶点各自包括的像素点的位置信息，确定所述第一顶点与所述第二顶点之间的边；所述第一顶点和所述第二顶点为任意两个顶点；

根据所述第一顶点和所述第二顶点各自对应的特征之间的欧氏距离，确定所述边的权重。
根据权利要6所述的方法，针对所述图结构数据中每个顶点，所述顶点对应的特征为所述顶点包括的像素点的特征的平均值。
一种图像区域分割模型训练装置，所述装置包括获取单元、生成单元、确定单元和训练单元：

所述获取单元，用于获取样本图像集合，所述样本图像集合包括至少一个样本图像，每个所述样本图像具有其对应的第一标注信息；

所述生成单元，用于所述针对所述样本图像集合中的目标样本图像，生成所述目标样本图像对应的图结构数据；所述图结构数据中包括多个顶点，每个所述顶点包括所述目标样本图像中至少一个像素点；所述目标样本图像为所述样本图像集合中的任一个样本图像；

所述确定单元，用于通过图卷积网络模型，根据所述目标样本图像对应的图结构数据和所述目标样本图像对应的所述第一标注信息，确定所述顶点的第二标注信息；所述第二标注信息的粒度小于所述第一标注信息的粒度；所述图卷积网络模型为所述图形区域分割模型的一部分；

所述训练单元，用于根据所述第二标注信息对所述图像区域分割模型进行训练。
根据权利要求8所述的装置，所述第一标注信息包括目标区域在样本图像中的面积占比，所述确定单元具体用于：

通过所述图卷积网络模型，根据所述图结构数据得到每个顶点的预测结果；

根据所述面积占比和所述图结构数据中顶点的总数量，确定所述目标区域对应的第一顶点数量以及背景区域对应的第二顶点数量，所述背景区域为所述样本图像中除所述目标区域外的区域；

根据所述第一顶点数量、所述第二顶点数量和所述预测结果，确定所述顶点的第二标注信息。
一种图像区域分割方法，由数据处理设备执行，所述方法包括：

获取待分割图像；

通过图像区域分割模型生成所述待分割图像对应的图结构数据；所述图结构数据中包括多个顶点，每个所述顶点包括所述待分割图像中至少一个像素点；所述图像区域分割模型是根据第二标注信息训练得到的，所述第二标注信息是根据样本图像对应的图结构数据和所述样本图样对应的第一标注信息确定的；所述第二标注信息的粒度小于所述第一标注信息的粒度；

通过所述图像区域分割模型，根据所述待分割图像对应的图结构数据分割得到所述待分割图像中的目标区域。
根据权利要求10所述的方法，所述待分割图像为病理图像，所述目标区域为病灶。
一种图像区域分割装置，所述装置包括获取单元、生成单元和分割单元：

所述获取单元，用于获取待分割图像；

所述生成单元，用于通过图像区域分割模型生成所述待分割图像对应的图结构数据；所述图结构数据中包括多个顶点，每个所述顶点包括所述待分割图像中至少一个像素点；所述图像区域分割模型是根据第二标注信息训练得到的，所述第二标注信息是根据样本图像对应的图结构数据和所述样本图样对应的第一标注信息确定的；所述第二标注信息的粒度小于所述第一标注信息的粒度；

所述分割单元，用于通过所述图像区域分割模型，根据所述待分割图像对应的图结构数据分割得到所述待分割图像中的目标区域。
一种医疗器械，所述医疗器械包括图像采集模组、图像处理模组和图像显示模组：

所述图像采集模组，用于获取待分割图像；所述待分割图像为包括生物组织的病理图像；

所述图像处理模组，用于通过图像区域分割模型生成所述待分割图像对应的图结构数据；所述图结构数据中包括多个顶点，每个所述顶点包括所述待分割图像中至少一个像素点；所述图像区域分割模型是根据第二标注信息训练得到的，所述第二标注信息是根据样本图像对应的图结构数据和所述样本图样对应的第一标注信息确定的；所述第二标注信息的粒度小于所述第一标注信息的粒度；通过所述图像区域分割模型，根据所述图结构数据分割得到所述待分割图像中的病灶；

所述图像显示模组，用于显示所述病灶。
一种设备，所述设备包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行权利要求1-7或10-11任一项所述的方法。
一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行权利要求1-7或10-11任一项所述的方法。
一种计算机程序产品，包括指令，当其在计算机上运行时，使得计算机执行权利要求1-7或10-11任一项所述的方法。