CN114742119A

CN114742119A - 交叉监督的模型训练方法、图像分割方法及相关设备

Info

Publication number: CN114742119A
Application number: CN202111653265.8A
Authority: CN
Inventors: 林春晖; 熊剑平
Original assignee: Zhejiang Dahua Technology Co Ltd
Current assignee: Zhejiang Dahua Technology Co Ltd
Priority date: 2021-12-30
Filing date: 2021-12-30
Publication date: 2022-07-12

Abstract

本发明公开了一种交叉监督的模型训练方法、图像分割方法及相关设备，该交叉监督的模型训练方法包括：获取样本图像；将样本图像输入基础孪生网络，孪生网络包括网络结构相同的第一网络和第二网络，第一网络的基础参数与第二网络的基础参数不同；以第一网络的预测结果作为第二网络的标签，计算第二网络的损失，以第二网络的预测结果作为第一网络的标签，计算第一网络的损失，以获取孪生网络的损失；基于孪生网络的损失，迭代更新第一网络与第二网络的参数，直至满足训练截止条件；将训练更新后的第一网络或第二网络作为目标模型。通过上述方式，本发明能够减少样本图像的标注，提高模型运算准确率。

Description

交叉监督的模型训练方法、图像分割方法及相关设备

技术领域

本发明涉及图像处理技术领域，特别是涉及一种交叉监督的模型训练方法、图像分割方法及相关设备。

背景技术

目前，对分割模型、分类模型等网络模型训练时，需要对大量的样本数据进行人工标注，当需要标注像素级别的标签时，需要非常多的标注资源，标注难度大，而当标注样本数量少时，训练得到模型的运算准确率则无法保证。

发明内容

本发明主要解决的技术问题是提供一种交叉监督的模型训练方法、图像分割方法及相关设备，能够减少样本图像的标注，提高模型运算准确率。

为解决上述技术问题，本发明采用的一个技术方案是：提供一种交叉监督的模型训练方法，该交叉监督的模型训练方法包括：获取样本图像；将样本图像输入基础孪生网络，孪生网络包括网络结构相同的第一网络和第二网络，第一网络的基础参数与第二网络的基础参数不同；以第一网络的预测结果作为第二网络的标签，计算第二网络的损失，以第二网络的预测结果作为第一网络的标签，计算第一网络的损失，以获取孪生网络的损失；基于孪生网络的损失，迭代更新第一网络与第二网络的参数，直至满足训练截止条件；将训练更新后的第一网络或第二网络作为目标模型。

其中，样本图像包括一级样本图像和二级样本图像，一级样本图像带有一级标签，二级样本图像不具有一级标签，获取孪生网络的损失包括：将一级样本图像分别输入基础孪生网络的第一网络和第二网络，利用一级标签计算第一网络的第一损失，以及第二网络的第一损失；将二级样本图像分别输入基础孪生网络的第一网络和第二网络，以第一网络的预测结果作为第二网络中二级样本图像的一级标签，计算第二网络的第二损失，以第二网络的预测结果作为第一网络中二级样本图像的一级标签，计算第一网络的第二损失；结合第一网络的第一损失、第一网络的第二损失、第二网络的第一损失、第二网络的第二损失得到孪生网络的损失。

其中，二级样本图像带有二级标签，所述一级标签的分辨率高于所述二级标签的分辨率，基础孪生网络还包括第三网络和第四网络的第三网络和第四网络，利用二级标签计算第三网络的第三损失，以及第四网络的第三损失；结合第一网络的第一损失、第一网络的第二损失、第二网络的第一损失、第二网络的第二损失、第三网络的第三损失、第四网络的第三损失得到孪生网络的损失。

其中，结合第一网络的第一损失、第一网络的第二损失、第二网络的第一损失、第二网络的第二损失、第三网络的第三损失，第四网络的第三损失得到孪生网络的损失包括：将所述第一网络的第一损失、第一网络的第二损失、第二网络的第一损失、第二网络的第二损失、第三网络的第三损失与第四网络的第三损失加权相加，得到孪生网络的损失；其中，第一网络的第一损失、第二网络的第一损失、第三网络的第三损失与第四网络的第三损失的权重系数为1，第一网络的第二损失、第二网络的第二损失的权重系数小于1。

其中，目标模型为图像分割模型，一级样本图像带有像素级标注，二级样本图像带有图像级标注，第一网络和第二网络为分割分支网络，第三网络和第四网络为分类分支网络。

其中，该交叉监督的模型训练方法包括：将一级样本图像输入初始孪生网络，分别利用一级标签计算第一网络的初级损失，以及第二网络的初级损失，以获取孪生网络的初级损失；基于孪生网络的初级损失，迭代更新第一网络与第二网络的参数，直至满足训练截止条件，得到基础孪生网络。

为解决上述技术问题，本发明采用的另一个技术方案是：提供一种图像分割方法，该图像分割方法包括：获取待处理图像；利用图像分割模型对待处理图像进行处理，得到分割图像，图像分割模型是利用上述的交叉监督的模型训练方法训练得到的。

其中，利用图像分割模型对待处理图像进行处理，得到分割图像包括：将待处理图像输入图像分割模型，得到图像类别掩膜；融合图像类别掩膜与待处理图像，得到分割图像。

为解决上述技术问题，本发明采用的另一个技术方案是：提供一种交叉监督的模型训练设备，该交叉监督的模型训练设备包括处理器，处理器用于执行以实现上述的交叉监督的模型训练方法。

为解决上述技术问题，本发明采用的另一个技术方案是：提供一种计算机可读存储介质，计算机可读存储介质用于存储指令/程序数据，指令/程序数据能够被执行以实现上述的交叉监督的模型训练方法。

本发明的有益效果是：区别于现有技术的情况，本发明通过建立孪生网络，将两个网络的输出结果分别作为另一个网络的训练标签进行训练，使用该交叉监督的方法能够减少对初始样本图像的标注，提高模型运算的准确率。

附图说明

图1是本申请模型训练方法的一实施方式的流程示意图；

图2是本申请模型训练方法的另一实施方式的流程示意图；

图3是本申请孪生网络训练方法的一实施方式的流程示意图；

图4是本申请基础孪生网络一实施方式的结构示意图；

图5是本申请孪生网络训练方法的另一实施方式的流程示意图；

图6是本申请基础孪生网络另一实施方式的结构示意图；

图7是本申请孪生网络训练方法的又一实施方式的流程示意图；

图8是本申请初始孪生网络一实施方式的结构示意图；

图9是本申请图像分割方法一实施方式的流程示意图；

图10是本申请实施方式中交叉监督的模型训练方法装置的结构示意图；

图11是本申请实施方式中交叉监督的模型训练设备的结构示意图；

图12是本申请实施方式中计算机可读存储介质的结构示意图。

具体实施方式

为使本发明的目的、技术方案及效果更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。

本申请提供一种交叉监督的模型训练方法，通过建立孪生网络，将两个网络的输出结果分别作为另一个网络的训练标签进行训练，使用该交叉监督的方法能够减少对初始样本图像的标注，提高模型运算的准确率。

请参阅图1，图1是本申请模型训练方法的一实施方式的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图1所示的流程顺序为限。如图1所示，本实施方式包括：

S110：获取样本图像。

S130：将样本图像输入基础孪生网络。

孪生神经网络(Siamese neural network)，又名双生神经网络，是基于两个人工神经网络建立的耦合构架。孪生网络包括网络结构相同的第一网络和第二网络。构建第一网络的基础参数与第二网络的基础参数不同的基础孪生网络。将样本图像分别输入基础孪生网络的第一网络和第二网络。

S150：以第一网络的预测结果作为第二网络的标签，计算第二网络的损失，以第二网络的预测结果作为第一网络的标签，计算第一网络的损失，以获取孪生网络的损失。

将第一网络的输出结果，即预测结果作为第二网络的标签，利用第一网络的预测结果监督引导第二网络调整网络参数。将第二网络的输出结果，即预测结果作为第一网络的标签，利用第二网络的预测结果监督引导第一网络调整网络参数。具体地，分别计算两个网络的损失，得到孪生网络的总损失。

S170：基于孪生网络的损失，迭代更新第一网络与第二网络的参数，直至满足训练截止条件。

计算多个损失并迭代更新孪生网络中两个分支网络的参数，在训练过程中，因两个分支网络使用的是另一个分支网络的输出作为标签，则两个网络的网络参数越来越接近，直至孪生网络的损失满足训练截止条件，即损失小于预设损失，则停止训练。

S190：将训练更新后的第一网络或第二网络作为目标模型。

利用上述方法对孪生网络模型训练之后，其第一网络和第二网络的具体参数几近于相同，因此，可以选择其中一个分支网络作为目标模型。

该实施方式中，通过建立孪生网络，将两个网络的输出结果分别作为另一个网络的训练标签进行训练，使用该交叉监督的方法能够减少对初始样本图像的标注，提高模型运算的准确率。

在一实施方式中，获取样本图像之后，选择少量样本图像作为一级样本图像，并对一级样本图像及进行一级标注，得到对应的一级标签。将剩余的样本图像作为二级样本图像。在一具体实施方式中，可以选择 10％的样本图像作为一级样本图像，将90％的样本图像作为二级样本图像。

请参阅图2，图2是本申请模型训练方法的另一实施方式的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图2所示的流程顺序为限。如图2所示，本实施方式包括：

S210：获取一级样本图像和二级样本图像。

分别获取经过标注的一级样本图像和二级样本图像。

S230：利用一级样本图像和二级样本图像训练孪生网络的第一网络和第二网络。

首先构建孪生网络，其具有两个网络分支，分别为第一网络和第二网络，第一网络和第二网络具有相同的网络结构，为了使两个同样结构的网络产生差异，便于后续训练，分别对两个分支的权重参数采用随机 kaiming初始化。

将一级样本图像和二级样本图像分别输入孪生网络中，对该孪生网络进行训练。

在一实施方式中，因为第一样本图像具有一级标签，因此可以直接利用一级样本图像和其对应的一级标签训练孪生网络模型，而同时利用二级样本图像对孪生网络模型进行交叉监督训练。具体地，请参阅图3，图3是本申请孪生网络训练方法的一实施方式的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图3所示的流程顺序为限。如图3所示，本实施方式包括：

S310：将一级样本图像输入基础孪生网络，并分别利用一级标签计算第一网络的第一损失，以及第二网络的第一损失。

请参阅图4，图4是本申请基础孪生网络一实施方式的结构示意图。其中，上分支为基础孪生网络的第一网络。下分支为基础孪生网络的第二网络。将一级样本图像分别输入到该基础孪生网络的第一网络和第二网络中，利用基础孪生网络得到每个分支网络的预测结果。以输入的一级样本的一级标签作为该网络的监督信息，监督该网络训练。结合预测结果和对应的一级标签，利用损失函数计算基础孪生网络中第一网络的第一损失，以及第二网络的第一损失。具体地，损失函数可以选择交叉熵函数，具体计算方式如下：

其中，D^l表示一级样本图像，W表示一级样本图像的宽，H表示一级样本图像的高，p_1i表示基础孪生网络的第一网络的预测结果，p_2i表示基础孪生网络的第二网络的预测结果，

表示输入到第一网络中的一级样本图像的一级标签，

表示输入到第二网络中的一级样本图像的一级标签，l_ce表示交叉熵函数，l_ce交叉熵函数具体表示如下：

其中，x表示样本，y表示标签，a表示输出的预测结果，n表示样本总数量。

S330：将二级样本图像输入基础孪生网络，以第一网络的预测结果作为第二网络中二级样本图像的一级标签，计算第二网络的第二损失，以第二网络的预测结果作为第一网络中二级样本图像的一级标签，计算第一网络的第二损失。

请继续参阅图4，将二级样本图像分别输入到该基础孪生网络的第一网络和第二网络中，利用基础孪生网络得到每个分支网络的预测结果。通过双分支网络交叉监督的方式，将基础孪生网络的第一网络的预测结果作为第二网络中二级样本图像的一级标签，将该二级样本图像的一级标签作为第二网络的监督信息，监督第二网络训练。将基础孪生网络的第二网络的预测结果作为第一网络中二级样本图像的一级标签，将该二级样本图像的一级标签作为第一网络的监督信息，监督第一网络训练。具体地，结合第一网络的预测结果和对应的二级样本图像的一级标签，利用损失函数计算基础孪生网络中第一网络的第二损失；以及结合第二网络的预测结果和对应的二级样本图像的一级标签，利用损失函数计算基础孪生网络的第二网络的第二损失。具体地，损失函数可以选择交叉熵函数，具体计算方式如下：

其中，D^u表示二级样本，l_ce表示交叉熵损失函数，p_1i表示第一网络的预测结果，p_2i表示第二网络的预测结果，y_2i表示将第二网络的预测结果得到的二级样本图像的一级标签，y_1i表示将第一网络的预测结果得到的二级样本图像的一级标签。

对步骤S310和步骤S330的顺序不进行限定，可以先执行步骤S310，再执行步骤S330，也可以先执行步骤S330，再执行步骤S310。

S350：结合第一网络的第一损失、第一网络的第二损失、第二网络的第一损失、第二网络的第二损失得到孪生网络的损失。

具体地，将上述损失加权相加，得到孪生网络的损失。具体损失函数如下：

L＝L_s+λL_cps，

其中，λ为进行交叉监督时，损失函数的权重系数，λ<1。

S370：基于孪生网络的损失，迭代更新第一网络与第二网络的参数，直至满足训练截止条件。

计算多个损失并迭代更新孪生网络中两个分支网络的参数，直至孪生网络的损失满足训练截止条件，即损失小于预设损失，则停止训练。

在该实施方式中，因一级样本具有一级标签，利用一级样本训练孪生网络相较利用二级样本训练孪生网络时，训练效果更佳。但对数据样本进行一级标注的难度大，耗时久，因此，使用的一级样本数量较少。在另一实施方式中，为提高模型训练的效率，在训练之前，对一级样本设置一级标签的同时，对二级样本进行二级标注，得到二级样本的二级标签，其中，二级标签的分辨率低于一级标签，标注难度较小。具体地，请参阅图5，图5是本申请孪生网络训练方法的另一实施方式的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图5所示的流程顺序为限。如图5所示，本实施方式包括：

S510：将一级样本图像输入基础孪生网络，并分别利用一级标签计算第一网络的第一损失，以及第二网络的第一损失。

请参阅图6，图6是本申请基础孪生网络另一实施方式的结构示意图。如图6所示。图6的基础孪生网络是在图4的基础孪生网络基础上，在输出之前增加两个分支，作为第三网络和第四网络。

将一级样本图像分别输入到该基础孪生网络的第一网络和第二网络中，利用基础孪生网络得到每个分支网络的预测结果。以输入的一级样本的一级标签作为该网络的监督信息，监督该网络训练。计算得到基础孪生网络的有监督损失为L_s。

S530：将二级样本图像输入基础孪生网络，以第一网络的预测结果作为第二网络中二级样本图像的一级标签，计算第二网络的第二损失，以第二网络的预测结果作为第一网络中二级样本图像的一级标签，计算第一网络的第二损失。

请继续参阅图6，将二级样本图像分别输入到该基础孪生网络的第一网络和第二网络中，利用基础孪生网络得到每个分支网络的预测结果。通过双分支网络交叉监督的方式，监督该网络训练。计算得到基础孪生网络的有监督损失为L_cps。

S550：将二级样本图像输入基础孪生网络，并分别利用二级标签计算第一网络的第三损失，以及第二网络的第三损失。

将二级样本图像分别输入到该基础孪生网络的第三网络和第四网络中，利用基础孪生网络得到每个分支网络的预测结果。以输入的二级样本图片的二级标签作为该网络的监督信息，监督该网络训练。结合预测结果和对应的二级标签，利用损失函数计算基础孪生网络的第三网络的第三损失，以及第四网络的第三损失。具体地，损失函数可以选择交叉熵函数，具体计算方式如下：

其中，D^u表示二级样本，l_ce表示交叉熵损失函数，p_c1i表示第三网络的预测结果，p_c2i表示第四网络的预测结果，

表示输入到第三网络中的二级样本图像的二级标签，

表示输入到第四网络中的二级样本图像的二级标签。

对步骤S510、步骤S530和步骤S550的顺序不进行限定，在一实施方式中，可以先执行步骤S510，再执行步骤S550，再执行步骤S530。在另一实施方式中，也可以先执行步骤S530，再执行步骤S550，再执行步骤S510。

S570：结合第一网络的第一损失、第一网络的第二损失、第二网络的第一损失、第二网络的第二损失、第三网络的第三损失和第四网络的第三损失得到孪生网络的损失。

L＝L_s+λL_cps+L_cls，

其中，λ为进行交叉监督时，损失函数的权重系数，λ<1。

S590：基于孪生网络的损失，迭代更新第一网络与第二网络的参数，直至满足训练截止条件。

计算多个损失并迭代更新孪生网络中分支网络的参数，直至孪生网络的损失满足训练截止条件，即损失小于预设损失，则停止训练。

在该实施方式中，请参阅图7，图7是本申请孪生网络训练方法的又一实施方式的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图7所示的流程顺序为限。如图7所示，本实施方式包括：

S710：将一级样本图像输入初始孪生网络，分别利用一级标签计算第一网络的第一损失，以及第二网络的第一损失，以获取孪生网络的损失。

对于建立好的初始孪生网络，先将一级样本图像输入到网络模型中，请参阅图8，图8是本申请初始孪生网络一实施方式的结构示意图。利用一级样本图像对初始孪生网络的第一网络分支和第二网络分支分别训练多个周期。具体地，利用一级样本图像和一级标签分别计算第一网络和第二网络的初级损失。其中，损失函数可以选择交叉熵函数，具体计算方式如下：

表示输入到第一网络中的一级样本图像的一级标签，

表示输入到第二网络中的一级样本图像的一级标签，l_ce表示交叉熵函数。

S730：基于孪生网络的初级损失，迭代更新第一网络与第二网络的参数，直至满足训练截止条件，得到基础孪生网络。

计算损失并迭代更新初始孪生网络中分支网络的参数，直至孪生网络的损失满足训练截止条件，即损失小于预设损失，则停止训练，得到基础孪生网络。

S250：将训练更新后的第一网络或第二网络作为目标模型。

该实施方式中，采用半监督图像训练方法，通过双分支孪生网络的构建，只需对少量的样本数据进行一级标注，其余数据进行二级标注即可达到全部一级标注数据训练的效果。需要的标注资源少且准确率更高，同时能够提高模型准确率。同时，本申请提出了一种基于图像级标签的分类分支辅助半监督语义分割的训练，通过分类信息的监督使交叉监督的训练更加稳定，效果更好。

本申请获取的目标模型可以应用于多种图像处理的分割和分类中。在一具体实施方式中，本申请的交叉监督的模型训练方法可以应用于对肺腺癌的病例切片图像的处理。其中，病理切片是取一定大小的病变组织，包埋在石蜡块里用切片机切成薄片，再用苏木精-伊红(H-E)染色，用显微镜进一步检查病变。而肺腺癌是肺癌的一种，属于非小细胞癌，较易发生于女性及不抽烟者，且发病年龄较小。基于病理切片的语义分割作为AI辅助诊断中的常用技术，能够有效的减少医生的工作量，提高医生诊断的工作效率。

请参阅图9，图9是本申请图像分割方法一实施方式的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图9所示的流程顺序为限。如图9所示，本实施方式包括：

S910：获取病理切片样本图像。

首先，获取一定大小的病变组织，用病理组织学方法制成病理切片，通过病理切片扫描成像装置扫描成数字图像。其中，通常将病变组织包埋在石蜡块里，用切片机切成薄片，再用苏木精－伊红(H-E)染色。一般地，由于病理切片图像通常特别大，为80000像素x40000像素，因此还需要人工剪裁，挑选出需要ROI区域，进而完成数据集的构建，得到多个病理切片样本图像，作为样本图像集。

S920：对病理切片样本图像进行像素级标注。

从获取的病理切片样本图像集中随机挑选10％的数据作为一级样本图像，对一级样本图像进行像素级的图像标注，得到一级样本图像的一级标签，即像素级样本图像的像素级标签。具体地，通过标注工具标注出一张一级样本图像中的各种类型的组织，包括癌症上皮组织、癌症介质组织以及正常的组织等，不同大小的组织在标注时需选择合适的倍率，来达到更精准的标注效果。为方便处理，将一级样本图像缩放为 512x512分辨率的图像。

S930：对病理切片样本图像进行图像级标注。

将剩余的90％的数据作为二级样本图像，对二级样本图像进行图像级的图像标，得到二级样本图像的二级标签，即图像级样本图像的图像级标签。具体地，只需要对一张图片给出二级样本图像的一个图像级分类，例如癌症上皮组织、癌症介质组织以及正常的组织等中的一个。为方便处理，将二级样本图像缩放为512x512分辨率的图像。

S940：构建双分支孪生网络分别训练像素级样本图像。

在本申请的实施方式中，利用Pytorch框架，构建双分支Deeplabv3 的孪生网络。孪生网络具有两个相同的网络结构，为了使两个同样结构的网络产生差异，便于后续训练，分别对两个分支的权重参数采用随机 kaiming初始化。具体地，kaiming初始化如下：

其中，a为激活函数leaky-relu的负斜率，relu的负斜率为0，fan_in表示会保留前向传递中权重的方差大小。

将一级样本图像输入到如图4所示双分支孪生网络中进行训练，输出像素级样本图像的分割结果，将两个分支分别训练10个周期，以保证该网络模型的初始性能，防止之后进行交叉监督时的标签蔓延。训练过程中，计算初级损失，并迭代更新孪生网络中分支网络的参数，直至损失满足训练截止条件，即损失小于预设损失，则停止训练。

S950：利用双分支孪生网络交叉监督训练图像级样本图像。

利用上述方法，得到双分支孪生网络的基础网络之后，将图像级样本图像输入上述训练好的双分支孪生网络中继续训练，通过交叉监督的方式，相互训练，得到图像分割结果。具体地，如图6所示，将孪生网络第一分支的分割结果作为第二分支的二级样本图像的一级标签，监督第二分支网络训练，将孪生网络第二分支的分割结果作为第一分支的二级样本图像的一级标签，监督第一分支网络训练，得到交叉监督损失函数。

同时，将像素级样本图像也输入双分支孪生网络的第一分支和第二分支中，两个分支网络分别监督训练，得到图像分割结果。并计算有监督损失函数。

同时，可以第三网络和第四网络作为分类分支，主要是在第一网络和第二网络的特征图上增加2个卷积层和池化层，将图像级样本图像输入双分支孪生网络的第三网络和第四网络的分类分支中，利用图像级样本图像的二级标签对其进行有监督训练，得到分类结果，虽然二级标签分辨率低于一级标签，但由于具有二级标签的图像更多，因此，引入分类分支可以加强交叉监督的准确率，避免在交叉监督训练的一开始走偏。具体地，预测得到每个类别的得分置信度并计算分类损失。

计算上述多个损失并迭代更新孪生网络中分支网络的参数，直至损失满足训练截止条件，即损失小于预设损失，则停止训练。

S960：部署单分支模型作为分割模型。

经过步骤S940-步骤S960中双分支孪生网络的交叉监督学习，每一个分支都训练了10％的像素级标签数据和90％的图像级标签数据，对于癌症上皮、介质以及正常组织的分割效果都有了显著的提升。同时由于交叉监督的原因，两个分支最后都学到了相近的特征提取能力，因此在部署时，我们只需要部署其中第一个分支，即可以达到相同的效果。最终通过TensorRT工具加速模型推理速度，将Deeplabv3网络部署在嵌入式芯片。

S970：利用预测模型对数字病理切片图像进行分割。

获取需要处理的病理组织，通过病理切片扫描成像装置扫描成数字图像，此时通过图像采集卡获取数字病理切片图像，并传输到分割模型中。

对图像预处理得到512x512大小后，利用分割模型对数字病理切片图像处理，通过单一分支的Deeplabv3模型分析每一个像素对应的癌症上皮、介质和组织类别，得到对不同图像类别的标注，作为图像类别掩模。在一实施方式中，对不同的组织类型使用不同的颜色标注，如黄色表示正常组织，蓝色表示癌症上皮，绿色表示癌症介质。

将图像类别掩模于输入的数字病理切片图像进行融合，得到分割图像。

现有的比较准确的病理切片诊断主要通过语义分割的方法，但是语义分割所需的像素级的标签，需要的非常多的标注资源。并且由于病理切片的标注需要较深的专业基础，难以获得标注人员。或者目前的方法只标注了少量的数据，模型的泛化能力一般，难以有较好的辅助诊断效果。因此，在该实施方式中，采用半监督图像分割方法，通过双分支孪生网络的构建，只需对10％的数据进行像素级标注，其余数据进行图像级标注即可达到全部像素级标注数据训练的效果。需要的标注资源少且准确率更高，可以明显解决医学病理切片数据量少，标注资源稀缺的问题，同时能够达到较高的分割准确率。同时，本申请提出了一种基于图像级标签的分类分支辅助半监督语义分割的训练，通过分类信息的监督使交叉监督的训练更加稳定，效果更好。

请参阅图10，图10是本申请实施方式中交叉监督的模型训练装置的结构示意图。该实施方式中，交叉监督的模型训练装置包括获取模块 01、输入模块02、预测模块03和更新模块04。

其中，获取模块01用于获取样本图像；输入模块02用于将样本图像输入基础孪生网络，孪生网络包括网络结构相同的第一网络和第二网络；预测模块03用于以第一网络的预测结果作为第二网络的标签，计算第二网络的损失，以第二网络的预测结果作为第一网络的标签，计算第一网络的损失，以获取孪生网络的损失；基于孪生网络的损失，迭代更新第一网络与第二网络的参数，直至满足训练截止条件；更新模块04 用于将训练更新后的第一网络或第二网络作为目标模型。该交叉监督的模型训练装置用于通过建立孪生网络，将两个网络的输出结果分别作为另一个网络的训练标签进行训练，使用该交叉监督的方法能够减少对初始样本图像的标注，提高模型运算的准确率。

请参阅图11，图11是本申请实施方式中交叉监督的模型训练设备的结构示意图。该实施方式中，交叉监督的模型训练设备11包括处理器12。

处理器12还可以称为CPU(Central Processing Unit，中央处理单元)。处理器12可能是一种集成电路芯片，具有信号的处理能力。处理器12 还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器12也可以是任何常规的处理器等。

交叉监督的模型训练设备11可以进一步包括存储器(图中未示出)，用于存储处理器12运行所需的指令和数据。

处理器12用于执行指令以实现上述本申请交叉监督的模型训练方法和图像分割方法任一实施例及任意不冲突的组合所提供的方法。

请参阅图12，图12是本申请实施方式中计算机可读存储介质的结构示意图。本申请实施例的计算机可读存储介质21存储有指令/程序数据22，该指令/程序数据22被执行时实现本申请交叉监督的模型训练方法和图像分割方法任一实施例以及任意不冲突的组合所提供的方法。其中，该指令/程序数据22可以形成程序文件以软件产品的形式存储在上述存储介质21中，以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质21包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM， Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质，或者是计算机、服务器、手机、平板等终端设备。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅为本发明的实施方式，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种交叉监督的模型训练方法，其特征在于，所述方法包括：

获取样本图像；

将所述样本图像输入基础孪生网络，孪生网络包括网络结构相同的第一网络和第二网络，所述第一网络的基础参数与所述第二网络的基础参数不同；

以所述第一网络的预测结果作为所述第二网络的标签，计算所述第二网络的损失，以所述第二网络的预测结果作为所述第一网络的标签，计算所述第一网络的损失，以获取所述孪生网络的损失；

基于所述孪生网络的损失，迭代更新所述第一网络与所述第二网络的参数，直至满足训练截止条件；

将训练更新后的所述第一网络或所述第二网络作为目标模型。

2.根据权利要求1所述的交叉监督的模型训练方法，其特征在于，

所述样本图像包括一级样本图像和二级样本图像，所述一级样本图像带有一级标签，所述二级样本图像不具有所述一级标签，所述获取所述孪生网络的损失包括：

将所述一级样本图像分别输入所述基础孪生网络的第一网络和第二网络，利用所述一级标签计算所述第一网络的第一损失，以及所述第二网络的第一损失；将所述二级样本图像分别输入所述基础孪生网络的第一网络和第二网络，以所述第一网络的预测结果作为所述第二网络中二级样本图像的一级标签，计算所述第二网络的第二损失，以所述第二网络的预测结果作为所述第一网络中二级样本图像的一级标签，计算所述第一网络的第二损失；

结合所述第一网络的第一损失、所述第一网络的第二损失、所述第二网络的第一损失、所述第二网络的第二损失得到所述孪生网络的损失。

3.根据权利要求2所述的交叉监督的模型训练方法，其特征在于，

所述二级样本图像带有二级标签，所述一级标签的分辨率高于所述二级标签的分辨率，所述基础孪生网络还包括第三网络和第四网络，所述获取所述孪生网络的损失还包括：

将所述二级样本图像分别输入所述基础孪生网络的第三网络和第四网络，利用所述二级标签计算所述第三网络的第三损失，以及所述第四网络的第三损失；

结合所述第一网络的第一损失、所述第一网络的第二损失、所述第二网络的第一损失、所述第二网络的第二损失、所述第三网络的第三损失、所述第四网络的第三损失得到所述孪生网络的损失。

4.根据权利要求3所述的交叉监督的模型训练方法，其特征在于，所述结合所述第一网络的第一损失、所述第一网络的第二损失、所述第二网络的第一损失、所述第二网络的第二损失、所述第三网络的第三损失，所述第四网络的第三损失得到所述孪生网络的损失包括：

将所述第一网络的第一损失、所述第一网络的第二损失、所述第二网络的第一损失、所述第二网络的第二损失、所述第三网络的第三损失与所述第四网络的第三损失加权相加，得到所述孪生网络的损失；

其中，所述第一网络的第一损失、所述第二网络的第一损失、所述第三网络的第三损失与所述第四网络的第三损失的权重系数为1，所述第一网络的第二损失、所述第二网络的第二损失的权重系数小于1。

5.根据权利要求3所述的交叉监督的模型训练方法，其特征在于，

所述目标模型为图像分割模型，所述一级样本图像带有像素级标注，所述二级样本图像带有图像级标注，所述第一网络和所述第二网络为分割分支网络，所述第三网络和所述第四网络为分类分支网络。

6.根据权利要求2所述的交叉监督的模型训练方法，其特征在于，所述方法还包括：

将所述一级样本图像输入初始孪生网络，分别利用所述一级标签计算所述第一网络的初级损失，以及所述第二网络的初级损失，以获取所述孪生网络的初级损失；

基于所述孪生网络的初级损失，迭代更新所述第一网络与所述第二网络的参数，直至满足训练截止条件，得到所述基础孪生网络。

7.一种图像分割方法，其特征在于，包括：

获取待处理图像；

利用图像分割模型对所述待处理图像进行处理，得到分割图像，所述图像分割模型是利用如权利要求1-6任一项所述的交叉监督的模型训练方法训练得到的。

8.根据权利要求7所述的图像分割方法，其特征在于，

所述利用图像分割模型对所述待处理图像进行处理，得到分割图像包括：

将所述待处理图像输入所述图像分割模型，得到图像类别掩膜；

融合所述图像类别掩膜与所述待处理图像，得到所述分割图像。

9.一种交叉监督的模型训练设备，其特征在于，包括处理器，所述处理器用于执行指令以实现如权利要求1-6任一项所述的交叉监督的模型训练方法或权利要求7-8任一项所述的图像分割方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储指令/程序数据，所述指令/程序数据能够被执行以实现如权利要求1-6任一项所述的交叉监督的模型训练方法或权利要求7-8任一项所述的图像分割方法。