WO2021164534A1

WO2021164534A1 - 图像处理方法、装置、设备及存储介质

Info

Publication number: WO2021164534A1
Application number: PCT/CN2021/074722
Authority: WO
Inventors: 刘钰安
Original assignee: Oppo广东移动通信有限公司
Priority date: 2020-02-18
Filing date: 2021-02-01
Publication date: 2021-08-26
Also published as: CN111369581B; CN111369581A

Abstract

一种图像处理方法、装置、设备及存储介质，属于图像处理领域。该方法包括：获取原始图像，该原始图像中包含至少一个目标对象（201）；将原始图像输入第一预测模型，得到第一预测模型输出的第一透明通道图像，第一透明通道图像中包括原始图像中各个像素点对应的预测透明度值（202）；将第一透明通道图像和原始图像输入第二预测模型，得到第二预测模型输出的第二透明通道图像，第二透明通道图像的精细度高于第一透明通道图像的精细度（203）；根据第二透明通道图像对原始图像进行分割处理，得到目标对象对应的图像（204）。相较于相关技术中的图像分割方法，无需引入三分图，可以实现从原始图像直接生成透明通道图像，进一步提升了进行图像分割的准确性。

Description

图像处理方法、装置、设备及存储介质

本申请要求于2020年02月18日提交的申请号为202010099612.6、发明名称为“图像处理方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及图像处理领域，特别涉及一种图像处理方法、装置、设备及存储介质。

背景技术

图像分割指在静态图像或连续的视频序列中精确地将感兴趣的前景对象从背景中分离出来的过程，在人像虚化、背景替换等方面具有广泛应用，对于图像分割任务来说，主要任务是得到透明通道图像，透明通道图像中标注有各个像素点对应的透明度值，其中，透明度值为1的区域为前景图像区域，透明度为0的区域为背景图像区域，利用得到的透明通道图像可以将原图中的前景图像分离出来。

相关技术中，提供了一种图像分割方法，需要根据原图生成三分图，三分图用来将原图分为三个部分，分别是确定的前景图像区域、确定的背景图像区域和不确定区域，利用三分图首先确定出不确定区域，再将三分图和原图输入训练完成的神经网络中，确定出不确定区域中的各个像素点对应的透明度值，从而输出用于图像分割的透明通道图像。

显然，相关技术中得到的透明通道图像依赖于三分图的精确性，而三分图需要依赖于训练特定神经网络产生或由人工标注得到，导致生成的透明通道图像的精确性较低。

发明内容

本申请实施例提供了一种图像处理方法、装置、设备及存储介质。所述技术方案如下：

一方面，本申请实施例提供了一种图像处理方法，所述方法包括：

获取原始图像，所述原始图像中包含至少一个目标对象；

将所述原始图像输入第一预测模型，得到所述第一预测模型输出的第一透明通道图像，所述第一透明通道图像中包括所述原始图像中各个像素点对应的预测透明度值；

将所述第一透明通道图像和所述原始图像输入第二预测模型，得到所述第二预测模型输出的第二透明通道图像，所述第二透明通道图像的精细度高于所述第一透明通道图像的精细度；

根据所述第二透明通道图像对所述原始图像进行分割处理，得到所述目标对象对应的图像。

另一方面，本申请实施例提供了一种图像处理装置，所述装置包括：

第一获取模块，用于获取原始图像，所述原始图像中包含至少一个目标对象；

第一预测模块，用于将所述原始图像输入第一预测模型，得到所述第一预测模型输出的第一透明通道图像，所述第一透明通道图像中包括所述原始图像中各个像素点对应的预测透明度值；

第二预测模块，用于将所述第一透明通道图像和所述原始图像输入第二预测模型，得到所述第二预测模型输出的第二透明通道图像，所述第二透明通道图像的精细度高于所述第一透明通道图像的精细度；

分割处理模块，用于根据所述第二透明通道图像对所述原始图像进行分割处理，得到所述目标对象对应的图像。

另一方面，本申请实施例提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述方面所述的图像处理方法。

另一方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述方面所述的图像处理方法。

另一方面，本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述方面的各种可选实现方式中提供的图像处理方法。

附图说明

图1示出了本申请一个示例性实施例提供的图像处理方法的流程图；

图2示出了本申请一个示例性实施例示出的图像处理方法的流程图；

图3示出了本申请一个示例性实施例示出的第一预测模型的训练方法的流程图；

图4示出了本申请另一个示例性实施例示出的第一预测模型的训练方法的流程图；

图5示出了本申请一个示例性实施例示出的第一预测模型的训练方法的过程示意图；

图6示出了多尺度解码网络使用的各个卷积块的结构示意图；

图7示出了本申请一个示例性实施例示出的第二预测模型的训练方法的流程图；

图8示出了本申请另一个示例性实施例示出的第二预测模型的训练方法的流程图；

图9示出了本申请一个示例性实施例示出的第二预测模型的训练方法的过程示意图；

图10示出了本申请另一个示例性实施例示出的图像处理方法的流程图；

图11示出了本申请另一个示例性实施例示出的图像处理方法的流程图；

图12示出了本申请一个示例性实施例示出的图像处理方法的网络部署图；

图13示出了本申请一个示例性实施例提供的图像处理装置的结构框图；

图14示出了本申请一个示例性实施例提供的计算机设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

在本文中提及的“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

图像分割指在静态图像或连续的视频序列中精确地将感兴趣的前景对象从背景中分离出来的过程，在图像分割任务中，需要生成用于分割出前景图像的透明通道图像，透明通道图像中包含有各个像素点对应的透明度值，比如，透明度值为1的区域代表前景图像区域，透明度为0的区域代表背景图像区域，因此，可以利用得到的透明通道图像将原图中的前景图像分离出来。

相关技术中提出了一种图像处理方法，主要分为两个阶段，第一阶段是：根据原图生成三分图，该三分图用于将原图分为三个部分，分别是确定的前景图像区域、确定的背景图像区域和不确定区域，通过生成的三分图可以划分出原图中的不确定区域；第二阶段是：将生成的三分图和原图输入训练完成的神经网络中，确定出不确定区域各个像素点对应的透明度值，从而输出用于图像分割的透明通道图像。

采用上述相关技术中的方法，若三分图划分出的不确定区域不够准确，则生成的透明通道图的精确性就会较低，从而影响图像分割的准确率。而且，三分图还需依赖特定的神经网络生成或需要人工进行标注，增加了训练过程的繁琐性，不能直接由原图生成对应的透明通道图像。

为了解决上述问题，本申请实施例提供了一种图像处理方法。请参考图1，其示出了本申请一个示例性实施例提供的图像处理方法的流程图。该方法包括：

步骤101，根据样本图像和样本分割图像训练第一预测模型，第一预测模型用于生成第一透明通道图像，第一透明通道图像中包括原始图像中各个像素点对应的预测透明度值。

步骤102，根据样本图像、第一样本透明通道图像和样本标注图像训练第二预测模型，第一样本透明通道图像为将样本图像输入第一预测模型中得到，第二预测模型用于生成第二透明通道图像，第二透明通道图像的精细度高于第一透明通道图像的精细度。

步骤103，将原始图像进行预处理后，输入训练完成的第一预测模型，得到第一预测模型输出的第一透明通道图像。

步骤104，将第一透明通道图像和原始图像输入第二预测模型，得到第二预测模型输出的第二透明通道图像。

步骤105，根据第二透明通道图像对原始图像进行分割处理，得到前景图像。

本申请实施例中，通过训练可以生成透明通道图像的第一预测模型和第二预测模型，将原始图像预处理后输入第一预测模型，得到第一预测模型输出的第一透明通道图像，并将生成的第一透明通道图像和原始图像重新输入第二预测模型，得到第二预测模型输出的第二透明通道图像，以便将该第二透明通道图像用于图像处理，相比于相关技术中，无需生成三分图，可以实现由原始图像直接生成透明通道图像，进一步提高了透明通道图像的精度，从而提高了图像分割的准确率。

需要说明的是，本申请各个实施例提供的图像处理方法可以用于具有图像处理功能的计算机设备，该计算机设备可以是智能手机、平板电脑、个人便携式计算机等。在一种可能的实施方式中，本申请实施例提供的图像处理方法可以应用于需要进行图像分割、背景替换、目标对象虚化等任务的应用程序。比如，具有美颜功能的应用程序；可选的，本申请各个实施例提供的图像处理方法中预测模型的训练过程可以在服务器中进行，并在预测模型训练完成之后，将训练完成的预测模型部署在计算机设备中进行后续的图像处理；可选的，本申请各个实施例提供的图像处理方法也可以用于具有图像处理功能的服务器。

为了便于描述，在下述方法实施例中，仅以图像处理方法的执行主体是计算机设备为例进行介绍说明。

请参考图2，其示出了本申请一个示例性实施例示出的图像处理方法的流程图。本实施例以该方法用于计算机设备为例进行说明，该方法包括如下步骤。

步骤201，获取原始图像。

由于本申请实施例中图像处理的目的在于将前景图像从原始图像中分离出来，前景图像即目标对象对应的图像。因此，原始图像中应该至少包含一个目标对象。

其中，目标对象可以是人物、景物、动物、物品等，本申请实施例对目标对象的类型不构成限定。

在一种可能的实施方式中，在对原始图像进行处理之前，可以对原始图像进行预处理，进行预处理的方式可以包括随机旋转、随机左右翻转、随机裁剪、伽马(Gamma)变换等在内的数据增强处理，以便用于后续的特征提取过程。

步骤202，将原始图像输入第一预测模型，得到第一预测模型输出的第一透明通道图像，第一透明通道图像中包括原始图像中各个像素点对应的预测透明度值。

其中，第一透明通道图像为概率图，即第一透明通道图像中各个像素点对应的预测透明度值的取值为0-1，比如，某一像素点的预测透明度值为0.9。

针对第一预测模型，其根据样本图像、样本标注图像、样本分割图像训练得到，而样本标注图像中标注有样本图像中各个像素点对应的标准透明度值，因此，在一种可能的实施方式中，将原始图像经过预处理之后，输入训练完成的第一预测模型中，可以得到预测的第一透明通道图像，该第一透明通道图像中包括原始图像中各个像素点对应的预测透明度值。

步骤203，将第一透明通道图像和原始图像输入第二预测模型，得到第二预测模型输出的第二透明通道图像，第二透明通道图像的精细度高于第一透明通道图像的精细度。

由于分割图像的精确度取决于获得的透明通道图像的精确度，因此，为了提高第一透明通道图像的精确度，部署有第二预测模型，该第二预测模型可以根据输入的原始图像和第一透明通道图像，生成精细度更高的第二透明通道图像。

其中，第二预测模型主要用于修正第一预测透明通道图像中各个像素点的透明度值，使得第二透明通道图像中各个像素点的预测透明度值更接近标准透明度值。

在一种可能的实施方式中，将第一透明通道图像和原始图像经过拼接(Concat)处理后，输入第二预测模型，可以得到精细度更高的第二透明通道图像，以便用于后续的图像分割处理过程中。

步骤204，根据第二透明通道图像对原始图像进行分割处理，得到目标对象对应的图像。

在一种可能的实施方式中，第二透明通道图像中包含有各个像素点对应的预测透明度值，由于前景图像对应的透明度值为1，背景图像对应的透明度值为0，因此，根据第二透明通道图像可以将原始图像中的前景图像和背景图像分离，从而可以得到目标对象对应的图像。

综上所述，本申请实施例中，将获取到的原始图像输入第一预测模型，得到第一预测模型输出的第一透明通道图像(包括原始图像中各个像素点对应的预测透明度值)，从而将第一透明通道图像和原始图像输入第二预测模型，得到第二预测模型输出的第二透明通道图像，用于根据第二透明通道图像对原始图像进行分割处理，得到目标对象对应的图像。由于第二透明通道图像的精细度高于第一透明通道图像的精细度，因此，可以提高图像分割的准确率；相较于相关技术中的图像分割方法，无需引入三分图，可以实现从原始图像直接生成用于分割的透明通道图像，进一步提升了进行图像分割的准确性。

可选的，获取原始图像之前，方法还包括：

获取样本图像、样本标注图像和样本分割图像，样本标注图像中标注有样本图像中各个像素点对应的透明度值，样本分割图像是对样本标注图像进行二值化处理得到的二值化图像；

根据样本图像和样本分割图像，训练第一预测模型；

将样本图像输入训练得到的第一预测模型，得到第一预测模型输出的第一样本透明通道图像；

根据第一样本透明通道图像、样本标注图像和样本图像，训练第二预测模型。

可选的，根据第一样本透明通道图像、样本标注图像和样本图像，训练第二预测模型，包括：

将第一样本透明通道图像和样本图像输入精细化网络，得到精细化网络输出的第二样本透明通道图像；

将样本图像、第二样本透明通道图像和样本标注图像输入边缘梯度网络，得到第二样本透明通道图像对应的边缘梯度损失；

根据第二样本透明通道图像和样本标注图像，计算第二样本透明通道图像对应的结构相似性损失和抠图损失；

将第二样本透明通道图像和样本标注图像输入连通性差异网络，得到第二样本透明通道图像对应的连通性差异损失；

根据边缘梯度损失、连通性差异损失、抠图损失和结构相似性损失，训练精细化网络；

将训练得到的精细化网络确定为第二预测模型。

可选的，将样本图像、第二样本透明通道图像和样本标注图像输入边缘梯度网络，得到第二样本透明通道图像对应的边缘梯度损失，包括：

将样本图像输入预设算子中，得到样本图像对应的样本梯度图像，预设算子用于对原始样本图像进行一阶倒数运算；

对样本标注图像进行二值化和膨胀腐蚀操作，得到样本边缘图像，样本边缘图像用于指示样本标注图像中前景图像和背景图像的交界区域；

根据样本边缘图像和样本梯度图像，生成样本边缘梯度图像，样本边缘梯度图像用于指示样本图像中前景图像和背景图像的交界区域；

根据第二样本透明通道图像和样本边缘图像，生成边缘透明通道图像，边缘透明通道图像用于指示第二样本透明通道图像中前景图像和背景图像的交界区域；

根据边缘透明通道图像和样本边缘梯度图像，计算得到边缘梯度损失。

可选的，第一预测模型包括多尺度编码网络、特征金字塔网络、多尺度解码网络和深度监督网络；

根据样本图像和样本分割图像，训练第一预测模型，包括：

将样本图像输入多尺度编码网络，得到多尺度编码网络输出的m个第一样本特征图，其中，不同第一样本特征图的分辨率和通道数不同，m为大于等于2的整数，多尺度编码网络用于对样本图像进行特征提取；

将m个第一样本特征图输入特征金字塔网络，得到特征金字塔网络输出的m个第二样本特征图，其中，不同第二样本特征图的通道数相同且分辨率不同，特征金字塔网络用于将m个第一样本特征图的通道数处理为目标通道数；

将m个第二样本特征图输入多尺度解码网络，得到多尺度解码网络输出的第一样本透明通道图像，多尺度解码网络用于对m个第二样本特征图进行相加和分辨率转换操作，第一样本透明通道图像的分辨率与样本图像的分辨率相同；

将m个第二样本特征图输入深度监督网络，得到深度监督网络输出的m个第三样本透明通道图像，深度监督网络用于对m个第二样本特征图进行上采样处理，不同第二样本特征图对应不同上采样倍数，m个第三样本透明通道图像的分辨率与样本图像的分辨率相同；

对第一样本透明通道图像和m个第三样本透明通道图像进行二值化处理，得到第一样本分割图像和m个第二样本分割图像；

根据第一样本分割图像、m个第二样本分割图像和样本分割图像，训练第一预测模型。

可选的，将原始图像输入第一预测模型，得到第一预测模型输出的第一透明通道图像，包括：

将原始图像输入多尺度编码网络，得到多尺度编码网络输出的n个第一特征图，其中，不同第一特征图的分辨率和通道数不同，n为大于等于2的整数；

将n个第一特征图输入特征金字塔网络，得到特征金字塔网络输出的n个第二特征图，其中，不同第二特征图的通道数相同且分辨率不同，n个第二特征图的通道数为目标通道数；

将n个第二特征图输入多尺度解码网络，得到多尺度解码网络输出的第一透明通道图像。

可选的，将n个第一特征图输入特征金字塔网络，得到特征金字塔网络输出的n个第二特征图，包括：

将n个第一特征图按照分辨率排列形成特征金字塔，特征金字塔中第一特征图的分辨率与第一特征图所在层级呈负相关关系；

响应于第n第一特征图对应的通道数为最大通道数，对第n第一特征图进行卷积处理，得到第n第二特征图；

响应于第n第一特征图对应的通道数不是最大通道数，对第n第一特征图进行卷积处理后得到第四特征图，对第n+1第一特征图进行卷积和上采样处理后得到第五特征图，对第四特征图和第五特征图进行混合，并进行卷积处理后得到第n第二特征图。

可选的，将n个第二特征图输入多尺度解码网络，得到多尺度解码网络输出的第一透明通道图像，包括：

将n个第二特征图分别通过卷积块处理，得到n个第三特征图，n个第三特征图对应的分辨率相同，其中，不同第二特征图对应不同卷积块，且不同第二特征图对应使用的卷积块数目不同；

对n个第三特征图进行相加、卷积和上采样处理，得到第一透明通道图像。

可选的，将m个第一样本特征图输入特征金字塔网络，得到特征金字塔网络输出的m个第二样本特征图，包括：

将m个第一样本特征图按照分辨率形成样本特征金字塔，样本特征金字塔中第一样本特征图的分辨率与第一样本特征图所在层级呈负相关关系；

响应于第m第一样特征图对应的通道数为最大通道数，对第m第一样本特征图进行卷积处理，得到第m第二样本特征图；

响应于第m第一样本特征图对应的通道数不是最大通道数，对第m第一样本特征图进行卷积处理后得到第一中间样本特征图，对第m+1第一样本特征图进行卷积和上采样处理后得到第二中间样本特征图，对第一中间样本特征图和第二中间样本特征图进行混合，并进行卷积处理后得到第m第二样本特征图。

在一种可能的实施方式中，由于生成第二透明通道图像的过程分为两个预测模型阶段，即第一预测模型和第二预测模型，因此，在模型训练阶段，也应该包括第一预测模型的训练阶段和第二预测模型的训练阶段。

请参考图3，其示出了本申请一个示例性实施例示出的第一预测模型的训练方法的流程图。该方法包括：

步骤301，获取样本图像、样本标注图像和样本分割图像，样本标注图像中标注有样本图像中各个像素点对应的透明度值，样本分割图像是对样本标注图像进行二值化处理得到的二值化图像。

针对第一预测模型的训练过程，所采用的数据集中包括预设数量的数据对，每个数据对均为样本图像和样本图像对应的样本标注图像，其中，样本标注图像中标注有对应的样本图像中各个像素点对应的标准透明度值。

可选的，预设数量可以由开发人员自行设置，数据对的数量越多，第一预测模型的预测准确性就越高。比如，数据集中可以包括5000个数据对。

可选的，样本标注图像可以由开发人员进行标注得到。

可选的，第一预测模型可以基于深度学习张量库(PyTorch)框架，以及图形处理器(Graphics Processing Unit，GPU)来进行训练。

为了使得第一预测模型可以快速的收敛，从而提高第一预测模型的训练速度，使用样本分割图像和原始图像训练第一预测模型。

针对样本分割图像的获取方式，在一种可能的实施方式中，可以将样本标注图像进行二值化处理得到，即设置有透明度阈值，若像素点对应的透明度值大于该透明度阈值时，则将该像素点对应的透明度值用1表示，若像素点对应的透明度值小于该透明度阈值时，则将该像素点对应的透明度值用0表示，使得样本标注图像中各个像素点对应的透明度值均为0或1。

可选的，透明度阈值可以由开发人员进行设置，比如，透明度阈值可以为0.8，即将大于0.8的像素点的透明度值用1表示，小于0.8的像素点的透明度值用0表示。

在一种可能的实施方式中，将获取到的预设数量的样本图像和样本分割图像按照一定比例分为测试集和样本集，其中，样本集用于后续对第一预测模型的训练过程，测试集用于对第一预测模型的校验过程。

可选的，预设比例可以由开发人员进行设置，比如，预设比例为2:8，则可以将数据集按照2:8的比例划分为测试集和样本集。

步骤302，根据样本图像和样本分割图像，训练第一预测模型。

在一种可能的实施方式中，可以通过对图像进行预处理，来扩充样本数据量，比如，对样本集中的样本图像进行随机旋转、随机左右翻转、随机裁剪、Gamma变换等预处理。本申请实施例对样本图像的预处理方式不构成限定。

在一种可能的实施方式中，第一预测模型可以包括用于特征提取的多尺度编码网络、用于复合和整合特征的特征金字塔网络、用于特征解码的多尺度解码网络以及用于从多个尺度对深层特征进行监督的深度监督网络等，以实现快速收敛并产生初步分割结果。

示意性的，如图4所示，步骤302可以包括步骤302A至302F。

步骤302A，将样本图像输入多尺度编码网络，得到多尺度编码网络输出的m个第一样本特征图，m为大于等于2的整数。

由于多尺度编码网络用于从不同尺度(分辨率)上对样本图像进行特征提取，因此，将样本图像输入多尺度编码网络中，通过在不同分辨率上对样本图像进行特征提取，可以得到具有不同分辨率的样本特征图，即不同第一样本特征图的分辨率和通道数不同，m为大于等于2的整数。

其中，多尺度编码网络可以采用用于特征提取的神经网络模型，比如，移动面部网络(MobileNetV2)模型，本申请实施例对多尺度编码网络采用的神经网络模型不构成限定。

在一种可能的实施方式中，将经过预处理之后的样本图像输入多尺度编码网络，通过多尺度编码网络对样本图像进行多尺度特征提取，可以得到m个第一样本特征图，由于是进行了多个尺度上的特征提取，因此，得到的m个第一样本特征图的分辨率和通道数均不相同。

示意性的，若m取4，则得到的m个第一样本特征图可以为：320×1/32、64×1/16、32×1/8、24×1/4，其中，320、64、32、24表示各个第一样本特征图对应的通道数，1/32、1/16、1/8、1/4表示各个第一样本特征图相对于样本图像的分辨率，比如，1/4表示第一样本特征图对应的分辨率为样本图像的1/4。

示意性的，如图5所示，将样本图像输入多尺度编码网络501中，进行多尺度特征提取之后，得到多尺度编码网络501输出的4个第一样本特征图，4个第一样本特征图对应的通道数和分辨率分别为：320×1/32、64×1/16、32×1/8、24×1/4。

步骤302B，将m个第一样本特征图输入特征金字塔网络，得到特征金字塔网络输出的m个第二样本特征图。

其中，不同第二样本特征图的通道数相同且分辨率不同。

其中，特征金字塔网络用于对提取到的特征图进行混合，并将其对应的通道数处理为目标通道数。

在一种可能的实施方式中，将m个第一样本特征图输入特征金字塔网络，通过特征金字塔网络对m个第一样本特征图进行特征整合和复用，得到m个第二样本特征图。

在一个示例性的例子中，特征金字塔网络对第一样本特征图进行处理的过程可以包括以下步骤：

一、将m个第一样本特征图按照分辨率形成样本特征金字塔，样本特征金字塔中第一样本特征图的分辨率与第一样本特征图所在层级呈负相关关系。

在一种可能的实施方式中，将多尺度编码网络输出的m个第一样本特征图，输入特征金字塔网络，首先按照各个第一样本特征图分辨率的大小排列形成样本特征金字塔，其中，第一样本特征图在该样本特征金字塔上所处的层级与其分辨率呈负相关关系。

示意性的，如图5所示，将多尺度编码网络输出的4个第一样本特征图输入特征金字塔网络502中，首先按照分辨率的高低排列形成第一样本特征金字塔(如特征金字塔网络的左边金字塔所示)，即第一样本特征金字塔中包含的各个层级与其对应的第一样本特征图分别为：24×1/4(第一层)、32×1/8(第二层)、64×1/16(第三层)、320×1/32(第四层)。在一种可能的实施方式中，形成第一样本特征金字塔之后，通过上采样和卷积处理，混合各个第一样本特征图，使得获得的第二样本特征图不仅关注同一采样尺寸的特征，且充分利用到其他分辨率的第一样本特征图。

其中，在对第一样本特征图进行整合过程中，对于位于不同层级的第一样本特征图采用不同的整合方式。

二、响应于第m第一样特征图对应的通道数为最大通道数，对第m第一样本特征图进行卷积处理，得到第m第二样本特征图。

在一种可能的实施方式中，若第一样本特征图对应的通道数为最大通道数(即对应最小分辨率)，则仅对该第一样本特征图进行卷积处理，即可得到最小分辨率对应的第二样本特征图。

示例性的，如图5所示，基于第一样本特征金字塔与分辨率的关系，对于第四层的第一样本特征图，由于其对应的通道数和分辨率为：320×1/32，可见其对应最大通道数，在进行特征整合过程中，仅需要对第四层的第一样本特征图进行卷积处理，即可以得到分辨率为1/32的第二样本特征图。

三、响应于第m第一样本特征图对应的通道数不是最大通道数，对第m第一样本特征图进行卷积处理后得到第一中间样本特征图，对第m+1第一样本特征图进行卷积和上采样处理后得到第二中间样本特征图，对第一中间样本特征图和第二中间样本特征图进行混合，并进行卷积处理后得到第m第二样本特征图。

在一种可能的实施方式中，若第一样本特征图对应的通道数不是最大通道数，在生成第二样本特征图过程中，需要混合不同分辨率的第一样本特征图，即首先对该第一样本特征图进行卷积处理，得到第一中间样本特征图，再混合上层特征，即对比该第一样本特征图高一层级的第一样本特征图进行卷积和上采样操作，得到第二中间样本特征图，并将第一中间特征图和第二中间特征图混合后，进行卷积处理，得到该分辨率对应的第二样本特征图。

示意性的，如图5所示，对于第四层对应的第一样本特征图320×1/32，仅对该第一样本特征图进行卷积操作，即可得到分辨率为1/32的第二样本特征图，用128×1/32来表示；对于第三层对应的第一样本特征图64×1/16，首先对第一样本特征图64×1/16进行卷积处理得到第一中间样本特征图，并对第四层(高一层级)对应的第一样本特征图320×1/32进行卷积和双线性差值2倍上采样(up2x)处理，得到第二中间样本特征图，再将第一中间样本特征图和第二中间样本特征图混合，并对混合后的样本特征图进行卷积处理，即得到分辨率为1/16的第二样本特征图，用128×1/16表示；同理，可以分别得到分辨率为1/8的第二样本特征图(128×1/8)，以及分辨率为1/4的第二样本特征图(128×1/4)。如图5中特征金字塔网络502中的右半边所示，即为特征金字塔网络输出的各个第二特征图。

在一种可能的实施方式中，各个第二样本特征图也同样按照分辨率的大小排列形成第二样本特征金字塔，其中，第二样本特征图在该第二样本特征金字塔上所处的层级与其分辨率呈负相关关系。

比如，第二样本特征金字塔包含的各个层级与其对应的第二样本特征图分别为：128×1/4(第一层)、 128×1/8(第二层)、128×1/16(第三层)、128×1/32(第四层)。

可选的，m个第二样本特征图对应的目标通道数可以由开发人员自行设置，比如，目标通道数为128，本申请实施例对目标通道数不构成限定。

步骤302C，将m个第二样本特征图输入多尺度解码网络，得到多尺度解码网络输出的第一样本透明通道图像。

其中，第一样本透明通道图像的分辨率与样本图像的分辨率相同。

在一种可能的实施方式中，将特征金字塔输出的m个第二样本特征图输入多尺度解码网络中，由多尺度解码网络对第二样本特征图进行相加和分辨率转换操作，得到样本图像对应的第一样本透明通道图像，该第一样本透明通道图像包含样本图像中各个像素点对应的预测透明度值，用于后续与样本分割图像进行比较，计算交叉熵损失。

由于各个第二样本特征图对应不同分辨率，不能直接进行相加处理，且最小分辨率为1/4，因此，首先需要将各个第二样本特征图的分辨率统一为原图的1/4。在一种可能的实施方式中，将各个第二样本特征图经过卷积块处理，且不同分辨率对应不同卷积块，不同分辨率对应的卷积块的数量不同。

其中，多尺度解码网络使用的卷积块的类型包括cgr2x、sgr2x、sgr等，cgr2x包括卷积层、组群归一化(Group Normalization)层、激活函数(ReLU)层以及双线性差值2倍上采样层，其中，卷积层对应的输入输出通道数相同，比如，输入通道数为128，输出通道数为128；sgr2x包括卷积层、Group Normalization层、ReLU层以及双线性差值2倍上采样层，其中，卷积层对应的输入输出通道数不同，比如，输入通道数为128，输出通道数为64；sgr包括卷积层、Group Normalization层、ReLU层，卷积层对应的输入输出通道数不同，比如，输入通道数为128，输出通道数为64。

示意性的，如图6所示，其示出了多尺度解码网络使用的各个卷积块的结构示意图。其中，图6中的(A)为cgr2x对应的结构示意图，图6中的(B)为sgr2x对应的结构示意图，图6中的(C)为sgr对应的结构示意图。

示意性的，如图5所示，将由特征金字塔网络502输出的4个第二样本特征图输入多尺度解码网络503，经过不同卷积块处理，形成4个分辨率为原图1/4的第三样本特征图(图中未示出)，比如，对第二样本特征图128×1/32，依次经过两个cgr2x和一个sgr2x卷积块，即可以得到其对应的第三样本特征图，对第二样本特征图128×1/16，依次经过一个cgr2x和一个sgr2x卷积块，即可以得到其对应的第三样本特征图，同理，可以得到各个第二样本特征图对应的第三样本特征图；再将得到的4个第三样本特征图进行相加处理后，经过卷积和4倍的上采样操作，即可以得到第一样本透明通道图像。

步骤302D，将m个第二样本特征图输入深度监督网络，得到深度监督网络输出的m个第三样本透明通道图像。

其中，不同第二样本特征图对应不同上采样倍数，m个第三样本透明通道图像的分辨率与样本图像的分辨率相同。

在一种可能的实施方式中，将特征金字塔网络输出的m个第二样本特征图输入深度监督网络，该深度监督网络用于对m个第二样本特征图进行上采样处理，得到与样本图像相同分辨率的m个第三样本透明通道图像，用于为第一预测模型提供不同分辨率上的交叉熵损失。

其中，不同第二样本特征图对应的上采样倍数与其对应的分辨率有关，比如，分辨率为1/32的第二样本特征图对应的上采样倍数为32倍，分辨率为1/16的第二样本特征图对应的上采样倍数为16倍。

示意性的，如图5所示，将第二样本特征图128×1/4进行4倍上采样得到第三样本透明通道图像4，将第二样本特征图128×1/8进行8倍上采样得到第三样本透明通道图像8，同理，可以得到第三样本透明通道图像16和第三样本透明通道图像32。

步骤302E，对第一样本透明通道图像和m个第三样本透明通道图像进行二值化处理，得到第一样本分割图像和m个第二样本分割图像。

由于第一样本透明通道图像和m个第三样本透明通道图像均是概率图像，而为了加速第一预测模型的收敛速度，采用样本分割图像，而样本分割图像为二值化图像，因此，需要对第一样本透明通道图像和m个第三样本透明通道图像进行二值化处理，得到第一样本分割图像和m个第二样本分割图像，才可以与样本分割图像进行比较，计算第一预测模型的交叉熵损失。

其中，对第一样本透明通道图像和m个第三样本透明通道图像进行二值化处理的方式，可以参考上文实施例中样本分割图像的生成过程，本实施例在此不做赘述。

示意性的，如图5所示，对4个第三样本透明通道图像进行二值化处理，得到4个第二样本分割图像，分别表示为第二样本分割图像32、第二样本分割图像16、第二样本分割图像8、第二样本分割图像4。对第一样本透明通道图像进行二值化处理，得到第一样本分割图像。

步骤302F，根据第一样本分割图像、m个第二样本分割图像和样本分割图像，训练第一预测模型。

其中，第一预测模型的损失采用交叉熵损，即将第一样本分割图像和样本分割图像之间的交叉熵损失，以及m个第三样本分割图像和样本分割图像之间的交叉熵损失求和，可以得到第一预测模型对应的交叉熵损失。

示意性的，如图5所示，分别计算第一样本分割图像和样本分割图像之间的交叉熵损失，以及各个第二样本分割图像与样本分割图像的交叉熵损失，对各个交叉熵损失求和，即为第一预测模型对应的交叉熵损失。

其中，交叉熵损失的公式可以表示为：

其中,若

为样本分割图像和第一样本分割图像的交叉熵损失，则y _i表示样本图像对应的样本分割图像，p _i表示第一样本分割图像，对所有样本的对数损失表示对每个样本的对数损失的平均值，在理想情况下，对数损失为0。

示意性的，第一预测模型对应的损失可以表示为：

其中，

表示第一预测模型对应的综合损失，

表示第一样本分割图像和样本分割图像的交叉熵损失，

表示第二样本分割图像32与样本分割图像的交叉熵损失，

表示第二样本分割图像16与样本分割图像的交叉熵损失，

表示第二样本分割图像8与样本分割图像的交叉熵损失，

表示第二样本分割图像4与样本分割图像的交叉熵损失。

在一种可能的实施方式中，可以根据上述公式(1)和公式(2)计算得到第一预测模型对应的综合损失，从而利用该综合损失对第一预测模型执行反向传播算法，更新第一预测模型中的各个参数。

可选的，在多个训练周期内，按照上文实施例所示的方法重复对一预测模型进行训练，直至第一预测模型对应的损失函数完全收敛时，完成第一预测模型的训练，保存第一预测模型，不冻结参数。

本实施例中，通过获取到的样本图像和样本分割图像，训练第一预测模型，并在第一预测模型的训练过程中引入了交叉熵损失，使得第一预测模型可以快速收敛，提升第一预测模型的训练效率。

在一种可能的实施方式中，当第一预测模型训练完成之后，即可以将样本图像输入训练完成的第一预测模型中，得到第一样本透明通道图像，用于第二预测模型的训练过程。

请参考图7，其示出了本申请一个示例性实施例示出的第二预测模型的训练方法的流程图。该方法包括：

步骤701，将样本图像输入训练得到的第一预测模型，得到第一预测模型输出的第一样本透明通道图像。

由于第二预测模型的训练需要依赖于第一预测模型的输出结果，即需要由第一预测模型输出对应的第一样本透明通道图像。因此，第二预测模型需要在第一预测模型训练完成之后，才可以进行第二预测模型的训练过程。

在一种可能的实施方式中，将样本图像输入训练得到的第一预测模型中，得到第一预测模型输出的该样本图像对应的第一透明通道图像，用于后续的第二预测模型的训练过程。

可选的，可以将数据集中各个样本图像均输入第一预测模型中，得到各个样本图像对应的第一样本透明通道图像，从而将样本图像和其对应的第一样本透明通道图像作为训练第二预测模型的数据集，也就是说，第二预测模型的数据集中由若干样本图像和第一样本透明通道图像组成的数据对构成。

可选的，与第一预测模型类似，在训练第二预测模型时，也可以将数据集划分为样本集和训练集，其中，样本集用于训练第二预测模型，训练集用于校验第二预测模型。

可选的，样本集和训练集的数据对比值可以由开发人员自行设置，比如，样本集：训练集＝8:2。

步骤702，根据第一样本透明通道图像、样本标注图像和样本图像，训练第二预测模型。由于第一预测模型的主要任务是得到初步分割结果，为了进一步提高第一预测模型的收敛速度，采用了样本标注图像参与第一预测模型的训练过程，而第二预测模型的目的是为了提高第一透明通道图像中各个像素点的精细度，基于样本分割图像和样本标注图像之间的关系(样本分割图像是通过对样本标注图像进行二值化处理得到)，显然样本标注图像更精确，因此，在一种可能的实施方式中，采用第一样本透明通道图像、样本标注图像和样本图像训练第二预测模型。

在一种可能的实施方式中，由于透明度通道图像主要是为了实现原图中前景图像和背景图像之间的分离，为了提高第二预测模型输出的第二样本透明通道图像的精度，引入了除基本的抠图损失之外的损失，比如，连通性差异损失、结构相似性损失以及边缘梯度损失，这些损失均更关注前景图像和背景图像交界区域的透明度通道值，使得由精细化网络输出的第二样本透明通道图像的精细度高于第一样本透明通道图像。

示意性的，如图8所示，步骤702可以包括步骤702A至702F。

步骤702A，将第一样本透明通道图像和样本图像输入精细化网络，得到精细化网络输出的第二样本透明通道图像。

在一种可能的实施方式中，第二预测模型中主要包含精细化网络，该精细化网络用于对第一样本透明通道图像和样本图像进行卷积处理，可以修正第一样本透明通道图像中的某些错误透明度通道值，以及对前景图像和背景图像交界区域的透明度通道值进行修正，从而提高各个像素点对应的透明度通道值的精细度，输出第二样本透明通道图像。

可选的，可以将第一样本透明通道图像和样本图像进行Concat处理后，输入精细化网络。

可选的，精细化网络可以包括三个卷积网络块以及一个卷积层，减少运算过程。

示意性的，如图9所示，将样本图像输入训练完成的第一预测模型901中，可以得到样本图像对应的第一样本透明通道图像，再将第一样本透明通道图像和样本图像Concat后，输入精细化网络902中，输出第二样本透明通道图像，其中，精细化网络902由三个卷积块和一个卷积层构成。

步骤702B，将样本图像、第二样本透明通道图像和样本标注图像输入边缘梯度网络，得到第二样本透明通道图像对应的边缘梯度损失。

在一种可能的实施方式中，对于边缘梯度损失的计算方式，设置有专门计算边缘梯度损失的网络，即边缘梯度网络，将样本图像、第二样本透明通道图像和样本标注图像输入边缘梯度网络，即可以得到第二样本透明通道图像对应的边缘梯度损失，为后续的训练过程提供边缘上的损失。

在一种可能的实施方式中，获得边缘梯度损失的过程可以包括以下步骤：

一、将样本图像输入预设算子中，得到样本图像对应的样本梯度图像，预设算子用于对样本图像进行一阶倒数运算。

由于图像边缘为前景图像和背景图像之间的交界区域，因此，要获得边缘梯度损失，需要首先获得样本图像和第二样本透明通道图像分别对应的边缘图像。

在一种可能的实施方式中，边缘梯度网络中设置有预设算子，该预设算子可以对样本图像进行一阶导数运算，得到样本图像在x和y方向上的梯度，从而输出样本梯度图像。

可选的，预设算子可以采用索贝尔(Sobel)算子，也可以采用其他产生图像梯度的滤波算子，比如，沙尔(Scharr)算子、拉普拉斯(Laplacian)算子等。本申请实施例对采用的预设算子不构成限定。

示意性的，以采用Sobel算子为例，生成样本梯度图像的过程可以表示为：

其中，A表示输入的样本图像，Gx表示样本图像在x方向上的梯度图，Gy表示样本图像在y方向上的梯度图，G表示经过Sobel算子后输出的样本梯度图像。

在一种可能的实施方式中，根据公式(3)和公式(4)对样本图像进行梯度运算后，得到样本图像在x和y方向上的梯度图，带入公式(5)中，可以计算得到样本图像对应的样本梯度图像。

二、对样本标注图像进行二值化和膨胀腐蚀操作，得到样本边缘图像，样本边缘图像用于指示样本标注图像中前景图像和背景图像的交界区域。

在一种可能的实施方式中，对标注图像进行二值化和膨胀腐蚀操作，可以得到样本边缘图像，该样本边缘图像用于划分出第二样本通道图像和样本梯度图像之间的边缘区域。

三、根据样本边缘图像和样本梯度图像，生成样本边缘梯度图像，样本边缘梯度图像用于指示样本图像中前景图像和背景图像的交界区域。

在一种可能的实施方式中，将样本边缘图像和样本梯度图像相乘，可以将样本图像中前景图像和背景图像的交界区域从样本梯度图像中划分出来，即得到样本边缘梯度图像。

四、根据第二样本透明通道图像和样本边缘图像，生成边缘透明通道图像，边缘透明通道图像用于指示第二样本透明通道图像中前景图像和背景图像的交界区域。

在一种可能的实施方式中，将第二样本透明通道图像和样本边缘图像相乘，可以将第二样本透明通道图像中前景图像和背景图像的交界区域划分出来，即得到对应的边缘透明通道图像。

五、根据边缘透明通道图像和样本边缘梯度图像，计算得到边缘梯度损失。

在一种可能的实施方式中，根据获得的边缘透明通道图像和样本边缘梯度图像，即可以计算得到第二样本透明通道图像对应的边缘梯度损失。

示意性的，边缘梯度损失的计算方式可以表示为：

其中，

表示第二样本透明通道图像对应的边缘梯度损失，G _input表示样本梯度图像，E _label表示样本边缘图像，G _Refindd,Mask表示第二样本透明通道图像，‖…‖ ₁表示边缘梯度损失采用L ₁范数的计算方式。

示意性的，如图9所示，将样本图像输入边缘梯度网络903，首先经过sobel算子，得到样本梯度图像；将样本标注图像输入边缘梯度网络903，经过二值化和膨胀腐蚀操作后，得到样本边缘图像；将第二样本透明通道图像输入边缘梯度网络903，与样本边缘图像相乘后，得到边缘透明通道图像；将样本梯度图像和样本边缘图像相乘，得到样本边缘梯度图像；根据样本边缘梯度图像和边缘透明通道图像计算边缘梯度损失。

步骤702C，根据第二样本透明通道图像和样本标注图像，计算第二样本透明通道图像对应的结构相似性损失和抠图损失。

其中，抠图损失的计算公式可以表示为：

其中，

表示第二样本透明通道图像对应的抠图损失，

表示第二样本透明通道图像中第i个像素点对应的透明度通道值，

表示样本标注图像中第i个像素点对应的透明度通道值，∈为常数。

在一种可能的实施方式中，将第二样本透明通道图像和样本标注图像带入上述公式中，即可得到第二样本透明通道图像对应的抠图损失。

其中，结构相似性损失的计算公式可以表示为：

其中，SSIM(x,y)表示结构相似性指数，

为第二样本透明通道图像对应的结构相似性损失，μ _x为样本标注图像的均值，σ _x为样本标注图像的方差，μ _y为第二样本透明通道图像的均值，σ _y为第二样本透明通道图像的方差，C ₁和C ₂为常数。

步骤702D，将第二样本透明通道图像和样本标注图像输入连通性差异网络，得到第二样本透明通道图像对应的连通性差异损失。

其中，连通性指灰度图片中针对单个像素，其相邻的上下左右存在相同值的像素。若第二预测模型的预测效果越好，那么预测的第二样本透明通道图像和样本标注图像也应有越相似的连通图，连通性也越相似。

在一种可能的实施方式中，开发人员预先设置有连通性差异网络，可以将第二样本透明通道图像和样本标注图像输入该连通性差异网络，用于计算第二样本透明通道图像对应的连通性差异损失。

其中，连通性差异损失的计算公式可以表示为：

其中，

表示各个像素点的连通性差异的累积和，Ω表示第二样本透明通道图像和样本标注图像共有的最大值为1的连通区域。

函数计算的是第二样本透明通道图像的第i个像素p _i与Ω的连通度，其值为1则表示全连通，为0则表示不连通，

表示样本标注图像上第i个像素点。

其中，

函数可以采用如下形式表示：

d _i＝p _i-l _i

其中，θ是一个阈值参数，d _i表示当前像素值p _i到临界阈值l _i的距离，当d _i小于θ则忽略不计。其中，

表示p _i到l _i之间离散像素值的集合，dist _k(i)表示设置阈值为k时，对于像素i距离最近的连通到源域的像素，与像素i之间的标准化欧氏距离。

示意性的，如图9所示，将第二样本透明通道图像和样本标注图像输入连通性差异网络904中，可以得到连通性差异网络904输出的连通性差异损失。

步骤702E，根据边缘梯度损失、连通性差异损失、抠图损失和结构相似性损失，训练精细化网络。

在一种可能的实施方式中，通过综合以上实施例中得到的多种损失，来训练精细化网络，相比于仅使用抠图损失，可以明显提高生成的第二样本透明通道图像的精细度。

步骤702F，将训练得到的精细化网络确定为第二预测模型。

在一种可能的实施方式中，对精细化网络执行反向传播算法，更新精细网络各个卷积层的参数，并在各个训练周期内重复进行上文实施例中的训练过程，直至第二预测模型对应的损失函数完全收敛，则将训练完成的精细化网络确定为第二预测模型。

本实施例中，通过引入多个损失函数连通性差异损失、边缘梯度损失、抠图损失和结构相似性损失，来训练精细化网络，使得由精细化网络输出的第二样本透明通道图像更关注在边缘区域上的透明度通道值，从而有利于提高图像分割的精确度。

在一种可能的实施方式中，当按照上文各个实施例所示的方法完成第一预测模型和第二预测模型的训练之后，即可以将训练完成的预测模型部署在计算机设备上，并利用该第一预测模型和第二预测模型实现对原始图像的分割处理。

请参考图10，其示出了本申请另一个示例性实施例示出的图像处理方法的流程图。本实施例以该方法用于计算机设备为例进行说明，该方法包括如下步骤。

步骤1001，获取原始图像。

本步骤的实施方式可以参考步骤201，本实施例在此不做赘述。

步骤1002，将原始图像输入多尺度编码网络，得到多尺度编码网络输出的n个第一特征图，其中，不同第一特征图的分辨率和通道数不同，n为大于等于2的整数。

其中，多尺度编码网络用于对原始图像进行特征提取，在一种可能的实施方式中，将原始图像进行预处理后，输入多尺度编码网络中，通过多尺度编码网络提取原始图像中不同尺度(分辨率)上的特征，从而得到不同分辨率和通道数的n个第一特征图。步骤1003，将n个第一特征图输入特征金字塔网络，得到特征金字塔网络输出的n个第二特征图，其中，不同第二特征图的通道数相同且分辨率不同，n个第二特征图的通道数为目标通道数。

其中，特征金字塔网络用于整合不同分辨率的特征，在一种可能的实施方式中，将n个第一样本特征图输入特征金字塔网络中，通过特征金字塔网络对不同分辨率上的特征图进行特征混合，以及卷积处理，从而得到特征金字塔网络输出的n个第二特征图。

由于不同第一特征图对应的通道数不同，而特征金字塔网络需要将特征图对应的通道数处理为同一通道数，因此，对于不同通道数的第一特征图，需要进行不同的特征整合处理。

在一个示例性的例子中，如图11所示，步骤1003可以包括步骤1003A、步骤1003B和步骤1003C。

步骤1003A，将n个第一特征图按照分辨率排列形成特征金字塔，特征金字塔中第一特征图的分辨率与第一特征图所在层级呈负相关关系。

在一种可能的实施方式中，首先将n个第一特征图按照分辨率进行排序，形成特征金字塔，其中，第一特征图的分辨率越低，其在特征金字塔网络中的层级越高。

步骤1003B，响应于第n第一特征图对应的通道数为最大通道数，对第n第一特征图进行卷积处理，得到第n第二特征图。

在一种可能的实施方式中，若第一特征图对应的通道数为最大通道数(对应最小分辨率)，则仅需要对该层第一特征图进行卷积处理，即可以得到最小分辨率对应的第二特征图。

步骤1003C，响应于第n第一特征图对应的通道数不是最大通道数，对第n第一特征图进行卷积处理后得到第四特征图，对第n+1第一特征图进行卷积和上采样处理后得到第五特征图，对第四特征图和第五特征图进行混合，并进行卷积处理后得到第n第二特征图。

在一种可能的实施方式中，若第一特征图对应的通道数不是最大通道数，在生成第二特征图过程中，需要混合不同分辨率的第一特征图，即首先对该第一特征图进行卷积处理，得到第四特征图，再混合上层特征，即对比该第一特征图高一层级的第一特征图进行卷积和上采样操作，得到第五特征图，并将第四特征图和第五特征图混合后，进行卷积处理，得到该分辨率对应的第二特征图

需要说明的是，步骤1003B和步骤1003C可以同时执行；也可以先执行步骤1003A，再执行步骤1003C；也可以先执行步骤1003C，再执行步骤1003B，本实施例对步骤1003B和步骤1003C的执行顺序不构成限定。

步骤1004，将n个第二特征图输入多尺度解码网络，得到多尺度解码网络输出的第一透明通道图像。

其中，多尺度解码网络用于对特征进行解码，在一种可能的实施方式中，将n个第二特征图输入多尺度解码网络，由多尺度解码网络对第二特征图进行相加和分辨率转换操作，得到原始图像对应的第一透明通道图像，该第一透明通道图像包含原始图像中各个像素点对应的预测透明度值。

示意性的，如图11所示，步骤1004包括步骤1004A和步骤1004B。

步骤1004A，将n个第二特征图分别通过卷积块处理，得到n个第三特征图，n个第三特征图对应的分辨率相同，其中，不同第二特征图对应不同卷积块，且不同第二特征图对应使用的卷积块数目不同。

由于各个第二特征图对应的分辨率不同，不能直接进行相加处理，且存在最小分辨率1/4，因此，首先需要将各个第二特征图的分辨率统一为原始图像的1/4。在一种可能的实施方式中，将各个第二特征图经过卷积块处理，可以得到n个分辨率为最小分辨率的第三特征图。

其中，为了统一分辨率，则不同分辨率的第二特征图对应不同卷积块，且不同分辨率对应的卷积块的数量不同。

步骤1004B，对n个第三特征图进行相加、卷积和上采样处理，得到第一透明通道图像。

在一种可能的实施方式中，将生成的n个相同分辨率的第三特征图进行相加、卷积和上采样处理，从而得到分辨率与原始图像相同的第一透明通道图像。

其中，上述生成第一透明通道图像的过程可以参考上文实施例中的第一预测模型训练过程中第一样本透明通道图像的生成过程，本申请实施例在此不做赘述。

与第一预测模型训练过程不同的是，模型训练阶段需要深度监督网络提供不同分辨率上的交叉熵损失，而模型应用阶段无需部署深度监督网络，也就是说，在模型应用阶段，第一预测模型中仅包含多尺度编码网络、特征金字塔网络以及多尺度解码网络，通过对原始图像进行特征提取、多尺度特征融合以及特征解码，即可以生成原始图像对应的第一透明通道图像。

步骤1005，将第一透明通道图像和原始图像输入第二预测模型，得到第二预测模型输出的第二透明通道图像，第二透明通道图像的精细度高于第一透明通道图像的精细度。

在模型应用阶段，第二预测模型即上文实施例中训练得到的精细化网络，在一种可能的实施方式中，将第一透明通道图像和原始图像进行拼接处理，输入精细化网络，可以得到精细化网络输出的第二透明通道图像。

步骤1006，根据第二透明通道图像对原始图像进行分割处理，得到目标对象对应的图像。

步骤1005和步骤1006的实施方式可以参考步骤201和步骤202，本实施例在此不做赘述。

本申请实施例中，通过部署训练完成的第一预测模型和第二预测模型，将原始图像预处理后输入第一预测模型，得到第一预测模型输出的第一透明通道图像，并将生成的第一透明通道图像和原始图像重新输入第二预测模型，得到第二预测模型输出的第二透明通道图像，以便将该第二透明通道图像用于图像处理，相比于相关技术中，无需生成三分图，可以实现由原始图像直接生成透明通道图像，进一步提高了透明通道图像的精度，从而提高了图像分割的准确率。

请参考图12，其示出了本申请一个示例性实施例示出的图像处理方法的网络部署图。该网络部署图包括：多尺度编码网络、特征金字塔网络、多尺度解码网络和精细化网络。

在一种可能的实施方式中，将原始图像经过预处理后，输入多尺度编码网络1201，得到多尺度编码网络1201输出的n个第一特征图；将该n个第一特征图输入特征金字塔网络1202，得到特征金字塔网络1202输出的n个第二特征图，且该n个第二特征图的通道数为目标通道数；将n个第二特征图输入多尺度解码网络1203，进行相加和分辨率转换等操作后，得到多尺度解码网络1203输出的第一透明通道图像；将该第一透明度通道图像和原始图像输入精细化网络1204，得到精细化网络1204输出的第二透明通道图像，从而利用该第二透明通道图像对原始图像进行分割处理，得到目标对象对应的图像。

请参考图13，其示出了本申请一个示例性实施例提供的图像处理装置的结构框图。该装置可以通过软件、硬件或者两者的结合实现成为计算机设备的全部或一部分，该装置包括：

第一获取模块1301，用于获取原始图像，所述原始图像中包含至少一个目标对象；

第一预测模块1302，用于将所述原始图像输入第一预测模型，得到所述第一预测模型输出的第一透明通道图像，所述第一透明通道图像中包括所述原始图像中各个像素点对应的预测透明度值；

第二预测模块1303，用于将所述第一透明通道图像和所述原始图像输入第二预测模型，得到所述第二预测模型输出的第二透明通道图像，所述第二透明通道图像的精细度高于所述第一透明通道图像的精细度；

分割处理模块1304，用于根据所述第二透明通道图像对所述原始图像进行分割处理，得到所述目标对象对应的图像。

可选的，所述装置还包括：

第二获取模块，用于获取样本图像、样本标注图像和样本分割图像，所述样本标注图像中标注有所述样本图像中各个像素点对应的透明度值，所述样本分割图像是对样本标注图像进行二值化处理得到的二值化图像；

第一训练模块，用于根据所述样本图像和所述样本分割图像，训练所述第一预测模型；

第三预测模块，用于将所述样本图像输入训练得到的所述第一预测模型，得到所述第一预测模型输出的第一样本透明通道图像；

第二训练模块，用于根据所述第一样本透明通道图像、所述样本标注图像和所述样本图像，训练所述第二预测模型。

可选的，所述第二训练模块，包括：

精细化单元，用于将所述第一样本透明通道图像和所述样本图像输入精细化网络，得到所述精细化网络输出的第二样本透明通道图像；

边缘梯度单元，用于将所述样本图像、所述第二样本透明通道图像和所述样本标注图像输入边缘梯度网络，得到所述第二样本透明通道图像对应的边缘梯度损失；

计算单元，用于根据所述第二样本透明通道图像和所述样本标注图像，计算所述第二样本透明通道图像对应的结构相似性损失和抠图损失；

连通性差异单元，用于将所述第二样本透明通道图像和所述样本标注图像输入连通性差异网络，得到所述第二样本透明通道图像对应的连通性差异损失；

第一训练单元，用于根据所述边缘梯度损失、所述连通性差异损失、所述抠图损失和所述结构相似性损失，训练所述精细化网络；

确定单元，用于将训练得到的所述精细化网络确定为所述第二预测模型。

可选的，所述边缘梯度单元，还用于：

将所述样本图像输入预设算子中，得到所述样本图像对应的样本梯度图像，所述预设算子用于对所述原始样本图像进行一阶倒数运算；

对所述样本标注图像进行二值化和膨胀腐蚀操作，得到样本边缘图像，所述样本边缘图像用于指示所述样本标注图像中前景图像和背景图像的交界区域；

根据所述样本边缘图像和所述样本梯度图像，生成样本边缘梯度图像，所述样本边缘梯度图像用于指示所述样本图像中前景图像和背景图像的交界区域；

根据所述第二样本透明通道图像和所述样本边缘图像，生成边缘透明通道图像，所述边缘透明通道图像用于指示所述第二样本透明通道图像中前景图像和背景图像的交界区域；

根据所述边缘透明通道图像和所述样本边缘梯度图像，计算得到所述边缘梯度损失。

可选的，所述第一预测模型包括多尺度编码网络、特征金字塔网络、多尺度解码网络和深度监督网络；

可选的，所述第一训练模块，包括：

第一多尺度编码单元，用于将所述样本图像输入所述多尺度编码网络，得到所述多尺度编码网络输出的m个第一样本特征图，其中，不同第一样本特征图的分辨率和通道数不同，m为大于等于2的整数，所述多尺度编码网络用于对所述样本图像进行特征提取；

第一特征金字塔单元，用于将m个所述第一样本特征图输入所述特征金字塔网络，得到所述特征金字塔网络输出的m个第二样本特征图，其中，不同第二样本特征图的通道数相同且分辨率不同，所述特征金字塔网络用于将m个所述第一样本特征图的通道数处理为目标通道数；

第一多尺度解码单元，用于将m个所述第二样本特征图输入所述多尺度解码网络，得到所述多尺度解码网络输出的所述第一样本透明通道图像，所述多尺度解码网络用于对m个所述第二样本特征图进行相加和分辨率转换操作，所述第一样本透明通道图像的分辨率与所述样本图像的分辨率相同；

深度监督单元，用于将m个所述第二样本特征图输入所述深度监督网络，得到所述深度监督网络输出的m个第三样本透明通道图像，所述深度监督网络用于对所述m个第二样本特征图进行上采样处理，不同第二样本特征图对应不同上采样倍数，m个所述第三样本透明通道图像的分辨率与所述样本图像的分辨率相同；

二值化处理单元，用于对所述第一样本透明通道图像和m个所述第三样本透明通道图像进行二值化处理，得到第一样本分割图像和m个第二样本分割图像；

第二训练单元，用于根据所述第一样本分割图像、m个所述第二样本分割图像和所述样本分割图像，训练所述第一预测模型。

可选的，所述第一预测模块1302，包括：

第二多尺度编码单元，用于将所述原始图像输入所述多尺度编码网络，得到所述多尺度编码网络输出的n个第一特征图，其中，不同第一特征图的分辨率和通道数不同，n为大于等于2的整数；

第二特征金字塔单元，用于将n个所述第一特征图输入所述特征金字塔网络，得到所述特征金字塔网络输出的n个第二特征图，其中，不同第二特征图的通道数相同且分辨率不同，n个所述第二特征图的通道数为所述目标通道数；

第二多尺度解码单元，用于将n个所述第二特征图输入所述多尺度解码网络，得到所述多尺度解码网络输出的所述第一透明通道图像。

可选的，所述第二特征金字塔单元，还用于：

将n个所述第一特征图按照分辨率排列形成特征金字塔，所述特征金字塔中所述第一特征图的分辨率与所述第一特征图所在层级呈负相关关系；

响应于第n第一特征图对应的通道数为最大通道数，对所述第n第一特征图进行卷积处理，得到第n第二特征图；

响应于第n第一特征图对应的通道数不是最大通道数，对所述第n第一特征图进行卷积处理后得到第四特征图，对第n+1第一特征图进行卷积和上采样处理后得到第五特征图，对所述第四特征图和所述第五特征图进行混合，并进行卷积处理后得到所述第n第二特征图。

可选的，所述第二多尺度解码单元，还用于：

将n个所述第二特征图分别通过卷积块处理，得到n个第三特征图，n个所述第三特征图对应的分辨率相同，其中，不同第二特征图对应不同卷积块，且不同第二特征图对应使用的卷积块数目不同；

对n个所述第三特征图进行相加、卷积和上采样处理，得到所述第一透明通道图像。

可选的，所述第一特征金字塔单元，还用于：

将m个所述第一样本特征图按照分辨率形成样本特征金字塔，所述样本特征金字塔中所述第一样本特征图的分辨率与所述第一样本特征图所在层级呈负相关关系；

响应于第m第一样特征图对应的通道数为最大通道数，对所述第m第一样本特征图进行卷积处理，得到第m第二样本特征图；

响应于所述第m第一样本特征图对应的通道数不是最大通道数，对所述第m第一样本特征图进行卷积处理后得到第一中间样本特征图，对第m+1第一样本特征图进行卷积和上采样处理后得到第二中间样本特征图，对所述第一中间样本特征图和所述第二中间样本特征图进行混合，并进行卷积处理后得到所述第m第二样本特征图。

本申请实施例中，通过将获取到的原始图像输入第一预测模型，得到第一预测模型输出的第一透明通道图像(包括原始图像中各个像素点对应的预测透明度值)，从而将第一透明通道图像和原始图像输入第二预测模型，得到第二预测模型输出的第二透明通道图像，用于根据第二透明通道图像对原始图像进行分割处理，得到目标对象对应的图像。由于第二透明通道图像的精细度高于第一透明通道图像的精细度，因此，可以提高图像分割的准确率；相较于相关技术中的图像分割方法，无需引入三分图，可以实现从原始图像直接生成用于分割的透明通道图像，进一步提升了进行图像分割的准确性。

请参考图14，其示出了本申请一个示例性实施例提供的计算机设备的结构示意图。所述计算机设备1400包括中央处理单元(Central Processing Unit，CPU)1401、包括随机存取存储器(Random Access Memory，RAM)1402和只读存储器(Read-Only Memory，ROM)1403的系统存储器1404，以及连接系统存储器1404和中央处理单元1401的系统总线1405。所述计算机设备1400还包括帮助计算机设备内的各个器件之间传输信息的基本输入/输出系统(Input/Output系统，I/O系统)1406，和用于存储操作系统1413、应用程序1414和其他程序模块1415的大容量存储设备1407。

所述基本输入/输出系统1406包括有用于显示信息的显示器1408和用于用户输入信息的诸如鼠标、键盘之类的输入设备1409。其中所述显示器1408和输入设备1409都通过连接到系统总线1405的输入输出控制器1410连接到中央处理单元1401。所述基本输入/输出系统1406还可以包括输入输出控制器1410以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器1410还提供输出到显示屏、打印机或其他类型的输出设备。

所述大容量存储设备1407通过连接到系统总线1405的大容量存储控制器(未示出)连接到中央处理单元1401。所述大容量存储设备1407及其相关联的计算机可读存储介质为计算机设备1400提供非易失性存储。也就是说，所述大容量存储设备1407可以包括诸如硬盘或者只读光盘(Compact Disc Read-Only Memory，CD-ROM)驱动器之类的计算机可读存储介质(未示出)。

不失一般性，所述计算机可读存储介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读存储指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读寄存器(Erasable Programmable Read Only Memory，EPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、闪存或其他固态存储其技术，CD-ROM、数字多功能光盘(Digital Versatile Disc，DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器1404和大容量存储设备1407可以统称为存储器。

存储器存储有一个或多个程序，一个或多个程序被配置成由一个或多个中央处理单元1401执行，一个或多个程序包含用于实现上述方法实施例的指令，中央处理单元1401执行该一个或多个程序实现上述各个方法实施例提供的方法。

根据本申请的各种实施例，所述计算机设备1400还可以通过诸如因特网等网络连接到网络上的远程服务器运行。也即计算机设备1400可以通过连接在所述系统总线1405上的网络接口单元1411连接到网络1412，或者说，也可以使用网络接口单元1411来连接到其他类型的网络或远程服务器系统(未示出)。

所述存储器还包括一个或者一个以上的程序，所述一个或者一个以上程序存储于存储器中，所述一个或者一个以上程序包含用于进行本申请实施例提供的方法中由计算机设备所执行的步骤。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的图像处理方法。

根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述方面的各种可选实现方式中提供的图像处理方法。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本申请实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读存储介质中或者作为计算机可读存储介质上的一个或多个指令或代码进行传输。计算机可读存储介质包括计算机存储介质和通信介质，其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种图像处理方法，所述方法包括：

获取原始图像，所述原始图像中包含至少一个目标对象；

将所述原始图像输入第一预测模型，得到所述第一预测模型输出的第一透明通道图像，所述第一透明通道图像中包括所述原始图像中各个像素点对应的预测透明度值；

将所述第一透明通道图像和所述原始图像输入第二预测模型，得到所述第二预测模型输出的第二透明通道图像，所述第二透明通道图像的精细度高于所述第一透明通道图像的精细度；

根据所述第二透明通道图像对所述原始图像进行分割处理，得到所述目标对象对应的图像。
根据权利要求1所述的方法，其中，所述获取原始图像之前，所述方法还包括：

获取样本图像、样本标注图像和样本分割图像，所述样本标注图像中标注有所述样本图像中各个像素点对应的透明度值，所述样本分割图像是对样本标注图像进行二值化处理得到的二值化图像；

根据所述样本图像和所述样本分割图像，训练所述第一预测模型；

将所述样本图像输入训练得到的所述第一预测模型，得到所述第一预测模型输出的第一样本透明通道图像；

根据所述第一样本透明通道图像、所述样本标注图像和所述样本图像，训练所述第二预测模型。
根据权利要求2所述的方法，其中，所述根据所述第一样本透明通道图像、所述样本标注图像和所述样本图像，训练所述第二预测模型，包括：

将所述第一样本透明通道图像和所述样本图像输入精细化网络，得到所述精细化网络输出的第二样本透明通道图像；

将所述样本图像、所述第二样本透明通道图像和所述样本标注图像输入边缘梯度网络，得到所述第二样本透明通道图像对应的边缘梯度损失；

根据所述第二样本透明通道图像和所述样本标注图像，计算所述第二样本透明通道图像对应的结构相似性损失和抠图损失；

将所述第二样本透明通道图像和所述样本标注图像输入连通性差异网络，得到所述第二样本透明通道图像对应的连通性差异损失；

根据所述边缘梯度损失、所述连通性差异损失、所述抠图损失和所述结构相似性损失，训练所述精细化网络；

将训练得到的所述精细化网络确定为所述第二预测模型。
根据权利要求3所述的方法，其中，所述将所述样本图像、所述第二样本透明通道图像和所述样本标注图像输入边缘梯度网络，得到所述第二样本透明通道图像对应的边缘梯度损失，包括：

将所述样本图像输入预设算子中，得到所述样本图像对应的样本梯度图像，所述预设算子用于对所述原始样本图像进行一阶倒数运算；

对所述样本标注图像进行二值化和膨胀腐蚀操作，得到样本边缘图像，所述样本边缘图像用于指示所述样本标注图像中前景图像和背景图像的交界区域；

根据所述样本边缘图像和所述样本梯度图像，生成样本边缘梯度图像，所述样本边缘梯度图像用于指示所述样本图像中前景图像和背景图像的交界区域；

根据所述第二样本透明通道图像和所述样本边缘图像，生成边缘透明通道图像，所述边缘透明通道图像用于指示所述第二样本透明通道图像中前景图像和背景图像的交界区域；

根据所述边缘透明通道图像和所述样本边缘梯度图像，计算得到所述边缘梯度损失。
根据权利要求2所述的方法，其中，所述第一预测模型包括多尺度编码网络、特征金字塔网络、多尺度解码网络和深度监督网络；

所述根据所述样本图像和所述样本分割图像，训练所述第一预测模型，包括：

将所述样本图像输入所述多尺度编码网络，得到所述多尺度编码网络输出的m个第一样本特征图，其中，不同第一样本特征图的分辨率和通道数不同，m为大于等于2的整数，所述多尺度编码网络用于对所述样本图像进行特征提取；

将m个所述第一样本特征图输入所述特征金字塔网络，得到所述特征金字塔网络输出的m个第二样本特征图，其中，不同第二样本特征图的通道数相同且分辨率不同，所述特征金字塔网络用于将m个所述第一样本特征图的通道数处理为目标通道数；

将m个所述第二样本特征图输入所述多尺度解码网络，得到所述多尺度解码网络输出的所述第一样本透明通道图像，所述多尺度解码网络用于对m个所述第二样本特征图进行相加和分辨率转换操作，所述第一样本透明通道图像的分辨率与所述样本图像的分辨率相同；

将m个所述第二样本特征图输入所述深度监督网络，得到所述深度监督网络输出的m个第三样本透明通道图像，所述深度监督网络用于对所述m个第二样本特征图进行上采样处理，不同第二样本特征图对应不同上采样倍数，m个所述第三样本透明通道图像的分辨率与所述样本图像的分辨率相同；

对所述第一样本透明通道图像和m个所述第三样本透明通道图像进行二值化处理，得到第一样本分割图像和m个第二样本分割图像；

根据所述第一样本分割图像、m个所述第二样本分割图像和所述样本分割图像，训练所述第一预测模型。
根据权利要求5所述的方法，其中，所述将所述原始图像输入第一预测模型，得到所述第一预测模型输出的第一透明通道图像，包括：

将所述原始图像输入所述多尺度编码网络，得到所述多尺度编码网络输出的n个第一特征图，其中，不同第一特征图的分辨率和通道数不同，n为大于等于2的整数；

将n个所述第一特征图输入所述特征金字塔网络，得到所述特征金字塔网络输出的n个第二特征图，其中，不同第二特征图的通道数相同且分辨率不同，n个所述第二特征图的通道数为所述目标通道数；

将n个所述第二特征图输入所述多尺度解码网络，得到所述多尺度解码网络输出的所述第一透明通道图像。
根据权利要求6所述的方法，其中，所述将n个所述第一特征图输入所述特征金字塔网络，得到所述特征金字塔网络输出的n个第二特征图，包括：

将n个所述第一特征图按照分辨率排列形成特征金字塔，所述特征金字塔中所述第一特征图的分辨率与所述第一特征图所在层级呈负相关关系；

响应于第n第一特征图对应的通道数为最大通道数，对所述第n第一特征图进行卷积处理，得到第n第二特征图；

响应于第n第一特征图对应的通道数不是最大通道数，对所述第n第一特征图进行卷积处理后得到第四特征图，对第n+1第一特征图进行卷积和上采样处理后得到第五特征图，对所述第四特征图和所述第五特征图进行混合，并进行卷积处理后得到所述第n第二特征图。
根据权利要求6所述的方法，其中，所述将n个所述第二特征图输入所述多尺度解码网络，得到所述多尺度解码网络输出的所述第一透明通道图像，包括：

将n个所述第二特征图分别通过卷积块处理，得到n个第三特征图，n个所述第三特征图对应的分辨率相同，其中，不同第二特征图对应不同卷积块，且不同第二特征图对应使用的卷积块数目不同；

对n个所述第三特征图进行相加、卷积和上采样处理，得到所述第一透明通道图像。
根据权利要求5所述的方法，其中，所述将m个所述第一样本特征图输入所述特征金字塔网络，得到所述特征金字塔网络输出的m个第二样本特征图，包括：

将m个所述第一样本特征图按照分辨率形成样本特征金字塔，所述样本特征金字塔中所述第一样本特征图的分辨率与所述第一样本特征图所在层级呈负相关关系；

响应于第m第一样特征图对应的通道数为最大通道数，对所述第m第一样本特征图进行卷积处理，得到第m第二样本特征图；

响应于所述第m第一样本特征图对应的通道数不是最大通道数，对所述第m第一样本特征图进行卷积处理后得到第一中间样本特征图，对第m+1第一样本特征图进行卷积和上采样处理后得到第二中间样本特征图，对所述第一中间样本特征图和所述第二中间样本特征图进行混合，并进行卷积处理后得到所述第m第二样本特征图。
一种图像处理装置，所述装置包括：

第一获取模块，用于获取原始图像，所述原始图像中包含至少一个目标对象；

第一预测模块，用于将所述原始图像输入第一预测模型，得到所述第一预测模型输出的第一透明通道图像，所述第一透明通道图像中包括所述原始图像中各个像素点对应的预测透明度值；

第二预测模块，用于将所述第一透明通道图像和所述原始图像输入第二预测模型，得到所述第二预测模型输出的第二透明通道图像，所述第二透明通道图像的精细度高于所述第一透明通道图像的精细度；

分割处理模块，用于根据所述第二透明通道图像对所述原始图像进行分割处理，得到所述目标对象对应的图像。
根据权利要求10所述的装置，其中，所述装置还包括：

第二获取模块，用于获取样本图像、样本标注图像和样本分割图像，所述样本标注图像中标注有所述样本图像中各个像素点对应的透明度值，所述样本分割图像是对样本标注图像进行二值化处理得到的二值化图像；

第一训练模块，用于根据所述样本图像和所述样本分割图像，训练所述第一预测模型；

第三预测模块，用于将所述样本图像输入训练得到的所述第一预测模型，得到所述第一预测模型输出的第一样本透明通道图像；

第二训练模块，用于根据所述第一样本透明通道图像、所述样本标注图像和所述样本图像，训练所述第二预测模型。
根据权利要求11所述的装置，其中，所述第二训练模块，包括：

精细化单元，用于将所述第一样本透明通道图像和所述样本图像输入精细化网络，得到所述精细化网络输出的第二样本透明通道图像；

边缘梯度单元，用于将所述样本图像、所述第二样本透明通道图像和所述样本标注图像输入边缘梯度网络，得到所述第二样本透明通道图像对应的边缘梯度损失；

计算单元，用于根据所述第二样本透明通道图像和所述样本标注图像，计算所述第二样本透明通道图像对应的结构相似性损失和抠图损失；

连通性差异单元，用于将所述第二样本透明通道图像和所述样本标注图像输入连通性差异网络，得到所述第二样本透明通道图像对应的连通性差异损失；

第一训练单元，用于根据所述边缘梯度损失、所述连通性差异损失、所述抠图损失和所述结构相似性损失，训练所述精细化网络；

确定单元，用于将训练得到的所述精细化网络确定为所述第二预测模型。
根据权利要求12所述的装置，其中，所述边缘梯度单元，还用于：

将所述样本图像输入预设算子中，得到所述样本图像对应的样本梯度图像，所述预设算子用于对所述原始样本图像进行一阶倒数运算；

对所述样本标注图像进行二值化和膨胀腐蚀操作，得到样本边缘图像，所述样本边缘图像用于指示所述样本标注图像中前景图像和背景图像的交界区域；

根据所述样本边缘图像和所述样本梯度图像，生成样本边缘梯度图像，所述样本边缘梯度图像用于指示所述样本图像中前景图像和背景图像的交界区域；

根据所述第二样本透明通道图像和所述样本边缘图像，生成边缘透明通道图像，所述边缘透明通道图像用于指示所述第二样本透明通道图像中前景图像和背景图像的交界区域；

根据所述边缘透明通道图像和所述样本边缘梯度图像，计算得到所述边缘梯度损失。
根据权利要求11所述的装置，其中，所述第一预测模型包括多尺度编码网络、特征金字塔网络、多尺度解码网络和深度监督网络；

所述第一训练模块，包括：

第一多尺度编码单元，用于将所述样本图像输入所述多尺度编码网络，得到所述多尺度编码网络输出的m个第一样本特征图，其中，不同第一样本特征图的分辨率和通道数不同，m为大于等于2的整数，所述多尺度编码网络用于对所述样本图像进行特征提取；

第一特征金字塔单元，用于将m个所述第一样本特征图输入所述特征金字塔网络，得到所述特征金字塔网络输出的m个第二样本特征图，其中，不同第二样本特征图的通道数相同且分辨率不同，所述特征金字塔网络用于将m个所述第一样本特征图的通道数处理为目标通道数；

第一多尺度解码单元，用于将m个所述第二样本特征图输入所述多尺度解码网络，得到所述多尺度解码网络输出的所述第一样本透明通道图像，所述多尺度解码网络用于对m个所述第二样本特征图进行相加和分辨率转换操作，所述第一样本透明通道图像的分辨率与所述样本图像的分辨率相同；

深度监督单元，用于将m个所述第二样本特征图输入所述深度监督网络，得到所述深度监督网络输出的m个第三样本透明通道图像，所述深度监督网络用于对所述m个第二样本特征图进行上采样处理，不同第二样本特征图对应不同上采样倍数，m个所述第三样本透明通道图像的分辨率与所述样本图像的分辨率相同；

二值化处理单元，用于对所述第一样本透明通道图像和m个所述第三样本透明通道图像进行二值化处理，得到第一样本分割图像和m个第二样本分割图像；

第二训练单元，用于根据所述第一样本分割图像、m个所述第二样本分割图像和所述样本分割图像，训练所述第一预测模型。
根据权利要求14所述的装置，其中，所述第一预测模块，包括：

第二多尺度编码单元，用于将所述原始图像输入所述多尺度编码网络，得到所述多尺度编码网络输出的n个第一特征图，其中，不同第一特征图的分辨率和通道数不同，n为大于等于2的整数；

第二特征金字塔单元，用于将n个所述第一特征图输入所述特征金字塔网络，得到所述特征金字塔网络输出的n个第二特征图，其中，不同第二特征图的通道数相同且分辨率不同，n个所述第二特征图的通道数为所述目标通道数；

第二多尺度解码单元，用于将n个所述第二特征图输入所述多尺度解码网络，得到所述多尺度解码网络输出的所述第一透明通道图像。
根据权利要求15所述的装置，其中，所述第二特征金字塔单元，还用于：

将n个所述第一特征图按照分辨率排列形成特征金字塔，所述特征金字塔中所述第一特征图的分辨率与所述第一特征图所在层级呈负相关关系；

响应于第n第一特征图对应的通道数为最大通道数，对所述第n第一特征图进行卷积处理，得到第n第二特征图；

响应于第n第一特征图对应的通道数不是最大通道数，对所述第n第一特征图进行卷积处理后得到第四特征图，对第n+1第一特征图进行卷积和上采样处理后得到第五特征图，对所述第四特征图和所述第五特征图进行混合，并进行卷积处理后得到所述第n第二特征图。
根据权利要求15所述的装置，其中，所述第二多尺度解码单元，还用于：

将n个所述第二特征图分别通过卷积块处理，得到n个第三特征图，n个所述第三特征图对应的分辨率相同，其中，不同第二特征图对应不同卷积块，且不同第二特征图对应使用的卷积块数目不同；

对n个所述第三特征图进行相加、卷积和上采样处理，得到所述第一透明通道图像。
根据权利要求14所述的装置，其中，所述第一特征金字塔单元，还用于：

将m个所述第一样本特征图按照分辨率形成样本特征金字塔，所述样本特征金字塔中所述第一样本特征图的分辨率与所述第一样本特征图所在层级呈负相关关系；

响应于第m第一样特征图对应的通道数为最大通道数，对所述第m第一样本特征图进行卷积处理，得到第m第二样本特征图；

响应于所述第m第一样本特征图对应的通道数不是最大通道数，对所述第m第一样本特征图进行卷积处理后得到第一中间样本特征图，对第m+1第一样本特征图进行卷积和上采样处理后得到第二中间样本特征图，对所述第一中间样本特征图和所述第二中间样本特征图进行混合，并进行卷积处理后得到所述第m第二样本特征图。
一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至9任一所述的图像处理方法。
一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至9任一所述的图像处理方法。