CN113222830A

CN113222830A - 图像处理方法和装置

Info

Publication number: CN113222830A
Application number: CN202110246084.7A
Authority: CN
Inventors: 王诗吟; 周强
Original assignee: Beijing Zitiao Network Technology Co Ltd
Current assignee: Beijing Zitiao Network Technology Co Ltd
Priority date: 2021-03-05
Filing date: 2021-03-05
Publication date: 2021-08-06

Abstract

本公开涉及一种图像处理方法和装置。该方法包括：获取待处理图像的可见区域的掩码，其中，待处理图像包含目标对象，目标对象的部分区域被遮挡物遮挡，可见区域为目标对象未被遮挡物遮挡的区域，或者，可见区域为待处理图像中除了目标对象被遮挡物遮挡的区域之外的区域；根据待处理图像和可见区域的掩码，获取待处理图像的可见区域与目标对象的不可见区域的相关关系；根据待处理图像和相关关系，补全目标对象的不可见区域的内容。从而，基于处理图像的可见区域与目标对象的不可见区域的相关关系，准确推断出目标对象的不可见区域的内容，完成了目标追踪、目标检测、图像分割等任务。

Description

图像处理方法和装置

技术领域

本公开涉及图像处理技术领域，尤其涉及一种图像处理方法和装置。

背景技术

在图像的采集过程中，受到光照、设备、算法等因素的影响，图像容易受损或者受到噪声干扰，导致图像无法正确表达内容。因此，图像修复(inpainting)已成为计算机视觉任务预处理的重要步骤之一，且与目标追踪、目标检测、图像分割等任务结果具有直接关联。

目前，图像的修复过程常常采用神经网络模型来补全图像。神经网络模型通常直接套用注意力机制，并未考虑到具体任务中图像需要补全的内容，导致无法成功捕捉到图像需要补全的区域，也无法准确推断出图像需要补全的内容，降低了神经网络模型的处理性能，且不利于实现目标追踪、目标检测、图像分割等任务。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题，本公开提供了一种图像处理方法和装置。

第一方面，本公开提供了一种图像处理方法，包括：

获取待处理图像的可见区域的掩码，其中，待处理图像包含目标对象，目标对象的部分区域被遮挡物遮挡，可见区域为目标对象未被遮挡物遮挡的区域，或者，可见区域为待处理图像中除了目标对象被遮挡物遮挡的区域之外的区域；

根据待处理图像和可见区域的掩码，获取待处理图像的可见区域与目标对象的不可见区域的相关关系，目标对象的不可见区域为目标对象被遮挡物遮挡区域；

根据待处理图像和相关关系，补全目标对象的不可见区域的内容。

通过第一方面提供的方法，充分考虑到目标对象的不可见区域与待处理图像的可见区域之间具备相关关系，以及目标对象的不可见区域与待处理图像中的背景区域之间不具备相关关系的因素，可在注意力机制中引入待处理图像的可见区域的掩码，使得注意力机制能够基于待处理图像的可见区域的掩码，确定出待处理图像的可见区域与目标对象的不可见区域的相关关系，以便基于处理图像的可见区域与目标对象的不可见区域的相关关系，准确推断出目标对象的不可见区域的内容，实现了待处理图像中目标对象的不可见区域的内容的补全，提高了补齐目标对象的不可见区域的内容的准确率和及时性，有利于可靠地完成目标追踪、目标检测、图像分割等任务。

在一种可能的设计中，根据待处理图像和可见区域的掩码，获取待处理图像的可见区域与目标对象的不可见区域的相关关系，包括：获取待处理图像对应的第一特征图；根据第一特征图对应的第一特征向量、可见区域的掩码对应的第一掩码特征向量、第一特征图对应的第二特征向量、可见区域的掩码对应的第二掩码特征向量，得到第一特征向量对应的可见区域的第一特征和第二特征向量对应的可见区域的第二特征，第一特征向量与第二特征向量的语义信息不同，第一掩码特征向量与第二掩码特征向量的维度顺序不同；根据第一特征和第二特征，得到相关矩阵图，相关矩阵图用于表示待处理图像的可见区域与目标对象的不可见区域的相关关系。

在一种可能的设计中，根据第一特征图对应的第一特征向量、可见区域的掩码对应的第一掩码特征向量、第一特征图对应的第二特征向量、可见区域的掩码对应的第二掩码特征向量，得到第一特征向量对应的可见区域的第一特征和第二特征向量对应的可见区域的第二特征，包括：将第一特征图对应的第一特征向量和可见区域的掩码对应的第一掩码特征向量进行点乘，得到用于表示所述第一特征的第一点乘结果；将第一特征图对应的第二特征向量和可见区域的掩码对应的第二掩码特征向量进行点乘，得到用于表示所述第二特征的第二点乘结果；根据第一特征和第二特征，得到相关矩阵图，包括：将第一点乘结果与第二点乘结果进行矩阵相乘运算，得到相关矩阵图。在一种可能的设计中，该方法还包括：获取待处理图像的目标对象的不可见区域的掩码；根据待处理图像和可见区域的掩码，获取待处理图像的可见区域与目标对象的不可见区域的相关关系，包括：获取待处理图像对应的第一特征图；根据第一特征图对应的第四特征向量、可见区域的掩码对应的第三掩码特征向量、第一特征图对应的第五特征向量、不可见区域的掩码对应的第四掩码特征向量，得到第四特征向量对应的可见区域的第三特征和第五特征向量对应的不可见区域的第四特征，第四特征向量与第五特征向量的语义信息不同，第三掩码特征向量与第四掩码特征向量的维度顺序不同；根据第三特征和第四特征，得到相关矩阵图，相关矩阵图用于表示待处理图像的可见区域与目标对象的不可见区域的相关关系。

在一种可能的设计中，根据第一特征图对应的第四特征向量、可见区域的掩码对应的第三掩码特征向量、第一特征图对应的第五特征向量、不可见区域的掩码对应的第四掩码特征向量，得到第四特征向量对应的可见区域的第三特征和第五特征向量对应的不可见区域的第四特征，包括：将第一特征图对应的第四特征向量和可见区域的掩码对应的第三掩码特征向量进行点乘，得到用于表示第三特征的第三点乘结果；将第一特征图对应的第五特征向量和不可见区域的掩码对应的第四掩码特征向量进行点乘，得到用于表示第四特征的第四点乘结果；根据第三特征和第四特征，得到相关矩阵图，包括：将第三点乘结果与第四点乘结果进行矩阵相乘运算，得到相关矩阵图。

在一种可能的设计中，根据待处理图像和相关关系，补全目标对象的不可见区域的内容，包括：根据相关矩阵图和第一特征图对应的第三特征向量，得到待处理图像对应的第二特征图；根据第二特征图补全目标对象的不可见区域的内容。

在一种可能的设计中，根据相关矩阵图和第一特征图对应的第三特征向量，得到待处理图像对应的第二特征图，包括：对相关矩阵图和第一特征图对应的第三特征向量进行矩阵相乘和归一化处理，得到第二处理后的特征向量，第二处理后的特征向量用于增强目标对象的不可见区域的内容对应的特征；对第二处理后的特征向量进行维度变换处理，得到第二特征图。

在一种可能的设计中，该方法还包括：采用卷积操作对第一特征图进行卷积处理，对卷积处理后的第一特征图进行向量化处理，得到第三特征向量；或者，对第一特征图进行向量化处理，得到第三特征向量；其中，第三特征向量的通道数与第一特征图的通道数相同。

在一种可能的设计中，方法还包括：采用卷积操作对第一特征图进行通道数降维处理，对降维处理后的第一特征图进行向量化处理，得到第一特征图对应的第一特征向量、第二特征向量、第四特征向量或第五特征向量；其中，第二特征向量和第一特征向量的通道数相同，第四特征向量和第五特征向量的通道数相同。

第二方面，本公开提供了一种图像处理装置，包括：

获取模块，用于获取待处理图像的可见区域的掩码，其中，待处理图像包含目标对象，目标对象的部分区域被遮挡物遮挡，可见区域为目标对象未被遮挡物遮挡的区域，或者，可见区域为待处理图像中除了目标对象被遮挡物遮挡的区域之外的区域；

获取模块，还用于根据待处理图像和可见区域的掩码，获取待处理图像的可见区域与目标对象的不可见区域的相关关系，目标对象的不可见区域为目标对象被遮挡物遮挡区域；

处理模块，用于根据待处理图像和相关关系，补全目标对象的不可见区域的内容。

在一种可能的设计中，获取模块，具体用于获取待处理图像对应的第一特征图；根据第一特征图对应的第一特征向量、可见区域的掩码对应的第一掩码特征向量、第一特征图对应的第二特征向量、可见区域的掩码对应的第二掩码特征向量，得到第一特征向量对应的可见区域的第一特征和第二特征向量对应的可见区域的第二特征，第一特征向量与第二特征向量的语义信息不同，第一掩码特征向量与第二掩码特征向量的维度顺序不同；根据第一特征和第二特征，得到相关矩阵图，相关矩阵图用于表示待处理图像的可见区域与目标对象的不可见区域的相关关系。

在一种可能的设计中，获取模块，具体用于将第一特征图对应的第一特征向量和可见区域的掩码对应的第一掩码特征向量进行点乘，得到用于表示第一特征的第一点乘结果；将第一特征图对应的第二特征向量和可见区域的掩码对应的第二掩码特征向量进行点乘，得到用于表示第二特征的第二点乘结果；将第一点乘结果与第二点乘结果进行矩阵相乘运算，得到相关矩阵图。

在一种可能的设计中，获取模块，还用于获取待处理图像的目标对象的不可见区域的掩码；

获取模块，具体用于获取待处理图像对应的第一特征图；根据第一特征图对应的第四特征向量、可见区域的掩码对应的第三掩码特征向量、第一特征图对应的第五特征向量、不可见区域的掩码对应的第四掩码特征向量，得到第四特征向量对应的可见区域的第三特征和第五特征向量对应的不可见区域的第四特征，第四特征向量与第五特征向量的语义信息不同，第三掩码特征向量与第四掩码特征向量的维度顺序不同；根据第三特征和第四特征，得到相关矩阵图，相关矩阵图用于表示待处理图像的可见区域与目标对象的不可见区域的相关关系。

在一种可能的设计中，获取模块，具体用于将第一特征图对应的第四特征向量和可见区域的掩码对应的第三掩码特征向量进行点乘，得到用于表示第三特征的第三点乘结果；将第一特征图对应的第五特征向量和不可见区域的掩码对应的第四掩码特征向量进行点乘，得到用于表示第四特征的第四点乘结果；将第三点乘结果与第四点乘结果进行矩阵运算，得到相关矩阵图。

在一种可能的设计中，处理模块，具体用于根据相关矩阵图和第一特征图对应的第三特征向量，得到待处理图像对应的第二特征图；根据第二特征图补全目标对象的不可见区域的内容。

在一种可能的设计中，处理模块，用于对相关矩阵图和第一特征图对应的第三特征向量进行矩阵相乘和归一化处理，得到第二处理后的特征向量，第二处理后的特征向量用于增强目标对象的不可见区域的内容对应的特征；对第二处理后的特征向量进行维度变换处理，得到第二特征图。

在一种可能的设计中，处理模块，还用于采用卷积操作对第一特征图进行卷积处理，对卷积处理后的第一特征图进行向量化处理，得到第三特征向量；或者，对第一特征图进行向量化处理，得到第三特征向量；其中，第三特征向量的通道数与第一特征图的通道数相同。

在一种可能的设计中，处理模块，还用于采用卷积操作对第一特征图进行通道数降维处理，对降维处理后的第一特征图进行向量化处理，得到第一特征图对应的第一特征向量、第二特征向量、第四特征向量或第五特征向量；其中，第二特征向量和第一特征向量的通道数相同，第四特征向量和第五特征向量的通道数相同。

上述第二方面以及上述第二方面的各可能的设计中所提供的图像处理装置，其有益效果可以参见上述第一方面和第一方面的各可能的实施方式所带来的有益效果，在此不再赘述。

第三方面，本公开提供了一种电子设备，包括：存储器和处理器；存储器用于存储程序指令；处理器用于调用存储器中的程序指令使得电子设备执行第一方面及第一方面任一种可能的设计中的图像处理方法。

第四方面，本公开提供了一种计算机存储介质，包括计算机指令，当计算机指令在电子设备上运行时，使得电子设备执行第一方面及第一方面任一种可能的设计中的图像处理方法。

第五方面，本公开提供了一种计算机程序产品，当计算机程序产品在计算机上运行时，使得计算机执行第一方面及第一方面任一种可能的设计中的图像处理方法。

第六方面，本公开提供了一种芯片系统，芯片系统包括：处理器；当处理器执行存储器中存储的计算机指令时，电子设备执行第一方面及第一方面任一种可能的设计中的图像处理方法。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例提供的图像处理方法的流程示意图；

图2为本公开实施例提供的人体的19个部分的结构示意图；

图3A为本公开实施例提供的图像处理方法的工作原理图；

图3B为本公开实施例提供的图像处理方法的流程示意图；

图4A为本公开实施例提供的图像处理方法的工作原理图；

图4B为本公开实施例提供的图像处理方法的流程示意图；

图5为本公开实施例提供的图像处理方法的流程示意图；

图6为本公开实施例提供的图像处理装置的结构示意图。

具体实施方式

为了能够更清楚地理解本公开的上述目的、特征和优点，下面将对本公开的方案进行进一步描述。需要说明的是，在不冲突的情况下，本公开的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本公开，但本公开还可以采用其他不同于在此描述的方式来实施；显然，说明书中的实施例只是本公开的一部分实施例，而不是全部的实施例。

示例性地，本公开提供一种图像处理方法、装置、设备、计算机存储介质以及计算机程序产品，通过将目标对象未被遮挡物遮挡的区域与目标对象的被遮挡物遮挡的区域之间的相关关系引入到注意力机制中，引导神经网络模型将注意力捕捉到目标对象的被遮挡物遮挡的区域与目标对象的未被遮挡物遮挡的区域之间的相关关系上，弱化了背景区域上的特征，从而补全了目标对象的被遮挡物遮挡的区域的内容，提高了推断目标对象的被遮挡物遮挡的区域的内容的准确率，提升了神经网络模型的处理性能，还有利于实现目标追踪、目标检测、图像分割等任务。

其中，本公开的图像处理方法由电子设备来执行。电子设备可以是平板电脑、手机(如折叠屏手机、大屏手机等)、可穿戴设备、车载设备、增强现实(augmented reality，AR)/虚拟现实(virtual reality， VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本、个人数字助理(personaldigital assistant，PDA)、智能电视、智慧屏、高清电视、4K电视、智能音箱、智能投影仪等物联网(theinternet of things，IOT)设备，本公开对电子设备的具体类型不作任何限制。

基于前述描述，本公开以实施例将以电子设备为例，结合附图和应用场景，对本公开提供的图像处理方法进行详细阐述。

请参阅图1，图1为本公开实施例提供的图像处理方法的流程示意图。如图1所示，本公开提供的图像处理方法可以包括：

S101、获取待处理图像的可见区域的掩码。

电子设备可获取待处理图像。其中，待处理图像包含目标对象，目标对象的部分区域被遮挡物遮挡。本公开对待处理图像的尺寸、格式和内容等参数不做限定。并且，目标对象可以包括但不限于为人体、动物或者物品等。

电子设备可对待处理图像的可见区域进行处理，获取到待处理图像的可见区域的掩码。

其中，可见区域为目标对象未被遮挡物遮挡的区域。即，在待处理图像中，关于目标对象的区域可以包括：目标对象的可见区域和目标对象的不可见区域。其中，本公开对目标对象的未被遮挡物遮挡的区域和目标对象的被遮挡物遮挡的区域的大小、形状和位置等参数不做限定。

或者，可见区域为待处理图像中除了目标对象被遮挡物遮挡的区域之外的区域。即，待处理图像包括两部分区域，分别为目标对象被遮挡物遮挡的区域(目标对象的不可见区域)，以及除了目标对象被遮挡物遮挡的区域之外的区域(背景区域和目标对象的可见区域)。

基于上述描述，由于背景区域与目标对象的不可见区域之间不具备相关性，目标对象的可见区域与目标对象的不可见区域之间具备相关性。因此，电子设备可将目标对象的可见区域的掩码确定为待处理图像的可见区域的掩码，有利于直观表征目标对象的可见区域，也可以将目标对象的可见区域的掩码和背景区域的掩码确定为待处理图像的可见区域的掩码，有利于突出目标对象的可见区域，增加计算的冗余性。

其中，待处理图像的可见区域的掩码可以理解为将待处理图像的可见区域的各个部分分割出来后，各个部分分别对应于0或1所形成的编码。

例如，假设待处理图像的可见区域为目标对象的可见区域，目标对象为人体时，电子设备可将人体分割成N个部位，并对分割出来的 N个部分分别采用数字0或1进行标记，得到人体的掩码，即待处理图像的可见区域的掩码。其中，N为正整数。

请参阅图2，在N＝19时，如图2所示，人体的19个部分可包括：头a1、颈a2、左肩a3、右肩a4、左上臂a5、右上臂a6、左下臂a7、右下臂a8、左手a9、右手a10、左臀a11、右臀a12、左大腿a13、右大腿a14、左小腿a15、右小腿a16、左脚a17、右脚a18和身体a19，且人体的掩码为由人体的19个部分分别对应数字0或1形成的编码。另外，本公开不限于将人体分割为19个部分。

S102、根据待处理图像和可见区域的掩码，获取待处理图像的可见区域与目标对象的不可见区域的相关关系。

由于待处理图像的可见区域的掩码可表示出待处理图像的可见区域，且待处理图像中除了待处理图像的可见区域之外的区域为目标对象的不可见区域，因此，电子设备可基于待处理图像和待处理图像的可见区域的掩码，可获取待处理图像的可见区域与目标对象的不可见区域之间的相关关系。

其中，本公开对上述相关关系的表示方式不做限定。另外，上述相关关系也可以用于表征待处理图像与目标对象的不可见区域之间的相关关系，也可以用于表征待处理图像与待处理图像的可见区域之间的相关关系。

S103、根据待处理图像和相关关系，补全目标对象的不可见区域的内容。

电子设备基于相关关系和待处理图像，可将目标对象的可见区域的特性与目标对象的不可区域的特性进行关联，通过目标对象的可见区域推断出目标对象的不可区域的内容，从而对目标对象的不可见区域的内容进行补齐，以便输出补齐目标对象的不可见区域后的待处理图像。

另外，电子设备基于相关关系和待处理图像，还可得到目标对象的完整区域的掩码，也可得到目标对象的完整区域的解析掩码。

本公开提供的图像处理方法，通过充分考虑到目标对象的不可见区域与待处理图像的可见区域之间具备相关关系，以及目标对象的不可见区域与待处理图像中的背景区域之间不具备相关关系的因素，可在注意力机制中引入待处理图像的可见区域的掩码，使得注意力机制能够基于待处理图像的可见区域的掩码，确定出待处理图像的可见区域与目标对象的不可见区域的相关关系，以便基于处理图像的可见区域与目标对象的不可见区域的相关关系，准确推断出目标对象的不可见区域的内容，实现了待处理图像中目标对象的不可见区域的内容的补全，提高了补齐目标对象的不可见区域的内容的准确率和及时性，有利于可靠地完成目标追踪、目标检测、图像分割等任务。

基于上述步骤S102的描述，电子设备可采用多种实现方式，根据待处理图像和可见区域的掩码，获取待处理图像的可见区域与目标对象的不可见区域的相关关系。

下面，结合图3A-图3B以及图4A-图4B，介绍电子设备得到待处理图像的可见区域与目标对象的不可见区域的相关关系的两种可行的实现方式。

请参阅图3A和图3B，图3A为本公开实施例提供的图像处理方法的工作原理图，图3B为本公开实施例提供的图像处理方法的流程示意图。如图3A和图3B所示，本公开的图像处理方法可以包括：

S201、获取待处理图像对应的第一特征图。

电子设备可采用神经网络模型，对待处理图像进行多层卷积处理，得到待处理图像对应的第一特征图。为了便于说明，图3A中的F_i为第一特征图，第一特征图F_i的尺寸可记为C×H×W，C为通道高数，H 为长度，W为宽度。

S202、根据第一特征图对应的第一特征向量、可见区域的掩码对应的第一掩码特征向量、第一特征图对应的第二特征向量、可见区域的掩码对应的第二掩码特征向量，得到第一特征向量对应的可见区域的第一特征和第二特征向量对应的可见区域的第二特征。电子设备可采用卷积操作对第一特征图进行通道数降维处理，对降维处理后的第一特征图进行向量化处理，得到第一特征图对应的第一特征向量。为了便于说明，图3A中的F_i ^q1为第一特征向量，第一特征向量F_i ^q1的尺寸可记为C/8×HW。

相应地，电子设备可将待处理图像的可见区域的掩码采样到与第一特征向量的尺寸保持相同，得到第一掩码特征向量。为了便于说明，图3A中的M_p1为第一掩码特征向量，第一掩码特征向量M_p1的尺寸可记为1×HW。

电子设备可采用卷积操作对第一特征图进行通道数降维处理，对降维处理后的第一特征图进行向量化处理，得到第一特征图对应的第二特征向量。为了便于说明，图3A中的F_i ^k1为第二特征向量，第二特征向量F_i ^k1的尺寸可记为HW×C/8。

相应地，电子设备可将待处理图像的可见区域的掩码采样到与第二特征向量的尺寸保持相同，得到第二掩码特征向量。为了便于说明，图3A中的M_p2为第二掩码特征向量，第二掩码特征向量M_p2的尺寸可记为HW×1。

其中，第一特征向量与第二特征向量的语义信息不同，第一掩码特征向量与第二掩码特征向量的维度顺序不同。此处的语义信息可以理解为第一特征图的不同角度，如亮度和颜色等。维度顺序可以理解为长度、宽度和高度的顺序不同，如长度、宽度和高度的顺序，以及高度、长度和宽度的顺序。

可见，第一掩码特征向量对应于目标对象的可见区域，或者，第一掩码特征向量对应于目标对象的可见区域和背景区域。第二掩码特征向量对应于目标对象的可见区域，或者，第二掩码特征向量对应于目标对象的可见区域和背景区域。

其中，第二特征向量和第一特征向量的通道数相同，有利于减少计算量。上述的向量化处理可理解为铺平处理，有利于降低计算量。一般情况下第一特征向量和第二特征向量的获得过程中的降维处理可采用一层卷积处理。

需要说明的是，本公开不限于上述方式得到第一特征向量、第二特征向量、第一掩码特征向量和第二掩码特征向量。例如，在获得第一掩码特征向量后，电子设备可将第一掩码特征向量的转置确定为第二掩码特征向量。

从而，电子设备可基于第一特征向量、第一掩码特征向量、第二特征向量和第二掩码特征向量，得到第一特征和第二特征。在一些实施例中，继续结合图3A，电子设备可采用神经网络模型，将第一特征向量和第一掩码特征向量进行点乘处理，得到用于表示第一特征的第一点乘结果。从而，将待处理图像的可见区域的特征过滤出来。其中，第一点乘结果用于表示与第一特征向量对应的可见区域的第一特征。

在一些实施例中，继续结合图3A，电子设备可采用神经网络模型，将第二特征向量和第二掩码特征向量进行点乘处理，得到用于表示第二特征的第二点乘结果。从而，确定目标对象的可见区域内的特征。其中，第二点乘结果用于表示与第二特征向量对应的可见区域的第二特征。

为了便于说明，图3A中，点乘处理采用一个圆圈内有一个点为例进行示意，表示两个矩阵对应元素相乘。

S203、根据第一特征和第二特征，得到相关矩阵图。

电子设备可将第一点乘结果与第二点乘结果进行矩阵相乘运算，计算出第一点乘结果中的每个空间位置点与第二点乘结果中的全部空间位置点之间的关联关系，使得第一点乘结果对应的待处理图像的可见区域与第二点乘结果对应的待处理图像的可见区域之间能够更加相关，反过来突出了目标对象的不可见区域，以得到相关矩阵图来表征出目标对象的不可区域与待处理图像的可见区域之间的相关关系。

此处的空间位置点为一特征图(H×W×C，H代表长度，W代表宽度，C代表通道数)中的一个点，该空间位置点的坐标表示为(i，j)，该空间位置点的尺寸为1×1×C。

为了便于说明，图3A中，矩阵相乘运算采用一个圆圈内有一个叉为例进行示意，A_i1为相关矩阵图，相关矩阵图A_i1的尺寸可记为HW ×HW。

另外，电子设备在进行矩阵相乘运算后，可在某个维度上做归一化(如采用Softmax函数)处理，得到相关矩阵图。

综上，电子设备可通过相关矩阵图来表征待处理图像的可见区域与目标对象的不可见区域的相关关系。

请参阅图4A和图4B，图4A为本公开实施例提供的图像处理方法的工作原理图，图4B为本公开实施例提供的图像处理方法的流程示意图。如图4A和图4B所示，本公开的图像处理方法可以包括：

S301、获取待处理图像的目标对象的不可见区域的掩码。

电子设备可对目标对象的不可见区域进行处理，获取到目标对象的不可见区域的掩码。其中，上述获得目标对象的不可见区域的掩码的具体实现过程可参见待处理图像的可见区域的掩码的描述，此处不做赘述。

S302、获取待处理图像对应的第一特征图。

其中，步骤S302的具体实现过程可参见图3A中的步骤S201的描述，此处不做赘述。为了便于说明，图4A中的F_i为第一特征图，第一特征图F_i的尺寸可记为C×H×W，C为通道高数，H为长度，W为宽度。

S303、根据第一特征图对应的第四特征向量、可见区域的掩码对应的第三掩码特征向量、第一特征图对应的第五特征向量、不可见区域的掩码对应的第四掩码特征向量，得到第四特征向量对应的可见区域的第三特征和第五特征向量对应的不可见区域的第四特征。

电子设备可采用卷积操作对第一特征图进行通道数降维处理，对降维处理后的第一特征图进行向量化处理，得到第一特征图对应的第四特征向量。为了便于说明，图4A中的F_i ^q2为第四特征向量，第四特征向量F_i ^q2的尺寸可记为C/8×HW。

相应地，电子设备可将待处理图像的可见区域的掩码采样到与第四特征向量的尺寸保持相同，得到第三掩码特征向量。为了便于说明，图4A中的M_p3为第三掩码特征向量，第三掩码特征向量M_p3的尺寸可记为1×HW。

电子设备可采用卷积操作对第一特征图进行通道数降维处理，对降维处理后的第一特征图进行向量化处理，得到第一特征图对应的第五特征向量。为了便于说明，图4A中的F_i ^k2为第五特征向量，第五特征向量F_i ^k2的尺寸可记为HW×C/8。

相应地，电子设备可将待处理图像的可见区域的掩码采样到与第五特征向量的尺寸保持相同，得到第四掩码特征向量。为了便于说明，图4A中的M_p4为第四掩码特征向量，第四掩码特征向量M_p4的尺寸可记为HW×1。

其中，第四特征向量与第五特征向量的语义信息不同，第三掩码特征向量与第四掩码特征向量的维度顺序不同。此处的语义信息可以理解为第一特征图的不同角度，如亮度和颜色等。维度顺序可以理解为长度、宽度和高度的顺序不同，如长度、宽度和高度的顺序，以及高度、长度和宽度的顺序。

可见，第三掩码特征向量对应于目标对象的可见区域，或者，第三掩码特征向量对应于目标对象的可见区域和背景区域。第四掩码特征向量对应于目标对象的不可见区域。

其中，第四特征向量和第五特征向量的通道数相同，有利于减少计算量。上述的向量化处理可理解为铺平处理，有利于降低计算量。一般情况下第四特征向量和第五特征向量的获得过程中的降维处理可采用一层卷积处理。

需要说明的是，本公开不限于上述方式得到第四特征向量、第五特征向量、第三掩码特征向量和第四掩码特征向量。例如，在获得第三掩码特征向量后，电子设备可将第三掩码特征向量的转置确定为第四掩码特征向量。

从而，电子设备可基于第四特征向量、第三掩码特征向量、第五特征向量和第四掩码特征向量，得到第三特征和第四特征。

在一些实施例中，继续结合图4A，电子设备可采用神经网络模型，将第四特征向量和第三掩码特征向量进行点乘处理，得到用于表示第三特征的第三点乘结果。从而，将待处理图像的可见区域的特征过滤出来。其中，第三点乘结果用于表示与第四特征向量对应的可见区域的第三特征。

在一些实施例中，继续结合图4A，电子设备可采用神经网络模型，将第五特征向量和第四掩码特征向量进行点乘，得到用于表示第四特征的第四点乘结果。从而，确定目标对象的不可见区域内的特征。其中，第四点乘结果用于表示与第五特征向量对应的可见区域的第四特征。

为了便于说明，图4A中，点乘处理采用一个圆圈内有一个点为例进行示意。

S304、根据第三特征和第四特征，得到相关矩阵图。

电子设备可将第三点乘结果与第四点乘结果进行矩阵相乘运算，计算出第三点乘结果中的每个空间位置点与第四点乘结果中的全部空间位置点之间的关联关系，使得第三点乘结果对应的待处理对象的可见区域与第二点乘结果对应的目标对象的不可见区域之间能够更加不相关，有效突出了目标对象的不可见区域以得到相关矩阵图来表征出待处理图像的可见区域与目标对象的不可见区域之间的相关关系。

为了便于说明，图4A中，矩阵相乘运算采用一个圆圈内有一个叉为例进行示意，A_i2为相关矩阵图，相关矩阵图A_i2的尺寸可记为HW ×HW。

基于上述步骤S103的描述，电子设备可采用多种实现方式，根据待处理图像和相关关系，补全目标对象的不可见区域的内容。

下面，结合图5，介绍电子设备补全目标对象的不可见区域的内容的具体实现方式。

请参阅图5，图5为本公开实施例提供的图像处理方法的流程示意图。如图5所示，本公开的图像处理方法可以包括：

S400、获取第一特征图对应的第三特征向量。

电子设备可采用多种方式获得第三特征向量。电子设备可采用多种方式获得第三特征向量。为了便于说明，图3A和图4A中的F_i ^v为第三特征向量，第三特征向量F_i ^v的尺寸可记为HW×C。

在一些实施例中，电子设备可采用卷积操作对第一特征图进行卷积处理，对卷积处理后的第一特征图进行向量化处理，得到第二特征向量。

在另一些实施例中，电子设备可对第一特征图进行向量化处理，得到第二特征向量。

S401、根据相关矩阵图和第一特征图对应的第三特征向量，得到待处理图像对应的第二特征图。

电子设备可对相关矩阵图和第三特征向量进行矩阵相乘和归一化处理，得到处理后的特征向量。其中，处理后的特征向量用于增强目标对象的不可见区域的内容对应的特征。

电子设备对处理后的特征向量进行维度变换(reshape)、转置和拆分空间维度等处理，将目标对象的可见区域的特征转移到目标对象的不可见区域中，以得到第二特征图。

为了便于说明，图3A和图4A中的F_i ^o为第二特征图，第二特征图F_i ^o的尺寸可记为C×H×W。

由此，可形成以第一特征图为输入，第二特征图为输出的注意力机制，使得神经网络的多个层的输入专注于第二特征图，其中，第一特征图和第二特征图的尺寸保持相同，可将注意力机制无缝插入到神经网络模型的不同阶段中，无需调节输出的特征图的空间维度，且不影响其余阶段的更新迭代，简化了输出特征图的操作。

S402、根据第二特征图补全目标对象的不可见区域的内容。

电子设备可采用神经网络模型，基于第二特征图能够增强目标对象的不可见区域的特征，以便推断出目标对象的不可见区域的内容，且减少了推断目标对象的不可见区域的内容的计算量。

综上，电子设备可基于由第一特征图转换为的第二特征图，来补全目标对象的不可见区域的内容。

示例性地，本公开提供一种图像处理装置。

请参阅图6，图6为本公开实施例提供的图像处理装置的结构示意图。本公开的图像处理装置可设置在电子设备中，可实现上述图1-图 4B实施例的图像处理方法对应于电子设备的操作。如图6所示，本公开提供的图像处理装置600可以包括：获取模块601和处理模块602。

获取模块601，用于获取待处理图像的可见区域的掩码，其中，待处理图像包含目标对象，目标对象的部分区域被遮挡物遮挡，可见区域为目标对象未被遮挡物遮挡的区域，或者，可见区域为待处理图像中除了目标对象被遮挡物遮挡的区域之外的区域；

获取模块601，还用于根据待处理图像和可见区域的掩码，获取待处理图像的可见区域与目标对象的不可见区域的相关关系，目标对象的不可见区域为目标对象被遮挡物遮挡区域；

处理模块602，用于根据待处理图像和相关关系，补全目标对象的不可见区域的内容。

在一些实施例中，获取模块601，具体用于获取待处理图像对应的第一特征图；根据第一特征图对应的第一特征向量、可见区域的掩码对应的第一掩码特征向量、第一特征图对应的第二特征向量、可见区域的掩码对应的第二掩码特征向量，得到第一特征向量对应的可见区域的第一特征和第二特征向量对应的可见区域的第二特征，第一特征向量与第二特征向量的语义信息不同，第一掩码特征向量与第二掩码特征向量的维度顺序不同；根据第一特征和第二特征，得到相关矩阵图，相关矩阵图用于表示待处理图像的可见区域与目标对象的不可见区域的相关关系。

在一种可能的设计中，获取模块601，具体用于将第一特征图对应的第一特征向量和可见区域的掩码对应的第一掩码特征向量进行点乘，得到用于表示第一特征的第一点乘结果；将第一特征图对应的第二特征向量和可见区域的掩码对应的第二掩码特征向量进行点乘，得到用于表示第二特征的第二点乘结果；将第一点乘结果与第二点乘结果进行矩阵相乘运算，得到相关矩阵图。

在一种可能的设计中，获取模块601，还用于获取待处理图像的目标对象的不可见区域的掩码；

获取模块601，具体用于获取待处理图像对应的第一特征图；根据第一特征图对应的第四特征向量、可见区域的掩码对应的第三掩码特征向量、第一特征图对应的第五特征向量、不可见区域的掩码对应的第四掩码特征向量，得到第四特征向量对应的可见区域的第三特征和与第五特征向量对应的不可见区域的第四特征，第四特征向量与第五特征向量的语义信息不同，第三掩码特征向量与第四掩码特征向量的维度顺序不同；根据第三特征和第四特征，得到相关矩阵图，相关矩阵图用于表示待处理图像的可见区域与目标对象的不可见区域的相关关系。

在一种可能的设计中，获取模块601，具体用于将第一特征图对应的第四特征向量和可见区域的掩码对应的第三掩码特征向量进行点乘，得到用于表示第三特征的第三点乘结果；将第一特征图对应的第五特征向量和不可见区域的掩码对应的第四掩码特征向量进行点乘，得到用于表示第四特征的第四点乘结果；将第三点乘结果与第四点乘结果进行矩阵运算，得到相关矩阵图。

在一种可能的设计中，处理模块602，具体用于根据相关矩阵图和第一特征图对应的第三特征向量，得到待处理图像对应的第二特征图；根据第二特征图补全目标对象的不可见区域的内容。

在一种可能的设计中，处理模块602，用于对相关矩阵图和第一特征图对应的第三特征向量进行矩阵相乘和归一化处理，得到第二处理后的特征向量，第二处理后的特征向量用于增强目标对象的不可见区域的内容对应的特征；对第二处理后的特征向量进行维度变换处理，得到第二特征图。

在一种可能的设计中，处理模块602，还用于采用卷积操作对第一特征图进行卷积处理，对卷积处理后的第一特征图进行向量化处理，得到第三特征向量；或者，对第一特征图进行向量化处理，得到第三特征向量；其中，第三特征向量的通道数与第一特征图的通道数相同。

在一种可能的设计中，处理模块602，还用于采用卷积操作对第一特征图进行通道数降维处理，对降维处理后的第一特征图进行向量化处理，得到第一特征图对应的第一特征向量、第二特征向量、第四征向量或第五特征向量；其中，第二特征向量和第一特征向量的通道数相同，第四特征向量和第五特征向量的通道数相同。

本公开提供的图像处理装置，可执行上述方法实施例，其具体实现原理和技术效果，可参见上述方法实施例，本公开此处不再赘述。

示例性地，本公开提供一种电子设备，包括：一个或多个处理器；存储器；以及一个或多个计算机程序；其中一个或多个计算机程序被存储在存储器中；一个或多个处理器在执行一个或多个计算机程序时，使得电子设备实现前文实施例的图像处理方法。

示例性地，本公开提供一种芯片系统，芯片系统应用于包括存储器和传感器的电子设备；芯片系统包括：处理器；当处理器执行前文实施例的图像处理方法。

示例性地，本公开提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器使得电子设备执行时实现前文实施例的图像处理方法。

示例性地，本公开提供一种计算机程序产品，当计算机程序产品在计算机上运行时，使得计算机执行前文实施例的图像处理方法。

在上述实施例中，全部或部分功能可以通过软件、硬件、或者软件加硬件的组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时，全部或部分地产生按照本公开实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如，固态硬盘(solid state disk，SSD))等。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上仅是本公开的具体实施方式，使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下，在其它实施例中实现。因此，本公开将不会被限制于本文的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种图像处理方法，其特征在于，包括：

获取待处理图像的可见区域的掩码，其中，所述待处理图像包含目标对象，所述目标对象的部分区域被遮挡物遮挡，所述可见区域为所述目标对象未被遮挡物遮挡的区域，或者，所述可见区域为所述待处理图像中除了所述目标对象被遮挡物遮挡的区域之外的区域；

根据所述待处理图像和所述可见区域的掩码，获取所述待处理图像的可见区域与所述目标对象的不可见区域的相关关系，所述目标对象的不可见区域为所述目标对象被遮挡物遮挡区域；

根据所述待处理图像和所述相关关系，补全所述目标对象的不可见区域的内容。

2.根据权利要求1所述的方法，其特征在于，所述根据所述待处理图像和所述可见区域的掩码，获取所述待处理图像的可见区域与所述目标对象的不可见区域的相关关系，包括：

获取所述待处理图像对应的第一特征图；

根据所述第一特征图对应的第一特征向量、所述可见区域的掩码对应的第一掩码特征向量、所述第一特征图对应的第二特征向量以及所述可见区域的掩码对应的第二掩码特征向量，得到所述第一特征向量对应的可见区域的第一特征和所述第二特征向量对应的可见区域的第二特征，其中，所述第一特征向量与所述第二特征向量的语义信息不同，所述第一掩码特征向量与所述第二掩码特征向量的维度顺序不同；

根据所述第一特征和所述第二特征，得到相关矩阵图，所述相关矩阵图用于表示所述待处理图像的可见区域与所述目标对象的不可见区域的相关关系。

3.根据权利要求2所述的方法，其特征在于，所述根据所述第一特征图对应的第一特征向量、所述可见区域的掩码对应的第一掩码特征向量、所述第一特征图对应的第二特征向量、所述可见区域的掩码对应的第二掩码特征向量，得到所述第一特征向量对应的可见区域的第一特征和所述第二特征向量对应的可见区域的第二特征，包括：

将所述第一特征图对应的第一特征向量和所述可见区域的掩码对应的第一掩码特征向量进行点乘，得到用于表示所述第一特征的第一点乘结果；

将所述第一特征图对应的第二特征向量和所述可见区域的掩码对应的第二掩码特征向量进行点乘，得到用于表示所述第二特征的第二点乘结果；

所述根据所述第一特征和所述第二特征，得到所述相关矩阵图，包括：

将所述第一点乘结果与所述第二点乘结果进行矩阵相乘运算，得到所述相关矩阵图。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取所述待处理图像的目标对象的不可见区域的掩码；

所述根据所述待处理图像和所述可见区域的掩码，获取所述待处理图像的可见区域与所述目标对象的不可见区域的相关关系，包括：

获取所述待处理图像对应的第一特征图；

根据所述第一特征图对应的第四特征向量、所述可见区域的掩码对应的第三掩码特征向量、所述第一特征图对应的第五特征向量、所述不可见区域的掩码对应的第四掩码特征向量，得到所述第四特征向量对应的所述可见区域的第三特征和所述第五特征向量对应的所述不可见区域的第四特征，其中，所述第四特征向量与所述第五特征向量的语义信息不同，所述第三掩码特征向量与所述第四掩码特征向量的维度顺序不同；

根据所述第三特征和所述第四特征，得到相关矩阵图，所述相关矩阵图用于表示所述待处理图像的可见区域与所述目标对象的不可见区域的相关关系。

5.根据权利要求4所述的方法，其特征在于，所述根据所述第一特征图对应的第一特征向量、所述可见区域的掩码对应的第一掩码特征向量、所述第一特征图对应的第二特征向量、所述不可见区域的掩码对应的第三掩码特征向量，得到所述第四特征向量对应的所述可见区域的第三特征和所述第五特征向量对应的所述不可见区域的第四特征，包括：

将所述第一特征图对应的第四特征向量和所述可见区域的掩码对应的第三掩码特征向量进行点乘，得到用于表示所述第三特征的第三点乘结果；

将所述第一特征图对应的第五特征向量和所述不可见区域的掩码对应的第四掩码特征向量进行点乘，得到用于表示所述第四特征的第四点乘结果；

所述根据所述第三特征和所述第四特征，得到相关矩阵图，包括：

将所述第三点乘结果与所述第四点乘结果进行矩阵相乘运算，得到所述相关矩阵图。

6.根据权利要求1-5任一项所述的方法，其特征在于，所述根据所述待处理图像和所述相关关系，补全所述目标对象的不可见区域的内容，包括：

根据所述相关矩阵图和第一特征图对应的第三特征向量，得到所述待处理图像对应的第二特征图；

根据所述第二特征图补全所述目标对象的不可见区域的内容。

7.根据权利要求6所述的方法，其特征在于，所述根据所述相关矩阵图和所述第一特征图对应的第三特征向量，得到所述待处理图像对应的第二特征图，包括：

对所述相关矩阵图和所述第一特征图对应的第三特征向量进行矩阵相乘和归一化处理，得到第二处理后的特征向量，所述第二处理后的特征向量用于增强所述目标对象的不可见区域的内容对应的特征；

对所述第二处理后的特征向量进行维度变换处理，得到所述第二特征图。

8.根据权利要求6所述的方法，其特征在于，所述方法还包括：

采用卷积操作对所述第一特征图进行卷积处理，对卷积处理后的第一特征图进行向量化处理，得到所述第三特征向量；或者，

对所述第一特征图进行向量化处理，得到所述第三特征向量；

其中，所述第三特征向量的通道数与所述第一特征图的通道数相同。

9.根据权利要求2-5任一项所述的方法，其特征在于，所述方法还包括：

采用卷积操作对所述第一特征图进行通道数降维处理，对降维处理后的第一特征图进行向量化处理，得到所述第一特征图对应的第一特征向量、第二特征向量、第四特征向量或第五特征向量；

其中，所述第二特征向量和所述第一特征向量的通道数相同，所述第四特征向量和所述第五特征向量的通道数相同。

10.一种图像处理装置，其特征在于，所述装置包括：

获取模块，用于获取待处理图像的可见区域的掩码，其中，所述待处理图像包含目标对象，所述目标对象的部分区域被遮挡物遮挡，所述可见区域为所述目标对象未被遮挡物遮挡的区域，或者，所述可见区域为所述待处理图像中除了所述目标对象被遮挡物遮挡的区域之外的区域；

所述获取模块，还用于根据所述待处理图像和所述可见区域的掩码，获取所述待处理图像的可见区域与所述目标对象的不可见区域的相关关系；

处理模块，用于根据所述待处理图像和所述相关关系，补全所述目标对象的不可见区域的内容。

11.一种电子设备，包括：一个或多个处理器；存储器；以及一个或多个计算机程序；其中所述一个或多个计算机程序被存储在所述存储器中；其特征在于，所述一个或多个处理器在执行所述一个或多个计算机程序时，使得所述电子设备实现如权利要求1-9任一项所述的图像处理方法。

12.一种计算机存储介质，其特征在于，包括计算机指令，当所述计算机指令在电子设备上运行时，使得所述电子设备执行如权利要求1-9任一项所述的图像处理方法。

13.一种计算机程序产品，其特征在于，当所述计算机程序产品在计算机上运行时，使得所述计算机执行如权利要求1-9任一项所述的图像处理方法。