WO2021179751A1

WO2021179751A1 - 图像处理方法和系统

Info

Publication number: WO2021179751A1
Application number: PCT/CN2020/140725
Authority: WO
Inventors: 施波迪; 罗勇; 黄之昊
Original assignee: 上海哔哩哔哩科技有限公司
Priority date: 2020-03-13
Filing date: 2020-12-29
Publication date: 2021-09-16
Also published as: US20220343507A1; EP4075381A1; CN113393477A; EP4075381A4; EP4075381B1

Abstract

一种图像处理方法，所述方法包括：获取原始图像并根据所述原始图像得到待处理图像（S200）；通过图像识别模型识别所述待处理图像以得到剪影数组（S202）；根据所述剪影数组生成剪影图像（S204）；根据所述原始图像和所述剪影图像生成目标图像，所述目标图像对应于所述原始图像的感兴趣区域（S206）。通过剪影数组和剪影图像实现了对原始图像的感兴趣区域的识别和分割，不需要借助景深信息识别和分割原始图像中的感兴趣区域(如人体轮廓区域)，因此，不需要高配置的硬件或系统。

Description

图像处理方法和系统

本申请申明2020年3月13日递交的申请号为202010174662.6、名称为“图像处理方法和系统”的中国专利申请的优先权，该中国专利申请的整体内容以参考的方式结合在本申请中。

技术领域

本申请实施例涉及计算机技术领域，尤其涉及一种图像处理方法、系统、设备及计算机可读存储介质。

背景技术

近年来，电子设备可以为用户提供各式各样的功能服务。这些电子设备可以是诸如计算机、平板电脑、电视机、多媒体设备、移动设备等。在一些情况下，这些电子设备可以通过安装在设备上的应用程序进行剪影操作。所述剪影操作是指将某些图像区域(如，人体轮廓)从照片/视频中分离出来，并将这分离出来的这些图像区域放置到另一个的照片/视频中。

然而，本专利申请人发现，现有技术的剪影应用，对电子设备的操作系统、硬件配置等均有要求，如苹果公司的人像剪影仅适用iOS11以上版本，且需要具备景深摄像头。

需要说明的是，上述内容并不用于限制申请保护范围。

发明内容

本申请实施例的目的是提供一种图像处理方法、系统、计算机设备及计算机可读存储介质，用于解决当前的剪影操作需要高配置的硬件或系统的问题。

本申请实施例的一个方面提供了一种图像处理方法，所述方法包括：获取原始图像并根据所述原始图像得到待处理图像；通过图像识别模型识别所述待处理图像以得到剪影数组；其中，所述剪影数组包括多个剪影数组元素，所述多个剪影数组元素包括多个第一数值和多个第二数值，所述多个第一数值对应所述待处理图像的感兴趣区域，所述多个第二数值对应所述待处理图像的非感兴趣区域；根据所述剪影数组生成剪影图像；及根据所述原始图像和所述剪影图像生成目标图像，所述目标图像对应于所述原始图像的感兴趣区域。

可选的，获取原始图像并根据所述原始图像得到待处理图像，包括：判断所述原始图像的尺寸大小是否等于预定尺寸大小；如果所述原始图像的尺寸大小等于所述预定尺寸大小，则将所述原始图像确定为所述待处理图像；及如果所述原始图像的尺寸大小不等于所述预定尺寸大小，则将所述原始图像调整为所述待处理图像，其中，所述待处理图像的尺寸大小等于所述预定尺寸大小。

可选的，所述图像识别模型包括训练好的神经网络模型；通过图像识别模型识别待处理图像以得到剪影数组，包括：将所述待处理图像输入到所述训练好的神经网络模型中，通过所述神经网络模型输出所述剪影数组；其中，所述剪影数组的每个第一数值与所述待处理图像的感兴趣区域的每个图像像素一一对应，所述剪影数组的每个第二数值与所述待处理图像的非感兴趣区域的每个图像像素一一对应。

可选的，根据所述剪影数组生成剪影图像，包括：根据所述剪影数组生成初始剪影图像；所述初始剪影图像包括多个第一像素和多个第二像素，所述初始剪影图像的每个第一像素与所述剪影数组的每个第一数值一一对应，所述初始剪影图像的每个第二像素与所述剪影数组的每个第二数值一一对应；及根据所述初始剪影图像生成所述剪影图像，所述剪影图像的尺寸大小与所述原始图像的尺寸大小相同。

可选的，根据所述原始图像和所述剪影图像生成目标图像，包括：确定将所述剪影图像作为掩膜滤镜的掩膜图像；及通过所述掩膜滤镜从所述原始图像中抽取出所述原始图像的感兴趣区域，以得到所述目标图像。

可选的，还包括：计算所述剪影数组和参考图像的参考数组之间的剪影匹配度；如果所述剪影数组和所述参考图像的参考数组之间的剪影匹配度大于预设阈值，则将所述目标图像插入到所述参考图像中。

可选的，计算所述剪影数组和参考图像的参考数组之间的剪影匹配度，包括：根据所述参考数组的各个参考数组元素和所述剪影数组中相应的剪影数组元素，计算所述剪影匹配度。

本申请实施例的一个方面又提供了一种图像处理系统，所述图像处理系统包括：获取模块，用于获取原始图像并根据所述原始图像得到待处理图像；识别模块，用于通过图像识别模型识别所述待处理图像以得到剪影数组；其中，所述剪影数组包括多个剪影数组元素，所述剪影数组元素包括多个第一数值和多个第二数值，所述多个第一数值对应所述待处理图像的感兴趣区域，所述多个第二数值对应所述待处理图像的非感兴趣区域；第一生成模块，用于根据所述剪影数组生成剪影图像；及第二生成模块，用于根据所述原始图像和所述剪影图像生成目标图像，所述目标图像对应于所述原始图像的感兴趣区域。

本申请实施例的一个方面又提供了一种计算机设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现以下步骤：获取原始图像并根据所述原始图像得到待处理图像；通过图像识别模型识别所述待处理图像以得到剪影数组；其中，所述剪影数组包括多个剪影数组元素，所述多个剪影数组元素包括多个第一数值和多个第二数值，所述多个第一数值对应所述待处理图像的感兴趣区域，所述多个第二数值对应所述待处理图像的非感兴趣区域；根据所述剪影数组生成剪影图像；及根据所述原始图像和所述剪影图像生成目标图像，所述目标图像对应于所述原始图像的感兴趣区域。

本申请实施例的一个方面又提供了一种计算机可读存储介质，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现以下步骤：获取原始图像并根据所述原始图像得到待处理图像；通过图像识别模型识别所述待处理图像以得到剪影数组；其中，所述剪影数组包括多个剪影数组元素，所述多个剪影数组元素包括多个第一数值和多个第二数值，所述多个第一数值对应所述待处理图像的感兴趣区域，所述多个第二数值对应所述待处理图像的非感兴趣区域；根据所述剪影数组生成剪影图像；及根据所述原始图像和所述剪影图像生成目标图像，所述目标图像对应于所述原始图像的感兴趣区域。

本申请实施例提供的图像处理方法、系统、设备及计算机可读存储介质，可以通过剪影数组和剪影图像实现对所述原始图像的感兴趣区域的识别和分割，不需要借助景深信息识别和分割原始图像中的感兴趣区域(如人体轮廓区域)，因此，不需要高配置的硬件或系统。

附图说明

图1示意性示出了根据本申请实施例的图像处理方法的应用环境图；

图2示意性示出了根据本申请实施例一的图像处理方法的流程图；

图3示意性示出了图2中步骤S200的子步骤；

图4示意性示出了根据本申请实施例一的图像处理方法的另一流程图；

图5示意性示出了图2中步骤S204的子步骤；

图6为图1中的剪影图像；

图7为图1中的目标图像；

图8示意性示出了图2中步骤S206的子步骤；

图9示意性示出了根据本申请实施例一的图像处理方法的新增流程图；

图10示意性示出了图9中步骤S900的子步骤；

图11示意性示出了基于本申请实施例二的动漫剪影流程；

图12为本申请实施例二中的剪影图像mask_image；

图13为本申请实施例二中的融合图像；

图14示意性示出了根据本申请实施例三的图像处理系统的框图；及

图15示意性示出了根据本申请实施例四的适于实现图像处理方法的计算机设备的硬件架构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，在本申请实施例中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本申请要求的保护范围之内。

苹果公司的人像剪影为例：苹果公司提供了ARKit平台，其具有景深信息、人体信息采集的功能。该ARKit平台能够识别人体在物理环境中的深度，通过景深信息和人像信息，从图像中识别和分割人像。但是，该ARKit平台也具有局限性：一、ARKit平台是由苹果公司提供的非开源框架，其不适用于Android等其他操作系统；二、ARKit平台仅适用于iOS11以上版本，其不适用于iOS11以下的系统版本；三、需要摄像设备(如手机)具备识别人体和景深的硬件功能，如，至少需要具备景深摄像头的iPhoneX系列机型；四、需要高配置的硬件以执行大量图形运算，会消耗极高的能源。以下实施例在于解决当前的剪影操作需要高配置的硬件、需要执行大量图形运算以消耗极高的能源、系统平台限制等问题。

图1示意性示出了根据本申请实施例的图像处理方法的环境应用示意图。在示例性的实施例中，计算机设备2可以被配置为提供剪影服务。计算机设备2可以包括任何类型的计算设备，诸如移动设备、平板设备、膝上型计算机、计算站、虚拟现实设备、机顶盒、智能电视、电视盒等，也可以是具有剪影功能的服务器等。

如图1所示，计算机设备2显示有一张图像，该图像显示了一个女孩以特定姿势站立。本申请旨在将该女孩的人体轮廓区域从这张图像中分离出来，以用于剪影操作。具体的，所述剪影操作是指将该女孩的人体轮廓区域从这张图像中，并且该分离出来的人体轮廓区域放置到另一张图像或视频中。下面将以这张图像为例，对本申请的图像处理方法进行介绍。但是需要说明的是，本申请的图像处理方法不仅适用于将人体轮廓区域从图像中分离，也适于将其他物体轮廓从图像中分离。所述其他物体轮廓可以是猫、狗、熊等生物的轮廓。

实施例一

图2示意性示出了根据本申请实施例一的图像处理方法的流程图。可以理解，本方法实施例中的流程图不用于对执行步骤的顺序进行限定。下面以计算机设备2为执行主体进行示例性描述。

如图2所示，该图像处理方法可以包括步骤S200～S206，其中：

步骤S200，获取原始图像并根据所述原始图像得到待处理图像。

本申请实施例对所述原始图像的来源及种类不做限定。作为示例，所述原始图像可以是计算机设备2通过其内置的摄像元件实时采集的，也可以是从数据库或其他数据来源获取的。该原始图像中包括感兴趣区域和非感兴趣区域。其中，所述感兴趣区域可以是人体轮廓区域、动物轮廓区域等需要被提取的画面或视频区域，所述非感兴趣区域是所述原始图像中出所述感兴趣区域之外的其他区域。如图1所示，计算机设备2中展示了这样一幅图像，即一个女孩以特定姿势站立。为了便于介绍本申请，本申请实施例将图1中展示的图像作为所述原始图像，将该女孩的人体轮廓区域作为所述原始图像中的所述感兴趣区域，并将所述原始图像中该女孩的人体轮廓区域之外的剩余区域作为所述非感兴趣区域。

图像处理通常会对图像尺寸、格式等提出具体要求。因此，为了提高图像处理方法中后续步骤的可操作性和处理效率，本申请实施例中可以对所述原始图像进行一些预处理，例如，所述原始图像的尺寸大小进行规范化处理。在示例性的实施例中，如图3所示，所述步骤S200可以包括步骤S300～S304，其中：步骤S300，判断所述原始图像的尺寸大小是否等于预定尺寸大小；步骤S302，如果所述原始图像的尺寸大小等于所述预定尺寸大小，则将所述原始图像确定为所述待处理图像；步骤S304，如果所述原始图像的尺寸大小不等于所述预定尺寸大小，则将所述原始图像调整为所述待处理图像，其中，所述待处理图像的尺寸大小等于所述预定尺寸大小。

示例性的，如果所述图像处理方法的后续需要涉及到神经网络模型，则所述预定尺寸大小是根据该神经网络模型的参数规格所确定的，如：将所述预定尺寸大小设置为“513(像素)*513(像素)”，所述预定尺寸大小为长和宽均为513个像素。

步骤S202，通过图像识别模型识别所述待处理图像以得到剪影数组。

所述剪影数组包括多个剪影数组元素。所述多个剪影数组元素包括多个第一数值和多个第二数值。所述多个第一数值对应所述待处理图像的感兴趣区域，所述多个第二数值对应所述待处理图像的非感兴趣区域。

在示例性的实施例中，每个第一数值均可以用非零数值(如，“1”)表示，每个第二数值均可以用“0”表示。不难理解，所述剪影数组中的各个剪影数组元素“1”所对应的所述待处理图像中的图像像素位于所述待处理图像的感兴趣区域之内，相反的，所述剪影数组中的各个剪影数组元素“0”所对应的所述待处理图像中的图像像素位于所述待处理图像的感兴趣区域(人体轮廓区域)之外。

识别所述待处理图像的方式有多种。示例性的，计算机设备2可以提高所述待处理图像的灰度或某个RGB通道的对比度，识别边缘，沿着边缘将所述待处理图像划分为各个区域，再试着将若干相邻区域组合起来，与数据库中的项目对比或交由深度学习模块分析，以达到识别目标。深度学习：是机器学习的一种，根据提供的样本数据，找出其中的内在规律和表示层次。通过对模型进行训练，训练后的模型可以将通常只能由人的感官才能理解的事物，如语言、图像等，解释成若干层次，每个层次包含若干特征信息。

本申请实施例中，计算机设备2可以依赖机器学习框架获取所述待处理图像中的感兴趣区域(如人体轮廓区域)，通过机器学习方式获取感兴趣区域没有硬件上的强制要求，也使用与Android等操作系统，因此可以适用于目前大多数的智能终端设备，也不需要景深信息即可识别感兴趣区域，不需要大量的图像运算和高耗能。在示例性的实施例中，所述图像识别模型包括训练好的神经网络模型，如图4所示，所述步骤S202可以包括步骤S202'：将所述待处理图像输入到所述训练好的神经网络模型中，通过所述神经网络模型输出所述剪影数组。其中，所述剪影数组的每个第一数值与所述待处理图像的感兴趣区域的每个图像像素一一对应，所述剪影数组的每个第二数值与所述待处理图像的非感兴趣区域的每个图像像素一一对应。例如，所述待处理图像的尺寸大小为513*513，则所述剪影数组对应为一个513*513的二维数组。例如，所述剪影数组第3行第5列对应的剪影数组元素为第二数值“0”，即V _[3][5]＝0，V _[3][5]对应于所述待处理图像中的第3行第5列对应的像素R _[3][5]。由于V _[3][5]＝0，所以所述待处理图像中的像素R _[3][5]在所述待处理图像的感兴趣区域(人体轮廓区域)之外。

所述神经网络模型可以是深度神经网络模型，例如，tensorflow-deeplab-v3模型。

步骤S204，根据所述剪影数组生成剪影图像。

所述剪影图像可以是多个黑色像素和多个白色像素构成的黑白图像，也可以是由其他颜色构成的双色图像，如由多个黑色像素和多个红色像素构成的红黑图像。

在示例性的实施例中，如图5所示，所述步骤S204可以包括步骤S500～S502，其中：步骤S500，根据所述剪影数组生成初始剪影图像；步骤S502，根据所述初始剪影图像生成所述剪影图像，所述剪影图像的尺寸大小与所述原始图像的尺寸大小相同。所述初始剪影图像包括多个第一像素和多个第二像素，所述初始剪影图像中的每个第一像素与所述剪影数组中的每个第一数值一一对应，所述初始剪影图像中的每个第二像素与所述剪影数组的每个第二数值一一对应。

所述剪影数组的列数与行数分别等于所述待处理图像的宽像素数与高像素数。由于所述待处理图像的尺寸大小与所述原始图像的尺寸大小可能是不相同的，因此计算机设备2要需要先根据所述剪影数组生成与所述剪影数组对应的初始剪影图像，剪影数组的列数与行数分别等于所述初始剪影图像的宽像素数与高像素数；然后根据所述初始剪影图像生成与所述原始图像具有相同尺寸大小的剪影图像，即，所述剪影图像是由多个第一像素和多个第二像素构成的并且与原始图像具有同等像素个数的图像。

在示例性的实施例中，第一像素为白色像素，第二像素为黑色像素。所述剪影数组中的每个第一数值“1”一一对应所述初始剪影图像中的白色像素，所述剪影数组中的每个第二数值“0”一一对应所述初始剪影图像中的黑色像素。同样的，通过所述初始剪影图像生成的所述剪影图像同样是由多个白色像素和多个黑色像素构成如图6所示的图像。

步骤S206，根据所述原始图像和所述剪影图像生成目标图像，所述目标图像对应于所述原始图像的感兴趣区域。

作为示例，计算机设备2可以根据所述剪影图像，将所述原始图像中的感兴趣区域(人体轮廓区域)从所述原始图像中分离出来，以得到如图7所示的所述目标图像。

作为示例，如图8所示，所述步骤S206可以包括步骤S800～S802，其中：步骤S800，确定将所述剪影图像作为掩膜滤镜的掩膜图像；步骤S802，通过所述掩膜滤镜从所述原始图像中抽取出所述原始图像的感兴趣区域，以得到所述目标图像。所述掩膜滤镜，用于对所述原始图像中的非感兴趣区域进行遮挡，从所述原始图像中提取所述原始图像的感兴趣区域，得到感兴趣区域图像(即所述目标图像)。

本申请实施例提供的上述图像处理方法，通过剪影数组和剪影图像实现对所述原始图像的感兴趣区域的识别和分割，具体的，通过图像识别模型识别待处理图像的感兴趣区域和非感兴趣区域，并将待处理图像的感兴趣区域和非感兴趣区域以数组形式的剪影数组表示和区分，进而根据剪影数组生成相应的剪影图像，并通过剪影图像分割原始图像中的感兴趣区域和非感兴趣区域以得到目标图像。通过上述步骤避免了借助景深信息识别和分割原始图像中的感兴趣区域(如人体轮廓区域)，因此，不需要高配置的硬件和不需要执行大量图形运算，具有耗能低的优势。另外，本实施例用数组形式代替图像形式，进一步降低了图像处理的数据处理量。

从所述原始图像中得到的所述目标图像，可以用于多个场景中，如动漫场景。示例性的，计算机设备2在得到所述目标图像(即所述原始图像中的人体轮廓区域)之后，可以将所述目标图像放置到另一个图像或视频中，例如，将所述目标图像放置到漫画图像中，即，将真人图像融入到漫画图像中以实现真人图像和虚拟场景的融合。

可以理解，将目标图像放置到另一个图像或视频中，并不是一件简单的事情，其首先要考虑的问题是：该目标图像与另一图像或视频中的待替换区域是否高度匹配。示例性的，计算机设备2需要判断如图7所示的人体轮廓是否与另一个图像或视频中的待替换人体轮廓(如漫画图像中的卡通人体轮廓)是否是匹配的。

为了方便描述，下面将所述目标图像的插入/放置对象统称为参考图像。

在示例性的实施例中，如图9所示，计算机设备2可以通过步骤S900～S902准确地判断所述目标图像与参考图像之间的匹配程度。其中，步骤S900，计算所述剪影数组和参考图像的参考数组之间的剪影匹配度；步骤S902，如果所述剪影数组和所述参考图像的参考数组之间的剪影匹配度大于预设阈值，则将所述目标图像插入到所述参考图像中。当然，如果所述剪影数组和所述参考图像的参考数组之间的剪影匹配度不大于预设阈值，则说明所述目标图像不合适插入到所述参考图像中。

在示例性的实施例中，如图10所示，步骤S900可以包括步骤S900'：根据所述参考数组的各个参考数组元素和所述剪影数组中相应的剪影数组元素，计算所述剪影匹配度。

作为示例，所述剪影数组可以是由多个零值和多个非零值构成的一个二维数组“shadow”，所述参考数组可以是由多个零值和多个非零值构成的另一个二维数组“refer”。所述剪影数组的行数和所述参考数组的行数是相同的，且所述剪影数组的列数和所述参考数组的列数是相同的。计算机设备2可以逐个判断剪影数组中的每个剪影数组元素和所述参考数组中相应位置处的参考数组元素同时大于零的剪影数组元素数量“numerator”，具体如下：If(shadow[i][j]＞0&&refer[i][j]＞0)numerator++；逐个判断剪影数组中的每个剪影数组元素大于零或所述参考数组中相应位置处的参考数组元素大于零的剪影数组元素数量“denumerator”，具体如下：If(shadow[i][j]＞0||refer[i][j]＞0)denumerator++；以及将numerator除以denumerator得到的商确定为所述剪影匹配度。

实施例二

如图11所示，下面将具体描述基于上述实施例一的图像处理方法的动漫剪影流程。具体如下。

步骤S1100，计算机设备2通过摄像头采集一个原始图像input_image，其中，该原始图像input_image的宽、高分别为w_origin、h_origin。

步骤S1102，计算机设备2重绘所述原始图像input_image，以得到待处理图像(像素w_input*h_input)。其中，待处理图像宽、高分别为w_input、h_input，且w_input、h_input均为513个像素。

步骤S1104，计算机设备2将所述待处理图像输入到训练好的tensorflow-deeplab-v3模型中，通过训练好的tensorflow-deeplab-v3模型输出一个剪影数组shadow。该剪影数组是一个二维数组shadow[h_output][w_output]，该剪影数组为w_output列和h_output行。该剪影数组的每个剪影数组元素均为整型，例如，“0”代表这个剪影数组元素所对应的待处理图像中的像素位于所述待处理图像的感兴趣区域(如，图1中的人体轮廓区域)之外，“1”代表这个剪影数组元素所对应的待处理图像中的像素位于所述待处理图像的感兴趣区域(如，图1中的人体轮廓区域)之内。

步骤S1106，计算机设备2根据所述剪影数组shadow[h_output][w_output]生成初始剪影图像(像素w_output*h_output)，其中，初始剪影图像(像素w_output*h_output)是由多个黑、白像素构成的图像，每个黑色像素对应所述剪影数组shadow[h_output][w_output]中相应位置处的剪影数组元素“0”，并且每个白色像素对应所述剪影数组shadow[h_output][w_output]中相应位置处的剪影数组元素“1”。然后，计算机设备对所述初始剪影图像(像素w_output*h_output)进行上下文重绘生成剪影图像mask_image(像素w_origin*h_origin)，所述剪影图像mask_image的尺寸大小(像素w_origin*h_origin)和所述原始图像input_image的尺寸大小(像素w_origin*h_origin)是相同的，如图12所示。

步骤S1108，计算机设备2构造一个Mask滤镜，入参为尺寸一致的所述原始图像input_image、任意选择的背景图像background_image(可为空)和所述剪影图像mask_image。Mask滤镜可以会在原始图像input_image的每个像素与和剪影图像mask_image中相同位置处的像素之间做像素色值运算(针对某一位置，如果原始图像input_image中处于这个位置的像素的像素色值input不为0，则对原始图像input_image中处于这个位置的像素的像素色值input与剪影图像mask_image中处于这个位置的像素的像素色值mask进行求交操作。如果所述求交操作的结果不为0，则取input&mask；如果所述求交操作的结果为0，则判断背景图像background_image中处于这个位置是否有像素色值background，若有则取background，若无则取0，最终输出目标图像output_image。具体可以通过如下代码实现：

步骤S1101，计算机设备2获取一个参考图像(像素w_origin*h_origin)。该参考图像的宽、高分别为w_origin、h_origin。

步骤S1103，计算机设备2对所述参考图像(像素w_origin*h_origin)进行上下文重绘，得到重绘后的参考图像(像素w_output*h_output)；

步骤S1105，计算机设备2将所述重绘后的参考图像(像素w_output*h_output)转化为参考数组refer。该参考数组为一个二维数组refer[h_output][w_output]，该参考数组为w_output列和h_output行。

步骤S1107，计算机设备2计算参考数组refer和剪影数组shadow之间的剪影匹配度。具体的，计算机设备2可以对剪影数组中的每个剪影数组元素shadow[i][j]和参照数组中相应位置处的参考数组元素refer[i][j]做计算(输出求交大于0的位置个数numerator除以求并大于0的位置个数denumerator的商)。具体可以通过如下代码实现：

步骤S1109，如果所述剪影匹配度大于预设阈值，计算机设备2则可以进行图像融合。例如，所述计算机设备2可以将目标图像output_image插入到所述参考图像中，或者将参考图像中的部分图像插入到所述原始图像input_image中以替换所述目标图像。例如，将参数图像中的真人图像插入到原始图input_image中，得到如图13所示的融合图像。示例性的，计算机设备2也可以根据目标图像和真人图像的相似度进行打分，并显示在融合图像中，以增加趣味性。

实施例三

图14示意性示出了根据本申请实施例三的图像处理系统的框图，该图像处理系统可以被分割成一个或多个程序模块，一个或者多个程序模块被存储于存储介质中，并由一个或多个处理器所执行，以完成本申请实施例。本申请实施例所称的程序模块是指能够完成特定功能的一系列计算机可读指令段，以下描述将具体介绍本实施例中各程序模块的功能。

如图14所示，该图像处理系统1400可以包括获取模块1410、识别模块1420、第一生成模块1430和第二生成模块1440，其中：

获取模块1410，用于获取原始图像并根据所述原始图像得到待处理图像；

识别模块1420，用于通过神经网络模型识别所述待处理图像以得到剪影数组；其中，所述剪影数组包括多个剪影数组元素，所述剪影数组元素包括多个第一数值和多个第二数值，所述多个第一数值对应所述待处理图像的感兴趣区域，所述多个第二数值对应所述待处理图像的非感兴趣区域；

第一生成模块1430，用于根据所述剪影数组生成剪影图像；及

第二生成模块1440，用于根据所述原始图像和所述剪影图像生成目标图像，所述目标图像对应于所述原始图像的感兴趣区域。

在示例性的实施例中，获取模块1410，还用于：判断所述原始图像的尺寸大小是否等于预定尺寸大小；如果所述原始图像的尺寸大小等于所述预定尺寸大小，则将所述原始图像确定为所述待处理图像；及如果所述原始图像的尺寸大小不等于所述预定尺寸大小，则将所述原始图像调整为所述待处理图像，其中，所述待处理图像的尺寸大小等于所述预定尺寸大小。

在示例性的实施例中，所述图像识别模型包括训练好的神经网络模型。识别模块1420，还用于：将所述待处理图像输入到所述训练好的神经网络模型中，通过所述神经网络模型输出所述剪影数组；其中，所述剪影数组的每个第一数值与所述待处理图像的感兴趣区域的每个图像像素一一对应，所述剪影数组的每个第二数值与所述待处理图像的非感兴趣区域的每个图像像素一一对应。

在示例性的实施例中，第一生成模块1430，还用于：根据所述剪影数组生成初始剪影图像；所述初始剪影图像包括多个第一像素和多个第二像素，所述初始剪影图像的每个第一像素与所述剪影数组的每个第一数值一一对应，所述初始剪影图像的每个第二像素与所述剪影数组的每个第二数值一一对应；及根据所述初始剪影图像生成所述剪影图像，所述剪影图像的尺寸大小与所述原始图像的尺寸大小相同。

在示例性的实施例中，第二生成模块1440，还用于：确定将所述剪影图像作为掩膜滤镜的掩膜图像；及通过所述掩膜滤镜从所述原始图像中抽取出所述原始图像的感兴趣区域，以得到所述目标图像。

在示例性的实施例中，所述图像处理系统1400还包括计算模块(未标识)，所述计算模块用于：计算所述剪影数组和参考图像的参考数组之间的剪影匹配度；如果所述剪影数组和所述参考图像的参考数组之间的剪影匹配度大于预设阈值，则将所述目标图像插入到所述参考图像中。

在示例性的实施例中，所述计算模块(未标识)，还用于：根据所述参考数组的各个参考数组元素和所述剪影数组中相应的剪影数组元素，计算所述剪影匹配度。

实施例四

图15示意性示出了根据本申请实施例四的适于实现图像处理方法的计算机设备2的硬件架构示意图。本实施例中，计算机设备2是一种能够按照事先设定或者存储的指令，自动进行数值计算和/或信息处理的设备。例如，可以是智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器，或者多个服务器所组成的服务器集群)等。如图15所示，计算机设备2至少包括但不限于：可通过系统总线相互通信链接存储器1510、处理器1520、网络接口1530。其中：

存储器1510至少包括一种类型的计算机可读存储介质，可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器1510可以是计算机设备2的内部存储模块，例如该计算机设备2的硬盘或内存。在另一些实施例中，存储器1510也可以是计算机设备2的外部存储设备，例如该计算机设备2上配备的插接式硬盘，智能存储卡(Smart Media Card，简称为SMC)，安全数字(Secure Digital，简称为SD)卡，闪存卡(Flash Card)等。当然，存储器1510还可以既包括计算机设备2的内部存储模块也包括其外部存储设备。本实施例中，存储器1510通常用于存储安装于计算机设备2的操作系统和各类应用软件，例如图像处理方法的程序代码等。此外，存储器1510还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器1520在一些实施图例中可以是中央处理器(Central Processing Unit，简称为CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器1520通常用于控制计算机设备2的总体操作，例如执行与计算机设备2进行数据交互或者通信相关的控制和处理等。本实施例中，处理器1520用于运行存储器1510中存储的程序代码或者处理数据。

网络接口1530可包括无线网络接口或有线网络接口，该网络接口1530通常用于在计算机设备2与其他计算机设备之间建立通信链接。例如，网络接口1530用于通过网络将计算机设备2与外部终端相连，在计算机设备2与外部终端之间的建立数据传输通道和通信链接等。网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication，简称为GSM)、宽带码分多址(Wideband Code Division Multiple Access，简称为WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。

需要指出的是，图15仅示出了具有部件1510-1530的计算机设备，但是应理解的是，并不要求实施所有示出的部件，可以替代的实施更多或者更少的部件。

在本实施例中，存储于存储器1510中的图像处理方法还可以被分割为一个或者多个程序模块，并由一个或多个处理器(本实施例为处理器1520)所执行，以完成本申请实施例。

实施例五

本申请还提供一种计算机可读存储介质，计算机可读存储介质其上存储有计算机可读指令，计算机可读指令被处理器执行时实现以下步骤：

获取原始图像并根据所述原始图像得到待处理图像；

通过图像识别模型识别所述待处理图像以得到剪影数组；其中，所述剪影数组包括多个剪影数组元素，所述多个剪影数组元素包括多个第一数值和多个第二数值，所述多个第一数值对应所述待处理图像的感兴趣区域，所述多个第二数值对应所述待处理图像的非感兴趣区域；

根据所述剪影数组生成剪影图像；及

根据所述原始图像和所述剪影图像生成目标图像，所述目标图像对应于所述原始图像的感兴趣区域。

本实施例中，计算机可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，计算机可读存储介质可以是计算机设备的内部存储单元，例如该计算机设备的硬盘或内存。在另一些实施例中，计算机可读存储介质也可以是计算机设备的外部存储设备，例如该计算机设备上配备的插接式硬盘，智能存储卡(Smart Media Card，简称为SMC)，安全数字(Secure Digital，简称为SD)卡，闪存卡(Flash Card)等。当然，计算机可读存储介质还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中，计算机可读存储介质通常用于存储安装于计算机设备的操作系统和各类应用软件，例如实施例中图像处理方法的程序代码等。此外，计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的各类数据。

显然，本领域的技术人员应该明白，上述的本申请实施例的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本申请实施例不限制于任何特定的硬件和软件结合。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种图像处理方法，所述方法包括：

获取原始图像并根据所述原始图像得到待处理图像；

通过图像识别模型识别所述待处理图像以得到剪影数组；其中，所述剪影数组包括多个剪影数组元素，所述多个剪影数组元素包括多个第一数值和多个第二数值，所述多个第一数值对应所述待处理图像的感兴趣区域，所述多个第二数值对应所述待处理图像的非感兴趣区域；

根据所述剪影数组生成剪影图像；及

根据所述原始图像和所述剪影图像生成目标图像，所述目标图像对应于所述原始图像的感兴趣区域。
根据权利要求1所述的图像处理方法，获取原始图像并根据所述原始图像得到待处理图像，包括：

判断所述原始图像的尺寸大小是否等于预定尺寸大小；

如果所述原始图像的尺寸大小等于所述预定尺寸大小，则将所述原始图像确定为所述待处理图像；及

如果所述原始图像的尺寸大小不等于所述预定尺寸大小，则将所述原始图像调整为所述待处理图像，其中，所述待处理图像的尺寸大小等于所述预定尺寸大小。
根据权利要求1所述的图像处理方法，所述图像识别模型包括训练好的神经网络模型；通过图像识别模型识别待处理图像以得到剪影数组，包括：

将所述待处理图像输入到所述训练好的神经网络模型中，通过所述神经网络模型输出所述剪影数组；

其中，所述剪影数组的每个第一数值与所述待处理图像的感兴趣区域的每个图像像素一一对应，所述剪影数组的每个第二数值与所述待处理图像的非感兴趣区域的每个图像像素一一对应。
权利要求1所述的图像处理方法，根据所述剪影数组生成剪影图像，包括：

根据所述剪影数组生成初始剪影图像；所述初始剪影图像包括多个第一像素和多个第二像素，所述初始剪影图像的每个第一像素与所述剪影数组的每个第一数值一一对应，所述初始剪影图像的每个第二像素与所述剪影数组的每个第二数值一一对应；及

根据所述初始剪影图像生成所述剪影图像，所述剪影图像的尺寸大小与所述原始图像的尺寸大小相同。
权利要求4所述的图像处理方法，根据所述原始图像和所述剪影图像生成目标图像，包括：

确定将所述剪影图像作为掩膜滤镜的掩膜图像；及

通过所述掩膜滤镜从所述原始图像中抽取出所述原始图像的感兴趣区域，以得到所述目标图像。
根据权利要求1所述的图像处理方法，还包括：

计算所述剪影数组和参考图像的参考数组之间的剪影匹配度；

如果所述剪影数组和所述参考图像的参考数组之间的剪影匹配度大于预设阈值，则将所述目标图像插入到所述参考图像中。
根据权利要求6所述的图像处理方法，计算所述剪影数组和参考图像的参考数组之间的剪影匹配度，包括：

根据所述参考数组的各个参考数组元素和所述剪影数组中相应的剪影数组元素，计算所述剪影匹配度。
一种图像处理系统，包括：

获取模块，用于获取原始图像并根据所述原始图像得到待处理图像；

识别模块，用于通过图像识别模型识别所述待处理图像以得到剪影数组；其中，所述剪影数组包括多个剪影数组元素，所述剪影数组元素包括多个第一数值和多个第二数值，所述多个第一数值对应所述待处理图像的感兴趣区域，所述多个第二数值对应所述待处理图像的非感兴趣区域；

第一生成模块，用于根据所述剪影数组生成剪影图像；及

第二生成模块，用于根据所述原始图像和所述剪影图像生成目标图像，所述目标图像对应于所述原始图像的感兴趣区域。
一种计算机设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现以下步骤：

获取原始图像并根据所述原始图像得到待处理图像；

通过图像识别模型识别所述待处理图像以得到剪影数组；其中，所述剪影数组包括多个剪影数组元素，所述多个剪影数组元素包括多个第一数值和多个第二数值，所述多个第一数值对应所述待处理图像的感兴趣区域，所述多个第二数值对应所述待处理图像的非感兴趣区域；

根据所述剪影数组生成剪影图像；及

根据所述原始图像和所述剪影图像生成目标图像，所述目标图像对应于所述原始图像的感兴趣区域。
根据权利要求9所述的计算机设备，获取原始图像并根据所述原始图像得到待处理图像，包括：

判断所述原始图像的尺寸大小是否等于预定尺寸大小；

如果所述原始图像的尺寸大小等于所述预定尺寸大小，则将所述原始图像确定为所述待处理图像；及

如果所述原始图像的尺寸大小不等于所述预定尺寸大小，则将所述原始图像调整为所述待处理图像，其中，所述待处理图像的尺寸大小等于所述预定尺寸大小。
根据权利要求9所述的计算机设备，所述图像识别模型包括训练好的神经网络模型；通过图像识别模型识别待处理图像以得到剪影数组，包括：

将所述待处理图像输入到所述训练好的神经网络模型中，通过所述神经网络模型输出所述剪影数组；

其中，所述剪影数组的每个第一数值与所述待处理图像的感兴趣区域的每个图像像素一一对应，所述剪影数组的每个第二数值与所述待处理图像的非感兴趣区域的每个图像像素一一对应。
权利要求9所述的计算机设备，根据所述剪影数组生成剪影图像，包括：

根据所述剪影数组生成初始剪影图像；所述初始剪影图像包括多个第一像素和多个第二像素，所述初始剪影图像的每个第一像素与所述剪影数组的每个第一数值一一对应，所述初始剪影图像的每个第二像素与所述剪影数组的每个第二数值一一对应；及

根据所述初始剪影图像生成所述剪影图像，所述剪影图像的尺寸大小与所述原始图像的尺寸大小相同。
权利要求12所述的计算机设备，根据所述原始图像和所述剪影图像生成目标图像，包括：

确定将所述剪影图像作为掩膜滤镜的掩膜图像；及

通过所述掩膜滤镜从所述原始图像中抽取出所述原始图像的感兴趣区域，以得到所述目标图像。
根据权利要求9所述的计算机设备，还包括：

计算所述剪影数组和参考图像的参考数组之间的剪影匹配度；

如果所述剪影数组和所述参考图像的参考数组之间的剪影匹配度大于预设阈值，则将所述目标图像插入到所述参考图像中。
根据权利要求14所述的计算机设备，计算所述剪影数组和参考图像的参考数组之间的剪影匹配度，包括：

根据所述参考数组的各个参考数组元素和所述剪影数组中相应的剪影数组元素，计算所述剪影匹配度。
一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机可读指令，所述计算机可读指令可被至少一个处理器所执行，以使所述至少一个处理器执行以下步骤：

获取原始图像并根据所述原始图像得到待处理图像；

通过图像识别模型识别所述待处理图像以得到剪影数组；其中，所述剪影数组包括多个剪影数组元素，所述多个剪影数组元素包括多个第一数值和多个第二数值，所述多个第一数值对应所述待处理图像的感兴趣区域，所述多个第二数值对应所述待处理图像的非感兴趣区域；

根据所述剪影数组生成剪影图像；及

根据所述原始图像和所述剪影图像生成目标图像，所述目标图像对应于所述原始图像的感兴趣区域。
根据权利要求16所述的计算机可读存储介质，获取原始图像并根据所述原始图像得到待处理图像，包括：

判断所述原始图像的尺寸大小是否等于预定尺寸大小；

如果所述原始图像的尺寸大小等于所述预定尺寸大小，则将所述原始图像确定为所述待处理图像；及

如果所述原始图像的尺寸大小不等于所述预定尺寸大小，则将所述原始图像调整为所述待处理图像，其中，所述待处理图像的尺寸大小等于所述预定尺寸大小。
根据权利要求16所述的计算机可读存储介质，所述图像识别模型包括训练好的神经网络模型；通过图像识别模型识别待处理图像以得到剪影数组，包括：

将所述待处理图像输入到所述训练好的神经网络模型中，通过所述神经网络模型输出所述剪影数组；

其中，所述剪影数组的每个第一数值与所述待处理图像的感兴趣区域的每个图像像素一一对应，所述剪影数组的每个第二数值与所述待处理图像的非感兴趣区域的每个图像像素一一对应。
权利要求16所述的计算机可读存储介质，根据所述剪影数组生成剪影图像，包括：

根据所述剪影数组生成初始剪影图像；所述初始剪影图像包括多个第一像素和多个第二像素，所述初始剪影图像的每个第一像素与所述剪影数组的每个第一数值一一对应，所述初始剪影图像的每个第二像素与所述剪影数组的每个第二数值一一对应；及

根据所述初始剪影图像生成所述剪影图像，所述剪影图像的尺寸大小与所述原始图像的尺寸大小相同。
权利要求19所述的计算机可读存储介质，根据所述原始图像和所述剪影图像生成目标图像，包括：

确定将所述剪影图像作为掩膜滤镜的掩膜图像；及

通过所述掩膜滤镜从所述原始图像中抽取出所述原始图像的感兴趣区域，以得到所述目标图像。