WO2023045641A1

WO2023045641A1 - 图像裁剪方法、装置、计算机设备及存储介质

Info

Publication number: WO2023045641A1
Application number: PCT/CN2022/113325
Authority: WO
Inventors: 汤泽胜; 司建锋
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2021-09-27
Filing date: 2022-08-18
Publication date: 2023-03-30
Also published as: CN113570626B; CN113570626A; US20230351604A1

Abstract

图像裁剪方法、装置、计算机设备及存储介质，属于计算机技术领域。该方法包括：确定第一图像中的每个对象所在的对象框(201)；将属于第一类型的对象所在的对象框确定为第一目标框，将属于第二类型的对象所在的对象框确定为排除框，第一类型的对象为需要保留的对象，第二类型的对象为不需要保留的对象(202)；确定第一图像中的目标区域，目标区域包括第一目标框且不包括排除框(203)；基于目标区域，对第一图像进行裁剪，得到包括第一目标框且不包括排除框的第二图像(204)。采用上述方法、装置、计算机设备及存储介质，能够提高图像裁剪的效果和图像裁剪的速度。

Description

图像裁剪方法、装置、计算机设备及存储介质

本申请要求于2021年09月27日提交的申请号为202111137663.4、发明名称为“图像裁剪方法、装置、计算机设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及计算机技术领域，特别涉及一种图像裁剪方法、装置、计算机设备及存储介质。

背景技术

随着计算机技术的快速发展，在各个领域中对图像进行裁剪的需求也越来越强。相关技术中，通常会采用居中裁剪的方式，也即是将图像中的边缘区域裁剪掉，保留图像的中间区域。但是，裁剪得到的图像中会存在关键信息不完整的问题，或者包括了较多的干扰信息，因此图像裁剪的效果不佳。

发明内容

本申请实施例提供了一种图像裁剪方法、装置、计算机设备及存储介质，能够提高图像裁剪的效果。所述技术方案包括如下方面。

一方面，提供了一种图像裁剪方法，所述方法由计算机设备执行，所述方法包括：

确定第一图像中的每个对象所在的对象框；

将属于第一类型的对象所在的对象框确定为第一目标框，将属于第二类型的对象所在的对象框确定为排除框，所述第一类型的对象为需要保留的对象，所述第二类型的对象为不需要保留的对象；

确定所述第一图像中的目标区域，所述目标区域包括所述第一目标框且不包括所述排除框；

基于所述目标区域，对所述第一图像进行裁剪，得到包括所述第一目标框且不包括所述排除框的第二图像。

另一方面，提供了一种图像裁剪装置，所述装置包括：

对象框确定模块，用于确定第一图像中的每个对象所在的对象框；

目标框和排除框确定模块，用于将属于第一类型的对象所在的对象框确定为第一目标框，将属于第二类型的对象所在的对象框确定为排除框，所述第一类型的对象为需要保留的对象，所述第二类型的对象为不需要保留的对象；

目标区域确定模块，用于确定所述第一图像中的目标区域，所述目标区域包括所述第一目标框且不包括所述排除框；

裁剪模块，用于基于所述目标区域，对所述第一图像进行裁剪，得到包括所述第一目标框且不包括所述排除框的第二图像。

另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条计算机程序，所述至少一条计算机程序由所述处理器加载并执行，以使所述计算机设备实现如上述方面所述的图像裁剪方法中所执行的操作。

另一方面，提供了一种非易失性计算机可读存储介质，所述非易失性计算机可读存储介质中存储有至少一条计算机程序，所述至少一条计算机程序由处理器加载并执行，以使计算机实现如上述方面所述的图像裁剪方法中所执行的操作。

另一方面，提供了一种计算机程序产品或计算机程序，所述计算机程序产品或计算机程序包括计算机程序代码，所述计算机程序代码存储在非易失性计算机可读存储介质中，计算机设备的处理器从非易失性计算机可读存储介质读取所述计算机程序代码，处理器执行所述计算机程序代码，使得所述计算机设备实现如上述方面所述的图像裁剪方法中所执行的操作。

本申请实施例提供的方法、装置、计算机设备及存储介质，将第一图像中的对象划分为需要保留的对象和不需要保留的对象，并通过确定第一目标框和排除框，来将需要保留的对象和不需要保留的对象所在的区域进行标记，由于第一图像中的目标区域包括第一目标框且不包括排除框，则基于目标区域，对第一图像进行裁剪，能够得到包括第一目标框且不包括排除框的第二图像。其中，利用第一目标框和排除框来标记图像中需要保留的对象和不需要保留的对象所在的区域，有利于快速识别出目标区域，从而提高了图像裁剪的速度。并且，需要保留的对象可视为需要关注的关键信息，不需要保留的对象可视为不需要关注的干扰信息，因此，此种图像裁剪方法保证了该第二图像中包括需要关注的关键信息，且不包括不需要关注的干扰信息，从而提高了图像裁剪的效果。

附图说明

图1是本申请实施例提供的一种实施环境的示意图；

图2是本申请实施例提供的一种图像裁剪方法的流程图；

图3是本申请实施例提供的一种图像裁剪方法的流程图；

图4是本申请实施例提供的一种图像分割方法的示意图；

图5是本申请实施例提供的另一种图像分割方法的示意图；

图6是本申请实施例提供的另一种图像分割方法的示意图；

图7是本申请实施例提供的另一种图像分割方法的示意图；

图8是本申请实施例提供的一种图像裁剪方法的示意图；

图9是本申请实施例提供的一种图像裁剪方法的流程图；

图10是本申请实施例提供的一种图像裁剪方法的流程图；

图11是本申请实施例提供的另一种图像裁剪方法的流程图；

图12是本申请实施例提供的一种图像裁剪装置的结构示意图；

图13是本申请实施例提供的另一种图像裁剪装置的结构示意图；

图14是本申请实施例提供的一种终端的结构示意图；

图15是本申请实施例提供的一种服务器的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

可以理解，本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种概念，但除非特别说明，这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。举例来说，在不脱离本申请的范围的情况下，可以将第一视频称为第二视频，且类似地，可将第二视频称为第一视频。

至少一个是指一个或者一个以上，例如，至少一个排除框可以是一个排除框、两个排除框、三个排除框等任一大于等于一的整数个排除框。多个是指两个或者两个以上，例如，多个排除框可以是两个排除框、三个排除框等任一大于等于二的整数个排除框。每个是指至少一个中的每一个，例如，每个排除框是指多个排除框中的每一个排除框，若多个排除框为3 个排除框，则每个排除框是指3个排除框中的每一个排除框。

图1是本申请实施例提供的一种实施环境的示意图，参见图1，该实施环境包括：服务器101和终端102。服务器101用于对图像进行裁剪，将裁剪后的图像提供给终端102。例如，终端102用于分享视频，在分享视频之前，请求服务器101为视频设置封面，服务器101用于对该视频关联的图像进行裁剪，从而将裁剪得到的图像确定为该视频的封面，并提供给终端102。在一些实施例中，终端102也可以用于对图像进行裁剪，例如，终端102在分享视频之前，对视频关联的图像进行裁剪，从而将裁剪得到的图像确定为该视频的封面。

在一种可能实现方式中，服务器101是独立的物理服务器，或者是多个物理服务器构成的服务器集群或者分布式系统，或者是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端102是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能电视、智能车载终端等，但并不局限于此。服务器101以及终端102可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

在另一种可能实现方式中，终端102上安装由服务器101提供服务的目标应用，终端102能够通过该目标应用实现例如视频编辑或者视频播放等功能。可选地，目标应用为终端102操作系统中的目标应用，或者为第三方提供的目标应用。例如，目标应用为视频分享应用，该视频分享应用具有视频分享的功能，当然，该视频分享应用还能够具有其他功能，例如，点评功能、购物功能、导航功能、游戏功能等。

图2是本申请实施例提供的一种图像裁剪方法的流程图。本申请实施例的执行主体为计算机设备，参见图2，该方法包括以下步骤201至步骤204。

201、计算机设备确定第一图像中的每个对象所在的对象框。

计算机设备获取第一图像，该第一图像为待裁剪的图像。其中，第一图像中包括多个对象，该对象可以为任意类型的对象，例如该对象为人物、物体、文本或者水印等。计算机设备确定该第一图像中的每个对象所在的对象框，该对象框用于表示对象的位置，对象框所框出的区域即为对象所在的区域。

202、计算机设备将属于第一类型的对象所在的对象框确定为第一目标框，将属于第二类型的对象所在的对象框确定为排除框。

第一图像中的多个对象包括属于第一类型的对象和属于第二类型的对象。其中，属于第一类型的对象为需要保留的对象，也即是对第一图像进行裁剪需要保留的对象，该第一类型的对象为第一图像中需要关注的关键信息。属于第二类型的对象为不需要保留的对象，也即是对第一图像进行裁剪不需要保留的对象，该第二类型的对象为第一图像中不需要关注的干扰信息。

因此，计算机设备将属于第一类型的对象所在的对象框确定为第一目标框，以表示第一目标框所框出的区域为需要保留的区域。计算机设备将属于第二类型的对象所在的对象框确定为排除框，以表示排除框所框出的区域为不需要保留的区域。计算机设备通过确定第一目标框和排除框，从而将第一图像中需要保留的区域和不需要保留的区域标记出来。

203、计算机设备确定第一图像中的目标区域，目标区域包括第一目标框且不包括排除框。

计算机设备确定第一图像中的第一目标框和排除框后，根据该第一目标框和排除框，在第一图像中确定包括第一目标框且不包括排除框的目标区域，则该目标区域中包括需要保留的对象，且不包括不需要保留的对象。通过确定此种目标区域，能够便于对第一图像进行裁剪，裁剪出的图像中包括需要保留的对象且不包括不需要保留的对象。

204、计算机设备基于目标区域，对第一图像进行裁剪，得到包括第一目标框且不包括排除框的第二图像。

由于目标区域中包括第一目标框且不包括排除框，因此计算机设备在第一图像中确定目标区域后，基于该目标区域，对第一图像进行裁剪，得到包括第一目标框的第二图像。由于是基于目标区域进行裁剪的，而目标区域中不包括排除框，因此裁剪得到的该第二图像中也不包括排除框。

也即是，第二图像中包括第一目标框所框出的区域，不包括排除框所框出的区域，因此该第二图像中包括需要保留的对象，且不包括不需要保留的对象。

在示例性实施例中，第一目标框和排除框中的至少一项的数量为多个，第二图像包括第一目标框且不包括排除框是指第二图像包括至少一个第一目标框且不包括任一排除框。

需要说明的是，本申请实施例以执行主体为计算机设备为例进行说明。在一种可能实现方式中，该计算机设备为上述图1所示的实施环境中的服务器。在另一种可能实现方式中，该计算机设备为上述图1所示的实施环境中的终端。

本申请实施例提供的方法，将第一图像中的对象划分为需要保留的对象和不需要保留的对象，并通过确定第一目标框和排除框，来将需要保留的对象和不需要保留的对象所在的区域进行标记，由于第一图像中的目标区域包括第一目标框且不包括排除框，则基于目标区域，对第一图像进行裁剪，能够得到包括第一目标框且不包括排除框的第二图像。其中，利用第一目标框和排除框来标记图像中需要保留的对象和不需要保留的对象所在的区域，有利于快速识别出目标区域，从而提高了图像裁剪的速度。并且，需要保留的对象可视为需要关注的关键信息，不需要保留的对象可视为不需要关注的干扰信息，因此，此种图像裁剪方法保证了该第二图像中包括需要关注的关键信息，且不包括不需要关注的干扰信息，从而提高了图像裁剪的效果。

图3是本申请实施例提供的一种图像裁剪方法的流程图。本申请实施例的执行主体为计算机设备，参见图3，该方法包括以下步骤301至步骤305。

301、计算机设备确定第一图像中的每个对象所在的对象框。

计算机设备获取待裁剪的第一图像，识别第一图像中的多个对象，从而确定第一图像中的每个对象所在的对象框，该对象框用于表示对象的位置，对象框所框出的区域即为对象所在的区域。例如，该对象框为矩形边框，或者还可以为其他形状的边框。

在一种可能实现方式中，计算机设备确定第一图像中的每个对象所在的对象框，包括以下至少一项。

(1)对第一图像进行人脸识别，得到第一图像中的人脸框。

该人脸框为人脸所在的对象框，人脸框所框出的区域为人脸所在的区域。可选地，计算机设备中存储有人脸识别模型，调用人脸识别模型，对第一图像进行人脸识别，得到第一图像中的人脸所在的人脸框。

(2)对第一图像进行物体识别，得到第一图像中的物体框。

该物体框为物体所在的对象框，物体框所框出的区域为物体所在的区域。可选地，计算机设备中存储有物体识别模型，调用物体识别模型，对第一图像进行物体识别，得到第一图像中的物体所在的物体框。其中，该物体识别模型能够识别多种物体，例如车辆、树木、建筑、家具或者动物等。

(3)对第一图像进行文本识别，得到第一图像中的文本框。

该文本框为文本所在的对象框，文本框所框出的区域为文本所在的区域。可选地，计算机设备中存储有文本识别模型，调用文本识别模型，对第一图像进行文本识别，得到第一图像中的文本所在的文本框。例如，第一图像为视频帧，该第一图像中的文本为视频帧中的字幕等。

(4)对第一图像进行水印识别，得到第一图像中的水印框。

该水印框为水印所在的对象框，水印框所框出的区域为水印所在的区域。可选地，计算机设备中存储有水印识别模型，调用水印识别模型，对第一图像进行水印识别，得到第一图像中的水印所在的水印框。例如，第一图像中的水印为添加在第一图像中的Logo(标志)等。

示例性地，上述人脸识别模型、物体识别模型、文本识别模型和水印识别模型中的每个识别模型的结构均可以为任一种神经网络模型，不同识别模型的结构可以相同，也可以不同，本申请实施例对此不加以限定。示例性地，人脸识别模型、物体识别模型、文本识别模型和水印识别模型均可以通过监督训练得到，例如，根据人脸图像和人脸图像中的人脸框标注结果，通过监督训练得到人脸识别模型；根据物体图像和物体图像中的物体框标注结果，通过监督训练得到物体识别模型；根据文本图像和文本图像中的文本框标注结果，通过监督训练得到文本识别模型；根据水印图像和水印图像中的水印框标注结果，通过监督训练得到水印识别模型。

在另一种可能实现方式中，计算机设备对第一图像进行对象识别，得到第一图像中的每个对象所在的对象框，计算机设备将对象框的尺寸扩大第三倍数，从而保证对象框中的对象是完整的，避免由于识别结果有误，导致对象框中的对象不完整的情况。其中，扩大第三倍数是指在原来的基础上，扩大第三倍数，例如第三倍数为10％，对象框的尺寸为100，则扩大10％后，对象框的尺寸为110。可选地，将对象框的尺寸扩大第三倍数是指，分别将对象框的宽度和高度扩大第三倍数。可选地，该第三倍数是计算机设备预先设置的。

在另一种可能实现方式中，计算机设备确定第一图像中的每个对象框在该第一图像中的位置信息，将对象框的位置信息存储下来，以便后续根据位置信息在第一图像中确定对象框。

302、计算机设备将属于第一类型的对象所在的对象框确定为第一目标框，将属于第二类型的对象所在的对象框确定为排除框。

计算机设备将第一图像中的多个对象分为属于第一类型的对象和属于第二类型的对象。其中，属于第一类型的对象为需要保留的对象，也即是第一图像中需要关注的关键信息。属于第二类型的对象为不需要保留的对象，也即是第一图像中不需要关注的干扰信息。因此，计算机设备将属于第一类型的对象所在的对象框确定为第一目标框，将属于第二类型的对象所在的对象框确定为排除框，从而将第一图像中需要保留的区域和不需要保留的区域标记出来。

在一种可能实现方式中，计算机设备采用第一标记方式，对属于第一类型的对象所在的对象框进行标记，得到第一目标框，采用第二标记方式，对属于第二类型的对象所在的对象框进行标记，得到排除框。其中，第一标记方式与第二标记方式不同。因此，计算机设备后续能够通过对对象框的标记方式进行识别，来确定图像中的哪些对象框属于第一目标框，哪些对象框属于排除框，从而对图像中的第一目标框和排除框加以区分。

可选地，第一标记方式是指将对象框的边缘线设置为第一颜色，第二标识方式是指将对象框的边缘线设置为第二颜色，第一颜色与第二颜色不同，例如第一颜色为红色，第二颜色为蓝色。可选地，第一标记方式是指将对象框的边缘线设置为第一尺寸，第二标记方式是指将对象框的边缘线设置为第二尺寸，第一尺寸与第二尺寸不同。可选地，第一标记方式是指将对象框设置为第一形状，第二标记方式是指将对象框设置为第二形状，第一形状与第二形状不同，例如第一形状为圆形，第二形状为方形。可选地，第一标记方式是指将对象框的边缘线设置为第一样式，第二标记方式是指将对象框的边缘线设置为第二样式，第一样式与第二样式不同，例如第一样式为实线，第二样式为虚线等。

需要说明的是，以上所述第一标记方式和第二标记方式仅为示例性举例，本申请实施例并不局限于此。在一些实施例中，第一标记方式和第二标记方式还可以为其他情况，只要保证第一标记方式与第二标记方式不同即可。示例性地，第一标记方式还可以是指将对象框的边缘线设置为第一颜色、第一尺寸和第一样式，且将对象框设置为第一形状；第二标记方式还可以是指将对象框的边缘线设置为第二颜色、第二尺寸和第二样式，且将对象框设置为第二形状。

本申请实施例中，由于目标框和排除框是采用不同的标记方式对对象框进行标记得到的，因此计算机设备能够通过对对象框的标记方式进行识别，来区分图像中的目标框和排除框，从而实现了对目标框和排除框的自动识别，有利于提高对目标框和排除框的识别速度。计算机设备后续基于第一目标框和排除框的位置来对图像进行裁剪，由于已经缩短了识别目标框和排除框所花费的时间，因此也能够提高图像裁剪的整体速度。

在一种可能实现方式中，计算机设备将属于第一类型的对象所在的对象框确定为第一目标框，包括以下(1)和(2)中的至少一项。

(1)将人脸所在的人脸框确定为第一目标框。

第一图像中的对象框包括人脸所在的人脸框，人脸为需要关注的关键信息，因此该人脸为需要保留的对象，人脸属于第一类型的对象，因此计算机设备将人脸所在的人脸框确定为第一目标框。

(2)将物体所在的物体框确定为第一目标框。

第一图像中的对象框包括物体所在的物体框，物体为需要关注的关键信息，因此该物体为需要保留的对象，物体属于第一类型的对象，因此计算机设备将物体所在的物体框确定为第一目标框。

在一种可能实现方式中，计算机设备将属于第二类型的对象所属在的对象框确定为排除框，包括以下(3)和(4)中的至少一项。

(3)将文本所在的文本框确定为排除框。

第一图像中的对象框包括文本所在的文本框，文本为不需要关注的干扰信息，因此该文本为不需要保留的对象，文本属于第二类型的对象，因此计算机设备将文本所在的文本框确定为排除框。

(4)将水印所在的水印框确定为排除框。

第一图像中的对象框包括水印所在的水印框，水印为不需要关注的干扰信息，因此该水印为不需要保留的对象，水印属于第二类型的对象，因此计算机设备将水印所在的水印框确定为排除框。

需要说明的是，以上所述确定第一目标框和排除框的方式仅为示例性举例，本申请实施例并不局限于此。在一些实施例中，确定第一目标框和排除框的方式还可以根据实际的应用场景灵活调整。示例性地，若实际的应用场景为需要关注文本和水印，不需要关注人脸和物体的场景，则可以将文本所在的文本框以及水印所在的水印框确定为第一目标框，将人脸所在的人脸框和物体所在的物体框确定为排除框。

可选地，计算机设备中存储有配置信息，该配置信息包括第一类型和第二类型，计算机设备将第一图像中的对象所属的类型与该配置信息中的第一类型和第二类型进行对比，从而确定第一图像中的哪些对象属于第一类型的对象，哪些对象属于第二类型的对象。例如，该配置信息是由研发人员在计算机设备中设置的。计算机设备通过修改配置信息，能够灵活控制裁剪后的图像中保留的对象以及不保留的对象。

在另一种可能实现方式中，计算机设备在已确定多个第一目标框的情况下，将每个第一目标框的尺寸扩大第一倍数，得到多个第二目标框，对于每个第二目标框，在第二目标框与其他第二目标框相交的情况下，将第二目标框与其他第二目标框合并为一个第三目标框。其中，任两个第二目标框相交是指，这两个目标框存在交点。可选地，该第一倍数是计算机设备预先设置的。例如，该第一倍数为20％，计算机设备将每个第一目标框的尺寸扩大20％。

本申请实施例中，计算机设备将每个第一目标框的尺寸扩大第一倍数，得到多个第二目标框，如果某一个第二目标框与其他第二目标框相交，则说明该第二目标框中的对象与该其他第二目标框中的对象离得比较近。考虑到如果两个属于第一类型的对象的位置离得很近，仅基于其中一个对象对应的第一目标框或者第二目标框对第一图像进行裁剪，可能导致裁剪得到的图像中包括另一个对象的部分信息。因此计算机设备将该第二目标框与该其他第二目标框合并为一个第三目标框，该第三目标框中包括离得比较近的多个对象，因此后续可以基于该第三目标框对第一图像进行裁剪，从而避免裁剪得到的图像中的信息有残缺。

例如，第二目标框A与第二目标框B相交，则计算机设备将第二目标框A和第二目标框 B合并为一个第三目标框。例如，第二目标框A与第二目标框B和第二目标框C都相交，则计算机设备将第二目标框A、第二目标框B和第二目标框C合并为一个第三目标框。例如，第二目标框A没有与任何其他第二目标框相交，则第二目标框A保持独立，无需与其他第二目标框合并。

例如，第一目标框为人脸框，扩大第一目标框所得到的第二目标框中包括人脸。以两个第二目标框相交为例，如果第二目标框与其他第二目标框相交，则说明这两个第二目标框中的人脸离得很近。如果计算机设备直接基于这两个人脸所在的第一目标框中的任一个，对第一图像进行裁剪，则裁剪得到的图像中很可能包括另一个人脸的部分信息，导致图像中的信息有残缺。因此，计算机设备将这两个第二目标框合并为一个第三目标框，该第三目标框中包括两个人脸，后续基于该第三目标框对第一图像进行裁剪，则裁剪得到的图像中包括两个人脸。

303、计算机设备基于排除框的位置，确定第一图像中的多个候选区域。

由于排除框中包括不需要保留的对象，因此计算机设备基于排除框的位置，在第一图像中确定不包括排除框的多个候选区域，则确定的每个候选区域中不包括不需要保留的对象，便于后续基于候选区域从第一图像中裁剪出图像，该图像不包括这些不需要保留的对象。

在一种可能实现方式中，计算机设备在排除框的边缘线中，确定与第一图像的每个边缘线没有重叠的目标边缘线。计算机设备确定目标边缘线所在的直线，将第一图像中位于直线外侧的区域确定为候选区域，直线外侧是指远离排除框的一侧。

其中，排除框的边缘线与第一图像的边缘线没有重叠是指，排除框的边缘线与第一图像的边缘线没有在一条直线上。如果排除框的某一个边缘线与第一图像的某一个边缘线重叠，则该边缘线所在的直线外侧的区域为第一图像之外的区域，也即是在第一图像中，该边缘线所在的直线外侧不存在候选区域。如果排除框的某一个边缘线与第一图像的每个边缘线都不重叠，则该边缘线所在的直线外侧存在第一图像中的区域，因此可以将该第一图像中位于该边缘线所在的直线外侧的区域确定为候选区域，采用此方法所确定的候选区域中不包括排除框。

可选地，排除框为矩形边框，则该排除框包括左边缘线、右边缘线、上边缘线和下边缘线。目标边缘线可能包括排除框的左边缘线、右边缘线、上边缘线和下边缘线中的至少一种。计算机设备基于目标边缘线，确定候选区域，包括以下至少一项。

(1)在目标边缘线包括排除框的左边缘线的情况下，确定目标边缘线所在的第一直线，将第一图像中位于第一直线左侧的区域确定为候选区域。

在目标边缘线包括排除框的左边缘线的情况下，左边缘线的左侧是远离排除框的一侧，因此该左边缘线所在的第一直线外侧，是指该第一直线的左侧。因此，计算机设备将第一图像中位于第一直线左侧的区域确定为候选区域。

(2)在目标边缘线包括排除框的右边缘线的情况下，确定目标边缘线所在的第二直线，将第一图像中位于第二直线右侧的区域确定为候选区域。

在目标边缘线包括排除框的右边缘线的情况下，右边缘线的右侧是远离排除框的一侧，因此该右边缘线所在的第二直线外侧，是指该第二直线的右侧。因此，计算机设备将第一图像中位于第二直线右侧的区域确定为候选区域。

(3)在目标边缘线包括排除框的上边缘线的情况下，确定目标边缘线所在的第三直线，将第一图像中位于第三直线上侧的区域确定为候选区域。

在目标边缘线包括排除框的上边缘线的情况下，上边缘线的上侧是远离排除框的一侧，因此该上边缘线所在的第三直线外侧，是指该第三直线的上侧。因此，计算机设备将第一图像中位于第三直线上侧的区域确定为候选区域。

(4)在目标边缘线包括排除框的下边缘线的情况下，确定目标边缘线所在的第四直线，将第一图像中位于第四直线下侧的区域确定为候选区域。

在目标边缘线包括排除框的下边缘线的情况下，下边缘线的下侧是远离排除框的一侧，因此该下边缘线所在的第四直线外侧，是指该第四直线的下侧。因此，计算机设备将第一图像中位于第四直线下侧的区域确定为候选区域。

可选地，在排除框为矩形边框的情况下，该排除框中与第一图像的每个边缘线没有重叠的目标边缘线的个数可以为4个、3个、2个或者1个。则计算机设备确定的候选区域包括以下4种情况。

(1)在目标边缘线的个数为4个的情况下，参见图4，图4是本申请实施例提供的一种图像分割方法的示意图，图4中包括第一图像401，第一图像401中包括排除框402，该排除框402在第一图像401的中间区域，该排除框402的4个边缘线均与第一图像401的边缘线没有重叠。则计算机设备在第一图像401中，将该排除框402的左边缘线所在的直线左侧的区域确定为候选区域403，将该排除框402的右边缘线所在的直线右侧的区域确定为候选区域404，将该排除框402的上边缘线所在的直线上侧的区域确定为候选区域405，将该排除框402的下边缘线所在的直线下侧的区域确定为候选区域406。其中，阴影部分表示候选区域。

因此，在目标边缘线的个数为4个的情况下，计算机设备能够在第一图像中确定4个候选区域，且4个候选区域之间可以相交。

(2)在目标边缘线的个数为3个的情况下，参见图5，图5是本申请提供的另一种图像分割方法的示意图。图5中包括第一图像501，第一图像501中包括排除框502，该排除框502在第一图像501的边缘区域，该排除框502的上边缘线与第一图像501的上边缘线重叠，该排除框502的其他3个边缘线均与第一图像501的边缘线没有重叠。则计算机设备在第一图像501中，将该排除框502的左边缘线所在的直线左侧的区域确定为候选区域503，将该排除框502的右边缘线所在的直线右侧的区域确定为候选区域504，将该排除框502的下边缘线所在的直线下侧的区域确定为候选区域505。其中，阴影部分表示候选区域。

因此，在目标边缘线的个数为3个的情况下，计算机设备能够在第一图像中确定3个候选区域，且3个候选区域之间可以相交。

(3)在目标边缘线的个数为2个的情况下，参见图6，图6是本申请提供的另一种图像分割方法的示意图。图6中包括第一图像601，第一图像601中包括排除框602，该排除框602在第一图像601的角上，该排除框602的上边缘线和左边缘线与第一图像601的边缘线重叠，该排除框602的右边缘线和下边缘线与第一图像601的边缘线没有重叠。则计算机设备在第一图像601中，将该排除框602的下边缘线所在的直线下侧的区域确定为候选区域603，将该排除框602的右边缘线所在的直线右侧的区域确定为候选区域604。其中，阴影部分表示候选区域。

因此，在目标边缘线的个数为2个的情况下，计算机设备能够在第一图像中确定2个候选区域，且2个候选区域之间可以相交。

(4)在目标边缘线的个数为1个的情况下，参见图7，图7是本申请提供的另一种图像分割方法的示意图。图7中包括第一图像701，第一图像701中包括排除框702，该排除框702的左边缘线、右边缘线和下边缘线均与第一图像701的边缘线重叠，该排除框702的上边缘线与第一图像701的边缘线没有重叠。则计算机设备在第一图像701中，将该排除框702的上边缘线所在的直线上侧的区域确定为候选区域703。其中，阴影部分表示候选区域。

因此，在目标边缘线的个数为1个的情况下，计算机设备能够在第一图像中确定1个候选区域。

本申请实施例中，基于排除框的边缘线与第一图像的边缘线的位置，对第一图像中的区域进行划分，从而在第一图像中确定出不包括排除框的候选区域，该方法逻辑简单，便于实现，有利于提高图像裁剪的速度。

在另一种可能实现方式中，排除框的数量为多个，计算机设备基于排除框的位置，确定第一图像中的多个候选区域，包括：基于第一排除框的位置，确定第一图像中的第一候选区域，第一候选区域中不包括第一排除框，第一排除框为多个排除框中的任一排除框；响应于第一候选区域包括第二排除框，基于第二排除框的位置，确定第一候选区域中的第二候选区域，第二候选区域中不包括第二排除框，第二排除框为多个排除框中除第一排除框外的任一排除框；响应于第二候选区域不包括任一排除框，将第二候选区域作为所需确定的候选区域。

示例性地，响应于第一候选区域不包括任一排除框，将第一候选区域作为所需确定的候选区域。

示例性地，响应于第二候选区域包括第三排除框，基于第三排除框的位置，确定第二候选区域中的第三候选区域，第三候选区域中不包括第三排除框，第三排除框为多个排除框中除第一排除框和第二排除框外的任一排除框；响应于第三候选区域不包括任一排除框，将第三候选区域作为所需确定的候选区域，响应于第三候选区域包括第四排除框，基于第四排除框的位置，确定第三候选区域中的第四候选区域，第四候选区域中不包括第四排除框，第四排除框为多个排除框中除第一排除框、第二排除框和第三排除框外的任一排除框。以此类推，直至得到不包括任一排除框的候选区域。

也就是说，基于第一排除框的位置，确定第一图像中的第一候选区域，第一候选区域中不包括第一排除框，第一排除框为多个排除框中的任一排除框，基于第二排除框的位置，确定第一候选区域中的第二候选区域，第二候选区域中不包括第二排除框，直至得到的每个候选区域中均不包括任一排除框。

也即是，在第一图像中包括多个排除框的情况下，计算机设备在多个排除框中，随机确定一个第一排除框，并基于该第一排除框的位置，在第一图像中确定不包括第一排除框的第一候选区域。在第一候选区域包括第二排除框的情况下，基于第二排除框的位置，在第一候选区域中确定不包括该第二排除框的第二候选区域，直至得到的每个候选区域中均不包括任一排除框。

例如，计算机设备确定的第一候选区域的数量为多个。对于每个第一候选区域，计算机设备判断该第一候选区域中是否包括排除框，如果第一候选区域中不包括排除框，则无需继续对该第一候选区域进行处理，该第一候选区域直接作为一个完整的候选区域。如果第一候选区域中还包括排除框，则计算机设备基于第一候选区域中的任一排除框的位置，在第一候选区域中，确定不包括该排除框的第二候选区域，然后计算机设备继续判断得到的第二候选区域中是否还包括排除框，如果不包括排除框则直接将第二候选区域作为一个完整的候选区域，如果包括排除框则继续对第二候选区域进行处理，直至得到的每个候选区域均不包括排除框，得到多个不包括排除框的候选区域。

可选地，计算机设备确定的第一候选区域的数量为多个。计算机设备从所确定的多个第一候选区域中，将尺寸小于第一阈值的第一候选区域删除。此种情况下，基于未删除的第一候选区域执行后续确定候选区域的步骤。示例性地，响应于未删除的第一候选区域包括第二排除框，基于第二排除框的位置，确定未删除的第一候选区域中的第二候选区域。响应于未删除的第一候选区域不包括任一排除框，将未删除的第一候选区域作为所需确定的候选区域。

本申请实施例中，候选区域为不包括排除框的区域，后续会基于候选区域确定包括目标框的目标区域，以便基于目标区域对第一图像进行裁剪，如果候选区域的尺寸太小，则在候选区域中确定出目标区域的可能性较小，因此将尺寸小于第一阈值的第一候选区域删除，能够减少在第一候选区域中未确定出目标区域的无效操作，从而提高操作效率，另外，如果候选区域的尺寸太小，还可能会影响后续进行图像裁剪的效果，因此将尺寸小于第一阈值的第一候选区域删除，能够保证第一候选区域的尺寸足够大，有利于保证图像裁剪的效果。

需要说明的是，上述实施例仅以第一候选区域为例进行说明，而实际上，计算机设备每确定出一个候选区域，都可以先确定该候选区域的尺寸是否小于第一阈值，如果小于第一阈值则删除该候选区域，如果不小于第一阈值则保留该候选区域，继续执行后续的操作。

在另一种可能实现方式中，计算机设备建立第一图像对应的空间坐标系，根据该空间坐标系，以及排除框和第一目标框在第一图像中的位置，确定每个排除框的坐标信息，根据排除框的坐标信息，在第一图像中确定多个候选区域的坐标信息，后续基于候选区域的坐标信息，来执行下述步骤304-步骤305。例如，计算机设备将第一图像中左下角的顶点，确定为空间坐标系的原点。

304、计算机设备在多个候选区域中，确定包括第一目标框的目标区域。

计算机设备确定出多个候选区域后，在多个候选区域中，确定包括第一目标框的目标区域，由于候选区域不包括排除框，因此该目标区域包括第一目标框且不包括排除框。

对于每个候选区域，计算机设备判断该候选区域中是否包括第一目标框，如果候选区域包括第一目标框，则将该候选区域确定为目标区域，如果候选区域不包括第一目标框，则该候选区域不是目标区域。其中，候选区域包括第一目标框是指，候选区域中包括完整的第一目标框，如果候选区域中仅包括第一目标框的部分区域，则认为该候选区域中不包括第一目标框。

在一种可能实现方式中，计算机设备在多个候选区域中，确定出包括第一目标框的多个候选目标区域，在多个候选目标区域中，确定面积最大的目标区域。

计算机设备通过上述步骤303-步骤304，实现了在第一图像中，确定第一图像中的目标区域，目标区域包括第一目标框且不包括排除框。

在一种可能实现方式中，在上述步骤302中，计算机设备在已确定多个第一目标框的情况下，将每个第一目标框的尺寸扩大第一倍数，得到多个第二目标框，对于每个第二目标框，在第二目标框与其他第二目标框相交的情况下，将第二目标框与其他第二目标框合并为一个第三目标框。则计算机设备在第一图像中，将包括第三目标框且不包括排除框的区域，确定为目标区域，在第一图像中，将包括剩余的第二目标框对应的第一目标框、且不包括排除框的区域，确定为目标区域。

其中，剩余的第二目标框是指没有进行合并的第二目标框，第二目标框对应的第一目标框是指，扩大第一倍数后得到该第二目标框的第一目标框。计算机设备的裁剪目标为合并得到的第三目标框，以及没有进行合并的第二目标框在扩大之前的第一目标框。

可选地，上述步骤304被替换为：计算机设备在多个候选区域中，将包括第三目标框的候选区域，确定为目标区域，将包括剩余的第二目标框对应的第一目标框的候选区域，确定为目标区域。其中，包括第三目标框的目标区域和包括该第一目标框的目标区域，可以为同一个候选区域，也可以为不同的候选区域。

在另一种可能实现方式中，第一目标框的数量为多个，计算机设备在第一图像中，确定包括至少一个第一目标框、且不包括排除框的目标区域。

也即是，对于每个第一目标框，计算机设备在第一图像中，确定包括该第一目标框、且不包括排除框的目标区域。不同第一目标框所确定出的目标区域，可以为相同的区域，也可以为不同的区域。因此，计算机设备能够确定出至少一个目标区域，每个目标区域可以包括一个第一目标框，也可以包括多个第一目标框。

可选地，上述步骤304被替换为：计算机设备在多个候选区域中，确定包括至少一个第一目标框的目标区域。

在另一种可能实现方式中，第一目标框的数量为多个，计算机设备在多个第一目标框中包括人脸框的情况下，在第一图像中，确定包括人脸框且不包括排除框的目标区域。

其中，人脸框是包括人脸的对象框。对于第一图像中各种类型的对象来说，相比于其他类型的对象，人脸是更为值得关注的对象，也即是更需要保留的对象。因此，在第一目标框包括人脸目标框的情况下，计算机设备在第一图像中包括人脸框的情况下，优先确定包括人脸的目标区域。例如，第一目标框可以分为人脸框和物体框两种类型，计算机设备先判断第一图像的多个第一目标框中是否存在人脸框，如果存在人脸框，则确定包括人脸框的目标区域，如果不存在人脸框，则确定包括物体框的目标区域。

可选地，上述步骤304被替换为：在多个第一目标框中包括人脸框的情况下，计算机设备在多个候选区域中，确定包括人脸框的目标区域。

本申请实施例的上述步骤303-步骤304提供了一种区域划分策略，基于排除框和第一目标框在第一图像中的位置，能够在第一图像中划分出不包括排除框且包括第一目标框的目标区域，该方法逻辑简单，便于实现。

需要说明的是，本申请实施例仅以在多个候选区域中，确定出包括第一目标框的目标区域为例进行说明。在另一实施例中，如果每个候选区域均不包括第一目标框，则确定第一图像裁剪失败。

305、计算机设备基于目标区域，对第一图像进行裁剪，得到包括第一目标框且不包括排除框的第二图像。

由于是基于目标区域进行裁剪的，而目标区域中不包括排除框，因此裁剪得到的该第二图像中也不包括排除框。也即是，第二图像中包括第一目标框所框出的区域，不包括排除框所框出的区域，因此该第二图像中包括需要保留的对象，且不包括不需要保留的对象。

在一种可能实现方式中，计算机设备基于目标区域，对第一图像进行裁剪，得到包括第一目标框、不包括排除框、且宽高比为目标宽高比的第二图像。

计算机设备基于该目标区域，对第一图像进行裁剪，得到宽高比为该目标宽高比的第二图像，且裁剪得到的第二图像中包括第一目标框，此种方式能够在第一图像中裁剪出符合目标宽高比的图像。可选地，该目标宽高比为计算机设备预先设置的，或者该目标宽高比为其他设备发送给该计算机设备，以请求该计算机设备裁剪符合目标宽高比的图像。例如，该目标宽高比为1:3等。

可选地，计算机设备裁剪得到宽高比为目标宽高比的第二图像，包括：计算机设备扩大第一目标框的宽度或者高度中的至少一项，得到第四目标框，以使第四目标框的宽高比为目标宽高比；保持第四目标框的中心点不变，扩大第四目标框的尺寸，直至扩大第二倍数或者扩大后第四目标框的任一边缘线与目标区域的边缘线重叠，得到第五目标框；从第一图像中裁剪第五目标框，将裁剪出的第五目标框确定为第二图像。

计算机设备先对第一目标框的宽度或者高度中的至少一项进行扩大，以使扩大后得到的第四目标框的宽高比为该目标宽高比，从而裁剪出目标宽高比的图像。其中，该第四目标框位于目标区域中，目标区域包括该第四目标框且不包括排除框。考虑到第四目标框的尺寸可能较小，如果直接从第一图像中裁剪第四目标框，将裁剪出的第四目标框确定为第二图像，该第二图像的尺寸也会比较小，导致图像裁剪的效果不佳，因此计算机设备扩大该第四目标框。

考虑到如果第四目标框扩大倍数较大，则扩大后得到的第五目标框的尺寸会比较大，从而第五目标框中的对象所占的面积比例较少，难以凸显该对象，导致图像裁剪的效果不佳，因此计算机设备以第二倍数为限，扩大第四目标框，直至扩大第二倍数，得到第五目标框。另外，考虑到目标区域之外可能存在排除框，因此计算机设备以目标区域为限，扩大第四目标框，直至扩大后的第四目标框的任一边缘线与目标区域的任一边缘线重叠，得到第五目标框。

计算机设备同时以第二倍数和目标区域为限，以避免上述两个问题。计算机设备在扩大第四目标框的过程中，判断是否扩大了第二倍数，以及判断扩大后的第四目标框的任一边缘线是否与目标区域的任一边缘线重叠，以上两个判断条件只要满足其中一个，则计算机设备停止继续扩大，得到第五目标框。也即是，在扩大第四目标框的过程中，如果扩大倍数达到了第二倍数，则停止扩大，或者如果扩大后的第四目标框的任一边缘线与目标区域的任一边缘线重叠，则也停止扩大。

图8是本申请实施例提供的一种图像裁剪方法的示意图，图8中包括目标区域801和第一目标框802，计算机设备扩大第一目标框802的高度，得到宽高比为目标宽高比的第四目标框803，计算机设备等比例扩大第四目标框803的尺寸，得到第五目标框。其中，该第五目标框包括以下两种情况。

第一种情况：如图8的左下角的示意图，计算机设备在扩大第四目标框803的尺寸的过程中，如果在扩大后的第四目标框的边缘线与目标区域的边缘线重叠之前，扩大了第二倍数，则计算机设备停止扩大，得到第五目标框804，该第五目标框804的宽高比为该目标宽高比。

第二种情况：如图8的右下角的示意图，计算机设备在扩大第四目标框803的尺寸的过程中，如果在扩大第二倍数之前，扩大后的第四目标框的下边缘线与目标区域的下边缘线重叠，则计算机设备停止扩大，得到第五目标框805，该第五目标框805的宽高比为该目标宽高比。

本申请实施例的上述步骤305提供了一种图像裁剪策略，基于目标区域，能够在第一图像中裁剪出包括第一目标框且不包括排除框的第二图像，并且还能够裁剪出宽高比为目标宽高比的第二图像，操作简便，且提高了图像裁剪的灵活性。

为了对本申请实施例提供的图像裁剪方法进行评估，计算机设备采用本申请实施例提供的方法以及相关技术提供的方法进行图像裁剪，裁剪得到的图像经由人工评定，来判断裁图效果，裁图效果不好的图像可以归为badcase(坏例)，实验结果表明，相比于相关技术，本申请实施例提供的方法的badcase率低于15％，而相关技术提供的方法的badcase率约为60％，也就是说，本申请实施例提供的方法明显提高了图像裁剪的效果。此外，badcase需要人工进行处理，耗费大量的人力和时间成本，因此，通过降低badcase率，本申请实施例提供的方法能够显著提升裁图流程的效率，降低人力和时间成本。

并且，将每个第一目标框的尺寸扩大第一倍数，得到多个第二目标框，如果某一个第二目标框与其他第二目标框相交，则说明该第二目标框中的对象与该其他第二目标框中的对象离得比较近，因此计算机设备将该第二目标框与该其他第二目标框合并为一个第三目标框，该第三目标框中包括离得比较近的多个对象，因此后续可以基于该第三目标框对第一图像进行裁剪，从而避免裁剪得到的图像中的信息有残缺。

并且，基于排除框的边缘线与第一图像的边缘线的位置，对第一图像中的区域进行划分，从而在第一图像中确定出不包括排除框的候选区域，该方法逻辑简单，便于实现，有利于提高图像裁剪的速度。

并且，候选区域为不包括排除框的区域，后续会基于候选区域确定包括目标框的目标区域，以便基于目标区域对第一图像进行裁剪，因此将尺寸小于第一阈值的第一候选区域删除，能够减少在第一候选区域中未确定出目标区域的无效操作，从而提高操作效率。另外，将尺寸小于第一阈值的第一候选区域删除，能够保证候选区域的尺寸足够大，有利于保证图像裁剪的效果。

图9是本申请实施例提供的一种图像裁剪方法的流程图。本申请实施例的执行主体为计算机设备。参见图9，该方法包括以下步骤901至步骤907。

901、计算机设备响应于封面设置请求，获取第一视频对应的多个关联图像。

封面设置请求用于请求计算机设备为第一视频设置封面，因此计算机设备响应于该封面设置请求，获取该第一视频对应的多个关联图像，该关联图像用于展示第一视频的内容，因此后续可以基于该多个关联图像来确定第一视频的封面。在一种可能实现方式中，该封面设置请求是由其他设备发送的，例如该计算机设备是上述图1的实施环境中的服务器，该其他设备是上述图1的实施环境中的终端，该封面设置请求是由终端发送给服务器的。在另一种可能实现方式中，该封面设置请求是计算机设备直接获取的，例如，该计算机设备是上述图1的实施环境中的终端，该终端可以直接获取封面设置请求。

在一种可能实现方式中，计算机设备响应于封面设置请求，获取封面设置请求中携带的备选封面和视频标识。计算机设备在视频帧数据库中，获取视频标识对应的至少一个视频帧，将该备选封面和该至少一个视频帧确定为第一视频对应的关联图像。

其中，该封面设置请求携带有备选封面和视频标识，该视频标识指示第一视频，例如该视频标识为第一视频的名称或者编号等。备选封面能够展示第一视频的内容，该备选封面用于设置第一视频的封面，例如备选封面为用户上传的封面。

其中，视频帧数据库用于存储任一视频的视频帧，每个视频帧与该视频帧所在视频的视频标识对应，该视频帧数据库中存储有第一视频的视频帧。由于封面设置请求中的视频标识指示第一视频，因此计算机设备在视频帧数据库中，获取该视频标识对应的至少一个视频帧，该至少一个视频帧即为第一视频的视频帧，因此该至少一个视频帧能够展示第一视频的内容。

因此，计算机设备将备选封面和该至少一个视频帧确定为第一视频对应的关联图像，以便后续基于确定的多个关联图像，来为第一视频设置封面。

以上所述获取第一视频对应的关联图像的方式仅为示例性举例，本申请实施例并不局限于此。示例性地，获取第一视频对应的关联图像的方式还可以为：计算机设备响应于封面设置请求，获取封面设置请求中携带的视频标识，计算机设备在视频帧数据库中，获取视频标识对应的至少一个视频帧，将该至少一个视频帧确定为第一视频对应的关联图像。

902、计算机设备分别对多个关联图像进行清晰度识别，得到每个关联图像的清晰度，在多个关联图像中，将清晰度大于第四阈值的图像确定为第一图像。

该多个关联图像用于设置第一视频的封面，考虑到如果关联图像的清晰度不够高，第一视频的封面会比较模糊，导致第一视频的封面效果不够好，因此，计算机设备先对多个关联图像进行清晰度识别，得到每个关联图像的清晰度。对于每个关联图像，如果该关联图像的清晰度大于第四阈值，说明该关联图像足够清晰，则计算机设备将该关联图像确定为第一图像，如果该关联图像的清晰度不大于第四阈值，说明该关联图像不够清晰，则计算机设备将该关联图像舍弃。因此，计算机设备能够基于清晰度，对多个关联图像进行筛选，从而得到清晰度大于第四阈值的第一图像。可选地，该第四阈值是由计算机设备预先设置的。

在一种可能实现方式中，计算机设备中存储有清晰度识别模型，该清晰度识别模型用于识别图像的清晰度。计算机设备基于该清晰度识别模型，对多个关联图像进行清晰度识别，得到每个关联图像的清晰度。示例性地，清晰度识别模型的结构可以为任一种神经网络模型，本申请实施例对此不加以限定。清晰度识别模型可以通过监督训练得到，例如，根据样本图像和样本图像对应的清晰度标签，通过监督训练得到清晰度识别模型。

可选地，计算机设备采用第一数值和第二数值来表示关联图像的清晰度，第一数值表示关联图像的清晰度低，第二数值表示关联图像的清晰度高。例如第一数值为0，第二数值为1，则计算机设备将清晰度为第二数值的关联图像确定为第一图像。

计算机设备通过执行上述步骤901-步骤902，实现了响应于对第一视频的封面设置请求，获取第一图像，该第一图像用于展示第一视频的内容。除此之外，计算机设备还可以采用其他方式获取第一图像，例如，封面设置请求中携带该第一图像，则计算机设备直接在封面设置请求中获取该第一图像即可。

903、计算机设备确定第一图像中的每个对象所在的对象框。

904、计算机设备将属于第一类型的对象所在的对象框确定为第一目标框，将属于第二类型的对象所在的对象框确定为排除框。

905、计算机设备确定第一图像中的目标区域，目标区域包括第一目标框且不包括排除框。

906、计算机设备基于目标区域，对第一图像进行裁剪，得到包括第一目标框且不包括排除框的第二图像。

需要说明的是，上述步骤903-步骤906仅以对一个第一图像进行处理，得到一个第二图像为例进行说明。在另一实施例中，在上述步骤902中，计算机设备确定出多个第一图像，则计算机设备按照多个第一图像的排列顺序，对至少一个第一图像执行上述步骤903-步骤906。

对于多个第一图像中的任意一个第一图像，计算机设备对该第一图像执行裁剪过程，如果在第一图像中成功裁剪出第二图像，则无需再对该第一图像之后的其他第一图像进行裁剪。如果在该第一图像中没有裁剪出第二图像，则计算机设备继续对该第一图像之后的其他第一图像进行裁剪，直至成功裁剪出第二图像。可选地，在第一图像中包括备选封面的情况下，计算机设备优先对该备选封面进行裁剪。

示例性地，在第一图像中没有裁剪出第二图像包括多种情况，例如在对第一图像执行上述步骤905时，无法在第一图像中确定包括第一目标框且不包括排除框的目标区域。或者在对第一图像执行上述步骤906时，无法在第一图像中裁剪出包括第一目标框且不包括排除框的第二图像等。

示例性地，计算机设备可以为第一视频设置多个不同宽高比的封面。则计算机设备确定多个不同的目标宽高比，则计算机设备按照多个第一图像的排列顺序，对多个第一图像执行上述步骤903-步骤906，得到宽高比分别为该多个目标宽高比的第二图像。

除此之外，上述步骤903-步骤906中得到第二图像的过程与上述步骤301-步骤305中得到第二图像的过程同理，在此不再赘述。

907、计算机设备将第二图像确定为第一视频的封面，或者，将第二图像调整至目标尺寸，将调整后的第二图像确定为第一视频的封面。

第二图像中包括需要保留的对象且不包括不需要保留的对象，计算机设备将该第二图像确定为第一视频的封面，则第一视频的封面中包括需要关注的关键信息，且不包括不需要关注的干扰信息，提高了视频封面的关键信息的信息量，同时降低了视频封面的干扰信息的信息量，从而提高了视频封面的展示效果。

另外，如果第一视频的封面具有尺寸要求，例如第一视频的封面需要在目标尺寸的封面展示区域中展示，则计算机设备先将第二图像调整至该目标尺寸，将调整后的第二图像确定为第一视频的封面，以使第一视频的封面与封面展示区域适配。示例性地，目标尺寸可能比第二图像的尺寸大，也可能比第二图像的尺寸小。若目标尺寸比第二图像的尺寸大，则计算机设备将第二图像扩大至该目标尺寸，将扩大后的第二图像确定为第一视频的封面；若目标尺寸比第二图像的尺寸小，则计算机设备将第二图像缩小至该目标尺寸，将缩小后的第二图像确定为第一视频的封面。

可选地，封面展示区域的宽高比为目标宽高比，则计算机设备在上述步骤903-步骤906中，在第一图像中裁剪出宽高比为该目标宽高比的第二图像，则计算机设备在该步骤907中，将该目标宽高比的第二图像，等比例调整(如，放大或缩小)至目标尺寸，得到调整(如，放大或缩小)后的第二图像。

需要说明的是，本申请实施例以目标尺寸与第二图像的尺寸不同为例进行说明。在一些实施例中，目标尺寸也可能与第二图像的尺寸相同，此种情况下，计算机设备将第二图像确定为第一视频的封面。

在一种可能实现方式中，计算机设备将第二图像分割成多个图像区域；对于每个图像区域，确定图像区域中的多个像素点的明亮度之间的差异参数；基于多个图像区域分别对应的差异参数，确定不小于第二阈值的差异参数的数量；在数量大于第三阈值的情况下，将第二图像确定为第一视频的封面，或者，将第二图像调整(如，放大或缩小)至目标尺寸，将调整(如，放大或缩小)后的第二图像确定为第一视频的封面。可选地，该第二阈值和第三阈值是由计算机设备预先设置的。

其中，明亮度之间的差异参数表示明亮度之间的差异程度，该差异参数越小，表示该多个明亮度之间越相似，该差异参数越大，表示该多个明亮度之间的差异越大。例如，该差异参数为多个明亮度之间的方差或者标准差等。示例性地，该明亮度用于表示像素点的颜色明亮的程度。例如，该明亮度为HSV(Hue-Aturation-Value，色调-饱和度-明亮度)颜色空间中V(明亮度)通道所对应的参数。

示例性地，图像区域中的多个像素点的明亮度之间的差异参数小于第二阈值，说明该图像区域中的多个像素点之间的颜色接近，则可以将该图像区域近似认为是纯色区域。如果在多个图像区域分别对应的差异参数中，不小于第二阈值的差异参数的数量不大于第三阈值，则说明小于第二阈值的差异参数的数量较多，也即是第二图像中的纯色区域的数量较多，则该第二图像的信息量较少，如果基于该第二图像来确定第一视频的封面，则确定出的封面的信息量较少，视频的封面展示效果不好。因此，如果不小于第二阈值的差异参数的数量大于第三阈值，则说明不小于第二阈值的差异参数的数量较多，也即是该第二图像中的纯色区域的数量较少，则该第二图像的信息量足够多，因此计算机设备基于该第二图像来确定第一视频的封面。示例性地，任一图像区域分别对应的差异参数是指该任一图像区域中的多个像素点的明亮度之间的差异参数。

本申请实施例中，基于第二图像中各个像素点的明亮度之间的差异参数，来对第二图像进行筛选，将信息量较少的第二图像舍弃，基于信息量较大的第二图像来确定第一视频的封面，从而保证第一视频的封面的信息量足够大，能够提高第一视频的封面展示效果。

图10是本申请实施例提供的另一种图像裁剪方法的流程图，参见图10，该方法包括以下步骤1001至步骤1004。

1001、计算机设备获取第一视频对应的关联图像。

其中该关联图像包括第一视频的备选封面以及第一视频的视频帧。

1002、对于每个关联图像，计算机设备分别对该关联图像进行人脸识别、物体识别、文本识别、水印识别和清晰度识别，来确定关联图像中的人脸框、物体框、文本框和水印框，以及关联图像的清晰度。

示例性地，计算机设备将清晰度不大于第四阈值的关联图像舍弃，将剩余的关联图像中的人脸框和物体框确定为需要保留的目标框，将文本框和水印框确定为不需要保留的排除框。

1003、计算机设备对剩余的关联图像执行区域划分策略和图像裁剪策略。

其中，区域划分策略即为上述步骤303-步骤304中的方法，图像裁剪策略即为上述步骤305中的方法。

1004、计算机设备输出对关联图像进行裁剪所得到的图像。

本申请实施例，通过计算机设备对图像执行区域划分策略和图像裁剪策略，来裁剪图像作为视频的封面，显著提升封面裁剪流程的效率，降低了人工成本和时间成本。

并且，本申请实施例提供了一种裁剪视频封面的方法，由于第二图像中包括需要保留的对象且不包括不需要保留的对象，因此计算机设备基于该第二图像确定第一视频的封面，则第一视频的封面中包括需要关注的关键信息，且不包括不需要关注的干扰信息，提高了视频封面的关键信息的信息量，同时降低了视频封面的干扰信息的信息量，从而提高了视频封面的展示效果。

并且，基于清晰度，对多个关联图像进行筛选，从而得到清晰度大于第四阈值的第一图像。由于第一图像用于设置第一视频的封面，因此通过保证第一图像的清晰度，能够保证第一视频的封面的清晰度，从而提高第一视频的封面展示效果。

并且，基于第二图像中各个像素点的明亮度之间的差异参数，对第二图像进行筛选，将信息量较少的第二图像舍弃，基于信息量较大的第二图像来确定第一视频的封面，从而保证第一视频的封面的信息量足够大，能够提高第一视频的封面展示效果。

上述实施例可应用于需要进行图像裁剪的任意场景中。例如，在视频分享领域，终端请求服务器为视频设置封面，则服务器可以对与视频内容有关的图像进行裁剪，将裁剪得到的图像确定为视频的封面。图11是本申请实施例提供的一种图像裁剪方法的流程图，参见图11，该方法包括以下步骤1101至步骤1105。

1101、用户终端在检测到对视频的封面设置请求的情况下，获取该视频的视频标识以及用户上传的备选封面，向服务器发送携带该视频标识和备选封面的封面设置请求。

其中，该封面设置请求是由用户在用户终端中执行的封面设置操作触发的。

1102、服务器响应于用户终端发送的封面设置请求，获取封面设置请求中的备选封面和视频标识，在视频帧数据库中获取该视频标识对应的多个视频帧。

1103、服务器在备选封面和多个视频帧中筛选清晰度大于第四阈值的图像，将筛选出来的图像确定为第一图像。

1104、服务器采用上述图3的实施例提供的图像裁剪方法，对多个第一图像进行裁剪，得到不同尺寸的第二图像，将不同尺寸的第二图像分别确定为该视频的封面。

1105、服务器分别发布封面为不同尺寸的第二图像的该视频。

其中，终端发送的封面设置请求还用于请求发布设置好封面的视频，因此计算机设备将不同尺寸的第二图像分别确定为视频的封面后，发布封面为不同尺寸的第二图像的该视频。

在视频分享的场景下，用户终端在发布视频时，不会为视频准备合适的封面，而在不同的分发场景下需要使用不同尺寸的封面，因此服务器采用上述图3的实施例提供的方法，自动为视频裁剪出不同尺寸的封面，能够提高视频的封面展示效果，节省了人力消耗。

除了在视频分享领域为视频裁剪封面之外，还可以在其他场景中应用上述实施例提供的图像裁剪方法。例如在需要对不同尺寸的图像进行集中处理时，采用上述实施例提供的图像裁剪方法，将多个不同尺寸的图像裁剪为相同的尺寸等。例如在图像分享领域中，将图像裁剪为符合要求的尺寸等，本申请实施例对图像裁剪方法的应用场景不做限定。

图12是本申请实施例提供的一种图像裁剪装置的结构示意图。参见图12，该装置包括：

对象框确定模块1201，用于确定第一图像中的每个对象所在的对象框；

目标框和排除框确定模块1202，用于将属于第一类型的对象所在的对象框确定为第一目标框，将属于第二类型的对象所在的对象框确定为排除框，第一类型的对象为需要保留的对象，第二类型的对象为不需要保留的对象；

目标区域确定模块1203，用于确定第一图像中的目标区域，目标区域包括第一目标框且不包括排除框；

裁剪模块1204，用于基于目标区域，对第一图像进行裁剪，得到包括第一目标框且不包括排除框的第二图像。

本申请实施例提供的图像裁剪装置，将第一图像中的对象划分为需要保留的对象和不需要保留的对象，并通过确定第一目标框和排除框，来将需要保留的对象和不需要保留的对象所在的区域进行标记，由于第一图像中的目标区域包括第一目标框且不包括排除框，则基于目标区域，对第一图像进行裁剪，能够得到包括第一目标框且不包括排除框的第二图像。其中，利用第一目标框和排除框来标记图像中需要保留的对象和不需要保留的对象所在的区域，有利于快速识别出目标区域，从而提高了图像裁剪的速度。并且，需要保留的对象可视为需要关注的关键信息，不需要保留的对象可视为不需要关注的干扰信息，因此，此种图像裁剪方法保证了该第二图像中包括需要关注的关键信息，且不包括不需要关注的干扰信息，从而提高了图像裁剪的效果。

可选地，参见图13，目标区域确定模块1203，包括：

候选区域确定单元1213，用于基于排除框的位置，确定第一图像中的多个候选区域，每个候选区域中不包括排除框；

目标区域确定单元1223，用于在多个候选区域中，确定包括第一目标框的目标区域。

可选地，参见图13，候选区域确定单元1213，用于：

在排除框的边缘线中，确定与第一图像的每个边缘线没有重叠的目标边缘线；

确定目标边缘线所在的直线，将第一图像中位于直线外侧的区域确定为候选区域，直线外侧是指远离排除框的一侧。

可选地，参见图13，候选区域确定单元1213，用于执行以下至少一项：

在目标边缘线包括排除框的左边缘线的情况下，确定目标边缘线所在的第一直线，将第一图像中位于第一直线左侧的区域确定为候选区域；

在目标边缘线包括排除框的右边缘线的情况下，确定目标边缘线所在的第二直线，将第一图像中位于第二直线右侧的区域确定为候选区域；

在目标边缘线包括排除框的上边缘线的情况下，确定目标边缘线所在的第三直线，将第一图像中位于第三直线上侧的区域确定为候选区域；

在目标边缘线包括排除框的下边缘线的情况下，确定目标边缘线所在的第四直线，将第一图像中位于第四直线下侧的区域确定为候选区域。

可选地，参见图13，排除框的数量为多个，候选区域确定单元1213，用于：

基于第一排除框的位置，确定第一图像中的第一候选区域，第一候选区域中不包括第一排除框，第一排除框为多个排除框中的任一排除框；

响应于第一候选区域包括第二排除框，基于第二排除框的位置，确定第一候选区域中的第二候选区域，第二候选区域中不包括第二排除框，第二排除框为多个排除框中除第一排除框外的任一排除框；

响应于第二候选区域不包括任一排除框，将第二候选区域作为候选区域。

可选地，参见图13，装置还包括：

区域删除模块1205，用于从所确定的多个第一候选区域中，将尺寸小于第一阈值的第一候选区域删除；

所述候选区域确定单元1213，用于响应于未删除的第一候选区域包括第二排除框，基于第二排除框的位置，确定未删除的第一候选区域中的第二候选区域。

可选地，参见图13，对象框确定模块1201，用于执行以下至少一项：

对第一图像进行人脸识别，得到第一图像中的人脸框；

对第一图像进行物体识别，得到第一图像中的物体框；

对第一图像进行文本识别，得到第一图像中的文本框；

对第一图像进行水印识别，得到第一图像中的水印框。

可选地，参见图13，目标框和排除框确定模块1202，用于执行以下至少一项：

将人脸所在的人脸框确定为第一目标框；

将物体所在的物体框确定为第一目标框。

将文本所在的文本框确定为排除框；

将水印所在的水印框确定为排除框。

可选地，参见图13，装置还包括：

扩大模块1206，用于在已确定多个第一目标框的情况下，将每个第一目标框的尺寸扩大第一倍数，得到多个第二目标框；

合并模块1207，用于对于每个第二目标框，在第二目标框与其他第二目标框相交的情况下，将第二目标框与其他第二目标框合并为一个第三目标框；

目标区域确定模块1203，包括：

第一确定单元1233，用于在第一图像中，将包括第三目标框且不包括排除框的区域，确定为目标区域；

第二确定单元1243，用于在第一图像中，将包括剩余的第二目标框对应的第一目标框、且不包括排除框的区域，确定为目标区域，剩余的第二目标框为没有进行合并的第二目标框。

可选地，参见图13，第一目标框的数量为多个，目标区域确定模块1203，包括：

第三确定单元1253，用于在第一图像中，确定包括至少一个第一目标框、且不包括排除框的目标区域。

第四确定单元1263，用于在多个第一目标框中包括人脸框的情况下，在第一图像中，确定包括人脸框且不包括排除框的目标区域。

可选地，参见图13，裁剪模块1204，包括：

裁剪单元1214，用于基于目标区域，对第一图像进行裁剪，得到包括第一目标框、不包括排除框、且宽高比为目标宽高比的第二图像。

可选地，参见图13，裁剪单元1214，用于：

扩大第一目标框的宽度或者高度中的至少一项，得到第四目标框，以使第四目标框的宽高比为目标宽高比；

保持第四目标框的中心点不变，扩大第四目标框的尺寸，直至扩大第二倍数或者扩大后第四目标框的任一边缘线与目标区域的边缘线重叠，得到第五目标框；

从第一图像中裁剪第五目标框，将裁剪出的第五目标框确定为第二图像。

可选地，参见图13，装置还包括：

图像获取模块1208，用于响应于对第一视频的封面设置请求，获取第一图像，第一图像用于展示第一视频的内容；

封面确定模块1209，用于将第二图像确定为第一视频的封面，或者，将第二图像调整至目标尺寸，将调整后的第二图像确定为第一视频的封面。

可选地，参见图13，封面确定模块1209，包括：

区域分割单元1219，用于将第二图像分割成多个图像区域；

差异参数确定单元1229，用于对于每个图像区域，确定图像区域中的多个像素点的明亮度之间的差异参数；

数量确定单元1239，用于基于多个图像区域分别对应的差异参数，确定不小于第二阈值的差异参数的数量；

封面确定单元1249，用于在数量大于第三阈值的情况下，将第二图像确定为第一视频的封面，或者，将第二图像调整至目标尺寸，将调整后的第二图像确定为第一视频的封面。

可选地，参见图13，图像获取模块1208，包括：

关联图像获取单元1218，用于响应于封面设置请求，获取第一视频对应的多个关联图像，关联图像用于展示第一视频的内容；

清晰度识别单元1228，用于分别对多个关联图像进行清晰度识别，得到每个关联图像的清晰度；

图像确定单元1238，用于在多个关联图像中，将清晰度大于第四阈值的图像确定为第一图像。

可选地，参见图13，关联图像获取单元1218，用于：

响应于封面设置请求，获取封面设置请求中携带的备选封面和视频标识，视频标识指示第一视频；

在视频帧数据库中，获取视频标识对应的至少一个视频帧；

将备选封面和至少一个视频帧确定为第一视频对应的关联图像。

需要说明的是：上述实施例提供的图像裁剪装置在进行图像裁剪时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将计算机设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的图像裁剪装置与图像裁剪方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

本申请实施例还提供了一种计算机设备，该计算机设备包括处理器和存储器，存储器中存储有至少一条计算机程序，该至少一条计算机程序由处理器加载并执行，以使计算机设备实现上述实施例的图像裁剪方法中所执行的操作。

可选地，该计算机设备提供为终端，例如该终端是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能电视、智能车载终端等。图14示出了本申请一个示例性实施例提供的终端1400的结构示意图。

终端1400包括有：处理器1401和存储器1402。

处理器1401可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1401可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1401也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central Processing Unit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1401可以集成有GPU(Graphics Processing Unit，图像处理的交互器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1401还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器1402可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1402还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1402中的非暂态的计算机可读存储介质用于存储至少一条计算机程序，该至少一条计算机程序用于被处理器1401所具有以实现本申请中方法实施例提供的图像裁剪方法。

在一些实施例中，终端1400还可选包括有：外围设备接口1403和至少一个外围设备。处理器1401、存储器1402和外围设备接口1403之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1403相连。可选地，外围设备包括：射频电路1404、显示屏1405和摄像头组件1406中的至少一种。

外围设备接口1403可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器1401和存储器1402。在一些实施例中，处理器1401、存储器1402和外围设备接口1403被集成在同一芯片或电路板上；在一些其他实施例中，处理器1401、存储器1402和外围设备接口1403中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路1404用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路1404通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1404将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路1404包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1404可以通过至少一种无线通信协议来与其它设备进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路1404还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏1405用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1405是触摸显示屏时，显示屏1405还具有采集在显示屏1405的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1401进行处理。此时，显示屏1405还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏1405可以为一个，设置在终端1400的前面板；在另一些实施例中，显示屏1405可以为至少两个，分别设置在终端1400的不同表面或呈折叠设计；在另一些实施例中，显示屏1405可以是柔性显示屏，设置在终端1400的弯曲表面上或折叠面上。甚至，显示屏1405还可以设置成非矩形的不规则图形，也即异形屏。显示屏1405可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode，有机发光二极管)等材质制备。

摄像头组件1406用于采集图像或视频。可选地，摄像头组件1406包括前置摄像头和后置摄像头。前置摄像头设置在终端1400的前面板，后置摄像头设置在终端1400的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件1406还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

本领域技术人员可以理解，图14中示出的结构并不构成对终端1400的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

可选地，该计算机设备提供为服务器。图15是本申请实施例提供的一种服务器的结构示意图，该服务器1500可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(Central Processing Units，CPU)1501和一个或一个以上的存储器1502，其中，所述存储器1502中存储有至少一条计算机程序，所述至少一条计算机程序由所述处理器1501加载并执行以实现上述各个方法实施例提供的图像裁剪方法。当然，该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

本申请实施例还提供了一种非易失性计算机可读存储介质，该非易失性计算机可读存储介质中存储有至少一条计算机程序，该至少一条计算机程序由处理器加载并执行，以使计算机实现上述实施例的图像裁剪方法中所执行的操作。

本申请实施例还提供了一种计算机程序产品或计算机程序，计算机程序产品或计算机程序包括计算机程序代码，计算机程序代码存储在非易失性计算机可读存储介质中，计算机设备的处理器从非易失性计算机可读存储介质读取计算机程序代码，处理器执行计算机程序代码，使得计算机设备实现如上述实施例的图像裁剪方法中所执行的操作。在一些实施例中，本申请实施例所涉及的计算机程序可被部署在一个计算机设备上执行，或者在位于一个地点的多个计算机设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算机设备上执行，分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种非易失性计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请实施例的可选实施例，并不用以限制本申请实施例，凡在本申请实施例的原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种图像裁剪方法，其中，所述方法由计算机设备执行，所述方法包括：

确定第一图像中的每个对象所在的对象框；

将属于第一类型的对象所在的对象框确定为第一目标框，将属于第二类型的对象所在的对象框确定为排除框，所述第一类型的对象为需要保留的对象，所述第二类型的对象为不需要保留的对象；

确定所述第一图像中的目标区域，所述目标区域包括所述第一目标框且不包括所述排除框；

基于所述目标区域，对所述第一图像进行裁剪，得到包括所述第一目标框且不包括所述排除框的第二图像。
根据权利要求1所述的方法，其中，所述确定所述第一图像中的目标区域，包括：

基于所述排除框的位置，确定所述第一图像中的多个候选区域，每个所述候选区域中不包括所述排除框；

在多个所述候选区域中，确定包括所述第一目标框的目标区域。
根据权利要求2所述的方法，其中，所述基于所述排除框的位置，确定所述第一图像中的多个候选区域，包括：

在所述排除框的边缘线中，确定与所述第一图像的每个边缘线没有重叠的目标边缘线；

确定所述目标边缘线所在的直线，将所述第一图像中位于所述直线外侧的区域确定为所述候选区域，所述直线外侧是指远离所述排除框的一侧。
根据权利要求3所述的方法，其中，所述确定所述目标边缘线所在的直线，将所述第一图像中位于所述直线外侧的区域确定为所述候选区域，包括以下至少一项：

在所述目标边缘线包括所述排除框的左边缘线的情况下，确定所述目标边缘线所在的第一直线，将所述第一图像中位于所述第一直线左侧的区域确定为所述候选区域；

在所述目标边缘线包括所述排除框的右边缘线的情况下，确定所述目标边缘线所在的第二直线，将所述第一图像中位于所述第二直线右侧的区域确定为所述候选区域；

在所述目标边缘线包括所述排除框的上边缘线的情况下，确定所述目标边缘线所在的第三直线，将所述第一图像中位于所述第三直线上侧的区域确定为所述候选区域；

在所述目标边缘线包括所述排除框的下边缘线的情况下，确定所述目标边缘线所在的第四直线，将所述第一图像中位于所述第四直线下侧的区域确定为所述候选区域。
根据权利要求2所述的方法，其中，所述排除框的数量为多个，所述基于所述排除框的位置，确定所述第一图像中的多个候选区域，包括：

基于第一排除框的位置，确定所述第一图像中的第一候选区域，所述第一候选区域中不包括所述第一排除框，所述第一排除框为多个所述排除框中的任一排除框；

响应于所述第一候选区域包括第二排除框，基于所述第二排除框的位置，确定所述第一候选区域中的第二候选区域，所述第二候选区域中不包括所述第二排除框，所述第二排除框为多个所述排除框中除所述第一排除框外的任一排除框；

响应于所述第二候选区域不包括任一排除框，将所述第二候选区域作为所述候选区域。
根据权利要求5所述的方法，其中，所述第一候选区域的数量为多个，所述基于第一排除框的位置，确定所述第一图像中的第一候选区域之后，所述方法还包括：

从所确定的多个所述第一候选区域中，将尺寸小于第一阈值的第一候选区域删除；

所述响应于所述第一候选区域包括第二排除框，基于所述第二排除框的位置，确定所述第一候选区域中的第二候选区域，包括：

响应于未删除的第一候选区域包括第二排除框，基于所述第二排除框的位置，确定所述未删除的第一候选区域中的第二候选区域。
根据权利要求1所述的方法，其中，所述确定第一图像中的每个对象所在的对象框，包括以下至少一项：

对所述第一图像进行人脸识别，得到所述第一图像中的人脸框；

对所述第一图像进行物体识别，得到所述第一图像中的物体框；

对所述第一图像进行文本识别，得到所述第一图像中的文本框；

对所述第一图像进行水印识别，得到所述第一图像中的水印框。
根据权利要求1所述的方法，其中，所述将属于第一类型的对象所在的对象框确定为第一目标框，包括以下至少一项：

将人脸所在的人脸框确定为所述第一目标框；

将物体所在的物体框确定为所述第一目标框。
根据权利要求1所述的方法，其中，所述将属于第二类型的对象所在的对象框确定为排除框，包括以下至少一项：

将文本所在的文本框确定为所述排除框；

将水印所在的水印框确定为所述排除框。
根据权利要求1所述的方法，其中，所述方法还包括：

在已确定多个所述第一目标框的情况下，将每个所述第一目标框的尺寸扩大第一倍数，得到多个第二目标框；

对于每个所述第二目标框，在所述第二目标框与其他第二目标框相交的情况下，将所述第二目标框与所述其他第二目标框合并为一个第三目标框；

所述确定所述第一图像中的目标区域，包括：

在所述第一图像中，将包括所述第三目标框且不包括所述排除框的区域，确定为所述目标区域；

在所述第一图像中，将包括剩余的第二目标框对应的第一目标框、且不包括所述排除框的区域，确定为所述目标区域，所述剩余的第二目标框为没有进行合并的第二目标框。
根据权利要求1所述的方法，其中，所述第一目标框的数量为多个，所述确定所述第一图像中的目标区域，包括：

在所述第一图像中，确定包括至少一个所述第一目标框、且不包括所述排除框的所述目标区域。
根据权利要求1所述的方法，其中，所述第一目标框的数量为多个，所述确定所述第一图像中的目标区域，包括：

在多个所述第一目标框中包括人脸框的情况下，在所述第一图像中，确定包括所述人脸框且不包括所述排除框的所述目标区域。
根据权利要求1所述的方法，其中，所述基于所述目标区域，对所述第一图像进行裁剪，得到包括所述第一目标框且不包括所述排除框的第二图像，包括：

基于所述目标区域，对所述第一图像进行裁剪，得到包括所述第一目标框、不包括所述排除框、且宽高比为目标宽高比的所述第二图像。
根据权利要求13所述的方法，其中，所述基于所述目标区域，对所述第一图像进行裁剪，得到包括所述第一目标框、不包括所述排除框、且宽高比为目标宽高比的所述第二图像，包括：

扩大所述第一目标框的宽度或者高度中的至少一项，得到第四目标框，以使所述第四目标框的宽高比为所述目标宽高比；

保持所述第四目标框的中心点不变，扩大所述第四目标框的尺寸，直至扩大第二倍数或者扩大后所述第四目标框的任一边缘线与所述目标区域的边缘线重叠，得到第五目标框；

从所述第一图像中裁剪所述第五目标框，将裁剪出的所述第五目标框确定为所述第二图像。
根据权利要求1-14任一项所述的方法，其中，所述确定第一图像中的每个对象所在的对象框之前，所述方法还包括：

响应于对第一视频的封面设置请求，获取所述第一图像，所述第一图像用于展示所述第一视频的内容；

所述基于所述目标区域，对所述第一图像进行裁剪，得到包括所述第一目标框且不包括所述排除框的第二图像之后，所述方法还包括：

将所述第二图像确定为所述第一视频的封面，或者，将所述第二图像调整至目标尺寸，将调整后的所述第二图像确定为所述第一视频的封面。
根据权利要求15所述的方法，其中，所述将所述第二图像确定为所述第一视频的封面，或者，将所述第二图像调整至目标尺寸，将调整后的所述第二图像确定为所述第一视频的封面，包括：

将所述第二图像分割成多个图像区域；

对于每个所述图像区域，确定所述图像区域中的多个像素点的明亮度之间的差异参数；

基于所述多个图像区域分别对应的差异参数，确定不小于第二阈值的差异参数的数量；

在所述数量大于第三阈值的情况下，将所述第二图像确定为所述第一视频的封面，或者，将所述第二图像调整至所述目标尺寸，将调整后的所述第二图像确定为所述第一视频的封面。
根据权利要求15所述的方法，其中，所述响应于对第一视频的封面设置请求，获取所述第一图像，包括：

响应于所述封面设置请求，获取所述第一视频对应的多个关联图像，所述关联图像用于展示所述第一视频的内容；

分别对所述多个关联图像进行清晰度识别，得到每个关联图像的清晰度；

在所述多个关联图像中，将清晰度大于第四阈值的图像确定为所述第一图像。
根据权利要求17所述的方法，其中，所述响应于所述封面设置请求，获取所述第一视频对应的多个关联图像，包括：

响应于所述封面设置请求，获取所述封面设置请求中携带的备选封面和视频标识，所述视频标识指示所述第一视频；

在视频帧数据库中，获取所述视频标识对应的至少一个视频帧；

将所述备选封面和所述至少一个视频帧确定为所述第一视频对应的关联图像。
一种图像裁剪装置，其中，所述装置包括：

对象框确定模块，用于确定第一图像中的每个对象所在的对象框；

目标框和排除框确定模块，用于将属于第一类型的对象所在的对象框确定为第一目标框，将属于第二类型的对象所在的对象框确定为排除框，所述第一类型的对象为需要保留的对象，所述第二类型的对象为不需要保留的对象；

目标区域确定模块，用于确定所述第一图像中的目标区域，所述目标区域包括所述第一目标框且不包括所述排除框；

裁剪模块，用于基于所述目标区域，对所述第一图像进行裁剪，得到包括所述第一目标框且不包括所述排除框的第二图像。
一种计算机设备，其中，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条计算机程序，所述至少一条计算机程序由所述处理器加载并执行，以使所述计算机设备实现如权利要求1至18任一项所述的图像裁剪方法所执行的操作。
一种非易失性计算机可读存储介质，其中，所述非易失性计算机可读存储介质中存储有至少一条计算机程序，所述至少一条计算机程序由处理器加载并执行，以使计算机实现如权利要求1至18任一项所述的图像裁剪方法所执行的操作。
一种计算机程序产品，其中，所述计算机程序产品包括计算机程序代码，所述计算机程序代码存储在非易失性计算机可读存储介质中，计算机设备的处理器从所述非易失性计算机可读存储介质读取所述计算机程序代码，所述处理器执行所述计算机程序代码，使得所述计算机设备实现如权利要求1至18任一项所述的图像裁剪方法所执行的操作。