CN110796663A

CN110796663A - 图片剪裁方法、装置、设备和存储介质

Info

Publication number: CN110796663A
Application number: CN201910875469.2A
Authority: CN
Inventors: 牛然森
Original assignee: Beijing Megvii Technology Co Ltd
Current assignee: Beijing Megvii Technology Co Ltd
Priority date: 2019-09-17
Filing date: 2019-09-17
Publication date: 2020-02-14
Anticipated expiration: 2039-09-17
Also published as: CN110796663B

Abstract

本申请涉及一种图片剪裁方法、装置、设备和存储介质，终端从目标图片中截取多个候选图片，候选图片包括的各对象的特征向量之间的距离小于预设距离阈值，将各候选图片输入预设的美学模型中，得到各候选图片的美学分数，进而根据各候选图片和各候选图片的美学分数，从多个候选图片中确定目标候选图片，并将目标候选图片作为对目标图片进行剪裁后得到的剪裁图片，使得剪裁图片是从多个候选图片中，根据候选图片中各对象之间的特征向量之间的距离所确定的美学分数，得到剪裁图片的。也即是说，剪裁图片的美学分数不是人为确定的，而是通过各对象的特征向量之间的距离确定的，避免了所获得的剪裁图片的美感受人为因素影像大的问题。

Description

图片剪裁方法、装置、设备和存储介质

技术领域

本申请涉及图像识别技术领域，特别是涉及了一种图片剪裁方法、装置、设备和存储介质。

背景技术

专业摄影师会通过裁剪来增强一张图片的构图效果，使得图片美感增加，主体更为突出。

常见的自动剪裁图片的方法，通常会根据预设的候选剪裁框先对图片进行剪裁，得到多个预剪裁图片，并根据用户的选择，从多个预剪裁图片中选择一个作为剪裁图片。

然而采用上述方法，对多个预剪裁图片的选择，受用户的主观影像较大，导所获得剪裁图片的美感受人为因素的影响大。

发明内容

基于此，有必要针对传统方法得到的剪裁图片的美感受人为因素影像大的问题，提供了一种图片剪裁方法、装置、设备和存储介质。

第一方面，一种图片剪裁方法，该方法包括：

从包括多个对象的目标图片中截取多个候选图片，其中，候选图片包括多个对象，且，候选图片包括的各对象的特征向量之间的距离小于预设距离阈值；

将各候选图片输入预设的美学模型中，得到各候选图片的美学分数；预设的美学模型用于根据候选图片中的各对象的特征向量之间的距离，确定候选图片的美学分数；

根据各候选图片和各候选图片的美学分数，从多个候选图片中确定目标候选图片，并将目标候选图片作为对目标图片进行剪裁后得到的剪裁图片。

在其中一个实施例中，上述从包括多个对象的目标图片中截取多个候选图片，包括：

在目标图片包括的多个对象中确定显著性对象及非显著性对象；

将显著性对象及非显著性对象输入预设的聚类模型，得到目标对象集合；目标对象集合中包括显著性对象及目标非显著性对象；目标非显著性对象的特征向量与显著性对象的特征向量之间的距离小于预设距离阈值；

根据目标对象集合从目标图片中截取多个候选图片，每个候选图片包括目标对象集合中的至少一个对象。

在其中一个实施例中，上述在目标图片包括的多个对象中确定显著性对象及非显著性对象，包括：

将目标图片输入预设的分割模型中，得到显著性对象和非显著性对象。

将目标图片按照预设的分割规则分割成多个分割图片；

根据用户输入的选择指令，从多个分割图片中选中目标分割图片，将目标分割图片中的对象作为显著性对象；将多个分割图片中除目标分割图片之外的其他分割图片中的对象作为非显著性对象。

在其中一个实施例中，上述根据目标对象集合从目标图片中截取多个候选图片，包括：

在目标图片中获取目标对象集合对应的对象轮廓；对象轮廓为目标图片中目标对象集合中的对象对应的轮廓；

根据对象轮廓从目标图片中截取多个候选图片。

在其中一个实施例中，上述根据对象轮廓从目标图片中截取多个候选图片，包括：

将目标图片中对象轮廓的最大外接矩形对应的图片，作为候选图片；

或，

将目标图片中对象轮廓的最小内接矩形对应的的图片，作为候选图片；

或，

根据预设的纵横比，在目标图片中对象轮廓的最小内接矩形对应的的图片进行滑窗操作，得到候选图片。

在其中一个实施例中，当目标对象集合为多个时，该方法还包括；

根据各目标对象集合得到多个对象轮廓，各对象轮廓与各目标对象集合一一对应；

根据多个对象轮廓和目标图片，得到多类候选图片，各类候选图片与各对象轮廓一一对应；

对应地，根据各候选图片和各候选图片的美学分数，得到剪裁图片，包括：

根据多类候选图片及用户输入的选择指令，得到剪裁图片。

在其中一个实施例中，当显著性对象为多个对象时，将各显著性对象及各显著性对象对应的非显著性对象依次输入预设的聚类模型。

第二方面，一种图片剪裁装置，该装置包括：

第一获取模块，用于从包括多个对象的目标图片中截取多个候选图片，其中，候选图片包括多个对象，且，候选图片包括的各对象的特征向量之间的距离小于预设距离阈值；

第二获取模块，用于将各候选图片输入预设的美学模型中，得到各候选图片的美学分数；预设的美学模型用于根据候选图片中的各对象的特征向量之间的距离，确定候选图片的美学分数；

确定模块，用于根据各候选图片和各候选图片的美学分数，从多个候选图片中确定目标候选图片，并将目标候选图片作为对目标图片进行剪裁后得到的剪裁图片。

第三方面，一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述图片剪裁方法的步骤：

第四方面，一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述图片剪裁方法的步骤：

上述图片剪裁方法、装置、设备和存储介质，终端从包括多个对象的目标图片中截取多个候选图片，其中，候选图片包括多个对象，且，候选图片包括的各对象的特征向量之间的距离小于预设距离阈值，将各候选图片输入预设的美学模型中，得到各候选图片的美学分数，其中预设的美学模型用于根据候选图片中的各对象的特征向量之间的距离，确定候选图片的美学分数，进而根据各候选图片和各候选图片的美学分数，从多个候选图片中确定目标候选图片，并将目标候选图片作为对目标图片进行剪裁后得到的剪裁图片，使得对剪裁图片是从多个候选图片中，根据候选图片中各对象之间的特征向量之间的距离所确定的美学分数，选中的目标候选图片，作为剪裁图片的。也即是说，剪裁图片的美学分数不是人为确定的，而是通过各对象的特征向量之间的距离确定的，避免了所获得的剪裁图片的美感受人为因素影像大的问题。

附图说明

图1为一个实施例中图片剪裁方法的流程示意图；

图2为另一个实施例中图片剪裁方法的流程示意图；

图2a为一个实施例中相似图的示意图；

图2b为一个实施例中连通图的示意图；

图3为另一个实施例中图片剪裁方法的流程示意图；

图4为另一个实施例中图片剪裁方法的流程示意图；

图5为另一个实施例中图片剪裁方法的流程示意图；

图6为一个实施例中提供的图片剪裁装置的结构示意图；

图7为另一个实施例中提供的图片剪裁装置的结构示意图；

图8为一个实施例中计算机设备的内部结构图。

具体实施方式

本申请提供的图片剪裁方法、装置、设备和存储介质，旨在解决传统方法得到的剪裁图片的美感受人为因素影像大的问题。下面将通过实施例并结合附图具体地对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。

需要说明的是，本申请实施例提供的图片剪裁方法，其执行主体可以是图片剪裁的装置，该装置可以通过软件、硬件或者软硬件结合的方式实现成为图片剪裁终端的部分或者全部。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。

图1为一个实施例中图片剪裁方法的流程示意图。本实施例涉及的是如何根据目标图片中各对象的特征向量之间的距离，得到剪裁图片具体过程。如图1所示，该方法包括以下步骤：

S101、从包括多个对象的目标图片中截取多个候选图片，其中，候选图片包括多个对象，且，候选图片包括的各对象的特征向量之间的距离小于预设距离阈值。

其中，目标图片可以是待剪裁的图片，其中可以包括多个对象，其中，对象可以用于指示图片中具体的人或物。例如，目标图片中包括人、车、猫和桌子这四个对象。候选图片可以是目标图片中的部分图片，候选图片中也包括多个对象，且候选图片中的各对象的特征向量之间的距离小于预设距离阈值，其中各对象的特征向量可以通过神经网络模型中的特征提取网络提取得到的，特征向量可以表示该对象本身的像素值(image)，也可以表示该对象在目标图片中的位置信息(location)，还可以表示该对象的标注信息(instance_label)，本申请实施例对此不做限制，特征向量可以表示上述像素值、位置信息和的标注信息中的至少一种。需要说明的是，除了上述像素值、位置信息和标注信息，特征向量还可以表示其他信息，本申请实施例对此不做限制。例如，目标图片中第i个对象的特征向量可以用Dict_i＝{image,location,ins tan ce_label,…}_i,i∈N,其中，N为目标图片中对象数量。终端可以从目标图片中截取多个候选图片，每个候选图片中包括的对象数量可以小于目标图片中包括的对象数量，也可以等于目标图片中包括的对象数量，本申请实施例对此不做限制。

S102、将各候选图片输入预设的美学模型中，得到各候选图片的美学分数；预设的美学模型用于根据候选图片中的各对象的特征向量之间的距离，确定候选图片的美学分数。

其中，预设的美学模型可以是神经网络模型，预设的美学模型可以根据候选图片中各对象的特征向量之间的距离，确定各候选图片的美学分数。进而还可以根据各候选图片的美学分数，通过非极大抑制(non-maxinum suppression，NMS)算法，得到剪裁图片。在上述实施例的基础上，当得到了多个候选图片时，将各候选图片输入预设的美学模型，使得预设的美学模型可以先通过特征提取网络提取候选图片中各对象的特征向量，并根据候选图片中各对象的特征向量之间的距离，确定候选图片的美学分数。候选图片中各对象的特征向量之间的距离小的候选图片的美学分数高。在将候选图片输入预设的美学模型时，可以是将多个候选图片依次输入预设的美学模型，也可以是一次输入一组候选图片，本申请实施例对此不做限制。

S103、根据各候选图片和各候选图片的美学分数，从多个候选图片中确定目标候选图片，并将目标候选图片作为对目标图片进行剪裁后得到的剪裁图片。

其中，剪裁图片可以是指对目标图片进行剪裁后得到的图片，通常通过对图片进行剪裁，改变图片的构图，使得图片的美感增加，主体更加突出。在专业摄影领域，构图是评判一张图片美感的重要标杆，图片中各对象之间的关系(包括但不限于位置关系、颜色关系和对象特性关系)，可以用于指示图片的构图。因此，可以通过图片中各对象之间的关系，确定该图片的美感。当通过预设的美学模型得到各候选图片的美学分数时，可以将美学分数高于预设分数阈值的候选图片作为目标候选图片，也可以根据用户输入的选择指令，在美学分数超过预设分数阈值的一组候选图片中，选中一个或多个候选图片作为目标候选图片，本申请实施例对此不做限制。当将美学分数高的候选图片作为目标候选图片时，可以是通过上述预设的美学模型直接将美学分数高于预设分数阈值的候选图片设置为目标候选图片，也可以根据上述预设的美学模型输出的各候选图片的美学分数，得到目标候选图片，本申请实施例对此不做限制。

上述图片剪裁方法，终端从包括多个对象的目标图片中截取多个候选图片，其中，候选图片包括多个对象，且，候选图片包括的各对象的特征向量之间的距离小于预设距离阈值，将各候选图片输入预设的美学模型中，得到各候选图片的美学分数，其中预设的美学模型用于根据候选图片中的各对象的特征向量之间的距离，确定候选图片的美学分数，进而根据各候选图片和各候选图片的美学分数，从多个候选图片中确定目标候选图片，并将目标候选图片作为对目标图片进行剪裁后得到的剪裁图片，使得对剪裁图片是从多个候选图片中，根据候选图片中各对象之间的特征向量之间的距离所确定的美学分数，选中的目标候选图片，作为剪裁图片的。也即是说，剪裁图片的美学分数不是人为确定的，而是通过各对象的特征向量之间的距离确定的，避免了所获得的剪裁图片的美感受人为因素影像大的问题。

图2为另一个实施例中图片剪裁方法的流程示意图。本实施例涉及的是如何从包括多个对象的目标图片中截取多个候选图片的具体过程。如图2所示，上述S101“从包括多个对象的目标图片中截取多个候选图片”的一种可能的实现方法包括以下步骤：

S201、在目标图片包括的多个对象中确定显著性对象及非显著性对象。

其中，显著性对象可以是目标图片中最突出的一个或多个对象，其可以是目标图片中所占图片面积最大的对象，也可以是目标图片中在最前面的对象，还可以是用户选择突出表现的对象，本申请实施例对此不做限制。非显著性对象可以是目标图片中除了显著性对象之外其他的对象。需要说明的是，显著性对象和非显著性对象是相对的。例如，目标图片中包括了山、水、车和人四个对象，其中，当选中目标图片中所占图片面积最大的“山”作为显著性对象时，“水”“车”“人”即为非显著性对象；当选中目标图片中在最前面的“人”作为显著性对象时，“山”“水”“车”即为非显著性对象。

可选地，将目标图片输入预设的分割模型中，得到显著性对象和非显著性对象。其中，预设的分割模型可以是图像识别的神经网络模型，其可以通过实例分割(instancesegmentation)的方法，将目标图片中的对象分离开，并学习目标图片中各对象之间的关系，得到显著性对象和非显著性对象。

可选地，还可以通过图3所示实施例来确定显著性对象及非显著性对象，包括以下步骤：

S301、将目标图片按照预设的分割规则分割成多个分割图片。

其中，预设的分割规则可以是对目标图片进行分割时，各分割图片所占目标图片的比例，将目标图片按照预设的分割规则分割可以是按照预设的分割比例分割目标图片，得到多个分割图片，例如，可以将目标图片等分为9个分割图片，也可以是将目标图片按照预设的分割比例，分成3个不同尺寸的分割图片，本申请实施例对此不做限制。

S302、根据用户输入的第一选择指令，从多个分割图片中选中目标分割图片，将目标分割图片中的对象作为显著性对象；将多个分割图片中除目标分割图片之外的其他分割图片中的对象作为非显著性对象。

在得到了多个分割图片时，可以接收用户输入的第一选择指令，并根据用户输入的第一选择指令，从上述多个分割图片中选中目标分割图片，进而根据目标分割图片得到显著性对象。终端可以将目标分割图片输入图像识别的神经网络模型，识别得到显著性对象。对应的，在得到目标分割图片之后，可以将多个分割图片中除分割图片之外的其他分割图片也输入图像识别的神经网络模型，识别得到非显著性对象。

S202、将显著性对象及非显著性对象输入预设的聚类模型，得到目标对象集合；目标对象集合中包括显著性对象及目标非显著性对象；目标非显著性对象的特征向量与显著性对象的特征向量之间的距离小于预设距离阈值。

其中，预设的聚类模型可以用于根据显著性对象及非显著性对象，得到目标对象集合，目标对象集合中包括显著性对象及目标非显著性对象，目标非显著性对象的特征向量与显著性对象的特征向量之间的距离小于预设距离阈值。预设的聚类模型可以是神经网络模型，其可以是与上述预设的美学模型结构相同的神经网络模型，先通过特征提取网络提取显著性对象的特征向量及非显著性对象的特征向量，将显著性对象的特征向量记为V_sal，将非显著性对象的特征向量记为V_rest。通过公式1得到显著性对象的特征向量与所有非显著性对象的特征向量之间的距离平均值，其中，公式1包括

通过公式2得到显著性对象的特征向量到所有非显著性对象的特征向量的平均值的距离，其中，公式2包括

将公式1得到的显著性对象的特征向量与所有非显著性对象的特征向量之间的距离平均值，和，公式2得到的显著性对象的特征向量到所有非显著性对象的特征向量的平均值的距离相加，得到目标非显著性对象的特征向量与显著性对象的特征向量之间的距离，进而根据显著性对象的特征向量及非显著性对象的特征向量之间的距离，将与显著性对象的特征向量之间的距离小于预设距离阈值的非显著性对象作为目标非显著性对象，并将目标非显著性对象和显著性对象作为目标对象集合。

在具体的显著性对象及非显著性对象根据获取目标对象集合时，可以通过(Hierarchical Star Algorithm，HAS)确定目标对象集合。例如，显著性对象的特征向量和各非显著性对象的特征向量之间的距离可以用Dis tan ce(V_sal,V_i)表示，通过建立如图2a所示的一个相似图(similartiy graph)，其中，每个V表示各对象的特征向量(Vertex)，各对象的特征向量之间的距离即为边缘(edge),对显著性对象的特征向量和距离进行归一化处理，得到如图2a所示的相似图。当然，相似图可以被分为如图2b所示多个连通图(connected graph)，然后在各连通图中选取最小支配集(minimum dominating set)，得到目标对象集合。

在将显著性对象及非显著性对象输入预设的聚类模型，得到目标对象集合之前，还可以获取多个样本图片对应的显著性对象和非显著性对象，及，各样本图片对应的目标对象集合，并根据多个样本图片对应的显著性对象和非显著性对象，及，各样本图片对应的目标对象集合，对初始的聚类模型进行训练，得到预设的聚类模型。其中，样本图片包括正样本图片和负样本图片，正样本图片中的显著性对象的特征向量与非显著性对象的特征向量之间的距离小于预设的距离阈值，负样本图片为随机剪裁得到的图片。

可选地，当显著性对象为多个对象时，将各显著性对象及各显著性对象对应的非显著性对象依次输入预设的聚类模型。

S203、根据目标对象集合从目标图片中截取多个候选图片，每个候选图片包括目标对象集合中的至少一个对象。

在得到了目标对象集合时，可以根据目标对象集合中包括的显著性对象和目标非显著性对象，从目标图片中截取包括显著性对象和目标非显著性对象的多个图片，作为多个候选图片，每个候选图片包括目标对象集合中的至少一个对象。

上述图片剪裁方法，终端在目标图片包括的多个对象中确定显著性对象及非显著性对象，将显著性对象及非显著性对象输入预设的聚类模型，得到目标对象集合，其中目标对象集合中包括显著性对象及目标非显著性对象，目标非显著性对象的特征向量与显著性对象的特征向量之间的距离小于预设距离阈值，进而根据目标对象集合从目标图片中截取多个候选图片，每个候选图片包括目标对象集合中的至少一个对象。也即是说，候选图片中非显著性对象的特征向量与显著性对象的特征向量之间的距离小于预设距离阈值，使得根据候选图片得到剪裁图片中的非显著性对象的特征向量与显著性对象的特征向量之间的距离小于预设距离阈值，进一步的避免了根据候选图片得到的剪裁图片的美感受人为因素影响大的问题。

在上述实施例的基础上，根据目标对象集合从目标图片中截取多个候选图片的具体过程可以如图5所示实施例。

图4为另一个实施例中图片剪裁方法的流程示意图。本实施例涉及的是如何根据目标对象集合从目标图片中截取多个候选图片的具体过程。如图4所示，上述S203“根据目标对象集合从目标图片中截取多个候选图片，每个候选图片包括目标对象集合中的至少一个对象”的一种可能的实现方法包括以下步骤：

S401、在目标图片中获取目标对象集合对应的对象轮廓；其中，对象轮廓为目标图片中目标对象集合中的对象对应的轮廓。

其中，对象轮廓可以是目标图片中的部分图片，对象轮廓中包括目标对象集合中的所有的对象。对象轮廓可以是由目标对象集合中的所有对象确定的轮廓。由于目标图片中对象的轮廓可以是不规则的轮廓，因此，包括目标对象集合中所有对象的对象轮廓可以是不规则的轮廓。

S402、根据对象轮廓从目标图片中截取多个候选图片。

在上述实施例的基础上，终端可以根据对象轮廓，从目标图片中截取部分图片，作为候选图片。可选地，将目标图片中对象轮廓的最大外接矩形对应的图片，作为候选图片；或，将目标图片中对象轮廓的最小内接矩形对应的的图片，作为候选图片；或，根据预设的纵横比，在目标图片中对象轮廓的最小内接矩形对应的的图片进行滑窗操作，得到候选图片。例如，对象轮廓为S，可以将目标图片中对象轮廓的最大外接矩形S1对应的图片,作为候选图片；也可以将目标图片中对象轮廓S的最小内接矩形S2对应的的图片，作为候选图片；还可以根据不同的纵横比在目标图片中对象轮廓S的最小内接矩形S2上做滑窗处理，得到候选图片。

上述图片剪裁方法，在目标图片中获取目标对象集合对应的对象轮廓；对象轮廓中包括目标对象集合中的所有的对象，根据对象轮廓从目标图片中截取多个候选图片，使得候选图片是根据对象轮廓，从目标图片中截取得到的，也即是说，候选图片的美感是有据可依的，从而使得根据有据可依的候选图片得到的剪裁图片的美感是有据可依的，进一步地避免了剪裁图片的美感受人为因素影像大的问题。

在上述实施例的基础上，当目标对象集合为多个时，可以根据多个目标对象集合确定多类候选图片，进而根据用户输入的选择指令和多类候选图片，得到剪裁图片，下面通过图5所示实施例来详细描述。

图5为另一个实施例中图片剪裁方法的流程示意图。本实施例涉及的是当目标对象集合为多个时，终端如何根据多个目标对象集合得到剪裁图片的具体过程。如图5所示，该方法包括以下步骤：

S501、根据各目标对象集合得到多个对象轮廓，各对象轮廓与各目标对象集合一一对应。

其中，当目标对象集合为多个时，可以根据各目标对象集合，分别得到多个对象轮廓，各对象轮廓和各目标对象集合之间存在一一对应的关系。各对象轮廓中包括对象轮廓对应的目标对象集合中的所有对象。例如，目标对象集合为3个时，分别是目标对象集合1、目标对象集合2和目标对象集合3，可以根据目标对象集合1、目标对象集合2和目标对象集合3得到对象轮廓1、对象轮廓2和对象轮廓3，对象轮廓1中包括目标对象集合1中的所有对象，对象轮廓2中包括目标对象集合2中的所有对象，对象轮廓3中包括目标对象集合3中的所有对象。也即是说，目标对象集合1对应的是对象轮廓1，目标对象集合2对应的是对象轮廓2，目标对象集合3对应的是对象轮廓3。

S502、根据多个对象轮廓和目标图片，得到多类候选图片，各类候选图片与各对象轮廓一一对应。

在上述实施例的基础上，得到了多个与多个目标对象集合一一对应的对象轮廓时，可以根据多个对象轮廓和目标图片，得到多类候选图片，各类候选图片与各对象轮廓一一对应。其中，每类候选图片中包括多个候选图片。继续以目标对象集合为3个为例，对应的，对象轮廓也为3个，分别为对象轮廓1、对象轮廓2和对象轮廓3，根据对象轮廓1、对象轮廓2和对象轮廓3和目标图片，可以得到3类候选图片，分别为第1类候选图片、第2类候选图片和第3类候选图片。其中，第1类候选图片与对象轮廓1之间一一对应，第2类候选图片与对象轮廓2之间一一对应，第3类候选图片与对象轮廓3之间一一对应。第1类候选图片中可以包括多个候选图片，第2类候选图片中可以包括多个候选图片，第3类候选图片中可以包括多个候选图片。

S503、根据多类候选图片及用户输入的选择指令，得到剪裁图片。

在得到了多类候选图片之后，可以将多类候选图片输入预设的美学模型，得到各类候选图片中各候选图片的美学分数，进而根据各候选图片的美学分数和用户输入的选择指令，得到剪裁图片。

上述图片剪裁方法，终端根据各目标对象集合得到多个对象轮廓，各对象轮廓与各目标对象集合一一对应，各对象轮廓中包括对象轮廓对应的目标对象集合中的所有对象，并根据多个对象轮廓和目标图片，得到多类候选图片，各类候选图片与各对象轮廓一一对应，进而根据多类候选图片及用户输入的选择指令，得到剪裁图片，使得当目标对象集合为多个时，可以根据用户的选择指令从多类候选图片中选中其中一类候选图片，得到剪裁图片。

应该理解的是，虽然图1-5的流程图中的各个步骤按照箭头的指示，依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1-5中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

图6为一个实施例中提供的图片剪裁装置的结构示意图，如图6所示，该图片剪裁装置包括：第一获取模块10、第二获取模块20和确定模块30，其中：

第一获取模块10用于从包括多个对象的目标图片中截取多个候选图片，其中，候选图片包括多个对象，且，候选图片包括的各对象的特征向量之间的距离小于预设距离阈值；

第二获取模块20用于将各候选图片输入预设的美学模型中，得到各候选图片的美学分数；预设的美学模型用于根据候选图片中的各对象的特征向量之间的距离，确定候选图片的美学分数；

确定模块30用于根据各候选图片和各候选图片的美学分数，从多个候选图片中确定目标候选图片，并将目标候选图片作为对目标图片进行剪裁后得到的剪裁图片。

本申请实施例提供的图片剪裁装置，可以执行上述方法实施例，其实现原理和技术效果类似，在此不再赘述。

图7为另一个实施例中提供的图片剪裁装置的结构示意图，在图6所示实施例的基础上，如图7所示，第一获取模块10包括：0，其中：

确定单元101用于在目标图片包括的多个对象中确定显著性对象及非显著性对象；

获取单元102用于将显著性对象及非显著性对象输入预设的聚类模型，得到目标对象集合；目标对象集合中包括显著性对象及目标非显著性对象；目标非显著性对象的特征向量与显著性对象的特征向量之间的距离小于预设距离阈值；

截取单元103用于根据目标对象集合从目标图片中截取多个候选图片，每个候选图片包括目标对象集合中的至少一个对象。

在一个实施例中，确定单元101具体用于将目标图片输入预设的分割模型中，得到显著性对象和非显著性对象。

在一个实施例中，确定单元101具体用于将目标图片按照预设的分割规则分割成多个分割图片；根据用户输入的选择指令，从多个分割图片中选中目标分割图片，将目标分割图片中的对象作为显著性对象；将多个分割图片中除目标分割图片之外的其他分割图片中的对象作为非显著性对象。

在一个实施例中，截取单元103具体用于在目标图片中获取目标对象集合对应的对象轮廓；对象轮廓为目标图片中目标对象集合中的对象对应的轮廓；根据对象轮廓从目标图片中截取多个候选图片。

在一个实施例中，截取单元103具体用于将目标图片中对象轮廓的最大外接矩形对应的图片，作为候选图片；或，将目标图片中对象轮廓的最小内接矩形对应的的图片，作为候选图片；或，根据预设的纵横比，在目标图片中对象轮廓的最小内接矩形对应的的图片进行滑窗操作，得到候选图片。

在一个实施例中，截取单元103还用于根据各目标对象集合得到多个对象轮廓，各对象轮廓与各目标对象集合一一对应；根据多个对象轮廓和目标图片，得到多类候选图片，各类候选图片与各对象轮廓一一对应；

确定模块30还用于根据多类候选图片及用户输入的选择指令，得到剪裁图片。

在一个实施例中，当显著性对象为多个对象时，将各显著性对象及各显著性对象对应的非显著性对象依次输入预设的聚类模型。

关于一种图片剪裁装置的具体限定可以参见上文中对图片剪裁方法的限定，在此不再赘述。上述图片剪裁装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端设备，其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图片剪裁方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图8中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种终端设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

在一个实施例中，处理器执行计算机程序时还实现以下步骤：在目标图片包括的多个对象中确定显著性对象及非显著性对象；将显著性对象及非显著性对象输入预设的聚类模型，得到目标对象集合；目标对象集合中包括显著性对象及目标非显著性对象；目标非显著性对象的特征向量与显著性对象的特征向量之间的距离小于预设距离阈值；根据目标对象集合从目标图片中截取多个候选图片，每个候选图片包括目标对象集合中的至少一个对象。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：将目标图片输入预设的分割模型中，得到显著性对象和非显著性对象。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：将目标图片按照预设的分割规则分割成多个分割图片；根据用户输入的选择指令，从多个分割图片中选中目标分割图片，将目标分割图片中的对象作为显著性对象；将多个分割图片中除目标分割图片之外的其他分割图片中的对象作为非显著性对象。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：在目标图片中获取目标对象集合对应的对象轮廓；对象轮廓为目标图片中目标对象集合中的对象对应的轮廓；根据对象轮廓从目标图片中截取多个候选图片。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：将目标图片中对象轮廓的最大外接矩形对应的图片，作为候选图片；或，将目标图片中对象轮廓的最小内接矩形对应的的图片，作为候选图片；或，根据预设的纵横比，在目标图片中对象轮廓的最小内接矩形对应的的图片进行滑窗操作，得到候选图片。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：根据各目标对象集合得到多个对象轮廓，各对象轮廓与各目标对象集合一一对应；根据多个对象轮廓和目标图片，得到多类候选图片，各类候选图片与各对象轮廓一一对应；根据多类候选图片及用户输入的选择指令，得到剪裁图片。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

在一个实施例中，计算机程序被处理器执行时实现以下步骤：在目标图片包括的多个对象中确定显著性对象及非显著性对象；将显著性对象及非显著性对象输入预设的聚类模型，得到目标对象集合；目标对象集合中包括显著性对象及目标非显著性对象；目标非显著性对象的特征向量与显著性对象的特征向量之间的距离小于预设距离阈值；根据目标对象集合从目标图片中截取多个候选图片，每个候选图片包括目标对象集合中的至少一个对象。

在一个实施例中，计算机程序被处理器执行时实现以下步骤：将目标图片输入预设的分割模型中，得到显著性对象和非显著性对象。

在一个实施例中，计算机程序被处理器执行时实现以下步骤：将目标图片按照预设的分割规则分割成多个分割图片；根据用户输入的选择指令，从多个分割图片中选中目标分割图片，将目标分割图片中的对象作为显著性对象；将多个分割图片中除目标分割图片之外的其他分割图片中的对象作为非显著性对象。

在一个实施例中，计算机程序被处理器执行时实现以下步骤：在目标图片中获取目标对象集合对应的对象轮廓；对象轮廓为目标图片中目标对象集合中的对象对应的轮廓；根据对象轮廓从目标图片中截取多个候选图片。

在一个实施例中，计算机程序被处理器执行时实现以下步骤：将目标图片中对象轮廓的最大外接矩形对应的图片，作为候选图片；或，将目标图片中对象轮廓的最小内接矩形对应的的图片，作为候选图片；或，根据预设的纵横比，在目标图片中对象轮廓的最小内接矩形对应的的图片进行滑窗操作，得到候选图片。

在一个实施例中，计算机程序被处理器执行时实现以下步骤：根据各目标对象集合得到多个对象轮廓，各对象轮廓与各目标对象集合一一对应；根据多个对象轮廓和目标图片，得到多类候选图片，各类候选图片与各对象轮廓一一对应；根据多类候选图片及用户输入的选择指令，得到剪裁图片。

本实施例提供的计算机可读存储介质，其实现原理和技术效果与上述方法实施例类似，在此不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种图片剪裁方法，其特征在于，所述方法包括：

从包括多个对象的目标图片中截取多个候选图片，其中，所述候选图片包括多个所述对象，且，所述候选图片包括的各所述对象的特征向量之间的距离小于预设距离阈值；

将各所述候选图片输入预设的美学模型中，得到各所述候选图片的美学分数；所述预设的美学模型用于根据所述候选图片中的各对象的特征向量之间的距离，确定所述候选图片的美学分数；

根据各所述候选图片和各所述候选图片的美学分数，从所述多个候选图片中确定目标候选图片，并将所述目标候选图片作为对所述目标图片进行剪裁后得到的剪裁图片。

2.根据权利要求1所述方法，其特征在于，所述从包括多个对象的目标图片中截取多个候选图片，包括：

在所述目标图片包括的多个对象中确定显著性对象及非显著性对象；

将所述显著性对象及所述非显著性对象输入预设的聚类模型，得到目标对象集合；所述目标对象集合中包括所述显著性对象及目标非显著性对象；所述目标非显著性对象的特征向量与所述显著性对象的特征向量之间的距离小于所述预设距离阈值；

根据所述目标对象集合从所述目标图片中截取多个所述候选图片，每个所述候选图片包括所述目标对象集合中的至少一个对象。

3.根据权利要求2所述方法，其特征在于，所述在所述目标图片包括的多个对象中确定显著性对象及非显著性对象，包括：

将所述目标图片输入预设的分割模型中，得到所述显著性对象和所述非显著性对象。

4.根据权利要求2所述方法，其特征在于，所述在所述目标图片包括的多个对象中确定显著性对象及非显著性对象，包括：

将所述目标图片按照预设的分割规则分割成多个分割图片；

根据用户输入的选择指令，从所述多个分割图片中选中目标分割图片，将所述目标分割图片中的对象作为所述显著性对象；

将所述多个分割图片中除所述目标分割图片之外的其他分割图片中的对象作为所述非显著性对象。

5.根据权利要求2-4任一项所述方法，其特征在于，所述根据所述目标对象集合从所述目标图片中截取多个所述候选图片，包括：

在所述目标图片中获取所述目标对象集合对应的对象轮廓；所述对象轮廓为所述目标图片中所述目标对象集合中的对象对应的轮廓；

根据所述对象轮廓从所述目标图片中截取多个所述候选图片。

6.根据权利要求5所述方法，其特征在于，所述根据所述对象轮廓从所述目标图片中截取多个所述候选图片，包括：

将所述目标图片中所述对象轮廓的最大外接矩形对应的图片，作为所述候选图片；

或，

将所述目标图片中所述对象轮廓的最小内接矩形对应的的图片，作为所述候选图片；

或，

根据预设的纵横比，在所述目标图片中所述对象轮廓的最小内接矩形对应的的图片进行滑窗操作，得到所述候选图片。

7.根据权利要求5所述方法，其特征在于，当所述目标对象集合为多个时，所述方法还包括；

根据各所述目标对象集合得到多个对象轮廓，各所述对象轮廓与各所述目标对象集合一一对应；

根据多个所述对象轮廓和所述目标图片，得到多类所述候选图片，各类所述候选图片与各所述对象轮廓一一对应；

对应地，根据各所述候选图片和各所述候选图片的美学分数，得到剪裁图片，包括：

根据所述多类候选图片及用户输入的选择指令，得到所述剪裁图片。

8.根据权利要求2-4任一项所述方法，其特征在于，当所述显著性对象为多个对象时，将各显著性对象及各显著性对象对应的非显著性对象依次输入所述预设的聚类模型。

9.一种图片剪裁装置，其特征在于，所述装置包括：

第一获取模块，用于从包括多个对象的目标图片中截取多个候选图片，其中，所述候选图片包括多个所述对象，且，所述候选图片包括的各所述对象的特征向量之间的距离小于预设距离阈值；

第二获取模块，用于将各所述候选图片输入预设的美学模型中，得到各所述候选图片的美学分数；所述预设的美学模型用于根据所述候选图片中的各对象的特征向量之间的距离，确定所述候选图片的美学分数；

确定模块，用于根据各所述候选图片和各所述候选图片的美学分数，从所述多个候选图片中确定目标候选图片，并将所述目标候选图片作为对所述目标图片进行剪裁后得到的剪裁图片。

10.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1-8中任一项所述方法的步骤。

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-8中任一项所述的方法的步骤。