CN110399847A

CN110399847A - 关键帧提取方法、装置及电子设备

Info

Publication number: CN110399847A
Application number: CN201910692649.7A
Authority: CN
Inventors: 高永强
Original assignee: Beijing ByteDance Network Technology Co Ltd
Current assignee: Douyin Vision Co Ltd; Douyin Vision Beijing Co Ltd
Priority date: 2019-07-30
Filing date: 2019-07-30
Publication date: 2019-11-01
Anticipated expiration: 2039-07-30
Also published as: CN110399847B

Abstract

本公开实施例中提供了一种关键帧提取方法、装置及电子设备，属于图像处理技术领域，该方法包括：构建关键帧主题分类体系，所述关键帧主题分类体系包含至少一个关键帧主题；基于所述关键帧主题分类体系获得图像显著性区域，所述图像显著性区域为包含所述关键帧主题分类体系中的至少一个关键帧主题的区域；计算所述图像显著性区域的比例，所述图像显著性区域的比例包括图像显著性区域与图像非显著性区域的比例以及图像显著性区域与图像整体区域的比例；以及根据所述图像显著性区域的比例确定关键帧。通过本公开的处理方案，能够自动提取视频场景中的关键帧以便于进一步的使用。

Description

关键帧提取方法、装置及电子设备

技术领域

本公开涉及图像处理技术领域，尤其涉及一种关键帧提取方法、装置及电子设备。

背景技术

随着网络技术的发展，海量的图像、视频资源被上传到网络上并流动传播。传统通过人员视检的方式来对图像、视频的内容进行鉴别、分类，工作量大、耗费时间长，特别对于长视频如何实现自动内容识别挑战巨大。

当前，通过场景理解来实现对图像、视频内容的识别，该技术已经受到越来越多的关注。场景理解是用模式识别和人工智能的方法对场景图像进行分析、描述、分类和解释，最终得到场景图像逐像素语义标注的技术，其在机器人导航、虚拟现实、安防监控以及网络搜索领域有着广泛的应用。

为了实现对场景内容的理解，一种方式是根据所选择的关键帧，基于对关键帧的理解进行场景理解。基于对关键帧的理解能够进行相应的滤镜推荐。与直接场景理解相比，通过关键帧的选择，有助于防止结果跳动现象。然而，如何自动提取图像、视频中的关键帧成为关键问题。

发明内容

有鉴于此，本公开实施例提供一种关键帧提取方法、装置及电子设备，至少部分解决现有技术中存在的问题。

第一方面，本公开实施例提供了一种关键帧提取方法，包括：

构建关键帧主题分类体系，所述关键帧主题分类体系包含至少一个关键帧主题；

基于所述关键帧主题分类体系获得图像显著性区域，所述图像显著性区域为包含所述关键帧主题分类体系中的至少一个关键帧主题的区域；

计算所述图像显著性区域的比例，所述图像显著性区域的比例包括图像显著性区域与图像非显著性区域的比例以及图像显著性区域与图像整体区域的比例；以及

根据所述图像显著性区域的比例确定关键帧。

根据本公开实施例的一种具体实现方式，所述基于所述关键帧主题分类体系获得图像显著性区域，包括：

对图像进行分类以确定所述图像是否包含所述关键帧主题分类体系中的至少一个关键帧主题；

将包含所述关键帧主题分类体系中的至少一个关键帧主题的图像确定为候选关键帧；以及

检测所述候选关键帧的图像显著性区域。

根据本公开实施例的一种具体实现方式，所述对图像进行分类以确定所述图像是否包含所述关键帧主题分类体系中的至少一个关键帧主题，包括：

针对所述关键帧主题分类体系中的每个关键帧主题构建网络模型；

训练所述网络模型；以及

将图像输入到所述网络模型中以确定所述图像是否包含所述关键帧主题分类体系中的至少一个关键帧主题。

针对所述关键帧主题分类体系中的所有关键帧主题构建网络模型；

训练所述网络模型；以及

采用图像分割网络来获得图像显著性区域，其中所述图像分割网络包括：

编码器网络，所述编码器网络为预训练的分类网络，并且用于获得输入图像的特征；

解码器网络，所述解码器网络用于将所述编码器网络获得的特征映射到像素空间以获得密集分类。

根据本公开实施例的一种具体实现方式，所述图像分割网络为全卷积网络，并且采用全卷积网络来获得图像显著性区域包括：

将所述编码器网络的全连接层替换为全卷积层；

执行上采样以获得与原图像尺寸相同的分割图；以及

从所述分割图获得图像显著性区域。

根据本公开实施例的一种具体实现方式，所述执行上采样以获得与原图像尺寸相同的分割图，包括：

对所述编码器网络的不同池化层的特征图执行上采样，并且结合这些结果以获得与原图像尺寸相同的分割图。

根据本公开实施例的一种具体实现方式，所述编码器网络的全连接层被转换为全卷积层，并利用双线性初始化的反卷积来执行上采样，且通过融合各池化层的特征图来获得与原图像尺寸相同的分割图。

根据本公开实施例的一种具体实现方式，所述解码器网络采用以下机制中的至少一个以恢复在所述编码器网络中丢失的图像信息：空洞卷积、SegNet、U-Net、全卷积DenseNet、E-Net和Link-Net、Mask R-CNN、PSPNet。

根据本公开实施例的一种具体实现方式，所述计算所述图像显著性区域的比例，包括：

将所述图像显著性区域的像素数量与图像的所有像素的数量或图像非显著性区域的像素数量的比例作为所述图像显著性区域的比例，或者

将所述图像显著性区域的面积与图像总面积或图像非显著性区域的面积的比例作为所述图像显著性区域的比例。

根据本公开实施例的一种具体实现方式，所述根据所述比例确定关键帧，包括：

将所述比例大于预定阈值的图像确定为关键帧，其中所述预定阈值依所述关键帧主题相同；或者

将所述比例大于预定阈值的图像确定为关键帧，其中所述预定阈值依所述关键帧主题而不同。

第二方面，本公开实施例提供了一种关键帧提取装置，包括：

关键帧主题分类体系构建模块，用于关键帧主题分类体系，其中所述关键帧主题分类体系包含至少一个关键帧主题；

显著性区域获得模块，所述显著性区域获得模块用于基于所述关键帧主题分类体系获得图像显著性区域，其中所述图像显著性区域为包含所述关键帧主题分类体系中的至少一个关键帧主题的区域；

比例计算模块，所述比例计算模块用于计算所述图像显著性区域的比例，其中所述图像显著性区域的比例包括图像显著性区域与图像非显著性区域的比例以及图像显著性区域与图像整体区域的比例；以及

关键帧确定模块，所述关键帧确定模块用于根据所述比例确定关键帧。

第三方面，本公开实施例还提供了一种电子设备，该电子设备包括：

至少一个处理器；以及

与该至少一个处理器通信连接的存储器；其中，

该存储器存储有可被该至少一个处理器执行的指令，该指令被该至少一个处理器执行，以使该至少一个处理器能够执行前述第一方面或第一方面的任一实现方式中的关键帧提取方法。

第四方面，本公开实施例还提供了一种非暂态计算机可读存储介质，该非暂态计算机可读存储介质存储计算机指令，该计算机指令用于使该计算机执行前述第一方面或第一方面的任一实现方式中的关键帧提取方法。

第五方面，本公开实施例还提供了一种计算机程序产品，该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序，该计算机程序包括程序指令，当该程序指令被计算机执行时，使该计算机执行前述第一方面或第一方面的任一实现方式中的关键帧提取方法。

本公开实施例中的图像质量评估方案，包括构建关键帧主题分类体系，其中所述关键帧主题分类体系包含至少一个关键帧主题；基于所述关键帧主题分类体系获得图像显著性区域，其中所述图像显著性区域为包含所述关键帧主题分类体系中的至少一个关键帧主题的区域；计算所述图像显著性区域的比例，其中所述图像显著性区域的比例包括图像显著性区域与图像非显著性区域的比例以及图像显著性区域与图像整体区域的比例；以及根据所述图像显著性区域的比例确定关键帧。通过本公开的方案，能够自动提取视频场景中的关键帧以便于进一步的使用。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本公开实施例提供的一种关键帧提取方法流程示意图；

图2为本公开实施例提供的基于关键帧主题分类体系获得图像显著性区域的流程示意图；

图3为本公开实施例提供的图像分割网络的结构示意图；

图4为本公开实施例提供的采用全卷积网络来获得图像显著性区域的流程示意图；

图5为本公开实施例提供的一种关键帧提取装置结构示意图；

图6为本公开实施例提供的电子设备示意图。

具体实施方式

下面结合附图对本公开实施例进行详细描述。

以下通过特定的具体实例说明本公开的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本公开的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

需要说明的是，下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见，本文中所描述的方面可体现于广泛多种形式中，且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开，所属领域的技术人员应了解，本文中所描述的一个方面可与任何其它方面独立地实施，且可以各种方式组合这些方面中的两者或两者以上。举例来说，可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外，可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。

还需要说明的是，以下实施例中所提供的图示仅以示意方式说明本公开的基本构想，图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。

另外，在以下描述中，提供具体细节是为了便于透彻理解实例。然而，所属领域的技术人员将理解，可在没有这些特定细节的情况下实践所述方面。

本公开实施例提供一种关键帧提取方法。本实施例提供的关键帧提取方法可以由一计算装置来执行，该计算装置可以实现为软件，或者实现为软件和硬件的组合，该计算装置可以集成设置在服务器、终端设备等中。

参见图1，本公开实施例提供的一种关键帧提取方法，包括：

S100：构建关键帧主题分类体系。

一般而言，对于所拍摄的照片或者视频，其会具有明显的拍摄主题，例如人像、物体等等。对于诸如照片之类的图像，其拍摄主题可以是该照片中所包含的内容场景，而对于视频而言，其拍摄主题可以是指构成该视频的视频帧中所包含的内容场景。

在本公开实施例中，将图像或者视频帧中包含特定拍摄主题的图像或者视频帧定义为关键帧，并且期望这些关键帧是清晰、完整的。在以下的描述中，以从视频的视频帧中提取出关键帧来描述本发明。但是应当理解，本发明也可以应用于从多张图像中提取出包含特定拍摄主题的图像，在这种情况下，包含特定主题的图像可以被称为关键帧。

为了提取出关键帧，首先需要构建关键帧主题分类体系。如上所述，在本公开实施例中，包含特定拍摄主题的图像或者视频帧被确定为关键帧，因此，术语“关键帧主题分类体系”是指所有这些拍摄主题的集合。也就是说，只有包含这些拍摄主题中的至少一个的视频帧才有可能被定义为关键帧。在本示例性实施例中，拍摄主题也可以被称为关键帧主题，其具有与拍摄主题相同的含义。

关键帧主题分类体系可以人为设定。例如，关键帧主题分类体系可以包含人、猫、飞机等拍摄主题。应当注意，可以人为设定任意数量的拍摄主题作为所述关键帧主题分类体系，并且将包含这些拍摄主题的图像或者视频帧作为候选关键帧。另外，可以根据预定标准或准则来确定关键帧主题分类体系的拍摄主题的集合，并且将包含这些拍摄主题的图像或者视频帧确定为候选关键帧。

可替代地，可以采用现有的主题分类体系作为关键帧主题分类体系。例如，可以采用基于Imagenet的1000类物体分类作为拍摄主题的类别，即关键帧主题分类体系。在这种情况下，将包含有这1000类物体中一个或者多个的图像或者视频帧确定为候选关键帧。

如上所述，在本公开实施例中，所构建的关键帧主题分类体系包含有至少一个拍摄主题(关键帧主题)。

S200：基于所述关键帧主题分类获得图像显著性区域。

在通过步骤S100确定了关键帧所应包含的拍摄主题之后，基于所构建的关键帧主题分类体系来获得图像显著性区域。

在本示例性实施例中，对于图像而言，图像显著性区域可以是指该图像中包含特定拍摄主题的区域。对于视频而言，图像显著性区域可以是指该视频的每个视频帧中包含特定拍摄主题的区域。另外，拍摄主题可以是指在步骤S100中构建的关键帧主题分类体系中所包含的拍摄主题。也就是说，在本公开实施例中，图像显著性区域包含所构建的关键帧主题分类体系中的至少一个拍摄主题。

在本公开实施例中，例如可以通过图像分割算法来获得图像显著性区域。图像分割是指确定图像中感兴趣区域(ROI)的边界，使得边界内部和外部的像素分别具备相似的特征(强度、纹理等)。典型的图像分割算法包括基于阀值的图像分割方法、基于区域的图像分割方法、基于边缘检测的图像分割方法、基于小波分析和小波变换的图像分割方法等等。这些图像分割算法的示例例如可参见https://www.cnblogs.com/ariel-dreamland/p/ 9428434.html，其全部内容通过引用结合于此。

应当理解，图像分割算法不限于上述图像分割算法，任何现有的和未来可能开发的图像分割算法都是可能的，只要其能够识别出图像或者视频帧中的图像显著性区域。

在本公开实施例中，采用多尺度的全卷积网络(FCN)为作为显著性区域分割网络。稍后描述本公开实施例的用于检测图像或者视频帧中的图像显著性区域的全卷积网络。

S300：计算所述图像显著性区域的比例。

在通过步骤S200获得了图像的显著性区域之后，在本公开实施例中确定所检测到的图像显著性区域与原始图像的比例。

可替代地，可以计算图像显著性区域与图像非显著性区域的比例。

具体地，可以将显著性区域的像素数量与图像的所有像素数量或非显著性区域像素数量的比例作为图像显著性区域与图像的比例。可替代地，可通将显著性区域的面积与图像总面积或非显著性区域的面积的比作为所述比例。

S400：根据所述比例确定关键帧。

在通过步骤S300获取了图像显著性区域与原始图像的比例之后，根据所获得的比例来确定该图像是否是关键帧。

具体地，可以将所述比例大于预定阈值的图像确定为关键帧。该预定阈值可以对于所有的拍摄主题相同。可替代地，该预定阈值可以因拍摄主题而不同。也就是说，为不同的拍摄主题设置不同的阈值。

如此，通过步骤S100至步骤S400的技术方案，能够自动地提取图像或者视频帧中的关键帧。

参见图2，根据本公开实施例的一种具体实现方式，所述基于所述关键帧主题分类体系获得图像显著性区域，包括：

S201：对图像进行分类以确定所述图像是否包含所述关键帧主题分类体系中的至少一个关键帧主题。

S202：将包含所述关键帧主题分类体系中的至少一个关键帧主题的图像确定为候选关键帧。

S203：检测所述候选关键帧的图像显著性区域。

在本公开实施例中，可以直接检测所有的图像的图像显著性区域。可替代地，可以先确定候选关键帧，然后再确定这些候选关键帧的图像显著性区域。

对于一段视频而言，其包含有数量庞大的视频帧，如果对于这些视频帧中的每一帧都采用如上所述的图像分割算法来提取图像显著性区域，计算量大且效率低。在本公开实施例中，视频帧中包含所构建的关键帧主题的视频帧才有可能成为关键帧。

因此，在本公开实施例中，首先对所有的图像进行分类。对图像分类例如可以采用多层感知器，其包括输入层、隐层与输出层，除了输入层之外，每层的激活函数例如可以采用sigmod。此外，在本公开实施例中，可以采用两层隐含层(全卷积)，层数分别为2048和1024。多层感知器的具体细节例如可以参见https://www.cnblogs.com/ooon/p/ 5577241.html，其全部内容通过引用结合于此。

应当理解，对图像进行分类分模型不限于此，例如还可以采用诸如Mobilenet网络之类的其他网络来对所有的图像进行分类，以确定该图像是否包含所构建的关键帧主题分类体系中的至少一个关键帧主题。

当通过诸如多层感知器、Mobilenet网络之类的模型对图像进行分类之后，将包含所构建的关键帧主题分类体系中的至少一个关键帧主题的图像确定为候选关键帧，并且然后再通过如上所述的图像分割算法来提取这些候选关键帧的图像显著性区域。

通过这种方式，能够大量减少图像分割算法的计算量。因为通过步骤S201和步骤S202，能够去除视频帧中大量不可能成为关键帧的视频帧。

根据本公开实施例的一种具体实现方式，在如上所述的步骤S201中，对图像进行分类可以针对所构建的关键帧主题分类体系中的每个关键帧主题设置网络模型，对所设置的网络模型进行训练直至收敛，如此能够确定输入图像是否包含所述关键帧主题分类体系中的至少一个关键帧主题，并且还能够具体确定该输入图像所包含的关键帧主题。

在这种情况下，所构建的网络模型的训练数据的正样本可以是单个关键帧主题(例如，人)的图像，并且反样本是包含该关键帧主题的图像之外的其他图像。

通过采用单独的网络具体判断输入图像的主题对于后续需要利用图像主题的应用特别有用，其不需要再采用单独的网络进行图像主题的确定。也就是说，该网络不仅排除了非候选关键帧，而且还确定了候选关键帧的主题，从而有利于后续应用。

根据本公开实施例的一种具体实现方式，在如上所述的步骤S201中，对图像进行分类可以针对所构建的关键帧主题分类体系中的所有关键帧主题设置网络模型，对所设置的网络模型进行训练直至收敛，并且将图像输入到所述网络以确定该图像是否包含关键帧主题分类体系中的主题。

在这种情况下，所构建的网络用于对输入图像进行二分，其结果可以为[0,1]，其中0可以表示输入图像不包含关键帧主题分类体系中的主题，而1表示输入图像包含关键帧主题分类体系中的主题。对于这种二分网络，其训练数据的正样本可以是与关键帧主题分类体系中的主题对应的图像，而负样本可以是其他图像。

通过对输入图像进行二分而不具体确定其主题，能够减少模型训练和计算量，对于之后无需利用输入图像主题的应用特别有利。

根据本公开实施例的一种具体实现方式，采用图像分割网络来获得图像显著性区域，并且所述图像分割网络包括编码器，所述编码器为预训练的分类网络。所述图像分割网络还包括解码器，所述解码器用于将所述解码器获得的可判别特征映射到像素空间以获得密集分类。

应当理解，这里的“获得图像显著性区域”可以是获得原始图像的显著性区域，并且也可以是获得候选关键帧的显著性区域。也就是说，原始图像可以直接通过图像分割方法来检测显著性区域，也可以首先确定原始图像中的候选关键帧，并检测这些候选关键帧的显著性区域。

另外，图3示出了根据本公开实施例的图像分割网络的结构示意图。如图3所示，根据本公开实施例的图像分割网络包括编码器和解码器。

编码器例如可以是预训练的分类网络，例如VGG、ResNet，其用于获得输入图像的可判别的特征。

此外，解码器的任务是将编码器学习到的可判别特征(较低分辨率)从语义上映射到像素空间(较高分辨率)，以获得密集分类。

根据本公开实施例的一种具体实现方式，采用全卷积网络来获得图像显著性区域。

如上所述，可以采用诸如基于阀值的图像分割方法、基于区域的图像分割方法、基于边缘检测的图像分割方法、基于小波分析和小波变换的图像分割方法之类的方法来获得图像显著性区域。在本是理性实施例中，采用全卷积网络来获得图像显著性区域。

图4示出了采用全卷积网络来获得图像显著性区域的方法，其包括：

S401：将图像分割网络的编码器网络的全连接层替换为全卷积层。

S402：执行上采样以获得与原图像尺寸相同的分割图。

S403：从所述分割图获得图像显著性区域。

一般的分类所使用的网络通常会在最后连接全连接层，在全卷积网络中，可以将编码器网络(诸如AlexNet,VGG网络、GoogLeNet网络)的全连接层修改为全卷积网络，通过对分割任务进行微调，能够将编码器网络学习的表征转移到网络中。

此外，在一般的CNN结构中，如AlexNet，VGGNet均是使用池化层来缩小输出图片的尺寸，而获得图像显著性区域需要得到一个与原图像尺寸相同的分割图，因此卷积网络对最后一层进行上采样。

在通过上采样操作获得与原图像尺寸相同的分割图之后，可以从该分割图获得图像显著性区域。

另外，直接将全卷积后的结果上采样后得到的结果通常较为粗糙。根据本公开实施例的全卷积网络包括跳跃结构，以对最终结果进行优化，具体地，跳跃结构将不同池化层的结果进行上采样，然后结合这些结果来优化输出。换句话说，可以对不同池化层的结果进行上采样，并且结合这些结果以获得所述图像显著性区域。

全卷积网络的具体描述可例如参见https://blog.csdn.net/u012426298/ article/details/81018981，其全部内容通过引用结合于此。

通过采用全卷积网络检测了图像显著性区域之后，即可通过该显著性区域的特征来进一步确定关键帧。

根据本公开实施例的一种具体实现方式，图像分割网络中的编码器网络例如为VGG16分类网络，其全连接层(fc6，fc7)被转换为全卷积层，并且然后用双线性初始化的反卷积，如此能够生成低分辨率的类的热图。

在传统的分类中，池化操作用来增加视野，同时减少特征图的分辨率。这对于分类任务来说非常有用，因为分类的最终目标是找到某个特定类的存在，而对象的空间位置无关紧要。因此，在每个卷积块之后引入池化操作，以使后续块能够从已池化的特征中提取更多抽象、突出类的特征。

在如上所述的上采样的每一个阶段，通过融合(简单地相加)VGG16中的低层(conv4和conv3)的更加粗糙但是分辨率更高的特征图以进一步细化特征。如此，能够对结果进行进一步的优化。

虽然以上以VGG16分类网络描述了本公开实施例的编码器网络，但是编码器网络还可以是诸如AlexNet、VGGNet之类的其他网络。

根据本公开实施例的一种具体实现方式，由于在编码器网络中，在低分辨率时会丢失信息，因此可以通过编码器网络来恢复在编码器中降低分辨率时丢失的信息。

具体地，编码器网络例如可以采用如下机制中的一种：空洞卷积、SegNet、U-Net、全卷积DenseNet、E-Net和Link-Net、Mask R-CNN、PSPNet等等。这些机制的详细描述可参见http://www.elecfans.com/d/688859.html，其全部内容通过引用结合于此。

与上面的方法实施例相对应，参见图5，本公开实施例还提供了一种关键帧提取装置500，包括：

关键帧主题分类体系构建模块501，用于关键帧主题分类体系，其中所述关键帧主题分类体系包含至少一个关键帧主题；

显著性区域获得模块502，所述显著性区域获得模块用于基于所述关键帧主题分类体系获得图像显著性区域，其中所述图像显著性区域为包含所述关键帧主题分类体系中的至少一个关键帧主题的区域；

比例计算模块503，所述比例计算模块用于计算所述图像显著性区域的比例，其中所述图像显著性区域的比例包括图像显著性区域与图像非显著性区域的比例以及图像显著性区域与图像整体区域的比例；以及

关键帧确定模块504，所述关键帧确定模块用于根据所述比例确定关键帧。

图5所示装置可以对应的执行上述方法实施例中的内容，本实施例未详细描述的部分，参照上述方法实施例中记载的内容，在此不再赘述。

参见图6，本公开实施例还提供了一种电子设备60，该电子设备包括：

至少一个处理器；以及，

与该至少一个处理器通信连接的存储器；其中，

该存储器存储有可被该至少一个处理器执行的指令，该指令被该至少一个处理器执行，以使该至少一个处理器能够执行前述方法实施例中的关键帧提取方法。

本公开实施例还提供了一种非暂态计算机可读存储介质，该非暂态计算机可读存储介质存储计算机指令，该计算机指令用于使该计算机执行前述方法实施例中的关键帧提取方法。

本公开实施例还提供了一种计算机程序产品，该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序，该计算机程序包括程序指令，当该程序指令被计算机执行时，使该计算机执行前述方法实施例中的关键帧提取方法。

下面参考图6，其示出了适于用来实现本公开实施例的电子设备60的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图6示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图6所示，电子设备60可以包括处理装置(例如中央处理器、图形处理器等)601，其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有电子设备60操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

通常，以下装置可以连接至I/O接口605：包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置606；包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607；包括例如磁带、硬盘等的存储装置608；以及通信装置609。通信装置609可以允许电子设备60与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种装置的电子设备60，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置609从网络上被下载和安装，或者从存储装置608被安装，或者从ROM 602被安装。在该计算机程序被处理装置601执行时，执行本公开实施例的方法中限定的上述功能。

需要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF(射频)等等，或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：获取至少两个网际协议地址；向节点评价设备发送包括所述至少两个网际协议地址的节点评价请求，其中，所述节点评价设备从所述至少两个网际协议地址中，选取网际协议地址并返回；接收所述节点评价设备返回的网际协议地址；其中，所获取的网际协议地址指示内容分发网络中的边缘节点。

或者，上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：接收包括至少两个网际协议地址的节点评价请求；从所述至少两个网际协议地址中，选取网际协议地址；返回选取出的网际协议地址；其中，接收到的网际协议地址指示内容分发网络中的边缘节点。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，单元的名称在某种情况下并不构成对该单元本身的限定，例如，第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。

应当理解，本公开的各部分可以用硬件、软件、固件或它们的组合来实现。

以上所述，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以权利要求的保护范围为准。

Claims

1.一种关键帧提取方法，其特征在于，包括：

根据所述图像显著性区域的比例确定关键帧。

2.根据权利要求1所述的关键帧提取方法，其特征在于，所述基于所述关键帧主题分类体系获得图像显著性区域，包括：

检测所述候选关键帧的图像显著性区域。

3.根据权利要求2所述的关键帧提取方法，其特征在于，所述对图像进行分类以确定所述图像是否包含所述关键帧主题分类体系中的至少一个关键帧主题，包括：

训练所述网络模型；以及

4.根据权利要求2所述的关键帧提取方法，其特征在于，所述对图像进行分类以确定所述图像是否包含所述关键帧主题分类体系中的至少一个关键帧主题，包括：

训练所述网络模型；以及

5.根据权利要求1所述的关键帧提取方法，其特征在于，所述基于所述关键帧主题分类体系获得图像显著性区域，包括：

6.根据权利要求5所述的关键帧提取方法，其特征在于，所述图像分割网络为全卷积网络，并且采用全卷积网络来获得图像显著性区域包括：

将所述编码器网络的全连接层替换为全卷积层；

执行上采样以获得与原图像尺寸相同的分割图；以及

从所述分割图获得图像显著性区域。

7.根据权利要求6所述的关键帧提取方法，其特征在于，所述执行上采样以获得与原图像尺寸相同的分割图，包括：

8.根据权利要求5所述的关键帧提取方法，其特征在于，所述编码器网络的全连接层被转换为全卷积层，并利用双线性初始化的反卷积来执行上采样，且通过融合各池化层的特征图来获得与原图像尺寸相同的分割图。

9.根据权利要求5所述的关键帧提取方法，其特征在于，所述解码器网络采用以下机制中的至少一个以恢复在所述编码器网络中丢失的图像信息：空洞卷积、SegNet、U-Net、全卷积DenseNet、E-Net和Link-Net、Mask R-CNN、PSPNet。

10.根据权利要求1所述的关键帧提取方法，其特征在于，所述计算所述图像显著性区域的比例，包括：

11.根据权利要求1所述的关键帧提取方法，其特征在于，所述根据所述比例确定关键帧，包括：

12.一种关键帧提取装置，其特征在于，包括：

关键帧主题分类体系构建模块，用于关键帧主题分类体系，所述关键帧主题分类体系包含至少一个关键帧主题；

显著性区域获得模块，所述显著性区域获得模块用于基于所述关键帧主题分类体系获得图像显著性区域，所述图像显著性区域为包含所述关键帧主题分类体系中的至少一个关键帧主题的区域；

比例计算模块，所述比例计算模块用于计算所述图像显著性区域的比例，所述图像显著性区域的比例包括图像显著性区域与图像非显著性区域的比例以及图像显著性区域与图像整体区域的比例；以及

13.一种电子设备，其特征在于，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行前述利要求1-11中任一项所述的关键帧提取方法。

14.一种非暂态计算机可读存储介质，该非暂态计算机可读存储介质存储计算机指令，该计算机指令用于使该计算机执行前述利要求1-11中任一项所述的关键帧提取方法。