CN109905782A

CN109905782A - 一种控制方法及装置

Info

Publication number: CN109905782A
Application number: CN201910254410.1A
Authority: CN
Inventors: 李杨; 柯海滨
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2019-03-31
Filing date: 2019-03-31
Publication date: 2019-06-18
Anticipated expiration: 2039-03-31
Also published as: US20200314482A1; CN109905782B; US11317139B2

Abstract

本申请提供了一种控制方法及装置，该方法及装置通过在视频封面中提供多个与视频包括的不同场景相对应的缩略图，可使得在获得携带视频封面中某一缩略图标识信息的播放指令时，基于播放指令中携带的缩略图标识信息，对视频中的相对应场景进行定位，进而可跳转至所定位的场景对视频进行播放。由此可见，本申请通过在视频封面中提供多个与视频不同场景相对应的缩略图，有效拓展了视频的封面信息，相比于现有技术，视频封面的内容更为丰富、全面，用户可通过视频封面对视频文件进行更多的了解，且可支持用户以视频封面中的缩略图为索引对视频中的相对应场景进行索引定位，便于用户快速定位到视频中感兴趣的位置，视频的播放也无疑更为灵活、便捷。

Description

一种控制方法及装置

技术领域

本申请属于视频应用技术领域，尤其涉及一种控制方法及装置。

背景技术

随着互联网络及移动网络的发展与普及，用户对计算机或手机等终端设备上的视频文件(由终端上安装的应用所提供的视频或存储于终端本地的视频等)的使用越来越多，相对应地，对使用视频文件时的需求也越来越高。

现有的视频文件因其封面(如图1所示，仅包括预先设计的缩略图标或单一图像)无法向用户提供更多有效的文件内容信息，且不利于用户快速定位到视频中感兴趣的位置，从而不能较好地满足用户需求。

发明内容

有鉴于此，本申请的目的在于提供一种控制方法及装置，以克服现有技术存在的上述问题，更好地满足用户使用视频文件时的需求。

为此，本发明公开如下技术方案：

一种控制方法，包括：

获得对第一视频的播放指令；所述播放指令包括所述第一视频的封面中第一缩略图的第一标识信息，所述第一视频的封面包括多个缩略图，每个缩略图与所述第一视频所包括的多个场景中的其中之一相对应；

确定与所述第一缩略图相对应的第一场景；

从所述第一场景对应的位置对所述第一视频进行播放。

上述方法，优选的，所述获得对第一视频的播放指令，包括：

获得通过操作所述第一视频的封面中的第一缩略图所触发的播放指令。

上述方法，优选的，所述从所述第一场景对应的位置对所述第一视频进行播放，包括：

从所述第一场景的起始位置对所述第一视频进行播放；

或者，

从所述第一场景中对应于所述第一缩略图的位置对所述第一视频进行播放；第一视频的封面包括的各个缩略图为：第一视频的各个场景中关键帧图像的至少部分的缩略图。

从所述第一场景对应的位置开始播放所述第一视频中的各个目标场景；所述目标场景包括所述第一场景以及所述第一视频中与所述第一场景符合预定关联条件的各个第二场景。

上述方法，优选的，在所述获得对第一视频的播放指令之前，还包括：

确定所述第一视频包括的多个场景；

提取每个场景的至少一个关键帧图像；

基于所述多个场景中每个场景的至少一个关键帧图像，生成所述第一视频的封面；所述第一视频的封面包括所述多个场景中各个场景的缩略图，每个场景的缩略图包括：该场景的至少一个关键帧图像的至少部分的缩略图；

建立并存储不同缩略图与不同场景之间的对应关系信息。

上述方法，优选的，所述生成所述第一视频的封面，包括：

将每个场景的至少一个关键帧图像进行缩略处理，并拼接所述至少一个关键帧图像在缩略处理后所得的缩略图，得到该场景的缩略图；

拼接各场景的缩略图，得到所述第一视频的封面；

或者，

从每个场景的至少一个关键帧图像中提取该场景的关键前景主体，并对所述关键前景主体进行缩略处理，得到该场景的缩略图；

将各个场景的缩略图中的关键前景主体叠加于预置的背景图片上，得到所述第一视频的封面。

上述方法，优选的，所述第一视频的封面中包括的每个场景的缩略图大小与该场景在所述第一视频中对应的时长相匹配。

上述方法，优选的，还包括：

在暂停对所述第一视频的播放时，显示所述第一视频的封面，或者显示基于所述第一视频的封面与暂停时刻对应的图像所生成的新的封面。

一种控制装置，包括：

存储器，用于至少存储一组指令集；

处理器，用于调用并执行所述存储器中的所述指令集，通过执行所述指令集进行以下操作：

确定与所述第一缩略图相对应的第一场景；

从所述第一场景对应的位置对所述第一视频进行播放。

上述装置，优选的，所述处理器在获得对第一视频的播放指令之前，还用于：

确定所述第一视频包括的多个场景；

提取每个场景的至少一个关键帧图像；

建立并存储不同缩略图与不同场景之间的对应关系信息。

由以上方案可知，本申请提供的控制方法及装置，通过在视频封面中提供多个与视频包括的不同场景相对应的缩略图，可使得在获得携带视频封面中某一缩略图标识信息的播放指令时，基于播放指令中携带的缩略图标识信息，对视频中的相对应场景进行定位，进而可跳转至所定位的场景对视频进行播放。由此可见，本申请通过在视频封面中提供多个与视频不同场景相对应的缩略图，有效拓展了视频的封面信息，相比于现有技术，视频封面的内容更为丰富、全面，用户可通过视频封面对视频文件进行更多的了解，且可支持用户以视频封面中的缩略图为索引对视频中的相对应场景进行索引定位，便于用户快速定位到视频中感兴趣的位置，视频的播放也无疑更为灵活、便捷，更好地满足了用户需求。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1是现有技术中视频封面的效果示例图；

图2是本申请实施例一提供的控制方法的流程示意图；

图3是本申请实施例二提供的控制方法的预处理过程流程示意图；

图4(a)-图4(b)是本申请实施例二提供的基于关键帧图像缩略图所生成的封面的效果示例图；

图5(a)-图5(b)是本申请实施例二提供的基于关键前景主体缩略图所生成的封面的效果示例图；

图6(a)-图6(b)是按时长对场景缩略图的尺寸进行设定的效果示例图；

图7-图9是本申请实施例三提供的控制方法的流程示意图；

图10是本申请实施例四提供的控制方法的流程示意图；

图11是本申请实施例五提供的控制装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请公开一种控制方法及装置，该方法及装置适用于但不限于对计算机或手机、平板、个人数字助理等终端设备上的视频文件(由终端上安装的应用所提供的视频或存储于终端本地端的视频等)进行播放控制，以下将通过具体实施例对申请的控制方法及装置进行详细说明。

实施例一

参考图2，是本申请提供的一种控制方法实施例一的流程图，如图2所示，本实施例中，所述控制方法可以包括以下步骤：

步骤201、获得对第一视频的播放指令；所述播放指令包括所述第一视频的封面中第一缩略图的第一标识信息，所述第一视频的封面包括多个缩略图，每个缩略图与所述第一视频所包括的多个场景中的其中之一相对应。

所述第一视频可以是但不限于计算机或手机、平板、个人数字助理等终端设备上的视频文件，如终端设备上安装的应用所提供的视频文件或者存储于终端本地的视频文件等等。

第一视频所包括的场景可以是但不限于以下几种类型：

1)按视频的图像内容对视频文件进行切分/划分后所得的场景

其中，切分/划分后所得的每个视频段作为视频的一个场景。

具体地，可通过对视频中图像的空间信息、物体(如景物、动植物、人物等)信息以及物体的行为/动作等信息进行识别，使得获知视频的图像内容，并进一步基于视频的图像内容对视频文件进行切分/划分，进而得到视频的按图像内容划分的多个场景。

2)按视频的背景音乐对视频文件进行切分/划分后所得的场景

同样地，切分/划分后所得的每个视频段作为视频的一个场景。

其中，对于在不同时段具有不同背景音乐的视频，可按背景音乐对视频文件进行切分/划分，并具体可将对应于相同背景音乐的各个连续图像划分在同一个场景，所述相同背景音乐可以是但不限于同一首歌曲、同一只奏乐等等。

3)按时间对视频文件进行切分/划分后所得的场景

作为一种可能的实现方式，可以按预先设置的时长将视频平均切分/划分为多个等长的视频段(当然最后一个视频段的时长可以小于或等于所设置的时长，具体可视视频的实际时长以及所设置的时长而定)，每个视频段作为视频的一个场景；作为另一种可能的实现方式，还可以随机将视频切分/划分为多个不等长的视频段，每个视频段作为视频的一个场景。

区别于现有技术的视频封面仅包括预先设计的缩略图标或单一图像的方式，本申请中，在视频封面中提供了多个与视频包括的不同场景相对应的缩略图，也即，视频封面中携带了对应于视频中不同场景的缩略图，支持用户基于视频封面所展示的各个缩略图对视频包括的各个场景进行了解，同时，支持用户以视频封面中的缩略图为索引对视频中的相对应场景进行索引定位。

从而，当用户需对第一视频进行播放时，可首先从第一视频的视频封面中所显示的对应于不同场景的缩略图，来全局地了解第一视频包括的各个场景，进而可基于实际需求选取并操作(如点击，双击，或者长按等等)第一视频封面中的某一缩略图如第一缩略图等，以触发针对第一视频的播放指令。

对于终端设备来说，设备端相对应地可以获得用户通过操作第一视频封面中的第一缩略图而触发的上述播放指令，与现有技术中用户通过操作视频的图标或封面而触发的播放指令不同，本申请中，用户通过操作第一视频封面中的第一缩略图而触发的上述播放指令，至少包括该第一缩略图的第一标识信息，如具体包括第一缩略图的ID(Identity，身份标识号码)、编号和/或名称等等，以此支持后续可基于该指令中的缩略图标识信息对第一视频中的相对应场景进行索引定位。

步骤202、确定与所述第一缩略图相对应的第一场景。

在获得上述播放指令后，可对该播放指令进行解析，以获得其中所携带的缩略图标识信息即所述第一缩略图的第一标识信息，进而可基于解析所得的该第一标识信息，以及预先制定并存储的缩略图标识与场景的对应关系信息，确定出与所述第一缩略图相对应的第一场景。

步骤203、从所述第一场景对应的位置对所述第一视频进行播放。

在确定出与所述第一缩略图相对应的第一场景的基础上，可进一步在第一视频中对所述第一场景进行定位，从而最终实现从所述第一场景对应的位置对所述第一视频进行播放，而不再如现有技术一般默认从视频的起始位置对视频进行播放。

由以上方案可知，本实施例提供的控制方法，通过在视频封面中提供多个与视频包括的不同场景相对应的缩略图，可使得在获得携带视频封面中某一缩略图标识信息的播放指令时，基于播放指令中携带的缩略图标识信息，来对视频中相对应的场景进行定位，进而可跳转至所定位的场景对视频进行播放。由此可见，相比于现有技术，本申请通过在视频封面中提供多个与视频不同场景相对应的缩略图，有效拓展了视频的封面信息，且可支持用户以视频封面中的缩略图为索引对视频中的相对应场景进行索引定位，从而，视频封面的内容更为丰富、全面，视频的播放更为灵活、便捷，更好地满足了用户需求。

实施例二

上述控制方法的实施、执行，需以已生成视频文件的封面、以及已构建并存储视频封面中不同缩略图与视频的不同场景间的对应关系为基础，因此，参考图3，本申请所提供的上述控制方法，还可以包括以下的预处理过程：

步骤301、确定所述第一视频包括的多个场景。

可以但不限于按第一视频的图像内容、背景音乐或者时间对视频文件进行切分/划分，并将切分/划分所得的每个视频段作为第一视频的一个场景。

对于按第一视频的图像内容对第一视频进行切分/划分以获得第一视频的场景的方式，具体可通过基本的图像分析、图像处理(如颜色分析、灰度分析、图像边缘检测等)和/或深度学习(如基于卷积网络模型的深度学习)等技术，对第一视频的视频图像进行模式识别，以识别出视频图像中所包括的空间信息、物体(如景物、动植物、人物、甚至图像中的文字等)信息和/或物体的行为、动作等图像内容。

之后，可进一步基于所识别出的空间信息、物体信息和/或物体的行为/动作等图像内容，对第一视频进行切分，其中，具体可按将内容相似度/关联度高的连续视频图像划分在同一场景的划分逻辑，将第一视频切分为多个视频段，每个视频段作为第一视频的一个场景。

举例来说，比如，假设视频A(如由普通用户制作并上传的各种小视频等)从起始时间点t₀至时间点t₁包括的各个图像主要为人物Person₁或大海沙滩的图像，而从时间点t₁至时间点t₂包括的各个图像主要为人物Person₂或沙漠的图像、从时间点t₂至时间点t₃(结束时间点)包括的各个图像主要为人物Person₃或古建筑的图像，则在对视频A进行模式识别的基础上，可按图像内容之间的相似度或关联度、以时间点t₁、t₂为切分点，将该视频A切分为分别对应Person₁、Person₂、Person₃的三个视频段，或者将该视频A切分为分别对应大海沙滩、沙漠、古建筑的三个视频段，每个视频段则作为该视频A的一个场景，从而，该视频A最终被切分为三个场景。

再比如，假设视频B(比如影视剧集等)从起始时间点t₀至时间点t₁包括的各个图像为前序序幕图像(可基于视频图像的文字区域特征和/或背景音乐识别出序幕部分)，时间点t₁至时间点t₂包括多幅主要用于呈现景物信息的图像，时间点t₂至时间点t₃包括多幅主要用于呈现多人物室内群像剧情的图像，时间点t₃至时间点t₄包括多幅主要用于呈现两个人物/单人物室内剧情的图像，时间点t₄至时间点t₅包括多幅主要用于呈现两个人物/单人物室外剧情的图像，时间点t₅至时间点t₆为后序序幕图像，则在对视频B的图像进行模式识别的基础上，可按图像内容之间的相似度或关联度，以t_1、t₂…t₅为切分点，将该视频B切分为分别对应前序序幕、景物信息、室内群像、室内单/双人物、室外单/双人物、后序序幕这六个视频段，每个视频段则作为该视频B的一个场景。

对于按背景音乐对第一视频进行切分/划分以获得第一视频的场景的方式，具体可将对应于同一首歌曲或同一只奏乐的各个连续图像划分在同一个场景。

对于按时间对第一视频进行切分/划分以获得第一视频的场景的方式，可以按预先设置的时长将第一视频平均切分/划分为多个等长的视频段(当然最后一个视频段的时长可以小于或等于所设置的时长，具体可视第一视频的实际时长以及所设置的时长而定)，或者还可以随机将第一视频切分/划分为多个不等长的视频段，每个视频段作为第一视频的一个场景。

需要说明的是，以上所示出的对第一视频进行场景划分的几种划分方式仅为本申请为阐述方案内容而提供的示例性而非限定性说明，具体实施本申请时，还可以对第一视频按其他方式进行划分，本申请对此不加限制。

步骤302、提取每个场景的至少一个关键帧图像。

在基于场景划分确定出所述第一视频包括的多个场景后，可提取第一视频的每个场景的至少一个关键帧图像。

场景的关键帧图像，一般来说为包括较多与场景相关的有效信息、能够直观体现场景主要内容的图像，以主要用于呈现多人物室内群像剧情的场景为例，可选取该场景中的至少一幅包括多人物群像的图像作为该场景的关键帧图像(事实上，该场景中往往还掺杂包括一些其他图像，如室内布局图像、多人物中某一个人物的特写图像等等)；以主要用于呈现某人物写真图像的场景为例，则可选取该场景中的至少一幅具备该人物正脸的图像作为该场景的关键帧图像。

步骤303、基于所述多个场景中每个场景的至少一个关键帧图像，生成所述第一视频的封面；所述第一视频的封面包括所述多个场景中各个场景的缩略图，每个场景的缩略图包括：该场景的至少一个关键帧图像的至少部分的缩略图。

作为一种可能的实现方式，针对第一视频的每个场景，可首先对场景的至少一个关键帧图像进行缩略处理，并拼接所述至少一个关键帧图像在缩略处理后所得的缩略图，得到该场景的缩略图；之后，进一步拼接第一视频的各个场景的缩略图，得到所述第一视频的封面。

基于该方式所生成的视频封面的封面效果具体可参考图4(a)-图4(b)所示，在图4(a)示出的视频封面中，共包括9个场景缩略图，相对应地分别一一对应于视频的9个场景，每个场景缩略图由一幅关键帧图像的缩略图构成；在图4(b)示出的视频封面中，共包括3个场景缩略图，其中，场景缩略图401由一幅关键帧图像的缩略图构成，场景缩略图402由两幅关键帧图像的缩略图构成，场景缩略图403由5幅关键帧图像的缩略图构成；后续，用户可通过在图4(a)-图4(b)中相应场景缩略图的任一区域执行规定的操作，来实现对该场景缩略图所对应的场景的索引、定位，进而实现从该场景对应的位置对视频进行播放。

对于图4(b)所示出的视频封面效果，具体实施中，可以将同一场景缩略图中的多幅不同的关键帧图像缩略图设置为具有相同的索引定位功能，也即，用户在同一场景缩略图中任一关键帧图像的缩略图区域内执行规定的操作，均不加区分地将视频索引、定位至该场景缩略图在视频中所对应的场景位置；或者，还可以将同一场景缩略图中的多幅不同的关键帧图像缩略图设置为具有不同的索引定位功能，具体地，比如，将该同一场景缩略图对应的场景进一步切分为多个子场景，各个关键帧图像缩略图分别与各个子场景一一对应，从而，用户可通过操作同一场景缩略图中的不同关键帧图像缩略图，来相应定位至场景缩略图在视频中所对应场景的不同子场景。对于前一种实施情况，由于同一场景缩略图中的不同关键帧图像缩略图具有相同的索引功能，从而，同一场景缩略图对应的各个关键帧图像既可以是视频中时间相邻的多帧连续图像，也可以是具有一定时距的多帧非连续图像；对于后一种实施情况，由于同一场景缩略图中的不同关键帧图像缩略图的索引功能不同，分别用于索引定位至所对应场景中的不同子场景，从而，同一场景缩略图对应的各关键帧图像一般来说是具有一定时距的多帧非连续图像，较优选的，可以选取子场景中包括较多与子场景相关的有效信息、能够直观体现子场景主要内容的图像作为子场景的关键帧图像。

作为另一种可能的实现方式，针对第一视频的每个场景，还可以从场景的至少一个关键帧图像中提取该场景的关键前景主体，并对所述关键前景主体进行缩略处理，得到该场景的缩略图；之后，将各个场景的缩略图中的关键前景主体叠加于预置的背景图片上，得到所述第一视频的封面。

其中，可基于抠图技术从场景的关键帧图像中提取其关键前景主体，如提取关键帧图像中的前景人物/动物图像、前景汽车图像或前景楼体图像等等。

基于该方式所生成的视频封面的封面效果具体可参考图5(a)-图5(b)所示，在图5(a)的视频封面中，共包括7个场景缩略图(图5(a)中的花朵为背景图片的图片内容)，相对应地分别一一对应于视频的7个场景，每个场景缩略图由一幅关键帧图像的关键前景主体构成；在图5(b)的视频封面中，共包括3个场景缩略图，其中，场景缩略图501由4幅关键帧图像的关键前景主体构成，场景缩略图502由两幅关键帧图像的关键前景主体构成，场景缩略图503由4幅关键帧图像的关键前景主体构成，而封面的其他部分则为背景图片所提供的图像内容；后续，用户可通过在图5(a)-图5(b)中场景缩略图的任一区域(或任一关键前景主体区域)执行规定的操作，来实现对该场景缩略图所对应的场景的索引、定位，进而实现从所定位的场景对视频进行播放。

与图4(b)对应的两种实施情况相类似，对于图5(b)所示出的视频封面效果，具体实施中，可以将同一场景缩略图中的多个不同关键前景主体设置为具有相同的索引定位功能，也即，用户在同一场景缩略图中的任一关键前景主体区域内执行规定的操作，均不加区分地将视频索引、定位至该场景缩略图在视频中所对应的场景位置；或者，还可以将同一场景缩略图中的多个不同关键前景主体设置为具有不同的索引定位功能，具体地，比如，将该同一场景缩略图对应的场景进一步切分为多个子场景，各个关键前景主体分别与各个子场景一一对应，从而，用户可通过操作同一场景缩略图的不同关键前景主体，来相应定位至该场景缩略图所对应场景的不同子场景。相类似地，对于前一种实施情况，由于同一场景缩略图中的不同关键前景主体具有相同的索引功能，从而，同一场景缩略图中的各个关键前景主体对应的各个关键帧图像既可以是视频中时间相邻的多帧连续图像，也可以是具有一定时距的多帧非连续图像；对于后一种实施情况，由于同一场景缩略图中的不同关键前景主体的索引功能不同，分别用于索引定位至所对应场景中的不同子场景，从而，同一场景缩略图中的各个关键前景主体对应的各关键帧图像，一般来说是具有一定时距的多帧非连续图像，较优选的，可以选取子场景中包括较多与子场景相关的有效信息、能够直观体现子场景主要内容的图像作为子场景的关键帧图像。

可选地，在本申请其他实施例中，还可以根据划分的每个场景/子场景在视频中所对应的时长，对场景/子场景的缩略图在视频封面中的尺寸大小进行设定，其中，为便于用户较直观地对各个场景/子场景的时长进行了解，可将每个场景/子场景的缩略图大小设定为与该场景/子场景在视频中对应的时长相匹配，即场景/子场景在视频中对应的时长越长，则其对应的缩略图在视频封面中的尺寸越大，反之，场景/子场景在视频中对应的时长越短，则其对应的缩略图在视频封面中的尺寸越小。

图6(a)、图6(b)分别针对上述的图4(a)、图5(a)的实施方式，示出了按时长对场景的缩略图在视频封面中的尺寸大小进行设定后的效果示意图，而对于在场景缩略图中又进一步包括多个关键帧图像缩略图/多个关键前景主体缩略图的情况，即图4(b)、图5(b)的实施情况，与图6(a)、图6(b)示出的按时长设定场景缩略图尺寸的效果类似，区别仅在于：在对场景缩略图的尺寸按场景时长进行设定后，又进一步对场景的子场景所对应的缩略图(关键帧图像缩略图/关键前景主体缩略图)的尺寸按子场景时长进行了设定，这里对于其效果图不再一一示出。

另外，可选地，还可以不按时长设定场景/子场景的缩略图在视频封面中的尺寸，而是在每个场景/子场景的缩略图区域标注场景/子场景对应的具体时长，如10′(10分钟)，10′56″(10分钟56秒等)，该方式同样可以实现在视频封面中为用户提供场景/子场景的时长信息；当然，还可以结合应用上述两种方式，即在按时长设定场景/子场景缩略图在视频封面中的尺寸基础上，进一步在每个场景/子场景的缩略图区域内标注场景/子场景对应的具体时长。

基于上述的时长信息显示方式，用户不仅可以通过视频封面中示出的关键帧图像/关键前景主体的缩略图，了解视频中各个场景的相关内容信息，还可以利用视频封面中场景/子场景的缩略图尺寸，了解场景/子场景在视频中的时长信息。

本实施例所提供的上述几种缩略图显示方式或时长信息显示方式，仅为本实施例为清楚地描述本申请方案所作出的示例性说明，具体实施本申请时，并不限于本申请所示出的上述几种实现方式。

步骤304、建立并存储不同缩略图与不同场景之间的对应关系信息。

在为第一视频生成包括多个场景/子场景缩略图的视频封面后，可进一步建立视频封面中所包括的各个不同场景/子场景缩略图与不同场景/子场景之间的对应关系信息，并存储所建立的缩略图与场景/子场景的对应关系信息，后续，在针对视频封面中的缩略图触发对第一视频的播放指令后，可基于所建立并存储的该对应关系信息，在第一视频中对“为了响应该播放指令以播放视频时的播放位置”进行定位。

所述对应关系信息可以包括但不限于缩略图ID、编号和/或名称等缩略图标识与场景ID、编号和/或名称等场景标识之间的对应关系。

更进一步地，针对上文的图4(a)、图5(a)所对应的实现方式，由于视频封面中的每个场景缩略图仅包括一个关键帧图像缩略图或者一个关键前景主体缩略图，从而具体可建立并存储“场景缩略图标识和/或场景缩略图中关键帧图像的缩略图标识”与场景标识间的对应关系信息，或者建立并存储“场景缩略图标识和/或场景缩略图中关键前景主体的缩略图标识”与场景标识间的对应关系信息。

针对上文的图4(b)、图5(b)所对应的实现方式，对于同一场景缩略图中的多幅不同关键帧图像/关键前景主体缩略图具有相同索引功能的实施情况，可建立并存储“场景缩略图标识和/或场景缩略图中任一帧或多帧关键帧图像的缩略图标识”与场景标识间的对应关系信息，或者，建立并存储“场景缩略图标识和/或场景缩略图中任一个或多个关键前景主体的缩略图标识”与场景标识间的对应关系信息。对于同一场景缩略图中的多幅不同关键帧图像/关键前景主体的缩略图具有不同索引功能(分别索引至场景的不同子场景)的实施情况，优选地，可构建并存储“缩略图-场景”的二级索引结构，其中，一级索引包括场景缩略图标识与场景标识之间的对应关系信息，二级索引包括场景缩略图中的不同关键帧图像的缩略图标识(或者不同关键前景主体的缩略图标识)与不同子场景标识之间的对应关系信息。

通过按本实施例的处理过程预先为视频生成包括多个场景缩略图的封面，并建立视频封面中的各缩略图与视频场景的对应关系，有效拓展了视频的封面信息，用户可通过视频封面对视频文件进行更多的了解，且可支持用户以视频封面中的缩略图为索引对视频中的相对应场景进行索引定位，便于用户快速定位到视频中感兴趣的位置。

实施例三

本实施例主要提供所述控制方法的步骤203(从所述第一场景对应的位置对所述第一视频进行播放)的具体实现过程。

在一个可选的实施方式中，参考图7示出的控制方法流程图，所述步骤203可以通过以下的步骤2031实现：

步骤2031：从所述第一场景的起始位置对所述第一视频进行播放。

其中，图7中步骤201-步骤202的实现过程具体可参阅上文实施例一中对步骤201-步骤202的说明，此处不再赘述。

在将第一视频切分为多个场景后，每一个场景在第一视频中均对应一起始位置与结束位置(或者也可称之为起始时间与结束时间)，当获得针对第一视频的播放指令，并确定出与播放指令中携带的第一缩略图标识信息相对应的第一场景后，可选地，具体可将响应于所述播放指令的视频播放动作索引至所述第一视频中所述第一场景的起始位置，即从所述第一场景的起始位置开始对所述第一视频进行播放，而所述第一场景的起始位置之前的部分则直接跳过不播。

在另一个可选的实施方式中，参考图8示出的控制方法流程图，所述步骤203可以通过以下的步骤2032实现：

步骤2032、从所述第一场景中对应于所述第一缩略图的位置对所述第一视频进行播放；第一视频的封面包括的各个缩略图为：第一视频的相应场景中关键帧图像的至少部分的缩略图。

图8中步骤201-步骤202的实现过程同样可参阅上文实施例一中对步骤201-步骤202的说明，此处不再赘述。

基于前文陈述可知，第一视频的相应场景中关键帧图像的至少部分的缩略图，可以为第一视频的场景中关键帧图像的缩略图或者从关键帧图像提取的关键前景主体的缩略图，从而，第一视频的封面包括的每个缩略图(此处，并非指宏观层面的场景缩略图)必然对应于第一视频中的一个相应关键帧图像，相对应地，每个缩略图也必然对应于第一视频中的一个相应图像位置/时间位置，基于该特点，当获得播放指令并确定出与播放指令中携带的第一缩略图标识信息相对应的目标场景即所述第一场景后，还可以将响应于所述播放指令的视频播放动作索引至第一场景中对应于所述第一缩略图的位置，即从所述第一场景中对应于所述第一缩略图的图像位置/时间位置对所述第一视频进行播放，而所述第一缩略图的图像位置/时间位置之前的部分则直接跳过不播。

在再一个可选的实施方式中，参考图9示出的控制方法流程图，所述步骤203可以通过以下的步骤2033实现：

步骤2033、从所述第一场景对应的位置开始播放所述第一视频中的各个目标场景；所述目标场景包括所述第一场景以及所述第一视频中与所述第一场景符合预定关联条件的各个第二场景。

图9中步骤201-步骤202的实现过程同样可参阅上文实施例一中对步骤201-步骤202的说明，此处不再赘述。

所述预定关联条件可以是但不限于能够表示与所述第一场景的内容具备较高相似性或关联性的条件，示例性地，比如，若第二场景与第一场景属于同类/相近似类别场景(如第二场景与第一场景为同一人物/同类人物的照片展示场景，或者，第二场景与第一场景均为景物展示场景或均为战争展示场景等)，则可判定为第二场景与第一场景具备较高相似性或关联性。

在前述图7-图8提供的两种实施方式中，在响应于所述播放指令对第一视频进行播放时，均是从所定位的位置(所定位场景的起始位置或者触发播放指令时所操作的缩略图在第一视频中的位置)开始，对第一视频在该位置之后的部分无选择地进行连续播放，而本实施方式则是从所定位的位置(同样可以是所定位场景的起始位置或者触发播放指令时所操作的缩略图在第一视频中的位置)开始，有选择地对第一视频中所定位的第一场景以及与该第一场景符合关联条件的各个第二场景进行播放。

该选取出第一视频中与所述第一场景符合关联条件的各个第二场景，并选择性地播放所述第一场景以及各个第二场景的方式，本质上属于对第一视频的跳播式播放，即基于跳播方式实现将第一视频中的各个相关联场景自动串接起来进行播放。

此种播放方式便于用户通过对视频的一个场景进行定位，而连续观看(以该定位的场景为起始)视频中与该定位的场景具备关联的其他场景(如同类/近似类别的场景等)，以下举例说明，比如，假设某一段小视频在时间点t₀-t₁为人物A的多幅写真照片(对应场景P1)，在时间点t₁-t₂为人物B的多幅写真照片(对应场景P2)，在时间点t₂-t₃为人物A的多幅写真照片(对应场景P3)，在时间点t₃-t₄人物B的多幅写真照片(对应场景P4)，基于该实施方式，在用户通过操作视频封面上的对应于场景P2的缩略图以触发对该视频的播放指令后，响应于该播放指令，会从场景P2对应的位置开始播放，并在完成场景P2的播放后，跳转至场景P4的位置进一步对场景P4进行播放，也即筛选出同类场景P2、P4，并以跳播方式实现依次对筛选出的同类场景P2、P4进行播放。再比如，某一电视剧集的视频，其中包括多个非连续的景物场景以及多个非连续的人物场景，则在用户通过操作视频封面上的对应于景物场景S1的缩略图以触发对该视频的播放指令后，可在响应该指令时，从景物场景S1开始对该视频中S1之后的各个景物场景进行播放。

基于本实施例提供的上述各种播放位置定位方式，用户可以以视频封面中的缩略图为索引将视频的播放动作索引至所需场景的相应位置，从而便于用户对视频中感兴趣的位置进行快速定位。

实施例四

在本申请实施例四中，参考图10示出的控制方法流程图，所述控制方法还可以包括以下步骤：

步骤204、在暂停对所述第一视频的播放时，显示所述第一视频的封面，或者显示基于所述第一视频的封面与暂停时刻对应的图像所生成的新的封面。

现有技术中，在暂停对视频的播放时会将暂停时的图像画面显示在视频界面上，与此相区别，本申请在暂停对所述第一视频的播放时，至少在第一视频的暂停界面区域显示所述第一视频的封面，如至少在第一视频的暂停界面区域显示如图4(a)、4(b)或者图5(a)、5(b)所示出的封面等，以便于用户在结束暂停需再次播放视频时能够基于暂停界面上所显示的场景缩略图灵活地定位到视频中感兴趣的位置。

可选地，具体可直接在第一视频的暂停界面区域显示所述第一视频的封面；或者，更优地，还可以将第一视频的封面与暂停时刻所对应图像的缩略图进行拼接，得到一新的封面，并在第一视频的暂停界面区域显示该拼接有暂停时刻图像的新封面，该新的封面中即提供了能够对视频的各个场景进行索引的场景缩略图，又提供了暂停时刻所对应图像的图像缩略图；其中，若用户操作暂停界面中的某一场景缩略图，可将视频定位至与该场景缩略图对应的目标场景开始播放，若用户操作暂停界面中的该暂停时刻所对应图像的图像缩略图，则直接以该暂停时刻为起始对视频进行播放。

需要说明的是，针对拼接有所述暂停时刻的图像的情况，可将暂停时刻的图像拼接于视频封面的任意位置，如中间位置，左上/下角，右/下上角等等，所采用的拼接方式可以是覆盖式拼接(即暂停时刻的图像覆盖其所在位置的原封面内容)或者挤压式拼接(即挤压缩小视频封面的图像使得视频封面空出一定区域以容纳暂停时刻的图像)，本实施例对此不作限定。

本实施例通过在视频的暂停界面中至少显示视频的封面内容，可便于用户在结束暂停需再次播放视频时能够基于暂停界面上所显示的场景缩略图灵活地定位到视频中感兴趣的位置，进一步通过将暂停时刻所对应图像的图像缩略图拼接到视频的封面中，可便于用户通过在暂停界面中对暂停时刻所对应图像的图像缩略图进行操作，来实现以该暂停时刻为起始对视频进行播放。

实施例五

对应于上述的控制方法，本申请还提供了一种控制装置，可控制装置可应用于但不限于对计算机或手机、平板、个人数字助理等终端设备上的视频文件(由终端上安装的应用所提供的视频或存储于终端本地端的视频等)进行播放控制，具体实施中，该控制装置的处理逻辑可部署在上述任一种终端设备和/或局域网/云端服务器中。

参考图11示出的控制装置的结构示意图，该控制装置包括：

存储器1101，用于至少存储一组指令集；

处理器1102，用于调用并执行所述存储器中的所述指令集，通过执行所述指令集进行以下操作：

确定与所述第一缩略图相对应的第一场景；

从所述第一场景对应的位置对所述第一视频进行播放。

第一视频所包括的场景可以是但不限于以下几种类型：

1)按视频的图像内容对视频文件进行切分/划分后所得的场景

其中，切分/划分后所得的每个视频段作为视频的一个场景。

2)按视频的背景音乐对视频文件进行切分/划分后所得的场景

3)按时间对视频文件进行切分/划分后所得的场景

由以上方案可知，本实施例提供的控制装置，通过在视频封面中提供多个与视频包括的不同场景相对应的缩略图，可使得在获得携带视频封面中某一缩略图标识信息的播放指令时，基于播放指令中携带的缩略图标识信息，来对视频中相对应的场景进行定位，进而可跳转至所定位的场景对视频进行播放。由此可见，相比于现有技术，本申请通过在视频封面中提供多个与视频不同场景相对应的缩略图，有效拓展了视频的封面信息，且可支持用户以视频封面中的缩略图为索引对视频中的相对应场景进行索引定位，从而，视频封面的内容更为丰富、全面，视频的播放更为灵活、便捷，更好地满足了用户需求。

实施例六

上述控制装置中处理逻辑的实施、执行，需以已生成视频文件的封面、以及已构建并存储视频封面中不同缩略图与视频的不同场景间的对应关系为基础，因此，本实施例中，上述控制装置中的处理器1102，在获得对第一视频的播放指令之前，还可以执行以下的预处理过程：

确定所述第一视频包括的多个场景；

提取每个场景的至少一个关键帧图像；

建立并存储不同缩略图与不同场景之间的对应关系信息。

实施例七

本实施例主要提供所述控制装置中的处理器1102从所述第一场景对应的位置对所述第一视频进行播放的具体实现过程。

在一个可选的实施方式中，所述处理器1102可以通过以下处理实现从所述第一场景对应的位置对所述第一视频进行播放：

从所述第一场景的起始位置对所述第一视频进行播放。

在另一个可选的实施方式中，所述处理器1102还可以通过以下处理实现从所述第一场景对应的位置对所述第一视频进行播放：

从所述第一场景中对应于所述第一缩略图的位置对所述第一视频进行播放；第一视频的封面包括的各个缩略图为：第一视频的相应场景中关键帧图像的至少部分的缩略图。

在再一个可选的实施方式中，所述处理器1102还可以通过以下处理实现从所述第一场景对应的位置对所述第一视频进行播放：

实施例八

在本申请的实施例八中，所述控制装置中的处理器1102还可以执行以下处理：

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

为了描述的方便，描述以上系统或装置时以功能分为各种模块或单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

最后，还需要说明的是，在本文中，诸如第一、第二、第三和第四等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种控制方法，包括：

确定与所述第一缩略图相对应的第一场景；

从所述第一场景对应的位置对所述第一视频进行播放。

2.根据权利要求1所述的方法，所述获得对第一视频的播放指令，包括：

3.根据权利要求1所述的方法，所述从所述第一场景对应的位置对所述第一视频进行播放，包括：

从所述第一场景的起始位置对所述第一视频进行播放；

或者，

4.根据权利要求1所述的方法，所述从所述第一场景对应的位置对所述第一视频进行播放，包括：

5.根据权利要求1-4任一项所述的方法，在所述获得对第一视频的播放指令之前，还包括：

确定所述第一视频包括的多个场景；

提取每个场景的至少一个关键帧图像；

建立并存储不同缩略图与不同场景之间的对应关系信息。

6.根据权利要求5所述的方法，所述生成所述第一视频的封面，包括：

拼接各场景的缩略图，得到所述第一视频的封面；

或者，

7.根据权利要求6所述的方法，所述第一视频的封面中包括的每个场景的缩略图大小与该场景在所述第一视频中对应的时长相匹配。

8.根据权利要求1所述的方法，还包括：

9.一种控制装置，包括：

存储器，用于至少存储一组指令集；

确定与所述第一缩略图相对应的第一场景；

从所述第一场景对应的位置对所述第一视频进行播放。

10.根据权利要求9所述的装置，所述处理器在获得对第一视频的播放指令之前，还用于：

确定所述第一视频包括的多个场景；

提取每个场景的至少一个关键帧图像；

建立并存储不同缩略图与不同场景之间的对应关系信息。