WO2021121023A1

WO2021121023A1 - 视频编辑方法、视频编辑装置、终端和可读存储介质

Info

Publication number: WO2021121023A1
Application number: PCT/CN2020/133047
Authority: WO
Inventors: 陈佳雨
Original assignee: Oppo广东移动通信有限公司
Priority date: 2019-12-17
Filing date: 2020-12-01
Publication date: 2021-06-24
Also published as: EP4068793A4; CN110992993A; CN110992993B; EP4068793A1; US20220312048A1

Abstract

一种视频编辑方法、视频编辑装置(10)、终端(100)和非易失性计算机可读存储介质(300)。视频编辑方法包括在初始视频中标记一个或多个视频片段；根据相邻两个节奏点之间的间隔时长，确定视频片段中待剪辑视频片段；及剪辑待剪辑视频片段，得到已剪辑视频片段，以已剪辑视频片段的起始时刻和结束时刻分别对应两个节奏点。

Description

视频编辑方法、视频编辑装置、终端和可读存储介质

优先权信息

本申请请求2019年12月17日向中国国家知识产权局提交的、专利申请号为201911298854.1的专利申请的优先权和权益，并且通过参照将其全文并入此处。

技术领域

本申请涉及消费性电子技术领域，特别涉及一种视频编辑方法、视频编辑装置、终端和非易失性计算机可读存储介质。

背景技术

目前，在进行视频编辑时，常常是通过用户将多个视频中的某些视频片段剪辑出来，然后将这些视频片段拼接在一起，然后搭配合适的背景音乐，形成一个新的剪辑视频。

发明内容

本申请的实施例提供了一种视频编辑方法、视频编辑装置、终端和非易失性计算机可读存储介质。

本申请实施方式的视频编辑方法包括在初始视频中标记一个或多个视频片段；根据预设音乐片段的相邻两个节奏点之间的间隔时长，从所述一个或多个视频片段中确定待剪辑视频片段，所述待剪辑视频片段的时长大于或者等于所述间隔时长；及剪辑所述待剪辑视频片段，得到已剪辑视频片段，以所述已剪辑视频片段的起始时刻和结束时刻分别对应两个所述节奏点。

本申请实施方式的视频编辑装置包括获取模块、确定模块和编辑模块。所述获取模块用于在初始视频中标记一个或多个视频片段；所述确定模块用于根据预设音乐片段的相邻两个节奏点之间的间隔时长，从所述一个或多个视频片段中确定待剪辑视频片段，所述待剪辑视频片段的时长大于或者等于所述间隔时长；所述编辑模块用于剪辑所述待剪辑视频片段，得到已剪辑视频片段，以所述已剪辑视频片段的起始时刻和结束时刻分别对应两个所述节奏点。

本申请实施方式的终端包括处理器，所述处理器用于在初始视频中标记一个或多个视频片段；根据预设音乐片段的相邻两个节奏点之间的间隔时长，从所述一个或多个视频片段中确定待剪辑视频片段，所述待剪辑视频片段的时长大于或者等于所述间隔时长；及剪辑所述待剪辑视频片段，得到已剪辑视频片段，以所述已剪辑视频片段的起始时刻和结束时刻分别对应两个所述节奏点。

本申请的一种包含计算机可执行指令的非易失性计算机可读存储介质，当所述计算机可执行指令被一个或多个处理器执行时，使得所述处理器执行视频编辑方法。所述视频编辑方法包括在初始视频中标记一个或多个视频片段；根据预设音乐片段的相邻两个节奏点之间的间隔时长，从所述一个或多个视频片段中确定待剪辑视频片段，所述待剪辑视频片段的时长大于或者等于所述间隔时长；及剪辑所述待剪辑视频片段，得到已剪辑视频片段，以所述已剪辑视频片段的起始时刻和结束时刻分别对应两个所述节奏点。

本申请的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请某些实施方式的视频编辑方法的流程示意图；

图2是本申请某些实施方式的终端结构示意图；

图3是本申请某些实施方式的视频编辑装置的模块示意图；

图4是本申请某些实施方式视频编辑方法的原理示意图；

图5是本申请某些实施方式的视频编辑方法的流程示意图；

图6是本申请某些实施方式的视频编辑装置的模块示意图；

图7是本申请某些实施方式的视频编辑方法的流程示意图；

图8是本申请某些实施方式的编辑模块的模块示意图；

图9是本申请某些实施方式视频编辑方法的原理示意图；

图10是本申请某些实施方式的视频编辑方法的流程示意图；

图11是本申请某些实施方式的编辑模块的模块示意图；

图12是本申请某些实施方式的视频编辑方法的流程示意图；

图13是本申请某些实施方式的编辑模块的模块示意图；

图14是本申请某些实施方式的视频编辑方法的流程示意图；

图15是本申请某些实施方式的编辑模块的模块示意图；

图16是本申请某些实施方式视频编辑方法的原理示意图；

图17是本申请某些实施方式视频编辑方法的原理示意图

图18是本申请某些实施方式的视频编辑方法的流程示意图；

图19是本申请某些实施方式的编辑模块的模块示意图；和

图20是本申请某些实施方式的处理器和计算机可读存储介质的连接示意图。

具体实施方式

以下结合附图对本申请的实施方式作进一步说明。附图中相同或类似的标号自始至终表示相同或类似的元件或具有相同或类似功能的元件。另外，下面结合附图描述的本申请的实施方式是示例性的，仅用于解释本申请的实施方式，而不能理解为对本申请的限制。

请参阅图1，本申请实施方式的视频编辑方法包括以下步骤：

在初始视频中标记一个或多个视频片段；

根据预设音乐片段的相邻两个节奏点之间的间隔时长，从一个或多个视频片段中确定待剪辑视频片段，待剪辑视频片段的时长大于或者等于间隔时长；及

剪辑待剪辑视频片段，得到已剪辑视频片段，以已剪辑视频片段的起始时刻和结束时刻分别对应两个节奏点。

请参阅图5，在某些实施方式中，根据预设音乐片段的相邻两个节奏点之间的间隔时长，从一个或多个视频片段中确定待剪辑视频片段，待剪辑视频片段的时长大于或者等于间隔时长包括：

确定一个或多个视频片段中，时长大于间隔时长、且时长差为所有时长差中的最小值的视频片段为待剪辑视频片段，时长差为视频片段的时长和间隔时长的差值。

请参阅图7，在某些实施方式中，剪辑待剪辑视频片段，得到已剪辑视频片段，以已剪辑视频片段的起始时刻和结束时刻分别对应两个节奏点包括：

识别待剪辑视频片段中的静音开始时刻和静音结束时刻；及在第一时长大于剪辑时长时，从起始时刻向后剪辑待剪辑视频片段，得到已剪辑视频片段，第一时长为待剪辑视频片段的起始时刻对应的静音时长，剪辑时长等于待剪辑视频片段中超过间隔时长的部分的时长；及在第二时长大于剪辑时长时，从结束时刻向前剪辑待剪辑视频片段，得到已剪辑视频片段，第二时长为待剪辑视频片段的结束时刻对应的静音时长。

请参阅图10，在某些实施方式中，剪辑待剪辑视频片段，得到已剪辑视频片段，以已剪辑视频片段的起始时刻和结束时刻分别对应两个节奏点还包括：

在第一时长和第二时长均小于剪辑时长时，判断第一时长和第二时长之和是否大于剪辑时长；及在第一时长和第二时长之和大于剪辑时长时，分别从待剪辑视频片段的起始时刻和结束时刻剪辑待剪辑视频片段，得到已剪辑视频片段。

请参阅图12，在某些实施方式中，剪辑待剪辑视频片段，得到已剪辑视频片段，以已剪辑视频片段的起始时刻和结束时刻分别对应两个节奏点还包括：

在第一时长和第二时长之和小于剪辑时长时，获取静音开始时刻对应的静音时长；在静音开始时刻对应的静音时长大于剪辑时长时，从静音开始时刻剪辑待剪辑视频片段，得到已剪辑视频片段。

请参阅图14，在某些实施方式中，视频编辑方法还包括：识别选取自同一初始视频的多个视频片段中的重复部分；及将具有相同的重复部分的N个视频片段中的任意N-1个视频片段中的重复部分剪辑掉，N为大于1的正整数。

请参阅图18，在某些实施方式中，视频编辑方法还包括：按照每个已剪辑视频片段的起始时刻和结束时刻将所有已剪辑视频片段拼接为一个融合视频片段；及整合融合视频片段和预定音乐片段以输出推荐视频。

请参阅图2，本申请实施方式的视频编辑装置10包括获取模块11、确定模块12和编辑模块13。获取模块11用于在初始视频中标记一个或多个视频片段；确定模块12用于根据预设音乐片段的相邻两个节奏点之间的间隔时长，从一个或多个视频片段中确定待剪辑视频片段，待剪辑视频片段的时长大于或者等于间隔时长；编辑模块13用于剪辑待剪辑视频片段，得到已剪辑视频片段，以已剪辑视频片段的起始时刻和结束时刻分别对应两个节奏点。

请参阅图6，在某些实施方式中，确定模块12包括确定单元121。确定单元121用于确定一个或多个视频片段中，时长大于间隔时长、且时长差为所有时长差中的最小值的视频片段为待剪辑视频片段，时长差为视频片段的时长和间隔时长的差值。

请参阅图8，在某些实施方式中，编辑模块13包括识别单元131、第一剪辑单元132和第二剪辑单元133。识别单元131用于识别待剪辑视频片段中的静音开始时刻和静音结束时刻。第一剪辑单元132用于在第一时长大于剪辑时长时，从起始时刻向后剪辑待剪辑视频片段，得到已剪辑视频片段，第一时长为待剪辑视频片段的起始时刻对应的静音时长，剪辑时长等于待剪辑视频片段中超过间隔时长的部分的时长。第二剪辑单元133用于在第二时长大于剪辑时长时，从结束时刻向前剪辑待剪辑视频片段，得到已剪辑视频片段，第二时长为待剪辑视频片段的结束时刻对应的静音时长。

请参阅图11，在某些实施方式中，编辑模块13还包括判断单元134和第三剪辑单元135。判断单元134用于在第一时长和第二时长均小于剪辑时长时，判断第一时长和第二时长之和是否大于剪辑时长。第三剪辑单元135用于在第一时长和第二时长之和大于剪辑时长时，分别从待剪辑视频片段的起始时刻和结束时刻剪辑待剪辑视频片段，得到已剪辑视频片段。

请参阅图13，在某些实施方式中，编辑模块13还包括获取单元136和第四剪辑单元137。获取单元136用于在第一时长和第二时长之和小于剪辑时长时，获取静音开始时刻对应的静音时长；第四剪辑单元137用于在静音开始时刻对应的静音时长大于剪辑时长时，从静音开始时刻剪辑待剪辑视频片段，得到已剪辑视频片段。

请参阅图3，本申请实施方式的终端100包括处理器20，处理器20用于在初始视频中标记一个或多个视频片段；根据预设音乐片段的相邻两个节奏点之间的间隔时长，从一个或多个视频片段中确定待剪辑视频片段，待剪辑视频片段的时长大于或者等于间隔时长；及剪辑待剪辑视频片段，得到已剪辑视频片段，以已剪辑视频片段的起始时刻和结束时刻分别对应两个节奏点。

在某些实施方式中，处理器20用于确定一个或多个视频片段中，时长大于间隔时长、且时长差为所有时长差中的最小值的视频片段为待剪辑视频片段，时长差为视频片段的时长和间隔时长的差值。

在某些实施方式中，处理器20还用于识别待剪辑视频片段中的静音开始时刻和静音结束时刻；在第一时长大于剪辑时长时，从起始时刻向后剪辑待剪辑视频片段，得到已剪辑视频片段，第一时长为待剪辑视频片段的起始时刻对应的静音时长，剪辑时长等于待剪辑视频片段中超过间隔时长的部分的时长；及在第二时长大于剪辑时长时，从结束时刻向前剪辑待剪辑视频片段，得到已剪辑视频片段，第二时长为待剪辑视频片段的结束时刻对应的静音时长。

在某些实施方式中，处理器20还用于在第一时长和第二时长均小于剪辑时长时，判断第一时长和第二时长之和是否大于剪辑时长；及在第一时长和第二时长之和大于剪辑时长时，分别从待剪辑视频片段的起始时刻和结束时刻剪辑待剪辑视频片段，得到已剪辑视频片段。

在某些实施方式中，处理器20还用于在第一时长和第二时长之和小于剪辑时长时，获取静音开始时刻对应的静音时长、及在静音开始时刻对应的静音时长大于剪辑时长时，从静音开始时刻剪辑待剪辑视频片段，得到已剪辑视频片段。

在某些实施方式中，处理器20还用于识别选取自同一初始视频的多个视频片段中的重复部分、及将具有相同的重复部分的N个视频片段中的任意N-1个视频片段中的重复部分剪辑掉。

在某些实施方式中，处理器20还用于按照每个已剪辑视频片段的起始时刻和结束时刻将所有已剪辑视频片段拼接为一个融合视频片段、及整合融合视频片段和预定音乐片段以输出推荐视频。

请参阅图2和图18，本申请实施方式的一种包含计算机可执行指令302的非易失性计算机可读存储介质300，当计算机可执行指令302被一个或多个处理器20执行时，使得处理器20可执行上述任一实施方式的视频编辑方法。

请参阅图1至图3，本申请实施方式的视频编辑方法包括以下步骤：

011：在初始视频中标记一个或多个视频片段；

012：根据预设音乐片段的相邻两个节奏点之间的间隔时长，从一个或多个视频片段中确定待剪辑视频片段，待剪辑视频片段的时长大于或者等于间隔时长；及

013：剪辑待剪辑视频片段，得到已剪辑视频片段，以已剪辑视频片段的起始时刻和结束时刻分别对应两个节奏点。

在某些实施方式中，视频编辑装置10包括获取模块11、确定模块12和编辑模块13。获取模块11用于在初始视频中标记一个或多个视频片段；确定模块12用于根据预设音乐片段的相邻两个节奏点之间的间隔时长，从一个或多个视频片段中确定待剪辑视频片段，待剪辑视频片段的时长大于或者等于间隔时长；编辑模块13用于剪辑待剪辑视频片段，得到已剪辑视频片段，以已剪辑视频片段的起始时刻和结束时刻分别对应两个节奏点。也即是说，步骤011、步骤012和步骤013可分别由获取模块11、确定模块12和编辑模块13实现。

在某些实施方式中，终端100还包括处理器20，处理器20用于在初始视频中标记一个或多个视频片段；根据预设音乐片段的相邻两个节奏点之间的间隔时长，从一个或多个视频片段中确定待剪辑视频片段，待剪辑视频片段的时长大于或者等于间隔时长；及剪辑待剪辑视频片段，得到已剪辑视频片段，以已剪辑视频片段的起始时刻和结束时刻分别对应两个节奏点。也即是说，步骤011和、步骤012和步骤013可以由处理器20实现。

具体地，终端100包括壳体30和处理器20。处理器20安装在壳体30内。更具体地，终端100可以是手机、平板电脑、显示器、笔记本电脑、柜员机、闸机、智能手表、头显设备、游戏机等。本申请实施方式以终端100是手机为例进行说明，可以理解，终端100的具体形式并不限于手机。壳体30还可用于安装终端100的成像装置、供电装置、通信装置等功能模块，以使壳体30为功能模块提供防尘、防摔、防水等保护。

在用户日常使用手机拍摄视频时，处理器20会自动对拍摄的初始视频进行分类，其中，初始视频可以是即时视频，例如在聊天软件中临时视频发送给对方，该种视频无需保存到系统相册；或者，初始视频也可以是已保存的视频，例如被用户使用系统相机拍摄得到的视频，或者用户手动从网络下载保存到系统相册内的视频。

处理器20根据初始视频的内容可将初始视频分为自拍、风景、宠物、萌娃、聚会等多种类别，其中，自拍类型的初始视频定义为视频中自拍图像的帧数占整个视频的帧数的比例是否大于第一预定比例(例如第一预定比例大于1/2)，自拍图像为人脸占据当前图像的比例大于第二预定比例(如第二预定比例为1/2)的图像；风景类型的初始视频定义为视频中风景图像占整个视频的帧数的比例是否大于第三预定比例(例如第三预定比例大于2/3)，风景图像为不包括人物图像的图像；宠物类型的初始视频定义为视频中宠物图像占整个视频的帧数的比例是否大于第四预定比例(例如第四预定比例大于2/3)，宠物图像为宠物的图像占当前图像的比例大于第五比例(例如第五预定比例大于1/3)的图像；聚会类型的初始视频定义为视频中聚会图像占整个视频的帧数的比例是否大于第六预定比例(例如第六预定比例大于3/4)，聚会图像为包含多个人物的图像。如此，可通过图像识别快速确定初始视频的类型。需要指出的是，上述第一预定比例至第六预定比例的数值仅为举例说明，并不能作为对本申请的限制。

在对初始视频确定好类型后，终端100可对初始视频中的精彩片段进行标记以得到一个或多个视频片段，精彩片段为初始视频中质量较高的视频片段，例如在自拍类型的初始视频中，存在人物脸部图像的视频部分可作为该初始视频中质量较高的部分；再例如，在聚会类型的初始视频中，多个人物同时存在的视频部分可作为该初始视频中质量较高的部分；再例如，在萌宠类型的初始视频中，宠物存在的视频部分可作为该初始视频中质量较高的部分；在此不再一一列举。当然，精彩片段也可以是用户手动选取较为喜欢的部分而被标记的。

终端100可将视频片段对应的视频参数(包括视频路径、视频类型、该视频片段的在初始视频中的时间信息(播放起始时刻和播放终止时刻)等)存入视频片段库中，在需要获取视频片段时，首先从视频片段库中获取视频片段的视频参数，然后根据视频参数从对应的初始视频中将该视频片段剪辑出来，例如，根据该视频片段的视频路径找到对应的初始视频，然后根据该视频片段的时间信息从初始视频中将该视频片段剪辑出来。如此，视频片段库中不需要存储所有已被标记为精彩片段的视频片段的视频文件，而是只需要存储该视频片段对应的视频参数即可，所需的存储空间较小。

终端100可获取一个或多个视频片段，例如终端100会从同类型的多个初始视频中获取一个或多个视频片段，在编辑初始视频时，会根据已经选取好的视频片段的视频参数，将一个或多个视频片段从对应的视频中剪辑出来，然后拼接以生成一个新的剪辑视频，例如对多个自拍类型的初始视频进行编辑以生成一个自拍类型的剪辑视频；或者，对多个风景类型的初始视频进行编辑以生成风景类型的剪辑视频；或者，对多个萌宠类型的初始视频进行编辑以生成萌宠类型的剪辑视频等。

剪辑视频包括从一个或多个初始视频中选取的一个或多个视频片段，多个视频片段可以来自同一初始视频(例如，在同一初始视频中选取3个视频片段)，多个视频片段也可以分为来自多个初始视频(例如，在3个初始视频中分别选取1个、2个和3个视频片段)。在生成剪辑视频后，可仅作为临时文件进行保存，在用户对该剪辑视频满意时，可手动选择保存，而在用户对临时的剪辑视频不满意，或者在一定时间内没有对临时的剪辑视频进行操作，则删除该剪辑视频。如此，可对用户的喜好剪辑视频进行分析，如用户从不保存风景类型的剪辑视频，则可确定用户不喜欢风景类型的剪辑视频，后续可不再生成风景类型的剪辑视频，而在用户对生成的自拍类型的剪辑视频均进行保存时，则可确定用户较为喜欢自拍类型的剪辑视频，可在后续生成更多的自拍类型的剪辑视频。

为了增加剪辑视频的表现力和冲击力，处理器20可为剪辑视频配上背景音乐，背景音乐的作用在剪辑视频中的不可忽视，背景音乐可调动观看者的情绪，一个剪辑视频配上合适的背景音乐，其表现力和冲击力会得到很大的提升，其中，背景音乐为播放剪辑视频时，与剪辑视频同步播放的一段音乐。本申请实施方式中，预定音乐片段即为背景音乐，预定音乐片段会与剪辑视频一起播放，以作为剪辑视频中的背景音乐。在获取预定音乐片段(即，背景音乐时)时，可根据需要剪辑的多个初始视频的类型，从终端100或云端预设的背景音乐库中选取一段合适的音乐作为背景音乐，或者从用户下载的音乐、用户经常播放的音乐中选取一段音乐作为背景音乐。或者，用户可手动创建背景音乐库，将自己喜欢的背景音乐存在背景音乐库中。处理器20在获取背景音乐时，可从该背景音乐库中选取一段合适的音乐作为背景音乐。

视频片段中原本存在的音频片段，如音频片段包括人物的说话声、环境噪音、背景音乐等，为了防止视频片段的背景音乐和预定音乐片段同时播放，影响剪辑视频的观看效果，可通过识别视频片段中的背景音乐并将该背景音乐从音频片段中剪出来，使得视频片段仅保留说话声、环境噪音等。从而使得根据视频片段生成的剪辑视频和预定音乐片段同步播放时，仅有一个预定音乐片段作为背景音乐来播放，剪辑视频的观看效果较好。

音乐一般存在节奏点，节奏点是根据音乐起伏或者自身节拍而得出的关键时间点。例如，节奏点可以是鼓点，也可以是音乐中的节拍点，人们欣赏一些音乐时，会随着音乐的节奏打拍子，打拍子的点也可以是节奏点。再例如，节奏点可根据背景音乐的频谱，通过频域分析的方式获取背景音乐的节奏点，一般节奏点对应的位置的频谱的变化较为明显。对于背景音乐库中的音乐，可事先就确定好节奏点，处理器20在获取背景音乐时，即可一并获取节奏点信息，从而提高视频剪辑的效率。

在处理器20获取到背景音乐及节奏点信息后，会从视频片段库中确定与相邻的两个节奏点匹配的视频片段，从而确定待剪辑视频片段。可以理解，视频片段的时长越接近两个节奏点之间的时长，所需剪辑的部分就越少。因此，处理器20可从视频片段库中确定与相邻两个节奏点之间的间隔时长相匹配的视频片段作为与该两个节奏点对应的待剪辑视频片段，例如，将时长差最小的视频片段确定为待剪辑视频片段，时长差为视频片段的时长和间隔时长的差值，此时在对待剪辑视频片段进行剪辑时，只需剪辑出和间隔时长对应的部分(即，只需将超过间隔时长的部分剪辑掉)，由于待剪辑视频片段的时长和间隔时长的时长差最小，相对其他视频片段作为待剪辑视频片段进行剪辑而言，被剪辑掉的视频内容较少，可尽可能的保证剪辑后得到的已剪辑视频片段(即，待剪辑视频片段剪辑掉超过间隔时长的部分后，剩余的视频片段部分)的完整性。在图4所示的例子中，待剪辑的视频片段为3个，分别为视频片段A、视频片段B和视频片段C，视频片段A的时长为6秒(S)、视频片段B的时长为8S，视频片段C的时长为10S，背景音乐M包括四个节奏点(分别为S1、S2、S3和S4)，节奏点S1和节奏点S2之间的间隔时长为5.5S，节奏点S2和节奏点S3之间的间隔时长为9.5S，节奏点S3和节奏点S4之间的间隔时长为7.5S，经过简单计算即可确定与节奏点S1和节奏点S2的间隔时长的时长差最小的视频片段为视频片段A(下称待剪辑视频片段A)，与节奏点S2和节奏点S3的间隔时长的时长差最小的视频片段为视频片段C(下称待剪辑视频片段C)，与节奏点S3和节奏点S4的间隔时长的时长差最小的视频片段为视频片段B(下称待剪辑视频片段B)，在剪辑时，每个视频片段均只需剪辑超过对应的间隔时长的部分的视频内容，而保留和间隔时长对应的部分，如待剪辑视频片段A剪辑掉的部分为a部分，保留的部分为待剪辑视频片段A中除a部分之外的部分；待剪辑视频片段B剪辑掉的部分为b部分，保留的部分为待剪辑视频片段B中除b部分之外的部分，待剪辑视频片段C剪辑掉的部分为c部分，保留的部分为待剪辑视频片段C中除c部分之外的部分，被剪辑掉的a部分、b部分和c部分均为0.5S，被剪辑掉的视频内容较少，保留的部分则刚好和对应的间隔时长相等。

在完成剪辑后，得到的已剪辑视频片段A’(即，待剪辑视频片段A中除a部分之外的部分)的时长刚好等于节奏点S1和节奏点S2之间间隔时长；得到的已剪辑视频片段B’(即，待剪辑视频片段B中除b部分之外的部分)的时长刚好等于节奏点S2和节奏点S3之间间隔时长；得到的已剪辑视频片段C’(即，待剪辑视频片段C中除c部分之外的部分)的时长刚好等于节奏点S3和节奏点S4之间间隔时长，已剪辑视频片段的起始时刻和结束时刻分别为对应的两个节奏点，从而实现已剪辑视频片段与该两个节奏点对应的背景音乐的同步播放。

用户在人工进行视频剪辑过程中，存在需要耗费用户很多的时间和精力，剪辑效率也较低的问题。

本申请的视频编辑方法、视频编辑装置和终端100可根据背景音乐的相邻节奏点之间的间隔时长选取匹配的视频片段，使得每个视频片段能够和节奏点配合，被剪辑掉的视频内容较少，保证了每个视频片段的完整性。且无需人为进行视频片段和背景音乐的节奏点的匹配，节省了用户的时间和精力，剪辑效率也较高。

请参阅图2、图5和图6，在某些实施方式中，步骤012包括以下步骤：

0121：确定一个或多个视频片段中，时长大于间隔时长、且时长差为所有时长差中的最小值的视频片段为待剪辑视频片段，时长差为视频片段的时长和间隔时长的差值。

在某些实施方式中，确定模块12包括确定单元121。确定单元121用于确定一个或多个视频片段中，时长大于间隔时长、且时长差为所有时长差中的最小值的视频片段为待剪辑视频片段，时长差为视频片段的时长和间隔时长的差值。也即是说，步骤0121可以由确定单元121实现。

在某些实施方式中，处理器20用于确定一个或多个视频片段中，时长大于间隔时长、且时长差为所有时长差中的最小值的视频片段为待剪辑视频片段，时长差为视频片段的时长和间隔时长的差值。也即是说，步骤014可以由处理器20实现。

具体地，请参阅图4，在从视频片段库中确定与节奏点S1和节奏点S2的间隔时长匹配的视频片段时，当视频片段的时长小于节奏点S1和节奏点S2之间的间隔时长时(如视频片段D的时长为6S，小于7.5S时)，若将视频片段D与节奏点S1和节奏点S2去匹配，虽然不需要对视频片段D进行剪辑，但会出现剪辑视频在播放时，存在背景音乐在播放而没有对应的视频内容显示的情况。因此，在对相邻两个节奏点匹配视频片段时，时长小于间隔时长的视频片段均不能作为待剪辑视频片段。

在视频片段的时长大于间隔时长时，为了使得视频片段被剪辑的内容最少，在时长差为所有视频片段和间隔时长的时长差中的最小值时，即可确定该最小的时长差对应的视频片段为待剪辑视频片段，例如，在对图4中的节奏点S1和节奏点S2待剪辑视频片段时，视频片段A和节奏点S1和节奏点S2间隔时长的时长差为0.5S，视频片段B和节奏点S1和节奏点S2间隔时长的时长差为2.5S，视频片段C和节奏点S1和节奏点S2间隔时长的时长差为4.5S，此时以时长差最小的视频片段A作为节奏点S1和节奏点S2对应的待剪辑视频片段，所需剪辑的视频内容最少。当然，在视频片段的时长等于间隔时长，即可确定该视频片段为该间隔时长对应的待剪辑视频片段，此时无需剪辑，视频片段的完整性较好，不会出现背景音乐在播放而没有对应的视频内容显示的情况。

请参阅图2、图7和图8，在某些实施方式中，步骤013包括以下步骤：

0131：识别待剪辑视频片段中的静音开始时刻和静音结束时刻；及

0132：在第一时长大于剪辑时长时，从起始时刻向后剪辑待剪辑视频片段，得到已剪辑视频片段，第一时长为待剪辑视频片段的起始时刻对应的静音时长，剪辑时长等于待剪辑视频片段中超过间隔时长的部分的时长；及

0133：在第二时长大于剪辑时长时，从结束时刻向前剪辑待剪辑视频片段，得到已剪辑视频片段，第二时长为待剪辑视频片段的结束时刻对应的静音时长。

在某些实施方式中，编辑模块13包括识别单元131、第一剪辑单元132和第二剪辑单元133。识别单元131用于识别待剪辑视频片段中的静音开始时刻和静音结束时刻。第一剪辑单元132用于在第一时长大于剪辑时长时，从起始时刻向后剪辑待剪辑视频片段，得到已剪辑视频片段，第一时长为待剪辑视频片段的起始时刻对应的静音时长，剪辑时长等于待剪辑视频片段中超过间隔时长的部分的时长。第二剪辑单元133用于在第二时长大于剪辑时长时，从结束时刻向前剪辑待剪辑视频片段，得到已剪辑视频片段，第二时长为待剪辑视频片段的结束时刻对应的静音时长。也即是说，步骤0131、步骤0132和步骤0133可分别由识别单元131、第一剪辑单元132和第二剪辑单元13实现。

在某些实施方式中，处理器20还用于识别待剪辑视频片段中的静音开始时刻和静音结束时刻；在第一时长大于剪辑时长时，从起始时刻向后剪辑待剪辑视频片段，得到已剪辑视频片段，第一时长为待剪辑视频片段的起始时刻对应的静音时长，剪辑时长等于待剪辑视频片段中超过间隔时长的部分的时长；及在第二时长大于剪辑时长时，从结束时刻向前剪辑待剪辑视频片段，得到已剪辑视频片段，第二时长为待剪辑视频片段的结束时刻对应的静音时长。也即是说，步骤0131、步骤0132和步骤0133可以由处理器20实现。

具体地，可以理解，在对待剪辑视频片段进行剪辑时，将待剪辑视频片段中和间隔时长对应的部分剪辑出来(即，剪辑掉待剪辑视频片段中超过间隔时长的部分)时，剪辑的位置可能正好是用户一句话还没说完的位置，若直接剪辑的话可能导致待剪辑视频片段中一段完整的话被剪辑掉了一部分，十分影响观看体验。因此，处理器20在剪辑前，可首先识别待剪辑视频片段的静音开始时刻和静音结束时刻，其中，静音开始时刻指的是视频片段中角色开始讲话的时刻，而静音结束时刻则是指该角色讲完一段话的时刻，当然，为了防止将一段完整的语句之间的停顿位置(如犹豫、口吃、呼吸等)也作为静音结束时刻，而导致完整的语句被剪辑掉一部分，处理器20可在该角色讲完一段话的时刻后预设时长(例如预设时长为1S)内均没有用户讲话时，才确定该时刻为静音结束时刻。如此，可准确地确定静音开始时刻和静音结束时刻。

请参阅图9，在一个例子中，视频片段E包括4个静音开始时刻(分别为P0、P2、P4和P6)和3个静音结束时刻(分别为P1、P3和P5)，视频片段E的剪辑时长为0.5S，在起始时刻P0对应的静音时长(即，第一时长P0P1)大于或等于剪辑时长时，表示视频片段的从起始时刻P0一直到距离起始时刻P0最近的静音结束时刻P1均没有角色讲话，此时以起始时刻P0向后(即，向结束时刻P7方向)剪辑掉剪辑时长，被剪辑的部分均位于起始时刻P0对应的静音时长内，不会影响角色讲的一段话的完整性。若角色在起始时刻P0即开始讲话，此时起始时刻P0将被识别为静音结束时刻(即，起始时刻P0没有对应的静音时长)，此时无法从起始时刻P0进行剪辑。因此，在起始时刻P0存在对应静音时长，且第一时长P0P1大于或等于剪辑时长时，处理器20可以起始时刻向后剪辑待剪辑视频片段中，超过间隔时长的部分，即从起始时刻向后剪辑掉剪辑时长的视频内容即可。

在结束时刻P7对应的静音时长(即，第二时长P6P7)大于或等于剪辑时长时，表示视频片段的结束时刻P7到距离结束时刻P7最近的静音开始时刻P6之间均没有角色讲话，此时以结束时刻P7向前(即，向起始时刻P0方向)剪辑掉剪辑时长，被剪辑的部分均位于结束时刻P7对应的静音时长内，也不会影响角色讲的一段话的完整性。若在静音开始时刻P6和结束时刻P7之间存在静音结束时刻，且静音结束时刻和结束时刻P7之间不存在静音开始时刻，则表示该静音结束时刻至结束时刻P7之间，角色一直在讲话(即，结束时刻P7没有对应的静音时长)，此时无法从结束时刻P7进行剪辑。因此，在结束时刻P7存在对应静音时长，且第二时长P6P7大于或等于剪辑时长时，处理器20可以结束时刻向前剪辑待剪辑视频片段中，超过间隔时长的部分，即从结束时刻向前剪辑掉剪辑时长的视频内容即可。如此，在保证视频片段中角色讲话的完整性的前提下进行剪辑，以剪辑视频片段中超过间隔时长的部分。

请参阅图2、图10和图11，在某些实施方式中，步骤013还包括以下步骤：

0134：在第一时长和第二时长均小于剪辑时长时，判断第一时长和第二时长之和是否大于剪辑时长；及

0135：在第一时长和第二时长之和大于剪辑时长时，分别从待剪辑视频片段的起始时刻和结束时刻剪辑待剪辑视频片段，得到已剪辑视频片段。

在某些实施方式中，编辑模块13还包括判断单元134和第三剪辑单元135。判断单元134用于在第一时长和第二时长均小于剪辑时长时，判断第一时长和第二时长之和是否大于剪辑时长。第三剪辑单元135用于在第一时长和第二时长之和大于剪辑时长时，分别从待剪辑视频片段的起始时刻和结束时刻剪辑待剪辑视频片段，得到已剪辑视频片段。也即是说，步骤0134和步骤0135可分别由判断单元134和第三剪辑单元135。

在某些实施方式中，处理器20还用于在第一时长和第二时长均小于剪辑时长时，判断第一时长和第二时长之和是否大于剪辑时长；及在第一时长和第二时长之和大于剪辑时长时，分别从待剪辑视频片段的起始时刻和结束时刻剪辑待剪辑视频片段，得到已剪辑视频片段。也即是说，步骤0134和步骤0135可以由处理器20实现。

具体地，请结合图9，在第一时长P0P1和第二时长P6P7均小于剪辑时长时(例如剪辑时长为2S，第一时长P0P1＝1.5S，第二时长P6P7＝1S)，此时不论是从起始时刻向后剪辑剪辑时长的视频内容，还是从结束时刻向前剪辑剪辑时长的视频内容，均会导致角色讲的一段话的完整性因剪辑而破坏。因此，处理器20可在此时判断第一时长P0P1和第二时长P6P7之和是否大于或等于剪辑时长，在第一时长P0P1和第二时长P6P7之和大于或等于剪辑时长时(如图9所示的例子中，P0P1+P6P7＝2.5S＞2S)，处理器20可分别从起始时刻P0向后剪辑小于或等于第一时长P0P1的第一剪辑时长(如第一剪辑时长为1S)，从结束时刻P7向前剪辑小于或等于第二时长P6P7的第二剪辑时长(如第一剪辑时长为1S)，使得第一剪辑时长和第二剪辑时长之和刚好等于剪辑时长，从而得到已剪辑视频片段。

如此，处理器20可在第一时长P0P1和第二时长P6P7均小于剪辑时长、且第一时长P0P1和第二时长P6P7之和大于或等于剪辑时长时，分别从起始时刻P0和结束时刻P7剪辑视频片段中超过间隔时长的部分，可保证剪辑后保留下来的部分(即，已剪辑视频片段)与间隔时长对应，可保证已剪辑视频片段中的角色讲话的完整性。

请参阅图2、图12和图13，在某些实施方式中，步骤013还包括以下步骤：

0136：在第一时长和第二时长之和小于剪辑时长时，获取静音开始时刻对应的静音时长；

0137：在静音开始时刻对应的静音时长大于剪辑时长时，从静音开始时刻剪辑待剪辑视频片段，得到已剪辑视频片段。

在某些实施方式中，编辑模块13还包括获取单元136和第四剪辑单元137。获取单元136用于在第一时长和第二时长之和小于剪辑时长时，获取静音开始时刻对应的静音时长；第四剪辑单元137用于在静音开始时刻对应的静音时长大于剪辑时长时，从静音开始时刻剪辑待剪辑视频片段，得到已剪辑视频片段。也即是说，步骤0136和步骤0137可分别由获取单元136和第四剪辑单元137实现。

在某些实施方式中，处理器20还用于在第一时长和第二时长之和小于剪辑时长时，获取静音开始时刻对应的静音时长、及在静音开始时刻对应的静音时长大于剪辑时长时，从静音开始时刻剪辑待剪辑视频片段，得到已剪辑视频片段。也即是说，步骤0136和步骤0137可以由处理器20实现。

具体地，请结合图9，例如此时的剪辑时长为3S，当第一时长P0P1和第二时长P6P7均小于剪辑时长、且第一时长P0P1和第二时长P6P7之和小于剪辑时长时，此时从起始时刻P0向后剪辑、从结束时刻P7向前剪辑、或分别时从起始时刻P0向后剪辑和从结束时刻P7向前剪辑均会使得剪辑后的视频片段中的角色说话的完整性破坏，因此，处理器20首先可先获取每个静音开始时刻(分别为P0、P2、P4和P6)对应的静音时长(即，静音开始时刻至对应的静音结束时刻之间的时长，如静音时长P0P1＝1.5S，静音时长P2P3＝3.5S，静音时长P4P5＝1.4S，静音时长P6P7＝1S)，然后在选取任一大于剪辑时长的静音时长(如静音时长P2P3)，从静音时长P2P3的静音开始时刻P2开始剪辑，剪辑掉剪辑时长(如剪辑时长为3S)的视频内容，此时被剪辑的部分均处于静音时长内，所以剪辑的部分不会影响剪辑后的视频片段中角色讲话的完整性。最后处理器20将剪辑后剩下的两部分的视频片段拼接成一个已剪辑视频片段即可，该已剪辑视频片段的时长等于对应的两个节奏点之间的间隔时长。

请参阅图2、图14和图15，在某些实施方式中，视频编辑方法还包括：

014：识别选取自同一初始视频的多个视频片段中的重复部分；及

015：将具有相同的重复部分的N个视频片段中的任意N-1个视频片段中的重复部分剪辑掉，N为大于1的正整数。

在某些实施方式中，视频编辑装置10还包括识别模块14和剪辑模块15。识别模块14用于识别选取自同一初始视频的多个视频片段中的重复部分。剪辑模块15用于将具有相同的重复部分的N个视频片段中的任意N-1个视频片段中的重复部分剪辑掉。也即是说，步骤014和步骤015可分别由识别模块14和剪辑模块15实现。

在某些实施方式中，处理器20还用于识别选取自同一初始视频的多个视频片段中的重复部分、及将具有相同的重复部分的N个视频片段中的任意N-1个视频片段中的重复部分剪辑掉。也即是说，步骤014和步骤015可以由处理器20实现。

具体地，在剪辑前，处理器20获取的多个视频片段可能有来自同一初始视频的多个视频片段，选取自同一初始视频的多个视频片段可能存在重复部分，若剪辑视频存在多个具有相同重复部分的视频片段，则剪辑视频在播放时会多次播放该重复部分，一般的，对于重复的部分，观众并不想第二次看到，因此，重复部分的多次播放可能会影响剪辑视频的观赏性和冲击力。因此，处理器20可以识别首先识别多个视频片段中来自同一初始视频的视频片段的重复部分。处理器20在比对多个视频片段是否存在相同的重复部分时，可首先获取该视频片段的视频信息(如视频路径)，根据视频的路径可找到每个视频片段对应的初始视频，多个视频片段的视频路径相同即表示多个视频片段选取自同一个初始视频，而不同初始视频的视频片段一般不存在重复部分，因此，本实施方式中，处理器20仅比对选取自同一初始视频的多个视频片段以识别重复部分。可以理解，在选取视频片段时处理器20就可获取到每个视频片段在初始视频中的时间信息(如播放起始时刻和播放终止时刻)。处理器20在获取到每个视频片段在初始视频中的播放起始时刻和终止时刻后，可判断两个视频片段的播放起始时刻和播放终止时刻是否存在交叉，若两个视频片段的播放起始时刻和播放终止时刻存在交叉，则表示该两个视频片段存在重复部分。例如图16中，视频片段F选自图17的初始视频O第1S到第5S的部分(即播放起始时刻为第1S，播放终止时刻为第5S)，视频片段G选自初始视频O第4S到第9S的部分(即播放起始时刻为第4S，播放终止时刻为第9S)，视频片段H选自初始视频O第7S到第13S的部分(即播放起始时刻为第7S，播放终止时刻为第13S)。视频片段F的“1”部分和视频片段G的“2”部分交叉，均为初始视频O中第4S到第5S的视频片段，为重复部分；视频片段G的“3”部分和视频片段H的“4”部分交叉，均为初始视频O中第7S到第9S的视频片段，也为重复部分。如此，无需进行图像识别来比对每个视频片段的视频内容，即可快速确定重复部分。

在确定重复部分后，处理器20将存在同样的重复部分的N个视频片段(如图16中的3个视频片段)中的N-1个(即2个，如分别为视频片段G和视频片段H)中的重复部分剪辑掉，而仅仅保留其中一个视频片段(即，视频片段F)的重复部分，这样在后续将所有剪辑后的视频片段根据节奏点拼接起来后，剪辑视频在播放时，重复部分仅播放一次，观众的观赏体验较好。

请参阅图2、图18和图19，在某些实施方式中，视频编辑方法还包括：

016：按照每个已剪辑视频片段的起始时刻和结束时刻将所有已剪辑视频片段拼接为一个融合视频片段；及

017：整合融合视频片段和预定音乐片段以输出推荐视频。

在某些实施方式中，视频编辑装置10还包括拼接模块16和整合模块17。拼接模块16用于按照每个已剪辑视频片段的起始时刻和结束时刻将所有已剪辑视频片段拼接为一个融合视频片段；整合模块17用于整合融合视频片段和预定音乐片段以输出推荐视频。也即是说，步骤016和步骤017可分别由拼接模块16和整合模块17实现。

在某些实施方式中，处理器20还用于按照每个已剪辑视频片段的起始时刻和结束时刻将所有已剪辑视频片段拼接为一个融合视频片段、及整合融合视频片段和预定音乐片段以输出推荐视频。也即是说，步骤016和步骤017可以由处理器20实现。

具体地，如图4所示，已剪辑视频片段A’的起始时刻和结束时刻分别对应节奏点S1和节奏点S2，已剪辑视频片段B’起始时刻和结束时刻分别对应节奏点S2和节奏点S3，已剪辑视频片段C’起始时刻和结束时刻分别对应节奏点S3和节奏点S4，处理器20可按照已剪辑视频片段的起始时刻和结束时刻的顺序(即，对应的节奏点的顺序)，将剪辑后的已剪辑视频片段A’、已剪辑视频片段B’和已剪辑视频片段C’拼接形成一个新的融合视频片段V1，然后将融合视频片段V1和背景音乐M整合成一个推荐视频V2，在播放推荐视频V2时，已剪辑视频片段A’和背景音乐M中处于节奏点S1和S2之间的音乐同时开始播放且同时结束播放，已剪辑视频片段B’和背景音乐M中处于节奏点S3和S4之间的音乐同时开始播放且同时结束播放，已剪辑视频片段C’和背景音乐M中处于节奏点S2和S3之间的音乐同时开始播放且同时结束播放。如此，使得拼接后的已剪辑视频片段和背景音乐能够很好的配合，从而提高推荐视频V2的冲击力和表现力。

请参阅图2和图18，本申请实施方式的一个或多个包含计算机可执行指令302的非易失性计算机可读存储介质300，当计算机可执行指令302被一个或多个处理器20执行时，使得处理器20可执行上述任一实施方式的视频编辑方法。

例如，请结合图1，当计算机可执行指令302被一个或多个处理器20执行时，使得处理器20执行以下步骤：

011：在初始视频中标记一个或多个视频片段；

再例如，请结合图5，当计算机可执行指令302被一个或多个处理器20执行时，处理器20还可以执行以下步骤：

0138：确定一个或多个视频片段中，时长大于间隔时长、且时长差为所有时长差中的最小值的视频片段为待剪辑视频片段，时长差为视频片段的时长和间隔时长的差值。

尽管上面已经示出和描述了本申请的实施方式，可以理解的是，上述实施方式是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施方式进行变化、修改、替换和变型，本申请的范围由权利要求及其等同物限定。

Claims

一种视频编辑方法，其特征在于，所述视频编辑方法包括：

在初始视频中标记一个或多个视频片段；

根据预设音乐片段的相邻两个节奏点之间的间隔时长，从所述一个或多个视频片段中确定待剪辑视频片段，所述待剪辑视频片段的时长大于或者等于所述间隔时长；及

剪辑所述待剪辑视频片段，得到已剪辑视频片段，以所述已剪辑视频片段的起始时刻和结束时刻分别对应两个所述节奏点。
根据权利要求1所述的视频编辑方法，其特征在于，所述根据预设音乐片段的相邻两个节奏点之间的间隔时长，从所述一个或多个视频片段中确定待剪辑视频片段，包括：

确定所述一个或多个视频片段中，时长大于所述间隔时长、且时长差为所有时长差中的最小值的视频片段为所述待剪辑视频片段，所述时长差为所述视频片段的时长和所述间隔时长的差值。
根据权利要求1所述的视频编辑方法，其特征在于，所述剪辑所述待剪辑视频片段，得到已剪辑视频片段，包括：

识别所述待剪辑视频片段中的静音开始时刻和静音结束时刻；

在第一时长大于剪辑时长时，从所述起始时刻向后剪辑所述待剪辑视频片段，得到所述已剪辑视频片段，所述第一时长为所述待剪辑视频片段的起始时刻对应的静音时长，所述剪辑时长等于所述待剪辑视频片段中超过所述间隔时长的部分的时长；及

在第二时长大于所述剪辑时长时，从所述结束时刻向前剪辑所述待剪辑视频片段，得到所述已剪辑视频片段，所述第二时长为所述待剪辑视频片段的结束时刻对应的所述静音时长。
根据权利要求3所述的视频编辑方法，其特征在于，所述剪辑所述待剪辑视频片段，得到已剪辑视频片段，还包括：

在所述第一时长和所述第二时长均小于所述剪辑时长时，判断所述第一时长和所述第二时长之和是否大于所述剪辑时长；及

在所述第一时长和所述第二时长之和大于所述剪辑时长时，分别从所述待剪辑视频片段的起始时刻和结束时刻剪辑所述待剪辑视频片段，得到所述已剪辑视频片段。
根据权利要求4所述的视频编辑方法，其特征在于，所述剪辑所述待剪辑视频片段，得到已剪辑视频片段，还包括：

在所述第一时长和所述第二时长之和小于所述剪辑时长时，获取所述静音开始时刻对应的所述静音时长；及

在所述静音开始时刻对应的所述静音时长大于所述剪辑时长时，从所述静音开始时刻剪辑所述待剪辑视频片段，得到所述已剪辑视频片段。
根据权利要求1所述的视频编辑方法，其特征在于，所述视频编辑方法还包括：

识别选取自同一所述初始视频的多个视频片段中的重复部分；及

将具有相同的所述重复部分的N个视频片段中的任意N-1个视频片段中的所述重复部分剪辑掉，所述N为大于1的正整数。
根据权利要求1所述的视频编辑方法，其特征在于，所述视频编辑方法还包括：

按照每个所述已剪辑视频片段的起始时刻和结束时刻将所有所述已剪辑视频片段拼接为一个融合视频片段；及

整合所述融合视频片段和所述预定音乐片段以输出推荐视频。
一种视频的视频编辑装置，其特征在于，所述视频编辑装置包括：

获取模块，用于在初始视频中标记一个或多个视频片段；

确定模块，用于根据预设音乐片段的相邻两个节奏点之间的间隔时长，从所述一个或多个视频片段中确定待剪辑视频片段，所述待剪辑视频片段的时长大于或者等于所述间隔时长；及

编辑模块，用于剪辑所述待剪辑视频片段，得到已剪辑视频片段，以所述已剪辑视频片段的起始时刻和结束时刻分别对应两个所述节奏点。
根据权利要求8所述的视频编辑装置，其特征在于，所述确定模块包括确定单元，所述确定单元用于确定所述一个或多个视频片段中，时长大于所述间隔时长、且时长差为所有时长差中的最小值的视频片段为所述待剪辑视频片段，所述时长差为所述视频片段的时长和所述间隔时长的差值。
根据权利要求8所述的视频编辑装置，其特征在于，所述编辑模块包括识别单元、第一剪辑单元和第二剪辑单元，所述识别单元用于识别所述待剪辑视频片段中的静音开始时刻和静音结束时刻；所述第一剪辑单元用于在第一时长大于剪辑时长时，从所述起始时刻向后剪辑所述待剪辑视频片段，得到所述已剪辑视频片段，所述第一时长为所述待剪辑视频片段的起始时刻对应的静音时长，所述剪辑时长等于所述待剪辑视频片段中超过所述间隔时长的部分的时长；所述第二剪辑单元用于在第二时长大于所述剪辑时长时，从所述结束时刻向前剪辑所述待剪辑视频片段，得到所述已剪辑视频片段，所述第二时长为所述待剪辑视频片段的结束时刻对应的所述静音时长。
根据权利要求10所述的视频编辑装置，其特征在于，所述编辑模块还包括判断单元和第三剪辑单元，所述判断单元用于在所述第一时长和所述第二时长均小于所述剪辑时长时，判断所述第一时长和所述第二时长之和是否大于所述剪辑时长；所述第三剪辑单元用于在所述第一时长和所述第二时长之和大于所述剪辑时长时，分别从所述待剪辑视频片段的起始时刻和结束时刻剪辑所述待剪辑视频片段，得到所述已剪辑视频片段。
根据权利要求11所述的视频编辑装置，其特征在于，所述编辑模块还包括获取单元和第四剪辑单元，所述获取单元用于在所述第一时长和所述第二时长之和小于所述剪辑时长时，获取所述静音开始时刻对应的所述静音时长；；所述第四剪辑单元用于在所述静音开始时刻对应的所述静音时长大于所述剪辑时长时，从所述静音开始时刻剪辑所述待剪辑视频片段，得到所述已剪辑视频片段。
一种终端，其特征在于，所述终端包括处理器，所述处理器用于：

在初始视频中标记一个或多个视频片段；

根据预设音乐片段的相邻两个节奏点之间的间隔时长，从所述一个或多个视频片段中确定待剪辑视频片段，所述待剪辑视频片段的时长大于或者等于所述间隔时长；及

剪辑所述待剪辑视频片段，得到已剪辑视频片段，以所述已剪辑视频片段的起始时刻和结束时刻分别对应两个所述节奏点。
根据权利要求13所述的终端，其特征在于，所述处理器还用于：

确定所述一个或多个视频片段中，时长大于所述间隔时长、且时长差为所有时长差中的最小值的视频片段为所述待剪辑视频片段，所述时长差为所述视频片段的时长和所述间隔时长的差值。
根据权利要求13所述的终端，其特征在于，所述处理器还用于：

识别所述待剪辑视频片段中的静音开始时刻和静音结束时刻；

在第一时长大于剪辑时长时，从所述起始时刻向后剪辑所述待剪辑视频片段，得到所述已剪辑视频片段，所述第一时长为所述待剪辑视频片段的起始时刻对应的静音时长，所述剪辑时长等于所述待剪辑视频片段中超过所述间隔时长的部分的时长；及

在第二时长大于所述剪辑时长时，从所述结束时刻向前剪辑所述待剪辑视频片段，得到所述已剪辑视频片段，所述第二时长为所述待剪辑视频片段的结束时刻对应的所述静音时长。
根据权利要求15所述的终端，其特征在于，所述处理器还用于：

在所述第一时长和所述第二时长均小于所述剪辑时长时，判断所述第一时长和所述第二时长之和是否大于所述剪辑时长；及

在所述第一时长和所述第二时长之和大于所述剪辑时长时，分别从所述待剪辑视频片段的起始时刻和结束时刻剪辑所述待剪辑视频片段，得到所述已剪辑视频片段。
根据权利要求16所述的终端，其特征在于，所述处理器还用于：

在所述第一时长和所述第二时长之和小于所述剪辑时长时，获取所述静音开始时刻对应的所述静音时长；及

在所述静音开始时刻对应的所述静音时长大于所述剪辑时长时，从所述静音开始时刻剪辑所述待剪辑视频片段，得到所述已剪辑视频片段。
根据权利要求13所述的终端，其特征在于，所述处理器还用于：

识别选取自同一所述初始视频的多个视频片段中的重复部分；及

将具有相同的所述重复部分的N个视频片段中的任意N-1个视频片段中的所述重复部分剪辑掉，所述N为大于1的正整数。
根据权利要求13所述的终端，其特征在于，所述处理器还用于：

按照每个所述已剪辑视频片段的起始时刻和结束时刻将所有所述已剪辑视频片段拼接为一个融合视频片段；及

整合所述融合视频片段和所述预定音乐片段以输出推荐视频。
一种包含计算机可执行指令的非易失性计算机可读存储介质，当所述计算机可执行指令被一个或多个处理器执行时，使得所述处理器执行如权利要求1至7中任一项所述的视频编辑方法。