CN117041679A

CN117041679A - 视频剪辑方法、装置、计算机设备及存储介质

Info

Publication number: CN117041679A
Application number: CN202311035412.4A
Authority: CN
Inventors: 洪嘉慧
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2023-08-16
Filing date: 2023-08-16
Publication date: 2023-11-10

Abstract

本申请提供了一种视频剪辑方法、装置、终端及存储介质，属于视频处理技术领域。本申请实施例提供的方法，通过基于视频所属的垂类，来自动确定该视频剪辑时所需要执行的剪辑任务，并通过剪辑任务的剪辑界面，来基于视频的视频内容等为用户提供相应剪辑任务的任务细节，以为用户提供辅助剪辑功能，无需用户自己设计剪辑任务以及手工选择各个任务细节，就可以实现基于视频内容的剪辑，提升了视频创作的自动化程度和效率，提供了更优的用户体验。

Description

视频剪辑方法、装置、计算机设备及存储介质

技术领域

本申请涉及视频处理领域，特别涉及一种视频剪辑方法、装置、计算机设备及存储介质。

背景技术

随着视频平台的普及，越来越多的用户在网上进行创作和上传视频。用户上传视频前需要对视频进行剪辑，因此，如何提高视频剪辑效率是本领域研究的重点。

目前，通常采用的视频剪辑方式是运用视频剪辑软件，一般的视频剪辑软件以手工剪辑为主，需要用户人工检索、选择、组合视频片段，并且手动输入视频字幕和标题文案。

但是，上述技术方案有诸多不足：(1)手工剪辑依赖专业技能，对于普通用户来说创作难度大。(2)人工操作不够高效，使得视频片段的检索、选择与组合效率低下。因此，上述视频剪辑方式造成视频剪辑效率低。

发明内容

本申请实施例提供了一种视频剪辑方法、装置、终端及存储介质，用于可以实现基于视频内容的剪辑，提升了视频创作的自动化程度和效率，提供了更优的用户体验。所述技术方案如下：

一方面，提供了一种视频剪辑方法，所述方法包括：

显示待剪辑的视频；

基于所述视频所属的垂类，显示所述垂类对应的至少一个剪辑任务的剪辑界面，所述剪辑任务包括片段组织任务和视频包装任务，所述片段组织任务用于组织所述视频的多个视频片段，所述视频包装任务用于基于视频包装素材对视频进行包装；

对于任一个剪辑界面，在所述剪辑界面中显示对应的剪辑任务的推荐执行信息，所述推荐执行信息基于所述视频的视频内容确定，用于指示执行所述剪辑任务的任务细节；

响应于对所述推荐执行信息的确认操作，对所述视频执行所述剪辑任务。

在一些实施例中，所述显示待剪辑的视频包括：

显示从目标数据库中获取的与剪辑目标信息匹配的视频，所述剪辑目标信息用于指示视频剪辑的目标；或，显示基于选择操作选择的视频。

在一些实施例中，所述剪辑任务为所述片段组织任务，所述在所述剪辑界面中显示对应的剪辑任务的推荐执行信息包括：

在所述剪辑界面中显示所述片段组织任务对应的多个视频片段以及所述多个视频片段的排序顺序；其中，所述多个视频片段是基于所述视频所包括的视频片段的视频内容，对所述视频所包括的视频片段进行筛选得到，所述排序顺序基于所述视频的视频内容确定。

在一些实施例中，所述方法还包括：

基于所述视频所包括的视频片段的视频内容，对所述视频所包括的视频片段进行筛选，得到所述多个视频片段；

基于所述视频的视频内容，对所述多个视频片段进行排序。

在一些实施例中，所述基于所述视频所包括的视频片段的视频内容，对所述视频所包括的视频片段进行筛选，得到所述多个视频片段包括下述至少一项：

基于所述视频所包括的视频片段的语义信息，筛选掉语义信息不符合预设语义条件的视频片段；

基于所述视频所包括的视频片段的画面信息，筛选掉画面信息不符合预设画面条件的视频片段。

在一些实施例中，所述基于所述视频所包括的视频片段的语义信息，筛选掉语义信息不符合预设语义条件的视频片段包括下述至少一项：

获取所述视频中各个所述视频片段的语义信息和剪辑目标信息之间的语义匹配度，所述剪辑目标信息用于指示视频剪辑的目标，筛选掉所述语义匹配度不符合预设语义条件的视频片段；

基于所述视频中各个所述视频片段的语义信息和预设叙事逻辑，筛选掉语义信息不符合所述预设叙事逻辑的视频片段。

在一些实施例中，基于所述视频所包括的视频片段的画面信息，筛选掉画面信息不符合预设画面条件的视频片段包括下述至少一项：

获取所述视频所包括的视频片段的清晰度，筛选掉清晰度不符合预设清晰度条件的视频片段；

获取所述视频所包括的视频片段的亮度，筛选掉亮度不符合预设亮度条件的视频片段；

基于所述画面信息，检测出所述视频所包括的视频片段中的黑屏片段，筛选掉所述黑屏片段，所述黑屏片段是指存在黑屏的视频片段；

基于所述画面信息，检测出所述视频所包括的视频片段中的画面静止片段，筛选掉所述画面静止片段，所述画面静止片段是指包括连续多个相同画面的视频片段。

在一些实施例中，所述基于所述视频的视频内容，对所述多个视频片段进行排序包括：

根据所述多个视频片段的语义信息，确定所述多个视频片段之间的关联关系，基于所述多个视频片段之间的关联关系，对所述多个视频片段进行排序，所述关联关系包括时空关联、情感关联和事件关联中至少一种。

在一些实施例中，所述剪辑任务为所述视频包装任务，所述在所述剪辑界面中显示对应的剪辑任务的推荐执行信息包括：

在所述剪辑界面中显示所述视频包装任务对应的多个视频包装素材，所述视频包装素材基于所述视频的语义信息、画面信息以及音频信息中至少一种确定。

在一些实施例中，所述方法还包括：

基于所述视频的语义信息、画面信息以及音频信息中至少一种，获取与所述视频匹配的视频包装素材。

在一些实施例中，所述基于所述视频的语义信息、画面信息以及音频信息中至少一种，获取与所述视频匹配的视频包装素材包括下述至少一项：

基于所述视频的语义信息、画面信息以及音频信息中至少一种，获取与所述视频匹配的文字片段，所述文字片段按照时间进行切分，得到所述视频的多个视频片段的字幕；

基于所述视频的语义信息、画面信息以及音频信息中至少一种，获取与所述视频匹配的标签、标题、滤镜、特效以及背景音乐中的至少一种。

在一些实施例中，所述基于所述视频的语义信息、画面信息以及音频信息中至少一种，获取与所述视频匹配的文字片段包括：

基于所述视频的语义信息、画面信息以及音频信息中至少一种，结合所述垂类对应的语言风格信息，获取与所述视频匹配且符合所述语言风格信息的文字片段。

在一些实施例中，所述基于所述视频的语义信息、画面信息以及音频信息中至少一种，获取与所述视频匹配的视频包装素材包括：

基于所述视频的语义信息、画面信息、音频信息以及用户历史数据中至少一种，获取所述视频的情感特征信息，获取与所述视频匹配且符合所述情感特征信息的视频包装素材，所述情感特征信息用于表示所述视频体现的情感倾向。

在一些实施例中，所述方法还包括下述任一项：

在执行任一剪辑任务时，显示所述剪辑任务的预览界面；响应于对所述剪辑任务的修改指令，基于所述修改指令重新执行所述剪辑任务；

在执行任一剪辑任务时，显示所述剪辑任务的预览界面；输出对所述剪辑任务的修改建议信息，所述修改建议信息基于所述视频的视频内容以及预设视频剪辑逻辑确定；

在执行任一剪辑任务时，响应于对所述剪辑任务的问询信息，输出与所述问询信息对应的答案信息，所述答案信息基于所述视频的视频内容和预设视频剪辑逻辑确定。

在一些实施例中，所述方法还包括：

基于所述视频的视频内容，查询知识图谱，得到与所述视频内容关联的扩展关键词，基于所述扩展关键词，获取所述视频的扩展视频；

所述基于所述视频的视频内容，对所述视频执行所述至少一个剪辑任务包括：

基于所述视频和所述扩展视频的视频内容，对所述视频和所述扩展视频执行所述至少一个剪辑任务。

一方面，提供了一种一种视频剪辑装置，所述装置包括：

视频显示模块，被配置为显示待剪辑的视频；

剪辑界面显示模块，被配置为基于所述视频所属的垂类，显示所述垂类对应的至少一个剪辑任务的剪辑界面，所述剪辑任务包括片段组织任务和视频包装任务，所述片段组织任务用于组织所述视频的多个视频片段，所述视频包装任务用于基于视频包装素材对视频进行包装；

剪辑界面显示模块，还被配置为对于任一个剪辑界面，在所述剪辑界面中显示对应的剪辑任务的推荐执行信息，所述推荐执行信息基于所述视频的视频内容确定，用于指示执行所述剪辑任务的任务细节；

剪辑模块，被配置为响应于对所述推荐执行信息的确认操作，对所述视频执行所述剪辑任务。

在一些实施例中，所述视频显示模块被配置为执行下述任一项：

显示从目标数据库中获取的与剪辑目标信息匹配的视频，所述剪辑目标信息用于指示视频剪辑的目标；

显示基于选择操作选择的视频。

在一些实施例中，所述剪辑任务为所述片段组织任务，所述剪辑界面显示模块，被配置为：

在一些实施例中，所述装置还包括：

筛选模块，被配置为基于所述视频所包括的视频片段的视频内容，对所述视频所包括的视频片段进行筛选，得到所述多个视频片段；

排序模块，被配置为基于所述视频的视频内容，对所述多个视频片段进行排序。

在一些实施例中，所述筛选模块包括下述至少一项：

语义筛选单元，被配置为基于所述视频所包括的视频片段的语义信息，筛选掉语义信息不符合预设语义条件的视频片段；

画面筛选单元，被配置为基于所述视频所包括的视频片段的画面信息，筛选掉画面信息不符合预设画面条件的视频片段。

在一些实施例中，所述语义筛选单元，被配置为执行下述至少一项：

在一些实施例中，所述画面筛选单元，被配置为执行下述至少一项：

在一些实施例中，所述排序模块，被配置为根据所述多个视频片段的语义信息，确定所述多个视频片段之间的关联关系，基于所述多个视频片段之间的关联关系，对所述多个视频片段进行排序，所述关联关系包括时空关联、情感关联和事件关联中至少一种。

在一些实施例中，所述剪辑界面显示模块，被配置为：

在一些实施例中，所述装置还包括：

包装获取模块，被配置为基于所述视频的语义信息、画面信息以及音频信息中至少一种，获取与所述视频匹配的视频包装素材。

在一些实施例中，所述包装获取模块包括下述至少一项：

文字片段获取单元，被配置为基于所述视频的语义信息、画面信息以及音频信息中至少一种，获取与所述视频匹配的文字片段，所述文字片段按照时间进行切分，得到所述视频的多个视频片段的字幕；

其他素材获取单元，被配置为基于所述视频的语义信息、画面信息以及音频信息中至少一种，获取与所述视频匹配的标签、标题、滤镜、特效以及背景音乐中的至少一种。

在一些实施例中，所述文字片段获取单元，被配置为：

在一些实施例中，，所述包装获取模块，被配置为：

在一些实施例中，所述装置还包括下述任一项：

修改指令响应模块，被配置为在执行任一剪辑任务时，显示所述剪辑任务的预览界面；响应于对所述剪辑任务的修改指令，基于所述修改指令重新执行所述剪辑任务；

修改建议输出模块，被配置为在执行任一剪辑任务时，显示所述剪辑任务的预览界面；输出对所述剪辑任务的修改建议信息，所述修改建议信息基于所述视频的视频内容以及预设视频剪辑逻辑确定；

信息问询模块，被配置为在执行任一剪辑任务时，响应于对所述剪辑任务的问询信息，输出与所述问询信息对应的答案信息，所述答案信息基于所述视频的视频内容和预设视频剪辑逻辑确定。

在一些实施例中，所述装置还包括：

视频扩展模块，被配置为基于所述视频的视频内容，查询知识图谱，得到与所述视频内容关联的扩展关键词，基于所述扩展关键词，获取所述视频的扩展视频；

所述剪辑模块被配置为基于所述视频和所述扩展视频的视频内容，对所述视频和所述扩展视频执行所述至少一个剪辑任务。

另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器用于存储至少一段计算机程序，所述至少一段计算机程序由所述处理器加载并执行以实现本申请实施例中的视频剪辑方法所执行的操作。

另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一段计算机程序，所述至少一段计算机程序由处理器加载并执行以实现如本申请实施例中视频剪辑方法所执行的操作。

另一方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机程序代码，该计算机程序代码存储在计算机可读存储介质中，计算机设备的处理器从计算机可读存储介质读取该计算机程序代码，处理器执行该计算机程序代码，使得该计算机设备执行上述任一方面的各种可选实现方式中提供的视频剪辑方法。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本申请实施例提供的一种视频剪辑方法的实施环境示意图；

图2是根据本申请实施例提供的一种视频剪辑方法流程图；

图3是根据本申请实施例提供的一种视频剪辑方法流程图；

图4是根据本申请实施例提供的一种视频剪辑装置的框图；

图5是根据本申请实施例提供的一种计算机设备的结构示意图；

图6是根据本申请实施例提供的一种服务器的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分，应理解，“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系，也不对数量和执行顺序进行限定。

本申请中术语“至少一个”是指一个或多个，“多个”的含义是指两个或两个以上。

需要说明的是，本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号，均为经用户授权或者经过各方充分授权的，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如，本申请中涉及到的视频都是在充分授权的情况下获取的。

为了便于理解，以下，对本申请涉及的术语进行解释。

语义理解技术：利用自然语言处理和知识图谱，分析文本或语音的语义，理解其中的概念、事件和逻辑，是人工智能的核心技术之一。

计算机视觉：利用计算机软硬件自动分析和理解数字图像和视频，识别其中的物体、人脸、场景等要素，可以用于内容理解、检测、跟踪等，是实现智能视频分析的技术基石。

自然语言处理：自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学和数学于一体的科学。自然语言处理并不是一般地研究自然语言，而在于研制能有效地实现自然语言通信的计算机系统，特别是其中的软件系统。因而它是计算机科学的一部分。自然语言处理主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比和语音识别等方面。

知识图谱：知识图谱(Knowledge Graph)又称科学知识图谱，是图书情报学领域的概念，用于绘制、分析和显示学科或学术研究主体之间的相互联系，是揭示显示科学知识发展进程与结构关系的可视化工具。知识图谱本质上是揭示实体之间关系的语义网络。

图1是根据本申请实施例提供的一种视频剪辑方法的实施环境示意图。参见图1，该实施环境包括终端101和服务器102。

终端101和服务器102能够通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

在一些实施例中，终端101是智能手机、平板电脑、笔记本电脑、台式计算机、智能手表、智能语音交互设备等，但并不局限于此。终端101运行有支持视频剪辑的应用程序。该应用程序可以是视频剪辑应用、社交应用、视频应用中的任意一种。示意性的，终端101是用户使用的终端，用户可以通过在终端101上触发视频编辑功能，以实现对视频的编辑。

在一些实施例中，服务器102是独立的物理服务器，也能够是多个物理服务器构成的服务器集群或者分布式系统，还能够是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、大数据和人工智能平台等基础云计算服务的云服务器。服务器102用于为支持视频剪辑的应用程序提供后台服务。在一些实施例中，服务器102承担主要视频剪辑工作，终端101承担次要视频剪辑工作；或者，服务器102承担次要视频剪辑工作，终端101承担主要视频剪辑工作；或者，服务器102和终端101二者之间采用分布式计算架构进行协同视频剪辑。

本领域技术人员可以知晓，上述终端的数量可以更多或更少。比如上述终端可以仅为一个，或者上述终端为几十个或几百个，或者更多数量。本申请实施例对终端的数量和设备类型不加以限定。

在一些实施例中，上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也能够是任何网络，包括但不限于局域网(Local Area Network，LAN)、城域网(Metropolitan Area Network，MAN)、广域网(Wide Area Network，WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。在一些实施例中，使用包括超文本标记语言(Hyper Text Mark-up Language，HTML)、可扩展标记语言(Extensible MarkupLanguage，XML)等的技术和/或格式来代表通过网络交换的数据。此外还能够使用诸如安全套接字层(Secure Socket Layer，SSL)、传输层安全(Transport Layer Security，TLS)、虚拟专用网络(Virtual Private Network，VPN)、网际协议安全(Internet ProtocolSecurity，IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中，还能够使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。

图2是根据本申请实施例提供的一种视频剪辑方法流程图，如图2所示，在本申请实施例中以终端为例进行说明。该方法包括以下步骤：

在步骤201中，终端显示待剪辑的视频。

在步骤202中，终端基于该视频所属的垂类，显示该垂类对应的至少一个剪辑任务的剪辑界面，该剪辑任务包括片段组织任务和视频包装任务，该片段组织任务用于组织该视频的多个视频片段，该视频包装任务用于基于视频包装素材对视频进行包装。

其中，垂类是指视频所属的类型，该垂类基于对视频的语音进行分析得到。例如，该待剪辑的视频为一段拍摄春天画面的视频，则，该视频属于风景视频，或者该待剪辑的视频为一个人的演讲视频，则该视频应属于演讲视频。

其中，每个垂类对应于至少一个预设的剪辑任务，用以表示对属于这个垂类内的视频进行剪辑时所需要执行的步骤。在本申请实施例中，系统维护垂类与剪辑任务之间的对应关系，该对应关系基于各个垂类内的热门剪辑方式确定，或，基于各个垂类的视频特点确定。该剪辑任务包括片段组织任务和视频包装任务，以便实现添加背景音乐、添加滤镜、调整构图等操作，从而对该视频进行自动剪辑。例如，对于情感视频，其剪辑任务包括：找一段情感语录，配上符情境的图片，添加舒缓的背景音乐。对于红眼视频，其剪辑任务包括：找一段含人物的片段，尾帧做画面定格，再加红眼特效。

该片段组织任务用于组织该视频的多个视频片段，也即是，用于从视频中筛选出用于进一步剪辑的视频片段，并对筛选出的视频片段进行排序，该排序体现为视频片段在剪辑好的视频中的播放顺序；该视频包装任务用于基于视频包装素材对视频进行包装，该视频包装素材是指能够对视频的视听效果进行包装的素材，例如，能够体现视频画面以及情景的滤镜、背景音乐或者表达人物心情的贴纸。

在一些实施例中，上述显示该垂类对应的至少一个剪辑任务的剪辑界面，可以是基于一定顺序逐个显示剪辑界面，响应于用户在任一个剪辑界面上操作完成，则跳转至下一个剪辑界面。当然，对于一些可以不限定剪辑顺序的剪辑任务，在一些实施例中，对不限定剪辑顺序的剪辑任务的剪辑界面，可以同时显示，并响应于用户对任一剪辑界面的选择操作，显示被选中的剪辑界面。

当然，在一些实施例中，上述至少一个剪辑任务的剪辑界面为一个界面，也即是，通过一个界面将该垂类对应的所有剪辑任务显示在一起，而无需分页显示，从而能够在一个界面中实现对所有剪辑任务的处理。

在步骤203中，对于任一个剪辑界面，终端在该剪辑界面中显示对应的剪辑任务的推荐执行信息，该推荐执行信息基于该视频的视频内容确定，用于指示执行该剪辑任务的任务细节。

在步骤204中，响应于对该推荐执行信息的确认操作，终端对该视频执行该剪辑任务。

本申请实施例提供的方法，通过基于视频所属的垂类，来自动确定该视频剪辑时所需要执行的剪辑任务，并通过剪辑任务的剪辑界面，来基于视频的视频内容等为用户提供相应剪辑任务的任务细节，以为用户提供辅助剪辑功能，无需用户自己设计剪辑任务以及手工选择各个任务细节，就可以实现基于视频内容的剪辑，提升了视频创作的自动化程度和效率，提供了更优的用户体验。

图3是根据本申请实施例提供的一种视频剪辑方法流程图，如图2所示，在本申请实施例中以终端为例进行说明。该方法包括以下步骤：

在步骤301中，响应于语音指令，终端对语音指令进行识别，得到剪辑目标信息，所述剪辑目标信息用于指示视频剪辑的目标。

其中，该语音指令是用户启动应用程序后，基于用户输入的语音内容进行识别得到。在一些实施例中，终端检测到用户输入的语音指令，对语音指令进行语音识别，得到该语音指令对应的语音文本，对该语音文本进行语义分析，得到剪辑目标信息。

例如，用户通过自然语言描述视频创作意图，如“我想剪辑一段拍摄春天的视频”，表达对视频的剪辑需求，使得应用程序能够通过对该自然语言描述的语音识别和语义分析，得到该视频的剪辑目标信息。

当然，在一些实施例中，该剪辑目标信息还能通过用户手动输入的方式得到，例如在应用程序中输入用户对于视频的剪辑需求，如“一段拍摄春天的视频”。

在步骤302中，终端从目标数据库中获取到与剪辑目标信息匹配的视频。

其中，目标数据库用于存储多个视频，该多个视频可以基于关键词索引。

在一些实施例中，终端对剪辑目标信息进行分词，以得到本次的剪辑关键词，基于剪辑关键词对目标数据库进行查询，得到与剪辑关键词对应的视频，作为与剪辑目标信息匹配的视频。当然，上述分词过程可以由服务器执行，本申请实施例对此不作限定。

在一些实施例中，上述步骤301和302可以通过下述过程实现：获取基于选择操作选择的视频。该选择操作可以是指对于任一存储空间内所存储视频的选择操作。例如，该视频是从本地文件夹中基于选择操作选中并自行上传的视频。当然，该视频还可以是用户基于选择操作从云端数据库中选择的视频。

进一步地，在通过选择操作来选择的视频的情况下，还包括：对该视频进行分析，得到剪辑目标信息。在一些实施例中，上述步骤包括：对视频进行语义分析、画面分析和音频分析中至少一种，得到剪辑目标信息。若选择了一段视频，通过基于视频画面的分析，以确定视频出现的人物，基于对视频语音的语义分析，以确定视频内人物的人物关系和/或语音内容，通过上述内容，得到剪辑目标信息。例如，视频是一段关于母子如何沟通的视频，那么通过对视频画面的分析，得到主讲人，基于对视频语音的语义分析，确定其语音内容为母子如何沟通，则可以确定该剪辑目标信息用于指示对该关于母子如何沟通的视频进行剪辑。

在一些实施例中，在上述视频的基础上，还基于视频的视频内容，扩展出更多的视频，用于进行剪辑，相应地，所述方法还包括：基于该视频的视频内容，查询知识图谱，得到与该视频内容关联的扩展关键词，基于该扩展关键词，获取该视频的扩展视频。可选地，上述视频内容包括所述视频的语义信息，则对该视频的语义信息进行分词，基于分词得到的语义关键词，查询知识图谱，得到与该视频内容关联的扩展关键词，基于该扩展关键词，从目标数据库中获取该视频的扩展视频。通过对待编辑视频的扩展，可以提供更丰富的视频素材，用以为视频剪辑提供更多信息。相应地，在获取到扩展视频后，在基于该视频的视频内容，对该视频执行该至少一个剪辑任务时，会基于该视频和该扩展视频的视频内容，对该视频和该扩展视频执行该至少一个剪辑任务。

在一些实施例中，上述扩展视频还可以基于GAN和获取到的视频来生成，以拓展视频时长。

在步骤303中，终端显示待剪辑的视频。

其中，在从目标数据库获取到视频后，将获取到的视频显示在剪辑界面上，以供用户预览。在显示该预览界面时，用户若不满意，还可以通过修改指令来触发重新获取视频的过程，也即是，响应于对该视频的修改指令，基于该修改指令重新执行获取视频的过程。若用户对获取到的视频满意，则可以通过确认操作来执行下一步剪辑流程。

在步骤304中，终端基于视频所属的垂类，确定该垂类对应的至少一个剪辑任务，该剪辑任务包括片段组织任务和视频包装任务，其中，片段组织任务用于组织所述视频的多个视频片段，视频包装任务用于基于视频包装素材对视频进行包装。

基于视频的剪辑目标信息或视频内容进行语义分析，基于分析得到的语义信息，确定该视频所属的垂类，再基于该垂类对本次剪辑进行拆解，以得到该垂类对应的至少一个剪辑任务。关于垂类与剪辑任务之间的关系参见步骤202。

在上述过程中进行语义分析时，可以采用3D重建中的语义理解部分来实现。

在步骤305中，终端基于该视频所包括的视频片段的视频内容，对该视频所包括的视频片段进行筛选，得到该多个视频片段。

其中，视频内容能够体现视频语义、画面和语音等方面的相关信息，通过基于视频内容的筛选，能够将一些不符合条件的视频片段筛选掉，从而得到符合条件的视频片段。

在一些实施例中，该步骤305包括下述305A和305B至少一项：

305A：基于该视频所包括的视频片段的语义信息，筛选掉语义信息不符合预设语义条件的视频片段。

每个视频片段对应于一定的语义，该语义决定了视频片段的内容，因此，通过对视频片段的语义信息的筛选，能够筛选出符合本次剪辑目标的视频片段。

在一些实施例中，可以基于该语义信息与剪辑目标信息之间的关系或者与预设叙事逻辑之间的关系来进行筛选，相应地，该步骤305A包括下述305A1和305A2中至少一项：

305A1：获取该视频中各个该视频片段的语义信息和剪辑目标信息之间的语义匹配度，该剪辑目标信息用于指示视频剪辑的目标，筛选掉该语义匹配度不符合预设语义条件的视频片段。

在一些实施例中，该语义匹配度是语义信息和剪辑目标信息之间的相似度，相似度越大，说明语义信息与剪辑目标信息之间的相关性越大，相似度越小，说明语义信息与剪辑目标信息之间的相关性越小，则基于这种语义匹配度的筛选，能够筛选掉与剪辑目标信息相关性小的视频片段，保证剩余的视频片段能够更准确的体现剪辑目标。

其中，该预设语义条件为语义匹配度大于匹配度阈值。例如，剪辑目标信息中有“晴天”，而该视频片段经过语义分析得到的关键词为“下雨”或者“阴天”，通过计算相似度，以得到语义匹配度，且确定该视频片段与剪辑目标信息的语义匹配度小于匹配度阈值，则该视频片段被筛选掉。

305A2：基于该视频中各个该视频片段的语义信息和预设叙事逻辑，筛选掉语义信息不符合该预设叙事逻辑的视频片段。

其中，该预设叙事逻辑是指该垂类对应的预设叙事逻辑，当然，也可以是各个垂类通用的预设叙事逻辑，用于指示视频片段的语义之间应具有的逻辑关系。该预设叙事逻辑可以通过对大量视频进行机器学习得到。

例如，风景视频的预设叙事逻辑为引言-风景片段，通过视频片段的语义信息确定该视频片段为引言部分，则对于预设叙事逻辑来说，该引言部分符合预设叙事逻辑，则保留该视频片段，若通过视频片段的语义信息确定该视频片段不包括风景画面，则筛选掉该视频片段。

305B：基于该视频所包括的视频片段的画面信息，筛选掉画面信息不符合预设画面条件的视频片段。

其中，画面信息能够体现画面效果以及画面所体现的画面内容的相关信息，通过基于画面信息的筛选，能够将一些不符合条件的视频片段筛选掉，从而得到符合条件的视频片段。

该步骤305B包括下述305B1-305B4中至少一项：

305B1：获取该视频所包括的视频片段的亮度，筛选掉亮度不符合预设亮度条件的视频片段。

亮度是影响视觉效果的重要条件，亮度过高或者过低都会造成不良的视觉效果，为了避免视频的视觉效果太差，在一些实施例中，基于上述亮度来筛选出属于预设亮度区间的视频片段。其中，该筛选出属于预设亮度区间的视频片段是指删除亮度不符合预设亮度区间的视频画面。

305B2：获取该视频所包括的视频片段的清晰度，筛选掉清晰度不符合预设清晰度条件的视频片段。

清晰度也是影响视觉效果的重要条件，清晰度过低会造成不良的视觉效果，为了避免视频的视觉效果太差，在一些实施例中，基于上述清晰度来筛选出清晰度大于或等于预设清晰度的视频片段。其中，该筛选出属于清晰度大于或等于预设清晰度的视频片段是指删除清晰度小于预设清晰度的视频画面。其中，上述清晰度可以通过画面中的黑点或噪点数量确定。

305B3：基于该画面信息，检测出该视频所包括的视频片段中的黑屏片段，筛选掉该黑屏片段，所述黑屏片段是指存在黑屏的视频片段。

对于一些视频片段来说，其中可能包含一定黑屏的画面，这类画面对于视频整体效果会造成不良影响，因此，删除这类画面，能够大大提升视频的视觉效果。其中，黑屏片段可以是指黑屏画面。

305B4：基于该画面信息，检测出该视频所包括的视频片段中的画面静止片段，筛选掉该画面静止片段，该画面静止片段是指包括连续多个相同画面的视频片段。

基于对画面信息的检测，可以确定视频中是否包含连续多个相同画面，若包含，在保留该连续多个相同画面中的任一画面，删除该多个相同画面中的其余画面，从而使得视频中不会出现冗余画面。

在步骤306中，终端基于该视频的视频内容，对该多个视频片段进行排序。

视频内容可以决定该视频片段在整体剪辑后片段中的播放顺序，因此，通过基于视频内容进行排序，能够自动确定如何组织该多个视频片段。

在一些实施例中，根据该多个视频片段的语义信息，确定该多个视频片段之间的关联关系，基于该多个视频片段之间的关联关系，对该多个视频片段进行排序，该关联关系包括时空关联、情感关联和事件关联中至少一种。

该关联关系可以指示视频片段之间的排序顺序，例如，对于时空关联来说，具有时空关联的多个视频片段，可以基于其所对应的时间先后来进行排序，具有事件关联的多个视频片段，可以基于其语义信息确定事件的发展顺序，从而基于发展顺序进行排序，而对于情感关联的多个视频片段，可以将情感递进的多个视频片段按照递进顺序进行排序，本申请实施例对上述过程不做限定。

在一些实施例中，还基于该垂类对应的预设叙事逻辑，结合上述多个视频片段之间的关联关系，来对进行排序，也即是，按照该预设叙事逻辑对不同关联关系的排序要求，对该多个视频片段进行排序，从而使得排序后的视频片段能够更符合该垂类对应视频的叙事方式。

在一些实施例中，剪辑目标信息中若包含对排序有指导的信息，则该方法还包括：按照所述视频的剪辑目标信息和所述多个视频片段的语义信息，对所述多个视频片段进行排序，所述剪辑目标信息用于指示视频剪辑的目标。例如，剪辑目标信息中包含排序要求或者时序信息，则基于该排序要求或者时序信息来按照语义信息对多个视频片段进行排序，从而在用户有自己的排序要求时，能够基于用户的个性化要求来进行排序。

在本申请实施例中，是以上述步骤305和306由终端执行为例进行说明，但是，在一些实施例中，该步骤305和306还可以由服务器实现，也即是，在服务器获取到视频后，仅向终端提供视频的预览，由服务器执行筛选和排序过程，并将相应处理结果返回给终端进行显示，本申请实施例对此不作限定。

在步骤307中，终端在该剪辑界面中显示该片段组织任务对应的多个视频片段以及该多个视频片段的排序顺序。

其中，在对视频片段进行筛选和排序后，将排序后的视频片段显示在剪辑界面上，以供用户预览。在显示该预览界面时，用户若不满意，还可以通过修改指令来触发重新筛选和排序的过程，也即是，响应于对该视频的修改指令，基于该修改指令重新执行获取筛选和排序的过程。若用户对获取到的视频满意，则可以通过确认操作来执行下一步剪辑流程。在一些实施例中，用户可以通过对上述所显示的排序后的多个视频片段执行删除或者改变顺序的操作，来对排序的视频片段进行修改，以使得上述排序结果更加符合用户的剪辑需求。

上述步骤304至307是基于该视频所属的垂类，获取片段组织任务的推荐执行信息以及对该推荐执行信息进行显示的过程。

在步骤308中，响应于对多个视频片段以及该多个视频片段的排序顺序的确认操作，终端对该视频的多个视频片段进行片段组织。

其中，对多个视频片段进行片段组织是指将该多个视频片段按照所确认的排序顺序拼接成一个视频。

在一些实施例中，为了丰富视频片段，在步骤308之前，该方法还包括：基于该视频的视频内容得到的与该视频内容关联的关键词，查询知识图谱，得到扩展的关键词，基于该扩展的关键词，获得扩展的剪辑目标信息，基于该扩展的剪辑目标信息，获得扩展的视频片段。该获取扩展的视频片段的过程与上述获取扩展视频的过程同理，在此不做赘述。而在获取到扩展的视频片段后，可以基于该扩展的视频片段进行上述筛选以及排序过程。

在一些实施例中，还可以在所生成视频不符合时长要求时才进行相应的扩展过程，也即是，该方法还包括：基于该视频的剪辑目标信息，确定剪辑后的视频不符合剪辑目标信息中的时长要求，基于该视频的视频内容，查询知识图谱，获得扩展的视频片段。例如，剪辑目标信息包括的时长要求为30秒，而上述视频片段的时长总和为25秒，则可以基于扩展过程，来获取更多的视频片段以供剪辑。

在步骤309中，终端基于该视频的语义信息、画面信息以及音频信息中至少一种，获取与该视频匹配的视频包装素材。

其中，该视频包装素材包括字幕、标签、标题、滤镜、特效以及背景音乐等。通过获取视频包装素材，能够进一步提升视频的视觉效果。

在一些实施例中，该步骤309包括下述309A-309B至少一项：

309A：基于该视频的语义信息、画面信息以及音频信息中至少一种，获取与该视频匹配的文字片段，该文字片段按照时间进行切分，得到该视频的多个视频片段的字幕。

通过基于视频中多个视频片段的语义信息、画面信息以及音频信息中的至少一种，生成一段用于描述该视频的文字片段，也即是该视频匹配的文字片段，并基于该用于描述整体视频的文字片段进行切分，通过这种处理得到的字幕，更能够体现视频的整体内容，与视频内容高度相关，且，由于结合了语义、画面和音频等多方面的信息，其文字信息量丰富，丰富了视频信息的表达。

在一些实施例中，还可以自动生成与垂类对应的语言风格相同的字幕，该垂类对应的语言风格是指在该垂类内热门视频的语言风格，通过对热门视频进行分析得到。相应地，基于所述视频的语义信息、画面信息以及音频信息中至少一种，结合所述垂类对应的语言风格信息，获取与所述视频匹配且符合所述语言风格信息的文字片段。其中，在基于垂类对应的语言风格信息进行处理时，可以通过语言模型处理得到，将上述文字片段输入对应语言风格的语言模型，以得到与垂类对应的语言风格相同的文字片段。上述语言模型基于该垂类内热门视频训练得到。

309B：基于该视频的语义信息、画面信息以及音频信息中至少一种，获取与该视频匹配的标签、标题、滤镜、特效以及背景音乐中的至少一种。

通过基于视频中多个视频片段的语义信息、画面信息以及音频信息中的至少一种，来获取相应的视频包装素材，更能够体现视频的整体内容，与视频内容高度相关，且，由于结合了语义、画面和音频等多方面的信息，其文字信息量丰富，丰富了视频信息的表达。

在一些实施例中，还可以通过上述信息来确定视频的情感色彩，并结合用户的偏好，来确定能够符合用户偏好且表达相应情感的视频包装素材，相应地，上述步骤309B包括：基于该视频的语义信息、画面信息以及音频信息中至少一种，获取该视频的情感特征信息，结合用户历史偏好数据，获取与该视频匹配且符合该情感特征信息的视频包装素材，该情感特征信息用于表示该视频体现的情感倾向。上述基于情感特征信息以及历史偏好数据的处理过程可以是基于多个匹配条件的匹配过程，本申请实施例对此不作限定。

在步骤310中，终端在该剪辑界面中显示该视频包装任务对应的多个视频包装素材，该视频包装素材基于该视频的语义信息、画面信息以及音频信息中至少一种确定。

其中，在对视频片段获取到视频包装素材后，将获取到的视频包装素材或者包装后的视频显示在剪辑界面上，以供用户预览。在显示该预览界面时，用户若不满意，还可以通过修改指令来触发重新素材获取的过程，也即是，响应于对该视频的修改指令，基于该修改指令重新执行获取素材获取的过程。若用户对包装后的视频或获取到的素材满意，则可以通过确认操作来执行下一步剪辑流程。在一些实施例中，用户可以通过对上述所显示的视频包装素材执行删除或调整操作，来进行修改，以使得上述包装效果更加符合用户的剪辑需求，并且，通过一次性提供上述多种视频包装素材，能够达到一站式视频创作的目的。

上述步骤308至309是基于该视频所属的垂类，获取视频包装任务的推荐执行信息以及对该推荐执行信息进行显示的过程。上述基于视频内容来提供各个剪辑任务的推荐执行信息，能够提供更高的自动推荐水平。

在一些实施例中，为剪辑过程提供预览功能，也即是，该方法还包括下述310A-310B至少一项：

310A：在执行任一剪辑任务时，显示该剪辑任务的预览界面；响应于对该剪辑任务的修改指令，基于该修改指令重新执行该剪辑任务。

该预览的示例可以参见上述对视频包装任务的预览以及对片段组织任务的预览。当然，在一些实施例中，终端可以在任意剪辑阶段提供对剪辑效果的预览，也即是，显示该剪辑任务对应的效果视频，若用户对其中的部分片段不满意，可以通过语音提出修改意见，若终端检测到用于提供修改意见的语音指令，则可以基于该语音指令进行修改。例如“这个片段的色彩似乎过于鲜艳，请推荐调整方案”。上述修改过程可以持续进行，以优化视频，直到用户满意为止。

310B：在执行任一剪辑任务时，显示该剪辑任务的预览界面；输出对该剪辑任务的修改建议信息，该修改建议信息基于该视频的视频内容以及预设视频剪辑逻辑确定。

其中，修改建议信息可以包括剪辑的各个方面，例如，剪辑顺序、色彩搭配、画面构图、敏感词检测等。例如，若检测到视频内容中出现涉敏或者违规词汇，则会输出修改建议信息。

在一些实施例中，终端为剪辑过程提供问询功能，在执行任一剪辑任务时，响应于对该剪辑任务的问询信息，输出与该问询信息对应的答案信息，该答案信息基于该视频的视频内容和预设视频剪辑逻辑确定。

针对任意剪辑任务，终端可以基于当前的剪辑效果、视频内容和预设视频剪辑逻辑，获取修改建议信息，以为用户提供剪辑引导和答案信息。由于预设视频剪辑逻辑能够体现一般对剪辑效果的要求或者用户对视频的反馈等，因此，提供这类修改建议以及答案信息，能够将反馈时机提前到视频剪辑过程中，大大提升了剪辑效率，实现精准高效的人机协作，最大限度满足用户创作意图。整体效果可以如人类导演一样，给出专业的创造指导与反馈。

上述修改指令、修改建议信息以及问询功能均可以通过语音人机交互来实现，比目前的技术在交互性与专业性上更具优势，能够满足用户精细化创作需求。

在步骤311中，响应于对视频包装素材的确认操作，终端对已确认的视频包装素材添加至该视频。

本申请实施例以该垂类对应的剪辑任务包括片段组织任务和视频包装任务为例进行说明，在一些实施例中，垂类还可以对应不同的剪辑任务，本申请实施例不作限定。

若基于上述步骤完成视频剪辑，则输出剪辑后的视频，进一步地，在一些实施例中，还提供了对上述过程的评价功能，也即是，上述输出剪辑后的视频后，终端显示评价界面，该评价界面用于对应用程序的创作表现进行评价，供应用程序继续学习与提高，响应于在该评价界面的评价操作，将评价反馈至应用程序。例如，评价界面给出“视频生成速率”、“视频生成效果”、“用户满意度”等选项，用户可以通过选择操作确定具体评价等级。

本申请实施例提供的方法，通过基于视频所属的垂类，来自动确定该视频剪辑时所需要执行的剪辑任务，并通过剪辑任务的剪辑界面，来基于视频的视频内容等为用户提供相应剪辑任务的任务细节，以为用户提供辅助剪辑功能，无需用户自己设计剪辑任务以及手工选择各个任务细节，就可以实现基于视频内容的剪辑，提升了视频创作的自动化程度和效率，提供了更优的用户体验。上述技术方案，继承了视频检索、组织、推荐以及反馈等各个功能，实现了全流程自动高效的视频创作，这一模式能够大大提高视频创作的效率与体验。

图4是根据本申请实施例提供的一种视频剪辑装置的框图。该装置用于执行上述视频剪辑方法执行时的步骤，参见图4，装置包括：

视频显示模块401，被配置为显示待剪辑的视频；

剪辑界面显示模块402，被配置为基于该视频所属的垂类，显示该垂类对应的至少一个剪辑任务的剪辑界面，该剪辑任务包括片段组织任务和视频包装任务，该片段组织任务用于组织该视频的多个视频片段，该视频包装任务用于基于视频包装素材对视频进行包装；

剪辑界面显示模块402，还被配置为对于任一个剪辑界面，在该剪辑界面中显示对应的剪辑任务的推荐执行信息，该推荐执行信息基于该视频的视频内容确定，用于指示执行该剪辑任务的任务细节；

剪辑模块403，被配置为响应于对该推荐执行信息的确认操作，对该视频执行该剪辑任务。

在一些实施例中，该视频显示模块401被配置为执行下述任一项：

显示从目标数据库中获取的与剪辑目标信息匹配的视频，该剪辑目标信息用于指示视频剪辑的目标；

显示基于选择操作选择的视频。

在一些实施例中，该剪辑任务为该片段组织任务，该剪辑界面显示模块，被配置为：

在该剪辑界面中显示该片段组织任务对应的多个视频片段以及该多个视频片段的排序顺序；其中，该多个视频片段是基于该视频所包括的视频片段的视频内容，对该视频所包括的视频片段进行筛选得到，该排序顺序基于该视频的视频内容确定。

在一些实施例中，该装置还包括：

筛选模块，被配置为基于该视频所包括的视频片段的视频内容，对该视频所包括的视频片段进行筛选，得到该多个视频片段；

排序模块，被配置为基于该视频的视频内容，对该多个视频片段进行排序。

在一些实施例中，该筛选模块包括下述至少一项：

语义筛选单元，被配置为基于该视频所包括的视频片段的语义信息，筛选掉语义信息不符合预设语义条件的视频片段；

画面筛选单元，被配置为基于该视频所包括的视频片段的画面信息，筛选掉画面信息不符合预设画面条件的视频片段。

在一些实施例中，该语义筛选单元，被配置为执行下述至少一项：

获取该视频中各个该视频片段的语义信息和剪辑目标信息之间的语义匹配度，该剪辑目标信息用于指示视频剪辑的目标，筛选掉该语义匹配度不符合预设语义条件的视频片段；

基于该视频中各个该视频片段的语义信息和预设叙事逻辑，筛选掉语义信息不符合该预设叙事逻辑的视频片段。

在一些实施例中，该画面筛选单元，被配置为执行下述至少一项：

获取该视频所包括的视频片段的清晰度，筛选掉清晰度不符合预设清晰度条件的视频片段；

获取该视频所包括的视频片段的亮度，筛选掉亮度不符合预设亮度条件的视频片段；

基于该画面信息，检测出该视频所包括的视频片段中的黑屏片段，筛选掉该黑屏片段，该黑屏片段是指存在黑屏的视频片段；

基于该画面信息，检测出该视频所包括的视频片段中的画面静止片段，筛选掉该画面静止片段，该画面静止片段是指包括连续多个相同画面的视频片段。

在一些实施例中，该排序模块，被配置为根据该多个视频片段的语义信息，确定该多个视频片段之间的关联关系，基于该多个视频片段之间的关联关系，对该多个视频片段进行排序，该关联关系包括时空关联、情感关联和事件关联中至少一种。

在一些实施例中，该剪辑界面显示模块，被配置为：

在该剪辑界面中显示该视频包装任务对应的多个视频包装素材，该视频包装素材基于该视频的语义信息、画面信息以及音频信息中至少一种确定。

在一些实施例中，该装置还包括：

包装获取模块，被配置为基于该视频的语义信息、画面信息以及音频信息中至少一种，获取与该视频匹配的视频包装素材。

在一些实施例中，该包装获取模块包括下述至少一项：

文字片段获取单元，被配置为基于该视频的语义信息、画面信息以及音频信息中至少一种，获取与该视频匹配的文字片段，该文字片段按照时间进行切分，得到该视频的多个视频片段的字幕；

其他素材获取单元，被配置为基于该视频的语义信息、画面信息以及音频信息中至少一种，获取与该视频匹配的标签、标题、滤镜、特效以及背景音乐中的至少一种。

在一些实施例中，该文字片段获取单元，被配置为：

基于该视频的语义信息、画面信息以及音频信息中至少一种，结合该垂类对应的语言风格信息，获取与该视频匹配且符合该语言风格信息的文字片段。

在一些实施例中，，该包装获取模块，被配置为：

基于该视频的语义信息、画面信息、音频信息以及用户历史数据中至少一种，获取该视频的情感特征信息，获取与该视频匹配且符合该情感特征信息的视频包装素材，该情感特征信息用于表示该视频体现的情感倾向。

在一些实施例中，该装置还包括下述任一项：

修改指令响应模块，被配置为在执行任一剪辑任务时，显示该剪辑任务的预览界面；响应于对该剪辑任务的修改指令，基于该修改指令重新执行该剪辑任务；

修改建议输出模块，被配置为在执行任一剪辑任务时，显示该剪辑任务的预览界面；输出对该剪辑任务的修改建议信息，该修改建议信息基于该视频的视频内容以及预设视频剪辑逻辑确定；

信息问询模块，被配置为在执行任一剪辑任务时，响应于对该剪辑任务的问询信息，输出与该问询信息对应的答案信息，该答案信息基于该视频的视频内容和预设视频剪辑逻辑确定。

在一些实施例中，该装置还包括：

视频扩展模块，被配置为基于该视频的视频内容，查询知识图谱，得到与该视频内容关联的扩展关键词，基于该扩展关键词，获取该视频的扩展视频；

该剪辑模块被配置为基于该视频和该扩展视频的视频内容，对该视频和该扩展视频执行该至少一个剪辑任务。

需要说明的是：上述实施例提供的视频剪辑装置在视频剪辑时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的视频剪辑装置与视频剪辑方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

在本申请实施例中，计算机设备能够被配置为终端或者服务器，当计算机设备被配置为终端时，可以由终端作为执行主体来实施本申请实施例提供的技术方案，当计算机设备被配置为服务器时，可以由服务器作为执行主体来实施本申请实施例提供的技术方案，也可以通过终端和服务器之间的交互来实施本申请提供的技术方案，本申请实施例对此不作限定。

图5是根据本申请实施例提供的一种计算机设备500的结构示意图。该计算机设备500可以是便携式移动终端，比如：智能手机、平板电脑、MP3播放器(Moving PictureExperts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(MovingPicture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。计算机设备500还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，计算机设备500包括有：处理器501和存储器502。

处理器501可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器501可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器501也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器501可以集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器501还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器502可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器502还可包括高速随机存取存储器以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器502中的非暂态的计算机可读存储介质用于存储至少一个计算机程序，该至少一个计算机程序用于被处理器501所执行以实现本申请中方法实施例提供的视频剪辑方法。

在一些实施例中，计算机设备500还可选包括有：外围设备接口503和至少一个外围设备。处理器501、存储器502和外围设备接口503之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口503相连。具体地，外围设备包括：射频电路504、显示屏505、摄像头组件506、音频电路507和电源508中的至少一种。

外围设备接口503可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器501和存储器502。在一些实施例中，处理器501、存储器502和外围设备接口503被集成在同一芯片或电路板上；在一些其他实施例中，处理器501、存储器502和外围设备接口503中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路504用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路504通过电磁信号与通信网络以及其他通信设备进行通信。射频电路504将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。在一些实施例中，射频电路504包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路504可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路504还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏505用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏505是触摸显示屏时，显示屏505还具有采集在显示屏505的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器501进行处理。此时，显示屏505还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏505可以为一个，设置在计算机设备500的前面板；在另一些实施例中，显示屏505可以为至少两个，分别设置在计算机设备500的不同表面或呈折叠设计；在另一些实施例中，显示屏505可以是柔性显示屏，设置在计算机设备500的弯曲表面上或折叠面上。甚至，显示屏505还可以设置成非矩形的不规则图形，也即异形屏。显示屏505可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-EmittingDiode，有机发光二极管)等材质制备。

摄像头组件506用于采集图像或视频。在一些实施例中，摄像头组件506包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件506还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路507可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器501进行处理，或者输入至射频电路504以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在计算机设备500的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器501或射频电路504的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路507还可以包括耳机插孔。

电源508用于为计算机设备500中的各个组件进行供电。电源508可以是交流电、直流电、一次性电池或可充电电池。当电源508包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中，计算机设备500还包括有一个或多个传感器509。该一个或多个传感器509包括但不限于：加速度传感器510、陀螺仪传感器511、压力传感器512、光学传感器513以及接近传感器514。

加速度传感器510可以检测以计算机设备500建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器510可以用于检测重力加速度在三个坐标轴上的分量。处理器501可以根据加速度传感器510采集的重力加速度信号，控制显示屏505以横向视图或纵向视图进行用户界面的显示。加速度传感器510还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器511可以检测计算机设备500的机体方向及转动角度，陀螺仪传感器511可以与加速度传感器510协同采集用户对计算机设备500的3D动作。处理器501根据陀螺仪传感器511采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器512可以设置在计算机设备500的侧边框和/或显示屏505的下层。当压力传感器512设置在计算机设备500的侧边框时，可以检测用户对计算机设备500的握持信号，由处理器501根据压力传感器512采集的握持信号进行左右手识别或快捷操作。当压力传感器512设置在显示屏505的下层时，由处理器501根据用户对显示屏505的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

光学传感器513用于采集环境光强度。在一个实施例中，处理器501可以根据光学传感器513采集的环境光强度，控制显示屏505的显示亮度。具体地，当环境光强度较高时，调高显示屏505的显示亮度；当环境光强度较低时，调低显示屏505的显示亮度。在另一个实施例中，处理器501还可以根据光学传感器513采集的环境光强度，动态调整摄像头组件506的拍摄参数。

接近传感器514，也称距离传感器，通常设置在计算机设备500的前面板。接近传感器514用于采集用户与计算机设备500的正面之间的距离。在一个实施例中，当接近传感器514检测到用户与计算机设备500的正面之间的距离逐渐变小时，由处理器501控制显示屏505从亮屏状态切换为息屏状态；当接近传感器514检测到用户与计算机设备500的正面之间的距离逐渐变大时，由处理器501控制显示屏505从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图5中示出的结构并不构成对计算机设备500的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

图6是根据本申请实施例提供的一种服务器的结构示意图，该服务器600可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(Central ProcessingUnits，CPU)601和一个或一个以上的存储器602，其中，该存储器602中存储有至少一条计算机程序，该至少一条计算机程序由该处理器601加载并执行以实现上述各个方法实施例提供的视频剪辑方法。当然，该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有至少一段计算机程序，该至少一段计算机程序由终端的处理器加载并执行以实现上述实施例的视频剪辑方法中终端所执行的操作。例如，所述计算机可读存储介质可以是只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、光盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、磁带、软盘和光数据存储设备等。

在一些实施例中，本申请实施例所涉及的计算机程序可被部署在一个计算机设备上执行，或者在位于一个地点的多个计算机设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算机设备上执行，分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。

本申请实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机程序代码，该计算机程序代码存储在计算机可读存储介质中。终端的处理器从计算机可读存储介质读取该计算机程序代码，处理器执行该计算机程序代码，使得该终端执行上述各种可选实现方式中提供的视频剪辑方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种视频剪辑方法，其特征在于，所述方法包括：

显示待剪辑的视频；

2.根据权利要求1所述的视频剪辑方法，其特征在于，所述显示待剪辑的视频包括：

3.根据权利要求1所述的视频剪辑方法，其特征在于，所述剪辑任务为所述片段组织任务，所述在所述剪辑界面中显示对应的剪辑任务的推荐执行信息包括：

4.根据权利要求3所述的视频剪辑方法，其特征在于，所述方法还包括：

基于所述视频的视频内容，对所述多个视频片段进行排序。

5.根据权利要求4所述的视频剪辑方法，其特征在于，所述基于所述视频所包括的视频片段的视频内容，对所述视频所包括的视频片段进行筛选，得到所述多个视频片段包括下述至少一项：

6.根据权利要求5所述的视频剪辑方法，其特征在于，所述基于所述视频所包括的视频片段的语义信息，筛选掉语义信息不符合预设语义条件的视频片段包括下述至少一项：

7.根据权利要求4所述的视频剪辑方法，其特征在于，基于所述视频所包括的视频片段的画面信息，筛选掉画面信息不符合预设画面条件的视频片段包括下述至少一项：

8.根据权利要求4所述的视频剪辑方法，其特征在于，所述基于所述视频的视频内容，对所述多个视频片段进行排序包括：

9.根据权利要求1所述的视频剪辑方法，其特征在于，所述剪辑任务为所述视频包装任务，所述在所述剪辑界面中显示对应的剪辑任务的推荐执行信息包括：

10.根据权利要求1所述的视频剪辑方法，其特征在于，所述方法还包括：

11.根据权利要求10所述的视频剪辑方法，其特征在于，所述基于所述视频的语义信息、画面信息以及音频信息中至少一种，获取与所述视频匹配的视频包装素材包括下述至少一项：

12.根据权利要求11所述的视频剪辑方法，其特征在于，所述基于所述视频的语义信息、画面信息以及音频信息中至少一种，获取与所述视频匹配的文字片段包括：

13.根据权利要求10所述的视频剪辑方法，其特征在于，所述基于所述视频的语义信息、画面信息以及音频信息中至少一种，获取与所述视频匹配的视频包装素材包括：

14.根据权利要求1所述的视频剪辑方法，其特征在于，所述方法还包括下述任一项：

15.根据权利要求1所述的视频剪辑方法，其特征在于，所述方法还包括：

16.一种视频剪辑装置，其特征在于，所述装置包括：

视频显示模块，被配置为显示待剪辑的视频；

17.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器用于存储至少一段计算机程序，所述至少一段计算机程序由所述处理器加载并执行权利要求1至15任一项权利要求所述的视频剪辑方法。

18.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储至少一段计算机程序，所述至少一段计算机程序用于执行权利要求1至15任一项权利要求所述的视频剪辑方法。

19.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至15任一项权利要求所述的视频剪辑方法。