WO2022127839A1

WO2022127839A1 - 视频处理方法、装置、设备、存储介质及计算机程序产品

Info

Publication number: WO2022127839A1
Application number: PCT/CN2021/138507
Authority: WO
Inventors: 叶欣靖; 王林林
Original assignee: 北京字跳网络技术有限公司
Priority date: 2020-12-18
Filing date: 2021-12-15
Publication date: 2022-06-23
Also published as: US20230133163A1; CN112653920A; EP4207783A1; JP2023554470A; CN112653920B; EP4207783A4

Abstract

本公开实施例提供一种视频处理方法、装置、设备、存储介质及计算机程序产品，该方法包括：在拍摄视频的过程中播放音频；响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，按照第一变速方式对所述音频中的第一部分进行变速播放；根据拍摄到的视频图像和音频，得到目标视频；在目标视频中，在目标对象呈现目标状态之前拍摄到的视频图像按照常速进行播放，在目标对象呈现目标状态之后拍摄到的视频图像按照第二变速方式进行变速播放，音频按照常速进行播放；其中，第一变速方式与第二变速方式的变速方向相反且变速速度相同。本公开实施例能够为用户提供便捷的操作，并且处理过程简单进而满足了用户需求，提高了用户的操作体验。

Description

视频处理方法、装置、设备、存储介质及计算机程序产品

本申请要求于2020年12月18日提交的申请号为202011508607.2、名称为“视频处理方法、装置、设备、存储介质及计算机程序产品”的中国专利申请的优先权，此申请的内容通过引用并入本文。

技术领域

本公开实施例涉及计算机技术领域，尤其涉及一种视频处理方法、装置、设备、存储介质及计算机程序产品。

背景技术

视频录制功能是客户端的视频拍摄器或视频录制应用程序的常用功能。随着科技的发展，视频录制功能的应用越来越广泛。

目前，视频录制功能可以实现制作多种方式的视频，比如制作慢动作的视频或是快动作的视频等，然而实现多种方式的视频的制作是基于一段拍摄的视频导入视频编辑软件或是编辑页进行相应的慢放处理或是快放处理，然后才能完成制作实现慢动作的视频或是快动作的视频播放。

因此，现有技术的视频变速录制方式操作步骤繁琐且处理过程复杂，无法为用户提供便捷的操作，进而影响用户体验。

发明内容

本公开实施例提供一种视频处理方法、装置、设备、存储介质及计算机程序产品，能够为用户提供便捷的操作，并且处理过程简单进而满足了用户需求，提高了用户的操作体验。

第一方面，本公开实施例提供一种视频处理方法，所述方法包括：

在拍摄视频的过程中播放音频；

响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，按照第一变速方式对所述音频中的第一部分进行变速播放；所述音频中的第一部分表示，在拍摄到的视频图像中识别到所述目标图像呈现所述目标状态时，所述音频中未播放的部分；

根据拍摄到的视频图像和所述音频，得到目标视频；

在所述目标视频中，在所述目标对象呈现所述目标状态之前拍摄到的视频图像按照常速进行播放，在所述目标对象呈现所述目标状态之后拍摄到的视频图像按照第二变速方式进行变速播放，所述音频按照常速进行播放；

其中，所述第一变速方式与所述第二变速方式的变速方向相反且变速速度相同。

第二方面，本公开实施例提供一种视频处理装置，所述装置包括：

拍摄模块，用于在拍摄视频的过程中播放音频；

处理模块，用于响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，按照第一变速方式对所述音频中的第一部分进行变速播放；所述音频中的第一部分表示，在拍摄到的视频图像中识别到所述目标图像呈现所述目标状态时，所述音频中未播放的部分；

所述处理模块，还用于根据拍摄到的视频图像和所述音频，得到目标视频；

播放模块，用于在所述目标视频中，在所述目标对象呈现所述目标状态之前拍摄到的视频图像按照常速进行播放，在所述目标对象呈现所述目标状态之后拍摄到的视频图像按照第二变速方式进行变速播放，所述音频按照常速进行播放；

第三方面，本公开实施例提供一种电子设备，

包括：至少一个处理器；以及存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如上述第一方面任一项所述的视频处理方法。

第四方面，本公开实施例提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如上第一方面任一项所述的视频处理方法。

第五方面，本公开实施例提供一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现如上述第一方面所述的视频处理方法。

第六方面，本公开实施例提供一种计算机程序，所述计算机程序被处理器执行时，用于实现如上述第一方面所述的视频处理方法。

本公开实施例提供的视频处理方法、装置、设备、存储介质及计算机程序产品，通过在拍摄视频的过程中播放音频，然后响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，按照第一变速方式对该音频中的第一部分进行变速播放，这里的第一部分表示在拍摄到的视频图像中识别到目标对象呈现目标状态时音频中未播放的部分；再根据拍摄到的视频图像和音频得到目标视频，在目标视频中，在目标对象呈现目标状态之前拍摄到的视频图像按照常速进行播放，在目标对象呈现目标状态之后拍摄到的视频图像按照第二变速方式进行变速播放，且音频按照常速进行播放，其中，第一变速方式与第二变速方式的变速方向相反且变速速度相同，保证在目标视频中音频是常速播放，而视频图像是一部分常速播放一部分变速播放，实现了对拍摄视频的变速录制以及播放。本申请直接通过识别目标对象呈现的目标状态即可开启控制视频变速录制的操作，无需将拍摄的视频导入视频编辑软件或是编辑页进行相应的慢放处理或是快放处理，为了提高用户体验，使得用户对变速录制有较强的感知，在拍摄视频过程中变速录制触发后，播放的音频是按照第一变速方式变速播放，而在拍摄完成后生成的目标视频播放过程中，变速触发后拍摄的视频是按照第二变速方式变速播放视频图像，而音频是按照常速播放的，满足了用户的个性化需求，处理过程简单且简化了操作步骤，使得用户通过便捷的操作即可实现视频的变处理，进而提高了用户体验。

附图说明

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例提供的拍摄界面的示意图；

图2为本公开实施例提供的视频处理方法的场景示意图；

图3为本公开又一实施例提供的视频处理方法的场景示意图；

图4为本公开另一实施例提供的视频处理方法的流程示意图；

图5为本公开实施例提供的视频处理方法的流程示意图；

图6为本公开再一实施例提供的视频处理方法的场景示意图；

图7为本公开实施例提供的视频处理装置的结构框图；

图8为本公开实施例提供的电子设备的硬件结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实施例仅用于示例性作用，并非用于限制本公开的保护范围。

应当理解，本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行，和/或并行执行。此外，方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。

本文使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。

需要注意，本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意，本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。

本公开实施方式中的多个装置或模块之间所交互的消息或者信息的名称仅用于说明性的目的，而并不是用于对这些消息或信息的范围进行限制。

目前，视频录制功能可以实现制作多种方式的视频，比如制作慢动作的视频或是快动作的视频等，然而实现多种方式的视频的制作是基于一段拍摄的视频导入视频编辑软件或是编辑页进行相应的慢放处理或是快放处理，然后才能完成制作实现慢动作的视频或是快动作的视频播放。此外，现有技术中也有拍摄功能中含有快慢速功能的平台，但是这里的快慢速仅仅是拍摄过程中实时处理并呈现给用户的，实时处理的要求难度较大且录制时间较短，通常为1s。因此，现有技术的视频录制方式操作步骤繁琐且处理过程复杂，无法为用户提供便捷的操作，进而影响用户体验。

为了解决上述问题，本公开的技术构思是可以配置变速触发操作，通过识别变速触发操作，以及获取到的变速录制的第二变速方式，首先基于第二变速方式，获取与第二变速方式匹配的第一变速方式即第一变速方式与第二变速方式的变速方向相反且变速速度相同，然后将在拍摄到的视频图像中识别到的目标对象呈现目标状态之后拍摄到的视频图像按照第二变速方式进行变速播放，用以提示用户开启了变速处理，然后将视频图像和音频生成的目标视频中的一部分视频图像按照常速播放一部分按照第二变速方式播放，同时保证目标视频中的音频常速播放，完成视频的变速处理，处理过程简单且简化了操作步骤，使得用户通过便捷的操作即可实现变速录制，进而提高了用户体验。

下面以具体地实施例对本公开的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

在实际应用中，本公开实施例的执行主体可以是终端设备，比如移动终端、计算机设备(如，台式机、笔记本电脑、一体机等)等，移动终端可以包括智能手机、掌上电脑、平板电脑、带显示屏的可穿戴设备等具有播放功能的移动设备。在实际应用中，显示的用户界面，比如拍摄界面可以用于拍摄或录制目标对象，这里的目标对象可以为人物、景色等，播放界面可以用于播放目标视频，该目标视频可以是经过变速录制处理过的音视频，本公开对此不做具体限定。

在一种场景下，参考图1，图1为本公开实施例提供的拍摄界面的示意图，终端设备可以显示用于拍摄目标对象的拍摄界面10，该拍摄界面10设置有拍摄按钮101、拍摄时长切换按钮102、特效编辑按钮103、选择音乐按钮104、相册按钮105，还可以包括其他拍摄功能展示区域106。其中，可以通过点击拍摄按钮101触发目标对象的拍摄操作。本领域技术人员应当理解，拍摄按钮101、拍摄时长切换按钮102、特效编辑按钮103、选择音乐按钮104以及其他拍摄功能展示区域所在位置和大小可以根据实际需求设置。其中，拍摄按钮101用于为用户提供拍摄启动功能；拍摄时长切换按钮102用于为用户提供拍摄时长切换功能；特效编辑按钮103用于为用户提供特效，其中特效中可以自带默认音乐，通过特效编辑效果可以识别拍摄对象即目标对象呈现的目标状态，即可触发变速处理操作；选择音乐按钮104可以为用户提供音乐库；相册按钮105用于为用户提供拍摄素材。

根据本公开实施例的视频处理方法可以应用于拍摄或录制场景，具体可以为视频变速录制场景，例如，支持触发配置好的任意特效编辑效果，该特效编辑效果用于支持控制视频变速录制的功能，可以通过识别拍摄到的视频图像中是否呈现有目标状态，若在拍摄或录制过程中识别到该目标状态即检测到用于控制视频变速录制的触发操作时，即可实现变速处理，比如对视频图像的变速处理或者拍摄时音频的变速播放等，无需繁琐的操作步骤。本公开不对应用场景进行限制。

下面以具体地实施例对本公开的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。终端设备可以在该拍摄界面10中的功能展示区域中展示多个功能，比如翻转、滤镜、美化、倒计时、特效编辑效果、相册、选择音乐、拍摄时长等等，其中，这里的特效编辑效果可以包括用于支持控制视频变速录制功能的特效编辑效果，比如预定义贴纸，该预定义贴纸中特效可以包含需求变速处理的速率，以要求的速率进行录制可以实现变速录制，然后通过识别出目标对象呈现目标状态，获取该特效编辑效果配置的变速方式(包括变速方向和变速的速度)；也可以通过拍摄界面向用户提供可选择的变速处理的速度以及变速方向(快速或慢速)，然后基于用户选择的变速方式结合特效编辑效果中特效配置的可识别的变速触发方式即识别目标对象呈现的目标状态。

其中，本公开实施例配置的特效编辑效果，可以通过识别触发动作或是具体物体控制变速录制。以贴纸为例，可以对该贴纸进行如下配置：此贴纸开拍重置；此贴纸只能录制有效，预览无效；此贴纸相应的变速的速率配置在资源包内；变速播放事件、变速的速率，要实时传给视频表示(Video Expression，VE)软件开发工具包(Software Development Kit，SDK)和客户端；新增变速录制消息接口，要求最慢控制在10帧以内；贴纸在制作时，适当加速，并适当加帧，进入编辑页之后慢放之后变成正常速度，如果需要跟着画面变慢的效果，配置正常速度的贴纸即可，粒子效果、物理效果(布料、羽毛等)只能跟着变慢；变速播放事件、变速的速率，要实时传给VE和客户端，这里可能需要新开接口；其中，此贴纸禁止合拍；此贴纸不录原声；此贴纸需要禁用调整速率的功能。本公开不对此进行限制。

具体地，以拍摄对象为人物，且特效编辑效果本身配置有变速触发特效以及变速方式(可以是一个特效编辑效果对应一个变速触发特效，一个特效对应一个变速方式；也可以是一个特效编辑效果对应多个变速触发特效，一个特效对应一个变速方式；还可以是一个特效编辑效果对应多个变速触发特效，多个特效对应一个变速方式；还可以是多个特效编辑效果对应一个变速触发特效，一个特效对应一个变速方式等等，特效与变速方式存在映射关系，在此不做具体限定)为例，在拍摄界面10显示该人物。在拍摄界面10用户可以选择拍摄时长，比如图1中所示的15s，表示当前的拍摄界面允许最长拍摄15s。用户通过点击特效编辑按钮103(参见图2中(a)所示)，显示特效编辑效果展示栏1031，包括多个贴纸(参见图2中(b)所示)，选择特效编辑效果中的预定义贴纸，比如贴纸1，特效编辑按钮所在位置替换为贴纸1(参见图2中(c)所示)，并且在拍摄界面显示该贴纸1对应的背景图像；还可以同时点击上述其他功能，比如点击选择音乐按钮104(参见图3中(a)所示)，显示音乐选择展示界面1041(参见图3中(b)所示)，用户可以从搜索栏中搜索目标音乐并确认使用，比如音乐1(参见图3中(c)所示)。

其中，需要说明的是，图2中(a)所示与图3中(a)所示的操作顺序不做具体限定。在图2中(c)和图3中(c)的基础上，用户可以通过点击拍摄界面中的拍摄按钮101开启拍摄功能(参见图4中(a)所示)，当拍摄功能开启后，终端设备开始拍摄目标对象，当前的拍摄界面上显示拍摄时间的进度条110、结束拍摄按钮107，并且功能模块隐藏，同时拍摄按钮101更新为拍摄状态即由拍摄按钮101切换为拍摄暂停按钮1011(参见图4中(b)所示)，当检测到拍摄过程中特效出现(比如微笑)，即可触发变速录制功能(以慢速录制为例，参见图4中(c)所示)，在拍摄过程中视频图像是按照常速播放的，与此同时音频以特效要求的速率相反方向的速率进行播放，并且在拍摄完成后播放视频时，通过对获取的触发变速操作之后拍摄视频图像按照特性要求的变速方式进行播放，音频按照常速播放，进而保证在播放拍摄完成的视频时播放的音频是正常速率。

以特效编辑效果的特效为微笑为例，在拍摄过程中若检测到微笑的动作，则触发用于控制视频变速录制的操作，获取该微笑特效要求变速录制的速率，比如慢速2倍，同时将以快速2倍的速率对特效触发后的音频进行后台(这里指音视频端)快速2倍的变速处理并播放，此时为了保证在录制完成后播放时播放的是音频不受变速录制之前播放和/或随机出现的原声的干扰，在对音频处理时不录制拍摄的原声，比如环境声音以及播放的音乐原声等，需要说明的是，在拍摄过程中，对于用户来说，变速录制可以是无感知的，播放视频图像以及音频可以是正常速度，也可以为了满足用户体验，针对变速录制，在拍摄过程中，拍摄到的视频图像是常速播放，对音频中的触发变速操作开启后未播放的部分按照与特效要求的第一变速方式匹配的第二变速方式进行播放。在拍摄结束后按照正常速率播放特效出现前录制的音视频以及在检测到特效触发操作(即变速触发操作)后按照特效要求的速率播放视频以及按照正常速率播放音频，实现视频变速录制处理，为用户提供便捷的操作，并且处理过程简单进而满足了用户需求，提高了用户的操作体验。

其中，这里的视频的常速指的是拍摄的速度，音频的常速是指它本身的速度。本公开不对应用场景进行限制。

此外，本领域技术人员应当理解的是，“触发”操作可以包括(但不限于)：点击触发，即用户通过点击对应的按钮或者界面中的任一位置实现触发；手势触发，用户通过做出相应的手势从而实现触发操作；语音触发，即用户通过发出相应的语音指令实现触发操作；表情触发，即通过做出相应的表情从而实现触发操作，等等，本公开不对触发操作进行限制。

在一个实施例中，视频处理方法的实现可以用过以下方式实现：

参考图5，图5为本公开实施例提供的视频处理方法的流程示意图。该视频处理方法可以包括：

S101、在拍摄视频的过程中播放音频；

S102、响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，按照第一变速方式对所述音频中的第一部分进行变速播放；所述音频中的第一部分表示，在拍摄到的视频图像中识别到所述目标对象呈现所述目标状态时，所述音频中未播放的部分。

其中，第一变速方式可以是与识别到的目标状态匹配的，比如，微笑触发变速处理操作，且变速方式为慢速2倍播放，则第一变速方式是快速2倍；也可以是由用户在拍摄视频之前选择输入的，在此不做具体限定。

本公开实施例的方法可以应用在终端设备中，在终端设备上可以显示用于拍摄目标对象的用户界面即拍摄界面，该拍摄界面上包括拍摄区域、功能展示区域以及拍摄按钮，在功能展示区可以展示特效编辑效果模块，通过点击特效编辑效果模块对应的特效编辑按钮可以在拍摄界面向用户展示多个特效编辑效果，这里多个特效编辑效果中可以包括用于支持视频变速录制功能的特效编辑效果。其中，多个特效编辑效果的展示方式不做具体限定。

具体地，用户通过终端设备点击拍摄按钮即可开启拍摄功能，在拍摄视频的过程中播放默认音频或是特效编辑效果自带音频或是用户选择的音频等等。终端设备在拍摄过程中实时检测是否存在用于控制视频变速处理的操作即识别目标对象是否呈现目标状态，如果检测到，则响应于该识别到的目标状态。首先获取在拍摄到的视频图像中识别到目标对象呈现目标状态时音频中未播放的部分所需变速播放的变速方式即第一变速方式，该第一变速方式可以是与特效要求的录制方式匹配的方式，比如特效要求的录制播放方式为慢速2倍播放，则第一变速方式为快速2倍播放；也可以是用户输入的方式。该目标状态可以包括交互动作和/或拍摄视频中包含的预设物体，其中，交互动作可以包括脸部，四肢动作，如微笑，眨眼，举手，抬腿等，识别到的目标对象是比如衣服，汽车，建筑等预设物体，本公开不对此进行限定。

在实际应用中，在变速触发之前，需要显示拍摄界面并开启拍摄功能，在此之前需要用户提前选取变速录制相应的特效比如某一特效编辑效果。具体地，终端设备可以通过以下步骤实现拍摄界面的显示以及拍摄功能的开启：

步骤a1、显示用于拍摄目标对象的所述拍摄界面，所述拍摄界面包括用于支持控制视频变速录制的特效编辑按钮。

步骤a2、响应作用于所述特效编辑按钮的第一触发操作，在接收到用于指示在拍摄界面执行拍摄操作的指令时，执行第一拍摄操作，并在所述拍摄界面中拍摄目标对象的同时，检测目标对象是否呈现目标状态，所述目标状态包括所述目标对象呈现目标动作的状态和/或所述目标对象中呈现有预设物体。

步骤a3、若在拍摄视频过程中识别到所述目标对象呈现目标状态，则执行控制视频变速录制的操作。

本公开实施例中，当拍摄/录制视频的用户(以下简称为用户)打开应用程序时，终端设备可以显示多个切换界面，用户可以点击与拍摄界面匹配的切换按键跳转显示拍摄界面10。其中，拍摄界面可以包括用于支持控制视频变速录制的特效编辑按钮，具体可以为贴纸，可以是一个贴纸对应开启一个速度的录制功能；也可以是一个贴纸对应多个速度的录制功能。因此，可以根据目标对象的动作或目标对象具体是什么，就相应的触发什么速度的录制功能。比如，微笑对应慢速2倍录制，挥手对应快速2倍录制等等，也可以是贴纸中的特效动作用于触发变速处理操作，用户在拍摄视频之前可以通过选择其他特效编辑效果比如变速方式特效编辑效果，在拍摄过程中，识别到呈现的目标状态时，依据获取到的用户输入的变速方式进行相应的变速处理。本公开不对此进行限定。

以特效编辑效果中的特效配置有变速方式为例，在拍摄界面中，拍摄开启之前，用户可以通过点击特效编辑按钮，从特效编辑效果的展示区域中选择用于支持控制视频变速录制的特效编辑效果，其中，若用于支持控制视频变速录制的特效编辑效果为多个，则可以从特效编辑效果中选择想要拍摄的速率对应的目标特效编辑效果，然后基于该特效编辑效果中的特效做出相应的目标触发操作；若用于支持控制视频变速录制的特效编辑效果为一个，则可以基于特效编辑效果中可识别的特效做出相应的目标触发操作。

具体地，用户选中特效编辑效果后，终端设备响应作用于该特效编辑按钮上的触发操作即第一触发操作，在拍摄界面显示该特效编辑效果的背景环境，当用户点击开启拍摄的拍摄按钮时，生成用于指示在拍摄界面执行拍摄操作的指令，终端设备接收该指令，开始执行拍摄操作即第一拍摄操作。在拍摄过程中，实时检测拍摄的视频中是否存在目标触发操作，比如微笑、挥手或是目标建筑等交互动作和/或目标物体，若存在，则终端设备中的客户端将与该目标触发操作相应的变速录制消息发送至终端设备中的音视频端，用以对当前音乐进行变速录制并保存。

S103、根据拍摄到的视频图像和所述音频，得到目标视频。

S104、在所述目标视频中，在所述目标对象呈现所述目标状态之前拍摄到的视频图像按照常速进行播放，在所述目标对象呈现所述目标状态之后拍摄到的视频图像按照第二变速方式进行变速播放，所述音频按照常速进行播放；

本实施例中，将拍摄到的视频图像与音频进行合成，得到待播放的音视频即目标视频。然后拍摄结束后，终端设备进行目标视频的播放，在目标视频播放过程中，按照常速播放在目标对象呈现所述目标状态之前拍摄到的视频图像以及按照第二变速方式变速播放在目标对象呈现目标状态之后拍摄到的视频图像，同时按照常速播放音频。

这里的视频的常速指的是拍摄的速度，音频的常速是指它本身的速度。这里的第二变速方式与第一变速方式的变速方向相反，比如，第一变速方式是慢速2倍，则第二变速方式为快速2倍，目的可以是为了在拍摄结束后播放目标视频时，音乐的播放是以正常速率播放的，提高用户的观看体验。为了保证在拍摄完成后播放时播放的是音频不受变速录制之前播放和/或随机出现的原声的干扰，在对音频处理的同时不录制拍摄的原声。

在一种可能的设计中，所述目标状态与所述第一变速方式存在映射关系；或者，所述第二变速方式是响应于用户的设置操作确定的，所述第一变速方式是基于所述第二变速方式确定的。

本实施例中，针对目标状态与第一变速方式存在映射关系，可以是特效编辑效果本身默认了变速的类型和/或速度，因此，特效编辑效果所能识别到的目标状态即可确定其对应的变速的类型和/或速度。也可以是通过特效编辑效果识别特效，特效中不同的动作触发不同类型的变速，甚至不同速度的变速，进而通过目标状态确定变速的类型和/或速度。

其中，如何响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，按照第一变速方式对所述音频中未播放的部分进行变速播放，可以通过以下步骤实现：

步骤b1、响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，确定与所述目标状态具有映射关系的第一变速方式。

步骤b2、按照所述第一变速方式，对所述音频中的第一部分进行变速播放。

本实施例中，响应于识别到的目标状态，通过映射关系，获取与目标状态匹配的第一变速方式，然后基于第一变速方式对音频中的第一部分进行变速播放。

针对第二变速方式是响应于用户的设置操作确定的，所述第一变速方式是基于所述第二变速方式确定的，可以是用户通过滑竿推动设置不同的速度，用户通过按钮选择不同类型的变速确定的。在此不具体限定用户以何种方式选择或设置不同的变速方式，变速方式包括变速的类型和/或速度。

具体地，该第二变速方式可以是特效要求的变速方式，比如特效要求的变速方式为慢速2倍播放，则第一变速方式为快速2倍播放，第二变速方式为慢速2倍播放；也可以是用户输入的方式。具体地，拍摄结束后跳转显示播放界面，通过播放界面播放变速处理的视频即目标视频，这里的目标视频中包括在目标对象呈现目标状态变速之前拍摄的视频图像以及按照第一变速方式播放的在目标对象呈现目标状态之后拍摄到的视频图像以及常速播放的音频。其中，按照第一变速方式播放的视频图像可以通过加帧或是减帧操作处理的。

此外，当拍摄功能开启时，终端设备开始拍摄目标对象，并对当前拍摄的视频进行播放，这里播放的内容包括拍摄目标对象时的视频图像以及拍摄过程中播放的音乐，直到变速触发，开始变速处理，按照第一变速方式对音频中的第一部分进行变速播放，这里的音频中的第一部分表示，在拍摄到的视频图像中识别到所述目标对象呈现所述目标状态时，所述音频中未播放的部分。其中，该音频中的第一部分的起始时间为响应于在拍摄到的视频图像中识别到目标对象呈现目标状态时，拍摄界面拍摄目标对象的时间(即开启变速处理的时刻)；音频中的第一部分的终止时间为响应于拍摄结束的时间，该拍摄结束的时间可以是用户触发的也可以是拍摄时间到达时刻。示例性的，当音频中的第一部分的起始时间为拍摄开启的时间时，说明开启拍摄功能时立即检测出目标状态，因此，在完成拍摄后播放的视频图像一开始即为变速的视频图像。

其中，如何显示播放界面，可以参见图6所示，图6为本公开再一实施例提供的场景示意图。在播放目标视频之前，所述方法还可以包括：

响应于用于指示结束拍摄的第二触发操作，跳转显示所述播放界面，所述播放界面用于播放所述目标视频；或者，

当所述拍摄界面中的拍摄时间结束后，跳转显示所述播放界面。

本公开实施例中，用户在拍摄过程中，可以通过点击结束拍摄按钮107(参见图6中(a)所示)，终端设备响应于该点击操作即第二触发操作，从拍摄界面10跳转至播放界面20并显示(参见图6中(b)所示)。若在拍摄过程中未检测到用户触发结束拍摄按钮107的操作，当拍摄界面中的拍摄时间结束后，比如，拍摄界面上的拍摄进度条到达结束位置(参见图6中(c)所示)，从拍摄界面10自动跳转至播放界面20并显示(参见图6中(b)所示)。本公开对拍摄界面与播放界面切换跳转的方式不做具体限定。

以微笑动作作为目标触发操作(即目标状态)，以微笑动作表示2倍慢速录制的触发动作为例，首先添加微笑动作对应的特效编辑效果，同时可以选择音乐也可以将该微笑动作对应的特效编辑效果的背景音乐作为拍摄的音乐，终端设备开始检测目标触发操作。具体地，是否有微笑动作，若有微笑动作，则确定当前微笑动作的出现是否在拍摄中，若是在拍摄中，则确定是否触发变速状态，若是，则将该微笑动作要求的速率对应的消息即按照2倍慢速录制的消息发送至音视频端VE，VE将默认音乐(拍摄界面当前播放的音乐)快速录制保存(这里的快速录制可以是按照2倍快速录制)，同时不录制原声，然后将录制后的目标音频发送至客户端，客户端按照2倍慢放速度播放，缩短总时间，结束录制以及播放。

本公开无需用户操作屏幕，只需要对着摄像头完成微笑动作即可控制拍摄速度。同时，无需将拍摄的视频再导入其他编辑页或是软件中，处理过程简单，提高了用户体验。需要说明的是，以识别微笑为例，是为了清楚说明变速录制触发以及处理过程，但是本公开对交互的行为不限制，包括举手，堵嘴，摇头等等。

本公开实施例提供的视频处理方法，通过在拍摄视频的过程中播放音频，然后响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，按照第一变速方式对该音频中的第一部分进行变速播放，这里的第一部分表示在拍摄到的视频图像中识别到目标对象呈现目标状态时音频中未播放的部分；再根据拍摄到的视频图像和音频得到目标视频，在目标视频中，在目标对象呈现目标状态之前拍摄到的视频图像按照常速进行播放，在目标对象呈现目标状态之后拍摄到的视频图像按照第二变速方式进行变速播放，且音频按照常速进行播放，其中，第一变速方式与第二变速方式的变速方向相反且变速速度相同，保证在目标视频中音频是常速播放，而视频图像是一部分常速播放一部分变速播放，实现了对拍摄视频的变速录制以及播放。本申请直接通过识别目标对象呈现的目标状态即可开启控制视频变速录制的操作，无需将拍摄的视频导入视频编辑软件或是编辑页进行相应的慢放处理或是快放处理，为了提高用户体验，使得用户对变速录制有较强的感知，在拍摄视频过程中变速录制触发后，播放的音频是按照第一变速方式变速播放，而在拍摄完成后生成的目标视频播放过程中，变速触发后拍摄的视频是按照第二变速方式变速播放视频图像，而音频是按照常速播放的，满足了用户的个性化需求，处理过程简单且简化了操作步骤，使得用户通过便捷的操作即可实现视频的变处理，进而提高了用户体验。

在本公开的一个实施例中，在上述实施例的基础上，对如何得到目标视频，可以通过以下至少两种方式实现：

方式1、将视频图像进行变速处理后再与常速播放的音频合成目标视频。

步骤c1、按照常速对所述拍摄到的视频图像进行录制，得到第一视频。

步骤c2、将所述第一视频划分成第一视频片段和第二视频片段；所述第一视频片段表示，所述第一视频在所述目标对象呈现所述目标状态之前的片段；所述第二视频片段表示，所述第二视频在所述目标对象呈现所述目标状态之后的片段。

步骤c3、按照所述第二变速方式对所述第二视频片段进行变速处理，得到第三视频片段。

步骤c4、在所述第一视频片段和所述第三视频片段的拼接视频中合成所述音频，得到所述目标视频。

本实施例中，首先按照常速对拍摄到的视频图像进行录制，得到第一视频，然后将第一视频划分成在所述目标对象呈现所述目标状态之前的片段即第一视频片段和在所述目标对象呈现所述目标状态之后的片段即第二视频片段。保存第一视频片段不变，针对第二视频片段，按照第二变速方式对第二视频片段进行加帧或减帧处理，得到第三视频片段，这里的第三视频片段为变速处理后的视频图像。然后将保存的第一视频片段与变速处理得到的第三视频片段进行拼接得到拼接视频，同时将常速播放录制保存的音频与该拼接视频进行合成，得到目标视频。由于是后台处理，不是实时处理，因此可以支持区别于现有技术时长的变速处理，并且操作简单，无需导入其他编辑软件，提高了用户体验。

方式2、将经过变速处理的视频图像与经过变速处理后的音频进行拼接处理生成目标视频。

步骤d1、在拍摄视频的过程，对播放出的视频图像和音频进行录制，得到第二视频；在所述第二视频中，在所述目标对象呈现所述目标状态之前所述音频按照常速播放，在所述目标对象呈现所述目标状态之后所述音频按照第一变速方式进行变速播放，所述拍摄到的视频图像按照常速播放。

步骤d2、将所述第二视频划分成第三视频片段和第四视频片段；所述第三视频片段表示，所述第二视频在所述目标对象呈现所述目标状态之前的片段；所述第四视频片段表示，所述第二视频在所述目标对象呈现所述目标状态之后的片段。

步骤d3、按照所述第二变速方式对所述第四视频片段进行变速处理，得到第五视频片段；将所述第三视频片段和所述第五视频片段进行拼接，得到所述目标视频。

本实施例中，在拍摄视频的过程，对播放出的视频图像和音频进行录制，得到第二视频，并且，录制的在目标对象呈现目标状态之前音频按照常速播放，录制的在目标对象呈现目标状态之后音频按照第一变速方式变速播放，录制的视频图像按照常速播放。其中，将第二视频划分成在所述目标对象呈现所述目标状态之前的片段即第三视频片段和在所述目标对象呈现所述目标状态之后的片段即第四视频片段。

具体地，针对第三视频片段进行保存，针对第四视频片段按照第二变速方式变速处理即对第四视频片段中的图像视频进行加帧或减帧处理，对第四视频片段中的音频即经过第一变速方式变速播放录制的音频按照第二变速方式播放，使得播放的音频是常速播放。将保存的第三视频片段与经过变速处理的第五视频片段进行拼接，得到目标视频。由于是后台处理，不是实时处理，因此可以支持区别于现有技术时长的变速处理，并且操作简单，无需导入其他编辑软件，提高了用户体验。

其中，为了保证经过第一变速方式播放的音频为正常速度，则可以通过与第一变速方式的变速方向相反且速度相同的第二变速方式先进行变速录制得到第一变速方式处理后的音频，比如，第一变速速度是慢速2倍的速率，则第二变速速度为快速2倍的速率。然后再对第一变速方式处理后的音频按照第二变速方式进行变速处理，得到常速播放的音频即目标视频中播放的音频。

具体地，终端设备获取拍摄过程中触发变速录制时当前播放的目标音乐，然后按照确定的第二变速方式对呈现目标状态之后的音频进行变速录制，生成变速后的不包含在拍摄界面中拍摄时的原声的音频。

其中，经过第一变速方式变速录制后的音频的起始时间为响应于识别到呈现目标状态的时间(即响应于识别到的目标对象呈现目标状态时的时刻)；该经过第一变速方式变速录制后的音频的终止时间为拍摄结束时，拍摄界面拍摄目标对象时播放音乐的进度对应的时间(即结束变速录制的时刻)。

其中，变速的速率包含了慢速、快速、正常速度，速度为0.333-3之间的任意数值，可以用速度倍率表示变速。示例性的，以第一变速速度为2倍慢速为例，比如正常速率录制的视频图像是30帧/s，按照2倍慢速的速率，对视频图像进行相应的减帧操作，比如录制的视频图像是2s录制30帧，使得在播放时，每帧视频图像播放的速率变慢。

在本公开的一个实施例中，在上述实施例的基础上，在拍摄功能开启后，该视频处理方法还可以包括：

响应于用于指示结束拍摄的第二触发操作，重置下述至少一项：所述第一变速方式、所述第二变速方式、特效编辑效果的状态、拍摄界面的状态。

本公开实施例中，用户可以点击拍摄界面中用于指示结束拍摄的结束按钮，终端设备检测到作用于结束按钮的触发操作即第二触发操作时，响应于该第二触发操作，发送重置录制速度的消息，控制VE重置状态、客户端重置状态，进而更新拍摄状态。具体地，重置第一变速方式和/或所述第二变速方式和/或特效编辑效果的状态和/或拍摄界面的状态。

具体地，用户点击开拍/停止特效编辑效果的具体流程为：终端设备首先判断是否开始拍摄，若开始拍摄，则更新拍摄状态，结束开始拍摄状态；若不是开始拍摄，则判断是否结束拍摄，若结束拍摄，则发送重置录制速度的消息，控制VE重置状态、客户端重置状态，进而更新拍摄状态，结束拍摄状态。

在本公开的一个实施例中，在上述实施例的基础上，对视频处理方法进行了详细说明。在跳转显示所述播放界面之后，视频处理方法还可以通过以下步骤实现：

步骤e1、响应于第一返回触发操作，控制所述播放界面返回至含有拍摄的所述目标对象的所述拍摄界面。

步骤e2、若接收到用于指示重新拍摄的指令，则根据所述用于指示重新拍摄的指令，重置所述含有拍摄的所述目标对象的所述拍摄界面的内容并退出所述拍摄界面。

本公开实施例中，在跳转显示播放界面之后，在播放界面播放录制的视频即目标视频，当用户想要返回拍摄界面重新编辑或是重新拍摄或是继续拍摄时，用户可以点击播放界面上的第一返回按钮，终端设备响应作用于该第一返回按钮的第一返回触发操作，控制播放界面返回至含有拍摄的目标对象的拍摄界面即跳转显示处于暂停拍摄状态的拍摄界面。用户可以在当前的拍摄界面选择取消当前拍摄的内容即用户可以点击当前的拍摄界面上的第二返回按钮，生成用于指示重新拍摄的指令并发送至终端设备，终端设备接收该指令，并根据该指令重置该拍摄界面的内容并退出当前的拍摄界面。便于用户重新拍摄，且交互操作简单。

在本公开的一个实施例中，在上述实施例的基础上，对视频处理方法进行了详细说明。该视频处理方法还可以包括以下步骤：

步骤f1、在所述控制所述播放界面返回至含有拍摄的所述目标对象的所述拍摄界面之后或者在拍摄界面拍摄目标对象时接收到用于指示暂停拍摄的指令时，检测当前的拍摄界面上的拍摄时间的进度条是否达到结束位置。

步骤f2、若未到达结束位置，则当接收到用于指示在拍摄界面执行拍摄操作的指令时，控制在所述拍摄界面上继续执行拍摄操作。

本公开实施例中，如果拍摄界面中的拍摄时间还未结束，用户可以继续在当前的拍摄界面接着原来拍摄的内容继续拍摄。可以通过以下至少两种场景实现：

场景1：当前的界面处于播放界面，用户可以通过点击播放界面中的第一返回按钮，使得终端设备将播放界面返回至处于暂停拍摄状态下的拍摄界面，该状态下的拍摄界面上显示有拍摄时间的进度条，通过检测该状态下的拍摄界面上的拍摄时间的进度条是否到达结束位置来确定是否能继续拍摄，若未到达结束位置，则用户可以点击该状态下的拍摄界面上的拍摄按钮，终端设备接收用于指示在拍摄界面执行拍摄操作的指令，并根据该指令在拍摄界面上继续执行拍摄操作。

场景2：当前的界面处于拍摄界面，且拍摄界面通过响应于用户输入的用于指示暂停拍摄的指令处于暂停拍摄状态。该状态下的拍摄界面上显示有拍摄时间的进度条，通过检测该状态下的拍摄界面上的拍摄时间的进度条是否到达结束位置来确定是否能继续拍摄，若未到达结束位置，则用户可以点击该状态下的拍摄界面上的拍摄按钮，终端设备接收用于指示在拍摄界面执行拍摄操作的指令，并根据该指令在拍摄界面上继续执行拍摄操作。

因此，本公开为了降低用户拍摄“慢动作变身”类视频的门槛，使用户通过特效编辑效果录慢动作视频超过1s或录快动作，解决音画不匹配的问题，同在在特效包内，加入了“识别某个触发条件，让录制变速”的逻辑，且通过特效将变速播放事件实时传给音视频端和客户端，在音视频端进行变速录制，能够帮助用户更简单地生产更高质量的慢动作视频或快动作视频，提高了用户体验。

对应于上文公开实施例的视频处理方法，图7为本公开实施例提供的视频处理装置的结构框图。其中视频处理装置可以是终端设备。为了便于说明，仅示出了与本公开实施例相关的部分。参照图7，所述视频处理装置70可以包括：拍摄模块701、处理模块702和播放模块703；拍摄模块，用于在拍摄视频的过程中播放音频；处理模块702，用于响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，按照第一变速方式对所述音频中的第一部分进行变速播放；所述音频中的第一部分表示，在拍摄到的视频图像中识别到所述目标图像呈现所述目标状态时，所述音频中未播放的部分；所述处理模块，还用于根据拍摄到的视频图像和所述音频，得到目标视频；播放模块，用于在所述目标视频中，在所述目标对象呈现所述目标状态之前拍摄到的视频图像按照常速进行播放，在所述目标对象呈现所述目标状态之后拍摄到的视频图像按照第二变速方式进行变速播放，所述音频按照常速进行播放；其中，所述第一变速方式与所述第二变速方式的变速方向相反且变速速度相同。

本公开实施例提供的拍摄模块701、处理模块702和播放模块703，通过在拍摄视频的过程中播放视频，然后响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，按照第一变速方式对该音频中的第一部分进行变速播放，这里的第一部分表示在拍摄到的视频图像中识别到目标对象呈现目标状态时音频中未播放的部分；再根据拍摄到的视频图像和音频得到目标视频，在目标视频中，在目标对象呈现目标状态之前拍摄到的视频图像按照常速进行播放，在目标对象呈现目标状态之后拍摄到的视频图像按照第二变速方式进行变速播放，且音频按照常速进行播放，其中，第一变速方式与第二变速方式的变速方向相反且变速速度相同，保证在目标视频中音频是常速播放，而视频图像是一部分常速播放一部分变速播放，实现了对拍摄视频的变速录制以及播放。本申请直接通过识别目标对象呈现的目标状态即可开启控制视频变速录制的操作，无需将拍摄的视频导入视频编辑软件或是编辑页进行相应的慢放处理或是快放处理，为了提高用户体验，使得用户对变速录制有较强的感知，在拍摄视频过程中变速录制触发后，播放的音频是按照第一变速方式变速播放，而在拍摄完成后生成的目标视频播放过程中，变速触发后拍摄的视频是按照第二变速方式变速播放视频图像，而音频是按照常速播放的，满足了用户的个性化需求，处理过程简单且简化了操作步骤，使得用户通过便捷的操作即可实现视频的变处理，进而提高了用户体验。

本公开实施例提供的装置，可用于执行上文第一方面任一项所述的视频处理方法实施例的技术方案，其实现原理和技术效果类似，本公开实施例此处不再赘述。

在本公开的一个实施例中，本公开实施例在上述公开实施例的基础上，对视频处理装置进行了详细说明。其中，所述目标状态与所述第一变速方式存在映射关系；处理模块702，具体用于：响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，确定与所述目标状态具有映射关系的第一变速方式；按照所述第一变速方式，对所述音频中的第一部分进行变速播放。

在本公开的一个实施例中，所述目标状态包括所述目标对象呈现目标动作的状态和/或所述目标对象中呈现有预设物体。

在本公开的一个实施例中，处理模块702，具体用于：按照常速对所述拍摄到的视频图像进行录制，得到第一视频；将所述第一视频划分成第一视频片段和第二视频片段；所述第一视频片段表示，所述第一视频在所述目标对象呈现所述目标状态之前的片段；所述第二视频片段表示，所述第二视频在所述目标对象呈现所述目标状态之后的片段；按照所述第二变速方式对所述第二视频片段进行变速处理，得到第三视频片段；在所述第一视频片段和所述第三视频片段的拼接视频中合成所述音频，得到所述目标视频。

在本公开的一个实施例中，处理模块702，还具体用于：在拍摄视频的过程，对播放出的视频图像和音频进行录制，得到第二视频；在所述第二视频中，在所述目标对象呈现所述目标状态之前所述音频按照常速播放，在所述目标对象呈现所述目标状态之后所述音频按照第一变速方式进行变速播放，所述拍摄到的视频图像按照常速播放；将所述第二视频划分成第三视频片段和第四视频片段；所述第三视频片段表示，所述第二视频在所述目标对象呈现所述目标状态之前的片段；所述第四视频片段表示，所述第二视频在所述目标对象呈现所述目标状态之后的片段；按照所述第二变速方式对所述第四视频片段进行变速处理，得到第五视频片段；将所述第三视频片段和所述第五视频片段进行拼接，得到所述目标视频。

在本公开的一个实施例中，所述第二变速方式是响应于用户的设置操作确定的，所述第一变速方式是基于所述第二变速方式确定的。

在本公开的一个实施例中，所述处理模块702，还用于：响应于用于指示结束拍摄的第二触发操作，重置下述至少一项：所述第一变速方式、所述第二变速方式、特效编辑效果的状态、拍摄界面的状态。

在本公开的一个实施例中，所述播放模块703，还用于：在播放目标视频之前，响应于用于指示结束拍摄的第二触发操作，跳转显示播放界面，所述播放界面用于播放所述目标视频。

在本公开的一个实施例中，所述处理模块702，还用于：在所述跳转显示所述播放界面之后，响应于第一返回触发操作，控制所述播放界面返回至含有拍摄的所述目标对象的所述拍摄界面；在接收到用于指示重新拍摄的指令时，根据所述用于指示重新拍摄的指令，重置所述含有拍摄的所述目标对象的所述拍摄界面的内容并退出所述拍摄界面。

在本公开的一个实施例中，所述处理模块702，还用于：在所述控制所述播放界面返回至含有拍摄的所述目标对象的所述拍摄界面之后或者在拍摄界面拍摄目标对象时接收到用于指示暂停拍摄的指令时，检测当前的拍摄界面上的拍摄时间的进度条是否到达结束位置；若未到达结束位置，则当接收到用于指示在拍摄界面执行拍摄操作的指令时，控制在所述拍摄界面上继续执行拍摄操作。

在本公开的一个实施例中，播放模块703，还用于：在播放目标视频之前，当所述拍摄界面中的拍摄时间结束后，跳转显示所述播放界面。

上述模块可以被实现为在一个或多个通用处理器上执行的软件组件，也可以被实现为诸如执行某些功能或其组合的硬件，诸如可编程逻辑设备和/或专用集成电路。在一些实施例中，这些模块可以体现为软件产品的形式，该软件产品可以存储在非易失性存储介质中，这些非易失性存储介质中包括使得计算机设备(例如个人计算机、服务器、网络设备、移动终端等)实现本发明实施例中描述的方法。在一个实施例中，上述模块还可以在单个设备上实现，也可以分布在多个设备上。这些模块的功能可以相互合并，也可以进一步拆分为多个子模块。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的信息处理装置的模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

基于与方法同样的发明构思，本申请实施例还提供一种电子设备，包括处理器和存储器；

存储器用于存储执行上述各个方法实施例所述方法的程序；处理器被配置为执行存储器中存储的程序。

该电子设备可以为终端设备。该电子设备，包括处理器和存储器；存储器用于存储执行上述各个方法实施例所述方法的程序；处理器被配置为执行存储器中存储的程序。处理器可以是包括中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制电子设备中的其它组件以执行期望的功能。存储器可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器可以运行所述程序指令，以实现上文所述的本公开的实施例的功能以及/或者其它期望的功能。

终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、个人数字助理(Personal Digital Assistant，简称PDA)、平板电脑、便携式多媒体播放器(Portable Media Player，简称PMP)、车载终端(例如车载导航终端)、可穿戴电子设备等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图8示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

参考图8，其示出了适于用来实现本公开实施例的电子设备的结构示意图，如图8所示，电子设备可以包括处理装置(例如中央处理器、图形处理器等)801，其可以根据存储在只读存储器(Read Only Memory，简称ROM)802中的程序或者从存储装置808加载到随机访问存储器(Random Access Memory，简称RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中，还存储有电子设备操作所需的各种程序和数据。处理装置801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

通常，以下装置可以连接至I/O接口805：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置806；包括例如液晶显示器(Liquid Crystal Display，简称LCD)、扬声器、振动器等的输出装置807；包括例如磁带、硬盘等的存储装置808；以及通信装置809。通信装置809可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图8示出了具有各种装置的电子设备，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置809从网络上被下载和安装，或者从存储装置808被安装，或者从ROM 802被安装。在该计算机程序被处理装置801执行时，执行本公开实施例的方法中限定的上述功能。本公开的实施例还包括一种计算机程序，所述计算机程序被处理器执行时，用于执行本公开实施例的方法中限定的上述功能。

需要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Electrically Programmable Read Only Memory，EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc-Read Only Memory，CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、射频(Radio Frequency，RF)等等，或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备执行上述公开实施例所示的方法。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(Local Area Network，简称LAN)或广域网(Wide Area Network，简称WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，单元的名称在某种情况下并不构成对该单元本身的限定，例如，第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：现场可编程门阵列(Field Programmable Gate Array，FPGA)、专用集成电路(Application Specific Integrated Circuit，ASIC)、专用标准产品(Application Specific Standard Product，ASSP)、片上系统(System On Chip，SOC)、复杂可编程逻辑设备(Complex Programmable Logic Device，CPLD)等等。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、快闪存储器、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

本公开实施例提供一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现如上述第一方面所述的视频处理方法。

第一方面，本公开实施例提供一种视频处理方法，包括：

在拍摄视频的过程中播放音频；

响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，按照第一变速方式对所述音频中的第一部分进行变速播放；所述音频中的第一部分表示，在拍摄到的视频图像中识别到所述目标对象呈现所述目标状态时，所述音频中未播放的部分；

根据拍摄到的视频图像和所述音频，得到目标视频；

根据本公开的一个或多个实施例，所述目标状态与所述第一变速方式存在映射关系；

所述响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，按照第一变速方式对所述音频中未播放的部分进行变速播放，包括：

响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，确定与所述目标状态具有映射关系的第一变速方式；

按照所述第一变速方式，对所述音频中的第一部分进行变速播放。

根据本公开的一个或多个实施例，所述目标状态包括所述目标对象呈现目标动作的状态和/或所述目标对象中呈现有预设物体。

根据本公开的一个或多个实施例，所述根据拍摄到的视频图像和所述音频，得到目标视频，包括：

按照常速对所述拍摄到的视频图像进行录制，得到第一视频；

将所述第一视频划分成第一视频片段和第二视频片段；所述第一视频片段表示，所述第一视频在所述目标对象呈现所述目标状态之前的片段；所述第二视频片段表示，所述第二视频在所述目标对象呈现所述目标状态之后的片段；

按照所述第二变速方式对所述第二视频片段进行变速处理，得到第三视频片段；

在所述第一视频片段和所述第三视频片段的拼接视频中合成所述音频，得到所述目标视频。

在拍摄视频的过程，对播放出的视频图像和音频进行录制，得到第二视频；在所述第二视频中，在所述目标对象呈现所述目标状态之前所述音频按照常速播放，在所述目标对象呈现所述目标状态之后所述音频按照第一变速方式进行变速播放，所述拍摄到的视频图像按照常速播放；

将所述第二视频划分成第三视频片段和第四视频片段；所述第三视频片段表示，所述第二视频在所述目标对象呈现所述目标状态之前的片段；所述第四视频片段表示，所述第二视频在所述目标对象呈现所述目标状态之后的片段；

按照所述第二变速方式对所述第四视频片段进行变速处理，得到第五视频片段；将所述第三视频片段和所述第五视频片段进行拼接，得到所述目标视频。

根据本公开的一个或多个实施例，所述第二变速方式是响应于用户的设置操作确定的，所述第一变速方式是基于所述第二变速方式确定的。

拍摄模块，用于在拍摄视频的过程中播放音频；

根据本公开的一个或多个实施例，所述目标状态与所述第一变速方式存在映射关系；处理模块，具体用于：响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，确定与所述目标状态具有映射关系的第一变速方式；按照所述第一变速方式，对所述音频中的第一部分进行变速播放。

根据本公开的一个或多个实施例，处理模块702，具体用于：按照常速对所述拍摄到的视频图像进行录制，得到第一视频；将所述第一视频划分成第一视频片段和第二视频片段；所述第一视频片段表示，所述第一视频在所述目标对象呈现所述目标状态之前的片段；所述第二视频片段表示，所述第二视频在所述目标对象呈现所述目标状态之后的片段；按照所述第二变速方式对所述第二视频片段进行变速处理，得到第三视频片段；在所述第一视频片段和所述第三视频片段的拼接视频中合成所述音频，得到所述目标视频。

根据本公开的一个或多个实施例，处理模块702，还具体用于：在拍摄视频的过程，对播放出的视频图像和音频进行录制，得到第二视频；在所述第二视频中，在所述目标对象呈现所述目标状态之前所述音频按照常速播放，在所述目标对象呈现所述目标状态之后所述音频按照第一变速方式进行变速播放，所述拍摄到的视频图像按照常速播放；将所述第二视频划分成第三视频片段和第四视频片段；所述第三视频片段表示，所述第二视频在所述目标对象呈现所述目标状态之前的片段；所述第四视频片段表示，所述第二视频在所述目标对象呈现所述目标状态之后的片段；按照所述第二变速方式对所述第四视频片段进行变速处理，得到第五视频片段；将所述第三视频片段和所述第五视频片段进行拼接，得到所述目标视频。

第三方面，本公开实施例提供一种电子设备，

包括：至少一个处理器、存储器；

所述存储器存储计算机执行指令；

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

此外，虽然采用特定次序描绘了各操作，但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地，在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims

一种视频处理方法，其特征在于，所述方法包括：

在拍摄视频的过程中播放音频；

响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，按照第一变速方式对所述音频中的第一部分进行变速播放；所述音频中的第一部分表示，在所述拍摄到的视频图像中识别到所述目标对象呈现所述目标状态时，所述音频中未播放的部分；

根据所述拍摄到的视频图像和所述音频，得到目标视频；

在所述目标视频中，在所述目标对象呈现所述目标状态之前拍摄到的视频图像按照常速进行播放，在所述目标对象呈现所述目标状态之后拍摄到的视频图像按照第二变速方式进行变速播放，所述音频按照常速进行播放；

其中，所述第一变速方式与所述第二变速方式的变速方向相反且变速速度相同。
根据权利要求1所述的方法，其特征在于，所述目标状态与所述第一变速方式存在映射关系；

所述响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，按照第一变速方式对所述音频中未播放的部分进行变速播放，包括：

响应于在所述拍摄到的视频图像中识别到所述目标对象呈现所述目标状态，确定与所述目标状态具有映射关系的所述第一变速方式；

按照所述第一变速方式，对所述音频中的第一部分进行变速播放。
根据权利要求1或2所述的方法，其特征在于，所述目标状态包括所述目标对象呈现目标动作的状态和/或所述目标对象中呈现有预设物体。
根据权利要求1-3任一项所述的方法，其特征在于，所述根据所述拍摄到的视频图像和所述音频，得到目标视频，包括：

按照常速对所述拍摄到的视频图像进行录制，得到第一视频；

将所述第一视频划分成第一视频片段和第二视频片段；所述第一视频片段表示，所述第一视频在所述目标对象呈现所述目标状态之前的片段；所述第二视频片段表示，所述第二视频在所述目标对象呈现所述目标状态之后的片段；

按照所述第二变速方式对所述第二视频片段进行变速处理，得到第三视频片段；

在所述第一视频片段和所述第三视频片段的拼接视频中合成所述音频，得到所述目标视频。
根据权利要求1-3任一项所述的方法，其特征在于，所述根据所述拍摄到的视频图像和所述音频，得到目标视频，包括：

在拍摄视频的过程，对播放出的视频图像和音频进行录制，得到第二视频；在所述第二视频中，在所述目标对象呈现所述目标状态之前所述音频按照常速播放，在所述目标对象呈现所述目标状态之后所述音频按照第一变速方式进行变速播放，所述拍摄到的视频图像按照常速播放；

将所述第二视频划分成第三视频片段和第四视频片段；所述第三视频片段表示，所述第二视频在所述目标对象呈现所述目标状态之前的片段；所述第四视频片段表示，所述第二视频在所述目标对象呈现所述目标状态之后的片段；

按照所述第二变速方式对所述第四视频片段进行变速处理，得到第五视频片段；将所述第三视频片段和所述第五视频片段进行拼接，得到所述目标视频。
根据权利要求1-5任一项所述的方法，其特征在于，所述第二变速方式是响应于用户的设置操作确定的，所述第一变速方式是基于所述第二变速方式确定的。
根据权利要求1-6任一项所述的方法，其特征在于，在所述拍摄视频的过程之前，所述方法包括显示拍摄界面并开启拍摄功能，具体包括：

显示用于拍摄所述目标对象的所述拍摄界面，所述拍摄界面包括用于支持控制视频变速录制的特效编辑按钮；

响应作用于所述特效编辑按钮的第一触发操作，在接收到用于指示在所述拍摄界面执行拍摄操作的指令时，执行第一拍摄操作，并在所述拍摄界面中拍摄所述目标对象的同时，识别所述目标对象是否呈现所述目标状态。
根据权利要求1-7任一项所述的方法，其特征在于，所述方法还包括：

响应于用于指示结束拍摄的第二触发操作，跳转显示播放界面，所述播放界面用于播放所述目标视频；或者，

当所述拍摄界面中的拍摄时间结束后，跳转显示所述播放界面；

播放所述目标视频。
根据权利要求8所述的方法，其特征在于，在所述拍摄功能开启后，所述方法还包括：

响应于所述用于指示结束拍摄的第二触发操作，重置下述至少一项：所述第一变速方式、所述第二变速方式、特效编辑效果的状态、拍摄界面的状态。
根据权利要求8或9所述的方法，其特征在于，在所述跳转显示所述播放界面之后，所述方法还包括：

响应于第一返回触发操作，控制所述播放界面返回至含有拍摄的所述目标对象的所述拍摄界面。
一种视频处理装置，其特征在于，所述装置包括：

拍摄模块，用于在拍摄视频的过程中播放音频；

处理模块，用于响应于在拍摄到的视频图像中识别到目标对象呈现目标状态，按照第一变速方式对所述音频中的第一部分进行变速播放；所述音频中的第一部分表示，在拍摄到的视频图像中识别到所述目标图像呈现所述目标状态时，所述音频中未播放的部分；

所述处理模块，还用于根据所述拍摄到的视频图像和所述音频，得到目标视频；

播放模块，用于在所述目标视频中，在所述目标对象呈现所述目标状态之前拍摄到的视频图像按照常速进行播放，在所述目标对象呈现所述目标状态之后拍摄到的视频图像按照第二变速方式进行变速播放，所述音频按照常速进行播放；

其中，所述第一变速方式与所述第二变速方式的变速方向相反且变速速度相同。
一种电子设备，其特征在于，包括：

至少一个处理器；以及

存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如权利要求1至10任一项所述的视频处理方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如权利要求1至10任一项所述的视频处理方法。
一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1-10任一项所述的视频处理方法。