WO2020215776A1

WO2020215776A1 - 多媒体数据的处理方法以及装置

Info

Publication number: WO2020215776A1
Application number: PCT/CN2019/128161
Authority: WO
Inventors: 袁明飞
Original assignee: 珠海格力电器股份有限公司
Priority date: 2019-04-22
Filing date: 2019-12-25
Publication date: 2020-10-29
Also published as: US20220217266A1; CN110062163B; EP3941075A4; EP3941075A1; US11800217B2; CN110062163A

Abstract

本申请公开了一种多媒体数据的处理方法以及装置。其中，该方法包括：获取第一多媒体数据；对第一多媒体数据进行多维度解析，得到多媒体维度信息；根据多媒体维度信息进行视频拍摄，得到第二多媒体数据。本申请解决了由于无法获取仿拍视频的信息导致视频仿拍效果差的技术问题。

Description

多媒体数据的处理方法以及装置

相关申请

本公开要求2019年04月22日申请的，申请号为201910324559.2，名称为“多媒体数据的处理方法以及装置”的中国专利申请的优先权，在此将其全文引入作为参考。

技术领域

本公开涉及多媒体领域，具体而言，涉及一种多媒体数据的处理方法以及装置。

背景技术

随着移动互联网的深入普及，网络视频，尤其是短视频广泛的出现在了人们的日常生活中，并对人们的产生了较深的影响。人们在闲暇时，可以通过第三方客户端观看短视频，还可通过第三方客户端模仿拍摄短视频。然而，由于无法获知源视频的相关信息，例如，采用的滤镜、特效、镜头等信息，因此，人们在模仿拍摄短视频的过程中，拍摄到的视频与源视频的拍摄效果相差较大，导致人们放弃拍摄，降低了用户体验。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本公开实施例提供了一种多媒体数据的处理方法以及装置，以至少解决发明人所知的方法中由于无法获取仿拍视频的信息导致视频仿拍效果差的技术问题。

根据本公开实施例的一个方面，提供了一种多媒体数据的处理方法，包括：获取第一多媒体数据；对第一多媒体数据进行多维度解析，得到多媒体维度信息；根据多媒体维度信息进行视频拍摄，得到第二多媒体数据。

在一个实施例中，多媒体数据的处理方法还包括：检测组成第一多媒体数据的场景数量；在检测到场景数量为多个的情况下，获取多个场景之间的切换效果以及每个场景对应的场景信息。

在一个实施例中，多媒体数据的处理方法还包括：检测组成第一多媒体数据的场景数量；在检测到场景数量为一个的情况下，获取该场景对应的场景信息。

在一个实施例中，多媒体数据的处理方法还包括：检测第一多媒体数据中每一帧对应的场景；根据相邻两个帧所对应的场景的匹配度确定组成第一多媒体数据的场景数量。

在一个实施例中，在检测到场景对象包括预设对象的情况下，多媒体数据的处理方法还包括：识别预设对象的对象信息，其中，对象信息包括如下至少之一：预设对象的表情、动作以及特效。

在一个实施例中，多媒体数据的处理方法还包括：获取第一多媒体数据中的每个场景对应的场景信息以及多个场景之间的切换效果；根据场景信息进行视频拍摄，得到每个场景对应的第三多媒体数据；根据切换效果设置多个第三多媒体数据之间的切换效果，得到第二多媒体数据。

在一个实施例中，多媒体数据的处理方法还包括：获取第一多媒体数据所对应的场景信息；根据场景信息进行视频拍摄，得到第二多媒体数据。

在一个实施例中，在对根据多媒体维度信息进行视频拍摄，得到第二多媒体数据的过程中，多媒体数据的处理方法还包括：检测第二多媒体数据与对应的场景的匹配度；在匹配度小于预设匹配度的情况下，生成摄像头控制信息；根据摄像头控制信息生成提示信息，其中，提示信息用于用户按照摄像头控制信息控制拍摄设备进行视频拍摄。

在一个实施例中，多媒体数据的处理方法还包括：检测视频拍摄指令；在检测到视频拍摄指令为模仿拍摄指令的情况下，控制拍摄设备进入模仿拍摄模式，其中，模仿拍摄模式用于根据已存在的多媒体数据进行拍摄，得到与已存在的多媒体数据的拍摄效果相同的多媒体数据；在检测到视频拍摄指令为常规拍摄指令的情况下，控制拍摄设备进入常规拍摄模式。

根据本公开实施例的另一方面，还提供了一种多媒体数据的处理装置，包括：获取模块，用于获取第一多媒体数据；解析模块，用于对第一多媒体数据进行多维度解析，得到多媒体维度信息；处理模块，用于根据多媒体维度信息进行视频拍摄，得到第二多媒体数据。

根据本公开实施例的另一方面，还提供了一种存储介质，该存储介质包括存储的程序，其中，在程序运行时控制存储介质所在设备执行多媒体数据的处理方法。

根据本公开实施例的另一方面，还提供了一种处理器，该处理器用于运行程序，其中，程序运行时执行多媒体数据的处理方法。

在本公开实施例中，采用对多媒体数据进行解析，根据解析后的信息进行视频拍摄的方式，在得到第一多媒体数据之后，对第一多媒体数据进行多维度解析，得到多媒体维度信息，最后根据多媒体维度信息进行视频拍摄，得到第二多媒体数据。容易注意到的是，通过对第一多媒体数据进行解析，可以得到第一多媒体数据的滤镜、特效、转场等信息，进而用户采用与第一多媒体数据相同的多媒体维度信息进行视频拍摄，得到与第一多媒体数据具有相同效果的第二多媒体数据。由于第二多媒体数据是根据第一多媒体数据解析后的信息进行拍摄得到的，因此，第二多媒体数据具有与第一多媒体数据相同的效果。由此可见，本申请所提供的方案达到了对多媒体数据进行仿拍的目的，从而实现了生成与源多媒体数据具有相同效果的视频的技术效果，提供了用户的拍摄体验，进而解决了发明人所知的方法中由于无法获取仿拍视频的信息导致视频仿拍效果差的技术问题。

附图说明

此处所说明的附图用来提供对本公开的进一步理解，构成本申请的一部分，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。在附图中：

图1是根据本公开实施例的一种多媒体数据的处理方法流程图；

图2是根据本公开实施例的一种可选的多媒体数据的处理方法的流程图；以及

图3是根据本公开实施例的一种多媒体数据的处理装置示意图。

具体实施方式

为了使本技术领域的人员更好地理解本公开方案，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分的实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本公开保护的范围。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本公开实施例，提供了一种多媒体数据的处理方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本公开实施例的多媒体数据的处理方法流程图，如图1所示，该方法包括如下步骤：

步骤S102，获取第一多媒体数据。

需要说明的是，上述第一多媒体数据为用户所要模仿拍摄的多媒体数据，其中，在一个实施例中第一多媒体数据为视频数据。

可选的，移动设备可获取第一多媒体数据。其中，移动设备为具有多媒体数据处理能力的设备，可以为但不限于智能手机、平板等交互设备。具体的，用户在观看视频时，移动设备对该视频(即第一多媒体数据)进行缓存。当用户想对该视频进行模仿拍摄时，用户将该视频输入至安装在移动设备的客户端上，该客户端获取该视频对应的多媒体数据。另外，客户端还可通过互联网获取第一多媒体数据的资源对应的网络地址，并根据网络地址从互联网上获取第一多媒体数据，在该场景下，移动设备无需下载或者缓存多媒体数据，减少了对移动设备的本地内存的占用。

步骤S104，对第一多媒体数据进行多维度解析，得到多媒体维度信息。

需要说明的是，多媒体维度信息包括如下至少之一：第一多媒体数据所包含的场景的场景信息，以及在多媒体数据包括多个场景时多个场景之间的切换效果，其中，场景信息包括如下至少之一：背景音乐、场景对象(例如，人、动物、风景)、场景效果(例如，滤镜、文字、特效等)以及摄像头信息(例如，摄像头的位置以及角度)。

可选的，客户端采用AI(Artificial Intelligence，人工智能)智能分析视频技术对第一多媒体数据进行智能分析，其中，主要对第一多媒体数据的语音、文字、人脸、物体以及场景等进行多维度分析。

步骤S106，根据多媒体维度信息进行视频拍摄，得到第二多媒体数据。

可选的，在得到了第一媒体数据的多媒体维度信息之后，客户端根据多媒体维度信息进行视频拍摄，例如，客户端通过对第一多媒体数据进行解析，确定第一多媒体使用了“秋天童话”这个滤镜，则在进行视频拍摄时，客户端使用“秋天童话”这个滤镜进行视频拍摄，得到第二多媒体数据。其中，第一多媒体数据为被模仿的视频，第二多媒体数据为模仿第一多媒体数据所拍摄的视频。

基于上述步骤S102至步骤S106所限定的方案，可以获知，采用对多媒体数据进行解析，根据解析后的信息进行视频拍摄的方式，在得到第一多媒体数据之后，对第一多媒体数据进行多维度解析，得到多媒体维度信息，最后根据多媒体维度信息进行视频拍摄，得到第二多媒体数据。

容易注意到的是，通过对第一多媒体数据进行解析，可以得到第一多媒体数据的滤镜、特效、转场等信息，进而用户采用与第一多媒体数据相同的多媒体维度信息进行视频拍摄，得到与第一多媒体数据具有相同效果的第二多媒体数据。由于第二多媒体数据是根据第一多媒体数据解析后的信息进行拍摄得到的，因此，第二多媒体数据具有与第一多媒体数据相同的效果。

由此可见，本申请所提供的方案达到了对多媒体数据进行仿拍的目的，从而实现了生成与源多媒体数据具有相同效果的视频的技术效果，提供了用户的拍摄体验，进而解决了发明人所知的方法中由于无法获取仿拍视频的信息导致视频仿拍效果差的技术问题。

在一种可选的实施例中，在获取第一多媒体数据之前，客户端还检测视频拍摄指令。其中，在检测到视频拍摄指令为模仿拍摄指令的情况下，控制拍摄设备进入模仿拍摄模式；在检测到视频拍摄指令为常规拍摄指令的情况下，控制拍摄设备进入常规拍摄模式。

需要说明的是，模仿拍摄模式用于根据已存在的多媒体数据进行拍摄，得到与已存在的多媒体数据的拍摄效果相同的多媒体数据

可选的，用户在进行视频拍摄之前，可通过客户端选择进行视频拍摄的模式，例如，用户通过语音控制或者触控操作在客户端上选择所要进行的拍摄模式。如果用户选择了模仿拍摄模式，则客户端将接收到模仿拍摄指令。在接收到模仿拍摄指令之后，客户端将获取被模仿的多媒体数据(即第一多媒体数据)，并对第一多媒体数据进行解析。

在一个实施例中，第一多媒体数据可能包括多个场景，例如，第一个场景为公园中，第二个场景为家中，不同的场景个数对应的多媒体维度信息也可能不同，因此，客户端在对第一多媒体数据进行多维度解析的过程中，需要检测第一多媒体数据包括的场景个数。

具体的，客户端检测组成第一多媒体数据的场景数量。其中，在检测到场景数量为多个的情况下，获取多个场景之间的切换效果以及每个场景对应的场景信息；在检测到场景数量为一个的情况下，获取该场景对应的场景信息。

需要说明的是，在场景数量为多个的情况下，多个场景之间需要进行场景切换，而多个场景之间的切换使用的切换效果不同，也会给最终生成的视频的视觉效果造成影响，因此，在场景数量为多个的情况下，除需获取场景信息之外，还需要获取多个场景之间的切换效果。可选的，多个场景之前的切换效果包括但不限于黑屏翻转切换场景、两个场景切换时预设时长内无场景。

在一种可选的实施例中，客户端检测第一多媒体数据中每一帧对应的场景，然后根据相邻两个帧所对应的场景的匹配度确定组成第一多媒体数据的场景数量。例如，客户端检测第一帧视频对应的场景为第一场景，第二帧视频对应的场景为第二场景，其中，第一帧视频与第二帧视频为相邻的两帧视频，第一场景和第二场景为两个不同的场景，则客户端确定第一多媒体数据中包括两个场景，此时，客户端获取这两个场景进行场景切换时的切换效果。

在对第一多媒体数据所包含的场景数量进行判断之后，客户端进一步对每个场景进行识别，其中，在第一多媒体数据仅包含一个场景的情况下，客户端对整个第一多媒体数据进行识别。其中，对第一多媒体数据的识别包括识别第一多媒体数据的每个场景中是否包含预设对象，其中，预设对象可以为人物，也可以为动物。在检测到场景对象包括预设对象的情况下，客户端识别预设对象的对象信息，其中，对象信息包括如下至少之一：预设对象的表情、动作以及特效。

可选的，在检测到第一多媒体数据中包含有人物时，客户端识别人物的表情、动作以及美颜效果，并识别该场景对应的多媒体数据中是否有滤镜、文字、特效等。在检测到第一多媒体数据中不包含人物，仅包含风景时，客户端仅识别该场景对应的多媒体数据中是否有滤镜、文字、特效等。用户在进行仿拍时可直接使用上述识别到的所有数据。

在一种可选的实施例中，在第一多媒体数据包括多个场景的情况下，客户端获取第一多媒体数据中的每个场景对应的场景信息以及多个场景之间的切换效果，然后根据场景信息进行视频拍摄，得到每个场景对应的第三多媒体数据，并根据切换效果设置多个第三多媒体数据之间的切换效果，得到第二多媒体数据。例如，第一多媒体数据包括两个场景，第一个场景使用了“秋天童话”滤镜，第二个场景使用了楷体文字，第一个场景与第二个场景之间的切换效果为黑屏翻转切换，则在用户使用客户端进行第一个场景的视频拍摄的过程中，客户端开启“秋天童话”滤镜，在进行第二个场景的视频拍摄的过程中，客户端使用楷体文字进行标注，并设置这两个场景的切换效果为黑屏翻转切换。

在另一种可选的实施例中，在第一多媒体数据包括一个场景的情况下，客户端获取第一多媒体数据所对应的场景信息，并根据场景信息进行视频拍摄，得到第二多媒体数据。

需要说明的是，在第一多媒体数据包括多个场景的情况下，客户端按照第一多媒体数据对应的多媒体维度信息对每个场景分别进行仿拍；在第一多媒体数据包括一个场景的情况下，客户端直接拍摄一段视频。

在一个实施例中，通过上述内容获取到第一多媒体数据对应的多媒体维度信息之后，客户端即可开始模仿拍摄。其中，拍摄时可直接使用以上识别到源视频(即第一多媒体数据)的滤镜、效果、专场、美颜、动作、文字、音乐等信息，用户只需在识别好的模板上仿照源视频的人物或风景拍摄即可。为了使拍摄的视频能够达到更好的拍摄效果，在进行视频拍摄的过程中，客户端的显示界面上实时追踪显示用户的拍摄情况，并智能提醒用户如何控制摄像头。

具体的，在对根据多媒体维度信息进行视频拍摄，得到第二多媒体数据的过程中，客户端检测第二多媒体数据与对应的场景的匹配度，在匹配度小于预设匹配度的情况下，生成摄像头控制信息，并根据摄像头控制信息生成提示信息，其中，提示信息用于用户按照摄像头控制信息控制拍摄设备进行视频拍摄。

需要说明的是，用户在根据多媒体维度信息进行视频拍摄的过程中，客户端还可接收用户的控制指令，该控制指令用于指示客户端进入仿拍模式或合拍模式。另外，在拍摄完成后，用户可通过客户端的显示界面浏览拍摄效果，也可单独对某个场景的视频进行编辑使用其他效果等，在视频编辑完成后保存即可完成仿拍视频。

在一种可选的实施例中，图2示出了本申请所提供的多媒体数据的处理方法的流程图。具体的，用户打开移动设备的相机控制客户端进入视频拍摄模式，如果用户选择了常规拍摄模式，则客户端将接收到常规拍摄指令，进行常规的视频拍摄；如果用户选择了模仿拍摄模式，则客户端将接收到模仿拍摄指令，进行模仿拍摄。在模仿拍摄模式下，客户端提示用户添加需要模仿的视频。在视频添加完成后，客户端对该视频进行解析，得到该视频的多媒体维度信息，例如，滤镜、特效、转场效果、摄像头信息等。然后用户开始拍摄一段或几段视频，在用户拍摄一段或几段视频的过程中，客户端根据源视频的相关信息对拍摄中的视频进行对应的处理，并实时提醒用户如何控制摄像头的位置以及角度，还可提示用户是否同步进行仿拍或合拍。在完成一段或几段视频的拍摄之后，用户可通过客户端的显示界面浏览拍摄效果，也可单独对某个场景的视频进行编辑使用其他效果等，在视频编辑完成后保存即可完成仿拍视频。

由上可知，本申请所提供的方案使用AI技术智能解析用户所要模仿拍摄的视频，分析视频的滤镜、特效、转场、摄像头控制等，解析后指导用户拍摄，拍摄后可对视频进行编辑，提高了用户对拍摄视频的兴趣，拉近与时代流行的距离，还提高用户对视频的用户体验，丰富了用户的感受。

实施例2

根据本公开实施例，还提供了一种多媒体数据的处理装置实施例，需要说明的是，该装置可执行实施例1中的多媒体数据的处理方法，其中，图3是根据本公开实施例的多媒体数据的处理装置示意图，如图3所示，该装置包括：获取模块301、解析模块303以及处理模块305。

其中，获取模块301，用于获取第一多媒体数据；解析模块303，用于对第一多媒体数据进行多维度解析，得到多媒体维度信息；处理模块305，用于根据多媒体维度信息进行视频拍摄，得到第二多媒体数据。

此处需要说明的是，上述获取模块301、解析模块303以及处理模块305对应于上述实施例的步骤S102至步骤S106，三个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例所公开的内容。

在一种可选的方案中，解析模块包括：第一检测模块以及第一获取模块。其中，第一检测模块，用于检测组成第一多媒体数据的场景数量；第一获取模块，用于在检测到场景数量为多个的情况下，获取多个场景之间的切换效果以及每个场景对应的场景信息。

在一种可选的方案中，解析模块包括：第二检测模块以及第二获取模块。其中，第二检测模块，用于检测组成第一多媒体数据的场景数量；第二获取模块，用于在检测到场景数量为一个的情况下，获取该场景对应的场景信息。

在一种可选的方案中，第二检测模块包括：第三检测模块以及第一确定模块。其中，第三检测模块，用于检测第一多媒体数据中每一帧对应的场景；第一确定模块，用于根据相邻两个帧所对应的场景的匹配度确定组成第一多媒体数据的场景数量。

在一种可选的方案中，在检测到场景对象包括预设对象的情况下，多媒体数据的处理装置还包括：识别模块。其中，识别模块，用于识别预设对象的对象信息，其中，对象信息包括如下至少之一：预设对象的表情、动作以及特效。

在一种可选的方案中，处理模块包括：第三获取模块、第一处理模块以及第二处理模块。其中，第三获取模块，用于获取第一多媒体数据中的每个场景对应的场景信息以及多个场景之间的切换效果；第一处理模块，用于根据场景信息进行视频拍摄，得到每个场景对应的第三多媒体数据；第二处理模块，用于根据切换效果设置多个第三多媒体数据之间的切换效果，得到第二多媒体数据。

在一种可选的方案中，处理模块包括：第四获取模块以及第三处理模块。其中，第四获取模块，用于获取第一多媒体数据所对应的场景信息；第三处理模块，用于根据场景信息进行视频拍摄，得到第二多媒体数据。

在一种可选的方案中，在对根据多媒体维度信息进行视频拍摄，得到第二多媒体数据的过程中，多媒体数据的处理装置还包括：第四检测模块、第一生成模块以及第二生成模块。其中，第四检测模块，用于检测第二多媒体数据与对应的场景的匹配度；第一生成模块，用于在匹配度小于预设匹配度的情况下，生成摄像头控制信息；第二生成模块，用于根据摄像头控制信息生成提示信息，其中，提示信息用于用户按照摄像头控制信息控制拍摄设备进行视频拍摄。

在一种可选的方案中，多媒体数据的处理装置还包括：第五检测模块、第一控制模块以及第二控制模块。其中，第五检测模块，用于检测视频拍摄指令；第一控制模块，用于在检测到视频拍摄指令为模仿拍摄指令的情况下，控制拍摄设备进入模仿拍摄模式，其中，模仿拍摄模式用于根据已存在的多媒体数据进行拍摄，得到与已存在的多媒体数据的拍摄效果相同的多媒体数据；第二控制模块，用于在检测到视频拍摄指令为常规拍摄指令的情况下，控制拍摄设备进入常规拍摄模式。

实施例3

根据本公开实施例的另一方面，还提供了一种存储介质，该存储介质包括存储的程序，其中，在程序运行时控制存储介质所在设备执行实施例1中的多媒体数据的处理方法。

实施例4

根据本公开实施例的另一方面，还提供了一种处理器，该处理器用于运行程序，其中，程序运行时执行实施例1中的多媒体数据的处理方法。

上述本公开实施例序号仅仅为了描述，不代表实施例的优劣。

在本公开的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对发明人已知的技术中做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本公开的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本公开原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本公开的保护范围。

Claims

一种多媒体数据的处理方法，其特征在于，包括：

获取第一多媒体数据；

对所述第一多媒体数据进行多维度解析，得到多媒体维度信息；

根据所述多媒体维度信息进行视频拍摄，得到第二多媒体数据。
根据权利要求1所述的处理方法，其特征在于，对所述第一多媒体数据进行多维度解析，得到多媒体维度信息，包括：

检测组成所述第一多媒体数据的场景数量；

在检测到所述场景数量为多个的情况下，获取多个场景之间的切换效果以及每个场景对应的场景信息。
根据权利要求1所述的处理方法，其特征在于，对所述第一多媒体数据进行多维度解析，得到多媒体维度信息，包括：

检测组成所述第一多媒体数据的场景数量；

在检测到所述场景数量为一个的情况下，获取该场景对应的场景信息。
根据权利要求2所述的处理方法，其特征在于，检测组成所述第一多媒体数据的场景数量，包括：

检测所述第一多媒体数据中每一帧对应的场景；

根据相邻两个帧所对应的场景的匹配度确定所述组成所述第一多媒体数据的场景数量。
根据权利要求3所述的处理方法，其特征在于，检测组成所述第一多媒体数据的场景数量，包括：

检测所述第一多媒体数据中每一帧对应的场景；

根据相邻两个帧所对应的场景的匹配度确定所述组成所述第一多媒体数据的场景数量。
根据权利要求2所述的处理方法，其特征在于，在检测到场景对象包括预设对象的情况下，所述方法还包括：

识别所述预设对象的对象信息，其中，所述对象信息包括如下至少之一：所述预设对象的表情、动作以及特效。
根据权利要求3所述的处理方法，其特征在于，在检测到场景对象包括预设对象的情况下，所述方法还包括：

识别所述预设对象的对象信息，其中，所述对象信息包括如下至少之一：所述预设对象的表情、动作以及特效。
根据权利要求2所述的处理方法，其特征在于，根据所述多媒体维度信息进行视频拍摄，得到第二多媒体数据，包括：

获取所述第一多媒体数据中的所述每个场景对应的场景信息以及所述多个场景之间的切换效果；

根据所述场景信息进行视频拍摄，得到所述每个场景对应的第三多媒体数据；

根据所述切换效果设置多个所述第三多媒体数据之间的切换效果，得到所述第二多媒体数据。
根据权利要求3所述的处理方法，其特征在于，根据所述多媒体维度信息进行视频拍摄，得到第二多媒体数据，包括：

获取所述第一多媒体数据所对应的场景信息；

根据所述场景信息进行视频拍摄，得到所述第二多媒体数据。
根据权利要求8所述的处理方法，其特征在于，在对根据所述多媒体维度信息进行视频拍摄，得到第二多媒体数据的过程中，所述方法还包括：

检测所述第二多媒体数据与对应的场景的匹配度；

在所述匹配度小于预设匹配度的情况下，生成摄像头控制信息；

根据所述摄像头控制信息生成提示信息，其中，所述提示信息用于用户按照所述摄像头控制信息控制拍摄设备进行视频拍摄。
根据权利要求9所述的处理方法，其特征在于，在对根据所述多媒体维度信息进行视频拍摄，得到第二多媒体数据的过程中，所述方法还包括：

检测所述第二多媒体数据与对应的场景的匹配度；

在所述匹配度小于预设匹配度的情况下，生成摄像头控制信息；

根据所述摄像头控制信息生成提示信息，其中，所述提示信息用于用户按照所述摄像头控制信息控制拍摄设备进行视频拍摄。
根据权利要求1所述的方法，其特征在于，在获取第一多媒体数据之前，所述方法还包括：

检测视频拍摄指令；

在检测到所述视频拍摄指令为模仿拍摄指令的情况下，控制拍摄设备进入模仿拍摄模式，其中，所述模仿拍摄模式用于根据已存在的多媒体数据进行拍摄，得到与所述已存在的多媒体数据的拍摄效果相同的多媒体数据；

在检测到所述视频拍摄指令为常规拍摄指令的情况下，控制拍摄设备进入常规拍摄模式。
一种多媒体数据的处理装置，其特征在于，包括：

获取模块，用于获取第一多媒体数据；

解析模块，用于对所述第一多媒体数据进行多维度解析，得到多媒体维度信息；

处理模块，用于根据所述多媒体维度信息进行视频拍摄，得到第二多媒体数据。
一种存储介质，其特征在于，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行权利要求1至12中任意一项所述的多媒体数据的处理方法。
一种处理器，其特征在于，所述处理器用于运行程序，其中，所述程序运行时执行权利要求1至12中任意一项所述的多媒体数据的处理方法。