WO2023231585A1

WO2023231585A1 - 视频拍摄方法、装置、设备和存储介质

Info

Publication number: WO2023231585A1
Application number: PCT/CN2023/087623
Authority: WO
Inventors: 崔瀚涛; 苗锋
Original assignee: 荣耀终端有限公司
Priority date: 2022-05-30
Filing date: 2023-04-11
Publication date: 2023-12-07
Also published as: CN117201955A

Abstract

本申请公开了一种视频拍摄方法、装置、设备和存储介质，属于视频处理技术领域。该方法包括：在视频拍摄过程中，获取多路视频流。对该多路视频流进行图像融合处理，得到第一视频流，获取第一视频流对应的图像融合参数。生成包含有第一视频流的第一多媒体文件，以及生成包含有该多路视频流和该图像融合参数的第二多媒体文件。将第一多媒体文件与第二多媒体文件关联存储。如此，在视频拍摄结束后可根据第二多媒体文件中的该多路视频流和该图像融合参数生成带有图像融合效果的融合视频流，该融合视频流的图像融合效果优于在视频拍摄过程中生成的第一多媒体文件中的第一视频流的图像融合效果，可使得用户最终得到图像融合效果更好的视频流来进行播放。

Description

视频拍摄方法、装置、设备和存储介质

本申请要求于2022年05月30日提交到国家知识产权局、申请号为202210601210.0、申请名称为“视频拍摄方法、装置、设备和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及视频处理技术领域，特别涉及一种视频拍摄方法、装置、设备和存储介质。

背景技术

随着终端技术的发展，终端逐渐集通讯、拍摄和影音等功能于一体，成为人们日常生活中不可缺少的部分。用户可以使用终端来拍摄视频，记录生活的点点滴滴。

目前，终端支持同时使用多个摄像头来拍摄视频。具体地，终端可以通过多个摄像头同时采集多路视频流，然后对该多路视频流进行图像融合处理来得到融合视频流，以在录像界面显示该融合视频流的视频图像。并且，在视频拍摄结束后，该终端还可以保存该融合视频流，以供用户后续观看。

然而，在视频拍摄过程中，受摄像器件、处理芯片、图像算法等限制，终端在保证视频实时录制的同时，很难兼顾视频处理能力，从而导致视频拍摄过程中获得的融合视频流的视频效果不佳。

发明内容

本申请提供了一种视频拍摄方法、装置、设备和存储介质，在视频拍摄结束后能够生成图像融合效果较好的视频流。所述技术方案如下：

第一方面，提供了一种视频拍摄方法。在该方法中，在视频拍摄过程中，获取多路视频流，然后对该多路视频流进行图像融合处理，得到第一视频流，获取第一视频流对应的图像融合参数。之后，生成包含有第一视频流的第一多媒体文件，以及生成包含有该多路视频流和该图像融合参数的第二多媒体文件。将第一多媒体文件与第二多媒体文件关联存储。

第一视频流对应的图像融合参数用于指示在得到第一视频流时该多路视频流的图像融合方式。示例地，该图像融合参数可以包括图像拼接模式，进一步还可以包括该多路视频流中每路视频流的图像拼接位置。该图像拼接模式可以包括上下拼接模式、左右拼接模式、画中画嵌套模式等中的一种或多种。该多路视频流中任意的一路视频流的图像拼接位置用于指示在按照相应的图像拼接模式进行拼接时，这一路视频流的视频图像所处的位置。

第一多媒体文件中的第一视频流具有图像融合效果。如此，在视频拍摄结束时，用户就可以观看所存储的第一多媒体文件中的带有图像融合效果的第一视频流，且可以将第一多媒体文件即时分享给其他人进行观看。

第二多媒体文件中的该多路视频流是未经图像融合处理的原始视频流，即是不带有图像融合效果的视频流。第二多媒体文件中的该图像融合参数用于指示第二多媒体文件中该多路视频流在后续融合时需要采用的图像融合方式。如此，在视频拍摄结束后，终端不仅可以根据所存储的第二多媒体文件实现对该多路视频流中每路视频流的播放，还可以根据所存储的第二多媒体文件中的该多路视频流和该图像融合参数生成带有图像融合效果的融合视频流。由于在视频拍摄结束后，该终端无需再进行视频实时录制，所以可以提供较高的视频处理能力，从而该终端根据第二多媒体文件生成的融合视频流的图像融合效果优于在视频拍摄过程中生成的第一多媒体文件中的第一视频流的图像融合效果，如此可以使得用户最终得到图像融合效果更好的视频流来进行播放。

在一种可能的方式中，获取多路视频流的操作可以为：获取多个摄像头中的每个摄像头采集的一路视频流，以得到该多路视频流。

这种方式是多摄同录场景，即通过多个摄像头同时进行录像，以得到该多个摄像头中每个摄像头采集的一路视频流。

作为一种示例，该多个摄像头可以均设置于该终端。此时该终端是通过自身的多个摄像头同时进行录像，从而该终端可以获取到该多个摄像头中每个摄像头采集的一路视频流，以得到多路视频流。

作为另一种示例，该多个摄像头中的一部分摄像头可以设置于该终端，另一部分摄像头可以设置于与该终端处于多屏协同状态的协同设备。此时该终端是通过自身的摄像头和该协同设备的摄像头同时进行录像，该协同设备可以将自身的摄像头采集的视频流发送给该终端，从而该终端可以获取到自身的摄像头采集的视频流和该协同设备的摄像头采集的视频流，以得到多路视频流。

在另一种可能的方式中，获取多路视频流的操作可以为：获取摄像头采集的一路视频流，对这一路视频流进行图像处理，得到另一路视频流。

这种方式是单摄同录场景，即通过一个摄像头进行录像，以得到这个摄像头采集的一路视频流，并且，对这个摄像头采集的一路视频流进行图像处理，得到另一路视频流，如此就可以获得两路视频流，包括原始的视频流和经图像处理得到的视频流。

需注意的是，终端还可以对这一路视频流进行不同的图像处理，来得到不同的视频流，如此就可以获得至少三路视频流，包括原始的视频流和经不同的图像处理得到的至少两路视频流。

可选地，对该多路视频流进行图像融合处理，得到第一视频流之后，还可以在录像界面显示第一视频流的视频图像，如此可以在视频拍摄过程中实现对所拍摄的视频的实时预览，便于用户及时获知视频的图像融合效果。

在一种可能的方式中，生成包含有该多路视频流和该图像融合参数的第二多媒体文件的操作可以为：分别对该多路视频流中的每路视频流进行编码，得到多个视频文件；对于该多个视频文件中任意的一个视频文件，将这个视频文件作为一个视频轨道，将该图像融合参数作为参数轨道，对这个视频轨道和该参数轨道进行封装，得到对应的一个多轨道文件；将与该多个视频文件一一对应的多个多轨道文件确定为第二多媒体文件。

这种方式中，是对该多路视频流中每路视频流的视频文件单独进行封装来得到对应的一个多轨道文件，如此，可以得到该多路视频流中每路视频流的多轨道文件，即得到多个多轨道文件。此时第二多媒体文件包括该多个多轨道文件。

在另一种可能的方式中，生成包含有该多路视频流和该图像融合参数的第二多媒体文件的操作可以为：分别对该多路视频流中的每路视频流进行编码，得到多个视频文件；将该多个视频文件中的每个视频文件均作为一个视频轨道，以得到多个视频轨道；将该图像融合参数作为参数轨道；对该多个视频轨道和该参数轨道进行封装，得到第二多媒体文件。

这种方式中，是对该多路视频流的该多个视频文件整体进行封装来得到第二多媒体文件。

进一步地，在视频拍摄结束后，还可以在视频列表中展示第一多媒体文件中的第一视频流和关联按钮，该关联按钮用于指示展示第一多媒体文件关联的第二多媒体文件。若检测到对该关联按钮的选择操作，则展示第二多媒体文件中的该多路视频流，以便用户可以获知第一多媒体文件中的第一视频流是由哪些原始视频流融合得到的，且便于用户选择播放第二多媒体文件中的该多路视频流中的任意一路视频流。

进一步地，在视频拍摄结束后，还可以从第二多媒体文件中获取该多路视频流，然后播放该多路视频流中的至少一路视频流。比如，可以在视频列表中展示该多路视频流，然后用户可以选择播放该多路视频流中的至少一路视频流。之后，若在该至少一路视频流的播放过程中接收到针对该至少一路视频流的视频图像的融合调整指令，则根据该融合调整指令携带的融合调整信息更新第二多媒体文件中的该图像融合参数。

该融合调整指令用于指示调整该多路视频流需要采用的图像融合方式。用户可以在该至少一路视频流的播放过程中，根据自身的需求手动逐帧触发融合调整指令，该融合调整指令用于指示改变图像融合方式，如可以指示改变图像拼接模式，和/或，改变各路视频流的图像拼接位置。也即，该融合调整指令中携带的融合调整信息可以包括需调整至的图像拼接模式，和/或，可以包括各路视频流需调整至的图像拼接位置。如此，该终端就可以根据该融合调整信息修改第二多媒体文件中的该图像融合参数，实现对该图像融合参数的更新，以使得后续根据第二多媒体文件中的该图像融合参数所进行的图像融合处理满足用户的最新需求。

进一步地，在视频拍摄结束后，还可以从第二多媒体文件中获取该多路视频流和该图像融合参数，然后根据该图像融合参数对该多路视频流进行图像融合处理，得到第二视频流，根据第二视频流生成第三多媒体文件。更进一步地，还可以将与第二多媒体文件关联存储的第一多媒体文件更新为第三多媒体文件。

这种情况下，第一视频流对应的图像融合参数与第二视频流对应的图像融合参数相同，也即，是使用相同的图像融合方式对该多路视频流进行图像融合处理，来得到第一视频流和第二视频流的。由于在视频拍摄结束后无需再进行视频实时录制，所以可以提供较高的视频处理能力，从而此时生成的第二视频流的图像融合效果优于在视频拍摄过程中生成的第一视频流的图像融合效果。

这种情况下，将与第二多媒体文件关联存储的第一多媒体文件更新为第三多媒体文件，使得与第二多媒体文件关联存储的多媒体文件中的视频流为图像融合效果更好的视频流，如此可以使得用户最终得到图像融合效果更好的视频流来进行播放。

需注意的是，若根据用户触发的融合调整指令对第二多媒体文件中的该图像融合参数进行了更新，则可以根据第二多媒体文件生成第三多媒体文件。然后将与第二多媒体文件关联存储的多媒体文件(有可能为第一多媒体文件，也有可能为旧的第三多媒体文件)更新为新生成的第三多媒体文件，以使得与第二多媒体文件关联存储的多媒体文件中的视频流为满足用户最新的图像融合需求的图像融合效果佳的视频流。

第二方面，提供了一种视频拍摄装置，所述视频拍摄装置具有实现上述第一方面中视频拍摄方法行为的功能。所述视频拍摄装置包括至少一个模块，所述至少一个模块用于实现上述第一方面所提供的视频拍摄方法。

第三方面，提供了一种视频拍摄装置，所述视频拍摄装置的结构中包括处理器和存储器，所述存储器用于存储支持视频拍摄装置执行上述第一方面所提供的视频拍摄方法的程序，以及存储用于实现上述第一方面所述的视频拍摄方法所涉及的数据。所述处理器被配置为用于执行所述存储器中存储的程序。所述视频拍摄装置还可以包括通信总线，所述通信总线用于在所述处理器与所述存储器之间建立连接。

第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第一方面所述的视频拍摄方法。

第五方面，提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述第一方面所述的视频拍摄方法。

上述第二方面、第三方面、第四方面和第五方面所获得的技术效果与上述第一方面中对应的技术手段获得的技术效果近似，在这里不再赘述。

附图说明

图1是本申请实施例提供的一种终端的结构示意图；

图2是本申请实施例提供的一种终端的软件系统的框图；

图3是本申请实施例提供的一种视频图像的示意图；

图4是本申请实施例提供的第一种录像界面的示意图；

图5是本申请实施例提供的第二种录像界面的示意图；

图6是本申请实施例提供的第三种录像界面的示意图；

图7是本申请实施例提供的第四种录像界面的示意图；

图8是本申请实施例提供的一种视频拍摄方法的流程图；

图9是本申请实施例提供的一种双视频容器的示意图；

图10是本申请实施例提供的另一种双视频容器的示意图；

图11是本申请实施例提供的一种视频列表的示意图；

图12是本申请实施例提供的一种生成第三多媒体文件的示意图；

图13是本申请实施例提供的第一种视频拍摄方法的示意图；

图14是本申请实施例提供的第二种视频拍摄方法的示意图；

图15是本申请实施例提供的第三种视频拍摄方法的示意图；

图16是本申请实施例提供的第四种视频拍摄方法的示意图；

图17是本申请实施例提供的一种视频拍摄装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请的实施方式作进一步地详细描述。

应当理解的是，本申请提及的“多个”是指两个或两个以上。在本申请的描述中，除非另有说明，“/”表示或的意思，比如，A/B可以表示A或B；本文中的“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，比如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，为了便于清楚描述本申请的技术方案，采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定，并且“第一”、“第二”等字样也并不限定一定不同。

在本申请中描述的“一个实施例”或“一些实施例”等语句意味着在本申请的一个或多个实施例中包括该实施例描述的特定特征、结构或特点。由此，在本申请中的不同之处出现的“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等语句不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。此外，术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”，除非是以其他方式另外特别强调。

下面先对本申请实施例涉及的终端予以说明。

图1是本申请实施例提供的一种终端的结构示意图。参见图1，终端100可以包括处理器110，外部存储器接口120，内部存储器121，通用串行总线(universal serial bus，USB)接口130，充电管理模块140，电源管理模块141，电池142，天线1，天线2，移动通信模块150，无线通信模块160，音频模块170，扬声器170A，受话器170B，麦克风170C，耳机接口170D，传感器模块180，按键190，马达191，指示器192，摄像头193，显示屏194，以及用户识别模块(subscriber identity module，SIM)卡接口195等。其中，传感器模块180可以包括压力传感器180A，陀螺仪传感器180B，气压传感器180C，磁传感器180D，加速度传感器180E，距离传感器180F，接近光传感器180G，指纹传感器180H，温度传感器180J，触摸传感器180K，环境光传感器180L，骨传导传感器180M等。

可以理解的是，本申请实施例示意的结构并不构成对终端100的具体限定。在本申请另一些实施例中，终端100可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。图示的部件可以以硬件，软件或软件和硬件的组合实现。

处理器110可以包括一个或多个处理单元，比如：处理器110可以包括应用处理器(application processor，AP)，调制解调处理器，图形处理器(graphics processing unit，GPU)，图像信号处理器(image signal processor，ISP)，控制器，存储器，视频编解码器，数字信号处理器(digital signal processor，DSP)，基带处理器，和/或神经网络处理器(neural-network processing unit，NPU)等。其中，不同的处理单元可以是独立的器件，也可以集成在一个或多个处理器中。

其中，控制器可以是终端100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号，产生操作控制信号，完成取指令和执行指令的控制。

处理器110中还可以设置存储器，用于存储指令和数据。在一些实施例中，处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据，可从该存储器中直接调用。避免了重复存取，减少了处理器110的等待时间，因而提高了系统的效率。

充电管理模块140用于从充电器接收充电输入。其中，充电器可以是无线充电器，也可以是有线充电器。在一些有线充电的实施例中，充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中，充电管理模块140可以通过终端100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时，还可以通过电源管理模块141为终端100供电。

电源管理模块141用于连接电池142，充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入，为处理器110，内部存储器121，外部存储器，显示屏194，摄像头193和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量，电池循环次数，电池健康状态(漏电，阻抗)等参数。在其他一些实施例中，电源管理模块141也可以设置于处理器110中。在另一些实施例中，电源管理模块141和充电管理模块140也可以设置于同一个器件中。

终端100的无线通信功能可以通过天线1，天线2，移动通信模块150，无线通信模块160，调制解调处理器以及基带处理器等实现。

移动通信模块150可以提供应用在终端100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器，开关，功率放大器，低噪声放大器(low noise amplifier，LNA)等。移动通信模块150可以由天线1接收电磁波，并对接收的电磁波进行滤波，放大等处理，传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大，经天线1转为电磁波辐射出去。在一些实施例中，移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中，移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。

无线通信模块160可以提供应用在终端100上的包括无线局域网(wireless local area networks，WLAN)(如无线保真(wireless fidelity，Wi-Fi)网络)，蓝牙(bluetooth，BT)，全球导航卫星系统(global navigation satellite system，GNSS)，调频(frequency modulation，FM)，近距离无线通信技术(near field communication，NFC)，红外技术(infrared，IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波，将电磁波信号调频以及滤波处理，将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号，对其进行调频，放大，经天线2转为电磁波辐射出去。

终端100通过GPU，显示屏194，以及应用处理器等实现显示功能。GPU为图像处理的微处理器，连接显示屏194和应用处理器。GPU用于执行数学和几何计算，用于图形渲染。处理器110可包括一个或多个GPU，其执行程序指令以生成或改变显示信息。

终端100可以通过ISP，摄像头193，视频编解码器，GPU，显示屏194以及应用处理器等实现拍摄功能。终端100可以包括1个或N个摄像头193，N为大于1的整数。

在本申请实施例中，终端100可以通过1个或多个摄像头193进行录像。在多摄同录场景中，终端100通过多个摄像头193同时进行录像。在单摄同录场景中，终端100通过一个摄像头193进行录像。摄像头193用于采集视频流。摄像头193采集到视频流后可以传递至ISP进行处理。

作为一种示例，摄像头193采集的视频流的视频图像的格式为RAW格式，ISP可以将该视频流中RAW格式的视频图像转换为YUV格式的视频图像，然后再对YUV格式的视频图像进行基础处理，如可调整对比度、去除噪声等。

在多摄同录场景下，ISP可以接收到多个摄像头193中每个摄像头193采集的视频流，并对这多路视频流进行基础处理，之后将该多路视频流传输给应用处理器。在单摄同录场景下，ISP可以接收到一个摄像头193采集的视频流，对这一路视频流进行基础处理，并对进行基础处理后的这一路视频流进行图像处理，如可进行放大处理和裁切处理等，得到另一路视频流，然后将这两路视频流传输至应用处理器。

应用处理器可以对该多路视频流进行图像融合处理，得到第一视频流，并且，还可以生成包含有第一视频流的第一多媒体文件，进一步地，还可以通过视频编解码器、GPU和显示屏194将第一视频流的视频图像显示在录像界面，实现视频预览。

同时，应用处理器还可以获取第一视频流对应的图像融合参数，该图像融合参数用于指示在得到第一视频流时该多路视频流的图像融合方式，然后生成包含有该多路视频流和第一视频流对应的图像融合参数的第二多媒体文件，并将第二多媒体文件和第一多媒体文件进行关联存储，第二多媒体文件中的该图像融合参数用于指示第二多媒体文件中该多路视频流在后续融合时需要采用的图像融合方式。如此，在视频拍摄结束后，可以根据所存储的第二多媒体文件生成图像融合效果更好的视频流。

外部存储器接口120可以用于连接外部存储卡，比如Micro SD卡，实现扩展终端100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信，实现数据存储功能。比如将音乐，视频等文件保存在外部存储卡中。

内部存储器121可以用于存储计算机可执行程序代码，计算机可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令，来执行终端100的各种功能应用以及数据处理。内部存储器121可以包括存储程序区和存储数据区。其中，存储程序区可存储操作系统，至少一个功能所需的应用程序(比如声音播放功能，图像播放功能等)等。存储数据区可存储终端100在使用过程中所创建的数据(比如音频数据，电话本等)等。此外，内部存储器121可以包括高速随机存取存储器，还可以包括非易失性存储器，比如至少一个磁盘存储器件，闪存器件，通用闪存存储器(universal flash storage，UFS)等。

终端100可以通过音频模块170，扬声器170A，受话器170B，麦克风170C，耳机接口170D以及应用处理器等实现音频功能，比如音乐播放，录音等。

音频模块170用于将数字音频信息转换成模拟音频信号输出，也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中，音频模块170可以设置于处理器110中，或将音频模块170的部分功能模块设置于处理器110中。

SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195，或从SIM卡接口195拔出，实现和终端100的接触和分离。终端100可以支持1个或N个SIM卡接口，N为大于1的整数。SIM卡接口195可以支持Nano SIM卡，Micro SIM卡，SIM卡等。同一个SIM卡接口195可以同时插入多张卡。多张卡的类型可以相同，也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。终端100通过SIM卡和网络交互，实现通话以及数据通信等功能。在一些实施例中，终端100采用eSIM，即：嵌入式SIM卡。eSIM卡可以嵌在终端100中，不能和终端100分离。

接下来对终端100的软件系统予以说明。

终端100的软件系统可以采用分层架构，事件驱动架构，微核架构，微服务架构，或云架构。本申请实施例以分层架构的安卓(Android)系统为例，对终端100的软件系统进行示例性说明。

图2是本申请实施例提供的一种终端100的软件系统的框图。参见图2，分层架构将软件分成若干个层，每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中，将Android系统从上至下分为应用程序层(application，APP)，应用程序框架层(framework，FWK)，安卓运行时(Android runtime)和系统层，以及内核层(kernel)。

应用程序层可以包括一系列应用程序包。如图2所示，应用程序包可以包括相机，图库，日历，通话，地图，导航，WLAN，蓝牙，音乐，视频，短信息等应用程序。

应用程序框架层为应用程序层的应用程序提供应用编程接口(application programming interface，API)和编程框架。应用程序框架层包括一些预先定义的函数。如图2所示，应用程序框架层可以包括窗口管理器，内容提供器，视图系统，电话管理器，资源管理器，通知管理器等。窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小，判断是否有状态栏，锁定屏幕，截取屏幕等。内容提供器用来存放和获取数据，并使这些数据可以被应用程序访问，这些数据可以包括视频，图像，音频，拨打和接听的电话，浏览历史和书签，电话簿等。视图系统包括可视控件，比如，显示文字的控件，显示图片的控件等。视图系统可用于构建应用程序的显示界面，显示界面可以由一个或多个视图组成，比如，包括显示短信通知图标的视图，包括显示文字的视图，以及包括显示图片的视图。电话管理器用于提供终端100的通信功能，比如，通话状态的管理(包括接通，挂断等)。资源管理器为应用程序提供各种资源，比如，本地化字符串，图标，图片，布局文件，视频文件等。通知管理器使应用程序可以在状态栏中显示通知信息，可以用于传达告知类型的消息，可以短暂停留后自动消失，无需用户交互，比如，通知管理器被用于告知下载完成，消息提醒等。通知管理器还可以是以图表或滚动条文本形式出现在系统顶部状态栏的通知，比如，后台运行的应用程序的通知。通知管理器还可以是以对话窗口形式出现在屏幕上的通知，比如，在状态栏提示文本信息，发出提示音，电子设备振动，指示灯闪烁等。

Android runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。核心库包含两部分：一部分是java语言需要调用的功能函数，另一部分是安卓的核心库。应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理，堆栈管理，线程管理，安全和异常的管理，以及垃圾回收等功能。

系统层可以包括多个功能模块，比如：表面管理器(surface manager)，媒体库(Media Libraries)，三维图形处理库(比如：OpenGL ES)，二维图形引擎(比如：SGL)等。表面管理器用于对显示子系统进行管理，并且为多个应用程序提供了2D和3D图层的融合。媒体库支持多种常用的音频，视频格式回放和录制，以及静态图像文件等。媒体库可以支持多种音视频编码格式，比如：MPEG4，H.264，MP3，AAC，AMR，JPG，PNG等。三维图形处理库用于实现三维图形绘图，图像渲染，合成，和图层处理等。二维图形引擎是二维绘图的绘图引擎。

内核层是硬件和软件之间的层。内核层至少包含显示驱动，摄像头驱动，音频驱动，传感器驱动等。

在对本申请实施例进行详细地解释说明之前，对本申请实施例涉及的应用场景予以说明。

目前，如图3所示，在很多录像场景中，诸如手机、平板电脑、笔记本电脑等终端在视频拍摄过程中都可以显示多路视频流中每路视频流的视频图像31。其中，该多路视频流可以是由不同摄像头采集的视频流，这种录像场景可以称为多摄同录场景。或者，该多路视频流可以是由一个摄像头采集的但经过不同处理的视频流，这种录像场景可以称为单摄同录场景。

下面对这两种录像场景进行示例性说明。

第一种录像场景：多摄同录场景

多摄同录场景中，通过多个摄像头同时进行录像，并且在录像界面(也可称为录像预览界面或视频拍摄界面)中显示该多个摄像头中每个摄像头采集的视频流的视频图像。

在一种可能的情况中，终端具有多个摄像头，该多个摄像头的拍摄方向不同。该终端可以启动多摄录像功能，以通过该终端自身的多个摄像头同时进行录像，然后在录像界面中显示该多个摄像头中每个摄像头采集的视频流的视频图像。

示例地，该终端可以具有前置摄像头和后置摄像头。该终端启动多摄录像功能后，就启动了自身的前置摄像头和后置摄像头，前置摄像头采集一路视频流，后置摄像头采集一路视频流。之后，如图4所示，该终端可以在录像界面41中显示前置摄像头采集的视频流的视频图像421以及显示后置摄像头采集的视频流的视频图像422。

在另一种可能的情况中，终端与其他设备(可称为协同设备)处于多屏协同状态，该终端和该协同设备都具有摄像头，该终端可以借助该协同设备的摄像头来拍摄。该终端可以启动协同录像功能，以通过该终端的摄像头和该协同设备的摄像头同时进行录像，然后在录像界面中显示该终端的摄像头采集的视频流的视频图像和该协同设备的摄像头采集的视频流的视频图像。

示例地，该终端和该协同设备均具有一个摄像头，该终端启动协同录像功能后，就启动了自身的摄像头，且指示该协同设备启动了该协同设备的摄像头。该终端的摄像头可以采集一路视频流，该协同设备的摄像头可以采集一路视频流，且该协同设备可以将自身的摄像头采集的视频流发送至该终端。之后，如图5所示，该终端501可以在录像界面51中显示自身的摄像头采集的视频流的视频图像521以及显示该协同设备502的摄像头采集的视频流的视频图像522。

第二种录像场景：单摄同录场景

单摄同录场景中，通过一个摄像头进行录像，并且在录像界面中显示这个摄像头采集的视频流经不同处理后的视频图像。

在一种可能的情况中，终端具有一个摄像头。该终端可以启动单摄录像功能，以通过该终端自身的这个摄像头进行录像，然后在录像界面中显示这个摄像头采集的视频流经不同处理后的视频图像。

示例地，该终端可以具有后置摄像头。该终端启动单摄录像功能后，就启动了自身的后置摄像头，后置摄像头采集一路视频流，该终端对这路视频流的视频图像进行放大处理和裁切处理，得到另一路视频流的视频图像。之后，如图6所示，该终端可以在录像界面61中显示后置摄像头采集的原始的视频流的视频图像622以及显示经放大处理和裁切处理得到的另一路视频流的视频图像621。其中，视频图像622是后置摄像头拍摄的原始的视频图像，视频图像621是对原始的视频图像622进行放大处理和裁切处理后的视频图像。

上述多种录像场景中，终端可以在视频拍摄过程中获取多路视频流，并在录像界面中显示该多路视频流中每路视频流的视频图像。可选地，在录像界面中显示该多路视频流中每路视频流的视频图像时，可以先按照特定的图像拼接模式将该多路视频流中每路视频流的视频图像进行拼接，得到融合视频流的视频图像，再将融合视频流的视频图像显示在录像界面中。

示例地，该图像拼接模式可以包括上下拼接模式、左右拼接模式、画中画嵌套模式等。其中，上下拼接模式是指将多路视频流中每路视频流的视频图像按照从上到下的顺序依次进行拼接，如此按照上下拼接模式得到的融合视频流的视频图像包含的该多路视频流中每路视频流的视频图像是从上到下依次排列的。比如，如图4、图5或图6所示，录像界面中显示的融合视频流的视频图像32即是按照上下拼接模式将多路视频流中每路视频流的视频图像拼接得到的。其中，左右拼接模式是指将多路视频流中每路视频流的视频图像按照从左到右的顺序依次进行拼接，如此按照左右拼接模式得到的融合视频流的视频图像包含的该多路视频流中每路视频流的视频图像是从左到右依次排列的。其中，画中画嵌套模式是指在全屏显示主画面的过程中，于主画面的小面积区域上同时显示子画面。也即，画中画嵌套模式是指将多路视频流中的一路视频流的视频图像作为主画面，将该多路视频流中除这一路视频流之外的其他路视频流的视频图像作为子画面，且将子画面拼接在主画面的小面积区域上。比如，如图7所示，终端可以在多摄录像过程中，在录像界面71中显示融合视频流的视频图像32，该融合视频流的视频图像32包含该终端的前置摄像头采集的视频流的视频图像721和该终端的后置摄像头采集的视频流的视频图像722，且后置摄像头采集的视频流的视频图像722为主画面，前置摄像头采集的视频流的视频图像721为在主画面的小面积区域上存在的子画面。

通过上述录像场景可知，终端在视频拍摄过程中获取多路视频流后，需要对该多路视频流进行图像融合处理来得到融合视频流，以在录像界面显示该融合视频流的视频图像。并且，在视频拍摄结束后，该终端还可以保存该融合视频流，以供用户后续观看。然而，在视频拍摄过程中，受摄像(Camera)器件、处理芯片、图像算法等限制，在保证视频实时录制的同时，很难兼顾视频处理能力，从而导致视频拍摄过程中获得的融合视频流的视频效果不佳。

为此，本申请实施例提供了一种视频拍摄方法，在视频拍摄过程中，对多路视频流进行图像融合处理，得到第一视频流。之后，不仅生成包含有第一视频流的第一多媒体文件，还生成包含有该多路视频流和第一视频流对应的图像融合参数的第二多媒体文件，并将第一多媒体文件与第二多媒体文件关联存储。如此，在视频拍摄结束后，用户就可以观看所存储的第一多媒体文件中的带有图像融合效果的第一视频流，且可以将第一多媒体文件即时分享给其他人进行观看。并且，终端还可以根据所存储的第二多媒体文件中的该多路视频流和该图像融合参数生成带有图像融合效果的融合视频流。由于在视频拍摄结束后，终端无需再进行视频实时录制，所以可以提供较高的视频处理能力，从而根据第二多媒体文件生成的融合视频流的图像融合效果优于在视频拍摄过程中生成的第一多媒体文件中的第一视频流的图像融合效果，如此可以使得用户最终得到图像融合效果更好的视频流来进行播放。

下面对本申请实施例提供的视频拍摄方法进行详细地解释说明。

图8是本申请实施例提供的一种视频拍摄方法的流程图，该方法应用于终端，该终端可以是上文图1至图2实施例所述的终端100。参见图8，该方法包括：

步骤801：终端在视频拍摄过程中，获取多路视频流。

该多路视频流中每路视频流的视频图像的时间戳是对齐的。也即，每个时间戳在该多路视频流中均有对应的一帧视频图像，换句话说，该多路视频流中每路视频流的第i帧视频图像的时间戳均相同，i为正整数。

可选地，若该视频拍摄过程为多摄同录过程，则该多路视频流可以是由不同摄像头采集的视频流。或者，若该视频拍摄过程为单摄同录过程，则该多路视频流可以是由一个摄像头采集的但经过不同处理的视频流。

这种情况下，该终端获取多路视频流的操作可以通过如下两种方式实现：

第一种方式：该终端获取多个摄像头中的每个摄像头采集的一路视频流，以得到多路视频流。

第二种方式：终端获取摄像头采集的一路视频流，对这一路视频流进行图像处理，得到另一路视频流。

其中，该终端对这一路视频流进行图像处理，即是对这一路视频流的视频图像进行处理，如可以对这一路视频流的视频图像进行放大处理和裁切处理，得到另一路视频流的视频图像。

可选地，这个摄像头可以设置于该终端，也可以设置于与该终端处于多屏协同状态的协同设备，本申请实施例对此不作限定。

步骤802：该终端对该多路视频流进行图像融合处理，得到第一视频流。

该终端对该多路视频流进行图像融合处理，即是对该多路视频流中每路视频流的视频图像进行融合处理，来得到第一视频流的视频图像。如此，第一视频流是带有特定的图像融合效果的视频流。

由于该多路视频流中每路视频流的视频图像的时间戳是对齐的，所以可以对该多路视频流中时间戳相同的多张视频图像进行融合处理。具体地，每获取到该多路视频流中每路视频流的第i帧视频图像，就对该多路视频流中每路视频流的第i帧视频图像进行融合处理，得到第一视频流的第i帧视频图像，也即，逐帧对该多路视频流中每路视频流的视频图像进行融合处理，来得到第一视频流的每帧视频图像，从而第一视频流的视频图像的时间戳与该多路视频流中每路视频流的视频图像的时间戳也是对齐的。如此，对该多路视频流进行图像融合处理后，得到的第一视频流的视频图像包含对该多路视频流中每路视频流的视频图像进行融合处理后的图像。

其中，该终端在对该多路视频流中每路视频流的视频图像进行融合处理时，可以根据特定的图像融合参数将该多路视频流中每路视频流的视频图像进行拼接。

该图像融合参数用于指示该多路视频流的图像融合方式。示例地，该图像融合参数可以包括图像拼接模式，进一步还可以包括该多路视频流中每路视频流的图像拼接位置。该图像拼接模式可以包括上下拼接模式、左右拼接模式、画中画嵌套模式等中的一种或多种，本申请实施例对此不作限定。该多路视频流中任意的一路视频流的图像拼接位置用于指示在按照相应的图像拼接模式进行拼接时，这一路视频流的视频图像所处的位置。

比如，该多路视频流包括视频流A和视频流B。假设该图像拼接模式为上下拼接模式，视频流A的图像拼接位置为上，视频流B的图像拼接位置为下，则该终端可以将视频流A的视频图像拼接在视频流B的视频图像的上方，以得到第一视频流的视频图像，此时第一视频流的视频图像的上半部分为视频流A的视频图像，下半部分为视频流B的视频图像。或者，假设该图像拼接模式为画中画嵌套模式，视频流A的图像拼接位置为主画面，视频流B的图像拼接位置为子画面，则该终端可以将视频流B的视频图像拼接在视频流A的小面积区域上，以得到第一视频流的视频图像，此时第一视频流的视频图像的主画面为视频流A的视频图像，子画面为视频流B的视频图像。

需注意的是，由于该终端是逐帧对该多路视频流中每路视频流的视频图像进行融合处理，来得到第一视频流的每帧视频图像，所以该图像融合参数也是逐帧存在的。也即，该多路视频流中每路视频流的第i帧视频图像均对应一个图像融合参数，且根据该多路视频流中每路视频流的第i帧视频图像得到的第一视频流的第i帧视频图像也对应这个图像融合参数，这个图像融合参数也可以具有时间戳，且这个图像融合参数的时间戳与该多路视频流中每路视频流的第i帧视频图像的时间戳以及第一视频流的第i帧视频图像的时间戳对齐。

可选地，该终端在对该多路视频流中每路视频流的视频图像进行融合处理时所采用的图像融合参数可以是默认的，或者，可以是用户在拍摄视频前根据自身需求事先设置的，或者，可以是该终端根据该多路视频流中每路视频流的视频图像的内容自动确定的，本申请实施例对此不作限定。

在一些实施例中，用户还可以在视频拍摄过程中主动去调整图像融合参数。比如，假设默认的图像拼接模式为上下拼接模式。在拍摄刚开始时，该终端采用默认的上下拼接模式对该多路视频流中每路视频流的视频图像进行拼接，在拍摄了一段时间后，用户可以在该终端中调整图像拼接模式为画中画嵌套模式，则在此之后该终端采用画中画嵌套模式继续对该多路视频流中每路视频流的视频图像进行拼接。

值得注意的是，该多路视频流中每路视频流的各帧视频图像的图像融合参数可以相同，也可以不同。在一些实施例中，整个视频拍摄过程中该多路视频流的图像融合方式可以是不断变化的，这种变化可以来自于用户的手动调整，如用户可以在视频拍摄过程中手动调整图像拼接模式，或者，这种变化也可以来自于该终端的自动调整，如该终端可以根据该多路视频流的视频图像的内容的不同而选择不同的图像融合参数。

比如，该终端具有前置摄像头和后置摄像头。在开始拍摄视频的前10秒内，该终端采用默认图像融合参数对该多路视频流进行图像融合处理，假设该默认图像融合参数中的图像拼接模式为上下拼接模式，且其中前置摄像头采集的视频流的图像拼接位置为上，后置摄像头采集的视频流的图像拼接位置为下，则如图4所示，在开始拍摄视频的前10秒内，该终端可以按照上下拼接模式对前置摄像头采集的视频流的视频图像421和后置摄像头采集的视频流的视频图像422进行拼接，得到录像界面41中显示的第一视频流的视频图像32，第一视频流的视频图像32中视频图像421和视频图像422按照从上至下的顺序排列。

拍摄视频的10秒以后，用户手动调整图像融合参数，调整后的图像融合参数中的图像拼接模式为画中画嵌套模式，且其中前置摄像头采集的视频流的图像拼接位置为子画面，后置摄像头采集的视频流的图像拼接位置为主画面，则如图7所示，在拍摄视频的10秒以后，该终端可以按照画中画嵌套模式对前置摄像头采集的视频流的视频图像721和后置摄像头采集的视频流的视频图像722进行拼接，得到录像界面71中显示的第一视频流的视频图像32，第一视频流的视频图像32中视频图像722为主画面，视频图像721为在主画面的小面积区域上存在的子画面。

步骤803：该终端获取第一视频流对应的图像融合参数。

第一视频流对应的图像融合参数(也可称为元数据(Metadata))用于指示在得到第一视频流时该多路视频流的图像融合方式，具体地，该图像融合参数是该多路视频流的视频图像的拼接方式的参数信息。也即，该终端在逐帧对该多路视频流中每路视频流的视频图像进行融合处理，来得到第一视频流的每帧视频图像后，还可以逐帧获取第一视频流的每帧视频图像对应的图像融合参数。这种情况下，第一视频流的第i帧视频图像对应的图像融合参数用于指示在得到第一视频流的第i帧视频图像时该多路视频流中每路视频流的第i帧视频图像的图像融合方式，也即，第一视频流的第i帧视频图像对应的图像融合参数是在对该多路视频流中每路视频流的第i帧视频图像进行融合处理时所采用的图像融合参数。

由于是逐帧获取第一视频流的每帧视频图像对应的图像融合参数，所以第一视频流对应的图像融合参数实际上是一个参数流，该参数流的图像融合参数具有时间戳，且该参数流的图像融合参数的时间戳与第一视频流的视频图像的时间戳对齐，该参数流的图像融合参数用于指示具体是如何根据该多路视频流中每路视频流的视频图像融合得到第一视频流的视频图像的，即该参数流的图像融合参数是逐帧的图像融合方式的描述。

进一步地，该终端在得到第一视频流后，还可以在录像界面显示第一视频流的视频图像，即每得到第一视频流的一帧视频图像，就可以在录像界面显示这一帧视频图像，如此可以在视频拍摄过程中实现对所拍摄的视频的实时预览，便于用户及时获知视频的图像融合效果。

比如，该终端具有前置摄像头和后置摄像头。该图像融合参数中的图像拼接模式为上下拼接模式，且其中前置摄像头采集的视频流的图像拼接位置为上，后置摄像头采集的视频流的图像拼接位置为下，则如图4所示，该终端可以按照上下拼接模式对前置摄像头采集的视频流的视频图像421和后置摄像头采集的视频流的视频图像422进行拼接，得到录像界面41中显示的第一视频流的视频图像32，第一视频流的视频图像32中视频图像421和视频图像422按照从上至下的顺序排列。

又比如，该终端具有前置摄像头和后置摄像头。该图像融合参数中的图像拼接模式为画中画嵌套模式，且其中前置摄像头采集的视频流的图像拼接位置为子画面，后置摄像头采集的视频流的图像拼接位置为主画面，则如图7所示，该终端可以按照画中画嵌套模式对前置摄像头采集的视频流的视频图像721和后置摄像头采集的视频流的视频图像722进行拼接，得到录像界面71中显示的第一视频流的视频图像32，第一视频流的视频图像32中视频图像722为主画面，视频图像721为在主画面的小面积区域上存在的子画面。

步骤804：该终端生成包含有第一视频流的第一多媒体文件。

第一多媒体文件是用于播放第一视频流的文件。第一多媒体文件中的第一视频流具有图像融合效果。

该终端在视频拍摄过程中可以不断融合得到第一视频流的视频图像，从而可以根据第一视频流不断生成第一多媒体文件。如此，在视频拍摄结束后，该终端就可以得到包含有完整的第一视频流的第一多媒体文件，便于用户即时分享。

可选地，该终端在生成包含有第一视频流的第一多媒体文件时，可以先对第一视频流进行编码，得到视频文件，再对该视频文件和其他相关文件(包含但不限于音频文件)进行封装，得到第一多媒体文件。当然，该终端也可以采用其他方式生成包含有第一视频流的第一多媒体文件，本申请实施例对此不作限定。

该视频文件的格式可以是预设的格式，如可以是动态图像专家组(moving picture experts group 4，MPEG-4)格式，即MP4格式，或者可以是流媒体格式(flash video，FLV)格式等，当然，也可以是其他格式，本申请实施例对此不作限定。

该音频文件可以是对音频流进行编码得到的。该音频流可以是该终端在视频拍摄过程中不断采集得到，如可以是由该终端的麦克风不断采集得到的。该音频流的音频帧的时间戳与该多路视频流中每路视频流的视频图像的时间戳对齐。该音频文件的格式可以与该视频文件的格式相同或不同，如该音频文件的格式可以是MP4格式、FLV格式、高级音频编码(advanced audio coding，AAC)格式等，本申请实施例对此不作限定。

该终端对该视频文件和其他相关文件进行封装时，可以将该视频文件作为一个视频轨道(track)，将其他相关文件作为其他轨道(如可将音频文件作为音频轨道)，然后对这个视频轨道和其他轨道进行封装，得到一个多轨道文件作为第一多媒体文件。其中，轨道是时间戳序列。

比如，该终端可以使用视频复用器将该视频文件对应的视频轨道和该音频文件对应的音频轨道封装(也可称为合成(mux))成一个MP4文件，该MP4文件为多轨道文件，也即为第一多媒体文件。

步骤805：该终端生成包含有该多路视频流和该图像融合参数的第二多媒体文件。

该多路视频流中的各路视频流是单独保存在第二多媒体文件中的，也即，各路视频流是独立存在的。第二多媒体文件可用于分别播放该多路视频流中的每路视频流。第二多媒体文件中的该多路视频流是未经图像融合处理的原始视频流，即是不带有图像融合效果的视频流。第二多媒体文件中的该图像融合参数用于指示第二多媒体文件中该多路视频流在后续融合时需要采用的图像融合方式。

该终端在视频拍摄过程中可以不断获取到该多路视频流中每路视频流的视频图像，且在不断对该多路视频流进行图像融合处理的过程中也可以不断获取到该图像融合参数，从而可以根据该多路视频流和该图像融合参数不断生成第二多媒体文件。如此，在视频拍摄结束后，该终端就可以得到包含有完整的多路视频流和完整的图像融合参数的第二多媒体文件，便于根据该图像融合参数对该多路视频流进行后处理，提升了该多路视频流的后处理空间。

可选地，步骤805的操作可以通过如下两种可能的方式实现。

第一种可能的方式：该终端分别对该多路视频流中的每路视频流进行编码，得到多个视频文件；对于该多个视频文件中任意的一个视频文件，对这个视频文件和该图像融合参数进行封装，得到对应的一个封装文件；将与该多个视频文件一一对应的多个封装文件确定为第二多媒体文件。

该视频文件的格式可以是预设的格式，如可以是MP4格式、FLV格式等，本申请实施例对此不作限定。

这种方式中，是对该多路视频流中每路视频流的视频文件单独进行封装来得到对应的一个封装文件，如此，可以得到该多路视频流中每路视频流的封装文件，即得到多个封装文件。此时第二多媒体文件包括该多个封装文件。

可选地，该终端在对某个视频文件和该图像融合参数进行封装时，还可以将其他相关文件也一同封装，如该终端可以将这个视频文件和该图像融合参数以及音频文件进行封装，得到对应的一个封装文件。

该音频文件可以是对音频流进行编码得到的。该音频流可以是该终端在视频拍摄过程中不断采集得到，如可以是由该终端的麦克风不断采集得到的。该音频流的音频帧的时间戳与该多路视频流中每路视频流的视频图像的时间戳是对齐的。该音频文件的格式可以与该视频文件的格式相同或不同，如该音频文件的格式可以是MP4格式、FLV格式、AAC格式等，本申请实施例对此不作限定。

可选地，该终端在对某个视频文件、该图像融合参数和其他相关文件进行封装时，可以将这个视频文件作为一个视频轨道，将该图像融合参数作为参数轨道，将其他相关文件作为其他轨道，对这个视频轨道、该参数轨道和该其他轨道进行封装，得到对应的一个多轨道文件作为封装文件。这种情况下，是将与该多个视频文件一一对应的多个多轨道文件确定为第二多媒体文件。

比如，对于该多个视频文件中任意的一个视频文件，该终端可以使用视频复用器将这个视频文件对应的视频轨道、该图像融合参数对应的参数轨道、该音频文件对应的音频轨道封装成一个MP4文件，该MP4文件为多轨道文件。之后，将封装得到的与该多个视频文件一一对应的多个MP4文件确定为第二多媒体文件。

第二种可能的方式：该终端分别对该多路视频流中的每路视频流进行编码，得到多个视频文件；对该多个视频文件和该图像融合参数进行封装，得到第二多媒体文件。

这种方式中，是对该多路视频流的该多个视频文件整体进行封装来得到一个封装文件作为第二多媒体文件。

可选地，该终端在对该多个视频文件和该图像融合参数进行封装时，还可以将其他相关文件也一同封装，如该终端可以将该多个视频文件和该图像融合参数以及音频文件进行封装，得到第二多媒体文件。

可选地，该终端在对该多个视频文件、该图像融合参数和其他相关文件进行封装时，可以将该多个视频文件中的每个视频文件均作为一个视频轨道，以得到多个视频轨道，将该图像融合参数作为参数轨道，将其他相关文件作为其他轨道，然后对该多个视频轨道、该参数轨道和该其他轨道进行封装，得到第二多媒体文件。

比如，该终端可以使用视频复用器将与该多个视频文件一一对应的多个视频轨道、该图像融合参数对应的参数轨道、该音频文件对应的音频轨道封装成一个MP4文件，该MP4文件为多轨道文件，也即为第二多媒体文件。

步骤806：该终端将第一多媒体文件与第二多媒体文件关联存储。

第二多媒体文件中的该多路视频流是未经图像融合处理的原始视频流，即是不带有图像融合效果的视频流。第二多媒体文件中的该图像融合参数用于指示第二多媒体文件中该多路视频流在后续融合时需要采用的图像融合方式。如此，在视频拍摄结束后，该终端不仅可以根据所存储的第二多媒体文件实现对该多路视频流中每路视频流的播放，还可以根据所存储的第二多媒体文件中的该多路视频流和该图像融合参数生成带有图像融合效果的融合视频流。由于在视频拍摄结束后，该终端无需再进行视频实时录制，所以可以提供较高的视频处理能力，从而该终端根据第二多媒体文件生成的融合视频流的图像融合效果优于在视频拍摄过程中生成的第一多媒体文件中的第一视频流的图像融合效果，如此可以使得用户最终得到图像融合效果更好的视频流来进行播放。

作为一种示例，该终端将第一多媒体文件与第二多媒体文件关联存储时，可以是将第一多媒体文件和第二多媒体文件绑定关联来形成一个视频容器，这个视频容器在本申请实施例中可称为双视频容器。也即，该终端可以在双视频容器中存放第一多媒体文件和第二多媒体文件，以实现对第一多媒体文件和第二多媒体文件的关联存储。

比如，若第二多媒体文件是通过上述步骤805中的第一种方式得到的，则如图9所示，该双视频容器中可以存放有第一多媒体文件，第一多媒体文件包含有第一视频流，第一视频流带有图像融合效果，并且，该双视频容器中还可以存放有第二多媒体文件，第二多媒体文件包括多个封装文件，如图9所示的封装文件A和封装文件B，该多个封装文件中每个封装文件包含一路视频流和该图像融合参数，这路视频流是不带有图像融合效果的原始视频流，如图9所示的封装文件A中包含有视频流A，封装文件B中包含有视频流B，视频流A和视频流B均不带有图像融合效果。

又比如，若第二多媒体文件是通过上述步骤805中的第二种方式得到的，则如图10所示，该双视频容器中可以存放有第一多媒体文件，第一多媒体文件包含有第一视频流，第一视频流具有图像融合效果，并且，该双视频容器中还可以存放有第二多媒体文件，第二多媒体文件包含有多路视频流(如图10所示的视频流A和视频流B)和该图像融合参数，该多路视频流均是不带有图像融合效果的原始视频流。

需注意的是，根据录像场景的不同，双视频容器的实现规格也有所不同。示例地，在多摄同录场景和单摄同录场景中，双视频容器的实现规格可以如下表1所示。

表1

本申请实施例仅以上表1为例来对双视频容器的实现规格进行说明，上表1并不对本申请实施例构成限定。

该终端在视频拍摄过程中，可以不断生成第一多媒体文件和第二多媒体文件，并将两者进行关联存储。进一步地，在视频拍摄结束后，该终端还可以在视频列表(也可称为图库)中展示所存储的第一多媒体文件中的第一视频流，以便用户可以选择播放第一多媒体文件中的第一视频流。

作为一种示例，该终端可以在视频列表中显示关联按钮。该关联按钮用于指示展示第一多媒体文件关联的第二多媒体文件。如此，该终端若检测到对关联按钮的选择操作，则可以展示第二多媒体文件中的多路视频流，以便用户可以获知第一多媒体文件中的第一视频流是由哪些原始视频流融合得到的，且便于用户选择播放第二多媒体文件中的该多路视频流中的任意一路视频流。

比如，如图11所示，该终端可以在视频列表1101中展示第一多媒体文件的第一视频流1102，并显示关联按钮1103。这种情况下，用户可以选择播放第一视频流1102。之后，如图11中的(a)图所示，若用户点击关联按钮1103，则如图11中的(b)图所示，该终端响应于对关联按钮1103的点击操作(即选择操作)，展示第二多媒体文件中的该多路视频流1104。这种情况下，用户可以选择播放该多路视频流1104中的任意一路视频流1104。

作为另一种示例，该终端可以在视频列表中显示第二多媒体文件中的多路视频流中每路视频流对应的视频缩略图。如此，该终端若检测到对所显示的任意一个视频缩略图的选择操作，则可以展示第二多媒体文件中与这个视频缩略图对应的一路视频流，以便用户可以选择播放这一路视频流。

当然，除了上述两种示例性的方式之外，该终端也可以通过其他方式展示第二多媒体文件中的多路视频流，本申请实施例对此不作限定。

进一步地，在视频拍摄结束后，该终端还可以从第二多媒体文件中获取该多路视频流，然后播放该多路视频流中的至少一路视频流。比如，该终端可以在视频列表中展示该多路视频流，然后用户可以选择播放该多路视频流中的至少一路视频流。

之后，若终端在该至少一路视频流的播放过程中接收到针对该至少一路视频流的视频图像的融合调整指令，则根据该融合调整指令携带的融合调整信息更新第二多媒体文件中的该图像融合参数。

该融合调整指令用于指示调整该多路视频流所需采用的图像融合方式。用户可以在该至少一路视频流的播放过程中，根据自身的需求手动触发融合调整指令，该融合调整指令用于指示改变图像融合方式，如可以指示改变图像拼接模式，和/或，改变各路视频流的图像拼接位置。也即，该融合调整指令中携带的融合调整信息可以包括需调整至的图像拼接模式，和/或，可以包括各路视频流需调整至的图像拼接位置。如此，该终端就可以根据该融合调整信息修改第二多媒体文件中的该图像融合参数，实现对该图像融合参数的更新，以使得后续根据第二多媒体文件中的该图像融合参数所进行的图像融合处理满足用户的最新需求。

比如，该多路视频流包括视频流A和视频流B，在视频拍摄过程中视频流A和视频流B在前10秒的图像拼接模式为上下拼接模式，在10秒后的图像拼接模式为左右拼接模式。这种情况下，第二多媒体文件中的图像融合参数中时间戳在前10秒内的图像融合参数中的图像拼接模式均为上下拼接模式，时间戳在10秒后的图像融合参数中的图像拼接模式均为左右拼接模式。

在视频拍摄结束后，该终端根据第二多媒体文件播放视频流A、或播放视频流B，或同时分别播放视频流A和视频流B。此时，用户若想要调整前3秒的图像拼接模式为左右拼接模式，则在视频流A和/或视频流B的播放过程中，可以触发针对视频流A和/或视频流B的前3秒的视频图像的融合调整指令，该融合调整指令用于指示调整前3秒的视频图像的图像拼接模式为左右拼接模式。这种情况下，该终端根据该融合调整指令更新第二多媒体文件中的图像融合参数，更新后的图像融合参数中时间戳在前3秒内的图像融合参数中的图像拼接模式均为左右拼接模式，时间戳在3秒到10秒内的图像融合参数中的图像拼接模式均为上下拼接模式，时间戳在10秒后的图像融合参数中的图像拼接模式均为左右拼接模式。

进一步地，在视频拍摄结束后，该终端可以根据第二多媒体文件生成第三多媒体文件。具体地，该终端可以从第二多媒体文件中获取该多路视频流和该图像融合参数，然后根据该图像融合参数对该多路视频流进行图像融合处理，得到第二视频流，根据第二视频流生成第三多媒体文件。更进一步地，该终端还可以将与第二多媒体文件关联存储的第一多媒体文件更新为第三多媒体文件。

这种情况下，第一视频流对应的图像融合参数与第二视频流对应的图像融合参数相同，也即，该终端是使用相同的图像融合方式对该多路视频流进行图像融合处理，来得到第一视频流和第二视频流的。然而，在视频拍摄过程中，受Camera器件、处理芯片、图像算法等限制，该终端在保证视频实时录制的同时，很难兼顾视频处理能力，因而该终端在视频拍摄过程中生成的第一视频流的图像融合效果很有可能不佳。而在视频拍摄结束后，该终端无需再进行视频实时录制，所以可以提供较高的视频处理能力，从而该终端此时生成的第二视频流的图像融合效果优于在视频拍摄过程中生成的第一视频流的图像融合效果。

这种情况下，该终端将与第二多媒体文件关联存储的第一多媒体文件更新为第三多媒体文件，使得与第二多媒体文件关联存储的多媒体文件中的视频流为图像融合效果更好的视频流，如此可以使得用户最终得到图像融合效果更好的视频流来进行播放。

需注意的是，若该终端根据用户触发的融合调整指令对第二多媒体文件中的该图像融合参数进行了更新，则该终端可以根据第二多媒体文件生成第三多媒体文件。然后将与第二多媒体文件关联存储的多媒体文件(有可能为第一多媒体文件，也有可能为旧的第三多媒体文件)更新为新生成的第三多媒体文件，以使得与第二多媒体文件关联存储的多媒体文件中的视频流为满足用户最新的图像融合需求的图像融合效果佳的视频流。

其中，该终端从第二多媒体文件中获取该多路视频流和该图像融合参数时，可以先对第二多媒体文件解封装(demux)，得到多个视频文件和该图像融合参数，然后再分别对该多个视频文件中的每个视频文件进行解码，得到该多路视频流。

其中，该终端根据第二视频流生成第三多媒体文件的方式与上述根据第一视频流生成第一多媒体文件的方式类似，本申请实施例对此不再赘述。

比如，如图12所示，该终端对第二多媒体文件解封装，得到视频文件A、视频文件B和该图像融合参数，然后对视频文件A解码得到视频流A，对视频文件B解码得到视频流B，之后，根据该图像融合参数对视频流A和视频流B进行图像融合处理，得到第二视频流。之后，该终端对第二视频流进行编码，得到视频文件C，对视频文件C进行封装，得到第三多媒体文件。

在本申请实施例中，在视频拍摄过程中，获取多路视频流。之后，对该多路视频流进行图像融合处理，得到第一视频流，并获取第一视频流对应的图像融合参数，该图像融合参数用于指示在得到第一视频流时多路视频流的图像融合方式。之后，生成包含有第一视频流的第一多媒体文件，以及生成包含有该多路视频流和该图像融合参数的第二多媒体文件，第二多媒体文件中的图像融合参数用于指示第二多媒体文件中该多路视频流在后续融合时需要采用的图像融合方式。将第一多媒体文件与第二多媒体文件关联存储。如此，在视频拍摄结束后，用户就可以观看所存储的第一多媒体文件中的带有图像融合效果的第一视频流，且可以将第一多媒体文件即时分享给其他人进行观看。并且，该终端还可以根据所存储的第二多媒体文件中的该多路视频流和该图像融合参数生成带有图像融合效果的融合视频流。由于在视频拍摄结束后，该终端无需再进行视频实时录制，所以可以提供较高的视频处理能力，从而该终端根据第二多媒体文件生成的融合视频流的图像融合效果优于在视频拍摄过程中生成的第一多媒体文件中的第一视频流的图像融合效果，如此可以使得用户最终得到图像融合效果更好的视频流来进行播放。

为了便于理解，下面结合图13至图16来对上述视频拍摄方法进行举例说明。

下面结合图13和图14对多摄同录场景下的视频拍摄方法进行说明。

图13是本申请实施例提供的一种视频拍摄方法的示意图。该方法应用于多摄同录场景，这种情况下，该终端通过摄像头A和摄像头B同时进行录像。该方法可以包括如下步骤(1)至步骤(4)：

(1)摄像头A采集视频流A，视频流A经过ISP前端模块0和ISP后端模块0的处理后，传输至图像融合模块和关联存储模块。

示例地，摄像头A采集的视频流A的视频图像可以是RAW格式的，ISP前端模块0可以将视频流A的RAW格式的视频图像转换为YUV格式的视频图像，ISP后端模块0可以对视频流A的YUV格式的视频图像进行基础处理，如调整对比度、去除噪声等。

(2)摄像头B采集视频流B，视频流B经过ISP前端模块1和ISP后端模块1的处理后，传输至图像融合模块和关联存储模块。

示例地，摄像头B采集的视频流B的视频图像可以是RAW格式的，ISP前端模块1可以将视频流B的RAW格式的视频图像转换为YUV格式的视频图像，ISP后端模块1可以对视频流B的YUV格式的视频图像进行基础处理，如调整对比度、去除噪声等。

(3)图像融合模块对视频流A和视频流B进行图像融合处理，得到第一视频流，将第一视频流对应的图像融合参数发送至关联存储模块，第一视频流带有图像融合效果。

可选地，可将第一视频流的视频图像作为预览视频图像显示于录像界面，实现视频预览(preview)。可选地，还可以生成包含有第一视频流的第一多媒体文件并存储。

(4)关联存储模块生成包含有视频流A、视频流B和该图像融合参数的第二多媒体文件，并将第二多媒体文件与第一多媒体文件进行关联存储。

值得注意的是，本申请实施例中，预览视频图像可以是第一视频流的视频图像，也即，预览视频图像和所存储的第一多媒体文件中的第一视频流的视频图像对应的图像融合方式相同。但本申请实施例仅是以此为例进行说明，实际使用时，预览视频图像和所存储的第一多媒体文件中的第一视频流的视频图像对应的图像融合方式也可以不同。这种情况下，如图14所示，该方法可以包括如下步骤a至步骤e：

步骤a：摄像头A采集视频流A，视频流A经过ISP前端模块0和ISP后端模块0的处理后，传输至预览模块、成片模块和关联存储模块。

步骤b：摄像头B采集视频流B，视频流B经过ISP前端模块1和ISP后端模块1的处理后，传输至预览模块、成片模块和关联存储模块。

步骤c：预览模块对视频流A和视频流B进行图像融合处理，得到预览视频流，将预览视频流的视频图像作为预览视频图像显示于录像界面，预览视频流带有图像融合效果。

步骤d：成片模块对视频流A和视频流B进行图像融合处理，得到第一视频流，将第一视频流对应的图像融合参数发送至关联存储模块，生成包含有第一视频流的第一多媒体文件并存储。

这种情况下，预览模块和成片模块所使用的图像融合方式可以不同。并且，相比于成片模块，预览模块对视频流A和视频流B进行图像融合处理时的操作更为简单一些，比如，成片模块在对视频流A和视频流B进行图像融合处理时需要进行图像防抖处理，而预览模块则无需进行图像防抖处理。

步骤e：关联存储模块生成包含有视频流A、视频流B和该图像融合参数的第二多媒体文件，并将第二多媒体文件与第一多媒体文件进行关联存储。

下面结合图15和图16对单摄同录场景下的视频拍摄方法进行说明。

图15是本申请实施例提供的一种视频拍摄方法的示意图。该方法应用于单摄同录场景，这种情况下，该终端通过摄像头A进行录像。该方法可以包括如下步骤(1)至步骤(5)：

(1)摄像头A采集视频流A，视频流A经过ISP前端模块0的处理后，传输至ISP后端模块0和ISP后端模块1。

示例地，摄像头A采集的视频流A的视频图像可以是RAW格式的，ISP前端模块0可以将视频流A的RAW格式的视频图像转换为YUV格式的视频图像。

(2)ISP后端模块0对视频流A进行基础处理后，将视频流A传输至图像融合模块和关联存储模块。

示例地，ISP后端模块0可以对视频流A的YUV格式的视频图像进行基础处理，如调整对比度、去除噪声等。

(3)ISP后端模块1对视频流A进行图像处理后，得到视频流A'，将视频流A'传输至图像融合模块和关联存储模块。

示例地，ISP后端模块1可以对视频流A的YUV格式的视频图像进行图像处理，如可以基于特定的逻辑对视频流A的YUV格式的视频图像进行放大处理和裁切处理等。比如，此特定的逻辑可以是人体追踪或其他显著性主体追踪等逻辑。

(4)图像融合模块对视频流A和视频流A'进行图像融合处理，得到第一视频流，将第一视频流对应的图像融合参数发送至关联存储模块，第一视频流带有图像融合效果。

可选地，可将第一视频流的视频图像作为预览视频图像显示于录像界面，实现视频预览。可选地，还可以生成包含有第一视频流的第一多媒体文件并存储。

(5)关联存储模块生成包含有视频流A、视频流A'和该图像融合参数的第二多媒体文件，并将第二多媒体文件与第一多媒体文件进行关联存储。

值得注意的是，本申请实施例中，预览视频图像可以是第一视频流的视频图像，也即，预览视频图像和所存储的第一多媒体文件中的第一视频流的视频图像对应的图像融合方式相同。但本申请实施例仅是以此为例进行说明，实际使用时，预览视频图像和所存储的第一多媒体文件中的第一视频流的视频图像对应的图像融合方式也可以不同。这种情况下，如图16所示，该方法可以包括如下步骤a至步骤f：

步骤a：摄像头A采集视频流A，视频流A经过ISP前端模块0的处理后，传输至ISP后端模块0和ISP后端模块1。

步骤b：ISP后端模块0对视频流A进行基础处理后，将视频流A传输至预览模块、成片模块和关联存储模块。

步骤c：ISP后端模块1对视频流A进行图像处理后，得到视频流A'，将视频流A'传输至预览模块、成片模块和关联存储模块。

步骤d：预览模块对视频流A和视频流A'进行图像融合处理，得到预览视频流，将预览视频流的视频图像作为预览视频图像显示于录像界面，预览视频流带有图像融合效果。

步骤e：成片模块对视频流A和视频流A'进行图像融合处理，得到第一视频流，将第一视频流对应的图像融合参数发送至关联存储模块，生成包含有第一视频流的第一多媒体文件并存储。

这种情况下，预览模块和成片模块所使用的图像融合方式可以不同。并且，相比于成片模块，预览模块对视频流A和视频流A'进行图像融合处理时的操作更为简单一些，比如，成片模块在对视频流A和视频流A'进行图像融合处理时需要进行图像防抖处理，而预览模块则无需进行图像防抖处理。

步骤f：关联存储模块生成包含有视频流A、视频流A'和该图像融合参数的第二多媒体文件，并将第二多媒体文件与第一多媒体文件进行关联存储。

图17是本申请实施例提供的一种视频拍摄装置的结构示意图，该装置可以由软件、硬件或者两者的结合实现成为计算机设备的部分或者全部，该计算机设备可以为上文图1至图2实施例所述的终端100。参见图17，该装置包括：第一获取模块1701、处理模块1702、第二获取模块1703、第一生成模块1704、第二生成模块1705和存储模块1706。

第一获取模块1701，用于在视频拍摄过程中，获取多路视频流；

处理模块1702，用于对多路视频流进行图像融合处理，得到第一视频流；

第二获取模块1703，用于获取第一视频流对应的图像融合参数，图像融合参数用于指示在得到第一视频流时多路视频流的图像融合方式；

第一生成模块1704，用于生成包含有第一视频流的第一多媒体文件；

第二生成模块1705，用于生成包含有多路视频流和图像融合参数的第二多媒体文件；

存储模块1706，用于将第一多媒体文件与第二多媒体文件关联存储。

可选地，第一获取模块1701用于：

获取多个摄像头中的每个摄像头采集的一路视频流，以得到多路视频流；

其中，多个摄像头均设置于终端；或者，多个摄像头中的一部分摄像头设置于终端，另一部分摄像头设置于与终端处于多屏协同状态的协同设备。

可选地，第一获取模块1701用于：

获取摄像头采集的一路视频流；

对这一路视频流进行图像处理，得到另一路视频流。

可选地，图像融合参数包括图像拼接模式，图像拼接模式包括上下拼接模式、左右拼接模式、画中画嵌套模式中的一种或多种。

可选地，该装置还包括：

显示模块，用于在录像界面显示第一视频流的视频图像。

可选地，第二生成模块1705用于：

分别对多路视频流中的每路视频流进行编码，得到多个视频文件；

对于多个视频文件中任意的一个视频文件，将这一个视频文件作为一个视频轨道，将图像融合参数作为参数轨道，对这一个视频轨道和参数轨道进行封装，得到对应的一个多轨道文件；

将与多个视频文件一一对应的多个多轨道文件确定为第二多媒体文件。

可选地，第二生成模块1705用于：

将多个视频文件中的每个视频文件均作为一个视频轨道，以得到多个视频轨道；

将图像融合参数作为参数轨道；

对多个视频轨道和参数轨道进行封装，得到第二多媒体文件。

可选地，该装置还包括：

第三获取模块，用于在视频拍摄结束后，从第二多媒体文件中获取多路视频流和图像融合参数；

处理模块1702，还用于根据图像融合参数对多路视频流进行图像融合处理，得到第二视频流；

第一生成模块1704，用于根据第二视频流生成第三多媒体文件。

可选地，该装置还包括：

第一更新模块，用于将与第二多媒体文件关联存储的第一多媒体文件更新为第三多媒体文件。

可选地，该装置还包括：

第四获取模块，用于在视频拍摄结束后，从第二多媒体文件中获取多路视频流；

播放模块，用于播放多路视频流中的至少一路视频流；

第二更新模块，用于若在该至少一路视频流的播放过程中接收到针对该至少一路视频流的视频图像的融合调整指令，则根据融合调整指令携带的融合调整信息更新第二多媒体文件中的图像融合参数。

可选地，该装置还包括：

第一展示模块，用于在视频拍摄结束后，在视频列表中展示第一多媒体文件中的第一视频流和关联按钮；

第二展示模块，用于若检测到对关联按钮的选择操作，则展示第二多媒体文件中的多路视频流。

在本申请实施例中，在视频拍摄过程中，获取多路视频流。之后，对该多路视频流进行图像融合处理，得到第一视频流，并获取第一视频流对应的图像融合参数，该图像融合参数用于指示在得到第一视频流时多路视频流的图像融合方式。之后，生成包含有第一视频流的第一多媒体文件，以及生成包含有该多路视频流和该图像融合参数的第二多媒体文件，第二多媒体文件中的图像融合参数用于指示第二多媒体文件中该多路视频流在后续融合时需要采用的图像融合方式。将第一多媒体文件与第二多媒体文件关联存储。如此，在视频拍摄结束后，用户就可以观看所存储的第一多媒体文件中的带有图像融合效果的第一视频流，且可以将第一多媒体文件即时分享给其他人进行观看。并且，该装置还可以根据所存储的第二多媒体文件中的该多路视频流和该图像融合参数生成带有图像融合效果的融合视频流。由于在视频拍摄结束后，该装置无需再进行视频实时录制，所以可以提供较高的视频处理能力，从而根据第二多媒体文件生成的融合视频流的图像融合效果优于在视频拍摄过程中生成的第一多媒体文件中的第一视频流的图像融合效果，如此可以使得用户最终得到图像融合效果更好的视频流来进行播放。

需要说明的是：上述实施例提供的视频拍摄装置在视频拍摄时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

上述实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请实施例的保护范围。

上述实施例提供的视频拍摄装置与视频拍摄方法实施例属于同一构思，上述实施例中单元、模块的具体工作过程及带来的技术效果，可参见方法实施例部分，此处不再赘述。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意结合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络或其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，比如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(比如：同轴电缆、光纤、数据用户线(Digital Subscriber Line，DSL))或无线(比如：红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质，或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(比如：软盘、硬盘、磁带)、光介质(比如：数字通用光盘(Digital Versatile Disc，DVD))或半导体介质(比如：固态硬盘(Solid State Disk，SSD))等。

以上所述为本申请提供的可选实施例，并不用以限制本申请，凡在本申请的揭露的技术范围之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种视频拍摄方法，其特征在于，应用于终端，所述方法包括：

在视频拍摄过程中，获取多路视频流；

对所述多路视频流进行图像融合处理，得到第一视频流；

获取所述第一视频流对应的图像融合参数，所述图像融合参数用于指示在得到所述第一视频流时所述多路视频流的图像融合方式；

生成包含有所述第一视频流的第一多媒体文件；

生成包含有所述多路视频流和所述图像融合参数的第二多媒体文件；

将所述第一多媒体文件与所述第二多媒体文件关联存储。
如权利要求1所述的方法，其特征在于，所述获取多路视频流，包括：

获取多个摄像头中的每个摄像头采集的一路视频流，以得到所述多路视频流；

其中，所述多个摄像头均设置于所述终端；或者，所述多个摄像头中的一部分摄像头设置于所述终端，另一部分摄像头设置于与所述终端处于多屏协同状态的协同设备。
如权利要求1所述的方法，其特征在于，所述获取多路视频流，包括：

获取摄像头采集的一路视频流；

对所述一路视频流进行图像处理，得到另一路视频流。
如权利要求1至3任一所述的方法，其特征在于，所述图像融合参数包括图像拼接模式，所述图像拼接模式包括上下拼接模式、左右拼接模式、画中画嵌套模式中的一种或多种。
如权利要求1至4任一所述的方法，其特征在于，所述对所述多路视频流进行图像融合处理，得到第一视频流之后，还包括：

在录像界面显示所述第一视频流的视频图像。
如权利要求1至5任一所述的方法，其特征在于，所述生成包含有所述多路视频流和所述图像融合参数的第二多媒体文件，包括：

分别对所述多路视频流中的每路视频流进行编码，得到多个视频文件；

对于所述多个视频文件中任意的一个视频文件，将所述一个视频文件作为一个视频轨道，将所述图像融合参数作为参数轨道，对所述一个视频轨道和所述参数轨道进行封装，得到对应的一个多轨道文件；

将与所述多个视频文件一一对应的多个多轨道文件确定为所述第二多媒体文件。
如权利要求1至5任一所述的方法，其特征在于，所述生成包含有所述多路视频流和所述图像融合参数的第二多媒体文件，包括：

分别对所述多路视频流中的每路视频流进行编码，得到多个视频文件；

将所述多个视频文件中的每个视频文件均作为一个视频轨道，以得到多个视频轨道；

将所述图像融合参数作为参数轨道；

对所述多个视频轨道和所述参数轨道进行封装，得到所述第二多媒体文件。
如权利要求1至7任一所述的方法，其特征在于，所述方法还包括：

在视频拍摄结束后，从所述第二多媒体文件中获取所述多路视频流和所述图像融合参数；

根据所述图像融合参数对所述多路视频流进行图像融合处理，得到第二视频流；

根据所述第二视频流生成第三多媒体文件。
如权利要求8所述的方法，其特征在于，所述根据所述第二视频流生成第三多媒体文件之后，还包括：

将与所述第二多媒体文件关联存储的所述第一多媒体文件更新为所述第三多媒体文件。
如权利要求1至9任一所述的方法，其特征在于，所述方法还包括：

在视频拍摄结束后，从所述第二多媒体文件中获取所述多路视频流；

播放所述多路视频流中的至少一路视频流；

若在所述至少一路视频流的播放过程中接收到针对所述至少一路视频流的视频图像的融合调整指令，则根据所述融合调整指令携带的融合调整信息更新所述第二多媒体文件中的所述图像融合参数。
如权利要求1至10任一所述的方法，其特征在于，所述方法还包括：

在视频拍摄结束后，在视频列表中展示所述第一多媒体文件中的所述第一视频流和关联按钮；

若检测到对所述关联按钮的选择操作，则展示所述第二多媒体文件中的所述多路视频流。
一种视频拍摄装置，其特征在于，所述装置包括：

第一获取模块，用于在视频拍摄过程中，获取多路视频流；

处理模块，用于对所述多路视频流进行图像融合处理，得到第一视频流；

第二获取模块，用于获取所述第一视频流对应的图像融合参数，所述图像融合参数用于指示在得到所述第一视频流时所述多路视频流的图像融合方式；

第一生成模块，用于生成包含有所述第一视频流的第一多媒体文件；

第二生成模块，用于生成包含有所述多路视频流和所述图像融合参数的第二多媒体文件；

存储模块，用于将所述第一多媒体文件与所述第二多媒体文件关联存储。
一种计算机设备，其特征在于，所述计算机设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至11任意一项所述的方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行如权利要求1至11任意一项所述的方法。