CN115460446A

CN115460446A - 一种多路视频信号的对齐方法、装置及电子设备

Info

Publication number: CN115460446A
Application number: CN202210999979.2A
Authority: CN
Inventors: 崔健雄; 于慧霞; 项东涛; 黄日鹏; 刘磊; 洪巨成
Original assignee: Shanghai Iqiyi New Media Technology Co ltd
Current assignee: Shanghai Iqiyi New Media Technology Co ltd
Priority date: 2022-08-19
Filing date: 2022-08-19
Publication date: 2022-12-09

Abstract

本发明实施例提供了一种多路视频信号的对齐方法、装置及电子设备。通过获取视频素材，然后提取视频素材的音频数据，根据音频数据，计算视频素材的音频特征，最后基于音频特征，将视频素材进行对齐。本申请实施例中，是基于音频特征对视频素材进行对齐，所以不需要获取视频素材的时码信息，进而可以避免依赖于时码信息对视频素材进行对齐，由于音频特征是基于音频数据计算得到的和时码信息无关，进而可以实现在无需获取视频素材的时码信息，而对视频素材进行对齐，对于无时码信息的视频素材也可以对齐，进一步地节约了资源，提升了资源利用率。

Description

一种多路视频信号的对齐方法、装置及电子设备

技术领域

本发明涉及素材剪辑技术领域，特别是涉及一种多路视频信号的对齐方法、装置及电子设备。

背景技术

在视频剪辑过程中，往往需要遍历大量的视频素材，从获取到所需视频素材中进行剪辑。在剪辑之前，往往会提前对视频素材进行对齐操作，以此可以提高后期剪辑师的剪辑效率。

现有技术中，后期剪辑师从视频素材中获取视频素材的时码信息，进而基于时码信息将视频素材进行对齐。但是，一些应用场景中，如综艺拍摄，拍摄到的内容多，素材量大，且拍摄时采用的摄像机种类繁多，并不是所有的视频素材都有时码信息，对于没有时码信息的视频素材则无法基于时码信息进行对齐，这样会导致大量的视频素材浪费。

发明内容

本发明实施例的目的在于提供一种多路视频信号的对齐方法、装置及电子设备，以实现减少人工操作的工作量。具体技术方案如下：

第一方面，本发明实施例提供了一种多路视频信号的对齐方法，包括：

提取至少两个视频素材的音频数据；

根据每个所述音频数据，计算每个视频素材的音频特征；

基于每个所述音频特征，将每个所述视频素材进行对齐，得到对齐后的视频素材的工程文件。

在一种可能的实现方式中，在所述提取视频素材的音频数据之前，所述方法还包括：

确定所述视频素材中包括的对象；

根据所述视频素材中包括的对象将至少两个所述视频素材进行分类；其中，每个分类中的视频素材包含相同的对象。

在一种可能的实现方式中，所述提取视频素材的音频数据，包括：

针对每个所述视频素材，将所述视频素材按照预设长度进行分割，得到多个子视频素材；

提取各个子视频素材的子音频数据，得到多个子音频数据。

在一种可能的实现方式中，所述音频数据中包括：声波数据，所述根据所述音频数据，计算视频素材的音频特征，包括：

基于各个子音频数据中的声波数据，并行计算所述各个子音频数据的音频特征。

在一种可能的实现方式中，所述基于所述音频特征，将所述视频素材进行对齐，包括：

根据各个子音频数据的音频特征，确定至少一个匹配子音频数据对，其中，所述匹配子音频数据对中的两个子音频数据属于不同的音频数据，且所述两个子音频数据的音频特征匹配；

针对每个所述匹配子音频数据对，将所述匹配子音频数据对中的子音频数据所属的视频素材对齐。

在一种可能的实现方式中，在提取至少视频素材的音频数据之前，所述方法还包括：

将所述至少两个视频素材整理至多个文件夹，其中，格式不同的视频素材被整理至不同的文件夹；

将所述整理好的视频素材进行转码，得到统一格式的转码后的素材。

在一种可能的实现方式中，所述对所述视频素材进行整理，得到整理好的视频素材，包括：

获取按照标准路径规则生成的原始素材路径和转码素材路径；

将所述至少两个视频素材放置所述原始素材路径中，对所述视频素材按照所述视频素材的拍摄机型、录制时间、卡号分层级整理至原始素材路径中的文件夹中，得到整理好的视频素材。

在本发明实施的第二方面，还提供了一种多路视频信号的对齐装置，所述装置包括：

提取模块，用于提取至少两个视频素材的音频数据；

计算模块，用于根据每个所述音频数据，计算每个视频素材的音频特征；

对齐模块，用于基于所述音频特征，将每个所述视频素材进行对齐，得到对齐后的视频素材的工程文件。

在本发明实施的第三方面，还提供了一种电子设备，所述电子设备包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述任一所述的多路视频信号的对齐方法。

在本发明实施的第四方面，还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一所述的多路视频信号的对齐方法。

本发明实施例提供的一种多路视频信号的对齐方法、装置，通过获取视频素材，然后提取视频素材的音频数据，根据音频数据，计算视频素材的音频特征，最后基于音频特征，将视频素材进行对齐。本申请实施例中，是基于音频特征对视频素材进行对齐，所以不需要获取视频素材的时码信息，进而可以避免依赖于时码信息对视频素材进行对齐，由于音频特征是基于音频数据计算得到的和时码信息无关，进而可以实现在无需获取视频素材的时码信息，而对视频素材进行对齐，对于无时码信息的视频素材也可以对齐，进一步地节约了资源，提升了资源利用率。

当然，实时本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例提供的一种多路视频信号的对齐方法的流程示意图；

图2为本发明实施例提供的一种视频素材的整理的流程示意图；

图3为本发明实施例提供的另一种视频素材的整理的流程示意图；

图4为本发明实施例提供的一种多路视频信号的对齐装置的结构示意图；

图5为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

为了能够在剪辑时，自动地对素材进行整理、转码、对齐，本发明实施例提供了一种多路视频信号的对齐方法。如图1所示，该方法包括：

S101，提取至少两个视频素材的音频数据。

S102，根据每个音频数据，计算每个视频素材的音频特征。

S103，基于每个所述音频特征，将每个所述视频素材进行对齐，得到对齐后的视频素材的工程文件。

本申请实施例中，通过获取视频素材，然后提取视频素材的音频数据，根据音频数据，计算视频素材的音频特征，最后基于音频特征，将视频素材进行对齐。本申请实施例中，是基于音频特征对视频素材进行对齐，所以不需要获取视频素材的时码信息，进而可以避免依赖于时码信息对视频素材进行对齐，由于音频特征是基于音频数据计算得到的和时码信息无关，进而可以实现在无需获取视频素材的时码信息，而对视频素材进行对齐，对于无时码信息的视频素材也可以对齐，进一步地节约了资源，提升了资源利用率。

下面将对前述步骤S101-S103进行详细说明:

在S101中，视频素材可以为不同摄像机拍摄的多段视频，也可以为相同摄像机拍摄的多段视频。其中，由于视频素材是多段拍摄的视频，而视频可以称为视频信号，所以视频素材也可以称之为多路视频信号。

在一种可行的实施方式中，由于拍摄视频素材时，视频素材的长短并不一定，有的视频素材是从开始一直拍摄到结束，有的视频素材是从中间开始拍摄的。所以，为了后续便于对齐，可以将视频素材进行分割，这样可以针对一些中间拍摄的视频，在进行对齐时，可以更好地基于音频特征进行对齐，提高对齐效率。上述S101可以具体为：

S1011，针对每个所述视频素材，将视频素材按照预设长度进行分割，得到多个子视频素材。

本步骤中，预设长度可以是技术人员根据实际操作设置的，也可以是基于预设规则设置的，本申请中不对如何设置预设长度进行限定。

S1012，提取各个子视频素材的子音频数据，得到多个子音频数据。

在另一种可行的实施方式中，还可以先提取视频素材的音频数据，然后再将视频素材的音频数据进行分割。例如，视频素材a的完整音频数据为A，先将视频素材进行按照预设长度分割得到子视频素材a1和子视频素材a2，然后在分别提取子视频素材a1的子音频数据A1和子视频素材a2的子音频数据A2，其中，a1+a2＝a，A1+A2＝A。还可以先提取视频素材a的音频数据A，然后将音频数据A按照预设长度分割为子音频数据A1和子音频数据A2，其中子音频数据A1对应子视频素材a1，子音频数据A2对应子视频素材a2，a1+a2＝a，A1+A2＝A。

在S102中，视频素材中的音频数据中可以包括声波数据，声波数据可以反映视频素材的音频特征，所以可以根据声波数据，计算视频素材的音频特征，具体可以为：

S1021：基于各个子音频数据中的声波数据，并行计算各个子音频数据的音频特征。

在上述步骤S1011-S1012中，为了提升资源利用率，将视频素材按照预设长度分割为多个子视频素材，并且提取了各个子视频素材的各个子音频数据。

所以，为了提升视频素材的对齐效率，可以并行计算各个子音频数据的音频特征。具体可以随机将预设数量个子音频数据输入计算程序中，计算得到各个子音频数据的音频特征；也可以将属于同一视频素材的各个子音频数据输入计算程序中，计算得到各个子音频数据的音频特征。其中预设数量为本领域技术人员根据经验设置，计算程序为本领域技术人员用来计算音频特征的程序。

在S103中，基于音频特征，将视频素材进行对齐时，可以通过音频特征的相似度进行对齐。两个视频素材音频特征越相似，则说明该两个视频素材在同一空间、同一时间拍摄的可能性越大。例如，视频素材A的音频特征为a，视频素材B的音频特征为b，音频特征a和音频特征b的相似度大于90％，则说明视频素材A和视频素材B处于同一空间、同一时间拍摄，则可以将视频素材A、B进行对齐。

在视频拍摄时，往往一段连续的视频素材的时长并不相同，所以在进行对齐时，会存在这样的情况，如：视频素材A(分割为子视频素材a1、a2、a3，其对应的音频特征分别为a11、a21、a31)的音频特征为a，视频素材B的音频特征b，视频素材A的音频特征a和视频素材B的音频特征b的相似度小于40％，但是视频素材A的子视频素材a2和视频素材B的音频特征b的相似度大于90％，则说明视频素材B和子视频素材a2拍摄在同一空间、同一时间拍摄的。且视频素材A的时长远远大于视频素材B的时长，视频素材B是在视频素材A拍摄后一段时间后才开始拍摄，视频素材A在视频素材B拍摄结束后一段时间后才结束的。

所以，视频素材在进行对齐时，视频素材的拍摄时长会不同，且拍摄的时间也不同，对齐时，可能存在各种情况，如：视频素材A结束前一段时间，视频素材B开始拍摄；视频素材B可能在视频素材A拍摄时任意时间开始拍摄，所以在对齐时，往往需要将视频素材A、B分割为预设长度，以此便于定位视频素材B与视频素材A在同一空间、同一时间开始拍摄的时间点，因为在同一空间、同一时间拍摄时的音频特征相似度较高，进而实现对齐。基于上述情况，上述S103具体可以为：

S1031，根据各个子音频数据的音频特征，确定至少一个匹配子音频数据对，其中，匹配子音频数据对中的两个子音频数据属于不同的音频数据，且两个子音频数据的音频特征匹配。

本步骤中，往往是针对不同的视频素材进行对齐，所以，在基于子音频数据对齐时，匹配子音频数据对中的两个子音频数据属于不同的音频数据。

实例性的，假设视频素材A分割为：子视频素材a1、a2、a3；视频素材B分割为：子视频素材b1、b2、b3；计算得到子视频素材a1、a2、a3的子音频特征分别为：a11、a21、a31，子视频素材b1、b2、b3的子音频特征分别为：b11、b21、b31；匹配确定子音频特征a21和b11匹配，所以将视频素材B的子视频素材b1和视频素材A的子视频素材a2进行对齐。

S1032，针对每个匹配子音频数据对，将匹配子音频数据对中的子音频数据所属的视频素材对齐。

本步骤中，每个匹配子音频数据对中的子音频特征相同或相似度高，即每个匹配子音频数据对中的子音频素材是同一空间、同一时间拍摄的可能性较大，所以将属于同一匹配子音频数据对中的子音频数据对应的子视频素材进行对齐。

本步骤中，通过将视频素材分割成多个子视频素材，然后基于子视频素材的音频数据匹配子音频数据对，属于同一匹配子音频数据对中的子视频素材在同一空间、同一时间拍摄的可能性较大，所以将属于同一匹配子音频数据对中的对应的子视频素材进行对齐。由于视频素材进行拍摄时，往往会在不同的场景不同的时间进行拍摄，所以在视频素材进行对齐时，往往存在两个视频素材可能只有一部分子视频素材是同一空间、同一时间拍摄的，可以进行对齐，所以本实施例中，将视频素材按照预设长度进行分割，然后基于分割后的各个子视频素材进行对齐，可以提高对齐时的资源利用率，避免视频素材浪费。

在一种可行的实施方式中，由于拍摄同一个对象得到的视频素材往往是连续的，所以，在进行环境音对齐时，可以按照拍摄对象将视频素材进行分类，然后基于分类后的视频素材，进行对齐，以此可以提高对齐的效率。所以，可以在提取视频素材时，先对视频素材进行分类，具体步骤如下：

A)，确定视频素材中包括的对象。

本步骤中，视频素材中的对象可以是拍摄时的主要参与者，如果拍摄内容为综艺节目，则对象可以为参与综艺节目拍摄的参与者，如，《偶像练习生》中的张艺兴；如果拍摄内容为科普类纪录片，比如，猫咪纪录片，则对象可以为拍摄内容中的某一只猫咪。本实施例中视频素材中的对象并不限于以上两种类型，其他对象也可以为本申请中视频素材中包括的对象，例如，纪实类纪录片中的拍摄的对象，某个建筑等。

B)，根据视频素材中包括的对象将至少两个视频素材进行分类，得到分类后的视频素材；其中，每个分类中的视频素材包含相同的对象。

本步骤中，可以根据视频素材中包括的对象的标识将视频素材进行分类，对象的标识根据对象确定，例如对象为人物时，对象的标识可以为面部特征；对象为物品时，对象的标识可以是物品的轮廓特征；示例性的，以对象为人物为例，对象的标识为面部特征，该实施例中获取到视频素材后，提取视频素材中人物的面部特征，然后根据面部特征进行分类，将脸部特征相同的视频归为一类，例如，假设一共有四段视频素材，分别记为：视频素材A，视频素材B，视频素材C，视频素材D，通过提取面部特征确定：视频素材A、C中人物的面部特征一致，即认为视频素材A、C中包括的人脸为同一人物的人脸，因此将视频素材A、C分为一类；视频素材B、D中人物的面部特征一致，即认为视频素材B、D中包括的人脸为同一人物的人脸，因此将视频素材B、D分为一类。

本实施例中，由于属于同一对象的视频素材一般具有连续性特征，所以可以先将视频素材按照对象进行分类，然后再进行对齐，以此可以提高对齐时的效率。

在一种可能的实现方式中，为了提高对齐效率，可以先对视频素材进行整理，然后再进行对齐步骤，如图2，具体处理过程包括：

S201，将至少两个视频素材整理至多个文件夹，其中，格式不同的视频素材被整理至不同的文件夹。

本步骤中，视频素材可以为不同摄像机拍摄的多段视频，也可以为相同摄像机拍摄的多段视频。本申请中的整理是指：基于视频素材的基本信息，将视频素材归类于多个不同的文件夹，每个文件夹内的任意两个视频素材的素材信息相同。归类时所基于的视频素材的基本信息根据应用场景的不同可以不同，但是应当尽可能保证：被归类至同一文件夹内的视频素材能够被批量转码。本申请中不限定视频素材的基本信息的具体内容，所有可以用来归类视频素材的信息均可以为本申请中的视频素材的基本信息。

S202，将整理好的视频素材进行转码，得到统一格式的转码后的素材。

本步骤中，在素材对齐时，由于不同的摄像机拍摄的视频素材存在格式不一致的问题从而导致无法进行对齐的情况。通过本实施例中将整理好的视频素材进行转码，将不同的摄像机拍摄的视频素材均转换为统一格式的转码后的素材，以便于后续可以基于统一格式的转码后的素材批量对齐，提高素材对齐的效率。

在一种可能的实现方式中，对视频素材进行整理，得到整理好的视频素材。如图3，具体处理过程包括：

S301，获取按照标准路径规则生成的原始素材路径和转码素材路径。

在本步骤实施例中，提供一种标准素材路径规则，可以在按照标准路径规则生成原始素材路径和转码素材路径后，对视频素材进行整理、转码时，直接获取生成的原始素材路径和转码素材路径。

本步骤中，标准路径规则可以为从标准路径中选择或在该路径下新建路径，作为原始素材路径和转码素材路径。标准路径规则根据应用场景的不同可以不同，但是应当保证生成的原始素材路径与转码素材路径为不同的路径。示例性的，标准路径为：D\剪辑，标准路径下还存在多个路径，比如D\剪辑\1、D\剪辑\2、D\剪辑\3。可以将D\剪辑\1作为原始素材路径，将D\剪辑\2作为转码素材路径。还可以是，标准路径为：D\剪辑，可以在标准路径下新建一个路径，比如在剪辑路径下建立一个整理素材路径，D\剪辑\整理素材，作为原始素材路径，在剪辑路径下建立一个转码素材路径，D\剪辑\转码素材，作为转码素材路径。

S302，将至少两个视频素材放置原始素材路径中，对视频素材按照视频素材的拍摄机型、录制时间、卡号分层级整理至原始素材路径中的文件夹中，得到整理好的视频素材。

由于同一拍摄机型拍摄得到的视频素材的格式相同，所以，被整理至同一文件夹下的视频素材是由同一拍摄机型拍摄的。因此，可以通过S301、S302实现上述步骤S201。

另外，不同拍摄机型拍摄到的视频素材格式也可以相同，比如，拍摄机型A和拍摄机型B除了拍摄机型A带闪光灯，其他全部形态。所以，在整理时也可以根据视频素材的格式进行整理，具体如何整理可以根据实际情况进行。将视频素材放置在原始素材路径中后，可以先按照录制时间将同一录制时间的视频素材放在同一个原始素材路径中的根目录下的原始文件夹中。然后分别针对每个原始文件夹，基于拍摄机型，再将该原始文件夹中的视频素材划分至不同的第一级子文件夹中。再分别针对每个第一级子文件夹，基于存储卡卡号，将该第一级子文件夹中从同一个卡号对应的存储卡中导出的视频素材再整理至同一个第二级子文件夹中，进而可以实现分层级整理视频素材。以便于在进行剪辑时，可以按照整理好的视频素材，有条理地选取各个文件夹内的视频素材进行转码、对齐，进而可以提高剪辑效率。

本实施例中，通过获取标准路径生成的原始素材路径和转码素材路径，然后基于原始素材路径对视频素材进行整理，基于转码素材路径对整理好的视频素材进行转码，只需将视频素材放置在对应的素材路径中就可以实现自动对视频素材的整理、转码。进而可以提高视频剪辑过程中的对视频素材进行处理的效率。

相应于上述一种多路视频信号的对齐方法实施例，本发明实施例还提供了一种多路视频信号的对齐装置，如图4所示，所述装置包括：

提取模块401，用于提取至少两个视频素材的音频数据；

计算模块402，用于根据每个音频数据，计算每个视频素材的音频特征；

对齐模块403，用于基于每个音频特征，将每个视频素材进行对齐，得到对齐后的视频素材的工程文件。

本实施例中，通过获取视频素材，然后提取视频素材的音频数据，根据音频数据，计算视频素材的音频特征，最后基于音频特征，将视频素材进行对齐。本申请实施例中，是基于音频特征对视频素材进行对齐，所以不需要获取视频素材的时码信息，进而可以避免依赖于时码信息对视频素材进行对齐，由于音频特征是基于音频数据计算得到的和时码信息无关，进而可以实现在无需获取视频素材的时码信息，而对视频素材进行对齐，对于无时码信息的视频素材也可以对齐，进一步地节约了资源，提升了资源利用率。

本发明实施例还提供了一种电子设备，如图5所示，包括处理器501、通信接口502、存储器503和通信总线504，其中，处理器501，通信接口502，存储器503通过通信总线504完成相互间的通信，

存储器503，用于存放计算机程序；

处理器501，用于执行存储器503上所存放的程序时，实现上述网络访问方法实施例所述的方法步骤：

提取视频素材的音频数据；

根据所述音频数据，计算视频素材的音频特征；

基于所述音频特征，将所述视频素材进行对齐，得到对齐后的视频素材的工程文件。

上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。在一种可能的实现方式中，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processor，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field－Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述实施例中任一所述的一种多路视频信号的对齐方法。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的一种多路视频信号的对齐方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例、电子设备实施例、计算机可读存储介质实施例、计算机程序产品实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种多路视频信号的对齐方法，所述方法包括：

提取至少两个视频素材的音频数据；

根据每个所述音频数据，计算每个视频素材的音频特征；

2.根据权利要求1所述的方法，在所述提取视频素材的音频数据之前，所述方法还包括：

确定所述视频素材中包括的对象；

3.根据权利要求1所述的方法，所述提取视频素材的音频数据，包括：

提取各个子视频素材的子音频数据，得到多个子音频数据。

4.根据权利要求3所述的方法，所述音频数据中包括：声波数据，所述根据所述音频数据，计算视频素材的音频特征，包括：

5.根据权利要求3所述的方法，所述基于所述音频特征，将所述视频素材进行对齐，包括：

6.根据权利要求1所述的方法，在提取至少两个视频素材的音频数据之前，所述方法还包括：

将所述至少两个视频素材整理至多个文件夹，其中，格式不同的所述视频素材被整理至不同的文件夹；

将经过整理的视频素材进行转码，得到统一格式的转码后的素材。

7.根据权利要求6所述的方法，所述将所述至少两个视频素材整理至多个文件夹，包括：

8.一种多路视频信号的对齐装置，所述装置包括：

提取模块，用于提取至少两个视频素材的音频数据；

对齐模块，用于基于每个所述音频特征，将每个所述视频素材进行对齐，得到对齐后的视频素材的工程文件。

9.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求1-7任一所述的方法步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法步骤。