CN105763923A

CN105763923A - 一种影音、影音模板编辑方法及其装置

Info

Publication number: CN105763923A
Application number: CN201410775864.0A
Authority: CN
Inventors: 彭刚; 王子君; 陈川
Original assignee: Leshi Zhixin Electronic Technology Tianjin Co Ltd
Current assignee: Leshi Zhixin Electronic Technology Tianjin Co Ltd
Priority date: 2014-12-15
Filing date: 2014-12-15
Publication date: 2016-07-13

Abstract

本申请提供一种影音、影音模板编辑方法及其装置，所述影音编辑方法包括：播放预存的影音模板；获得用户根据影音模板输入的录音文件；将所述录音文件同所述影音模板组成影音文件。所述影音模板编辑方法包括：选择要编辑的影音文件以及所述影音文件的字幕文件；对所述影音文件进行音频数据和视频数据的拆分；对拆分得到的音频数据进行人声分量的消除；将消除人声分量的音频数据、视频数据以及字幕文件组成影音模板。本申请根据影音文件生成的影音模板，与用户的录音文件合成，生成具有个人特色的影音文件。

Description

一种影音、影音模板编辑方法及其装置

技术领域

本申请涉及影音处理技术领域，尤其涉及一种影音、影音模板编辑方法及其装置。

背景技术

随着影音处理技术的发展，现有的影音编辑方法，能够提供音频/视频信号的编辑，例如剪接、加入特效等，且支持为数众多的影像/声音文件格式。使用者可以编辑影像素材及声音素材，生成影音文件。

为了进一步提升影音文件的观看体验，字幕成为影音文件的重要辅助信息。现有的影音编辑方法，会对字幕文件进行解码，获得字符的图像数据。将字符的图像数据与视频图像合成，进行输出显示。

但是用户仅能够通过现有的影音编辑软件，对影音素材进行编辑处理，并结合字幕文件进行显示。现有的影音编辑软件无法将影音文件和用户的录音文件合成，生成具有个人特色的影音文件。

因此，如何将影音文件和用户的录音文件合成，生成具有个人特色的影音文件，成为现有技术中亟需解决的技术问题。

发明内容

有鉴于此，本申请提供一种影音编辑方法及其装置，其根据影音文件生成的影音模板，与用户的录音文件合成，生成具有个人特色的影音文件。

本申请提供一种影音编辑方法，所述方法包括：

播放预存的影音模板；

获得用户根据影音模板输入的录音文件；

将所述录音文件同所述影音模板组成影音文件。

在本申请一具体实施例中，所述预存的影音模板的生成包括：

选择要编辑的影音文件以及所述影音文件的字幕文件；

对所述影音文件进行音频数据和视频数据的拆分；

对拆分得到的音频数据进行人声分量的消除；

将消除人声分量的音频数据、视频数据以及字幕文件组成影音模板。

在本申请一具体实施例中，所述获得用户根据影音模板输入的录音文件之后包括：

调整所述录音文件的声音特征参数；

所述将录音文件同所述影音模板组成影音文件为：

将调整声音特征参数的录音文件同所述模板文件组成影音文件。

在本申请一具体实施例中，所述调整所述录音文件的声音特征参数包括：

通过用户输入指令，选择预设数据库中的角色，获得所选择角色的声音特征参数；

根据所述录音文件的声音特征参数和所选择角色的声音特征参数，获得声音调整参数；

根据所述声音调整参数调整所述录音文件的声音特征参数。

本申请还提供一种影音模板编辑方法，所述方法包括：

选择要编辑的影音文件以及所述影音文件的字幕文件；

对所述影音文件进行音频数据和视频数据的拆分；

对拆分得到的音频数据进行人声分量的消除；

本申请还提供一种影音编辑装置，所述装置包括：

模板播放模块，用于播放预存的影音模板；

录音获得模块，用于获得用户根据影音模板输入的录音文件；

文件组成模块，用于将所述录音文件同所述影音模板组成影音文件。

文件选择模块，选择要编辑的影音文件以及所述影音文件的字幕文件；

数据拆分模块，对所述影音文件进行音频数据和视频数据的拆分；

人声消除模块，对拆分得到的音频数据进行人声分量的消除；

模板生成模块，将消除人声分量的音频数据、视频数据以及字幕文件组成影音模板。

在本申请一具体实施例中，还包括：

参数调整模块，用于调整所述录音文件的声音特征参数；

所述文件组成模块，用于将调整声音特征参数的录音文件同所述模板文件组成影音文件。

在本申请一具体实施例中，所述参数调整单元包括：

角色选择子单元，用于通过用户输入指令，选择预设数据库中的角色，获得所选择角色的声音特征参数；

参数获得子单元，用于根据所述录音文件的声音特征参数和所选择角色的声音特征参数，获得声音调整参数；

参数调整子单元，用于根据所述声音调整参数调整所述录音文件的声音特征参数。

本申请还提供一种影音模板编辑装置，所述装置包括：

文件选择模块，用于选择要编辑的影音文件以及所述影音文件的字幕文件。

数据拆分模块，用于对所述影音文件进行音频数据和视频数据的拆分。

人声消除模块，用于对拆分得到的音频数据进行人声分量的消除。

模板生成模块，用于将消除人声分量的音频数据、视频数据以及字幕文件组成影音模板。

由以上技术方案可见，本申请选择要编辑的影音文件以及所述影音文件的字幕文件，对所述影音文件进行音频数据和视频数据的拆分，将拆分得到的音频数据进行人声分量的消除。进一步，将消除人声分量的音频数据、视频数据以及字幕文件组成影音模板。用户可将所述影音模板与用户的录音文件合成，生成具有个人特色的影音文件。通过本申请，用户可互联互动的对所述影音数据进行编辑，获得更好的参与体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1是本申请影音编辑方法及其装置所应用的终端或者服务器的结构图；

图2是本申请影音编辑方法的一实施例的流程图；

图3是本申请影音编辑方法中影音模板的生成方法的流程图；

图4是本申请影音编辑方法的另一实施例的流程图；

图5是本申请影音编辑方法中步骤S4的流程图；

图6是本申请影音编辑装置的一实施例的结构图；

图7是本申请影音编辑装置中影音模板的生成装置的结构图；

图8是本申请影音编辑装置的另一实施例的结构图；

图9是本申请影音编辑装置中参数调整模块的结构图。

具体实施方式

本申请选择要编辑的影音文件以及所述影音文件的字幕文件，对所述影音文件进行音频数据和视频数据的拆分，将拆分得到的音频数据进行人声分量的消除。进一步，将消除人声分量的音频数据、视频数据以及字幕文件组成影音模板。用户可将所述影音模板与用户的录音文件合成，生成具有个人特色的影音文件。通过本申请，用户可互联互动的对所述影音数据进行编辑，获得更好的参与体验。

当然，实施本申请的任一技术方案必不一定需要同时达到以上的所有优点。

为了使本领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于本申请保护的范围。

下面结合本申请附图进一步说明本申请具体实现。

本申请提供一种影音编辑方法，应用于终端装置或者服务器，比如智能电视、智能手机或者视频服务器等。

参见图1，所述终端装置或者服务器在硬件上包括控制模块11，存储模块12、输入模块13以及输出模块14。其中，所述控制模块11用于对各功能模块进行控制。所述存储模块12用于存储程序以及中间数据。所述输入模块13用于接收用户的输入指令。所述输出模块14用于输出音视频数据。

参见图2，本申请影音编辑方法包括：

S1、播放预存的影音模板。

具体地，参看图3，所述预存的影音模板的生成方法包括：

P1、选择要编辑的影音文件以及所述影音文件的字幕文件。

具体地，影音文件及其字幕文件均存储于所述终端装置或者服务器的存储模块12中。用户通过所述终端装置或者服务器的输入模块13选择要编辑的影音文件以及所述影音文件的字幕文件。

所述影音文件通常为带有声音的动画，文件格式为gif、swf格式，或者为视频短片，文件格式可以为MPEG、avi、mp4、mkv、rmvb等格式。所述终端装置或者服务器需支持该格式的影音文件的播放。

字幕文件一般是独立于其影音文件的单独的文件，并且具有特定的文件格式。例如，SRT、SSA、ASS、SUP等。其中，最常用的是SRT格式以及SSA格式，SRT格式只是单纯的时间码和文本内容，而SSA却可以做出一些特效，如指定字体的大小、颜色和一些简单的动画(翻滚、移动……)等。在实际应用中，字幕文件可能是一些用户自行制作的，或者一般还会有专门制作字幕文件的提供商等。

对于同一影音文件而言，可能存在多份可用字幕文件。用户通过所述终端装置或者服务器的输入模块13选择需求的字幕文件。比如，用户希望使用中文字幕，则选择中文字幕文件，希望使用英文字幕，则选择英文字幕文件。用户可以从影音文件所在的目录(或子目录)中查找相关字幕文件，也可以从对影音文件进行播放的媒体播放器设置的字幕文件存放目录(或子目录)中查找相关字幕文件，当然亦可通过互联网搜索并下载相关字幕文件。当然，也可以按上述位置从前到后的顺序进行查找，直到找到相关字幕文件为止。

P2、对所述影音文件进行音频数据和视频数据的拆分。

具体步骤如下：

P21、针对影音文件的格式，按其格式读出其中的音视频数据帧。例如AVI文件分为文件头和数据体，文件头为RIFF格式，所有的数据帧的索引保存在文件头中，按此索引将所有的数据帧按顺序一一读出；

P22、根据数据帧的帧头中的数据类型，区分出音频帧数据和视频帧数据。例如AVI文件中数据帧的帧头数据中有帧的类型，指示此数据帧是音频数据还是视频数据；

P23、再将所有的音频帧数据按影音文件的格式存入音频文件中，将所有的视频帧数据按影音文件的格式存入视频文件中。例如如果要存成音频AVI文件，则首先写入空的RIFF文件头和空的索引部分，再在文件的结尾部分添加音频数据帧的数据，添加完后修改索引部分的索引，添加完所有的音频数据帧和音频数据帧的索引后，再修改文件头部分的数据，这样一个完整的音频AVI文件就写入完成了。视频数据帧处理同音频数据帧。

P3、对拆分得到的音频数据进行人声分量的消除。

在本申请一具体实现中，所述步骤P3包括：

P31、获得右声道的音频信号以及左声道的音频信号；

P32、将右声道的音频信号减去左声道的音频信号，获得消除人声分量的音频数据。

由于大多数的人声分量存在于音频信号中的200Hz到4kHz的频带中。人声信号是音频系统中的单信号，即单声道信号。包括乐器的声音的音乐信号被分离为左右声道。因此，除了单声道信号外，输入到左声道端的音频信号和输入到右声道端的音频信号的波形彼此不同。所以，如果从输入到右声道的音频信号中减去输入到左声道的音频信号，则可生成其中消除了人声信号的音频信号。因此，由于人声分量位于音频信号的中心通道，本申请通过获得左、右声道之间的差值以消除人声分量。

P4、将消除人声分量的音频数据、视频数据以及字幕文件组成影音模板。

在本申请的具体实现中，将消除人声分量的音频数据和视频数据进行合并，合并方式同步骤P2中将影音文件拆分为音频数据和视频数据的方式类似。

针对音频数据和视频数据的格式，合并所述音频数据和视频数据为影音文件。合并步骤为：

P41、分别按音频文件的格式和视频文件格式，读入音频数据帧和视频数据帧，例如AVI文件分为文件头和数据体，文件头为RIFF格式，所有的数据帧的索引保存在文件头中，按此索引将所有的数据帧按顺序一一读出；

P42、再依照数据帧头中的时间的顺序将这些音视频数据排序，例如AVI文件中数据帧的帧头数据中有帧开始时间和展示时间，以帧开始时间作为时间排序依据；

P43、将排序后的数据帧按音视频文件格式存入到音视频文件中。例如如果要存成AVI文件，则首先写入空的RIFF文件头和空的索引部分，再在文件的结尾部分添加数据帧的数据，添加完后修改索引部分的索引，添加完所有的数据帧和数据帧的索引后，再修改文件头部分的数据，这样一个完整的AVI文件就写入完成了。

所述字幕显示参数包括分辨率大小、字体大小、字体颜色、字幕显示位置等。

其中，分辨率大小包括：1920*1080、1366*786、1280*720、848*480、640*480；字体大小包括：大、中、小；字体颜色包括：白、黑、灰、黄、绿、蓝；字幕显示位置，包括：横向显示在屏幕下部、横向显示在屏幕上部、竖向显示在屏幕右侧、竖向显示在屏幕左侧等。

字幕文件包含时间信息，时间信息能够保证字幕文件可以和影音文件数据流合成显示。为了便于理解，下面对字幕文件相关概念进行说明。

字幕文件一般包括图形格式字幕以及文本格式字幕。其中，图形格式字幕由idx和sub文件组成，idx相当于索引文件，里面包括了字幕出现的时间码和字幕显示的属性，sub文件就是字幕数据本身。文本格式字幕的扩展名通常是srt、smi、ssa或sub(与图形格式后缀一样，但数据格式不同)，其中srt文本字幕最流行，其制作和修改非常简单：一句时间代码+一句字幕。如，对于下述srt字幕文件内容：

45

00：02：52，184——〉00：02：53，617

慢慢来

表示：第45行字幕，显示时间从影音数据流开始的第2分52.184秒到第2分53.617秒，字幕内容为：慢慢来。

因此，影音文件和字幕文件进行播放的过程中，可以根据各自包含的时间信息之间的对应关系(如影音文件与字幕内容属性中的时间戳一致)，以及字幕显示参数属性，将影音数据与字幕内容叠加在一起进行播放。

S2、获得用户根据影音模板输入的录音文件。

具体地，本实施例所述用户的录音文件为用户根据影音模板输入的录音文件。即，用户采用现有的播放软件进行影音文件和字幕内容的播放，根据字幕内容，进行配音，输入录音文件。因此，本实施例用户输入的录音文件是根据播放影音模板中的字幕内容录入的，所述录音文件和所述影音模块的匹配度更佳。

S3、将所述录音文件同所述影音模板组成影音文件。

由于影音文件和字幕文件是根据各自包含的时间信息对应关系实现的同步播放，而用户根据影音模板中的字幕内容，输入的录音文件。所述录音文件时间信息是同字幕文件相同的。

具体地，本申请将所述录音文件同所述影音模板组成新的影音文件，该新的影音文件根据录音文件、字幕文件各自包含的时间信息对应关系实现同步播放。

具体地，本申请亦可将所述录音文件同所述影音模板单独存放，根据各自包含的时间信息对应关系实现同步播放。

通过本申请，用户可互联互动的对所述影音数据进行编辑，获得更好的参与体验。

参看图4，本申请另一实施例所述影音编辑方法包括：步骤S1——S3。

此外，所述步骤S2之后还包括：

S4、调整所述录音文件的声音特征参数。

用户通过所述终端装置或者服务器的输入模块13调整所述录音文件的声音特征参数。所述声音特征参数包括：响度，表示人主观感觉声音的大小；音调，表示声音的高低；音色，采用波形决定声音的音色，表示声音的质感，如方波，锯齿波脉冲波等。

比如，用户可以调整响度参数，令录音文件中的声音更大；或者调整音调参数，令录音文件中的声音更高。

所述步骤S3为将调整声音特征参数的录音文件同所述模板文件组成影音文件。

本实施例对用户根据模板文件输入的录音文件进行声音特征参数的调整，将调整声音特征参数的录音文件同所述模板文件组成影音文件。本实施例可令录音文件中的声音更加满足用户需求，用户可以更好的参与影音文件的编辑，增加影音文件编辑的互联互动性。

本申请另一实施例所述影音编辑方法包括：步骤S1——S4。

参看图5，所述步骤S4包括：

S41、通过用户输入指令，选择预设数据库中的角色，获得所选择角色的声音特征参数。

所述终端装置或者服务器的存储模块12存储有预设数据库，所述预设数据库存储各类角色的声音特征参数，比如卡通角色声音特征参数、性别角色声音特征参数等。用户通过输入指令，在所述预设数据库中选择角色，获得角色对应的声音特征参数。

S42、根据所述录音文件的声音特征参数和所选择角色的声音特征参数，获得声音调整参数。

本申请比较所述录音文件的声音特征参数和所选择角色的声音特征参数，根据两者的差异，获得声音调整参数。优选地，所述声音调整参数令所述录音文件的声音特征参数在不失真的情况下，接近所选择角色的声音特征参数。比如选择的角色为卡通角色中小猫的角色，获得小猫的声音特征参数。根据所述录音文件的声音特征参数和小猫的声音特征参数的差异，获得声音调整参数。所述声音调整参数令所述录音文件的声音特征参数在不失真的情况下，接近小猫的声音特征参数。

S43、根据所述声音调整参数调整所述录音文件的声音特征参数。

根据所述声音调整参数调整所述录音文件的声音特征参数，调整后的录音文件中，声音更加接近所选择角色的声音，又保存录音用户的个人特征。

本实施例根据所选择角色的声音特征参数，调整录音文件的声音特征参数，从而令录音文件中的声音效果更接近所选择的角色。本实施例将调整声音特征参数的录音文件同所述模板文件组成影音文件后的播放效果更好。

参看图3，本申请还提供一种影音模板编辑方法，所述方法包括：

P1、选择要编辑的影音文件以及所述影音文件的字幕文件。

P2、对所述影音文件进行音频数据和视频数据的拆分。

具体步骤如下：

P3、对拆分得到的音频数据进行人声分量的消除。

在本申请一具体实现中，参看图3，所述步骤S3包括：

P31、获得右声道的音频信号以及左声道的音频信号；

在本申请的具体实现中，将消除人声分量的音频数据和视频数据进行合并，合并方式同步骤S2中将影音文件拆分为音频数据和视频数据的方式类似。

45

00：02：52，184——〉00：02：53，617

慢慢来

本实施例将消除人声分量的音频数据、视频数据以及字幕文件组成影音模板，用户可使用所述影音模板与用户的录音文件合成，生成具有个人特色的影音文件。通过本申请，用户可互联互动的对所述影音数据进行编辑，获得更好的参与体验。

对应上述方法，本申请还提供一种影音编辑装置，应用于终端装置或者服务器，比如智能电视、智能手机或者视频服务器等。

参见图6，本申请影音编辑装置包括：

模板播放模块61，用于播放预存的影音模板。

录音获得模块62，用于获得用户根据影音模板输入的录音文件。

文件组成模块63，用于将所述录音文件同所述影音模板组成影音文件。

具体地，参看图7，所述预存的影音模板的生成装置包括：

文件选择模块71，用于选择要编辑的影音文件以及所述影音文件的字幕文件。

数据拆分模块72，用于对所述影音文件进行音频数据和视频数据的拆分。

人声消除模块73，用于对拆分得到的音频数据进行人声分量的消除。

模板生成模块74，用于将消除人声分量的音频数据、视频数据以及字幕文件组成影音模板。

45

00：02：52，184——〉00：02：53，617

慢慢来

参看图8，本申请另一实施例所述影音编辑装置包括：模板播放模块61、录音获得模块62、文件组成模块63。

此外，所述装置还包括：

参数调整模块64，用于调整所述录音文件的声音特征参数。

所述文件组成模块63用于将调整声音特征参数的录音文件同所述模板文件组成影音文件。

本申请另一实施例所述影音编辑装置包括：模板播放模块61、录音获得模块62、文件组成模块63、参数调整模块64。

参看图9，所述参数调整模块64包括：

角色选择单元641，用于通过用户输入指令，选择预设数据库中的角色，获得所选择角色的声音特征参数。

参数获得单元642，用于根据所述录音文件的声音特征参数和所选择角色的声音特征参数，获得声音调整参数。

参数调整单元643，用于根据所述声音调整参数调整所述录音文件的声音特征参数。

参看图7，本申请还提供一种影音模板编辑装置，所述装置包括：

45

00：02：52，184——〉00：02：53，617

慢慢来

下面通过一具体应用场景来进一步说明本申请实现。

本申请以APP的形式应用于一具有触摸屏的智能手机中，用户通过智能手机的触摸屏，点选要编辑的动画片《三只小猪》，以及《三只小猪》的字幕文件为“中文字幕文件”。

所述智能手机对动画片《三只小猪》进行音频数据和视频数据的拆分，获得《三只小猪》的音频数据和《三只小猪》的视频数据。

所述智能手机对拆分得到的《三只小猪》的音频数据进行人声分量的消除，获得消除人声分量《三只小猪》的音频数据。

将消除人声分量《三只小猪》的音频数据、《三只小猪》的视频数据进行合并，合并为《三只小猪》的影音文件。将《三只小猪》的影音文件以及《三只小猪》的“中文字幕文件”组成《三只小猪》的影音模板。

所述智能手机播放所述《三只小猪》的影音模板，将“中文字幕文件”叠加到《三只小猪》的影音文件数据流中进行播放。

用户根据播放的《三只小猪》的影音模板，根据显示的字幕内容，进行配音，输入录音文件。

用户通过智能手机的触摸屏，点选预设数据库中的小猪卡通角色，获得小猪卡通角色的声音特征参数。

根据所述录音文件的声音特征参数和小猪的声音特征参数的差异，获得声音调整参数。所述声音调整参数令所述录音文件的声音特征参数在不失真的情况下，接近小猪的声音特征参数。

所述智能手机将所述录音文件同所述影音模板组成新的影音文件。所述新的影音文件可以通过网络将其推送到播放设备进行播放，或分享到其他平台或进行保存。

本申请将消除人声分量的音频数据、视频数据以及字幕文件组成影音模板，用户可使用所述影音模板与用户的录音文件合成，生成具有个人特色的影音文件。通过本申请，用户可互联互动的对所述影音数据进行编辑，获得更好的参与体验。

本领域的技术人员应明白，本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种影音编辑方法，其特征在于，所述方法包括：

播放预存的影音模板；

获得用户根据影音模板输入的录音文件；

将所述录音文件同所述影音模板组成影音文件。

2.根据权利要求1所述的方法，其特征在于，所述预存的影音模板的生成包括：

选择要编辑的影音文件以及所述影音文件的字幕文件；

对所述影音文件进行音频数据和视频数据的拆分；

对拆分得到的音频数据进行人声分量的消除；

3.根据权利要求1所述的方法，其特征在于，所述获得用户根据影音模板输入的录音文件之后包括：

调整所述录音文件的声音特征参数；

所述将录音文件同所述影音模板组成影音文件为：

4.根据权利要求3所述的方法，其特征在于，所述调整所述录音文件的声音特征参数包括：

根据所述声音调整参数调整所述录音文件的声音特征参数。

5.一种影音模板编辑方法，其特征在于，所述方法包括：

选择要编辑的影音文件以及所述影音文件的字幕文件；

对所述影音文件进行音频数据和视频数据的拆分；

对拆分得到的音频数据进行人声分量的消除；

6.一种影音编辑装置，其特征在于，所述装置包括：

模板播放模块，用于播放预存的影音模板；

7.根据权利要求6所述的装置，其特征在于，所述预存的影音模板的生成包括：

8.根据权利要求6所述的装置，其特征在于，还包括：

参数调整模块，用于调整所述录音文件的声音特征参数；

9.根据权利要求8所述的装置，其特征在于，所述参数调整模块包括：

角色选择单元，用于通过用户输入指令，选择预设数据库中的角色，获得所选择角色的声音特征参数；

参数获得单元，用于根据所述录音文件的声音特征参数和所选择角色的声音特征参数，获得声音调整参数；

参数调整单元，用于根据所述声音调整参数调整所述录音文件的声音特征参数。

10.一种影音模板编辑装置，其特征在于，所述装置包括：