具体实施方式
下面将结合本发明实施例的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种音频合成方法,用于实现自由选取音频文件的部分内容进行录制,提高用户体验感。本发明实施例还提供了一种音频合成装置。
下面将以具体实施例对本发明进行详细介绍。
如图1所示,一种音频合成方法,可包括:
101、检测输入的针对源音频文件的录制指令,响应所述录制指令;
在该步骤中,获取用户指定的音频文件,然后解析并播放该音频文件,检测用户输入的对该源音频文件的录制指令,响应录制指令,同时开启对外部音频信号的检测。
本发明实施例中的源音频文件可以是歌曲、演讲、朗诵、相声、小品等,在此不作限定。
其中,当检测到外部音频信号时,转向步骤102;当未检测到外部音频信号时,转向步骤103。
102、当检测到外部音频信号时,过滤所述源音频文件的音频信息,并录制所述外部音频信号得到第一音频信息;
其中,如果检测到外部音频信号,将停止源音频文件的播放,从而录制外部音频信号。
103、当未检测到外部音频信号时,获取所述源音频文件的音频信息得到第二音频信息;
在没有检测到外部音频信号时,将继续播放源音频文件。
104、当检测到所述源音频文件播放结束,按照所述源音频文件的播放顺序,将所述第一音频信息和第二音频信息进行合成得到目标音频文件。
本发明实施例中,通过在检测到输入的针对源音频文件的录制指令时,响应该录制指令,并在检测到外部音频信号时,过滤源音频文件的音频信息,然后录制外部音频信号得到第一音频信息,在没有检测到外部音频信号时,获取源音频文件的音频信息,得到第二音频信息,最后,在源音频文件播放结束后,按照所述源音频文件的播放顺序,将所述第一音频信息和第二音频信息进行合成得到目标音频文件。在本发明实施例中,用户可以选择音频文件的任意部分,然后录制自己的声音,另一部分则用原声,从而录制得到与源音频文件原创的合演作品,当然,用户可以录制自己的声音取代整个音频文件的原声,从而录制成自己的音频作品,录制方式灵活,用户体验感好。
如图2所示,本发明另一实施例提供的一种音频合成方法,可包括:
201、检测输入的针对源音频文件的录制指令,响应所述录制指令;
其中,当检测到外部音频信号时,转向步骤202;当未检测到外部音频信号时,转向步骤203。
202、当检测到外部音频信号时,将与所述外部音频信号的录入时长对应的所述源音频文件的音频信息过滤,并将所述外部音频信号和所述录入时长对应的伴奏部分进行合并录制,得到第一音频信息;
可以理解的是,源音频文件除包含音频信息外,其中还包含有伴奏,通过伴奏能够丰富、突显音频信息。
203、当未检测到外部音频信号时,将未录入时长对应的所述源音频文件的另一音频信息和所述未录入时长对应的伴奏部分进行合并录制,得到第二音频信息;
204、当检测到所述源音频文件播放结束,按照所述源音频文件的播放顺序,将所述第一音频信息和第二音频信息进行合成得到目标音频文件。
本发明实施例中,在检测到输入的针对源音频文件的录制指令后,若检测到外部音频信号,将该录入时长对应的源音频文件中的音频信息过滤掉,然后用外部音频信号和录入时长对应的伴凑进行合并录制,得到第一音频信息,从而录制用户声音取代原声,若未检测到外部音频信号,则用未录入时长对应的源音频文件的音频信息和未录入时长对应的伴凑进行合并录制,得到第二音频信息,在源音频文件播放结束后,按照源音频文件的播放顺序,将第一音频信息和第二音频信息合成得到目标音频文件。在本发明实施例中,用户可以选择音频文件的任意部分,然后录制自己的声音,另一部分则用原声,从而录制并合成得到新的音频文件,当然,用户可以录制自己的声音取代整个音频文件的原声,从而录制成自己的音频文件,录制方式灵活,用户体验感好。
如图3所示,进一步对上述实施例进行介绍,一种音频合成方法包括:
301、检测输入的针对源音频文件的播放指令;
获取用户指定的源音频文件。
302、响应所述播放指令,解析及播放所述源音频文件并确定所述源音频文件的开始时间点和结束时间点;
可以理解的是,源音频文件具有其自身属性,包括音频内容、音频字幕、播放的开始时间点和结束时间点,本发明实施例中通过在解析源音频文件时确定出播放的开始时间点和结束时间点。
303、检测输入的针对源音频文件的录制指令,响应所述录制指令;
用户录制系统界面上选择源音频文件,然后启动录制功能,从而触发录制指令,在检测到录制指令后,开始检测外部音频信号,其中,在检测到外部音频信号时,转向步骤304;在未检测到外部音频信号时,转向步骤305。
304、当检测到外部音频信号时,将与所述外部音频信号的录入时长对应的所述源音频文件的音频信息过滤,并将所述外部音频信号和所述录入时长对应的伴奏进行合并录制,得到第一音频信息;
305、当未检测到外部音频信号时,将未录入时长对应的所述源音频文件的音频信息和所述未录入时长对应的伴奏进行合并录制,得到第二音频信息;
306、当检测到所述源音频文件播放结束,按照所述源音频文件的播放顺序,将所述第一音频信息和第二音频信息进行合成得到音频文件。
在本发明实施例中,在检测到输入的对源音频文件的播放指令,然后进行音频文件的解析播放,之后检测到输入的针对该源音频文件的录制指令,开始检测外部音频信号,在检测到外部音频信号时,将该外部音频信号的录入时长对应的源音频文件的音频信息过滤,然后将外部音频信号与录入时长对应的源音频文件的伴奏合并录制得到第一音频信息,在未检测到外部音频信号时,将未录入时长对应的源音频文件的音频信息和伴奏进行合并录制得到第二音频信息,从而完成用户与原声的合唱录制,得到用户需要的录制作品。
其中,本发明实施例中在检测到外部音频信号时,确定所述外部音频信号的录入开始点和录入结束点,根据所述源音频文件的开始时间点和结束点,以及所述外部音频信号的录入结束点和录入开始点计算所述录入时长和未录入时长。
若在源音频文件的播放过程中,只检测到一次外部音频信号,那么录入时长是录入结束点与录入开始点之间的时长,但是具有两段未录入时长,分别为该录入时长对应的录入开始点与源音频文件的开始时间点之间的时长,另一段未录入时长为源音频文件的结束时间点与该录入时长的录入结束点之间的时长。
可以理解的是,在本发明实施例中,可以自由选择源音频文件中的任意部分进行录制,如在源音频文件中N次录制外部音频信号和伴奏,从而确定得到N个录入时长,相应地,具有N个所述外部音频信号的录入开始点录入结束点,且第n个所述录入开始点匹配第n个所述录入结束点,所述N为大于或等于1的正整数,所述n为小于或等于所述N的正整数。基于上述介绍,那么,未录入时长存在以下几种情况:
情况一、所述源音频文件的开始时间点与首个所述录入开始点之间的时长作为未录入时长;
情况二、第n+1个所述录入开始点与第n个所述录入结束点之间的时长作为未录入时长;
情况三、最后一个所述录入结束点与所述源音频文件的结束时间点之间的时长作为未录入时长。
举例来说,图4a为本发明实施例提供的录制方法的一种应用示意图,如图4a所示,源音频文件播放的开始时间点为0和结束时间点T,在T1时间检测到外部音频信号并开始录制外部音频信号,将录入开始点记为T1,将外部音频信号的录入结束点即为T2,计算0到T1之间的时间段作为未录入时长t1,将未录入时长t1对应的该源音频文件的音频信息和伴奏进行合并录制,计算T1~T2之间的时间段作为录入时长t2,然后将该录入时长t2对应的源音频文件的音频信息过滤,用外部音频信号和该录入时长t2对应的源音频文件的伴奏进行合并录制。而本发明实施例中还有另一个未录入时长为T2~T时间段,记为未录入时长t3,将未录入时长t3对应的该源音频文件的音频信息和伴奏进行合并录制。
图4b为本发明实施例提供的录制方法的另一种应用示意图,如图4b所示,本发明实施例中间隔检测到两次外部音频信号,分别在T4时间检测到外部音频信号,记录第一个录入时长的录入开始点T4,该录入时长的录入结束点为T5,在T6时再次检测到外部音频信号,记录第二个录入时长的录入开始点T6,第二录入时长的录入结束点为T7。计算0到T4之间的时长得到第一个未录入时长t4,计算T4到T5之间的时长得到第一个录入时长t5,计算T5到T6之间的时长得到第二个未录入时长t6,计算T6到T7之间的时长得到第二个录入时长t7,计算T7到T之间的时长得到第三个未录入时长t8,在t4中,t4对应的源音频文件的音频信息和伴奏合并录制,在t5中,是外部音频信号和t5对应的源音频文件的伴奏合并录制,在t6中,t6对应的源音频文件的音频信息和伴奏合并录制,在t7中,是外部音频信号和t7对应的源音频文件的伴奏合并录制,在t8中,t8对应的源音频文件的音频信息和伴奏合并录制。
如图5所示,本发明另一实施例提供的音频合成方法,可包括:
501、检测输入的针对源音频文件的录制指令,开始外部音频信号检测;
可以理解的是,在进行录制时,除了用户的声音,还可能存在外部环境中的其它声音,如动物声音、车辆声音等,而在本发明实施例中,目的是检测用户声音,而人声和其它声音的频率是不同的,其中,人声的频率范围为F,其中,2≤F≤200000HZ之间,因此,在本发明实施例中可以限定外部音频信号的频率为上述F。当然,也可以是F外的其它频率,例如可以录制动物的声音。
502、当所述外部音频信号的频率满足上述F时,关闭所述源音频文件的音频信息对应的声道,将外部音频信号和所述录入时长对应的所述源音频文件的伴奏合并录制,得到第一音频信息;
具体地,是将源音频文件的音频信息对应的声道关闭,只打开伴奏的声道,从而将外部音频信号和伴奏合并录制。
503、当未检测到外部音频信号,或者检测的外部音频信号的频率不满足上述F时,将未录入时长对应的所述源音频文件的音频信息和伴奏合并录制,得到第二音频信息;
在没有检测到外部音频信号,或者是检测到的外部音频信号的频率不在上述F内时,则确定为未检测到外部音频信号,则保持打开音频信息对应的声道和伴奏的声道,从而将未录入时长对应的所述源音频文件的音频信息和伴奏合并录制。
504、当检测到所述源音频文件的结束时间点时,按照所述源音频文件的播放顺序,将所述第一音频信息和第二音频信息进行合成得到音频文件。
在本发明实施例中,只有在检测到的外部音频信号频率满足上述F时,将源音频文件的音频信息对应的声道关闭,打开伴奏声道,从而将外部音频信号和录入时长对应的源音频文件的伴奏合并录制,在没有检测到外部音频信号,或者检测到的外部音频信号的频率不满足F时,将保留源音频文件的音频信息对应的声道和伴奏声道是打开的,将未录入时长对应的源音频文件的音频信息和伴奏合并录制。
如图6所示,以源音频文件为歌曲作为例子,一种音频合成方法可包括:
601、检测到用户输入的针对指定歌曲的录制指令,开始外部音频信号检测;
在录制歌曲的应用场景中,用户在智能歌曲合唱录制系统的界面中选择了录制歌曲,并启动了对该歌曲的录制功能,且可以由麦克风拾取外部声音。
602、当检测到外部音频信号,且所述外部音频信号的频率满足上述F时,将所述外部音频信号的录入时长对应的所述指定歌曲的原声声道关闭,将外部音频信号和所述录入时长对应的所述指定歌曲的伴奏合并录制,得到第一音频信息;
其中,对拾取到的外部音频信号的频率进行判断,若频率在F范围内,记录录入开始点,将歌曲原声声道关闭,歌曲原声消失,将外部音频信号和伴奏合并录制。
603、当未检测到外部音频信号,或者检测到的外部音频信号的频率不满足上述F时,将未录入时长对应的所述指定歌曲的原声和伴奏合并录制,得到第二音频信息;
在外部音频信号消失后,重新打开原声声道,将原声和伴奏合并录制。
604、当检测到所述指定歌曲的结束时间点时,按照所述指定歌曲的播放顺序,将所述第一音频信息和第二音频信息进行合成得到新的歌曲文件。
在本发明实施例中,在检测出外部音频信号的频率满足F时,将指定歌曲中的原声声道关闭,打开伴奏声道,从而将外部音频信号和录入时长对应的指定歌曲的伴奏合并录制,在未检测出外部音频信号或者外部音频信号的频率不满足F时,将打开源音频文件的原声声道和伴奏声道,将未录入时长对应的指定歌曲的原声和伴奏合并录制,从而录制属于用户自己的歌曲作品,满足用户需求。
本发明实施例还提供了一种音频合成方法对应的装置,如图7所示,包括:
指令检测模块710,检测输入的针对源音频文件的录制指令;
第一录制模块720,用于在响应所述录制指令之后,当检测到外部音频信号时,过滤所述源音频文件的音频信息,并录制所述外部音频信号得到第一音频信息;
第二录制模块730,用于在响应所述录制指令之后,获取所述源音频文件的音频信息得到第二音频信息;
音频合成模块740,用于检测到所述源音频文件播放结束,按照所述源音频文件的播放顺序,将所述第一音频信息和第二音频信息进行合成得到音频文件。
本发明实施例中的音频文件可以是歌曲、演讲、朗诵、相声、小品等,在此不作限定。
其中,指令检测模块710在检测到输入的针对源音频文件的录制指令后,响应该录制指令,并开始检测外部音频信号,在检测到外部音频信号时,第一录制模块720过滤源音频文件的音频信息,并录制外部音频信号得到第一音频信息,在没有检测到外部音频信号时,第二录制模块730获取源音频文件的音频信息,得到第二音频信息,音频合成模块740将第一录制模块720得到的第一音频信息和第二录制模块730得到的第二音频信息合成目标音频文件,满足用户实现与源音频文件的原创合演作品的愿望,且用户能够选择源音频文件中的任意部分来录制自己的声音,不受限于系统,灵活性较强,提高用户体验。
可以理解的是,源音频文件除包含音频信息外,其中还包含有伴奏,通过伴奏能够丰富、突显音频信息。
因而,上述第一录制模块720具体用于,当检测到外部音频信号时,将与所述外部音频信号的录入时长对应的所述源音频文件的音频信息过滤,并将所述外部音频信号和所述录入时长对应的伴奏进行合并录制,得到第一音频信息。
其中,将与所述外部音频信号的录入时长对应的所述源音频文件的音频信息过滤是指:在录入时长中,关闭源音频文件的音频信息对应的声道,只打开伴奏声道。
上述第二录制模块730具体用于,当未检测到外部音频信号时,将未录入时长对应的所述源音频文件的音频信息和所述未录入时长对应的伴奏进行合并录制,得到第二音频信息。
进一步地,上述检测模块710还用于检测输入的针对所述源音频文件的播放指令。同时,上述装置还包括解析模块,用于响应上述检测模块710检测到播放指令,解析及播放所述源音频文件并确定所述源音频文件的开始时间点和结束时间点。
如图8所述,上述装置进一步还包括:
确定模块810,用于当检测到外部音频信号时,确定所述外部音频信号的录入开始点和录入结束点;
计算模块820,用于当检测到外部音频信号时,用于确定所述外部音频信号的录入开始点和录入结束点,根据所述源音频文件的开始时间点和结束点,以及所述录入结束点和录入开始点计算所述录入时长和未录入时长。
进一步地,计算模块820具体用于,当确定有N个所述外部音频信号的录入时长,则相应确定N个所述外部音频信号的录入开始点录入结束点,且第n个所述录入开始点匹配第n个所述录入结束点,所述N为大于或等于1的正整数,所述n为小于或等于所述N的正整数,计算所述源音频文件的开始时间点与首个所述录入开始点之间的未录入时长;和/或,计算第n个所述录入结束点与第n+1个所述录入开始点之间的未录入时长;和/或,计算最后一个所述录入结束点与所述源音频文件的结束时间点之间的未录入时长。
如图9所示,上述装置还具体包括了音频检测模块910,用于检测外部环境的音频频率,当所述外部环境的音频频率满足F时,则确定检测到所述外部音频信号,其中,2≤F≤200000HZ。
在本发明实施例中,在进行录制时,除了用户的声音,还可能存在外部环境中的其它声音,如动物声音、车辆声音等,而在本发明实施例中,目的是检测用户声音,而人声和其它声音的频率是不同的,其中,人声的频率范围为F,其中,2≤F≤200000HZ之间,因此,在本发明实施例中可以限定外部音频信号的频率为上述F。当然,也可以是F外的其它频率,例如可以录制动物的声音。
本发明实施例中,在检测到输入的针对源音频文件的录制指令后,响应该录制指令,并开始检测外部音频信号,在检测到外部音频信号时,将外部音频信号录入时长对应的该源音频文件的音频信息过滤,而外部音频信号和录入时长对应的伴奏进行合并录制得到第一音频信息,而在没有检测到外部音频信号时,将未录入时长对应的源音频文件的音频信息和未录入时长对应的伴凑进行合并录制得到第二音频信息,当源音频文件结束时,按照所述源音频文件的播放顺序,将所述第一音频信息和第二音频信息进行合成得到目标音频文件,本发明实施例提供的音频合成方法中声音的录制方式灵活,不受限于系统,用户体验感,能够录制得到用户与原创合演的作品,或者录制用户个人作品。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本发明所提供的一种音频合成方法及装置进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。