CN109859729A - 对音频进行波形幅度控制方法及装置 - Google Patents

对音频进行波形幅度控制方法及装置 Download PDF

Info

Publication number
CN109859729A
CN109859729A CN201910055475.3A CN201910055475A CN109859729A CN 109859729 A CN109859729 A CN 109859729A CN 201910055475 A CN201910055475 A CN 201910055475A CN 109859729 A CN109859729 A CN 109859729A
Authority
CN
China
Prior art keywords
audio
accompaniment
loudness
dry sound
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910055475.3A
Other languages
English (en)
Other versions
CN109859729B (zh
Inventor
李好博
杨闯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sing Sing Technology Co Ltd
Original Assignee
Beijing Sing Sing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sing Sing Technology Co Ltd filed Critical Beijing Sing Sing Technology Co Ltd
Priority to CN201910055475.3A priority Critical patent/CN109859729B/zh
Publication of CN109859729A publication Critical patent/CN109859729A/zh
Application granted granted Critical
Publication of CN109859729B publication Critical patent/CN109859729B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

本申请公开了一种对音频进行波形幅度控制方法及装置,其中方法包括:确定干声音频的波形幅度信息;确定伴奏音频的伴奏响度信息;其中,所述伴奏响度信息中的响度随时间变化而变化;根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整,得到波形幅度随时间的变化正比于所述伴奏响度信息的调整后的干声音频。达到了能够通过伴奏的响度调整干声对应音频幅度的目的,从而实现了能够快速自动使干声与伴奏进行混音,同时能够有效保障干声与伴奏响度和谐的技术效果,进而解决了混音师通过手动调试波形幅度包络,反复叠加伴奏对比听才能够确认混音是否成功的技术问题。

Description

对音频进行波形幅度控制方法及装置
技术领域
本申请涉及通信领域,具体而言,涉及一种对音频进行波形幅度控制方法及装置。
背景技术
在唱歌录制过程中,会存在一些因素,影响录制演唱歌曲的质量,比如歌唱者在歌唱过程中声音由于改变自身与麦克风之间的距离、情绪变化导致声音时而慷慨激昂,时而脆弱无力等。这些都会降低演唱作品的可欣赏性,破坏干声与伴奏的和谐关系,乃至使人误解歌曲意义的表达。我们需要将这些问题改正,来保证演唱作品的质量。
现有技术为:专业音乐录制过程中,混音师会根据整首歌中干声的响度变化,以及伴奏随时间的变化来调整干声波形幅度包络的大小,来平衡干声在整首歌曲中的幅度变化,改善干声与伴奏的融合度。
现有技术存在以下述问题:
混音师通常会手动调试波形幅度包络,反复叠加伴奏对比听来确认混音是否成功,这样的工作量是很大的,并且此工作对于歌唱者,这种行为是不可能完成的。
针对相关技术中存在的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种快速进行伴奏叠加的对音频进行波形幅度控制方法及装置,以解决相关技术中存在的至少一个技术问题。
为了实现上述目的,根据本申请的一个方面,提供了一种对音频进行波形幅度控制方法。
根据本申请的对音频进行波形幅度控制方法包括:
确定干声音频的波形幅度信息;
确定伴奏音频的伴奏响度信息;其中,所述伴奏响度信息中的响度随时间变化而变化;
根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整,得到波形幅度随时间的变化正比于所述伴奏响度信息的调整后的干声音频。
进一步的,如前述的对音频进行波形幅度控制方法,所述根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整,包括:
将所述干声音频的每个时刻的波形幅度进行调整,使所述干声音频的每个时刻的波形幅度均在一目标范围内,得到稳定的干声音频;
根据所述伴奏响度信息对所述稳定的干声音频的整体波形幅度进行调整。
进一步的,如前述的对音频进行波形幅度控制方法,所述确定干声音频的波形幅度信息,包括:
确定所述干声音频的平均幅度信息;
确定所述干声音频的最大幅度信息;
确定所述干声音频的波形幅度包络随时间变化的包络信息。
进一步的,如前述的对音频进行波形幅度控制方法,所述将所述干声音频的每个时刻的波形幅度进行调整,使所述干声音频的每个时刻的波形幅度均在一目标范围内,得到稳定的干声音频,包括:
预先设置一个音频波形的幅值目标;其中,所述幅值目标为一常数;
将所述平均幅度信息、最大幅度及包络信息输入DRC算法,并根据所述幅值目标对所述干声音频的整体波形进行调整,使所述干声音频的每个时刻的波形幅度均在一目标范围内,得到所述稳定的干声音频。
进一步的,如前述的对音频进行波形幅度控制方法,所述确定伴奏音频的伴奏响度信息,包括:
确定用于计算所述伴奏音频的响度的音量计算因子;
通过所述音量计算因子计算得到所述伴奏音频中每帧伴奏音频的响度;其中,所述伴奏响度信息中的每个一帧伴奏音频都有对应的响度和时间,且各帧伴奏音频按时序排列;
对所述伴奏音频中每帧伴奏音频的响度进行平滑处理,得到所述伴奏响度信息。
进一步的,如前述的对音频进行波形幅度控制方法,所述根据所述伴奏响度信息对所述稳定的干声音频的整体波形幅度进行调整,包括:
将所述伴奏响度信息中的每帧伴奏音频响度均归一化到0至1之间的一范围A内,得到相应的调整信息;
根据每帧伴奏音频所对应的时间确定各个所述调整信息与时间的第一对应关系;
确定所述稳定的干声音频中每帧干声音频与时间的第二对应关系;
根据所述第一对应关系以及第二对应关系确定所述调整信息与每帧干声音频之间的第三对应关系;
按照所有所述调整信息以及第三对应关系对所述稳定的干声音频的整体波形幅度进行调整。
为了实现上述目的,根据本申请的另一方面,提供了一种对音频进行波形幅度控制装置。
根据本申请的对音频进行波形幅度控制装置包括:
干声幅值确定单元,用于确定干声音频的波形幅度信息;
伴奏响度确定单元,用于确定伴奏音频的伴奏响度信息;其中,所述伴奏响度信息中的响度随时间变化而变化;
调整单元,用于根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整,得到波形幅度随时间的变化正比于所述伴奏响度信息的调整后的干声音频。
进一步的,如前述的对音频进行波形幅度控制装置,所述调整单元包括:
干声稳定模块,用于将所述干声音频的每个时刻的波形幅度进行调整,使所述干声音频的每个时刻的波形幅度均在一目标范围内,得到稳定的干声音频;
干声调整模块,用于根据所述伴奏响度信息对所述稳定的干声音频的整体波形幅度进行调整。
进一步的,如前述的对音频进行波形幅度控制装置,所述伴奏响度确定单元包括:
音量计算因子确定模块,用于确定用于计算所述伴奏音频的响度的音量计算因子;
每帧响度计算模块,用于通过所述音量计算因子计算得到所述伴奏音频中每帧伴奏音频的响度;其中,所述伴奏响度信息中的每个一帧伴奏音频都有对应的响度和时间,且各帧伴奏音频按时序排列;
响度平滑处理模块,用于对所述伴奏音频中每帧伴奏音频的响度进行平滑处理,得到所述伴奏响度信息。
进一步的,如前述的对音频进行波形幅度控制装置,所述干声调整模块包括:
伴奏响度归一化子模块,用于将所述伴奏响度信息中的每帧伴奏音频响度均归一化到0至1之间的一范围A内,得到相应的调整信息;
第一对应子模块,用于根据每帧伴奏音频所对应的时间确定各个所述调整信息与时间的第一对应关系;
第二对应子模块,用于确定所述稳定的干声音频中每帧干声音频与时间的第二对应关系;
第三对应子模块,用于根据所述第一对应关系以及第二对应关系确定所述调整信息与每帧干声音频之间的第三对应关系;
调整子模块,用于按照所有所述调整信息以及第三对应关系对所述稳定的干声音频的整体波形幅度进行调整。
在本申请实施例中,采用对音频进行波形幅度控制方法及装置的方式,通过确定干声音频的波形幅度信息;确定伴奏音频的伴奏响度信息;其中,所述伴奏响度信息中的每个响度都有对应的一帧伴奏音频,每帧伴奏音频有对应的时间,且各帧伴奏音频按时序排列;根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整,得到波形幅度随时间的变化正比于所述伴奏响度信息的调整后的干声音频。达到了能够通过伴奏的响度调整干声对应音频幅度的目的,从而实现了能够快速自动使干声与伴奏进行混音,同时能够有效保障干声与伴奏响度和谐的技术效果,进而解决了混音师通过手动调试波形幅度包络,反复叠加伴奏对比听才能够确认混音是否成功的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请一种实施例的对音频进行波形幅度控制方法的流程示意图;以及
图2是根据本申请一种实施例的对音频进行波形幅度控制装置的功能模块结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。
此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据本申请的一个方面,提供了一种对音频进行波形幅度控制方法;如图1所示,该方法包括如下的步骤S1至步骤S3:
S1.确定干声音频的波形幅度信息;
具体的,计算并确定所述干声音频的波形幅度信息用于确定所述干声音频的波形幅度随时间的变化关系,因而能够在后续中对该干声音频进行准确的调整;
S2.确定伴奏音频的伴奏响度信息;其中,所述伴奏响度信息中的响度随时间变化而变化;
具体的,所述伴奏音频中的每个响度都有对应的一帧伴奏音频,每帧伴奏音频有对应的时间,且各帧伴奏音频按时序排列;因而响度也是随着时间而起伏变化的,并且可以得到一条响度随时间变化的第一曲线;
S3.根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整,得到波形幅度随时间的变化正比于所述伴奏响度信息的调整后的干声音频。
具体的,可以根据上述中响度随时间变化的第一曲线对所述干声音频进行调整,使得所述干声音频中响度随时间变化的第二曲线整体上与所述第一曲线对应,因此达到了能够通过伴奏的响度调整干声对应音频幅度的目的,从而实现了能够快速自动使干声与伴奏进行混音,同时能够有效保障干声与伴奏响度和谐的技术效果,进而解决了混音师通过手动调试波形幅度包络,反复叠加伴奏对比听才能够确认混音是否成功的技术问题。
在一些实施例中,如前述的对音频进行波形幅度控制方法,所述根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整,包括:
将所述干声音频的每个时刻的波形幅度进行调整,使所述干声音频的每个时刻的波形幅度均在一目标范围内,得到稳定的干声音频;
因为在唱歌录制过程中,会存在一些因素,影响录制演唱歌曲的质量,比如歌唱者在歌唱过程中声音由于改变自身与麦克风之间的距离、情绪变化导致声音时而慷慨激昂,时而脆弱无力等,因而同一个人在唱歌时也会出现波形幅度的起伏偏移,因而如果在此基础上通过所述伴奏响度信息对干声音频进行调整的话,则会出现响度变化太大,造成歌曲可欣赏性大大降低的情况;此外人与人之间的声音大小是存在差异性的,因此不同的人在唱歌时也会得到不一样干声音频的响度;而在生成相应的歌曲的时候,一般都会使人声达到一特定的响度,为了克服人与人的差异,因此要将所述干声音频的每个时刻的波形幅度调整至一目标范围内;使其能够达到在播放时有适当的响度。
根据所述伴奏响度信息对所述稳定的干声音频的整体波形幅度进行调整。
在一些实施例中,如前述的对音频进行波形幅度控制方法,所述确定干声音频的波形幅度信息,包括:
确定所述干声音频的平均幅度信息;
具体的,计算所述干声音频的平均幅度用于确定对应演唱者的平均演唱的响度信息;
确定所述干声音频的最大幅度信息;
具体的,计算所述干声音频的最大幅度信息于确定对应演唱者的最大演唱的响度信息;
确定所述干声音频的波形幅度包络随时间变化的包络信息。
通过确定所述平均幅度信息、最大幅度信息以及所述包络信息,可以判断得到该干声音频与幅值目标(即:目标范围)的差异;从而为之后进行响度调整提供基础信息。
在一些实施例中,如前述的对音频进行波形幅度控制方法,所述将所述干声音频的每个时刻的波形幅度进行调整,使所述干声音频的每个时刻的波形幅度均在一目标范围内,得到稳定的干声音频,包括:
预先设置一个音频波形的幅值目标;其中,所述幅值目标为一常数;具体的,所述幅值目标可以是通过统计或行业默认的一首歌曲中干声的最佳的平均幅值;
将所述平均幅度信息、最大幅度及包络信息输入DRC算法,并根据所述幅值目标对所述干声音频的整体波形进行调整,使所述干声音频的每个时刻的波形幅度均在一目标范围内,得到所述稳定的干声音频。具体的,所述目标范围可以是包括所述幅值目标的一个幅值区间。
也就是说,随后通过DRC算法进行动态的调整使得所有干声音频波形的幅值都向这个幅值目标去靠。达到的效果是大于这个幅值的波形被缩小,小于这个幅值的波形被放大,使得声音维持一个相对比较一致的音量(即:在目标范围内)。
在一些实施例中,如前述的对音频进行波形幅度控制方法,所述确定伴奏音频的伴奏响度信息,包括:
确定用于计算所述伴奏音频的响度的音量计算因子;具体的,所述音量计算因子可以是均方值或者更复杂的响度算法;具体实际所采用的算法可以根据具体的使用情况进行选择;
通过所述音量计算因子计算得到所述伴奏音频中每帧伴奏音频的响度;其中,所述伴奏响度信息中的每个一帧伴奏音频都有对应的响度和时间,且各帧伴奏音频按时序排列;具体的,每帧伴奏音频的时长可以根据具体情况进行选择,但无论如何进行时长的选择,各帧伴奏音频总能构成时序上不间断的所述伴奏音频,优选的,时长越短,越能够准确得到对应的伴奏音频的响度曲线,因此,在本实施例中为毫秒级的短帧;
对所述伴奏音频中每帧伴奏音频的响度进行平滑处理,得到所述伴奏响度信息;
具体的,由于已经得到相应的每帧音频的响度,且由于各帧伴奏音频总构成时序上不间断的所述伴奏音频;因此可以通过波形平滑处理的方法对各帧伴奏音频的响度进行处理,进而得到随时间变化且平滑的所述伴奏响度信息。
在一些实施例中,如前述的对音频进行波形幅度控制方法,所述根据所述伴奏响度信息对所述稳定的干声音频的整体波形幅度进行调整,包括:
将所述伴奏响度信息中的每帧伴奏音频响度均归一化到0至1之间的一范围A内,得到相应的调整信息;
具体的,由于伴奏音频的响度波动范围可能会出现由极轻到极大之间的变化,而干声音频的响度的波动范围一般是大大小于伴奏音频的,因此,若完全按照伴奏音频的响度波动曲线对干声音频进行调节,虽然能够获得干声音频的波形幅度随伴奏音频的波形幅度同步变化的效果,但是干声音频的响度会出现太轻或爆音等情况,很大程度会影响可听度;因此,需要将所述伴奏音频的响度波动进行缩小,也就是说,若所述伴奏音频的原始的波动范围为0至100的大的变化幅度,则将其适应性降低为0至10或0至1的变化幅度,因此,整体的响度起伏是原伴奏音频保持一致的,只是起伏的幅度相应缩小;因此本实施例中将所述伴奏响度信息中的每帧伴奏音频响度均归一化到0至1之间的一范围A(优选为0.7至1)内,得到相应的调整信息;因此在通过此调整信息对干声音频进行调整时,可以使干声音频的响度的变化较为平缓,与正常情况下听众的需求更加适配,可听度更高;
根据每帧伴奏音频所对应的时间确定各个所述调整信息与时间的第一对应关系;
确定所述稳定的干声音频中每帧干声音频与时间的第二对应关系;
根据所述第一对应关系以及第二对应关系确定所述调整信息与每帧干声音频之间的第三对应关系;
因此,通过上述方法可以准确地将调整信息与所述干声音频进行对应;因而可以逐帧地对干声音频进行调整;
按照所有所述调整信息以及第三对应关系对所述稳定的干声音频的整体波形幅度进行调整。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明实施例,还提供了一种用于实施上述对音频进行波形幅度控制方法的对音频进行波形幅度控制装置,如图2所示,该装置包括:为了实现上述目的,根据本申请的另一方面,提供了一种对音频进行波形幅度控制装置。
根据本申请的对音频进行波形幅度控制装置包括:
干声幅值确定单元1,用于确定干声音频的波形幅度信息;
伴奏响度确定单元2,用于确定伴奏音频的伴奏响度信息;其中,所述伴奏响度信息中的响度随时间变化而变化;
调整单元3,用于根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整,得到波形幅度随时间的变化正比于所述伴奏响度信息的调整后的干声音频。
具体的,本发明实施例的装置中各模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。
在一些实施例中,如前述的对音频进行波形幅度控制装置,所述调整单元包括:
干声稳定模块,用于将所述干声音频的每个时刻的波形幅度进行调整,使所述干声音频的每个时刻的波形幅度均在一目标范围内,得到稳定的干声音频;
干声调整模块,用于根据所述伴奏响度信息对所述稳定的干声音频的整体波形幅度进行调整。
具体的,本发明实施例的装置中各模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。
在一些实施例中,如前述的对音频进行波形幅度控制装置,所述伴奏响度确定单元包括:
音量计算因子确定模块,用于确定用于计算所述伴奏音频的响度的音量计算因子;
每帧响度计算模块,用于通过所述音量计算因子计算得到所述伴奏音频中每帧伴奏音频的响度;其中,所述伴奏响度信息中的每个一帧伴奏音频都有对应的响度和时间,且各帧伴奏音频按时序排列;
响度平滑处理模块,用于对所述伴奏音频中每帧伴奏音频的响度进行平滑处理,得到所述伴奏响度信息。
具体的,本发明实施例的装置中各模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。
在一些实施例中,如前述的对音频进行波形幅度控制装置,所述干声调整模块包括:
伴奏响度归一化子模块,用于将所述伴奏响度信息中的每帧伴奏音频响度均归一化到0至1之间的一范围A内,得到相应的调整信息;
第一对应子模块,用于根据每帧伴奏音频所对应的时间确定各个所述调整信息与时间的第一对应关系;
第二对应子模块,用于确定所述稳定的干声音频中每帧干声音频与时间的第二对应关系;
第三对应子模块,用于根据所述第一对应关系以及第二对应关系确定所述调整信息与每帧干声音频之间的第三对应关系;
调整子模块,用于按照所有所述调整信息以及第三对应关系对所述稳定的干声音频的整体波形幅度进行调整。
具体的,本发明实施例的装置中各模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种对音频进行波形幅度控制方法,其特征在于,包括:
确定干声音频的波形幅度信息;
确定伴奏音频的伴奏响度信息;其中,所述伴奏响度信息中的响度随时间变化而变化;
根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整,得到波形幅度随时间的变化正比于所述伴奏响度信息的调整后的干声音频。
2.根据权利要求1所述的对音频进行波形幅度控制方法,其特征在于,所述根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整,包括:
将所述干声音频的每个时刻的波形幅度进行调整,使所述干声音频的每个时刻的波形幅度均在一目标范围内,得到稳定的干声音频;
根据所述伴奏响度信息对所述稳定的干声音频的整体波形幅度进行调整。
3.根据权利要求2所述的对音频进行波形幅度控制方法,其特征在于,所述确定干声音频的波形幅度信息,包括:
确定所述干声音频的平均幅度信息;
确定所述干声音频的最大幅度信息;
确定所述干声音频的波形幅度包络随时间变化的包络信息。
4.根据权利要求3所述的对音频进行波形幅度控制方法,其特征在于,所述将所述干声音频的每个时刻的波形幅度进行调整,使所述干声音频的每个时刻的波形幅度均在一目标范围内,得到稳定的干声音频,包括:
预先设置一个音频波形的幅值目标;其中,所述幅值目标为一常数;
将所述平均幅度信息、最大幅度及包络信息输入DRC算法,并根据所述幅值目标对所述干声音频的整体波形进行调整,使所述干声音频的每个时刻波形幅度均在一目标范围内,得到所述稳定的干声音频。
5.根据权利要求2所述的对音频进行波形幅度控制方法,其特征在于,所述确定伴奏音频的伴奏响度信息,包括:
确定用于计算所述伴奏音频的响度的音量计算因子;
通过所述音量计算因子计算得到所述伴奏音频中每帧伴奏音频的响度;其中,所述伴奏响度信息中的每个一帧伴奏音频都有对应的响度和时间,且各帧伴奏音频按时序排列;
对所述伴奏音频中每帧伴奏音频的响度进行平滑处理,得到所述伴奏响度信息。
6.根据权利要求5所述的对音频进行波形幅度控制方法,其特征在于,所述根据所述伴奏响度信息对所述稳定的干声音频的整体波形幅度进行调整,包括:
将所述伴奏响度信息中的每帧伴奏音频响度均归一化到0至1之间的一范围A内,得到相应的调整信息;
根据每帧伴奏音频所对应的时间确定各个所述调整信息与时间的第一对应关系;
确定所述稳定的干声音频中每帧干声音频与时间的第二对应关系;
根据所述第一对应关系以及第二对应关系确定所述调整信息与每帧干声音频之间的第三对应关系;
按照所有所述调整信息以及第三对应关系对所述稳定的干声音频的整体波形幅度进行调整。
7.一种对音频进行波形幅度控制装置,其特征在于,包括:
干声幅值确定单元,用于确定干声音频的波形幅度信息;
伴奏响度确定单元,用于确定伴奏音频的伴奏响度信息;其中,所述伴奏响度信息中的响度随时间变化而变化;
调整单元,用于根据所述伴奏响度信息对所述干声音频中的波形幅度进行调整,得到波形幅度随时间的变化正比于所述伴奏响度信息的调整后的干声音频。
8.根据权利要求7所述的对音频进行波形幅度控制装置,其特征在于,所述调整单元包括:
干声稳定模块,用于将所述干声音频的每个时刻的波形幅度进行调整,使所述干声音频的每个时刻的波形幅度均在一目标范围内,得到稳定的干声音频;
干声调整模块,用于根据所述伴奏响度信息对所述稳定的干声音频的整体波形幅度进行调整。
9.根据权利要求8所述的对音频进行波形幅度控制装置,其特征在于,所述伴奏响度确定单元包括:
音量计算因子确定模块,用于确定用于计算所述伴奏音频的响度的音量计算因子;
每帧响度计算模块,用于通过所述音量计算因子计算得到所述伴奏音频中每帧伴奏音频的响度;其中,所述伴奏响度信息中的每个一帧伴奏音频都有对应的响度和时间,且各帧伴奏音频按时序排列;
响度平滑处理模块,用于对所述伴奏音频中每帧伴奏音频的响度进行平滑处理,得到所述伴奏响度信息。
10.根据权利要求9所述的对音频进行波形幅度控制装置,其特征在于,所述干声调整模块包括:
伴奏响度归一化子模块,用于将所述伴奏响度信息中的每帧伴奏音频响度均归一化到0至1之间的一范围A内,得到相应的调整信息;
第一对应子模块,用于根据每帧伴奏音频所对应的时间确定各个所述调整信息与时间的第一对应关系;
第二对应子模块,用于确定所述稳定的干声音频中每帧干声音频与时间的第二对应关系;
第三对应子模块,用于根据所述第一对应关系以及第二对应关系确定所述调整信息与每帧干声音频之间的第三对应关系;
调整子模块,用于按照所有所述调整信息以及第三对应关系对所述稳定的干声音频的整体波形幅度进行调整。
CN201910055475.3A 2019-01-21 2019-01-21 对音频进行波形幅度控制方法及装置 Active CN109859729B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910055475.3A CN109859729B (zh) 2019-01-21 2019-01-21 对音频进行波形幅度控制方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910055475.3A CN109859729B (zh) 2019-01-21 2019-01-21 对音频进行波形幅度控制方法及装置

Publications (2)

Publication Number Publication Date
CN109859729A true CN109859729A (zh) 2019-06-07
CN109859729B CN109859729B (zh) 2021-03-05

Family

ID=66895473

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910055475.3A Active CN109859729B (zh) 2019-01-21 2019-01-21 对音频进行波形幅度控制方法及装置

Country Status (1)

Country Link
CN (1) CN109859729B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110688082A (zh) * 2019-10-10 2020-01-14 腾讯音乐娱乐科技(深圳)有限公司 确定音量的调节比例信息的方法、装置、设备及存储介质
CN111048063A (zh) * 2019-12-13 2020-04-21 集奥聚合(北京)人工智能科技有限公司 音频合成方法及装置
CN111491176A (zh) * 2020-04-27 2020-08-04 百度在线网络技术(北京)有限公司 一种视频处理方法、装置、设备及存储介质
CN112908302A (zh) * 2021-01-26 2021-06-04 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、装置、设备及可读存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04298793A (ja) * 1991-01-08 1992-10-22 Brother Ind Ltd 自動演奏切替え機能付き音楽再生装置
CN1549243A (zh) * 2003-05-20 2004-11-24 联发科技股份有限公司 音乐文件的波形调节系统
CN1953048A (zh) * 2005-10-18 2007-04-25 腾讯科技(深圳)有限公司 一种混音的处理方法
CN101267222A (zh) * 2007-03-13 2008-09-17 智多微电子(上海)有限公司 移动设备混音装置中控制多路声音信号音量调整的装置
WO2010110586A2 (ko) * 2009-03-23 2010-09-30 Hwang Jay-Yeob 변주 가능한 뮤직레코드 및 플레이어와 그 방법
CN103559876A (zh) * 2013-11-07 2014-02-05 安徽科大讯飞信息科技股份有限公司 音效处理方法及系统
CN106132040A (zh) * 2016-06-20 2016-11-16 科大讯飞股份有限公司 歌唱环境的灯光控制方法和装置
CN106210943A (zh) * 2016-07-25 2016-12-07 北京塞宾科技有限公司 一种无线k歌话筒
CN106558314A (zh) * 2015-09-29 2017-04-05 广州酷狗计算机科技有限公司 一种混音处理方法和装置及设备
CN107680571A (zh) * 2017-10-19 2018-02-09 百度在线网络技术(北京)有限公司 一种歌曲伴奏方法、装置、设备和介质
CN107705778A (zh) * 2017-08-23 2018-02-16 腾讯音乐娱乐(深圳)有限公司 音频处理方法、装置、存储介质以及终端

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04298793A (ja) * 1991-01-08 1992-10-22 Brother Ind Ltd 自動演奏切替え機能付き音楽再生装置
CN1549243A (zh) * 2003-05-20 2004-11-24 联发科技股份有限公司 音乐文件的波形调节系统
CN1953048A (zh) * 2005-10-18 2007-04-25 腾讯科技(深圳)有限公司 一种混音的处理方法
CN101267222A (zh) * 2007-03-13 2008-09-17 智多微电子(上海)有限公司 移动设备混音装置中控制多路声音信号音量调整的装置
WO2010110586A2 (ko) * 2009-03-23 2010-09-30 Hwang Jay-Yeob 변주 가능한 뮤직레코드 및 플레이어와 그 방법
CN103559876A (zh) * 2013-11-07 2014-02-05 安徽科大讯飞信息科技股份有限公司 音效处理方法及系统
CN106558314A (zh) * 2015-09-29 2017-04-05 广州酷狗计算机科技有限公司 一种混音处理方法和装置及设备
CN106132040A (zh) * 2016-06-20 2016-11-16 科大讯飞股份有限公司 歌唱环境的灯光控制方法和装置
CN106210943A (zh) * 2016-07-25 2016-12-07 北京塞宾科技有限公司 一种无线k歌话筒
CN107705778A (zh) * 2017-08-23 2018-02-16 腾讯音乐娱乐(深圳)有限公司 音频处理方法、装置、存储介质以及终端
CN107680571A (zh) * 2017-10-19 2018-02-09 百度在线网络技术(北京)有限公司 一种歌曲伴奏方法、装置、设备和介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蔡聂奎: "《多媒体计算机的数字音频处理技术研究》", 《多媒体应用技术》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110688082A (zh) * 2019-10-10 2020-01-14 腾讯音乐娱乐科技(深圳)有限公司 确定音量的调节比例信息的方法、装置、设备及存储介质
CN110688082B (zh) * 2019-10-10 2021-08-03 腾讯音乐娱乐科技(深圳)有限公司 确定音量的调节比例信息的方法、装置、设备及存储介质
CN111048063A (zh) * 2019-12-13 2020-04-21 集奥聚合(北京)人工智能科技有限公司 音频合成方法及装置
CN111491176A (zh) * 2020-04-27 2020-08-04 百度在线网络技术(北京)有限公司 一种视频处理方法、装置、设备及存储介质
CN112908302A (zh) * 2021-01-26 2021-06-04 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、装置、设备及可读存储介质
CN112908302B (zh) * 2021-01-26 2024-03-15 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN109859729B (zh) 2021-03-05

Similar Documents

Publication Publication Date Title
CN109859729A (zh) 对音频进行波形幅度控制方法及装置
US10957297B2 (en) Self-produced music apparatus and method
CN111326132B (zh) 音频处理方法、装置、存储介质及电子设备
JP4810541B2 (ja) 自然でない反響
Ternström et al. Intonation precision of choir singers
Cuesta et al. Analysis of intonation in unison choir singing
CN101667422B (zh) 一种调节歌曲伴奏的调式的方法及装置
MX2011012749A (es) Sistema y metodo para recibir, analizar y editar audio para crear composiciones musicales.
CN107682642A (zh) 识别视频特效触发时间点的方法、装置和终端设备
Ueno et al. Experimental study on the evaluation of stage acoustics by musicians using a 6-channel sound simulation system
CN109741723A (zh) 一种卡拉ok音效优化方法及卡拉ok装置
CN106686493A (zh) 自动调整音质的方法和系统
CN108172232A (zh) 音频修正方法及装置
CN109410971B (zh) 一种美化声音的方法和装置
CN113077771B (zh) 异步合唱混音方法及装置、存储介质和电子设备
WO1999031937A1 (en) Automatic system for optimizing hearing aid adjustments
EP1168296B1 (en) Waveform signal generation method with pseudo low tone synthesis
CN112927713B (zh) 音频特征点的检测方法、装置和计算机存储介质
KR20160056104A (ko) 사용자 음색 분석 장치 및 음색 분석 방법
CN112017622B (zh) 一种音频数据的对齐方法、装置、设备和存储介质
US7016814B2 (en) Method and device for determining the quality of a signal
CN106448710B (zh) 一种音乐播放参数的校准方法及音乐播放设备
Prodi et al. A scale value for the balance inside a historical opera house
Hermes Towards Measuring Music Mix Quality: the factors contributing to the spectral clarity of single sounds
JPH11237890A (ja) 歌唱採点機能付きカラオケ装置における歌唱採点方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant