CN102044249A - 一种适用于文件播出系统的音频响度一致性控制方法 - Google Patents

一种适用于文件播出系统的音频响度一致性控制方法 Download PDF

Info

Publication number
CN102044249A
CN102044249A CN2010105822269A CN201010582226A CN102044249A CN 102044249 A CN102044249 A CN 102044249A CN 2010105822269 A CN2010105822269 A CN 2010105822269A CN 201010582226 A CN201010582226 A CN 201010582226A CN 102044249 A CN102044249 A CN 102044249A
Authority
CN
China
Prior art keywords
loudness
value
file
volume
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010105822269A
Other languages
English (en)
Other versions
CN102044249B (zh
Inventor
姚威
骆新
李岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dayang Technology Development Inc
Original Assignee
Beijing Dayang Technology Development Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dayang Technology Development Inc filed Critical Beijing Dayang Technology Development Inc
Priority to CN2010105822269A priority Critical patent/CN102044249B/zh
Publication of CN102044249A publication Critical patent/CN102044249A/zh
Application granted granted Critical
Publication of CN102044249B publication Critical patent/CN102044249B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及一种适用于文件播出系统的音频响度一致性控制方法,该方法将在播出前对待播出节目文件中的音频进行扫描分析,获取待播文件的响度特征,根据响度控制目标确定响度调整值。具体包括对待播音频文件从头至尾以一定的窗口宽度进行划分,提取所有窗口的平均响度值和该音频文件的最大峰值电平以及总体平均响度;将大于总体平均响度值并出现次数最多的响度值作为响度特征值;导入响度调整目标值、并确定响度调整值;将响度调整值与原始音频的每个采样点的电平值相加,得到的结果为最终的调整音频。本发明对现有技术的贡献是:响度一致性的控制效果好;不会改变节目动态范围,对原有的艺术效果没有破坏;既保证了响度控制的质量,又解决了重新生成文件所带来的低效问题。

Description

一种适用于文件播出系统的音频响度一致性控制方法
技术领域
本发明涉及一种适用于文件播出系统的音频响度一致性控制方法,该方法将对播出文件中的响度控制信息与素材文件分离开,既保证了响度控制的质量,又解决了重新生成文件所带来的低效问题,而且素材的内容没有进行过二次处理,保证了素材的原始效果。 
背景技术
目前播出系统中,由于音频校准电平不统一、动态处理不当等各种原因,存在不同电视台之间、不同频道之间,甚至是同一频道不同的节目之间、节目与广告之间声音响度不同的问题,导致观众在收看电视节目过程中,在切换频道或者节目、广告切换过程中需要不断调整电视机输出音量的不便。要想做到不同的节目之间都能让观众得到一个满意的相对声音响度,需要解决测量与调整两方面的问题。有的电视台对提交的节目提出了一些音频的参数指标,希望能够得到响度一致的节目,但是由于这些指标并不能真正反映音频的真实响度,因此控制效果并不理想;有一些设备厂商有自己的响度解决方案,这样能够比较好地对不同节目进行响度控制,但是受限于的特殊的音频格式,以及在传输过程中需要携带特殊的元数据信息,因此并不能适应所有情况。再加上电视台节目的来源比较广泛,有自产的,也有外购、收录的,情况比较复杂,要求送到播出部门的待播节目的响度一致是非常困难的。
如何能够达到响度一致是目前各家电视台都非常关心的问题,现有的解决方法主要包括响度的整体调整和实时调整;前者按照不同音频的平均响度进行整体调整,调整后不同音频的平均响度均与目标响度保持一致;后者对音频作部分调整,对音频中响度小的部分进行提升,响度大的部分进行衰减。但这两种方式都有各自优缺点:整体调整可保持节目的动态范围,但该调整把平均响度作为描述音频的唯一信息,对不同类型的节目作统一处理可能导致调整后不同节目听起来声音并不相同;实时调整可以使节目内(节目间)响度趋于一致,但会破坏音频的动态范围,音频声音效果将大打折扣。 
发明内容
本发明的目的是提出一种适用于文件播出系统的音频响度一致性控制方法,该方法对不同类型音频引入动态指标,将响度控制信息与源素材文件分离开,既保证了响度控制的质量,又解决了重新生成文件所带来的低效问题,而且源素材的内容没有进行过二次处理,保证了素材的原始效果。
为了实现上述目的,本发明的技术方案是,一种适用于文件播出系统的音频响度一致性控制方法,在素材文件中分离出在播出前对待播出节目文件中的音频数据进行扫描分析,获取待播出节目文件的响度特征,根据响度控制目标确定响度调整值,将带有响度调整值的响度控制信息连同待播出节目文件一同送入播出服务器,在播出服务器中作最终的响度调整并播出,对响度文件调整值的分析提取使用了ITU-BS.1770标准中的响度计算,控制方法步骤包括:
a.提取待播出文件中的音频数据,对音频数据从头至尾以50至1000毫秒的窗口宽度进行划分,提取所有窗口的平均响度值和该音频文件的最大峰值电平; 
b.将大于平均响度值、并出现次数最多的响度值作为响度特征值;
c.导入响度调整目标值并确定响度调整值;
d.将响度调整值与原始音频的每个采样点的电平值相加,得到的结果为最终的调整音频。
所述窗口宽度最佳是200毫秒。
所述窗口相互交叠,交叠的宽度是1/10窗口宽度至1/2窗口宽度。
所述交叠的宽度最佳是1/4窗口宽度。
所述确定响度调整值的步骤是:首先由响度调整目标值减去响度特征值后得到一个响度调整初始值L’adj;再通过计算方法Ladj=min(L’adj, - Vpeak)确定响度调整值,其中Vpeak是该待播文件最大响度峰值电平。
本发明对现有技术的贡献是:响度一致性的控制效果好;不会改变节目动态范围,对原有的艺术效果没有破坏;对播出设备的改造要求小;对播出设备的调节能力要求低。
下面结合实施例和附图对本发明做一详细描述。
附图说明
图1为播出系统流程框图;
图2为本发明控制方法流程图;
图3为多声道响度算法方框图;
图4为头部声学效应的前置滤波器响应图;
图5为二阶滤波器的信号流程图;
图6为 RLB加权曲线图;
图7为实时响度曲线和计算示意图。
具体实施方式
一种适用于文件播出系统的音频响度一致性控制方法实施例,参见图1至图7;如图1所示,该方法是在一个播出系统中实现,其播出系统包括响度控制服务器1,近线存储2和播出服务器3,响度控制服务器从近线存储中的素材文件中分离出音频数据进行扫描分析,获取待播文件的响度特征,根据响度控制目标确定响度调整值,将带有响度调整值的响度文件送回到近线服务器,连同源素材文件一同送入播出服务器,在播出服务器中作最终的响度调整并播出,对响度调整值的分析提取中利用ITU-BS.1770标准中的响度计算方法,对待播出文件中的音频信息以响度特征值为核心进行调整,如图2所示,所述控制方法步骤包括:
a.提取待播出节目文件中的音频数据,对音频数据进行响度扫描分析,即对音频文件从头至尾以50至1000毫秒的窗口宽度进行划分,提取所有窗口的平均响度值和该音频文件的最大峰值电平;其中,所述窗口宽度最佳是200毫秒;   
b.确定响度特征值,即将大于平均响度值、并出现次数最多的响度值作为响度特征值;
c.导入响度调整目标值并确定响度调整值;
d.确定最终调整音频;即将响度调整值与原始音频的每个采样点的电平值相加,得到的结果为最终的调整音频。
为了提高分析的准确性,所述窗口相互交叠,交叠的宽度是1/10窗口宽度至1/2窗口宽度;交叠的宽度最佳是1/4窗口宽度。
其中,所述确定响度调整值的步骤是:首先由响度调整目标值减去响度特征值后得到一个响度调整初始值L’adj;在通过计算方法Ladj=min(L’adj, - Vpeak)确定响度调整值,其中Vpeak是待播出节目文件最大响度峰值电平。
下面对上述方案进行具体的描述:
本实施例使用的音频节目响度计算方法,采用的是ITU-R BS.1770-1 建议书中所阐释的方法。该方法规定了多声道响度测量算法,图3所示的是该算法各个组成部件的方框图;方框图显示了五个主要通道的输入,左边XL、中间XC、右边XR、左边环绕XLS和右边环绕XRS,分别经过前置滤波器、RLB滤波器,从RLB滤波器输出YL、YC、YR、YLS、YRS、到均方,从均方输出ZL、ZC、ZR、ZLS、ZRS到GL、GC、GR、GLS、GRS汇总到∑输出,这样允许监听包含一至五个通道的节目。对于少于五个通道的节目,一些输入将不会使用。该测量法中不包括低频效应(LFE)通道。
算法的第一步是在Leq(RLB)测量之前,对信号进行前置滤波,图4 示了前置滤波用于说明头部的声学效应,这里把头部模拟为一个固定的球体。
前置滤波器定义为如图5 所示的滤波器,滤波器系数见表1。
Figure 2010105822269100002DEST_PATH_IMAGE001
表1 模拟球形头部的前置滤波器的滤波器系数
算法的第二步是应用RLB 加权曲线,该曲线由如图6所示的一个简单的高通滤波器组成。
RLB 加权曲线定义为如图5所示的一个2 阶滤波器,其系数见表2。
Figure 326268DEST_PATH_IMAGE002
 
表2  RLB 加权曲线的滤波器系数
随着前置滤波器和RLB 滤波的应用,于是测量间隔T 内的均方能量计量如下:
Figure 534527DEST_PATH_IMAGE004
其中,yi是经过模拟头部效应的前置滤波器和RLB 加权曲线滤波以后的输入信号。(i = L,R,C,Ls,Rs,N,这里N 为通道的数量)。
一旦计算出每一个通道的加权均方电平Zi,最后一步就是求N个通道的和,如下所示响度计算公式:
在该算法中使用的频率加权,是前置滤波器和RLB 加权的级联,并定名为“K”加权。上面计算的响度值的数值结果之后应有“LKFS”标志,表示“K 加权的相对满刻度的响度”。该LKFS 单位等于一个分贝,其中信号电平每增加1 dB,将导致响度数值增加1LKFS。
表3 给出了不同通道的加权系数。
 
表3  各个音频通道的加权
响度随时间分布值
Figure DEST_PATH_IMAGE007
的计算方法
如果将ITU-BS.1770-1建议书中的响度算法记为:LoudnessCalc(W)。其中W是图7所示为待计算响度的音频片段的窗口长度。
当W为音频节目的长度时,计算结果即为该节目的总体平均响度值,记为:Lavg;是图中Lreal(0)、Lreal(1)、Lreal(2)。。。。Lreal(n)的平均值。
对音频文件从头至尾以宽度为W的窗口进行局部的响度扫描计算,连续两次计算交叠大小为O。每次计算可以得到一个局部的响度平均值:
Lreal(t)= LoudnessCalc (t,w,o)   t∈[1,N]  
其中N为音频按照计算窗口宽度W进行的分段数量。W的取值范围为50到1000毫秒,考虑人耳对声音的分辨率和计算精度的要求,W取值最佳是200毫秒。O的取值通常为W/10到W/2,本实施例建议采用W/4。
Lreal(t)形成的集合即为如图7所示构成该音频文件的实时响度曲线计算值。
响度特征值Leigen的计算方法
响度特征值是能体现人对音频节目响度最敏感响度的值。本实施例对该值的选取思想是,大于总体平均响度的、并出现次数最多的响度值作为响度特征值。通过以下步骤可以获得该值:
1)      对获得的实时响度数据集合Lreal(t),按照1LKFS的分辨率,在-80LKFS到10LKFS范围内进行响度值分布情况统计,得到每个响度值出现的数量S(L)。
2)      如果W为窗口宽度(通常选取W为6LKFS),则以某响度L为中心的响度分布情况F(L)为:
取F(L,W)的最大值Fmax=max(F(L,W)),将它对应的响度值称为最集中响度Lmost
综合考虑人耳对高响度的敏感性和减少大段静音对最集中响度的影响,我们对高于平均响度的响度值进行统计Fmax,其对应的最集中响度Lmost即作为该文件的响度特征值Leigen
响度调整值
Figure 109045DEST_PATH_IMAGE010
的计算方法
在实际的播出工作中,每个电视台会根据本台节目声音特点,设定一个各频道、各类节目统一的响度标准值。结合本方法的使用,如果各个频道的不同节目都使用同一个响度标准值作为调整目标,进行响度一致性控制,那么观众收看这个电视台的不同节目时将会感受到大致相同的音量,也就达到了想读一执行控制的目的。因此,我们使用电视台事先确定的响度标准值来作为响度调整目标,该响度调整目标一般事先通过计算机软件设置在响度控制服务器中。如果设定的响度调整目标为Ltarg,则初始响度调整值L’adj为:L’adj=Ltarg-Leigen
数字音频的最小访问单位为采样点,理论最大电平值为0dBFs。如果音频文件中采样点的最大峰值电平为Vpeak(单位dBFs),那么在不失真情况下能够进行的最大增益调整量(峰值储备)为Vmadj ,则有:
Vmadj =0-Vpeak=- Vpeak
因此,考虑峰值储备对响度调整的限制,那么最终的响度调整值Ladj
Ladj=min(L’adj,Vmadj)
响度调整值
Figure 189128DEST_PATH_IMAGE010
作用于音频节目的方法
响度控制服务器在确定一个待播出节目文件的响度调整值Ladj后,通常生成一个与该待播出节目文件对应的响度控制文件存放这个调整值;并将这个响度控制文件送回到近线服务器,最终这个响度控制文件连同待播出节目文件一同送入播出服务器,在播出服务器中作最终的响度调整并播出。播出服务器在播出过程中,对播出音频的调整方式如下:
Figure DEST_PATH_IMAGE011
与待播出节目文件原始音频的每个采样点Samplesrc的电平值相加,得到的结果Sampletag为最终的调整音频,是响度控制的结果:
Sampletag(s) =Samplesrc(s)+Ladj     s∈[1,N] 
其中N为采样点数量。
播出服务器输出的音频就是最终的调整音频。
最后应说明的是,以上仅用以说明本发明的技术方案而非限制,尽管参照较佳布置方案对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案(比如响度控制信息传入播出服务器的方法等)进行修改或者等同替换,而不脱离本发明技术方案的精神和范围。

Claims (5)

1.一种适用于文件播出系统的音频响度一致性控制方法:在播出前对待播出节目文件中的音频数据进行扫描分析,获取待播出节目文件的响度特征,根据响度控制目标确定响度调整值,对响度调整值的分析提取使用了ITU-BS.1770标准中的响度计算,其特征在于,将带有响度调整值的响度控制信息连同待播出节目文件一同送入播出服务器,在播出服务器中作最终的响度调整并播出,所述控制方法步骤包括:
a.提取待播出文件中的音频数据,对音频数据从头至尾以50至1000毫秒的窗口宽度进行划分,提取所有窗口的平均响度值和该音频文件的最大峰值电平和整体平均响度; 
b.将大于整体平均响度值、并出现次数最多的响度值作为响度特征值;
c.导入响度调整目标值并确定响度调整值;
d.将响度调整值与原始音频的每个采样点的电平值相加,得到的结果为最终的调整音频。
2.根据权利要求1所述的一种适用于文件播出系统的音频响度一致性控制方法,其特征在于,所述窗口宽度是200毫秒。 
3.根据权利要求1所述的一种适用于文件播出系统的音频响度一致性控制方法,其特征在于,所述窗口相互交叠,交叠的宽度是1/10窗口宽度至1/2窗口宽度。
4.根据权利要求3所述的一种适用于文件播出系统的音频响度一致性控制方法,其特征在于,所述交叠的宽度是1/4窗口宽度。
5.根据权利要求1所述的一种适用于文件播出系统的音频响度一致性控制方法,其特征在于,所述确定响度调整值的步骤是:首先由响度调整目标值减去响度特征值后得到一个响度调整初始值L’adj;再通过计算方法Ladj=min(L’adj, -Vpeak)确定响度调整值,其中Vpeak是该待播文件最大响度峰值电平。
CN2010105822269A 2010-12-10 2010-12-10 一种适用于文件播出系统的音频响度一致性控制方法 Active CN102044249B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105822269A CN102044249B (zh) 2010-12-10 2010-12-10 一种适用于文件播出系统的音频响度一致性控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105822269A CN102044249B (zh) 2010-12-10 2010-12-10 一种适用于文件播出系统的音频响度一致性控制方法

Publications (2)

Publication Number Publication Date
CN102044249A true CN102044249A (zh) 2011-05-04
CN102044249B CN102044249B (zh) 2012-05-30

Family

ID=43910330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105822269A Active CN102044249B (zh) 2010-12-10 2010-12-10 一种适用于文件播出系统的音频响度一致性控制方法

Country Status (1)

Country Link
CN (1) CN102044249B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103763498A (zh) * 2014-01-24 2014-04-30 深圳市影歌科技有限公司 Hdmi信号处理系统及处理方法
CN103888868A (zh) * 2014-03-21 2014-06-25 刘海东 一种基于响度调控的声音还原方法
CN104079726A (zh) * 2014-07-14 2014-10-01 深圳市中兴移动通信有限公司 一种移动终端及其智能断开通话的方法和装置
CN105681876A (zh) * 2015-12-30 2016-06-15 惠州市伟乐科技股份有限公司 用于广电播出系统的音频响度一致性控制方法及系统
CN112700784A (zh) * 2020-12-24 2021-04-23 惠州市德赛西威汽车电子股份有限公司 一种基于itu-r bs.1770的响度校准方法及存储介质
CN113963726A (zh) * 2021-09-29 2022-01-21 稿定(厦门)科技有限公司 音频响度均衡方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0748043A2 (de) * 1995-06-07 1996-12-11 LOEWE OPTA GmbH Automatische Lautstärkekorrektur
US20040199933A1 (en) * 2003-04-04 2004-10-07 Michael Ficco System and method for volume equalization in channel receivable in a settop box adapted for use with television
CN1973434A (zh) * 2004-07-01 2007-05-30 杜比实验室特许公司 用于校正影响音频信息的播放响度和动态范围的元数据的方法
CN1981433A (zh) * 2004-06-30 2007-06-13 皇家飞利浦电子股份有限公司 自动调整音频信号的音量的方法和系统
CN101421781A (zh) * 2006-04-04 2009-04-29 杜比实验室特许公司 音频信号的感知响度和/或感知频谱平衡的计算和调整

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0748043A2 (de) * 1995-06-07 1996-12-11 LOEWE OPTA GmbH Automatische Lautstärkekorrektur
US20040199933A1 (en) * 2003-04-04 2004-10-07 Michael Ficco System and method for volume equalization in channel receivable in a settop box adapted for use with television
CN1981433A (zh) * 2004-06-30 2007-06-13 皇家飞利浦电子股份有限公司 自动调整音频信号的音量的方法和系统
CN1973434A (zh) * 2004-07-01 2007-05-30 杜比实验室特许公司 用于校正影响音频信息的播放响度和动态范围的元数据的方法
CN101421781A (zh) * 2006-04-04 2009-04-29 杜比实验室特许公司 音频信号的感知响度和/或感知频谱平衡的计算和调整

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103763498A (zh) * 2014-01-24 2014-04-30 深圳市影歌科技有限公司 Hdmi信号处理系统及处理方法
CN103763498B (zh) * 2014-01-24 2017-08-01 深圳市影歌科技有限公司 Hdmi信号处理系统及处理方法
CN103888868A (zh) * 2014-03-21 2014-06-25 刘海东 一种基于响度调控的声音还原方法
CN104079726A (zh) * 2014-07-14 2014-10-01 深圳市中兴移动通信有限公司 一种移动终端及其智能断开通话的方法和装置
CN105681876A (zh) * 2015-12-30 2016-06-15 惠州市伟乐科技股份有限公司 用于广电播出系统的音频响度一致性控制方法及系统
CN112700784A (zh) * 2020-12-24 2021-04-23 惠州市德赛西威汽车电子股份有限公司 一种基于itu-r bs.1770的响度校准方法及存储介质
CN112700784B (zh) * 2020-12-24 2023-12-15 惠州市德赛西威汽车电子股份有限公司 一种基于itu-r bs.1770的响度校准方法及存储介质
CN113963726A (zh) * 2021-09-29 2022-01-21 稿定(厦门)科技有限公司 音频响度均衡方法及装置
CN113963726B (zh) * 2021-09-29 2023-11-07 稿定(厦门)科技有限公司 音频响度均衡方法及装置

Also Published As

Publication number Publication date
CN102044249B (zh) 2012-05-30

Similar Documents

Publication Publication Date Title
CN102044249B (zh) 一种适用于文件播出系统的音频响度一致性控制方法
CN102017402B (zh) 用于调节音频信号的感知响度的系统
US10966033B2 (en) Systems and methods for modifying an audio signal using custom psychoacoustic models
EP3369175B1 (en) Object-based audio signal balancing
RU2520420C2 (ru) Способ и система для масштабирования подавления слабого сигнала более сильным в относящихся к речи каналах многоканального звукового сигнала
US10455335B1 (en) Systems and methods for modifying an audio signal using custom psychoacoustic models
CN102792588B (zh) 用于在单个回放模式中结合响度测量的系统
CN101411060B (zh) 用于多声道音频信号的响度修改的方法和设备
EP3175634B1 (en) Audio device
CN108711435A (zh) 一种面向响度的高效音频控制方法
Moore et al. Comparison of the CAM2 and NAL-NL2 hearing aid fitting methods
Ward et al. Multitrack mixing using a model of loudness and partial loudness
Eddins et al. Psychometric properties of the coordinate response measure corpus with various types of background interference
CN102007535A (zh) 对环绕体验具有最小影响的用于保持多通道音频中的语音可听度的方法和设备
Kirchberger et al. Dynamic range across music genres and the perception of dynamic compression in hearing-impaired listeners
KR20180099642A (ko) 오디오 신호의 스펙트럼 보정
van Dorp Schuitman et al. Deriving content-specific measures of room acoustic perception using a binaural, nonlinear auditory model
JP2022526271A (ja) ラウドネスレベルを制御するオーディオ信号処理方法及び装置
Ma et al. Implementation of an intelligent equalization tool using Yule-Walker for music mixing and mastering
WO2018066383A1 (ja) 情報処理装置および方法、並びにプログラム
Olive et al. The preferred low frequency response of in-ear headphones
Stone et al. Multichannel fast-acting dynamic range compression hinders performance by young, normal-hearing listeners in a two-talker separation task
Terrell et al. An offline, automatic mixing method for live music, incorporating multiple sources, loudspeakers, and room effects
Seefeldt Loudness domain signal processing
Terrell et al. A perceptual audio mixing device

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant