CN102044249A

CN102044249A - 一种适用于文件播出系统的音频响度一致性控制方法

Info

Publication number: CN102044249A
Application number: CN2010105822269A
Authority: CN
Inventors: 姚威; 骆新; 李岩
Original assignee: Beijing Dayang Technology Development Inc
Current assignee: Beijing Dayang Technology Development Inc
Priority date: 2010-12-10
Filing date: 2010-12-10
Publication date: 2011-05-04
Anticipated expiration: 2030-12-10
Also published as: CN102044249B

Abstract

本发明涉及一种适用于文件播出系统的音频响度一致性控制方法，该方法将在播出前对待播出节目文件中的音频进行扫描分析，获取待播文件的响度特征，根据响度控制目标确定响度调整值。具体包括对待播音频文件从头至尾以一定的窗口宽度进行划分，提取所有窗口的平均响度值和该音频文件的最大峰值电平以及总体平均响度；将大于总体平均响度值并出现次数最多的响度值作为响度特征值；导入响度调整目标值、并确定响度调整值；将响度调整值与原始音频的每个采样点的电平值相加，得到的结果为最终的调整音频。本发明对现有技术的贡献是：响度一致性的控制效果好；不会改变节目动态范围，对原有的艺术效果没有破坏；既保证了响度控制的质量，又解决了重新生成文件所带来的低效问题。

Description

一种适用于文件播出系统的音频响度一致性控制方法

技术领域

本发明涉及一种适用于文件播出系统的音频响度一致性控制方法，该方法将对播出文件中的响度控制信息与素材文件分离开，既保证了响度控制的质量，又解决了重新生成文件所带来的低效问题，而且素材的内容没有进行过二次处理，保证了素材的原始效果。

背景技术

目前播出系统中，由于音频校准电平不统一、动态处理不当等各种原因，存在不同电视台之间、不同频道之间，甚至是同一频道不同的节目之间、节目与广告之间声音响度不同的问题，导致观众在收看电视节目过程中，在切换频道或者节目、广告切换过程中需要不断调整电视机输出音量的不便。要想做到不同的节目之间都能让观众得到一个满意的相对声音响度，需要解决测量与调整两方面的问题。有的电视台对提交的节目提出了一些音频的参数指标，希望能够得到响度一致的节目，但是由于这些指标并不能真正反映音频的真实响度，因此控制效果并不理想；有一些设备厂商有自己的响度解决方案，这样能够比较好地对不同节目进行响度控制，但是受限于的特殊的音频格式，以及在传输过程中需要携带特殊的元数据信息，因此并不能适应所有情况。再加上电视台节目的来源比较广泛，有自产的，也有外购、收录的，情况比较复杂，要求送到播出部门的待播节目的响度一致是非常困难的。

如何能够达到响度一致是目前各家电视台都非常关心的问题，现有的解决方法主要包括响度的整体调整和实时调整；前者按照不同音频的平均响度进行整体调整，调整后不同音频的平均响度均与目标响度保持一致；后者对音频作部分调整，对音频中响度小的部分进行提升，响度大的部分进行衰减。但这两种方式都有各自优缺点：整体调整可保持节目的动态范围，但该调整把平均响度作为描述音频的唯一信息，对不同类型的节目作统一处理可能导致调整后不同节目听起来声音并不相同；实时调整可以使节目内(节目间)响度趋于一致，但会破坏音频的动态范围，音频声音效果将大打折扣。

发明内容

本发明的目的是提出一种适用于文件播出系统的音频响度一致性控制方法，该方法对不同类型音频引入动态指标，将响度控制信息与源素材文件分离开，既保证了响度控制的质量，又解决了重新生成文件所带来的低效问题，而且源素材的内容没有进行过二次处理，保证了素材的原始效果。

为了实现上述目的，本发明的技术方案是，一种适用于文件播出系统的音频响度一致性控制方法，在素材文件中分离出在播出前对待播出节目文件中的音频数据进行扫描分析，获取待播出节目文件的响度特征，根据响度控制目标确定响度调整值，将带有响度调整值的响度控制信息连同待播出节目文件一同送入播出服务器，在播出服务器中作最终的响度调整并播出，对响度文件调整值的分析提取使用了ITU-BS.1770标准中的响度计算，控制方法步骤包括：

a.提取待播出文件中的音频数据，对音频数据从头至尾以50至1000毫秒的窗口宽度进行划分，提取所有窗口的平均响度值和该音频文件的最大峰值电平；

b.将大于平均响度值、并出现次数最多的响度值作为响度特征值；

c.导入响度调整目标值并确定响度调整值；

d.将响度调整值与原始音频的每个采样点的电平值相加，得到的结果为最终的调整音频。

所述窗口宽度最佳是200毫秒。

所述窗口相互交叠，交叠的宽度是1/10窗口宽度至1/2窗口宽度。

所述交叠的宽度最佳是1/4窗口宽度。

所述确定响度调整值的步骤是：首先由响度调整目标值减去响度特征值后得到一个响度调整初始值L’_adj；再通过计算方法L_adj＝min(L’_adj, - V_peak)确定响度调整值，其中V_peak是该待播文件最大响度峰值电平。

本发明对现有技术的贡献是：响度一致性的控制效果好；不会改变节目动态范围，对原有的艺术效果没有破坏；对播出设备的改造要求小；对播出设备的调节能力要求低。

下面结合实施例和附图对本发明做一详细描述。

附图说明

图1为播出系统流程框图；

图2为本发明控制方法流程图；

图3为多声道响度算法方框图；

图4为头部声学效应的前置滤波器响应图；

图5为二阶滤波器的信号流程图；

图6为 RLB加权曲线图；

图7为实时响度曲线和计算示意图。

具体实施方式

一种适用于文件播出系统的音频响度一致性控制方法实施例，参见图1至图7；如图1所示，该方法是在一个播出系统中实现，其播出系统包括响度控制服务器1，近线存储2和播出服务器3，响度控制服务器从近线存储中的素材文件中分离出音频数据进行扫描分析，获取待播文件的响度特征，根据响度控制目标确定响度调整值，将带有响度调整值的响度文件送回到近线服务器，连同源素材文件一同送入播出服务器，在播出服务器中作最终的响度调整并播出，对响度调整值的分析提取中利用ITU-BS.1770标准中的响度计算方法，对待播出文件中的音频信息以响度特征值为核心进行调整，如图2所示，所述控制方法步骤包括：

a.提取待播出节目文件中的音频数据，对音频数据进行响度扫描分析，即对音频文件从头至尾以50至1000毫秒的窗口宽度进行划分，提取所有窗口的平均响度值和该音频文件的最大峰值电平；其中，所述窗口宽度最佳是200毫秒；

b.确定响度特征值，即将大于平均响度值、并出现次数最多的响度值作为响度特征值；

c.导入响度调整目标值并确定响度调整值；

d.确定最终调整音频；即将响度调整值与原始音频的每个采样点的电平值相加，得到的结果为最终的调整音频。

为了提高分析的准确性，所述窗口相互交叠，交叠的宽度是1/10窗口宽度至1/2窗口宽度；交叠的宽度最佳是1/4窗口宽度。

其中，所述确定响度调整值的步骤是：首先由响度调整目标值减去响度特征值后得到一个响度调整初始值L’_adj；在通过计算方法L_adj＝min(L’_adj, - V_peak)确定响度调整值，其中V_peak是待播出节目文件最大响度峰值电平。

下面对上述方案进行具体的描述：

本实施例使用的音频节目响度计算方法，采用的是ITU-R BS.1770-1 建议书中所阐释的方法。该方法规定了多声道响度测量算法，图3所示的是该算法各个组成部件的方框图；方框图显示了五个主要通道的输入，左边X_L、中间X_C、右边X_R、左边环绕X_LS和右边环绕X_RS，分别经过前置滤波器、RLB滤波器，从RLB滤波器输出Y_L、Y_C、Y_R、Y_LS、Y_RS、到均方，从均方输出Z_L、Z_C、Z_R、Z_LS、Z_RS到G_L、G_C、G_R、G_LS、G_RS汇总到∑输出，这样允许监听包含一至五个通道的节目。对于少于五个通道的节目，一些输入将不会使用。该测量法中不包括低频效应（LFE）通道。

算法的第一步是在Leq(RLB)测量之前，对信号进行前置滤波，图4 示了前置滤波用于说明头部的声学效应，这里把头部模拟为一个固定的球体。

前置滤波器定义为如图5 所示的滤波器，滤波器系数见表1。

Figure 2010105822269100002DEST_PATH_IMAGE001

表1 模拟球形头部的前置滤波器的滤波器系数

算法的第二步是应用RLB 加权曲线，该曲线由如图6所示的一个简单的高通滤波器组成。

RLB 加权曲线定义为如图5所示的一个2 阶滤波器，其系数见表2。

表2 RLB 加权曲线的滤波器系数

随着前置滤波器和RLB 滤波的应用，于是测量间隔T 内的均方能量计量如下：

其中，y_i是经过模拟头部效应的前置滤波器和RLB 加权曲线滤波以后的输入信号。（i = L，R，C，Ls，Rs，N，这里N 为通道的数量）。

一旦计算出每一个通道的加权均方电平Z_i，最后一步就是求N个通道的和，如下所示响度计算公式：

在该算法中使用的频率加权，是前置滤波器和RLB 加权的级联，并定名为“K”加权。上面计算的响度值的数值结果之后应有“LKFS”标志，表示“K 加权的相对满刻度的响度”。该LKFS 单位等于一个分贝，其中信号电平每增加1 dB，将导致响度数值增加1LKFS。

表3 给出了不同通道的加权系数。

表3 各个音频通道的加权

响度随时间分布值

的计算方法

如果将ITU-BS.1770-1建议书中的响度算法记为：LoudnessCalc(W)。其中W是图7所示为待计算响度的音频片段的窗口长度。

当W为音频节目的长度时，计算结果即为该节目的总体平均响度值，记为：Lavg；是图中L_real(0)、L_real(1)、L_real(2)。。。。L_real(n)的平均值。

对音频文件从头至尾以宽度为W的窗口进行局部的响度扫描计算，连续两次计算交叠大小为O。每次计算可以得到一个局部的响度平均值：

L_real(t)= LoudnessCalc (t,w,o) t∈[1,N]

其中N为音频按照计算窗口宽度W进行的分段数量。W的取值范围为50到1000毫秒，考虑人耳对声音的分辨率和计算精度的要求，W取值最佳是200毫秒。O的取值通常为W/10到W/2，本实施例建议采用W/4。

L_real(t)形成的集合即为如图7所示构成该音频文件的实时响度曲线计算值。

响度特征值L_eigen的计算方法

响度特征值是能体现人对音频节目响度最敏感响度的值。本实施例对该值的选取思想是，大于总体平均响度的、并出现次数最多的响度值作为响度特征值。通过以下步骤可以获得该值：

1) 对获得的实时响度数据集合L_real(t)，按照1LKFS的分辨率，在-80LKFS到10LKFS范围内进行响度值分布情况统计，得到每个响度值出现的数量S(L)。

2) 如果W为窗口宽度（通常选取W为6LKFS），则以某响度L为中心的响度分布情况F(L)为：

取F(L,W)的最大值F_max=max(F(L,W))，将它对应的响度值称为最集中响度L_most。

综合考虑人耳对高响度的敏感性和减少大段静音对最集中响度的影响，我们对高于平均响度的响度值进行统计F_max，其对应的最集中响度L_most即作为该文件的响度特征值L_eigen。

响度调整值

的计算方法

在实际的播出工作中，每个电视台会根据本台节目声音特点，设定一个各频道、各类节目统一的响度标准值。结合本方法的使用，如果各个频道的不同节目都使用同一个响度标准值作为调整目标，进行响度一致性控制，那么观众收看这个电视台的不同节目时将会感受到大致相同的音量，也就达到了想读一执行控制的目的。因此，我们使用电视台事先确定的响度标准值来作为响度调整目标，该响度调整目标一般事先通过计算机软件设置在响度控制服务器中。如果设定的响度调整目标为L_targ，则初始响度调整值L’_adj为：L’_adj=L_targ－L_eigen

数字音频的最小访问单位为采样点，理论最大电平值为0dBFs。如果音频文件中采样点的最大峰值电平为V_peak（单位dBFs），那么在不失真情况下能够进行的最大增益调整量（峰值储备）为V_madj，则有：

V_madj ＝0－V_peak＝- V_peak

因此，考虑峰值储备对响度调整的限制，那么最终的响度调整值L_adj为

L_adj＝min(L’_adj,V_madj)

响度调整值

作用于音频节目的方法

响度控制服务器在确定一个待播出节目文件的响度调整值L_adj后，通常生成一个与该待播出节目文件对应的响度控制文件存放这个调整值；并将这个响度控制文件送回到近线服务器，最终这个响度控制文件连同待播出节目文件一同送入播出服务器，在播出服务器中作最终的响度调整并播出。播出服务器在播出过程中，对播出音频的调整方式如下：

将

与待播出节目文件原始音频的每个采样点Sample_src的电平值相加，得到的结果Sample_tag为最终的调整音频，是响度控制的结果：

Sample_tag(s) ＝Sample_src(s)＋L_adj s∈[1,N]

其中N为采样点数量。

播出服务器输出的音频就是最终的调整音频。

最后应说明的是，以上仅用以说明本发明的技术方案而非限制，尽管参照较佳布置方案对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案（比如响度控制信息传入播出服务器的方法等）进行修改或者等同替换，而不脱离本发明技术方案的精神和范围。

Claims

1.一种适用于文件播出系统的音频响度一致性控制方法：在播出前对待播出节目文件中的音频数据进行扫描分析，获取待播出节目文件的响度特征，根据响度控制目标确定响度调整值，对响度调整值的分析提取使用了ITU-BS.1770标准中的响度计算，其特征在于，将带有响度调整值的响度控制信息连同待播出节目文件一同送入播出服务器，在播出服务器中作最终的响度调整并播出，所述控制方法步骤包括：

a.提取待播出文件中的音频数据，对音频数据从头至尾以50至1000毫秒的窗口宽度进行划分，提取所有窗口的平均响度值和该音频文件的最大峰值电平和整体平均响度；

b.将大于整体平均响度值、并出现次数最多的响度值作为响度特征值；

c.导入响度调整目标值并确定响度调整值；

2.根据权利要求1所述的一种适用于文件播出系统的音频响度一致性控制方法，其特征在于，所述窗口宽度是200毫秒。

3.根据权利要求1所述的一种适用于文件播出系统的音频响度一致性控制方法，其特征在于，所述窗口相互交叠，交叠的宽度是1/10窗口宽度至1/2窗口宽度。

4.根据权利要求3所述的一种适用于文件播出系统的音频响度一致性控制方法，其特征在于，所述交叠的宽度是1/4窗口宽度。

5.根据权利要求1所述的一种适用于文件播出系统的音频响度一致性控制方法，其特征在于，所述确定响度调整值的步骤是：首先由响度调整目标值减去响度特征值后得到一个响度调整初始值L’_adj；再通过计算方法L_adj＝min(L’_adj, -V_peak)确定响度调整值，其中V_peak是该待播文件最大响度峰值电平。