CN111933173B

CN111933173B - 一种增益平稳调节的动态范围控制方法及系统

Info

Publication number: CN111933173B
Application number: CN202010767816.2A
Authority: CN
Inventors: 王青云; 梁瑞宇; 余兵; 唐闺臣; 包永强; 谢跃
Original assignee: Nanjing Institute of Technology
Current assignee: Nanjing Institute of Technology
Priority date: 2020-08-03
Filing date: 2020-08-03
Publication date: 2022-03-01
Anticipated expiration: 2040-08-03
Also published as: CN111933173A

Abstract

本发明公开了一种增益平稳调节的动态范围控制算法及系统，涉及音频信号处理技术领域，根据实际动态范围控制程度的需要，给定增益曲线相关参数，参数包括过渡段的起始点、过渡段的带宽及压缩段的斜率，通过求出过渡段曲线方程的未知参数，进而得出整个增益曲线；根据输入语音信号的幅度大小及增益曲线确定实时增益，通过期望增益和实际增益的平稳调节，确保参与运算的增益平稳变化。本发明的方法通过数据缓存，进一步确保增益能够跟上当前点数据对增益的需要，使得结果准确，与经典DRC算法相较，本发明所用方法的突出优势在于能够较小失真地对原始音频信号进行缩放处理，不会对后续功能模块造成影响。

Description

一种增益平稳调节的动态范围控制方法及系统

技术领域

本发明涉及声音信号处理技术控制领域，具体涉及一种增益平稳调节的动态范围控制算法及系统。

背景技术

动态范围控制技术是在使用声音信号之前人为地对大幅度信号进行压缩来避免出现削波失真，同时放大小幅度信号使其容易被人耳感知的技术。在模拟电路盛行的时期，对语音信号动态范围的调整是通过将电流分成两条线路分别进行调幅整流来实现的。

进入20世纪90年代，数字信号处理技术的广泛应用使得动态范围控制器也开始走向数字化。动态范围控制涵盖压缩器、限幅器、扩展器、噪声门等多种动态处理器，既可以分开使用，也可以根据需求将各种动态处理器进行合理的组合。

经典的动态范围控制算法是根据输入信号与增益曲线实时地更新增益。尽管有增益平滑的过程，但是由于增益是严格按照输入信号的幅度实时变化的，所以增益的波动会比较大，进而影响声音信号的音质。

申请号为201610371874.7的中国专利，公开了一种应用于语音识别前端的音频增益调整方法和装置，调整方法包括：接收音频数据；对所述音频数据进行AGC处理；对AGC处理后的音频数据进行DRC处理，其目的在于克服有效放大幅值较小的语音信号，提高音频增益效果，但此方法获得增益平稳变化效果仍不够理想。

发明内容

技术目的：为了解决经典的动态范围控制算法存在增益波动较大，导致语音信号音质受损的问题，本发明提供了一种增益平稳调节的动态范围控制算法及系统，能够不失真地对声音信号的幅度进行控制，对大信号的幅度能够很好地进行限制。

技术方案：为了达到上述目的，本发明所采用的技术方案是：

一种增益平稳调节的动态范围控制算法，其特征在于，包括以下步骤，

A、设计一条能够根据实际需要进行增益调节的增益曲线；

B、对输入语音信号进行分帧，对于一帧信号的每一个点，根据输入语音信号的幅度大小及增益曲线确定实时增益Gr，比较实时增益Gr与期望增益Ge的大小关系，计算期望增益变化率Re，根据期望增益变化率Re更新期望增益Ge的值，更新后的期望增益Ge用于计算下一个点的实时增益Gr；

C、对于一帧信号的每一个点，根据实际增益变化率Ra更新实际增益Ga的值；对获得的实际增益Ga做反规格化处理，得到的结果作为最终参与计算的增益g；

D、循环操作步骤B和步骤C，对一帧信号的所有采样点逐个处理，处理结束后，将最后得到的期望增益Ge做规格化处理，得到规格化后的期望增益Gn，比较实际增益Ga与规格化后的期望增益Gn的大小关系，求实际增益变化率Ra。

优选地，步骤A中，增益曲线包括直通段、过渡段和压缩段三个部分，增益曲线的设计步骤包括：根据动态范围控制要求，设定过渡段的起始点和结束点的坐标、以及压缩段的斜率；过渡段与压缩段在交点处的斜率相等，根据设定的参数，求出过渡段的过渡曲线方程；确定整个增益曲线方程。

优选地，步骤A中，增益曲线在对数坐标下建立，设定过渡段的开始点和结束点的线性横坐标分别为x₀、x₁，过渡曲线方程为公式(1)：

设定压缩段的斜率为kc，压缩段的曲线方程为公式(2)：

压缩段的斜率的线性方程为公式(3)：

增益曲线平滑连接时，过渡段与压缩段在交点处的斜率相等，结合过渡曲线和压缩曲线方程求出参数k的值，求出整条增益曲线的形式。

优选地，步骤B中，对于一帧信号的每一个点，设定幅度的阈值T，根据输入语音信号的幅度大小及增益曲线确定实时增益Gr，如公式(4)所述：

其中，A1为输入语音信号的幅度A1，A2为将输入语音信号的幅度A1代入增益曲线，得到的输出语音信号的幅度A2。

优选地，步骤B中，比较实时增益Gr与期望增益Ge的大小关系，确定期望增益变化率Re，如公式(5)所述：

根据变化率Re更新期望增益Ge，如公式(6)所述：

Ge＝Ge+(Gr-Ge)*Re (6)

其中Tsr表示饱和释放时间，fs表示采样率。

优选地，步骤C中，根据实际增益变化率Ra更新实际增益Ga，如公式(7)所述：

对获得的实际增益做反规格化处理，其反规格化后的增益Gad，如公式(8)所述：

最终参与计算的增益g，如公式(9)所述：

其中，Gp表示后增益，参数ful是将常数1代入增益曲线得到的输出。

优选地，步骤D中，对最后得到的期望增益的值Ge做规格化处理得到规格化后的期望增益Gn，如公式(10)所述：

先将实际增益Ga与规格化后的期望增益Gn的比值转化为dB值，设为变量Ran，如公式(11)所述：

若Ran＜0，说明实际增益Ga小于规格化后的期望增益Gn；实际增益的变化率Ra的更新公式如公式(12)所述：

其中，spa表示一个常量；

若Ran＞0，说明实际增益Ga大于规格化后的期望增益Gn，记录Ran的最大值，保存至变量Mran中。

优选地，步骤D中，在Ran＜0的情况中，Mran更新为-1，否则Mran的值总是记录Ran＞0时候Ran的最大值；并且当Mran＜0.5时设置成0.5，则实际增益的变化率Ra的更新公式如公式(13)所述：

其中fs是采样率，Ta是攻击时间。

优选地，步骤D中，将处理过后的Ran值作为输入代入一个3次函数y＝ax³+bx²+cx+d中得到释放的样点数resamps；其中三次函数经过点(0，y₁)、(1，y₂)、(2，y₃)、(3，y₄)，其中纵坐标的单位长度是总释放样点数St，总释放样点数St的表达式如公式(14)所示：

St＝fs*Tr (14)

其中fs表示采样率，Tr表示释放时间，y₁、y₂、y₃、y₄是四个介于0和1之间的常数。

一种增益平稳调节的动态范围控制系统，用于所述方法，其特征在于：包括音频信号获取模块、比较和计算模块和调节模块；其中，

音频信号获取模块，用于接收音频信号并进行预处理；

比较和计算模块，处理内容包括比较实时增益Gr与期望增益Ge的大小、实际增益Ga与规格化后的期望增益Gn的大小，计算期望增益变化率Re、比较求实际增益变化率Ra和更新期望增益Ge的值；

调节模块，用于根据比较和计算模块输出的结果，调节所述音频信号的增益。

技术效果：由于采用了上述技术方案，本发明具有如下技术效果：

1)、本发明的方法能够根据实际动态范围控制程度的需要，通过给定增益曲线相关参数，包括过渡段的起始点、过渡段的带宽及压缩段的斜率，求出过渡曲线方程的未知参数，进而得出整个增益曲线；利用增益曲线，实现对音频信号的期望增益和实际增益的平稳调节，确保参与运算的增益平稳变化；

2)、本发明的方法通过数据缓存，进一步确保增益能够跟上当前点数据对增益的需要，使得结果准确，与经典DRC算法相较，其突出优势在于能够不失真地对原始音频信号进行缩放处理，不会对后续功能模块造成影响。

3)本发明能够不失真地对声音信号的幅度进行控制，对小信号可以放大5dB-6dB，对大信号的幅度能够很好地进行限制。

附图说明

图1是本发明的一种增益平稳调节的动态范围控制简单算法流程图；

图2是期望增益Ge的实现流程图；

图3是实际增益Ga的实现流程图；

图4是三次函数曲线示意图；

图5是DRC处理过后时域波形对比图。

具体实施方式

如图1所示，本发明的一种增益平稳调节的动态范围控制算法包括以下步骤。

步骤A，设计一条可以根据实际需要进行调节的可变增益曲线；

步骤B，对于一帧信号的每一个点，根据输入语音信号的幅度大小及增益曲线确定实时增益Gr，比较实时增益Gr与期望增益Ge的大小关系，求期望增益变化率Re，根据期望增益变化率更新期望增益的值；

步骤C，对于一帧信号的每一个点，根据实际增益变化率Ra更新实际增益的值；根据获得的实际增益，做一个反规格化处理，此时可以选择再乘上一个主增益，得到最终参与计算的增益g；主增益是一个与增益曲线有关的参数；

步骤D，一帧信号结束后，将最后得到的期望增益的值Ge做一个规格化处理得到规格化后的期望增益Gn，比较实际增益Ga与规格化后的期望增益Gn的大小关系，求实际增益变化率Ra。

本发明的一种增益平稳调节的动态范围控制算法的步骤A中，增益曲线是在对数坐标下表示的，分成三个部分，“直通段”、“过渡段”、“压缩段”。

增益曲线的“过渡段”的起始点的线性值为x₀，其线性方程如公式(1)所述：

其中k为参数，由增益曲线的“压缩段”在对数坐标下的斜率kc决定。

过渡曲线结束点的坐标为(x₁，y₁)，那么第三段压缩曲线线性方程如公式(2)所示：

20log₁₀y＝kc*(20log₁₀x-20log₁₀x₁)+20log₁₀y₁ (2)

化简为公式(3)所示：

其斜率的线性方程如公式(4)所示：

令增益曲线的“过渡段”与“压缩段”在交点处的斜率相等，即满足公式(5)：

将

代入公式(5)，得到公式(6)：

只要知道增益曲线的“压缩段”在对数坐标下的斜率kc，以及增益曲线“过渡段”的起始点和结束点两个线性横坐标x0、x1，即可确定参数k，从而确定整条增益曲线的形式。

步骤B中，对于一帧信号的每一个点，根据输入语音信号的幅度大小及增益曲线确定实时增益Gr，比较实时增益Gr与期望增益Ge的大小关系，求期望增益变化率Re，根据期望增益变化率更新期望增益的值，其原理流程图如图2所示。

如前述步骤B所述，输入信号幅值A1小于某个阈值T，则将实时增益Gr设置为1；若其幅值大于某个阈值，则实时增益Gr由增益曲线的输出A2与输入信号的幅值A1的比值确定，即：

如前述步骤B所述，比较实时增益Gr与期望增益Ge的大小关系，求变化率Re；当实时增益Gr大于期望增益Ge时，变化率Re是实时增益Gr的函数，实时增益越小，变化率越大，反之则越小；当实时增益Gr小于期望增益Ge时，变化率Re设置为1即：

其中Tsr是饱和释放时间。

如前述步骤B所述，根据期望增益变化率Re更新期望增益Ge的值，其更新方程如公式9所述：

Ge＝Ge+(Gr-Ge)*Re (9)

步骤C中，根据实际增益变化率Ra更新实际增益Ga的值，其更新公式如式(10)所述：

根据获得的实际增益，做一个反规格化处理，其反规格化后的增益Gad如公式(11)所述：

最终参与计算的增益g如公式(12)所述：

其中，Gp是后增益，一般设置为0dB。参数ful是将常数1代入增益曲线得到的输出，1是横坐标，ful是对应的纵坐标。

步骤D中，一帧信号结束后，将最后得到的期望增益的值Ge做一个规格化处理得到规格化后的期望增益Gn，如公式(13)所述：

如前述步骤D所述，一帧信号结束后，比较实际增益Ga与规格化后的期望增益Gn的大小关系，求实际增益变化率Ra；先将实际增益Ga与规格化后的期望增益Gn的比值转化为dB值，设为变量Ran，如公式(14)所述：

如前述步骤D所述，若Ran＜0，说明实际增益Ga小于规格化后的期望增益Gn，将Ran的值限制在-12到0之间，也即小于-12的Ran值都作-12处理。将区间限制后的Ran值整体加上12，再乘上0.25，此时Ran的区间范围是0到4之间。

然后将处理过后的Ran值作为输入代入一个3次函数y＝ax³+bx²+cx+d中得到释放的样点数resamps。其中三次函数经过点(0，y₁)、(1，y₂)、(2，y₃)、(3，y₄)，如图4所示，其中纵坐标的单位是总释放样点数St，其表达式如公式(15)所示：

St＝fs*Tr (15)

其中fs是采样率，Tr是释放时间，例如0.25s，y₁、y₂、y₃、y₄是四个介于0到1之间的常数。

若Ran＜0，则实际增益的变化率Ra的更新公式如公式(16)所述：

其中，spa是一个常量，例如5。

若Ran＞0，说明实际增益Ga大于规格化后的期望增益Gn。记录Ran的最大值，保存至变量Mran中。在Ran＜0的情况中，Mran更新为-1，否则Mran的值总是记录Ran＞0时候Ran的最大值；并且当Mran＜0.5时设置成0.5，则实际增益的变化率Ra的更新公式如公式(17)所述：

其中fs是采样率，Ta是攻击时间，例如0.003，相比较于释放时间Tr，攻击时间更短。

一般的增益曲线要根据情况设计，本发明的算法中，增益曲线只要给定3个参数，就能自动生成曲线，不需要调节。实时增益是根据输入信号的幅度与增益曲线得到的一个增益，期望增益是根据实时增益不断更新得到的。本发明可通过采用一个环形缓冲区，将与实际增益相乘的数据从所述环形缓冲区里面读取，然后获取的数据也存储在所述环形缓冲区里，所以如果取数据指针滞后于写数据指针一段长度，那么当前实际增益对应的数据就是历史数据，而若干点后的实际增益对应的是当前点数据，这样就实现了实际增益与数据的匹配。本发明通过数据缓存，进一步确保增益能够跟上当前点数据对增益的需要，使得结果准确。即本发明采用的方法，通过在前一帧根据输入信号和增益曲线确定实时增益，然后根据实时增益更新期望增益，在处理下一帧信号时，以前一帧算出的期望增益为标准，来更新实际用于输入此信号幅度变化的实际增益；实际增益的变化率是由实际增益和期望增益的大小关系决定的，实际增益的变化率又反过来更新实际增益，实际增益与实际增益的变化率是相辅相成的，使得结果准确。

图5是用本发明的DRC算法处理过后的波形与原时域波形的对比图，其中上面为输入信号时域波形图，下图为用本发明的DRC算法处理过后的波形。

综上所述，本发明的一种增益平稳调节的动态范围控制算法，根据实际动态范围控制程度的需要，给定曲线相关参数，包括过渡段的起始点，过渡带的带宽及压缩段的斜率，求出过渡曲线方程的未知参数，进而得出整个增益曲线。通过期望增益和实际增益的平稳调节，确保参与运算的增益平稳变化。通过数据缓存，进一步确保增益能够跟上当前点数据对增益的需要，使得结果准确。本发明区别于经典DRC算法的突出优势在于它能够不失真地对原始音频信号进行缩放处理，不会对后续功能模块造成影响。

以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种增益平稳调节的动态范围控制方法，其特征在于，包括以下步骤，

A、设计一条能够根据实际需要进行增益调节的增益曲线；

B、对输入语音信号进行分帧，对于一帧信号的每一个点，根据输入语音信号的幅度大小及增益曲线确定实时增益Gr，比较实时增益Gr与期望增益Ge的大小关系，计算期望增益变化率Re，根据期望增益变化率Re更新期望增益Ge的值；

其中，所述实际增益Ga是实际用于输入信号幅度变化的增益，所述实际增益变化率Ra是在对上一帧信号处理时计算获得，即将上一帧信号的最后一个点得到的期望增益Ge做规格化处理，得到规格化后的期望增益Gn，比较上一帧信号的最后一个点的实际增益Ga与规格化后的期望增益Gn的大小关系，求得用于当前帧信号的实际增益变化率Ra；

D、循环操作步骤B和步骤C，对一帧信号的所有采样点逐个处理，一帧信号处理结束后，将最后一个点得到的期望增益Ge做规格化处理，得到规格化后的期望增益Gn，比较实际增益Ga与规格化后的期望增益Gn的大小关系，求用于下一帧信号处理的实际增益变化率Ra。

2.根据权利要求1所述的一种增益平稳调节的动态范围控制方法，其特征在于：步骤A中，增益曲线包括直通段、过渡段和压缩段三个部分，增益曲线的设计步骤包括：根据动态范围控制要求，设定过渡段的起始点和结束点的坐标、以及压缩段的斜率；过渡段与压缩段在交点处的斜率相等，根据设定的参数，求出过渡段的过渡曲线方程；确定整个增益曲线方程。

3.根据权利要求2所述的一种增益平稳调节的动态范围控制方法，其特征在于：步骤A中，设定过渡段的开始点和结束点的线性横坐标分别为x₀、x₁，纵坐标为y₀、y₁，过渡曲线方程(x,y)为公式(1)：

其中k为参数；

过渡曲线结束点的坐标为(x₁,y₁)，压缩曲线线性方程如公式(2)所示：

kc为压缩曲线与斜率有关的常数；

压缩曲线的斜率的线性方程为公式(3)：

增益曲线平滑连接时，过渡段与压缩段在交点处的斜率相等，结合过渡曲线和压缩曲线方程求出参数k的值，求出整条增益曲线。

4.根据权利要求1所述的一种增益平稳调节的动态范围控制方法，其特征在于：步骤B中，对于一帧信号的每一个点，设定幅度的阈值T，根据输入语音信号的幅度大小及增益曲线确定实时增益Gr，如公式(4)所示：

其中，A1为输入语音信号的幅度，A2为将输入语音信号的幅度A1代入增益曲线，得到的输出语音信号的幅度。

5.根据权利要求4所述的一种增益平稳调节的动态范围控制方法，其特征在于：步骤B中，比较实时增益Gr与期望增益Ge的大小关系，确定期望增益变化率Re，如公式(5)所示：

根据期望增益变化率Re更新期望增益Ge，如公式(6)所示：

Ge＝Ge+(Gr-Ge)*Re (6)

其中Tsr表示饱和释放时间，fs表示采样率。

6.根据权利要求1所述的一种增益平稳调节的动态范围控制方法，其特征在于：步骤C中，根据实际增益变化率Ra更新实际增益Ga，如公式(7)所示：

对获得的实际增益Ga做反规格化处理，其反规格化后的增益Gad，如公式(8)所示：

最终参与计算的增益g，如公式(9)所示：

7.根据权利要求1所述的一种增益平稳调节的动态范围控制方法，其特征在于：步骤D中，对最后得到的期望增益Ge做规格化处理得到规格化后的期望增益Gn，如公式(10)所示：

先将实际增益Ga与规格化后的期望增益Gn的比值转化为dB值，设为变量Ran，如公式(11)所示：

若Ran<0，说明实际增益Ga小于规格化后的期望增益Gn；实际增益的变化率Ra的更新公式如公式(12)所示：

其中，spa表示一个常量，St表示总释放样点数，；

若Ran>0，说明实际增益Ga大于规格化后的期望增益Gn，记录Ran的最大值，保存至变量Mran中。

8.根据权利要求7所述的一种增益平稳调节的动态范围控制方法，其特征在于：步骤D中，在Ran<0的情况中，Mran更新为-1，否则Mran的值总是记录Ran>0时候Ran的最大值；并且当Mran<0.5时设置成0.5，则实际增益的变化率Ra的更新公式如公式(13)所示：

其中fs是采样率，Ta是攻击时间。

9.根据权利要求7所述的一种增益平稳调节的动态范围控制方法，其特征在于：步骤D中，将处理过后的Ran值作为输入代入一个3次函数β＝aα³+bα²+cα+d中得到释放的样点数resamps；其中三次函数经过点(0，β₁)、(1，β₂)、(2，β₃)、(3，β₄)，其中纵坐标的单位长度是总释放样点数St，总释放样点数St的表达式如公式(14)所示：

St＝fs*Tr (14)

其中fs表示采样率，Tr表示释放时间，β₁、β₂、β₃、β₄是四个介于0和1之间的常数。

10.一种增益平稳调节的动态范围控制系统，用于执行权利要求1至9任一所述方法，其特征在于：包括音频信号获取模块、比较和计算模块和调节模块；其中，

音频信号获取模块，用于接收音频信号并进行预处理；