CN108632711A - 扩声系统增益自适应控制方法 - Google Patents
扩声系统增益自适应控制方法 Download PDFInfo
- Publication number
- CN108632711A CN108632711A CN201810592382.XA CN201810592382A CN108632711A CN 108632711 A CN108632711 A CN 108632711A CN 201810592382 A CN201810592382 A CN 201810592382A CN 108632711 A CN108632711 A CN 108632711A
- Authority
- CN
- China
- Prior art keywords
- signal
- noise ratio
- value
- gain
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000002787 reinforcement Effects 0.000 title claims abstract description 23
- 230000005236 sound signal Effects 0.000 claims abstract description 10
- 230000003321 amplification Effects 0.000 claims description 76
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 76
- 238000012512 characterization method Methods 0.000 claims description 19
- 230000003044 adaptive effect Effects 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 8
- 238000012886 linear function Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 2
- 230000003595 spectral effect Effects 0.000 claims 1
- 238000001228 spectrum Methods 0.000 description 16
- 230000007613 environmental effect Effects 0.000 description 5
- 210000004271 bone marrow stromal cell Anatomy 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000009123 feedback regulation Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了扩声系统增益自适应控制方法,该方法包括:S1、预设初始系统增益gain,直接在扩声系统的电路中拾取播放的扩声源信号;S2、将所述扩声源信号与初始系统增益gain相乘,然后经过扩声系统中的扬声器播放;S3、在扩声现场通过设置传声器来拾取现场扩声混合信号,即扩声源信号和系统增益的乘积再与声场脉冲卷积,然后与噪声信号相加后的信号;S4、再根据选定的函数关系利用MSC信噪比表征值计算出估计的现场信噪比;S5、根据估计的现场信噪比调整扩声系统的增益gain。本发明提供的扩声系统增益自适应控制方法使得扩声系统增益设置更加准确,扩声音量合适,在不增加声污染的情况下,调整后的扩声现场声音信号明显比未经过自适应调整的现场声音信号清晰。
Description
技术领域
本发明属于扩声调节的技术领域,涉及一种扩声系统增益自适应控制方法。
背景技术
随着经济社会的发展,许多公共场所都安装了用于扩声的公共广播或语音指引等扩声系统。比如:学校、车站、公园、商场等场所的公共广播扩声系统可用于播放背景音乐、应急安全指引、业务宣传等。扩声系统虽然给人们的工作生活带来方便,但也存在一个不可忽视的问题,即系统播放的声音音量是固定的,这会带来两个方面的问题:首先,音量过小系统播放的声音会被噪声所掩蔽;其次,音量过大则会产生噪声污染。因此,人们希望扩声系统应能够依据扩声现场的噪声大小来自适应地调节扩声系统增益:当现场信噪比较高时,应降低系统增益;反之则升高。这样既保证了公共场所扩声服务的需求,又维护了公共场所舒适的声环境。
目前国内外对此问题的研究主要集中在对扩声现场的环境噪声的识别上,归纳起来有以下几种技术:
(1)间隙检测噪声
这种方法的思路是在播音停顿音隙时刻采集噪声信号,经过A/D转换后计算噪声的平均功率,然后据此调节功放的音量。此方法只需应用一般的模拟技术和通用数字技术,实现简单,但效果并不理想。这是因为当进行背景广播时,实际可以利用的间隙并不很多,不能够提取足够的数据。
(2)包络检测、频谱鉴别
从扩声现场拾取的音频信噪比信号中分辨噪声信号,沿噪声曲线保持适当的扩声声压。但因为实际应用中所应对的并不是典型的白噪声或粉红噪声,而是(至少包括)人群噪声,其包络不会同广播信号有重大差异;其频谱则会同广播信号互相交错。
(3)自适应回波消除方法
利用声学回波消除(AEC:Acoustic Echo Cancellation)模型和方法,将送给功放的信号作为参考信号,对现场采集到的信号进行自适应的回波消除处理,从而得到噪声信号,这种方法会受到现场混响和反射声的影响。
由于公共场合的主要噪声来源为人群噪声,而噪声信号(及现场混响)和广播信号物理特性差异不大,很难准确分离出噪声信号,这也是以上基于环境噪声识别的方法均不大理想的根本原因。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种扩声系统增益自适应控制方法,使得调整后的现场混合信号明显比原现场混合信号清晰,能够清楚地听到播放的内容。
为了达到上述目的,本发明采用以下技术方案:
本发明扩声系统增益自适应控制方法,该方法具体包括下述步骤:
S1、预设系统增益gain,并在播音室进行播音,直接在扩声系统的电路中拾取播放的扩声源信号;
S2、将所述扩声源信号与系统增益gain相乘,然后经过扩声系统中的扬声器播放;
S3、在扩声现场通过设置传声器来拾取现场扩声混合信号,即扩声源信号和系统增益的乘积再与声场脉冲卷积,然后与噪声信号相加后的信号;
S4、对现场扩声混合信号和扩声源信号进行幅度平方相干算法分析得到MSC函数值,并基于MSC函数值提取MSC信噪比表征值,再根据选定的函数关系利用MSC信噪比表征值计算出估计的现场信噪比;
S5、根据估计的现场信噪比调整扩声系统的增益gain,即根据前一段时间的数据来计算MSC信噪比表征值E,再根据前段时间的表征值利用函数估计出信噪比SNR,进而根据SNR来调整现在时刻的增益gain,并重复步骤S2-S5。
作为优选的技术方案,步骤S1中,系统增益gain预设值为0dB。
作为优选的技术方案,所述MSC函数值采用Welch谱估计法进行计算。
作为优选的技术方案,以选定频段内的MSC函数值的平均值作为MSC信噪比表征值。
作为优选的技术方案,步骤S4中,根据高斯拟合函数关系利用MSC信噪比表征值计算出估计的现场信噪比,具体如下:
通过改变人群噪声信号的大小,并与固定大小的测试语音进行混合可得到不同信噪比下的声场混合信号,再计算得出对应信噪比的MSC信噪比表征值,并得到高斯拟合曲线,所述MSC信噪比表征值的变化趋势如公式(5)式所示:
所述公式(5)中,SNR表示声场混合信号的信噪比,E是不同信噪比下对应的MSC信噪比表征值,N是高斯拟合的阶数,为正整数,且高斯拟合的阶数N的取值为一个大于等于4的正整数,an、bn、cn是由高斯拟合得出的常量参数,不同的高斯拟合阶数N计算得到的an、bn、cn各不相同,SNRthd是一个阈值,当信噪比大于等于此阈值时,MSC信噪比表征值恒定为1。
作为优选的技术方案,步骤S4中,根据三段分段函数关系利用MSC信噪比表征值计算出估计的现场信噪比,具体为:
用3段分段折线对高斯拟合曲线作近似的逼近,使得声场混合信号的信噪比与MSC信噪比表征值之间呈分段线性的函数关系,具体归纳为如下公式:
其中E是前述计算得出的帧MSC信噪比表征值,b1、b2、b3、k1、k2、k3是三段分段函数的参数,E1和E2是三段分段函数的两个分界点,SNR是利用3段分段一次函数计算得出的估计的声场信噪比,当计算得出帧MSC信噪比表征值以后,便可根据此公式计算得出估计的声场信噪比。
作为优选的技术方案,步骤S5具体为:
S51、设定期望的声场信噪比,该期望的声场信噪比可视现场情况由用户自行调整设定;
S52、计算当前帧扩声源信号的有效值,以dB为单位表示,将此有效值与一个定值进行相加,此定值为在一段播放时间内使相加后的值的峰值为0dB或为接近0且不大于0dB的一个值,该定值可由用户视情况自行设定。
S53、将步骤S51中设定的期望声场信噪比与步骤S52中得到的求和值进行相加,得出当前帧的期望信噪比,该当前帧的期望信噪比是一个变化的值,此值既与期望声场信噪比有关,亦随扩声源信号大小而变化;
S54、计算当前帧的期望信噪比与当前帧的估计信噪比的差值;
S55、当步骤S54中计算的值大于等于0,即当前帧的估计信噪比小于等于当前帧的期望信噪比时,说明此刻的扩声系统音量还没达到期望水平,需要提高系统增益,因而调整当前帧的增益gain为前一帧的增益加上步骤S54中的差值与Kp1和Ti的乘积,其中Kp1为系统增益提升速度,Ti为一帧数据的长度除以采样率得到的商;
S56、当步骤S54中计算的值小于0,即当前帧的估计信噪比大于当前帧的期望信噪比时,说明此刻扩声现场背景噪声成分很低,过高的播放音量有可能影响到现场声环境,造成声污染,所以应该降低系统增益,因而调整当前帧的增益gain等于前一帧的增益加上步骤S4中的差值与Kp2和Ti的乘积,所述Kp2为系统增益下降速度;
S57、最终得到的系统增益gain还要与MAX=30和MIN=0进行对比,若高于MAX,则认为系统增益超出量程造成失真,此时系统增益gain=MAX;若低于MIN,系统增益gain=MIN;否则,系统增益gain不更改;
S58、将最后得到的系统增益gain与下一帧的扩声源信号相乘。
作为优选的技术方案,步骤S51中,所述期望的声场信噪比取0到50dB之间的一个值,典型值为20dB。
作为优选的技术方案,步骤S52中,所述定值为0到140之间的一个值。
作为优选的技术方案,步骤S55、S56中,Kp1取0到10之间的一个值;Kp2取0到10之间的一个值;采样率为音频信号常用的值,典型值为8000Hz、16000Hz、44100Hz、48000Hz、96000Hz等;帧长为2的正整数次幂,典型值为128、256、512、1024等;故Ti=帧长/采样率。
本发明的原理为:
本发明是一种扩声系统增益自适应控制方法,通过幅度平方相干函数(MagnitudeSquared Coherence,MSC)计算扩声现场声音信号与扩声源信号频谱的相干性,以获得的MSC系数计算出MSC信噪比表征值,再根据一定的函数关系利用MSC信噪比表征值计算出估计的扩声现场信噪比,从而自适应调节扩声系统的增益。本发明提供的扩声系统增益自适应控制方法提出利用幅度平方相干函数(Magnitude Squared Coherence,MSC)估计扩声现场声音信号与扩声源信号频谱的相干性,来获得扩声现场信噪比(Signal to NoiseRatio,SNR)信息,使得扩声系统增益设置更加准确,扩声音量合适,在不增加声污染的情况下,扩声系统增益自适应调整后的扩声现场声音信号明显比未经过自适应调整的现场声音信号清晰。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明采用了数字信号处理技术,对现场扩声混合信号和扩声源信号进行幅度平方相干算法分析,提取MSC信噪比表征值,以此依据高斯拟合曲线或3段分段一次函数计算出估计的现场信噪比,进而根据估计的现场信噪比对系统增益大小进行调整。
2、本发明有效地解决了扩声系统播放音量固定的问题,使得扩声音量能随着环境噪声音量的变化自适应地进行调整。当环境噪声变大时,扩声音量能快速适量地增大,当环境噪声变小时,扩声音量能快速适量的降低,保证了扩声现场信噪比基本恒定。
3、本发明利用MSC信噪比表征值依据高斯拟合函数能准确地估计出当前扩声现场的信噪比,而且无需等待短暂且不确定的播音停顿音隙时刻来采集噪声信号以估计信噪比,实时性强。
4、本发明利用MSC信噪比表征值依据对高斯拟合函数逼近得出的3段分段线性函数能比较准确地估计出当前扩声现场的信噪比。与上所述第2条相比,同样由于无需等待短暂且不确定的播音停顿音隙时刻来采集噪声信号以估计信噪比,因此实时性强。另外,由于采用3段分段线性函数对扩声现场的信噪比进行估计,因此相比于上述第2条的高斯拟合函数具有更低的运算复杂度,易于在资源有限的硬件系统上实现。
5、本发明中,每一帧的期望信噪比既与设定的期望的声场信噪比有关,亦与当前帧的扩声源信号大小有关,这样做有效防止了在噪声大小不变的情况下,扩声源信号大小在一定动态范围内变化时而导致的系统增益错误地跟随扩声源信号大小变化而变化以至于降低了扩声源信号的动态范围的情况。同时也能有效防止扩声源信号处于静音段时系统增益错误大幅度地增大。
6、本发明中的系统增益采用反馈控制的调节方式,当前帧的系统增益既与当前的估计声场信噪比有关,亦与前一帧的系统增益有关,系统增益既能快速有效的进行调节,同时防止了系统增益突变的情况。另外,由于当前帧的系统增益是和当前帧估计的声场信噪比与当前帧期望的声场信噪比的差值有关,因此在当前帧估计的声场信噪比与当前帧期望的声场信噪比相差很远时,系统增益大幅度快速地进行调整,当当前帧估计的声场信噪比接近当前帧期望的声场信噪比时,系统增益进行小幅度缓慢地调整,有效防止系统增益调节过慢或过度调节的情况。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的不当限定,在附图中:
图1是本发明扩声现场声线示意图;
图2是本发明MSC算法设计步骤图;
图3是本发明自适应增益控制算法框图;
图4为本发明扩声源信号即录制的语音信号;
图5为本发明声场脉冲响应信号;
图6为本发明噪声信号选取噪声数据库NOISEX92_19k的人群噪声信号babble.wav;
图7为本发明现场混合信号(信噪比为0dB)为扩声源信号与声场脉冲响应卷积后得到的信号再与噪声信号相加得到;
图8为本发明信噪比为0dB、6dB、12dB和15dB时语音段的MSC系数;
图9为本发明信噪比为0dB、6dB、12dB和15dB时无声段的MSC系数;
图10(a)、图10(b)分别为本发明信噪比在0dB和15dB时计算得到的MSC信噪比表征值;
图11为本发明利用一段采集的测试语音与噪声数据库NOISEX92_19k的人群噪声信号计算得出的不同信噪比下MSC信噪比表征值及对其进行高斯拟合得出的曲线;
图12为本发明利用3段折线对图11进行简化后的曲线;
图13为本发明增益调整方案流程图;
图14~图17是在从无噪声跳变到信噪比为-10dB的恒定噪声再跳变到无噪声的噪声情况下,扩声源信号经过系统以后MSC信噪比表征值的曲线、自动增益调整曲线以及调整前后得到的现场混合信号的波形示意图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例
如图1所示,在现实场景中,由于扩声现场的混合信号是扩声源信号与现场的声传播途径参数卷积后得到的信号再加上噪声信号得来的,所以现场混合信号与扩声源信号具有较大的相关度,相关度大小取决于信噪比,当信噪比较低时,相关度较小;而当信噪比较高时,相关度较大。扩声源信号可以直接从功放采集,现场混合信号可通过在现场设置一个传声器来获取。上述信号均为实时信号,其相关度的实时检测是可行的,然后根据相关度来来估计信噪比,进而进行扩声系统增益的自适应调整。该方法不受到空隙时间的影响,实时性强;也避免了因为信号分离不当而导致的误判或错判。基于此思路,本发明提出了一种新的方法:利用幅度(幅值)平方相干函数(Magnitude Squared Coherence,MSC)计算现场声音信号与扩声源信号频谱的相干性,以获得的MSC系数作为MSC信噪比表征值来表征现场信噪比,从而自适应调节扩声系统增益。
幅度平方相干函数(MSC)
假定x1(n)和x2(n)是实数离散信号,且n=0,1,……,N-1。x1(n)的傅立叶变换为:
其中,频率fk=k/N,k=0,1,……,N-1。将x2(n)代入(1),可以得到X2(fk)。
定义幅度平方相干函数(MSC)为:
其中,是x1(n)和x2(n)的互谱,和分别是x1(n)和x2(n)的自谱。即:
MSC是在频域上描述两个信号相关程度的函数,在语音增强中有着重要的作用。容易得到,当且仅当x1(n)和x2(n)可以用线性系统互相表示时,当且仅当x1(n)和x2(n)独立或不相关时,
从上面的式子可以看出,计算MSC的关键在于对功率谱的计算。然而在实际中,要得到信号的功率谱是相当困难的,因此,产生了许多对信号的功率谱估计方法,如Welch谱估计法、MVDR谱估计法,等。由于Welch-MSC在实际应用中可以采用快速傅立叶变换(FFT:Fast Fourier Transform),计算量小,因而本发明采用Welch谱估计法来计算MSC值。
自适应增益控制的算法关键在于MSC算法的实现,MSC算法设计步骤如图2所示。作为输入的两组信号分别为扩声源信号和现场采集到的混合信号(含有直射声、反射声、混响以及背景噪声等信号),分别对两组信号进行分帧加窗(帧长为512,帧移为0,加矩形窗),再对每帧信号重新进行分段,加窗(帧长为128,帧移为64,加汉宁窗),计算每段的功率谱,相加求期望。最后根据公式(2),得到MSC系数。
如图3所示,自适应增益控制算法实现的基本步骤如下:
S1、预设系统增益gain,在播音室进行播音,直接在电路中拾取扩声源信号;
S2、将所述扩声源信号与初始系统增益gain相乘,然后经过扩声系统中的扬声器播放;
S3、扩声源信号与系统增益相乘经过扩声系统中的扬声器播放,在扩声现场通过设置传声器来拾取现场扩声混合信号,即扩声源信号和系统增益的乘积再与声场脉冲卷积,然后与噪声信号相加后的信号;
S4对扩声现场混合信号和扩声源信号进行幅度平方相干算法分析,提取MSC信噪比表征值,再根据选定的函数关系利用MSC信噪比表征值计算出估计的现场信噪比;
5)、根据估计的现场信噪比调整源系统的增益gain,即根据前一段时间的数据来计算MSC信噪比表征值E,再根据前段时间的表征值利用函数估计出信噪比SNR,进而根据SNR来调整现在时刻的增益gain,重复步骤2)。
注:当系统开始工作时,只需对扩声源信号整体进行1次延时处理即可
图4~图7是仿真信号的说明,信号的采样率均为44100Hz,量化位数16bits。图4为扩声源信号为录制的语音信号;图5为声场脉冲响应信号;图6为噪声信号选取噪声数据库NOISEX92_19k的人群噪声信号babble.wav;图7为现场混合信号(信噪比为0dB)为扩声源信号与声场脉冲响应卷积后得到的信号再与噪声信号相加得到。
《公共广播系统工程技术规范》(GB50526-2010)指出:紧急广播的信噪比应大于等于12dB。因此图8选择现场信噪比在0dB,6dB,12dB和15dB的情况下,计算得到的某一帧的语音段MSC系数。
因为语音频率范围主要集中在300~4000Hz(张雪英.数字语音信号处理及MATLAB仿真[M].北京:电子工业出版社.2011),因此主要关注在这个频段上MSC系数的变化情况。由图8可以看出,随着现场信噪比的提高,中低频范围内的MSC系数也不断的提高,当信噪比小的时候,MSC系数在此中低频的范围内相对比较小,当信噪比大的时候,MSC系数在此中低频的范围内相对比较大。同时可以从图上看出,在不同频点上,MSC系数各不相同,这是由于扩声源信号在不同频点上的能量各不相同。这表明了,MSC系数可以很好地用于表征现场信噪比,故可以从MSC系数中找出表征信噪比的参数,从而根据表征参数自适应地调整扩声系统的增益。
图9是现场信噪比在0dB,6dB,12dB和15dB的情况下,计算得到的某一帧的无声段MSC系数。无声段的MSC系数在语音频率集中分布的300~4000Hz范围内,主要集中在0.4以下,虽然随着信噪比的增大,无声段的MSC系数也会有少量的增大,但是幅值变化不明显,对比前面我们可以根据MSC系数很容易区分无声段和语音段。
帧MSC信噪比表征值
由图8可以看出,随着信噪比的提高,扩声源信号与现场混合信号的MSC系数也在提高,但同一帧里不同频率点上的MSC是不同的,所以必须由这些MSC系数归纳出一个能够表征该帧信噪比的参数来进行后续的扩声系统音量调整,该表征参数被称为“MSC信噪比表征值”。将不同信噪比下的MSC连接起来,可以看到低信噪比的MSC是被涵括在高信噪比的MSC之下。故本发明提出将一定频段内MSC系数的平均值作为MSC信噪比表征值E。公式如下:
由于本发明优先考虑人声的扩声,人声信号主要分布在300Hz到4000Hz,因此本实施例定义MSC信噪比表征值为0Hz到4300Hz(采样率为44100Hz、FFT点数为1024点的情况下,N1=0,N2=100)下,MSC系数的平均值。计算每一帧的帧MSC特征值,如图10(a)和图10(b)所示。
帧MSC信噪比表征值与声场信噪比对应函数关系
由于整个控制方法最终是通过估计的声场信噪比来自适应地调整扩声系统增益,因此必须找到帧MSC信噪比表征值与声场信噪比之间的对应函数关系。
(1)高斯拟合函数关系;
通过改变人群噪声信号的大小,并与固定大小的测试语音进行混合可得到不同信噪比下的声场混合信号,再根据前述的方法计算可得出对应信噪比的MSC信噪比表征值。如图11所示,图上各点是利用一段采集的测试语音与噪声数据库NOISEX92_19k的人群噪声信号计算得出的不同信噪比下MSC信噪比表征值。其中横坐标是声场混合信号的信噪比,单位是dB;纵坐标是不同信噪比下对应的MSC信噪比表征值。
图11中曲线是对各点进行高斯拟合得出的结果。其变化趋势可归纳为下式:
公式中SNR表示声场混合信号的信噪比,E是不同信噪比下对应的MSC信噪比表征值。N是高斯拟合的阶数,为正整数,n0一般取4。因此高斯拟合的阶数N一般取一个大于等于4的正整数。an、bn、cn是由高斯拟合得出的常量参数,不同的高斯拟合阶数N计算得到的an、bn、cn各不相同。SNRthd是一个阈值,当信噪比大于等于此阈值时,MSC信噪比表征值恒定为1。
(2)简化的3段分段线性函数关系;
从图11可以看出MSC信噪比表征值与声场混合信号的信噪比之间的变化关系,但实际应用过程中,此变化关系过于复杂,为了降低运算复杂度,用3段分段折线对图11的拟合曲线作近似的逼近,使得声场混合信号的信噪比与MSC信噪比表征值之间呈分段线性的函数关系。如图12所示,图中的3段折线是对图11曲线作近似逼近得出的曲线。
由于整个控制过程是先计算得到帧MSC信噪比表征值,再根据图中的曲线计算出估计的声场信噪比,因此可归纳为如下公式:
其中E是前述计算得出的帧MSC信噪比表征值,b1、b2、b3、k1、k2、k3是三段分段函数的参数,E1和E2是三段分段函数的两个分界点,SNR是利用3段分段一次函数计算得出的估计的声场信噪比。当计算得出帧MSC信噪比表征值以后,便可根据函数关系计算得出估计的声场信噪比。
本系统的调节属于反馈调节,由于扩声源信号经过系统调整播放以后,再利用麦克风拾取现场信号重新返回到系统存在一定的延时,因而系统实际是根据前一段时间的数据来计算MSC信噪比表征值E,再根据前段时间的表征值利用函数估计出信噪比SNR,进而根据SNR来调整现在时刻的增益gain。具体的调整方案如图13:
系统增益gain的预设值为0dB,根据估计的现场信噪比调整源系统的增益gain具体包括下述内容:
S51、首先设定期望的声场信噪比为20dB,此值可视现场情况由用户自行调整设定。
S52、计算当前帧扩声源信号的有效值,以dB为单位表示。将此有效值与一个定值进行相加,此定值为在一段播放时间内使相加后的值的峰值为0dB或为接近0且不大于0dB的一个值。本例中取此定值为42,具体可由用户视情况自行设定。
S53、将S51中设定的期望声场信噪比与S52中得到的求和值进行相加,得出当前帧的期望信噪比。可以看出当前帧的期望信噪比是一个变化的值,此值既与期望声场信噪比有关,亦随扩声源信号大小而变化,有效防止扩声源信号静音段增益过高的问题。
S54、计算当前帧的期望信噪比与当前帧的估计信噪比的差值。
S55、当S54中计算的值大于等于0,即当前帧的估计信噪比小于等于当前帧的期望信噪比时,说明此刻的扩声系统音量还没达到期望水平,需要提高系统增益,因而调整当前帧的增益gain为前一帧的增益加上S54中的差值与Kp1和Ti的乘积。其中Kp1为1.5,Ti为一帧数据的长度除以采样率得到的商(本例中采样率为44100Hz,帧长为512,Ti=512/44100)。
S56、当S54中计算的值小于0,即当前帧的估计信噪比大于当前帧的期望信噪比时,说明此刻扩声现场背景噪声成分很低,过高的播放音量有可能影响到现场声环境,造成声污染,所以应该降低系统增益,因而调整当前帧的增益gain等于前一帧的增益加上S54中的差值与Kp2和Ti的乘积。其中Kp2为1,Ti与S55中所述一致。
S57、最终得到的系统增益gain还要与MAX=30和MIN=0进行对比,若高于MAX,则认为系统增益超出量程造成失真,此时系统增益gain=MAX;若低于MIN,系统增益gain=MIN;否则,系统增益gain不更改。
S58、将最后得到的系统增益gain与下一帧的扩声源信号相乘。
图14~图17是在从无噪声跳变到信噪比为-10dB的恒定噪声再跳变到无噪声的噪声情况下,扩声源信号经过系统以后MSC信噪比表征值的曲线、自动增益调整曲线以及调整前后得到的现场混合信号的波形,其中图14为扩声源信号和从无噪声跳变到信噪比为-10dB的恒定噪声再跳变到无噪声变化人群噪声信号,图15为图14描述的噪声情况下扩声源信号经过系统后每帧的MSC信噪比表征值,图16为图14描述的噪声情况下经过系统后的自动增益调整曲线,图17为图14描述的噪声情况下经过系统调整前后的现场混合信号。
对比图14~图17可以清楚地看到,通过增益调节方案后,系统增益随着噪声的变化而调整,现场混合信号从原来难以分辨扩声源信号变成基本能分辨出扩声源信号。从听音上来说,声压级调整后的现场混合信号明显比原现场混合信号清晰,能够清楚地听到扩声的内容。
本实施例的结果表明利用MSC信噪比表征值来估计现场信噪比是可行的。当现场信噪比发生变化时,在0~4300Hz范围内,扩声源信号与现场混合信号的MSC系数也随之变化,且信噪比提高的时候,MSC系数也随之提高。接下来,本实施例定义了MSC信噪比表征值用于间接表征现场信噪比信息,并根据提出的函数估计出现场信噪比,进而根据估计现场信噪比进行了增益调整。本设计在信噪比比较低的情况下比较适用,而且它运算量比较少,易于程序的移植和DSP硬件的实现。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (10)
1.扩声系统增益自适应控制方法,其特征在于,该方法具体包括下述步骤:
S1、预设系统增益gain,并在播音室进行播音,直接在扩声系统的电路中拾取播放的扩声源信号;
S2、将所述扩声源信号与系统增益gain相乘,然后经过扩声系统中的扬声器播放;
S3、在扩声现场通过设置传声器来拾取现场扩声混合信号,即扩声源信号和系统增益的乘积再与声场脉冲卷积,然后与噪声信号相加后的信号;
S4、对现场扩声混合信号和扩声源信号进行幅度平方相干算法分析得到MSC函数值,并基于MSC函数值提取MSC信噪比表征值,再根据选定的函数关系利用MSC信噪比表征值计算出估计的现场信噪比;
S5、根据估计的现场信噪比调整扩声系统的增益gain,即根据前一段时间的数据来计算MSC信噪比表征值E,再根据前段时间的表征值利用函数估计出信噪比SNR,进而根据SNR来调整现在时刻的增益gain,并重复步骤S2-S5。
2.根据权利要求1所述扩声系统增益自适应控制方法,其特征在于,步骤S1中,系统增益gain预设值为0dB。
3.根据权利要求1所述扩声系统增益自适应控制方法,其特征在于,所述MSC函数值采用Welch谱估计法进行计算。
4.根据权利要求1所述扩声系统增益自适应控制方法,其特征在于,以选定频段内的MSC函数值的平均值作为MSC信噪比表征值。
5.根据权利要求1所述扩声系统增益自适应控制方法,其特征在于,步骤S4中,根据高斯拟合函数关系利用MSC信噪比表征值计算出估计的现场信噪比,具体如下:
通过改变人群噪声信号的大小,并与固定大小的测试语音进行混合可得到不同信噪比下的声场混合信号,再计算得出对应信噪比的MSC信噪比表征值,并得到高斯拟合曲线,所述MSC信噪比表征值的变化趋势如公式(5)式所示:
所述公式(5)中,SNR表示声场混合信号的信噪比,E是不同信噪比下对应的MSC信噪比表征值,N是高斯拟合的阶数,为正整数,且高斯拟合的阶数N的取值为一个大于等于4的正整数,an、bn、cn是由高斯拟合得出的常量参数,不同的高斯拟合阶数N计算得到的an、bn、cn各不相同,SNRthd是一个阈值,当信噪比大于等于此阈值时,MSC信噪比表征值恒定为1。
6.根据权利要求1所述扩声系统增益自适应控制方法,其特征在于,步骤S4中,根据三段分段函数关系利用MSC信噪比表征值计算出估计的现场信噪比,具体为:
用3段分段折线对高斯拟合曲线作近似的逼近,使得声场混合信号的信噪比与MSC信噪比表征值之间呈分段线性的函数关系,具体归纳为如下公式:
其中E是前述计算得出的帧MSC信噪比表征值,b1、b2、b3、k1、k2、k3是三段分段函数的参数,E1和E2是三段分段函数的两个分界点,SNR是利用3段分段一次函数计算得出的估计的声场信噪比,当计算得出帧MSC信噪比表征值以后,便可根据此公式计算得出估计的声场信噪比。
7.根据权利要求1所述扩声系统增益自适应控制方法,其特征在于,步骤S5具体为:
S51、设定期望的声场信噪比,该期望的声场信噪比可视现场情况由用户自行调整设定;
S52、计算当前帧扩声源信号的有效值,以dB为单位表示,将此有效值与一个定值进行相加,此定值为在一段播放时间内使相加后的值的峰值为0dB或为接近0且不大于0dB的一个值,该定值可由用户视情况自行设定。
S53、将步骤S51中设定的期望声场信噪比与步骤S52中得到的求和值进行相加,得出当前帧的期望信噪比,该当前帧的期望信噪比是一个变化的值,此值既与期望声场信噪比有关,亦随扩声源信号大小而变化;
S54、计算当前帧的期望信噪比与当前帧的估计信噪比的差值;
S55、当步骤S54中计算的值大于等于0,即当前帧的估计信噪比小于等于当前帧的期望信噪比时,说明此刻的扩声系统音量还没达到期望水平,需要提高系统增益,因而调整当前帧的增益gain为前一帧的增益加上步骤S54中的差值与Kp1和Ti的乘积,其中Kp1为系统增益提升速度,Ti为一帧数据的长度除以采样率得到的商;
S56、当步骤S54中计算的值小于0,即当前帧的估计信噪比大于当前帧的期望信噪比时,说明此刻扩声现场背景噪声成分很低,过高的播放音量有可能影响到现场声环境,造成声污染,所以应该降低系统增益,因而调整当前帧的增益gain等于前一帧的增益加上步骤S4中的差值与Kp2和Ti的乘积,所述Kp2为系统增益下降速度;
S57、最终得到的系统增益gain还要与MAX=30和MIN=0进行对比,若高于MAX,则认为系统增益超出量程造成失真,此时系统增益gain=MAX;若低于MIN,系统增益gain=MIN;否则,系统增益gain不更改;
S58、将最后得到的系统增益gain与下一帧的扩声源信号相乘。
8.根据权利要求1所述扩声系统增益自适应控制方法,其特征在于,步骤S51中,所述期望的声场信噪比取0到50dB之间的一个值,典型值为20dB。
9.根据权利要求1所述扩声系统增益自适应控制方法,其特征在于,步骤S52中,所述定值为0到140之间的一个值。
10.根据权利要求1所述扩声系统增益自适应控制方法,其特征在于,步骤S55、S56中,Kp1取0到10之间的一个值;Kp2取0到10之间的一个值;采样率为音频信号常用的值,典型值为8000Hz、16000Hz、44100Hz、48000Hz、96000Hz等;帧长为2的正整数次幂,典型值为128、256、512、1024等;故Ti=帧长/采样率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810592382.XA CN108632711B (zh) | 2018-06-11 | 2018-06-11 | 扩声系统增益自适应控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810592382.XA CN108632711B (zh) | 2018-06-11 | 2018-06-11 | 扩声系统增益自适应控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108632711A true CN108632711A (zh) | 2018-10-09 |
CN108632711B CN108632711B (zh) | 2020-09-04 |
Family
ID=63691508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810592382.XA Active CN108632711B (zh) | 2018-06-11 | 2018-06-11 | 扩声系统增益自适应控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108632711B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110045333A (zh) * | 2019-04-12 | 2019-07-23 | 上海工程技术大学 | 一种基于卡尔曼滤波的声源三维定位方法 |
CN110856072A (zh) * | 2019-12-04 | 2020-02-28 | 北京声加科技有限公司 | 一种耳机通话降噪方法及耳机 |
CN111328008A (zh) * | 2020-02-24 | 2020-06-23 | 广州市迪士普音响科技有限公司 | 一种基于扩声系统的声压级智能控制方法 |
CN111383647A (zh) * | 2018-12-28 | 2020-07-07 | 展讯通信(上海)有限公司 | 语音信号处理方法及装置、可读存储介质 |
CN112616109A (zh) * | 2020-11-19 | 2021-04-06 | 广州市保伦电子有限公司 | 一种广播噪声检测音量自动调节方法、服务器和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1737271A1 (en) * | 2005-06-23 | 2006-12-27 | AKG Acoustics GmbH | Array microphone |
CN101790752A (zh) * | 2007-09-28 | 2010-07-28 | 高通股份有限公司 | 多麦克风声音活动检测器 |
CN104716917A (zh) * | 2015-01-15 | 2015-06-17 | 广州大学 | 公共广播声压自适应控制方法 |
US20160198275A1 (en) * | 2002-03-25 | 2016-07-07 | Bose Corporation | Automatic audio system equalizing |
CN108134976A (zh) * | 2017-12-20 | 2018-06-08 | 江苏中协智能科技有限公司 | 一种感知噪声并自动调节音量的广播装置 |
-
2018
- 2018-06-11 CN CN201810592382.XA patent/CN108632711B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160198275A1 (en) * | 2002-03-25 | 2016-07-07 | Bose Corporation | Automatic audio system equalizing |
EP1737271A1 (en) * | 2005-06-23 | 2006-12-27 | AKG Acoustics GmbH | Array microphone |
CN101790752A (zh) * | 2007-09-28 | 2010-07-28 | 高通股份有限公司 | 多麦克风声音活动检测器 |
CN104716917A (zh) * | 2015-01-15 | 2015-06-17 | 广州大学 | 公共广播声压自适应控制方法 |
CN108134976A (zh) * | 2017-12-20 | 2018-06-08 | 江苏中协智能科技有限公司 | 一种感知噪声并自动调节音量的广播装置 |
Non-Patent Citations (3)
Title |
---|
M. TEJUS ADIGA: "Improving single frequency filtering based Voice Activity Detection (VAD) using spectral subtraction based noise cancellation", 《2016 INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING, COMMUNICATION, POWER AND EMBEDDED SYSTEM (SCOPES) 》 * |
李银永: "基于曲线拟合的信噪比估计方法研究", 《数字通信世界》 * |
王杰,杨广权等: "基于互相关函数的电声系统延时测量方法", 《广州大学学报( 自然科学版)》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111383647A (zh) * | 2018-12-28 | 2020-07-07 | 展讯通信(上海)有限公司 | 语音信号处理方法及装置、可读存储介质 |
CN111383647B (zh) * | 2018-12-28 | 2022-10-25 | 展讯通信(上海)有限公司 | 语音信号处理方法及装置、可读存储介质 |
CN110045333A (zh) * | 2019-04-12 | 2019-07-23 | 上海工程技术大学 | 一种基于卡尔曼滤波的声源三维定位方法 |
CN110856072A (zh) * | 2019-12-04 | 2020-02-28 | 北京声加科技有限公司 | 一种耳机通话降噪方法及耳机 |
CN111328008A (zh) * | 2020-02-24 | 2020-06-23 | 广州市迪士普音响科技有限公司 | 一种基于扩声系统的声压级智能控制方法 |
CN112616109A (zh) * | 2020-11-19 | 2021-04-06 | 广州市保伦电子有限公司 | 一种广播噪声检测音量自动调节方法、服务器和系统 |
CN112616109B (zh) * | 2020-11-19 | 2022-03-08 | 广州市保伦电子有限公司 | 一种广播噪声检测音量自动调节方法、服务器和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108632711B (zh) | 2020-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108632711B (zh) | 扩声系统增益自适应控制方法 | |
CN104471855B (zh) | 具有噪声检测和响度下降检测的响度控制 | |
US7302062B2 (en) | Audio enhancement system | |
US20130030800A1 (en) | Adaptive voice intelligibility processor | |
US20080137874A1 (en) | Audio enhancement system and method | |
US6718301B1 (en) | System for measuring speech content in sound | |
US10374564B2 (en) | Loudness control with noise detection and loudness drop detection | |
Perez-Gonzalez et al. | Automatic gain and fader control for live mixing | |
JPH09503590A (ja) | 会話の品質向上のための背景雑音の低減 | |
US10319389B2 (en) | Automatic timbre control | |
CN113766073A (zh) | 会议系统中的啸叫检测 | |
KR20160113224A (ko) | 오디오 신호를 압축하는 오디오 압축 시스템 | |
US20050246170A1 (en) | Audio signal processing apparatus and method | |
CN105869656B (zh) | 一种语音信号清晰度的确定方法及装置 | |
Yang et al. | Deep learning based automatic volume control and limiter system | |
CN115579016B (zh) | 一种声学回声消除的方法和系统 | |
CN104716917B (zh) | 公共广播声压自适应控制方法 | |
US10135413B2 (en) | Automatic timbre control | |
EP3830823A1 (en) | Forced gap insertion for pervasive listening | |
Jeub et al. | Blind Dereverberation for Hearing Aids with Binaural Link. | |
Thomas et al. | Automated suppression of howling noise using sinusoidal model based analysis/synthesis | |
CN115881080B (zh) | 一种语音通信系统中的声反馈处理方法及装置 | |
CN114242092A (zh) | 一种监控环境中提高语音播报扩声增益的智能处理方法和系统 | |
CN116964665A (zh) | 提高去混响的感知质量 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |