CN111933173B - 一种增益平稳调节的动态范围控制方法及系统 - Google Patents

一种增益平稳调节的动态范围控制方法及系统 Download PDF

Info

Publication number
CN111933173B
CN111933173B CN202010767816.2A CN202010767816A CN111933173B CN 111933173 B CN111933173 B CN 111933173B CN 202010767816 A CN202010767816 A CN 202010767816A CN 111933173 B CN111933173 B CN 111933173B
Authority
CN
China
Prior art keywords
gain
actual
curve
expected
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010767816.2A
Other languages
English (en)
Other versions
CN111933173A (zh
Inventor
王青云
梁瑞宇
余兵
唐闺臣
包永强
谢跃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Institute of Technology
Original Assignee
Nanjing Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Institute of Technology filed Critical Nanjing Institute of Technology
Priority to CN202010767816.2A priority Critical patent/CN111933173B/zh
Publication of CN111933173A publication Critical patent/CN111933173A/zh
Application granted granted Critical
Publication of CN111933173B publication Critical patent/CN111933173B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

本发明公开了一种增益平稳调节的动态范围控制算法及系统,涉及音频信号处理技术领域,根据实际动态范围控制程度的需要,给定增益曲线相关参数,参数包括过渡段的起始点、过渡段的带宽及压缩段的斜率,通过求出过渡段曲线方程的未知参数,进而得出整个增益曲线;根据输入语音信号的幅度大小及增益曲线确定实时增益,通过期望增益和实际增益的平稳调节,确保参与运算的增益平稳变化。本发明的方法通过数据缓存,进一步确保增益能够跟上当前点数据对增益的需要,使得结果准确,与经典DRC算法相较,本发明所用方法的突出优势在于能够较小失真地对原始音频信号进行缩放处理,不会对后续功能模块造成影响。

Description

一种增益平稳调节的动态范围控制方法及系统
技术领域
本发明涉及声音信号处理技术控制领域,具体涉及一种增益平稳调节的动态范围控制算法及系统。
背景技术
动态范围控制技术是在使用声音信号之前人为地对大幅度信号进行压缩来避免出现削波失真,同时放大小幅度信号使其容易被人耳感知的技术。在模拟电路盛行的时期,对语音信号动态范围的调整是通过将电流分成两条线路分别进行调幅整流来实现的。
进入20世纪90年代,数字信号处理技术的广泛应用使得动态范围控制器也开始走向数字化。动态范围控制涵盖压缩器、限幅器、扩展器、噪声门等多种动态处理器,既可以分开使用,也可以根据需求将各种动态处理器进行合理的组合。
经典的动态范围控制算法是根据输入信号与增益曲线实时地更新增益。尽管有增益平滑的过程,但是由于增益是严格按照输入信号的幅度实时变化的,所以增益的波动会比较大,进而影响声音信号的音质。
申请号为201610371874.7的中国专利,公开了一种应用于语音识别前端的音频增益调整方法和装置,调整方法包括:接收音频数据;对所述音频数据进行AGC处理;对AGC处理后的音频数据进行DRC处理,其目的在于克服有效放大幅值较小的语音信号,提高音频增益效果,但此方法获得增益平稳变化效果仍不够理想。
发明内容
技术目的:为了解决经典的动态范围控制算法存在增益波动较大,导致语音信号音质受损的问题,本发明提供了一种增益平稳调节的动态范围控制算法及系统,能够不失真地对声音信号的幅度进行控制,对大信号的幅度能够很好地进行限制。
技术方案:为了达到上述目的,本发明所采用的技术方案是:
一种增益平稳调节的动态范围控制算法,其特征在于,包括以下步骤,
A、设计一条能够根据实际需要进行增益调节的增益曲线;
B、对输入语音信号进行分帧,对于一帧信号的每一个点,根据输入语音信号的幅度大小及增益曲线确定实时增益Gr,比较实时增益Gr与期望增益Ge的大小关系,计算期望增益变化率Re,根据期望增益变化率Re更新期望增益Ge的值,更新后的期望增益Ge用于计算下一个点的实时增益Gr;
C、对于一帧信号的每一个点,根据实际增益变化率Ra更新实际增益Ga的值;对获得的实际增益Ga做反规格化处理,得到的结果作为最终参与计算的增益g;
D、循环操作步骤B和步骤C,对一帧信号的所有采样点逐个处理,处理结束后,将最后得到的期望增益Ge做规格化处理,得到规格化后的期望增益Gn,比较实际增益Ga与规格化后的期望增益Gn的大小关系,求实际增益变化率Ra。
优选地,步骤A中,增益曲线包括直通段、过渡段和压缩段三个部分,增益曲线的设计步骤包括:根据动态范围控制要求,设定过渡段的起始点和结束点的坐标、以及压缩段的斜率;过渡段与压缩段在交点处的斜率相等,根据设定的参数,求出过渡段的过渡曲线方程;确定整个增益曲线方程。
优选地,步骤A中,增益曲线在对数坐标下建立,设定过渡段的开始点和结束点的线性横坐标分别为x0、x1,过渡曲线方程为公式(1):
Figure GDA0003387873380000021
设定压缩段的斜率为kc,压缩段的曲线方程为公式(2):
Figure GDA0003387873380000022
压缩段的斜率的线性方程为公式(3):
Figure GDA0003387873380000023
增益曲线平滑连接时,过渡段与压缩段在交点处的斜率相等,结合过渡曲线和压缩曲线方程求出参数k的值,求出整条增益曲线的形式。
优选地,步骤B中,对于一帧信号的每一个点,设定幅度的阈值T,根据输入语音信号的幅度大小及增益曲线确定实时增益Gr,如公式(4)所述:
Figure GDA0003387873380000024
其中,A1为输入语音信号的幅度A1,A2为将输入语音信号的幅度A1代入增益曲线,得到的输出语音信号的幅度A2。
优选地,步骤B中,比较实时增益Gr与期望增益Ge的大小关系,确定期望增益变化率Re,如公式(5)所述:
Figure GDA0003387873380000031
根据变化率Re更新期望增益Ge,如公式(6)所述:
Ge=Ge+(Gr-Ge)*Re (6)
其中Tsr表示饱和释放时间,fs表示采样率。
优选地,步骤C中,根据实际增益变化率Ra更新实际增益Ga,如公式(7)所述:
Figure GDA0003387873380000032
对获得的实际增益做反规格化处理,其反规格化后的增益Gad,如公式(8)所述:
Figure GDA0003387873380000033
最终参与计算的增益g,如公式(9)所述:
Figure GDA0003387873380000034
其中,Gp表示后增益,参数ful是将常数1代入增益曲线得到的输出。
优选地,步骤D中,对最后得到的期望增益的值Ge做规格化处理得到规格化后的期望增益Gn,如公式(10)所述:
Figure GDA0003387873380000035
先将实际增益Ga与规格化后的期望增益Gn的比值转化为dB值,设为变量Ran,如公式(11)所述:
Figure GDA0003387873380000036
若Ran<0,说明实际增益Ga小于规格化后的期望增益Gn;实际增益的变化率Ra的更新公式如公式(12)所述:
Figure GDA0003387873380000037
其中,spa表示一个常量;
若Ran>0,说明实际增益Ga大于规格化后的期望增益Gn,记录Ran的最大值,保存至变量Mran中。
优选地,步骤D中,在Ran<0的情况中,Mran更新为-1,否则Mran的值总是记录Ran>0时候Ran的最大值;并且当Mran<0.5时设置成0.5,则实际增益的变化率Ra的更新公式如公式(13)所述:
Figure GDA0003387873380000041
其中fs是采样率,Ta是攻击时间。
优选地,步骤D中,将处理过后的Ran值作为输入代入一个3次函数y=ax3+bx2+cx+d中得到释放的样点数resamps;其中三次函数经过点(0,y1)、(1,y2)、(2,y3)、(3,y4),其中纵坐标的单位长度是总释放样点数St,总释放样点数St的表达式如公式(14)所示:
St=fs*Tr (14)
其中fs表示采样率,Tr表示释放时间,y1、y2、y3、y4是四个介于0和1之间的常数。
一种增益平稳调节的动态范围控制系统,用于所述方法,其特征在于:包括音频信号获取模块、比较和计算模块和调节模块;其中,
音频信号获取模块,用于接收音频信号并进行预处理;
比较和计算模块,处理内容包括比较实时增益Gr与期望增益Ge的大小、实际增益Ga与规格化后的期望增益Gn的大小,计算期望增益变化率Re、比较求实际增益变化率Ra和更新期望增益Ge的值;
调节模块,用于根据比较和计算模块输出的结果,调节所述音频信号的增益。
技术效果:由于采用了上述技术方案,本发明具有如下技术效果:
1)、本发明的方法能够根据实际动态范围控制程度的需要,通过给定增益曲线相关参数,包括过渡段的起始点、过渡段的带宽及压缩段的斜率,求出过渡曲线方程的未知参数,进而得出整个增益曲线;利用增益曲线,实现对音频信号的期望增益和实际增益的平稳调节,确保参与运算的增益平稳变化;
2)、本发明的方法通过数据缓存,进一步确保增益能够跟上当前点数据对增益的需要,使得结果准确,与经典DRC算法相较,其突出优势在于能够不失真地对原始音频信号进行缩放处理,不会对后续功能模块造成影响。
3)本发明能够不失真地对声音信号的幅度进行控制,对小信号可以放大5dB-6dB,对大信号的幅度能够很好地进行限制。
附图说明
图1是本发明的一种增益平稳调节的动态范围控制简单算法流程图;
图2是期望增益Ge的实现流程图;
图3是实际增益Ga的实现流程图;
图4是三次函数曲线示意图;
图5是DRC处理过后时域波形对比图。
具体实施方式
如图1所示,本发明的一种增益平稳调节的动态范围控制算法包括以下步骤。
步骤A,设计一条可以根据实际需要进行调节的可变增益曲线;
步骤B,对于一帧信号的每一个点,根据输入语音信号的幅度大小及增益曲线确定实时增益Gr,比较实时增益Gr与期望增益Ge的大小关系,求期望增益变化率Re,根据期望增益变化率更新期望增益的值;
步骤C,对于一帧信号的每一个点,根据实际增益变化率Ra更新实际增益的值;根据获得的实际增益,做一个反规格化处理,此时可以选择再乘上一个主增益,得到最终参与计算的增益g;主增益是一个与增益曲线有关的参数;
步骤D,一帧信号结束后,将最后得到的期望增益的值Ge做一个规格化处理得到规格化后的期望增益Gn,比较实际增益Ga与规格化后的期望增益Gn的大小关系,求实际增益变化率Ra。
本发明的一种增益平稳调节的动态范围控制算法的步骤A中,增益曲线是在对数坐标下表示的,分成三个部分,“直通段”、“过渡段”、“压缩段”。
增益曲线的“过渡段”的起始点的线性值为x0,其线性方程如公式(1)所述:
Figure GDA0003387873380000051
其中k为参数,由增益曲线的“压缩段”在对数坐标下的斜率kc决定。
过渡曲线结束点的坐标为(x1,y1),那么第三段压缩曲线线性方程如公式(2)所示:
20log10y=kc*(20log10x-20log10x1)+20log10y1 (2)
化简为公式(3)所示:
Figure GDA0003387873380000052
其斜率的线性方程如公式(4)所示:
Figure GDA0003387873380000061
令增益曲线的“过渡段”与“压缩段”在交点处的斜率相等,即满足公式(5):
Figure GDA0003387873380000066
Figure GDA0003387873380000062
代入公式(5),得到公式(6):
Figure GDA0003387873380000063
只要知道增益曲线的“压缩段”在对数坐标下的斜率kc,以及增益曲线“过渡段”的起始点和结束点两个线性横坐标x0、x1,即可确定参数k,从而确定整条增益曲线的形式。
步骤B中,对于一帧信号的每一个点,根据输入语音信号的幅度大小及增益曲线确定实时增益Gr,比较实时增益Gr与期望增益Ge的大小关系,求期望增益变化率Re,根据期望增益变化率更新期望增益的值,其原理流程图如图2所示。
如前述步骤B所述,输入信号幅值A1小于某个阈值T,则将实时增益Gr设置为1;若其幅值大于某个阈值,则实时增益Gr由增益曲线的输出A2与输入信号的幅值A1的比值确定,即:
Figure GDA0003387873380000064
如前述步骤B所述,比较实时增益Gr与期望增益Ge的大小关系,求变化率Re;当实时增益Gr大于期望增益Ge时,变化率Re是实时增益Gr的函数,实时增益越小,变化率越大,反之则越小;当实时增益Gr小于期望增益Ge时,变化率Re设置为1即:
Figure GDA0003387873380000065
其中Tsr是饱和释放时间。
如前述步骤B所述,根据期望增益变化率Re更新期望增益Ge的值,其更新方程如公式9所述:
Ge=Ge+(Gr-Ge)*Re (9)
步骤C中,根据实际增益变化率Ra更新实际增益Ga的值,其更新公式如式(10)所述:
Figure GDA0003387873380000071
根据获得的实际增益,做一个反规格化处理,其反规格化后的增益Gad如公式(11)所述:
Figure GDA0003387873380000072
最终参与计算的增益g如公式(12)所述:
Figure GDA0003387873380000073
其中,Gp是后增益,一般设置为0dB。参数ful是将常数1代入增益曲线得到的输出,1是横坐标,ful是对应的纵坐标。
步骤D中,一帧信号结束后,将最后得到的期望增益的值Ge做一个规格化处理得到规格化后的期望增益Gn,如公式(13)所述:
Figure GDA0003387873380000074
如前述步骤D所述,一帧信号结束后,比较实际增益Ga与规格化后的期望增益Gn的大小关系,求实际增益变化率Ra;先将实际增益Ga与规格化后的期望增益Gn的比值转化为dB值,设为变量Ran,如公式(14)所述:
Figure GDA0003387873380000075
如前述步骤D所述,若Ran<0,说明实际增益Ga小于规格化后的期望增益Gn,将Ran的值限制在-12到0之间,也即小于-12的Ran值都作-12处理。将区间限制后的Ran值整体加上12,再乘上0.25,此时Ran的区间范围是0到4之间。
然后将处理过后的Ran值作为输入代入一个3次函数y=ax3+bx2+cx+d中得到释放的样点数resamps。其中三次函数经过点(0,y1)、(1,y2)、(2,y3)、(3,y4),如图4所示,其中纵坐标的单位是总释放样点数St,其表达式如公式(15)所示:
St=fs*Tr (15)
其中fs是采样率,Tr是释放时间,例如0.25s,y1、y2、y3、y4是四个介于0到1之间的常数。
若Ran<0,则实际增益的变化率Ra的更新公式如公式(16)所述:
Figure GDA0003387873380000076
其中,spa是一个常量,例如5。
若Ran>0,说明实际增益Ga大于规格化后的期望增益Gn。记录Ran的最大值,保存至变量Mran中。在Ran<0的情况中,Mran更新为-1,否则Mran的值总是记录Ran>0时候Ran的最大值;并且当Mran<0.5时设置成0.5,则实际增益的变化率Ra的更新公式如公式(17)所述:
Figure GDA0003387873380000081
其中fs是采样率,Ta是攻击时间,例如0.003,相比较于释放时间Tr,攻击时间更短。
一般的增益曲线要根据情况设计,本发明的算法中,增益曲线只要给定3个参数,就能自动生成曲线,不需要调节。实时增益是根据输入信号的幅度与增益曲线得到的一个增益,期望增益是根据实时增益不断更新得到的。本发明可通过采用一个环形缓冲区,将与实际增益相乘的数据从所述环形缓冲区里面读取,然后获取的数据也存储在所述环形缓冲区里,所以如果取数据指针滞后于写数据指针一段长度,那么当前实际增益对应的数据就是历史数据,而若干点后的实际增益对应的是当前点数据,这样就实现了实际增益与数据的匹配。本发明通过数据缓存,进一步确保增益能够跟上当前点数据对增益的需要,使得结果准确。即本发明采用的方法,通过在前一帧根据输入信号和增益曲线确定实时增益,然后根据实时增益更新期望增益,在处理下一帧信号时,以前一帧算出的期望增益为标准,来更新实际用于输入此信号幅度变化的实际增益;实际增益的变化率是由实际增益和期望增益的大小关系决定的,实际增益的变化率又反过来更新实际增益,实际增益与实际增益的变化率是相辅相成的,使得结果准确。
图5是用本发明的DRC算法处理过后的波形与原时域波形的对比图,其中上面为输入信号时域波形图,下图为用本发明的DRC算法处理过后的波形。
综上所述,本发明的一种增益平稳调节的动态范围控制算法,根据实际动态范围控制程度的需要,给定曲线相关参数,包括过渡段的起始点,过渡带的带宽及压缩段的斜率,求出过渡曲线方程的未知参数,进而得出整个增益曲线。通过期望增益和实际增益的平稳调节,确保参与运算的增益平稳变化。通过数据缓存,进一步确保增益能够跟上当前点数据对增益的需要,使得结果准确。本发明区别于经典DRC算法的突出优势在于它能够不失真地对原始音频信号进行缩放处理,不会对后续功能模块造成影响。
以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种增益平稳调节的动态范围控制方法,其特征在于,包括以下步骤,
A、设计一条能够根据实际需要进行增益调节的增益曲线;
B、对输入语音信号进行分帧,对于一帧信号的每一个点,根据输入语音信号的幅度大小及增益曲线确定实时增益Gr,比较实时增益Gr与期望增益Ge的大小关系,计算期望增益变化率Re,根据期望增益变化率Re更新期望增益Ge的值;
C、对于一帧信号的每一个点,根据实际增益变化率Ra更新实际增益Ga的值;对获得的实际增益Ga做反规格化处理,得到的结果作为最终参与计算的增益g;
其中,所述实际增益Ga是实际用于输入信号幅度变化的增益,所述实际增益变化率Ra是在对上一帧信号处理时计算获得,即将上一帧信号的最后一个点得到的期望增益Ge做规格化处理,得到规格化后的期望增益Gn,比较上一帧信号的最后一个点的实际增益Ga与规格化后的期望增益Gn的大小关系,求得用于当前帧信号的实际增益变化率Ra;
D、循环操作步骤B和步骤C,对一帧信号的所有采样点逐个处理,一帧信号处理结束后,将最后一个点得到的期望增益Ge做规格化处理,得到规格化后的期望增益Gn,比较实际增益Ga与规格化后的期望增益Gn的大小关系,求用于下一帧信号处理的实际增益变化率Ra。
2.根据权利要求1所述的一种增益平稳调节的动态范围控制方法,其特征在于:步骤A中,增益曲线包括直通段、过渡段和压缩段三个部分,增益曲线的设计步骤包括:根据动态范围控制要求,设定过渡段的起始点和结束点的坐标、以及压缩段的斜率;过渡段与压缩段在交点处的斜率相等,根据设定的参数,求出过渡段的过渡曲线方程;确定整个增益曲线方程。
3.根据权利要求2所述的一种增益平稳调节的动态范围控制方法,其特征在于:步骤A中,设定过渡段的开始点和结束点的线性横坐标分别为x0、x1,纵坐标为y0、y1,过渡曲线方程(x,y)为公式(1):
Figure FDA0003387873370000011
其中k为参数;
过渡曲线结束点的坐标为(x1,y1),压缩曲线线性方程如公式(2)所示:
Figure FDA0003387873370000012
kc为压缩曲线与斜率有关的常数;
压缩曲线的斜率的线性方程为公式(3):
Figure FDA0003387873370000021
增益曲线平滑连接时,过渡段与压缩段在交点处的斜率相等,结合过渡曲线和压缩曲线方程求出参数k的值,求出整条增益曲线。
4.根据权利要求1所述的一种增益平稳调节的动态范围控制方法,其特征在于:步骤B中,对于一帧信号的每一个点,设定幅度的阈值T,根据输入语音信号的幅度大小及增益曲线确定实时增益Gr,如公式(4)所示:
Figure FDA0003387873370000022
其中,A1为输入语音信号的幅度,A2为将输入语音信号的幅度A1代入增益曲线,得到的输出语音信号的幅度。
5.根据权利要求4所述的一种增益平稳调节的动态范围控制方法,其特征在于:步骤B中,比较实时增益Gr与期望增益Ge的大小关系,确定期望增益变化率Re,如公式(5)所示:
Figure FDA0003387873370000023
根据期望增益变化率Re更新期望增益Ge,如公式(6)所示:
Ge=Ge+(Gr-Ge)*Re (6)
其中Tsr表示饱和释放时间,fs表示采样率。
6.根据权利要求1所述的一种增益平稳调节的动态范围控制方法,其特征在于:步骤C中,根据实际增益变化率Ra更新实际增益Ga,如公式(7)所示:
Figure FDA0003387873370000024
对获得的实际增益Ga做反规格化处理,其反规格化后的增益Gad,如公式(8)所示:
Figure FDA0003387873370000025
最终参与计算的增益g,如公式(9)所示:
Figure FDA0003387873370000026
其中,Gp表示后增益,参数ful是将常数1代入增益曲线得到的输出。
7.根据权利要求1所述的一种增益平稳调节的动态范围控制方法,其特征在于:步骤D中,对最后得到的期望增益Ge做规格化处理得到规格化后的期望增益Gn,如公式(10)所示:
Figure FDA0003387873370000031
先将实际增益Ga与规格化后的期望增益Gn的比值转化为dB值,设为变量Ran,如公式(11)所示:
Figure FDA0003387873370000032
若Ran<0,说明实际增益Ga小于规格化后的期望增益Gn;实际增益的变化率Ra的更新公式如公式(12)所示:
Figure FDA0003387873370000033
其中,spa表示一个常量,St表示总释放样点数,;
若Ran>0,说明实际增益Ga大于规格化后的期望增益Gn,记录Ran的最大值,保存至变量Mran中。
8.根据权利要求7所述的一种增益平稳调节的动态范围控制方法,其特征在于:步骤D中,在Ran<0的情况中,Mran更新为-1,否则Mran的值总是记录Ran>0时候Ran的最大值;并且当Mran<0.5时设置成0.5,则实际增益的变化率Ra的更新公式如公式(13)所示:
Figure FDA0003387873370000034
其中fs是采样率,Ta是攻击时间。
9.根据权利要求7所述的一种增益平稳调节的动态范围控制方法,其特征在于:步骤D中,将处理过后的Ran值作为输入代入一个3次函数β=aα3+bα2+cα+d中得到释放的样点数resamps;其中三次函数经过点(0,β1)、(1,β2)、(2,β3)、(3,β4),其中纵坐标的单位长度是总释放样点数St,总释放样点数St的表达式如公式(14)所示:
St=fs*Tr (14)
其中fs表示采样率,Tr表示释放时间,β1、β2、β3、β4是四个介于0和1之间的常数。
10.一种增益平稳调节的动态范围控制系统,用于执行权利要求1至9任一所述方法,其特征在于:包括音频信号获取模块、比较和计算模块和调节模块;其中,
音频信号获取模块,用于接收音频信号并进行预处理;
比较和计算模块,处理内容包括比较实时增益Gr与期望增益Ge的大小、实际增益Ga与规格化后的期望增益Gn的大小,计算期望增益变化率Re、比较求实际增益变化率Ra和更新期望增益Ge的值;
调节模块,用于根据比较和计算模块输出的结果,调节所述音频信号的增益。
CN202010767816.2A 2020-08-03 2020-08-03 一种增益平稳调节的动态范围控制方法及系统 Active CN111933173B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010767816.2A CN111933173B (zh) 2020-08-03 2020-08-03 一种增益平稳调节的动态范围控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010767816.2A CN111933173B (zh) 2020-08-03 2020-08-03 一种增益平稳调节的动态范围控制方法及系统

Publications (2)

Publication Number Publication Date
CN111933173A CN111933173A (zh) 2020-11-13
CN111933173B true CN111933173B (zh) 2022-03-01

Family

ID=73306371

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010767816.2A Active CN111933173B (zh) 2020-08-03 2020-08-03 一种增益平稳调节的动态范围控制方法及系统

Country Status (1)

Country Link
CN (1) CN111933173B (zh)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08278796A (ja) * 1995-04-10 1996-10-22 Fujitsu Ten Ltd 音声処理装置
CN101740037B (zh) * 2008-11-21 2011-12-28 联芯科技有限公司 一种基于滑动增益的语音自动增益和动态范围控制方法
WO2016050740A1 (en) * 2014-10-01 2016-04-07 Dolby International Ab Efficient drc profile transmission
CN105845151B (zh) * 2016-05-30 2019-05-31 百度在线网络技术(北京)有限公司 应用于语音识别前端的音频增益调整方法和装置
CN106504765B (zh) * 2016-10-20 2019-08-13 广州视源电子科技股份有限公司 一种音频信号的自动增益控制方法和装置
CN106713794B (zh) * 2016-11-29 2019-12-24 青岛海信电器股份有限公司 一种调节音频均衡的方法及提供均衡调节的音频系统
CN107659279B (zh) * 2017-09-30 2023-10-27 浙江芯劢微电子股份有限公司 一种音频自动增益控制方法及装置
CN108231088B (zh) * 2018-01-08 2021-04-06 北京小鱼在家科技有限公司 一种应用于语音数字信号的快速自动增益控制方法和装置
CN110956972B (zh) * 2019-12-23 2022-07-19 佛山慧明电子科技有限公司 一种语音信号自动增益控制方法

Also Published As

Publication number Publication date
CN111933173A (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
TWI440301B (zh) 對於音訊動態處理具限制之階層式控制路徑
KR101041665B1 (ko) 청각 이벤트 검출에 기반한 비-라우드니스를 이용한 자동 이득 제어
US20030216907A1 (en) Enhancing the aural perception of speech
CN1981433A (zh) 自动调整音频信号的音量的方法和系统
US9311933B2 (en) Method of processing a voice segment and hearing aid
US10382857B1 (en) Automatic level control for psychoacoustic bass enhancement
US9119007B2 (en) Method of and hearing aid for enhancing the accuracy of sounds heard by a hearing-impaired listener
CN103746668A (zh) 音量控制方法及系统
CN111525902A (zh) 一种音频限幅的方法和系统
CN111933173B (zh) 一种增益平稳调节的动态范围控制方法及系统
US9185497B2 (en) Method and computer program product of processing sound segment and hearing aid
CN102044249A (zh) 一种适用于文件播出系统的音频响度一致性控制方法
WO2023006107A1 (zh) 语音交互系统的自动增益控制方法、装置及系统
EP3691124A1 (en) Audio system and method for controlling same
CN114466285B (zh) 音频信号的响度调节方法、装置、设备及存储介质
CN116168719A (zh) 一种基于语境分析的声音增益调节方法及系统
JP2009171057A (ja) 増幅回路
JPH0580796A (ja) 話速制御型補聴方法および装置
EP3704870B1 (en) Method for processing an acoustic speech input signal and audio processing device
US20130064395A1 (en) Audio amplifier circuit and method thereof
CN116486828B (zh) 一种音频数据处理方法、装置及系统
CN117912475A (zh) 中控台压缩发声方法、系统、设备及存储介质
JPH06204770A (ja) データ格納方式を用いたボリュームコントロール
US20230163739A1 (en) Method for increasing perceived loudness of an audio data signal
US20230290366A1 (en) Automatic Classification of Audio Content as Either Primarily Speech or Primarily Non-speech, to Facilitate Dynamic Application of Dialogue Enhancement

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant