CN106571148B - 一种音频信号自动增益控制方法及装置 - Google Patents

一种音频信号自动增益控制方法及装置 Download PDF

Info

Publication number
CN106571148B
CN106571148B CN201611002926.XA CN201611002926A CN106571148B CN 106571148 B CN106571148 B CN 106571148B CN 201611002926 A CN201611002926 A CN 201611002926A CN 106571148 B CN106571148 B CN 106571148B
Authority
CN
China
Prior art keywords
audio signal
gain value
value
current frame
automatic gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201611002926.XA
Other languages
English (en)
Other versions
CN106571148A (zh
Inventor
顾骋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Codyy Education Technology Co Ltd
Original Assignee
Codyy Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codyy Education Technology Co Ltd filed Critical Codyy Education Technology Co Ltd
Priority to CN201611002926.XA priority Critical patent/CN106571148B/zh
Publication of CN106571148A publication Critical patent/CN106571148A/zh
Application granted granted Critical
Publication of CN106571148B publication Critical patent/CN106571148B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供一种音频信号自动增益控制方法及装置,上述音频信号自动增益控制方法包括:判断输入的且经过回声消除的当前帧音频信号是否有回声残余;若有回声残余,则根据回声残余数据得到回音残余因子;根据自动增益控制策略和所述回音残余因子得到所述当前帧音频信号的自动增益值;根据所述自动增益值对所述当前帧音频信号进行自动增益处理。本发明能够解决经过回声消除之后仍有回声残余影响音频效果的问题,进一步消除回声残余,提高音频质量,此外,还可以通过音频信的自动增益控制,使得最终输出的声音幅度始终保持在一个恒定的范围内。

Description

一种音频信号自动增益控制方法及装置
技术领域
本发明属于计算机技术领域,尤其涉及一种音频信号自动增益控制方法及装置。
背景技术
音源与拾音器的距离决定了声音的强弱程度,当音源距离拾音器较近时采集到的声音就较强;当音源距离拾音器较远时采集到的声音就较弱。在直录播互动系统中由于不可避免的主观因素,老师和麦克风之间的距离不可能是恒定不变的,导致采集到的声音忽大忽小,严重影响接收方收听的效果。自动增益控制模块(Automatic gain control)则可以通过改变音频信号输入输出压缩比来实现控制声音大小的功能,使得最终输出的声音幅度始终保持在一个恒定的范围内。然而直录播互动系统中由于存在互动的功能,麦克风必然会采集到远端的声音(也就是回声),经过回音消除模块处理后还是会有一定程度的回声残余,所以单纯使用自动增益控制模块会容易将原本已经减弱的回声再次放大。
发明内容
本发明提供一种音频信号自动增益控制方法及装置,以解决上述问题。
本发明公开了一种音频信号自动增益控制方法,包括:判断输入的且经过回声消除的当前帧音频信号是否有回声残余;若有回声残余,则根据回声残余数据得到所述当前帧音频信号的第一自动增益值;根据所述第一自动增益值对所述当前帧音频信号进行自动增益处理。
本发明还公开了一种音频信号自动增益控制装置,包括:回声残余判断单元,用于判断输入的且经过回声消除的当前帧音频信号是否有回声残余;第一增益值计算单元,用于在所述判断单元确定有回声残余时,根据回声残余数据得到所述当前帧音频信号的第一自动增益值;增益控制单元,用于根据所述第一自动增益值对所述当前帧音频信号进行自动增益处理。
相较于先前技术,根据本发明提供的技术方案,能够解决经过回声消除之后仍有回声残余影响音频效果的问题,进一步消除回声残余,提高音频质量,此外,还可以通过音频信的自动增益控制,使得最终输出的声音幅度始终保持在一个恒定的范围内,解决采集到的声音忽大忽小、严重影响接收方收听效果的问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1所示为根据本发明的一较佳实施例提供的音频信号自动增益控制方法的流程图;
图2所示为根据本发明的另一较佳实施例提供的音频信号自动增益控制方法的流程图;
图3所示为根据本发明的又一较佳实施例提供的音频信号自动增益控制装置的框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
图1所示为根据本发明的一较佳实施例提供的音频信号自动增益控制方法的流程图。如图1所示,本发明的较佳实施例提供的音频信号自动增益控制方法包括以下步骤:
步骤102,判断输入的且经过回声消除的当前帧音频信号是否有回声残余。
步骤104,若有回声残余,则根据回声残余数据得到所述当前帧音频信号的第一自动增益值。
步骤106,根据所述第一自动增益值对所述当前帧音频信号进行自动增益处理。
在本实施例中,输入的当前帧音频信号是已经经过回声消除的信号,虽然经过回声消除,但仍有回声残余。因此,本发明实施例在对音频信号进行自动增益控制时,考虑到了回声残余,使得音频质量更高。
上述步骤104中,所述根据回声残余数据得到所述当前帧音频信号的第一自动增益值具体包括:
根据所述回声残余数据计算回声残余因子,其中,所述回声残余数据是所述当前帧音频信号与参考信号之间的相关性数据;
根据所述回声残余因子计算出所述当前帧音频信号的第一初始增益值;
对所述第一初始增益值进行平滑处理得到所述第一自动增益值。
其中,按照以下公式计算出所述第一初始增益值:
g=a/γ2,其中,g是所述第一初始增益值,a是常量转换因子,γ是所述回声残余因子。
在本实施例中,通过回声残余数据可以计算出回声残余因子,而回声残余数据是根据当前帧音频信号与参考信号之间的相关性数据而求得,因此根据回声残余因子计算得到的增益值,考虑到了回声残余的情况,先削弱回声残余,然后对最终的音频信号进行自动增益控制,最大化地避免对残余回声的放大,更符合真实的音频信号。
音频信号自动增益控制方法还可以包括以下步骤:
若未有回声残余,则根据自动增益控制策略得到所述当前帧音频信号的第二初始增益值;
对所述第二初始增益值进行平滑处理,得到第二自动增益值;
根据所述第二自动增益值对所述当前帧音频信号进行自动增益处理。
其中,所述自动增益控制策略包括:
计算所述当前帧音频信号的平均幅度值并对所述平均幅度值进行平滑处理,得到平滑幅度值;
根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算,得到第二初始增益值。
其中,根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算,具体包括:
若所述平滑幅度值大于语音上阈值,则根据第一公式计算出所述第二初始增益值;
若所述平滑幅度值小于等于所述语音上阈值且大于语音下阈值,则根据第二公式计算出所述第二初始增益值;
若所述平滑幅度值小于等于所述语音下阈值且大于噪声阈值,则根据第三公式计算出所述第二初始增益值;
若所述平滑幅度值小于等于所述噪声阈值,则根据第四公式计算出所述第二初始增益值;
其中,所述第一公式为
Figure BDA0001151510330000031
Tup表示所述语音上阈值,Asmooth是所述平滑幅度值,Rup表示当Asmooth>Tup时增益值在对数域的斜率,gmoderate表示增益抬升量,
所述第二公式为g=gmoderate
所述第三公式为
Figure BDA0001151510330000032
Tdown表示语音下阈值,Tnoise表示噪声阈值,Rdown表示当Tdown≥Asmooth>Tnoise时增益值在对数域的斜率,
所述第四公式为g=gconceal,gconceal表示增益压制量。
其中,根据以下公式对所述第一初始增益值进行平滑处理:
G=(1-β)×G'+β×g
其中G表示当前帧音频信号的第一自动增益值,G'表示前一帧音频信号的第一自动增益值,g是当前帧音频信号的第一初始增益值,β是平滑因子。
其中,根据以下公式对所述第二初始增益值进行平滑处理:
G=(1-β)×G'+β×g
其中G表示当前帧音频信号的第二自动增益值,G'表示前一帧音频信号的第二自动增益值,g是当前帧音频信号的第二初始增益值,β是平滑因子。
如果没有回声残余,则采用自动增益控制策略对音频信号进行增益处理。
音频信号自动增益控制方法在判断所述当前帧音频信号是否有回声残余之前,还包括:
判断所述当前帧音频信号是否是语音帧信号;
若是语音帧信号,则判断所述当前帧音频信号是否有回声残余,若不是语音帧信号,则不进行音频信号自动增益处理。
图2所示为根据本发明的另一较佳实施例提供的音频信号自动增益控制方法的流程图。
如图2所示,首先在本实施例中,输入的音频信号是经过回声消除、降噪处理后的麦克信号。步骤202,判断当前帧音频信号是否为语音帧,若为语音帧则不做自动增益处理,否则进入步骤204。
步骤204,判断当前帧音频信号是否有回声残余存在,若有回声残余,则进入步骤206利用准则1计算初始增益值然后跳至步骤7;若无回声残余,则直接进入步骤208。
[准则1]
g=a/γ2
其中g表示初始增益值,γ表示回声残余因子(γ是通过当前帧音频信号与远端参考信号的相关性求得,γ越大则g越小,γ越小则g越大),a是一个常量转换因子。
步骤208,计算当前帧音频信号的平均幅度值并做平滑处理。
Figure BDA0001151510330000041
Asmooth=(1-α)×Asmooth+α×Amp
其中s[i]表示当前帧音频信号中第i个采样点的值,N表示当前帧音频信号包含的总采样点数,Amp表示当前帧音频信号的平均幅度值,Asmooth是对Amp平滑后的结果,α是平滑因子。
根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算步骤210,如果Asmooth>Tup,则进入步骤212,利用准则2计算初始增益值然后跳至步骤224,否则直接进入步骤214。
[准则2]
Figure BDA0001151510330000051
其中Tup表示语音上阈值,Rup表示当Asmooth>Tup时增益值在对数域的斜率,gmoderate表示增益抬升量。
步骤214,如果Tup≥Asmooth>Tdown,则进入步骤216利用准则3计算初始增益值然后跳至步骤224,否则直接进入步骤218。
[准则3]
g=gmoderate
其中Tdown表示语音下阈值。
步骤218,如果Tdown≥Asmooth>Tnoise,则进入步骤220利用准则4计算初始增益值然后跳至步骤224,否则利用准则5计算初始增益值然后跳至步骤224。
[准则4]
Figure BDA0001151510330000052
[准则5]
g=gconceal
其中Tnoise表示噪声阈值,Rdown表示当Tdown≥Asmooth>Tnoise时增益值在对数域的斜率,gconceal表示增益压制量。
步骤224,对初始增益值做平滑处理,得到当前帧音频信号的自动增益值。
G=(1-β)×G'+β×g
其中G表示当前帧音频信号的第一自动增益值,G'表示前一帧音频信号的第一自动增益值,g是当前帧音频信号的第一初始增益值,β是平滑因子。
本发明充分考虑了回声的存在,能最大化地避免对残余回声的放大;将音频信号转换到对数域后再进行自动增益处理,更加符合真实声学模型。
图3所示为根据本发明的又一较佳实施例提供的音频信号自动增益控制装置的框图。
如图3所示,根据本发明的实施例的音频信号自动增益控制装置300,包括:
回声残余判断单元302,用于判断输入的且经过回声消除的当前帧音频信号是否有回声残余;
第一增益值计算单元304,用于在所述判断单元确定有回声残余时,根据回声残余数据得到所述当前帧音频信号的第一自动增益值;
增益控制单元306,用于根据所述第一自动增益值对所述当前帧音频信号进行自动增益处理。
所述第一增益值计算单元304包括:
第一计算子单元3042,根据所述回声残余数据计算回声残余因子,其中,所述回声残余数据是所述当前帧音频信号与参考信号之间的相关性数据;
第二计算子单元3044,根据所述回声残余因子计算出所述当前帧音频信号的第一初始增益值;
第三计算子单元3046,对所述第一初始增益值进行平滑处理得到所述第一自动增益值。
其中,所述第二计算子单元3044按照以下公式计算出所述第一初始增益值:
g=a/γ2,其中,g是所述第一初始增益值,a是常量转换因子,γ是所述回声残余因子。
音频信号自动增益控制装置还可以包括:
第二增益值计算单元308,用于在所述判断单元确定未有回声残余时,根据自动增益控制策略得到所述当前帧音频信号的第二初始增益值;
平滑处理单元310,对所述第二初始增益值进行平滑处理,得到第二自动增益值;
所述增益控制单元306根据所述第二自动增益值对所述当前帧音频信号进行自动增益处理。
其中,所述第二增益值计算单元308包括:
平滑幅度值计算子单元3082,计算所述当前帧音频信号的平均幅度值并对所述平均幅度值进行平滑处理,得到平滑幅度值;
增益值处理子单元3084,根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算,得到第二初始增益值。
其中,所述增益值处理子单元3084用于在所述平滑幅度值大于语音上阈值时,根据第一公式计算出所述第二初始增益值,以及在所述平滑幅度值小于等于所述语音上阈值且大于语音下阈值时,根据第二公式计算出所述第二初始增益值,以及在所述平滑幅度值小于等于所述语音下阈值且大于噪声阈值时,根据第三公式计算出所述第二初始增益值,以及在所述平滑幅度值小于等于所述噪声阈值时,根据第四公式计算出所述第二初始增益值;
其中,所述第一公式为
Figure BDA0001151510330000071
Tup表示所述语音上阈值,Asmooth是所述平滑幅度值,Rup表示当Asmooth>Tup时增益值在对数域的斜率,gmoderate表示增益抬升量,
所述第二公式为g=gmoderate
所述第三公式为
Figure BDA0001151510330000072
Tdown表示语音下阈值,Tnoise表示噪声阈值,Rdown表示当Tdown≥Asmooth>Tnoise时增益值在对数域的斜率,
所述第四公式为g=gconceal,gconceal表示增益压制量。
其中,所述第三计算子单元3046根据以下公式对所述第一初始增益值进行平滑处理:
G=(1-β)×G'+β×g
其中G表示当前帧音频信号的第一自动增益值,G'表示前一帧音频信号的第一自动增益值,g是当前帧音频信号的第一初始增益值,β是平滑因子。
所述平滑处理单元310根据以下公式对所述第二初始增益值进行平滑处理:
G=(1-β)×G'+β×g
其中G表示当前帧音频信号的第二自动增益值,G'表示前一帧音频信号的第二自动增益值,g是当前帧音频信号的第二初始增益值,β是平滑因子。
音频信号自动增益控制装置还可以包括:
语音帧判断单元312,用于在判断所述当前帧音频信号是否有回声残余之前,判断所述当前帧音频信号是否是语音帧信号;
若是语音帧信号,则通知所述回声残余判断单元判断所述当前帧音频信号是否有回声残余,若不是语音帧信号,则不进行音频信号自动增益处理。
相较于先前技术,根据本发明提供的技术方案,能够解决经过回声消除之后仍有回声残余影响音频效果的问题,进一步消除回声残余,提高音频质量,此外,还可以通过音频信的自动增益控制,使得最终输出的声音幅度始终保持在一个恒定的范围内,解决采集到的声音忽大忽小、严重影响接收方收听效果的问题。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种音频信号自动增益控制方法,其特征在于,包括:
判断输入的且经过回声消除的当前帧音频信号是否有回声残余;
若有回声残余,则根据回声残余数据得到所述当前帧音频信号的第一自动增益值;
根据所述第一自动增益值对所述当前帧音频信号进行自动增益处理;
若未有回声残余,则根据自动增益控制策略得到所述当前帧音频信号的第二初始增益值;
对所述第二初始增益值进行平滑处理,得到第二自动增益值;
根据所述第二自动增益值对所述当前帧音频信号进行自动增益处理;
所述自动增益控制策略包括:
计算所述当前帧音频信号的平均幅度值并对所述平均幅度值进行平滑处理,得到平滑幅度值;
根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算,得到第二初始增益值。
2.根据权利要求1所述的音频信号自动增益控制方法,其特征在于,所述根据回声残余数据得到所述当前帧音频信号的第一自动增益值包括:
根据所述回声残余数据计算回声残余因子,其中,所述回声残余数据是所述当前帧音频信号与参考信号之间的相关性数据;
根据所述回声残余因子计算出所述当前帧音频信号的第一初始增益值;
对所述第一初始增益值进行平滑处理得到所述第一自动增益值。
3.根据权利要求2所述的音频信号自动增益控制方法,其特征在于,按照以下公式计算出所述第一初始增益值:
g=a/γ2,其中,g是所述第一初始增益值,a是常量转换因子,γ是所述回声残余因子。
4.根据权利要求1所述的音频信号自动增益控制方法,其特征在于,根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算,包括:
若所述平滑幅度值大于语音上阈值,则根据第一公式计算出所述第二初始增益值;
若所述平滑幅度值小于等于所述语音上阈值且大于语音下阈值,则根据第二公式计算出所述第二初始增益值;
若所述平滑幅度值小于等于所述语音下阈值且大于噪声阈值,则根据第三公式计算出所述第二初始增益值;
若所述平滑幅度值小于等于所述噪声阈值,则根据第四公式计算出所述第二初始增益值;
其中,所述第一公式为
Figure FDA0002333963970000021
Tup表示所述语音上阈值,Asmooth是所述平滑幅度值,Rup表示当Asmooth>Tup时增益值在对数域的斜率,gmoderate表示增益抬升量,所述第二公式为g=gmoderate
所述第三公式为
Figure FDA0002333963970000022
Tdowm表示语音下阈值,Tnoise表示噪声阈值,Rdown表示当Tdowm≥Asmooth>Tnoise时增益值在对数域的斜率,
所述第四公式为g=gconceal,gconceal表示增益压制量。
5.根据权利要求2或3中所述的音频信号自动增益控制方法,其特征在于,根据以下公式对所述第一初始增益值进行平滑处理:
G=(1-β)×G'+β×g
其中G表示当前帧音频信号的第一自动增益值,G'表示前一帧音频信号的第一自动增益值,g是当前帧音频信号的第一初始增益值,β是平滑因子。
6.根据权利要求1或4所述的音频信号自动增益控制方法,其特征在于,根据以下公式对所述第二初始增益值进行平滑处理:
G=(1-β)×G'+β×g
其中G表示当前帧音频信号的第二自动增益值,G'表示前一帧音频信号的第二自动增益值,g是当前帧音频信号的第二初始增益值,β是平滑因子。
7.根据权利要求1至4中任一项所述的音频信号自动增益控制方法,其特征在于,在判断所述当前帧音频信号是否有回声残余之前,还包括:
判断所述当前帧音频信号是否是语音帧信号;
若是语音帧信号,则判断所述当前帧音频信号是否有回声残余,若不是语音帧信号,则不进行音频信号自动增益处理。
8.一种音频信号自动增益控制装置,其特征在于,包括:
回声残余判断单元,用于判断输入的且经过回声消除的当前帧音频信号是否有回声残余;
第一增益值计算单元,用于在所述判断单元确定有回声残余时,根据回声残余数据得到所述当前帧音频信号的第一自动增益值;
增益控制单元,用于根据所述第一自动增益值对所述当前帧音频信号进行自动增益处理;
第二增益值计算单元,用于在所述判断单元确定未有回声残余时,根据自动增益控制策略得到所述当前帧音频信号的第二初始增益值;
平滑处理单元,对所述第二初始增益值进行平滑处理,得到第二自动增益值;
所述增益控制单元根据所述第二自动增益值对所述当前帧音频信号进行自动增益处理;
所述第二增益值计算单元包括:
平滑幅度值计算子单元,计算所述当前帧音频信号的平均幅度值并对所述平均幅度值进行平滑处理,得到平滑幅度值;
增益值处理子单元,根据所述平滑幅度值所处的不同语音值区间,对所述平滑幅度值进行不同的增益值计算,得到第二初始增益值。
9.根据权利要求8所述的音频信号自动增益控制装置,其特征在于,所述第一增益值计算单元包括:
第一计算子单元,根据所述回声残余数据计算回声残余因子,其中,所述回声残余数据是所述当前帧音频信号与参考信号之间的相关性数据;
第二计算子单元,根据所述回声残余因子计算出所述当前帧音频信号的第一初始增益值;
第三计算子单元,对所述第一初始增益值进行平滑处理得到所述第一自动增益值。
10.根据权利要求9所述的音频信号自动增益控制装置,其特征在于,所述第二计算子单元按照以下公式计算出所述第一初始增益值:
g=a/γ2,其中,g是所述第一初始增益值,a是常量转换因子,γ是所述回声残余因子。
11.根据权利要求8所述的音频信号自动增益控制装置,其特征在于,所述增益值处理子单元用于在所述平滑幅度值大于语音上阈值时,根据第一公式计算出所述第二初始增益值,以及在所述平滑幅度值小于等于所述语音上阈值且大于语音下阈值时,根据第二公式计算出所述第二初始增益值,以及在所述平滑幅度值小于等于所述语音下阈值且大于噪声阈值时,根据第三公式计算出所述第二初始增益值,以及在所述平滑幅度值小于等于所述噪声阈值时,根据第四公式计算出所述第二初始增益值;
其中,所述第一公式为
Figure FDA0002333963970000041
Tup表示所述语音上阈值,Asmooth是所述平滑幅度值,Rup表示当Asmooth>Tup时增益值在对数域的斜率,gmoderate表示增益抬升量,
所述第二公式为g=gmoderate
所述第三公式为
Figure FDA0002333963970000042
Tdowm表示语音下阈值,Tnoise表示噪声阈值,Rdown表示当Tdowm≥Asmooth>Tnoise时增益值在对数域的斜率,
所述第四公式为g=gconceal,gconceal表示增益压制量。
12.根据权利要求9或10中所述的音频信号自动增益控制装置,其特征在于,所述第三计算子单元根据以下公式对所述第一初始增益值进行平滑处理:
G=(1-β)×G'+β×g
其中G表示当前帧音频信号的第一自动增益值,G'表示前一帧音频信号的第一自动增益值,g是当前帧音频信号的第一初始增益值,β是平滑因子。
13.根据权利要求8或11中任一项所述的音频信号自动增益控制装置,其特征在于,所述平滑处理单元根据以下公式对所述第二初始增益值进行平滑处理:
G=(1-β)×G'+β×g
其中G表示当前帧音频信号的第二自动增益值,G'表示前一帧音频信号的第二自动增益值,g是当前帧音频信号的第二初始增益值,β是平滑因子。
14.根据权利要求8至11中任一项所述的音频信号自动增益控制装置,其特征在于,还包括:
语音帧判断单元,用于在判断所述当前帧音频信号是否有回声残余之前,判断所述当前帧音频信号是否是语音帧信号;
若是语音帧信号,则通知所述回声残余判断单元判断所述当前帧音频信号是否有回声残余,若不是语音帧信号,则不进行音频信号自动增益处理。
CN201611002926.XA 2016-11-14 2016-11-14 一种音频信号自动增益控制方法及装置 Expired - Fee Related CN106571148B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611002926.XA CN106571148B (zh) 2016-11-14 2016-11-14 一种音频信号自动增益控制方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611002926.XA CN106571148B (zh) 2016-11-14 2016-11-14 一种音频信号自动增益控制方法及装置

Publications (2)

Publication Number Publication Date
CN106571148A CN106571148A (zh) 2017-04-19
CN106571148B true CN106571148B (zh) 2020-04-28

Family

ID=58542220

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611002926.XA Expired - Fee Related CN106571148B (zh) 2016-11-14 2016-11-14 一种音频信号自动增益控制方法及装置

Country Status (1)

Country Link
CN (1) CN106571148B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107644649B (zh) * 2017-09-13 2022-06-03 黄河科技学院 一种信号处理方法
CN107888792B (zh) * 2017-10-19 2019-09-17 浙江大华技术股份有限公司 一种回声消除方法、装置及系统
CN110111805B (zh) * 2019-04-29 2021-10-29 北京声智科技有限公司 远场语音交互中的自动增益控制方法、装置及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1736091A (zh) * 2003-01-08 2006-02-15 皇家飞利浦电子股份有限公司 用于抑制尤其在电话中的回声的装置和方法
CN101262530A (zh) * 2008-04-29 2008-09-10 中兴通讯股份有限公司 一种消除移动终端回音的装置
CN102223157A (zh) * 2010-04-16 2011-10-19 联芯科技有限公司 残留回声消除器和残留回声消除方法
JP2011254420A (ja) * 2010-06-04 2011-12-15 Nippon Telegr & Teleph Corp <Ntt> 反響消去方法、反響消去装置及び反響消去プログラム
CN104754157A (zh) * 2013-12-26 2015-07-01 联芯科技有限公司 一种残留回声抑制方法和系统
CN105812598A (zh) * 2014-12-30 2016-07-27 展讯通信(上海)有限公司 一种降低回声的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8155304B2 (en) * 2007-04-10 2012-04-10 Microsoft Corporation Filter bank optimization for acoustic echo cancellation

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1736091A (zh) * 2003-01-08 2006-02-15 皇家飞利浦电子股份有限公司 用于抑制尤其在电话中的回声的装置和方法
CN101262530A (zh) * 2008-04-29 2008-09-10 中兴通讯股份有限公司 一种消除移动终端回音的装置
CN102223157A (zh) * 2010-04-16 2011-10-19 联芯科技有限公司 残留回声消除器和残留回声消除方法
JP2011254420A (ja) * 2010-06-04 2011-12-15 Nippon Telegr & Teleph Corp <Ntt> 反響消去方法、反響消去装置及び反響消去プログラム
CN104754157A (zh) * 2013-12-26 2015-07-01 联芯科技有限公司 一种残留回声抑制方法和系统
CN105812598A (zh) * 2014-12-30 2016-07-27 展讯通信(上海)有限公司 一种降低回声的方法及装置

Also Published As

Publication number Publication date
CN106571148A (zh) 2017-04-19

Similar Documents

Publication Publication Date Title
CN106782586B (zh) 一种音频信号处理方法及装置
US8170879B2 (en) Periodic signal enhancement system
US8755546B2 (en) Sound processing apparatus, sound processing method and hearing aid
EP2372700A1 (en) A speech intelligibility predictor and applications thereof
US8447044B2 (en) Adaptive LPC noise reduction system
US20140200881A1 (en) Noise reduction devices and noise reduction methods
KR101624652B1 (ko) 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치, 잡음 환경에서 음성 신호를 강화하는 방법 및 그 장치
KR101068227B1 (ko) 명료도 향상장치와 이를 이용한 음성출력장치
US20060089958A1 (en) Periodic signal enhancement system
WO2008121436A1 (en) Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate
EP2244254A1 (en) Ambient noise compensation system robust to high excitation noise
CN110111805B (zh) 远场语音交互中的自动增益控制方法、装置及可读存储介质
CN106571148B (zh) 一种音频信号自动增益控制方法及装置
JPWO2010131470A1 (ja) ゲイン制御装置及びゲイン制御方法、音声出力装置
US8543390B2 (en) Multi-channel periodic signal enhancement system
US20240062770A1 (en) Enhanced de-esser for in-car communications systems
CN110956976B (zh) 一种回声消除方法、装置、设备及可读存储介质
CN111048118A (zh) 一种语音信号处理方法、装置及终端
US8243955B2 (en) System for attenuating noise in an input signal
US9972338B2 (en) Noise suppression device and noise suppression method
JPH11305792A (ja) 収音装置,音声認識装置,これらの方法、及びプログラム記録媒体
JP2008129107A (ja) オートゲインコントロール装置、音声記録装置、映像・音声記録装置および通話装置
US20200251090A1 (en) Detection of fricatives in speech signals
JP4922427B2 (ja) 信号補正装置
CN115410593A (zh) 音频信道的选择方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200428