CN101009099A - 数字自动增益控制方法及装置 - Google Patents

数字自动增益控制方法及装置 Download PDF

Info

Publication number
CN101009099A
CN101009099A CNA200710063109XA CN200710063109A CN101009099A CN 101009099 A CN101009099 A CN 101009099A CN A200710063109X A CNA200710063109X A CN A200710063109XA CN 200710063109 A CN200710063109 A CN 200710063109A CN 101009099 A CN101009099 A CN 101009099A
Authority
CN
China
Prior art keywords
frame
present frame
sampling point
voice
yield value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200710063109XA
Other languages
English (en)
Other versions
CN100589183C (zh
Inventor
赵永刚
冯宇红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vimicro Corp
Original Assignee
Vimicro Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vimicro Corp filed Critical Vimicro Corp
Priority to CN200710063109A priority Critical patent/CN100589183C/zh
Publication of CN101009099A publication Critical patent/CN101009099A/zh
Application granted granted Critical
Publication of CN100589183C publication Critical patent/CN100589183C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种数字自动增益控制方法及装置,解决了相邻语音帧的衔接处出现增益值骤变,使得语音不连贯,影响语音的主观听觉质量的问题。包括:将语音信号按固定时长分成若干帧;对每一帧语音信号进行活动语音检测,将其区分为语音帧或噪音帧两种类型;根据当前帧和当前帧的前一帧的语音类型,对当前帧语音样点的增益进行帧间平滑处理。然后,对当前帧的各个语音样点的增益再进行帧内平滑处理。本发明数字自动增益控制方法,不但能够在相邻语音帧的衔接处,防止增益值骤变,而且能够在语音帧内相邻语音样点间,防止增益值骤变。

Description

数字自动增益控制方法及装置
技术领域
本发明涉及语音信号的处理方法及装置,尤其涉及一种对语音增益进行控制的方法及装置。
背景技术
在对于语音信号进行编码、增强等数字处理之后,一般会对语音信号有一定的损伤。我们可以应用数字自动增益控制(AGC)对这种损伤进行补偿。数字AGC算法主要目的是对接收到的数字信号进行一定的处理,使其幅度相对稳定,从而增加声音的主观听觉质量。
常见的AGC的结构主要有两种:反馈结构、和无反馈结构。反馈方式调整方法为:比较前一时刻增益调整之后的输出信号的幅度和我们期望的幅度R,以控制增益的变化,若输出小于R则增大增益,相反则减小增益。无反馈结构的主要原理为:提取输入信号的幅度包络,根据这一包络来设定增益控制算法来控制当前样点的增益。
对于反馈结构的数字AGC方法,没有使用当前的输入语音样点的信息对增益进行调整。这个过程是非线性的、时变的、依赖于输入的反馈系统。整个系统难于实际分析,稳定性以及增益的大小、两个相邻样点之间增益的变化不容易控制。同时在样点大小不同的情况下,会造成增益调整的差异。无反馈的结构利用了当前输入语音样点的信息,将语音信号按照固定时长分成若干个帧,每帧包括若干样点,每个样点分别具有各自的振幅值,现有自动增益的控制方法为:1、计算当前帧各个样点振幅值绝对值的平均值,以该平均值作为当前帧的平均能量值;2、将接收端当前播放音量对应的能量值除以该平均能量值,得到一放大倍数,以该放大倍数作为当前帧的增益值,3、该增益值乘以当前帧各个样点的振幅值并输出,从而达到将当前帧的能量值放大至当前播放音量对应的能量值的目的;语音信号的每帧均执行上述操作过程,从而实现对语音信号的整体放大,使得放大后的语音信号中各个帧对应的能量值分别等于当前播放音量对应的能量值;其中,由于各个帧中样点的振幅值各不相同,因此,各个帧所计算出的增益值就各不相同。该现有技术虽然能够通过对语音信号进行放大达到统一语音音量的目的,但是,还存在如下缺点:由于相邻帧的增益值各不相同,并且,语音帧中第一个或最后一个样点的能量值与语音帧的平均能量值不相同,每帧采用相同的增益值进行放大,会导致相邻语音帧的衔接处,振幅突变处出现增益值骤变,从而造成语音瞬时发生很大变化,使得语音不连贯,影响语音的主观听觉质量。
发明内容
针对现有技术存在的缺陷和不足,本发明提供一种在相邻语音帧的衔接处,能够防止振幅突变处出现增益值骤变的数字自动增益控制方法及装置。
为达到上述目的,本发明采用以下技术方案:本发明数字自动增益控制方法,包括如下步骤:
步骤A,将语音信号按固定时长分成若干帧;
步骤B,对每一帧语音信号进行活动语音检测,将其区分为语音帧或噪音帧两种类型;
步骤C,获取当前帧的各个语音样点的增益值,并在获取增益值的过程中,根据当前帧的类型,对当前帧的语音样点的增益进行帧间平滑处理。
所述步骤C中,在获取当前帧的各个语音样点的增益值的过程中,进一步,根据当前帧的类型,对当前处理的语音样点的增益进行帧内平滑处理。
在所述数字自动增益控制方法中,步骤B具体为:如果当前帧包含语音信号信息,则当前帧为语音帧,否则为噪音帧。
在所述数字自动增益控制方法中,步骤C包括:
步骤C11,对当前帧进行包络检测,得到当前帧的包络信息;
步骤C12,根据当前帧语音信号的类型和包络信息,调整当前帧语音样点增益。
在所述数字自动增益控制方法中,步骤C包括:
步骤C21,对当前帧进行包络检测,得到当前帧的包络信息;
步骤C22,根据当前帧和当前帧的前一帧的语音信号类型和包络信息,调整当前帧语音样点增益。
在所述数字自动增益控制方法中,步骤C11、C21包括如下步骤:
步骤一,选取当前帧中的一个语音样点作为当前语音样点,对当前语音样点的幅度值x(n)求绝对值得到|x(n)|;
步骤二,通过公式 c ( n ) = max [ | x ( n ) | , | x ( n ) | - βe ave ( n - 1 ) 1 - β ] 使包络跟踪输入信号的变化;α是一个预先确定的常数, β = 1 M Σ i = 0 M - 1 ( 1 - α ) N + 1 - i , M为用来进行包络平滑的窗长度;
步骤三,在当前样点和向前数N个语音样点的c(n)的范围内,选取最大的c(n),即xmax(n)=max[c(n-N),…,c(n)];
步骤四,根据选取的最大值,计算出当前语音样点的包络值:
emax(n)=αxmax(n)+(1-α)emax(n-1)
步骤五,在当前语音样点和向前数M个语音样点的范围内,对所有语音样点的包络值相加后取平均值 e ave ( n ) = 1 M Σ i = 0 M e max ( n - i ) .
在所述数字自动增益控制方法中,步骤C12具体为:
如果当前帧为噪音帧,将当前帧的增益设为1,即对于所有n,g(n)=1,对当前帧的各个语音样点不放大也不缩小;
如果当前帧为语音帧,将当前帧的每个语音样点的增益值调整到平滑过渡增益值g(n),
g ( n ) = ( threshold e ave ( n ) ) θ
θ表示一个和调整的效果有关的常数,一般满足0<θ≤1,threshold表示预先定义的阈值。
在所述数字自动增益控制方法中,步骤C22具体为:
如果当前帧和当前帧的前一帧均为噪音帧,将当前帧的增益设为1,对当前帧不放大也不缩小;
如果前一帧为噪音帧,当前帧为语音帧,噪音帧向语音帧过渡,此时将当前帧的第一个语音样点的增益值取为1,最后一个语音样点的增益值为平滑过渡增益值,其余各个语音样点的增益值由1线性递增到平滑过渡增益值;
如果前一帧为语音帧,当前帧为噪音帧,语音帧向噪音帧的过渡,此时将当前帧的第一个语音样点的增益值取为平滑过渡增益值,最后一个语音样点的增益值为1,其余各个语音样点的增益值由平滑过渡增益值线性递减到1;
如果前一帧和当前帧均为语音帧,当前帧每个语音样点的增益值都取为平滑过渡增益值。
在所述数字自动增益控制方法中,所述平滑过渡增益值g(n),
g ( n ) = ( threshold e ave ( n ) ) θ - - - ( 5 )
θ表示一个和调整的效果有关的常数,一般满足0<θ≤ 1,threshold表示预先定义的阈值。
在所述数字自动增益控制方法中,所述帧内平滑处理具体为:将当前帧的各个语音样点的增益调整为帧内平滑增益值gave(n):
g ave ( n ) = 1 M Σ i = 0 M g ( n - i ) .
在所述数字自动增益控制方法中,如果当前样点的帧内平滑增益值大于预定门限值,则帧内平滑增益值设为预定门限值。
在所述数字自动增益控制方法中,还包括步骤D:当前语音样点之前第N个语音样点的输入语音幅度值乘以帧内平滑增益值得到输出语音。
一种自动增益控制装置,包括:
语音信号分割模块,用于将语音信号按固定时长分割成若干帧;
其特征在于还包括:
活动语音检测模块,将所述语音信号分割模块分割后的每一帧,区分为语音帧或噪音帧两种类型;
帧间平滑处理模块,获取当前帧的各个语音样点的增益值,并在获取增益值的过程中,根据当前帧的类型,对当前帧的语音样点的增益进行帧间平滑处理。
在所述自动增益控制装置中,还包括:帧内平滑处理模块,根据当前帧的类型,对当前处理的语音样点的增益进行帧内平滑处理。
在所述自动增益控制装置中,所述帧间平滑处理模块包括:
包络检测模块,对当前帧进行包络检测,得到当前帧的包络信息;
增益调整模块,根据当前帧语音信号的类型和包络信息,调整当前帧语音样点增益。
在所述自动增益控制装置中,所述增益调整模块,根据当前帧和当前帧的前一帧的语音信号类型和包络信息,调整当前帧语音样点增益。
在所述自动增益控制装置中,所述包络检测模块包括:
幅度值求模单元,用于对当前帧当前语音样点的幅度值x(n)求绝对值,得到|x(n)|;包络平滑处理单元,根据|x(n)|,利用公式 c ( n ) = max [ | x ( n ) | , | x ( n ) | - βe ave ( n - 1 ) 1 - β ] 使包络跟踪输入语音信号的变化;
最大值选取单元,在当前语音样点和向前数N个语音样点的c(n)的范围内,选取最大的幅度值c(n),即xmax(n)=max[c(n-N),…,c(n)];
包络值计算单元,根据选取的最大幅度值c(n),利用公式emax(n)=αxmax(n)+(1-α)emax(n-1)计算当前语音样点的包络值;
包络幅度平滑处理单元,在当前语音样点和向前数M个语音样点的范围内,对所有语音样点的包络值相加后取平均值 e ave ( n ) = 1 M Σ i = 0 M e max ( n - i ) .
在所述自动增益控制装置中,所述增益调整模块包括:
平滑过渡增益值计算单元,根据公式 g ( n ) = ( threshold e ave ( n ) ) θ 计算平滑过渡增益值。
增益调整控制单元,调整当前帧语音样点增益。
在所述自动增益控制装置中,所述增益调整控制单元对当前帧语音样点增益进行如下调整:
如果当前帧为噪音帧,将当前帧的增益设为1,即对于所有n,g(n)=1,对当前帧的各个语音样点不放大也不缩小;
如果当前帧为语音帧,将当前帧的每个语音样点的增益值调整到平滑过渡增益值。
在所述自动增益控制装置中,所述增益调整控制单元对当前帧语音样点增益进行如下调整:
如果当前帧和当前帧的前一帧均为噪音帧,将当前帧的增益设为1,对当前帧不放大也不缩小;
如果前一帧为噪音帧,当前帧为语音帧,噪音帧向语音帧过渡,此时将当前帧的第一个语音样点的增益值取为1,最后一个语音样点的增益值为平滑过渡增益值,其余各个语音样点的增益值由1线性递增到平滑过渡增益值;
如果前一帧为语音帧,当前帧为噪音帧,语音帧向噪音帧的过渡,此时将当前帧的第一个语音样点的增益值取为平滑过渡增益值,最后一个语音样点的增益值为1,其余各个语音样点的增益值由平滑过渡增益值线性递减到1;
如果前一帧和当前帧均为语音帧,当前帧每个语音样点的增益值都取为平滑过渡增益值。
在所述自动增益控制装置中,所述帧内平滑处理模块包括:
帧内平滑增益值计算单元,根据公式 g ave ( n ) = 1 M Σ i = 0 M g ( n - i ) 计算帧内平滑增益值;
帧内增益调整单元,将当前帧的各个语音样点的增益调整为帧内平滑增益值gave(n)。
在所述自动增益控制装置中,还包括:语音输出模块,根据当前语音样点之前第N个语音样点的输入语音幅度值,乘以帧内平滑增益值得到输出语音,并输出该语音。
本发明数字自动增益控制方法,将每一帧语音信号区分为语音帧或噪音帧两种类型;在不同类型语音帧之间的衔接处,进行帧间平滑处理。对于噪音帧向语音帧的过渡,噪音帧内各个语音样点的增益本发明设为1,语音帧内第一个语音样点的增益为1,最后一个语音样点的增益为平滑过渡增益值,中间的各个语音样点的增益值由1线性递增到平滑过渡增益值。这样防止了在噪音帧向语音帧过渡的衔接处发生增益骤变。对于语音帧向噪音帧的过渡,语音帧内第一个语音样点的增益值为平滑过渡增益值,最后一个语音样点的增益值为1,中间的各个语音样点的增益值由平滑过渡增益值线性衰减到1。这样防止了在语音帧向噪音帧过渡的衔接处发生增益骤变。对于两个连续语音帧,当前帧各个语音样点的增益值调整为平滑过渡增益值。这样防止了在语音帧向语音帧过渡的衔接处发生增益骤变。
本发明数字自动增益控制方法,不但能够在相邻语音帧的衔接处,防止增益值骤变,而且能够在语音帧内相邻语音样点间,防止增益值骤变。将当前帧内的各个语音样点的增益,由平滑过渡增益值调整到帧内平滑增益值。帧内平滑增益值是对若干个连续语音样点的平滑过渡增益值取平均得到的。这样使得相邻语音样点间的增益过渡平滑。
附图说明
图1为本发明自动增益控制方法实施例1的流程图;
图2为本发明自动增益控制方法实施例2的流程图;
图3为本发明自动增益控制装置的方框图;
图4为平滑过渡增益值计算单元的结构方框图。
具体实施方式
为了解决相邻语音帧的衔接处,振幅突变处出现增益值骤变的问题,本发明自动增益控制方法采用帧间平滑处理技术。下面结合附图和具体实施例对本发明作进一步详细说明:
实施例1:
参照附图1,本实施例数字自动增益控制方法包括:
步骤1、将待输入的语音信号进行分帧处理。
即将待输入的语音信号按照固定时长(如20ms)分割成若干帧,每帧包括若干个语音样点,每个语音样点分别具有各自的振幅值。
步骤2,活动语音检测模块(VAD检测模块)对每一帧输入的语音信号进行检测,区分为语音帧和噪音帧两种类型。
选择一帧语音信号作为当前帧。当前帧经过活动语音检测模块检测,得到当前帧是否包含语音信号的信息vad_flag,如果包含语音信号vad_flag=1,否则vad_flag=0。活动语音检测模块的主要作用是区分语音帧和无语音的噪音帧,目的在于:在下面增益调整时只对语音帧进行调整,对噪音帧不放大也不缩小。避免在增益调整时放大无语音时的噪声。
步骤3,可以与步骤2同时进行,对当前帧进行包络检测,得到当前帧的包络信息。
包络检测包括预处理部分和包络检测部分。
所述预处理部分具体步骤如下:
步骤一,选取当前帧中的一个语音样点作为当前样点,对当前样点的幅度值x(n)求绝对值得到|x(n)|,其中n为语音样点的序号。
步骤二,为了使得包络能够跟踪输入信号的变化,将|x(n)|做平滑处理:
c ( n ) = max [ | x ( n ) | , | x ( n ) | - βe ave ( n - 1 ) 1 - β ] - - - ( 1 )
步骤三,以当前样点为起点向前数N个语音样点为终点的范围内,选取语音样点对应c(n)的最大值
xmax(n)=max[c(n-N),…,c(n)]    (2);
其中,N的取值范围为10~40,本实施例中可以取值为20,即以当前样点为起点向前数20个语音样点。显然,在处理当前帧的最前面的N-1个语音样点时,向前数得的N个语音样点中,将有一部分语音样点为前一帧的语音样点。
下面是包络检测部分:
步骤四,根据选取的最大幅度值xmax(n)以及当前样点的前一个样点的包络值emax(n-1),
计算出当前样点的包络值:
emax(n)=αxmax(n)+(1-α)emax(n-1)    (3)
为了得到平滑的包络幅度,经过如下平滑处理:在当前样点和向前数M个语音样点的范围内,对所有语音样点的包络值相加后取平均值:
e ave ( n ) = 1 M Σ i = 0 M e max ( n - i ) - - - ( 4 )
以上的公式1~4中α是一个预先确定的常数,可以按照要求调整;一般的,在xmax(n)>emax(n-1)时α=0.2,否则α=0.01。
β = 1 M Σ i = 0 M - 1 ( 1 - α ) N + 1 - i ;
M为用来进行包络平滑的窗长度,为整数且一般大于10,本实施例中可以取M=20。
步骤4,根据当前帧语音信号的类型和包络信息来确定样点增益。
本步骤中,针对不同的分类,我们采用不同的方法处理。总体思想是:
0表示当前帧为噪音帧,可以将当前帧的增益设为1,即对于所有n,g(n)=1,对当前帧不放大也不缩小。
1表示当前帧为语音帧,此时需要对每个样点的增益值进行帧间平滑处理。
下面将详细描述当前帧为语音帧时的帧间增益平滑处理过程。
步骤A1,通过公式(5)计算当前帧中每个语音样点的增益值g(n)。
g ( n ) = ( threshold e ave ( n ) ) θ - - - ( 5 )
θ表示一个和调整的效果有关的常数,一般满足0<θ≤1,最佳取值为0.5,θ越大得到的语音能量越平坦。极限情况θ=1时输出语音的包络将保持恒定为threshold。threshold表示预先定义的阈值,一般取值为16384,大于threshold的语音将被缩小,且幅度越大缩小的倍数也越大;小于threshold的语音将被放大,语音样点的幅度越小被放大的倍数越大。
步骤5,为了防止当前帧内相邻语音样点间发生增益值骤变,下面对当前帧的各个语音样点的增益进行帧内平滑处理。即根据步骤A2计算得到的增益值g(n)计算帧内平滑增益值gave(n):
g ave ( n ) = 1 M Σ i = 0 M g ( n - i ) - - - ( 6 ) ;
另外,在步骤4中,为了防止背景噪声被放大的过大,还可设定一个允许放大的最大倍数MAX_GAIN,MAX_GAIN为经验常数,如最佳取值为MAX_GAIN=3。如果当前样点的增益大于MAX_GAIN那么当前样点的增益设为MAX_GAIN。
步骤6,利用得到的增益值乘以当前语音样点之前第N个语音样点的输入语音幅度值,得到最终的数字AGC调整之后的输出语音。
用公式表示为:y(n)=gave(n)*x(n-N)。
实施例1提供的方法,通过包络检测步骤,能够准确的检测语音信号的包络并且使其平滑的变化。并且,在根据包络值获取增益值时,又通过对增益值的平滑处理,防止增益值在帧间和帧内发生骤变。同时,本实施例针对噪音帧和语音帧采用了不同的处理方法,可防止噪音帧被放大。因此采用本实施例的数字增益控制方法,可以获得语音连贯、且无瞬时骤变现象的良好质量的语音信号。
本发明同时提供了实现该方法的装置。参照附图3,本发明自动增益控制装置,包括:
语音信号分割模块,用于将语音信号按固定时长分割成若干帧;
活动语音检测模块,将所述语音信号分割模块分割后的每一帧,区分为语音帧或噪音帧两种类型;
帧间平滑处理模块,获取当前帧的各个语音样点的增益值,并在获取增益值的过程中,根据当前帧的类型,对当前帧的语音样点的增益进行帧间平滑处理。
帧内平滑处理模块,根据当前帧的类型,对当前处理的语音样点的增益进行帧内平滑处理。
语音输出模块,根据当前语音样点之前第N个语音样点的输入语音幅度值,乘以帧内平滑增益值得到输出语音,并输出该语音。
所述帧间平滑处理模块包括:
包络检测模块,对当前帧进行包络检测,得到当前帧的包络信息;
增益调整模块,根据当前帧语音信号的类型和包络信息,调整当前帧语音样点增益。
参照附图4,所述包络检测模块包括:
幅度值求模单元,用于对当前帧当前语音样点的幅度值x(n)求绝对值,得到|x(n)|;包络平滑处理单元,根据|x(n)|,利用公式 c ( n ) = max [ | x ( n ) | , | x ( n ) | - βe ave ( n - 1 ) 1 - β ] 使包络跟踪输入语音信号的变化;
最大值选取单元,在当前语音样点和向前数N个语音样点的c(n)的范围内,选取最大的幅度值c(n),即xmax(n)=max[c(n-N),…,c(n)];
包络值计算单元,根据选取的最大幅度值c(n),利用公式emax(n)=αxmax(n)+(1-α)emax(n-1)计算当前语音样点的包络值;
包络幅度平滑处理单元,在当前语音样点和向前数M个语音样点的范围内,对所有语音样点的包络值相加后取平均值 e ave ( n ) = 1 M Σ i = 0 M e max ( n - i ) .
所述增益调整模块包括:
平滑过渡增益值计算单元,根据公式 g ( n ) = ( threshold e ave ( n ) ) θ 计算平滑过渡增益值。
增益调整控制单元,调整当前帧语音样点增益。
增益调整控制单元对当前帧语音样点增益进行如下调整:
如果当前帧为噪音帧,将当前帧的增益设为1,即对于所有n,g(n)=1,对当前帧的各个语音样点不放大也不缩小;
如果当前帧为语音帧,将当前帧的每个语音样点的增益值调整到平滑过渡增益值。
所述帧内平滑处理模块包括:
帧内平滑增益值计算单元,根据公式 g ave ( n ) = 1 M Σ i = 0 M g ( n - i ) 计算帧内平滑增益值;
帧内增益调整单元,将当前帧的各个语音样点的增益调整为帧内平滑增益值gave(n)。
实施例2:
参照附图2,本实施例数字自动增益控制方法,包括:
步骤100(图中未示出),将待输入的语音信号进行分帧处理。
即将待输入的语音信号按照固定时长(如20ms)分割成若干帧,每帧包括若干个语音样点,每个语音样点分别具有各自的振幅值。
步骤101,活动语音检测模块(VAD检测模块)对每一帧输入的语音信号进行检测,区分为语音帧和噪音帧两种类型,并将每一帧语音信号的类型保存起来。
选择一帧语音信号作为当前帧。当前帧经过活动语音检测模块检测,得到当前帧是否包含语音信号的信息vad_flag,如果包含语音信号vad_flag=1,否则vad_flag=0。活动语音检测模块的主要作用是区分语音帧和无语音的噪音帧,目的在于:在下面增益调整时只对语音帧进行调整,对噪音帧不放大也不缩小。避免在增益调整时放大无语音时的噪声。
步骤102,可以与步骤101同时进行,对当前帧进行包络检测,得到当前帧的包络信息。
包络检测包括预处理部分和包络检测部分。
所述预处理部分具体步骤如下:
步骤一,选取当前帧中的一个语音样点作为当前样点,对当前样点的幅度值x(n)求绝对值得到|x(n)|,;其中n为语音样点的序号。
步骤二,为了使得包络能够跟踪输入信号的变化,将|x(n)|做平滑处理:
c ( n ) = max [ | x ( n ) | , | x ( n ) | - βe ave ( n - 1 ) 1 - β ] - - - ( 1 )
步骤三,以当前样点为起点向前数N个语音样点为终点的范围内,选取语音样点对应c(n)的最大值xmax(n)=max[c(n-N),…,c(n)]    (2);
其中,N的取值范围为10~40,本实施例中可以取值为20,即以当前样点为起点向前数20个语音样点。显然,在处理当前帧的最前面的N-1个语音样点时,向前数得的N个语音样点中,将有一部分语音样点为前一帧的语音样点。
下面是包络检测部分:
步骤四,根据选取的最大幅度值xmax(n)以及当前样点的前一个样点的包络值emax(n-1),
计算出当前样点的包络值:
emax(n)=αxmax(n)+(1-α)emax(n-1)    (3)
为了得到平滑的包络幅度,经过如下平滑处理:在当前样点和向前数M个语音样点的范围内,对所有语音样点的包络值相加后取平均值:
e ave ( n ) = 1 M Σ i = 0 M e max ( n - i ) - - - ( 4 )
以上的公式1~4中α是一个预先确定的常数,可以按照要求调整;一般的,在xmax(n)>emax(n-1)时α=0.2,否则α=0.01。
β = 1 M Σ i = 0 M - 1 ( 1 - α ) N + 1 - i ;
M为用来进行包络平滑的窗长度,为整数且一般大于10,本实施例中可以取M=20。
步骤103,取出步骤101保存的当前帧的前一帧语音信号的类型。
本实施例中,可以采用延时1帧的方法,输出前一帧语音信号的类型。
步骤104,利用当前帧和其前一帧语音信号的类型,将当前帧分为4类。
按照前一帧的vad_flag和当前帧的vad_flag将输入语音分成四类,用xy表示,其中x表示前一帧的vad_flag,y表示当前帧的vad_flag。四类分别为00,01,10,11。
步骤105,根据不同的分类和包络信息来确定样点增益。
本步骤中,针对不同的分类,我们采用不同的方法处理。总体思想是:
00表示为当前帧和当前帧的前一帧均为噪音帧,可以将当前帧的增益设为1,对当前帧不放大也不缩小。
01表示前一帧为噪音帧,当前帧为语音帧,噪音帧向语音帧过渡,此时可以使当前帧每个样点的增益线性从1递增到当前帧最后一个样点的增益。
10表示前一帧为语音帧,当前帧为噪音帧,语音帧向噪音帧的过渡,这时可以使当前帧的每个样点的增益逐渐衰减到1。
11表示前一帧和当前帧均为语音帧,需要对每个样点的增益值进行平滑处理。
下面将详细描述这四类情况的增益平滑处理过程。
(一),当为00时,表示为当前帧和当前帧的前一帧均为噪音帧,如前所述,将当前帧的增益设为1,即对于所有n,g(n)=1。
(二),当为01时,前一帧为噪音帧,当前帧为语音帧,此时将当前帧的第一个语音样点的增益值取为1,最后一个语音样点的增益值为平滑过渡增益值,其余各个语音样点的增益值由1线性递增到平滑过渡增益值。其处理过程具体如下:
步骤A1,通过公式(5)计算当前帧中最后一个语音样点的增益值g(n)。
g ( n ) = ( threshold e ave ( n ) ) θ - - - ( 5 )
θ表示一个和调整的效果有关的常数,一般满足0<θ≤1,最佳取值为0.5,θ越大得到的语音能量越平坦。极限情况θ=1时输出语音的包络将保持恒定为threshold。threshold表示预先定义的阈值,一般取值为16384,大于threshold的语音将被缩小,且幅度越大缩小的倍数也越大;小于threshold的语音将被放大,语音样点的幅度越小被放大的倍数越大。
步骤A2,取步骤A1中计算获得的当前帧的最后一个样点的增益值作为其平滑过渡增益值,取当前帧的第一个样点的增益值为1,对当前帧内的其它样点的增益值按顺序进行线性化处理获得各个样点的增益值,并使当前帧内的各个样点的增益值从1线性递增到最后一个样点的平滑过渡增益值。
所述线性化处理的过程可以为使当前帧内每个语音样点的增益值呈顺序递增的等差数列。
本步骤是对相邻语音帧的衔接处,进行帧间平滑处理。
步骤A3,为了防止当前帧内相邻语音样点间发生增益值骤变,下面对当前帧的各个语音样点的增益进行帧内平滑处理。即根据步骤A2计算得到的增益值g(n)计算帧内平滑增益值gave(n):
g ave ( n ) = 1 M Σ i = 0 M g ( n - i ) - - - ( 6 ) ;
(三)当为10时,即前一帧为语音帧,当前帧为噪音帧,此时将当前帧的第一个语音样点的增益值取为平滑过渡增益值,最后一个语音样点的增益值为1,其余各个语音样点的增益值由平滑过渡增益值线性递减到1。
其处理过程与分类为01时的情况大致相同,同样执行步骤A1利用公式5求得当前帧的第一个样点的增益值;执行A3对求得的增益进行平滑,区别在于执行步骤A2时,是将当前帧的第一个语音样点的增益值取为步骤A1计算所得的当前帧第一个样点增益值,而将最后一个语音样点的增益值取为1,然后按照顺序递减的等差数列取其它语音样点的增益值。
应当说明的是,本步骤中亦可取前一帧的最后一个语音样点的增益值作为平滑过渡增益值,然后将当前帧内的各个样点的增益值按顺序线性递减到1。这样就无需再进行步骤A1的计算了。
(四)当为11时,即前一帧和当前帧均为语音帧,此时当前帧的每个样点的增益值都应当取为平滑过渡增益值。
其处理过程与分类为01时的区别在于,在执行步骤A1利用公式5求得每一个样点的增益值;执行A3后即获得了每个语音样点的平滑过渡增益值。并且不需要执行A2。
另外,在步骤105中,为了防止背景噪声被放大的过大,还可设定一个允许放大的最大倍数MAX_GAIN,MAX_GAIN为经验常数,如最佳取值为MAX_GAIN=3。如果当前样点的增益大于MAX_GAIN那么当前样点的增益设为MAX_GAIN。
步骤106,利用得到的增益值乘以当前语音样点之前第N个语音样点的输入语音幅度值,得到最终的数字AGC调整之后的输出语音。
用公式表示为:y(n)=gave(n)*x(n-N)。
在本实施例中,为了不对噪声进行调整而引入附加噪声,在系统结构中加入和语音活动检测(VAD)模块用以对输入语音进行分类,并结合前一帧语音的特性分为4类分别进行处理,使对增益的调整更加平滑,最终得到的语音没有听觉失真,且使输入语音的相对大小关系保持不变的条件下提高能量低的语音段,降低能量过高的语音段。
总之,经过上述处理,本实施例提供的数字AGC算法对高信噪比的信号进行处理,可以有效的调整小信号和过大的信号,使之在合理的范围内,且整个调整过程不引入附加语音听觉失真。
本发明同时提供了实现该方法的装置。参照附图3,本发明自动增益控制装置,包括:
语音信号分割模块,用于将语音信号按固定时长分割成若干帧;
活动语音检测模块,将所述语音信号分割模块分割后的每一帧,区分为语音帧或噪音帧两种类型;
帧间平滑处理模块,获取当前帧的各个语音样点的增益值,并在获取增益值的过程中,根据当前帧的类型,对当前帧的语音样点的增益进行帧间平滑处理。
帧内平滑处理模块,根据当前帧的类型,对当前处理的语音样点的增益进行帧内平滑处理。
语音输出模块,根据当前语音样点之前第N个语音样点的输入语音幅度值,乘以帧内平滑增益值得到输出语音,并输出该语音。
所述帧间平滑处理模块包括:
包络检测模块,对当前帧进行包络检测,得到当前帧的包络信息;
所述增益调整模块,根据当前帧和当前帧的前一帧的语音信号类型和包络信息,调整当前帧语音样点增益。
参照附图4,所述包络检测模块包括:
幅度值求模单元,用于对当前帧当前语音样点的幅度值x(n)求绝对值,得到|x(n)|;包络平滑处理单元,根据|x(n)|,利用公式 c ( n ) = max [ | x ( n ) | , | x ( n ) | - βe ave ( n - 1 ) 1 - β ] 使包络跟踪输入语音信号的变化;
最大值选取单元,在当前语音样点和向前数N个语音样点的c(n)的范围内,选取最大的幅度值c(n),即xmax(n)=max[c(n-N),…,c(n)];
包络值计算单元,根据选取的最大幅度值c(n),利用公式emax(n)=αxmax(n)+(1-α)emax(n-1)计算当前语音样点的包络值;
包络幅度平滑处理单元,在当前语音样点和向前数M个语音样点的范围内,对所有语音样点的包络值相加后取平均值 e ave ( n ) = 1 M Σ i = 0 M e max ( n - i ) .
所述增益调整模块包括:
平滑过渡增益值计算单元,根据公式 g ( n ) = ( threshold e ave ( n ) ) θ 计算平滑过渡增益值。
增益调整控制单元,调整当前帧语音样点增益。
增益调整控制单元对当前帧语音样点增益进行如下调整:
如果当前帧和当前帧的前一帧均为噪音帧,将当前帧的增益设为1,对当前帧不放大也不缩小;
如果前一帧为噪音帧,当前帧为语音帧,噪音帧向语音帧过渡,此时将当前帧的第一个语音样点的增益值取为1,最后一个语音样点的增益值为平滑过渡增益值,其余各个语音样点的增益值由1线性递增到平滑过渡增益值;
如果前一帧为语音帧,当前帧为噪音帧,语音帧向噪音帧的过渡,此时将当前帧的第一个语音样点的增益值取为平滑过渡增益值,最后一个语音样点的增益值为1,其余各个语音样点的增益值由平滑过渡增益值线性递减到1;
如果前一帧和当前帧均为语音帧,当前帧每个语音样点的增益值都取为平滑过渡增益值。
所述帧内平滑处理模块包括:
帧内平滑增益值计算单元,根据公式 g ave ( n ) = 1 M Σ i = 0 M g ( n - i ) 计算帧内平滑增益值;
帧内增益调整单元,将当前帧的各个语音样点的增益调整为帧内平滑增益值gave(n)。

Claims (22)

1、一种数字自动增益控制方法,包括:
步骤A,将语音信号按固定时长分成若干帧;
其特征在于还包括:
步骤B,对每一帧语音信号进行活动语音检测,将其区分为语音帧或噪音帧两种类型;
步骤C,获取当前帧的各个语音样点的增益值,并在获取增益值的过程中,根据当前帧的类型,对当前帧的语音样点的增益进行帧间平滑处理。
2、根据权利要求1所述的数字自动增益控制方法,其特征在于所述步骤C中,在获取当前帧的各个语音样点的增益值的过程中,进一步,根据当前帧的类型,对当前处理的语音样点的增益进行帧内平滑处理。
3、根据权利要求1所述的数字自动增益控制方法,其特征在于步骤B具体为:如果当前帧包含语音信号的信息,则当前帧为语音帧,否则为噪音帧。
4、根据权利要求1所述的数字自动增益控制方法,其特征在于步骤C包括:
步骤C11,对当前帧进行包络检测,得到当前帧的包络信息;
步骤C12,根据当前帧语音信号的类型和包络信息,调整当前帧语音样点增益。
5、根据权利要求1所述的数字自动增益控制方法,其特征在于步骤C包括:
步骤C21,对当前帧进行包络检测,得到当前帧的包络信息;
步骤C22,根据当前帧和当前帧的前一帧的语音信号类型和包络信息,调整当前帧语音样点增益。
6、根据权利要求4或5所述的数字自动增益控制方法,其特征在于步骤C11、C21包括如下步骤:
步骤一,选取当前帧中的一个语音样点作为当前语音样点,对当前语音样点的幅度值x(n)求绝对值得到|x(n)|;
步骤二,通过公式 c ( n ) = max [ | x ( n ) | , | x ( n ) | - βe ave ( n - 1 ) 1 - β ] 使包络跟踪输入信号的变化;α是一个预先确定的常数, β = 1 M Σ i = 0 M - 1 ( 1 - α ) N + 1 - i ,M为用来进行包络平滑的窗长度;
步骤三,在当前样点和向前数N个语音样点的c(n)的范围内,选取最大的c(n),即xmax(n)=max[c(n-N),…,c(n)];
步骤四,根据选取的最大值,计算出当前语音样点的包络值:
emax(n)=αxmax(n)+(1-α)emax(n-1)
步骤五,在当前语音样点和向前数M个语音样点的范围内,对所有语音样点的包络值相加后取平均值 e ave ( n ) = 1 M Σ i = 0 M e max ( n - 1 ) .
7、根据权利要求6所述的数字自动增益控制方法,其特征在于步骤C12具体为:
如果当前帧为噪音帧,将当前帧的增益设为1,即对于所有n,g(n)=1,对当前帧的各个语音样点不放大也不缩小;
如果当前帧为语音帧,将当前帧的每个语音样点的增益值调整到平滑过渡增益值g(n),
g ( n ) = ( threshold e ave ( n ) ) θ
θ表示一个和调整的效果有关的常数,一般满足0<θ≤1,threshold表示预先定义的阈值。
8、根据权利要求6所述的数字自动增益控制方法,其特征在于步骤C22具体为:
如果当前帧和当前帧的前一帧均为噪音帧,将当前帧的增益设为1,对当前帧不放大也不缩小;
如果前一帧为噪音帧,当前帧为语音帧,此时将当前帧的第一个语音样点的增益值取为1,最后一个语音样点的增益值为平滑过渡增益值,其余各个语音样点的增益值由1线性递增到平滑过渡增益值;
如果前一帧为语音帧,当前帧为噪音帧,此时将当前帧的第一个语音样点的增益值取为平滑过渡增益值,最后一个语音样点的增益值为1,其余各个语音样点的增益值由平滑过渡增益值线性递减到1;
如果前一帧和当前帧均为语音帧,当前帧每个语音样点的增益值都取为平滑过渡增益值。
9、根据权利要求8所述的数字自动增益控制方法,其特征在于所述平滑过渡增益值g(n),
g ( n ) = ( threshold e ave ( n ) ) θ
θ表示一个和调整的效果有关的常数,一般满足0<θ≤1,threshold表示预先定义的阈值。
10、根据权利要求9所述的数字自动增益控制方法,其特征在于所述帧内平滑处理具体为:将当前帧的各个语音样点的增益调整为帧内平滑增益值gave(n):
g ave ( n ) = 1 M Σ i = 0 M g ( n - i ) .
11、根据权利要求10所述的数字自动增益控制方法,其特征在于,如果当前样点的帧内平滑增益值大于预定门限值,则帧内平滑增益值设为预定门限值。
12、根据权利要求2所述的数字自动增益控制方法,其特征在于还包括步骤D:当前语音样点之前第N个语音样点的输入语音幅度值乘以帧内平滑增益值得到输出语音。
13、一种自动增益控制装置,包括:
语音信号分割模块,用于将语音信号按固定时长分割成若干帧;
其特征在于还包括:
活动语音检测模块,将所述语音信号分割模块分割后的每一帧,区分为语音帧或噪音帧两种类型;
帧间平滑处理模块,获取当前帧的各个语音样点的增益值,并在获取增益值的过程中,根据当前帧的类型,对当前帧的语音样点的增益进行帧间平滑处理。
14、根据权利要求13所述的自动增益控制装置,其特征在于还包括:帧内平滑处理模块,根据当前帧的类型,对当前处理的语音样点的增益进行帧内平滑处理。
15、根据权利要求13所述的自动增益控制装置,其特征在于所述帧间平滑处理模块包括:
包络检测模块,对当前帧进行包络检测,得到当前帧的包络信息;
增益调整模块,根据当前帧语音信号的类型和包络信息,调整当前帧语音样点增益。
16、根据权利要求13所述的自动增益控制装置,其特征在于所述帧间平滑处理模块包括:
包络检测模块,对当前帧进行包络检测,得到当前帧的包络信息;
所述增益调整模块,根据当前帧和当前帧的前一帧的语音信号类型和包络信息,调整当前帧语音样点增益。
17、根据权利要求15或16所述的自动增益控制装置,其特征在于所述包络检测模块包括:
幅度值求模单元,用于对当前帧当前语音样点的幅度值x(n)求绝对值,得到|x(n)|;包络平滑处理单元,根据|x(n)|,利用公式 c ( n ) = max [ | x ( n ) | , | x ( n ) | - βe ave ( n - 1 ) 1 - β ] 使包络跟踪输入语音信号的变化;
最大值选取单元,在当前语音样点和向前数N个语音样点的c(n)的范围内,选取最大的幅度值c(n),即xmax(n)=max[c(n-N),…,c(n)];
包络值计算单元,根据选取的最大幅度值c(n),利用公式
emax(n)=αxmax(n)+(1-α)emax(n-1)计算当前语音样点的包络值;
包络幅度平滑处理单元,在当前语音样点和向前数M个语音样点的范围内,对所有语音样点的包络值相加后取平均值 e ave ( n ) = 1 M Σ i = 0 M e max ( n - i ) .
18、根据权利要求17所述的自动增益控制装置,其特征在于所述增益调整模块包括:平滑过渡增益值计算单元,根据公式 g ( n ) = ( threshold e ave ( n ) ) θ 计算平滑过渡增益值。
增益调整控制单元,调整当前帧语音样点增益。
19、根据权利要求18所述的自动增益控制装置,其特征在于所述增益调整控制单元对当前帧语音样点增益进行如下调整:
如果当前帧为噪音帧,将当前帧的增益设为1,即对于所有n,g(n)=1,对当前帧的各个语音样点不放大也不缩小;
如果当前帧为语音帧,将当前帧的每个语音样点的增益值调整到平滑过渡增益值。
20、根据权利要求18所述的自动增益控制装置,其特征在于所述增益调整控制单元对当前帧语音样点增益进行如下调整:
如果当前帧和当前帧的前一帧均为噪音帧,将当前帧的增益设为1,对当前帧不放大也不缩小;
如果前一帧为噪音帧,当前帧为语音帧,噪音帧向语音帧过渡,此时将当前帧的第一个语音样点的增益值取为1,最后一个语音样点的增益值为平滑过渡增益值,其余各个语音样点的增益值由1线性递增到平滑过渡增益值;
如果前一帧为语音帧,当前帧为噪音帧,语音帧向噪音帧的过渡,此时将当前帧的第一个语音样点的增益值取为平滑过渡增益值,最后一个语音样点的增益值为1,其余各个语音样点的增益值由平滑过渡增益值线性递减到1;
如果前一帧和当前帧均为语音帧,当前帧每个语音样点的增益值都取为平滑过渡增益值。
21、根据权利要求18所述的自动增益控制装置,其特征在于所述帧内平滑处理模块包括:帧内平滑增益值计算单元,根据公式 g ave ( n ) = 1 M Σ i = 0 M g ( n - i ) 计算帧内平滑增益值;帧内增益调整单元,将当前帧的各个语音样点的增益调整为帧内平滑增益值gave(n)。
22、根据权利要求13所述的自动增益控制装置,其特征在于还包括:语音输出模块,根据当前语音样点之前第N个语音样点的输入语音幅度值,乘以帧内平滑增益值得到输出语音,并输出该语音。
CN200710063109A 2007-01-26 2007-01-26 数字自动增益控制方法及装置 Expired - Fee Related CN100589183C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200710063109A CN100589183C (zh) 2007-01-26 2007-01-26 数字自动增益控制方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200710063109A CN100589183C (zh) 2007-01-26 2007-01-26 数字自动增益控制方法及装置

Publications (2)

Publication Number Publication Date
CN101009099A true CN101009099A (zh) 2007-08-01
CN100589183C CN100589183C (zh) 2010-02-10

Family

ID=38697496

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200710063109A Expired - Fee Related CN100589183C (zh) 2007-01-26 2007-01-26 数字自动增益控制方法及装置

Country Status (1)

Country Link
CN (1) CN100589183C (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192411B (zh) * 2007-12-27 2010-06-02 北京中星微电子有限公司 大距离麦克风阵列噪声消除的方法和噪声消除系统
CN102332264A (zh) * 2011-09-21 2012-01-25 哈尔滨工业大学 鲁棒性活动语音检测方法
CN102687196A (zh) * 2009-10-08 2012-09-19 西班牙电信公司 用于检测语音段的方法
CN101203063B (zh) * 2007-12-19 2012-11-28 北京中星微电子有限公司 麦克风阵列的噪声消除方法及装置
CN104200810A (zh) * 2014-08-29 2014-12-10 无锡中星微电子有限公司 自动增益控制装置及方法
CN105355197A (zh) * 2015-10-30 2016-02-24 百度在线网络技术(北京)有限公司 用于语音识别系统的增益处理方法及装置
CN105811975A (zh) * 2014-12-30 2016-07-27 展讯通信(上海)有限公司 一种降低量化噪声的方法及装置
CN106060717A (zh) * 2016-05-26 2016-10-26 广东睿盟计算机科技有限公司 一种高清晰度动态降噪拾音器
CN106412689A (zh) * 2016-10-28 2017-02-15 北京数码视讯科技股份有限公司 音频响度调整方法及装置
CN106448712A (zh) * 2016-10-20 2017-02-22 广州视源电子科技股份有限公司 一种音频信号的自动增益控制方法和装置
WO2018099143A1 (zh) * 2016-11-30 2018-06-07 华为技术有限公司 一种处理音频数据的方法和装置
CN108174328A (zh) * 2018-02-06 2018-06-15 深圳市富励逻辑科技有限公司 语音处理系统的自动增益控制方法及控制装置
CN108962275A (zh) * 2018-08-01 2018-12-07 电信科学技术研究院有限公司 一种音乐噪声抑制方法及装置
CN109716432A (zh) * 2018-11-30 2019-05-03 深圳市汇顶科技股份有限公司 增益处理方法及其装置、电子设备、信号采集方法及其系统
CN110111805A (zh) * 2019-04-29 2019-08-09 北京声智科技有限公司 远场语音交互中的自动增益控制方法、装置及可读存储介质
CN110660408A (zh) * 2019-09-11 2020-01-07 厦门亿联网络技术股份有限公司 一种数字自动控制增益的方法和装置
CN110971769A (zh) * 2019-11-19 2020-04-07 百度在线网络技术(北京)有限公司 通话信号的处理方法、装置、电子设备及存储介质
CN111243631A (zh) * 2020-01-14 2020-06-05 北京声智科技有限公司 一种自动增益控制方法及电子设备
CN112151047A (zh) * 2020-09-27 2020-12-29 桂林电子科技大学 一种应用于语音数字信号的实时自动增益控制方法
CN112669878A (zh) * 2020-12-23 2021-04-16 北京声智科技有限公司 声音增益值的计算方法、装置和电子设备
CN113470691A (zh) * 2021-07-08 2021-10-01 浙江大华技术股份有限公司 一种语音信号的自动增益控制方法及其相关装置

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101203063B (zh) * 2007-12-19 2012-11-28 北京中星微电子有限公司 麦克风阵列的噪声消除方法及装置
CN101192411B (zh) * 2007-12-27 2010-06-02 北京中星微电子有限公司 大距离麦克风阵列噪声消除的方法和噪声消除系统
CN102687196A (zh) * 2009-10-08 2012-09-19 西班牙电信公司 用于检测语音段的方法
CN102687196B (zh) * 2009-10-08 2014-05-07 西班牙电信公司 用于检测语音段的方法
CN102332264A (zh) * 2011-09-21 2012-01-25 哈尔滨工业大学 鲁棒性活动语音检测方法
CN104200810A (zh) * 2014-08-29 2014-12-10 无锡中星微电子有限公司 自动增益控制装置及方法
CN105811975B (zh) * 2014-12-30 2018-11-27 展讯通信(上海)有限公司 一种降低量化噪声的方法及装置
CN105811975A (zh) * 2014-12-30 2016-07-27 展讯通信(上海)有限公司 一种降低量化噪声的方法及装置
CN105355197A (zh) * 2015-10-30 2016-02-24 百度在线网络技术(北京)有限公司 用于语音识别系统的增益处理方法及装置
CN106060717A (zh) * 2016-05-26 2016-10-26 广东睿盟计算机科技有限公司 一种高清晰度动态降噪拾音器
CN106448712A (zh) * 2016-10-20 2017-02-22 广州视源电子科技股份有限公司 一种音频信号的自动增益控制方法和装置
CN106448712B (zh) * 2016-10-20 2019-06-25 广州视源电子科技股份有限公司 一种音频信号的自动增益控制方法和装置
CN106412689A (zh) * 2016-10-28 2017-02-15 北京数码视讯科技股份有限公司 音频响度调整方法及装置
WO2018099143A1 (zh) * 2016-11-30 2018-06-07 华为技术有限公司 一种处理音频数据的方法和装置
CN108174328A (zh) * 2018-02-06 2018-06-15 深圳市富励逻辑科技有限公司 语音处理系统的自动增益控制方法及控制装置
CN108962275A (zh) * 2018-08-01 2018-12-07 电信科学技术研究院有限公司 一种音乐噪声抑制方法及装置
CN109716432A (zh) * 2018-11-30 2019-05-03 深圳市汇顶科技股份有限公司 增益处理方法及其装置、电子设备、信号采集方法及其系统
CN110111805A (zh) * 2019-04-29 2019-08-09 北京声智科技有限公司 远场语音交互中的自动增益控制方法、装置及可读存储介质
CN110660408A (zh) * 2019-09-11 2020-01-07 厦门亿联网络技术股份有限公司 一种数字自动控制增益的方法和装置
CN110660408B (zh) * 2019-09-11 2022-02-22 厦门亿联网络技术股份有限公司 一种数字自动控制增益的方法和装置
CN110971769A (zh) * 2019-11-19 2020-04-07 百度在线网络技术(北京)有限公司 通话信号的处理方法、装置、电子设备及存储介质
CN111243631A (zh) * 2020-01-14 2020-06-05 北京声智科技有限公司 一种自动增益控制方法及电子设备
CN112151047A (zh) * 2020-09-27 2020-12-29 桂林电子科技大学 一种应用于语音数字信号的实时自动增益控制方法
CN112151047B (zh) * 2020-09-27 2022-08-05 桂林电子科技大学 一种应用于语音数字信号的实时自动增益控制方法
CN112669878A (zh) * 2020-12-23 2021-04-16 北京声智科技有限公司 声音增益值的计算方法、装置和电子设备
CN112669878B (zh) * 2020-12-23 2024-04-19 北京声智科技有限公司 声音增益值的计算方法、装置和电子设备
CN113470691A (zh) * 2021-07-08 2021-10-01 浙江大华技术股份有限公司 一种语音信号的自动增益控制方法及其相关装置

Also Published As

Publication number Publication date
CN100589183C (zh) 2010-02-10

Similar Documents

Publication Publication Date Title
CN100589183C (zh) 数字自动增益控制方法及装置
CN104200810B (zh) 自动增益控制装置及方法
CN101533641B (zh) 对多声道信号的声道延迟参数进行修正的方法和装置
CN101478296B (zh) 一种多声道系统中的增益控制方法及装置
WO2006116024A3 (en) Systems, methods, and apparatus for gain factor attenuation
US20080253586A1 (en) Systems and methods for controlling audio loudness
EP2172930B1 (en) Audio signal processing device and audio signal processing method
EP1526639A3 (en) Voice enhancement system
CN101388216A (zh) 声音处理装置、控制增益的装置和方法
CN103226952A (zh) 语音处理装置、方法和程序
US9002033B2 (en) Scaling a plurality of signals to prevent amplitude clipping
CN101068105A (zh) 放大器单元及其故障检测方法
CN1166244A (zh) 一种放大器电路以及一种用于控制射频通讯系统中的放大器的方法
CN101729034A (zh) 语音处理装置、动态范围控制模块及语音振幅调整的方法
CN105490654B (zh) 语音采集系统的自动增益控制器控制方法及电路
CN101567672B (zh) 获取增益的方法及系统
CN102307323B (zh) 对多声道信号的声道延迟参数进行修正的方法
CN104332162A (zh) 一种音频信号车辆识别系统
US6081603A (en) Method and apparatus for automatic gain control using a linear limiter circuit with voltage controlled resistors as a variable element
CN106448690A (zh) 一种音频信号的自动增益控制方法和装置
CN103278548A (zh) 一种固态纳米孔dna测序的电信号校准方法
US20120262233A1 (en) Mixed signal dynamic range compression
CN107516528B (zh) 一种音频链路自检方法
CN101820563B (zh) 扬声器保护系统
US20140023208A1 (en) Digital audio amplification device using harmonics and method thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100210

Termination date: 20200126