JP3588555B2 - 音声レベル自動調整方法及び装置 - Google Patents
音声レベル自動調整方法及び装置 Download PDFInfo
- Publication number
- JP3588555B2 JP3588555B2 JP32506398A JP32506398A JP3588555B2 JP 3588555 B2 JP3588555 B2 JP 3588555B2 JP 32506398 A JP32506398 A JP 32506398A JP 32506398 A JP32506398 A JP 32506398A JP 3588555 B2 JP3588555 B2 JP 3588555B2
- Authority
- JP
- Japan
- Prior art keywords
- gain
- level
- setting
- maximum
- minimum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Control Of Amplification And Gain Control (AREA)
Description
【発明の属する技術分野】
この発明は、主に通信会議等に用いられる拡声通話系において、収音された音声信号のレベルを発話者の声の大きさや、マイクロホンとの距離によらず、ある一定範囲のレベルに自動的に調整する方法及び装置に関するものである。
【0002】
【従来の技術】
テレビ会議等の拡声通話系において、発話者の声の大きさや、発話者とマイクロホンとの距離によらず、収音された音声が、ある一定範囲のレベルで相手側のスピーカから再生されるように、音声レベルを自動的に調整する技術がある。
この従来の技術として、第1の方法は、文献:Peter L. Chu,“Voice−activated AGC for teleconferencing,”Proc. ICASSP96,vol. 2,pp.929−932(1996)記載の方法である。この方法では、音声信号を20ms毎のフレームに分割し、そのフレーム内でのエネルギーを計算し、過去2秒間に渡って各フレームのエネルギーの最大値を求める。そして、この最大値が所望の大きさであるかどうかを判断し、現在のフレームのゲインを決定し、音声レベルを調節する。この方法では、入力された音声が、フレーム幅の時間分蓄積されてから、処理が実行され、その後、レベル調整された音声が出力されるため、出力に遅延を伴い、遠端の相手の反応が遅く感じられるため、通信会議の円滑性を損なう場合がある。
【0003】
また、第2の方法として、特願平5−156774:「自動音量制御方法」がある。この方法は、第1の方法のように、フレーム処理を行わず、逐次処理によりレベル調整を行うため、出力に遅延を伴わない。この方法は、自動車内でのオーディオシステムへの適用を想定し、自動車内の騒音レベルに応じて、音楽信号のスピーカ出力を自動調整するものであり、拡声通話系には、そのままでは適用できないが、ゲイン調整は以下のように行われる。音楽信号S(t)を電子ボリュームのゲインVを乗じスピーカから音楽信号に変換し、観測用マイクで検出される信号X(t)を観測したとき、推定倍率をβi を、
と計算し、
Ri+1 =βi+1 −βi (2)
として、Ri+1 >0のとき電子ボリュームのゲインVをΔVだけ減少させ、Ri+1 <0のとき電子ボリュームのゲインVをΔVだけ増加させることにより、音楽信号S(t)の出力レベルを調整する。調整ゲイン(電子ボリュームのゲイン)Vを決定するにあたり、音楽信号等の微分値を計算する必要があるため、演算量が多くなる点や、ゲインの修正量が一定値(−ΔV,ΔV)であるため、この修正量が小さく設定されると目標値への到達がおそくなり、大きく設定されると、微調整が困難等の問題がある。
【0004】
【発明が解決しようとする課題】
この発明の課題は、例えば拡声通話系に適用され、前述の従来の技術の項で記載した第2の方法のように、出力遅延の生じない逐次処理によりレベル調整を行う方法において、なおかつ、演算量の多くなる信号の微分値計算を必要とせず、また、ゲインの修正量を状況に応じて変化させることにより、素早くかつ精度良く音声レベル調整ゲインを計算する方法及び装置を提供することにある。
【0005】
【課題を解決するための手段】
前述の課題を解決するため、この発明では、適応ディジタル信号処理の一手法であり、例えば文献:「音響システムとディジタル処理」、大賀、金田、山崎、電子情報通信学会編、コロナ社(1995)等に記載されている学習同定法(NLMS法)を適用する。学習同定法は、未知の線形システムの入力と出力とを利用して、その未知システムを逐次推定する方法であるが、入力信号等の微分値を計算する必要はない。また、推定された疑似システムの修正量は、未知システムの出力と疑似システムの出力との誤差の大きさに依存するため、推定状態に応じて、必要な量だけ修正される。
【0006】
さて、学習同定法は、既に存在している未知システムに、信号を入力し、その出力を観測することで、未知システムを推定する。しかし、いま適用すべき音声レベル調整においては、未知システムとして扱う音声レベル調整ゲイン(第2の利得)は、決定されるまで存在しないため、出力を観測することはできない。そこで、ここでは、観測できない出力の代わりに、目標とする所望音声レベルの平均パワーを一定値として設定し、この一定値を未知システムの出力として用いる。このときの入力は、実際にレベル調整対象となる音声信号の短時間平均パワーを用いる。すなわち、離散時間kにおいて、入力音声信号s(k)の短時間平均パワーをPs(k)、所望音声レベルの平均パワー(目標値)をPd、音声レベル調整ゲインをGain(k)とし、Gain(k)を以下のように決定する。まず、Gain(k)とは別に、適応調整ゲイン(第1の利得)g(k)を導入する。g(k)は、学習同定法により、
と逐次更新される。ただし、
e(k)=Pd−g(k)Ps(k) (4)
であり、μは、0〜2の範囲で設定されるステップサイズ係数である。さらに、式(3)において、正の非零の安定化係数δを導入し、
g(k+1)=g(k)+μ・e(k)/(Ps(k)+δ) (5)
とすることにより、零除算を防止する。このようにして得られたg(k+1)は、信号のパワーについて得られたゲインであるから、実際の音声信号のレベル調整を行うGain(k)は、
Gain(k+1)=√(g(k+1)) (6)
となる。これより、時刻k+1において、レベル調整された音声信号Gain(k+1)s(k+1)を出力する。以下、上記の手順を繰り返す。
【0007】
以上のように音声レベル調整を行うことが、この発明の特徴である。
作用
音声信号を所望のレベルに調整する音声レベル自動調整方法において、学習同定法により、逐次的に、信号の微分値を用いず、推定状態に応じて修正量を変化させながら調整ゲインを更新計算するため、ゲイン調整された音声を出力されるまでの遅延がなく、更新計算の演算量が少なく、高速かつ高精度な音声レベル調整ゲインを得ることができる。
【0008】
【発明の実施の形態】
実施例1
図1の実施例1は、以下の手順により音声レベル調整ゲインGain(k)を決定する。
手順(1)上記調整ゲイン(第2の利得)Gain(k)とは別に、適応調整ゲイン(第1の利得)g(k)を設け、この適応調整ゲインg(k)に初期値g0 を与える。g0 は通常は1が考えられる。
【0009】
手順(2)入力音声信号s(k)の例えば数100ミリ秒間の短時間平均パワーPs(k)を計算する。
手順(3)上記短時間平均電力Ps(k)と上記適応調整ゲインg(k)との積g(k)Ps(k)と、設定された目標値Pdとの誤差e(k)=Pd−g(k)Ps(k)を計算する。
【0010】
手順(4)安定化係数δ、ステップサイズ係数μを用い、上記適応調整ゲインの更新値g(k+1)を
g(k+1)=g(k)+μ・e(k)/(Ps(k)+δ) (7)
とする。μは1より小さい正の値で、例えば0.001程度、δも1より小さい正の値で、入力音声信号の平均レベルが予め知られている場合はその値の1/100程度とされる。
【0011】
手順(5)上記調整ゲインGain(k+1)を
Gain(k+1)=√(g(k+1)) (8)
と更新する。
上記、手順(2)から(5)を繰り返す。
各時刻kごとに調整ゲインG(k)を入力音声信号s(k)に乗算して、音声レベルの調整を行う。
実施例2
図2の実施例2では、実施例1の手順(2)において、入力音声信号s(k)の短時間平均パワーPs(k)の代わりに、短時間平均振幅As(k)を用いる。この場合、手順(5)での上記調整ゲインGain(k)を
Gain(k+1)=g(k+1) (9)
と更新する。
実施例3
図3の実施例では、実施例1または実施例2において、入力音声信号が無いと判断された場合には、適応調整ゲインg(k)を初期値g0 に戻す手順を含む(図3は、実施例1への適用例である)。これにより、無音区間でのゲインの増大を防止する。手順(2)の後、入力音声が有るかを調べる(手順(6))。音声信号が有れば手順(3)に移る。入力音声信号の有無の判断には、拡声通話系に必須な音声スイッチ回路やエコーキャンセラ回路等が、送話信号の有無、受話信号の有無を判断しているため、この状態信号を利用することができる。つまり、送話信号の自動レベル調整をする場合は、音声スイッチ回路等により検出される送話信号の有無により、入力音声信号の有無を判定し、受話信号の自動レベル調整をする場合は、同様に受話信号の有無により、入力音声信号の有無を判定する。これにより、入力音声信号が無いと判断された場合には、手順(7)に示すように上述の適応調整ゲインg(k)を初期値g0 に戻す処理を行って手順(5)に移る。適応調整ゲインg(k)の初期値g0 への戻し方としては、瞬時に戻す方法、段階的に戻す方法があり、段階的に戻す方法には、段階幅を真数で等間隔とする方法と対数で等間隔とする方法がある。真数で等間隔とする方法は、適応調整ゲインg(k)に定数(図3では、gstep1)を足すか引くかして、初期値g0 へ戻す。対数で等間隔とする方法は、適応調整ゲインg(k)に定数を掛けるか割るかして、初期値g0 へ戻す。図3では、真数で等間隔に戻す方法を示している。つまり|g(k)−g0 |<gstep1であればg(k+1)=g0 とし、前記条件以外でg(k)<g0 のときはg(k+1)=g(k)+gstep1とし、g(k)>g0 のときはg(k+1)=g(k)−gstep1とする。
【0012】
実施例3では入力音声信号がない場合に適応調整ゲインg(k)を直ちに初期値g0 に戻すか、段階的にg0 に戻したが、適応調整ゲインg(k)に対する修正量を零にしてもよい、つまり式(7)の右辺第2項を零にしてもよい。この場合適応調整ゲインg(k)が修正されることなく維持されるため、無音状態における調整ゲイン増大を防止できる。
実施例4
図4の実施例では、実施例1または実施例2において手順(2)の後に手順(8)で、調整ゲインGain(k)と入力音声信号s(k)との積の絶対値|Gain(k)s(k)|が、上限値Upper(例えば使用する演算装置の演算がオーバフローしない最大値)を越えていないかを調べ、越えている場合には、手順(9)で適応調整ゲインg(k)を初期値に戻して手順(5)に移る。これにより、実施例3は、無音状態の場合のゲイン増大を防止するものであったが、この実施例は、入力音声が、小さいレベルであったのが、突如大きなレベルに変化し、調整ゲインの追随が遅れた場合に、過大音量となるのを防止する。手順(9)での適応調整ゲインg(k)の初期値g0 への戻し方としては、実施例3で述べた方法と同様である。
実施例5
図5の実施例は、実施例3と実施例4をまとめたものである。手順(2)の後に手順(6)で入力音声有りかを調べ、入力音声がある場合は手順(8)で|Gain(k)s(k)|が上限値Upperを越えないかを調べる。ただし、無音状態の場合よりも、|Gain(k)s(k)|が過大となった場合に対する適応調整ゲインg(k)の初期値g0 への戻し方を素早く行うようにすることを特徴とする。つまり初期値g0 へ段階的に戻すための定数gstep1は0.001程度とし、定数gstep2は0.1程度とする。
実施例6
図6の実施例では、適応調整ゲインg(k)に、上限値Gmax と下限値Gmin を設け、適応調整ゲインg(k)の可変範囲を制限し、動作の安定化を図っている。図6は、実施例5に、上記の適応調整ゲインg(k)の可変範囲の制限を加えたものである。この場合の処理手順は、手順(4)、(7)、(9)の後で、手順(10)により求めた適応調整ゲインg(k)が上限値Gmax より小さいかを調べGmax より小さくなければ、手順(11)で適応調整ゲインg(k+1)を上限値Gmax として手順(5)へ移り、手順(10)で上限値Gmax より小さければ、手順(12)で適応調整ゲインg(k)が下限値Gmin より大きいかを調べ、大きくなければ手段(13)で適応調整ゲインg(k+1)を下限値Gmin として手順(5)に移り、手順(12)でg(k)がGmin より大きければ手順(5)に移る。Gmax は例えば64(倍)、Gmin は例えば0.25(倍)に選らばれる。
実施例7
図7は、この発明方法の一実施例を示す。この実施例では、調整ゲインGain(k)に、適応調整ゲインg(k)の上限値Gmax より小さい上限値Gainmax 、同様に下限値Gmin より大きい下限値Gainmin を設け、調整ゲインGain(k)の可変範囲を適応調整ゲインg(k)の可変範囲よりも小さくしている。実施例6では、適応調整ゲインg(k)の可変範囲を制限すると、必然的に、調整ゲインGain(k)はg(k)の可変範囲に制限される。このとき、例えば可変範囲の上限値Gmax 付近での調整ゲインGain(k)の値はg(k)と連動し、図8に示すように安定しない。しかし、この実施例によれば、Gain(k)の上限値Gainmax は、g(k)の上限値Gmax よりも小さく設定されているので、図9に示すように上限値Gmax 付近でのg(k)の変動の影響を受け難くすることができる。
【0013】
実施例7における処理手順を述べる。手順(5)の後に、手順(14)で調整ゲインGain(k)(手順(5)で求まったGain(k+1))が上限値Gainmax より小さいかを調べ、小さくなければ、手順(15)で調整ゲインGain(k)を上限値Gainmax として手順(2)に移る。手順(14)でGain(k)がGainmax より小さいと判定されると、手順(16)でGain(k)が下限値Gainmin より大きいかを調べ、大きくなければ、手順(17)でGain(k)を下限値Gainmin にして手順(2)に移る。手順(17)でGain(k)が下限値より大きければ手順(2)に移る。例えばGmax は64(倍)程度、Gainmax は4(倍)程度、Gmin は0.25(倍)程度、Gainmin は1(倍)程度とされる。
【0014】
上述したこの発明の方法の処理手順は、例えば図10に示す機能構成により達成することができる。
入力端子31にはマイクロホンに捕捉された入力音声信号s(k)は一般デジタル信号とされて入力され、この入力音声信号s(k)はパワー計算部32で短時間平均パワーPs(k)が計算され、誤差計算部33内の乗算部34で適応調整ゲインg(k)と乗算され、その乗算値g(k)Ps(k)が、レジスタ35内の目標値Pdから差計算部36で差し引かれて誤差e(k)が得られる。
【0015】
利得修正部37内の修正量演算部38に誤差e(k)と、短時間平均パワーPs(k)と、レジスタ39,41内の各ステップサイズ係数μ、安定化係数δとが入力されて、下記の修正量が演算される。
μ・e(k)/(Ps(k)+δ)
この修正量と適応調整ゲインg(k)とが加算部42で加算されてレジスタ43にg(k+1)として格納され、g(k)が更新される。なおレジスタ43には初期値としてレジスタ44内のg0 が設定される。g(k+1)は利得計算部45で√(g(k+1))が演算され、調整ゲインGain(k+1)が得られ、これがレベル調整部46に与えられ、入力音声信号s(k)に対して乗算され、出力端子46にレベル調整された音声信号が得られる。
【0016】
パワー計算部32で短時間平均振幅As(k)を計算すれば、レジスタ43に得られたg(k+1)が調整ゲインGain(k+1)となる。
実施例3で述べた無音区間での適応調整ゲインg(k)を段階的に初期値g0 へ近づけるための機能構成の例は図11に示すようになる。即ち入力音声信号s(k)が無音区間検出部51に入力され、無音区間が検出されると、適応調整ゲインg(k)とその初期値g0 との差の絶対値|g(k)−g0 |が演算部52で演算され、この値|g(k)−g0 |とレジスタ53の定数gstep1と比較部54で比較され、|g(k)−g0 |の方が小さければ、アンドゲート55を通じて、g0 が出力される。またg(k)とg0 とが比較部56で比較され、g(k)の方が小さいと、加算部57で加算されたg(k)とgstep1との加算値がゲート58より出力され、比較部56でg(k)の方が大きいと、減算部59で減算されたg(k)−gstepがゲート61より出力される。ゲート55,58,61の出力がオアゲート62を通じ、更にアンドゲート63を通じて、無音区間における更新適応調整ゲインg(k+1)として出力され、これが図10中のレジスタ43に格納される。この際、無音区間検出部51の出力で図10中の加算部42の出力がレジスタ43に格納されないように禁止ゲート64が禁止される。
【0017】
実施例4の場合は図12に示すように乗算絶対値部65で入力音声信号s(k)と調整ゲインGain(k)との積の絶対値がとられ、この絶対値とレジスタ66の上限値Upperとが比較部67で比較され、この出力が図11中のアンドゲート63と対応するアンドゲート68に入力される。アンドゲート68には図11中のアンドゲート55,58,61の出力を得る構成と同一構成の出力が同様にオアゲートを通じて入力される。ただし定数gstep1の代りに定数gstep2が用いられる。
【0018】
実施例6に対する機能構成は例えば図13に示すように、レジスタ71,72内の上限値Gmax 、下限値Gmin と適応調整ゲインg(k+1)と比較部73,74でそれぞれ比較され、比較部73でg(k+1)の方が大であればアンドゲ−ト75に比較部73から1が供給され、Gmax がアンドゲート75を通過し、比較部74でg(k+1)の方が小さければアンドゲ−ト76に比較部74から1が供給され、アンドゲート76からGmin が出力され、比較部73でg(k+1)の方が小さく、比較部74でg(k+1)の方が大きければアンドゲ−ト77に比較部73,74からそれぞれ1が供給され、アンドゲート77からg(k+1)が出力され、アンドゲート75,76,77の出力がオアゲート78を通じてg(k+1)として出力される。
【0019】
実施例7に対する機能構成は図13において入力を調整ゲインGain(k+1)とし、比較部73,74でそれぞれ上限値Gainmax 、下限値Gainmin とそれぞれ比較し、同様に出力を得、Gain(k+1)とすればよい。
【0020】
【発明の効果】
拡声通話系において、収音された音声信号のレベルを発話者の声の大きさや、マイクロホンとの距離によらず、ある一定範囲のレベルに自動的に調整する音声レベル自動調整方法において、従来の方法では、フレーム処理に基づき出力に遅延が生じること、レベル調整ゲインの算出に、微分値計算など多くの演算量を必要とすること、レベル調整ゲインの更新幅が一定で、所望レベルまでの到達速度と、精度の両立が難しいこと等が問題であった。
【0021】
この発明方法においては、逐次処理により、出力の遅延をなくし、なおかつ、レベル調整ゲインの算出に、学習同定法を用いているため、微分値計算などが不要で、低演算量で実現でき、さらに、更新幅は、所望レベルへの到達の程度により適応的に変化する。従って、従来方法と比べ、出力遅延がないことによる拡声通話の円滑化、低演算量による低価格化、適応更新幅によるレベル調整の高性能化の効果がある。
【図面の簡単な説明】
【図1】実施例1の処理手順を示す流れ図。
【図2】実施例2の処理手順を示す流れ図。
【図3】実施例3の処理手順を示す流れ図。
【図4】実施例4の処理手順を示す流れ図。
【図5】実施例5の処理手順を示す流れ図。
【図6】実施例6の処理手順を示す流れ図。
【図7】実施例7の処理手順を示す流れ図。
【図8】実施例6のg(k)とGain(k)の上限値付近での値のとり方を示す図。
【図9】実施例7のg(k)とGain(k)の上限値付近での値のとり方を示す図。
【図10】実施例1の機能構成例を示す図。
【図11】実施例3の機能構成例の一部を示す図。
【図12】実施例4の機能構成例の一部を示す図。
【図13】実施例6の機能構成例の一部を示す図。
Claims (14)
- 入力信号レベルに作用する利得を制御することによって出力信号レベルを調節する音声レベル自動調整方法であって、
入力信号の短時間平均振幅を計算し、その短時間平均振幅をもって入力レベルとする入力レベル計算過程と、
前記入力レベルと第1の利得の積と、目標出力レベルとの誤差を計算する誤差計算過程と、
前記誤差を、前記入力レベルと安定化係数との和で除算して得られた商にステップサイズ係数を乗じて修正量を計算し、前記修正量を前記第1の利得に加算して前記第1の利得を修正する修正過程と、
前記修正した第1の利得を第2の利得として設定する設定過程と、
前記入力レベル計算過程と前記誤差計算過程と前記修正過程と前記設定過程を逐次反復する反復過程と、
前記反復過程の反復ごとに得られる前記第2の利得を前記入力信号に乗算する過程と
前記修正過程において前記第1の利得と修正量との和が最大第1の利得を超える場合には前記第1の利得を前記最大第1の利得に設定し、前記第1の利得と修正量との和が最小第1の利得に満たない場合には前記第1の利得を前記最小第1の利得に設定する過程と、
最大第2の利得が前記最大第1の利得より小さく、最小第2の利得が前記最小第1の利得より大きく、前記第2の利得が前記最大第2の利得よりも大きいときには前記第2の利得を前記最大第2の利得に設定し、前記第2の利得が前記最小第2の利得よりも小さいときには前記第2の利得を前記最小第2の利得に設定する過程と、
を有する音声レベル自動調整方法。 - 入力信号レベルに作用する利得を制御することによって出力信号レベルを調節する音声レベル自動調整方法であって、
入力信号の短時間平均パワーを計算し、その短時間平均パワーをもって入力レベルとする入力レベル計算過程と、
前記入力レベルと第1の利得の積と、目標出力レベルとの誤差を計算する誤差計算過程と、
前記誤差を、前記入力レベルと安定化係数との和で除算して得られた商にステップサイズ係数を乗じて修正量を計算し、前記修正量を前記第1の利得に加算して前記第1の利得を修正する修正過程と、
前記修正された第1の利得の平方根を第2の利得として設定する設定過程と、
前記入力レベル計算過程と前記誤差計算過程と前記修正過程と前記設定過程を逐次反復する反復過程と、
前記反復過程の反復ごとに得られる前記第2の利得を前記入力信号に乗算する過程と
前記修正過程において前記第1の利得と修正量との和が最大第1の利得を超える場合には前記第1の利得を前記最大第1の利得に設定し、前記第1の利得と修正量との和が最小第1の利得に満たない場合には前記第1の利得を前記最小第1の利得に設定する過程と、
最大第2の利得が前記最大第1の利得より小さく、最小第2の利得が前記最小第1の利得より大きく、前記第2の利得が前記最大第2の利得よりも大きいときには前記第2の利得を前記最大第2の利得に設定し、前記第2の利得が前記最小第2の利得よりも小さいときには前記第2の利得を前記最小第2の利得に設定する過程と、
を有する音声レベル自動調整方法。 - 前記入力信号レベルに基づいて無音区間を判別し、無音区間でないと判別されると前記修正過程に移る無音区間判別過程と、
前記無音区間が判別された場合には前記第1の利得をその初期値に設定する過程とを有することを特徴とする請求項1又は2記載の音声レベル自動調整方法。 - 前記第2の利得と前記入力信号の瞬時値との積の絶対値が、瞬時レベル上限値を超えるか否かを判別し、超えないと判別されると前記修正過程に移る過程と、
前記瞬時レベル上限値を超えたと判定された場合に前記第1の利得をその初期値に設定する過程を有することを特徴とする請求項1乃至3の何れかに記載の音声レベル自動調整方法。 - 前記第1の利得をその初期値に設定する過程は前記第1の利得の現在値から段階的に前記初期値に漸近させる過程であることを特徴とする請求項3又は4記載の音声レベル自動調整方法。
- 前記入力信号のレベルに基づいて無音区間を判別する無音区間判別過程と、
前記無音区間が判別された場合には前記第1の利得を予め設定した第1のステップ幅で段階的にその初期値に漸近させる第1の漸近過程と、
無音区間でないと判別されると前記第2の利得と前記入力信号の瞬時値との積の絶対値が、瞬時レベル上限値を超えるか否かを判別し、超えないと判別されると前記修正過程に移る過程と、
前記瞬時値レベル上限値を超えると判別された場合に前記第1の利得を予め設定した第2のステップ幅で段階的にその初期値に漸近させる第2の漸近過程とを有し、
前記第2のステップ幅を前記第1のステップ幅より大きく設定しておくことにより、前記第2の漸近過程における前記第1の利得の初期値へ漸近させる速度を、前記第1の漸近過程における前記第1の利得の初期値へ漸近させる速度より速くすることを特徴とする請求項 1 又は2記載の音声レベル自動調整方法。 - 前記入力信号レベルに基づいて無音区間を判別する無音区間判別過程を有し、前記無音区間が判別された場合には前記修正過程において修正量を零とすることを特徴とする請求項1又は2記載の音声レベル自動調整方法。
- 入力信号レベルに作用する利得を制御することによって出力信号レベルを調節する音声レベル自動調整装置であって、
入力信号の短時間平均振幅を計算し、該短時間平均振幅をもって入力レベルとする入力レベル計算手段と、
入力レベルと第1の利得の積と、目標出力レベルとの誤差を計算する誤差計算手段と、
前記誤差を、前記入力レベルと安定化係数との和で除算して得られた商にステップサイズ係数を乗じて修正量を計算し、前記修正量を前記第1の利得に加算して前記第1の利得を修正する修正手段と、
前記第1の利得を第2の利得として設定する設定手段と、
前記入力レベル計算手段と前記誤差計算手段と前記修正手段と前記設定手段を逐次反復する手段と、
前記第2の利得を入力信号に乗算する手段と、
前記修正手段における前記第1の利得と修正量との和が最大利得を超えるか否かを判定し、超える場合には前記第1の利得として前記最大利得を設定する手段と、前記第1の利得と修正量との和が最小利得に満たないか否かを判定し、満ない場合には前記第1の利得として前記最小利得を設定する手段と、
第2の最大利得が前記最大利得より小さく、第2の最小利得が前記最小利得より大きく、前記第2の利得が前記第2の最大利得よりも大きいときには前記第2の利得を前記第2の最大利得に設定し、前記第2の利得が前記第2の最小利得よりも小さいときには前記第2の利得を前記第2の最小利得に設定する手段と、
を有する音声レベル自動調整装置。 - 入力信号レベルに作用する利得を制御することによって出力信号レベルを調節する音声レベル自動調整装置であって、
入力信号の短時間平均パワーを計算し、該短時間平均パワーをもって入力レベルとする入力レベル計算手段と、
入力レベルと第1の利得の積と、目標出力レベルとの誤差を計算する誤差計算手段と、
前記誤差を、前記入力レベルと安定化係数との和で除算して得られた商にステップサイズ係数を乗じて修正量を計算し、前記修正量を前記第1の利得に加算して前記第1の利得を修正する修正手段と、
前記第1の利得の平方根を第2の利得として設定する設定手段と、
前記入力レベル計算手段と前記誤差計算手段と前記修正手段と前記設定手段を逐次反復する手段と、
前記第2の利得を入力信号に乗算する手段と、
前記修正手段における前記第1の利得と修正量との和が最大利得を超えるか否かを判定し、超える場合には前記第1の利得として前記最大利得を設定する手段と、前記第1の利得と修正量との和が最小利得に満たないか否かを判定し、満ない場合には前記第1の利得として前記最小利得を設定する手段と、
第2の最大利得が前記最大利得より小さく、第2の最小利得が前記最小利得より大きく、前記第2の利得が前記第2の最大利得よりも大きいときには前記第2の利得を前記第2の最大利得に設定し、前記第2の利得が前記第2の最小利得よりも小さいときには前記第2の利得を前記第2の最小利得に設定する手段と、
を有する音声レベル自動調整装置。 - 前記入力信号レベルに基づいて無音区間を判別する無音区間判別手段と、無音区間が判別された場合には前記修正手段の修正第1の利得にかえて前記第1の利得をその初期値に設定する手段とを有することを特徴とする請求項8又は9記載の音声レベル自動調整装置。
- 前記第2の利得と前記入力信号の瞬時値との積の絶対値が瞬時レベル上限値を超えるか否かを判別する手段と、前記瞬時レベル上限値を超えた場合に前記修正手段の修正第1の利得にかえて前記第1の利得をその初期値に設定する手段とを有することを特徴とする請求項9乃至10の何れかに記載の音声レベル自動調整装置。
- 前記第1の利得をその初期値に設定する手段は、現在値から段階的に前記初期値に漸近させる手段であることを特徴とする請求項10又は11記載の音声レベル自動調整装置。
- 前記入力信号のレベルに基づいて無音区間を判別する無音区間判別手段と、
前記無音区間が判別された場合には前記第1の利得を予め設定した第1のステップ幅で段階的にその初期値に漸近させる第1の漸近手段と、
無音区間でないと判別されると前記第2の利得と前記入力信号の瞬時値との積の絶対値が、瞬時レベル上限値を超えるか否かを判別し、超えないと判別されると前記修正手段による修正に移る手段と、
前記瞬時値レベル上限値を超えると判別された場合に前記第1の利得を予め設定した第2のステップ幅で段階的にその初期値に漸近させる第2の漸近手段とを有し、
前記第2のステップ幅を前記第1のステップ幅より大きく設定しておくことにより、前記第2の漸近過程における前記第1の利得の初期値へ漸近させる速度を、前記第1の漸近過程における前記第1の利得の初期値へ漸近させる速度より速くすることを特徴とする請求項8又は9記載の音声レベル自動調整装置。 - 前記入力信号レベルに基づいて無音区間を判別する無音区間判別手段と、無音区間が判別された場合には前記修正手段において修正量を零とする手段を有することを特徴とする請求項8又は9記載の音声レベル自動調整装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32506398A JP3588555B2 (ja) | 1998-11-16 | 1998-11-16 | 音声レベル自動調整方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32506398A JP3588555B2 (ja) | 1998-11-16 | 1998-11-16 | 音声レベル自動調整方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000151313A JP2000151313A (ja) | 2000-05-30 |
JP3588555B2 true JP3588555B2 (ja) | 2004-11-10 |
Family
ID=18172748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP32506398A Expired - Fee Related JP3588555B2 (ja) | 1998-11-16 | 1998-11-16 | 音声レベル自動調整方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3588555B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7276967B2 (en) * | 2005-07-01 | 2007-10-02 | Sanyo Electric Co., Ltd. | Signal level adjusting apparatus, gain value updating method, and program |
JP5269175B2 (ja) * | 2011-11-28 | 2013-08-21 | 株式会社東芝 | 音量制御装置、音声制御方法及び電子機器 |
CN105336327B (zh) * | 2015-11-17 | 2016-11-09 | 百度在线网络技术(北京)有限公司 | 音频数据的增益控制方法及装置 |
JP6903884B2 (ja) | 2016-09-15 | 2021-07-14 | 沖電気工業株式会社 | 信号処理装置、プログラム及び方法、並びに、通話装置 |
-
1998
- 1998-11-16 JP JP32506398A patent/JP3588555B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000151313A (ja) | 2000-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100843522B1 (ko) | 노이즈 억제를 위한 방법 및 장치 | |
US6546099B2 (en) | Arrangement for suppressing an interfering component of an input signal | |
US7035398B2 (en) | Echo cancellation processing system | |
JP3361724B2 (ja) | エコーキャンセラ装置 | |
JP5347794B2 (ja) | エコー抑圧方法およびその装置 | |
JP2882364B2 (ja) | 雑音消去方法及び雑音消去装置 | |
US8150045B2 (en) | Automatic gain control system applied to an audio signal as a function of ambient noise | |
JP5300861B2 (ja) | 雑音抑圧装置 | |
US20130066628A1 (en) | Apparatus and method for suppressing noise from voice signal by adaptively updating wiener filter coefficient by means of coherence | |
US20070232257A1 (en) | Noise suppressor | |
KR100423472B1 (ko) | 적응성필터의수렴도측정 | |
JP4204754B2 (ja) | 通信システムにおける適応信号利得制御のための方法及び装置 | |
JPH11345000A (ja) | 雑音消去方法及び雑音消去装置 | |
JP3961290B2 (ja) | 雑音抑圧装置 | |
CN1666495A (zh) | 与平稳频谱功率相关的音频增强系统 | |
WO2013015887A1 (en) | Apparatus and method for automatic gain control | |
JP3269969B2 (ja) | 背景雑音消去装置 | |
JP3588555B2 (ja) | 音声レベル自動調整方法及び装置 | |
JP3929686B2 (ja) | 音声スイッチング装置およびその方法 | |
CN111989934B (zh) | 回声消除装置、回声消除方法、信号处理芯片及电子设备 | |
KR100545832B1 (ko) | 간섭신호에 강인한 음향 반향 제거장치 | |
US9659575B2 (en) | Signal processor and method therefor | |
JP5105912B2 (ja) | 音声明瞭度改善装置およびその騒音レベル推定方法 | |
JP6143702B2 (ja) | エコー消去装置、その方法及びプログラム | |
JP3293575B2 (ja) | 雑音消去方法及びそれを用いた雑音消去装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040224 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040423 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040601 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040624 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040720 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040816 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080820 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080820 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090820 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090820 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100820 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100820 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110820 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120820 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130820 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |