JP3588555B2

JP3588555B2 - 音声レベル自動調整方法及び装置

Info

Publication number: JP3588555B2
Application number: JP32506398A
Authority: JP
Inventors: 末廣島内; 陽一羽田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1998-11-16
Filing date: 1998-11-16
Publication date: 2004-11-10
Anticipated expiration: 2018-11-16
Also published as: JP2000151313A

Description

【０００１】
【発明の属する技術分野】
この発明は、主に通信会議等に用いられる拡声通話系において、収音された音声信号のレベルを発話者の声の大きさや、マイクロホンとの距離によらず、ある一定範囲のレベルに自動的に調整する方法及び装置に関するものである。
【０００２】
【従来の技術】
テレビ会議等の拡声通話系において、発話者の声の大きさや、発話者とマイクロホンとの距離によらず、収音された音声が、ある一定範囲のレベルで相手側のスピーカから再生されるように、音声レベルを自動的に調整する技術がある。
この従来の技術として、第１の方法は、文献：ＰｅｔｅｒＬ．Ｃｈｕ，“Ｖｏｉｃｅ−ａｃｔｉｖａｔｅｄＡＧＣｆｏｒｔｅｌｅｃｏｎｆｅｒｅｎｃｉｎｇ，”Ｐｒｏｃ．ＩＣＡＳＳＰ９６，ｖｏｌ．２，ｐｐ．９２９−９３２（１９９６）記載の方法である。この方法では、音声信号を２０ｍｓ毎のフレームに分割し、そのフレーム内でのエネルギーを計算し、過去２秒間に渡って各フレームのエネルギーの最大値を求める。そして、この最大値が所望の大きさであるかどうかを判断し、現在のフレームのゲインを決定し、音声レベルを調節する。この方法では、入力された音声が、フレーム幅の時間分蓄積されてから、処理が実行され、その後、レベル調整された音声が出力されるため、出力に遅延を伴い、遠端の相手の反応が遅く感じられるため、通信会議の円滑性を損なう場合がある。
【０００３】
また、第２の方法として、特願平５−１５６７７４：「自動音量制御方法」がある。この方法は、第１の方法のように、フレーム処理を行わず、逐次処理によりレベル調整を行うため、出力に遅延を伴わない。この方法は、自動車内でのオーディオシステムへの適用を想定し、自動車内の騒音レベルに応じて、音楽信号のスピーカ出力を自動調整するものであり、拡声通話系には、そのままでは適用できないが、ゲイン調整は以下のように行われる。音楽信号Ｓ（ｔ）を電子ボリュームのゲインＶを乗じスピーカから音楽信号に変換し、観測用マイクで検出される信号Ｘ（ｔ）を観測したとき、推定倍率をβ_ｉを、

と計算し、
Ｒ_ｉ＋１＝β_ｉ＋１−β_ｉ（２）
として、Ｒ_ｉ＋１＞０のとき電子ボリュームのゲインＶをΔＶだけ減少させ、Ｒ_ｉ＋１＜０のとき電子ボリュームのゲインＶをΔＶだけ増加させることにより、音楽信号Ｓ（ｔ）の出力レベルを調整する。調整ゲイン（電子ボリュームのゲイン）Ｖを決定するにあたり、音楽信号等の微分値を計算する必要があるため、演算量が多くなる点や、ゲインの修正量が一定値（−ΔＶ，ΔＶ）であるため、この修正量が小さく設定されると目標値への到達がおそくなり、大きく設定されると、微調整が困難等の問題がある。
【０００４】
【発明が解決しようとする課題】
この発明の課題は、例えば拡声通話系に適用され、前述の従来の技術の項で記載した第２の方法のように、出力遅延の生じない逐次処理によりレベル調整を行う方法において、なおかつ、演算量の多くなる信号の微分値計算を必要とせず、また、ゲインの修正量を状況に応じて変化させることにより、素早くかつ精度良く音声レベル調整ゲインを計算する方法及び装置を提供することにある。
【０００５】
【課題を解決するための手段】
前述の課題を解決するため、この発明では、適応ディジタル信号処理の一手法であり、例えば文献：「音響システムとディジタル処理」、大賀、金田、山崎、電子情報通信学会編、コロナ社（１９９５）等に記載されている学習同定法（ＮＬＭＳ法）を適用する。学習同定法は、未知の線形システムの入力と出力とを利用して、その未知システムを逐次推定する方法であるが、入力信号等の微分値を計算する必要はない。また、推定された疑似システムの修正量は、未知システムの出力と疑似システムの出力との誤差の大きさに依存するため、推定状態に応じて、必要な量だけ修正される。
【０００６】
さて、学習同定法は、既に存在している未知システムに、信号を入力し、その出力を観測することで、未知システムを推定する。しかし、いま適用すべき音声レベル調整においては、未知システムとして扱う音声レベル調整ゲイン（第２の利得）は、決定されるまで存在しないため、出力を観測することはできない。そこで、ここでは、観測できない出力の代わりに、目標とする所望音声レベルの平均パワーを一定値として設定し、この一定値を未知システムの出力として用いる。このときの入力は、実際にレベル調整対象となる音声信号の短時間平均パワーを用いる。すなわち、離散時間ｋにおいて、入力音声信号ｓ（ｋ）の短時間平均パワーをＰｓ（ｋ）、所望音声レベルの平均パワー（目標値）をＰｄ、音声レベル調整ゲインをＧａｉｎ（ｋ）とし、Ｇａｉｎ（ｋ）を以下のように決定する。まず、Ｇａｉｎ（ｋ）とは別に、適応調整ゲイン（第１の利得）ｇ（ｋ）を導入する。ｇ（ｋ）は、学習同定法により、

と逐次更新される。ただし、
ｅ（ｋ）＝Ｐｄ−ｇ（ｋ）Ｐｓ（ｋ）（４）
であり、μは、０〜２の範囲で設定されるステップサイズ係数である。さらに、式（３）において、正の非零の安定化係数δを導入し、
ｇ（ｋ＋１）＝ｇ（ｋ）＋μ・ｅ（ｋ）／（Ｐｓ（ｋ）＋δ）（５）
とすることにより、零除算を防止する。このようにして得られたｇ（ｋ＋１）は、信号のパワーについて得られたゲインであるから、実際の音声信号のレベル調整を行うＧａｉｎ（ｋ）は、
Ｇａｉｎ（ｋ＋１）＝√（ｇ（ｋ＋１））（６）
となる。これより、時刻ｋ＋１において、レベル調整された音声信号Ｇａｉｎ（ｋ＋１）ｓ（ｋ＋１）を出力する。以下、上記の手順を繰り返す。
【０００７】
以上のように音声レベル調整を行うことが、この発明の特徴である。
作用
音声信号を所望のレベルに調整する音声レベル自動調整方法において、学習同定法により、逐次的に、信号の微分値を用いず、推定状態に応じて修正量を変化させながら調整ゲインを更新計算するため、ゲイン調整された音声を出力されるまでの遅延がなく、更新計算の演算量が少なく、高速かつ高精度な音声レベル調整ゲインを得ることができる。
【０００８】
【発明の実施の形態】
実施例１
図１の実施例１は、以下の手順により音声レベル調整ゲインＧａｉｎ（ｋ）を決定する。
手順（１）上記調整ゲイン（第２の利得）Ｇａｉｎ（ｋ）とは別に、適応調整ゲイン（第１の利得）ｇ（ｋ）を設け、この適応調整ゲインｇ（ｋ）に初期値ｇ₀を与える。ｇ₀は通常は１が考えられる。
【０００９】
手順（２）入力音声信号ｓ（ｋ）の例えば数１００ミリ秒間の短時間平均パワーＰｓ（ｋ）を計算する。
手順（３）上記短時間平均電力Ｐｓ（ｋ）と上記適応調整ゲインｇ（ｋ）との積ｇ（ｋ）Ｐｓ（ｋ）と、設定された目標値Ｐｄとの誤差ｅ（ｋ）＝Ｐｄ−ｇ（ｋ）Ｐｓ（ｋ）を計算する。
【００１０】
手順（４）安定化係数δ、ステップサイズ係数μを用い、上記適応調整ゲインの更新値ｇ（ｋ＋１）を
ｇ（ｋ＋１）＝ｇ（ｋ）＋μ・ｅ（ｋ）／（Ｐｓ（ｋ）＋δ）（７）
とする。μは１より小さい正の値で、例えば０．００１程度、δも１より小さい正の値で、入力音声信号の平均レベルが予め知られている場合はその値の１／１００程度とされる。
【００１１】
手順（５）上記調整ゲインＧａｉｎ（ｋ＋１）を
Ｇａｉｎ（ｋ＋１）＝√（ｇ（ｋ＋１））（８）
と更新する。
上記、手順（２）から（５）を繰り返す。
各時刻ｋごとに調整ゲインＧ（ｋ）を入力音声信号ｓ（ｋ）に乗算して、音声レベルの調整を行う。
実施例２
図２の実施例２では、実施例１の手順（２）において、入力音声信号ｓ（ｋ）の短時間平均パワーＰｓ（ｋ）の代わりに、短時間平均振幅Ａｓ（ｋ）を用いる。この場合、手順（５）での上記調整ゲインＧａｉｎ（ｋ）を
Ｇａｉｎ（ｋ＋１）＝ｇ（ｋ＋１）（９）
と更新する。
実施例３
図３の実施例では、実施例１または実施例２において、入力音声信号が無いと判断された場合には、適応調整ゲインｇ（ｋ）を初期値ｇ₀に戻す手順を含む(図３は、実施例１への適用例である）。これにより、無音区間でのゲインの増大を防止する。手順（２）の後、入力音声が有るかを調べる（手順（６））。音声信号が有れば手順（３）に移る。入力音声信号の有無の判断には、拡声通話系に必須な音声スイッチ回路やエコーキャンセラ回路等が、送話信号の有無、受話信号の有無を判断しているため、この状態信号を利用することができる。つまり、送話信号の自動レベル調整をする場合は、音声スイッチ回路等により検出される送話信号の有無により、入力音声信号の有無を判定し、受話信号の自動レベル調整をする場合は、同様に受話信号の有無により、入力音声信号の有無を判定する。これにより、入力音声信号が無いと判断された場合には、手順（７）に示すように上述の適応調整ゲインｇ（ｋ）を初期値ｇ₀に戻す処理を行って手順（５）に移る。適応調整ゲインｇ（ｋ）の初期値ｇ₀への戻し方としては、瞬時に戻す方法、段階的に戻す方法があり、段階的に戻す方法には、段階幅を真数で等間隔とする方法と対数で等間隔とする方法がある。真数で等間隔とする方法は、適応調整ゲインｇ（ｋ）に定数（図３では、ｇｓｔｅｐ１）を足すか引くかして、初期値ｇ₀へ戻す。対数で等間隔とする方法は、適応調整ゲインｇ（ｋ）に定数を掛けるか割るかして、初期値ｇ₀へ戻す。図３では、真数で等間隔に戻す方法を示している。つまり｜ｇ（ｋ）−ｇ₀｜＜ｇｓｔｅｐ１であればｇ（ｋ＋１）＝ｇ₀とし、前記条件以外でｇ（ｋ）＜ｇ₀のときはｇ（ｋ＋１）＝ｇ（ｋ）＋ｇｓｔｅｐ１とし、ｇ（ｋ）＞ｇ₀のときはｇ（ｋ＋１）＝ｇ（ｋ）−ｇｓｔｅｐ１とする。
【００１２】
実施例３では入力音声信号がない場合に適応調整ゲインｇ（ｋ）を直ちに初期値ｇ₀に戻すか、段階的にｇ₀に戻したが、適応調整ゲインｇ（ｋ）に対する修正量を零にしてもよい、つまり式（７）の右辺第２項を零にしてもよい。この場合適応調整ゲインｇ（ｋ）が修正されることなく維持されるため、無音状態における調整ゲイン増大を防止できる。
実施例４
図４の実施例では、実施例１または実施例２において手順（２）の後に手順（８）で、調整ゲインＧａｉｎ（ｋ）と入力音声信号ｓ（ｋ）との積の絶対値｜Ｇａｉｎ（ｋ）ｓ（ｋ）｜が、上限値Ｕｐｐｅｒ（例えば使用する演算装置の演算がオーバフローしない最大値）を越えていないかを調べ、越えている場合には、手順（９）で適応調整ゲインｇ（ｋ）を初期値に戻して手順（５）に移る。これにより、実施例３は、無音状態の場合のゲイン増大を防止するものであったが、この実施例は、入力音声が、小さいレベルであったのが、突如大きなレベルに変化し、調整ゲインの追随が遅れた場合に、過大音量となるのを防止する。手順（９）での適応調整ゲインｇ（ｋ）の初期値ｇ₀への戻し方としては、実施例３で述べた方法と同様である。
実施例５
図５の実施例は、実施例３と実施例４をまとめたものである。手順（２）の後に手順（６）で入力音声有りかを調べ、入力音声がある場合は手順（８）で｜Ｇａｉｎ（ｋ）ｓ（ｋ）｜が上限値Ｕｐｐｅｒを越えないかを調べる。ただし、無音状態の場合よりも、｜Ｇａｉｎ（ｋ）ｓ（ｋ）｜が過大となった場合に対する適応調整ゲインｇ（ｋ）の初期値ｇ₀への戻し方を素早く行うようにすることを特徴とする。つまり初期値ｇ₀へ段階的に戻すための定数ｇｓｔｅｐ１は０．００１程度とし、定数ｇｓｔｅｐ２は０．１程度とする。
実施例６
図６の実施例では、適応調整ゲインｇ（ｋ）に、上限値Ｇmax と下限値Ｇmin を設け、適応調整ゲインｇ（ｋ）の可変範囲を制限し、動作の安定化を図っている。図６は、実施例５に、上記の適応調整ゲインｇ（ｋ）の可変範囲の制限を加えたものである。この場合の処理手順は、手順（４）、（７）、（９）の後で、手順（１０）により求めた適応調整ゲインｇ（ｋ）が上限値Ｇmax より小さいかを調べＧmax より小さくなければ、手順（１１）で適応調整ゲインｇ（ｋ＋１）を上限値Ｇmax として手順（５）へ移り、手順（１０）で上限値Ｇmax より小さければ、手順（１２）で適応調整ゲインｇ（ｋ）が下限値Ｇmin より大きいかを調べ、大きくなければ手段（１３）で適応調整ゲインｇ（ｋ＋１）を下限値Ｇmin として手順（５）に移り、手順（１２）でｇ（ｋ）がＧmin より大きければ手順（５）に移る。Ｇmax は例えば６４（倍）、Ｇmin は例えば０．２５（倍）に選らばれる。
実施例７
図７は、この発明方法の一実施例を示す。この実施例では、調整ゲインＧａｉｎ（ｋ）に、適応調整ゲインｇ（ｋ）の上限値Ｇmax より小さい上限値Ｇａｉｎmax 、同様に下限値Ｇmin より大きい下限値Ｇａｉｎmin を設け、調整ゲインＧａｉｎ（ｋ）の可変範囲を適応調整ゲインｇ（ｋ）の可変範囲よりも小さくしている。実施例６では、適応調整ゲインｇ（ｋ）の可変範囲を制限すると、必然的に、調整ゲインＧａｉｎ（ｋ）はｇ（ｋ）の可変範囲に制限される。このとき、例えば可変範囲の上限値Ｇmax 付近での調整ゲインＧａｉｎ（ｋ）の値はｇ（ｋ）と連動し、図８に示すように安定しない。しかし、この実施例によれば、Ｇａｉｎ（ｋ）の上限値Ｇａｉｎmax は、ｇ（ｋ）の上限値Ｇmax よりも小さく設定されているので、図９に示すように上限値Ｇmax 付近でのｇ（ｋ）の変動の影響を受け難くすることができる。
【００１３】
実施例７における処理手順を述べる。手順（５）の後に、手順（１４）で調整ゲインＧａｉｎ（ｋ）（手順（５）で求まったＧａｉｎ（ｋ＋１））が上限値Ｇａｉｎｍａｘより小さいかを調べ、小さくなければ、手順（１５）で調整ゲインＧａｉｎ（ｋ）を上限値Ｇａｉｎｍａｘとして手順（２）に移る。手順（１４）でＧａｉｎ（ｋ）がＧａｉｎｍａｘより小さいと判定されると、手順（１６）でＧａｉｎ（ｋ）が下限値Ｇａｉｎｍｉｎより大きいかを調べ、大きくなければ、手順（１７）でＧａｉｎ（ｋ）を下限値Ｇａｉｎｍｉｎにして手順（２）に移る。手順（１７）でＧａｉｎ（ｋ）が下限値より大きければ手順（２）に移る。例えばＧｍａｘは６４（倍）程度、Ｇａｉｎｍａｘは４（倍）程度、Ｇｍｉｎは０．２５（倍）程度、Ｇａｉｎｍｉｎは１（倍）程度とされる。
【００１４】
上述したこの発明の方法の処理手順は、例えば図１０に示す機能構成により達成することができる。
入力端子３１にはマイクロホンに捕捉された入力音声信号ｓ（ｋ）は一般デジタル信号とされて入力され、この入力音声信号ｓ（ｋ）はパワー計算部３２で短時間平均パワーＰｓ（ｋ）が計算され、誤差計算部３３内の乗算部３４で適応調整ゲインｇ（ｋ）と乗算され、その乗算値ｇ（ｋ）Ｐｓ（ｋ）が、レジスタ３５内の目標値Ｐｄから差計算部３６で差し引かれて誤差ｅ（ｋ）が得られる。
【００１５】
利得修正部３７内の修正量演算部３８に誤差ｅ（ｋ）と、短時間平均パワーＰｓ（ｋ）と、レジスタ３９，４１内の各ステップサイズ係数μ、安定化係数δとが入力されて、下記の修正量が演算される。
μ・ｅ（ｋ）／（Ｐｓ（ｋ）＋δ）
この修正量と適応調整ゲインｇ（ｋ）とが加算部４２で加算されてレジスタ４３にｇ（ｋ＋１）として格納され、ｇ（ｋ）が更新される。なおレジスタ４３には初期値としてレジスタ４４内のｇ_０が設定される。ｇ（ｋ＋１）は利得計算部４５で√（ｇ（ｋ＋１））が演算され、調整ゲインＧａｉｎ（ｋ＋１）が得られ、これがレベル調整部４６に与えられ、入力音声信号ｓ（ｋ）に対して乗算され、出力端子４６にレベル調整された音声信号が得られる。
【００１６】
パワー計算部３２で短時間平均振幅Ａｓ（ｋ）を計算すれば、レジスタ４３に得られたｇ（ｋ＋１）が調整ゲインＧａｉｎ（ｋ＋１）となる。
実施例３で述べた無音区間での適応調整ゲインｇ（ｋ）を段階的に初期値ｇ_０へ近づけるための機能構成の例は図１１に示すようになる。即ち入力音声信号ｓ（ｋ）が無音区間検出部５１に入力され、無音区間が検出されると、適応調整ゲインｇ（ｋ）とその初期値ｇ_０との差の絶対値｜ｇ（ｋ）−ｇ_０｜が演算部５２で演算され、この値｜ｇ（ｋ）−ｇ_０｜とレジスタ５３の定数ｇｓｔｅｐ１と比較部５４で比較され、｜ｇ（ｋ）−ｇ_０｜の方が小さければ、アンドゲート５５を通じて、ｇ_０が出力される。またｇ（ｋ）とｇ_０とが比較部５６で比較され、ｇ（ｋ）の方が小さいと、加算部５７で加算されたｇ（ｋ）とｇｓｔｅｐ１との加算値がゲート５８より出力され、比較部５６でｇ（ｋ）の方が大きいと、減算部５９で減算されたｇ（ｋ）−ｇｓｔｅｐがゲート６１より出力される。ゲート５５，５８，６１の出力がオアゲート６２を通じ、更にアンドゲート６３を通じて、無音区間における更新適応調整ゲインｇ（ｋ＋１）として出力され、これが図１０中のレジスタ４３に格納される。この際、無音区間検出部５１の出力で図１０中の加算部４２の出力がレジスタ４３に格納されないように禁止ゲート６４が禁止される。
【００１７】
実施例４の場合は図１２に示すように乗算絶対値部６５で入力音声信号ｓ（ｋ）と調整ゲインＧａｉｎ（ｋ）との積の絶対値がとられ、この絶対値とレジスタ６６の上限値Ｕｐｐｅｒとが比較部６７で比較され、この出力が図１１中のアンドゲート６３と対応するアンドゲート６８に入力される。アンドゲート６８には図１１中のアンドゲート５５，５８，６１の出力を得る構成と同一構成の出力が同様にオアゲートを通じて入力される。ただし定数ｇｓｔｅｐ１の代りに定数ｇｓｔｅｐ２が用いられる。
【００１８】
実施例６に対する機能構成は例えば図１３に示すように、レジスタ７１，７２内の上限値Ｇｍａｘ、下限値Ｇｍｉｎと適応調整ゲインｇ（ｋ＋１）と比較部７３，７４でそれぞれ比較され、比較部７３でｇ（ｋ＋１）の方が大であればアンドゲ−ト７５に比較部７３から１が供給され、Ｇｍａｘがアンドゲート７５を通過し、比較部７４でｇ（ｋ＋１）の方が小さければアンドゲ−ト７６に比較部７４から１が供給され、アンドゲート７６からＧｍｉｎが出力され、比較部７３でｇ（ｋ＋１）の方が小さく、比較部７４でｇ（ｋ＋１）の方が大きければアンドゲ−ト７７に比較部７３，７４からそれぞれ１が供給され、アンドゲート７７からｇ（ｋ＋１）が出力され、アンドゲート７５，７６，７７の出力がオアゲート７８を通じてｇ（ｋ＋１）として出力される。
【００１９】
実施例７に対する機能構成は図１３において入力を調整ゲインＧａｉｎ（ｋ＋１）とし、比較部７３，７４でそれぞれ上限値Ｇａｉｎｍａｘ、下限値Ｇａｉｎｍｉｎとそれぞれ比較し、同様に出力を得、Ｇａｉｎ（ｋ＋１）とすればよい。
【００２０】
【発明の効果】
拡声通話系において、収音された音声信号のレベルを発話者の声の大きさや、マイクロホンとの距離によらず、ある一定範囲のレベルに自動的に調整する音声レベル自動調整方法において、従来の方法では、フレーム処理に基づき出力に遅延が生じること、レベル調整ゲインの算出に、微分値計算など多くの演算量を必要とすること、レベル調整ゲインの更新幅が一定で、所望レベルまでの到達速度と、精度の両立が難しいこと等が問題であった。
【００２１】
この発明方法においては、逐次処理により、出力の遅延をなくし、なおかつ、レベル調整ゲインの算出に、学習同定法を用いているため、微分値計算などが不要で、低演算量で実現でき、さらに、更新幅は、所望レベルへの到達の程度により適応的に変化する。従って、従来方法と比べ、出力遅延がないことによる拡声通話の円滑化、低演算量による低価格化、適応更新幅によるレベル調整の高性能化の効果がある。
【図面の簡単な説明】
【図１】実施例１の処理手順を示す流れ図。
【図２】実施例２の処理手順を示す流れ図。
【図３】実施例３の処理手順を示す流れ図。
【図４】実施例４の処理手順を示す流れ図。
【図５】実施例５の処理手順を示す流れ図。
【図６】実施例６の処理手順を示す流れ図。
【図７】実施例７の処理手順を示す流れ図。
【図８】実施例６のｇ（ｋ）とＧａｉｎ（ｋ）の上限値付近での値のとり方を示す図。
【図９】実施例７のｇ（ｋ）とＧａｉｎ（ｋ）の上限値付近での値のとり方を示す図。
【図１０】実施例１の機能構成例を示す図。
【図１１】実施例３の機能構成例の一部を示す図。
【図１２】実施例４の機能構成例の一部を示す図。
【図１３】実施例６の機能構成例の一部を示す図。

Claims

入力信号レベルに作用する利得を制御することによって出力信号レベルを調節する音声レベル自動調整方法であって、
入力信号の短時間平均振幅を計算し、その短時間平均振幅をもって入力レベルとする入力レベル計算過程と、
前記入力レベルと第１の利得の積と、目標出力レベルとの誤差を計算する誤差計算過程と、
前記誤差を、前記入力レベルと安定化係数との和で除算して得られた商にステップサイズ係数を乗じて修正量を計算し、前記修正量を前記第１の利得に加算して前記第１の利得を修正する修正過程と、
前記修正した第１の利得を第２の利得として設定する設定過程と、
前記入力レベル計算過程と前記誤差計算過程と前記修正過程と前記設定過程を逐次反復する反復過程と、
前記反復過程の反復ごとに得られる前記第２の利得を前記入力信号に乗算する過程と
前記修正過程において前記第１の利得と修正量との和が最大第１の利得を超える場合には前記第１の利得を前記最大第１の利得に設定し、前記第１の利得と修正量との和が最小第１の利得に満たない場合には前記第１の利得を前記最小第１の利得に設定する過程と、
最大第２の利得が前記最大第１の利得より小さく、最小第２の利得が前記最小第１の利得より大きく、前記第２の利得が前記最大第２の利得よりも大きいときには前記第２の利得を前記最大第２の利得に設定し、前記第２の利得が前記最小第２の利得よりも小さいときには前記第２の利得を前記最小第２の利得に設定する過程と、
を有する音声レベル自動調整方法。
入力信号レベルに作用する利得を制御することによって出力信号レベルを調節する音声レベル自動調整方法であって、
入力信号の短時間平均パワーを計算し、その短時間平均パワーをもって入力レベルとする入力レベル計算過程と、
前記入力レベルと第１の利得の積と、目標出力レベルとの誤差を計算する誤差計算過程と、
前記誤差を、前記入力レベルと安定化係数との和で除算して得られた商にステップサイズ係数を乗じて修正量を計算し、前記修正量を前記第１の利得に加算して前記第１の利得を修正する修正過程と、
前記修正された第１の利得の平方根を第２の利得として設定する設定過程と、
前記入力レベル計算過程と前記誤差計算過程と前記修正過程と前記設定過程を逐次反復する反復過程と、
前記反復過程の反復ごとに得られる前記第２の利得を前記入力信号に乗算する過程と
前記修正過程において前記第１の利得と修正量との和が最大第１の利得を超える場合には前記第１の利得を前記最大第１の利得に設定し、前記第１の利得と修正量との和が最小第１の利得に満たない場合には前記第１の利得を前記最小第１の利得に設定する過程と、
最大第２の利得が前記最大第１の利得より小さく、最小第２の利得が前記最小第１の利得より大きく、前記第２の利得が前記最大第２の利得よりも大きいときには前記第２の利得を前記最大第２の利得に設定し、前記第２の利得が前記最小第２の利得よりも小さいときには前記第２の利得を前記最小第２の利得に設定する過程と、
を有する音声レベル自動調整方法。
前記入力信号レベルに基づいて無音区間を判別し、無音区間でないと判別されると前記修正過程に移る無音区間判別過程と、
前記無音区間が判別された場合には前記第１の利得をその初期値に設定する過程とを有することを特徴とする請求項１又は２記載の音声レベル自動調整方法。
前記第２の利得と前記入力信号の瞬時値との積の絶対値が、瞬時レベル上限値を超えるか否かを判別し、超えないと判別されると前記修正過程に移る過程と、
前記瞬時レベル上限値を超えたと判定された場合に前記第１の利得をその初期値に設定する過程を有することを特徴とする請求項１乃至３の何れかに記載の音声レベル自動調整方法。
前記第１の利得をその初期値に設定する過程は前記第１の利得の現在値から段階的に前記初期値に漸近させる過程であることを特徴とする請求項３又は４記載の音声レベル自動調整方法。
前記入力信号のレベルに基づいて無音区間を判別する無音区間判別過程と、
前記無音区間が判別された場合には前記第１の利得を予め設定した第１のステップ幅で段階的にその初期値に漸近させる第１の漸近過程と、
無音区間でないと判別されると前記第２の利得と前記入力信号の瞬時値との積の絶対値が、瞬時レベル上限値を超えるか否かを判別し、超えないと判別されると前記修正過程に移る過程と、
前記瞬時値レベル上限値を超えると判別された場合に前記第１の利得を予め設定した第２のステップ幅で段階的にその初期値に漸近させる第２の漸近過程とを有し、
前記第２のステップ幅を前記第１のステップ幅より大きく設定しておくことにより、前記第２の漸近過程における前記第１の利得の初期値へ漸近させる速度を、前記第１の漸近過程における前記第１の利得の初期値へ漸近させる速度より速くすることを特徴とする請求項 1 又は２記載の音声レベル自動調整方法。
前記入力信号レベルに基づいて無音区間を判別する無音区間判別過程を有し、前記無音区間が判別された場合には前記修正過程において修正量を零とすることを特徴とする請求項１又は２記載の音声レベル自動調整方法。
入力信号レベルに作用する利得を制御することによって出力信号レベルを調節する音声レベル自動調整装置であって、
入力信号の短時間平均振幅を計算し、該短時間平均振幅をもって入力レベルとする入力レベル計算手段と、
入力レベルと第１の利得の積と、目標出力レベルとの誤差を計算する誤差計算手段と、
前記誤差を、前記入力レベルと安定化係数との和で除算して得られた商にステップサイズ係数を乗じて修正量を計算し、前記修正量を前記第１の利得に加算して前記第１の利得を修正する修正手段と、
前記第１の利得を第２の利得として設定する設定手段と、
前記入力レベル計算手段と前記誤差計算手段と前記修正手段と前記設定手段を逐次反復する手段と、
前記第２の利得を入力信号に乗算する手段と、
前記修正手段における前記第１の利得と修正量との和が最大利得を超えるか否かを判定し、超える場合には前記第１の利得として前記最大利得を設定する手段と、前記第１の利得と修正量との和が最小利得に満たないか否かを判定し、満ない場合には前記第１の利得として前記最小利得を設定する手段と、
第２の最大利得が前記最大利得より小さく、第２の最小利得が前記最小利得より大きく、前記第２の利得が前記第２の最大利得よりも大きいときには前記第２の利得を前記第２の最大利得に設定し、前記第２の利得が前記第２の最小利得よりも小さいときには前記第２の利得を前記第２の最小利得に設定する手段と、
を有する音声レベル自動調整装置。
入力信号レベルに作用する利得を制御することによって出力信号レベルを調節する音声レベル自動調整装置であって、
入力信号の短時間平均パワーを計算し、該短時間平均パワーをもって入力レベルとする入力レベル計算手段と、
入力レベルと第１の利得の積と、目標出力レベルとの誤差を計算する誤差計算手段と、
前記誤差を、前記入力レベルと安定化係数との和で除算して得られた商にステップサイズ係数を乗じて修正量を計算し、前記修正量を前記第１の利得に加算して前記第１の利得を修正する修正手段と、
前記第１の利得の平方根を第２の利得として設定する設定手段と、
前記入力レベル計算手段と前記誤差計算手段と前記修正手段と前記設定手段を逐次反復する手段と、
前記第２の利得を入力信号に乗算する手段と、
前記修正手段における前記第１の利得と修正量との和が最大利得を超えるか否かを判定し、超える場合には前記第１の利得として前記最大利得を設定する手段と、前記第１の利得と修正量との和が最小利得に満たないか否かを判定し、満ない場合には前記第１の利得として前記最小利得を設定する手段と、
第２の最大利得が前記最大利得より小さく、第２の最小利得が前記最小利得より大きく、前記第２の利得が前記第２の最大利得よりも大きいときには前記第２の利得を前記第２の最大利得に設定し、前記第２の利得が前記第２の最小利得よりも小さいときには前記第２の利得を前記第２の最小利得に設定する手段と、
を有する音声レベル自動調整装置。
前記入力信号レベルに基づいて無音区間を判別する無音区間判別手段と、無音区間が判別された場合には前記修正手段の修正第１の利得にかえて前記第１の利得をその初期値に設定する手段とを有することを特徴とする請求項８又は９記載の音声レベル自動調整装置。
前記第２の利得と前記入力信号の瞬時値との積の絶対値が瞬時レベル上限値を超えるか否かを判別する手段と、前記瞬時レベル上限値を超えた場合に前記修正手段の修正第１の利得にかえて前記第１の利得をその初期値に設定する手段とを有することを特徴とする請求項９乃至１０の何れかに記載の音声レベル自動調整装置。
前記第１の利得をその初期値に設定する手段は、現在値から段階的に前記初期値に漸近させる手段であることを特徴とする請求項１０又は１１記載の音声レベル自動調整装置。
前記入力信号のレベルに基づいて無音区間を判別する無音区間判別手段と、
前記無音区間が判別された場合には前記第１の利得を予め設定した第１のステップ幅で段階的にその初期値に漸近させる第１の漸近手段と、
無音区間でないと判別されると前記第２の利得と前記入力信号の瞬時値との積の絶対値が、瞬時レベル上限値を超えるか否かを判別し、超えないと判別されると前記修正手段による修正に移る手段と、
前記瞬時値レベル上限値を超えると判別された場合に前記第１の利得を予め設定した第２のステップ幅で段階的にその初期値に漸近させる第２の漸近手段とを有し、
前記第２のステップ幅を前記第１のステップ幅より大きく設定しておくことにより、前記第２の漸近過程における前記第１の利得の初期値へ漸近させる速度を、前記第１の漸近過程における前記第１の利得の初期値へ漸近させる速度より速くすることを特徴とする請求項８又は９記載の音声レベル自動調整装置。
前記入力信号レベルに基づいて無音区間を判別する無音区間判別手段と、無音区間が判別された場合には前記修正手段において修正量を零とする手段を有することを特徴とする請求項８又は９記載の音声レベル自動調整装置。