JP5038417B2

JP5038417B2 - 緩慢段階と急速段階の音声ピーク値制限

Info

Publication number: JP5038417B2
Application number: JP2009523828A
Authority: JP
Inventors: スミサーズ、マイケル・ジョン; クロケット、ブレット・グラハム; マクグラス、デイビッド・スタンリー
Original assignee: ドルビーラボラトリーズライセンシングコーポレイション
Priority date: 2006-08-09
Filing date: 2007-08-08
Publication date: 2012-10-03
Anticipated expiration: 2027-08-08
Also published as: ES2399295T3; WO2008021110A3; CN101501988B; TWI489774B; TW200830704A; EP2070191A2; US20090271185A1; US8488811B2; JP2010500613A; EP2070191B1; WO2008021110A2; CN101501988A

Description

本発明は、一般に音声デジタル信号処理および音声ピーク値制限に関する。本発明は、特に、音声信号（audio signal）をしきい値に制限するための、音声信号の可変利得低減に関する。

音声ピーク値制限は、50年以上の間、音声の製作、伝達および再生の基本部分である。図１に示すように、そのほとんどの基本形式において、音声ピーク値制限器は、出力電圧がピーク値制限しきい値（peak-limiting threshold）までの入力電圧と等しいような、入力出力信号レベル特性を有する。しきい値を越える振幅を有する入力音声信号に関しては、出力音声信号レベルがしきい値を越えないように抑制（制限）される。音声についての他の動的利得制御システムのように、利得調整方法は、出力音声信号に導入される不自然な結果（artifact）の性質および可聴性に重要な影響を及ぼす。

その最も初期の用途の１つでは、音声ピーク値制限は、無線放送で生じる過剰変調を防ぐように音声信号振幅を制御した。今日、音声ピーク値制限は、依然として慣例的に無線とテレビ放送中の過剰変調を防いでいる。

音声ピーク値制限はまたレコード原盤製作の重要部分である。フォノグラフ原盤製作には、旋盤がフォノグラフ・レコード・マスターディスクに、音声波形を表わす溝を切削することが含まれる。この場合、フォノグラフ媒体の物理的制限内に適合するように、制限は音声の振幅を抑制し、それ故、レコードの溝の幅および深さを抑制する。

デジタル音声技術の出現で、ピーク値制限を用いる音声振幅の制御は、録音と再生において引き続き重要である。デジタル音声録音は、アナログ信号をデジタル信号に変換することである。そして、入力アナログ音声信号がデジタルシステムによって表わすことができる最大のデジタル音声サンプル値(0ｄＢFS)に対応する入力信号レベルを超過する場合、音声のデジタル表現が録音された状態では、クリップしている。0ｄＢFSを越えたアナログ音声信号レベルは多くても0ｄＢFSによって表わされるために、このクリップが生じる。同様に、多数のデジタル音声信号がスケーリングなしにデジタル領域でミキシングされる場合、再生中に、音声データの合計が0ｄＢFSを超過することは起こりえる。ここで、0ｄＢFSは、デジタルアナログ変換で表わすことができる最大のデジタル信号をいう。この結果はクリップされた出力アナログ波形である。

図２には、クリッピングの代表例として、デジタル録音とデジタル再生の両方の典型が示してある。多数のデジタル音声信号のミキシングは、ドルビー方式のデジタル５．１およびＭＬＰのような現代のマルチチャネルオーディオ・フォーマット、およびステレオ互換性システムやモノラル互換性システム上での再生用に多チャネル資料をダウンミクスするための再生システムの出現で、非常に一般的になった。

最近では、ＣＤ音声やＤＶＤ音声のようなデジタル音声の原盤製作をする際に、ピーク値制限アルゴリズムが、音声のレベル(したがって明白な音の大きさ)を、ユーザ定義のピークレベル(例えば−０．１ｄＢFSあるいは０ｄＢＦＳ)を超えることなく、増やすための標準となっている。音声のますます大きな表現を生成する希望が増大するにつれて、ピーク値制限アルゴリズムの実践はますます普及している。

音声ピーク値制限は、完全な全帯域幅信号上、あるいは異なる別個のオーディオ周波数帯域上でそれぞれピーク値制限操作を行なう、マルチバンド・アプローチで行なうことができる。マルチバンドピーク値制限に関しては、複合信号を再作成するために、個々に処理された周波数帯域がピーク値制限の後で合計される。

一般に、音楽用の原盤製作のように、音声スペクトルおよび音色に対して変更を最小化することが好まれる場合、広帯域ピーク値制限が用いられる。マルチバンドピーク値制限は著しい量のピーク値制限を達成するためにしばしば用いられるが、しかし音声のスペクトル特性および知覚された音色を著しく変更する可能性が附帯する。マルチバンドピーク値制限の用途としては、放送局が非常に大きな知覚された音響レベルだけでなく、マルチバンドピーク値制限の設定によって決定されるような、ユニークな「音」を持つことを望むFM電波伝送がある。

音楽原盤製作中のピーク値制限には、典型的には０ｄＢからおよそ２０ｄＢの間の利得低減が必要である。ＤＶＤプレーヤーおよびホームシアター・レシーバーで生じるように、５チャネルサラウンド音声信号から２チャネル・ステレオ信号へダウンミキシングするには、９ｄＢ以内の利得低減が必要になる。ここで、例えば、ステレオ左チャネルは、５チャネルサラウンド音声信号の左、左サラウンド、および−３ｄＢ減少させた中心チャネルの合計である。

ほとんど聞き取れない程度のピーク値制限は、典型的に０ｄＢから１２ｄＢの範囲の利得低減で達成できる。また、この範囲内で見事に成し遂げる商品が存在する。必要とされる利得低減をおよそ１２ｄＢより大きく限定することは、ピーク値制限の影響が相当可聴になり、ここでは利得低減がおよそ１2ｄＢより大きい場合は多量又は著しいと考えられる。

ここに、音声信号の絶対振幅を制限する、教示された方法および装置を開示する。この方法は、音声信号の利得を低減する第１の可変利得と、そして次に音声信号の利得を第１の可変利得低減より早く低減させる第２の可変利得を備え、その結果として、音声信号の絶対振幅をしきい値に制限するものである。第１の可変利得低減は、第１段階の音声信号の利得を低減する可変利得を有してもよい。また、第２の可変利得低減は、利得を第１段階より早く低減する、第２段階の音声信号の利得を低減する可変利得を有してもよい。

第１の可変利得低減はしきい値を超過した音声信号の軌跡（excursion）を検出し、検出された軌跡を用いて、緩慢利得を計算し、音声信号に緩慢利得を適用することを有する。

第２の可変利得低減は音声信号を遅延させて、遅延させた音声信号中のピークを検出して、検出されたピークからの急速利得を計算し、計算された急速利得による、遅延させた音声信号の修正を有してもよい。遅延は、音声信号をバッファするものでもよい。また、検出はバッファされた音声信号を調べる機能を有するものでもよい。それぞれの虚像(virtual image)の見掛けの方向(apparent direction)およびそれぞれのマトリックスにコード化された音声信号の方向が保持されてもよい。第２の可変利得低減は、遅延がない以外は上記で構成されるような方法と比較して、可聴のスペクトルのスプラッター（splatter）が少なく生成される。バッファリングは、しきい値を超過えるピークに遭遇するために、多量の第２の可変利得低減に対して、限定された量の時間を付与してもよい。遅延は、少なくとも1ミリ秒の遅延を有してもよく、約1.5ミリ秒の遅延を有するのがよい。ピークを検出するには遅延させた音声信号の各時間セグメント中の最大値を決定し、音声信号最大値を遅延させて、遅延させた最大値に基づいて音声信号の利得の低減に関する制御信号を計算してもよい。

最初の上記遅延は、さらにその前に述べた遅延と一致してもよい。計算は遅延させた最大値の低域通過フィルタリングの関数として制御信号を計算する工程を有してもよい。計算は加重平均され遅延させた最大値の関数として制御信号を計算してもよい。

計算はハニング・ウィンドウの平方根の関数である、フィルタリングの係数を使用することを有してもよい。当該使用はハニング・ウィンドウのサイズを遅延バッファと同じ長さに設定することでもよい。

計算はハニング・ウィンドウの平方根の関数である重み付け値を使用してもよい。使用はハニング・ウィンドウのサイズを遅延バッファと同じ長さに設定することでもよい。

急速利得の計算は、ピーク値の検出について決定し、遅延し、計算する手順を実質的に逆にしてもよい。急速利得の計算は、1と利得を低減するために計算された制御信号の合計の逆数として、急速利得を計算してもよい。

急速利得の計算はニュートン・ラプソン（Newton-Rhapson）近似法によって、急速利得を計算してもよい。当該計算は、その収束を遅延させたニュートン・ラプソン近似法によって計算してもよい。当該計算は、収束Sの速度が次式で制限されているような、緩慢ニュートン・ラプソン近似法によって計算してもよい。

当該計算は収束の速度Sが約０．３であるような、緩慢ニュートン・ラプソン近似法によって計算してもよい。

ここに、また上記の方法のうちの１つを実行するためのコンピュータ・プログラムを有するコンピュータ可読媒体が教示されている。

ここに、またCPU、コンピュータで判読可能な媒体の一つ、およびCPUと媒体を連結するバスを有するコンピュータシステムが教示されている。

ここに、また音声ピーク値制限器が教示されている。ピーク値制限器は、音声信号の利得を低減する可変利得用の第１の可変利得低減器、および音声信号の利得を第１の可変利得低減より早く低減する可変利得用の第２の可変利得低減器を備えており、その結果として、音声信号の絶対振幅をしきい値に制限する。第１の可変利得低減器は、音声信号の利得を低減する可変利得用の第１段階を含んでいてもよい。また、第２の可変利得低減器は、利得を第１段階より早く低減する、第２段階の音声信号の利得を低減する可変利得用の第２段階を含んでいてもよい。

第１の可変利得低減器は、音声信号を遅らせる遅延器、遅延させた音声信号内のピークを検出するためのピーク検出器、検出されたピークを使用して、急速利得低減を計算するための急速利得計算機、および計算された急速利得により遅延させた音声信号を修正するための修正器を備える。

当該遅延器はバッファを有していてもよい。また、ピーク検出器は、バッファ付きの音声信号の検査器を有していてもよい。それぞれの虚像の見掛けの方向およびそれぞれのマトリックスにコード化された音声信号の方向が保持されてもよい。第２の可変利得低減器は、遅延器がない以外は上記で構成されるピーク値制限器より、可聴のスペクトルのスプラッターが少なくなっている。遅延器は、少なくとも１ミリ秒の遅延を有してもよく、約１.5ミリ秒の遅延を有するのがよい。ピーク検出器は遅延させた音声信号の各時間セグメント中の最大値を決定する差エンジン、音声信号最大値を遅らせる遅延バッファ、遅延させた最大値に基づいて音声信号の利得の低減に関する制御信号を計算する計算機を有していてもよい。

ピーク検出器の遅延バッファは、ピーク値制限器の遅延器と一致（match）してもよい。計算機は、遅延させた最大値の低域通過フィルタリングの関数として制御信号を計算する計算機を含んでいてもよい。計算機は、加重平均された遅延させた最大値の関数として制御信号を計算する計算機を含んでいてもよい。

フィルタリングの係数はハニング・ウィンドウの平方根の関数でもよい。ハニング・ウィンドウは遅延バッファと同じ長さでもよい。

重み付け値はハニング・ウィンドウの平方根の関数でもよい。ハニング・ウィンドウは遅延バッファと同じ長さでもよい。

急速利得の計算機は、ピーク検出器の演算の手順を実質的に逆にすることにより、急速利得低減を計算する急速利得の計算機でもよい。急速利得の計算機は、１と利得を低減するために計算された制御信号との合計の逆数として、急速利得を計算するための急速利得の計算機でもよい。

急速利得の計算機は急速の利得の計算に関しての急速利得の計算機でもよい。急速利得の計算機は、その収束を遅延させたニュートン・ラプソン近似法によって計算する急速利得の計算機でもよい。急速利得の計算機は、収束Ｓの速度が次式で制限されているような、緩慢ニュートン・ラプソン近似法によって計算する急速利得の計算機でもよい。

急速利得の計算機は、収束Sの速度は約0.3であるような、緩慢ニュートン・ラプソン近似法によって計算する急速利得の計算機でもよい。

本発明およびその好ましい実施例の様々な特徴は、以下の説明と添付の図面の参照により一層よく了解されてもよい。

図１は、典型的な音声制限器（audio limiter）の作用を要約するもので、システムブロック・レベルで音声制限器を図解し、任意のしきい値を有する音声制限器の典型的な入出力電圧特性を示し、ピーク値制限処理の前と後の音声信号の例を示している。図２は、クリッピングの代表例を示すもので、デジタル録音とデジタル再生の両方の代表例である。図３ａは、本発明の一実施例による2段階音声ピーク値制限器を示す。図３ｂは、本発明の一実施例として、さらに図３ａの音声ピーク値制限器を詳述する。図４は、本発明の一実施例による、入力信号と、軌跡検出器出力であると共に当該入力信号に対応する制御信号の数百のサンプルを図示する。図５は、本発明の一実施例による緩慢利得計算機の処理過程の全体図である。図６は、本発明の一実施例による緩慢利得計算機３０４の歪み（warping）関数を図示する。図７は、本発明の一実施例による緩慢利得回路のＲＣモデルにおける抵抗値の更新過程を図示する。図８は、本発明の一実施例による緩慢利得計算機のＲＣ回路をモデル化してある。図９は、本発明の一実施例として、出力抵抗値Ｒｏｕｔと前回の緩慢利得低減値の関係、および入力抵抗Ｒｉｎと制限器しきい値を越える連続する入力音声サンプル数の関係を図示する。図１０は、本発明の一実施例によるピークサンプル検出器を詳述する。図１１は、真値で上書きされた数百のサンプルに対して、ニュートン・ラプソン近似法で推定された急速利得低減値を示している。図１２は、本発明の一実施例として、３ｄＢ〜１８ｄＢでクリップされた信号の急速利得低減をプロットしたもので、同様に、利得低減が大きくなるともに、対応するスペクトルの分散が高い値となる関係もプロットしている。図１３は、本発明の一実施例として、典型的な４４．１ｋＨｚのデジタル音声の内容物の０．５秒について計算された、利得低減信号をピーク値制限する帰結を示している。図１４は、本発明の一実施例として、典型的な４４．１ｋＨｚのデジタル音声の内容物の１．５秒について計算された、別の利得低減信号をピーク値制限する帰結を示している。図１５は、本発明の一実施例として、大幅なクリップ低減条件と持続するクリップ低減条件の下で、ピーク値制限器の2個の段階がどのように動作するかを示している。図１６は、本発明の一実施例による緩慢ピークサンプル検出器の処理過程の全体図である。

図３ａは、本発明の一実施例による2段階の音声ピーク値制限器１０２を示す。ピーク値制限器１０２は、緩慢利得低減器２０２と急速利得低減器２０４を有している。緩慢利得低減器２０２は、しきい値信号２０１および入力音声信号１０１を入力として受け取り、中間音声信号２０３として生成する。急速利得低減器２０４は、しきい値信号20１に加えて中間の音声信号203も入力として受け取り、出力として出力音声信号１03を生成する。

ピーク値制限器１０２は以下のように作動する：緩慢利得低減器２０２は、入力音声信号１０１による１個以上のオーディオチャネルと、しきい値信号20１による制限器しきい値を表わす信号を受け取る。オーディオチャネルの絶対的ピーク値は制限器しきい値を超過してもよい。

急速利得低減器２０４は出力音声信号１03を出力するが、出力音声信号１03は入力音声信号１０１の恐らく制限されたオーディオチャネルである。ピーク値制限器１０２は、制限器しきい値を超過する入力音声信号１０１中の任意の絶対的ピーク値を、制限器しきい値を超えないように制限（利得低減）する。

入力音声信号１０１と出力音声信号１03はそれぞれ、本発明の一実施例による線形のPCMサンプルでもよい。しきい値信号20１は、ｄＢＦＳを単位とする値でもよい。次に、xは入力音声信号１０１を表わし、Mは入力音声信号１０１の入力チャネルの数を表わし、表記ｘ［ｍ、ｎ］において、mは０からＭ−１までのチャネル指数であり、ｎはサンプル指数である。

図３ｂは、本発明の一実施例として、ピーク値制限器１０２をさらに詳述する。緩慢利得低減器２０２は軌跡／超過検出器３０２、緩慢利得計算機３０４および乗算器３０６を含んでいる。軌跡検出器３０２は入力としてしきい値信号20１および入力音声信号１０１を受け取り、出力として制御信号Q[n]３０３を生成する。緩慢利得計算機３０４は入力として制御信号Q[n]303を受け取り、出力として現在の緩慢利得値Ｇ_ｓｌｏｗ［ｎ］信号３０５を生成する。乗算器３０６は、入力音声信号１０１と現在の緩慢利得値Ｇ_ｓｌｏｗ［ｎ］信号３０５を入力として受け取り、また出力として利得低減された音声信号ｘ’［ｍ，ｎ］３０７を生成する。

急速利得低減器２０４は急速利得計算機3１2、ピークサンプル検出器３１１、遅延器３０８および乗算器３１５を含んでいる。遅延器３０８は入力として利得低減された音声信号ｘ’［ｍ，ｎ］３０７を受け取り、また出力として遅延され、利得低減された音声信号ｘ’’［ｍ，ｎ］３１４を生成する。遅延器３０８は、また信号３０９として遅延させた音声信号の全バッファを利用可能にする。ピークサンプル検出器３１０は入力として遅延バッファ信号３０９およびしきい値信号20１を受け取り、出力として制御信号Ｐ’［ｎ］３１１を生成する。急速利得計算機3１2は入力として制御信号Ｐ’［ｎ］３１１を受け取り、また出力として急速利得低減値Ｇ_ＦＡＳＴ［ｎ］３１３を生成する。乗算器3１5は入力として急速利得低減値Ｇ_ＦＡＳＴ［ｎ］３１３および遅延され、利得低減された音声信号ｘ’［ｍ，ｎ］３１４を受け取り、また出力として最終利得低減サンプルｘ’’［ｍ，ｎ］１０３を生成する。

緩慢利得低減器２０２と急速利得低減器２０４の処理の各反復で、各入力チャネルから一個のサンプルが生成され、また、一個の緩慢利得低減値および一個の急速利得低減値の両方が計算され、すべてのチャネルに適用される。チャネルがすべて同じ緩慢・急速利得低減を受け取るので、虚像の見掛けの方向およびマトリックスにコード化された音声信号の方向が保持される。

緩慢利得低減（Slow Gain Reduction）

軌跡（Excursions）の検知（制限器しきい値を超過する音声信号を検知すること）

入力音声信号１０１の全Ｍチャネルについて最大絶対サンプル値が制限器しきい値Tほど大きくない場合、軌跡検出器３０２は、制御信号Ｑ［ｎ］３０３を零（０)にセットする。全Mチャネルについて最大絶対サンプル値が制限器しきい値Tを超過する場合、軌跡検出器302は、入力音声信号が制限器しきい値Tを超過する程度に比例して、制御信号Ｑ［ｎ］３０３をセットする。

したがって、入力音声信号１０１が制限器しきい値Tを超過する場合に限って、緩慢利得低減器２０２は、中間音声信号３０７を出力するために入力音声信号１０１を低減する。

次に、中間音声信号３０７を生成する際に、入力音声信号１０１が制限器しきい値Tを超過するとき、緩慢利得低減器２０２が応答する。しかし、音声信号３０３が制限器しきい値Tよりも低下した後にも、緩慢利得低減器２０２は利得を低減し続けてもよい。

一実施例において、入力音声信号１０１の全Ｍチャネルについて最大絶対サンプル値が制限器しきい値Tよりも大きい場合、制御信号Q[n]は、最大絶対サンプル値の制限器しきい値Tに対する比率にセットされ、これは１未満である。方程式(1)はこの実施例を詳述する。

図４は、本発明の一実施例による、入力信号と、対応する制御信号の数百のサンプルを図示する。入力信号は−３ｄＢのピーク振幅で５００Hzのデジタル正弦波である。また、制限器しきい値Tは０．５ｄＢあるいは−６．０２ｄＢである。図4に示されるように、制御信号Ｑ［ｎ］３０３のサンプル値は各入力ＰＣＭサンプルに関して計算される。

(説明された割り算演算の代わりに、計算量を低減するために、１／Ｔの乗算によって、Q[n]の計算を行うことができる。)

緩慢利得の計算

図５は、本発明の一実施例による緩慢利得計算機の処理過程の全体図である。入力として制御信号Ｑ［ｎ］３０３および前回の緩慢利得値Ｇ_ｓｌｏｗ［ｎ−１］３０５を受け取って、緩慢利得計算機３０４は制御信号Ｑ［ｎ］３０３を修正し（ステップ６０１）、修正済の制御信号６０２を平滑化し(ステップ６０３）、修正され平滑化された制御信号６０４から、現在の緩慢利得値Ｇ_ｓｌｏｗ［ｎ］３０５を計算する（ステップ６０５）。

１つの実施例では、平滑化ステップ６０３には信号依存性の動作開始と解除の特性を取り入れる。

制御信号の修正

修正済の制御信号Ｑ’［ｎ］６０２を作成するために、緩慢利得計算機304は前回の緩慢利得値Ｇ_ｓｌｏｗ[ｎ−１]によって制御信号Q[n]303を修正する(歪ませる)。前回の緩慢利得値Ｇ_ｓｌｏｗ[ｎ−１]３０５は、単一あるいは１．０の値に当初はセットされる。

利得低減が既に非単一である場合、即ちもし既に利得低減が適用されていれば、この修正は、利得低減の量を増加させるように制御信号Q[n]303に対する作用を増幅（増加）する。有益なことに、信号クリッピング(すなわちクリップされる軌跡)が稀にしか起きないときは、緩慢利得低減を生成する際に影響を与えない。しかし、信号クリッピングが急速に連続的に頻繁に発生すると、緩慢利得低減について著しくより多くの利得低減をもたらす。このように、稀なクリップ発生に関しては、この段階はほとんど作動せず、可聴ポンピングの可能性を回避する。

方程式2aおよび2bは、本発明の一実施例に従って歪ませることを示すもので、図６はそのワーピング関数を図示したものである。方程式2a、2bと図６のワーピング関数は、広範囲な実験および検査によって決定された。図６から読み取れるように、前回の緩慢利得低減値がおよそ−６ｄＢである場合、その結果は最も顕著である。

制御信号の平滑化

本発明の一実施例に従って、信号依存性の動作開始時間（attack time）と解除時間（release time）を有するフィルタが、修正済の制御信号Ｑ’［ｎ］602を平滑化する。特に大量の利得低減が必要な場合、これらの信号依存性技術は、利得低減の応用から可聴の不自然な結果（artifacts）を最小限にする。

一実施例では、データ圧縮器（compressor）や振幅制限器（limiter）で周知の、アナログRC回路のデジタル・エミュレーションにより、修正済の制御信号Ｑ’［ｎ］602を平滑化する。ここで、抵抗値の変更は、信号依存性の動作開始と解除の行動に影響する。

図８は本発明の一実施例により、そのような回路をモデル化してある。モデルの単純性のために、ダイオードの両端の電圧降下が0であると仮定される。また、出力抵抗RoutはコンデンサーCの充電中は無視される。Cの好ましい値は１μFである。

図７は、本発明の一実施例により、抵抗値の更新過程を図示している。修正済の制御信号Ｑ‘［ｎ］６０２が０を越えている場合（ステップ７０７)―すなわち、現在の入力サンプル振幅が制限器しきい値を超過する場合に、サンプル・クリップカウントはインクリメントされ（ステップ７０８)、この結果クリッピングにおける時間長の基準を増加させ、そして入力抵抗Rinがクリッピングの時間長の関数として計算される（ステップ７１０)。また、出力抵抗Routは、前回の利得低減値Ｇ_ｓｌｏｗ[ｎ−１]の関数として計算される（ステップ７０９)。

修正済の制御信号Ｑ‘［ｎ］６０２が０を越えない場合（ステップ７０３)―すなわち、現在の入力サンプル振幅が制限器しきい値を超過しない場合に、抵抗器は、初期設定値にセットされ（ステップ７０５、ステップ７０６)、サンプル・クリップカウントはゼロにセットされる（ステップ７０４)。この結果、クリッピングの時間長の基準がリセットされる。

軌跡を検知する際に時間長の関数として入力抵抗Ｒｉｎを計算することによって、平滑器は周波数依存性の様式で動作開始時間を変更する。より短い間隔やより高い周波数でのクリップ発生は動作開始時間を早くする。また、より長い間隔やより低い周波数でのクリップ発生は次第に動作開始時間を遅くする。このことは、より低い周波数の内容物について劇的なゲイン変動の可能性を低減し、これにより可聴の強い打撃音を最小限にする。利得低減の早い動作開始行動は、聴覚の周波数隠蔽がもっと優勢となる、より短い持続時間かより高い周波数でのクリップ発生に関して許容される。

図9では、グラフb)は、本発明の一実施例に従って、入力抵抗Ｒｉｎと、制限器しきい値を超過する連続する入力音声サンプルの数の関係を図示する。抵抗はオームで表現される。また、クリッピングの持続時間は、サンプルレート４４．１ｋＨｚに対するクリッピング中のサンプル数(クリップ・カウント)で表現される。

図9bの中のプロットの形は実験および聞き取りテストに由来する。１３ミリ秒未満(４４．１ｋＨｚでは６００サンプル)のクリップ長さについては、入力抵抗Rinは非線形である。１３ミリ秒より長いクリップ長さについては、方程式5のように、入力抵抗Ｒｉｎは線形である。

ここで、ＣｌｉｐＣｎｔは４４．１ｋＨｚでのクリッピングのサンプル数である。

クリッピングの短い時間長では、入力抵抗Ｒｉｎは、クリッピングの時間増加と共に急速に上昇する。クリッピングの長い時間長では、入力抵抗Ｒｉｎがもっと緩慢に上昇する。Ｒｉｎ値がより低くなると、緩慢利得計算機３０４では動作開始時間がより早くなり、また、Ｒｉｎ値がより高くなると、動作開始時間がより遅くなる。

前回の緩慢利得低減値の関数として出力抵抗Ｒｏｕｔを計算することによって、緩慢利得計算機３０４は、用いている低減の量に比例して解除行動を変更できる。利得低減がほとんど使用されていない場合、解除時間を早くすることで利得低減を単一に早く戻すことを可能にする。利得低減がかなりの量使用されている場合、可聴のポンピングの不自然な結果を最小限にするために、解除時間が増加する。これは、また大量で持続された利得低減が必要な場合、緩慢第１段階が急速第２段階より多くの利得低減を負担することの説明となる。これは、大量の利得低減を適用する場合に、第２段階が生成する可聴のスペクトルのスプラッターを最小限にすることに役立つ。

音声に可変利得係数を掛けることは振幅変調と考えられる。そのため、演算は、音声のスペクトル、可変利得係数のスペクトルおよび利得変化の程度に依存して、可聴であるような追加のスペクトル成分を導入する。ここで、これらの構成要素は「スペクトルのスプラッター」と呼ばれる。)

図9では、グラフa)は、本発明の一実施例に従って、出力抵抗Routと前回の緩慢利得低減値Ｇｓｌｏｗ［ｎ−１］の関係を図示する。前回に使用される利得低減の量が多いほど、出力抵抗Routの値は低くなり、従って平滑回路の解除行動は早くなる。

方程式3は出力抵抗の値を計算する：

多くのコンピュータおよびデジタル信号プロセッサ(DSP)に関して、平方根の計算は計算コストが高い。しかしながら、計算コストがより安い方法で平方根関数に近似できる。好ましい方法は、方程式4に説明される「ニュートン反復」の反復による平方根推定式である。

この方程式では、反復kにおける平方根推定は、前回のｋ−１推定、および計算された平方根の値（この場合Ｇｓｌｏｗ［ｎ−１］）の関数である。

通常は、単一の比較的正確な推定を得るために、多数回の反復が要求される。しかしながら、緩慢利得低減値が比較的ゆっくり経時的に変化するので、一回の反復を行ない、前回のサンプルか緩慢利得低減計算値からの平方根推定値を使用することで十分に正確である。しかし、これは、計算上許容できるか、離散値のルックアップテーブルと置換されるかの、どちらかによる単一の割り算演算を必要とするものの、恐らく精度を犠牲する。

モデル化されたＲＣ回路による制御信号の平滑化は、以下のように演算する。制御信号Ｑ‘［ｎ］６０２が前回の計算値Ｑ‘’［ｎ−１］６０２からのコンデンサ電圧より大きな場合には、コンデンサーは、次式のように、入力抵抗Ｒｉｎによって充電され、出力抵抗Routを通じて放電される。

そうでなければ、コンデンサーは、出力抵抗Routを通じて単に以下のように放電される：

（パラメータfsはHzで表したサンプリングレートである。) 平滑化された制御信号Ｑ’’［ｎ］６０４は、次に、緩慢利得低減値を計算するために使用される。

多くのコンピュータおよびＤＳＰでは、割り算演算は計算コストが高いので、１／Ｒｉｎおよび１／Ｒｏｕｔの有効範囲の値は、ルックアップテーブルに離散値として記憶されるのがよい。これは、方程式６および方程式７の理想状態に対して、制御信号Ｑ［ｎ］６０４に可聴な変化がないため、許容できる。

緩慢利得値の計算

方程式１に従うと、緩慢利得低減値は、典型的には修正されて平滑化された制御信号Q’’[n]604の逆数の関数となる。方程式8はこれを示す：

しかしながら、平滑化特性と多くの実験の結果、好ましい関数は、方程式9に示すような、マイナスの形式である。

(定数sは、１．６５の値である。)

この関数は好ましいものだが、他方それは、理論上制御信号Q’’[n]604が大きな値になると負の利得を帰着する場合がある。実用的な目的のために、典型的に利得低減の必要とされる量が２０ｄＢ未満である場合、平滑化は緩慢利得低減値が常に０を越えるものであることを保証する。

最後に、乗算器306は、利得低減サンプルｘ’［ｍ、ｎ］３０７を作成するために、緩慢利得低減値Gslow[n]305と、各入力チャネルｍからのPCMサンプルとを乗算する。

急速利得低減（Fast Gain Reduction）

遅延

緩慢利得低減サンプルx'[m、n]307は遅延器３０８を通過する。急速利得低減器２０４が制限器しきい値を越えた軌跡が生じる時を知り、出力音声信号が制限器しきい値を越えないことを保証するような急速利得低減について、急速利得低減器２０４が計算することができるように、これは急速利得低減器に予見能力（look ahead）を付与する。この予見能力は、制限器しきい値を越えた軌跡に遭遇するために、多量の急速利得低減に対して限定された量の時間を付与するので、それ故、ピーク値制限器１０２に予見能力がない場合と比較した場合に、利得軌跡（gain trajectory）に起因する可聴のスペクトルのスプラッターの量を減らす。

遅延器３０８の１つの実施例は遅延線であり、より明確には、およそ１．５ミリ秒の予見能力あるいは４４．１ｋＨｚのサンプリングレートでN=66個のサンプルを有する遅延線３０８である。遅延線３０８は先入れ先出し(FIFO)バッファでもよく、また、出力は音声サンプル信号x’’[m、n]3１4である。ここで、１つ以上のチャネルが存在し、各チャネルｍはサンプルと同数だけ遅延される。

遅延器３０８の長さに関しては、より長い利得変化が望ましい。１つの実施例では、しかしながら、支配的な目標はできるだけ短い待ち時間を維持している。実験によると、１ミリ秒より急速な利得変化ではかなり可聴であり、うるさく感じられることを示す。約１．５ミリ秒の予見能力はよい妥協である。

遅延器３０８の遅延線システムが以下の記述で用いられる。

ピークサンプル検出

図１0は本発明の一実施例に従ってピークサンプル検出器３１０を詳述する。この実施例では、ピークサンプル検出器は、フィルタ係数を記憶するためのメモリ１００４、CPU１００３あるいは他の計算手段１００３、遅延バッファ１００２、コンパレーター、および差エンジン１００１を備えている。(もちろん、CPU１００３あるいは別の計算手段１００３は、コンパレーターや差エンジン１００１と同じでもよい。)

コンパレーターと差エンジン１００１は、遅延器３０８の遅延バッファ信号３０９を入力として受け取り、そして中間制御信号を出力する。遅延バッファ１００２は入力としてその中間制御信号を受け取り、出力としてそのバッファの内容物を生成する。計算手段１００３は、入力として遅延バッファ１００２のコンテンツおよびメモリ１００４のコンテンツを受け取り、制御信号3１１を出力する。

ピークサンプル検出器３１０は定義された時間長の間でピーク値を見つけて保持する。それは、遅延器３０８の出力309をとり、制限器しきい値Tを超過した遅延器３０８の内容物の中で最大のサンプル値の関数としての、制御信号P’[n]3１１を生成する(遅延線３０８の長さの中で、前回の１．５ミリ秒までの範囲が有効である)。

図１６は、本発明の一実施例に従ったピークサンプル検出器３１０の過程１６００の全体図である。各入力サンプルで、ピークサンプル検出器３１０は、遅延線３０８の長さにわたり、全ｍチャネルの中で最大絶対値を見つける（ステップ１６０５）。それ、次に、ピークサンプル検出器３１０は制限器しきい値Tで最大絶対値を割り、中間制御信号P[n]を作成するために１を引く(ステップ１6１0)。(方程式(１)でのように、１／Ｔの乗算は効率的にTによる割り算を実施できる。)

この中間制御信号P[n]は、遅延線３０８と同じ長さのＦＩＦＯ遅延線か遅延バッファ１００２を通過する(ステップ１6１5)。

次に、ピークサンプル検出器３１０は、低域通過フィルタされ、または加重平均された中間制御信号P[n]から、出力制御信号P'[n]3１１を計算する(ステップ１620)。遅延線１００２は第（Ｎ−１）次のフィルタあるいは平均に相当する。

ピークサンプル検出器３１０は、長さN(遅延バッファ１００２と同じ長さ)のハニング・ウィンドウの平方根から好ましいフィルタ係数か重み付け値Ｈ［ｉ］１００４を計算する。経験的に、これらは可聴の不自然な結果を生成するのが最も少ない。

ここで、

そしてここで、

方程式１２ｂの正規化ステップは、フィルタ係数Ｈ［ｉ］１００４の合計が単一になることを保証する。

急速利得の計算

１つの実施例では、急速利得低減値は、平滑化されたピーク制御信号Ｐ‘［ｎ］３１１に１を加えたものの逆数である。これは、本質的に方程式１１中のピークサンプル検出演算の逆数である。参照方程式１3：

2個の遅延線３０８、１００２の長さが同じであるので、方程式１3中の急速利得低減値はピークサンプルが遅延線３０８から出現するとともに、絶対的なピークを制限器しきい値Tのレベルに同時に縮小するのに必要な値に達する。対等な遅延器長さNは、音声信号３０７から制御信号P'[n]3１１までの間の整数サンプル群遅延時間に帰着し、これは急速利得低減値Ｇ_ＦＡＳＴ［ｎ］に対応する。

以前述べたように、多くのコンピュータおよびＤＳＰ上の割り算演算は計算コストが高価になるから、方程式１３中の急速利得低減値を計算するための割算に基づかない方法は有益である。しかしながら、離散値を含んでいるルックアップテーブルの使用では、精度を維持すると共に、きめの粗く定められルックアップ表から発生する擬似的なスペクトルのスプラッターを回避するために、膨大なメモリを必要とする。

代案は、ニュートン・ラプソン反復による推定方程式を使用して、急速利得低減値を近似することである。ニュートン・ラプソン推定は、次式の方程式を反復して解く：

有名なニュートン・ラプソン反復近似は、xの初期推定値にx0を使用し、xの更新値をx１として計算する。初期推定値と更新値は、次のニュートン・ラプソン近似方程式を使用して計算される：

ここで、f(x)は方程式１４、１５、１６に示される関数を表わし、f'(x)は関数f(x)の導関数である。

解こうとしている方程式１３の急速利得低減値については、Ｇ_ＦＡＳＴ［ｎ］(x)の値と方程式１3は次の一般的な形式をとる。

その後、ニュートン・ラプソン近似は方程式１4の形式で方程式１５を解く：

ここでα=(１+P'[n])である。方程式１6で解こうとしている方程式について、方程式１7のニュートン・ラプソン近似は次式の形式となる。

しかしながら、この形式はまだαによる割り算を必要とするので、まだ効率的に方程式１5を実行しない。急速利得低減値の計算を除けば、１/αがx0に近似するという事実を導入できる。この近似により、方程式１8は次式の形式となる：

ニュートン・ラプソン方法を適用して：

この近似は、各計算の反復で２倍の精度で小数位数を備えたｘの値にかなり速く収束する。

近似の計算コストを安くするために、単一の反復と同じくらい低くてすむ有用な収束が望ましい。しかしながら、方程式20は、単一の反復用に試してみるべきサンプルからの不適当なゆらぎを示す。解に含まれる不自然な結果をより少なくするために、反復の収束を遅くできる。収束の速度の項Sが方程式20に適用される場合、方程式は次式の形式となる：

ここで、S=１が完全なニュートン・ラプソンを表し、S=0.00１は、故意に非常にゆっくり収束する方法と解釈する。実際上、方程式2１での収束の不適当な振る舞いを回避するために、Sの値を適切に選択することが必要である。例えば、好ましくは、Sは値が次式で表される：

この式の大きな値は、収束中に過剰反応を引き起こすためである。

ここで、x１=Ｇ_ＦＡＳＴ[n]、x0=Ｇ_ＦＡＳＴ[n-１]並びにα=(１+P'[n])として、Ｇ_ＦＡＳＴ[n]の計算中で使用される制御パラメータを適用すると、方程式2１は次式の形式となる：

この方程式では、急速利得低減値Ｇ_ＦＡＳＴ[n]は、前回サンプルｎ−１からの前回値と方程式の入力値、この場合、P'[n]、との関数である。前に述べたように、正確な推定には典型的には多数回の反復が必要である。しかしながら、この方法では、希望する１／（１＋ｘ）値へ急速利得低減値Ｇ_ＦＡＳＴ[n]をゆっくり旋回する単一の反復が、より正確な推定や正確な計算と比較して、可聴の不自然な結果を削減する効果をもたらす。聴取実験によると、Ｓ＝０．３の値が音声中の可聴の不自然な結果を最小にする非常に好結果を与えることが判った。図１１では、数百のサンプルに対するニュートン・ラプソン近似による急速利得値の例を、方程式１3を使用して計算されたその真値と共に示す。

最後に、急速利得低減値Ｇ_ＦＡＳＴ[n]3１3の生成値と、遅延線３０８からの出力である前回の利得低減値x' [m、n]とを乗算して、最終の利得低減値x’’[m、n]１03を生成する(ステップ１625)。

図１２のグラフa）に、本発明の一実施例として、３ｄＢ〜１８ｄＢでクリップした、急速利得低減信号を示している。クリップがおよそ１．５ミリ秒で生じる。また、プロットは、予見能力がクリップ発生をどのように予想するか示す。図１２のグラフｂ）に示されるように、大量の利得低減により、利得のより高い変化率、および相応してより高い量のスペクトルの分散を招来する。しかしながら、１番目の遅延利得低減の段階はこの利得低減段階に先行するので、急速利得低減段階が単独で用いられる場合ほどには多量の利得低減をする必要がないため、可聴のスペクトルの分散が最小化される。この一例は図１５に示され、さらに下に議論される。

図１２のグラフｂ）では、ピーク平滑化のFIRフィルタの使用によりスペクトルの分散でのリップルが示される。IIRフィルタはリップルを削除できるが、生じる周波数は、平滑化処理により群遅延を変えるため、音声信号が制限器しきい値のレベルを正確に低減したことを保証しない。急速利得低減値は、利得低減を要求するサンプルに対応するために、あまりにも早く又は遅く低下するので、必要な利得値に正確には達しない可能性がある。

動作

図１３には、典型的な44.１kHzのデジタル音声信号の内容物の０．５秒に対して、本発明の一実施例で計算された利得低減信号をピーク値制限する帰結を示す。この例において、制限器しきい値Ｔは０．５ｄＢ又は−６ｄＢである。図の下半分は、入力PCM信号(スピーチ)の絶対的な振幅を示す。また、図形の上半分は遅延利得低減信号と急速利得低減信号の合成を示す。図１３では、制限器しきい値を越える短期間の信号成分に対して、急速利得成分がより著しい利得低減を提供している間に、遅延利得成分は最小のゆっくり変わる利得低減信号を提供する(図の全巾に渡って)。

図１４は、本発明の一実施例で計算された、典型的な44.１kHzのデジタル音声信号の内容物の１．５秒に対して、別の利得低減信号をピーク値制限する帰結を示す。この例において、制限器しきい値Ｔは０．２５ｄＢ又は−１２ｄＢである。図１４では、急速利得成分が制限器しきい値を越える短期間の信号成分に対して、時々は利得低減を提供しているものの、遅延利得成分は適度の量のゆっくり変わる利得低減信号を提供する(図の全巾に渡って)。イメージ縮尺の影響で、短期間の利得低減成分が垂直ラインとして現われている。したがって、図１４は、さらに利得低減信号の部分を増幅し、短期間の利得低減成分をより詳細に示している。図１４の短期間の利得低減成分は、図１３に示される短期間の利得低減成分と同様の形および持続時間を持っている。

図１５は、本発明の一実施例による大幅で持続されたクリップ低減条件の下で二個の段階がどのように働くか示す。プロットは、突然開始するピッチパイプ信号のための合成した利得低減軌道を示すもので、これによると、１0ｄＢの保持された利得低減を必要とする。図１５では、グラフa）は、ほぼ１秒の間隔に関する利得低減についての大まかな投影図を提示する。図１５では、グラフｂ）は、０．２秒付近について非常に繊細に詳細を示す。この例で、第１段階のゆっくり変化する利得低減段階では、約０．２又は−１４ｄＢの利得低減の大部分を提供し、第２段階の急速利得低減段階は、ほぼ±１ｄＢのリップルの原因となる。

Claims

入力音声信号を受け取る工程と；
しきい値を超える前記入力音声信号の逸脱（excursion）を検出する工程と；
検出された前記逸脱の応答として第１の利得を計算する工程と；
中間音声信号を生成するために、前記入力音声信号に前記第１の利得を適用する工程と；
Ｌと等しい長さの第１のバッファの入力での前記中間音声信号を表すサンプルを受け取り、前記サンプルを前記第１のバッファの出力まで前記第１のバッファを通過させることによって、遅延させた中間音声信号を生成するために、前記中間音声信号に遅延線を適用する工程であって、前記第１のバッファがＬと等しいサンプル数を記憶する先入れ先出し方式のバッファである、工程と；
前記しきい値を超える前記遅延線中の前記中間音声信号の一個以上のピーク値を特定する工程と；
特定された一個以上の前記ピーク値の応答として第２の利得を計算する工程であって、ここで、前記第２の利得の時間変化が前記第１の利得の時間変化よりも速く、前記第２の利得は、前記第１のバッファの前記入力で受け取られる前記中間音声信号の各サンプルに対して、以下の（あ）から（え）の工程、すなわち：
（あ）最大振幅を有する前記第１のバッファに記憶されたサンプルから中間制御値を導く工程と；
（い）前記中間制御値をＬに等しい長さの第２のバッファを通過させる工程で、前記第２のバッファがＬと等しい長さを有する先入れ先出し方式のバッファであり、Ｌに等しい数の中間制御値を記憶する、工程と；
（う）前記第２のバッファに記憶された前記中間制御値にフィルター係数を掛け算して、利得制御値を得るために当該掛け算の生成値を合計する工程と；
（え）前記利得制御値の応答として前記第２の利得を計算する工程、
とを行うことによって計算される工程と；
ピーク値がしきい値を超えない出力音声信号を生成するために、遅延させた中間音声信号に前記第２の利得を適用する工程と；
を備えることを特徴とする音声信号のピーク値制限方法。
請求項1に記載の音声信号のピーク値制限方法において、
前記第１の利得が、検出された逸脱の計数値に対する応答として計算されることを特徴とする音声信号のピーク値制限方法。
請求項１に記載の音声信号のピーク値制限方法において、
前記フィルター係数が、長さＬのハニング・ウィンドウ関数の平方根から導かれる値を有することを特徴とする音声信号のピーク値制限方法。
請求項１に記載の音声信号のピーク値制限方法において、
前記利得制御値に逆比例して変化するニュートン・ラプソン数式近似による量によって前記第２の利得が計算されることを特徴とする音声信号のピーク値制限方法。
入力音声信号を受け取る手段と；
しきい値を超える前記入力音声信号の逸脱を検出する手段と；
検出された前記逸脱の応答として第１の利得を計算する手段と；
中間音声信号を生成するために、前記入力音声信号に前記第１の利得を適用する手段と；
Ｌと等しい長さの第１のバッファの入力での前記中間音声信号を表すサンプルを受け取り、前記サンプルを前記第１のバッファの出力まで前記第１のバッファを通過させることによって、遅延させた中間音声信号を生成するために、前記中間音声信号に遅延線を適用する手段であって、前記第１のバッファがＬと等しいサンプル数を記憶する先入れ先出し方式のバッファである、手段と；
前記しきい値を超える前記遅延線中の前記中間音声信号の一個以上のピーク値を特定する手段と；
特定された一個以上の前記ピーク値の応答として第２の利得を計算する手段であって、ここで、前記第２の利得の時間変化が前記第１の利得の時間変化よりも速く、前記第２の利得は、前記第１のバッファの前記入力で受け取られる前記中間音声信号の各サンプルに対して、以下の（あ）から（え）の工程、すなわち：
（あ）最大振幅を有する前記第１のバッファに記憶されたサンプルから中間制御値を導く工程と；
（い）前記中間制御値をＬに等しい長さの第２のバッファを通過させる工程で、前記第２のバッファがＬと等しい長さを有する先入れ先出し方式のバッファであり、Ｌに等しい数の中間制御値を記憶する、工程と；
（う）前記第２のバッファに記憶された前記中間制御値にフィルター係数を掛け算して、利得制御値を得るために当該掛け算の生成値を合計する工程と；
（え）前記利得制御値の応答として前記第２の利得を計算する工程、
とを行うことによって計算される、手段と；
ピーク値がしきい値を超えない出力音声信号を生成するために、遅延させた中間音声信号に前記第２の利得を適用する手段と；
を備えることを特徴とする音声信号のピーク値制限装置。
請求項５に記載の音声信号のピーク値制限装置において、
前記第１の利得が、検出された逸脱の計数値に対する応答として計算されることを特徴とする音声信号のピーク値制限装置。
請求項５に記載の音声信号のピーク値制限装置において、
前記フィルター係数が、長さＬのハニング・ウィンドウ関数の平方根から導かれる値を有することを特徴とする音声信号のピーク値制限装置。
請求項５に記載の音声信号のピーク値制限装置において、
前記利得制御値に逆比例して変化するニュートン・ラプソン数式近似による量によって前記第２の利得が計算される手段を有することを特徴とする音声信号のピーク値制限装置。
入力音声信号を受け取る工程と；
しきい値を超える前記入力音声信号の逸脱を検出する工程と；
検出された前記逸脱の応答として第１の利得を計算する工程と；
中間音声信号を生成するために、前記入力音声信号に前記第１の利得を適用する工程と；
Ｌと等しい長さの第１のバッファの入力での前記中間音声信号を表すサンプルを受け取り、前記サンプルを前記第１のバッファの出力まで前記第１のバッファを通過させることによって、遅延させた中間音声信号を生成するために、前記中間音声信号に遅延線を適用する工程であって、前記第１のバッファがＬと等しいサンプル数を記憶する先入れ先出し方式のバッファである、工程と；
前記しきい値を超える前記遅延線中の前記中間音声信号の一個以上のピーク値を特定する工程と；
特定された一個以上の前記ピーク値の応答として第２の利得を計算する工程であって、ここで、前記第２の利得の時間変化が前記第１の利得の時間変化よりも速く、前記第２の利得は、前記第１のバッファの前記入力で受け取られる前記中間音声信号の各サンプルに対して、以下の（あ）から（え）の工程、すなわち：
（あ）最大振幅を有する前記第１のバッファに記憶されたサンプルから中間制御値を導く工程と；
（い）前記中間制御値をＬに等しい長さの第２のバッファを通過させる工程で、前記第２のバッファがＬと等しい長さを有する先入れ先出し方式のバッファであり、Ｌに等しい数の中間制御値を記憶する、工程と；
（う）前記第２のバッファに記憶された前記中間制御値にフィルター係数を掛け算して、利得制御値を得るために当該掛け算の生成値を合計する工程と；
（え）前記利得制御値の応答として前記第２の利得を計算する工程、
とを行うことによって計算される、工程と；
ピーク値がしきい値を超えない出力音声信号を生成するために、遅延させた中間音声信号に前記第２の利得を適用する工程と；
を備える音声信号のピーク値制限方法を遂行する装置で実行可能な命令プログラムが記録された記憶媒体。
請求項９に記載の記憶媒体において、前記方法は、前記第１の利得が、検出された逸脱の計数値に対する応答として計算されることを特徴とする音声信号のピーク値制限方法を遂行する装置で実行可能な命令プログラムが記録された記憶媒体。
請求項９に記載の記憶媒体において、前記方法は、前記フィルター係数が、長さＬのハニング・ウィンドウ関数の平方根から導かれる値を有することを特徴とする音声信号のピーク値制限方法を遂行する装置で実行可能な命令プログラムが記録された記憶媒体。
請求項９に記載の記憶媒体において、前記方法は、前記利得制御値に逆比例して変化するニュートン・ラプソン数式近似による量によって前記第２の利得が計算されることを特徴とする音声信号のピーク値制限方法を遂行する装置で実行可能な命令プログラムが記録された記憶媒体。