JP5038417B2 - 緩慢段階と急速段階の音声ピーク値制限 - Google Patents

緩慢段階と急速段階の音声ピーク値制限 Download PDF

Info

Publication number
JP5038417B2
JP5038417B2 JP2009523828A JP2009523828A JP5038417B2 JP 5038417 B2 JP5038417 B2 JP 5038417B2 JP 2009523828 A JP2009523828 A JP 2009523828A JP 2009523828 A JP2009523828 A JP 2009523828A JP 5038417 B2 JP5038417 B2 JP 5038417B2
Authority
JP
Japan
Prior art keywords
audio signal
gain
buffer
value
peak value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009523828A
Other languages
English (en)
Other versions
JP2010500613A (ja
Inventor
スミサーズ、マイケル・ジョン
クロケット、ブレット・グラハム
マクグラス、デイビッド・スタンリー
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2010500613A publication Critical patent/JP2010500613A/ja
Application granted granted Critical
Publication of JP5038417B2 publication Critical patent/JP5038417B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G11/00Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general
    • H03G11/008Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general of digital or coded signals

Description

本発明は、一般に音声デジタル信号処理および音声ピーク値制限に関する。本発明は、特に、音声信号(audio signal)をしきい値に制限するための、音声信号の可変利得低減に関する。
音声ピーク値制限は、50年以上の間、音声の製作、伝達および再生の基本部分である。図1に示すように、そのほとんどの基本形式において、音声ピーク値制限器は、出力電圧がピーク値制限しきい値(peak-limiting threshold)までの入力電圧と等しいような、入力出力信号レベル特性を有する。しきい値を越える振幅を有する入力音声信号に関しては、出力音声信号レベルがしきい値を越えないように抑制(制限)される。音声についての他の動的利得制御システムのように、利得調整方法は、出力音声信号に導入される不自然な結果(artifact)の性質および可聴性に重要な影響を及ぼす。
その最も初期の用途の1つでは、音声ピーク値制限は、無線放送で生じる過剰変調を防ぐように音声信号振幅を制御した。今日、音声ピーク値制限は、依然として慣例的に無線とテレビ放送中の過剰変調を防いでいる。
音声ピーク値制限はまたレコード原盤製作の重要部分である。フォノグラフ原盤製作には、旋盤がフォノグラフ・レコード・マスターディスクに、音声波形を表わす溝を切削することが含まれる。この場合、フォノグラフ媒体の物理的制限内に適合するように、制限は音声の振幅を抑制し、それ故、レコードの溝の幅および深さを抑制する。
デジタル音声技術の出現で、ピーク値制限を用いる音声振幅の制御は、録音と再生において引き続き重要である。デジタル音声録音は、アナログ信号をデジタル信号に変換することである。そして、入力アナログ音声信号がデジタルシステムによって表わすことができる最大のデジタル音声サンプル値(0dBFS)に対応する入力信号レベルを超過する場合、音声のデジタル表現が録音された状態では、クリップしている。0dBFSを越えたアナログ音声信号レベルは多くても0dBFSによって表わされるために、このクリップが生じる。同様に、多数のデジタル音声信号がスケーリングなしにデジタル領域でミキシングされる場合、再生中に、音声データの合計が0dBFSを超過することは起こりえる。ここで、0dBFSは、デジタルアナログ変換で表わすことができる最大のデジタル信号をいう。この結果はクリップされた出力アナログ波形である。
図2には、クリッピングの代表例として、デジタル録音とデジタル再生の両方の典型が示してある。多数のデジタル音声信号のミキシングは、ドルビー方式のデジタル5.1およびMLPのような現代のマルチチャネルオーディオ・フォーマット、およびステレオ互換性システムやモノラル互換性システム上での再生用に多チャネル資料をダウンミクスするための再生システムの出現で、非常に一般的になった。
最近では、CD音声やDVD音声のようなデジタル音声の原盤製作をする際に、ピーク値制限アルゴリズムが、音声のレベル(したがって明白な音の大きさ)を、ユーザ定義のピークレベル(例えば−0.1dBFSあるいは0dBFS)を超えることなく、増やすための標準となっている。音声のますます大きな表現を生成する希望が増大するにつれて、ピーク値制限アルゴリズムの実践はますます普及している。
音声ピーク値制限は、完全な全帯域幅信号上、あるいは異なる別個のオーディオ周波数帯域上でそれぞれピーク値制限操作を行なう、マルチバンド・アプローチで行なうことができる。マルチバンドピーク値制限に関しては、複合信号を再作成するために、個々に処理された周波数帯域がピーク値制限の後で合計される。
一般に、音楽用の原盤製作のように、音声スペクトルおよび音色に対して変更を最小化することが好まれる場合、広帯域ピーク値制限が用いられる。マルチバンドピーク値制限は著しい量のピーク値制限を達成するためにしばしば用いられるが、しかし音声のスペクトル特性および知覚された音色を著しく変更する可能性が附帯する。マルチバンドピーク値制限の用途としては、放送局が非常に大きな知覚された音響レベルだけでなく、マルチバンドピーク値制限の設定によって決定されるような、ユニークな「音」を持つことを望むFM電波伝送がある。
音楽原盤製作中のピーク値制限には、典型的には0dBからおよそ20dBの間の利得低減が必要である。DVDプレーヤーおよびホームシアター・レシーバーで生じるように、5チャネルサラウンド音声信号から2チャネル・ステレオ信号へダウンミキシングするには、9dB以内の利得低減が必要になる。ここで、例えば、ステレオ左チャネルは、5チャネルサラウンド音声信号の左、左サラウンド、および−3dB減少させた中心チャネルの合計である。
ほとんど聞き取れない程度のピーク値制限は、典型的に0dBから12dBの範囲の利得低減で達成できる。また、この範囲内で見事に成し遂げる商品が存在する。必要とされる利得低減をおよそ12dBより大きく限定することは、ピーク値制限の影響が相当可聴になり、ここでは利得低減がおよそ12dBより大きい場合は多量又は著しいと考えられる。
ここに、音声信号の絶対振幅を制限する、教示された方法および装置を開示する。この方法は、音声信号の利得を低減する第1の可変利得と、そして次に音声信号の利得を第1の可変利得低減より早く低減させる第2の可変利得を備え、その結果として、音声信号の絶対振幅をしきい値に制限するものである。第1の可変利得低減は、第1段階の音声信号の利得を低減する可変利得を有してもよい。また、第2の可変利得低減は、利得を第1段階より早く低減する、第2段階の音声信号の利得を低減する可変利得を有してもよい。
第1の可変利得低減はしきい値を超過した音声信号の軌跡(excursion)を検出し、検出された軌跡を用いて、緩慢利得を計算し、音声信号に緩慢利得を適用することを有する。
第2の可変利得低減は音声信号を遅延させて、遅延させた音声信号中のピークを検出して、検出されたピークからの急速利得を計算し、計算された急速利得による、遅延させた音声信号の修正を有してもよい。遅延は、音声信号をバッファするものでもよい。また、検出はバッファされた音声信号を調べる機能を有するものでもよい。それぞれの虚像(virtual image)の見掛けの方向(apparent direction)およびそれぞれのマトリックスにコード化された音声信号の方向が保持されてもよい。第2の可変利得低減は、遅延がない以外は上記で構成されるような方法と比較して、可聴のスペクトルのスプラッター(splatter)が少なく生成される。バッファリングは、しきい値を超過えるピークに遭遇するために、多量の第2の可変利得低減に対して、限定された量の時間を付与してもよい。遅延は、少なくとも1ミリ秒の遅延を有してもよく、約1.5ミリ秒の遅延を有するのがよい。ピークを検出するには遅延させた音声信号の各時間セグメント中の最大値を決定し、音声信号最大値を遅延させて、遅延させた最大値に基づいて音声信号の利得の低減に関する制御信号を計算してもよい。
最初の上記遅延は、さらにその前に述べた遅延と一致してもよい。計算は遅延させた最大値の低域通過フィルタリングの関数として制御信号を計算する工程を有してもよい。計算は加重平均され遅延させた最大値の関数として制御信号を計算してもよい。
計算はハニング・ウィンドウの平方根の関数である、フィルタリングの係数を使用することを有してもよい。当該使用はハニング・ウィンドウのサイズを遅延バッファと同じ長さに設定することでもよい。
計算はハニング・ウィンドウの平方根の関数である重み付け値を使用してもよい。使用はハニング・ウィンドウのサイズを遅延バッファと同じ長さに設定することでもよい。
急速利得の計算は、ピーク値の検出について決定し、遅延し、計算する手順を実質的に逆にしてもよい。急速利得の計算は、1と利得を低減するために計算された制御信号の合計の逆数として、急速利得を計算してもよい。
急速利得の計算はニュートン・ラプソン(Newton-Rhapson)近似法によって、急速利得を計算してもよい。当該計算は、その収束を遅延させたニュートン・ラプソン近似法によって計算してもよい。当該計算は、収束Sの速度が次式で制限されているような、緩慢ニュートン・ラプソン近似法によって計算してもよい。
Figure 0005038417
当該計算は収束の速度Sが約0.3であるような、緩慢ニュートン・ラプソン近似法によって計算してもよい。
ここに、また上記の方法のうちの1つを実行するためのコンピュータ・プログラムを有するコンピュータ可読媒体が教示されている。
ここに、またCPU、コンピュータで判読可能な媒体の一つ、およびCPUと媒体を連結するバスを有するコンピュータシステムが教示されている。
ここに、また音声ピーク値制限器が教示されている。ピーク値制限器は、音声信号の利得を低減する可変利得用の第1の可変利得低減器、および音声信号の利得を第1の可変利得低減より早く低減する可変利得用の第2の可変利得低減器を備えており、その結果として、音声信号の絶対振幅をしきい値に制限する。第1の可変利得低減器は、音声信号の利得を低減する可変利得用の第1段階を含んでいてもよい。また、第2の可変利得低減器は、利得を第1段階より早く低減する、第2段階の音声信号の利得を低減する可変利得用の第2段階を含んでいてもよい。
第1の可変利得低減器は、音声信号を遅らせる遅延器、遅延させた音声信号内のピークを検出するためのピーク検出器、検出されたピークを使用して、急速利得低減を計算するための急速利得計算機、および計算された急速利得により遅延させた音声信号を修正するための修正器を備える。
当該遅延器はバッファを有していてもよい。また、ピーク検出器は、バッファ付きの音声信号の検査器を有していてもよい。それぞれの虚像の見掛けの方向およびそれぞれのマトリックスにコード化された音声信号の方向が保持されてもよい。第2の可変利得低減器は、遅延器がない以外は上記で構成されるピーク値制限器より、可聴のスペクトルのスプラッターが少なくなっている。遅延器は、少なくとも1ミリ秒の遅延を有してもよく、約1.5ミリ秒の遅延を有するのがよい。ピーク検出器は遅延させた音声信号の各時間セグメント中の最大値を決定する差エンジン、音声信号最大値を遅らせる遅延バッファ、遅延させた最大値に基づいて音声信号の利得の低減に関する制御信号を計算する計算機を有していてもよい。
ピーク検出器の遅延バッファは、ピーク値制限器の遅延器と一致(match)してもよい。計算機は、遅延させた最大値の低域通過フィルタリングの関数として制御信号を計算する計算機を含んでいてもよい。計算機は、加重平均された遅延させた最大値の関数として制御信号を計算する計算機を含んでいてもよい。
フィルタリングの係数はハニング・ウィンドウの平方根の関数でもよい。ハニング・ウィンドウは遅延バッファと同じ長さでもよい。
重み付け値はハニング・ウィンドウの平方根の関数でもよい。ハニング・ウィンドウは遅延バッファと同じ長さでもよい。
急速利得の計算機は、ピーク検出器の演算の手順を実質的に逆にすることにより、急速利得低減を計算する急速利得の計算機でもよい。急速利得の計算機は、1と利得を低減するために計算された制御信号との合計の逆数として、急速利得を計算するための急速利得の計算機でもよい。
急速利得の計算機は急速の利得の計算に関しての急速利得の計算機でもよい。急速利得の計算機は、その収束を遅延させたニュートン・ラプソン近似法によって計算する急速利得の計算機でもよい。急速利得の計算機は、収束Sの速度が次式で制限されているような、緩慢ニュートン・ラプソン近似法によって計算する急速利得の計算機でもよい。
Figure 0005038417
急速利得の計算機は、収束Sの速度は約0.3であるような、緩慢ニュートン・ラプソン近似法によって計算する急速利得の計算機でもよい。
本発明およびその好ましい実施例の様々な特徴は、以下の説明と添付の図面の参照により一層よく了解されてもよい。
図1は、典型的な音声制限器(audio limiter)の作用を要約するもので、システムブロック・レベルで音声制限器を図解し、任意のしきい値を有する音声制限器の典型的な入出力電圧特性を示し、ピーク値制限処理の前と後の音声信号の例を示している。 図2は、クリッピングの代表例を示すもので、デジタル録音とデジタル再生の両方の代表例である。 図3aは、本発明の一実施例による2段階音声ピーク値制限器を示す。 図3bは、本発明の一実施例として、さらに図3aの音声ピーク値制限器を詳述する。 図4は、本発明の一実施例による、入力信号と、軌跡検出器出力であると共に当該入力信号に対応する制御信号の数百のサンプルを図示する。 図5は、本発明の一実施例による緩慢利得計算機の処理過程の全体図である。 図6は、本発明の一実施例による緩慢利得計算機304の歪み(warping)関数を図示する。 図7は、本発明の一実施例による緩慢利得回路のRCモデルにおける抵抗値の更新過程を図示する。 図8は、本発明の一実施例による緩慢利得計算機のRC回路をモデル化してある。 図9は、本発明の一実施例として、出力抵抗値Routと前回の緩慢利得低減値の関係、および入力抵抗Rinと制限器しきい値を越える連続する入力音声サンプル数の関係を図示する。 図10は、本発明の一実施例によるピークサンプル検出器を詳述する。 図11は、真値で上書きされた数百のサンプルに対して、ニュートン・ラプソン近似法で推定された急速利得低減値を示している。 図12は、本発明の一実施例として、3dB〜18dBでクリップされた信号の急速利得低減をプロットしたもので、同様に、利得低減が大きくなるともに、対応するスペクトルの分散が高い値となる関係もプロットしている。 図13は、本発明の一実施例として、典型的な44.1kHzのデジタル音声の内容物の0.5秒について計算された、利得低減信号をピーク値制限する帰結を示している。 図14は、本発明の一実施例として、典型的な44.1kHzのデジタル音声の内容物の1.5秒について計算された、別の利得低減信号をピーク値制限する帰結を示している。 図15は、本発明の一実施例として、大幅なクリップ低減条件と持続するクリップ低減条件の下で、ピーク値制限器の2個の段階がどのように動作するかを示している。 図16は、本発明の一実施例による緩慢ピークサンプル検出器の処理過程の全体図である。
図3aは、本発明の一実施例による2段階の音声ピーク値制限器102を示す。ピーク値制限器102は、緩慢利得低減器202と急速利得低減器204を有している。緩慢利得低減器202は、しきい値信号201および入力音声信号101を入力として受け取り、中間音声信号203として生成する。急速利得低減器204は、しきい値信号201に加えて中間の音声信号203も入力として受け取り、出力として出力音声信号103を生成する。
ピーク値制限器102は以下のように作動する:緩慢利得低減器202は、入力音声信号101による1個以上のオーディオチャネルと、しきい値信号201による制限器しきい値を表わす信号を受け取る。オーディオチャネルの絶対的ピーク値は制限器しきい値を超過してもよい。
急速利得低減器204は出力音声信号103を出力するが、出力音声信号103は入力音声信号101の恐らく制限されたオーディオチャネルである。ピーク値制限器102は、制限器しきい値を超過する入力音声信号101中の任意の絶対的ピーク値を、制限器しきい値を超えないように制限(利得低減)する。
入力音声信号101と出力音声信号103はそれぞれ、本発明の一実施例による線形のPCMサンプルでもよい。しきい値信号201は、dBFSを単位とする値でもよい。次に、xは入力音声信号101を表わし、Mは入力音声信号101の入力チャネルの数を表わし、表記x[m、n]において、mは0からM−1までのチャネル指数であり、nはサンプル指数である。
図3bは、本発明の一実施例として、ピーク値制限器102をさらに詳述する。緩慢利得低減器202は軌跡/超過検出器302、緩慢利得計算機304および乗算器306を含んでいる。軌跡検出器302は入力としてしきい値信号201および入力音声信号101を受け取り、出力として制御信号Q[n]303を生成する。緩慢利得計算機304は入力として制御信号Q[n]303を受け取り、出力として現在の緩慢利得値Gslow[n]信号305を生成する。乗算器306は、入力音声信号101と現在の緩慢利得値Gslow[n]信号305を入力として受け取り、また出力として利得低減された音声信号x’[m,n]307を生成する。
急速利得低減器204は急速利得計算機312、ピークサンプル検出器311、遅延器308および乗算器315を含んでいる。遅延器308は入力として利得低減された音声信号x’[m,n]307を受け取り、また出力として遅延され、利得低減された音声信号x’’[m,n]314を生成する。遅延器308は、また信号309として遅延させた音声信号の全バッファを利用可能にする。ピークサンプル検出器310は入力として遅延バッファ信号309およびしきい値信号201を受け取り、出力として制御信号P’[n]311を生成する。急速利得計算機312は入力として制御信号P’[n]311を受け取り、また出力として急速利得低減値GFAST[n]313を生成する。乗算器315は入力として急速利得低減値GFAST[n]313および遅延され、利得低減された音声信号x’[m,n]314を受け取り、また出力として最終利得低減サンプルx’’[m,n]103を生成する。
緩慢利得低減器202と急速利得低減器204の処理の各反復で、各入力チャネルから一個のサンプルが生成され、また、一個の緩慢利得低減値および一個の急速利得低減値の両方が計算され、すべてのチャネルに適用される。チャネルがすべて同じ緩慢・急速利得低減を受け取るので、虚像の見掛けの方向およびマトリックスにコード化された音声信号の方向が保持される。
緩慢利得低減(Slow Gain Reduction)
軌跡(Excursions)の検知(制限器しきい値を超過する音声信号を検知すること)
入力音声信号101の全Mチャネルについて最大絶対サンプル値が制限器しきい値Tほど大きくない場合、軌跡検出器302は、制御信号Q[n]303を零(0)にセットする。全Mチャネルについて最大絶対サンプル値が制限器しきい値Tを超過する場合、軌跡検出器302は、入力音声信号が制限器しきい値Tを超過する程度に比例して、制御信号Q[n]303をセットする。
したがって、入力音声信号101が制限器しきい値Tを超過する場合に限って、緩慢利得低減器202は、中間音声信号307を出力するために入力音声信号101を低減する。
次に、中間音声信号307を生成する際に、入力音声信号101が制限器しきい値Tを超過するとき、緩慢利得低減器202が応答する。しかし、音声信号303が制限器しきい値Tよりも低下した後にも、緩慢利得低減器202は利得を低減し続けてもよい。
一実施例において、入力音声信号101の全Mチャネルについて最大絶対サンプル値が制限器しきい値Tよりも大きい場合、制御信号Q[n]は、最大絶対サンプル値の制限器しきい値Tに対する比率にセットされ、これは1未満である。方程式(1)はこの実施例を詳述する。
Figure 0005038417
図4は、本発明の一実施例による、入力信号と、対応する制御信号の数百のサンプルを図示する。入力信号は−3dBのピーク振幅で500Hzのデジタル正弦波である。また、制限器しきい値Tは0.5dBあるいは−6.02dBである。図4に示されるように、制御信号Q[n]303のサンプル値は各入力PCMサンプルに関して計算される。
(説明された割り算演算の代わりに、計算量を低減するために、1/Tの乗算によって、Q[n]の計算を行うことができる。)
緩慢利得の計算
図5は、本発明の一実施例による緩慢利得計算機の処理過程の全体図である。入力として制御信号Q[n]303および前回の緩慢利得値Gslow[n−1]305を受け取って、緩慢利得計算機304は制御信号Q[n]303を修正し(ステップ601)、修正済の制御信号602を平滑化し(ステップ603)、修正され平滑化された制御信号604から、現在の緩慢利得値Gslow[n]305を計算する(ステップ605)。
1つの実施例では、平滑化ステップ603には信号依存性の動作開始と解除の特性を取り入れる。
制御信号の修正
修正済の制御信号Q’[n]602を作成するために、緩慢利得計算機304は前回の緩慢利得値Gslow[n−1]によって制御信号Q[n]303を修正する(歪ませる)。前回の緩慢利得値Gslow[n−1]305は、単一あるいは1.0の値に当初はセットされる。
利得低減が既に非単一である場合、即ちもし既に利得低減が適用されていれば、この修正は、利得低減の量を増加させるように制御信号Q[n]303に対する作用を増幅(増加)する。有益なことに、信号クリッピング(すなわちクリップされる軌跡)が稀にしか起きないときは、緩慢利得低減を生成する際に影響を与えない。しかし、信号クリッピングが急速に連続的に頻繁に発生すると、緩慢利得低減について著しくより多くの利得低減をもたらす。このように、稀なクリップ発生に関しては、この段階はほとんど作動せず、可聴ポンピングの可能性を回避する。
方程式2aおよび2bは、本発明の一実施例に従って歪ませることを示すもので、図6はそのワーピング関数を図示したものである。方程式2a、2bと図6のワーピング関数は、広範囲な実験および検査によって決定された。図6から読み取れるように、前回の緩慢利得低減値がおよそ−6dBである場合、その結果は最も顕著である。
Figure 0005038417
制御信号の平滑化
本発明の一実施例に従って、信号依存性の動作開始時間(attack time)と解除時間(release time)を有するフィルタが、修正済の制御信号Q’[n]602を平滑化する。特に大量の利得低減が必要な場合、これらの信号依存性技術は、利得低減の応用から可聴の不自然な結果(artifacts)を最小限にする。
一実施例では、データ圧縮器(compressor)や振幅制限器(limiter)で周知の、アナログRC回路のデジタル・エミュレーションにより、修正済の制御信号Q’[n]602を平滑化する。ここで、抵抗値の変更は、信号依存性の動作開始と解除の行動に影響する。
図8は本発明の一実施例により、そのような回路をモデル化してある。モデルの単純性のために、ダイオードの両端の電圧降下が0であると仮定される。また、出力抵抗RoutはコンデンサーCの充電中は無視される。Cの好ましい値は1μFである。
図7は、本発明の一実施例により、抵抗値の更新過程を図示している。修正済の制御信号Q‘[n]602が0を越えている場合(ステップ707)―すなわち、現在の入力サンプル振幅が制限器しきい値を超過する場合に、サンプル・クリップカウントはインクリメントされ(ステップ708)、この結果クリッピングにおける時間長の基準を増加させ、そして入力抵抗Rinがクリッピングの時間長の関数として計算される(ステップ710)。また、出力抵抗Routは、前回の利得低減値Gslow[n−1]の関数として計算される(ステップ709)。
修正済の制御信号Q‘[n]602が0を越えない場合(ステップ703)―すなわち、現在の入力サンプル振幅が制限器しきい値を超過しない場合に、抵抗器は、初期設定値にセットされ(ステップ705、ステップ706)、サンプル・クリップカウントはゼロにセットされる(ステップ704)。この結果、クリッピングの時間長の基準がリセットされる。
軌跡を検知する際に時間長の関数として入力抵抗Rinを計算することによって、平滑器は周波数依存性の様式で動作開始時間を変更する。より短い間隔やより高い周波数でのクリップ発生は動作開始時間を早くする。また、より長い間隔やより低い周波数でのクリップ発生は次第に動作開始時間を遅くする。このことは、より低い周波数の内容物について劇的なゲイン変動の可能性を低減し、これにより可聴の強い打撃音を最小限にする。利得低減の早い動作開始行動は、聴覚の周波数隠蔽がもっと優勢となる、より短い持続時間かより高い周波数でのクリップ発生に関して許容される。
図9では、グラフb)は、本発明の一実施例に従って、入力抵抗Rinと、制限器しきい値を超過する連続する入力音声サンプルの数の関係を図示する。抵抗はオームで表現される。また、クリッピングの持続時間は、サンプルレート44.1kHzに対するクリッピング中のサンプル数(クリップ・カウント)で表現される。
図9bの中のプロットの形は実験および聞き取りテストに由来する。13ミリ秒未満(44.1kHzでは600サンプル)のクリップ長さについては、入力抵抗Rinは非線形である。13ミリ秒より長いクリップ長さについては、方程式5のように、入力抵抗Rinは線形である。
Figure 0005038417
ここで、ClipCntは44.1kHzでのクリッピングのサンプル数である。
クリッピングの短い時間長では、入力抵抗Rinは、クリッピングの時間増加と共に急速に上昇する。クリッピングの長い時間長では、入力抵抗Rinがもっと緩慢に上昇する。Rin値がより低くなると、緩慢利得計算機304では動作開始時間がより早くなり、また、Rin値がより高くなると、動作開始時間がより遅くなる。
前回の緩慢利得低減値の関数として出力抵抗Routを計算することによって、緩慢利得計算機304は、用いている低減の量に比例して解除行動を変更できる。利得低減がほとんど使用されていない場合、解除時間を早くすることで利得低減を単一に早く戻すことを可能にする。利得低減がかなりの量使用されている場合、可聴のポンピングの不自然な結果を最小限にするために、解除時間が増加する。これは、また大量で持続された利得低減が必要な場合、緩慢第1段階が急速第2段階より多くの利得低減を負担することの説明となる。これは、大量の利得低減を適用する場合に、第2段階が生成する可聴のスペクトルのスプラッターを最小限にすることに役立つ。
音声に可変利得係数を掛けることは振幅変調と考えられる。そのため、演算は、音声のスペクトル、可変利得係数のスペクトルおよび利得変化の程度に依存して、可聴であるような追加のスペクトル成分を導入する。ここで、これらの構成要素は「スペクトルのスプラッター」と呼ばれる。)
図9では、グラフa)は、本発明の一実施例に従って、出力抵抗Routと前回の緩慢利得低減値Gslow[n−1]の関係を図示する。前回に使用される利得低減の量が多いほど、出力抵抗Routの値は低くなり、従って平滑回路の解除行動は早くなる。
方程式3は出力抵抗の値を計算する:
Figure 0005038417
多くのコンピュータおよびデジタル信号プロセッサ(DSP)に関して、平方根の計算は計算コストが高い。しかしながら、計算コストがより安い方法で平方根関数に近似できる。好ましい方法は、方程式4に説明される「ニュートン反復」の反復による平方根推定式である。
Figure 0005038417
この方程式では、反復kにおける平方根推定は、前回のk−1推定、および計算された平方根の値(この場合Gslow[n−1])の関数である。
通常は、単一の比較的正確な推定を得るために、多数回の反復が要求される。しかしながら、緩慢利得低減値が比較的ゆっくり経時的に変化するので、一回の反復を行ない、前回のサンプルか緩慢利得低減計算値からの平方根推定値を使用することで十分に正確である。しかし、これは、計算上許容できるか、離散値のルックアップテーブルと置換されるかの、どちらかによる単一の割り算演算を必要とするものの、恐らく精度を犠牲する。
モデル化されたRC回路による制御信号の平滑化は、以下のように演算する。制御信号Q‘[n]602が前回の計算値Q‘’[n−1]602からのコンデンサ電圧より大きな場合には、コンデンサーは、次式のように、入力抵抗Rinによって充電され、出力抵抗Routを通じて放電される。
Figure 0005038417
そうでなければ、コンデンサーは、出力抵抗Routを通じて単に以下のように放電される:
Figure 0005038417
(パラメータfsはHzで表したサンプリングレートである。) 平滑化された制御信号Q’’[n]604は、次に、緩慢利得低減値を計算するために使用される。
多くのコンピュータおよびDSPでは、割り算演算は計算コストが高いので、1/Rinおよび1/Routの有効範囲の値は、ルックアップテーブルに離散値として記憶されるのがよい。これは、方程式6および方程式7の理想状態に対して、制御信号Q[n]604に可聴な変化がないため、許容できる。
緩慢利得値の計算
方程式1に従うと、緩慢利得低減値は、典型的には修正されて平滑化された制御信号Q’’[n]604の逆数の関数となる。方程式8はこれを示す:
Figure 0005038417
しかしながら、平滑化特性と多くの実験の結果、好ましい関数は、方程式9に示すような、マイナスの形式である。
Figure 0005038417
(定数sは、1.65の値である。)
この関数は好ましいものだが、他方それは、理論上制御信号Q’’[n]604が大きな値になると負の利得を帰着する場合がある。実用的な目的のために、典型的に利得低減の必要とされる量が20dB未満である場合、平滑化は緩慢利得低減値が常に0を越えるものであることを保証する。
最後に、乗算器306は、利得低減サンプルx’[m、n]307を作成するために、緩慢利得低減値Gslow[n]305と、各入力チャネルmからのPCMサンプルとを乗算する。
Figure 0005038417
急速利得低減(Fast Gain Reduction)
遅延
緩慢利得低減サンプルx'[m、n]307は遅延器308を通過する。急速利得低減器204が制限器しきい値を越えた軌跡が生じる時を知り、出力音声信号が制限器しきい値を越えないことを保証するような急速利得低減について、急速利得低減器204が計算することができるように、これは急速利得低減器に予見能力(look ahead)を付与する。この予見能力は、制限器しきい値を越えた軌跡に遭遇するために、多量の急速利得低減に対して限定された量の時間を付与するので、それ故、ピーク値制限器102に予見能力がない場合と比較した場合に、利得軌跡(gain trajectory)に起因する可聴のスペクトルのスプラッターの量を減らす。
遅延器308の1つの実施例は遅延線であり、より明確には、およそ1.5ミリ秒の予見能力あるいは44.1kHzのサンプリングレートでN=66個のサンプルを有する遅延線308である。遅延線308は先入れ先出し(FIFO)バッファでもよく、また、出力は音声サンプル信号x’’[m、n]314である。ここで、1つ以上のチャネルが存在し、各チャネルmはサンプルと同数だけ遅延される。
遅延器308の長さに関しては、より長い利得変化が望ましい。1つの実施例では、しかしながら、支配的な目標はできるだけ短い待ち時間を維持している。実験によると、1ミリ秒より急速な利得変化ではかなり可聴であり、うるさく感じられることを示す。約1.5ミリ秒の予見能力はよい妥協である。
遅延器308の遅延線システムが以下の記述で用いられる。
ピークサンプル検出
図10は本発明の一実施例に従ってピークサンプル検出器310を詳述する。この実施例では、ピークサンプル検出器は、フィルタ係数を記憶するためのメモリ1004、CPU1003あるいは他の計算手段1003、遅延バッファ1002、コンパレーター、および差エンジン1001を備えている。(もちろん、CPU1003あるいは別の計算手段1003は、コンパレーターや差エンジン1001と同じでもよい。)
コンパレーターと差エンジン1001は、遅延器308の遅延バッファ信号309を入力として受け取り、そして中間制御信号を出力する。遅延バッファ1002は入力としてその中間制御信号を受け取り、出力としてそのバッファの内容物を生成する。計算手段1003は、入力として遅延バッファ1002のコンテンツおよびメモリ1004のコンテンツを受け取り、制御信号311を出力する。
ピークサンプル検出器310は定義された時間長の間でピーク値を見つけて保持する。それは、遅延器308の出力309をとり、制限器しきい値Tを超過した遅延器308の内容物の中で最大のサンプル値の関数としての、制御信号P’[n]311を生成する(遅延線308の長さの中で、前回の1.5ミリ秒までの範囲が有効である)。
図16は、本発明の一実施例に従ったピークサンプル検出器310の過程1600の全体図である。各入力サンプルで、ピークサンプル検出器310は、遅延線308の長さにわたり、全mチャネルの中で最大絶対値を見つける(ステップ1605)。それ、次に、ピークサンプル検出器310は制限器しきい値Tで最大絶対値を割り、中間制御信号P[n]を作成するために1を引く(ステップ1610)。(方程式(1)でのように、1/Tの乗算は効率的にTによる割り算を実施できる。)
Figure 0005038417
この中間制御信号P[n]は、遅延線308と同じ長さのFIFO遅延線か遅延バッファ1002を通過する(ステップ1615)。
次に、ピークサンプル検出器310は、低域通過フィルタされ、または加重平均された中間制御信号P[n]から、出力制御信号P'[n]311を計算する(ステップ1620)。遅延線1002は第(N−1)次のフィルタあるいは平均に相当する。
ピークサンプル検出器310は、長さN(遅延バッファ1002と同じ長さ)のハニング・ウィンドウの平方根から好ましいフィルタ係数か重み付け値H[i]1004を計算する。経験的に、これらは可聴の不自然な結果を生成するのが最も少ない。
Figure 0005038417
ここで、
Figure 0005038417
そしてここで、
Figure 0005038417
方程式12bの正規化ステップは、フィルタ係数H[i]1004の合計が単一になることを保証する。
急速利得の計算
1つの実施例では、急速利得低減値は、平滑化されたピーク制御信号P‘[n]311に1を加えたものの逆数である。これは、本質的に方程式11中のピークサンプル検出演算の逆数である。参照方程式13:
Figure 0005038417
2個の遅延線308、1002の長さが同じであるので、方程式13中の急速利得低減値はピークサンプルが遅延線308から出現するとともに、絶対的なピークを制限器しきい値Tのレベルに同時に縮小するのに必要な値に達する。対等な遅延器長さNは、音声信号307から制御信号P'[n]311までの間の整数サンプル群遅延時間に帰着し、これは急速利得低減値GFAST[n] に対応する。
以前述べたように、多くのコンピュータおよびDSP上の割り算演算は計算コストが高価になるから、方程式13中の急速利得低減値を計算するための割算に基づかない方法は有益である。しかしながら、離散値を含んでいるルックアップテーブルの使用では、精度を維持すると共に、きめの粗く定められルックアップ表から発生する擬似的なスペクトルのスプラッターを回避するために、膨大なメモリを必要とする。
代案は、ニュートン・ラプソン反復による推定方程式を使用して、急速利得低減値を近似することである。ニュートン・ラプソン推定は、次式の方程式を反復して解く:
Figure 0005038417
有名なニュートン・ラプソン反復近似は、xの初期推定値にx0を使用し、xの更新値をx1として計算する。初期推定値と更新値は、次のニュートン・ラプソン近似方程式を使用して計算される:
Figure 0005038417
ここで、f(x)は方程式14、15、16に示される関数を表わし、f'(x)は関数f(x)の導関数である。
解こうとしている方程式13の急速利得低減値については、GFAST[n](x)の値と方程式13は次の一般的な形式をとる。
Figure 0005038417
その後、ニュートン・ラプソン近似は方程式14の形式で方程式15を解く:
Figure 0005038417
ここでα=(1+P'[n])である。方程式16で解こうとしている方程式について、方程式17のニュートン・ラプソン近似は次式の形式となる。
Figure 0005038417
しかしながら、この形式はまだαによる割り算を必要とするので、まだ効率的に方程式15を実行しない。急速利得低減値の計算を除けば、1/αがx0に近似するという事実を導入できる。この近似により、方程式18は次式の形式となる:
Figure 0005038417
ニュートン・ラプソン方法を適用して:
Figure 0005038417
この近似は、各計算の反復で2倍の精度で小数位数を備えたxの値にかなり速く収束する。
近似の計算コストを安くするために、単一の反復と同じくらい低くてすむ有用な収束が望ましい。しかしながら、方程式20は、単一の反復用に試してみるべきサンプルからの不適当なゆらぎを示す。解に含まれる不自然な結果をより少なくするために、反復の収束を遅くできる。収束の速度の項Sが方程式20に適用される場合、方程式は次式の形式となる:
Figure 0005038417
ここで、S=1が完全なニュートン・ラプソンを表し、S=0.001は、故意に非常にゆっくり収束する方法と解釈する。実際上、方程式21での収束の不適当な振る舞いを回避するために、Sの値を適切に選択することが必要である。例えば、好ましくは、Sは値が次式で表される:
Figure 0005038417
この式の大きな値は、収束中に過剰反応を引き起こすためである。
ここで、x1=GFAST[n]、x0=GFAST[n-1]並びにα=(1+P'[n])として、GFAST[n]の計算中で使用される制御パラメータを適用すると、方程式21は次式の形式となる:
Figure 0005038417
この方程式では、急速利得低減値GFAST[n]は、前回サンプルn−1からの前回値と方程式の入力値、この場合、P'[n]、との関数である。前に述べたように、正確な推定には典型的には多数回の反復が必要である。しかしながら、この方法では、希望する1/(1+x)値へ急速利得低減値GFAST[n]をゆっくり旋回する単一の反復が、より正確な推定や正確な計算と比較して、可聴の不自然な結果を削減する効果をもたらす。聴取実験によると、S=0.3の値が音声中の可聴の不自然な結果を最小にする非常に好結果を与えることが判った。図11では、数百のサンプルに対するニュートン・ラプソン近似による急速利得値の例を、方程式13を使用して計算されたその真値と共に示す。
最後に、急速利得低減値GFAST[n]313の生成値と、遅延線308からの出力である前回の利得低減値x' [m、n]とを乗算して、最終の利得低減値x’’[m、n]103を生成する(ステップ1625)。
Figure 0005038417
図12のグラフa)に、本発明の一実施例として、3dB〜18dBでクリップした、急速利得低減信号を示している。クリップがおよそ1.5ミリ秒で生じる。また、プロットは、予見能力がクリップ発生をどのように予想するか示す。図12のグラフb)に示されるように、大量の利得低減により、利得のより高い変化率、および相応してより高い量のスペクトルの分散を招来する。しかしながら、1番目の遅延利得低減の段階はこの利得低減段階に先行するので、急速利得低減段階が単独で用いられる場合ほどには多量の利得低減をする必要がないため、可聴のスペクトルの分散が最小化される。この一例は図15に示され、さらに下に議論される。
図12のグラフb)では、ピーク平滑化のFIRフィルタの使用によりスペクトルの分散でのリップルが示される。IIRフィルタはリップルを削除できるが、生じる周波数は、平滑化処理により群遅延を変えるため、音声信号が制限器しきい値のレベルを正確に低減したことを保証しない。急速利得低減値は、利得低減を要求するサンプルに対応するために、あまりにも早く又は遅く低下するので、必要な利得値に正確には達しない可能性がある。
動作
図13には、典型的な44.1kHzのデジタル音声信号の内容物の0.5秒に対して、本発明の一実施例で計算された利得低減信号をピーク値制限する帰結を示す。この例において、制限器しきい値Tは0.5dB又は−6dBである。図の下半分は、入力PCM信号(スピーチ)の絶対的な振幅を示す。また、図形の上半分は遅延利得低減信号と急速利得低減信号の合成を示す。図13では、制限器しきい値を越える短期間の信号成分に対して、急速利得成分がより著しい利得低減を提供している間に、遅延利得成分は最小のゆっくり変わる利得低減信号を提供する(図の全巾に渡って)。
図14は、本発明の一実施例で計算された、典型的な44.1kHzのデジタル音声信号の内容物の1.5秒に対して、別の利得低減信号をピーク値制限する帰結を示す。この例において、制限器しきい値Tは0.25dB又は−12dBである。図14では、急速利得成分が制限器しきい値を越える短期間の信号成分に対して、時々は利得低減を提供しているものの、遅延利得成分は適度の量のゆっくり変わる利得低減信号を提供する(図の全巾に渡って)。イメージ縮尺の影響で、短期間の利得低減成分が垂直ラインとして現われている。したがって、図14は、さらに利得低減信号の部分を増幅し、短期間の利得低減成分をより詳細に示している。図14の短期間の利得低減成分は、図13に示される短期間の利得低減成分と同様の形および持続時間を持っている。
図15は、本発明の一実施例による大幅で持続されたクリップ低減条件の下で二個の段階がどのように働くか示す。プロットは、突然開始するピッチパイプ信号のための合成した利得低減軌道を示すもので、これによると、10dBの保持された利得低減を必要とする。図15では、グラフa)は、ほぼ1秒の間隔に関する利得低減についての大まかな投影図を提示する。図15では、グラフb)は、0.2秒付近について非常に繊細に詳細を示す。この例で、第1段階のゆっくり変化する利得低減段階では、約0.2又は−14dBの利得低減の大部分を提供し、第2段階の急速利得低減段階は、ほぼ±1 dBのリップルの原因となる。

Claims (12)

  1. 入力音声信号を受け取る工程と;
    しきい値を超える前記入力音声信号の逸脱(excursion)を検出する工程と;
    検出された前記逸脱の応答として第1の利得を計算する工程と;
    中間音声信号を生成するために、前記入力音声信号に前記第1の利得を適用する工程と;
    Lと等しい長さの第1のバッファの入力での前記中間音声信号を表すサンプルを受け取り、前記サンプルを前記第1のバッファの出力まで前記第1のバッファを通過させることによって、遅延させた中間音声信号を生成するために、前記中間音声信号に遅延線を適用する工程であって、前記第1のバッファがLと等しいサンプル数を記憶する先入れ先出し方式のバッファである、工程と;
    前記しきい値を超える前記遅延線中の前記中間音声信号の一個以上のピーク値を特定する工程と;
    特定された一個以上の前記ピーク値の応答として第2の利得を計算する工程であって、ここで、前記第2の利得の時間変化が前記第1の利得の時間変化よりも速く、前記第2の利得は、前記第1のバッファの前記入力で受け取られる前記中間音声信号の各サンプルに対して、以下の(あ)から(え)の工程、すなわち:
    (あ)最大振幅を有する前記第1のバッファに記憶されたサンプルから中間制御値を導く工程と;
    (い)前記中間制御値をLに等しい長さの第2のバッファを通過させる工程で、前記第2のバッファがLと等しい長さを有する先入れ先出し方式のバッファであり、Lに等しい数の中間制御値を記憶する、工程と;
    (う)前記第2のバッファに記憶された前記中間制御値にフィルター係数を掛け算して、利得制御値を得るために当該掛け算の生成値を合計する工程と;
    (え)前記利得制御値の応答として前記第2の利得を計算する工程、
    とを行うことによって計算される工程と
    ピーク値がしきい値を超えない出力音声信号を生成するために、遅延させた中間音声信号に前記第2の利得を適用する工程と;
    を備えることを特徴とする音声信号のピーク値制限方法。
  2. 請求項1に記載の音声信号のピーク値制限方法において、
    前記第1の利得が、検出された逸脱の計数値に対する応答として計算されることを特徴とする音声信号のピーク値制限方法。
  3. 請求項に記載の音声信号のピーク値制限方法において、
    前記フィルター係数が、長さLのハニング・ウィンドウ関数の平方根から導かれる値を有することを特徴とする音声信号のピーク値制限方法。
  4. 請求項に記載の音声信号のピーク値制限方法において、
    前記利得制御値に逆比例して変化するニュートン・ラプソン数式近似による量によって前記第2の利得が計算されることを特徴とする音声信号のピーク値制限方法。
  5. 入力音声信号を受け取る手段と;
    しきい値を超える前記入力音声信号の逸脱を検出する手段と;
    検出された前記逸脱の応答として第1の利得を計算する手段と;
    中間音声信号を生成するために、前記入力音声信号に前記第1の利得を適用する手段と;
    Lと等しい長さの第1のバッファの入力での前記中間音声信号を表すサンプルを受け取り、前記サンプルを前記第1のバッファの出力まで前記第1のバッファを通過させることによって、遅延させた中間音声信号を生成するために、前記中間音声信号に遅延線を適用する手段であって、前記第1のバッファがLと等しいサンプル数を記憶する先入れ先出し方式のバッファである、手段と;
    前記しきい値を超える前記遅延線中の前記中間音声信号の一個以上のピーク値を特定する手段と;
    特定された一個以上の前記ピーク値の応答として第2の利得を計算する手段であって、ここで、前記第2の利得の時間変化が前記第1の利得の時間変化よりも速く、前記第2の利得は、前記第1のバッファの前記入力で受け取られる前記中間音声信号の各サンプルに対して、以下の(あ)から(え)の工程、すなわち:
    (あ)最大振幅を有する前記第1のバッファに記憶されたサンプルから中間制御値を導く工程と;
    (い)前記中間制御値をLに等しい長さの第2のバッファを通過させる工程で、前記第2のバッファがLと等しい長さを有する先入れ先出し方式のバッファであり、Lに等しい数の中間制御値を記憶する、工程と;
    (う)前記第2のバッファに記憶された前記中間制御値にフィルター係数を掛け算して、利得制御値を得るために当該掛け算の生成値を合計する工程と;
    (え)前記利得制御値の応答として前記第2の利得を計算する工程、
    とを行うことによって計算される、手段と;
    ピーク値がしきい値を超えない出力音声信号を生成するために、遅延させた中間音声信号に前記第2の利得を適用する手段と;
    を備えることを特徴とする音声信号のピーク値制限装置。
  6. 請求項に記載の音声信号のピーク値制限装置において、
    前記第1の利得が、検出された逸脱の計数値に対する応答として計算されることを特徴とする音声信号のピーク値制限装置。
  7. 請求項に記載の音声信号のピーク値制限装置において、
    前記フィルター係数が、長さLのハニング・ウィンドウ関数の平方根から導かれる値を有することを特徴とする音声信号のピーク値制限装置。
  8. 請求項に記載の音声信号のピーク値制限装置において、
    前記利得制御値に逆比例して変化するニュートン・ラプソン数式近似による量によって前記第2の利得が計算される手段を有することを特徴とする音声信号のピーク値制限装置。
  9. 入力音声信号を受け取る工程と;
    しきい値を超える前記入力音声信号の逸脱を検出する工程と;
    検出された前記逸脱の応答として第1の利得を計算する工程と;
    中間音声信号を生成するために、前記入力音声信号に前記第1の利得を適用する工程と;
    Lと等しい長さの第1のバッファの入力での前記中間音声信号を表すサンプルを受け取り、前記サンプルを前記第1のバッファの出力まで前記第1のバッファを通過させることによって、遅延させた中間音声信号を生成するために、前記中間音声信号に遅延線を適用する工程であって、前記第1のバッファがLと等しいサンプル数を記憶する先入れ先出し方式のバッファである、工程と;
    前記しきい値を超える前記遅延線中の前記中間音声信号の一個以上のピーク値を特定する工程と;
    特定された一個以上の前記ピーク値の応答として第2の利得を計算する工程であって、ここで、前記第2の利得の時間変化が前記第1の利得の時間変化よりも速く、前記第2の利得は、前記第1のバッファの前記入力で受け取られる前記中間音声信号の各サンプルに対して、以下の(あ)から(え)の工程、すなわち:
    (あ)最大振幅を有する前記第1のバッファに記憶されたサンプルから中間制御値を導く工程と;
    (い)前記中間制御値をLに等しい長さの第2のバッファを通過させる工程で、前記第2のバッファがLと等しい長さを有する先入れ先出し方式のバッファであり、Lに等しい数の中間制御値を記憶する、工程と;
    (う)前記第2のバッファに記憶された前記中間制御値にフィルター係数を掛け算して、利得制御値を得るために当該掛け算の生成値を合計する工程と;
    (え)前記利得制御値の応答として前記第2の利得を計算する工程、
    とを行うことによって計算される、工程と;
    ピーク値がしきい値を超えない出力音声信号を生成するために、遅延させた中間音声信号に前記第2の利得を適用する工程と;
    を備える音声信号のピーク値制限方法を遂行する装置で実行可能な命令プログラムが記録された記憶媒体。
  10. 請求項に記載の記憶媒体において、前記方法は、前記第1の利得が、検出された逸脱の計数値に対する応答として計算されることを特徴とする音声信号のピーク値制限方法を遂行する装置で実行可能な命令プログラムが記録された記憶媒体。
  11. 請求項に記載の記憶媒体において、前記方法は、前記フィルター係数が、長さLのハニング・ウィンドウ関数の平方根から導かれる値を有することを特徴とする音声信号のピーク値制限方法を遂行する装置で実行可能な命令プログラムが記録された記憶媒体。
  12. 請求項に記載の記憶媒体において、前記方法は、前記利得制御値に逆比例して変化するニュートン・ラプソン数式近似による量によって前記第2の利得が計算されることを特徴とする音声信号のピーク値制限方法を遂行する装置で実行可能な命令プログラムが記録された記憶媒体。
JP2009523828A 2006-08-09 2007-08-08 緩慢段階と急速段階の音声ピーク値制限 Active JP5038417B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US83674806P 2006-08-09 2006-08-09
US60/836,748 2006-08-09
PCT/US2007/017588 WO2008021110A2 (en) 2006-08-09 2007-08-08 Audio-peak limiting in slow and fast stages

Publications (2)

Publication Number Publication Date
JP2010500613A JP2010500613A (ja) 2010-01-07
JP5038417B2 true JP5038417B2 (ja) 2012-10-03

Family

ID=39082570

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009523828A Active JP5038417B2 (ja) 2006-08-09 2007-08-08 緩慢段階と急速段階の音声ピーク値制限

Country Status (7)

Country Link
US (1) US8488811B2 (ja)
EP (1) EP2070191B1 (ja)
JP (1) JP5038417B2 (ja)
CN (1) CN101501988B (ja)
ES (1) ES2399295T3 (ja)
TW (1) TWI489774B (ja)
WO (1) WO2008021110A2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101324577B1 (ko) 2007-07-16 2013-11-04 삼성전자주식회사 지연된 신호에 avc를 적용하는 신호 처리장치 및 방법
WO2009086174A1 (en) 2007-12-21 2009-07-09 Srs Labs, Inc. System for adjusting perceived loudness of audio signals
US8284959B2 (en) 2008-07-29 2012-10-09 Lg Electronics Inc. Method and an apparatus for processing an audio signal
EP2353161B1 (en) * 2008-10-29 2017-05-24 Dolby International AB Signal clipping protection using pre-existing audio gain metadata
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
DK2512157T3 (en) * 2011-04-13 2014-02-17 Oticon As Hearing aid with automatic speech clipping prevention and similar procedure
WO2013154868A1 (en) * 2012-04-12 2013-10-17 Dolby Laboratories Licensing Corporation System and method for leveling loudness variation in an audio signal
US9312829B2 (en) * 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US9070371B2 (en) * 2012-10-22 2015-06-30 Ittiam Systems (P) Ltd. Method and system for peak limiting of speech signals for delay sensitive voice communication
JP6105929B2 (ja) * 2012-12-27 2017-03-29 キヤノン株式会社 音声処理装置及びその制御方法
US9325286B1 (en) * 2013-04-08 2016-04-26 Amazon Technologies, Inc. Audio clipping prevention
US9247342B2 (en) 2013-05-14 2016-01-26 James J. Croft, III Loudspeaker enclosure system with signal processor for enhanced perception of low frequency output
DE102015217565A1 (de) 2015-09-15 2017-03-16 Ford Global Technologies, Llc Verfahren und Vorrichtung zur Verarbeitung von Audio-Signalen
CN106558314B (zh) * 2015-09-29 2021-05-07 广州酷狗计算机科技有限公司 一种混音处理方法和装置及设备
US9979369B2 (en) * 2016-10-21 2018-05-22 Dolby Laboratories Licensing Corporation Audio peak limiting
US10574371B2 (en) * 2017-10-23 2020-02-25 Wheatstone Corporation Audio processor apparatus, methods and computer program products using integrated diversity delay error compensation
CN109963235B (zh) * 2019-03-15 2021-12-28 维沃移动通信有限公司 一种声音信号处理方法及移动终端
GB2592030B (en) * 2020-02-12 2022-03-09 Edwards Ltd Multiple stage vacuum pump
US11405739B2 (en) * 2020-12-01 2022-08-02 Bose Corporation Dynamic audio headroom management system

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57146297A (en) * 1981-03-04 1982-09-09 Nippon Electric Co Voice processor
JPH04195000A (ja) * 1990-11-27 1992-07-14 Canon Inc 情報処理方法及び装置
JP3713289B2 (ja) * 1994-07-11 2005-11-09 クラリオン株式会社 デジタル信号処理方式
JP3789503B2 (ja) * 1994-12-22 2006-06-28 ソニー株式会社 音声処理装置
JP3972267B2 (ja) * 1997-02-25 2007-09-05 日本ビクター株式会社 デジタルオーディオ信号処理用記録媒体、プログラム用の通信方法及び受信方法、デジタルオーディオ信号用の通信方法及び受信方法、並びにデジタルオーディオ記録媒体
US6868163B1 (en) * 1998-09-22 2005-03-15 Becs Technology, Inc. Hearing aids based on models of cochlear compression
US6556685B1 (en) * 1998-11-06 2003-04-29 Harman Music Group Companding noise reduction system with simultaneous encode and decode
JP2001320793A (ja) * 2000-05-10 2001-11-16 Sony Corp 自動利得調整装置
GB2373975B (en) * 2001-03-30 2005-04-13 Sony Uk Ltd Digital audio signal processing
US7406178B2 (en) * 2001-04-06 2008-07-29 Texas Instruments Incorporated Efficient digital audio automatic gain control
WO2004112245A1 (en) * 2003-06-18 2004-12-23 Nokia Corporation Dynamic range control of an audio signal and method of its operation
KR100561440B1 (ko) * 2004-07-24 2006-03-17 삼성전자주식회사 채널 변경에 따른 음량 자동 보정 장치 및 그 방법
CN100466467C (zh) * 2004-12-02 2009-03-04 上海交通大学 具有自动增益控制功能的音量自动限幅装置
US9008319B2 (en) * 2004-12-30 2015-04-14 Plantronics, Inc. Sound pressure level limiter with anti-startle feature
US7729673B2 (en) * 2004-12-30 2010-06-01 Sony Ericsson Mobile Communications Ab Method and apparatus for multichannel signal limiting

Also Published As

Publication number Publication date
CN101501988A (zh) 2009-08-05
JP2010500613A (ja) 2010-01-07
TW200830704A (en) 2008-07-16
US8488811B2 (en) 2013-07-16
WO2008021110A3 (en) 2008-06-05
TWI489774B (zh) 2015-06-21
EP2070191A2 (en) 2009-06-17
CN101501988B (zh) 2012-03-28
US20090271185A1 (en) 2009-10-29
WO2008021110A2 (en) 2008-02-21
ES2399295T3 (es) 2013-03-27
EP2070191B1 (en) 2012-11-21

Similar Documents

Publication Publication Date Title
JP5038417B2 (ja) 緩慢段階と急速段階の音声ピーク値制限
JP5730881B2 (ja) 録音の適応的ダイナミックレンジ強化
EP3148075B1 (en) Loudness-based audio-signal compensation
JP5917518B2 (ja) 知覚スペクトルアンバランス改善のための音声信号動的補正
US9673770B2 (en) Frequency domain multiband dynamics compressor with spectral balance compensation
US8351619B2 (en) Auditory sense correction device
EP2614659B1 (en) Upmixing method and system for multichannel audio reproduction
US8687824B2 (en) Acoustic processing device
CA2844915A1 (en) Sound processing apparatus, method, and program
US9661438B1 (en) Low latency limiter
US10380989B1 (en) Methods and apparatus for processing stereophonic audio content
JP2003068013A (ja) デジタルオーディオ信号の処理
EP1472786A2 (en) A method for decreasing the dynamic range of a signal and electronic circuit
US10636448B2 (en) Audio buffering for processing with variable lookahead
WO2007069369A1 (ja) 信号処理装置及び信号処理方法
JP5040623B2 (ja) 自動音量補正装置
RU2812005C2 (ru) Усиление диалога в звуковом кодеке
EP3940954A1 (en) Systems and methods for limiter functions
WO2020157888A1 (ja) 周波数帯域拡張装置、周波数帯域拡張方法、及び周波数帯域拡張プログラム
JP2022530338A (ja) オーディオコーデックにおける会話拡張
JP2009188449A (ja) 量子化歪み低減装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110927

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20111018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120516

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120612

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120705

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150713

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5038417

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250