JP2005534980A - オーディオ明瞭度および了解度を改善するディジタル信号処理技術 - Google Patents

オーディオ明瞭度および了解度を改善するディジタル信号処理技術 Download PDF

Info

Publication number
JP2005534980A
JP2005534980A JP2004526116A JP2004526116A JP2005534980A JP 2005534980 A JP2005534980 A JP 2005534980A JP 2004526116 A JP2004526116 A JP 2004526116A JP 2004526116 A JP2004526116 A JP 2004526116A JP 2005534980 A JP2005534980 A JP 2005534980A
Authority
JP
Japan
Prior art keywords
readable medium
computer readable
gain factor
attack
multiplier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004526116A
Other languages
English (en)
Other versions
JP2005534980A5 (ja
Inventor
クラーソン・リーフ
ホッジス・リチャード
Original Assignee
プラントロニクス, インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by プラントロニクス, インコーポレーテッド filed Critical プラントロニクス, インコーポレーテッド
Publication of JP2005534980A publication Critical patent/JP2005534980A/ja
Publication of JP2005534980A5 publication Critical patent/JP2005534980A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G11/00Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general
    • H03G11/008Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general of digital or coded signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Abstract

【課題】 オリジナルのサンプリングされた信号のマルチバンド処理および自動利得制御を実行する方法および装置を提供する。
【解決手段】 さまざまな実現例(図1B)によれば、アタック乗数およびリリース乗数がさまざまな手法で信号サンプルに適用されることによって、さまざまな効果を達成する。

Description

本願は、2001年8月6日に出願された「DIGITAL SIGNAL PROCESSING TECHNIQUES FOR IMPROVING AUDIO CLARITY AND INTELLIGIBILITY」という米国特許出願第09/927,578号の部分継続出願であり、この出願は、2000年12月20日に出願された「TECHNIQUES FOR IMPROVING AUDIO CLARITY AND INTELLIGIBILITY AT REDUCED BIT RATES OVER A DIGITAL NETWORK」という米国特許出願第09/669,069号の部分継続出願であり、これらの全ての開示内容が全ての目的のためにここで参照によって援用される。
本発明は、一般に、ディジタル信号処理に関し、より具体的には、さまざまなコンテキストにおけるディジタルオーディオ信号の処理に関する。
ある時点でインターネットの成長は、18ヶ月ごとに倍になっていて、5700万ドメインホストが1999年7月の時点であった。合衆国においては、人口の半分以上がインターネットへのアクセスを今や持っている。他のさまざまなコンテンツデリバリーのメカニズム、例えばディジタル放送、ケーブルおよび衛星システムなどの同時に起こる進化に加えて、この急速な発展は、ディジタルオーディオ産業の爆発的な発展を加速してきている。しかし、これらさまざまなメカニズムによって送り届けられる音声の質は、音声を送るのに採用されている低いビットレートのエンコーディングスキーム、例えばMPEGレイヤ3(MP3)エンコーディングスキームによってしばしば限られている。
ラジオ放送局、コンサート、スピーチ、および講演会は、ストリームの形で全てウェブ上で送られる。MicrosoftおよびReal Audioによって提供されるもののようなエンコーダは、複数のビットレートにおいてさまざまなタイプの接続(モデム、T1、DSL、ISDNなど)を介してリスナーのコンピュータにオーディオストリームを送るサーバ上に常駐する。受け取られると、ストリームデータは、特定のエンコーディングフォーマットがわかるプレーヤー、例えばRealPlayerソフトウェアによってデコードされる。同様にケーブルおよび衛星テレビシステムもストリーミングビデオおよびオーディオを、エンコードされたコンテンツをデコードおよび再生するユーザの家にあるセットトップボックスに送る。
オーディオファイル(例えばMP3ファイル)は、例えば、リスナーのコンピュータまたはさまざまな利用可能な携帯再生デバイスのうちの任意のものを含む、さまざまなメカニズムの任意のものを用いて記憶し、その後、再生するためにインターネット上でダウンロードもされえる。
ディジタルオーディオがリスナーに届けられるメカニズムに関わらず、リスナーの観点からは再生されたオーディオの明瞭度および了解度に関する多くの問題が一般に存在する。これら問題は、ディジタル的にエンコードされた情報から音声信号を復元する任意のシステム、例えば携帯音楽プレーヤー、ホームエンターテイメントシステムなどに関する。
例として、典型的な低ビットレートエンコーディングスキーム、例えばMP3エンコーディングスキームのエンコーディングプロセスにおいて、不要なアーティファクトが生成され、これは低帯域幅技術(すなわち低ビットレートコーデック)を用いて比較的、高帯域幅の信号(すなわちオリジナルの音声)を忠実に再生することを邪魔する。
このようなアーティファクトは、少なくとも一部は、それぞれのソースにおけるアナログまたはディジタル信号の適切な処理によって(例えばディジタルオーディオ放送者によって)扱い得る。これは、高計算量オーバヘッドと共に、高価なハードウェア、ソフトウェア技術、またはこれらの両方を伴うさまざまな技術を用いて典型的には達成される。残念ながら、これらの費用のかかる技術は、方程式の半分しか扱わない。
すなわち、リスニング環境、音楽のタイプ、およびリスナーの好みのさまざまな範囲によって、それぞれのエンドユーザについての聴取体験を適切に向上する信号処理をディジタルオーディオソースにおいて提供することは現実的には不可能になる。これは、さまざまな利用可能なコンテンツにわたってラウドネスレベルが首尾一貫しないシステムにおいては悪化する。それぞれのユーザの好みに合わせてカスタマイズを可能にする処理能力は、もちろんユーザデバイス中に含まれえる。しかしハードウェアまたはソフトウェアリソースのいずれかにおいてそうすることのコストは、技術的に困難であることはもちろん、これまでは実現不可能なほどであった。消費者が望む低コストの携帯デバイスについてはこのことが特に当てはまる。
したがって、ディジタルエンコーディング技術(特に低ビットレート技術)によって発生した不要なアーティファクトを取り除き、それぞれのリスナーの経験のカスタム化を可能にし、比較的、オーディオデリバリーシステムの処理リソースに低負荷しか課さないディジタル信号処理技術を提供することが望まれる。
本発明によれば、さまざまなディジタルシグナルプロセッサの構成が可能となり、これは、ディジタルオーディオの明瞭度および了解度を向上させるために柔軟に構成されえる。採用されるエンコーディングスキーム、伝送メカニズム、リスニング環境の性質、またはリスナーの好みにかかわりなく、本発明のディジタルシグナルプロセッサは、リスナーの体験を向上させ、計算のオーバヘッドの許容可能なレベルを課すディジタルオーディオの処理を実行するよう構成され得る。
より具体的には、本発明は、サンプリングされた信号のために自動利得制御を実行する方法および装置を提供する。具体的な実施形態が、応用例および所望の効果に依存して選択されえるあるパラメータに依存するアルゴリズムとして記載される。これらのパラメータは、アタックスレッショルド、1より小さいリリース乗数、および1より大きいアタック乗数を含む。このパラメータは、オプションとして非線形最終利得関数を含み得る。
あるそのような実施形態によれば、本発明は、アルゴリズムを実行するコンピュータプログラム命令によって実現される。利得係数による入力サンプリング信号の試行乗算が実行される。利得係数は、試行乗算の結果がアタックスレッショルドを超えないとき、リリース乗数によって乗算される。利得係数は、試行乗算の結果がアタックスレッショルドを超えるとき、アタック係数によって乗算される。もしオプションの非線形最終利得関数が存在しないなら、出力信号は試行乗算の結果そのものである。もしオプションの非線形最終利得関数が存在するなら、最終利得係数は、非線形最終利得関数を利得係数に適用することによって計算される。それから出力信号は、入力サンプリング信号を最終利得係数によって乗算した結果である。
他の実施形態によれば、本発明は、それぞれが複数のチャネルのうちの一つに対応する複数のサンプリングされた信号のための自動利得制御を実行する方法および装置を提供する。それぞれのチャネルは、そこに関連付けられた利得係数を有する。前記チャネルのそれぞれについてアタックスレッショルドが提供され、前記アタックスレッショルドのうちの少なくとも1つは前記アタックスレッショルドの他のものとは異なる。前記初期利得係数および前記対応するサンプリングされた信号の試行乗算の複数の結果がいずれもその関連付けられたアタックスレッショルドを超えないとき、1より大きい少なくとも1つのリリース乗数が前記初期利得係数のそれぞれに適用される。前記試行乗算の結果のうちの少なくとも1つがその関連付けられたアタックスレッショルドを超えるとき、1より小さい少なくとも1つのアタック乗数が前記初期利得係数のそれぞれに適用される。
他の実施形態によれば、本発明は、アタックスレッショルドおよびそれに関連付けられた初期利得係数を有するサンプリングされた信号のための自動利得制御を実行する方法および装置を提供する。前記初期利得係数および前記サンプリングされた信号を参照して導かれた試行乗算の結果が前記アタックスレッショルドより下であるとき、1より大きいリリース乗数が前記初期利得係数に適用される。前記試行乗算の結果が前記関連付けられたアタックスレッショルドを超えるとき、1より小さいアタック乗数が前記初期利得係数に適用される。具体的な実施形態において、最終利得係数を得るために、非線形利得関数が前記第1または第2の変更された利得係数のいずれかに適用される。
あるそのような実施形態によれば、非線形最終利得関数は数学的な指数関数であり、ここで最終利得係数は、利得係数の指数またはべき関数である。これは、入力の信号レベルにおける変化の比による信号レベル出力信号の対数圧縮を生じる。他のそのような実施形態によれば、非線形最終利得係数は、べき関数の近似である。より具体的には、利得係数の対数への近似が計算される。近似対数は、圧縮比を表す指数によって乗算される。この結果の真数がそれから計算されて、利得係数の近似べき関数を生成し、これが最終利得係数として用いられる。
特定の実現例によれば、近似対数関数は、2進対数である。この実施形態によれば、利得係数の2進表現は、先頭2進ディジットを1ビットにするのに必要なだけ多くの桁を左にシフトされる。シフトされた桁の数(すなわち2進指数)は、先頭の1ビット(すなわち2進仮数)に続くシフトされた値の部分に結合され、先頭1ビットは廃棄される。この結果が2進対数である。
2進対数はそれから圧縮比によって乗算される。2進真数、すなわち2進対数の逆がそれから計算され、最終利得係数を生成する。すなわち、入力値は、2進指数および2進仮数に分けられる。1ビットが2進仮数の左に挿入される。拡張された2進仮数はそれから、2進指数によって特定された2進桁の数だけ右にシフトされる。この結果は、最終的な利得係数として用いられる2進真数である。
さらに他の実施形態によれば、本発明は、それぞれが複数のチャネルのうちの一つに対応する複数のサンプリングされた信号について自動利得制御を実行する方法および装置を提供する。チャネル群の特定のサブセットのためのアタック群は相互関連され、すなわちチャネル群は結合される。すなわち例えば、試行乗算のうちの少なくとも1つの結果がその関連付けられたアタックスレッショルドを超えるとき、1より小さい第1アタック乗数がサンプリングされた信号の第1サブセットのうちのそれぞれに、1より小さい第2アタック乗数がサンプリングされた信号の第2サブセットのうちのそれぞれに適用される。
さらに他の実施形態によれば、本発明は、それぞれが複数のチャネルのうちの一つに対応する複数のサンプリングされた信号について自動利得制御を実行する方法および装置を提供し、それぞれのチャネルはそれに関連付けられたアタックスレッショルドを有する。サンプリングされた信号は、周波数バンドについてフィルタリングすることによって、自動利得制御の感度を前記周波数バンドに対して操作する。
さらに他の実施形態によれば、本発明は、関連付けられたアタックスレッショルドを有するサンプリングされた信号のための自動利得制御を実行する方法および装置を提供する。前記試行乗算の結果が前記アタックスレッショルドより小さい少なくとも1つのスレッショルドより小さいとき、前記リリース乗数の前記初期利得係数への適用が禁止される。
さらに他の実施形態によれば、本発明は、複数のサンプリングされた信号の処理を実行する方法および装置を提供する。前記サンプリングされた信号のうちの少なくとも1つはマスターバンドに対応し、前記サンプリングされた信号のうちの第1のものはサブウーファチャネルに対応する。前記マスターバンドに対応する前記少なくとも1つのサンプリングされた信号はローパスフィルタリングされることによって、前記少なくとも1つのサンプリングされた信号に関連付けられたバス成分を含むフィルタリングされた信号を生成する。前記フィルタリングされた信号および前記第1のサンプリングされた信号は混合されることによって、バス強調されたサブウーファチャネルを生成する。
本発明の性質および優位性のさらなる理解は、残りの部分の明細書および図面を参照して実現されよう。
図1aおよび1bをここで参照して、本発明の具体的な実施形態によるオーディオ信号を処理する信号プロセッサ30のブロック図が示される。この実施形態において、信号プロセッサ30は、完全にソフトウェアで、例えばディジタルオーディオファイルまたはストリーミングオーディオを配信するサーバ内で、または例えばディジタルラジオ送信機および受信機、標準PC、携帯電話、パーソナルディジタルアシスタント(PDA)、ワイヤレスアプリケーションデバイス、携帯再生デバイス、セットトップボックスなどを含むさまざまな他のデバイスの任意のものの中で実現される。
図1Aの入力ブロック32は、オーディオソース(不図示)からオーディオ信号を受け取る。入力ブロック32は、よく知られたディジタルエンコーディングスキームの幅広いバリエーションのうちの任意のものによって、オーディオ信号をパルス符号変調された(PCM)サンプル群に変換する。その後、周波数整形ブロック34において、除去されない場合はサンプル群の音質を悪化させえる、PCMサンプルの非常に低い周波数成分が除去される。具体的な実施形態によれば、ブロック34は、DCオフセットを除去するハイパスフィルタ(例えば5Hz)である。
2バンドクロスオーバブロック36において、オーディオサンプルは、2つの部分的にオーバラップする周波数バンド群に分離される。具体的な実施形態によれば、プロセッサ30におけるクロスオーバブロックの全ては、比較的、浅い特性を有することによって、それぞれのバンドが近接バンドとうまく混ざるようにする。それぞれの周波数バンドは、非線形自動利得制御(AGC)ループブロック38および40において後で処理され、具体的な実施形態によれば、これらブロックは後続のAGCよりそれほど過激なアタックおよびリリースタイムを持たず、主に信号レベルを後続のマルチバンドクロスオーバブロック44の「スイートスポット」に配置するためのものである。
非線形AGCループ38および40において、入力サンプルのそれぞれは、利得係数として知られる数によって乗算される。利得係数が1.0より大きいか小さいかに依存して、入力サンプルのボリュームは、それぞれの周波数バンドにおける入力サンプルの振幅をイコライズする目的で増加または減少される。利得係数は、以下に詳述されるように異なる入力サンプルについて可変である。非線形AGCおよびAGCの間で区別するファクタは、利得係数が非線形AGCでは非線形数学的関数にしたがって変化することである。よって、非線形AGC38および40のそれぞれの出力は、入力サンプルおよび利得係数の積である。具体的な実施形態によれば、AGC38および40は、図1Bの処理ブロック60中のAGC48を参照して後述されるのと同様なやりかたで動作する。2つの非線形AGCの出力は、ミキサブロック42において混合され、それにより結果として生じる出力においては全ての周波数群が表される。
次のブロック、マルチバンドクロスオーバ44において、オーディオサンプルは、n個のオーバラップする周波数バンドに分割され、ここでn=3以上である。5バンドプロセッサについては、これらバンドは、例えば、サブバス、ミッドバス、ミッドレンジ、プレゼンス、およびトレブルを含み得る。マルチバンドクロスオーバ44は、より多くの周波数バンドを有することを除いては、2バンドクロスオーバ36と非常に似た振る舞いをする。
サンプル群が複数の周波数バンドに分割されるので、それぞれの周波数バンドにおけるボリュームは、他の周波数バンドとは独立して、別個にイコライズされ得る。それぞれの周波数バンドの独立処理は、同時に演奏する高音域、低音域、および中音域の楽器群の組み合わせが存在する場合に望ましい。数分の一秒のあいだの他の楽器よりも大きな音のシンバルのクラッシュ音のような高音域の音が存在する場合、単一のバンドのAGCは、ボーカリストまたはベースから発生したかもしれないサンプル中に存在する低音および中音周波数成分を含む全体のサンプルの振幅を下げてしまうだろう。その結果は、音質の悪化および音楽への不要なアーティファクトの混入になる。ワンバンドAGCは、最も大きいボリュームを持つ周波数の成分が全体のサンプルを制御することを許し、これはスペクトル利得相互変調と呼ばれる現象である。
今度は図1Bを参照して、それぞれの周波数バンドが処理ブロック60、62、および64によって独立に処理される。処理ブロック60は、最も低い周波数を持つ成分を有する処理バンド1専用である。ドライブブロック46は、利得の変化を減らすように機能するAGC48に入る信号成分を均一に強調するユーザプログラマブル利得調整である。そのスレッショルドをオーバシュートしないN番目のサンプル毎に、AGC48は利得を逐次増す。同様に、スレッショルドをオーバシュートするN番目のサンプル毎に、AGC48は利得を逐次減らす。
ドライブブロック50は、ネガティブアタックタイムリミッタ(NATL)52の前段に置かれる、もう一つのユーザプログラマブル利得調整である。ドライブブロック50は、逆ドライブブロック54と協調して働くことによって、NATL52の動作の実効的な範囲を調節する。急に発生する信号遷移については、AGC48は、充分急速には反応できないかもしれず、そうでなければ処理されないオーバシュートするサンプルが鋭いオーバシュートを遷移の始まりにおいて生むことになる。これを処理するために、NATL52は、将来のサンプルを見て、現在のサンプルの利得を制限することによって、そのような鋭いオーバシュートに付随する歪みを防止する。実用的には、スレッショルドが低いほど、サウンドはより「密」になる。
NATL52の具体的な実施形態によれば、サンプルは、ディレイバッファ内に記憶されることによって、将来のサンプルがボリュームのイコライズにおいて用いられ得る。バッファがフルのとき、より古いサンプルの小さなブロックがバッファの始めから抽出され、将来のサンプルのブロックがバッファの終わりに追加される。将来のサンプルは、利得係数によって乗算される。もし結果として生じるデータがスレッショルド値(ユーザが決めたパラメータ)よりも大きい振幅を有するなら、利得係数は、将来のサンプルの振幅によって除算されたスレッショルド値に等しい値にまで低減される。リリースカウンタと呼ばれるカウンタは、ディレイバッファの長さに等しくあとで設定される。結果として生じるデータはそれからローパスフィルタを通されることによって、将来のサンプルによる乗算から生じるであろう利得の急峻な変化が平滑にされる。
最後に、遅延されたバッファ内のサンプルは、出力を作るために上述のように利得係数によって乗算される。その後、リリースカウンタは減算される。もしリリースカウンタがゼロより小さくなるなら、利得係数は、1.0よりわずかに大きい数によって乗算される。最後に、次のサンプルが読み込まれ、上のプロセスが反復される。NATL52は、現在のサンプルから将来のサンプルへの遷移が滑らかに耳に聴こえないように達成されることを確実にし、帯域幅を浪費するオーディオ信号上のピークを除去する。
プロセッサ30の具体的な5バンドオーディオの実現例によれば、処理ブロック60は、波形を実質的に丸めることによって、出力が入力信号より多くの低音エネルギーを含むような効果を作る倍音を作るソフトクリップブロック56を含みえる。すなわち、ドライブブロック54からの入力信号のピーク・トゥ・ピークの可動範囲よりも小さい出力信号の可動範囲内には、実質的に多くの音響エネルギーが存在する。
レベルミキサブロック58は、もう一つの利得制御であり、ここでサンプルは、ユーザによってプリセットされ得る一定利得係数によって乗算される。異なる周波数バンド中の信号成分のリミキシングは、ミキサブロック66において実行される。一般のラウドネスについてのもう一つのユーザプログラマブル利得制御68の後には、ファイナルNATL70が続き、これはNATL52を参照して上述したのと同様に合成されたバンドの総ピークを制限する。NATL70によって実行される制限機能は、例えば、異なるバンドにおけるピーク間の干渉による強め合いが処理されなければならないようなピークを生じるときには望ましい。最後に、処理されたオーディオサンプルの形のシグナルプロセッサ30の出力は、出力ブロック72を介して伝送される。
図2は、図1Aのマルチバンドクロスオーバ44の具体的な実施形態として採用され得る5バンドクロスオーバブロック80の4つのステージを示す。クロスオーバブロック80は、信号をオーバラップする周波数バンドに分離する一連のリニア操作を表す。マルチバンドクロスオーバ80(図3に示される)のそれぞれのステージにおいて、計算が実行されてループ90に示されるようなハイパス出力が生じる。より具体的には、特定の周波数バンドに対応するそれぞれのステージにおいては、ハイパス出力と呼ばれる前段からの出力だけが読み出される。それから平均化するプロセスが実行され、ここでこのステージの1つ以上の前の出力サンプル、および新しい入力サンプルの重み付けされた和が計算される。
平均化プロセスの出力は、図2および図3においてローパス出力と呼ばれる。よって、n周波数バンドに対応するn−1個のローパス出力が存在する。入力サンプルおよびローパス出力間の差は、マルチバンドクロスオーバの次段への入力を形成するハイパス出力として表される。図2は、それぞれ82〜88とラベルが付されたマルチバンドクロスオーバの第1、第2、第3、および第4のステージに対応する4つのステージを示す。
図4は、例えば図1BのAGC48を実現するために採用されえるAGCループ98の具体的な実施形態の動作を示すフローチャートを示す。AGCループ98は、それが受け取るそれぞれのサンプルに利得係数を適用する。最初に、利得係数が仮定され、その後それぞれのサンプルについて92において示されるように、利得係数が、リリースレートパラメータとここで呼ばれる0.0より大きい数による乗算を通してわずかに増される。このようにして利得係数はそれぞれのサンプルとともに増加する。それぞれの入力サンプルは、94において示されるように、このようにして得られた利得係数によって乗算される。
96において、利得係数が適用されたサンプルの振幅がプリセットされたスレッショルド値を超えるかが決定される。スレッショルド値を超える場合は、利得係数が、アタックレートパラメータとここで呼ばれる0.0より大きい数による乗算を通してわずかに減らされる。そうでなければ利得係数は変化されないまま留まり、プロセスは新しい入力サンプルを読み出すことによって反復する。
図5は、例えば図1BのAGC38を実現するために採用されえるAGCループ100の具体的な実施形態の動作を示すフローチャートを示す。AGCループ100は、それが受け取るそれぞれのサンプルに利得係数を適用する。102において、利得係数が、リリースレートパラメータとここで呼ばれる1.0よりわずかに大きい数で利得係数を乗算することによってそれぞれのサンプルについて増される。104において、試行乗算が、それぞれの入力サンプルを利得係数で乗算することによって実行される。もし結果として生じる信号の振幅がプリセットスレッショルド値より大きいなら、利得係数は1.0よりわずかに小さい数、すなわちアタックレートパラメータでの乗算によってわずかに減らされる。それから利得係数は非線形関数によって変更される。
本発明のある実施形態によれば、新しい利得係数は、古い利得係数を2で除算し、結果に固定値を加算することによって得られ、それによって利得係数に非線形の変化をもたらす。非線形AGCループ100の最終出力は、それぞれの入力サンプルを変更された利得係数によって乗算することによって得られる。その後、プロセスは入力される新しい入力サンプルについて反復される。
本発明のさまざまな実施形態は、全体がソフトウェアで実現される。ある実施形態においては、標準的なPC内のペンティアム(登録商標)プロセッサが、アセンブリ言語でプログラムされることによって、図1Aおよび1Bに示される一般化された信号処理を実行し、費用および複雑さの両方においてかなりの節約になる。さらに本発明は、リアルタイムで実現され、インターネットのような任意のディジタルネットワーク上でのオーディオ信号の伝送において用いられるのに特に望ましい。
図6は、本発明のある応用例を示し、ここでオーディオファイルは、ダイナミック処理最適化を持つディジタルネットワーク上で再生される。図6は、オーディオサーバ106、ディジタルネットワーク110、PC114、およびスピーカ118を備える通信システム120を示す。オーディオサーバ106は、T1ラインでありえる伝送線路108を通してディジタルネットワーク110に結合される。ディジタルネットワーク110は、伝送線路112を通してPC114に結合され、PC114はライン116を通してスピーカ118に結合される。
一台のPCまたは何台かの接続されたPC群でありえるオーディオサーバ106内には、オーディオ信号を処理するいくつかのブロックがある。ディスク上に記憶されたオーディオファイル122は、例えばMP3エンコーディングスキームのようなさまざまなエンコーディングアルゴリズムのうちの任意のものを用いてエンコードされえる。オーディオファイルは、例えばWinampなどデコーディングソフトウェアを用いて124において再生され、その後、PCMサンプルに変換される。それからPCMサンプルは、信号処理ソフトウェア126によって処理され、その実施形態はここで説明された図1Aおよび1Bのプロセッサである。
信号処理ソフトウェア126の出力は、例えばMP3のような任意の所望のエンコーディングアルゴリズムを用いて再びエンコーディングされ、ライン108を通してディジタルネットワーク110をわたって伝送され、ライン112を通してPC114へ達する。Winampのような適切なデコーディングソフトウェアを装備したPC114内では、サンプルがデコーディングされ、オーディオ信号に変換され、それからそれはライン116を通してスピーカ118に与えられる。
図7は、本発明の他の一般化された応用例を示し、ここでユーザはディジタルオーディオ再生デバイス130に記憶されたオーディオファイルを再生している。スピーカ134は、ライン132を通して再生デバイス130に結合される。再生デバイス130は、例えば、本発明の信号処理から利益を受ける、パーソナルコンピュータ、ホームエンターテイメントシステムの任意のコンポーネント、携帯通信デバイス、携帯CDまたはMP3プレーヤーなどのようなさまざまなコンシューマー電子デバイスのうちの任意のものを備え得る。例えば、再生デバイス130は、ユーザの車の中に位置するオーディオシステムの一部でありえ、そのような環境下で典型的なバックグランドノイズの存在の下で音質を改善するために本発明のダイナミック処理機能が採用され得る。
さまざまなエンコーディング技術のうちの任意のものを用いてエンコードされたオーディオファイル136は、デコーディングソフトウェア138(例えばWinamp)によってデコードされ、PCMサンプルに変換される。PCMサンプルは、本発明のさまざまな実施形態のうちの任意のものによって設計された信号処理ソフトウェア140によって処理される。
信号処理ソフトウェア140は、ここで説明されるさまざまな実施形態よりも、より多くの、またはより少ない数の周波数バンドおよび処理ブロックを採用し得る。すなわち、異なる応用例については、本発明の信号処理技術を実現するためには、より多くの、またはより少ない量の処理リソースが利用可能である。例えば、MP3プレーヤーのような小さい携帯再生デバイス内の処理サイクルの利用可能な数は限られている。対照的に、図6のサーバ106のようなオーディオサーバについてはそのような制限は存在しないかもしれない。
信号処理ソフトウェア140の出力は、変換ブロック142(PC内ではサウンドカードでありえる)において最終的にオーディオ信号に変換され、これがスピーカ134をライン132を介して駆動する。
図8は、本発明の更なる他の応用例を示し、ここで説明される信号処理技術はネットワーク通信システムの受信端において採用される。図8に示されるのは、オーディオサーバ150、ディジタルネットワーク154、PC158、およびスピーカ162を含む通信システム170である。オーディオサーバ150は、伝送線路152を通してディジタルネットワーク154に結合され、ディジタルネットワーク154は伝送線路156を通してPC158に結合され、PC158はライン160を通してスピーカ162にリンクされる。
この場合のオーディオサーバ150は、本発明の実施形態のうちの任意のものによって設計された信号処理ソフトウェアを含んでも含まなくてもよい。エンコードされたオーディオデータは、オーディオサーバ150から伝送線路152を通って、ディジタルネットワーク154を介し、伝送線路156を通してPC158へと伝送される。PC158内では、PCMサンプルは164において適切なデコーディングソフトウェアを用いてデコードされる。オーディオデータはPCMサンプルにデコードされ、これが信号処理ソフトウェア166によって処理される。信号処理ソフトウェア166の出力は、サウンドカードドライバ168によってオーディオ信号に変換され、これがスピーカ162をライン160を介して駆動する。
本発明のさまざまな実施形態において用いられるAGCおよびNATLブロックは、ほとんど同様であるが、異なる実現例について、または同じ実現例内でも異なる効果について、時定数、すなわちアタックおよびリリースタイムの調整に大きくは依る差を持つ。すなわち、特定の所望のサウンドは、特定のブロックについて特定されたアタックおよびリリースタイムに影響を与え得る。加えて、利用可能な処理リソースは、例えばMP3プレーヤー内の小さいサイクルバジェット対音楽ファイルサーバ内の大きなサイクルバジェットのような、特定の実現例におけるバンドおよび/またはバンド当たりのブロックの数に影響を与え得る。
エンコーダのバンド幅は、オリジナルのオーディオのバンド幅に相対的に減らされるので、不要な可聴アーティファクトが発生する。本発明は、これら予期されるアーティファクトがより人間の耳につきにくくなるように、オーディオサンプルを処理する。すなわち、本発明の信号処理は、低帯域幅システム(低ビットレートコーデック)で高帯域幅信号(オリジナルオーディオ)を忠実に再生しようとすることによって作られる不要なアーティファクトから大きく影響を受けることなく、低ビットレートエンコーダがオーディオストリームをエンコードするために用いられることを可能にする。
低ビットレートエンコーダによって表される帯域幅の節約に加えて、本発明の信号処理は、例えばバックグランドノイズおよびカット・トゥ・カットの平滑性(cut-to-cut evenness)が存在する中での、明瞭度の改善のような他の望ましい効果を有しえる。
本発明の一般化されたトポロジーは、AGC(NATLを含む)、ドライブブロック(例えば図1Bのドライブブロック46、50および54)、およびフィルタブロック(図1Aのクロスオーバ36および44)の3つの異なる種類のブロックを含む。これら3つの要素をさまざまなやりかたのうちの任意のやりかたで結合する信号処理ネットワークは、本発明の範囲内にあると考えられる。上述のように、フィルタまたはクロスオーバブロックは、信号をオーバラップする周波数バンドに分離するために一連の線形操作を実行するために典型的には採用され得る。
一般に、本発明のAGCブロックは、その信号の最近の履歴および/または直近の未来を調べ、この標準を用いて利得係数を調整することによって、信号がピーク可動範囲(peak excursion)の範囲内に収められるようにする。さまざまな実施形態におけるこのようなブロックの異なる実現例は、これらの調整をするのにどの程度、信号が用いられるか、およびこの調整がどの程度速く、またはどの程度頻繁に行われるかについて異なる。また特定されるのは、例えばNATL中において機能するか、または機能しないかのスレッショルドの使用のような、出力において維持されるのが望まれる信号の範囲である。加えて、いったん適用される利得値が決定されると、現在のサンプルに適用する前に、さらなる非線形関数が利得値に適用される。最後に、また利得値は、入力信号レベルを参照して計算され得る。本発明のさまざまな実施形態によればフィードフォワードおよびフィードバックAGCトポロジーの両方が採用されえる。本発明のさまざまな実施形態によって採用される2つの基本的なAGCのタイプには、1)リミッタタイプ(例えば図1BのNATL52)、および2)ダイナミックレンジ制御タイプ(例えば図1BのAGC48)がある。
ドライブブロックは、サンプルを後続の処理ブロック(群)のスイートスポットに入れるための単なるプリセットレベル制御である。ドライブブロックおよび逆ドライブブロックの間に処理ブロック(群)を置くことは、処理ブロック(群)がその正常範囲内で動作することを可能にしつつ、オーディオ信号に対して実効レンジを移動させることができる。
具体的な実施形態によれば、本発明のシグナルプロセッサの基本ブロックが動作する効率は、ブロックの機能を実現するための低精密整数演算の使用に一部は関係する。より具体的な実施形態によれば、AGCおよびNATLの動作を2つの独立したステージに分離することも、効率および音質に貢献する。
本発明のさらなる実施形態は、図9Aおよび9Bおよび後続の図を参照して説明される。図9Aおよび9Bは、本発明の具体的な実施形態によって設計された5バンドシグナルプロセッサ900を示す。プロセッサ900の処理ブロックは図1Aおよび1Bを参照して上述したプロセッサ30の対応するブロックと同様に動作することに注意されたい。プロセッサ900は、特にこの構成によって与えられる関連する計算負荷を受け入れるための充分な処理オーバヘッド有するアプリケーションのような、さまざまな応用例について採用され得ることが理解されよう。
今度は図9Aを参照して、受け取られたディジタルオーディオサンプルは、フィルタブロック902においてハイパスフィルタを通され、DC成分および5Hz未満の他の不要な信号成分が抑圧される。それからフィルタを通されたサンプルは、「トランスペアレント(transparent)」、「デュアルブリックウォール(dual brick wall)」、「ワイドバンド(wideband)」、および「ブリックウォール(brick wall)」とそれぞれここで呼ばれる4つのパラレルパスのうちの一つでプリプロセスされる。
本発明の具体的な実施形態によれば、「トランスペアレント」パスは、オーディオを2つのバンド(バスおよびマスタ)に分割し、それらを個別に(バスバンドをマスターバンドに結合させて)処理する。これは無視できる効果を有する標準モードとして考えられえる。「デュアルブリックウォール」パスは、その利得変化がより耳に聴こえる点を除いて「トランスペアレント」パスと同じである。「ワイドバンド」パスは、フルレンジのオーディオを1つのAGCだけで処理する。これは、わずかなスペクトル利得相互変調しか与えず、実施形態によっては、ある種のプリセット(例えばロックプリセット)によって利用される。「ブリックウォール」パスは、「ワイドバンド」パスと同様であるが、かなりのスペクトル利得相互変調を与え、さまざまな実施形態によれば、ある種のプリセット(例えばいわゆるクラブまたはハウスプリセット)によって利用され得る。
それからプリプロセスされたオーディオは、それぞれ80Hz、200Hz、2kHz、および8kHzのカットオフ周波数を有する2ウェイクロスオーバブロック952〜955を用いて5つの周波数バンドに分割される。これは、例えば図3のマルチバンドクロスオーバを参照して上述したように実現されえる。バンド1〜5のそれぞれにおけるサンプルはそれから以下のようにさらなる処理が施される。
ノイズゲートブロック961〜965は、振幅があるレベル未満であるオーディオ信号の成分を除去する。ディレイブロック956〜960は、ルックアヘッド/ネガティブアタックタイムのためのノイズゲートブロック961〜965によって用いられる。
ドライブブロック966〜970は、利得の変化を減らすよう機能する後続のAGCブロック(すなわち971〜975)へ進むときに、受け取られた信号成分を均一に強調するユーザプログラマブル利得調整を表す。具体的な実施形態によれば、そのスレッショルドをオーバシュートしないそれぞれのn番目のサンプルについて、AGCブロック971〜975のそれぞれはその利得を漸次的に増やす。同様に、そのスレッショルドをオーバシュートするそれぞれのn番目のサンプルについて、AGCブロック971〜975のそれぞれはその利得を漸次的に減らす。より具体的な実施形態によれば、AGCブロック971〜975のリリース関数は、「gain = gain + (gain*release)」として与えられ、AGCブロック971〜975のアタック関数は、「gain = gain + (gain*attack)」として与えられる。ここで「release」および「attack」は、それぞれリリース時定数およびアタック時定数を表す。
ドライブブロック976〜980は、ネガティブアタックタイムリミッタ(NATL)981〜985に先行するユーザプログラマブル利得調整の他のセットである。急に起こる信号遷移によっては、AGC971〜975は充分に急に応答しないかもしれず、ある程度のオーバシュートサンプルが、そうでなければ処理されずに、遷移の始まりにおいて急なオーバシュートを結果として生む。これを扱うために、NATL981〜985は、このような鋭いオーバシュートに付随する歪みを防止するために、将来のサンプルを見て、現在のサンプルの利得を制限する。スレッショルドが低く設定されると、サウンドもより「密(dense)」になる。
ドライブブロック986〜990のそれぞれは、ドライブブロック976〜980の対応するものの逆である。ドライブブロック976〜980のそれぞれは、ドライブブロック976〜980の対応するものと協調して働き、NATL981〜985の対応するものの動作の実効範囲を調整する。加えて、バンド1、例えばサブバスにおいて、ドライブブロック986は、ソフトクリップブロック991に信号を送る。ソフトクリップブロック991は、波形を実質的に丸める非線形関数に対応し、入力信号の同じピーク・トゥ・ピークの可動範囲内であっても倍音のために、出力にはより多くの音響エネルギーが存在するように、存在するよりももっと多いバスがあるような認識を作る倍音を作る。
独立して制御可能な利得をそれぞれのバンドについて有するミキサブロック992の後には最終のNATL993が続き、これは結合されたバンドの総ピーク、例えば処理されなければならないピークを生じえる異なるバンドのピーク間の干渉による強め合いを制限する。NATL993の後には、クリップブロック994が続き、これは信号から残りのオーバシュートを除去する。
図10Aおよび10Bは、本発明のさらに他の実施形態によって設計された他の5バンドシグナルプロセッサ1000を示す。本発明のこの実施形態は、システムの全体的な処理リソースにより低い負荷を示す、すなわち簡略化のためにより低いサイクルバジェットを有するという点で図9Aおよび9Bのプロセッサ900に対して優位性を持つ。また後述の例外を除いては、プロセッサ1000の処理ブロックは、上述のプロセッサ30および900の対応するブロックと同様に動作する。実際、図10Aに見られるように、入力サンプルは、図9Aを参照して上述したのと同じやり方で(バンドパスフィルタについては異なるが)4つのパラレルパスのうちの一つでプリプロセスされる。
それからプリプロセスされたオーディオは、それぞれ80および400Hz、および2および8kHzのカットオフ周波数のペアを有する3ウェイクロスオーバブロック1052および1054(図9Bの4つのクロスオーバ952〜955の代わりに)を用いて5つの周波数バンドに分割される。加えて、クロスオーバブロック1052および1054は、独立したユーザプログラマブル利得制御を含み、これらは他の実施形態における後続のドライブブロックの必要をなくす。バンド1〜5のそれぞれにおけるサンプルは、それから以下のようにさらに処理が施される。
具体的な実施形態によれば、そのスレッショルドをオーバシュートしないそれぞれのサンプルについて、AGCブロック1070〜1074のそれぞれはその利得を漸次的に増やす。同様に、そのスレッショルドをオーバシュートするそれぞれのサンプルについて、AGCブロック1070〜1074のそれぞれはその利得を漸次的に減らす。より具体的な実施形態によれば、AGCブロック1070〜1074のリリース関数は、「gain=gain+(gain/(2^release))」として与えられ、AGCブロック1070〜1074のアタック関数は、「gain=gain-(gain/(2^attack))」として与えられる。ここで「release」および「attack」は、それぞれリリース時定数およびアタック時定数を表す。
急に起こる信号遷移によっては、AGC1070〜1074は充分に急に応答しないかもしれず、ある程度のオーバシュートサンプルが、そうでなければ処理されずに、遷移の始まりにおいて急なオーバシュートを結果として生む。これを扱うために、NATL1080〜1084は、このような鋭いオーバシュートに付随する歪みを防止するために、将来のサンプルを見て、現在のサンプルの利得を制限する。
加えて、最も低い周波数バンド、例えばサブバスにおいては、ソフトクリップブロック1090が非線形関数に対応し、これは実質的に波形を丸め、入力信号の同じピーク・トゥ・ピークの可動範囲内であっても倍音のために、出力にはより多くの音響エネルギーが存在するよう、存在するよりももっと多いバスがあるような認識を作る倍音を作る。
独立して制御可能な利得をそれぞれのバンドについて有するミキサブロック1091の後には最終のNATL1092が続き、これは結合されたバンドの総ピーク、例えば処理されなければならないピークを生じ得る異なるバンドのピーク間の干渉による強め合いを制限する。NATL1092の後には、クリップブロック1093が続き、これは信号から残りのオーバシュートを除去する。
図11は、本発明の更なる他の実施形態によって設計された4バンドシグナルプロセッサ1100を示す。本発明のこの実施形態は、更なる簡略化のために、前述した実施形態よりも処理リソースにさらに低い負荷を示す。よって、この実施形態は、かなり高度なレベルの信号処理が望まれるが、例えばMP3およびCDプレーヤーのような処理リソースが足りない携帯オーディオプレーヤーの応用例に特にふさわしい。また、後述の例外を除いては、プロセッサ1100の処理ブロックは、上述のプロセッサ30,900,1000の対応するブロックと同様に動作することにも注意されたい。
受け取られたオーディオサンプルは、それぞれ80および400Hz、および2kHzのカットオフ周波数のペアを有する1つの3ウェイクロスオーバ1152および1つの2ウェイクロスオーバブロック1154を用いて4つの周波数バンドに分割される。加えて、クロスオーバブロック1152および1154は、独立したユーザプログラマブル利得制御を含み、これらは他の実施形態における後続のドライブブロックの必要をなくす。
具体的な実施形態によれば、そのスレッショルドをオーバシュートしないそれぞれのサンプルについて、AGCブロック1170〜1173のそれぞれはその利得を漸次的に増やす。同様に、そのスレッショルドをオーバシュートするそれぞれのサンプルについて、AGCブロック1170〜1173のそれぞれはその利得を漸次的に減らす。より具体的な実施形態によれば、AGCブロック1170〜1173のリリース関数は、「gain=gain+(gain/(2^release))」として与えられ、AGCブロック1170〜1173のアタック関数は、「gain=gain-(gain/(2^attack))」として与えられる。ここで「release」および「attack」は、それぞれリリース時定数およびアタック時定数を表す。
独立して制御可能な利得をそれぞれのバンドについて有するミキサブロック1191の後には最終のNATL1192が続き、これは結合されたバンドの総ピーク、例えば処理されなければならないピークを生じえる異なるバンドのピーク間の干渉による強め合いを制限する。
具体的な応用例が図12A〜14を参照してこれから説明される。示されるシステムは、本発明の信号処理技術のうちのさまざまなものを利用することが有益なシステムの例に過ぎないことが理解されよう。上述のように、考えられるこれら技術にはより多くの応用例が存在し、これらも本発明の範囲の中にある。
ディジタルラジオ産業における最近の継続する発達は、結果的には、放送提供者から消費者へ高品質ディジタルパスを生むはずであるが、このパスは大きくはダイナミックレンジの制限およびプリエンファシスの問題を起こしやすい要求がない。オーディオ伝送チェーンの完全なディジタル化は、例えば従来、コンパクトディスクプレーヤーを直接聴くときの1フィートのように、オリジナルの録音から消費者への完全なパスについてそのオリジナルの質およびダイナミックレンジを維持しつつ、オーディオがディジタル領域の中に留まることを意味する。
そのようなシステムによってオーディオ信号のダイナミックレンジの実質的に全てを保持することは、従来可能であったよりも広いダイナミックレンジ制御を可能にし、芸術的および他の目的のためにオーディオ信号のより高度な処理を可能にする。残念ながら、処理の高度さのレベルにかかわらず、ディジタル放送者は、あらゆるリスナーの好みはもちろん、あらゆるリスニング環境に適切なディジタルオーディオ信号を現在は提供できない。放送者が望みえる最良のものは、ある程度、正規化された「最小公倍数的」リスニング体験を参照する特定の「署名(signature)」サウンドについてのオーディオ信号を処理することである。このようなアプローチは、伝送される信号のダイナミックレンジを厳しく制限し、大多数のリスナーにとってはしばしばリスニング体験を満足のいかないものにする。
現在のディジタル放送スキームの欠点の多くは、オーディオ処理がオーディオ信号のソース、すなわちディジタル放送者のラジオ送信機において起こり、その結果、それぞれの個別のリスナーの特定の要求を満足できないという事実に関する。したがって、本発明の具体的な実施形態によれば、本発明のディジタル信号処理技術がこの問題を克服するために採用されるディジタル放送システムが提案される。すなわち、処理能力がラジオレシーバ内に提供され、これがそれぞれのリスナーの好みによってリスニング体験のカスタム化を可能にする。
図12Aおよび12Bは、それぞれ、ディジタルオーディオ放送(DAB)局1200、およびDABレシーバ側システム1250の簡略化されたブロック図である。ラジオ局1200は、プログラムオーディオ信号を受け取り、これは後でディジタル信号にA/Dコンバータ1202によって変換されるアナログ信号、またはAES/EBUディジタル信号であり、これらのうちのいずれかはそれから局のCODEC1204を用いてエンコードされる。結果として生じるAESディジタルオーディオ信号はそれから、IBOCエキサイタ1206に与えられ、これはそれを用いて放送RF信号を変調する。
また出力AESディジタル信号は、本発明によって設計されたシグナルプロセッサ1208にも提供される。より具体的な実施形態によれば、プロセッサ1208は、図9Aおよび9Bのプロセッサ900を備える。しかし、本発明のさまざまな実施形態の任意のものが用いられえることが理解されよう。
プロセッサ1208は、ディジタル放送者によって制御インタフェース1210を介して構成され、例えば局の「署名」サウンドを提供するなどさまざまな目的を達成する。結果として生じるオーディオ信号は、放送者の職員によって処理されたAES/EBUディジタル信号およびD/Aコンバータ1214によって提供される2チャネル処理されたオーディオ信号の両方を受け取るオフエアモニタ1212を介してモニタされ得る。このようにして放送者の所望のサウンドが達成され得る。
前述の実施形態とは異なり、プロセッサ1208は、ディジタルオーディオを伝送前には処理しない。その代わり、ディジタルオーディオと共にRF信号上で伝送するために、所望のプロセッサ構成を表す低速ディジタルデータがエキサイタ1206に提供される。これらデータはそれからリスナーのシステムによって採用されて、レシーバ側の対応するシグナルプロセッサを構成することによって、ディジタルオーディオ信号を放送者のプログラムされたスキームで処理する。構成データセット(configuration data set)は、任意のプロセッサブロックのための任意のパラメータを含みえ、放送者の設計にしたがって、それより少なくてもそれより多くを含んでもよい。
今度は図12Bを参照して、DABレシーバ側システム1250は、DABレシーバ1252およびコンパクトディスク(CD)プレーヤー1254を含み、これらのそれぞれはユーザによって制御回路1256を介して制御され、これは例えば、リモートコントロール(不図示)を含み得る。図に示されるように、ユーザはオーディオソースとしてレシーバ1252およびCDプレーヤー1254の間で選択し得る。
もし、ユーザがDABレシーバ1252を選択するならば、局1200によって送られたPCMオーディオデータおよび低速プロセッサ構成データが、具体的な実施形態によれば図9Aおよび9Bのプロセッサ900を備えるシグナルプロセッサ1258に提供される。しかし、さまざまな実現例のうちの任意のものが用いられ得ることが理解されよう。プロセッサ1258は、受け取られた低速データによって構成され、ディジタルオーディオデータをそれにしたがって処理する。リスナーは、制御インタフェース1260を用いてプロセッサ1258の構成をカスタマイズして、放送者のデフォールトの構成を増強または完全にオーバライドし得る。この制御インタフェース1260は示される実施形態によれば、ブロック1262によって表されるシステムボリューム、バランス、およびフェーダー機能をも制御するよう動作可能である。
プロセッサ1258は、処理されたディジタルオーディオサンプルをD/Aコンバータ1264に与え、これが今度は変換されたアナログ信号をボリューム/バランス/フェーダーブロック1262に与え、その出力はアンプ1266〜1269に与えられ、これらがスピーカ1270〜1273をそれぞれ駆動する。
このようにして、ディジタル放送システムによって提供されるリスニング体験は、それぞれのリスニング環境に合うように、およびそれぞれのリスナーの好みにしたがってカスタマイズされ、一方で、放送者の手による基本的な体験のためにある程度の制御のレベルを維持できる。すなわち、さまざまな実施形態によれば、ユーザは、放送者によって提供される予め定義されたデフォールトの処理構成を選択し、その構成をなんらかのやり方で変更し、または完全にオーバライドするオプションが与えられる。これら機能のリスナーのシステムへの統合は、少なくとも部分的には、本発明の処理技術が、多くのこのようなシステムにおいて既に利用可能である処理リソースに非常に小さい影響しか与えないという事実によって可能とされる。
実際、本発明の信号処理の影響の低さは、これらプロセッサを幅広い応用例に統合するのに理想なものとする。あるこのような応用例は、図13に示されるようなサテライトテレビシステムである。ボックス1302、1304、および1306によって表されるように、サテライトシステム1300は、顧客に伝送するコンテンツのためにさまざまな異なるソースを採用する。これは典型的には、異なるチャネルにわたって、またエンドユーザの観点からは望ましくないが単一のチャネル上の異なるコンテンツについての、不均一なラウドネスにつながる。
これはもちろん本発明の処理技術をサテライトシステムのヘッドエンド装置に統合することによって扱い得る。しかし、ディジタル放送のコンテキストを参照して上述したように、これは問題の一部にしか対応しない。これはやはり個別のユーザのリスニング体験のカスタム化を可能にはしない。したがって、本発明の実施形態によれば、本発明の処理技術は、所望の信号処理機能を提供するためにディジタル放送システムにおけるのと同じように、ユーザの装置に統合される。
図13を再び参照して、コンテンツの異なるタイプ(1302、1304、および1306)がヘッドエンドサテライトアップリンク1308に与えられ、これは本発明または他の技術のいずれかによる信号処理機能のなんらかのレベルを含んでもよく、または含まなくてもよい。このコンテンツはサテライト1310に伝送され、これがさらにセットトップボックス1314によるデコーディングおよびテレビ1316上での表示のためにコンテンツをユーザアンテナ1312に送信する。ある実施形態によれば、本発明によって設計されたシグナルプロセッサ(図11のプロセッサ1100)は、セットトップボックス1314内に含まれ、図12Aおよび12Bを参照して上述したのと同様のやり方でサテライトプロバイダによってコンテンツと共に送信された構成データにしたがって構成され得る。あるいは、デフォールトの構成は、セットトップボックス自体の中に提供され得る。いずれの場合もユーザは、例えば、テレビ1316および付随するリモートコントロール(不図示)を介してアクセスされるメニュードリブンインタフェースを用いてデフォールトのプロセッサ構成を変更またはオーバライドのいずれかができる。もちろん上記説明はケーブルテレビシステムにも等しく適用しえることが理解されよう。
代替実施形態によれば、本発明によって設計されたシグナルプロセッサは、テレビ受信機自体の中に提供される。実際、異なるソースから導き出されるオーディオを含む任意のシステムは、本発明の信号処理および正規化機能から利益を受け得る。例えば、今度は図14を参照して、ホームエンターテイメントシステム1400は、CDプレーヤー1402、FMラジオレシーバ1404、およびMP3プレーヤー1406のようなオーディオ信号の複数のソースを含み得る。これらオーディオ信号は、レシーバ1408によって受信され、これがスピーカ1412を駆動するパワーアンプ1410を用いてそれらを増幅する。示されるように、レシーバ1408は、本発明によって設計されたシグナルプロセッサ1414を含み、これはオーディオソース間の差から生じる不均一さを消すように構成され、ユーザが自分の好みにしたがってリスニング体験をカスタマイズすることを可能にする。
このアイディアは、本発明によって設計されたシグナルプロセッサを、オーディオを扱う任意の電子デバイスまたはシステムに統合することを含むようさらに一般化され得る。これは、例えばテレビ、CDおよびMP3プレーヤー、カーステレオ、ラジオなど上述のデバイスのタイプを含み得る。これはまたビデオおよびテープレコーダ、ミニディスクレコーダなどのような記録デバイスも含み得る。本発明の技術はまた、従来の電話線、インターネット、または無線環境にかかわらず、任意の電話または音声通信システムのタイプにも適用され得る。音声応用例のためのマルチバンドプロセッサの例は、図15を参照して説明される。
図15は、例えば音声または電話の応用例において採用され得る3バンドシグナルプロセッサ1500を示す。入力オーディオはAGC1501によってプリプロセスされる。それからプリプロセスされたオーディオは、それぞれ1000Hzおよび2000Hzのカットオフ周波数を有する2ウェイクロスオーバブロック1502および1504を用いて3つの周波数バンドに分割される。これは例えば、図3のマルチバンドクロスオーバを参照して上述したように達成され得る。バンド1〜3のそれぞれにおけるサンプルはそれから、以下のさらなる処理が施される。
ノイズゲートブロック1512〜1516は、振幅があるレベル未満であるオーディオ信号の成分を除去する。ディレイブロック1518〜1522は、ルックアヘッド/ネガティブアタックタイムのためのノイズゲートブロック1512〜1516によって用いられる。ドライブブロック1518〜1522は、利得の変化を減らすように機能する、後続のAGCブロック(すなわち1524〜1528)に入る信号成分を均一に強調するユーザプログラマブル利得調整である。具体的な実施形態によれば、そのスレッショルドをオーバシュートしないn番目のサンプル毎に、AGCブロック1524〜1528のそれぞれは利得を逐次増やす。同様に、スレッショルドをオーバシュートするm番目のサンプル毎に、AGCブロック1524〜1528のそれぞれは利得を逐次減らす。さまざまな実施形態によれば、AGCブロック1524〜1528のリリース関数は、上述の関数の任意のものに対応し得る。
ドライブブロック1530〜1534は、ネガティブアタックタイムリミッタ(NATL)1536〜1540に先行するユーザプログラマブル利得調整の他のセットである。急に起こる信号遷移によっては、AGC1524〜1528は充分に急に応答しないかもしれず、ある程度のオーバシュートサンプルが、そうでなければ処理されずに、遷移の始まりにおいて急なオーバシュートを結果として生む。これを扱うために、NATL1536〜1540は、このような鋭いオーバシュートに付随する歪みを防止するために、将来のサンプルを見て、現在のサンプルの利得を制限する。スレッショルドが低く設定されると、サウンドもより「密(dense)」になる。
ドライブブロック1542〜1546のそれぞれは、ドライブブロック1530〜1534の対応するものの逆である。ドライブブロック1530〜1534のそれぞれは、逆ドライブブロックの対応するものと協調して働き、NATLの対応するものの動作の実効範囲を調整する。独立して制御可能な利得をそれぞれのバンドについて有するミキサブロック1548の後には最終のNATL1550が続き、これは結合されたバンドの総ピーク、例えば処理されなければならないピークを生じえる異なるバンドのピーク間の干渉による強め合いを制限する。NATL1550の後には、クリップブロック1552が続き、これは信号から残りのオーバシュートを除去する。
本発明の信号処理技術がMP3エンコーディングのようなオーディオエンコーディングスキームの帯域幅削減を促進するやり方は、さらに他の実施形態のセットにも関する。これら実施形態によれば、本発明の効果は、関連付けられた信号処理技術をディジタルオーディオにリアルタイムで適用しない場合でさえ実現され得る。すなわち、ディジタルオーディオサンプルの任意のシーケンスは、本発明によって設計されたシグナルプロセッサを用いて処理されることによって、あとで再生されるように記憶されるべきオーディオファイルを生成する。
例えば、インターネット上でダウンロードされるべきMP3ファイルのプロバイダは、ストリーミングオーディオのプロバイダとして同じリアルタイム処理を提供する立場にはない。にもかかわらず、本発明の効果は、ユーザが本発明の信号処理の機能を有していなくても、このプロバイダおよびこのようなダウンロードされたファイルのユーザによって享受され得る。すなわち、MP3ファイルのプロバイダは、本発明の任意の実施形態の信号処理技術を任意のMP3ファイルに適用し、インターネット上でユーザにサービスするために処理されたMP3ファイルを記憶できる。これらファイルはそれから、利用可能なデコーダ/プレーヤーの任意のものを用いてダウンロードされ再生され、リスニング体験は、本発明の処理技術がリアルタイムで適用されているのとほとんど同一になる。プリプロセスは、例えば、低ビットレートコーデックの不要なアーティファクトを緩和すること、またはオーディオファイルのプロバイダのために「署名」サウンドを提供することのような、本発明のさまざまな実施形態について参照して上述のような任意の所望の効果についてであり得る。
オーディオサンプルのリアルタイム処理なしで本発明の効果が享受され得る他の場合の例は、その中に本発明によってプリプロセスされたオーディオファイルが記憶されている記録媒体、例えばコンパクトディスクの製造および配布である。すなわち、オーディオCDの製造者または配布者は、CD上で配布されるべきオーディオを上述の任意の目的、例えば特定のタイプの音楽のためのデフォールトサウンドを提供するためにプリプロセスすることができる。
図16A〜16Cは、さらに他の実施形態によって設計されたマルチチャネル、マルチバンドシグナルプロセッサを示し、これはディジタルオーディオ信号を処理するのに特に優位性を持つ。具体的には、6チャネル、4バンドシグナルプロセッサが示され、これは例えばいわゆる5.1チャネルサラウンドサウンドオーディオシステムにおいて採用され得る。示される実施形態において、チャネルは、センターチャネルC、左および右フロントチャネルLFおよびRF、左および右サラウンドチャネルLSおよびRS、およびサブウーファSWを含む。図16Aを参照して、6つの入力チャネルは、レベル検出器ブロック1602によって受け取られ、このブロックは入力信号のレベルに依存して、後述のゲーティングまたはフリージング機能を起動したり、起動しなかったりし得る。
レベル検出器1602は、チャネルのそれぞれについてのサンプルの現在のブロックについてのピーク値を2つの異なるスレッショルドと比較する。具体的な実施形態によれば、これらスレッショルドは−40dBおよび−60dBである。これらは例示的なスレッショルド値であることが理解されよう。もしチャネルの任意のものについてのピーク値が両方のスレッショルドよりも上であるなら、ゲーティングまたはフリージング機能はいずれも起動されない。逆にもし全てのチャネルが2つのスレッショルドのうちの高いほうよりも下である(つまりオーディオレベルが比較的静かである)なら、ゲーティング信号がイネーブルされ、シグナルプロセッサ内のAGCブロックのそれぞれに適用され、この信号はAGCのリリースレートを所定の率だけ遅くする効果を有する。これは例えば映画での2人の俳優の会話の間において望ましく、このような場合は信号はノイズである可能性が高く、通常のレートまでブーストされるべきではない。リリースレートが低減される率は、さまざまな実現例によって変わり得る。
もし全てのチャネルが2つのスレッショルドの低いほうよりも下である(つまり沈黙)なら、フリーズ信号がイネーブルされ、AGCブロックのそれぞれに適用され、この信号は条件が変わるまで一時的にAGC動作をフリーズさせる(すなわちリリースしない)。これはバックグラウンドノイズのブーストが起こらないことを確実にする。明らかに、これらの機能を実現するためには広い範囲の率およびスレッショルド値が用いられ得る。加えて、所望の効果に依存してリリースレート低減の度合いを変える効果を出すために、2つより多いスレッショルドレベルが採用され得る。
レベル検出器1602に続いて、チャネルLS、LF、C、RF、およびRSのそれぞれについて一つずつ、5つのクロスオーバブロック1604がある。クロスオーバブロック1604は、それぞれのチャネルを2つのバンドに分割し、第1バンドはそれぞれのチャネルのバスに対応し、第2バンドはそれぞれのチャネルについてのバスバンドより上の残りの信号に対応する。さまざまな実施形態によれば、クロスオーバブロックは、多少なりとも2つの間でオーバラップが生じることによって、結果として生じるバンド群が特定の応用例に適切であるように変化し得る。
分割されていないサブウーファSWチャネルと共にそれぞれのバンドについてのバス成分は、6チャネルAGCブロック1610に与えられる。5チャネルのそれぞれのアッパーバンドは、5チャネルAGCブロック1612に与えられる。さまざまな実施形態を参照して上述のように、この第1の2バンドAGCステージは、後続のマルチバンド処理のために、信号レベルを適切な範囲に置く目的がある。よってこれらAGCについてのアタックおよびリリースレートは、後続のAGCのアタックおよびリリースレートに対して比較的遅い。
示される実施形態によれば、AGCブロック1612のための制御信号は、ハイパスフィルタ1614およびバンドストップフィルタ1616を用いてオーディオ信号コンテンツをフィルタリングすることによって導き出される。フィルタ1614は、クロスオーバによって除去されない低周波数信号成分を除去する。フィルタ1616は、特定の周波数レンジをディエンファシスすることによって、後続のAGCブロックがそのレンジにそれほど敏感ではないようにする。具体的な実施形態によれば、アッパーオーディオミッドレンジは、このようにしてディエンファシスされる。具体的な実施形態によれば、フィルタ1614および1616の効果は、ロワーミッドレンジおよびアッパーバス内にAGCの感度が向けられる特定の周波数バンドだけが存在することである。このようにチャネルをフィルタリングすることによって、大きな音声信号についてAGCがそれほどアタックしないようにAGCの応答が整形される。
さまざまな実施形態によれば、AGC1610および1612は、本発明の他の実施形態を参照して上述したように一般に動作する。すなわち、もし入力信号レベルがAGCのスレッショルドよりも上であるなら、AGCは、信号レベルがスレッショルドレベルになるまで、すなわち無限圧縮比で、そのアタックレートパラメータにしたがって「アタックし」、すなわちその利得を下げる。
より具体的な実施形態によれば、これらAGCブロック(後述のAGCブロックと共に)の圧縮比は、圧縮がより線形な関数であるように、すなわち入力信号レベルがAGCスレッショルドを超える程度が、利得が減少させられる程度と線形な関係を有するように、任意の恣意的な有限値に調整され得る。例えば、もし圧縮比が4:1であったなら、AGCの入力における4dBの超過は、出力における1dBの超過を意味する。さらに具体的な実施形態によれば、異なるバンドについての圧縮比は、例えばラウドネスコントロールの効果を実現するために独立に調整され得る。
ある実施形態によれば、N:1の圧縮比(ここでNは任意の数である)は、以前の技術を用いるより効率的に達成される。すなわち従来では、N:1の圧縮比を得ることは、それぞれのサンプルについて対数が計算され、それからNによって除算がなされ、その結果から指数が取られなければならない。この結果をAGC利得係数に適用することは、入力の信号レベルの変化の比にしたがった信号レベル出力信号の対数圧縮を生じる。しかしこのアプローチは、計算の点で高価であり、応用例によっては現実的ではないくらいに高い。したがって本発明の具体的な実施形態によれば、より効率的なアプローチが提供される。
すなわち、正確な数学的べき関数は複雑であり、多くのコンピュータサイクルを要求するので、べき関数を近似する簡易方法が用いられえる。そのような方法の一つによれば、利得係数の対数の近似が計算される。近似対数はそれから圧縮比を表す指数によって乗算される。この結果の真数(anti-logarithm)がそれから計算される。この計算の結果は、利得係数の近似べき関数であり、これが最終的な利得係数として用いられる。
近似対数関数の特定の実現例は、2進対数として知られる。ある実施形態によれば、利得係数の2進対数表現は、先頭2進ディジットを1ビットにするのに必要なだけ多くの桁を左にシフトされる。シフトされた桁の数(すなわち2進指数)は、先頭の1ビット(すなわち2進仮数)に続くシフトされた値の部分に結合され、先頭1ビットは廃棄される。この結果が2進対数である。
2進真数の実現は、2進対数の逆である。すなわち、入力値は、2進指数および2進仮数に分けられる。1ビットが2進仮数の左に挿入される。拡張された2進仮数はそれから、2進指数によって特定された2進桁の数だけ右にシフトされる。この結果は、最終的な利得係数として用いられる2進真数である。
具体的な実施形態によれば、AGC1610および1612のチャネルは結合され、例えばそれらは全ての同じ利得値および同じAGC関数を用いることによって、あるチャネルがアタックするとき全てのチャネルがアタックする。しかしチャネルが結合されてはいるが、AGCは独立したアタックスレッショルドを持ちえる。独立したアタックスレッショルドを提供することは、異なるチャネルについての異なるレベルの感度を示すAGCを有することが望ましい応用例において優位性を持つ。
例えばある実施形態によれば、センターチャネルのスレッショルドは、他のチャネルの全てよりも6dB高い。これは例えば叫び声のような急な大きな音に応答した過剰なダッキング(ducking、低減)を防ぐ。加えて、さらに具体的な実施形態によれば、チャネルに関連付けられたアタックレートは、チャネルの異なる組み合わせについて異なりえる。例えば、C、LFおよびRFについてのアタック乗数は0.999でありえ、一方、LSおよびRSについてのアタック乗数は0.9999であり得る。このような設定は、例えば、大きなサラウンド効果に応答する過剰なダッキングを防ぐために用いられえる。
このようなAGCブロックの例示的実現例のブロック図は図17に与えられる。別個のレベル検出器(すなわちブロック1702〜1706)がそれぞれのチャネルに与えられ、それぞれのチャネルについてのアタックスレッショルドは独立に設定されえる。レベル検出器の出力は、少なくとも1つのアタックスレッショルドが超えられたことを示す単一の出力信号を生成するためにレベル結合器1708内で結合される。
結合器ブロック1708の出力は、アタック/リリースブロック1710に与えられ、これはアタックおよびリリース機能を利得ブロック1712に与え、これがさらに利得を5つのチャネルのそれぞれに与える。具体的な実施形態によれば、与えられたチャネルに対する全体的なAGC機能の感度は、レベル検出器およびレベル結合器1708の間の乗数によって表されるチャネルのそれぞれへの乗算係数を与えることによって操作され得る。示されるように、フリーズ/ゲート制御信号(例えば図16のレベル検出器1602からの)はアタック/リリースブロック1710に与えられる。
図16Aを再び参照して、AGC1610は、そのAGC機能を6チャネル全てにおいて実行する。すなわち、5つのメインチャネルのバス部分が、レベル検出器1602から直接の全体のSWチャネルと共に、クロスオーバブロック1604〜1608から受け取られる。示される実施形態においてはAGC1612とは異なり、AGC1610への制御信号は、同じようにはフィルタリングされない。むしろ制御信号は、図17を参照して上述されたように、個別のレベル検出器およびレベル結合器を用いてオーディオ信号から直接に導き出され得る。
加えて具体的な実施形態によれば、1方向結合がAGC1612およびAGC1610の間には存在する。これの効果は、もしバスについての増幅、すなわちAGC1610がマスターバンド、すなわちAGC1612の増幅より大きいなら、AGC1610は、そのリリースレートパラメータにしたがってリリースせず、すなわちその利得を大きくしない。これは、オーディオ信号の高い周波数成分に対するバスの過剰な強調を防ぐ。
いったんAGC1610および1612からの利得制御が適用されると、2つのバンドは、5チャネルミキサ1618によって再び単一のバンドに混合され、全ての6チャネルはさらなる処理へと送られる。今度は図16Bを参照して、5つのメインチャネルLS、LF、C、RF、およびRSのそれぞれは、対応するクロスオーバブロック1620〜1629によって4つのバンドに分割される。それぞれのバンドに対応するそれぞれのチャネルの部分は、AGC1631〜1634のうちの対応するものに送られる。AGC1631は、SWチャネルと共に、バンド1、すなわちバンド1〜4のうち最も低い周波数バンドに対応する5つのメインチャネルのそれぞれの部分を受け取る6チャネルAGCである。AGC1632〜1634は、それぞれバンド2、3、および4に対応する5つのメインチャネルのそれぞれの部分を受け取る5チャネルAGCである。
具体的な実施形態によれば、AGC1632〜1634は、図16Aおよび17を参照して上述のようにAGC1610および1612と同様に動作する。すなわち例えば、AGC1632〜1634のそれぞれにおけるチャネルが完全に結合され、同じ利得値および同じAGC関数がそれぞれのチャネルについて用いられることによって、あるチャネルがアタックするときには全てのチャネルがアタックする。しかしチャネル群が結合されてはいるが、AGCは独立したアタックスレッショルドを有しえる。具体的な実施形態によれば、AGC1631〜1634の目的は所望の周波数バランスを維持することである。これを達成するために、これらAGCのアタックおよびリリースレートは、AGC1610および1612に関連するそれらよりも速い。
示されるように、AGC1631〜34のそれぞれは、またフリーズ/ゲート制御信号をレベル検出器1602から受け取る。上述のようにこの制御信号の状態に依存して、AGC1631〜34のリリースをすることは、オーディオ信号中の検出された沈黙期間のあいだはバックグラウンドノイズの増幅を防ぐために遅くされるか、または「フリーズ」され得る。
より具体的な実施形態によれば、AGC1610および1612を参照して上述のように、例えば同じアタックレート乗数をチャネルの特定のサブセット、例えばC、LF、およびRFチャネルについて持つような、チャネル群の特定の組み合わせの間におけるようなAGC1631〜34における追加の結合が提供され得る。
AGC1631〜34の後には、ネガティブアタックタイムリミッタ(NATL)1641〜1660が続き、これらのそれぞれは4つのバンドのそれぞれについての5つのメインチャネルのそれぞれに対応する。本発明の他の実施形態を参照して上述のように、これらNATLは、AGCが充分に急に応答しないかもしれず、そうでなければオーバシュートを結果として生むような信号遷移を扱う。このような遷移を扱うために、NATL1641〜1660は、このような鋭いオーバシュートに付随する歪みを防止するために、将来のサンプルを見て、現在のサンプルの利得を制限する。さまざまな実施形態によれば、これらNATLは、忠実度をそれほど低下させることなく省略され、特に後述する後続のNATLブロックを含める場合はそうである。示されるようにこの実施形態においては、AGC1631からのSWチャネルはこの段をバイパスする。
NATL1641〜1660の後、4つのバンドのそれぞれからのチャネル成分は、4ウェイミキサ1664〜1668によって5つのメインチャネルに再び混合され、これらの出力は、AGC1631からのSWチャネルと共に、図16Cを参照して後述されるようにさらに処理される。6つのチャネルのそれぞれは、他の対応するNATL(1671〜1676)を通され、これらは、NATL1641〜1660を参照して上述したのと同じように、それぞれのチャネルにおける結合されたバンドの総ピークを制限する。クリップブロック1681〜1686は、対応するチャネルからの任意の残ったオーバシュートを除去する。
具体的な実施形態によれば、バス強調はSWチャネルに提供され、ここで5つのメインチャネルのバス成分は、SWチャネルのコンテンツ内で混合される。この機能は、5つのメインチャネルに関連するスピーカがフルレンジスピーカではない、すなわちバス信号を適切に再生しないシステムについては特に優位性を持つ。図16Cに示されるこの実施形態の具体的な実現例によれば、これは、5つのメインチャネルを単一の信号にミックスするための5ウェイミキサ1690、結合された信号の高い周波数成分を除去するローパスフィルタ1692、プログラマブル利得ブロック1694(ユーザがコンフィギャ可能でありえる)、および最後に、混合された信号をSWチャネルと結合する2ウェイミキサ1696を用いて達成される。この「バス強調された」信号はそれから、上述のような処理のためにNATL1676に与えられる。さまざまな実施形態によれば、シグナルプロセッサのこのバス強調部分は、もし望まれるならディセーブルされ得る。
図16A〜16Cおよび17を参照して上述された特徴および技術の任意のものは、ここで説明されたシグナルプロセッサトポロジーの任意のものと共に採用され、プロセッサブロック構成およびブロックパラメータの幅広いバリエーションは、ここで説明した技術のさまざまな応用例について適切である限り本発明の範囲内である。
本発明は、その具体的な実施形態を参照して特に示され説明されてきたが、当業者には開示された実施形態の形態および詳細の変更も本発明の精神および範囲から逸脱することなくなされえることが理解されよう。すなわち、説明された具体的な構成の基本構成ブロック、例えばAGC、ネガティブアタックタイムリミッタ、およびドライブブロックは、さまざまな範囲の応用例のための、高度に効率的なマルチバンド信号処理を提供するためにさまざまなやり方で結合され得る。所望の忠実度、利用可能な伝送帯域幅、および利用可能な処理オーバヘッドのような要素は、異なる応用例についての異なる最適化構成を支配するよう相互作用し得る。
さらにさまざまな実施形態はソフトウェアでの実現を参照してここでは説明されてきた。しかしそのような実施形態の基本信号処理ブロックは、他のやり方で実現されてもよく、本発明の範囲内に留まる。例えば、これらの処理ブロックは、特定用途向け集積回路(ASIC)またはプログラマブルロジックデバイス(PLD)において実現されえる。本発明の処理ブロックのハードウェアおよび回路による実現も可能である。
さらに、特定のプロセッサ構成がここでは特定の応用例、例えばインターネット上のストリーミングオーディオ、携帯再生デバイス、ケーブルおよびサテライトテレビのためのセットトップボックスを参照して説明されてきた。しかし上述の構成は、対応する応用例に限定されない。むしろ説明されたプロセッサの任意のものは、説明された応用例の任意のものを含むさまざまな応用例のうちの任意のものについて構成および採用され得る。
加えて、本発明のさまざまな効果、局面、および目的は、さまざまな実施形態を参照して説明されてきたが、本発明の範囲はそのような効果、局面、および目的を参照することによって限定されるべきではないことが理解されよう。むしろ、本発明の範囲は添付の特許請求の範囲を参照して決定されるべきである。
本発明の具体的な実施形態によって設計されたシグナルプロセッサの簡略化されたブロック図である。 本発明の具体的な実施形態によって設計されたシグナルプロセッサの簡略化されたブロック図である。 本発明のさまざまな具体的な実施形態と用いられるマルチバンドクロスオーバのさまざまなステージの簡略化されたブロック図である。 図2のマルチバンドクロスオーバにおけるクロスオーバステージの動作を示すフロー図である。 本発明の具体的な実施形態による自動利得制御処理ブロックの動作を示すフロー図である。 本発明の具体的な実施形態による非線形自動利得制御処理ブロックの動作を示すフロー図である。 本発明の具体的な実施形態によるネットワーク上でのオーディオファイルの再生を示すブロック図である。 本発明の具体的な実施形態によるオーディオファイルのデコーディングを示すブロック図である。 本発明の他の具体的な実施形態によるネットワーク上でのオーディオファイルの再生を示すブロック図である。 本発明の他の具体的な実施形態によって設計されたシグナルプロセッサの簡略化されたブロック図である。 本発明の他の具体的な実施形態によって設計されたシグナルプロセッサの簡略化されたブロック図である。 本発明のさらに他の具体的な実施形態によって設計されたシグナルプロセッサの簡略化されたブロック図である。 本発明のさらに他の具体的な実施形態によって設計されたシグナルプロセッサの簡略化されたブロック図である。 本発明のさらなる具体的な実施形態によって設計されたシグナルプロセッサの簡略化されたブロック図である。 本発明の具体的な実施形態によるディジタルオーディオ放送システムの送信側を示すブロック図である。 本発明の具体的な実施形態によるディジタルオーディオ放送システムの受信側を示すブロック図である。 本発明の具体的な実施形態による衛星テレビシステムを示すブロック図である。 本発明の具体的な実施形態によって設計されたホームエンターテイメントシステムのブロック図である。 音声または電話の応用例で採用されえる他の具体的な実施形態によって設計された3バンドシグナルプロセッサの図である。 ディジタルオーディオ信号を処理するのに優位な本発明のさらに他の実施形態によって設計されたマルチチャネルマルチバンドシグナルプロセッサを示す図である。 ディジタルオーディオ信号を処理するのに優位な本発明のさらに他の実施形態によって設計されたマルチチャネルマルチバンドシグナルプロセッサを示す図である。 ディジタルオーディオ信号を処理するのに優位な本発明のさらに他の実施形態によって設計されたマルチチャネルマルチバンドシグナルプロセッサを示す図である。 本発明のさまざまな実施形態と用いるAGC処理ブロックの例示的実現例の簡略化されたブロック図である。

Claims (99)

  1. それぞれが複数のチャネルのうちの一つに対応する複数のサンプリングされた信号のための自動利得制御を実行するその中に記憶されたコンピュータプログラム命令を有する少なくとも1つのコンピュータで読み取り可能な媒体であって、それぞれのチャネルは、そこに関連付けられた初期利得係数を有し、前記コンピュータプログラム命令は、
    前記チャネルのそれぞれについてアタックスレッショルドを設定する第1命令であって、前記アタックスレッショルドのうちの少なくとも1つは前記アタックスレッショルドの他のものとは異なる、第1命令、
    前記初期利得係数および前記対応するサンプリングされた信号の試行乗算の複数の結果がいずれもその関連付けられたアタックスレッショルドを超えないとき、1より大きい少なくとも1つのリリース乗数を前記初期利得係数のそれぞれに適用することによって、第1の変更された利得係数を生成する第2命令、
    前記試行乗算の結果のうちの少なくとも1つがその関連付けられたアタックスレッショルドを超えるとき、1より小さい少なくとも1つのアタック乗数を前記初期利得係数のそれぞれに適用することによって、第2の変更された利得係数を生成する第3命令、および
    前記第1または第2の変更された利得係数のいずれかに対応する最終利得係数を前記複数のサンプリングされた信号に適用する第4命令
    を含むコンピュータで読み取り可能な媒体。
  2. 請求項1に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記複数のチャネルは、センターチャネル、レフトフロントチャネル、ライトフロントチャネル、レフトサラウンドチャネル、およびライトサラウンドチャネルを備えるコンピュータで読み取り可能な媒体。
  3. 請求項2に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記センターチャネルに関連付けられた前記アタックスレッショルドは、他のアタックスレッショルドより少なくとも3dB高いコンピュータで読み取り可能な媒体。
  4. 請求項3に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記センターチャネルに関連付けられた前記アタックスレッショルドは、他のアタックスレッショルドより少なくとも6dB高いコンピュータで読み取り可能な媒体。
  5. 請求項2に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記レフトフロントおよびライトフロントチャネルに関連付けられた前記アタックスレッショルド群は同じであるコンピュータで読み取り可能な媒体。
  6. 請求項2に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記レフトサラウンドおよびライトサラウンドチャネルに関連付けられた前記アタックスレッショルド群は同じであるコンピュータで読み取り可能な媒体。
  7. 請求項1に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、非線形利得関数を前記第1および第2の変更された利得係数のいずれかに適用することによって前記最終利得係数を生成する第5命令をさらに含むコンピュータで読み取り可能な媒体。
  8. 請求項7に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記非線形利得関数は指数関数を備えるコンピュータで読み取り可能な媒体。
  9. 請求項7に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記非線形利得関数は近似指数関数を備えるコンピュータで読み取り可能な媒体。
  10. 請求項9に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記近似指数関数は2進対数を用いて導かれるコンピュータで読み取り可能な媒体。
  11. 請求項1に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記複数のチャネルをバンドパスフィルタリングすることによって複数の制御信号を生成する第5命令をさらに含み、前記第2および第3命令は、前記制御信号を用いて前記試行乗算を実行するよう動作可能であるコンピュータで読み取り可能な媒体。
  12. 請求項1に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記試行乗算の全ての結果が前記アタックスレッショルドの全てより低い第1スレッショルドより低いとき、前記少なくとも1つのリリース乗数の前記初期利得係数への適用を禁止する第5命令をさらに含むコンピュータで読み取り可能な媒体。
  13. 請求項12に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記第5命令は、前記少なくとも1つのリリース乗数を減らすことによって前記少なくとも1つのリリース乗数の適用を禁止するよう動作可能であるコンピュータで読み取り可能な媒体。
  14. 請求項12に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記第5命令は、前記少なくとも1つのリリース乗数の適用を止めることによって前記少なくとも1つのリリース乗数の適用を禁止するよう動作可能であるコンピュータで読み取り可能な媒体。
  15. 請求項1に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記少なくとも1つのアタック乗数は、第1アタック乗数および第2アタック乗数を備え、前記第3命令は、前記第1アタック乗数を前記初期利得係数の第1サブセットのそれぞれに、および前記第2アタック乗数を前記初期利得係数の第2サブセットのそれぞれに適用するよう動作可能であるコンピュータで読み取り可能な媒体。
  16. 請求項15に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記複数のチャネルは、センターチャネル、レフトフロントチャネル、ライトフロントチャネル、レフトサラウンドチャネル、およびライトサラウンドチャネルを備え、初期利得係数の前記第1サブセットは前記センターチャネル、前記レフトフロントチャネル、および前記ライトフロントチャネルに対応し、初期利得係数の前記第2サブセットは前記レフトサラウンドチャネル、および前記ライトサラウンドチャネルに対応するコンピュータで読み取り可能な媒体。
  17. 請求項1に記載の前記サンプリングされた信号を伝送するシステムであって、請求項1に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備えるシステム。
  18. 請求項17に記載のシステムであって、ワイドエリアネットワーク内の任意のサーバプラットフォーム、ディジタルラジオ送信プラットフォーム、セルラー通信システム送信プラットフォーム、ケーブルテレビ送信プラットフォーム、および衛星テレビ送信プラットフォームを備えるシステム。
  19. 請求項1に記載の前記サンプリングされた信号を受け取るシステムであって、請求項1に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備えるシステム。
  20. 請求項19に記載のシステムであって、ワイドエリアネットワーク内の任意のクライアントプラットフォーム、ディジタルラジオレシーバ、携帯セルラー通信デバイス、ケーブルテレビデコーダ、および衛星テレビデコーダを備えるシステム。
  21. 請求項1に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備える携帯デバイス。
  22. 請求項21に記載の携帯デバイスであって、前記サンプリングされた信号はオーディオ信号を表し、前記携帯デバイスはディジタルオーディオプレーヤーを備える携帯デバイス。
  23. 請求項22に記載の携帯デバイスであって、前記ディジタルオーディオプレーヤーは、コンパクトディスクプレーヤーおよびMP3プレーヤーのいずれかを備える携帯デバイス。
  24. それぞれが複数のチャネルのうちの一つに対応する複数のサンプリングされた信号のための自動利得制御を実行するコンピュータによって実現される方法であって、それぞれのチャネルは、そこに関連付けられた初期利得係数を有し、前記方法は、
    前記チャネルのそれぞれについてアタックスレッショルドを設定することであって、前記アタックスレッショルドのうちの少なくとも1つは前記アタックスレッショルドの他のものとは異なる、設定すること、
    前記初期利得係数および前記対応するサンプリングされた信号の試行乗算の複数の結果がいずれもその関連付けられたアタックスレッショルドを超えないとき、1より大きい少なくとも1つのリリース乗数を前記初期利得係数のそれぞれに適用することによって、第1の変更された利得係数を生成すること、
    前記試行乗算の結果のうちの少なくとも1つがその関連付けられたアタックスレッショルドを超えるとき、1より小さい少なくとも1つのアタック乗数を前記初期利得係数のそれぞれに適用することによって、第2の変更された利得係数を生成すること、および
    前記第1または第2の変更された利得係数のいずれかに対応する最終利得係数を前記複数のサンプリングされた信号に適用すること
    を含むコンピュータによって実現される方法。
  25. 請求項24に記載の前記コンピュータによって実現される方法を用いて生成された、利得制御されたサンプリングされた信号を表す、その中に記憶されたデータファイルを有するコンピュータで読み取り可能な媒体。
  26. アタックスレッショルドおよびそれに関連付けられた初期利得係数を有するサンプリングされた信号のための自動利得制御を実行するその中に記憶されたコンピュータプログラム命令を有する少なくとも1つのコンピュータで読み取り可能な媒体であって、前記コンピュータプログラム命令は、
    前記初期利得係数および前記サンプリングされた信号を参照して導かれた試行乗算の結果が前記アタックスレッショルドより下であるとき、1より大きいリリース乗数を前記初期利得係数に適用することによって、第1の変更された利得係数を生成する第1命令、
    前記試行乗算の結果が前記関連付けられたアタックスレッショルドを超えるとき、1より小さいアタック乗数を前記初期利得係数に適用することによって、第2の変更された利得係数を生成する第2命令、および
    最終利得係数を前記サンプリングされた信号に適用する第3命令であって、前記最終利得係数は、非線形利得関数を前記第1または第2の変更された利得係数のいずれかに適用することによって導かれる、第3命令
    を含むコンピュータで読み取り可能な媒体。
  27. 請求項26に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記非線形利得関数は指数関数を備えるコンピュータで読み取り可能な媒体。
  28. 請求項26に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記非線形利得関数は近似指数関数を備えるコンピュータで読み取り可能な媒体。
  29. 請求項28に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記近似指数関数は2進対数を用いて導かれるコンピュータで読み取り可能な媒体。
  30. 請求項27に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記非線形利得関数は圧縮比によって特徴付けられ、前記コンピュータプログラム命令は、前記圧縮比を調整する第4命令をさらに含むコンピュータで読み取り可能な媒体。
  31. 請求項26に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、試行乗算の結果が前記アタックスレッショルドより低い第1スレッショルドより低いとき、前記リリース乗数の前記初期利得係数への適用を禁止する第4命令をさらに含むコンピュータで読み取り可能な媒体。
  32. 請求項26に記載の前記サンプリングされた信号を送信するシステムであって、請求項26に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備えるシステム。
  33. 請求項32に記載のシステムであって、ワイドエリアネットワーク内の任意のサーバプラットフォーム、ディジタルラジオ送信プラットフォーム、セルラー通信システム送信プラットフォーム、ケーブルテレビ送信プラットフォーム、および衛星テレビ送信プラットフォームを備えるシステム。
  34. 請求項26に記載の前記サンプリングされた信号を受け取るシステムであって、請求項26に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備えるシステム。
  35. 請求項34に記載のシステムであって、ワイドエリアネットワーク内の任意のクライアントプラットフォーム、ディジタルラジオレシーバ、携帯セルラー通信デバイス、ケーブルテレビデコーダ、および衛星テレビデコーダを備えるシステム。
  36. 請求項26に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備える携帯デバイス。
  37. 請求項36に記載の携帯デバイスであって、前記サンプリングされた信号はオーディオ信号を表し、前記携帯デバイスはディジタルオーディオプレーヤーを備える携帯デバイス。
  38. 請求項37に記載の携帯デバイスであって、前記ディジタルオーディオプレーヤーは、コンパクトディスクプレーヤーおよびMP3プレーヤーのいずれかを備える携帯デバイス。
  39. アタックスレッショルドおよびそれに関連付けられた初期利得係数を有するサンプリングされた信号のための自動利得制御を実行するコンピュータによって実現される方法であって、
    前記初期利得係数および前記サンプリングされた信号を参照して導かれた試行乗算の結果が前記アタックスレッショルドより下であるとき、1より大きいリリース乗数を前記初期利得係数に適用することによって、第1の変更された利得係数を生成すること、
    前記試行乗算の結果が前記関連付けられたアタックスレッショルドを超えるとき、1より小さいアタック乗数を前記初期利得係数に適用することによって、第2の変更された利得係数を生成すること、および
    最終利得係数を前記サンプリングされた信号に適用すること、前記最終利得係数は、非線形利得関数を前記第1または第2の変更された利得係数のいずれかに適用することによって導かれる、適用すること
    を含むコンピュータによって実現される方法。
  40. 請求項39に記載のコンピュータによって実現される方法を用いて生成された利得制御されたサンプリングされた信号を表す、その中に記憶されたデータファイルを有するコンピュータで読み取り可能な媒体。
  41. それぞれが複数のチャネルのうちの一つに対応する複数のサンプリングされた信号のための自動利得制御を実行するその中に記憶されたコンピュータプログラム命令を有する少なくとも1つのコンピュータで読み取り可能な媒体であって、それぞれのチャネルは、そこに関連付けられた初期利得係数を有し、前記コンピュータプログラム命令は、
    前記初期利得係数および前記対応するサンプリングされた信号の試行乗算の複数の結果がいずれもその関連付けられたアタックスレッショルドを超えないとき、1より大きい少なくとも1つのリリース乗数を前記初期利得係数のそれぞれに適用することによって、第1の変更された利得係数を生成する第1命令、
    前記試行乗算の結果のうちの少なくとも1つがその関連付けられたアタックスレッショルドを超えるとき、1より小さい少なくとも1つのアタック乗数を前記初期利得係数のそれぞれに適用することによって、第2の変更された利得係数を生成する第2命令、および
    前記第1または第2の変更された利得係数のいずれかに対応する最終利得係数を前記複数のサンプリングされた信号に適用する第3命令
    を含むコンピュータで読み取り可能な媒体。
  42. 請求項41に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記複数のチャネルは、センターチャネル、レフトフロントチャネル、ライトフロントチャネル、レフトサラウンドチャネル、およびライトサラウンドチャネルを備えるコンピュータで読み取り可能な媒体。
  43. 請求項42に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、初期利得係数の前記第1サブセットは前記センターチャネル、前記レフトフロントチャネル、および前記ライトフロントチャネルに対応し、初期利得係数の前記第2サブセットは前記レフトサラウンドチャネル、および前記ライトサラウンドチャネルに対応するコンピュータで読み取り可能な媒体。
  44. 請求項41に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記アタックスレッショルドのうちの少なくとも1つは前記アタックスレッショルドの他のものとは異なるコンピュータで読み取り可能な媒体。
  45. 請求項41に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、非線形利得関数を前記第1および第2の変更された利得係数のいずれかに適用することによって前記最終利得係数を生成する第4命令をさらに含むコンピュータで読み取り可能な媒体。
  46. 請求項41に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記複数のチャネルをバンドパスフィルタリングすることによって複数の制御信号を生成する第4命令をさらに含み、前記第1および第2命令は、前記制御信号を用いて前記試行乗算を実行するよう動作可能であるコンピュータで読み取り可能な媒体。
  47. 請求項41に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記試行乗算の全ての結果が前記アタックスレッショルドの全てより低い第1スレッショルドより低いとき、前記少なくとも1つのリリース乗数の前記初期利得係数への適用を禁止する第4命令をさらに含むコンピュータで読み取り可能な媒体。
  48. 請求項41に記載の前記サンプリングされた信号を送信するシステムであって、請求項41に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備えるシステム。
  49. 請求項48に記載のシステムであって、ワイドエリアネットワーク内の任意のサーバプラットフォーム、ディジタルラジオ送信プラットフォーム、セルラー通信システム送信プラットフォーム、ケーブルテレビ送信プラットフォーム、および衛星テレビ送信プラットフォームを備えるシステム。
  50. 請求項41に記載の前記サンプリングされた信号を受け取るシステムであって、請求項41に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備えるシステム。
  51. 請求項50に記載のシステムであって、ワイドエリアネットワーク内の任意のクライアントプラットフォーム、ディジタルラジオレシーバ、携帯セルラー通信デバイス、ケーブルテレビデコーダ、および衛星テレビデコーダを備えるシステム。
  52. 請求項41に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備える携帯デバイス。
  53. 請求項52に記載の携帯デバイスであって、前記サンプリングされた信号はオーディオ信号を表し、前記携帯デバイスはディジタルオーディオプレーヤーを備える携帯デバイス。
  54. 請求項53に記載の携帯デバイスであって、前記ディジタルオーディオプレーヤーは、コンパクトディスクプレーヤーおよびMP3プレーヤーのいずれかを備える携帯デバイス。
  55. それぞれが複数のチャネルのうちの一つに対応する複数のサンプリングされた信号のための自動利得制御を実行するコンピュータによって実現される方法であって、それぞれのチャネルは、初期利得係数およびそこに関連付けられたアタックスレッショルドを有し、前記方法は、
    前記初期利得係数および前記対応するサンプリングされた信号の試行乗算の複数の結果がいずれもその関連付けられたアタックスレッショルドを超えないとき、1より大きい少なくとも1つのリリース乗数を前記初期利得係数のそれぞれに適用することによって、第1の変更された利得係数を生成すること、
    前記試行乗算の結果のうちの少なくとも1つがその関連付けられたアタックスレッショルドを超えるとき、1より小さい第1アタック乗数を前記初期利得係数の第1サブセットのそれぞれに、および1より小さい第2アタック乗数を前記初期利得係数の第2サブセットのそれぞれに、適用することによって、第2の変更された利得係数を生成すること、および
    前記第1または第2の変更された利得係数のいずれかに対応する最終利得係数を前記複数のサンプリングされた信号に適用すること
    を含むコンピュータによって実現される方法。
  56. 請求項55に記載の前記コンピュータによって実現される方法を用いて生成された、利得制御されたサンプリングされた信号を表す、その中に記憶されたデータファイルを有するコンピュータで読み取り可能な媒体。
  57. それぞれが複数のチャネルのうちの一つに対応する複数のサンプリングされた信号のための自動利得制御を実行するその中に記憶されたコンピュータプログラム命令を有する少なくとも1つのコンピュータで読み取り可能な媒体であって、それぞれのチャネルは、そこに関連付けられた初期利得係数およびアタックスレッショルドを有し、前記コンピュータプログラム命令は、
    前記サンプリングされた信号のうちの少なくとも一部を周波数バンドについてフィルタリングすることによって、前記自動利得制御の感度を前記周波数バンドに対して操作する第1命令、
    前記初期利得係数および前記対応するフィルタリングされた信号の試行乗算の結果が前記関連付けられたアタックスレッショルドを超えるとき、1より大きいリリース乗数を前記初期利得係数に適用することによって、第1の変更された利得係数を生成する第2命令、
    前記試行乗算の結果が前記関連付けられたアタックスレッショルドを超えるとき、1より小さいアタック乗数を前記初期利得係数に適用することによって、第2の変更された利得係数を生成する第3命令、および
    前記第1または第2の変更された利得係数のいずれかに対応する最終利得係数を前記複数のサンプリングされた信号に適用する第4命令
    を含むコンピュータで読み取り可能な媒体。
  58. 請求項57に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記複数のチャネルは、センターチャネル、レフトフロントチャネル、ライトフロントチャネル、レフトサラウンドチャネル、およびライトサラウンドチャネルを備えるコンピュータで読み取り可能な媒体。
  59. 請求項58に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記周波数バンドはアッパーミッドレンジオーディオバンドを含むコンピュータで読み取り可能な媒体。
  60. 請求項58に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記複数のチャネルは、サブウーファチャネルをさらに含み、前記第1命令は、前記サブウーファチャネルに対応する前記サンプリングされた信号をフィルタするよう動作可能ではないコンピュータで読み取り可能な媒体。
  61. 請求項57に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記アタックスレッショルドのうちの少なくとも1つは前記アタックスレッショルドの他のものとは異なるコンピュータで読み取り可能な媒体。
  62. 請求項57に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記アタック乗数のうちの少なくとも1つは前記アタック乗数の他のものとは異なるコンピュータで読み取り可能な媒体。
  63. 請求項57に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、非線形利得関数を前記第1および第2の変更された利得係数のいずれかに適用することによって前記最終利得係数を生成する第5命令をさらに含むコンピュータで読み取り可能な媒体。
  64. 請求項57に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記試行乗算の全ての結果が前記アタックスレッショルドの全てより低い第1スレッショルドより低いとき、前記リリース乗数の前記初期利得係数への適用を禁止する第5命令をさらに含むコンピュータで読み取り可能な媒体。
  65. 請求項57に記載の前記サンプリングされた信号を送信するシステムであって、請求項57に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備えるシステム。
  66. 請求項65に記載のシステムであって、ワイドエリアネットワーク内の任意のサーバプラットフォーム、ディジタルラジオ送信プラットフォーム、セルラー通信システム送信プラットフォーム、ケーブルテレビ送信プラットフォーム、および衛星テレビ送信プラットフォームを備えるシステム。
  67. 請求項57に記載の前記サンプリングされた信号を受け取るシステムであって、請求項57に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備えるシステム。
  68. 請求項67に記載のシステムであって、ワイドエリアネットワーク内の任意のクライアントプラットフォーム、ディジタルラジオレシーバ、携帯セルラー通信デバイス、ケーブルテレビデコーダ、および衛星テレビデコーダを備えるシステム。
  69. 請求項57に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備える携帯デバイス。
  70. 請求項69に記載の携帯デバイスであって、前記サンプリングされた信号はオーディオ信号を表し、前記携帯デバイスはディジタルオーディオプレーヤーを備える携帯デバイス。
  71. 請求項70に記載の携帯デバイスであって、前記ディジタルオーディオプレーヤーは、コンパクトディスクプレーヤーおよびMP3プレーヤーのいずれかを備える携帯デバイス。
  72. それぞれが複数のチャネルのうちの一つに対応する複数のサンプリングされた信号のための自動利得制御を実行するコンピュータによって実現される方法であって、それぞれのチャネルは、そこに関連付けられた初期利得係数およびアタックスレッショルドを有し、前記コンピュータによって実現される方法は、
    前記サンプリングされた信号のうちの少なくとも一部を周波数バンドについてフィルタリングすることによって、前記自動利得制御の感度を前記周波数バンドに対して操作すること、
    前記初期利得係数および前記対応するフィルタリングされた信号の試行乗算の結果が前記関連付けられたアタックスレッショルドを超えるとき、1より大きいリリース乗数を前記初期利得係数に適用することによって、第1の変更された利得係数を生成すること、
    前記試行乗算の結果が前記関連付けられたアタックスレッショルドを超えるとき、1より小さいアタック乗数を前記初期利得係数に適用することによって、第2の変更された利得係数を生成すること、および
    前記第1または第2の変更された利得係数のいずれかに対応する最終利得係数を前記複数のサンプリングされた信号に適用すること
    を含むコンピュータによって実現される方法。
  73. 請求項72に記載の前記コンピュータによって実現される方法を用いて生成された、利得制御されたサンプリングされた信号を表す、その中に記憶されたデータファイルを有するコンピュータで読み取り可能な媒体。
  74. 関連付けられた初期利得係数およびアタックスレッショルドを有するサンプリングされた信号のための自動利得制御を実行するその中に記憶されたコンピュータプログラム命令を有する少なくとも1つのコンピュータで読み取り可能な媒体であって、前記コンピュータプログラム命令は、
    前記初期利得係数および前記サンプリングされた信号の試行乗算の結果が前記アタックスレッショルドより下であるとき、1より大きいリリース乗数を前記初期利得係数に適用することによって、第1の変更された利得係数を生成する第1命令、
    前記試行乗算の結果が前記アタックスレッショルドを超えるとき、1より小さいアタック乗数を前記初期利得係数に適用することによって、第2の変更された利得係数を生成する第2命令、
    前記試行乗算の結果が前記アタックスレッショルドより小さい少なくとも1つのスレッショルドより小さいとき、前記リリース乗数の前記初期利得係数への適用を禁止する第3命令、および
    最終利得係数を前記サンプリングされた信号に適用する第4命令であって、前記最終利得係数は、前記初期利得係数、前記第1の変更された利得係数、または前記第2の変更された利得係数のうちのいずれかに対応する、第4命令、
    を含むコンピュータで読み取り可能な媒体。
  75. 請求項74に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記第3命令は、前記リリース乗数を減らすことによって前記リリース乗数の適用を禁止するよう動作可能であるコンピュータで読み取り可能な媒体。
  76. 請求項74に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記第3命令は、前記リリース乗数の適用を止めることによって前記リリース乗数の適用を禁止するよう動作可能であるコンピュータで読み取り可能な媒体。
  77. 請求項74に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、非線形利得関数を前記第1および第2の変更された利得係数のいずれかに適用することによって前記最終利得係数を生成する第5命令をさらに含むコンピュータで読み取り可能な媒体。
  78. 請求項74に記載のコンピュータで読み取り可能な媒体であって、前記サンプリングされた信号をバンドパスフィルタリングすることによって制御信号を生成する第5命令をさらに含み、前記第2および第3命令は、前記試行乗算を前記制御信号で実行するよう動作可能であるコンピュータで読み取り可能な媒体。
  79. 請求項74に記載の前記サンプリングされた信号を送信するシステムであって、請求項74に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備えるシステム。
  80. 請求項79に記載のシステムであって、ワイドエリアネットワーク内の任意のサーバプラットフォーム、ディジタルラジオ送信プラットフォーム、セルラー通信システム送信プラットフォーム、ケーブルテレビ送信プラットフォーム、および衛星テレビ送信プラットフォームを備えるシステム。
  81. 請求項74に記載の前記サンプリングされた信号を受け取るシステムであって、請求項74に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備えるシステム。
  82. 請求項81に記載のシステムであって、ワイドエリアネットワーク内の任意のクライアントプラットフォーム、ディジタルラジオレシーバ、携帯セルラー通信デバイス、ケーブルテレビデコーダ、および衛星テレビデコーダを備えるシステム。
  83. 請求項74に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備える携帯デバイス。
  84. 請求項83に記載の携帯デバイスであって、前記サンプリングされた信号はオーディオ信号を表し、前記携帯デバイスはディジタルオーディオプレーヤーを備える携帯デバイス。
  85. 請求項84に記載の携帯デバイスであって、前記ディジタルオーディオプレーヤーは、コンパクトディスクプレーヤーおよびMP3プレーヤーのいずれかを備える携帯デバイス。
  86. 関連付けられた初期利得係数およびアタックスレッショルドを有するサンプリングされた信号のための自動利得制御を実行するコンピュータによって実現される方法であって、
    前記初期利得係数および前記サンプリングされた信号の試行乗算の結果が前記アタックスレッショルドより下であるとき、1より大きいリリース乗数を前記初期利得係数に適用することによって、第1の変更された利得係数を生成すること、
    前記試行乗算の結果が前記アタックスレッショルドを超えるとき、1より小さいアタック乗数を前記初期利得係数に適用することによって、第2の変更された利得係数を生成すること、
    前記試行乗算の結果が前記アタックスレッショルドより小さい少なくとも1つのスレッショルドより小さいとき、前記リリース乗数の前記初期利得係数への適用を禁止すること、および
    最終利得係数を前記サンプリングされた信号に適用することであって、前記最終利得係数は、前記初期利得係数、前記第1の変更された利得係数、または前記第2の変更された利得係数のうちのいずれかに対応する、適用すること、
    を含むコンピュータによって実現される方法。
  87. 請求項86に記載の前記コンピュータによって実現される方法を用いて生成された、利得制御されたサンプリングされた信号を表す、その中に記憶されたデータファイルを有するコンピュータで読み取り可能な媒体。
  88. 複数のサンプリングされた信号の処理を実行するその中に記憶されたコンピュータプログラム命令を有する少なくとも1つのコンピュータで読み取り可能な媒体であって、前記サンプリングされた信号のうちの少なくとも1つはマスターバンドに対応し、前記サンプリングされた信号のうちの第1のものはサブウーファチャネルに対応し、前記コンピュータプログラム命令は、
    前記マスターバンドに対応する前記少なくとも1つのサンプリングされた信号をローパスフィルタリングすることによって、前記少なくとも1つのサンプリングされた信号に関連付けられたバス成分を含むフィルタリングされた信号を生成する第1命令、および
    前記フィルタリングされた信号および前記第1のサンプリングされた信号を混合することによって、バス強調されたサブウーファチャネルを生成する第2命令
    を含むコンピュータで読み取り可能な媒体。
  89. 請求項88に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記少なくとも1つのサンプリングされた信号は、複数のサンプリングされた信号に対応し、前記マスターバンドは複数のメインチャネルに対応し、複数のメインチャネルのそれぞれは前記複数のサンプリングされた信号のうちの一つに対応するコンピュータで読み取り可能な媒体。
  90. 請求項88に記載の少なくとも1つのコンピュータで読み取り可能な媒体であって、前記複数のメインチャネルは、センターチャネル、レフトフロントチャネル、ライトフロントチャネル、レフトサラウンドチャネル、およびライトサラウンドチャネルを備えるコンピュータで読み取り可能な媒体。
  91. 請求項88に記載の前記サンプリングされた信号を送信するシステムであって、請求項88に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備えるシステム。
  92. 請求項91に記載のシステムであって、ワイドエリアネットワーク内の任意のサーバプラットフォーム、ディジタルラジオ送信プラットフォーム、セルラー通信システム送信プラットフォーム、ケーブルテレビ送信プラットフォーム、および衛星テレビ送信プラットフォームを備えるシステム。
  93. 請求項88に記載の前記サンプリングされた信号を受け取るシステムであって、請求項88に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備えるシステム。
  94. 請求項93に記載のシステムであって、ワイドエリアネットワーク内の任意のクライアントプラットフォーム、ディジタルラジオレシーバ、携帯セルラー通信デバイス、ケーブルテレビデコーダ、および衛星テレビデコーダを備えるシステム。
  95. 請求項88に記載の前記少なくとも1つのコンピュータで読み取り可能な媒体を備える携帯デバイス。
  96. 請求項95に記載の携帯デバイスであって、前記サンプリングされた信号はオーディオ信号を表し、前記携帯デバイスはディジタルオーディオプレーヤーを備える携帯デバイス。
  97. 請求項96に記載の携帯デバイスであって、前記ディジタルオーディオプレーヤーは、コンパクトディスクプレーヤーおよびMP3プレーヤーのいずれかを備える携帯デバイス。
  98. 複数のサンプリングされた信号の処理を実行するコンピュータによって実現される方法であって、前記サンプリングされた信号のうちの少なくとも1つはマスターバンドに対応し、前記サンプリングされた信号のうちの第1のものはサブウーファチャネルに対応し、前記方法は、
    前記マスターバンドに対応する前記少なくとも1つのサンプリングされた信号をローパスフィルタリングすることによって、前記少なくとも1つのサンプリングされた信号に関連付けられたバス成分を含むフィルタリングされた信号を生成すること、および
    前記フィルタリングされた信号および前記第1のサンプリングされた信号を混合することによって、バス強調されたサブウーファチャネルを生成すること
    を含むコンピュータによって実現される方法。
  99. 請求項98に記載の前記コンピュータによって実現される方法を用いて生成された、前記バス強調されたサブウーファチャネルを表す、その中に記憶されたデータファイルを有するコンピュータで読み取り可能な媒体。
JP2004526116A 2002-08-06 2003-07-16 オーディオ明瞭度および了解度を改善するディジタル信号処理技術 Pending JP2005534980A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/214,944 US20030023429A1 (en) 2000-12-20 2002-08-06 Digital signal processing techniques for improving audio clarity and intelligibility
PCT/US2003/022240 WO2004013840A1 (en) 2002-08-06 2003-07-16 Digital signal processing techniques for improving audio clarity and intelligibility

Publications (2)

Publication Number Publication Date
JP2005534980A true JP2005534980A (ja) 2005-11-17
JP2005534980A5 JP2005534980A5 (ja) 2006-08-24

Family

ID=31494748

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004526116A Pending JP2005534980A (ja) 2002-08-06 2003-07-16 オーディオ明瞭度および了解度を改善するディジタル信号処理技術

Country Status (5)

Country Link
US (1) US20030023429A1 (ja)
EP (1) EP1552505A4 (ja)
JP (1) JP2005534980A (ja)
AU (1) AU2003256571A1 (ja)
WO (1) WO2004013840A1 (ja)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7072477B1 (en) * 2002-07-09 2006-07-04 Apple Computer, Inc. Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file
KR100841096B1 (ko) * 2002-10-14 2008-06-25 리얼네트웍스아시아퍼시픽 주식회사 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
DE10360511A1 (de) * 2003-12-22 2005-07-21 Eastern Asia Technology Ltd. Drahtloses Übertragungsgerät für Stereoanlagen mit Surround-Klangausgabe
JP4241443B2 (ja) * 2004-03-10 2009-03-18 ソニー株式会社 音声信号処理装置、音声信号処理方法
US8284955B2 (en) 2006-02-07 2012-10-09 Bongiovi Acoustics Llc System and method for digital signal processing
US10848118B2 (en) 2004-08-10 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US9281794B1 (en) 2004-08-10 2016-03-08 Bongiovi Acoustics Llc. System and method for digital signal processing
US10158337B2 (en) 2004-08-10 2018-12-18 Bongiovi Acoustics Llc System and method for digital signal processing
US9413321B2 (en) 2004-08-10 2016-08-09 Bongiovi Acoustics Llc System and method for digital signal processing
US11431312B2 (en) 2004-08-10 2022-08-30 Bongiovi Acoustics Llc System and method for digital signal processing
JP2006191316A (ja) * 2005-01-05 2006-07-20 Freescale Semiconductor Inc 音声信号処理装置
US7668848B2 (en) * 2005-12-07 2010-02-23 Motorola, Inc. Method and system for selectively decoding audio files in an electronic device
US9195433B2 (en) 2006-02-07 2015-11-24 Bongiovi Acoustics Llc In-line signal processor
US10848867B2 (en) 2006-02-07 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US10069471B2 (en) 2006-02-07 2018-09-04 Bongiovi Acoustics Llc System and method for digital signal processing
US10701505B2 (en) 2006-02-07 2020-06-30 Bongiovi Acoustics Llc. System, method, and apparatus for generating and digitally processing a head related audio transfer function
US9348904B2 (en) 2006-02-07 2016-05-24 Bongiovi Acoustics Llc. System and method for digital signal processing
US11202161B2 (en) 2006-02-07 2021-12-14 Bongiovi Acoustics Llc System, method, and apparatus for generating and digitally processing a head related audio transfer function
US9615189B2 (en) 2014-08-08 2017-04-04 Bongiovi Acoustics Llc Artificial ear apparatus and associated methods for generating a head related audio transfer function
US7873424B1 (en) 2006-04-13 2011-01-18 Honda Motor Co., Ltd. System and method for optimizing digital audio playback
EP2191467B1 (en) 2007-09-12 2011-06-22 Dolby Laboratories Licensing Corporation Speech enhancement
WO2009035613A1 (en) 2007-09-12 2009-03-19 Dolby Laboratories Licensing Corporation Speech enhancement with noise level estimation adjustment
EP2191466B1 (en) 2007-09-12 2013-05-22 Dolby Laboratories Licensing Corporation Speech enhancement with voice clarity
US8645144B2 (en) * 2008-04-24 2014-02-04 Broadcom Corporation Audio signal shaping for playback by audio devices
US8284957B2 (en) 2010-07-12 2012-10-09 Creative Technology Ltd Method and apparatus for stereo enhancement of an audio system
EP2714184B1 (en) * 2011-05-26 2017-05-10 Advanced Bionics AG Systems for improving representation by an auditory prosthesis system of audio signals having intermediate sound levels
DK2820863T3 (en) * 2011-12-22 2016-08-01 Widex As Method of operating a hearing aid and a hearing aid
JP5898534B2 (ja) * 2012-03-12 2016-04-06 クラリオン株式会社 音響信号処理装置および音響信号処理方法
US9344828B2 (en) 2012-12-21 2016-05-17 Bongiovi Acoustics Llc. System and method for digital signal processing
WO2014209434A1 (en) * 2013-02-15 2014-12-31 Max Sound Corporation Voice enhancement methods and systems
US20160065160A1 (en) * 2013-03-21 2016-03-03 Intellectual Discovery Co., Ltd. Terminal device and audio signal output method thereof
US9883318B2 (en) 2013-06-12 2018-01-30 Bongiovi Acoustics Llc System and method for stereo field enhancement in two-channel audio systems
US9398394B2 (en) 2013-06-12 2016-07-19 Bongiovi Acoustics Llc System and method for stereo field enhancement in two-channel audio systems
US9264004B2 (en) 2013-06-12 2016-02-16 Bongiovi Acoustics Llc System and method for narrow bandwidth digital signal processing
US9397629B2 (en) 2013-10-22 2016-07-19 Bongiovi Acoustics Llc System and method for digital signal processing
US9906858B2 (en) 2013-10-22 2018-02-27 Bongiovi Acoustics Llc System and method for digital signal processing
US10820883B2 (en) 2014-04-16 2020-11-03 Bongiovi Acoustics Llc Noise reduction assembly for auscultation of a body
US9615813B2 (en) 2014-04-16 2017-04-11 Bongiovi Acoustics Llc. Device for wide-band auscultation
US10639000B2 (en) 2014-04-16 2020-05-05 Bongiovi Acoustics Llc Device for wide-band auscultation
US9564146B2 (en) 2014-08-01 2017-02-07 Bongiovi Acoustics Llc System and method for digital signal processing in deep diving environment
US9638672B2 (en) 2015-03-06 2017-05-02 Bongiovi Acoustics Llc System and method for acquiring acoustic information from a resonating body
US9621994B1 (en) 2015-11-16 2017-04-11 Bongiovi Acoustics Llc Surface acoustic transducer
JP2018537910A (ja) 2015-11-16 2018-12-20 ボンジョビ アコースティックス リミテッド ライアビリティー カンパニー 表面音響変換器
US11245375B2 (en) 2017-01-04 2022-02-08 That Corporation System for configuration and status reporting of audio processing in TV sets
WO2018129143A1 (en) * 2017-01-04 2018-07-12 That Corporation Configurable multi-band compressor architecture with advanced surround processing
GB2561844A (en) * 2017-04-24 2018-10-31 Nokia Technologies Oy Spatial audio processing
KR20200143707A (ko) 2018-04-11 2020-12-24 본지오비 어커스틱스 엘엘씨 오디오 향상 청력 보호 시스템
US10911013B2 (en) 2018-07-05 2021-02-02 Comcast Cable Communications, Llc Dynamic audio normalization process
US10959035B2 (en) 2018-08-02 2021-03-23 Bongiovi Acoustics Llc System, method, and apparatus for generating and digitally processing a head related audio transfer function

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2628259C3 (de) * 1976-06-24 1978-11-30 Tevog Technische-Vertriebsorganisation Gmbh, 8000 Muenchen Gegensprechanlage
US4215431A (en) * 1978-10-12 1980-07-29 John Nady Wireless transmission system
US4243840A (en) * 1978-12-22 1981-01-06 Teledyne Industries, Inc. Loudspeaker system
US4460871A (en) * 1979-08-06 1984-07-17 Orban Associates, Inc. Multiband cross-coupled compressor with overshoot protection circuit
WO1985002085A1 (en) * 1983-10-25 1985-05-09 The Commonwealth Of Australia Hearing aid amplification method and apparatus
US4627098A (en) * 1984-01-04 1986-12-02 Motorola, Inc. Automatic gain control for a remote control system having symmetrical send/receive signaling circuits
US4704728A (en) * 1984-12-31 1987-11-03 Peter Scheiber Signal re-distribution, decoding and processing in accordance with amplitude, phase, and other characteristics
US4641361A (en) * 1985-04-10 1987-02-03 Harris Corporation Multi-band automatic gain control apparatus
US5177604A (en) * 1986-05-14 1993-01-05 Radio Telcom & Technology, Inc. Interactive television and data transmission system
US4901307A (en) * 1986-10-17 1990-02-13 Qualcomm, Inc. Spread spectrum multiple access communication system using satellite or terrestrial repeaters
US5303306A (en) * 1989-06-06 1994-04-12 Audioscience, Inc. Hearing aid with programmable remote and method of deriving settings for configuring the hearing aid
US5263019A (en) * 1991-01-04 1993-11-16 Picturetel Corporation Method and apparatus for estimating the level of acoustic feedback between a loudspeaker and microphone
US5305307A (en) * 1991-01-04 1994-04-19 Picturetel Corporation Adaptive acoustic echo canceller having means for reducing or eliminating echo in a plurality of signal bandwidths
US5365583A (en) * 1992-07-02 1994-11-15 Polycom, Inc. Method for fail-safe operation in a speaker phone system
US5473666A (en) * 1992-09-11 1995-12-05 Reliance Comm/Tec Corporation Method and apparatus for digitally controlling gain in a talking path
DE69424419T2 (de) * 1993-06-23 2001-01-04 Noise Cancellation Tech Aktive lärmunterdrückungsanordnung mit variabler verstärkung und verbesserter restlärmmessung
DE69428119T2 (de) * 1993-07-07 2002-03-21 Picturetel Corp Verringerung des hintergrundrauschens zur sprachverbesserung
US5664021A (en) * 1993-10-05 1997-09-02 Picturetel Corporation Microphone system for teleconferencing system
US5485515A (en) * 1993-12-29 1996-01-16 At&T Corp. Background noise compensation in a telephone network
DE4407032A1 (de) * 1994-03-03 1995-09-07 Sel Alcatel Ag Vorrichtung zur Sprachsignalverarbeitung
US5771301A (en) * 1994-09-15 1998-06-23 John D. Winslett Sound leveling system using output slope control
US5724340A (en) * 1995-02-02 1998-03-03 Unisys Corporation Apparatus and method for amplitude tracking
EP1134697B1 (en) * 1995-03-29 2007-02-14 Fuji Photo Film Co., Ltd. Image processing method and apparatus
US6097824A (en) * 1997-06-06 2000-08-01 Audiologic, Incorporated Continuous frequency dynamic range audio compressor
US6434246B1 (en) * 1995-10-10 2002-08-13 Gn Resound As Apparatus and methods for combining audio compression and feedback cancellation in a hearing aid
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5778082A (en) * 1996-06-14 1998-07-07 Picturetel Corporation Method and apparatus for localization of an acoustic source
US5832444A (en) * 1996-09-10 1998-11-03 Schmidt; Jon C. Apparatus for dynamic range compression of an audio signal
US6044162A (en) * 1996-12-20 2000-03-28 Sonic Innovations, Inc. Digital hearing aid using differential signal representations
US6038430A (en) * 1997-12-10 2000-03-14 3Com Corporation Method and apparatus for improving transmission of data in a wireless network
DE69712801T2 (de) * 1997-12-23 2002-11-07 Widex As Vaerloese Dynamische automatische verstärkungssteuerung in einem hörhilfegerät
US6038435A (en) * 1997-12-24 2000-03-14 Nortel Networks Corporation Variable step-size AGC
US6282176B1 (en) * 1998-03-20 2001-08-28 Cirrus Logic, Inc. Full-duplex speakerphone circuit including a supplementary echo suppressor
US6212273B1 (en) * 1998-03-20 2001-04-03 Crystal Semiconductor Corporation Full-duplex speakerphone circuit including a control interface
US6351731B1 (en) * 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6285767B1 (en) * 1998-09-04 2001-09-04 Srs Labs, Inc. Low-frequency audio enhancement system
AU761865B2 (en) * 1999-02-05 2003-06-12 Hearworks Pty Ltd Adaptive dynamic range optimisation sound processor
US6324509B1 (en) * 1999-02-08 2001-11-27 Qualcomm Incorporated Method and apparatus for accurate endpointing of speech in the presence of noise
US6381570B2 (en) * 1999-02-12 2002-04-30 Telogy Networks, Inc. Adaptive two-threshold method for discriminating noise from speech in a communication signal
DE19957128C1 (de) * 1999-11-26 2001-08-16 Siemens Audiologische Technik Verfahren zur Pegelbegrenzung in einem digitalen Hörhilfegerät sowie digitales Hörhilfegerät
EP1226578A4 (en) * 1999-12-31 2005-09-21 Octiv Inc TECHNIQUES TO IMPROVE THE CLARITY AND UNDERSTANDING OF AUDIO-REDUCED AUDIO SIGNALS IN A DIGITAL NETWORK
US6418303B1 (en) * 2000-02-29 2002-07-09 Motorola, Inc. Fast attack automatic gain control (AGC) loop and methodology for narrow band receivers
EP1391106B1 (en) * 2001-04-30 2014-02-26 Polycom, Inc. Audio conference platform with dynamic speech detection threshold
JP2002345097A (ja) * 2001-05-15 2002-11-29 Sony Corp サラウンド音場再生システム

Also Published As

Publication number Publication date
US20030023429A1 (en) 2003-01-30
AU2003256571A1 (en) 2004-02-23
WO2004013840A1 (en) 2004-02-12
EP1552505A4 (en) 2007-09-12
EP1552505A1 (en) 2005-07-13

Similar Documents

Publication Publication Date Title
JP2005534980A (ja) オーディオ明瞭度および了解度を改善するディジタル信号処理技術
US10276173B2 (en) Encoded audio extended metadata-based dynamic range control
KR101118922B1 (ko) 음향 가상 현실 엔진 및 전달 사운드 확장을 위한 향상된 기술들
US9576585B2 (en) Method and apparatus for normalized audio playback of media with and without embedded loudness metadata of new media devices
US9093968B2 (en) Sound reproducing apparatus, sound reproducing method, and recording medium
US9276542B2 (en) System and method for digital signal processing
JP5129888B2 (ja) トランスコード方法、トランスコーディングシステム及びセットトップボックス
FI105522B (fi) Järjestely kotiteatteri- tai muussa äänentoistolaitteistossa
EP4290888A2 (en) Encoded audio metadata-based equalization
CN110677804A (zh) 用于数字信号处理的系统和方法
US6940987B2 (en) Techniques for improving audio clarity and intelligibility at reduced bit rates over a digital network
EP3566472B1 (en) Configurable multi-band compressor architecture with advanced surround processing
EP3761672B1 (en) Using metadata to aggregate signal processing operations
KR101571197B1 (ko) 멀티채널 사운드 시스템에서의 멀티채널 프로세싱 방법
US20020075965A1 (en) Digital signal processing techniques for improving audio clarity and intelligibility
WO2002074013A2 (en) A method of modifying low frequency components of a digital audio signal
AU2003251403B2 (en) Acoustical virtual reality engine and advanced techniques for enhancing delivered sound

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060704

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100622