JP6104629B2

JP6104629B2 - ダイナミックサウンド提供システム及び方法

Info

Publication number: JP6104629B2
Application number: JP2013027425A
Authority: JP
Inventors: テンザー、ジョン・シー
Original assignee: ドルビーラボラトリーズライセンシングコーポレイション
Priority date: 2008-05-02
Filing date: 2013-02-15
Publication date: 2017-03-29
Anticipated expiration: 2029-05-01
Also published as: CN102016984B; EP2283484B1; KR20130115382A; ES2548977T3; JP2011523086A; KR20110002494A; CA2722883A1; US8085941B2; JP2013117734A; EP2283484A1; BRPI0911587B1; EP2283484A4; WO2009135192A1; MY151363A; AU2009242464A1; US20090274310A1; CA2722883C; KR101541452B1; CN102016984A; BRPI0911587A2

Description

本発明はオーディオ再生に関し、例えば、携帯電話やウォーキートーキーのような２方向通信システムに関する。

周囲ノイズ（ambient noise）は、しばしばオーディオ情報の配信を妨げる。例えば、２方向通信システムにおいて近端リスナーから離れた位置にいる遠端話者は、リスナーの位置における状況がわからないので、混乱を引き起こすノイズ事象の（突発的又は持続的な）発生を補償するための対策を取ることができない。例えば、話者がリスナーの居場所に車が通りすぎるのを知らずにいるため、リスナーが聞こえるように声を大きくすることができず、システムがそのような場合の補償が機械的にも電気的にもできるようになっていたとしても話者の話はリスナーに聞こえず理解できないかもしれない。このような状況で話者のスピーチがリスナーに聞き分けられないのは、遠端で再生したサウンド信号を大きなローカルのノイズが覆い隠す、すなわち、マスクするためである。この問題は、もちろん２方向通信システムに限ったことではなく、周囲ノイズは、記録済みの音声や保存されたオーディオ情報の再生も同様に妨害する。

ここに記載しているとおり、ダイナミックレンジ操作システムは、情報信号を提供するよう構成された第１の入力と、ノイズ指標信号を提供するよう構成された第２の入力と、この情報信号とノイズ指標信号を受け取り、この情報信号とノイズ信号中のパワーの測定〔決定〕に基づきゲイン制御された出力信号を生じさせるよう構成されたプロセッサとを有する。

さらに、ここに記載しているとおり、オーディオ再生装置は、情報信号を提供するよう構成された情報源と、再生駆動信号に従いオーディオ情報を演奏するよう構成されたラウドスピーカと、ラウドスピーカの位置での周囲ノイズに基づいてノイズ指標信号を提供するよう構成されたノイズ指標信号源としての再生駆動信号を生じさせるよう構成されたプロセッサとを有し、このプロセッサは、この情報信号とノイズ信号中のパワーの測定〔決定〕に基づき再生信号のゲイン制御を行う。

また、ここに記載しているのは、再生場所で周囲ノイズを補償するための方法である。この方法は、周囲ノイズを示す周囲ノイズを受け取るステップと、情報信号を受け取るステップと、この周囲ノイズ信号と情報信号中のパワーの関数として制御されるゲインである出力信号を生じさせる。

本明細書に組み込まれ本明細書の一部を形成する添付図は、実施形態の１つ以上の例を示すと共に、例示的な実施の形態の説明と併せて、実施形態の原理と実施例を説明する役割を果たす。
２人のユーザーが遠隔から相互に通信することを可能にする２方向オーディオ通信システム１００の線図である。図１Ａの通信システム１００の通信装置１０２のブロック線図である。ダイナミックサウンド提供システムのブロック線図である。図２のプロセッサ２０２（及び図１Ｂの制御装置１１０の）を構成することができる、ダイナミックレンジ操作システム３００のブロック線図である。標準的な短時間フーリエ変換（ＳＴＦＴ）処理に関するブロック線図である。ダイナミックレンジ操作処理のフロー線図である。図５の処理に組み込むために用いる処理モジュール又は処理回路のブロック線図である。種々の圧縮／伸長曲線のプロットである。サブ帯域の等ゲイン曲線である。ラウドスピーカ２０６を駆動するために用いられる再生信号の等レベル曲線である。

実施形態を、ダイナミックサウンド提供システム及び方法との関連で記載する。当業者であれば以下の説明は実例としてのみ記載したものであり、如何なる意味でも発明を限定するものではないことを理解するであろう。当業者であれば本願に開示された利点を有する他の実施形態を容易に思いつくであろう。図と共に示したような例示的な実施形態の実装についてこれから詳細に述べる。図面全体及び同じ又は同様の項目を参照する以下の説明全体に亘って可能な限り同じ参照符号を用いる。

分かりやすくするために、ここでは必ずしも実施の形態の所定の特徴のすべてを記載してはいない。当然のことながら、実際の実施に当たっては、アプリケーションに関する制約やビジネスに関する制約のような、開発者の具体的な目的を達成するために数多くの実際的な判断をしなければならないし、このような具体的な目的は、実施の形態毎にまた開発者毎に違ってくる。さらに、このような取り組みを続けることは複雑で時間のかかることであることは当然のことではあるが、本願で開示された利益を享受することとなる当業者にとって、通常のエンジニアリング業務となる。

本願によれば、以下に記載した構成要素、処理ステップ、及び／又はデータ構造は、種々のオペレーティングシステム、コンピュータプラットフォーム、コンピュータプログラム、及び／又は汎用機を用いて実施することができる。加えて、本願発明の技術分野における通常の知識を有するものは、ハードワイヤード装置、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡｓ）、特定用途向け集積回路（ＡＳＩＣｓ）、その他、のような汎用性のない装置でも、本明細書に記載した発明概念の範囲及び精神から離れることなく使用できることが分かるであろう。ここで一連の処理ステップからなる方法は、コンピュータ又は機械により実行され、これらの処理ステップは、その機械により読み取り可能な一連の命令として記憶され、これらの処理ステップは、コンピュータ記憶装置（例えばＲＯＭ（リードオンリーメモリ）、ＰＲＯＭ（プログラマブル・リードオンリーメモリ）、ＥＥＰＲＯＭ（エレクトリカリー・イリーザブル・プログラマブル・リードオンリーメモリ）、フラッシュメモリ、ジャンプドライブ、その他）、磁気記憶媒体（例えば、磁気テープ、磁気デスクドライブ、その他）、光学的記憶媒体（例えば、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ、紙カード、紙テープ、その他）、及び他の形式のメモリに記憶させることができる。

ここに記載した実施の形態は、デジタル信号処理を用いて実施したプロセスとして表現している。各処理ステップは、例えば、アナログ回路を代替的に用いて行うことができることが理解できるであろう。アナログでの実施の形態に用いるハードウェアは、デジタル領域での実施の形態におけるハードウェアとは異なるように見えるが、対応する各処理ステップでの基本的な特性は同等である。従って、ここに記載の処理は、アナログ領域又はデジタル領域のどちらでのハードウェア形態でも可能であるようにしている。

図１Ａは、２人のユーザーが遠隔から相互に通信することを可能にする２方向オーディオ通信システム１００の線図である。図１Ｂのブロック線図に詳細に示した通信装置１０２が各ユーザーに与えられる。各通信装置１０２は、マイクロフォン１０４、ラウドスピーカ１０６、トランシーバー１０８、及びプロセッサ又はコントローラ１１０を有する。第１の通信「回路」において、遠隔すなわち遠端位置のユーザーの声は、通信装置１０２のマイクロフォン１０４でピックアップされ、無線その他で伝送され、ローカルすなわち近端ユーザー位置の通信装置１０２のラウドスピーカ１０６で再生される。同様に、第２の通信「回路」において、ローカル又は近端ユーザー位置のユーザーの声は、近端通信装置１０２のマイクロフォン１０４でピックアップされ、遠隔すなわち遠端位置のラウドスピーカ１０６で再生される。

通信システム１００は、上述のとおり２つの通信「回路」をもっているので、２方向システムと考えられる。しかし、ここに記載した実施の形態は、通信「回路」個々に関するものであり、従って２方向システムに限定するものではないことを理解すべきである。むしろ、これは、ローカルすなわち近端ユーザーが遠隔ユーザーからのみ聞くことができ、遠隔ユーザーに話すことができないか、又はその逆となっているような、１方向システムにも適用することができる。もっと一般的には、ここに記載の実施の形態は、オーディオ情報源の状況又は位置にかかわらず、遠隔ユーザー又はオーディオ源を用いることなく、音楽、サウンド信号及び録音済みの音声のような、もっぱらオーディオ情報の再生又は実演のためのシステムに適用可能である。このようなシステムとして、例えば、ウォークマン、コンパクトディスクプレーヤー、ホームステレオ、テレビジョンセット、携帯情報端末（ＰＤＡ）その他の、ポータブル及びポータブルでないオーディオシステムがある。このようなシステムにおいて、２方向通信システム１００とは異なり、再生は必ずしも実時間に反映する必要はなく、すなわち、オーディオ情報は、必ずしもそれが作られたときと同時に演奏する必要はない。

図１Ｂに戻って、本例においてトランシーバー１０８が伝送しようとする情報は、ユーザーの音声のようなサウンド信号であり、マイクロフォン１０４でピックアップされ、電気信号に変換されて、直接又は図示したコントローラ１１０を経由してトランシーバーに送られるものである。コントローラ１１０を経由するとき、ピックアップした情報は、特定のアプリケーション及び／又はプロトコルに従い伝送に適した形式にパッケージ化され通信システム１００の装置１０２間で監視することができるようにする。多くの変換方法が考えられるこのパッケージ化に続いて、情報は伝送のためにトランシーバー１０８に送られる。逆に、トランシーバー１０８は受け取った情報を、無線その他の方法により、「アンパッケージ」するためにコントローラ１１０に送り、以下に説明するように、情報をラウドスピーカ１０６により再生しているあいだ聴覚的な形式に変換されているときに、聴取しているユーザーが浸っている環境のノイズの如何にかかわらず聴取可能なように、又は可能な限りもとのメッセージ又は特徴を持続するように、処理し操作する。

トランシーバー１０８は、情報の伝送及び／又は情報の受信を行うよう構成されており、単一部品の形状とすることができる。代替的に、これらの２つの機能のそれぞれに専用の別々の部品を用いることもできる。伝送は、例えば変調した無線信号により無線で、又は通常のケーブルを用いて有線で、又はファイバーを用いて光通信で、又は見通し線により行うことができる。

図１Ａ及び１Ｂの例では、遠端話者は近端リスナーから遠い位置にいるため、話者はリスナーの位置におけるノイズ状況がわからず、話者はリスナー位置でのノイズに気付かないので、リスナー位置から遠くはなれた、混乱を引き起こす（突発的又は持続的な）ノイズ事象を補償するための対策を取らないであろう。簡単な例をあげると、話者は、リスナー位置で車が通るのに気付かず、リスナーが聞こえるようにするために声を大きくすることはしないであろうし、システムが電気的又は機械的にそのような補償が可能であったとしても、話者の言葉はリスナーに聞こえないか又は理解できないかもしれない。このような状況で話者のスピーチをリスナーが聞き分けることができないのは、「マスキング」というよく知られた心理的現象によるものであり、その場所のノイズが大きいとき、再生した遠端サウンド信号を覆い隠す、すなわち、マスクすることによるものである。それにもかかわらず、以下に記載のとおり、コントローラ１１０は、混乱を引き起こすオーディオ事象を認識させることができ、必要に応じて、他の構成要素を付加して、それを補償又はその影響を最小限にするするために必要な対策を取るようにすることができる。

先に説明したとおり、２方向通信システムについての説明であるが、これに限定するものではなく、音楽、サウンド信号、及び録音済みの音声のようなオーディオ情報の再生をもっぱら行うシステムのアプリケーションも、オーディオ情報源の状態や特性、実時間その他を問わず、考慮するものである。図２はこのような一般化したアプリケーションを示し、そして、ダイナミックサウンド提供システム２００において、プロセッサ２０２は、オーディオ情報源２０４が提供したオーディオ情報を操作し、情報を操り、必要な手段を用いて、ユーザーの前に演奏又は再生させるためのラウドスピーカに駆動信号又は生成信号の出力の形で提供する前に、損なわれたリスニング環境の状況を補償する。システム２００において、再生場所における周囲オーディオノイズの表示又は重みは、オーディオノイズインジケータ２０８で生成される。このような場合において、再生システムは、まだマイクロフォンが利用可能となっていなければ、マイクロフォンを装備しても良い。操作及び補償を実時間でおこない、連続的又は離散的な瞬時サンプリングの形式のどちらにすることもできる。ノイズの表示又は重みは、ここでは周囲ノイズ指標又はノイズ指標と称し、プロセッサ２０２に送られ、そこで、情報源２０４からの情報信号と共にこの表示を用いて、再生時に必要な補償をおこなう。

ノイズ指標を導き出すことのできるインジケータ２０８は、マイクロフォン、又はマイクロフォンの配列（例えば図１Ｂのマイクロフォン１０４）とすることができ、再生場所での周囲ノイズを検出するために用いられる。代替的に（又は付加的に）、ノイズ指標は、同一目的又は関連する目的で、又は全く違う目的で、このシステム中の、又は接続されているシステム中の他の場所で実行する補助的な演算〔補助的な処理動作〕により導き出すこともできる。例えば、２方向システムにおいて、周囲ノイズが存在する状況でオーディオ信号出力を強調するために近端で用いられるノイズ低減アルゴリズムから、このノイズ指標を導き出すこともできる。周囲ノイズはこのような種々のノイズ低減アルゴリズムにより測定することができ、この測定結果をダイナミックサウンド提供システム２００に必要なノイズ指標を提供し、サウンドの再生改善のために用いることができる。出力するオーディオ信号のためのノイズ低減アルゴリズムにおいて、しばしば、ノイズの多い出力信号に乗算する１組の減衰値を生成するために、複数帯域手法を用いる。減衰値は「０」と「１」の間の数値とすることができる。ノイズの多い出力信号に適用するときに、ほとんどがノイズであるか又はノイズのみであるとみなされるノイズ信号部分を減衰させる一方、必要とされる信号とみなされる部分を減衰させないか又は減衰の程度を低くすることによりノイズを低減させる役割を果たす。ダイナミックサウンド提供システム２００は、各減衰値を「１」から減算することによりノイズ指標を得ることができる。ダイナミックサウンド提供システム２００は、このように導き出した「反減衰」値を元のノイズの多い信号に適用し、それによりノイズインジケータ２０８からノイズ指標を導き出す。さらに、１つの変化形態において、以下に詳細説明するように、１）パワーのパーセントを表すように２乗する、２）帯域毎に非ノイズのパワーのトータルパーセント指標を得るために各周波数帯域で得られた数値を合計する、３）各帯域中の元のノイズのある信号のトータルパワーを計算する、及び４）各帯域のノイズのみのパワー指標を得るために、１００％から非ノイズパワーパーセンテージを減算したものとなる、ノイズパーセンテージにトータルパワーを乗算することにより、減衰値自身を用いることが望ましい。

さらなる詳細を以下に説明するように、図２のダイナミックサウンド提供システム２００は、近端のノイズの多い環境で再生される信号のダイナミックレンジを調整するために圧縮を用いる、複数帯域ダイナミックレンジプロセッサとして動作するよう構成される。ダイナミックサウンド提供システム２００は、ラウドスピーカ２０６を駆動するために用いる出力再生信号に選択的ゲインコントロールを適用し、このゲインコントロールは、情報源２０４からのオーディオ情報とノイズインジケータ２０８からの周囲ノイズ状態（ノイズ指標）の両方の関数である。個々の環境に応じて、駆動信号出力は圧縮を受けないよう、さらに、下方伸長も受けないようにすることができる。

図３は、図２のプロセッサ２０２の（及び図１Ｂのコントローラ１１０の）一部を構成するダイナミックレンジ操作システム３００のブロック線図である。プロセッサ２０２は、以下に記載するものとは異なる機能を有する処理回路又は処理モジュールを含むことができる。先に説明したように、ダイナミックレンジ操作システム３００で行われる処理は、単一帯域処理又は複数帯域処理として実行することができるが、図３の例は複数帯域での方法に関する。ここで、複数帯域処理の各帯域はサブ帯域と称し、実施の形態の例では２つのサブ帯域処理がある状況で説明するが、これに限定することを意図するものではない。実施の形態の例では、２つのサブ帯域間のカットオフとして約１ｋＨｚを選択する。１ｋＨｚ以下のオーディオ信号は一般にスピーチ音量と称されるスピーチの母音を含有するが、１ｋＨｚ以上の部分は一般にもっと情報の豊富な子音を含有する。具体的には、例示としてのみであるが、下方のサブ帯域は、約５０Ｈｚから約１ｋＨｚまで広がり、上方のサブ帯域は、約１ｋＨｚから約３．５ｋＨｚまで広がっている。２つのサブ帯域の例において、信号処理モジュール３０６は、下方のサブ帯域ダイナミックレンジ操作プロセスをもたらし、信号処理モジュール３０８は、上方のサブ帯域ダイナミックレンジ操作プロセスをもたらす。単一帯域での実施の形態では、信号処理モジュール３０６のみを必要とし、これが必要とするスペクトル全体を含むように構成される一方、多数サブ帯域での実施の形態では、図３で破線で示した信号処理モジュールで表したように、追加の信号処理モジュールを必要とする。

ダイナミックレンジ操作システム３００は、このシステムの第１の入力３０１においてオーディオノイズインジケータ信号を受け取り、この信号を第１の周波数分解モジュール３０２に送り、そこでノイズインジケータ信号を周波数ビン又は周波数帯域に分解する。先に説明したようにオーディオノイズインジケータ信号は再生場所での周囲ノイズを表示する。ダイナミックレンジ操作システム３００は、第２の入力としてオーディオ情報信号を受け取り、この信号を第２の周波数分解モジュール３０４に送る。周波数分解モジュール３０４は、このオーディオ情報信号も同様に周波数ビン又は周波数帯域に分解する。

図１Ａ及び図１Ｂの２方向通信システムにおいて、オーディオ情報信号は、遠端位置で通信装置１０２のマイクロフォン１０４によりピックアップされた、遠方の遠端位置の話者の声を表し、そこで再生される近端通信装置１０２へ転送される。もっと一般的に言えば、しかしながら、オーディオ情報は、図２に示した情報源２０４からのものであり、例えば、記録した音楽であり、記録済みの声であり、その類のものであり、必ずしも実時間で再生されるものに限られない。

２つのサブ帯域の実施形態の例では、周波数分解モジュール３０２及び３０４はそれぞれ一般的な短時間フーリエ変換（ＳＴＦＴ）処理を、入力３０１及び３０３からのそれぞれの入力信号に適用する。この処理を図４の線図４００を参照して説明する。信号の時間サンプルを採取し（４０２）、窓処理された（４０６）フレームに分割する（窓化技術は乗算を用いることが公知である）。ゼロパディングを行い（４０８）、時間データをパディングしたフレームを、この例では高速フーリエ変換（ＦＦＴ）を用いて周波数領域に変換する（４１０）。他の使用可能な変換方法として、ハートレ変換、ウェーブレット変換、その他がある。例示の方法により、１６ビットワードでサンプリングレートが８ｋｓｐｓ（キロサンプル毎秒）で、完全再構成オーディオ窓で窓処理され、結果として作られたものの周波数分解能を上げるために５１２サンプルにパッドしたものを用いる。合計２５７の周波数「ビン」（ナイキスト周波数とＤＣハーフビンとを含む）をこのようにして取得する。５６サンプルの前のフレームを第２の演算毎に１４３フレームを送るために用いられる。このようにして、毎秒１４３回のサブサンプルレートで制御処理をおこない、スピーチ変換レート及び聴取変換レート（約３０Ｈｚ）より十分高いが、計算パワーを節約するため生のサンプリングレート８ｋｓｐｓより低いレートで処理をおこなう。

周波数領域の実施形態例において、周波数ビンはグループ又はサブ帯域に組み立てられる。本例では、１ｋＨｚから３．５ｋＨｚ迄のビンのグループが１つのサブ帯域（上位サブ帯域）を形成し、５０Ｈｚから１ｋＨｚ迄のビンのグループが別の、第２のサブ帯域（下位サブ帯域）を形成する。このようにして、それぞれオーディオノイズインジケータ信号と情報信号を表す周波数領域を構成する２つのセットのビンがそれぞれ２つのビンのグループ、すなわち２つのサブ帯域に分割され、ノイズインジケータ信号及びオーディオ情報信号のそれぞれについて高サブ帯域と低サブ帯域とが作られる。

上述の実施形態は、周波数領域にて実行される。しかし、代替的な時間領域での実施形態では、周波数分解がバンドパスフィルタにより有効になる。２つのサブ帯域の例では、２つのバンドパスフィルタが２セットあり、それぞれのセットは、下位サブ帯域に関連する範囲の周波数範囲を通過する１つのバンドパスフィルタと、上位サブ帯域に関連する範囲の周波数範囲を通過する１つのバンドパスフィルタとを具備する。２つのバンドパスフィルタのセットのうちの１つは、ノイズインジケータ信号と関連付けられ、バンドパスフィルタのセットのうちの１つは、オーディオ情報信号と関連付けられる。従って、この実施形態の例では、４つのバンドパスフィルタが周波数分解処理を行う。

ダイナミックレンジ操作制御信号は、処理のフロー線図を示した図５と、この実施形態に用いる処理モジュール又は処理回路を示した図６を参照して説明するように、サブプロセッサ３０６，３０８により作り出される。データの各フレームに対して、図５に示す処理が各サブ帯域〔サブバンド〕に対して行われる。下位サブ帯域及び上位サブ帯域の各々に対して、対応するサブプロセッサ３０６，３０８は、ラウドスピーカ２０６（図２）へ出力する再生駆動信号に適用するゲイン制御の基本となるフレームパワーの算定をおこなう。ノイズ信号及び情報信号をそれぞれ算定するフレームパワーを導き出すために、各信号の各周波数ビンの強度値を２乗し、サブ帯域のすべてのビンからの結果をそのサブ帯域の周波数範囲全体にわたって加算する。これについて、図５の５０１及び５０１’に、及び図６の６０１及び６０１’に示す。強度〔大きさ〕（magnitude）値の２乗を実行してビンパワー値を形成する、６０１及び６０１’中の２乗回路又はモジュール、例えば６０１ａ（図６）、及び、６０１及び６０１’の加算回路又は加算モジュール、例えば、各信号のそれぞれのサブ帯域内のビンパワー値の積算を行う６０１ｂ（図６）により、各フレームパワーの算定を行う。結果得られたビンのパワーの総和値は、対数変換器６０３，６０３’（図６）によりビンのパワーの総和の対数値となり、各フレームにトータル４つのフレームパワー値、すなわち、１つは、下位サブ帯域中のノイズ信号に関連し、１つは、下位サブ帯域中の情報信号に関連し、１つは、上位サブ帯域中のノイズ信号に関連し、１つは、上位サブ帯域中の情報信号に関連するフレームパワー値をもたらす。当然ながら、２乗計算はパワー決定の多くの方法のうちの１つであり、他の方法も考慮に入れることができる。簡単な例では、下位サブ帯域において、ビン番号３からビン番号６４まで、ノイズの下位サブ帯域のフレームパワー値も含めて、個々のビンパワー値の総和を処理し、情報の下位サブ帯域のフレームパワー値の総和を処理も行う。上位サブ帯域では、ビン番号６５からビン番号２２４まで、ノイズの上位サブ帯域のフレームパワー値及び情報の上位サブ帯域のフレームパワー値も含めて、個々のビンパワー値の総和を処理する。次いで、その結果は、必要に応じて、図６の６０４，６０４’に示すように、また各サブ帯域や各信号に対して異なることのある、正規化値、例えば１０で乗算することで正規化される。

このようにして得られたフレームパワー値は、特にノイズフレームパワー値に対してフレーム毎に自然に変化し、この可変性を減少させることが好ましい。従って、結果として得られた４つのフレームパワー値のストリームは、フレームパワー値をトラックする平滑フィルター６０５及び６０５’を通過する。この平滑化は対数領域で行われるのが好ましく、従って、４つのストリームを、上述のとおりまず対数パワー値に変換する。平滑化は図５の５０５及び５０５’で示し、一般に平滑化処理は、図６のローパス平滑化フィルター６０５及び６０５’により行われる。どのようなローパスフィルターでも適用可能であるが、この例では、以下の式で表されるフィルターを用いる。

ここでＰ_ｉは、現在のフレーム、信号及びサブ帯域についてのトラックされるパワーであり、Ｐ_ｉ−１は、先のフレームについてのトラックされるパワーであり、α及びβはフィルター係数であり、Ｓ_ｉは、現在のフレーム、信号及びサブ帯域でのパワーの積算値であり、ｉはフレームの指標である。この例では、α＝０．８３（一般的な値は、約０．５から約０．９５である）及びβ＝０．１３４（一般的な値は、約０．０１から約０．５である）を用いる。

ノイズフレームパワー値が情報フレームパワー値よりも変化幅が大きく、「ポンピング」サウンド特性が圧縮システムの最終出力に持ち込まれることを防ぐためにゆっくりとして応答が必要となるため、２つのサブ帯域ノイズフレームパワー値には、トラッキングフィルター６０７を再度適用することにより（５０７）さらなる平滑化を行う（ローパスフィルターであればどのようなフィルターでもこの機能に適用することができる）。例示した２つのサブ帯域システムにおいて、平滑化は以下の式で表すことができる。

ここでＮ_ｉは、現在のフレーム及びサブ帯域についての平滑化されトラックされるノイズパワーであり、Ｎ_ｉ−１は、先のフレームについての平滑化されトラックされるノイズパワーであり、δはフィルター平滑化係数である。例として数値δ＝０．４を用いた（一般に数値範囲は約０．１から約０．８である）。

ここに記載の実施形態において、平滑化フィルター６０５及び６０５’は、同じ特性を持ち、ＤＳＰ（デジタル信号プロセッサ）コードとして実施される場合、付加的なトラッキングフィルター６０７により出来るノイズ成分のために用いられるトラッキングフィルターと共に、同じコードを両方のフィルターに用いることができる。代替的に、平滑化フィルター６０５とトラッキングフィルター６０７とを結合して１つのフィルターとすることができ、フィルター６０５’より大きな時定数を持つ。

平滑化されトラッキングされたノイズパワーから、下式により各サブ帯域について圧縮ニー（compression knee）の値が計算される（５０９，６０９）。

ここで、Ｋ_ｉは、現在のフレームでの圧縮ニーの値であり、μはオフセット係数である。μの値はμ＝−１．２を用いた。

圧縮ニーの値の有意性について、実線で単一のゲイン／ゼロ圧縮曲線を示し、約５２ｄＢで示した閾値で分離したダウンワード伸長及びマイルド圧縮を破線で示し、ダウンワード伸長及びストロング圧縮を一点鎖線で示した、図７Ａの曲線を参照して説明する。３つの各「圧縮」曲線は、異なるローカルノイズレベルにおける応答を表し、実線は低い６０ｄＢ近端ノイズレベル、破線はそれより大きな７５ｄＢ近端ノイズレベル、そして、一点鎖線は大きな９０ｄＢ近端ノイズレベルを表す。関連するノイズレベルそのものは、水平線で表され、実線のノイズ直線は実線の「圧縮」曲線を表す、等、である。圧縮曲線の、それぞれ対応するノイズレベル直線より上の部分は、より正確には対応するノイズレベル直線より約５ｄＢ低いレベルより上の部分は、普通の聴覚を持った近端リスナーに実際に聞こえる部分を表す。すなわち、約−５ｄＢの信号対ノイズ比（ＳＮＲ）より上のスピーチを理解できることが知られている。

図７Ａのプロットにおいて、３つの「圧縮」曲線について、対応するノイズはそれぞれ異なり、圧縮量はそれぞれ異なる一方、それぞれの近端ノイズに基づいて各「圧縮」曲線の聞こえる範囲にある部分は３つの曲線すべてで類似している。言い換えれば、近端の周囲ノイズに応じて圧縮パラメータを自動的に調整する制御処理を用いることにより、再生駆動信号のダイナミックレンジを調整することができ、人の一般的な静かなダイナミックレンジで生じた信号を、近端ノイズマスキングレベルを越える可聴な領域を表すダイナミックレンジに圧縮するように、ローカルノイズが増えるにつれて小さなダイナミックレンジに信号を圧縮する。プロット中の絶対値レベルは例示であるが、通信システムに適用可能な適切なレベルの表現を構成している。この例におけるプロットでは、座標軸は等価な音響ｄＢＳＰＬで縮尺している。従って、入力信号軸は、例えば２方向通信システムにおいてユーザーが遠端話者から直接聞くことができたとしたらユーザーの耳に入ったと考えられる遠端信号の音響レベルと等価な表現となり、出力信号軸は、サウンドを出力するスピーカの実際の音響レベルを表し、ノイズ信号軸は、ローカルノイズの実際の音響レベルを表す。

この圧縮ニー値は、平滑化信号パワーと共に、圧縮ゲイン（又は減衰ゲイン）を作るために、５１１及び６１１で用いられ、続いて、入力情報信号の各サブ帯域に適用されラウドスピーカ２０６（図２）を駆動するために用いられる。圧縮ゲインは、以下のように定義される。

ここでＧ_ｉは、現在のフレーム及びサブ帯域での対数形式で表現した圧縮ゲインであり、ηは及びμは圧縮ゲインパラメータである。この例では、η＝０．４（一般に数値範囲は約０．１から約２の範囲である）、μ＝１０（一般に数値範囲は約１から約１００である）を用いた。この式の結果は図７Ｂに示すようなゲイン曲線となり、図７Ｂにおいて、式（４）から得られたゲインは１０を乗算することにより図示目的でｄＢに変換している。

所定の時刻において、所定のサブ帯域について、式（４）は、圧縮曲線を示し、圧縮ニー値は単一の変数である。この式の演算は、パラメータが、静寂時の最低等価可聴ＳＰＬを表す最低入力信号レベルと、最大音響ＳＰＬを表す最大信号レベルと、リスナーがノイズの中にいるときに可聴性を保持させるような最小の音響ＳＰＬを表す圧縮ニー閾値レベルを定める。図７Ａの曲線で示した例示的な実施形態について、最低等価入力音圧レベルを上記のパラメータ値により約２０ｄＢに設定する。図にプロットした部分の左側のこの点において、２０ｄＢＳＰＬの等価入力信号レベルは、３つの圧縮曲線が図の左側で交わるポイントとなる、２０ｄＢＳＰＬの等価出力信号レベルを生じさせる。さらに、図７Ａの曲線で示した例示的な実施形態について、最大等価入力音圧レベルを上記のパラメータ値により約１１０ｄＢに設定する。図にプロットした部分の右側のこの最大値の点で、１１０ｄＢＳＰＬの等価入力信号レベルは、１１０ｄＢＳＰＬの等価出力信号レベルを生じさせる。これは３つの圧縮曲線が図の右側で交わる点として図示される。第３に、さらに、図７Ａの曲線で示した例示的な実施形態について、圧縮ニー閾値レベル（圧縮がその値以上で生じる入力信号のレベル）を上記のパラメータ値により約５２ｄＢに設定する。この入力信号レベルで、圧縮ニー（ゲイン）値が信号に適用される。従って、圧縮曲線の入力信号レベル点での高さは、両方とも対数項（ｄＢ）で表したときの入力信号レベルと圧縮ニー値とを合計したものに等しくなる。

この単一値圧縮制御を理解するには、最大と最小の点が実質的に固定されており出力レベルがこの２つの点で入力レベルと同じであることを知ることが１つの方法である。このように理解することにより、ラバーバンド（ｒｕｂｂｅｒｂａｎｄ）をこの２つの点に広げ、圧縮ニー閾値レベルの位置で圧縮ニー値に等しい量だけこのラバーバンドを引き上げて圧縮ニー値を適用したとすると、ラバーバンドは圧縮曲線、すなわち図７Ａに示したような曲線になる。このようにして、式（４）を適用することにより、単一の圧縮ニー値が圧縮曲線全体を決定する。

この圧縮制御方法の特徴は、圧縮ニー閾値の左側の領域の圧縮曲線の傾きが明らかに急勾配となるようにした、下方延長である（図７Ａ）。対象となる入力信号の予測最低レベルのすぐ下にこの閾値を選定することにより、入力信号中に含まれる低ノイズ成分を増幅しすぎることを防止するだけでなく、このような好ましくない成分を抑制することができる。

式（４）の圧縮ゲインを定めた後、以下のように圧縮ゲインＧ_ｉを線形形式に変換する。

ここでＧｆ_ｉは、現在のフレーム及び信号サブ帯域での線形ゲインである。従って、この例示の実施形態を式（５）で示したように、式（４）で得た数値を「２」で割り、その指数で１０を累乗して線形ゲイン係数を求めることにより、圧縮ゲインを対数領域から線形領域に変換する。これは、図６の逆対数変換及び伸長器６１３の部分で行われ、図５の５１３に示されている。これにより、各サブ帯域について１つの線形ゲイン係数が作られる。

この点で、データの各フレームに対応する２つのサブ帯域の線形ゲイン係数がある。これらのゲイン係数は、各サブ帯域中のすべてのビンと関連付けた各ビン番号に適切な線形ゲイン係数を割り付けることにより２５７の別のビンゲイン係数に引き延ばされる（図５の５１３及び図６の６１３）。ゼロの値はどのサブ帯域でもなくこのビンに割り付けられる。隣り合うサブ帯域は通常異なる線形ゲイン係数を有するので、周波数平滑化を適用しない場合、隣り合うサブ帯域間にまたがるゲインに１つのステップを適用することがあり、これにより可聴な信号に歪みを生じることがある。圧縮ゲインを変換して線形領域に戻し、別のビンにゲイン係数を伸長させた後、周波数ビンをまたいでゲイン係数を適用することができる（図５の５１５）。図６の畳み込み演算／スプライン補間６１５として示されるような平滑化を随意的に適用することができる。例えば表６１４から読み込むことができ、或いは、等式から計算することができ、或いは、他の方法で計算等することができる、カーネルとして知られる、１セットの徐々に小さくなる値を用いることにより、この畳み込み演算／スプライン補間６１５は、平滑化カーネルとゲイン係数とを畳み込むことにより、隣接するサブ帯域間での変わり目でのビンゲイン値を平滑化する。あるいは、スプラインとして知られるショートカーネルをビンゲイン係数で乗算して境界をまたいで係数を平滑化する。周波数をまたいで平滑化する他の方法は当業者によく知られており、そのようなどの方法も考えられる。平滑化処理により、各周波数ビンに関連付けられた１セットのビン圧縮ゲインを生成する。結果として生じたビン圧縮ゲインは、５１７，６１７で各ビンをそれぞれのビン圧縮ゲインで乗算することにより、情報信号に適用する。その結果生じた各サブ帯域について処理された出力信号を図５の５１９及び図６の６１９に示す。

ビン圧縮ゲインを適用した後、結果として生じた減衰した周波数マルチ帯域信号５１９，６１９は、周知の逆ＳＴＦＴ重複加算処理により結合される。これは、図３の信号再構成ブロック３１０として示される。再構成の結果は、３１２で、圧縮した全帯域出力信号となり、ラウドスピーカ２０６（図２）を駆動するのに用いる出力信号となる。代替的に、例示的な時間領域での実施形態では、サブ帯域信号で制限した各帯域が、５１７，６１７にて、それぞれのサブ帯域線形ゲイン係数で乗算され、各サブ帯域に対して複数の処理された出力信号が、再構成ステップ又は再構成回路３１０で加算され、３１２で、圧縮した全帯域出力信号となり、ラウドスピーカ２０６（図２）を駆動するのに用いる出力信号となる。

図７Ｂにプロットしたゲイン曲線は、サブ帯域に対するゲインを示す。図７Ｂにプロットしたゲイン曲線において、縦軸はラウドスピーカ２０６を駆動するのに用いる再生情報信号のサブ帯域に関連させて適用されるゲインを示す。これは、インジケータ２０８からのローカル（近端）周囲ノイズ入力のレベルと情報源２０４からの情報信号入力の瞬時レベルの両方の関数と見ることができる。図７Ｃは、ラウドスピーカ２０６を駆動するのに用いる再生信号のレベルの曲線であり、インジケータ２０８からのローカル（近端）周囲ノイズ入力のレベルと情報源２０４からの情報信号入力の瞬時レベルの両方の関数として示されている。

ノイズ信号と情報信号の両方を処理するときに、信号の大きさではなく信号のパワーを用いることに留意すべきである。信号のパワーを用いることにより、処理された出力信号を求めるために必要な計算能力が最小化される。しかしながら、代替的に信号の大きさを使うこともでき、そのような演算も考えることができる。また、線形領域ではなく対数領域におけるフィルターで平滑化を行い、これにより、線形領域でフィルターした場合と顕著に異なる、対数平均値の周囲に対数的なシンメトリーを得ることができる。人の音量に対する感覚は、対数特性に従うことが知られているので、線形領域での処理とは異なり、この処理は非常に自然な音響的結果をもたらす。しかしながら、これらの特性に限定するものではなく、他の非線形による代替案のみならず線形処理によるものも考えられる。

ここに説明したように、上記構成により達成される利点は、圧縮ニー値（圧縮閾値で適用されるゲインの数値）の制御により圧縮を制御することである。言い換えれば、出力信号レベルを、最大ｓｐｌ（例えば、９０〜１２０の範囲での１１０ｄｂｓｐｌ）及び最小ｓｐｌ（例えば、１０〜４０の範囲での２０ｄｂｓｐｌ）での入力信号レベル（ゲイン＝１）に保持することができる。次いで、圧縮ニー閾値（例えば、４０〜７５の範囲での５２ｄｂｓｐｌ）を計算する。この圧縮ニー閾値は、入力信号が圧縮ニー閾値を通り越して増大するとき、下位方向からの圧縮への移行が起こる入力信号のレベルである。近端ノイズの関数として圧縮閾値で適用されるゲイン（圧縮ニー値）が定められ、圧縮ニー値に基づく圧縮／伸長が導き出される。圧縮曲線上の他のすべての点は、これらの３つの点の間を線形補間することにより簡単に求める（図７Ａ参照）。このようにしてどのフレーム及びどの帯域に適用したゲインでも入力信号の強さ及び圧縮／伸長曲線の関数となり、圧縮／伸長曲線はそれ自身が近端ノイズレベルの関数となる。このようにして、適用されたゲインは、遠端信号の強さと近端ノイズの強さの両方により制御される。この方法で計算する必要があるのは１つの数値だけであり、この１つの数値は（フレーム毎、サブ帯域毎に）全体の圧縮／伸長曲線で定めることができることを意味する。

従って、当然ながらパワーの測定自身は最優先事項ではない。より重要なのは、すべきことは、「輪郭」又は記憶を必要としない簡単な計算であり、遠端信号レベル及び近端ノイズレベルの両方に応答可能な適切な圧縮／伸長もたらす、簡単な計算である。

実施形態及び応用例を示し説明したが、この明細書の助けを得た当業者には、個々に記載した発明の概念から逸脱することなしに、上記のものに修正を加えることができることは明らかである。例えば、信号のパワーのトラッキングは、ノイズであろうと情報であろうと、本質的にエンベロープの形状の検出であり、どのような形式のエンベロープ検出（又は、エンベロープ追従／追従装置）は、本発明の範囲内である。従って、本発明は添付した特許請求の範囲以外では限定されることはない。

いくつかの態様を記載しておく。
〔態様１〕
ダイナミックレンジ操作システムであって、
情報信号を提供するよう構成された第１の入力と、
ノイズ指標信号を提供するよう構成された第２の入力と、
前記情報信号と前記ノイズ指標信号を受け取り、該情報信号と該ノイズ信号中のパワーの測定に基づきゲイン制御された出力信号を生じさせるよう構成されたプロセッサとを有することを特徴とする、
ダイナミックレンジ操作システム。
〔態様２〕
前記パワーの測定は、前記情報信号および前記ノイズ指標信号の各々について２つのサブバンド上で行うことを特徴とする態様１に記載のシステム。
〔態様３〕
前記２つのサブバンドの範囲はそれぞれ約５０Ｈｚから約１ｋＨｚと、約１ｋＨｚから約３．５ｋＨｚであることを特徴とする態様２に記載のシステム。
〔態様４〕
前記パワーの測定は、前記情報信号および前記ノイズ信号のうちの少なくとも１つに対して対数領域で行われることを特徴とする態様１に記載のシステム。
〔態様５〕
前記プロセッサが前記情報信号および前記ノイズ信号のうちの少なくとも１つのパワーの平滑化を行うことを特徴とする態様１に記載のシステム。
〔態様６〕
前記ゲイン制御された出力信号は、平滑化関数にかけられるゲイン値を用いることを特徴とする態様１に記載のシステム。
〔態様７〕
オーディオ再生装置であって、
情報信号を提供するよう構成された情報源と、
再生駆動信号に従いオーディオ情報を表現するよう構成されたラウドスピーカと、
前記ラウドスピーカ位置における周囲ノイズに基づきノイズ指標信号を提供するよう構成されたノイズ指標信号源と、
前記情報信号と前記ノイズ指標信号の関数として、再生駆動信号を生成するよう構成されたプロセッサであって、該情報信号と該ノイズ信号中のパワーの測定に基づき前記再生信号のゲイン制御を行うことを特徴とする、プロセッサと、
を具備することを特徴とするオーディオ再生装置。
〔態様８〕
前記パワーの測定は、前記情報信号の各々について２つのサブバンドと前記ノイズ指標信号に対して行うことを特徴とする態様７に記載のオーディオ再生装置。
〔態様９〕
前記２つのサブバンドの範囲はそれぞれ約５０Ｈｚから約１ｋＨｚと、約１ｋＨｚから約３．５ｋＨｚであることを特徴とする態様８に記載のオーディオ再生装置。
〔態様１０〕
前記パワーの測定は、前記情報信号および前記ノイズ指標信号のうちの少なくとも１つに対して対数領域で行われることを特徴とする態様７に記載のオーディオ再生装置。
〔態様１１〕
前記プロセッサが前記情報信号および前記ノイズ指標信号のうちの少なくとも１つのパワーの平滑化を行うことを特徴とする態様７に記載のオーディオ再生装置。
〔態様１２〕
前記ゲイン制御された出力信号は、平滑化関数に従属するゲイン値を用いることを特徴とする態様７に記載のオーディオ再生装置。
〔態様１３〕
前記情報信号はあらかじめ記録されたオーディオ情報であることを特徴とする態様７に記載のオーディオ再生装置。
〔態様１４〕
前記情報信号は実時間で生じたオーディオ情報であることを特徴とする態様７に記載のオーディオ再生装置。
〔態様１５〕
再生場所での周囲ノイズを補償する方法であって、
周囲ノイズを示す周囲ノイズ信号を受け取るステップと、
情報信号を受け取るステップと、
前記周囲ノイズ信号のパワーと前記情報信号の関数として制御された出力信号を生成するステップと、
を具備することを特徴とする方法。
〔態様１６〕
前記パワーの測定は、前記情報信号の各々について２つのサブバンドと前記ノイズ表示信号に対して行うことを特徴とする態様１５に記載の方法。
〔態様１７〕
前記２つのサブバンドの範囲はそれぞれ約５０Ｈｚから約１ｋＨｚと、約１ｋＨｚから約３．５ｋＨｚであることを特徴とする態様１６に記載の方法。
〔態様１８〕
前記パワーの測定は、前記情報信号および前記ノイズ表示信号のうちの少なくとも１つに対して対数領域で行われることを特徴とする態様１５に記載の方法。
〔態様１９〕
前記情報信号および前記ノイズ指標信号のうちの少なくとも１つのパワーを平滑化するステップを具備することを特徴とする態様１５に記載の方法。
〔態様２０〕
前記出力信号に適用されるゲイン制御値を平滑化するステップを具備することを特徴とする態様１５に記載の方法。
〔態様２１〕
あらかじめ記録された音源から情報信号を生成するステップを具備することを特徴とする態様１５に記載の方法。
〔態様２２〕
実時間で前記情報信号を生成するステップを具備することを特徴とする態様１５に記載の方法。

Claims

動的サウンド送達装置によって実行される、動的なサウンド送達方法であって：
前記動的サウンド送達装置についての周囲ノイズを示す周囲ノイズ信号を受領する段階と；
前記周囲ノイズの源から遠隔な音を表わす情報信号を受領する段階と；
前記周囲ノイズ信号のレベルの関数として、所定の情報信号閾値レベルにおけるゲインを決定する段階と；
前記ゲインに基づいて圧縮／伸長関数を生成する段階であって、前記圧縮／伸長関数は曲線として表現可能であり、前記ゲインおよび前記所定の情報信号閾値レベルより低い第一の所定の曲線点および前記所定の情報信号閾値レベルより高い第二の所定の曲線点に基づく、段階と；
前記圧縮／伸長関数から決定される圧縮／伸長特性を前記情報信号に適用してゲイン制御された出力信号を生成する段階とを含む、
方法。
前記所定の情報信号閾値レベルより上での前記圧縮／伸長関数の傾きは前記周囲ノイズ信号のレベルの関数である、請求項１記載の方法。
当該方法が、前記周囲ノイズ信号および前記情報信号の少なくとも一方についての周波数帯ベース上で実行され、前記周波数帯ベースは二つ以上の周波数帯を使う、請求項１記載の方法。
前記周囲ノイズ信号および前記情報信号の少なくとも一方を周波数ビンに分解することをさらに含む、請求項１記載の方法。
各周波数ビン内の信号の大きさを２乗して２乗された信号の大きさを合計することをさらに含む、請求項４記載の方法。
前記周囲ノイズ信号のレベルが前記周囲ノイズ信号の大きさ、前記周囲ノイズ信号のパワー・レベル、前記周囲ノイズ信号のエネルギー、前記周囲ノイズ信号のrms（二乗平均平方根）またはそれらの組み合わせの決定から導出される、請求項１記載の方法。
前記ゲイン制御された出力信号を前記周囲ノイズと音響的に組み合わせて音響聴取信号を生成することをさらに含む、請求項１記載の方法。
前記音響聴取信号がユーザーに可聴である、請求項７記載の方法。
前記ゲイン制御された出力信号が、周囲ノイズによって誘起される音響心理学的マスキング効果を緩和する、請求項１記載の方法。
前記周囲ノイズ信号が、一つまたは複数のマイクロフォンを含むマイクロフォン・システムから得られる、請求項１記載の方法。
動的サウンド送達装置によって実行される、動的なサウンド送達方法であって：
前記動的サウンド送達装置についての周囲ノイズを示す周囲ノイズ信号を当該動的なサウンド送達方法とは独立な補助的な処理動作から得る段階と；
前記周囲ノイズの源から遠隔な音を表わす情報信号を受領する段階と；
前記周囲ノイズ信号のレベルの関数として、所定の情報信号閾値レベルにおけるゲインを決定する段階と；
前記ゲインに基づいて圧縮／伸長関数を生成する段階と；
前記圧縮／伸長関数から決定される圧縮／伸長特性を前記情報信号に適用してゲイン制御された出力信号を生成する段階とを含む、
方法。
ゲイン対情報信号レベルとして表された前記圧縮／伸長関数が実質的に直線を含む、請求項１または１１記載の方法。
動的サウンド送達装置によって実行される、動的なサウンド送達方法であって：
前記動的サウンド送達装置についての周囲ノイズを示す周囲ノイズ信号を受領する段階と；
前記周囲ノイズの源から遠隔な音を表わす情報信号を受領する段階と；
前記周囲ノイズ信号のレベルの関数として、所定の情報信号閾値レベルにおけるゲインを決定する段階と；
前記ゲインに基づいて圧縮／伸長関数を生成する段階であって、前記圧縮／伸長関数がは、ゲイン対情報信号レベルとして表されたとき、前記所定の情報信号閾値レベルにおけるゲインを前記所定の情報信号閾値レベルより低い第一の所定の曲線点および前記所定の情報信号閾値レベルより高い第二の所定の曲線点と結ぶ実質的な直線を含む、段階と；
前記圧縮／伸長関数から決定される圧縮／伸長特性を前記情報信号に適用してゲイン制御された出力信号を生成する段階とを含む、
方法。
動的サウンド送達装置であって：
前記動的サウンド送達装置についての周囲ノイズを示す周囲ノイズ信号を受領する手段と；
前記周囲ノイズの源から遠隔な音を表わす情報信号を受領する手段と；
前記周囲ノイズ信号のレベルの関数として、所定の情報信号閾値レベルにおけるゲインを決定する手段と；
前記ゲインに基づいて圧縮／伸長関数を生成する手段であって、前記圧縮／伸長関数は曲線として表現可能であり、前記ゲインおよび前記所定の情報信号閾値レベルより低い第一の所定の曲線点および前記所定の情報信号閾値レベルより高い第二の所定の曲線点に基づく、段階と；
前記圧縮／伸長関数から決定される圧縮／伸長特性を前記情報信号に適用する手段であってゲイン制御された出力信号を生成する手段とを有する、
装置。
前記所定の情報信号閾値レベルより上での前記圧縮／伸長関数の傾きは前記周囲ノイズ信号のレベルの関数である、請求項１４記載の装置。
前記決定する手段、生成する手段および適用する手段がそれぞれ決定、生成および適用を、前記周囲ノイズ信号および前記情報信号の少なくとも一方について周波数帯ベース上で行い、前記周波数帯ベースは二つ以上の周波数帯を使う、請求項１４記載の装置。
前記周囲ノイズ信号および前記情報信号の少なくとも一方を周波数ビンに分解する手段をさらに含む、請求項１４記載の装置。
各周波数ビン内の信号の大きさを２乗する手段と、２乗された信号の大きさを合計する手段とをさらに有する、請求項１７記載の装置。
前記周囲ノイズ信号のレベルが前記周囲ノイズ信号の大きさ、前記周囲ノイズ信号のパワー・レベル、前記周囲ノイズ信号のエネルギー、前記周囲ノイズ信号のrms（二乗平均平方根）またはそれらの組み合わせの決定から導出される、請求項１４記載の装置。
前記ゲイン制御された出力信号を前記周囲ノイズと音響的に組み合わせて音響聴取信号を生成する手段をさらに有する、請求項１４記載の装置。
前記音響聴取信号がユーザーに可聴である、請求項２０記載の装置。
前記ゲイン制御された出力信号が、周囲ノイズによって誘起される音響心理学的マスキング効果を緩和する、請求項１４記載の装置。
前記周囲ノイズ信号が、一つまたは複数のマイクロフォンを含むマイクロフォン・システムから得られる、請求項１４記載の装置。
動的サウンド送達装置であって：
前記動的サウンド送達装置についての周囲ノイズを示す周囲ノイズ信号を当該動的サウンド送達装置とは独立な補助的な処理動作から得る手段と；
前記周囲ノイズの源から遠隔な音を表わす情報信号を受領する手段と；
前記周囲ノイズ信号のレベルの関数として、所定の情報信号閾値レベルにおけるゲインを決定する手段と；
前記ゲインに基づいて圧縮／伸長関数を生成する手段と；
前記圧縮／伸長関数から決定される圧縮／伸長特性を前記情報信号に適用する手段であってゲイン制御された出力信号を生成する手段とを有する、
装置。
ゲイン対情報信号レベルとして表された前記圧縮／伸長関数が実質的に直線を含む、請求項１４または２４記載の装置。
動的サウンド送達装置であって：
前記動的サウンド送達装置についての周囲ノイズを示す周囲ノイズ信号を受領する手段と；
前記周囲ノイズの源から遠隔な音を表わす情報信号を受領する手段と；
前記周囲ノイズ信号のレベルの関数として、所定の情報信号閾値レベルにおけるゲインを決定する手段と；
前記ゲインに基づいて圧縮／伸長関数を生成する手段であって、前記圧縮／伸長関数は、ゲイン対情報信号レベルとして表されたとき、前記所定の情報信号閾値レベルにおけるゲインを前記所定の情報信号閾値レベルより低い第一の所定の曲線点および前記所定の情報信号閾値レベルより高い第二の所定の曲線点と結ぶ実質的な直線を含む、手段と；
前記圧縮／伸長関数から決定される圧縮／伸長特性を前記情報信号に適用する手段であってゲイン制御された出力信号を生成する手段とを有する、
装置。
動的サウンド送達を実行する回路であって：
前記動的サウンド送達を実行する回路についての周囲ノイズを示す周囲ノイズ信号を受領するよう構成された第一入力と；
前記周囲ノイズの源から遠隔な音を表わす情報信号を受領するよう構成された第二入力と；
プロセッサとを有しており、前記プロセッサは：
前記周囲ノイズ信号のレベルの関数として、所定の情報信号閾値レベルにおけるゲインを決定し；
前記ゲインに基づいて圧縮／伸長関数であって、前記圧縮／伸長関数は曲線として表現可能であり、前記ゲインおよび前記所定の情報信号閾値レベルより低い第一の所定の曲線点および前記所定の情報信号閾値レベルより高い第二の所定の曲線点に基づく、圧縮／伸張関数を生成し；
前記圧縮／伸長関数から決定される圧縮／伸長特性を前記情報信号に適用してゲイン制御された出力信号を生成するよう構成されている、
回路。
前記所定の情報信号閾値レベルより上での前記圧縮／伸長関数の傾きは前記周囲ノイズ信号のレベルの関数である、請求項２７記載の回路。
前記プロセッサは、前記周囲ノイズ信号および前記情報信号の少なくとも一方について周波数帯ベース上で動作可能であり、前記周波数帯ベースは二つ以上の周波数帯を使う、請求項２７記載の回路。
前記プロセッサは、前記周囲ノイズ信号および前記情報信号の少なくとも一方を周波数ビンに分解する、請求項２７記載の回路。
前記プロセッサは、各周波数ビン内の信号の大きさを２乗して、２乗された信号の大きさを合計する、請求項３０記載の回路。
前記周囲ノイズ信号のレベルが前記周囲ノイズ信号の大きさ、前記周囲ノイズ信号のパワー・レベル、前記周囲ノイズ信号のエネルギー、前記周囲ノイズ信号のrms（二乗平均平方根）またはそれらの組み合わせの決定から導出される、請求項２７記載の回路。
前記ゲイン制御された出力信号を前記周囲ノイズと音響的に組み合わせて音響聴取信号を生成する回路をさらに有する、請求項２７記載の回路。
前記音響聴取信号がユーザーに可聴である、請求項３３記載の回路。
前記ゲイン制御された出力信号が、周囲ノイズによって誘起される音響心理学的マスキング効果を緩和する、請求項２７記載の回路。
前記周囲ノイズ信号が、一つまたは複数のマイクロフォンを含むマイクロフォン・システムから得られる、請求項２７記載の回路。
動的サウンド送達を実行する回路であって：
前記動的サウンド送達を実行する回路についての周囲ノイズを示す周囲ノイズ信号を、当該動的サウンド送達を実行する回路とは独立な補助的な処理動作から得るよう構成された第一入力と；
前記周囲ノイズの源から遠隔な音を表わす情報信号を受領するよう構成された第二入力と；
プロセッサとを有しており、前記プロセッサは：
前記周囲ノイズ信号のレベルの関数として、所定の情報信号閾値レベルにおけるゲインを決定し；
前記ゲインに基づいて圧縮／伸長関数を生成し；
前記圧縮／伸長関数から決定される圧縮／伸長特性を前記情報信号に適用してゲイン制御された出力信号を生成するよう構成されている、
回路。
ゲイン対情報信号レベルとして表された前記圧縮／伸長関数が実質的に直線を含む、請求項２７または３７記載の回路。
動的サウンド送達を実行する回路であって：
前記動的サウンド送達を実行する回路についての周囲ノイズを示す周囲ノイズ信号を受領するよう構成された第一入力と；
前記周囲ノイズの源から遠隔な音を表わす情報信号を受領するよう構成された第二入力と；
プロセッサとを有しており、前記プロセッサは：
前記周囲ノイズ信号のレベルの関数として、所定の情報信号閾値レベルにおけるゲインを決定し；
前記ゲインに基づいて圧縮／伸長関数であって、前記圧縮／伸張関数は、ゲイン対情報信号レベルとして表されたとき、前記所定の情報信号閾値レベルにおけるゲインを前記所定の情報信号閾値レベルより低い第一の所定の曲線点および前記所定の情報信号閾値レベルより高い第二の所定の曲線点と結ぶ実質的な直線を含む、圧縮／伸張関数を生成し；
前記圧縮／伸長関数から決定される圧縮／伸長特性を前記情報信号に適用してゲイン制御された出力信号を生成するよう構成されている、
回路。
再生システムであって、
前記再生システムについての周囲ノイズを示す周囲ノイズ信号を提供するよう構成されたノイズ指標生成回路と；
前記周囲ノイズと独立な情報信号を提供するよう構成された情報信号生成回路と；
プロセッサとを有する再生システムであって、前記プロセッサは：
前記周囲ノイズ信号のレベルの関数として、所定の情報信号閾値レベルにおけるゲインを決定し；
前記ゲインに基づいて圧縮／伸長関数であって、前記圧縮／伸長関数は曲線として表現可能であり、前記ゲインおよび前記所定の情報信号閾値レベルより低い第一の所定の曲線点および前記所定の情報信号閾値レベルより高い第二の所定の曲線点に基づく、圧縮／伸張関数を生成し；
前記圧縮／伸長関数から決定される圧縮／伸長特性を前記情報信号に適用して、ゲイン制御された出力信号を生成するよう構成されており、
当該再生システムはさらに、
前記ゲイン制御された出力信号を前記周囲ノイズと音響的に組み合わせて音響聴取信号を生成する回路と；
前記音響聴取信号を受領してそれから可聴信号を生成するよう構成されたラウドスピーカとを有する、
システム。
前記所定の情報信号閾値レベルより上での前記圧縮／伸長関数の傾きは前記周囲ノイズ信号のレベルの関数である、請求項４０記載のシステム。
前記プロセッサは、前記周囲ノイズ信号および前記情報信号の少なくとも一方について周波数帯ベース上で動作可能であり、前記周波数帯ベースは二つ以上の周波数帯を使う、請求項４０記載のシステム。
前記プロセッサは、前記周囲ノイズ信号および前記情報信号の少なくとも一方を周波数ビンに分解する、請求項４０記載のシステム。
前記プロセッサは、各周波数ビン内の信号の大きさを２乗して、２乗された信号の大きさを合計する、請求項４３記載のシステム。
前記周囲ノイズ信号のレベルが前記周囲ノイズ信号の大きさ、前記周囲ノイズ信号のパワー・レベル、前記周囲ノイズ信号のエネルギー、前記周囲ノイズ信号のrms（二乗平均平方根）またはそれらの組み合わせの決定から導出される、請求項４０記載のシステム。
前記ゲイン制御された出力信号が周囲ノイズによって誘起される音響心理学的マスキング効果を緩和する、請求項４０記載のシステム。
信号を提供するよう前記ノイズ指標生成回路に結合されている一つまたは複数のマイクロフォンをさらに有する、請求項４０記載のシステム。
ゲイン対情報信号レベルとして表された前記圧縮／伸長関数が実質的に直線を含む、請求項４０記載のシステム。
再生システムであって、
前記再生システムについての周囲ノイズを示す周囲ノイズ信号を提供するよう構成されたノイズ指標生成回路と；
前記周囲ノイズと独立な情報信号を提供するよう構成された情報信号生成回路と；
プロセッサとを有する再生システムであって、前記プロセッサは：
前記周囲ノイズ信号のレベルの関数として、所定の情報信号閾値レベルにおけるゲインを決定し；
前記ゲインに基づいて、圧縮／伸長関数であって、前記圧縮／伸張関数は、ゲイン対情報信号レベルとして表されたとき、前記所定の情報信号閾値レベルにおけるゲインを前記所定の情報信号閾値レベルより低い第一の所定の曲線点および前記所定の情報信号閾値レベルより高い第二の所定の曲線点と結ぶ実質的な直線を含む、圧縮／伸張関数を生成し；
前記圧縮／伸長関数から決定される圧縮／伸長特性を前記情報信号に適用して、ゲイン制御された出力信号を生成するよう構成されており、
当該再生システムはさらに、
前記ゲイン制御された出力信号を前記周囲ノイズと音響的に組み合わせて音響聴取信号を生成する回路と；
前記音響聴取信号を受領してそれから可聴信号を生成するよう構成されたラウドスピーカとを有する、
システム。