JP6420353B2

JP6420353B2 - 周波数依存的減衰段をチューニングするための装置及び方法

Info

Publication number: JP6420353B2
Application number: JP2016552893A
Authority: JP
Inventors: タパニパカリネン，ユリ; スミザーズ，マイケル; フェリクストーレス，フアン; パーンヘーゲン，ハイコ
Original assignee: ドルビー・インターナショナル・アーベー; ドルビーラボラトリーズライセンシングコーポレイション
Priority date: 2014-02-18
Filing date: 2015-02-18
Publication date: 2018-11-07
Anticipated expiration: 2035-02-18
Also published as: EP3108669B1; CN106105262A; HK1231660A1; JP2017506464A; CN110381421B; JP6711881B2; CN106105262B; EP3108669A1; JP2019033522A; CN110381421A; US20170061982A1; US10283137B2; WO2015124598A1

Description

関連出願への相互参照
本願は、２０１４年２月１８日付け出願の米国特許仮出願第６１／９４１，４１４号に基づき優先権を主張するものであり、この出願の開示内容の全てを本願に援用する。

技術分野
本開示の実施形態例は、広くオーディオ再生システムに関し、特にオーディオ再生システム中で発生する歪みの抑制に関する。

背景
消費者向けオーディオ再生システムの音質を向上する目的でデジタル信号処理を使用することは、オーディオ産業における現在のトレンドである。小型または低価格のオーディオ再生システムが持つ典型的な欠点には、例えば、平坦でない振幅応答、控えめな低周波放射能力、及びノイズが含まれる。そのようなシステムの多くが有するもうひとつの望ましくない特性は、音色や位相などの音の特徴を音の振幅の関数として変化させる原因となり得る、非線形歪みの発生である。非線形歪みはまた、ある特定の周波数における非線形な振幅応答（強度に関して）の原因となり得て、音声出力中に、例えば入力周波数成分の周波数の整数倍（倍音）における、新たな周波数成分を生み出し得る。結果として、２つの同一の音を、非線形歪みを生じるオーディオ再生システム上で異なる再生利得を用いて再生すれば、２つの非常に異なる出力音を得る結果になり得る。商業用音再生システムにおける非線形歪みの典型的な源は、トランスデューサについてのコストを増大させることなくさらに大きな音声出力を達成する目的で、スピーカユニットをその線形動作範囲外で無理やり動作させることである。

非線形歪みを抑制する１つの方法は、入力信号をスピーカへ与える前に減衰させることであるが、これはシステムの音が小さくなってしまうことであり、典型的には容認できない。システムのラウドネスをほんのわずかにしか犠牲にすることなく非線形歪みを抑制するための１つのアプローチは、入力信号を監視して音量の大きい部分にのみ減衰処理を適用するダイナミックレンジリミッタを用いることであり、その結果、スピーカに与えられる信号の振幅は所定の閾値を決して越えることはない。

非線形歪みは典型的には周波数に依存するため、リミッタ処理を異なる周波数帯に対して別々に適用するのが望ましく、その結果、問題となる周波数と信号強度との組合せのみが減衰されることとなる。このアプローチは、マルチバンドリミティング／コンプレッションと呼ばれ、これにより、例えば「ボリュームパンピング（ｖｏｌｕｍｅｐｕｍｐｉｎｇ）」のような、ダイナミックレンジ圧縮に関わる副作用のうちのいくつかもまた緩和される。

しかし、マルチバンドリミッタ／コンプレッサは、入力信号に応じて異なる周波数帯を異なる減衰のさせ方をするため、このことが不快に感じられる音色の変化につながり得る。その全文を本願に援用する米国特許出願第２０１３／００１３０９６Ａ１号の中で、音色維持マルチコンプレッサ（ａｍｕｌｔｉ‐ｂａｎｄｃｏｍｐｒｅｓｓｏｒｗｉｔｈｔｉｍｂｒｅｐｒｅｓｅｒｖａｔｉｏｎ）が、そのような音色変化を低減すべく提案されている。

上記のように、オーディオ再生システムにおいて発生する非線形歪みを抑制するために、いくつかの方法がこれまでに提案されており、これによりオーディオ再生システムの音質を向上できる。しかし、非線形歪みの抑制に関連する上記の諸問題のうちの、少なくともいくつかを緩和する装置および／または方法を提供することが望ましいであろう。

図面の簡易説明
実施形態例が、これより添付図面を参照しながら述べられる。

図１はある実施形態例による装置を用いて周波数依存減衰処理段をチューニングするための構成例を示す、汎用ブロック図である。図２はある実施形態例による周波数依存減衰処理段をチューニングするための装置を示す、汎用ブロック図である。図３は、非線形歪みを生じるオーディオ再生システムが単一周波数オーディオ信号に相当する入力データ信号により励起される際に生じる出力音響信号の、スペクトル例を表す両対数グラフを模式的に示す。図４は、ある実施形態例による、周波数依存の可聴閾値（実線）及びマスキング閾値（破線）をそれぞれ模式的に示し、チューニング装置において考慮され得る心理音響効果を示す。図５は、ある実施形態例による、周波数依存の可聴閾値（実線）及びマスキング閾値（破線）をそれぞれ模式的に示し、チューニング装置において考慮され得る心理音響効果を示す。図６は、ある実施形態例によるオーディオ再生システムに対する励起として用いられる入力信号例を模式的に示す。図７ａは、図６に示された入力信号例の振幅を模式的に示す。図７ｂは、図６に示された入力信号例による励起に際してのオーディオ再生システムの出力信号例における、周波数成分の大きさを模式的に示す。ここで、当該周波数成分は入力信号例と同一周波数に局在しており、図中の飽和はオーディオ再生システム内にダイナミックレンジ制御が存在していることを表し得る。図８はある実施形態例による装置を用いて周波数依存減衰処理段をチューニングするための代替構成例を示す、汎用ブロック図である。図９はある実施形態例による、周波数依存減衰処理段をチューニングするための方法を示す、フローチャートである。図１０はある実施形態例による、オーディオ再生システム内にＤＲＣが存在することを検知するための方法を示す、フローチャートである。

全ての図は模式的であり、概ねいずれも開示を明らかにする為に必要な部分のみを示している。その一方で、省略されるかあるいは単に示唆されるのみの部分もある。別途の示唆の無い限り、異なる図において類似の参照符号は類似の部分を指す。

実施形態例の説明
Ｉ．概要‐チューニング
本明細書中で用いるとき、「オーディオ信号」は、純粋なオーディオ信号、または視聴覚信号やマルチメディア信号のオーディオ部分、もしくはメタデータと組み合わされたこれらのいずれか、であり得る。

実施形態例において、周波数依存的減衰段を、周波数依存的減衰段に連関したオーディオ再生システム中で発生する非線形歪みを抑制するためにチューニングするための装置が、提供される。装置によりチューニングされる周波数依存的減衰段に連関したオーディオ再生システムは、入力データ信号に応答して出力音響信号を供給するように構成される。装置は、既定入力データ信号によるオーディオ再生システムの励起に際して記録される出力音響信号を表現するデータを受信するように適応された受信部を備える。装置はまた、前記受信したデータに基づき非線形歪みの存在を検知し、かつ、前記検知された非線形歪みに対して心理音響補償を適用するように適応された第１の歪み検知部も含む。装置はさらに、前記心理音響補償を受けた非線形歪みに基づき周波数依存的減衰段の制御に適した制御情報を決定するように適応された制御部を含む。

周波数依存的減衰段とは、とりわけ、オーディオ信号あるいはマルチメディア信号のオーディオ部分に周波数依存の減衰処理を実施するように適応された処理段を意味し、例えば、マルチバンドリミッタのことである。周波数依存的減衰段は、オーディオ再生システムにより再生されるべき信号を、オーディオ再生システム中で生じる非線形歪み量を低減する目的で減衰処理するのであり、既存の非線形歪みを減衰処理するわけではない。

非線形歪みとは、オーディオ再生システムの非線形効果、例えば、音色および／または位相のような音の特徴の変化を音の振幅の関数として引き起こす効果、に起因する歪みを意味する。非線形歪みには、例えば、入力周波数の整数倍の周波数もしくはその付近に位置する倍音歪み成分が、含まれ得る。

周波数依存的減衰段のチューニングは、既定入力データ信号による特定オーディオ再生システムの励起に際して検知された非線形歪みに基づき、その特定オーディオ再生システムの歪み挙動を考慮に入れる。これにより、その特定オーディオ再生システム中で発生する非線形歪みを、さらに効率的に抑制することが可能となる。

心理音響効果が、オーディオ再生システム出力中の非線形歪みが聴取者にどのように感じられるかを左右する。検知された非線形歪みに対して心理音響補償を適用し、周波数依存的減衰段を制御するための制御情報を心理音響補償を受けた非線形歪みに基づき決定することにより、周波数依存的減衰段は、知覚可能／聴取可能な非線形歪みをより効率的に抑制したり、かつ／または主として不可聴であるかまたは特に気にならない非線形歪みの原因となっただけであろうオーディオコンテンツに対する不要な減衰処理を減じたりするように、チューニングされ得る。言い換えれば、周波数依存的減衰段のチューニング中に心理音響補償を適用すれば、オーディオ再生システムが生成する可聴な非線形歪みと、オーディオ再生システムが有する全体的なラウドネスとのバランスが改善され得る。

既定入力データ信号は、例えば装置にとって既知であり得て、例えば、周波数依存的減衰段のチューニングに関する既定の手続きの一部として、装置によりオーディオ再生システムへと提供され得る。あるいは、既定入力データ信号についての情報（ｉｎｆｏｒｍａｔｉｏｎ）は、例えば装置により受信データに基づき取得されるか、かつ／または装置により別途受信されてもよい。

ある実施形態例によれば、第１の歪み検知部は、少なくとも、検知された非線形歪みのスペクトル成分であって周波数依存の可聴性閾値を下回るものを無視することによって心理音響補償を適用するように適応され得る。

ある所定の周波数について、周波数依存の可聴性閾値は、例えば、その所定の周波数にあるオーディオコンテンツが平均的な人間の聴取者に聴取可能／知覚可能となるような振幅／パワー／エネルギーレベルとして設定され得る。あるいは、可聴性閾値は、可聴レベルよりも十分に低いオーディオコンテンツのみが無視されるよう、低めに設定されてもよい。あるいは、可聴性閾値は、平均的聴取者により十分に弱い／小さいと知覚されるオーディオコンテンツが無視されるよう、高めのレベルに設定されてもよい。

周波数依存の可聴性閾値を下回るスペクトル成分を無視することは、検知された非線形歪みの周波数成分であって周波数可聴性閾値を下回る振幅／パワー／エネルギーレベルを有するものを無視することを、含み得る。例えば、後続の工程手順において、その対応する周波数範囲内ではその歪みのスペクトルはゼロであるものと考えてもよい。

少なくともいくつかの実施形態例によれば、周波数依存の可聴性閾値を下回るスペクトル成分を無視することはまた、検知された非線形歪み成分の振幅／パワー／エネルギーレベルを、それぞれの非線形歪み成分に対応する周波数における周波数依存の可聴性閾値のレベル分だけ低減することも含み得る。すなわち、周波数依存の可聴性閾値に関するある種の正規化のが含まれ得る。後続の工程手順は例えば、検知された非線形歪み成分の、抑制／正規化された、振幅／パワー／エネルギーレベルに基づき得る。

ある実施形態例によれば、第１の歪み検知部は、周波数依存の可聴性閾値の較正を、受信データが表現する出力音響信号の記録に関連して推定される音圧レベルに基づいて行うように適応され得る。音圧レベルは、出力音響信号を表現する受信データと、出力音響信号が聴取者によってどのように感じられるかを推定することに関連する諸物理量とを結び付けるリンクの役割を担うことができ、周波数依存の可聴性閾値の適正な較正を容易にし得る。

ある実施形態例によれば、第１の歪み検知部は、心理音響補償の適用を、少なくとも以下により行うように、適応され得る。すなわち、既定入力データ信号の第１の周波数成分についての情報（ｋｎｏｗｌｅｄｇｅ）を取得すること、当該第１の周波数成分に基づき、当該第１の周波数成分の近傍についてマスキング閾値を推定すること、及び、検知された非線形歪みのスペクトル成分であって、このようにして推定されたマスキング閾値を下回るものを無視することである。

オーディオ再生システムが既定入力データ信号により励起される際、既定入力データ信号の第１の周波数成分により、第１の周波数成分と実質的に同一の周波数に局在する、受信データのスペクトル成分が生じる。そして、このスペクトル成分は、受信オーディオ信号が有する他のオーディオコンテンツに対するマスキング効果を有する。

マスキング閾値を下回るスペクトル成分を無視することは、検知された非線形歪みの周波数成分であって、その振幅／パワー／エネルギーレベルがマスキング閾値を下回るものを無視することを含み得る。

いくつかの実施形態例によれば、既定入力オーディオ信号及び第１の周波数成分は、装置および／または第１の歪み検知部にとって既知であってもよく、例えば、装置中に含まれるインターフェースによりオーディオ再生システムへと提供され得る。他のいくつかの実施形態例によれば、第１の周波数成分についての情報は、第１の歪み検知部が受信してもよいし、受信データに基づき取得されてもよい。

ある実施形態例によれば、第１の歪み検知部は、既定入力データ信号の第１の周波数成分についての情報を取得すること、及び、受信データに基づいて当該第１の周波数成分に対応する非線形歪み成分を検知すること、を行うように適応され得る。言い換えれば、本実施形態例によれば、第１の歪み検知部は、受信データに基づき、第１の周波数成分によるオーディオ再生システム励起の結果である非線形歪み成分を検知するように適応され得る。

オーディオ再生システムが既定入力データ信号により励起される際、既定入力データ信号の第１の周波数成分により、第１の周波数成分と実質的に同一の周波数に局在する受信データのスペクトル成分や、他の周波数に位置する非線形歪み成分、例えば第１の周波数成分の周波数の整数倍上またはその付近に位置する倍音成分が生じる。

ある実施形態例によれば、第１の歪み検知部は、第１の周波数成分と実質的に同一の周波数にあるような受信データのスペクトル成分のパワーと、非線形歪み成分のパワー総計との、パワー比を決定するように適応され得る。本実施形態例によれば、制御部は、制御情報の決定を当該パワー比にもまた基づいて行うように適応され得る。

ある実施形態例によれば、第１の歪み検知部は、少なくとも、パワー比生成に先立ち、第１の周波数成分と実質的に同一の周波数に局在する受信データのスペクトル成分のパワーを正規化すること、及び、さらに非線形歪み成分のパワーを正規化することによって、心理音響補償を適用するように適応され得る。正規化は周波数依存の可聴性閾値に関して行われる。言い換えれば、パワー比生成に先立ち、そのそれぞれのスペクトル成分またはコンポーネントを周波数依存の可聴性閾値に関して正規化することにより、分子分母の両方が小さくされる。パワー比生成に先立ち、それぞれのスペクトル成分またはコンポーネントを周波数依存の可聴性閾値に関して正規化することにより、取得されるパワー比の値は、求める音声出力と非線形歪みとの間の、聴取者によって感じられるパワー比（すなわち強度差）をより適正に示し得る。

いくつかの実施形態例によれば、第１の歪み検知部は、周波数依存の可聴性閾値の較正を、受信データが表現する出力音響信号の記録に関連して推定される音圧レベルに基づいて行うように適応され得る。

ある実施形態例によれば、第１の歪み検知部は、少なくとも、倍音インデックスを非線形歪み成分に割り当てること、及び、例えばパワー比生成に先立ち、当該倍音インデックスに基づいて非線形歪み成分に重み付けをすることによって、心理音響補償を適用するように適応され得る。

倍音インデックスは、非線形歪み成分（倍音歪み成分とも呼ぶ）が位置する周波数を、オーディオ再生システムへの入力励起信号中に存在する基本周波数に対して関係付ける。異なる倍音歪み成分は、典型的には、不快さが同じであるようには聴取者にとって感じられない。例えば、第２倍音成分は、より高位の倍音成分に比べればはるかに微妙な音響効果を有するものであると、しばしば報告されている。倍音インデックスに基づいて非線形歪み成分を重み付けすること、例えば、第２倍音成分に対し比較的軽めの重みを与えることにより、このことを考慮することができる。

いくつかの実施形態例によれば、非線形歪み成分のうち少なくとも１つは、その倍音インデックスに基づき無視されてもよい。

ある実施形態例によれば、第１の歪み検知部は、少なくとも、第１の周波数成分と実質的に同一の周波数に局在する受信データのスペクトル成分のラウドネスを推定すること、及び、非線形歪み成分群の結合的ラウドネスを推定することによって、心理音響補償を適用するように適応され得る。本実施形態例によれば、制御部は、制御情報の決定を、推定されたこれらラウドネス間の差異にもまた基づいて行うように、適応され得る。聴取者が感じるラウドネスは、典型的には周波数により異なり、例えば、当該非線形歪み成分を、それらが存在するそれぞれの周波数領域に基づきその大きさを変えたり重み付けしたりすることによって対処され得る。非線形歪み成分群の結合的ラウドネスは、例えば、ラウドネス総計法（ｓｕｍｍａｔｉｏｎｓｃｈｅｍｅ）を用いて推定され得る。ある実施形態例によれば、装置は、既定入力データ信号のスペクトル成分の範囲にわたる周波数範囲についての情報を取得すること、及び、受信データのスペクトル成分であって当該周波数範囲を上回るものに基づき非線形歪みを検知すること、を行うように適応された第２の歪み検知部を備え得る。本実施形態例によれば、制御部は、制御情報の決定を、第２の歪み検知部が検知する非線形歪みにもまた基づいて行うように、適応され得る。

なお、いくつかの実施形態例によれば、既定入力データ信号は比較的弱いノイズ、例えば、既定入力データ信号の総エネルギーの多くとも５または１０パーセントであるようなノイズを含み得ることに留意されたい。そのような状況下では、本明細書内及び特許請求の範囲において言及されている周波数範囲は、ノイズのみしか存在しない周波数を含んでいる必要はない。

既定入力データ信号のスペクトル成分の範囲にわたる周波数範囲を上回る周波数に対して、受信データのスペクトル成分が発生していることは、非線形歪みを示し得る。第２の歪み検知部による非線形歪みの検知は、第１の歪み検知部による非線形歪みの検知を補完する役割を果たし得る。これら２つの歪み検知部の両方による非線形歪みの検知結果に基づき制御情報を決定することにより、オーディオ再生システム中で発生する非線形歪みの抑制は、改善され得る。

ある実施形態例によれば、装置は、既定入力データ信号群のシーケンスによるオーディオ再生システムの励起に際して記録されるデータを受信するように適応され得る。当該シーケンス中で連続する既定入力データ信号群は、ある１つの既定波形を次第に増幅した波形群に相当する。本実施形態例によれば、装置は、オーディオ再生システムの出力オーディオ信号のスペクトル組成であって当該既定入力データ信号群のシーケンスによる励起の結果であるものを受信データに基づいて監視し、当該監視されるスペクトル組成における突然の変化を検知し、かつ、当該検知された突然の変化に対応する既定波形の増幅値を決定するように適応された、スペクトル組成解析部を備え得る。本実施形態例によれば、制御部は、制御情報の決定を、スペクトル組成解析部により決定される増幅値にもまた基づいて行うように、適応され得る。

例えば、スペクトル組成解析部により決定される増幅値は、最大のエネルギー／パワーレベル動作動作（ある特定の周波数帯のスペクトル成分が常にこれを下回るよう周波数依存的減衰段によって保たれることによって、スピーカがその線形動作区間外で動作するのを回避することを目的とする）を特定するために、制御部により使用され得る。第１の歪み検知部からの、心理音響補償を受けた非線形歪みに関する情報は、例えば、その特定の周波数帯内でのエネルギー／パワーレベルが前記最大のエネルギー／パワーレベルを既に下回るときの周波数依存的減衰段用の減衰レベルを決定するために、制御部により使用され得る。

既定波形は、例えば、単一の正弦信号であってもよいし、複数の周波数成分を含むより合成的なオーディオ信号であってもよい。既定波形は、例えば、狭帯域信号であることによりオーディオ再生システムの非線形歪み特性がある特定の周波数帯について解析されるようにしてもよい。

もし例えば、既定入力データ信号群のシーケンス中の個々の要素が無音を表すデータなどによって時間的に区切られているならば、スペクトル組成解析部は、オーディオ再生システムの出力音響信号が備えるスペクトル組成の決定を、既定入力データ信号群のシーケンス中の各要素に対応する離散的時点において行うように適応され得、また、各時点において決定されるスペクトル組成値間に起こる突然の変化を検知できるように適応され得る。なお、オーディオの連続する時間区分を結合して単一の連続的なオーディオシーケンスにするためのいくつかの手法が当業者には既知であり、少なくともそのいくつかを、オーディオ区分を次々に追加することに起因する過渡現象および／またはその他のアーチファクトを減らす目的で採用し得ることに、留意されたい。そのような手法を採用することによって、例えば、既定入力データ信号群のシーケンス中の要素群を結合してオーディオ再生システムに対する励起として用いられる単一の入力データ信号にしておいてもよく、その結果、監視されるスペクトル成分のうちで、オーディオの時間区分を次々に追加することに起因する過渡現象／アーチファクトに由来する部分を減少することとなり得る。

もし例えば、既定波形が単一の正弦波であるならば、既定入力データ信号群のシーケンスは、例えば次第にあるいは連続的に増加する振幅を有する単一の正弦信号の形として、オーディオ再生システムにより受信され得る。またこのとき、オーディオ再生システムの出力音響信号のスペクトル組成は、例えば、スペクトル組成解析部により、既定入力データ信号群のシーケンス中の個々の要素に対応する離散時点上で監視／決定されるのではなく、むしろ連続的に監視され得る。本例示では、スペクトル組成分析部は、連続的に監視されるスペクトル組成における突然の変化を検知するように適応され得る。

スペクトル組成は、例えばスペクトル中心および／またはケプストラム極大を推定することにより、監視され得る。監視されるスペクトル組成における突然の変化は、オーディオ再生システムがその線形動作範囲の上端に達したことを示し、この範囲の外側で非線形歪み量は有意に増加し得る。検知された突然の変化に対応する既定波形の増幅値は、オーディオ再生システムが備える線形動作域の上端に関連するエネルギー／パワー／振幅レベルにも対応していてもよく、制御部は、制御情報の決定をこのエネルギー／パワー／振幅レベルにもまた基づいて行うように適応され得る。

ある実施形態例によれば、装置は、既定入力データ信号と受信データとの間の整合性（ｃｏｈｅｒｅｎｃｅ）を決定することを行うように適応された相関性解析部を備え得る。この構成を用いれば、制御部は、制御情報の決定を、整合性解析部により決定される整合性値にもまた基づいて行うように適応され得る。例えば、既定入力データ信号と受信データとの間の低い整合性は、非線形歪みの存在を示し得る。特に、低ノイズ状況下ではそうである。

ある実施形態例によれば、相関性解析部は、既定入力データ信号と受信データとの間の相互相関性を決定すること、決定された相互相関性に基づき既定入力データ信号と受信データとの間のサンプルレート差を推定すること、及び受信データを再サンプリングしたものに基づき整合性を決定すること、を行うように適応され得る。受信データの再サンプリングは、既定入力データ信号と受信データとの間の同期性を向上する目的で使用され得るものであり、決定される整合性におけるノイズを低減し得る。

ある実施形態例によれば、装置は、既定入力データ信号群のシーケンスによるオーディオ再生システムの励起に際して記録されるデータを受信するように適応され得る。前記シーケンス中で連続する既定入力データ信号群は、ある１つの既定波形を次第に増幅した波形群に相当する。本実施形態例によれば、装置は、受信データに基づき、オーディオ再生システムからの出力音響信号の振幅であってシーケンスによるオーディオ再生システム励起の結果であるものを監視すること、及び、監視される振幅の飽和を検知してオーディオ再生システム内におけるＤＲＣの存在を証明すること、を行うように適応されたダイナミックレンジ制御（ＤＲＣ）検知部を含み得る。本実施形態例によれば、制御部は、制御情報の決定を、ＤＲＣ検知部による検知結果にもまた基づいて行うように適応され得る。

所与のオーディオ再生システムについて、典型的には、音響出力において得ることが可能な振幅についての上限が存在し、それはＤＲＣがなくとも、例えば、増幅段および／またはスピーカにおける物理的制限の結果生じる。オーディオ再生システム内にＤＲＣが存在することの証明となる検知された飽和とは、監視される振幅の飽和であって、そのような上限を下回るレベルで起きるものを意味する。

ある実施形態例によれば、既定入力データ信号群のシーケンスは、増加する振幅を伴う単一周波数のオーディオ信号に実質的に相当し得る。本実施形態例によれば、ＤＲＣ検知部は、受信データに基づきオーディオ再生システムからの出力音響信号中の、ある周波数成分の振幅を監視すること（この監視される周波数成分は単一周波数のオーディオ信号と実質的に同一の周波数に局在する）、及び、監視される周波数成分の振幅につき飽和を検知してオーディオ再生システム内におけるＤＲＣの存在を証明すること、を行うように適応され得る。

ある実施形態例によれば、制御部は、ＤＲＣ検知部による検知に応答して、周波数依存的減衰段に減衰処理を中断させるための制御情報を決定するように適応され得る。オーディオ再生システム内にＤＲＣが存在することは、可聴なアーチファクトが生じる原因となり得る。少なくともいくつかの実施形態例においては、それゆえ、周波数依存的減衰段が減衰処理を適用しないことが有益となり得る。

ある実施形態例によれば、装置は、一定の入力データ信号によるオーディオ再生システムの励起に際して記録されるデータを受信するように適応され得る。本実施形態例によれば、装置は、オーディオ再生システムに含まれかつ装置の制御部により決定される制御情報に基づいて入力データ信号を減衰処理するよう動作し得る周波数依存的減衰段、をチューニングするように適応され得る。本実施形態例によれば、装置は、周波数依存的減衰段のチューニングを、受信データに基づき反復的に制御情報を決定することによって行うように適応され得る。

ある実施形態例によれば、制御部は、制御情報の決定を、少なくとも、周波数依存的減衰段についての基準チューニングのセットに基づき機械学習を適用することによって行うように適応され得る。基準チューニングのセットは、例えば、それぞれの基準オーディオ再生システムの既定入力データ信号による励起に際して記録される出力音響信号を表現する基準データのセットと、それぞれの基準データに対応する基準制御信号であって、それぞれの基準オーディオ再生システム中で発生する非線形歪みの抑制を目的に周波数依存的減衰段を制御するための信号を含み得る。基準チューニングは、例えば、聴取検定中にチューニング担当者（ｈｕｍａｎｔｕｎｅｒ）によって取得されたものであってもよい。制御部は、例えば、基準チューニングが格納されるメモリを含み得る。

ある実施形態例によれば、装置はさらに、既定入力データ信号をオーディオ再生システムへと提供するように適応されたインターフェースを含み得る。インターフェースは、例えば、有線でも無線でもよい。

ある実施形態例によれば、装置はさらに、オーディオ再生システムからの音響出力を記録すること、及びそのデータを受信部へと提供すること、を行うように適応された音響トランスデューサを含み得る。

実施形態例において、周波数依存的減衰段を、周波数依存的減衰段に連関するオーディオ再生システム中で起こる非線形歪みの抑制するためにチューニングするための方法が、提供される。提案される方法は、概ね、上記に提案された装置のものと同一または対応した、特徴と利点を有し得る。特に、いくつかの実施形態例によれば、当該方法は、既定入力データ信号によるオーディオ再生システムの励起に際して記録される出力音響信号を表現するデータを受信することを含み得る。当該方法は、受信データに基づき非線形歪みの存在を検知することを含み得る。当該方法は、心理音響補償を検知された非線形歪みに対し適用すること、及び、心理音響補償を受けた非線形歪みに基づき周波数依存的減衰段の制御のために適切な制御情報を決定すること、を含み得る。

実施形態例において、コンピュータプログラム製品は、上記に提案された方法のうちいずれかをコンピュータに実行させるための指令を備えるコンピュータ可読媒体を含み得る。その提案されたコンピュータプログラム製品は、概ね、上記に提案された方法や装置のものと同一または対応した特徴と利点を有し得る。

更なる諸実施形態例が、従属する請求項において規定される。なお、諸実施形態例には、例え互いに異なる請求項中で規定されているとしても、特徴のあらゆる組合せが含まれることに留意されたい。

ＩＩ．概要‐ＤＲＣ検知
実施形態例において、オーディオ再生システム内にダイナミックレンジ制御すなわちＤＲＣの存在を検知するための方法、装置、及びコンピュータプログラム製品が提案される。その提案される、オーディオ再生システム内におけるＤＲＣの存在を検知するための方法、装置、及びコンピュータプログラム製品は、概ね、同一または対応した特徴や利点を共有し得る。なお、その提案される、オーディオ再生システム内におけるＤＲＣの存在を検知するための方法、なお、装置、及びコンピュータプログラム製品は、前節に記載されたそれぞれの方法、装置、コンピュータプログラム製品とは独立、かつ組み合わせ可能であることに留意されたい。

実施形態例において、オーディオ再生システム内にダイナミックレンジ制御（ＤＲＣ）の存在を検知するための方法が、提供される。オーディオ再生システムは、入力データ信号に応答して出力音響信号を供給するように構成される。当該方法は、以下を含む。すなわち、一既定入力データ信号群のシーケンスによるオーディオ再生システムの励起に際し記録される出力音響信号を表現するデータを受信すること、但し、シーケンス中で連続する既定入力データ信号群は、ある１つの既定波形を次第に増幅した波形群に相当する；受信データに基づき、シーケンスによるオーディオ再生システムの励起の結果である、オーディオ再生システムからの出力音響信号の振幅を監視すること；および、監視される振幅の飽和を検知し、オーディオ再生システム内におけるＤＲＣの存在を証明することである。

所与のオーディオ再生システムにおいて、音響出力において得ることが可能な振幅について、ＤＲＣが存在せずとも、例えば、増幅段および／またはスピーカにおける物理的制限の結果生じるような上限が、典型的には存在する。オーディオ再生システム内にＤＲＣが存在することの証明となる検知された飽和とは、監視される振幅の飽和であってそのような上限から区別される（例えば、下回る）レベルで起きるもの、を意味する。

オーディオ再生システムのスピーカには典型的には線形動作区間が存在し、それを上回ると、入力信号のエネルギー成分のうちの大部分が、出力信号中では入力信号よりも高い周波数に位置する周波数成分のエネルギーへと（すなわち倍音歪み成分の形の非線形歪みに）移動／シフトされることとなる。

少なくともいくつかの実施形態例によれば、オーディオ再生システム内にＤＲＣが存在することの証明となる検知された飽和は、オーディオ再生システムが備える１つ以上のスピーカおよび／またはヘッドフォンが動作それぞれの線形動作区間で動作することに対応するレベルで起きる、監視される振幅の飽和であり得る。

線形動作区間の上端／上限は、例えば、前節「Ｉ．概要‐チューニング」中の実施形態例において記載したように、次第に増加する振幅／パワーを伴う信号によるオーディオ再生システムの励起に際しての、オーディオ再生システムの出力音響信号のスペクトル成分／組成における突然の変化を検知することにより、決定され得る。

ある実施形態例によれば、当該方法は以下を包含し得る。すなわち、増加する振幅を伴う単一周波数のオーディオ信号に実質的に相当する、既定入力データ信号群のシーケンスによりオーディオ再生システムが励起される際に記録される出力音響信号を表現するデータを受信すること；前記受信データに基づき、オーディオ再生システムからの出力音響信号中の、ある周波数成分の振幅を監視すること（この監視される周波数成分は、前記単一周波数のオーディオ信号と同一周波数に実質的に局在している）；および、監視される振幅の飽和を検知して、オーディオ再生システム内におけるＤＲＣの存在を証明することである。言い換えれば、当実施形態例では、既定波形は単一周波数のオーディオ信号である。その他の実施形態例であって、その中では、前記既定波形が例えば複数の周波数成分を含むより合成的な信号であるようなもの、もまた想定される。

実施形態例において、コンピュータプログラム製品は、上記に提案されたＤＲＣの存在を検知するための方法のうちいずれかをコンピュータに実行させるための指令を備えるコンピュータ可読媒体を含み得る。

実施形態例において、オーディオ再生システム内におけるＤＲＣの存在を検知するためのダイナミックレンジ制御、すなわちＤＲＣ検知装置が提供される。オーディオ再生システムは、入力データ信号に応答して出力音響信号を供給するように構成され、そしてＤＲＣ検知装置は、増加する振幅を伴う単一周波数のオーディオ信号に実質的に相当する、入力データ信号によりオーディオ再生システムが励起される際に記録される出力音響信号を表現するデータを受信し；受信データに基づき、オーディオ再生システムからの出力音響信号中のある周波数成分の振幅を監視し（この監視される周波数成分は前記単一周波数のオーディオ信号と実質的に同一の周波数に局在している）；かつ、監視される振幅の飽和を検知してオーディオ再生システム内におけるＤＲＣの存在を証明するように、適応され得る。

ＩＩＩ．実施形態例
図１はある実施形態例による装置１６０を用いて周波数依存的減衰段１２２をチューニングするための構成例を示す、汎用ブロック図である。

当構成例において、オーディオ再生システム１２０は、オーディオ再生システム１２０により再生されるべきオーディオコンテンツを表現する入力データ信号１１０を受け取る。オーディオ再生システム１２０は、例えばモバイル装置中に含まれる消費者向けオーディオ再生システムであってもよいし、あるいは、例えばもっと大きな据付式オーディオ再生システムであってもよい。入力データ信号１１０は、例えばファイル記憶装置から、あるいは外部デジタル入力から再生され得る。もし、オーディオ再生システム１２０がモバイル装置中に含まれるならば、入力データ信号１１０は、例えば装置１６０からオーディオ再生システム１２０へと無線通信経由で送信され得る。

当構成例において、オーディオ再生システム１２０は、入力データ信号１１０に応答して出力音響信号１４０を供給する。音響トランスデューサ１５０は、例えば１つ以上のマイクであり、オーディオ再生システム１２０からの音響出力１４０を記録し、その記録された音響出力を表現するデータを当該装置１６０へと供給する。その受信データに基づき、装置１６０は、オーディオ再生システム１２０に連関する周波数依存的減衰段１２２を、オーディオ再生システム１２０中で発生する非線形歪みを抑制する目的でチューニングする。

当構成例において、オーディオ再生システム１２０は、処理段１２１、周波数依存的減衰段１２２、デジタルからアナログへの変換段１２３、増幅段１２４、及び１つ以上のスピーカ１２５またはヘッドフォンを含む。処理段１２１は、入力データ信号１１０に対する１つ以上の信号処理タスク、例えば入力データ信号１１０により表現されるオーディオ信号／チャンネルのミキシング、および／またはオーディオ再生システムのスピーカ１２５による音量応答を修正／均衡化するための等化を実行し得る。処理済み入力データ信号は、その後、周波数依存的減衰段１２２へと供給される。周波数依存的減衰段１２２の目的は、オーディオ再生システム１２０の残りの段内、例えば、デジタルからアナログへの変換段１２３、増幅段１２４、及びスピーカ１２５またはヘッドフォン、において生み出される非線形歪みの量を制御することである。処理済み入力データ信号に対して適正な減衰処理を適用することにより、（例えば、非線形歪みに対し感受性の高い／影響を受けやすい周波数区間中での大きな振幅を避けることにより）オーディオ再生システム１２０中で発生する非線形歪みは抑制されて、可聴な非線形歪みとオーディオ再生システム１２０の全体的ラウドネスとの間のトレードオフが成立し得る。周波数依存的減衰段１２２は、例えば、異なる周波数帯が互いに独立に減衰処理されるマルチバンドリミッタとして、あるいは、その内容を全て本願に援用する米国特許出願第２０１３／００１３０９６Ａ１号に記載のような、音色維持マルチバンドリミッタ（ｔｉｍｂｒｅ−ｐｒｅｓｅｒｖｉｎｇｍｕｌｔｉ−ｂａｎｄｌｉｍｉｔｅｒ）として実装され得る。周波数依存的減衰段１２２によるデータ信号出力は、その後、デジタルからアナログへの変換段１２３によりアナログ形式へと変換されて、さらに増幅段１２４により増幅された後、スピーカ１２５またはヘッドフォンへと与えられて、出力音響信号１４０として出力されることになる。

ある特定の音声再生システム１２０中で生み出される非線形歪みを制御するために、周波数依存的減衰段１２２は、特定の音声再生システム１２０の歪み挙動についての情報に基づいてチューニングされ得る。そのような情報は、装置１６０の実施形態例によって取得され得るものであり、図２を参照しながら以下に説明する。

図１に示されるオーディオ再生システム１２０は、装置１６０によってチューニング可能な周波数依存的減衰段に連関するオーディオ再生システムの一例であることに留意されたい。特に、装置１６０によってチューニング可能な周波数依存的減衰段は、図１に示されるオーディオ再生システム１２０とは異なる組合せの、処理段、変換段、および／または増幅段を含むオーディオ再生システムに連関してもよい。例えば、装置１６０によってチューニング可能な周波数依存的減衰段は、デジタルからアナログへの変換段１２３を有さないオーディオ再生システムに連関していてもよい。この場合の理由は例えば、入力データ信号１１０はアナログ入力から再生される（そして減衰処理はアナログの周波数依存的減衰段１２２により遂行される）から、あるいはスピーカ１２５はマイクロ電気機械システム（ＭＥＭＳ）を使用するデジタルスピーカとして実装されるからである。ある別の例では、オーディオ再生システムは処理段１２１を含まなくてもよい。

図２は汎用ブロック図であって、実施形態例による、周波数依存的減衰段１２２に連関するオーディオ再生システム１２０中で発生する非線形歪みの抑制を目的として周波数依存的減衰段１２２をチューニングするための装置１６０を示す。装置１６０は、既定入力データ信号１１０によるオーディオ再生システム１２０の励起に際し記録される出力音響信号１４０を表現するデータ１６１を受信するように適応された、受信部１６２を含む。例えば、装置１６０は、例えば有線または無線通信経由で、既定入力オーディオ信号１１０をオーディオ再生システム１２０へと提供するように適応されたインターフェース（図２には不図示）を含み得る。あるいは、既定入力オーディオ信号１１０は、オーディオ再生システム１２０により、ファイル記憶装置から再生されてもよいし、その他の装置から受信されてもよい。すると、装置１６０は既定入力オーディオ信号１１０についての情報を、例えば別個に受信される信号通信経由で、および／または受信データ１６１に基づいて取得し得る。出力音響信号１４０を表現するデータ１６１を記録する図１に示された音響トランスデューサ１５０は、例えば装置１６０中に含まれてもよいし、装置１６０とは別個に構成されてもよい。

第１の実施形態例によれば、装置１６０は、受信データ１６１に基づき非線形歪みの存在を検知すること、および、その検知された非線形歪みに対し心理音響補償を適応すること、を行うように適応された第１の歪み検知部１６３を含む。装置１６０はまた、その心理音響補償を受けた非線形歪みに基づいて周波数依存的減衰段１２２の制御のために適正な制御情報１７０を決定すること、を行うように適応された制御部１６４をも含む。もし例えば、周波数依存的減衰段１２２がマルチバンドリミッタであるならば、制御情報１７０は、そのマルチバンドリミッタによりそれぞれの周波数帯内で適用されるべき適正な閾値を示し得る。もし例えば、周波数依存的減衰段１２２が、その内容を全て本願に援用する米国特許出願第２０１３／００１３０９６Ａ１号に記載のタイプの音色温存マルチバンドリミッタであって、固定閾値と経時的に変化する閾値との両方を適用するならば、制御情報１７０は、例えば固定閾値につき適正値を示し得る。

第１の歪み検知部１６３の動作例が、第１の実施形態例により、これより図３〜５を参照しながら述べられる。図２に示される装置１６０のその他の実施形態例が、さらにそれより以下に述べられる。

図３は、非線形歪みを生じるオーディオ再生システム１２０が単一周波数オーディオ信号に相当する入力データ信号１１０により励起される際に生じる出力音響信号１４０のスペクトル例の両対数グラフを、概略的に示す。スペクトルは、図３において、周波数に対し振幅をプロットすることにより示されている。出力音響信号１４０には、単一周波数のオーディオ信号と実質的に同一の周波数に局在する第１の周波数成分３０１（ｃ₁とも表す）だけでなく、オーディオ再生システム１２０中の非線形歪みにより引き起こされて、単一周波数のオーディオ信号とは異なる他の周波数に位置する、いくつかの非線形歪み成分３０２〜３１０（ｃ_i（ｉ≧２）とも表す）もまた含まれる。図３に示される非線形歪み成分例３０２〜３１０は、単一周波数のオーディオ信号の周波数の整数倍上に位置する倍音歪み成分である。第１の歪み検知部１６３は、非線形歪み成分３０２〜３１０を、既定入力データ信号１１０により表現される単一周波数のオーディオ信号についての情報に基づいて検知し得る。そのように検知された非線形歪み成分３０２〜３１０の生成を抑制するために周波数依存的減衰段１２２をチューニングするのではなく、装置１６０は、むしろまず、非線形歪み成分３０２〜３１０が聴取者にどのように感じられるかを考慮する。特に、第１の周波数成分３０１のパワーと非線形歪み成分３０２〜３１０のパワー総計との間のパワー比

に基づいて周波数依存的減衰段１２２をチューニングするのではなく、以下に図４及び図５を参照しながら述べられるように、むしろ心理音響補償を最初にまず異なる成分群に対して適用する。上記のパワー比において、ＲＭＳ（ｃ）は成分ｃの２乗平均平方根、すなわち

を表し、これにより第１の周波数成分３０１のパワーはＲＭＳ（ｃ₁）²と表され得て、各非線形歪み成分のパワーはＲＭＳ（ｃ_i）²と表され得る。

図４では、図３に示されるスペクトルを、異なる周波数成分が代表的な（もしくは平均的な）人間聴取者により可聴／知覚可能であるための閾振幅を示す周波数依存の可聴性閾値３２０と、比較している。第１の実施形態例によると、第１の歪み検知部１６３は、検知された非線形歪みのスペクトル成分であって周波数依存の可聴性閾値３２０を下回るものを無視することにより、心理音響補償を適用する。例えば、非線形歪み成分３０６〜３１０のうちいくつかは、可聴性閾値３２０より上には届かず、無視される。

オプションとして、第１の歪み検知部１６３は、第１の周波数成分３０１の一部であって可聴性閾値３２０を下回る部分３０１ａを無視してもよいし、また、検知された非線形歪み成分３０２〜５の各一部であって可聴性閾値３２０を下回る部分３０２ａを無視してもよいし、そして例えば、任意の残りの処理手順において、第１の周波数成分３０１の残部３０１ｂと検知された非線形歪み成分３０２〜３０５の各残部３０２ｂのみを考慮してもよい。

あるいは、第１の歪み検知部１６３により適用される心理音響補償は、第１の周波数成分３０１と非線形歪み成分３０２〜３１０のパワー総計との間のパワー比

の生成に先立ち、第１の周波数成分３０１のパワーＲＭＳ（ｃ₁）²及び検知された非線形歪み成分３０２〜３０６のパワーＲＭＳ（ｃ_i）²の、可聴性閾値３２０に関する正規化として表現されてもよい。上記のパワー比において、Ｔｈ（ｆ（ｃ₁））及びＴｈ（ｆ（ｃ_i））は、それぞれ第１の周波数成分３０１及び非線形歪み成分３０２〜３１０が有する周波数ｆ（ｃ₁）及びｆ（ｃ_i）における可聴性閾値３２０の２乗平均平方根レベルを表す。なお、上記のパワー比における総計には、４つの非線形歪み成分３０２〜３０５のみが含まれることに留意されたい。その他の非線形歪み成分３０６〜３１０は可聴性閾値３２０より上には届かないからである。また、図３、図４、及び図５に示される非線形歪み成分３０２〜３１０は一例であり、任意の数の非線形歪み成分が音響出力信号１４０中に存在して上記のパワー比に含まれ得るような他のシナリオ例、が想定されることにさらに留意されたい。

第１の実施形態例により、制御部１６４は、制御パラメータ１７０の決定を、決定されたパワー比にもまた基づいて行うように適応される。例えば制御部１６４は、パワー比が許容レベルＴを上回り、検知された歪みが許容できないことを示しているときを決定する目的で、ある基準

を適用し得る。オーディオ再生システム１２０の音響出力１４０にそのような許容できない歪みが起きるのを避ける目的で、制御部１６４は例えば、周波数依存的減衰段１２２に、そのような許容レベルＴを上回る歪みを引き起こすものと検知された周波数と振幅との組合せを減衰させるための制御情報１７０を決定し得る。

周波数依存の可聴性閾値３２０は、例えば、受信データ１６１により表現される出力音響信号１４０の記録に関連して推定される音圧レベル１６９に基づいて較正され得る。例えば、適正な可聴性閾値を、様々な音圧レベルに関連付けられた可聴性閾値を含むルックアップテーブルから選ぶことによって較正され得る。例えば、音圧レベル１６９は、専用の音圧レベルメータにより測定／推定され得て、第１の歪み検知部１６３により受信され得る。あるいは、音響トランスデューサ１５０は、出力音響信号１４０の記録に先行して予め較正済みであってもよく、すると第１の歪み検知部１６３は、周波数依存の可聴性閾値３２０の較正を、音圧レベル較正済み音響トランスデューサの既知の特性に基づいて行うように適応され得る。

図５では、マスキング閾値３３０が、図４に示されるスペクトル内に含められているが、これは平均的な人間の聴取者により知覚される周波数マスキングを示している。第１の周波数成分３０１は、そのスペクトル近傍にある非線形歪み（そしてその他音声についても）に対し、マスキング効果を有し得る。同様に、非線形歪み成分３０２〜３１０は、そのスペクトル近傍にある他の非線形歪み成分に対し、マスキング効果を有し得る。従って、検知された非線形歪みのスペクトル成分であってマスキング閾値３３０を下回るものは、聴取者にとって聴取／知覚不能で有り得、例えば、周波数依存的減衰段１２２のチューニング時に無視されてもよい。それゆえ、第２の実施形態例によれば、第１の歪み検知部１６３は、マスキング閾値３３０を第１の周波数成分３０１に基づき推定し、第１の非線形歪み成分３０２がマスキング閾値３３０を上回ることを察知する。すると、検知部は、第１の非線形歪み成分３０２に起因するマスキングもまた考慮に入れながらマスキング閾値３３０を更新し、さらに第２の非線形歪み成分３０３が更新されたマスキング閾値３３０を上回ることを察知する。すると検知部は、第２の非線形歪み成分３０３に起因するマスキングもまた考慮に入れながらマスキング閾値３３０を更新し、さらに第３の非線形歪み成分３０４が更新されたマスキング閾値３３０を下回ることを察知する。第２の実施形態例によれば、第１の歪み検知部１６３は、少なくとも、マスキング閾値３３０を下回っている第３の非線形歪み成分３０４を無視することにより心理音響補償を適用する。第２の実施形態例によれば、第１の歪み検知部１６３は、その後、図４を参照しながら述べられたパワー比と同様のパワー比を生成するが、そこでは少なくとも第３の非線形歪み成分３０４は無視されている。その後、制御部１６４は、制御パラメータ１７０の決定を、決定済みのパワー比にもまた基づいて行う。

それぞれ図４及び図５を参照しながら述べた周波数依存の可聴性閾値３２０及びマスキング閾値３３０は、代表的な人間聴取者が備える既知の特性に基づき較正または推定され得る。音の知覚は聴取者が異なれば様々であり得るため、周波数依存の可聴性閾値３２０及びマスキング閾値３３０は、例えば、可聴（例えば、非常に高感度の聴力を備える聴取者にとって）であり得る非線形歪みが決して無視されることのないよう、十分に低く設定され得る。あるいは、重み付けが、検知された非線形歪み成分３０２〜１０に対し、パワー比生成に先行して適用されてもよい。重みは、各非線形歪み成分３０２〜１０の振幅が、周波数依存の可聴性閾値３２０および／またはマスキング閾値３３０をどの程度下回ってあるいは上回って広がるかに基づく。

全ての非線形歪み成分が等しく不快であるとは聴取者に感じられことは、典型的にはない。例えば第２倍音成分（すなわち、図３における第１の非線形歪み成分３０２）は、より高位の倍音成分（例えば、図３における非線形歪み成分３１０）に比べて、はるかに微妙な音響効果を有するものであると、しばしば報告される。よって、第１の歪み検知部１６３は、例えば、検知された非線形歪み成分３０２〜１０に対し倍音インデックスを割り当ててもよく、それから、第１の周波数成分３０１のパワーと非線形歪み成分３０２〜１０のパワー総計との間のパワー比生成に先立ち、非線形歪み成分３０２〜１０に対しそれぞれの倍音インデックスに基いて重みを適用し得る。

図４及び図５を参照しながら述べられた、周波数依存の可聴性閾値３２０および／またはマスキング閾値３３０を用いること、に代わる１つの方法は、聴取者に感じられる第１の周波数成分３０１と検知された非線形歪み成分３０２〜３１０との相対的ラウドネスを、評価することである。例えば、心理音響補償を適用することには、第１の周波数成分３０１のラウドネスと、検知された非線形歪み成分３０２〜３１０の結合的ラウドネスとを推定することが含まれ得る。制御部１６４は、例えば、制御情報１７０の決定を、推定されるラウドネス間の差異にもまた基づいて行うように適応され得る。ラウドネスを推定することには、例えば、Ａ荷重、Ｂ荷重、またはＣ荷重というような重みフィルタを用いることが含まれ得る。非線形歪み成分群の結合的ラウドネスは、例えば、ラウドネス総計法を用いて推定され得る。図３〜５を参照しながら以上に述べられた非線形歪みの解析は、例えば、各周波数帯からの既定入力データ信号１１０を用いることにより、異なる周波数帯につき反復され得る。また、検知部１６４は、例えば、各周波数帯毎の歪み特性に関する情報に基づいて制御情報１７０を決定し得る。

いくつかの実施形態例によれば、図２に示される装置１６０は、図３〜５を参照しながら述べられた心理音響解析法に追加して、１つ以上の歪み解析法を採用し得る。

非線形歪みの総量を推定するための方法は、比較的低周波数にある比較的狭帯域な励起信号を既定入力データ信号１１０として用い、音響応答１４０中の高周波エネルギーを推定し、そしてこれを既定の閾値と比較することである。もし音響応答１４０中において励起周波数の帯域幅を上回って無視できない信号エネルギーがあるならば、これは主として非線形歪みに起因するものと考えてよい。よって、ある実施形態例によれば、装置１６０は、既定入力データ信号１１０のスペクトル成分の範囲にわたる周波数範囲についての情報を取得すること、及び受信データ１６１のスペクトル成分であって周波数範囲を上回るものに基づいて非線形歪みを検知すること、を行うように適応された第２の歪み検知部１６５を含み得る。全体的な非線形歪みについてのそのような推定を行う際、特定の周波数成分の位置を突き止めることは必ずしも必要ではなく、所与の周波数領域内のエネルギー成分が、推定を行うために十分な入力データとなり得る。

特にスピーカにおいてありふれた歪み現象の１つは、本明細書では「ハードな歪み（ｈａｒｄｄｉｓｔｏｒｔｉｏｎ）」と呼ぶが、励起信号の振幅がある限度値を超えるときに起きる歪み量の突然の増加である。歪み量は、典型的には、この限度を下回る励起信号については比較的低いが、それを上回る励起信号については耐えられないほど高くなる。これは、特別なタイプの非線形利得応答だと考えられる。次第に増加する振幅を伴うオーディオ信号を表現する入力データ信号１１０をオーディオ再生システム１２０のための励起として使用して、装置１６０は、そのような限度の存在を示す音響応答１４０における突然のスペクトル変化を探索し、その限度に対応する入力利得値を推定し得る。特に、増加する振幅を伴う狭帯域信号を励起として用いれば、オーディオ再生システム１２０中でのハードな歪みについての限度値を周波数の関数として解析することが可能になる。音響応答１４０における突然のスペクトル変化は、例えば、応答信号のスペクトル中心および／またはケプストラム極大（例えば、ケプストラム最大）を監視することにより、検知され得る。従って、ある実施形態例により、装置１６０は、既定入力データ信号群のシーケンス１１０によるオーディオ再生システム１２０の励起に際して記録されるデータ１６１を受信するように適応され得る。但し、シーケンス中で連続する既定入力データ信号群１１０は、ある１つの既定波形を次第に増幅した波形群に相当する。当実施形態例によれば、装置１６０は、以下を行うように適応されたスペクトル組成解析部１６６を含み得る。すなわち、受信データ１６１に基づき、既定入力データ信号群のシーケンスによる励起の結果生じるオーディオ再生システム１２０の出力音響信号１４０のスペクトル組成を監視すること；監視されるスペクトル組成における突然の変化を検知すること；及び、検知された突然の変化に対応する既定波形の増幅値を決定することである。

もし例えば、既定入力データ信号群のシーケンス１１０の個々の要素が例えば無音を表すデータで時間的に区切られているならば、スペクトル組成解析部１６６は、オーディオ再生システム１２０の出力音響信号１４０のスペクトル組成の決定を、既定入力データ信号群のシーケンス１１０の各要素に対応する離散的時点において行うように適応され得るし、また、各時点において決定されるスペクトル組成値間に起こる突然の変化を検知するように適応され得る。

もし例えば、既定波形が単一の正弦波であるならば、既定入力データ信号群のシーケンス１１０は、例えば連続的に増加する振幅をもつ、単一の正弦信号の形でオーディオ再生システム１２０により受信され得る。またこのとき、オーディオ再生システム１２０の出力音響信号１４０のスペクトル組成は、例えば、スペクトル組成解析部１６６により既定入力データ信号群のシーケンス１１０の個々の要素に対応する離散時点上で監視／決定されるのではなく、むしろ連続的に監視され得る。

様々な周波数範囲を備える狭帯域信号群をオーディオ再生システム１２０のための励起として使用する代わりに、例えば音楽のような広帯域励起が使用されてもよく、するとこのとき、２チャンネル高速フーリエ変換に基づく解析法が、非線形歪み量を推定する目的で利用され得る。特に、オーディオ再生システム１２０の入出力信号間の整合性を測定することにより、入出力信号間の線形依存性の見積もりが得られる。応答中の非線形歪み生成物はノイズと同様に整合性値を低下させるが、その一方で、線形かつ経時不変なプロセスはそのような効果を有さない。故に、低ノイズ状況下では、整合性値の逆数が、広帯域励起信号の場合の非線形歪みの目安として使用され得る。従って、ある実施形態例によれば、装置１６０は、既定入力データ信号１１０と受信データ１４０との間の整合性を決定するように適応された相関性解析部１６７を含み得る。既定入力データ信号１１０と受信データ１６１との間の同期性を向上する目的で、相関性解析部１６７は、既定入力データ信号１１０と受信データ１６１との間の相互相関性を決定すること、決定された相互相関性に基づき既定入力データ信号１１０と受信データ１６１との間のサンプルレート差を推定すること、及び受信データ１６１を再サンプリングしたものに基づき整合性を決定すること、を行うように適応され得る。

いくつかの利用可能な音声再生システムは、図１に示されるオーディオ再生システム１２０の周波数依存的減衰段１２２に加えて、ダイナミックレンジ制御（ＤＲＣ）段を有する。これらのＤＲＣ段の内いくつかは迂回したり動作無効化したりできず、装置１６０による解析に適した「本来の意味の」非線形歪みとは類似しない、不快で可聴なアーチファクトを生成し得る。よって、装置１６０がオーディオ再生システム１２０中にビルトインされた任意のＤＲＣを検知可能で、かつそれに対し適切なやり方で対応可能であることは、有益となり得る。そのような対応とは、例えば、周波数依存的減衰段１２２に対し、リミッタ処理を一切適用しないように、すなわち、減衰処理を中断するように指令することにより行ってもよい。

従って、ある実施形態例によれば、装置１６０は、図６において増加する振幅を伴う正弦信号６０１〜６０４によって例示されるような、増加する振幅を伴う単一周波数オーディオ信号に実質的に相当する入力データ信号１１０により、オーディオ再生システム１２０が励起される際に記録されるデータ１６１を受信するように適応され得る。本実施形態例によれば、装置１６０は、受信データ１６１に基づきオーディオ再生システム１２０からの出力音響信号１４０中の、ある周波数成分の振幅を監視すること（但し、監視される周波数は単一周波数オーディオ信号６０１〜６０４と実質的に同一の周波数に局在する）、及び、監視される振幅の飽和を検知してオーディオ再生システム１２０内におけるＤＲＣの存在を証明すること、を行うように適応されたＤＲＣ検知部１６８を備え得る。単一周波数オーディオ信号６０１〜６０４の振幅は、図７ａにおいて一連の振幅値７０１ａ〜７０４ａとして示されている。監視される振幅、例えば、単一周波数オーディオ信号６０１〜６０４と実質的に同一の周波数に局在する、出力音響信号１４０中の周波数成分の振幅は、図７ｂにおいて、一連の振幅値７０１ｂ〜７０４ｂによって例示される。図７ａ及び７ｂに示されるように、入力振幅７０１ａ〜７０４ａは増加し、その一方で、監視される出力振幅７０１ｂ〜７０４ｂはレベル７１０で飽和する。制御部１６４は、例えば、ＤＲＣ検知部１６８による検知に応答し、周波数依存的減衰段１２２に減衰処理を中断させるための制御情報１７０を決定するように、適応され得る。

図６に示される正弦信号６０１〜６０４の他に、オーディオ再生システム１２０に対する励起として用いられる、増加する振幅を伴う単一周波数オーディオ信号に実質的に対応する入力データ信号１１０は、連続的に大きくなる正弦信号（時間的に分離された正弦信号６０１〜６０４ではなく）の形で提供されてもよい。そのような連続的に大きくなる正弦信号を励起とすれば、出力振幅は、ＤＲＣ検知部１６８によって連続的に監視され得て、その結果、図７に示される離散的な振幅値７０１ｂ〜７０４ｂではなくむしろ１つのカーブが得られる。

増加する振幅を伴う単一周波数オーディオ信号に実質的に相当する入力データ信号１１０により、オーディオ再生システム１２０が励起される際に記録されるデータ１６１を受信する代わりに、装置１６０は、ある既定入力データ信号群のシーケンスによるオーディオ再生システム１２０の励起に際して記録されるデータを受信するように、適応されてもよい。但し、シーケンス中で連続する既定入力データ信号群は、ある１つの既定波形を次第に増幅した波形群に相当する。既定波形は、例えば、図６に具体的に例示されるような単一の正弦信号であり得るが、より合成的な信号であってもよい。ＤＲＣ検知部１６８は、シーケンスによるオーディオ再生システム１２０の励起の結果生じるオーディオ再生システム１２０からの出力音響信号１４０の振幅を監視すること、及び、監視される振幅の飽和を検知し、オーディオ再生システム１２０内におけるＤＲＣの存在を証明すること、を受信データ１６１に基づいて行うように適応され得る。既定波形のスペクトル組成は、好ましくは装置１６０にとって既知で有ることにより、スピーカ１２５の線形動作範囲外での動作は出力音響信号１４０のスペクトル組成に基づき検知され得て、また、ＤＲＣの存在を証明する飽和は、スピーカの線形動作範囲外での動作に起因する飽和から区別され得ることとなる。

所与のオーディオ再生システム１２０について、典型的には、音響出力１４０において得ることが可能な振幅の上限が存在し、それはたとえＤＲＣがなくとも、例えば、増幅段および／またはスピーカにおける物理的制限の結果生じる。オーディオ再生システム１２０内にＤＲＣが存在することの証明となる検知された飽和とは、監視される振幅の飽和であって、そのような上限を下回るレベル７１０で起きるものを意味する。

いくつかの実施形態例によれば、ＤＲＣ検知部１６８は、音響出力１４０における信号対ノイズ比（ＳＮＲ）を推定するように適応され得る。例えば、単一周波数オーディオ信号と同一周波数のスペクトル成分を、非線形歪みのために存在し得る全ての倍音とともに取り除いた後に何が残るか、について考察することによってもよい。飽和の検知は、図７ａ及び７ｂを参照しながら述べられたように、高ＳＮＲの検知と組み合わせて、オーディオ再生システム１２０内におけるＤＲＣの存在を示し得る。従って、いくつかの実施形態例によれば、制御部１６４は、周波数依存的減衰段１２２に減衰処理を中断させるための制御情報１７０を、既定の閾値を上回り推定されるＳＮＲとＤＲＣ検知部１６８による飽和の検知とに応答して決定するように適応され得る。

図１０はある実施形態例による、オーディオ再生システム１２０内にＤＲＣが存在することを検知するための方法を示す、フローチャートである。この方法は、例えば、図１及び図２を参照しながら述べられたチューニング装置１６０のＤＲＣ検知部１６８において、あるいは、図１の構成によるチューニング装置１６０と全く同様に構成された別のＤＲＣ検知装置（但しＤＲＣ検知装置が制御情報１７０を減衰段１２２に提供するように構成されなくともよい）において、用いられ得る。本実施形態例によれば、当該方法は、既定入力データ信号群のシーケンスによるオーディオ再生システム１２０の励起に際して記録されるデータを受信する工程１０１０（シーケンス中で連続する既定入力データ信号群は、ある１つの規定波形を次第に増幅した波形群に相当する）と、受信データに基づき、シーケンスによるオーディオ再生システム１２０の励起の結果であるオーディオ再生システム１２０からの出力音響信号１４０の振幅を監視する工程１０２０と、を含む。本実施形態例によれば、当該方法は、監視される振幅の飽和を検知する工程１０３０と、飽和が検知された場合に（図１０においてＹで示される）検知された飽和がＤＲＣの存在を示唆／証明するかどうかを決定する工程１０４０と、を含む。検知された飽和がＤＲＣの存在を示す／証明するかどうかを決定する工程１０４０は、例えば、飽和が検知された振幅／エネルギー／パワーレベルを、オーディオ再生システム１２０の増幅段および／またはスピーカにおける物理的制限と対照して比較すること（上述）、および／または推定ＳＮＲが十分に高いかどうかについて考察すること（上述）を含み得る。もし、ある振幅／エネルギー／パワーレベルまでのオーディオ再生システム１２０の励起に対応する既受信データに基づいては如何なる飽和も検知されないならば、前記方法は、より高い振幅／エネルギー／パワーレベルによるオーディオ再生システム１２０の励起に対応するさらなるデータを受信する工程１０１０と、より高い振幅／エネルギー／パワーレベル上での飽和を検知する工程１０３０のための受信データを監視する工程１０２０と、に戻る（図１０ではＮで示される）。もし、検知された飽和がＤＲＣの存在を示す／証明する（図１０ではＹで示される）と工程１０４０で決定されれば、さらなる手順がこの決定に基づき得る。例えば、図２を参照しながら以上に述べたような、ＤＲＣの検知を例えば制御部１６４へと制御情報１７０の決定のために出力／発信する工程１０５０等である。オプションとして、もし検知された飽和がＤＲＣの存在を示す／証明すると工程１０４０で決定されれば、当該方法は、以前に励起として用いられたのとは異なる周波数の入力データ信号１１０によるオーディオ再生システム１２０の励起に際して記録される出力音響信号１４０を表現するデータを受信する工程１０１０へと戻ってもよい。異なる複数の励起周波数につき飽和が検知されれば、そのことは、オーディオ再生システム１２０内におけるＤＲＣの存在をいっそう強く示し得る。もし、検知された飽和はＤＲＣの存在を示さない／証明しない（図１０ではＮで示される）と工程１０４０で決定されれば、さらなる手順がこの決定に基づき得る。例えば、ＤＲＣの存在は（まだ）検知されていないことを出力／発信する工程１０６０等である。ＤＲＣを備えるいくつかのオーディオ再生システム１２０では、ＤＲＣの存在は、ある特定の周波数帯において、より容易に検知され得る。よって、もし検知された飽和はＤＲＣの存在を示し／証明しないと工程１０４０で決定されれば、前記方法は、例えば、以前に励起として用いられたのとは異なる周波数の入力データ信号１１０によるオーディオ再生システム１２０の励起に際して記録される出力音響信号１４０を表現するデータを受信する工程１０１０へと、戻り得る。

以上に、装置１６０が、第１の歪み検知部１６３に加えて、第２の歪み検知部１６５、スペクトル組成解析部１６６、相関性解析部１６７、および／またはＤＲＣ検知部１６８を含むようないくつかの実施形態例を、図２を参照しながら述べた。装置１６０がこれらの部の任意の組合せを含み、かつ、制御部１６４がそれら各部により決定される情報の任意の組合せに基づいて制御情報１７０を決定するような実施形態が、想定される。オーディオ再生システム１２０中で発生する非線形歪みに対する様々なタイプの解析に基づいて制御情報１７０を決定することにより、周波数依存的減衰段１２２のチューニングが改善され得るか、かつ／または、可聴な非線形歪みとオーディオ再生システム１２０の全体的ラウドネスとの間でより知覚的に魅力的なバランスが達成され得る。例えば、制御情報１７０は、各部１６３、１６５、１６６、１６７、１６８において取得される解析結果に重みを付けて組合せたものに基づき得る。

なお、第１の歪み検知部１６３、第２の歪み検知部１６５、スペクトル組成解析部１６６、相関性解析部１６７、及びＤＲＣ検知部１６８のうち少なくともいくつかは、異なるタイプの既定入力データ信号１１０をオーディオ再生システム１２０に対する励起として用い得ることに、留意されたい。従って、少なくともいくつかの実施形態例によれば、異なるタイプの既定入力データ信号群のシーケンス１１０がオーディオ再生システム１２０に提供されて、かつ、異なる部が各自の分析をお互いの後に、例えば異なる時点で、実行するように適応され得る。図２に図示される様々な部は、例えば、単一プロセッサの複数の機能として実装されてもよいし、また例えば、２つ以上の別々の物理単位／コンポーネント中に実装されてもよい。

もし、装置１６０が、例えば訓練を受けたチューニング担当者により取得された、装置応答例１４０及び対応する周波数依存的減衰段１２２の基準チューニングについての大きなデータベースを利用できるならば、例えばニューラルネットワークに基づく機械学習アプローチを用いて、周波数依存的減衰段１２２のチューニングのために適正な制御情報を見出だしてもよい。従って、ある実施形態例によれば、制御部は、制御情報の決定を、少なくとも、周波数依存的減衰段１２２に関する基準チューニングのセットに基づき機械学習を適用することによって行うように、適応され得る。例えば、装置１６０は、基準チューニングを格納する記憶部（図２には不図示）を含み得る。

少なくとも上記のいくつかの実施形態例中で述べられたように、図１に示す構成を用いた周波数依存的減衰段１２２のチューニングは、励起信号１１０の振幅を変化させること、及び、音響応答１４０を解析すること、を含み得る。図８は、周波数依存的減衰段１２２をチューニングするための代替構成例を示す汎用ブロック図である。ここで、チューニング中において、オーディオ再生システム１２０中で生み出される非線形歪みが周波数依存的減衰段１２２による影響を受けずに解析されるよう、周波数依存的減衰段１２２は迂回８０１され、すなわち、その減衰処理が中断され得る。

しかし、もしも周波数依存的減衰段１２２が単純なマルチバンドリミッタではなくて、米国特許出願第２０１３／００１３０９６Ａ１号（その内容を全て本願に援用する）に記載の音色維持マルチバンドリミッタのように、適用される減衰処理を例えば周波数域／帯同士間の相互作用に基づき変化させるための何らかの機能を有しているならば、図１に例示されるように、測定工程に周波数依存的減衰段１２２を含めて、そのパラメータを音響出力１４０を測定中に調整することが有益であり得る。この場合、励起信号１１０は、例えば定常信号であってもよい。なぜならば、周波数依存的減衰段１２２により提供される減衰処理を制御情報１７０を経由して調整することにより、生成される非線形歪みの量を様々に変化させ得るからである。従って、ある実施形態例によれば、装置１６０は、定常入力データ信号１１０によるオーディオ再生システム１２０の励起に際して記録されるデータ１６１を受信するように、適応され得る。また、周波数依存的減衰段１２２は、装置の制御部により決定される制御情報１７０に基づいて入力データ信号１１０を減衰処理すべく動作し得る。本実施形態例によれば、装置１６０は、周波数依存的減衰段１２２のチューニングを、受信データ１６１に基づき反復的に制御情報１７０を決定することによって行うように適応され得る。

オーディオ再生システム１２０中で発生する非線形歪みを解析する事に加えて、さらに、全ての周波数域がオーディオ再生システム１２０により音響出力信号１４０として発せられることが可能かどうかを推定することが、有益であり得る。例えば、オーディオ再生システム１２０の音響出力１４０中において可聴音声が得られない周波数域を、完全に減衰処理するように周波数依存的減衰段１２２をチューニングすることが、有益であり得る。なぜならば、そうすることにより、トランスデューサでの不必要なパワーロスを防ぎ得るし、しかも、追加的な歪み抑制へとつながり得るからである。ある周波数がオーディオ再生システム１２０により発せられ得るかどうかを推定するための１つのアプローチは、固定周波数正弦信号を励起１１０として使用し、励起１１０と音響応答１４０との間に生じる様々な遅延について励起１１０と音響応答１４０との間の相互相関関係を推定し、相互相関最大値が所定の閾値を超過するかどうかを確かめることである。

図９は、ある実施形態例による、周波数依存的減衰段１２２に連関したオーディオ再生システム１２０中で発生する非線形歪みの抑制を目的として周波数依存的減衰段１２２をチューニングするための方法、を示すフローチャートである。この方法は、既定入力データ信号１１０によるオーディオ再生システム１２０の励起に際して記録される出力音響信号１４０を表現するデータ１６１を受信する工程９０１と、受信データ１６１に基づき非線形歪みの存在を検知する工程９０２と、検知された非線形歪みに対し心理音響補償を適用する工程９０３と、心理音響補償を受けた非線形歪みに基づき周波数依存的減衰段１２２制御用に適正な制御情報１７０を決定する工程９０４と、を含む。

ＩＶ．均等物、拡張物、代替物、その他
本開示の更なる実施形態が、当該分野の当業者にとり、以上の明細書を熟読した後に明らかとなるであろう。当明細書及び図面は実施形態及び例を開示するが、本開示はこれら特定の例に限定されるわけではない。多数の修正や変更が、本開示の範囲から離れることなく為され得るのであって、その開示の範囲は、付属の請求項により定義される。それら請求項に現れるいかなる参照符号も、それら請求項の範囲を限定するものと考えられるべきではない。

さらに、開示された実施形態に対する変更は、図面、開示、及び末尾に添付の請求項を熟読することにより、本開示を実践しようとする当業者が理解して遂行し得る。請求項において、「含む（ｃｏｍｐｒｉｓｉｎｇ）」という言葉は、その他の要素や手順を排除しない。また、不定冠詞「ある／１つの（ａ）」や「ある／１つの（ａｎ）」は、複数を排除しない。あるいくつかの手段が互いに相異なる従属の請求項で規定されているという単なる事実が、これらの方法の組合せて有利に用い得ないことを示唆することはない。

以上の本明細書中に開示された装置及び方法は、ソフトウェア、ファームウェア、ハードウェア、またはそれらの組合せとして実装され得る。ハードウェアによる実装において、以上の明細書中で言及された機能的ユニット間でのタスク分割は、必ずしも物理的単位への分割に相当しない。逆に、１つの物理的部品は複数の機能性を有することがあり、また１つのタスクは互いに協力し合う数個の物理的部品により実行されることがある。特定のいくつかの部品あるいは全ての部品は、デジタル信号プロセッサまたはマイクロプロセッサにより実行されるソフトウェアとして実装されるか、もしくは、ハードウェアとしてまたは特定用途向けＩＣとして実装され得る。そのようなソフトウェアは、コンピュータ可読媒体に乗せて配信され得て、それら媒体は、コンピュータ記憶媒体（すなわち非一時的媒体）及び通信媒体（すなわち一時的媒体）を含み得る。当該分野の当業者には周知のとおり、コンピュータ記憶媒体という用語には、情報の格納のための任意の方法や技術を用いて実装される揮発性／不揮発性、リムーバブル／非リムーバブルの両方の媒体が含まれ、例えば、コンピュータ可読指令、データ構造、プログラムモジュール、またはその他のデータのようなものが挙げられる。コンピュータ記憶媒体には、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリまたはその他のメモリ技術、ＣＤ‐ＲＯＭ、デジタル多用途ディスク（ＤＶＤ）またはその他の光学ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶またはその他の磁気記憶装置、もしくは、望まれる情報を格納するために使用可能かつコンピュータによりアクセス可能であるその他の任意媒体が含まれるが、それらに限定されない。さらに、当業者には周知のことであるが、通信媒体とは、典型的にはコンピュータ可読指令、データ構造、プログラムモジュール、もしくは、例えば搬送波またはその他の運搬機構のような変調データ信号内にあるその他のデータ、を体現するものであり、そこには任意の情報配送媒体が含まれる。

Claims

周波数依存的減衰段を、前記周波数依存的減衰段に連関したオーディオ再生システム中で発生する非線形歪みを抑制するためにチューニングするための装置であって、前記オーディオ再生システムは、入力データ信号に応答して出力音響信号を供給するように構成されており、
既定入力データ信号による前記オーディオ再生システムの励起に際して記録される出力音響信号を表現するデータを、受信するように適応された受信部と、
前記受信データに基づいて非線形歪みの存在を検知し、前記検知された非線形歪みに対して、前記検知された非線形歪みが聴取者にどのように感じられるかを左右する心理音響効果を補償する心理音響補償を適用するように適応された第１の歪み検知部と、
前記心理音響補償を受けた非線形歪みに基づいて前記周波数依存的減衰段を制御するために、制御情報を決定するように適応された制御部と、
を備え、
前記第１の歪み検知部は、少なくとも、前記検知された非線形歪みのスペクトル成分であって、異なる周波数成分が聴取者により可聴または知覚可能であるための閾振幅を示す周波数依存の可聴性閾値を下回るものを無視することによって心理音響補償を適用するように適応された、装置。
前記第１の歪み検知部は、前記周波数依存の可聴性閾値を、前記受信データにより表現される前記出力音響信号の記録に関連して推定される音圧レベルに基づいて較正するように適応された、請求項１に記載の装置。
周波数依存的減衰段を、前記周波数依存的減衰段に連関したオーディオ再生システム中で発生する非線形歪みを抑制するためにチューニングするための装置であって、前記オーディオ再生システムは、入力データ信号に応答して出力音響信号を供給するように構成されており、
既定入力データ信号による前記オーディオ再生システムの励起に際して記録される出力音響信号を表現するデータを、受信するように適応された受信部と、
前記受信データに基づいて非線形歪みの存在を検知し、前記検知された非線形歪みに対して、前記検知された非線形歪みが聴取者にどのように感じられるかを左右する心理音響効果を補償する心理音響補償を適用するように適応された第１の歪み検知部と、
前記心理音響補償を受けた非線形歪みに基づいて前記周波数依存的減衰段を制御するために、制御情報を決定するように適応された制御部と、
を備え、
前記第１の歪み検知部は、少なくとも以下により心理音響補償を適用するように適応された装置：
前記既定入力データ信号の第１の周波数成分を取得すること、
前記第１の周波数成分に基づき、前記第１の周波数成分の近傍について、聴取者により知覚される周波数マスキングを示すマスキング閾値を推定すること、及び
前記非線形歪みのスペクトル成分であって前記マスキング閾値を下回るものを無視すること。
前記第１の歪み検知部は以下のことを行うように適応された、請求項１から３のいずれかに記載の装置：
前記既定入力データ信号の第１の周波数成分を取得すること、及び
前記受信データに基づき、前記第１の周波数成分に対応する非線形歪み成分群を検知すること。
前記第１の歪み検知部は、前記第１の周波数成分と実質的に同一の周波数に局在する、前記受信データのスペクトル成分のパワーと、前記非線形歪み成分群のパワー総計との、パワー比を決定するように適応されており、かつ、前記制御部は、前記制御情報の決定を前記パワー比に基づいて行うように適応されている、請求項４に記載の装置。
前記第１の歪み検知部は、少なくとも、前記パワー比の生成に先立ち、前記受信データの前記スペクトル成分のパワー及び前記非線形歪み成分群のパワーを、異なる周波数成分が聴取者により可聴または知覚可能であるための閾振幅を示す周波数依存の可聴性閾値に関して正規化することによって、心理音響補償を適用するように適応された、請求項５に記載の装置。
前記第１の歪み検知部は、心理音響補償の適用を、少なくとも以下の手段によって行うように適応された、請求項４から６のいずれかに記載の装置：
前記非線形歪み成分群に対し、倍音インデックスを割り当てること、及び
前記非線形歪み成分群に対し、前記倍音インデックスに基づき、重みを適用すること。
前記第１の歪み検知部は、少なくとも前記受信データの前記スペクトル成分のラウドネス及び前記非線形歪み成分群の、ラウドネス総計法を用いて推定される結合的ラウドネスを推定することによって心理音響補償を適用するように適応されており、かつ、前記制御部は、前記制御情報の決定を、前記推定されるラウドネス間の差異にもまた基づいて行うように適応されている、請求項４に記載の装置。
請求項１から８のいずれかに記載の装置であって、
前記既定入力データのスペクトル成分の範囲にわたる周波数範囲を取得すること、及び
前記受信データのスペクトル成分であって前記周波数範囲を上回るものに基づく非線形歪みを検知すること、
を行うように適応された第２の歪み検知部を備え、
前記制御部は、前記制御情報の決定を、前記第２の歪み検知部により検知される前記非線形歪みにもまた基づいて行うように適応されている、装置。
請求項１から９のいずれかに記載の装置であって、既定入力データ信号群のシーケンスによるオーディオ再生システムの励起に際して記録されるデータを受信するように適応されており、前記シーケンス中で連続する既定入力データ信号群は、ある１つの既定波形を次第に増幅した波形群に相当し、前記装置は、
前記受信データに基づき、前記既定入力データ信号群のシーケンスによる励起の結果である、前記オーディオ再生システムの出力音響信号のスペクトル組成を監視すること、
前記監視されるスペクトル組成における突然の変化を検知すること、及び
前記検知された突然の変化に対応する前記既定波形の増幅値を決定すること、
を行うように適応されたスペクトル組成解析部を備え、
前記制御部は、前記制御情報の決定を、前記スペクトル組成解析部により決定される前記増幅値にもまた基づいて行うように適応されている、装置。
前記既定入力データ信号と前記受信データとの間の整合性を決定するように適応された相関性解析部を含み、前記制御部は、前記制御情報の決定を、前記相関性解析部により決定される整合性の値にもまた基づいて行うように適応されている、請求項１から１０のいずれかに記載の装置。
前記相関性解析部は以下のことを行うように適応された、請求項１１に記載の装置：
前記既定入力データ信号と前記受信データとの間の相互相関性を決定すること、
前記決定される相互相関性に基づき、前記既定入力データ信号と前記受信データとの間のサンプルレート差を推定すること、及び
前記受信データを再サンプリングしたものに基づき、前記整合性を決定すること。
請求項１から１２のいずれかに記載の装置であって、既定入力データ信号群のシーケンスによるオーディオ再生システムの励起に際して記録されるデータを受信するように適応されており、前記シーケンス中で連続する既定入力データ信号群は、ある１つの既定波形を次第に増幅した波形群に相当し、前記装置は、
前記受信データに基づき、前記シーケンスによる前記オーディオ再生システムの励起の結果である、前記オーディオ再生システムからの前記出力音響信号の振幅を監視すること、及び、
前記監視される振幅の飽和を検知し、前記オーディオ再生システム内におけるＤＲＣの存在を証明すること、
を行うように適応されたダイナミックレンジ制御、すなわち、ＤＲＣ検知部を備え、
前記制御部は、前記制御情報の決定を、前記ＤＲＣ検知部による前記検知結果にもまた基づいて行うように適応されている、装置。
前記制御部は、前記周波数依存的減衰段に減衰処理を中断させるための制御情報を、前記ＤＲＣ検知部による前記検知に応答して決定できるように適応された、請求項１３に記載の装置。
請求項１から９のいずれかに記載の装置であって、定常入力データ信号による前記オーディオ再生システムの励起に際して記録されるデータを受信するように適応されており、前記装置は、前記オーディオ再生システムに含まれかつ前記装置の前記制御部により決定される前記制御情報に基づいて前記入力データ信号を減衰処理するように動作し得る周波数依存的減衰段をチューニングするように適応されており、前記装置は、前記周波数依存的減衰段のチューニングを、前記受信データに基づき前記制御情報を反復的に決定することによって行うように適応されている、装置。
前記制御部は、前記制御情報の決定を、少なくとも、前記周波数依存的減衰段についての基準チューニングのセットに基づき機械学習を適用することによって行うように適応された、請求項１から１５のいずれかに記載の装置。
請求項１から１６のいずれかに記載の装置であって、以下をさらに備える装置：
前記既定入力データ信号を、前記オーディオ再生システムに提供するように適応された、インターフェース。
請求項１から１７のいずれかに記載の装置であって、以下をさらに備える装置：
前記オーディオ再生システムからの音響出力を記録し、そのデータを前記受信部に提供するように適応された、音響トランスデューサ。
周波数依存的減衰段を、前記周波数依存的減衰段に連関したオーディオ再生システム中で発生する非線形歪みを抑制するためにチューニングするための方法であって、前記オーディオ再生システムは、入力データ信号に応答して出力音響信号を供給するように構成されている、以下を含む方法：
既定入力データ信号による前記オーディオ再生システムの励起に際して記録される、出力音響信号を表現するデータを受信する工程、
前記受信データに基づき、非線形歪みの存在を検知する工程、
前記検知された非線形歪みに対して、前記検知された非線形歪みが聴取者にどのように感じられるかを左右する心理音響効果を補償する心理音響補償を適用する工程であって、前記検知された非線形歪みのスペクトル成分であり、異なる周波数成分が聴取者により可聴または知覚可能であるための閾振幅を示す周波数依存の可聴性閾値を下回るものを無視することによって前記心理音響補償を適用する工程、及び
前記心理音響補償を受けた非線形歪みに基づき、前記周波数依存的減衰段を制御するために制御情報を決定する工程。
周波数依存的減衰段を、前記周波数依存的減衰段に連関したオーディオ再生システム中で発生する非線形歪みを抑制するためにチューニングするための方法であって、前記オーディオ再生システムは、入力データ信号に応答して出力音響信号を供給するように構成されている、以下を含む方法：
既定入力データ信号による前記オーディオ再生システムの励起に際して記録される、出力音響信号を表現するデータを受信する工程、
前記受信データに基づき、非線形歪みの存在を検知する工程、
前記検知された非線形歪みに対して、前記検知された非線形歪みが聴取者にどのように感じられるかを左右する心理音響効果を補償する心理音響補償を適用する工程であって、前記心理音響補償を適用する工程は、
前記既定入力データ信号の第１の周波数成分を取得すること、
前記第１の周波数成分に基づき、前記第１の周波数成分の近傍について、聴取者により知覚される周波数マスキングを示すマスキング閾値を推定すること、及び
前記非線形歪みのスペクトル成分であって前記マスキング閾値を下回るものを無視することを含み、及び
前記心理音響補償を受けた非線形歪みに基づき、前記周波数依存的減衰段を制御するために制御情報を決定する工程。
コンピュータに請求項１９または２０に記載の方法を実行させるための指令を備えるコンピュータ可読媒体を含む、コンピュータプログラム製品。