JP6436934B2 - 動的閾値を用いた周波数帯域圧縮 - Google Patents

動的閾値を用いた周波数帯域圧縮 Download PDF

Info

Publication number
JP6436934B2
JP6436934B2 JP2016134973A JP2016134973A JP6436934B2 JP 6436934 B2 JP6436934 B2 JP 6436934B2 JP 2016134973 A JP2016134973 A JP 2016134973A JP 2016134973 A JP2016134973 A JP 2016134973A JP 6436934 B2 JP6436934 B2 JP 6436934B2
Authority
JP
Japan
Prior art keywords
frequency band
distortion
threshold
estimate
band component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016134973A
Other languages
English (en)
Other versions
JP2016195439A5 (ja
JP2016195439A (ja
Inventor
ジェイ. シーフェルドット,アラン
ジェイ. シーフェルドット,アラン
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2016195439A publication Critical patent/JP2016195439A/ja
Publication of JP2016195439A5 publication Critical patent/JP2016195439A5/ja
Application granted granted Critical
Publication of JP6436934B2 publication Critical patent/JP6436934B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/16Automatic control
    • H03G5/165Equalizers; Volume or gain control in limited frequency bands
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03FAMPLIFIERS
    • H03F3/00Amplifiers with only discharge tubes or only semiconductor devices as amplifying elements
    • H03F3/181Low-frequency amplifiers, e.g. audio preamplifiers
    • H03F3/183Low-frequency amplifiers, e.g. audio preamplifiers with semiconductor devices only
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/008Visual indication of individual signal levels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03FAMPLIFIERS
    • H03F2200/00Indexing scheme relating to amplifiers
    • H03F2200/03Indexing scheme relating to amplifiers the amplifier being designed for audio applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Power Engineering (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

関連出願への相互参照
本願は2013年4月29日に出願されたAlan J. Seefedtによる「歪み可聴性モデルに基づく動的閾値を用いた、歪み低減マルチ帯域圧縮器」という名称の本願と同時係属中であり同一被譲渡者の米国仮特許出願第61/817,175号(代理人整理番号D13064USP1)の優先権を主張するものである。同出願の内容は参照により、あらゆる目的についてその全体において組み込まれる。
技術分野
本特許開示は概括的にはオーディオ呈示に、詳細には呈示の際の歪み低減に関する。
スマートフォンおよびタブレットのようないくつかのオーディオ再生装置は限られた出力能力をもつ増幅器およびスピーカーを含む。そのような装置では、オーディオ再生は知覚的に歪められることがあり、呈示中に再生レベルが上げられるとしばしば鋭く歪められることがある。歪みの特性はしばしば再生装置にとって周波数依存である。たとえば、テレビジョン・キャビネットは特定の周波数で共鳴応答を示すことがある。この共鳴応答は、その特定の周波数における出力信号が特定のレベルに達するかそれを超えるときに励起され、わずらわしいガタガタ音を生じる。
歪みを低減し、再生装置での再生レベルを最大化しようとするために、マルチ帯域圧縮が再生前のオーディオ信号に適用されることができる。信号の各周波数帯域について歪み閾値が指定される。圧縮器は、各帯域における信号レベルが対応する歪み閾値を超えないことを保証するよう、各帯域に独立な利得を適用する。
入力オーディオ信号に応じて圧縮器の閾値を動的に調整する技法を実装するシステム、装置、方法およびコンピュータ可読記憶媒体のいくつかの例が開示される。いくつかの実装では、いくつかの周波数帯域成分をもつ入力信号が処理される。それらの周波数帯域成分に応じて、時間変化する閾値が決定されることができる。各時間変化する閾値は一般に、それぞれの周波数帯域成分に対応する。圧縮器が、各周波数帯域成分に対して、前記対応する時間変化する閾値をもつ圧縮動作を実行して、いくつかの利得を生成する。ここで、各利得はそれぞれの周波数帯域成分に対応する。各利得は、遅延された対応する周波数帯域成分に適用されて、いくつかの処理された帯域成分を生成し、それらの処理された帯域成分は加算されて出力信号を生成する。
いくつかの実装では、出力信号の知覚されるスペクトルの時間変化する推定値が決定される。また、知覚されるスペクトル推定値によって誘起される歪みスペクトルの時間変化する推定値が、たとえば歪みモデルの応答に従って決定される。知覚されるスペクトル推定値の存在における歪みスペクトル推定値の可聴性指標が予測される。時間変化する閾値は、予測された可聴性指標に従って調整されることができる。
いくつかの実装では、可聴性指標を予測することは、知覚されるスペクトル推定値からマスキング閾値を計算し;歪みスペクトル推定値とマスキング閾値との間の差を決定し;決定された差の正の値を合計して予測された可聴性指標を生成することを含む。マスキング閾値は、知覚されるスペクトル推定値に基づくトーン性スペクトルを参照して計算されることができる。トーン性スペクトルは、トーン的な周波数帯域成分からノイズ的な周波数帯域成分を区別するトーン性値を含む。合計される、決定された差の正の値は、一つまたは複数の上の周波数帯域成分および一つまたは複数の下の周波数帯域成分が、該上および下の帯域成分の間の周波数帯域成分より低い重みをもつよう重み付けされることができる。
いくつかの実装では、時間変化する閾値は、少なくとも部分的には、固定された名目閾値に従って決定される。このように、各時間変化する閾値は、対応する周波数帯域成分に従ってかつそれぞれの固定した閾値に従って決定されることができる。これらの実装において、歪みの予測される可聴性指標は規格化されることができる。時間変化する閾値は、一つまたは複数の固定した閾値を参照して、かつオフセット値に適用される規格化された可聴性指標に従って上げられたり下げられたりすることができる。
いくつかの実装では、入力オーディオ信号に応答して圧縮閾値を動的に調整する装置は、上記の動作の一部または全部を実行させるよう動作可能な一つまたは複数のコントローラを含む。さらに、そのような装置は、前記入力信号をフィルタリングして前記周波数帯域成分を生成することができるフィルタリング・モジュールおよびいくつかの帯域通過フィルタを含むマルチ帯域フィルタを含むことができる。ここで、各帯域通過フィルタはそれぞれの周波数帯域成分に対応する。本装置は、前記出力信号を受領し、増幅して増幅された出力信号を生成するよう結合された一つまたは複数の増幅器と、増幅された出力信号を受領して再生するよう結合された一つまたは複数のスピーカーとを含むこともできる。
いくつかの実装では、上記の動作の一部または全部を実行させるようコンピューティング装置によって実行可能な命令を記憶する非一時的なコンピュータ可読記憶媒体。コンピューティング装置の限定しない例は、サーバーおよびデスクトップ・コンピュータならびにスマートフォン、タブレット、携帯型音楽プレーヤーなどといった携帯型ハンドヘルド装置を含む。いくつかの事例では、一つまたは複数のサーバーが、クラウド・ベースのサービスの一部として、開示される技法の一つまたは複数を使って入力オーディオ信号を処理し、処理された出力信号をインターネットを通じてユーザーの装置にストリーミングするよう構成されることができる。
含まれる図面は例解目的のためであり、開示される発明のシステム、装置、方法およびコンピュータ可読記憶媒体についての可能な構造および動作の例を提供するだけのものである。これらの図面はいかなる意味でも、開示される実装の精神および範囲から外れることなく当業者によってなされうる形および細部におけるいかなる変化をも制限するものではない。
いくつかの実装に基づく、入力オーディオ信号に応じて圧縮器の閾値を動的に調整する歪み可聴性モデル(DAM: distortion audibility model)を組み込む圧縮器100の例を示している。 いくつかの実装に基づいて実行される、入力オーディオ信号に応じて圧縮器の閾値を動的に調整する方法200の例を示す図である。 いくつかの実装に基づいて実行される、入力オーディオ信号に応じて圧縮器の閾値を動的に調整する方法300の別の例を示す図である。 いくつかの実装に基づいて実行される、知覚されるスペクトル推定値の存在において歪みスペクトル推定値の可聴性指標を予測する方法400の例を示す図である。 Aは、いくつかの実装に基づく、表示装置に表示される入力オーディオ信号の周波数帯域成分のエネルギー・レベルのグラフィック表現500Aの例を示す。Bは、いくつかの実装に基づく、表示装置に表示される、聴取者によって知覚される推定された出力信号スペクトルの対応するエネルギー・レベルのグラフィック表現500Bの例を示す。 いくつかの実装に基づく、オーディオ信号を呈示するための圧縮器100を組み込む再生システム600の例を示す図である。
入力オーディオ信号に応じて圧縮器の閾値を動的に調整する技法を実装するシステム、装置、方法およびコンピュータ可読記憶媒体のいくつかの例が開示される。開示される技法のいくつかは、マルチ帯域圧縮器によって適用されることのできる動的閾値を決定するための歪み可聴性モデルを組み込む。歪み可聴性モデルは、動的な信号依存の仕方で、入力信号の存在におけるその入力信号によって誘起される歪みの知覚される可聴性を予測するよう構成される。この予測される可聴性は、圧縮器の閾値を動的に修正するために使用されることができる。こうして、開示される技法を組み込むいくつかの装置およびシステムは、最小限の知覚される歪みをもって増大した再生レベルに対応できる。
いくつかの実装では、歪み可聴性モデルは、聴取者に聞こえる信号スペクトルの時間変化する推定値およびその信号によって誘起される歪みスペクトルの時間変化する推定値を予測するよう構成される。その際、歪み可聴性モデルは、信号スペクトル推定値の存在における、この歪みスペクトル推定値の可聴性を予測する。このようにして、圧縮器の一つまたは複数の時間変化する閾値がしかるべく動的に変調されることができる。
圧縮閾値の動的な調整のための開示される技法は、他の圧縮プロセスとの関連で使われてもよく、スマートフォン、タブレット、ラップトップ・コンピュータ、携帯型音楽プレーヤー、テレビジョン、モニタおよびサーバー・ベースのシステムといったさまざまな装置およびシステムにおいて実装されることができる。
開示される技法を実装するいくつかの装置およびシステムは、音色、つまり等しいラウドネスおよびピッチの二つの音が異なるように知覚されうる聴取者知覚の属性を知覚できるほどに変えてしまう通常のマルチ帯域圧縮器に対して改善する。ある種の周波数が歪み閾値に達し、他の周波数が達しないとき、いくつかの通常の圧縮器は、これらの周波数の間の相対バランスを変更することによって不都合を導入してしまう。結果として得られる音は、異常なものとして現われ、不自然な聴取体験につながる。
さらに、利得が積極的すぎる場合には、再生レベルは不必要に低減されることがある。各帯域における閾値が、その帯域を中心とする狭帯域信号についての知覚される歪みをなくすよう設定されれば、広帯域信号が圧縮器を通過することから帰結する減衰はしばしば、任意の誘起される歪みを知覚的に消去するために必要とされるよりも強い。これは、広帯域信号は、該広帯域信号が誘起する歪みの一部を有意にマスクすることがありうる一方、狭帯域信号はその誘起される歪みをマスクする効果がずっと弱いことがありうるという事実のためである。
図1は、入力オーディオ信号に応じて圧縮器の閾値を動的に調整するための歪み可聴性モデル(DAM)を組み込む圧縮器100の例を示している。図1では、フィルタバンク104の形のフィルタリング・モジュールが入力オーディオ信号x[n]を受領する。フィルタバンク104は、入力信号x[n]をフィルタリングして入力信号x[n]をいくつかの周波数帯域成分x1[n]〜xB[n]に分離するよう構成されている。いくつかの実装では、フィルタバンク104は、B個の帯域通過フィルタとして実装されるマルチ帯域フィルタとして構成される。ここで、各帯域通過フィルタがそれぞれの周波数帯域成分に対応する。たとえば、フィルタバンク104の各帯域bは、式(1)
xb[n]=hb[n]*x[n] b=1…B (1)
に表わされるように入力信号x[n]を帯域通過フィルタ応答hb[n]と畳み込みしたものとして計算される周波数帯域成分xb[n]を出力するよう構成されることができる。
図1において、DAM 108はフィルタバンク104から出力される周波数帯域成分x1[n]〜xB[n]を受領するよう結合された入力をもつ。DAM 108に提供される各周波数帯域成分xb[n]は、図1に示されるように、それぞれの固定した圧縮閾値Lbと対にされる。DAM 108は、時間変化する閾値D1[n]〜DB[n]を計算して出力するよう構成される。いくつかの実装では、時間変化する閾値Db[n]は、それぞれの周波数帯域成分xb[n]の関数として計算される。いくつかの他の実装では、各帯域について独立に計算されるのではなく、各時間変化する閾値Db[n]は、式(2)
Db[n]=DAM({xi[n],Li|i=1…B}) (2)
に表わされるように、諸帯域b=1…Bにわたるすべての周波数帯域成分x1[n]〜xB[n]および固定した閾値Lbの関数として計算される。
各周波数帯域成分xb[n]は、それぞれの時間変化する閾値Db[n]とともに圧縮関数(CF: compression function)112に入力として与えられる。該時間変化する閾値は、それより上でその帯域bにおける信号が歪みを生じはじめるレベルを表わす。各圧縮関数112bは、式(3)
gb[n]=CF(xb[n],Db[n]) (3)
に表わされるように、周波数帯域成分xb[n]および時間変化する閾値Db[n]を処理して時間変化する利得gb[n]を生成するよう構成される。これは、帯域bをその限界閾値Lbより下に保つための利得を表わす。
周波数帯域成分x1[n]〜xB[n]全部の遅延されたバージョンにそれらの対応する利得信号g1[n]〜gB[n]を乗算したものを合計することによって、処理された出力信号y[n]が計算される。図1では、乗算器ユニット116は利得信号を遅延された周波数帯域成分に乗算して(yb[n]=gb[n]xb[n−d])処理された帯域成分y1[n]〜yB[n]を生成するよう構成されている。これらの処理された帯域成分が次いで加算ユニット120において合計されて出力信号y[n]を生じる。たとえば、遅延dは、利得信号の計算に関連する任意の処理遅延を考慮に入れるよう設計されることができる。式(4)は、処理された信号y[n]の生成の表現を表わしている。
Figure 0006436934
図2は、いくつかの実装に基づいて実行される、入力オーディオ信号に応じて圧縮器の閾値を動的に調整する方法200の例を示している。図2は、図1の例を参照して記述される。図2の204において、上記で説明したように、周波数帯域成分x1[n]〜xB[n]がDAM 108への入力として受領される。208では、DAM 108が周波数帯域成分x1[n]〜xB[n]に従って時間変化する閾値D1[n]〜DB[n]を決定する。212では、各CF 112bは、対応する時間変化する閾値Db[n]を使って対応する周波数帯域成分xb[n]に対して圧縮動作を実行して利得g1[n]〜gB[n]を生成するよう構成される。216では、各利得gb[n]は、たとえば乗算器ユニット116を使って、対応する周波数帯域成分xb[n]の遅延されたバージョンに適用され、処理された帯域成分y1[n]〜yB[n]を生成する。220では、処理された帯域成分y1[n]〜yB[n]は加算ユニット120において加算されて出力信号y[n]を生成する。次いでこれがメモリ装置に記憶されるおよび/または追加的な処理モジュールに提供されることができる。
図3は、いくつかの実装に基づいて実行される、入力オーディオ信号に応じて圧縮器の閾値を動的に調整する方法300のもう一つの例を示している。方法300の動作304〜320は上記の方法200の動作204〜220と実質的に同じである。図3では、出力信号y[n]の生成に続いて、324において、聴取者に聞こえる出力信号y[n]のパワースペクトルの時間変化する推定値が推定されることができる。この目的に向け、平滑化動作が処理された帯域成分y1[n]〜yB[n]に適用されることができる。たとえば、各処理された帯域成分yb[n]=gb[n]xb[n−d]が高速アタック/低速リリース一極平滑化器(fast-attack/slow-release one pole smoother)を用いて平滑化されることができる。sb[n]は、聴取者によって知覚される出力信号スペクトルの推定値を表わし、式(5)において計算される。
Figure 0006436934
圧縮閾値のその後の変調から生じるアーチファクトを軽減するために、いくつかの事例では、利得g1[n]〜gB[n]のアタックおよびリリースを支配するために式(5)において使われるものよりやや速いアタックおよびやや遅いリリースを利用することが望ましいことがある。そのような事例では、聴取者によって知覚される推定された出力信号スペクトルは、式(6)
Sb[n]=10log10(sb[n]) (6)
に示されるように、デシベル(dB)で表わされることができる。
図3では、328において、知覚されるスペクトル推定値sb[n]によって誘起される歪みスペクトルの時間変化する推定値が決定される。たとえば、sb[n]によって再生システムにおいて誘起される歪みは、sb[n]を歪み生成モデルに入力することによって推定できる。そのようなモデルは、個々の再生システムを測定し、特徴付けることによって生成されてもよい。いくつかの場合には、小型スピーカーをもつ装置についての一般化されたモデルが十分であり、帯域bにおける信号が、bを含めb以上のすべての帯域に、帯域bにおける信号レベルより何らかの固定オフセットだけ下のレベルで歪みを誘起すると想定する。
いくつかの実装では、任意の所与の帯域における歪みスペクトル推定値は、その帯域中に生成される歪みの、すべての帯域にわたる最大によって与えられる。こうして、第一の周波数帯域成分の第一の推定された歪みは、第一の周波数帯域成分中におよび前記第一の周波数帯域成分より高い周波数の周波数帯域成分の少なくとも一部に誘起される歪みの最大として決定されることができる。これは、任意の単一の帯域が一般に、当該帯域を含む当該帯域以上の諸帯域に歪みを生成するからである。図1および図2との関係で上記したように時間変化する閾値のはたらきをする歪みスペクトル推定値D1[n]〜DB[n]は、最低帯域から始まって最高帯域まで逐次的な仕方で計算されうる。これは式(7)に例解される。ここで、固定オフセットDoffsetについての値の例は40dBである。
Figure 0006436934
図3では、332において、知覚されるスペクトル推定値sb[n]の存在における歪みスペクトル推定値Db[n]の可聴性指標が、たとえば図1のDAM 108を使って予測される。後述する図4は、この可聴性指標を予測するための技法の例を示す。
図3では、336において、時間変化する閾値の一つまたは複数が、予測された可聴性指標A[n]に従って調整される。いくつかの実装では、予測された可聴性指標A[n]は規格化され、時間変化する閾値Db[n]の一つまたは複数が、固定した諸閾値Lbの一つまたは複数を参照して、かつオフセット値に適用される規格化された可聴性指標に従って、上げられたり下げられたりする。たとえば、予測された可聴性指標は、時間変化する閾値D1[n]〜DB[n]を変調するために利用される前に、式(8)に示されるように、0と1の間に規格化されることができる。
Figure 0006436934
式(8)の例において、規格化限界は、規格化された予測された可聴性指標Anorm[n]が0に等しいときは誘起される歪みが出力信号によってよくマスクされ、Anorm[n]が1に等しいときは歪みが可聴性の縁にあるよう、選ばれる。したがって、Anorm[n]が0に等しいときは、時間変化する閾値D1[n]〜DB[n]はよりラウドな再生を許容するよう上げられることができるが、Anorm[n]が1に等しいときは、閾値D1[n]〜DB[n]はそれらの名目値のままとなる。よって、閾値D1[n]〜DB[n]は
Db[n]=Lb+(1−Anorm[n])Loffset (9)
に従って固定した閾値Lbから計算できる。
式(9)において、Anorm[n]が0に等しいときは、閾値Db[n]はLoffset dBだけその名目値より上に上げられる。ある事例では、Loffsetを6dBの範囲に設定すると、歪みの知覚される増大はなしに、広帯域の信号についての知覚されるラウドネスにおける知覚的な実質的な増大を与えた。他の事例では、Loffsetは特定の再生装置に合わせて調整された。
図4は、いくつかの実施形態に基づいて実行される、知覚されるスペクトル推定値の存在において歪みスペクトル推定値の可聴性指標を予測する方法400の例を示している。404では、マスキング閾値Mb[n]が知覚されるスペクトル推定値sb[n]から計算される。マスキング閾値Mb[n]についての一つのモデルは、知覚されるスペクトル推定値より固定オフセットMoffset低いというものである。これは式(10)
Mb[n]=Sb[n]−Moffset (10)
において示される。ここで、Moffsetについての値の例は10dBである。
あるいはまた、マスキング信号のトーン性の関数としてのマスキングの可変性を考慮に入れるマスキング・モデルが使用されてもよい。トーン的な信号のマスキング能力はノイズ的な信号より有意に低いことが一般に知られている。よって、マスキング閾値Mb[n]は、sb[n]に基づいてトーン性スペクトルを参照して計算されることができる。トーン性スペクトルは、ノイズ的な周波数帯域成分をトーン的な周波数帯域成分から区別するトーン性値を含む。各帯域におけるsb[n]のトーン性を、トーン性スペクトルTb[n]を生成するための既知の技法を使って特徴付けてもよい。ここで、Tb[n]は0から1まで変わる。0はノイズ的な信号を示し、1はトーン的な信号を示す。このトーン性スペクトルを利用して、マスキング閾値は式(11)
Mb[n]=Sb[n]−(Tb[n]Mtone+(1−Tb[n])Mnoise) (11)
に表わされるように計算されてもよい。
ある試験事例において、Mtone=30dBおよびMnoise=10dBが適切な値の例であった。これはノイズ的信号よりトーン性信号について20dB低いマスキングを与える。
図4では、408において、諸帯域にわたって歪みスペクトル推定値Db[n]がマスキング閾値Mb[n]と比較され、Db[n]とMb[n]との間の差があればそれを決定する。412では、決定された差のあらゆる正の値が加算されて、予測された可聴性指標A[n]を生成する。いくつかの実装では、A[n]は、式(12)に示されるように、Db[n]とMb[n]との間の差の正の値の重み付けされた和として計算される。
Figure 0006436934
式(12)において、いくつかの実装では、重み付けWbは知覚的に動機付けされて、高周波数帯域および低周波数帯域が中間周波数帯域より低く重み付けされてもよい。
いくつかの他の実装では、明示的な歪み生成およびマスキング・モデルを利用するのではなく、歪み可聴性の指標が信号スペクトルSb[n]の関数から推定されてもよい。一つのそのような例は、式(13)に示されるような、諸帯域にわたるこのスペクトルの標準偏差である。
Figure 0006436934
標準偏差が小さいときは、すべての帯域の値はほぼ同じである。つまり、Sb[n]は大まかに広帯域である。この場合、Sb[n]は歪みをそこそこよくマスクするはずである。標準偏差が比較的大きい場合には、Sb[n]の値は有意に変動するということであり、スペクトルにおける、歪みが可聴となる「穴」の可能性を示す。結果として、式(13)における値A[n]はごく大まかに、式(12)での値の振る舞いに一致する。式(13)からの可聴性値は次いで、歪み生成およびマスキング・モデルで使われたのとは異なる規格化限界をもって式(8)に従って規格化され、次いで式(9)におけるように、閾値Db[n]を変調するために利用されてもよい。
図5のAは、いくつかの実装に基づく、表示装置に表示される、入力オーディオ信号の周波数帯域成分のエネルギー・レベルのグラフィック表現500Aの例を示す。図5のBは、いくつかの実装に基づく、表示装置に表示される、聴取者によって知覚される推定された出力信号スペクトルの対応するエネルギー・レベルのグラフィック表現500Bの例を示す。
図5のAおよびBの例では、図1の圧縮器100は上記のように入力オーディオ信号x[n]を処理する。図5のAでは、入力信号の20個の周波数帯域成分x1[n]〜x20[n]が図1のフィルタバンク104によって生成され、人間の聴覚の知覚的な分解能を模倣するよう離間される。図1の圧縮関数112の入力となる各周波数帯域成分xb[n]の信号エネルギーは、図5のAにおけるバー504によって表わされる。上記のように計算された各周波数帯域成分についての時間変化する閾値D1[n]〜D20[n]はクリアなセグメント508によって表わされる。圧縮関数112から出力される利得g1[n]〜g20[n]はセグメント512によって描かれる。
図5のBでは知覚されるスペクトル推定値S1[n]〜S20[n]のエネルギー・レベルがバー514によって表わされる。上記のように知覚されるスペクトル推定値sb[n]から計算されたマスキング閾値M1[n]〜M20[n]は図5のBではセグメント516によって表わされる。図1のDAM 108によって生成された時間変化する閾値D1[n]〜D2[n]は図5のBにおけるクリアなセグメント520によって表わされる。図1では、DAM 108は図5のBの時間変化する閾値D1[n]〜D20[n] 520を、圧縮器100を通じて再生されるオーディオ信号の存在において聴取者によって知覚される何らかの誘起された歪みが生じる前に、可能な最大レベルまで増大させる。一般に、広帯域信号については、時間変化する閾値D1[n]〜D20[n]は、それらの名目上設定されたレベルLbより上まで増大させられる。誘起される歪みがあったとしてもそのかなりの部分を信号自身がマスクするからである。狭帯域信号については、時間変化する閾値はそれらの名目レベルの近くに留まる可能性が高い。何らかの誘起される歪みに対して信号がほとんどマスキングをもたらさないからである。
図6は、いくつかの実装に基づく、オーディオ信号を呈示するための圧縮器100を組み込む再生システム600の例を示す図である。図6では、コントローラ604が上記の圧縮器100を実装するよう構成される。たとえば、図2〜図4を参照して上記した動作の一つまたは複数がコントローラ604によって実行されることができるまたはコントローラ604によって実行されるようにされることができる。コントローラ604は、下記でより詳細に説明するように幅広い多様な異なる構成をもつことができる。さらに、コントローラ604は、図6の場合におけるようにユーザー装置上に実装されることができるし、あるいは場合によっては一つまたは複数のサーバー上に実装されることができる。
図6に示したものに対する代替例として、コントローラ604を実装するサーバーが、オーディオをユーザーの装置に、好適なネットワークを通じてストリーミングすることができる。当業者は、そのようなネットワークがサーバーと、スマートフォンまたはタブレットのようなユーザー装置との間の通信を提供することを理解するはずである。ネットワークは、たとえば、TCP/IPベースのネットワーク、テレコミュニケーション・ネットワーク、無線ネットワーク、ケーブル・ネットワーク、公共ネットワーク、私設ネットワーク、広域ネットワーク、ローカル・エリア・ネットワーク、インターネット、ワールドワイドウェブ、イントラネット、エクストラネットなどを含む幅広い多様なネットワーク環境の任意の部分集合または組み合わせであることができる。
図6に戻ると、再生システム600は、圧縮器100から出力信号y[n]を受領してy[n]をアナログ信号に変換するよう結合されたデジタル‐アナログ変換器(DAC)608を含む。DAC 608はこの例ではコントローラ604の一つの処理モジュールとして実装されているが、当業者はDAC 608がコントローラ604とは別個のユニットとして、場合によってはコントローラ604が位置しているサーバーまたはユーザーの装置から別個の装置として構築されることができることを理解するはずである。
図6では、前置増幅器612が、DAC 608によって出力されるアナログ信号の信号強度を受領し、ブーストするよう結合されている。電流感応前置増幅器、寄生容量前置増幅器、電荷感応前置増幅器またはそれらの何らかの組み合わせといったさまざまな型の前置増幅器が使用されることができる。当業者は、いくつかの代替例では前置増幅器612がシステム600から省略できることを理解するはずである。
図6では、電力増幅器616は前置増幅器612からのブーストされた信号を受領し、増幅して、一つまたは複数のスピーカー620を駆動するのに好適な増幅された出力信号を生成するよう結合されている。前置増幅器612がシステム600から省略される状況では、電力増幅器616が、統合された増幅器で置換されてもよい。システム600の増幅器およびスピーカーは、上記のようなユーザーの装置のコンポーネントであることができる。いくつかの実装では、ユーザーの装置と一体のまたはユーザーの装置に接続された別個の装置の形のディスプレイが制御されて、図5のAおよびBに呈示した情報のような、前記出力信号の諸周波数帯域および前記信号を特徴付ける他の情報を示すグラフィック・データを表示することができる。他のいくつかのシナリオでは、図6の増幅器612およびスピーカー620は公共アナウンス(PA: public address)システム、劇場もしくはコンサート・サウンド・システムまたはステレオもしくはホームシアター・システムのような家庭システムの一部である。
本稿に記載した技法は、一つまたは複数のコンピューティング装置によって実装されることができる。たとえば、特殊目的コンピューティング装置のコントローラが、開示される動作を実行するようまたはそのような動作を実行させるよう固定結線されてもよく、動作を実行するまたは動作を実行させるよう持続的にプログラムされた一つまたは複数の特定用途向け集積回路(ASIC)またはフィールド・プログラマブル・ゲート・アレイ(FPGA)のようなデジタル電子回路を含んでいてもよい。いくつかの実装では、カスタムの固定結線論理、ASICおよび/またはFPGAでカスタム・プログラミングをもつものが組み合わされて上記技法を達成する。
他のいくつかの実装では、汎用コンピューティング装置が、ファームウェア、メモリ、他の記憶またはその組み合わせの中のプログラム命令に従って開示される動作の一つまたは複数を実行させるようプログラムされたコントローラを含むことができる。汎用コンピューティング装置の例は、サーバー、ネットワーク装置およびスマートフォン、タブレット、ラップトップ、デスクトップ・コンピュータ、携帯型メディアプレーヤー、他のさまざまな携帯型ハンドヘルド装置のようなユーザー装置ならびに開示される動作を実装するまたは該動作を実装および実行させるデータ処理ハードウェアおよび/またはプログラム論理を組み込む他の任意の装置を含む。コンピューティング装置は、モニタ、プリンタまたは本稿で言及される結果の任意のものをユーザーに提供するための他の好適なディスプレイを含んでいてもよい。
本稿での用法では、用語「記憶媒体」および「記憶メディア」は、コンピュータまたは機械の型に特定の仕方で動作させるデータおよび/または命令を記憶する任意の媒体を指す。本稿に記載されるモデル、モジュール、ユニット、エンジンおよび動作の任意のものは、任意の好適なコンピュータ言語を使ってコントローラのプロセッサによって実行可能なソフトウェア・コードとして実装されてもよいし、そのようなソフトウェア・コードによって実装されるようにされてもよい。ソフトウェア・コードは、記憶および/または伝送のためのコンピュータ可読媒体上の一連の命令またはコマンドとして記憶されてもよい。好適なコンピュータ可読媒体の例は、ランダム・アクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、ハードドライブまたはフロッピーディスクのような磁気媒体、コンパクトディスク(CD)またはDVD(デジタル多用途ディスク)のような光学式媒体、半導体ドライブ、フラッシュ・メモリおよび他の任意のメモリ・チップまたはカートリックを含む。コンピュータ可読媒体は、そのような記憶デバイスの任意の組み合わせであってもよい。ソフトウェア/プログラム・コードをエンコードされたコンピュータ可読媒体は、上記のようなユーザー装置またはサーバーのような互換な装置と一緒にパッケージングされてもよいし、あるいは他の装置とは別個に提供されてもよい。任意のそのようなコンピュータ可読媒体は、単一のコンピューティング装置の上もしくは中にまたはコンピュータ・システム全体の上または中に存在してもよく、システムまたはネットワーク内の他にもあるコンピュータ可読媒体のうちのものであってもよい。
記憶媒体は、伝送媒体とは異なるが、伝送媒体との関連で使われてもよい。伝送媒体は記憶媒体の間で情報を転送することに参加する。たとえば、伝送媒体は同軸ケーブル、銅線および光ファイバーを含む。伝送媒体は、音響波または光波、たとえば電波および赤外線データ通信の際に生成されるものの形を取ることもできる。
本稿において具体的なコンピューティング・パラダイムおよびソフトウェア・ツールを参照したにもかかわらず、開示される技法はハードウェアおよびソフトウェアのいかなる特定の組み合わせにも、コンピューティング装置またはデータ処理装置によって実行される命令のいかなる特定の源にも限定されない。さまざまな実装のベースとなるプログラム命令は幅広い多様なプログラミング言語、ソフトウェア・ツールおよびデータ・フォーマットの任意のものに対応してもよく、任意の型の非一時的なコンピュータ可読記憶媒体もしくはメモリ・デバイス(単数または複数)に記憶されてもよく、多様なコンピューティング・モデルに従って実行されてもよい。コンピューティング・モデルは、たとえば、クライアント/サーバー・モデル、ピアツーピア・モデル、スタンドアローン・コンピューティング装置上またはさまざまな機能が異なる位置で実施されるまたは用いられる分散コンピューティング・モデルに従うことを含む。さらに、本稿における具体的なプロトコルへの言及は、単に例である。当業者に既知の好適な代替が用いられてもよい。
本稿での用法での用語「スピーカー」は、単に例として、エンクロージャー内に設けられた直接放射型エレクトロダイナミック・ドライバを組み込むラウドスピーカー、ホーン・ラウドスピーカー、圧電型スピーカー、磁歪スピーカー、静電ラウドスピーカー、リボン型および平面型ラウドスピーカー、屈曲波ラウドスピーカー、フラット・パネル・ラウドスピーカー、分散モード・ラウドスピーカー、ハイル(Heil)空気動トランスデューサ、プラズマ・アーク・スピーカー、デジタル・スピーカーおよびそれらの任意の組み合わせを含むことができる。
本願の主題はその個別的な実装を参照して具体的に示され、記述されてきたが、当業者は、本開示の精神および範囲から外れることなく開示される実装の形および詳細における変更ができることを理解するであろう。これらの実装のいくつかの例は付属の図面に示されており、その十全な理解を与えるために個別的な詳細が記載されている。こうした個別的な詳細の一部または全部なしでも実装が実施されうることは注意しておくべきである。さらに、よく知られた特徴は明確さを増進するために詳細には記述されなかったことがある。最後に、本稿でいくつかの実装を参照して利点が論じられているが、範囲はそのような利点への言及によって限定されるべきではないことは理解されるであろう。むしろ、範囲は、付属の請求項を参照して決定されるべきである。
いくつかの態様を記載しておく。
〔態様1〕
入力オーディオ信号に応じて圧縮器の閾値を動的に調整する方法であって:
複数の周波数帯域成分をもつ入力オーディオ信号を受領する段階と:
前記複数の周波数帯域成分に応じて、複数の時間変化する閾値を決定する段階であって、各時間変化する閾値はそれぞれの周波数帯域成分に対応する、段階と;
圧縮器によって、各周波数帯域成分に対して、前記対応する時間変化する閾値をもつ圧縮動作を実行して、複数の利得を生成する段階であって、各利得はそれぞれの周波数帯域成分に対応する、段階と;
各利得を、遅延された対応する周波数帯域成分に適用して、複数の処理された帯域成分を生成する段階と;
前記処理された帯域成分を加算して出力信号を生成する段階とを含む、
方法。
〔態様2〕
前記出力信号の知覚されるスペクトルの時間変化する推定値を決定する段階と;
前記知覚されるスペクトル推定値によって誘起される歪みスペクトルの時間変化する推定値を決定する段階と;
前記知覚されるスペクトル推定値の存在における前記歪みスペクトル推定値の可聴性指標を予測する段階と;
前記時間変化する閾値の一つまたは複数を、予測された可聴性指標に従って調整する段階とをさらに含む、
態様1記載の方法。
〔態様3〕
前記歪みスペクトル推定値は、前記知覚されるスペクトル推定値に対する歪みモデルの応答に従って決定される、態様2記載の方法。
〔態様4〕
前記歪みスペクトル推定値は、第一の周波数帯域成分の第一の推定された歪みを含み、前記第一の推定された歪みは、前記第一の周波数帯域成分におよび前記第一の周波数帯域成分より高い周波数の周波数帯域成分の少なくとも一部に誘起される歪みの最大として決定される、態様3記載の方法。
〔態様5〕
前記知覚されるスペクトル推定値の決定は:
前記処理された帯域成分に平滑化処理を適用することを含む、
態様2ないし4のうちいずれか一項記載の方法。
〔態様6〕
前記知覚されるスペクトル推定値の存在における前記歪みスペクトル推定値の可聴性指標を予測する段階が、
前記知覚されるスペクトル推定値からマスキング閾値を計算し;
前記歪みスペクトル推定値と前記マスキング閾値との間の差を決定し;
決定された差の正の値を合計して前記の予測された可聴性指標を生成することを含む、
態様2ないし5のうちいずれか一項記載の方法。
〔態様7〕
前記マスキング閾値は、前記知覚されるスペクトル推定値に基づくトーン性スペクトルを参照して計算され、前記トーン性スペクトルは、トーン的な周波数帯域成分からノイズ的な周波数帯域成分を区別するトーン性値を含む、態様6記載の方法。
〔態様8〕
合計される、決定された差の正の値は、一つまたは複数の上の周波数帯域成分および一つまたは複数の下の周波数帯域成分が、該上および下の帯域成分の間の周波数帯域成分より低い重みをもつよう重み付けされる、態様6または7記載の方法。
〔態様9〕
前記出力信号の知覚されるスペクトルの標準偏差として歪みの可聴性指標を予測し;
前記予測された可聴性指標に従って前記時間変化する閾値の一つまたは複数を調整することをさらに含む、
態様1記載の方法。
〔態様10〕
前記時間変化する閾値はさらに、複数の固定閾値に従って決定される、態様1ないし8のうちいずれか一項記載の方法。
〔態様11〕
各時間変化する閾値は、周波数帯域成分に従ってかつ前記複数の固定閾値に従って決定される、態様10記載の方法。
〔態様12〕
各時間変化する閾値は、前記対応する周波数帯域成分に従ってかつ対応する固定閾値に従って決定される、態様10記載の方法。
〔態様13〕
歪みの可聴性指標を予測し;
予測された可聴性指標を規格化し;
前記固定閾値の一つまたは複数を参照して、かつオフセット値に適用される前記の規格化された可聴性指標に従って、前記時間変化する閾値の一つまたは複数を上げるまたは下げることを含む、
態様10記載の方法。
〔態様14〕
前記出力信号のデータを記憶媒体上に記憶する段階をさらに含む、
態様1ないし13のうちいずれか一項記載の方法。
〔態様15〕
態様1記載の動作を実行させるよう動作可能な一つまたは複数のコントローラを有する、入力オーディオ信号に応じて圧縮閾値を動的に調整する装置。
〔態様16〕
前記一つまたは複数のコントローラが、態様2ないし14のうち一つまたは複数に記載の動作の一つまたは複数を実行させるようさらに動作可能である、態様15記載の装置。
〔態様17〕
前記入力オーディオ信号をフィルタリングして前記複数の周波数帯域成分を生成することができるフィルタリング・モジュールをさらに有する、
態様15または16記載の装置。
〔態様18〕
前記フィルタリング・モジュールが、複数の帯域通過フィルタを有するマルチ帯域フィルタを有し、各帯域通過フィルタはそれぞれの周波数帯域成分に対応する、態様17記載の装置。
〔態様19〕
前記出力信号を受領するよう結合された一つまたは複数の増幅器をさらに有し、前記一つまたは複数の増幅器は、前記出力信号を増幅して、増幅された出力信号を生成することができる、態様15ないし18のうちいずれか一項記載の装置。
〔態様20〕
前記出力信号または前記増幅された出力信号を受領するよう結合されたディスプレイ装置をさらに有し、前記ディスプレイ装置は、前記受領された信号に関連するグラフィック・データを表示することができる、態様19記載の装置。
〔態様21〕
入力オーディオ信号に応じて圧縮器の閾値を動的に調整するために方法を実行させるようコンピューティング装置によって実行可能な命令を記憶しており、前記方法が態様1記載の動作を含む、非一時的なコンピュータ可読記憶媒体。
〔態様22〕
前記方法がさらに、態様2ないし14のうち一つまたは複数に記載の一つまたは複数の動作を含む、態様21記載の非一時的なコンピュータ可読記憶媒体。

Claims (20)

  1. 入力オーディオ信号に応じて圧縮器の閾値を動的に調整する方法であって:
    複数の周波数帯域成分をもつ入力オーディオ信号を受領する段階と:
    前記複数の周波数帯域成分に応じて、複数の閾値を決定する段階であって、各閾値はそれぞれの周波数帯域成分に対応する、段階と;
    周波数帯域成分に対して、前記対応する閾値を使って動作を実行して、複数の利得を生成する段階であって、各利得はそれぞれの周波数帯域成分に対応する、段階と;
    各利得を、対応する周波数帯域成分に適用して、複数の処理された周波数帯域成分を生成する段階と;
    前記処理された周波数帯域成分の知覚されるスペクトルの時間変化する推定値を決定する段階と;
    前記知覚されるスペクトル推定値によって誘起される歪みスペクトルの時間変化する推定値を決定する段階と;
    前記知覚されるスペクトル推定値の存在における前記歪みスペクトル推定値の可聴性指標を予測する段階と;
    前記閾値の一つまたは複数を、予測された可聴性指標に従って調整する段階とを含む、
    方法。
  2. 前記歪みスペクトル推定値は、前記知覚されるスペクトル推定値に対する歪みモデルの応答に従って決定される、請求項1記載の方法。
  3. 前記歪みスペクトル推定値は、第一の周波数帯域成分の第一の推定された歪みを含み、前記第一の推定された歪みは、前記第一の周波数帯域成分におよび前記第一の周波数帯域成分より高い周波数の周波数帯域成分の少なくとも一部に誘起される歪みの最大として決定される、請求項2記載の方法。
  4. 前記知覚されるスペクトル推定値の決定は:
    前記処理された周波数帯域成分に平滑化処理を適用することを含む、
    請求項1ないし3のうちいずれか一項記載の方法。
  5. 前記知覚されるスペクトル推定値の存在における前記歪みスペクトル推定値の可聴性指標を予測する段階が、
    前記知覚されるスペクトル推定値からマスキング閾値を計算し;
    前記歪みスペクトル推定値と前記マスキング閾値との間の差を決定し;
    決定された差の正の値を合計して前記の予測された可聴性指標を生成することを含む、
    請求項1ないし4のうちいずれか一項記載の方法。
  6. 前記マスキング閾値は、前記知覚されるスペクトル推定値に基づくトーン性スペクトルを参照して計算され、前記トーン性スペクトルは、トーン的な周波数帯域成分からノイズ的な周波数帯域成分を区別するトーン性値を含む、請求項5記載の方法。
  7. 合計される、決定された差の正の値は、一つまたは複数の上の周波数帯域成分および一つまたは複数の下の周波数帯域成分が、該上および下の帯域成分の間の周波数帯域成分より低い重みをもつよう重み付けされる、請求項5または6記載の方法。
  8. 前記閾値は時間変化する閾値である、請求項1ないし7のうちいずれか一項記載の方法。
  9. 各時間変化する閾値は、周波数帯域成分に従ってかつ対応する固定閾値に従って決定される、請求項8記載の方法。
  10. 各時間変化する閾値は、前記対応する周波数帯域成分に従ってかつ対応する固定閾値に従って決定される、請求項9記載の方法。
  11. 歪みの可聴性指標を予測し;
    予測された可聴性指標を規格化し;
    前記固定閾値の一つまたは複数を参照して、かつオフセット値に適用される前記の規格化された可聴性指標に従って、前記時間変化する閾値の一つまたは複数を上げるまたは下げることを含む、
    請求項8記載の方法。
  12. 前記出力信号のデータを記憶媒体上に記憶する段階をさらに含む、
    請求項1ないし11のうちいずれか一項記載の方法。
  13. 請求項1記載の方法を実行するよう構成された装置。
  14. 請求項2ないし12のうちいずれか一項記載の方法を実行するよう構成された装置。
  15. 前記入力オーディオ信号をフィルタリングして前記複数の周波数帯域成分を生成することができるフィルタリング・モジュールをさらに有する、
    請求項13または14記載の装置。
  16. 前記フィルタリング・モジュールが、複数の帯域通過フィルタを有するマルチ帯域フィルタを有し、各帯域通過フィルタはそれぞれの周波数帯域成分に対応する、請求項15記載の装置。
  17. 前記出力信号を受領するよう結合された一つまたは複数の増幅器をさらに有し、前記一つまたは複数の増幅器は、前記出力信号を増幅して、増幅された出力信号を生成することができる、請求項13ないし16のうちいずれか一項記載の装置。
  18. 前記出力信号または前記増幅された出力信号を受領するよう結合されたディスプレイ装置をさらに有し、前記ディスプレイ装置は、前記受領された信号に関連するグラフィック・データを表示することができる、請求項17記載の装置。
  19. ンピューティング装置に請求項1記載の方法を実行させるための命令を記憶している非一時的なコンピュータ可読記憶媒体。
  20. コンピューティング装置に請求項2ないし12のうちいずれか一項記載の方法を実行させるための命令を記憶している非一時的なコンピュータ可読記憶媒体。
JP2016134973A 2013-04-29 2016-07-07 動的閾値を用いた周波数帯域圧縮 Active JP6436934B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201361817175P 2013-04-29 2013-04-29
US61/817,175 2013-04-29

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016510698A Division JP5969727B2 (ja) 2013-04-29 2014-04-14 動的閾値を用いた周波数帯域圧縮

Publications (3)

Publication Number Publication Date
JP2016195439A JP2016195439A (ja) 2016-11-17
JP2016195439A5 JP2016195439A5 (ja) 2017-05-25
JP6436934B2 true JP6436934B2 (ja) 2018-12-12

Family

ID=50687733

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2016510698A Active JP5969727B2 (ja) 2013-04-29 2014-04-14 動的閾値を用いた周波数帯域圧縮
JP2016134973A Active JP6436934B2 (ja) 2013-04-29 2016-07-07 動的閾値を用いた周波数帯域圧縮

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2016510698A Active JP5969727B2 (ja) 2013-04-29 2014-04-14 動的閾値を用いた周波数帯域圧縮

Country Status (6)

Country Link
US (1) US9762198B2 (ja)
EP (1) EP2992605B1 (ja)
JP (2) JP5969727B2 (ja)
CN (2) CN105164918B (ja)
HK (3) HK1215108A1 (ja)
WO (1) WO2014179021A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2992605B1 (en) * 2013-04-29 2017-06-07 Dolby Laboratories Licensing Corporation Frequency band compression with dynamic thresholds
EP3223279B1 (en) * 2016-03-21 2019-01-09 Nxp B.V. A speech signal processing circuit
US10225654B1 (en) * 2017-09-07 2019-03-05 Cirrus Logic, Inc. Speaker distortion reduction
US11322170B2 (en) 2017-10-02 2022-05-03 Dolby Laboratories Licensing Corporation Audio de-esser independent of absolute signal level
US10827265B2 (en) * 2018-01-25 2020-11-03 Cirrus Logic, Inc. Psychoacoustics for improved audio reproduction, power reduction, and speaker protection
EP3579583B1 (en) 2018-06-06 2023-03-29 Dolby Laboratories Licensing Corporation Manual characterization of perceived transducer distortion
US11062717B2 (en) * 2018-06-20 2021-07-13 Mimi Hearing Technologies GmbH Systems and methods for processing an audio signal for replay on an audio device
EP3584927B1 (en) * 2018-06-20 2021-03-10 Mimi Hearing Technologies GmbH Systems and methods for processing an audio signal for replay on an audio device
US10991375B2 (en) 2018-06-20 2021-04-27 Mimi Hearing Technologies GmbH Systems and methods for processing an audio signal for replay on an audio device
US10911013B2 (en) 2018-07-05 2021-02-02 Comcast Cable Communications, Llc Dynamic audio normalization process
CN112640301B (zh) * 2018-09-28 2022-03-29 杜比实验室特许公司 动态地调整压缩器的阈值的方法和设备
FR3091078A1 (fr) * 2018-12-21 2020-06-26 Cabasse Systeme d’adaptation de la reponse spectrale d’une enceinte acoustique et de commande de la dynamique d’une chaine haute fidelite
KR102277952B1 (ko) * 2019-01-11 2021-07-19 브레인소프트주식회사 디제이 변환에 의한 주파수 추출 방법
CN113574596B (zh) * 2019-02-19 2024-07-05 公立大学法人秋田县立大学 音频信号编码方法、音频信号解码方法、程序、编码装置、音频系统及解码装置
EP3840404B8 (en) * 2019-12-19 2023-11-01 Steelseries France A method for audio rendering by an apparatus
US11153682B1 (en) 2020-09-18 2021-10-19 Cirrus Logic, Inc. Micro-speaker audio power reproduction system and method with reduced energy use and thermal protection using micro-speaker electro-acoustic response and human hearing thresholds
US11159888B1 (en) 2020-09-18 2021-10-26 Cirrus Logic, Inc. Transducer cooling by introduction of a cooling component in the transducer input signal
CN113821047A (zh) * 2021-08-18 2021-12-21 杭州电子科技大学 一种基于单目视觉的无人机自主降落方法

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1385493A (en) 1971-11-19 1975-02-26 Secr Defence Speech communication system
US4208548A (en) * 1977-07-19 1980-06-17 Orban Associates, Inc. Apparatus and method for peak-limiting audio frequency signals
US4249042A (en) 1979-08-06 1981-02-03 Orban Associates, Inc. Multiband cross-coupled compressor with overshoot protection circuit
SU1223285A1 (ru) 1984-02-16 1986-04-07 Предприятие П/Я Р-6947 Устройство дл сжати частотного диапазона звуковых сигналов
US5278912A (en) 1991-06-28 1994-01-11 Resound Corporation Multiband programmable compression system
US5483600A (en) 1994-02-14 1996-01-09 Aphex Systems, Ltd. Wave dependent compressor
US6097824A (en) 1997-06-06 2000-08-01 Audiologic, Incorporated Continuous frequency dynamic range audio compressor
US6108431A (en) 1996-05-01 2000-08-22 Phonak Ag Loudness limiter
US5832444A (en) 1996-09-10 1998-11-03 Schmidt; Jon C. Apparatus for dynamic range compression of an audio signal
US7309829B1 (en) 1998-05-15 2007-12-18 Ludwig Lester F Layered signal processing for individual and group output of multi-channel electronic musical instruments
US6757395B1 (en) * 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
US6618486B2 (en) 2000-05-03 2003-09-09 Robert A. Orban Controller for FM 412 multiplex power regulation
DE60209161T2 (de) 2001-04-18 2006-10-05 Gennum Corp., Burlington Mehrkanal Hörgerät mit Übertragungsmöglichkeiten zwischen den Kanälen
CA2354755A1 (en) * 2001-08-07 2003-02-07 Dspfactory Ltd. Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US20030223597A1 (en) 2002-05-29 2003-12-04 Sunil Puria Adapative noise compensation for dynamic signal enhancement
US7043423B2 (en) * 2002-07-16 2006-05-09 Dolby Laboratories Licensing Corporation Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding
JP2004061617A (ja) * 2002-07-25 2004-02-26 Fujitsu Ltd 受話音声処理装置
US20050069155A1 (en) 2003-09-26 2005-03-31 Gagon Paul R. Audio pre-amp and mid-band compressor circuit
JP4185984B2 (ja) * 2003-11-04 2008-11-26 国立大学法人山梨大学 音信号の加工装置および加工方法
JP2005175674A (ja) * 2003-12-09 2005-06-30 Nec Corp 信号圧縮伸張装置および携帯通信端末装置
US7254243B2 (en) 2004-08-10 2007-08-07 Anthony Bongiovi Processing of an audio signal for presentation in a high noise environment
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
CA2581810C (en) 2004-10-26 2013-12-17 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
BRPI0712625B1 (pt) * 2006-06-30 2023-10-10 Fraunhofer - Gesellschaft Zur Forderung Der Angewandten Forschung E.V Codificador de áudio, decodificador de áudio, e processador de áudio tendo uma caractéristica de distorção ("warping") dinamicamente variável
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
EP1923994B1 (en) * 2006-11-17 2008-11-19 AKG Acoustics GmbH Audio compressor
JP5530720B2 (ja) 2007-02-26 2014-06-25 ドルビー ラボラトリーズ ライセンシング コーポレイション エンターテイメントオーディオにおける音声強調方法、装置、およびコンピュータ読取り可能な記録媒体
KR101163411B1 (ko) * 2007-03-19 2012-07-12 돌비 레버러토리즈 라이쎈싱 코오포레이션 지각 모델을 사용한 스피치 개선
US7742746B2 (en) * 2007-04-30 2010-06-22 Qualcomm Incorporated Automatic volume and dynamic range adjustment for mobile audio devices
CN101743586B (zh) * 2007-06-11 2012-10-17 弗劳恩霍夫应用研究促进协会 音频编码器、编码方法、解码器、解码方法
US20090253457A1 (en) * 2008-04-04 2009-10-08 Apple Inc. Audio signal processing for certification enhancement in a handheld wireless communications device
EP2373067B1 (en) 2008-04-18 2013-04-17 Dolby Laboratories Licensing Corporation Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience
EP4407610A1 (en) * 2008-07-11 2024-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
CN102257728B (zh) 2008-10-17 2014-11-26 夏普株式会社 音频信号调节设备及音频信号调节方法
EP2401872A4 (en) * 2009-02-25 2012-05-23 Conexant Systems Inc SYSTEM AND METHOD FOR REDUCING SPEAKER DISTORTION
US9093968B2 (en) * 2009-05-29 2015-07-28 Sharp Kabushiki Kaisha Sound reproducing apparatus, sound reproducing method, and recording medium
US8600076B2 (en) * 2009-11-09 2013-12-03 Neofidelity, Inc. Multiband DRC system and method for controlling the same
US9083298B2 (en) * 2010-03-18 2015-07-14 Dolby Laboratories Licensing Corporation Techniques for distortion reducing multi-band compressor with timbre preservation
ES2526761T3 (es) 2010-04-22 2015-01-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para modificar una señal de audio de entrada
WO2012024144A1 (en) * 2010-08-18 2012-02-23 Dolby Laboratories Licensing Corporation Method and system for controlling distortion in a critical frequency band of an audio signal
EP2538555B1 (en) * 2011-06-22 2019-09-11 Nxp B.V. Control of a loudspeaker output
EP2992605B1 (en) * 2013-04-29 2017-06-07 Dolby Laboratories Licensing Corporation Frequency band compression with dynamic thresholds

Also Published As

Publication number Publication date
HK1215108A1 (zh) 2016-08-12
US20160072467A1 (en) 2016-03-10
US9762198B2 (en) 2017-09-12
EP2992605B1 (en) 2017-06-07
HK1258837A1 (zh) 2019-11-22
JP5969727B2 (ja) 2016-08-17
HK1222478A1 (zh) 2017-06-30
CN108365827B (zh) 2021-10-26
CN108365827A (zh) 2018-08-03
JP2016518788A (ja) 2016-06-23
EP2992605A1 (en) 2016-03-09
CN105164918A (zh) 2015-12-16
JP2016195439A (ja) 2016-11-17
WO2014179021A1 (en) 2014-11-06
CN105164918B (zh) 2018-03-30

Similar Documents

Publication Publication Date Title
JP6436934B2 (ja) 動的閾値を用いた周波数帯域圧縮
KR102473598B1 (ko) 왜곡 감지, 방지, 및 왜곡-인지 베이스 강화
JP5488389B2 (ja) 音響信号処理装置
KR100619066B1 (ko) 오디오 신호의 저음역 강화 방법 및 장치
JP5448771B2 (ja) 音響処理装置及び方法
JP5649934B2 (ja) サウンドエンハンスメント装置及び方法
JP5602309B2 (ja) オーディオ信号の臨界周波数帯域における歪みを制御する方法とシステム
CN105245195B (zh) 用于具有音质保护的失真减少多频带压缩器的技术
US20110002467A1 (en) Dynamic enhancement of audio signals
US8386242B2 (en) Method, medium and apparatus enhancing a bass signal using an auditory property
JP2014514609A (ja) 改善されたオーディオのための統合されたサイコアコースティック・バス・エンハンスメント(pbe)
JP5074115B2 (ja) 音響信号処理装置及び音響信号処理方法
JP2007500466A (ja) 音声調整装置、方法及びコンピュータプログラム
US11716065B2 (en) Systems and methods of volume limiting
US9088841B2 (en) Signal processor and method for compensating loudspeaker aging phenomena
US20210266667A1 (en) Apparatus and method for optimizing sound quality of a generated audible signal
JP5340121B2 (ja) オーディオ信号再生装置
US9240764B2 (en) Apparatus and method for preventing acoustic shock of portable terminal
JP2005184154A (ja) 自動利得制御装置及び自動利得制御方法
JP6699280B2 (ja) 音響再生装置
US20240045644A1 (en) Techniques for dynamically managing a low-frequency sound field using non-low-frequency loudspeakers
TWI538526B (zh) 指向性揚聲裝置與產生指向性聲波的方法
WO2017203677A1 (ja) オーディオ信号処理装置、および音響パラメータ決定方法
JP6807769B2 (ja) 音響装置及び音質調整方法
JP2010183126A (ja) 音響再生装置および音響再生システム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170404

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170404

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180508

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180626

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180813

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181016

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181113

R150 Certificate of patent or registration of utility model

Ref document number: 6436934

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250