JP5969727B2 - 動的閾値を用いた周波数帯域圧縮 - Google Patents

動的閾値を用いた周波数帯域圧縮 Download PDF

Info

Publication number
JP5969727B2
JP5969727B2 JP2016510698A JP2016510698A JP5969727B2 JP 5969727 B2 JP5969727 B2 JP 5969727B2 JP 2016510698 A JP2016510698 A JP 2016510698A JP 2016510698 A JP2016510698 A JP 2016510698A JP 5969727 B2 JP5969727 B2 JP 5969727B2
Authority
JP
Japan
Prior art keywords
frequency band
threshold
distortion
estimate
varying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016510698A
Other languages
English (en)
Other versions
JP2016518788A (ja
Inventor
ジェイ. シーフェルドット,アラン
ジェイ. シーフェルドット,アラン
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2016518788A publication Critical patent/JP2016518788A/ja
Application granted granted Critical
Publication of JP5969727B2 publication Critical patent/JP5969727B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/16Automatic control
    • H03G5/165Equalizers; Volume or gain control in limited frequency bands
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03FAMPLIFIERS
    • H03F3/00Amplifiers with only discharge tubes or only semiconductor devices as amplifying elements
    • H03F3/181Low frequency amplifiers, e.g. audio preamplifiers
    • H03F3/183Low frequency amplifiers, e.g. audio preamplifiers with semiconductor devices only
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers without distortion of the input signal
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/008Visual indication of individual signal levels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03FAMPLIFIERS
    • H03F2200/00Indexing scheme relating to amplifiers
    • H03F2200/03Indexing scheme relating to amplifiers the amplifier being designed for audio applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Power Engineering (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

関連出願への相互参照
本願は2013年4月29日に出願されたAlan J. Seefedtによる「歪み可聴性モデルに基づく動的閾値を用いた、歪み低減マルチ帯域圧縮器」という名称の本願と同時係属中であり同一被譲渡者の米国仮特許出願第61/817,175号(代理人整理番号D13064USP1)の優先権を主張するものである。同出願の内容は参照により、あらゆる目的についてその全体において組み込まれる。
技術分野
本特許開示は概括的にはオーディオ呈示に、詳細には呈示の際の歪み低減に関する。
スマートフォンおよびタブレットのようないくつかのオーディオ再生装置は限られた出力能力をもつ増幅器およびスピーカーを含む。そのような装置では、オーディオ再生は知覚的に歪められることがあり、呈示中に再生レベルが上げられるとしばしば鋭く歪められることがある。歪みの特性はしばしば再生装置にとって周波数依存である。たとえば、テレビジョン・キャビネットは特定の周波数で共鳴応答を示すことがある。この共鳴応答は、その特定の周波数における出力信号が特定のレベルに達するかそれを超えるときに励起され、わずらわしいガタガタ音を生じる。
歪みを低減し、再生装置での再生レベルを最大化しようとするために、マルチ帯域圧縮が再生前のオーディオ信号に適用されることができる。信号の各周波数帯域について歪み閾値が指定される。圧縮器は、各帯域における信号レベルが対応する歪み閾値を超えないことを保証するよう、各帯域に独立な利得を適用する。
入力オーディオ信号に応じて圧縮器の閾値を動的に調整する技法を実装するシステム、装置、方法およびコンピュータ可読記憶媒体のいくつかの例が開示される。いくつかの実装では、いくつかの周波数帯域成分をもつ入力信号が処理される。それらの周波数帯域成分に応じて、時間変化する閾値が決定されることができる。各時間変化する閾値は一般に、それぞれの周波数帯域成分に対応する。圧縮器が、各周波数帯域成分に対して、前記対応する時間変化する閾値をもつ圧縮動作を実行して、いくつかの利得を生成する。ここで、各利得はそれぞれの周波数帯域成分に対応する。各利得は、遅延された対応する周波数帯域成分に適用されて、いくつかの処理された帯域成分を生成し、それらの処理された帯域成分は加算されて出力信号を生成する。
いくつかの実装では、出力信号の知覚されるスペクトルの時間変化する推定値が決定される。また、知覚されるスペクトル推定値によって誘起される歪みスペクトルの時間変化する推定値が、たとえば歪みモデルの応答に従って決定される。知覚されるスペクトル推定値の存在における歪みスペクトル推定値の可聴性指標が予測される。時間変化する閾値は、予測された可聴性指標に従って調整されることができる。
いくつかの実装では、可聴性指標を予測することは、知覚されるスペクトル推定値からマスキング閾値を計算し;歪みスペクトル推定値とマスキング閾値との間の差を決定し;決定された差の正の値を合計して予測された可聴性指標を生成することを含む。マスキング閾値は、知覚されるスペクトル推定値に基づくトーン性スペクトルを参照して計算されることができる。トーン性スペクトルは、トーン的な周波数帯域成分からノイズ的な周波数帯域成分を区別するトーン性値を含む。合計される、決定された差の正の値は、一つまたは複数の上の周波数帯域成分および一つまたは複数の下の周波数帯域成分が、該上および下の帯域成分の間の周波数帯域成分より低い重みをもつよう重み付けされることができる。
いくつかの実装では、時間変化する閾値は、少なくとも部分的には、固定された名目閾値に従って決定される。このように、各時間変化する閾値は、対応する周波数帯域成分に従ってかつそれぞれの固定した閾値に従って決定されることができる。これらの実装において、歪みの予測される可聴性指標は規格化されることができる。時間変化する閾値は、一つまたは複数の固定した閾値を参照して、かつオフセット値に適用される規格化された可聴性指標に従って上げられたり下げられたりすることができる。
いくつかの実装では、入力オーディオ信号に応答して圧縮閾値を動的に調整する装置は、上記の動作の一部または全部を実行させるよう動作可能な一つまたは複数のコントローラを含む。さらに、そのような装置は、前記入力信号をフィルタリングして前記周波数帯域成分を生成することができるフィルタリング・モジュールおよびいくつかの帯域通過フィルタを含むマルチ帯域フィルタを含むことができる。ここで、各帯域通過フィルタはそれぞれの周波数帯域成分に対応する。本装置は、前記出力信号を受領し、増幅して増幅された出力信号を生成するよう結合された一つまたは複数の増幅器と、増幅された出力信号を受領して再生するよう結合された一つまたは複数のスピーカーとを含むこともできる。
いくつかの実装では、上記の動作の一部または全部を実行させるようコンピューティング装置によって実行可能な命令を記憶する非一時的なコンピュータ可読記憶媒体。コンピューティング装置の限定しない例は、サーバーおよびデスクトップ・コンピュータならびにスマートフォン、タブレット、携帯型音楽プレーヤーなどといった携帯型ハンドヘルド装置を含む。いくつかの事例では、一つまたは複数のサーバーが、クラウド・ベースのサービスの一部として、開示される技法の一つまたは複数を使って入力オーディオ信号を処理し、処理された出力信号をインターネットを通じてユーザーの装置にストリーミングするよう構成されることができる。
含まれる図面は例解目的のためであり、開示される発明のシステム、装置、方法およびコンピュータ可読記憶媒体についての可能な構造および動作の例を提供するだけのものである。これらの図面はいかなる意味でも、開示される実装の精神および範囲から外れることなく当業者によってなされうる形および細部におけるいかなる変化をも制限するものではない。
いくつかの実装に基づく、入力オーディオ信号に応じて圧縮器の閾値を動的に調整する歪み可聴性モデル(DAM: distortion audibility model)を組み込む圧縮器100の例を示している。 いくつかの実装に基づいて実行される、入力オーディオ信号に応じて圧縮器の閾値を動的に調整する方法200の例を示す図である。 いくつかの実装に基づいて実行される、入力オーディオ信号に応じて圧縮器の閾値を動的に調整する方法300の別の例を示す図である。 いくつかの実装に基づいて実行される、知覚されるスペクトル推定値の存在において歪みスペクトル推定値の可聴性指標を予測する方法400の例を示す図である。 Aは、いくつかの実装に基づく、表示装置に表示される入力オーディオ信号の周波数帯域成分のエネルギー・レベルのグラフィック表現500Aの例を示す。Bは、いくつかの実装に基づく、表示装置に表示される、聴取者によって知覚される推定された出力信号スペクトルの対応するエネルギー・レベルのグラフィック表現500Bの例を示す。 いくつかの実装に基づく、オーディオ信号を呈示するための圧縮器100を組み込む再生システム600の例を示す図である。
入力オーディオ信号に応じて圧縮器の閾値を動的に調整する技法を実装するシステム、装置、方法およびコンピュータ可読記憶媒体のいくつかの例が開示される。開示される技法のいくつかは、マルチ帯域圧縮器によって適用されることのできる動的閾値を決定するための歪み可聴性モデルを組み込む。歪み可聴性モデルは、動的な信号依存の仕方で、入力信号の存在におけるその入力信号によって誘起される歪みの知覚される可聴性を予測するよう構成される。この予測される可聴性は、圧縮器の閾値を動的に修正するために使用されることができる。こうして、開示される技法を組み込むいくつかの装置およびシステムは、最小限の知覚される歪みをもって増大した再生レベルに対応できる。
いくつかの実装では、歪み可聴性モデルは、聴取者に聞こえる信号スペクトルの時間変化する推定値およびその信号によって誘起される歪みスペクトルの時間変化する推定値を予測するよう構成される。その際、歪み可聴性モデルは、信号スペクトル推定値の存在における、この歪みスペクトル推定値の可聴性を予測する。このようにして、圧縮器の一つまたは複数の時間変化する閾値がしかるべく動的に変調されることができる。
圧縮閾値の動的な調整のための開示される技法は、他の圧縮プロセスとの関連で使われてもよく、スマートフォン、タブレット、ラップトップ・コンピュータ、携帯型音楽プレーヤー、テレビジョン、モニタおよびサーバー・ベースのシステムといったさまざまな装置およびシステムにおいて実装されることができる。
開示される技法を実装するいくつかの装置およびシステムは、音色、つまり等しいラウドネスおよびピッチの二つの音が異なるように知覚されうる聴取者知覚の属性を知覚できるほどに変えてしまう通常のマルチ帯域圧縮器に対して改善する。ある種の周波数が歪み閾値に達し、他の周波数が達しないとき、いくつかの通常の圧縮器は、これらの周波数の間の相対バランスを変更することによって不都合を導入してしまう。結果として得られる音は、異常なものとして現われ、不自然な聴取体験につながる。
さらに、利得が積極的すぎる場合には、再生レベルは不必要に低減されることがある。各帯域における閾値が、その帯域を中心とする狭帯域信号についての知覚される歪みをなくすよう設定されれば、広帯域信号が圧縮器を通過することから帰結する減衰はしばしば、任意の誘起される歪みを知覚的に消去するために必要とされるよりも強い。これは、広帯域信号は、該広帯域信号が誘起する歪みの一部を有意にマスクすることがありうる一方、狭帯域信号はその誘起される歪みをマスクする効果がずっと弱いことがありうるという事実のためである。
図1は、入力オーディオ信号に応じて圧縮器の閾値を動的に調整するための歪み可聴性モデル(DAM)を組み込む圧縮器100の例を示している。図1では、フィルタバンク104の形のフィルタリング・モジュールが入力オーディオ信号x[n]を受領する。フィルタバンク104は、入力信号x[n]をフィルタリングして入力信号x[n]をいくつかの周波数帯域成分x1[n]〜xB[n]に分離するよう構成されている。いくつかの実装では、フィルタバンク104は、B個の帯域通過フィルタとして実装されるマルチ帯域フィルタとして構成される。ここで、各帯域通過フィルタがそれぞれの周波数帯域成分に対応する。たとえば、フィルタバンク104の各帯域bは、式(1)
xb[n]=hb[n]*x[n] b=1…B (1)
に表わされるように入力信号x[n]を帯域通過フィルタ応答hb[n]と畳み込みしたものとして計算される周波数帯域成分xb[n]を出力するよう構成されることができる。
図1において、DAM 108はフィルタバンク104から出力される周波数帯域成分x1[n]〜xB[n]を受領するよう結合された入力をもつ。DAM 108に提供される各周波数帯域成分xb[n]は、図1に示されるように、それぞれの固定した圧縮閾値Lbと対にされる。DAM 108は、時間変化する閾値D1[n]〜DB[n]を計算して出力するよう構成される。いくつかの実装では、時間変化する閾値Db[n]は、それぞれの周波数帯域成分xb[n]の関数として計算される。いくつかの他の実装では、各帯域について独立に計算されるのではなく、各時間変化する閾値Db[n]は、式(2)
Db[n]=DAM({xi[n],Li|i=1…B}) (2)
に表わされるように、諸帯域b=1…Bにわたるすべての周波数帯域成分x1[n]〜xB[n]および固定した閾値Lbの関数として計算される。
各周波数帯域成分xb[n]は、それぞれの時間変化する閾値Db[n]とともに圧縮関数(CF: compression function)112に入力として与えられる。該時間変化する閾値は、それより上でその帯域bにおける信号が歪みを生じはじめるレベルを表わす。各圧縮関数112bは、式(3)
gb[n]=CF(xb[n],Db[n]) (3)
に表わされるように、周波数帯域成分xb[n]および時間変化する閾値Db[n]を処理して時間変化する利得gb[n]を生成するよう構成される。これは、帯域bをその限界閾値Lbより下に保つための利得を表わす。
周波数帯域成分x1[n]〜xB[n]全部の遅延されたバージョンにそれらの対応する利得信号g1[n]〜gB[n]を乗算したものを合計することによって、処理された出力信号y[n]が計算される。図1では、乗算器ユニット116は利得信号を遅延された周波数帯域成分に乗算して(yb[n]=gb[n]xb[n−d])処理された帯域成分y1[n]〜yB[n]を生成するよう構成されている。これらの処理された帯域成分が次いで加算ユニット120において合計されて出力信号y[n]を生じる。たとえば、遅延dは、利得信号の計算に関連する任意の処理遅延を考慮に入れるよう設計されることができる。式(4)は、処理された信号y[n]の生成の表現を表わしている。
Figure 0005969727
図2は、いくつかの実装に基づいて実行される、入力オーディオ信号に応じて圧縮器の閾値を動的に調整する方法200の例を示している。図2は、図1の例を参照して記述される。図2の204において、上記で説明したように、周波数帯域成分x1[n]〜xB[n]がDAM 108への入力として受領される。208では、DAM 108が周波数帯域成分x1[n]〜xB[n]に従って時間変化する閾値D1[n]〜DB[n]を決定する。212では、各CF 112bは、対応する時間変化する閾値Db[n]を使って対応する周波数帯域成分xb[n]に対して圧縮動作を実行して利得g1[n]〜gB[n]を生成するよう構成される。216では、各利得gb[n]は、たとえば乗算器ユニット116を使って、対応する周波数帯域成分xb[n]の遅延されたバージョンに適用され、処理された帯域成分y1[n]〜yB[n]を生成する。220では、処理された帯域成分y1[n]〜yB[n]は加算ユニット120において加算されて出力信号y[n]を生成する。次いでこれがメモリ装置に記憶されるおよび/または追加的な処理モジュールに提供されることができる。
図3は、いくつかの実装に基づいて実行される、入力オーディオ信号に応じて圧縮器の閾値を動的に調整する方法300のもう一つの例を示している。方法300の動作304〜320は上記の方法200の動作204〜220と実質的に同じである。図3では、出力信号y[n]の生成に続いて、324において、聴取者に聞こえる出力信号y[n]のパワースペクトルの時間変化する推定値が推定されることができる。この目的に向け、平滑化動作が処理された帯域成分y1[n]〜yB[n]に適用されることができる。たとえば、各処理された帯域成分yb[n]=gb[n]xb[n−d]が高速アタック/低速リリース一極平滑化器(fast-attack/slow-release one pole smoother)を用いて平滑化されることができる。sb[n]は、聴取者によって知覚される出力信号スペクトルの推定値を表わし、式(5)において計算される。
Figure 0005969727
圧縮閾値のその後の変調から生じるアーチファクトを軽減するために、いくつかの事例では、利得g1[n]〜gB[n]のアタックおよびリリースを支配するために式(5)において使われるものよりやや速いアタックおよびやや遅いリリースを利用することが望ましいことがある。そのような事例では、聴取者によって知覚される推定された出力信号スペクトルは、式(6)
Sb[n]=10log10(sb[n]) (6)
に示されるように、デシベル(dB)で表わされることができる。
図3では、328において、知覚されるスペクトル推定値sb[n]によって誘起される歪みスペクトルの時間変化する推定値が決定される。たとえば、sb[n]によって再生システムにおいて誘起される歪みは、sb[n]を歪み生成モデルに入力することによって推定できる。そのようなモデルは、個々の再生システムを測定し、特徴付けることによって生成されてもよい。いくつかの場合には、小型スピーカーをもつ装置についての一般化されたモデルが十分であり、帯域bにおける信号が、bを含めb以上のすべての帯域に、帯域bにおける信号レベルより何らかの固定オフセットだけ下のレベルで歪みを誘起すると想定する。
いくつかの実装では、任意の所与の帯域における歪みスペクトル推定値は、その帯域中に生成される歪みの、すべての帯域にわたる最大によって与えられる。こうして、第一の周波数帯域成分の第一の推定された歪みは、第一の周波数帯域成分中におよび前記第一の周波数帯域成分より高い周波数の周波数帯域成分の少なくとも一部に誘起される歪みの最大として決定されることができる。これは、任意の単一の帯域が一般に、当該帯域を含む当該帯域以上の諸帯域に歪みを生成するからである。図1および図2との関係で上記したように時間変化する閾値のはたらきをする歪みスペクトル推定値D1[n]〜DB[n]は、最低帯域から始まって最高帯域まで逐次的な仕方で計算されうる。これは式(7)に例解される。ここで、固定オフセットDoffsetについての値の例は40dBである。
Figure 0005969727
図3では、332において、知覚されるスペクトル推定値sb[n]の存在における歪みスペクトル推定値Db[n]の可聴性指標が、たとえば図1のDAM 108を使って予測される。後述する図4は、この可聴性指標を予測するための技法の例を示す。
図3では、336において、時間変化する閾値の一つまたは複数が、予測された可聴性指標A[n]に従って調整される。いくつかの実装では、予測された可聴性指標A[n]は規格化され、時間変化する閾値Db[n]の一つまたは複数が、固定した諸閾値Lbの一つまたは複数を参照して、かつオフセット値に適用される規格化された可聴性指標に従って、上げられたり下げられたりする。たとえば、予測された可聴性指標は、時間変化する閾値D1[n]〜DB[n]を変調するために利用される前に、式(8)に示されるように、0と1の間に規格化されることができる。
Figure 0005969727
式(8)の例において、規格化限界は、規格化された予測された可聴性指標Anorm[n]が0に等しいときは誘起される歪みが出力信号によってよくマスクされ、Anorm[n]が1に等しいときは歪みが可聴性の縁にあるよう、選ばれる。したがって、Anorm[n]が0に等しいときは、時間変化する閾値D1[n]〜DB[n]はよりラウドな再生を許容するよう上げられることができるが、Anorm[n]が1に等しいときは、閾値D1[n]〜DB[n]はそれらの名目値のままとなる。よって、閾値D1[n]〜DB[n]は
Db[n]=Lb+(1−Anorm[n])Loffset (9)
に従って固定した閾値Lbから計算できる。
式(9)において、Anorm[n]が0に等しいときは、閾値Db[n]はLoffset dBだけその名目値より上に上げられる。ある事例では、Loffsetを6dBの範囲に設定すると、歪みの知覚される増大はなしに、広帯域の信号についての知覚されるラウドネスにおける知覚的な実質的な増大を与えた。他の事例では、Loffsetは特定の再生装置に合わせて調整された。
図4は、いくつかの実施形態に基づいて実行される、知覚されるスペクトル推定値の存在において歪みスペクトル推定値の可聴性指標を予測する方法400の例を示している。404では、マスキング閾値Mb[n]が知覚されるスペクトル推定値sb[n]から計算される。マスキング閾値Mb[n]についての一つのモデルは、知覚されるスペクトル推定値より固定オフセットMoffset低いというものである。これは式(10)
Mb[n]=Sb[n]−Moffset (10)
において示される。ここで、Moffsetについての値の例は10dBである。
あるいはまた、マスキング信号のトーン性の関数としてのマスキングの可変性を考慮に入れるマスキング・モデルが使用されてもよい。トーン的な信号のマスキング能力はノイズ的な信号より有意に低いことが一般に知られている。よって、マスキング閾値Mb[n]は、sb[n]に基づいてトーン性スペクトルを参照して計算されることができる。トーン性スペクトルは、ノイズ的な周波数帯域成分をトーン的な周波数帯域成分から区別するトーン性値を含む。各帯域におけるsb[n]のトーン性を、トーン性スペクトルTb[n]を生成するための既知の技法を使って特徴付けてもよい。ここで、Tb[n]は0から1まで変わる。0はノイズ的な信号を示し、1はトーン的な信号を示す。このトーン性スペクトルを利用して、マスキング閾値は式(11)
Mb[n]=Sb[n]−(Tb[n]Mtone+(1−Tb[n])Mnoise) (11)
に表わされるように計算されてもよい。
ある試験事例において、Mtone=30dBおよびMnoise=10dBが適切な値の例であった。これはノイズ的信号よりトーン性信号について20dB低いマスキングを与える。
図4では、408において、諸帯域にわたって歪みスペクトル推定値Db[n]がマスキング閾値Mb[n]と比較され、Db[n]とMb[n]との間の差があればそれを決定する。412では、決定された差のあらゆる正の値が加算されて、予測された可聴性指標A[n]を生成する。いくつかの実装では、A[n]は、式(12)に示されるように、Db[n]とMb[n]との間の差の正の値の重み付けされた和として計算される。
Figure 0005969727
式(12)において、いくつかの実装では、重み付けWbは知覚的に動機付けされて、高周波数帯域および低周波数帯域が中間周波数帯域より低く重み付けされてもよい。
いくつかの他の実装では、明示的な歪み生成およびマスキング・モデルを利用するのではなく、歪み可聴性の指標が信号スペクトルSb[n]の関数から推定されてもよい。一つのそのような例は、式(13)に示されるような、諸帯域にわたるこのスペクトルの標準偏差である。
Figure 0005969727
標準偏差が小さいときは、すべての帯域の値はほぼ同じである。つまり、Sb[n]は大まかに広帯域である。この場合、Sb[n]は歪みをそこそこよくマスクするはずである。標準偏差が比較的大きい場合には、Sb[n]の値は有意に変動するということであり、スペクトルにおける、歪みが可聴となる「穴」の可能性を示す。結果として、式(13)における値A[n]はごく大まかに、式(12)での値の振る舞いに一致する。式(13)からの可聴性値は次いで、歪み生成およびマスキング・モデルで使われたのとは異なる規格化限界をもって式(8)に従って規格化され、次いで式(9)におけるように、閾値Db[n]を変調するために利用されてもよい。
図5のAは、いくつかの実装に基づく、表示装置に表示される、入力オーディオ信号の周波数帯域成分のエネルギー・レベルのグラフィック表現500Aの例を示す。図5のBは、いくつかの実装に基づく、表示装置に表示される、聴取者によって知覚される推定された出力信号スペクトルの対応するエネルギー・レベルのグラフィック表現500Bの例を示す。
図5のAおよびBの例では、図1の圧縮器100は上記のように入力オーディオ信号x[n]を処理する。図5のAでは、入力信号の20個の周波数帯域成分x1[n]〜x20[n]が図1のフィルタバンク104によって生成され、人間の聴覚の知覚的な分解能を模倣するよう離間される。図1の圧縮関数112の入力となる各周波数帯域成分xb[n]の信号エネルギーは、図5のAにおけるバー504によって表わされる。上記のように計算された各周波数帯域成分についての時間変化する閾値D1[n]〜D20[n]はクリアなセグメント508によって表わされる。圧縮関数112から出力される利得g1[n]〜g20[n]はセグメント512によって描かれる。
図5のBでは知覚されるスペクトル推定値S1[n]〜S20[n]のエネルギー・レベルがバー514によって表わされる。上記のように知覚されるスペクトル推定値sb[n]から計算されたマスキング閾値M1[n]〜M20[n]は図5のBではセグメント516によって表わされる。図1のDAM 108によって生成された時間変化する閾値D1[n]〜D2[n]は図5のBにおけるクリアなセグメント520によって表わされる。図1では、DAM 108は図5のBの時間変化する閾値D1[n]〜D20[n] 520を、圧縮器100を通じて再生されるオーディオ信号の存在において聴取者によって知覚される何らかの誘起された歪みが生じる前に、可能な最大レベルまで増大させる。一般に、広帯域信号については、時間変化する閾値D1[n]〜D20[n]は、それらの名目上設定されたレベルLbより上まで増大させられる。誘起される歪みがあったとしてもそのかなりの部分を信号自身がマスクするからである。狭帯域信号については、時間変化する閾値はそれらの名目レベルの近くに留まる可能性が高い。何らかの誘起される歪みに対して信号がほとんどマスキングをもたらさないからである。
図6は、いくつかの実装に基づく、オーディオ信号を呈示するための圧縮器100を組み込む再生システム600の例を示す図である。図6では、コントローラ604が上記の圧縮器100を実装するよう構成される。たとえば、図2〜図4を参照して上記した動作の一つまたは複数がコントローラ604によって実行されることができるまたはコントローラ604によって実行されるようにされることができる。コントローラ604は、下記でより詳細に説明するように幅広い多様な異なる構成をもつことができる。さらに、コントローラ604は、図6の場合におけるようにユーザー装置上に実装されることができるし、あるいは場合によっては一つまたは複数のサーバー上に実装されることができる。
図6に示したものに対する代替例として、コントローラ604を実装するサーバーが、オーディオをユーザーの装置に、好適なネットワークを通じてストリーミングすることができる。当業者は、そのようなネットワークがサーバーと、スマートフォンまたはタブレットのようなユーザー装置との間の通信を提供することを理解するはずである。ネットワークは、たとえば、TCP/IPベースのネットワーク、テレコミュニケーション・ネットワーク、無線ネットワーク、ケーブル・ネットワーク、公共ネットワーク、私設ネットワーク、広域ネットワーク、ローカル・エリア・ネットワーク、インターネット、ワールドワイドウェブ、イントラネット、エクストラネットなどを含む幅広い多様なネットワーク環境の任意の部分集合または組み合わせであることができる。
図6に戻ると、再生システム600は、圧縮器100から出力信号y[n]を受領してy[n]をアナログ信号に変換するよう結合されたデジタル‐アナログ変換器(DAC)608を含む。DAC 608はこの例ではコントローラ604の一つの処理モジュールとして実装されているが、当業者はDAC 608がコントローラ604とは別個のユニットとして、場合によってはコントローラ604が位置しているサーバーまたはユーザーの装置から別個の装置として構築されることができることを理解するはずである。
図6では、前置増幅器612が、DAC 608によって出力されるアナログ信号の信号強度を受領し、ブーストするよう結合されている。電流感応前置増幅器、寄生容量前置増幅器、電荷感応前置増幅器またはそれらの何らかの組み合わせといったさまざまな型の前置増幅器が使用されることができる。当業者は、いくつかの代替例では前置増幅器612がシステム600から省略できることを理解するはずである。
図6では、電力増幅器616は前置増幅器612からのブーストされた信号を受領し、増幅して、一つまたは複数のスピーカー620を駆動するのに好適な増幅された出力信号を生成するよう結合されている。前置増幅器612がシステム600から省略される状況では、電力増幅器616が、統合された増幅器で置換されてもよい。システム600の増幅器およびスピーカーは、上記のようなユーザーの装置のコンポーネントであることができる。いくつかの実装では、ユーザーの装置と一体のまたはユーザーの装置に接続された別個の装置の形のディスプレイが制御されて、図5のAおよびBに呈示した情報のような、前記出力信号の諸周波数帯域および前記信号を特徴付ける他の情報を示すグラフィック・データを表示することができる。他のいくつかのシナリオでは、図6の増幅器612およびスピーカー620は公共アナウンス(PA: public address)システム、劇場もしくはコンサート・サウンド・システムまたはステレオもしくはホームシアター・システムのような家庭システムの一部である。
本稿に記載した技法は、一つまたは複数のコンピューティング装置によって実装されることができる。たとえば、特殊目的コンピューティング装置のコントローラが、開示される動作を実行するようまたはそのような動作を実行させるよう固定結線されてもよく、動作を実行するまたは動作を実行させるよう持続的にプログラムされた一つまたは複数の特定用途向け集積回路(ASIC)またはフィールド・プログラマブル・ゲート・アレイ(FPGA)のようなデジタル電子回路を含んでいてもよい。いくつかの実装では、カスタムの固定結線論理、ASICおよび/またはFPGAでカスタム・プログラミングをもつものが組み合わされて上記技法を達成する。
他のいくつかの実装では、汎用コンピューティング装置が、ファームウェア、メモリ、他の記憶またはその組み合わせの中のプログラム命令に従って開示される動作の一つまたは複数を実行させるようプログラムされたコントローラを含むことができる。汎用コンピューティング装置の例は、サーバー、ネットワーク装置およびスマートフォン、タブレット、ラップトップ、デスクトップ・コンピュータ、携帯型メディアプレーヤー、他のさまざまな携帯型ハンドヘルド装置のようなユーザー装置ならびに開示される動作を実装するまたは該動作を実装および実行させるデータ処理ハードウェアおよび/またはプログラム論理を組み込む他の任意の装置を含む。コンピューティング装置は、モニタ、プリンタまたは本稿で言及される結果の任意のものをユーザーに提供するための他の好適なディスプレイを含んでいてもよい。
本稿での用法では、用語「記憶媒体」および「記憶メディア」は、コンピュータまたは機械の型に特定の仕方で動作させるデータおよび/または命令を記憶する任意の媒体を指す。本稿に記載されるモデル、モジュール、ユニット、エンジンおよび動作の任意のものは、任意の好適なコンピュータ言語を使ってコントローラのプロセッサによって実行可能なソフトウェア・コードとして実装されてもよいし、そのようなソフトウェア・コードによって実装されるようにされてもよい。ソフトウェア・コードは、記憶および/または伝送のためのコンピュータ可読媒体上の一連の命令またはコマンドとして記憶されてもよい。好適なコンピュータ可読媒体の例は、ランダム・アクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、ハードドライブまたはフロッピーディスクのような磁気媒体、コンパクトディスク(CD)またはDVD(デジタル多用途ディスク)のような光学式媒体、半導体ドライブ、フラッシュ・メモリおよび他の任意のメモリ・チップまたはカートリックを含む。コンピュータ可読媒体は、そのような記憶デバイスの任意の組み合わせであってもよい。ソフトウェア/プログラム・コードをエンコードされたコンピュータ可読媒体は、上記のようなユーザー装置またはサーバーのような互換な装置と一緒にパッケージングされてもよいし、あるいは他の装置とは別個に提供されてもよい。任意のそのようなコンピュータ可読媒体は、単一のコンピューティング装置の上もしくは中にまたはコンピュータ・システム全体の上または中に存在してもよく、システムまたはネットワーク内の他にもあるコンピュータ可読媒体のうちのものであってもよい。
記憶媒体は、伝送媒体とは異なるが、伝送媒体との関連で使われてもよい。伝送媒体は記憶媒体の間で情報を転送することに参加する。たとえば、伝送媒体は同軸ケーブル、銅線および光ファイバーを含む。伝送媒体は、音響波または光波、たとえば電波および赤外線データ通信の際に生成されるものの形を取ることもできる。
本稿において具体的なコンピューティング・パラダイムおよびソフトウェア・ツールを参照したにもかかわらず、開示される技法はハードウェアおよびソフトウェアのいかなる特定の組み合わせにも、コンピューティング装置またはデータ処理装置によって実行される命令のいかなる特定の源にも限定されない。さまざまな実装のベースとなるプログラム命令は幅広い多様なプログラミング言語、ソフトウェア・ツールおよびデータ・フォーマットの任意のものに対応してもよく、任意の型の非一時的なコンピュータ可読記憶媒体もしくはメモリ・デバイス(単数または複数)に記憶されてもよく、多様なコンピューティング・モデルに従って実行されてもよい。コンピューティング・モデルは、たとえば、クライアント/サーバー・モデル、ピアツーピア・モデル、スタンドアローン・コンピューティング装置上またはさまざまな機能が異なる位置で実施されるまたは用いられる分散コンピューティング・モデルに従うことを含む。さらに、本稿における具体的なプロトコルへの言及は、単に例である。当業者に既知の好適な代替が用いられてもよい。
本稿での用法での用語「スピーカー」は、単に例として、エンクロージャー内に設けられた直接放射型エレクトロダイナミック・ドライバを組み込むラウドスピーカー、ホーン・ラウドスピーカー、圧電型スピーカー、磁歪スピーカー、静電ラウドスピーカー、リボン型および平面型ラウドスピーカー、屈曲波ラウドスピーカー、フラット・パネル・ラウドスピーカー、分散モード・ラウドスピーカー、ハイル(Heil)空気動トランスデューサ、プラズマ・アーク・スピーカー、デジタル・スピーカーおよびそれらの任意の組み合わせを含むことができる。
本願の主題はその個別的な実装を参照して具体的に示され、記述されてきたが、当業者は、本開示の精神および範囲から外れることなく開示される実装の形および詳細における変更ができることを理解するであろう。これらの実装のいくつかの例は付属の図面に示されており、その十全な理解を与えるために個別的な詳細が記載されている。こうした個別的な詳細の一部または全部なしでも実装が実施されうることは注意しておくべきである。さらに、よく知られた特徴は明確さを増進するために詳細には記述されなかったことがある。最後に、本稿でいくつかの実装を参照して利点が論じられているが、範囲はそのような利点への言及によって限定されるべきではないことは理解されるであろう。むしろ、範囲は、付属の請求項を参照して決定されるべきである。

Claims (20)

  1. 入力オーディオ信号に応じて圧縮器の閾値を動的に調整する方法であって:
    複数の周波数帯域成分をもつ入力オーディオ信号を受領する段階と:
    前記複数の周波数帯域成分に応じて、複数の時間変化する閾値を決定する段階であって、各時間変化する閾値はそれぞれの周波数帯域成分に対応する、段階と;
    圧縮器によって、各周波数帯域成分に対して、前記対応する時間変化する閾値をもつ圧縮動作を実行して、複数の利得を生成する段階であって、各利得はそれぞれの周波数帯域成分に対応する、段階と;
    各利得を、遅延された対応する周波数帯域成分に適用して、複数の処理された周波数帯域成分を生成する段階と;
    前記処理された周波数帯域成分を加算して出力信号を生成する段階と、
    前記出力信号の知覚されるスペクトルの時間変化する推定値を決定する段階と;
    前記知覚されるスペクトル推定値によって誘起される歪みスペクトルの時間変化する推定値を決定する段階と;
    前記知覚されるスペクトル推定値の存在における前記歪みスペクトル推定値の可聴性指標を予測する段階と;
    前記時間変化する閾値の一つまたは複数を、予測された可聴性指標に従って調整する段階とを含む、
    法。
  2. 前記歪みスペクトル推定値は、前記知覚されるスペクトル推定値に対する歪みモデルの応答に従って決定される、請求項記載の方法。
  3. 前記歪みスペクトル推定値は、第一の周波数帯域成分の第一の推定された歪みを含み、前記第一の推定された歪みは、前記第一の周波数帯域成分におよび前記第一の周波数帯域成分より高い周波数の周波数帯域成分の少なくとも一部に誘起される歪みの最大として決定される、請求項記載の方法。
  4. 前記知覚されるスペクトル推定値の決定は:
    前記処理された周波数帯域成分に平滑化処理を適用することを含む、
    請求項ないしのうちいずれか一項記載の方法。
  5. 前記知覚されるスペクトル推定値の存在における前記歪みスペクトル推定値の可聴性指標を予測する段階が、
    前記知覚されるスペクトル推定値からマスキング閾値を計算し;
    前記歪みスペクトル推定値と前記マスキング閾値との間の差を決定し;
    決定された差の正の値を合計して前記の予測された可聴性指標を生成することを含む、
    請求項ないしのうちいずれか一項記載の方法。
  6. 前記マスキング閾値は、前記知覚されるスペクトル推定値に基づくトーン性スペクトルを参照して計算され、前記トーン性スペクトルは、トーン的な周波数帯域成分からノイズ的な周波数帯域成分を区別するトーン性値を含む、請求項記載の方法。
  7. 合計される、決定された差の正の値は、一つまたは複数の上の周波数帯域成分および一つまたは複数の下の周波数帯域成分が、該上および下の帯域成分の間の周波数帯域成分より低い重みをもつよう重み付けされる、請求項または記載の方法。
  8. 前記時間変化する閾値はさらに、複数の固定閾値に従って決定される、請求項1ないしのうちいずれか一項記載の方法。
  9. 各時間変化する閾値は、周波数帯域成分に従ってかつ前記複数の固定閾値に従って決定される、請求項記載の方法。
  10. 各時間変化する閾値は、前記対応する周波数帯域成分に従ってかつ対応する固定閾値に従って決定される、請求項記載の方法。
  11. 歪みの可聴性指標を予測し;
    予測された可聴性指標を規格化し;
    前記固定閾値の一つまたは複数を参照して、かつオフセット値に適用される前記の規格化された可聴性指標に従って、前記時間変化する閾値の一つまたは複数を上げるまたは下げることを含む、
    請求項記載の方法。
  12. 前記出力信号のデータを記憶媒体上に記憶する段階をさらに含む、
    請求項1ないし11のうちいずれか一項記載の方法。
  13. 請求項1記載の動作を実行するよう構成された装置。
  14. 求項2ないし12のうち一つまたは複数に記載の動作を実行するよう構成された装置。
  15. 前記入力オーディオ信号をフィルタリングして前記複数の周波数帯域成分を生成することができるフィルタリング・モジュールをさらに有する、
    請求項13または14記載の装置。
  16. 前記フィルタリング・モジュールが、複数の帯域通過フィルタを有するマルチ帯域フィルタを有し、各帯域通過フィルタはそれぞれの周波数帯域成分に対応する、請求項15記載の装置。
  17. 前記出力信号を受領するよう結合された一つまたは複数の増幅器をさらに有し、前記一つまたは複数の増幅器は、前記出力信号を増幅して、増幅された出力信号を生成することができる、請求項13ないし16のうちいずれか一項記載の装置。
  18. 前記出力信号または前記増幅された出力信号を受領するよう結合されたディスプレイ装置をさらに有し、前記ディスプレイ装置は、前記受領された信号に関連するグラフィック・データを表示することができる、請求項17記載の装置。
  19. 入力オーディオ信号に応じて圧縮器の閾値を動的に調整するために方法を実行させるようコンピューティング装置によって実行可能な命令を記憶しており、前記方法が請求項1記載の動作を含む、非一時的なコンピュータ可読記憶媒体。
  20. 前記方法がさらに、請求項2ないし12のうち一つまたは複数に記載の一つまたは複数の動作を含む、請求項19記載の非一時的なコンピュータ可読記憶媒体。
JP2016510698A 2013-04-29 2014-04-14 動的閾値を用いた周波数帯域圧縮 Active JP5969727B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361817175P 2013-04-29 2013-04-29
US61/817,175 2013-04-29
PCT/US2014/034024 WO2014179021A1 (en) 2013-04-29 2014-04-14 Frequency band compression with dynamic thresholds

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016134973A Division JP6436934B2 (ja) 2013-04-29 2016-07-07 動的閾値を用いた周波数帯域圧縮

Publications (2)

Publication Number Publication Date
JP2016518788A JP2016518788A (ja) 2016-06-23
JP5969727B2 true JP5969727B2 (ja) 2016-08-17

Family

ID=50687733

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2016510698A Active JP5969727B2 (ja) 2013-04-29 2014-04-14 動的閾値を用いた周波数帯域圧縮
JP2016134973A Active JP6436934B2 (ja) 2013-04-29 2016-07-07 動的閾値を用いた周波数帯域圧縮

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2016134973A Active JP6436934B2 (ja) 2013-04-29 2016-07-07 動的閾値を用いた周波数帯域圧縮

Country Status (6)

Country Link
US (1) US9762198B2 (ja)
EP (1) EP2992605B1 (ja)
JP (2) JP5969727B2 (ja)
CN (2) CN108365827B (ja)
HK (3) HK1215108A1 (ja)
WO (1) WO2014179021A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108365827B (zh) * 2013-04-29 2021-10-26 杜比实验室特许公司 具有动态阈值的频带压缩
EP3223279B1 (en) * 2016-03-21 2019-01-09 Nxp B.V. A speech signal processing circuit
US10225654B1 (en) 2017-09-07 2019-03-05 Cirrus Logic, Inc. Speaker distortion reduction
US11322170B2 (en) 2017-10-02 2022-05-03 Dolby Laboratories Licensing Corporation Audio de-esser independent of absolute signal level
US10827265B2 (en) * 2018-01-25 2020-11-03 Cirrus Logic, Inc. Psychoacoustics for improved audio reproduction, power reduction, and speaker protection
EP3579582B1 (en) 2018-06-06 2023-11-15 Dolby Laboratories Licensing Corporation Automatic characterization of perceived transducer distortion
EP3584927B1 (en) * 2018-06-20 2021-03-10 Mimi Hearing Technologies GmbH Systems and methods for processing an audio signal for replay on an audio device
US11062717B2 (en) * 2018-06-20 2021-07-13 Mimi Hearing Technologies GmbH Systems and methods for processing an audio signal for replay on an audio device
US10991375B2 (en) 2018-06-20 2021-04-27 Mimi Hearing Technologies GmbH Systems and methods for processing an audio signal for replay on an audio device
US10911013B2 (en) 2018-07-05 2021-02-02 Comcast Cable Communications, Llc Dynamic audio normalization process
EP3662468B1 (en) 2018-09-28 2020-11-04 Dolby Laboratories Licensing Corporation Distortion reducing multi-band compressor with dynamic thresholds based on scene switch analyzer guided distortion audibility model
FR3091078A1 (fr) * 2018-12-21 2020-06-26 Cabasse Systeme d’adaptation de la reponse spectrale d’une enceinte acoustique et de commande de la dynamique d’une chaine haute fidelite
KR102277952B1 (ko) * 2019-01-11 2021-07-19 브레인소프트주식회사 디제이 변환에 의한 주파수 추출 방법
WO2020171049A1 (ja) * 2019-02-19 2020-08-27 公立大学法人秋田県立大学 音響信号符号化方法、音響信号復号化方法、プログラム、符号化装置、音響システム、及び復号化装置
EP3840404B8 (en) 2019-12-19 2023-11-01 Steelseries France A method for audio rendering by an apparatus
US11153682B1 (en) 2020-09-18 2021-10-19 Cirrus Logic, Inc. Micro-speaker audio power reproduction system and method with reduced energy use and thermal protection using micro-speaker electro-acoustic response and human hearing thresholds
US11159888B1 (en) 2020-09-18 2021-10-26 Cirrus Logic, Inc. Transducer cooling by introduction of a cooling component in the transducer input signal
CN113821047A (zh) * 2021-08-18 2021-12-21 杭州电子科技大学 一种基于单目视觉的无人机自主降落方法

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1385493A (en) 1971-11-19 1975-02-26 Secr Defence Speech communication system
US4208548A (en) * 1977-07-19 1980-06-17 Orban Associates, Inc. Apparatus and method for peak-limiting audio frequency signals
US4249042A (en) 1979-08-06 1981-02-03 Orban Associates, Inc. Multiband cross-coupled compressor with overshoot protection circuit
SU1223285A1 (ru) 1984-02-16 1986-04-07 Предприятие П/Я Р-6947 Устройство дл сжати частотного диапазона звуковых сигналов
US5278912A (en) 1991-06-28 1994-01-11 Resound Corporation Multiband programmable compression system
US5483600A (en) 1994-02-14 1996-01-09 Aphex Systems, Ltd. Wave dependent compressor
US6097824A (en) 1997-06-06 2000-08-01 Audiologic, Incorporated Continuous frequency dynamic range audio compressor
US6108431A (en) 1996-05-01 2000-08-22 Phonak Ag Loudness limiter
US5832444A (en) * 1996-09-10 1998-11-03 Schmidt; Jon C. Apparatus for dynamic range compression of an audio signal
US7309829B1 (en) 1998-05-15 2007-12-18 Ludwig Lester F Layered signal processing for individual and group output of multi-channel electronic musical instruments
US6757395B1 (en) * 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
US6618486B2 (en) 2000-05-03 2003-09-09 Robert A. Orban Controller for FM 412 multiplex power regulation
ATE318062T1 (de) 2001-04-18 2006-03-15 Gennum Corp Mehrkanal hörgerät mit übertragungsmöglichkeiten zwischen den kanälen
CA2354755A1 (en) * 2001-08-07 2003-02-07 Dspfactory Ltd. Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US20030223597A1 (en) 2002-05-29 2003-12-04 Sunil Puria Adapative noise compensation for dynamic signal enhancement
US7043423B2 (en) * 2002-07-16 2006-05-09 Dolby Laboratories Licensing Corporation Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding
JP2004061617A (ja) * 2002-07-25 2004-02-26 Fujitsu Ltd 受話音声処理装置
US20050069155A1 (en) 2003-09-26 2005-03-31 Gagon Paul R. Audio pre-amp and mid-band compressor circuit
JP4185984B2 (ja) * 2003-11-04 2008-11-26 国立大学法人山梨大学 音信号の加工装置および加工方法
JP2005175674A (ja) 2003-12-09 2005-06-30 Nec Corp 信号圧縮伸張装置および携帯通信端末装置
US7254243B2 (en) 2004-08-10 2007-08-07 Anthony Bongiovi Processing of an audio signal for presentation in a high noise environment
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
CN101048935B (zh) 2004-10-26 2011-03-23 杜比实验室特许公司 控制音频信号的单位响度或部分单位响度的方法和设备
JP5205373B2 (ja) * 2006-06-30 2013-06-05 フラウンホーファーゲゼルシャフト・ツア・フェルデルング・デア・アンゲバンテン・フォルシュング・エー・ファウ 動的可変ワーピング特性を有するオーディオエンコーダ、オーディオデコーダ及びオーディオプロセッサ
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
ATE415010T1 (de) * 2006-11-17 2008-12-15 Akg Acoustics Gmbh Audiokompressor
BRPI0807703B1 (pt) 2007-02-26 2020-09-24 Dolby Laboratories Licensing Corporation Método para aperfeiçoar a fala em áudio de entretenimento e meio de armazenamento não-transitório legível por computador
TWI421856B (zh) * 2007-03-19 2014-01-01 Dolby Lab Licensing Corp 使用感知模型之語音增強技術
US7742746B2 (en) * 2007-04-30 2010-06-22 Qualcomm Incorporated Automatic volume and dynamic range adjustment for mobile audio devices
US8706480B2 (en) * 2007-06-11 2014-04-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoding audio signal
US20090253457A1 (en) * 2008-04-04 2009-10-08 Apple Inc. Audio signal processing for certification enhancement in a handheld wireless communications device
SG189747A1 (en) 2008-04-18 2013-05-31 Dolby Lab Licensing Corp Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience
PL3246918T3 (pl) * 2008-07-11 2023-11-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio, sposób dekodowania sygnału audio oraz program komputerowy
WO2010044439A1 (ja) 2008-10-17 2010-04-22 シャープ株式会社 音声信号調整装置及び音声信号調整方法
EP2401872A4 (en) * 2009-02-25 2012-05-23 Conexant Systems Inc SYSTEM AND METHOD FOR REDUCING SPEAKER DISTORTION
WO2010137650A1 (ja) * 2009-05-29 2010-12-02 シャープ株式会社 音声再生装置、音声再生方法及びプログラム
US8600076B2 (en) * 2009-11-09 2013-12-03 Neofidelity, Inc. Multiband DRC system and method for controlling the same
CN104242853B (zh) * 2010-03-18 2017-05-17 杜比实验室特许公司 用于具有音质保护的失真减少多频带压缩器的技术
ES2526761T3 (es) 2010-04-22 2015-01-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para modificar una señal de audio de entrada
US9130527B2 (en) * 2010-08-18 2015-09-08 Dolby Laboratories Licensing Corporation Method and system for controlling distortion in a critical frequency band of an audio signal
EP2538555B1 (en) * 2011-06-22 2019-09-11 Nxp B.V. Control of a loudspeaker output
CN108365827B (zh) * 2013-04-29 2021-10-26 杜比实验室特许公司 具有动态阈值的频带压缩

Also Published As

Publication number Publication date
HK1222478A1 (zh) 2017-06-30
JP2016195439A (ja) 2016-11-17
JP6436934B2 (ja) 2018-12-12
JP2016518788A (ja) 2016-06-23
CN105164918B (zh) 2018-03-30
CN108365827A (zh) 2018-08-03
EP2992605B1 (en) 2017-06-07
WO2014179021A1 (en) 2014-11-06
HK1258837A1 (zh) 2019-11-22
CN108365827B (zh) 2021-10-26
HK1215108A1 (zh) 2016-08-12
US20160072467A1 (en) 2016-03-10
CN105164918A (zh) 2015-12-16
EP2992605A1 (en) 2016-03-09
US9762198B2 (en) 2017-09-12

Similar Documents

Publication Publication Date Title
JP6436934B2 (ja) 動的閾値を用いた周波数帯域圧縮
KR102473598B1 (ko) 왜곡 감지, 방지, 및 왜곡-인지 베이스 강화
JP5649934B2 (ja) サウンドエンハンスメント装置及び方法
JP5488389B2 (ja) 音響信号処理装置
JP5680789B2 (ja) 改善されたオーディオのための統合されたサイコアコースティック・バス・エンハンスメント(pbe)
JP5602309B2 (ja) オーディオ信号の臨界周波数帯域における歪みを制御する方法とシステム
JP5448771B2 (ja) 音響処理装置及び方法
CN105245195B (zh) 用于具有音质保护的失真减少多频带压缩器的技术
KR100619066B1 (ko) 오디오 신호의 저음역 강화 방법 및 장치
US20110002467A1 (en) Dynamic enhancement of audio signals
JP2007500466A (ja) 音声調整装置、方法及びコンピュータプログラム
JP5074115B2 (ja) 音響信号処理装置及び音響信号処理方法
EP2109328B1 (en) Apparatus for processing an audio signal
US9088841B2 (en) Signal processor and method for compensating loudspeaker aging phenomena
US20210067122A1 (en) Systems and methods of volume limiting
JP2008507934A (ja) 音声強調
JP5340121B2 (ja) オーディオ信号再生装置
US11277689B2 (en) Apparatus and method for optimizing sound quality of a generated audible signal
US9240764B2 (en) Apparatus and method for preventing acoustic shock of portable terminal
JP2005184154A (ja) 自動利得制御装置及び自動利得制御方法
US20240045644A1 (en) Techniques for dynamically managing a low-frequency sound field using non-low-frequency loudspeakers
TWI538526B (zh) 指向性揚聲裝置與產生指向性聲波的方法
JP6807769B2 (ja) 音響装置及び音質調整方法
WO2017203677A1 (ja) オーディオ信号処理装置、および音響パラメータ決定方法

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20160413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160607

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160707

R150 Certificate of patent or registration of utility model

Ref document number: 5969727

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250