JP2008518565A - オーディオ信号の感知音量及び/又は感知スペクトルバランスの計算と調整 - Google Patents

オーディオ信号の感知音量及び/又は感知スペクトルバランスの計算と調整 Download PDF

Info

Publication number
JP2008518565A
JP2008518565A JP2007539070A JP2007539070A JP2008518565A JP 2008518565 A JP2008518565 A JP 2008518565A JP 2007539070 A JP2007539070 A JP 2007539070A JP 2007539070 A JP2007539070 A JP 2007539070A JP 2008518565 A JP2008518565 A JP 2008518565A
Authority
JP
Japan
Prior art keywords
specific loudness
audio signal
target specific
function
loudness
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007539070A
Other languages
English (en)
Other versions
JP5101292B2 (ja
JP2008518565A5 (ja
Inventor
シーフェルト、アラン・ジェフリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of JP2008518565A publication Critical patent/JP2008518565A/ja
Publication of JP2008518565A5 publication Critical patent/JP2008518565A5/ja
Application granted granted Critical
Publication of JP5101292B2 publication Critical patent/JP5101292B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/12Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
    • H03G9/14Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for gain control and tone control
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/20Combinations of two or more types of control, e.g. gain control and tone control in frequency-selective amplifiers
    • H03G9/24Combinations of two or more types of control, e.g. gain control and tone control in frequency-selective amplifiers having semiconductor devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Control Of Amplification And Gain Control (AREA)

Abstract

本発明は、オーディオ信号の感知音量及び/又は感知スペクトルバランスの計測と制御に関する。オーディオ信号は、少なくとも部分的には感知(音響心理学的)音量領域でなされた計算に応答して修正する。本発明は、例えば、音量補償ボリューム制御、自動ゲイン制御、ダイナミックレンジ制御(例えば、リミッター、圧縮器、伸張器、等を含む)、ダイナミックイコライゼーション、及び、オーディオ再生環境における暗騒音の相殺、のうちの1つ以上で有用である。本発明には方法が含まれるのみならず対応するコンピュータプログラム及び装置が含まれる。

Description

本発明はオーディオ信号処理に関する。さらに詳細には、本発明はオーディオ信号の感知音量及び/又は感知スペクトルバランスの計測と制御に関する。本発明は、例えば、音量補償ボリューム制御、自動ゲイン制御、ダイナミックレンジ制御(例えば、リミッター、圧縮器、伸張器、等を含む)、ダイナミックイコライゼーション、及び、オーディオ再生環境における暗騒音の相殺、のうちの1つ以上で有用である。本発明には方法が含まれるのみならず対応するコンピュータプログラム及び装置が含まれる。
なお、本願は米国暫定特許出願S.N.60/622,458:2004年10月26日出願、及びS.N.60/638,607:2004年12月21日出願、に基づく優先権を主張する。
音量を計測する十分客観的な方法を開発する試みは何度もなされてきた。フレッチャーとマンソンは、人間の聴覚は中間周波(又は音声周波)より低周波又は高周波において感度が鈍くなることを1933年に明らかにした。彼らはまた、サウンドのレベルが上がってゆくにつれて感度が相対的に下がってゆくことも発見した。初期の音量メータは、マイクロフォン、増幅器、及び、低サウンドレベル、中間サウンドレベル、及び高サウンドレベルにおける聴覚の周波数応答を大雑把に模倣するよう組み合わせたフィルターにより構成されていた。
このような装置が単一で孤立したトーンの一定レベルの音量の計測を行なうが、もっと複雑なサウンドの計測においては、音量の主観的な印象とうまく合致しなかった。このタイプのサウンドレベルメータは標準化されているが、工業的なノイズの監視と制御のような特定の目的にのみ使われる。
1950年代前半、中でもツビッカーとスチーブンスが、フレッチャーとマンソンの研究を拡張して音量認識プロセスのより現実的なモデルを開発した。スチーブンスは、1956年に、Journal of the Acoustical Society of Americaに、「複合ノイズの音量の測定」方法を発表し、ツビッカーは、1958年に、Acousticaに、彼の「音量の心理的理論」の論文を発表した。1959年にツビッカーは、音量計算の図式的な手順を発表し、そのすぐ後いくつかの類似の論文を発表した。スチーブンスとツビッカーの方法は、ISO 532の(それぞれ)パートA及びパートBとして規格化された。両方法は、同様の方法を必要とする。
まず、エキサイテーションと言われる、内耳基底膜に沿う時間的に変化するエネルギーの分布が、クリティカル帯域レートスケール上で均一な間隔を持つ中央周波数の通過帯域聴覚フィルターのバンクにオーディオを通すことによりシミュレートされる。各聴覚フィルターは、フィルターのその位置に対応する中央周波数を持ち、内耳基底膜に沿う特定の位置に対応する周波数応答をシミュレートするよう設計される。クリティカル帯域幅は、このようなフィルターの帯域幅として定義される。ヘルツ(Hz)で計測されて、これらの聴覚フィルターのクリティカル帯域幅は中央周波数の増大と共に増加する。したがって、全ての聴覚フィルターにおいてこのゆがんだスケールで計測したクリティカル帯域幅が一定になるようなゆがんだ周波数スケールを定義することは有益である。このようなゆがんだスケールは、クリティカル帯域レートスケールと称され、広い範囲の音響心理学的現象を理解しシミュレートする上で有益である。例えば、E.ツビッカーとH.ファステルによる「音響心理学‐実際とモデル」1990年ベルリン、を参照のこと。スチーブンスとツビッカーの方法は、バークスケールと称されるクリティカル帯域レートスケールを用い、そこでは、クリティカル帯域幅は500Hz以下では一定であり、500Hzを越えると増大する。最近ではムーアとグラスバーグは、クリティカル帯域レートスケールを定義し、彼等はそれを等価直角帯域幅(Equivalent Rectangular Bandwidth)(ERB)スケールと名づけた。(B. C. J. Moore, B. Glasberg, T. Baer, 「閾値音量と部分音量の予想のためのモデル」Journal of the Audio Engineering Society, Vol. 45, No. 4, 1997年4月, 224〜240ページ)。ノッチ雑音マスカーを用いた音響心理学的実験を通して、ムーアとグラスバーグは、バークスケールにおいてクリティカル帯域幅が一定であるのに対して、クリティカル帯域幅が500Hz以下で減少し続けることを示した。
エキサイテーションの計算に続くのが、「特定ラウドネス」と称される量を生成する、非線形圧縮機能である。特定ラウドネスは、周波数及び時間の関数としての感知音量の指標であり、上述のバークスケール又はERBスケールのような、クリティカル帯域レートスケールに沿って単位周波数毎の感知音量を単位として測定することができる。最終的に時間的に変化する「トータル音量」は周波数横断的に特定ラウドネスを積算することで計算される。特定ラウドネスは、クリティカル帯域レートスケールに沿って一様に配分された有限個の聴覚フィルターから推定され、トータル音量は、各フィルターからの特定ラウドネスを単純に積算することにより計算することができる。
音量はフォンの単位で計測される。フォン単位の所定のサウンドの音量は、そのサウンドの音量に等しい主観的音量を持つ1kHz毎の音圧レベル(SPL)である。普通、SPLで0dBは、2×10−5パスカルの2乗平均平方根圧力であり、したがって0フォンでもある。1kHzにおける音量を持つ1kHz以外の周波数のトーンの音量を比較するためにこの定義を用いて、等しい音量の曲線を所定のフォンレベルで定めることができる。図11は、20Hzと12.5kHzとの間の周波数、及び、4.2フォン(聴覚の閾値を考慮した)から120フォン(IS0226:1087(E)、「音質‐標準等音量レベル曲線」)までのフォンレベルにおける等音量レベルの曲線を示す。フォンの計測は、周波数の変化に対する人間の聴覚の感度の変化を考慮しているが、SPLにおける音量の増大の非直線性を補正する試み、すなわち曲線の間隔が変化するということに対する補正の試みがなされていないので、計測結果で、レベルが変化したときにサウンドの主観的相対音量を評価することはできない。
音量は、「ソーン」の単位で計測してもよい。図11に示すように、フォン単位とソーン単位とでは1対1対応が成り立つ。1ソーンは、1kHzの純粋なサイン波で40dB(SPL)の音量で定義され、40フォンと等価である。ソーン単位は感知する音量が2倍になったときソーン単位で2倍になるような単位である。例えば、4ソーンは2ソーンの2倍の大きさで感知される。このようにソーンで音量レベルを表現することはより参考になる。特定ラウドネスを感知音量の指標として、周波数と時間の関数として定義すると、特定ラウドネスは、単位周波数当たりのソーン単位で計測してもよい。したがって、バークスケールを用いたとき、特定ラウドネスは、ソーン毎バークとなり、同様にERBスケールを用いたとき、単位はソーン毎ERBとなる。
上述のように、人間の耳の感度は周波数とレベルの両方で変化し、この事実は音響心理学の文献によく記載されている。1つの結果によれば、感知された所定のサウンドのスペクトル又は音質は、そのサウンドを聞いたときの音量レベルと共に変化する。例えば、低周波数、中間周波数、及び高周波数を含むサウンドについて、このような周波数成分に相対的に比例する感知成分は、そのサウンドの全体的な音量と共に変化する。静かなときの低周波数成分のサウンドと高周波数成分のサウンドは、うるさいときの中間周波数より静かである。この現象はよく知られており、サウンドを再生する機器においていわゆる音量制御により緩和される。音量制御は、ボリュームを下げるとき、低周波、ときには高周波も強めるボリューム制御である。したがって、周波数の極限で耳の感度が低くなるのをそれらの周波数で人工的に増大させることにより補償する。このような制御は完全に受動的であり、補償の程度は、ボリューム制御の設定値又は他のユーザが操作する制御の設定値の関数であり、オーディオ信号内容の関数ではない。
実際には、低周波数、中間周波数、及び高周波数における感知される相対的スペクトルのバランスに変化は信号、特に、その実際のスペクトル及び意図しているのが大きな音か穏やかな音かに依存する。交響楽団のレコーディングを考える。聴衆の一員がコンサートホールで聞いたときと同じレベルで再生されたとすると、この交響楽団が大きな音で又は穏やかな音のどちらで演奏しているかによってスペクトル横断的なバランスを修正することができる。もし、例えばこの音楽が10dB静かに再生されたならば、感知されたスペクトル横断的なバランスを、大きな音の部分に対してある方法で、静かな音の部分に対して別の方法で変化させる。従来の受動的音量制御では、音楽の関数として異なった補償を適用することはない。
シーフェルト他による、2004年5月27日に出願された国際特許出願No.PCT/US2004/016964であって、2004年12月23日にWO2004/111994A2として国際公開されたものには、特に、オーディオ信号の感知音量を計測し調整するシステムが開示されている。米国を指定国とする前記PCT出願は、その全てを参照として本出願に組み込む。前記出願において、音響心理学的モデルにより、知覚単位でオーディオ信号の音量が計算される。加えて、この出願は、オーディオに適用したとき、ゲインにより補正されたオーディオが実質的に参照音量と同じ音量となる、広帯域に乗算できるゲインを計算する技術が導入されている。しかしながら、このような広帯域ゲインを適用することにより、感知されるオーディオのバランスが変化する。
1つの特徴として、本発明は、その特定ラウドネスと目標特定ラウドネスとの差を縮めるために、オーディオ信号を修正することで、オーディオ信号の特定ラウドネスを制御するのに有用な情報を導き出すものである。特定ラウドネスとは、周波数と時間の関数としての感知音量の指標である。実際の実施の形態において、修正されたオーディオ信号の特定ラウドネスを、目標特定ラウドネスに近似させる。この近似は、以下に既述するように、通常の信号処理の検討に影響されるだけでなく、この修正に用いた時間平滑及び/又は周波数平滑にも影響される。
特定ラウドネスは周波数と時間の関数としての感知音量の指標なので、オーディオ信号の特定ラウドネスと目標特定ラウドネスとの差を縮めるために、前記修正では、 周波数の関数としてこのオーディオ信号を修正してもよい。場合によって目標特定ラウドネスは時間不変であるかもしれず、オーディオ信号自身は定常的な時間不変信号かもしれないが、一般に、この修正では、時間の関数としてオーディオ信号を修正してもよい。
本発明の特徴は、オーディオ再生環境における暗騒音を相殺するために採用することができることである。暗騒音がある状態でオーディオを聞くとき、オーディオのレベルとスペクトル及びノイズのレベルとスペクトルの両方に依存するような形で部分的に又は完全にノイズがオーディオをマスクすることがある。その結果、感知されるオーディオスペクトルの変化があらわれる。音響心理学的研究によれば、(B. C. J. Moore, B. Glasberg, T. Baer, 「閾値音量と部分音量の予想のためのモデル」Journal of the Audio Engineering Society, Vol. 45, No. 4, 1997年4月参照)ノイズのような2次的な干渉性のあるサウンド信号の存在下でオーディオの感知音量として、オーディオの「部分的特定ラウドネス」を定義することができる。
このように、他の特徴として、本発明は、その特定ラウドネスと目標特定ラウドネスとの差を縮めるために、オーディオ信号を修正することで、オーディオ信号の部分的特定ラウドネスを制御するのに有用な情報を導き出すものである。このようにすることで、知覚的に正確な方法でノイズの影響を緩和する。干渉性のあるノイズ信号を考慮に入れる本発明のこの特徴又は他の特徴において、オーディオ信号自身への及び2次的な干渉信号自身へのアクセスを仮定している。
他の特徴として、本発明は、その特定ラウドネスと目標特定ラウドネスとの差を縮めるために、オーディオ信号を修正することで、オーディオ信号の特定ラウドネスを制御するものである。
他の特徴として、本発明は、その部分的特定ラウドネスと目標特定ラウドネスとの差を縮めるために、オーディオ信号を修正することで、オーディオ信号の部分的特定ラウドネスを制御するものである。
目標特定ラウドネスがオーディオ信号の関数ではない場合、目標特定ラウドネスを保存又は受信してもよい。目標特定ラウドネスがオーディオ信号の関数ではない場合、前記修正又は前記導き出しにより、明示的又は黙示的に特定ラウドネス又は部分的特定ラウドネスを計算する。黙示的な計算の例には、特定ラウドネス及び/又は部分的特定ラウドネスを本来的に決定するルックアップテーブル又は「クローズドフォーム」の数学的表現が含まれる(クローズドフォームの用語は、指数関数や正弦関数のように、有限個の標準的な数学的演算及び関数を用いて正確に表現することのできる数学的表現の記述を意味する)。さらに、目標特定ラウドネスがオーディオ信号の関数ではない場合、目標特定ラウドネスは、時間及び周波数的に不変であっても、時間に対してのみ不変であってもよい。
さらに他の特徴として、本発明は、目標特定ラウドネスを生成するための1以上のプロセスパラメータ及び1以上のプロセス制御パラメータに従い、オーディオ信号を処理すること又はオーディオ信号を計測することによりオーディオ信号を処理するものである。目標特定ラウドネスが時間的に不変(「固定」)であっても、目標特定ラウドネスは、都合よく、オーディオ信号の特定ラウドネスの関数とすることができる。それが静的で、時間及び周波数的に不変であるかもしれないが、一般に、オーディオ信号自身は時間及び周波数的に変化し、したがって、目標特定ラウドネスがオーディオ信号の関数であるとき、目標特定ラウドネスは時間及び周波数的に変化する。
オーディオ及び目標特定ラウドネス又は目標特定ラウドネスを代理するものは、伝達により受け取り、又は記憶媒体から再生するることができる。目標特定ラウドネスを代理するものは、オーディオ信号又はオーディオ信号の尺度を圧伸する1以上のスケールファクタとすることができる。
本発明の上記特徴を持つ目標特定ラウドネスは、オーディオ信号の関数又はオーディオ信号の尺度とすることができる。適切なオーディオ信号の尺度の1つが、オーディオ信号の目標特定ラウドネスである。オーディオ信号の関数又はオーディオ信号の尺度の関数は、オーディオ信号の圧伸又はオーディオ信号の尺度の圧伸とすることができる。例えば、この圧伸は、以下の圧伸のうちの1つ又はこれらの組合せとすることができる。
Figure 2008518565
(b)時間的に変化し、周波数的に不変であるスケールファクタΦ[t]は、以下のように特定ラウドネスを圧伸する。
Figure 2008518565
(c)時間的に不変であり、周波数的に変化するスケールファクタΘ[t]は、以下のように特定ラウドネスを圧伸する。
Figure 2008518565
(d)時間的に不変であり、周波数的に不変であるスケールファクタα[t]は、以下のように特定ラウドネスを圧伸する。
Figure 2008518565
Figure 2008518565
(a)の時間及び周波数的に変化するスケールファクタの場合、圧伸は、少なくとも部分的には、好ましい複数帯域音量のそのオーディオ信号の複数帯域音量に対する比により決定することができる。このような圧伸はダイナミックレンジ制御として利用することができる。ダイナミックレンジ制御として本発明の特徴を採用することについての詳細を以下に説明する。
(a)の時間及び周波数的に変化するスケールファクタの場合はまた、特定ラウドネスは、好ましいスペクトル形状の指標とそのオーディオ信号のスペクトル形状の指標との比により圧伸することができる。このような圧伸は、時間的に変化する感知されたスペクトルから実質的に時間的に不変である感知されたスペクトルへと、感知されたオーディオ信号のスペクトルを変換するために採用される。特定ラウドネスが、好ましいスペクトル形状と指標のそのオーディオ信号のスペクトル形状の指標との比により圧伸された場合、このような圧伸は、ダイナミックイコライザーとして利用することができる。ダイナミックイコライザーとして本発明の特徴を採用することについての詳細を以下に説明する。
(b)の時間的に変化し、周波数的に不変であるスケールファクタの場合、圧伸は、少なくとも部分的には、好ましい広帯域音量とそのオーディオ信号の広帯域音量との比により決定することができる。このような圧伸は、自動ゲイン制御又はダイナミックレンジ制御として利用することができる。自動ゲイン制御又はダイナミックレンジ制御として本発明の特徴を採用することについての詳細を以下に説明する。
(a)の場合(時間及び周波数的に変化するスケールファクタ)、又は、(b)の場合(時間的に変化し、周波数的に不変であるスケールファクタ)、スケールファクタは、オーディオ信号の関数又はオーディオ信号の指標の関数とすることができる。
(c)の時間的に不変であり、周波数的に変化するスケールファクタの場合、又は(d)の時間的に不変であり、周波数的に不変であるスケールファクタの場合、両方の場合において、前記修正または前記導き出しには、スケールファクタの保存が含まれることがあり、又は、スケールファクタは外部から受信することができる。
(c)及び(d)のどちらも、スケールファクタはオーディオ信号の関数又はオーディオ信号の指標の関数でなくてもよい。
本発明の全ての特徴及びその修正したものにおいて、修正、導き出し、又は生成には、明示的に又は黙示的に(1)特定ラウドネス、及び/又は、(2)部分的特定ラウドネス、及び/又は、(3)目標特定ラウドネスの計算を行う。黙示的な計算の例には、ルックアップテーブル又はクローズドフォームの数学的表現が含まれる。
修正パラメータは時間的に平滑化されてもよい。修正パラメータは、マルチタップのFIRフィルター又はマルチポールのHRフィルターのような、例えば、(1)オーディオ信号の周波数帯域に関する複数の振幅スケールファクタ、又は(2)1以上のフィルターを制御する複数のフィルター係数とすることができる。このスケールファクタ又はフィルター係数(及び、これらが用いられるフィルター)は時間的に変化するものであってもよい。
目標特定ラウドネスを定義するオーディオ信号の特定ラウドネスの関数又はその逆演算の計算において、このような計算処理は、感知(音響心理学的)音量領域として特徴づけられるような処理、すなわち、計算の入力及び出力が特定ラウドネスとなるような処理で行われる。一方、オーディオ信号の周波数帯域に振幅スケールファクタを適用することにより、あるいは、オーディオ信号の制御可能なフィルタリング処理にフィルター係数を適用することにより、修正パラメータが作用して、電気信号領域として特徴づけられる感知(音響心理学的)音量領域の外のオーディオ信号を修正する。オーディオ信号の修正が電気信号領域で行われるかもしれないが、電気信号領域でのこのような変化は、修正されたオーディオ信号が好ましい目標特定ラウドネスに近似する特定ラウドネスような、感知(音響心理学的)音量領域における計算結果から導き出される。
音量領域での計算から修正パラメータを導き出すことにより、このような修正パラメータを電気信号領域で導き出すのに比べて、感知音量と感知スペクトルバランスに対する卓越した制御を行うことができる。加えて、音量領域での計算を行うに当たって基底膜をシミュレートする音響心理学的フィルターバンク又はその等価物を用いることにより、電気信号領域で修正パラメータを導き出す構成より、感知スペクトルの詳細な制御を行うことができる。
修正、導出、及び生成の各々は、干渉性のあるオーディオ信号の指標、目標特定ラウドネス、特定ラウドネスから導き出された修正されていないオーディオ信号又は修正されたオーディオ信号の部分特定ラウドネスの推定値、修正されていないオーディオ信号の特定ラウドネス、及び特定ラウドネス又は修正されたオーディオ信号の部分特定ラウドネスから導き出された目標特定ラウドネスの概算値のうちの1つ以上に依存する。
この修正又は導出により、少なくとも部分的には、干渉性のあるオーディオ信号の指標、目標特定ラウドネス、特定ラウドネスから導き出された修正されていないオーディオ信号又は修正されたオーディオ信号の部分特定ラウドネスの推定値、修正されていないオーディオ信号の特定ラウドネス、及び特定ラウドネス又は修正されたオーディオ信号の部分特定ラウドネスから導き出された目標特定ラウドネスの概算値のうちの1つ以上から修正パラメータを導くことができる。
もっと具体的には、この修正又は導出により、少なくとも部分的には、
(1)目標特定ラウドネスと、
修正されたオーディオ信号の特定ラウドネスから受け取った修正されていないオーディオ信号の特定ラウドネスの推定値と、
のいずれか1つと、
(2)修正されていないオーディオ信号の特定ラウドネスと、
修正されたオーディオ信号の特定ラウドネスから導き出された目標特定ラウドネスの概算値と、
のいずれか1つと、
から修正パラメータを導くことができ、
又は、
干渉性のあるオーディオ信号を考慮に入れるときは、この修正又は導出により、少なくとも部分的には、
(1)干渉性のあるオーディオ信号の指標と、
(2)目標特定ラウドネスと、
修正されたオーディオ信号の特定ラウドネスから受け取った修正されていないオーディオ信号の特定ラウドネスの推定値と、
のいずれか1つと、
(3)修正されていないオーディオ信号の特定ラウドネスと、
修正されたオーディオ信号の特定ラウドネスから導き出された目標特定ラウドネスの概算値と、
のいずれか1つと、
から修正パラメータを導くことができる。
オーディオ信号から特定ラウドネスから導き出され、目標特定ラウドネスがこの方法以外の音源から受け取られるか、又は、修正又は導出に目標特定ラウドネスの保存が含まれているときには保存したものから受け取られるようなフィードフォワード構成を採用することができる。代替的に、フィードフォワード/フィードバック構成を採用することもでき、ここでは、目標特定ラウドネスの推定が修正されたオーディオ信号から導き出され、目標特定ラウドネスがこの方法以外の音源から受け取られるか、又は、修正又は導出に目標特定ラウドネスの保存が含まれているときには保存したものから受け取られる。
この修正又は導出には、明示的又は黙示的に、目標特定ラウドネスを取得する1つ以上の処理が含まれることがあり、この1つ以上の処理では、明示的又は黙示的に、オーディオ信号の関数又はオーディオ信号の指標の計算を行う。1つの代替的形態では、フィードフォワード構成を採用することができ、ここでは、特定ラウドネスと目標特定ラウドネスとは、オーディオ信号から導き出され、目標特定ラウドネスの導出ではオーディオ信号の関数又はオーディオ信号の指標を採用する。他の代替的形態では、フィードフォワード/フィードバックのハイブリッド構成を採用することができ、ここでは、目標特定ラウドネスの概算値は修正されたオーディオ信号から導き出され、目標特定ラウドネスはオーディオ信号から導き出され、目標特定ラウドネスの導出ではオーディオ信号の関数又はオーディオ信号の指標を採用する。
この修正又は導出には、明示的又は黙示的に、修正されたオーディオ信号に応答して修正されていないオーディオ信号の特定ラウドネスの推定値を取得する1つ以上の処理が含まれることがあり、この1つ以上の処理では、明示的又は黙示的に、オーディオ信号の関数の逆演算又はオーディオ信号の指標の逆演算を行う。1つの代替的形態では、フィードバック構成を採用することができ、ここでは、修正されていないオーディオ信号の特定ラウドネスの推定値と目標特定ラウドネスの概算値は、修正されたオーディオ信号から導き出され、特定ラウドネスの推定値は、オーディオ信号の関数の逆演算又はオーディオ信号の指標の逆演算を用いて計算される。他の代替的形態では、フィードフォワード/フィードバックのハイブリッド構成を採用することができ、ここでは、特定ラウドネスは、オーディオ信号から導き出され、修正されていないオーディオ信号の特定ラウドネスの推定値は、修正されたオーディオ信号から導き出され、この推定値の導出はオーディオ信号の関数の逆演算又はオーディオ信号の指標の逆演算を用いて行われる。
修正されたオーディオ信号を生成させるために修正パラメータをオーディオ信号に適用することができる。
本発明の他の特徴は、実質的なエンコーダ又はエンコーディング処理及びデコーダ又はデコーディング処理となるように、処理又は装置の時間的及び/又は空間的分割ができるという点である。例えば、エンコーディング/デコーディングシステムがあり、そこでは、修正又は導出では、伝達及び受信又は保存を行い、さらに、オーディオ信号と(1)修正パラメータ又は(2)目標特定ラウドネス又は目標特定ラウドネスを代理するものを複製する。代替的に、実質的にエンコーダ又はエンコーディング処理のみがあり、そこでは、オーディオ信号及び(1)修正パラメータ又は(2)目標特定ラウドネス又は目標特定ラウドネスを代理するものの伝達又は保存を行う。代替的に、上述のように、デコーダ又はデコーディング処理のみがあり、そこでは、オーディオ信号及び(1)修正パラメータ又は(2)目標特定ラウドネス又は目標特定ラウドネスを代理するものの受信及び複製を行う。
図1から4は、本発明の特徴による実行可能なフィードフォワード構成、フィードバック構成、及びフィードフォワード/フィードバックの2つのハイブリッド構成の実施例を示す機能ブロックダイアグラムである。
図1のフィードフォワードトポロジーの例を参照すると、オーディオ信号は2つの経路に用いられる。すなわち、(1)修正パラメータに応答してオーディオを修正することのできる処理又は装置2(「オーディオ信号の修正」)を有する信号経路、と(2)このような修正パラメータを生成することのできる処理又は装置4(「修正パラメータの生成」)有する信号経路、である。図1のフィードフォワードトポロジーの例と図2〜4の例における修正パラメータの生成2は、修正パラメータの生成4(図2〜4の例ではそれぞれ、コンピュータ処理又はコンピュータ4’、4’’、4’’’)から受け取った修正パラメータMに応じて周波数及び/又は時間を変更する方法で、オーディオ信号、例えば、その振幅を修正する処理又は装置とすることができる。修正パラメータの生成4とそれに相当する図2〜4のコンピュータは、それぞれ少なくとも部分的には感知音量領域で動作する。オーディオ信号の修正2は、電気信号領域で動作し、図1〜4の各例における修正されたオーディオ信号を生成する。図1〜4の例においてもオーディオ信号の修正2と修正パラメータの生成4(又はそれに相当するコンピュータ)はオーディオ信号を修正し、その特定ラウドネスと目標特定ラウドネスとの差を減少させる。
図1のフィードフォワードの例では、処理又は装置4には、いくつかの処理及び/又装置が含まれる。すなわち、オーディオ信号又はオーディオ信号の特定ラウドネスのようなオーディオ信号の指標に応答して目標特定ラウドネスを計算する「目標特定ラウドネスの計算」処理又は装置と、オーディオ信号又はそのエキサイテーションのようなオーディオ信号の指標に応答して特定ラウドネスを計算する「特定ラウドネスの計算」処理又は装置8と、特定ラウドネスと目標特定ラウドネスとに応答して修正パラメータを計算する「修正パラメータの計算」処理又は装置10と、である。目標特定ラウドネスの計算6は、それぞれが関数パラメータを持つことのできる1以上の関数「F」を実行することができる。例えば、オーディオ信号の特定ラウドネスを計算してそれに1以上の関数Fを適用して目標特定ラウドネスを算出する。これは図1に図解的に示したように、「関数Fと関数パラメータの選択」として処理又は装置6に入力される。処理又は装置6で計算する代わりに、目標特定ラウドネスは、修正パラメータの生成4に含まれるかあるいはこれに関連づけられた(図解的に「保存」として処理又は装置10に入力する)保存処理又は保存装置、又は全体的な処理又は装置の外部の供給源(図解的に「外部」として処理又は装置10に入力する)から提供されてもよい。このように、修正パラメータは、少なくとも部分的には、感知(音響心理学的)音量領域での計算(すなわち、少なくとも特定ラウドネスと、場合によって、目標特定ラウドネスの計算)に基づく。
処理又は装置6,8及び10(及び、図2の例では処理又は装置12,14,10’、図3の例では処理又は装置6,14,10’’、及び、図4の例では処理又は装置8,12,10’’’)によりなされる計算は、明示的及び/又は黙示的に行うことができる。黙示的に行う例には、(1)項目が特定ラウドネス及び/又は目標特定ラウドネス及び/又は修正パラメータの全体又は部分的に基づいているルックアップテーブルと、(2)特定ラウドネス及び/又は目標特定ラウドネス及び/又は修正パラメータの全体又は部分的に本質的に基づいている閉形式の数学的表現と、が含まれる。
図1の例の計算処理又は装置6,8及び10(及び、図2の例では処理又は装置12,14,10’、図3の例では処理又は装置6,14,10’’、及び、図4の例では処理又は装置8,12,10’’’)は、図解的に示され、ここに説明されているが、これは説明のためだけのものである。これらの処理又は装置のいくつか又は全てを、単一の処理又は装置あるいは、複数の処理又は装置の様々な結合に統合してもよいことは了解されよう。例えば、以下の図9の構成、すなわち、図1の例におけるフィードフォワードトポロジーにおいて、修正パラメータを計算する処理又は装置では、オーディオ信号と目標特定ラウドネスとから導き出された平滑化されたエキサイテーションに応答してそれを行う。図9の例では、修正パラメータを計算する処理又は装置では、オーディオ信号の特定ラウドネスを黙示的に計算する。
Figure 2008518565
時間的に変化し、周波数的に不変であるスケールファクタΦ[t]は、以下の関係を持つ特定ラウドネスの圧伸となる、
Figure 2008518565
時間的に不変で、周波数的に変化するスケールファクタΘ[b]は、以下の関係を持つ特定ラウドネスの圧伸となる、
Figure 2008518565
スケールファクタαは、以下の関係を持つオーディオ信号の特定ラウドネスの圧伸となる、
Figure 2008518565
ここで、bは周波数の尺度であり(例えば帯域数)、tは時間の尺度である(例えば、ブロック数)。特定の圧伸及び/又は特定の圧伸の組み合わせの事例を用いて複数の圧伸を採用することができる。このような複数の圧伸の例を以下に示す。場合によって、以下にさらに説明するように、この圧伸はオーディオ信号又はオーディオ信号の指標の関数とすることができる。他の場合では、以下にさらに説明するように、圧伸がオーディオ信号の指標の関数でないとき、圧伸は、別の方法で定められるか又は提供される。例えば、時間と周波数的に不変なスケールファクタα、又は、時間的に不変で、周波数的に変化するスケールファクタΘ[b]での圧伸を選択又は適用することができる。
このようにして、目標特定ラウドネスはオーディオ信号の1以上の関数又はオーディオ信号の指標を表現することができる(特定ラウドネスはオーディオ信号の1つの指標である)。
Figure 2008518565
以下に示すように、逆関数すなわち関数F−1は、図2及び4の例におけるフィードバック構成及びフィードフォワード/フィードバックのハイブリッド構成において計算される。
目標特定ラウドネスの計算6へ入力する「関数と関数パラメータの選択」は、1以上の関数パラメータに従い1以上の関数を適用することにより装置又は処理6は特定ラウドネスの計算を行うことができることを示すために記載されている。例えば、特定ラウドネスの計算8は、目標特定ラウドネスを定義するためにオーディオ信号の特定ラウドネスの関数「F]を計算することができる。例えば、「関数と関数パラメータの選択」入力は、その関数に関連する定数(例えばスケールファクタ)のような、1以上の関数パラメータと共に、1以上の上記形式の圧伸に該当する1以上の特定の関数を選択することができる。
上述の通り、圧伸に関係するスケールファクタは、目標特定ラウドネスが特定ラウドネスの圧伸として計算される限り、目標特定ラウドネスを代理するものとして機能を果たす。このように、図9の例において、以下に説明し上記したように、特定ラウドネスと目標特定ラウドネスがテーブル内で固有であるルックアップテーブルは、スケールファクタ及びエキサイテーションにより索引付けることができる。
ルックアップテーブル、閉形式の数学的表現、あるいは他の技術を採用したとしても、修正パラメータ4(及び各々図2〜4の例におけるそれに対応する処理又は装置4’,4’’,及び4’’’)は、特定ラウドネス及び目標特定ラウドネスが明示的に計算されないとしても、感知(音響心理学的)音量領域で計算される。そこには明示的な特定ラウドネス又は、概念的黙示的な特定ラウドネスが存在する。同様に、そこには明示的な目標特定ラウドネス又は、概念的黙示的な目標特定ラウドネスが存在する。いずれにせよ、修正パラメータの計算は、修正パラメータを生成し、特定ラウドネスと目標特定ラウドネスとの差を減少させるようオーディオ信号を修正することを目的とする。
ノイズのような2次的な干渉性のあるオーディオ信号を有する再生環境において、修正パラメータの計算10(及び各々図2〜4の例におけるそれに対応する処理又は装置10’,10’’,及び10’’’)は、付加的な入力として、2次的な干渉性のあるオーディオ信号の指標又は2次的な干渉信号それ自身もその入力として受け取ることができる。このような付加的な入力は図1(及び図2〜4)に破線で示されている。2次的な干渉性のあるオーディオ信号の指標は、以下に説明する、図17の例におけるそのエキサイテーションでもよい。修正パラメータの計算10(及び各々図2〜4の例におけるそれぞれに対応する処理又は装置10’,10’’,及び10’’’)に対する干渉性のある信号の指標又は信号それ自身(この干渉性のある信号は別に処理することが可能であると仮定する)の処理は、以下に表題「ノイズ補償」でさらに説明するように干渉性信号を考慮に入れた修正パラメータを計算するよう適切に構成した処理又は装置を許容する。図2〜4の例において、部分特定ラウドネスの計算では、適切な干渉性信号の指標をそれぞれ修正パラメータの処理又は装置10’,10’’,又は10’’’に適用するのみならず、この処理又は装置によって、部分特定ラウドネスの計算を容易にするために「修正されていないオーディオの特定ラウドネスの近似値の計算」処理又は装置12及び/又は「目標特定ラウドネスの近似値の計算」処理又は装置14にも用いられる。図1のフィードフォワード例において、部分特定ラウドネスは明示的に計算されない。すなわち、図1の修正パラメータの計算は、修正されたオーディオの部分特定ラウドネスを目標特定ラウドネスに近似させるために、修正パラメータの近似値を計算する。これについては、先に言及した表題「ノイズ補償」でさらに以下に説明する。
上述のように、各図1〜4の例において、修正パラメータMは、信号修正演算2をオーディオ信号に適用するとき、オーディオ修正の結果生じた特定ラウドネス又は部分特定ラウドネスと、目標特定ラウドネスとの差を縮小させる。修正されたオーディオ信号の特定ラウドネスが目標特定ラウドネスに極めて近似するか又は同じとなることが理想である。修正パラメータMは、例えば、フィルターバンクから導き出された周波数帯域又は時間的に変動するフィルターの係数に適用する時間的にて変動するゲインの形をとる。したがって、図1〜4の全ての例において、オーディオ信号の修正2は、例えば、それぞれ周波数低域で動作する複数の振幅圧伸器又は時間的に変化するフィルター(例えば、複数タップのFIRフィルター又は複数極のIIRフィルター)として実施してもよい。
ここで、又は本明細書の他の部分で、同じ参照番号の使用しているものは、その装置又は処理が実質的に同じ参照番号を持つものと同じであることを示す。主要な番号(例えば「10」)の参照番号は、その装置又は処理が構成又は機能において類似するが、同一の基本番号又はその最上位桁が同一の番号を持つ他のものを修正していることを示す。
ある構成では、図1のフィードフォワード例とほぼ等しいフィードバック構成を実現することができる。図2は、信号経路中のオーディオ信号の修正装置又は処理2にもオーディオ信号が用いられるような例を示す。この装置又は処理2は、フィードバック構成において修正パラメータの生成装置又は処理4’がその入力として、オーディオ信号の修正装置又は処理2の出力から修正されたオーディオ信号も受け取る。このようにして、図2の例では、修正されていないオーディオ信号ではなく修正されたオーディオ信号が制御経路に用いられる。オーディオ信号の修正装置又は処理2と修正パラメータの生成装置又は処理4’とは、オーディオ信号を修正し、その特定ラウドネスと目標特定ラウドネスとの差を減少させる。処理又は装置4’には、いくつかの機能又は装置を含むことができる。すなわち、「修正されていないオーディオの特定ラウドネスの近似値の計算」処理又は装置12、「目標特定ラウドネスの近似値の計算」処理又は装置14、及び修正パラメータを計算する「修正パラメータの計算」処理又は装置10’である。
関数Fが可逆であるという条件で、処理又は装置12は、修正されたオーディオ信号の特定ラウドネス又は部分特定ラウドネスに逆関数F−1を適用することにより、修正されていないオーディオ信号の特定ラウドネスを推定する。処理又は装置12は、上述のように、逆関数F−1を計算することができる。これは、図2に処理又は装置12への入力「逆関数F−1と逆関数パラメータの選択」として概略的に示されている。「目標特定ラウドネスの近似値の計算」14は、修正されたオーディオ信号の、特定ラウドネス又は部分特定ラウドネスの計算により動作する。このような特定ラウドネス又は部分特定ラウドネスは、目標特定ラウドネスの近似値となる。修正されていないオーディオ信号の特定ラウドネス及び目標特定ラウドネスの近似値は、修正パラメータの計算10’で使われ、オーディオ信号の修正2に適用された場合は、修正されたオーディオ信号の特定ラウドネス又は部分特定ラウドネスと目標特定ラウドネスとの差を減少させる。上述の通り、修正パラメータMは、例えば、フィルターバンクの周波数帯域に用いられる時間的に変化するゲイン又は時間的に変化するフィルターの係数の形を取る。修正パラメータの計算10’’の実際の形態において、フィードバックループでは、修正パラメータの計算と適用の間に時間遅れを導入することもできる。
上述したように、雑音のような2次的な干渉性のあるオーディオ信号を有する再生環境において、修正パラメータの計算10’、目標特定ラウドネスの近似値の計算12、及び目標特定ラウドネスの近似値の計算14ではそれぞれ、付加的な入力として、2次的な干渉性のあるオーディオ信号又はその入力の1つとしての2次的な干渉性のある信号自身のような指標を受け取ることができ、処理又は装置12及び処理又は装置14は、それぞれ修正されたオーディオ信号の部分特定ラウドネスの計算を行うことができる。このような付加的な入力は図2に破線で示されている。
上述したように、本発明のフィードフォワード/フィードバックのハイブリッド構成の実施例が可能である。図3及び4は、このような実施の形態の2つの例を示す。図3及び4の例において、図1及び2の例のように、オーディオ信号はやはり信号経路中のオーディオ信号の修正処理又は装置2に用いられるが、それぞれの制御経路中の修正パラメータの生成(図3における4’’、図4における4’’’)では修正されていないオーディオ信号と修正されたオーディオ信号の両方を受信する。図3及び4の両方において、オーディオ信号の修正2と修正パラメータの生成(それぞれ4’’と4’’’)では、黙示的であることもある特定ラウドネスと、これも黙示的であることもある目標特定ラウドネスとの差を減少させるためにオーディオ信号を修正する。
図3の例では、修正パラメータの生成処理又は装置4’には、いくつかの機能と装置を含むことができる。すなわち、図1の例のような目標特定ラウドネスの計算6、図2のフィードバック例のような、目標特定ラウドネスの近似値の計算14、及び「修正パラメータの計算」処理又は装置10’’である。図1の例のように、このフィードフォワード/フィードバックのハイブリッド構成例のフィードフォワード部分において、目標特定ラウドネスの計算6では、それぞれが関数パラメータを有することができる1以上の関数「F」を実行する。これは図3に処理又は装置6に入力する「関数Fと関数パラメータの選択」として図解的に示されている。このフィードフォワード/フィードバックのハイブリッド構成例のフィードバック部分において、図2のフィードバックの例のように、修正されたオーディオ信号が、目標特定ラウドネスの近似値の計算14に用いられる。処理又は装置14は、修正されたオーディオ信号の特定ラウドネス又は部分特定ラウドネスを計算することにより、図3の例において、図2の例で行ったような動作を行う。このような特定ラウドネス又は部分特定ラウドネスは、目標特定ラウドネスの1つの近似値となる。(処理又は装置6からの)目標特定ラウドネスと(処理又は装置14からの)目標特定ラウドネスの近似値とは、修正パラメータの計算10’’に適用され、修正パラメータMを導き出す。修正パラメータは、オーディオ信号の修正2によりオーディオ信号に用いられると、修正されないオーディオ信号の特定ラウドネスと目標特定ラウドネスとの差を減少させる。上述のように、これらの修正パラメータMは、例えば、フィルターバンクの周波数帯域に用いられる時間的に変化するゲイン又は時間的に変化するフィルターの係数の形を取る。実際の実施の形態において、フィードバックループでは、修正パラメータMの、計算と適用との間に時間遅れを導入することもできる。上述したように、ノイズのような2次的な干渉性のあるオーディオ信号を有する再生環境において、修正パラメータの計算10’’及び目標特定ラウドネスの近似値の計算14ではそれぞれまた、2次的な干渉性のあるオーディオ信号又はその入力の1つとしての2次的な干渉性のある信号自身のような指標を受け取ることができ、処理又は装置14では、修正されたオーディオ信号の部分特定ラウドネスを計算することができる。このような付加的な入力は図3において破線で示されている。
修正パラメータの計算10’’では、目標特定ラウドネスと目標特定ラウドネス近似値入力との差が、目標特定ラウドネスの近似値と「実際の」目標特定ラウドネスとの差を減少させるように修正パラメータを調整するように、誤差検出装置又は機能を採用することができる。このような調整は、黙示的かもしれないが、修正されていないオーディオ信号の特定ラウドネスと目標特定ラウドネスとの差を減少させる。このようにして、修正パラメータMは、関数Fを用いて元のオーディオの特定ラウドネスからのフィードフォワード経路で計算された目標特定ラウドネスと、修正されたオーディオの特定ラウドネス又は部分特定ラウドネスからのフィードバック経路で計算された目標特定ラウドネスの近似値との誤差に基づいて修正してもよい。
図4の例では、代替的なフィードフォワード/フィードバック構成例が示されている。この代替案は、フィードフォワード経路で関数Fが計算されるのではなく、フィードバック経路で逆関数F−1が計算される点で図3の例とは異なる。図4の例では、修正パラメータの生成処理又は装置4’には、いくつかの関数と装置とを含むことができる。すなわち、図1のフィードフォワード例のような特定ラウドネスの計算8、図2のフィードバック例のような修正されていないオーディオの特定ラウドネスの近似値の計算12、及び修正パラメータの計算10’’’である。図1のフィードフォワード例のような特定ラウドネスの計算8では、修正パラメータの計算10’’’の入力として、修正されないオーディオ信号の特定ラウドネスを与える。図2のフィードバック例のように、関数Fが可逆であることを条件として、処理又は装置12は、修正されたオーディオ信号に特定ラウドネス又は部分特定ラウドネス逆関数F−1を適用することにより、修正されていないオーディオ信号の特定ラウドネスを推定する。修正されていないオーディオの特定ラウドネスの近似値の計算処理又は装置12に入力される「逆関数及び逆関数パラメータの選択」は、処理又は装置12が上述のように逆関数F−1を計算することのできることを示すために示されている。これは、図4において、処理又は装置12への「逆関数F−1逆関数パラメータの選択」入力として図解的に示されている。このように、処理又は装置12は、もう1つの修正パラメータの計算10’’’の入力として、修正されていないオーディオ信号の特定ラウドネスの近似値を提供する。
図1〜3の例のように、修正パラメータの計算10’’’では、この例では黙示的となるが、オーディオ信号の修正2に適用すると、修正されていないオーディオ信号の特定ラウドネスと目標特定ラウドネスとの差を減少させる修正パラメータMを導き出す。上述のように、修正パラメータMは、例えば、フィルターバンクの周波数帯域に用いられる時間的に変化するゲイン又は時間的に変化するフィルターの係数の形を取る。実際の実施の形態において、フィードバックループでは、修正パラメータMの、計算と適用との間に時間遅れを導入することもできる。上述のように、ノイズのような2次的な干渉性のあるオーディオ信号を有する再生環境において、修正パラメータの計算10’’’及び修正されていないオーディオの特定ラウドネスの近似値の計算12ではそれぞれまた、付加的な入力として、2次的な干渉性のあるオーディオ信号又はその入力の1つとしての2次的な干渉性のある信号自身のような指標を受け取ることができ、処理又は装置12では、修正されたオーディオ信号の部分特定ラウドネスを計算することができる。このような付加的な入力は図4において破線で示されている。
修正パラメータの計算10’’’では、特定ラウドネスと特定ラウドネス近似値入力との差が、特定ラウドネスの近似値と「実際の」特定ラウドネスとの差を減少させるように修正パラメータを調整する出力を生じさせるように、誤差検出装置又は機能を採用することができる。目標特定ラウドネスの近似値と考えることのできる、特定ラウドネスの近似値は、修正されたオーディオの特定ラウドネス又は部分特定ラウドネスから導き出されるので、本質的に関数F−1であるこのような調整により、修正されたオーディオの特定ラウドネスと目標特定ラウドネスとの差を減少させる。このようにして、修正パラメータMは、特定ラウドネス同士の差に基づいて更新され、元のオーディオからのフィードフォワード経路で計算され、そして、特定ラウドネスの近似値は、逆関数F−1を用いて修正されたオーディオの特定ラウドネス又は部分特定ラウドネスからのフィードバック経路で計算される。フィードバック経路により、現実的な実施例では修正パラメータの、更新と適用との間に時間遅れを導入する。
図1〜4の例における修正パラメータMは、オーディオ信号の修正処理又は装置2に適用されたとき、オーディオ信号の特定ラウドネスと目標特定ラウドネスとの差を減少させるとはいえ、現実的な実施例では、同じオーディオ信号に応答して生じた対応する修正パラメータはお互いに同じである必要はない。
本発明の重要で本質的な特徴ではないが、オーディオ信号又は修正されたオーディオ信号の特定ラウドネスの計算では、前記国際特許出願No.PCT/US2004/016964であって、WO2004/111964A2として国際公開された技術を採用することが有利であり、ここでは、計算において、2以上の特定ラウドネスモデル関数のグループ、2以上の特定ラウドネスモデル関数の1つ又はその組み合わせ、から選択し、その選択は、入力オーディオ信号の特性の指標により制御される。図1の特定ラウドネスの記述104は、以下のように、このような構成について説明する。
本発明のさらなる特徴によれば、修正されていないオーディオ信号及び、(1)修正パラメータ、又は、(2)目標特定ラウドネス又は目標特定ラウドネスを代理するもの(例えば、目標特定ラウドネスを、明示的又は黙示的に計算するのに使うことのできるスケールファクタ)のどちらか一方を、例えば一時的に及び/又は空間的に分離した装置又は処理において使用するために、保存又は伝達することができる。修正パラメータ又は、目標特定ラウドネス又は、目標特定ラウドネスを代理するものは、例えば、上述の図1〜4のフィードフォワード構成、フィードバック構成、及びフィードフォワードとフィードバックのハイブリッド構成のうちの1つような、適切な方法で決定することができる。実際には、図1の例のようなフィードフォワード構成が、修正されたオーディオ信号に基づく計算を避ける限りにおいて、最も簡単で速い。修正されていないオーディオと修正パラメータの伝達と保存の例を図5に示し、修正されていないオーディオと目標特定ラウドネス又は目標特定ラウドネスを代理するものの伝達と保存の例を図6に示す。
図5の例のような構成は、オーディオ信号への修正パラメータの適用とこのような修正パラメータの生成とを一時的に及び/又は空間的に分離するために用いることができる。図6の例のような構成は、修正パラメータの生成と適用の両方と、目標特定ラウドネス又は目標特定ラウドネスを代理するものとを一時的に及び/又は空間的に分離するために用いることができる。両方の構成形式により、修正パラメータの生成や目標特定ラウドネスの生成における複雑さを避けた単純な低価格の再現又は受信構成が可能となる。図5の形式の構成のほうが図6の形式の構成より簡単であるが、図6の構成は、保存又は伝達に必要とされる情報がより少なく、特に、1以上のスケールファクタのような目標特定ラウドネスを代理するものが保存又は伝達されるとき、有利となる。このような、情報の保存と伝達の削減は、低ビットレートのオーディオ環境で特に有用である。
したがって、本発明のさらなる特徴によれば、(1)保存又は伝達装置又は処理から修正パラメータMを受け取り、それを、受け取ったオーディオ信号に適用する装置又は処理、又は、(2)保存又は伝達装置又は処理から、目標特定ラウドネス又は目標特定ラウドネスを代理するものを受け取り、受け取ったオーディオ信号に(又は、このオーディオ信号〜導き出される特定ラウドネスのようなオーディオ信号の指標に)この目標特定ラウドネス又はそれを代理するものを適用することにより、修正パラメータMを生成し、この修正パラメータMをオーディオ信号に適用する装置又は処理を提供するものである。このような装置又は処理は、デコーディング処理又はデコーダとして特徴づけることができ、保存又は伝達された情報を生成するために必要な装置又は処理は、エンコーディング処理又はエンコーダとして特徴づけることができる。このようなエンコーディング処理又はエンコーダは、それぞれのデコーディング処理又はデコーダで必要とされる情報を生成するのに有効な、図1〜4の構成例の一部となる。このようなデコーディング処理又はデコーダは、サウンドを処理及び/又は再生する事実上すべての装置又は処理に関係付けること又は動作させることができる。
本発明の1つの特徴によれば、図5の例において、例えば、図1の修正パラメータの生成4、図2の4’、図3の4’’、図4の4’’’のような、修正パラメータの生成処理又は生成装置により作られた修正されていないオーディオ信号及び修正パラメータMは、適切な保存装置又は伝達装置(「保存又は伝達」)16に適用することができる。エンコーディング処理又はエンコーダとして図1のフィードフォワード例を用いる場合、オーディオ信号の修正2は、修正されたオーディオを生成するためには必要なく、エンコーダ又はエンコーディング処理の時間的又は空間的位置にこの修正されたオーディオを供給する必要がなければ削除することができる。保存又は伝達16には、例えば、適切な磁気記憶再生装置、光学的記憶装置再生装置、又は、半導体記憶再生装置、あるいは、適切な電線による伝達受信装置、ワイヤレス伝達受信装置を含めることができるが、これらの選択は本発明に重要ではない。再生した修正パラメータ又は受信した修正パラメータは、次いで、その特定ラウドネスが、修正パラメータが導き出された構成における目標特定ラウドネス又はこの構成において本質的な目標特定ラウドネスに近似するように、再生した修正パラメータ又は受信した修正パラメータを修正するために、図1〜4の例において採用されたオーディオ信号の修正2に用いられる。この修正パラメータはさまざまな方法で保存又は伝達することができる。例えば、これらはオーディオ信号に伴うメタデータとして保存又は伝達することができ、これらは、別の経路又はチャンネルで送ってもよく、オーディオ中に電子迷彩技術によりエンコードしてもよく、マルチプレクックスしてもよい。オーディオ信号を修正する修正パラメータの使用は任意としてもよく、もし任意とするならば、例えばユーザによりその使用を選択できるようにしてもよい。例えば、オーディオ信号に修正パラメータが用いられる場合は、オーディオ信号のダイナミックレンジを下げるかもしれない。このようなダイナミックレンジを採用するかどうかはユーザにより選択可能にすることができる。
図6の例のように、本発明の他の特徴によれば、修正されていないオーディオ信号と目標特定ラウドネス又は目標特定ラウドネスを代理するものは、適切な保存又は伝達装置又は機能(「伝達又は保存」)16に適用することができる。図1の例のように、エンコーディング処理又はエンコーダとしてフィードフォワード構成を用いる場合は、修正パラメータの計算型の処理又は装置もオーディオ信号の修正型の処理又は装置も必要ではなく、エンコーダ又はエンコーディング処理の時間的又は空間的位置に修正パラメータ又は修正されたオーディオを供給することを必要としないならば、削除してもよい。図5の例の場合のように、保存又は伝達16には、例えば、適切な磁気記憶再生装置、光学的記憶装置再生装置、又は、半導体記憶再生装置、あるいは、適切な電線による伝達受信装置、ワイヤレス伝達受信装置を含めることができるが、これらの選択は本発明に重要ではない。再生した目標特定ラウドネス又は目標特定ラウドネスを代理するもの又は受信した目標特定ラウドネス又は目標特定ラウドネスを代理するものは、次いで、図1〜4の例において採用された形式のオーディオ信号の修正2に適用する修正パラメータMを供給するために、再生したオーディオ信号又は受信したオーディオ信号の特定ラウドネスが、修正パラメータを導き出す構成において目標特定ラウドネスに近似するか又は本質的となるよう、再生したオーディオ信号又は受信したオーディオ信号を修正するために、図1の例で採用された形式の、修正パラメータの計算10に、又は図3の例で採用された形式の、修正パラメータの計算10’’に修正されていないオーディオと共に用いられる。目標特定ラウドネス又はその代理をするものが図1の例の形式のエンコーディング処理又はエンコーダで極簡単に取得できるかもしれないが、目標特定ラウドネス又はその代理をするもの又は目標特定ラウドネス又はその代理をするものの近似値は、図2から4までの例の形式のエンコーディング処理又はエンコーダで(近似値は図2及び3の処理又は装置14、及び図4の処理又は装置12で)取得することができる。目標特定ラウドネス又はその代理をするものは、種々の方法で保存又は伝達される。例えば、これらはオーディオ信号に伴うメタデータとして保存又は伝達することができ、これらは、別の経路又はチャンネルで送ってもよく、オーディオ中に電子迷彩技術によりエンコードしてもよく、マルチプレクックスしてもよい。オーディオ信号を修正するために、保存又は伝達された目標特定ラウドネス又はその代理をするものから導き出された修正パラメータの使用は任意としてもよく、もし任意とするならば、例えばユーザによりその使用を選択できるようにしてもよい。例えば、オーディオ信号に修正パラメータが用いられる場合は、オーディオ信号のダイナミックレンジを下げるかもしれない。このようなダイナミックレンジを採用するかどうかはユーザにより選択可能にすることができる。
開示された発明をディジタルシステムとして実施する場合は、フィードフォワード構成が最も実用的なので、そのような構成の例を以下に詳細に説明するが、これは本発明をそれに限定するものではないことは了解されよう。
本明細書を通じて、ここで「フィルター」又は「フィルターバンク」のような用語には、本質的にIIRフィルター又は変換のようなあらゆる再帰的及び非再帰的なフィルター処理が含まれ、「フィルターされた」情報は、このようなフィルターを適用した結果得られたものである。以下に記載の実施の形態では、変換により実行されたフィルターバンクを採用する。
図7は、フィードフォワード構成で実施した本発明の特徴の模範的な実施の形態の詳細を示したものである。オーディオは、まず分析フィルターバンク機能又は装置(「分析フィルターバンク」)100を通過し、そこでオーディオ信号を複数の周波数帯域に分割する(したがって、図5は、各出力が周波数低域を表す、分析フィルターバンク100からの複数の出力を示し、その出力が種々の機能又は装置を通って合成フィルターバンクに伝わり、以下に説明するように、その帯域を加算して結合された広帯域の信号となる)。分析フィルターバンク100における各周波数帯域に関連するフィルターの応答は、内耳における基底膜の特定の位置の応答をシミュレートするよう設計している。分析フィルターバンク100の各フィルターの出力は、次に、外耳又は中耳を通るオーディオの伝達における効果のフィルター処理をシミュレートする伝達フィルター又は伝達フィルター機能(「伝達フィルター」)101に入る。このオーディオのラウドネスが計測されさえすれば、伝達フィルターを分析フィルターバンクに先立って適用することができるが、分析フィルターバンクの出力は、修正されたオーディオの合成に用いられるので、このフィルターバンクの後に伝達フィルターを適用する方が好都合である。伝達フィルター101の出力は、次に、エキサイテーション機能又は装置(「エキサイテーション」)102に入り、その出力は基底膜に沿ってのエネルギーの分布をシミュレートする。エキサイテーションエネルギー値は、平滑化機能又は装置(「平滑化」)103により時間的に平滑化される。平滑化機能の時定数は、必要なアプリケーションでの要求にしたがって設定される。平滑化されたエキサイテーション信号は、続いて、特定ラウドネス機能又は装置(「特定ラウドネス(SL)」)104の特定ラウドネスに変換される。特定ラウドネスは、ソーン毎単位周波数の単位で表現される。各帯域に関連づけられたこの特定ラウドネスの成分は、特定ラウドネス修正機能又は装置(「SL修正」)105に入る。SL修正は元の特定ラウドネスをその入力とし、本発明の特徴に従い、元の特定ラウドネスの関数であることが好ましい(次の「目標特定ラウドネス」の見出しの表題を参照のこと)、好ましい又は「目標」特定ラウドネスを出力する。SL修正105は、各帯域で独立に動作することができ、好ましい効果によっては、帯域間で相互依存が存在していてもよい(図7の相互接続ラインで示唆したような周波数平滑化)。入力としてエキサイテーション102から平滑化されたエキサイテーション周波数帯域と、SL修正105から目標特定ラウドネスとを取り込み、ゲインソルバー機能又は装置(「ゲインソルバー」)106は、計測した特定ラウドネスを目標特定ラウドネスに変換するために、分析フィルターバンク100の出力の各大域に適用する必要のあるゲインを決定する。ゲインソルバーはさまざまな方法で実行することができる。例えば、ゲインソルバーには、前記国際特許出願No.PCT/US2004/016964であって、WO2004/111964A2として国際公開されたものに開示された方法のような反復的な方法、又は、代替的にルックアップテーブルを見る方法が含まれる。ゲインソルバー106により作られた帯域毎のゲインを、感知できるアーティファクトを最小限にするために任意的な平滑化機能又は装置(「平滑化」)107により時間的にさらに平滑化することができるが、他で説明したように、処理又は装置全体の他の場所で時間的平滑化を適用することが好ましい。最後に、それぞれの乗算結合機能又は結合器108を介して分析フィルターバンク100のそれぞれの帯域にゲインが適用され、処理又は「修正された」オーディオは、合成フィルターバンク機能又は装置(「合成フィルターバンク」)110において、ゲイン修正された帯域から合成される。加えて、分析フィルターバンクからの出力は、ゲインの計算における待ち時間を埋め合わせるために、ゲインを適用する前に時間遅れ機能又は装置(「時間遅れ」)109により時間遅れが加えられる。代替的に、周波数帯域でのゲイン修正の適用に用いるためにゲインを計算する代わりに、ゲインソルバー106は、複数タップのFIRフィルターまたは複数極のIIRフィルターのような時間的に変化するフィルターを制御するフィルター係数を計算してもよい。説明を簡単にするために、本発明の特徴は主に周波数帯域に用いられるゲイン要素を採用するような記載となっているが、このフィルター係数と時間的に変化するフィルターを実際的な実施の形態に採用することもできる。
実際的な実施の形態において、オーディオの処理は、ディジタル領域で実行するかもしれない。したがって、オーディオ入力信号は、オーディオ源からサンプリング周波数fでサンプルされた離散的な時間シーケンスx[n]で表される。下式で与えられるx[n]のrmsパワーが人間のリスナに聴取されるdB単位の音圧レベルに等しくなるように、シーケンスx[n]は適切に圧伸されていると仮定する。
Figure 2008518565
加えて、オーディオ信号は説明を簡単にするためにモノラルであると仮定する。
分析フィルターバンク100、伝達フィルター101、エキサイテーション102、特定ラウドネス104、特定ラウドネス修正105、ゲインソルバー106、及びフィルターバンク110については以下に詳細を説明する。
[分析フィルターバンク100]
オーディオ入力信号は分析フィルターバンク又は機能(「分析フィルターバンク」)100に用いられる。分析フィルターバンク100の各フィルターは、内耳の基底膜に沿う特定の位置での周波数応答をシミュレートするよう設計されている。分析フィルターバンク100には、MooreとGlasbergとBaerが定義したような(B. C. J. Moore, B. Glasberg, T. Baer, 「閾値音量と部分音量の予想のためのモデル」参照)、等価矩形帯域幅(ERB)で帯域幅と間隔が一定の線形フィルターが含まれる。
ERB周波数スケールは、人間の知覚にしっかりと合致しており、より主観的な音量に合致することとなる客観的な音量計測を行う上で性能の改善を示しているが、性能を下げてバーク周波数スケールを適用してもよい。
ヘルツ単位の中心周波数f、ヘルツ単位のERBの1つの帯域幅は以下のように近似できる。
Figure 2008518565
この関係から、歪んだ周波数スケールが、歪んだスケールのどの点でも歪んだスケールの1つにおける対応するERBが等しくなるように定義される。ヘルツ単位の線形周波数からこのERB周波数スケールへの変換のための関数は式(1)の逆数を積分することにより得られる。
Figure 2008518565
fについて式(2a)を解くことによりERBスケールから線形周波数スケールに戻す変換を表現することもまた有益である。
Figure 2008518565
ここで、eは、ERBスケールの単位である。図9は、ERBスケールとヘルツ単位の周波数との関係を示す。
分析フィルターバンク100には、ERBスケールに沿って一定間隔の中央周波数f[I]...f[B]で表されるB聴覚フィルターを含むことができる。より具体的には
Figure 2008518565
ここで、Δは、分析フィルターバンク100の好ましいERB間隔であり、fminとfmaxとはそれぞれ好ましい最大中央周波数と最小中央周波数である。Δ=1を選び、人間の耳が感知できる周波数範囲を考慮に入れて、fmin=50Hzそしてfmax=20000Hzに設定することができる。このようなパラメータにより、例えば、式(3a)〜(3c)に適用してB=40の聴覚フィルターが得られる。
各聴覚フィルターの振幅周波数応答は、MooreとGlasbergが示したように、端数を切り捨てた指数関数により特徴づけることができる。具体的には、中央周波数f[b]を持つしルターの振幅応答は、以下のように計算される、
Figure 2008518565
ここで、
Figure 2008518565
このようなB聴覚フィルターの振幅応答は、ERBスケールでのクリティカル帯域を近似し、図10に示される。
分析フィルターバンク100のフィルター処理は、一般に短時間離散フーリエ変換(STDFT)と称される有限長の離散フーリエ変換を用いて適切に近似される。なぜなら、フルレート実施と称される、オーディオ信号のサンプリングレートでこのフィルターを実施することは、正確な音量計測に必要とする以上の時間分解能が得られると信じられているからである。フルレート実施の代わりにSTDFTを用いることにより、効率を改善し計算の複雑さを緩和することができる。
入力オーディオ信号x[n]のSTDFTは以下のように定義される、
Figure 2008518565
ここで、kは周波数インデックスであり、tは時間ブロックインデックスであり、NはDFTのサイズであり、Tはホップサイズであり、w[n]は、以下のように規格化した長さNの窓である。
Figure 2008518565
ここで、式(5a)の変数tは、秒での時間尺度に対立するSTDFTの時間ブロックを表す離散インデックスであることに留意すべきである。tにおける増加は、信号x[n]に沿ってTサンプルのホップを表す。それに続くインデックスtの参照はこの定義を想定する。実施の形態の詳細に応じて、異なったパラメータの設定と窓の形を用いることができるが、fs=44100Hz、N=2048、T=1024、そしてw[n]を
ハニング窓にすることで、適切な時間分解能と周波数分解能とのバランスが得られる。上述のSTDFTは、高速フーリエ変換(FFT)を用いるとより効率的になる。
STDFTの代わりに、変形離散コサイン変換(MDCT)を分析フィルターバンクを実施するために用いることができる。MDCTは、ドルビーAC−3のような、知覚オーディオコーダに一般的に用いられる変換である。開示したシステムがこのような知覚的にコード化されたオーディオを実施する場合、開示した音量計測と修正により、コード化されたオーディオの既存のMDCT係数をより効率的に処理することができ、それにより、分析フィルターバンク変換が削除される。入力信号x[n]のMDCTは下式で得られる。
Figure 2008518565
一般にホップサイズTは、信号x[n]の完全な再構成が可能となるよう変換長Nのちょうど2分の1となるよう選ばれる。
[伝達フィルター101]
分析フィルターバンク100の出力は、フィルターバンクの各帯域が外耳及び中耳を通るオーディオの伝達に合致するようにフィルター処理する、伝達フィルター又は伝達フィルター機能(「伝達フィルター」)101に用いられる。図8は、可聴周波数レンジでの伝達フィルターP(f)の適切な振幅周波数応答を示す。この応答は1kHz以下で一定であり、1kHz以上では、ISO226標準で定義された聴覚閾値の逆数に従い、この閾値は、1kHzで一致するよう正規化される。
[エキサイテーション102]
入力オーディオ信号の音量を計算するためには、伝達フィルター101を適用した後の分析フィルターバンク100の各フィルターにおけるオーディオ信号の短時間エネルギーの指標が必要である。この時間的にまた空間的に変化する指標はエキサイテーションと称される。分析フィルターバンク100の各フィルターにおける短時間エネルギー出力は、周波数領域でのフィルター応答に入力信号のパワースペクトルを乗算することにより、エキサイテーション関数102に近似させることができる。
Figure 2008518565
ここで、bは帯域数、tはブロック数、Hb[k]とP[k]は、STDFTビンインデックスk又はMDCTビンインデックスkに対応する周波数でサンプルされた、それぞれ聴覚フィルター及び聴覚伝達フィルターの周波数応答である。ここで、同様の結果を得るために、式(4a)〜(4c)で説明したものとは違う聴覚フィルターの振幅応答の形を式(7)で用いることに留意すべきである。例えば、前記国際特許出願No.PCT/US2004/016964であって、国際公開番号WO2004/111964A2として国際公開されたものでは、2つの代案が記載されている。すなわち、12次のIIR変換で特徴づけられる聴覚フィルターと、低価格の「レンガ壁(brick−wall)」帯域通過近似値である。
要約すると、エキサイテーション関数102の出力は、時間間隔t毎のそれぞれのERB帯域におけるエネルギーEの周波数領域での表現である。
[時間平均化(「平滑化」)103]
開示された発明の応用において、以下に説明するように、それを特定ラウドネスに変換する前に、エキサイテーションE[b,t]を平滑化することが好ましい。例えば、下式により、平滑化関数103を再帰的に行うことで平滑化を実行することができる。
Figure 2008518565
ここで、帯域bでの時定数λbは、望みの応用例に応じて選定する。多くの場合帯域b内で人の音量感知の時間積分に比例して選定することが好都合である。WatsonとGengelが、この時間積分が低周波数(125〜200Hz)で150〜175ms以内であり、高周波数で40〜60msであることを実験的に示した(Charles S. Watson及びRoy W. Gengelの「聴覚感度に関連する信号継続と信号周波数」,Journal of the Acoustical Society of America,Vol.46, No.4 (Part2),
1969, pp.989-997)。
[特定ラウドネス104]
特定ラウドネス変換又は変換関数(「特定ラウドネス」)104において、エキサイテーションの各周波数帯域は、ソーン毎ERBで計測される、特定ラウドネスの成分値に変換される。
Figure 2008518565
Figure 2008518565
ここで、T1kHz(E,f)は、周波数fではレベルEの音量に等しい1kHzでのレベルを生成する関数である。実際にはT1kHz(E,f)は、伝達フィルターにより正規化された等音量曲線のルックアップテーブルの補間として実行される。1kHzでの等価なレベルに変換することで、以下の特定ラウドネスの計算が簡単になる。
次に、各帯域の特定ラウドネスは以下のように計算される。
Figure 2008518565
ここで、NNB[b,t]とNWB[b,t]は、それぞれ狭帯域信号モデルと広帯域信号モデルに基づく特定ラウドネス値である。値α[b,t]は、オーディオ信号から計算される0と1との間の補間係数である。前記国際特許出願No.PCT/US2004/016964であって、国際公開番号WO2004/111964A2で国際公開されたものには、エキサイテーションのスペクトルの平坦性からα[b,t]を計算する技術が記載されている。また、「狭帯域信号」信号モデルと「広帯域」信号モデルについても詳細に記載されている。
狭帯域特定ラウドネス値と広帯域特定ラウドネス値、NNB[b,t]とNWB[b,t]は、指数関数を用いて変換されたエキサイテーションから推定することができる。
Figure 2008518565
ここでTQ1kHzは、1kHzのトーンに対する静音の閾値でのエキサイテーションレベルである。等音量曲線(図11と12)TQ1kHzからは4.2dBである。これらの特定ラウドネス関数は両方とも、エキサイテーションが静音の閾値に等しいとき、ゼロに等しいことに留意すべきである。静音の閾値より大きなエキサイテーションに対して、両方の関数は、感覚の強さについてのスチーブンスの法則に従うパワーの法則により単調に増大する。狭帯域関数の指数は広帯域関数より大きくなるよう選定し、狭帯域関数を広帯域関数より速く増大させる。狭帯域と広帯域の場合の指数βとゲインGの具体的な選定は、トーンに対する音量とノイズの増大に対する経験的なデータと適合するように選択される。
MooreとGlasbergが示したように、特定ラウドネスはエキサイテーションが聴覚の閾値にあるとき、ゼロの代わりの小さな値にしておくべきである。エキサイテーションがゼロに向かって減少するにつれて、特定ラウドネスは単調にゼロに向かって減少してゆく。この理由は、聴覚の閾値が蓋然的な閾値であり(トーンが50%の回数で検出される点)、一緒に現れた、各々閾値である複数のトーンが、個々のトーンより可聴であるサウンドの和であるかもしれないからである。開示した本出願において、この特性を有する特定ラウドネスの増大により、以下に説明するように、エキサイテーションが閾値に近いときゲインソルバーに、より適切な振る舞いをさせるという利点が加えられる。エキサイテーションが閾値又は閾値以下にあるとき、特定ラウドネスをゼロに定めると、ゲインソルバーの一意的な解は存在しない。一方、MooreとGlasbergが示したように、特定ラウドネスをゼロ以上のすべてのエキサイテーションの値に対して単調増加するように定めた場合、一意的な解が存在する。音量の圧伸が一定以上であればゲインは一定以上となり、その逆も成り立つ。式(11a)と(11b)の特定ラウドネス関数は、下記の好ましい特性を持つよう修正することができる。
Figure 2008518565
Figure 2008518565
Figure 2008518565
特定ラウドネスから、すべての帯域に亘って特定ラウドネスを積算することにより、全体の又は「トータル」音量L[t]が得られる。
Figure 2008518565
Figure 2008518565
以下に詳細に説明するように、例えば音量制御の場合、スケールファクタαを用いて目標特定ラウドネスを計算することができる。以下の式(16)及びそれについての説明を参照のこと。自動ゲイン制御及びダイナミックレンジ制御の場合、目標特定ラウドネスは、好ましい出力音量と入力音量との比を用いて計算することができる。以下の式(17)と(18)及びそれらについての説明を参照のこと。ダイナミックイコライゼーションの場合は、式(23)及びそれについての説明に示した関係を用いて目標特定ラウドネスを計算する。
Figure 2008518565
Figure 2008518565
ゲインソルバーは以下となるようにG[b,t]を求める。
Figure 2008518565
ゲインソルバー106は、元のエキサイテーションに適用したとき、特定ラウドネスが理想的には目標特定ラウドネスに等しくなるような特定ラウドネスが結果的に得られるような周波数的に変化し時間的に変化するゲインを定める。実際には、ゲインソルバーは、周波数領域でのオーディオ信号に適用したとき、特定ラウドネスと目標特定ラウドネスとの差を減少させるようにオーディオ信号を修正する結果となるような周波数的に変化し時間的に変化するゲインを定める。理想的には、修正されたオーディオ信号が目標特定ラウドネスに非常に近似した特定ラウドネスを持つように、修正を行う。式(14a)の解は、さまざまな方法で実行できる。例えば、Ψ−1{.}で表される、特定ラウドネスの逆数の閉形式数学的表現が存在するなら、式(14a)を再構成することにより直接的にゲインを計算することができる。
Figure 2008518565
代替的に、もし、Ψ−1{.}の閉形式の解が存在しないならば、式(14a)の繰り返しを、そのときのゲインの推定値を用いて評価する反復的なアプローチを採用することができる。結果得られた特定ラウドネスを好ましい目標と比較し、ゲインを誤差に基づいて更新する。もしゲインが適切に更新されたなら、好ましい解に収束する。もう1つの方法は、ルックアップテーブルを作るために各帯域のエキサイテーション値の範囲で関数Ψ{.}をあらかじめ計算する。このルックアップテーブルから、逆関数Ψ−1{.}の近似が得られ、そして式(14b)からゲインが計算される。先に説明したように、目標特定ラウドネスは、特定ラウドネスを圧伸することで表現することができるから、
Figure 2008518565
式(13)を(14c)に代入し、(14c)を(14b)に代入してゲインの他の表現が得られる。
Figure 2008518565
Figure 2008518565
したがって、ゲインは、中間値として特定ラウドネスや目標特定ラウドネスを明示的に計算することなく、(14d)の評価又は等価なルックアップテーブルから計算することができる。しかし、これらの値は式(14d)の使用を通じて黙示的に計算される。特定ラウドネスや目標特定ラウドネスを明示的又は黙示的に計算することで修正パラメータを計算する等価な他の方法も工夫することができ、この発明はこのような方法のすべてを包含するものである。
[合成フィルターバンク110]
上述したように、分析フィルターバンク100は、短時間離散フーリエ変換(STDFT)又は変形離散コサイン変換を用いることにより効率的に実施できるが、STDFT又はMDCTは同様に合成フィルターバンク110の実施に用いることができる。具体的には、X[k,t]に入力オーディオのSTDFT又はMDCTを表現させると、先に説明したように、合成フィルターバンク110で処理した(修正された)オーディオSTDFT又はMDCTは以下のように計算することができる。
Figure 2008518565
ここでS[k]は、帯域bに関する合成フィルターの応答であり、dは図7の時間遅れブロック109に関する時間遅れである。合成フィルターS[k]の形は、分析フィルターバンクで用いたフィルター、H[k]、と同じに選んでもよく、又はこれらを、ゲイン修正なしで(すなわちG[b,t]=1で)完全な再構成ができるように修正してもよい。
Figure 2008518565
本発明は、目標特定ラウドネスを計算するための特定の関数又は逆関数に制限されるものではないが、いくつかのそのような関数と適切な応用例をここで説明する。
[音量制御に適した時間的に変化せず、周波数的に変化しない関数]
標準の音量制御ではオーディオに広帯域ゲインを適用することによりオーディオ信号の音量を調整する。一般に、ゲインは、オーディオ音量が望みのレベルになるまでユーザが調整するノブ又はスライダーと結合している。本発明の特徴によれば、このような制御をより音響心理学的に満足させるようにすることができる。本発明のこの特徴によれば、感知するスペクトルの変化をもたらすかもしれない、全周波数帯域に亘って同じ量だけゲインを変化させる音量制御と結合した広帯域ゲインを持つのではなく、理想的には感知するスペクトルに変化がないよう複数の周波数帯域のそれぞれのゲインが人の聴覚モデルを考慮に入れた量だけ変化するように、特定ラウドネススケールファクタが代わって音量制御の調整と結合している。本発明の特徴及びその応用例の記載において、「一定」又は「時間的に変化しない」は、例えば人により、音量制御スケールファクタの設定を時間と共に変化させることを許容するものである。このような、「時間的に変化しない」は、しばしば「ある程度時間的に変化しない」、「ある程度一定である」「区分的に時間的に変化しない」、「区分的に一定である」、「階段状に時間的に変化しない」、及び「階段状に一定である」というように称される。このようなスケールファクタαが与えられると、αで乗算され、計測された特定ラウドネスとして目標特定ラウドネスを計算することができる。
Figure 2008518565
トータル音量L[t]が特定ラウドネスN[b,t]の全帯域bに亘っての和なので、上記修正ではファクタαによりトータル音量を圧伸するが、音量制御の調整を変更させるときに感知したスペクトルを同じに維持するような方法でそれを行う。言い換えれば、どんなときでも、音量制御の調整を変更することにより、感知した音量が変化することになるが、修正されたオーディオの感知したスペクトルと修正されていないオーディオの感知したスペクトルとにおいて変化はない。図13aは、女性の音声を含むオーディオ信号に対してα=0.25のとき、時間「t」で帯域「b」に亘って得られた複数帯域ゲインG[b,t]を示す。比較のために、標準の音量制御として、元のトータル音量を0.25で圧伸するのに必要な広帯域ゲインを点線で示す(水平線)。この複数帯域ゲインG[b,t]は、中間周波数帯域に比べて高周波数帯域と低周波数帯域とで増加している。これは、人の耳が高周波数と低周波数とで感度が低くなることを示す等音量曲線を満足している。
図13bは、元のオーディオ信号の特定ラウドネスと、先行技術の音量制御により修正されたものとしての広帯域ゲイン修正された信号の特定ラウドネスと、本発明の特徴により修正されたものとしての複数帯域ゲイン修正された信号の特定ラウドネスとを示したものである。複数帯域ゲイン修正された信号の特定ラウドネスは、オリジナルを0.25で圧伸したものである。広帯域ゲイン修正された信号の特定ラウドネスは、元の修正されていない信号の特定ラウドネスに対してそのスペクトルの形が変わっている。この場合、特定ラウドネスは相対的に、低周波数と高周波数の両方で音量が失われている。これは、オーディオの音量を下げたときのオーディオの曇りとして感知され、この問題は、音量が感知音量領域で導き出されたゲインで制御されている、複数帯域で修正された信号では起こらない。
従来の音量制御に関する感知されたスペクトルバランスの歪みに加えて、第2の問題が存在する。式(11a)〜(11d)に反映された音量モデルに反映されている音量検知の特性は、信号レベルが聴覚の閾値に近づくにつれて、あらゆる周波数において信号の音量が速く減少して行くことである。その結果、音量の小さな信号に同じ音量減衰を与えるのに必要な電気的減衰は、音量の大きな信号に必要なものより少ない。従来の音量制御では、信号レベルを考慮しないで一定の減衰を与えているので、音量を下げたとき、音量の大きな信号に対して音量の小さな信号は、「音量が小さすぎ」になる。多くの場合この結果オーディオの詳細が失われる結果となる。カスタネットを残響室でレコーディングすることを考える。このようなレコーディングにおいて、カスタネットの主となる「一打」は反射エコーに比べて非常に大音量であるが、部屋の大きさを伝達するのは反射エコーである。従来の音量制御で音量を下げるにつれて、反射エコーは、主となる一打に比べて音量が小さくなり、最終的に聴覚の閾値以下に消えてしまい、「乾いた」カスタネット音を残す。音量に基づく音量制御により、音量の大きい部分と音量の小さい部分との相対音量を一定に保つために、音量の大きい部分に比較して音量の小さい残響部分を押し上げることにより、レコーディングにおける音量の小さい部分の消失を防止する。このような効果を達成するために、複数帯域ゲインG[b,t]は、人の音量に対する時間分解能とつりあった速さで時間的に変化しなければならない。
Figure 2008518565
先に述べたように、これらの時定数は帯域b内での人の音量感知の時間の積分に比例して選定することができ、そして時間について適切なG[b,t]の変化を生み出す。もし時定数が不適切(速すぎるか遅すぎる)に選定されるならば、感知できる不快なアーティファクトが処理したオーディオに持ち込まれる。
[固定イコライゼーションに適した時間的に不変で周波数的に変化する関数]
いくつかの応用例において、オーディオに感知可能な固定のイコライゼーションの適用を望むかもしれず、この場合、目標特定ラウドネスは、下式のように、時間的に不変であるが周波数的に変化するスケールファクタΘ[b]をその関連として用いて計算することができる。
Figure 2008518565
Figure 2008518565
この場合、圧伸は帯域から帯域で変化してもよい。このような応用例は、例えば理解しやすさを増すために音声周波数で目立つスペクトルを部分的に強調するのに有効である。
[自動ゲイン制御及び自動ダイナミックレンジ制御に適した周波数的に不変で時間的に変化する関数]
自動ゲイン制御及び自動ダイナミックレンジ制御(AGC及びDRC)の技法は、オーディオ処理の分野でよく知られている。抽象的な意味では、両方ともある方法でオーディオ信号のレベルを計測し、そして、計測したレベルの関数である量で信号のゲインを修正する。AGCの場合では、計測したレベルが、ユーザが選択した参照レベルに近似するように信号のゲインが修正される。DRCでは、信号の計測したレベルが好ましいレンジに変換されるように信号のゲインが修正される。例えば、オーディオの静かな部分を大きく、音量の大きな部分を静かにすることを望むことができる。RobinsonとGundryにより記載されている(Charles RobinsonとKenneth Gundry、「メタデータによるダイナミックレンジ制御」、107th Convention of the AES, Preprint 5028, September 24-27, 1999, New
York)。従来のAGCとDRCの実施例は、一般に、平滑化されたピーク又は2乗平均平方根(rms)振幅のようなオーディオ信号レベルの簡単な計測を用いて、ゲイン修正をおこなう。このような簡単な計測は、オーディオの感知音量にある程度まで関連しているが、本発明の特徴によれば、音響心理学的モデルに基づく音量の計測によりゲイン修正を行うことにより、感覚的により適切なAGCとDRCが可能となる。さらに、多くの従来のAGCシステムとDRCシステムでは、広帯域ゲインのゲイン修正を適用し、したがって、処理したオーディオ中に先に説明したような音質の(スペクトルの)歪みを受ける。一方、本発明の特徴によれば、そのような歪みを除去又は最低限にするような方法で特定ラウドネスを形成するために複数帯域のゲインを用いる。
本発明の特徴を採用するAGCの応用例とDRCの応用例とは両方とも、入力広帯域音量L[t]を好ましい出力広帯域音量L[t]に変換又は写像し、ここで音量は、ソーンのような感知音量単位で計測される。入力広帯域音量L[t]は、入力オーディオ信号の具体的な入力特定ラウドネスN[b,t]の関数となる。それは入力オーディオ信号のトータル音量と同じかもしれないが、オーディオ信号のトータル音量を時間的に平滑化したものとしてもよい。
図14aと14bは、それぞれAGCとDRCに一般的な写像の例を示す。L[t]がL[t]の関数であるような写像を仮定すると目標特定ラウドネスは以下のように計算される。
Figure 2008518565
Figure 2008518565
AGCシステムに対して、入力広帯域音量L[t]は、原則として、オーディオの長時間トータル音量の計測値であるべきである。これは、トータル音量L[t]を時間で平滑化してL[t]を作ることにより達成できる。
AGCと比較して、DRCシステムは、信号の音量短時間変化に反応し、したがって、L[t]は単純にL[t]と等しくなる。結果として、L[t]/L[t]で与えられる特定ラウドネスの圧伸は、急速に動揺し、処理したオーディオに不必要なアーティファクトを導く。1つの典型的なアーティファクトは、周波数スペクトルの一部が、他の比較的関係のないスペクトル部分で可聴に変調されたものである。例えば、クラシック音楽を選択した場合、低周波数には大きく響くティンパニーが含まれる一方、一様な弦楽器の響きが目立つ高周波数が含まれる。このティンパニーを叩いたときはいつでも、全体的な音量L[t]が増大し、DRCシステムはこの特定ラウドネス全体に減衰を適用する。そして、弦楽器は「ポンプ」ダウンし、ティンパニーは「ポンプ」アップして聞こえる。このようなスペクトル中のクロスポンピングは、今までの広帯域DRCシステムでも問題であり、一般的な解決手段は、DRCを異なった周波数帯域に独立に適用することである。ここに開示したシステムは、フィルターバンクと感知音量モデルを用いる特定ラウドネスの計算に起因して、本質的に複数帯域であり、したがって、本発明の特徴に従うように複数帯域でDRCシステムを動作させるように修正することは、比較的簡単であり、次に説明する。
[ダイナミックレンジ制御に適した周波数的に変化し、時間的に変化する関数]
DRCシステムは、入力音量と出力音量を帯域bとは独立に変化させることにより、複数帯域又は周波数的に変化する方法で動作させるよう拡張することができる。これらの複数帯域音量値はL[b,t]とL[b,t]として参照され、目標特定ラウドネスは、下式で得られる。
Figure 2008518565
ここで、L[b,t]は、図14bで示したようにL[b,t]から各帯域bとは独立に計算又は写像されたものである。入力複数帯域音量L[b,t]は、入力オーディオ信号の特定ラウドネスN[b,t]の関数である。これは、入力オーディオ信号の特定ラウドネスと同じかもしれないが、オーディオ信号の特定ラウドネスを時間的に平滑化し及び/又は周波数的に平滑化したものであってもよい。
[b,t]を計算する最も簡単な方法は、それを特定ラウドネスN[b,t]に等しく設定することである。この場合、DRCは、上記表題「自動ゲイン制御及び自動ダイナミックレンジ制御に適した周波数的に不変で時間的に変化する関数」で説明したような、全帯域で同じ入力音量対出力音量比によるのではなく、感知音量モデルの聴覚フィルターバンク内の各帯域で独立に行われる。40帯域を用いた実際の実施の形態において、周波数軸に沿うこれらの帯域間の間隔は、音量の正確な計測とを提供するために比較的細かい。しかし、各帯域に独立にDRCスケールファクタを適用することにより、処理したオーディオを「引き裂かれた」サウンドにするかもしれない。この問題を避けるため、DRCの量を1つの帯域から次の帯域に適用するときに大幅に変化することのないように特定ラウドネスN[b,t]を帯域を通して平滑化してL[b,t]を計算するような選択ができる。これは、帯域平滑化フィルターQ(b)を定義し、標準的な畳み込み積算により特定ラウドネスを全帯域cで平滑化することで達成できる。
Figure 2008518565
ここで、N[c,t]は、オーディオ信号の特定ラウドネスであり、Q(b−c)は、平滑化フィルターの帯域シフトした応答である。図15は、このような帯域平滑化フィルターの1例を示す。
もし、L[b,t]の関数としてL[b,t]を計算するDRC関数がすべての帯域bで固定されているならば、特定ラウドネスN[b,t]の各帯域で被る変化の形式は、信号の全体的な音量が同じに維持されるとしても、処理されるオーディオのスペクトルにより変化する。例えば、大きな音量のバスと静かなトレブルを有するオーディオ信号は、バスをカットしトレブルをブーストすることができる。正味の効果はオーディオの音質又は感知されるスペクトルの変化であり、これは特定の応用例では好ましいかもしれない。
しかし、オーディオの平均感知スペクトルを修正しないで複数帯域のDRCを行うことを望むかもしれない。修正の短時間変動を帯域間で独立に動作させる一方、各帯域における平均修正をほぼ同じにすることを望むかもしれない。各帯域におけるこのDRCの平均的な作用を基準となる作用と同じにさせることにより好ましい効果が達成できるかもしれない。広帯域入力音量L[b,t]の好ましいDRCとしてこの基準となる作用を選ぶことができる。関数L[t]=DRC{L[t]}が広帯域音量の好ましいDRC写像を表すとする。
Figure 2008518565
Figure 2008518565
ここで、複数帯域入力音量は広帯域入力音量と同じ平均レンジに最初に圧伸されることに留意すべきである。広帯域音量に設計されたDRC関数が次いで適用される。最後に、その結果が圧伸されて複数帯域音量の平均レンジに戻される。複数帯域DRCをこのように公式化することにより、縮小したスペクトル的ポンピングの利点が保たれ、同時にオーディオの平均感知スペクトルが保たれる。
[ダイナミックイコライゼーションに適した周波数的に変化し時間的に変化する関数]
本発明の特徴の他の応用例は、オーディオの元のダイナミックレンジを保持しながら、時間的に変化するオーディオの感知スペクトルを目標となる時間的に変化しない感知スペクトルに意図的に変換することである。この処理をダイナミックイコライゼーション(DEQ)と称してもよい。従来の静的なイコライゼーションでは、単純な固定のフィルター処理がそのスペクトルを変化させるためにオーディオに適用されている。例えば、固定したバス又はトレブルブーストに適用できる。このような処理は、オーディオの現在のスペクトルを考慮に入れないので、同じ信号すなわち、すでに比較的大量のバス又はトレブルを含む信号には適さない。DEQにより、信号のスペクトルが計測され、この計測されたスペクトルを本質的に静的な好ましい形に変換するためにその信号をダイナミックに修正する。本発明の特徴として、このような好ましい形はフィルターバンクの帯域を通じて仕様を定められ、EQ[b]と称される。実際の実施の形態では、計測されたスペクトルは、特定ラウドネスN[b,t]を時間で平滑化することにより生成することができるオーディオの平均スペクトルの形を表す。
Figure 2008518565
Figure 2008518565
Figure 2008518565
Figure 2008518565
最終的に目標特定ラウドネスは以下のように計算される。
Figure 2008518565
ここでβは、ユーザが指定する0から1までの間のパラメータであり、適用されるDEQの程度を示す。式(23)を参照して、β=0のとき、もとの特定ラウドネスは修正されず、β=1のとき、特定ラウドネスは好ましいスペクトル形状の計測されたスペクトル形状に対する比で圧伸される。
Figure 2008518565
図16は、図7を簡単にしたもので、分析フィルターバンク100から合成フィルターバンク110までの複数帯域を示す1つのラインのみを示している。図17の例では、上述したようなダイナミックイコライゼーションに従い機能又は装置104で計測された特定ラウドネスに修正を施す、ダイナミックEQ特定ラウドネス(SL)修正505も提供する。
[結合された処理]
音量制御(VC)、AGC、DRC、及びDEQを含む、先に説明したすべての処理を1つのシステムに結合することを望むかもしれない。これらの各処理は特定ラウドネスの圧伸として表すことができるから、以下のようにこれらを結合することができる。
Figure 2008518565
Figure 2008518565
次いで、結合された処理を表す目標特定ラウドネスのゲインG[b,t]の単一のセットを計算することができる。
場合によっては、このラウドネスの修正処理の1つ又は組み合わせについてのスケールファクタが時間的に速く変動しすぎ、処理したオーディオ中にアーティファクトを生じることがある。したがって、これらのスケールファクタの一部を平滑化させることが望ましい。一般に、VCとDEQからのスケールファクタは時間的に平滑に変化するが、AGCスケールファクタとDRCスケールファクタの結合を平滑化することは必要であろう。これらのスケールファクタの結合を以下で表すこととする。
Figure 2008518565
平滑化の背後にある概念は、特定ラウドネスが増加するとき結合されたスケールファクタがすばやく反応することであり、特定ラウドネスが減少するときスケールファクタがより重く平滑化されることである。この概念は、オーディオ圧縮器の設計におけるファーストアタック(fast attack)及びスローリリース(slow release)の使用としてよく知られているものに相当する。スケールファクタを平滑化するための適切な時定数は、特定ラウドネスの帯域平滑化したものを時間的に平滑化することにより計算することができる。最初に、特定ラウドネスの帯域平滑化したものは下式で計算される。
Figure 2008518565
ここでN[c,t]は、オーディオ信号の特定ラウドネスであり、Q[b−c]は、前記式(19)のような平滑フィルターの帯域シフトした応答である。
この帯域平滑化した特定ラウドネスの時間平滑化したものは下式で計算される。
Figure 2008518565
ここで、帯域に依存する平滑化係数λ[b,t]は下式で与えられる。
Figure 2008518565
平滑化した結合されたスケールファクタは、次に、下式で計算される。
Figure 2008518565
ここで、λ[b,t]は、λ[b,t]の帯域平滑化したものである。
Figure 2008518565
平滑化係数の帯域平滑化により、時間平滑化したスケールファクタが帯域をまたがって急激に変化することを防ぐ。時間平滑化と帯域平滑化の記載のスケールファクタにより、処理したオーディオに、耳障りな感知できるアーティファクトをほとんど含有させない。
[ノイズ補償]
多くのオーディオ再生環境において、リスナが聞こうとするオーディオと干渉する暗騒音が存在する。例えば、移動中の乗用車内のリスナは備え付けのステレオシステムで音楽を再生することができ、エンジン及び道路からのノイズにより、音楽が顕著に異なって感知される。特に、ノイズのエネルギーが音楽のエネルギーに強く関連するスペクトルの部分では、音楽の感知音量が減少する。もしノイズが十分大きい場合は、音楽は完全にマスクされる。
Figure 2008518565
この効果を達成するため、MooreとGlasbergによって定義された部分ラウドネスの概念を用いてもよい。ノイズ単独の計測値とオーディオ単独の計測値とが得られると仮定する。E[b,t]はノイズからのエキサイテーションを表し、E[b,t]はオーディオからのエキサイテーションを表すものとする。オーディオとノイズの結合した特定ラウドネスは、下式で与えられる。
Figure 2008518565
ここで、Ψ{.}は、エキサイテーションから特定ラウドネスへの非線形変換を表す。結合した特定ラウドネスを保持するような方法で、リスナーの聴覚が結合した特定ラウドネスを、オーディオの部分特定ラウドネスとノイズの部分特定ラウドネスとを区別すると仮定する。すなわち、
Figure 2008518565
オーディオの部分特定ラウドネス、NA[b,t]は、制御したい値であリ、したがってこの値を求めなければならない。ノイズの部分特定ラウドネスは、以下のように近似することができる。
Figure 2008518565
ここでETN[b,t]は、ノイズの存在によりマスクされる閾値であり、ETQ[b]は帯域bでの静音閾値であり、κは0と1との間の指数である。式(31)〜(33)を結合して、オーディオの部分特定ラウドネスの表現に到達する。
Figure 2008518565
オーディオのエキサイテーションがノイズによりマスクされる閾値(E[b,t]=ETN[b,t])であるとき、オーディオの部分特定ラウドネスは、静音閾値での信号のラウドネスに等しく、これは好ましい結果であることに留意すべきである。オーディオのエキサイテーションがノイズよりはるかに大きいとき、式(34)の2番目の項が消え、オーディオの特定ラウドネスはノイズが無い場合の値にほぼ等しくなる。言い換えると、オーディオがノイズよりはるかに大きいので、ノイズがオーディオにマスクされる。指数κは、信号対ノイズ比の関数として、ノイズ中のトーンの音量のデータにうまく適合するように経験的に選択される。MooreとGlasbergはκ=0.3が適当であることを見つけている。マスクされるノイズの閾値は、ノイズのエキサイテーション自身の関数として近似される。
Figure 2008518565
ここで、K[b]は低周波数帯域で増大する定数である。したがって、式(34)で与えられるオーディオの部分特定ラウドネスは、抽象的にはオーディオのエキサイテーションとノイズのエキサイテーションの関数として表現することができる。すなわち、
Figure 2008518565
修正されたゲインソルバーは、次いで、ノイズの存在下で処理したオーディオの部分特定ラウドネスが目標特定ラウドネスに等しくなるようゲインG[b,t]の計算に用いられる。
Figure 2008518565
図17は、元のゲインソルバー106を記載したノイズ補償ゲインソルバー206に置き換えた図7のシステムを示す(フルターバンクの複数帯域を示すブロック間の複数の垂直線は、図を単純化するために1本の線に置き換えてあることに留意すべきである)。加えて、図は、(平滑化103からの)オーディオのエキサイテーションと(SL修正からの)目標特定ラウドネスと共に新しいゲインソルバー206に(ブロック100,101,102および103の動作に相当する方法で、分析フルターバンク200,伝達フィルター201,エキサイテーション202及び平滑化203により)供給するノイズエキサイテーションの測定も示している。
Figure 2008518565
言い換えれば、SL修正は、周波数的に変化しない、α=1である、オーディオ信号の特定ラウドネスを圧伸するスケールファクタαを提供する。図17のような構成により、ノイズの存在下で処理したオーディオの感知されるラウドネススペクトラムがノイズが存在しない状態でのラウドネススペクトラムと等しくなるよう計算される。さらに、VC,AGC,DRC,及びDEQを含む元の関数として目標特定ラウドネスを計算するための先に説明した技術の1つ又はその組み合わせを、ノイズ補償音量修正システムと共に用いてもよい。
現実的な実施の形態において、ノイズの計測はオーディオが再生される環境の近傍におかれたマイクロフォンから得ることもできる。あるいは、さまざまな状況の下での予想ノイズスペクトルに近似する所定のノイズエキサイテーションのテンプレートのセットを用いてもよい。例えば、自動車の室内のノイズは種々の運転速度であらかじめ分析しておき、それをノイズエキサイテーション対速度のルックアップテーブルとして保存することができる。次いで、自動車の速度が変わるときにこのルックアップテーブルから、図17のゲインソルバー206に送られるノイズエキサイテーションを近似する。
[実施の形態]
本発明は、ハードウェア又はソフトウェア又は両者の組み合わせ(例えば、プログラマブルロジックアレー)により実施することができる。特記なき場合は、本発明の一部として含まれるアルゴリズムは、特定のコンピュータ又は他の装置に本質的に関連するものではない。特に、ここでの開示にしたがって書かれたプログラムによりさまざまな汎用マシーンを使用してもよく、また、要求される方法を実行するために特別に作られた装置(例えば、集積回路)を作ることはもっと便利かもしれない。このように、各々が少なくとも1つのプロセッサ、少なくとも1つのデータ記憶システム(揮発性メモリー、不揮発性メモリー、及び/又は記憶素子を含む)、少なくとも1つの入力装置又は入力ポート、及び少なくとも1つの出力装置又は出力ポートからなる1以上のプログラム可能なコンピュータシステム上で動作する1以上のコンピュータプログラムにより本発明を実施することができる。プログラムコードは、本明細書に記載した機能を実行し出力情報を生成するために入力データにおいて適用される。出力情報は、既知の方法で、1以上の出力装置において適用される。
このようなプログラムの各々は、コンピュータシステムと通信するために好ましいどんなコンピュータ言語(機械語、アセンブリ言語、又は高級手続言語、ロジック言語、又はオブジェクト指向プログラム言語を含む)で実行してもよい。どの場合でも、言語はコンパイラでもインタプリタでもよい。
ここに記載した手続を実行させるために記憶媒体又は装置をコンピュータが読み出したとき、コンピュータを設定し動作させるために、このようなコンピュータプログラムは、汎用コンピュータ又は特定目的のプログラム可能なコンピュータで読み出し可能な記憶媒体又は装置(例えば、半導体メモリー又は媒体、又は次期媒体又は光学媒体)に記憶しておくことが好ましい。本発明のシステムは、コンピュータプログラムとして構成され、この記憶媒体がここに記載した機能を実行するために具体的かつあらかじめ定めた方法でコンピュータを動作させるよう構成されている、コンピュータで読み出し可能な記憶媒体として実施することも考えられる。
本発明の種々の実施の形態をここで説明した。しかしながら、本発明の思想や範囲から逸脱することなしにさまざまな変更を加えることが可能であることは了解されよう。例えば、上述の工程のいくつかはその順序に関係がなく、したがって、ここに説明したものとは異なる順序で実施することができる。したがって、他の実施の形態も以下の特許請求の範囲に含まれる。
本発明の特徴によるフィードフォワード構成の実施形態の1例を示す機能ブロックダイアグラムである。 本発明の特徴によるフィードバック構成の実施形態の1例を示す機能ブロックダイアグラムである。 本発明の特徴によるフィードフォワード/フィードバックのハイブリッド構成の実施形態の1例を示す機能ブロックダイアグラムである。 本発明の特徴によるもう1つのフィードフォワード/フィードバックのハイブリッド構成の実施形態の1例を示す機能ブロックダイアグラムである。 フィードフォワード構成、フィードバック構成、及びフィードフォワード/フィードバックのハイブリッド構成のいずれか1つにより決定された修正されていないオーディオ信号と修正パラメータを、例えば、時間的に又は空間的に分離した装置又は処理において用いるために保存又は伝達する様子を示す機能ブロックダイアグラムである。 フィードフォワード構成、フィードバック構成、及びフィードフォワード/フィードバックのハイブリッド構成のいずれか1つにより決定された修正されていないオーディオ信号と目標特定ラウドネス又はそれを代理するものを、例えば、時間的に又は空間的に分離した装置又は処理において用いるために保存又は伝達する様子を示す機能ブロックダイアグラムである。 本発明の特徴を概観する概略機能ブロックダイアグラム又は概略フローチャートである。 本発明の実施の形態における伝達フィルターに適した線形フィルターP(z)の理想的な特性応答を示し、ここで、垂直軸はデシベル(dB)単位の減衰であり、水平軸は10を底とする対数で表したヘルツ(Hz)である。 ERB周波数スケール(垂直軸)とヘルツ(Hz)単位の周波数(水平軸)との関係を示す。 ERBスケールにおけるクリティカル帯域を近似した応答特性を持つ理想的な聴覚フィルターを示す。水平軸はヘルツ単位で示した周波数で、垂直軸はデシベル単位で示したレベルである。 IS0226の等音量曲線を示す。水平軸はヘルツ(Hz)単位で示した周波数であり(底10の対数)、垂直軸はデシベル単位で示した音圧レベルである。 伝達フィルターP(z)により正規化されたIS0226の等音量曲線を示す。水平軸はヘルツ単位で示した周波数であり(底10の対数)、垂直軸はデシベル単位で示した音圧レベルである。 女性の音声セグメント上の0.25で音量縮小させる広帯域及び複数帯域ゲインを示す理想的な図である。水平軸の尺度はERB単位であり、垂直軸の尺度はデシベル(dB)単位の相対ゲインである。 それぞれ、元の信号、広帯域でゲイン修正された信号、及び複数帯域でゲイン修正された信号の特定ラウドネスを示す理想的な図である。水平軸の尺度はERB単位であり、垂直軸の尺度はデシベル(dB)単位の相対ゲインである。 典型的なAGCに対するL[t]の関数としてのL[t]を示す理想的な図である。水平軸はlog(L[t])であり垂直軸はlog(L[t])である。 典型的なDRCに対するL[t]の関数としてのL[t]を示す理想的な図である。水平軸はlog(L[t])であり垂直軸はlog(L[t])である。 複数帯域DRCに対する典型的な帯域平滑関数を示す理想的な図である。水平軸の尺度は帯域数であり、垂直軸の尺度は帯域bに対するゲイン出力である。 本発明の特徴を概観する概略機能ブロックダイアグラム又は概略フローチャートである。 再生環境における騒音の相殺を含む、図1に類似の概略機能ブロックダイアグラム又は概略フローチャートである。

Claims (90)

  1. オーディオ信号の特定ラウドネスを制御するのに有用な情報を導き出す方法であって、
    特定ラウドネスは、周波数と時間の関数としての感知音量の指標であり、
    オーディオ信号の特定ラウドネスと目標特定ラウドネスとの差を縮めるために、前記オーディオ信号を修正するのに有用な修正パラメータを導き出すステップを具備することを特徴とする方法。
  2. オーディオ信号の部分特定ラウドネスを制御するのに有用な情報を導き出す方法であって、
    特定ラウドネスは、周波数と時間の関数としての感知音量の指標であり、信号の部分特定ラウドネスは、2次的な干渉性のあるサウンドの存在下で周波数と時間の関数としてのその信号の感知音量の指標であり、
    オーディオ信号の部分特定ラウドネスと目標特定ラウドネスとの差を縮めるために、前記オーディオ信号を修正するのに有用な修正パラメータを導き出すステップを具備することを特徴とする方法。
  3. オーディオ信号の特定ラウドネスを制御する方法であって、
    特定ラウドネスは、周波数と時間の関数としての感知音量の指標であり、
    オーディオ信号の特定ラウドネスと目標特定ラウドネスとの差を縮めるために、オーディオ信号を修正するステップを具備することを特徴とする方法。
  4. オーディオ信号の部分特定ラウドネスを制御する方法であって、
    特定ラウドネスは、周波数と時間の関数としての感知音量の指標であり、信号の部分特定ラウドネスは、2次的な干渉性のあるサウンドの存在下で周波数と時間の関数としてのその信号の感知音量の指標であり、
    オーディオ信号の部分特定ラウドネスと目標特定ラウドネスとの差を縮めるために、オーディオ信号を修正するステップを具備することを特徴とする方法。
  5. 前記修正するステップ又は導き出すステップでは、前記オーディオ及び目標特定ラウドネス又は目標特定ラウドネスを代理するものを、伝達系から受け取り又は保存媒体から再生することを特徴とする請求項1乃至請求項4のいずれか1項に記載の方法。
  6. 前記修正するステップでは、修正したオーディオ信号を供給するために修正パラメータに従い前記オーディオ信号を修正し、かつ、前記修正するステップでは、前記オーディオ及び前記修正パラメータを、伝達系から受け取り又は保存媒体から再生することを特徴とする請求項3又は請求項4に記載の方法。
  7. 前記修正するステップは、修正パラメータの生成を含むことを特徴とする請求項3又は請求項4に記載の方法。
  8. 前記目標特定ラウドネスは、前記オーディオ信号の関数ではないことを特徴とする請求項1乃至請求項7のいずれか1項に記載の方法。
  9. 前記修正するステップ又は前記導き出すステップは、目標特定ラウドネスを保存するステップを含むことを特徴とする請求項8に記載の方法。
  10. 前記修正するステップ又は前記導き出すステップは、前記方法の外部源から目標特定ラウドネスを受け取るステップを含むことを特徴とする請求項8に記載の方法。
  11. 前記修正するステップ又は前記導き出すステップは、特定ラウドネス及び/又は部分特定ラウドネスを明示的に計算する処理を含むことを特徴とする請求項8乃至請求項10のいずれか1項に記載の方法。
  12. 前記修正するステップ又は前記導き出すステップは、特定ラウドネス及び/又は部分特定ラウドネスを黙示的に計算する処理を含むことを特徴とする請求項8乃至請求項10のいずれか1項に記載の方法。
  13. 前記処理は、本質的に特定ラウドネス及び/又は部分特定ラウドネスを決定するようなルックアップテーブルを採用する採用することを特徴とする請求項12に記載の方法。
  14. 特定ラウドネス及び/又は部分特定ラウドネスは、前記処理で採用された閉形式の数学表現で本質的に決定されることを特徴とする請求項12に記載の方法。
  15. 前記目標特定ラウドネスは、時間的に不変であり周波数的に不変であることを特徴とする請求項8乃至請求項14のいずれか1項に記載の方法。
  16. 前記目標特定ラウドネスは、時間的に不変であることを特徴とする請求項8乃至請求項14のいずれか1項に記載の方法。
  17. オーディオ信号を処理する方法であって、
    目標特定ラウドネスを生成するために1以上の処理と1以上のプロセス制御パラメータにより前記オーディオ信号又は前記オーディオ信号の指標を処理するステップを具備し、特定ラウドネスは、周波数と時間の関数としてのオーディオ信号の感知音量の指標であることを特徴とする、方法。
  18. 前記目標特定ラウドネスは、前記オーディオ信号の関数又は前記オーディオ信号の指標の関数であることを特徴とする請求項1乃至請求項7及び請求項17のいずれか1項に記載の方法。
  19. 前記オーディオ信号の指標は、前記オーディオ信号の特定ラウドネスであることを特徴とする請求項18に記載の方法。
  20. 前記オーディオ信号の関数又は前記オーディオ信号の指標の関数は、オーディオ信号又はオーディオ信号の指標の1以上の圧伸であることを特徴とする請求項18又は請求項19に記載の方法。
  21. Figure 2008518565
  22. 前記圧伸は、少なくとも一部は、好ましい複数帯域音量と前記オーディオ信号の複数帯域音量との比により定められることを特徴とする請求項21に記載の方法。
  23. 前記圧伸は、以下のような関係で、L[b,t]/L[b,t]として表現でき、
    Figure 2008518565
    Figure 2008518565
  24. [b,t]は、L[b,t]の関数であることを特徴とする請求項23に記載の方法。
  25. [b,t]の関数としてのL[b,t]は、下記のように表現することができ、
    [b,t]=DRC{L[b,t]}
    ここで、DRC{}は、L[b,t]からL[b,t]ヘの写像するダイナミックレンジ関数であることを特徴とする請求項24に記載の方法。
  26. [b,t]は、前記オーディオ信号の前記特定ラウドネスの時間的に平滑化したもの及び/又は周波数的に平滑化したものであることを特徴とする請求項23に記載の方法。
  27. 前記方法は、前記修正するステップ又は、前記修正パラメータを生成する応用例又は、目標特定ラウドネスが、前記感知されたオーディオスペクトル又は干渉性信号の存在下で感知されたオーディオスペクトルが異なった特定ラウドネスの圧伸の値に対して異なる値となることができるオーディオ信号に対応する、ダイナミックレンジ制御として有用であることを特徴とする請求項22乃至請求項26のいずれか1項に記載の方法。
  28. 前記ダイナミックレンジ関数は、各帯域に適用した平均変化がすべての帯域で実質的に等しいとき、各帯域に適用した短期変化が帯域間で独立に変化するよう各帯域の音量を制御することを特徴とする請求項27に記載の方法。
  29. [b,t]の関数としてのL[b,t]は、下記のように表現することができ、
    Figure 2008518565
    Figure 2008518565
  30. 前記方法は、前記修正するステップ又は、前記修正パラメータを生成する応用例又は、目標特定ラウドネスが、前記感知されたオーディオスペクトル又は干渉性信号の存在下で感知されたオーディオスペクトルが異なった特定ラウドネスの圧伸の値に対して、前記オーディオ信号の感知されたオーディオスペクトルの圧伸と実質的に同じ値となることができるオーディオ信号に対応する、ダイナミックレンジ制御として有用であることを特徴とする請求項28又は請求項29に記載の方法。
  31. 前記特定ラウドネスは、好ましいスペクトル形状の指標の前記オーディオ信号のスペクトル形状の指標に対する比で圧伸されることを特徴とする請求項21に記載の方法。
  32. 前記方法は、オーディオ信号の感知されたスペクトルを時間的に変化する感知されたスペクトルから時間的に変化しない感知されたスペクトルへと変換することを特徴とする請求項31に記載の方法。
  33. Figure 2008518565
  34. 前記パラメータβは前記方法の外部源により選択又は制御されることを特徴とする請求項33に記載の方法。
  35. 前記外部源は、前記方法のユーザであることを特徴とする請求項34に記載の方法。
  36. 前記方法は、前記修正するステップ又は、前記修正パラメータを生成する応用例又は、前記目標特定ラウドネスが、感知されたオーディオスペクトル又は干渉性信号の存在下での感知されたオーディオスペクトルが異なった特定ラウドネスの圧伸の値に対して異なる値となることができるオーディオ信号に対応する、ダイナミックイコライザーとして有用であることを特徴とする請求項31乃至請求項35のいずれか1項に記載の方法。
  37. 前記オーディオ信号の複数帯域音量は、前記オーディオ信号をクリティカル帯域に分割し前記クリティカル帯域のいくつかについて周波数平滑化することにより、概算することを特徴とする請求項21乃至請求項36のいずれか1項に記載の方法。
  38. 特定の帯域bで複数帯域音量の帯域平滑化したもの、すなわちL[b,t]は、全帯域cでの畳み込み積算として以下のように表現され、
    Figure 2008518565
    ここで、N[b,t]は、前記オーディオ信号の特定ラウドネスであり、Q(b−c)は前記平滑フィルターの帯域シフトした応答であることを特徴とする請求項37に記載の方法。
  39. 前記1以上の平滑化は、下式の関係で特定ラウドネスを圧伸する時間的に変化し周波数的に変化しないスケールファクタを含み
    Figure 2008518565
    Figure 2008518565
  40. 前記圧伸は、少なくとも一部は、好ましい広帯域音量と前記オーディオ信号の広帯域音量との比により定められることを特徴とする請求項39に記載の方法。
  41. 前記オーディオ信号の特定ラウドネスの関数における前記圧伸は、下式のような関係で、L[b,t]/L[b,t]として表現でき、
    Figure 2008518565
    Figure 2008518565
  42. [t]は、L[t]の関数であることを特徴とする請求項41に記載の方法。
  43. [t]の関数としてのL[t]は、下式のように表現することができ、
    [t]=DRC{L[t]}
    ここで、DRC{}は、L[t]からL[t]ヘの写像するダイナミックレンジ関数であることを特徴とする請求項42に記載の方法。
  44. [t]は、前記オーディオ信号の前記特定ラウドネスの時間的に平滑化したものであることを特徴とする請求項41に記載の方法。
  45. [t]は、前記オーディオ信号の長期音量の指標であることを特徴とする請求項41に記載の方法。
  46. [t]は、前記オーディオ信号の短期音量の指標であることを特徴とする請求項41に記載の方法。
  47. 前記方法は、前記修正するステップ又は、前記修正パラメータを生成する応用例又は、前記目標特定ラウドネスが、感知されたオーディオスペクトル又は干渉性信号の存在下での感知されたオーディオスペクトルが前記オーディオ信号の感知されたオーディオスペクトルの圧伸の値として異なった特定ラウドネスの圧伸の値又は異なった部分特定ラウドネスの圧伸の値に対して実質的に同じ値となることができるオーディオ信号に対応する、自動ゲイン制御又はダイナミックレンジ制御として有用であることを特徴とする請求項39乃至請求項46のいずれか1項に記載の方法。
  48. 前記スケールファクタは、前記オーディオ信号の関数又は前記オーディオ信号の指標の関数であることを特徴とする請求項21乃至請求項47のいずれか1項に記載の方法。
  49. 前記1以上の圧伸は、下式の関係の特定ラウドネスの圧伸を行う、時間的に変化せず周波数的に変化するスケールファクタΘ[b]を含み、
    Figure 2008518565
    Figure 2008518565
  50. 前記修正するステップ又は前記導き出すステップは、スケールファクタΘ[b]を保存するステップを含むことを特徴とする請求項49に記載の方法。
  51. 前記スケールファクタΘ[b]は、前記方法の外部源から受け取ることを特徴とする請求項49に記載の方法。
  52. 前記1以上の圧伸は、下式の関係の特定ラウドネスの圧伸を行う、時間的に変化せず周波数的に変化しないスケールファクタαを含み、
    Figure 2008518565
    Figure 2008518565
  53. 前記修正するステップ又は前記導き出すステップは、スケールファクタαを保存するステップを含むことを特徴とする請求項52に記載の方法。
  54. 前記スケールファクタαは、前記方法の外部源から受け取ることを特徴とする請求項52に記載の方法。
  55. 前記方法は、前記修正するステップ又は、前記修正パラメータを生成する応用例又は、前記目標特定ラウドネスが、感知されたオーディオスペクトル又は干渉性信号の存在下での感知されたオーディオスペクトルが前記オーディオ信号の感知されたオーディオスペクトルの圧伸の値として異なった特定ラウドネスの圧伸の値又は異なった部分特定ラウドネスの圧伸の値に対して実質的に同じ値となることができるオーディオ信号に対応する、音量制御として有用であることを特徴とする請求項49乃至請求項54のいずれか1項に記載の方法。
  56. 前記スケールファクタは、前記オーディオ信号の関数でも前記オーディオ信号の指標の関数でもないことを特徴とする請求項49乃至請求項55のいずれか1項に記載の方法。
  57. 前記修正するステップ又は、前記導き出すステップ又は、前記生成するステップは、(1)特定ラウドネス、及び/又は、(2)部分特定ラウドネス、及び/又は、(3)目標特定ラウドネスを明示的に計算することを特徴とする請求項1乃至請求項56のいずれか1項に記載の方法。
  58. 前記修正するステップ又は、前記導き出すステップ又は、前記生成するステップは、(1)特定ラウドネス、及び/又は、(2)部分特定ラウドネス、及び/又は、(3)目標特定ラウドネスを黙示的に計算することを特徴とする請求項1乃至請求項56のいずれか1項に記載の方法。
  59. 前記修正するステップ又は、前記導き出すステップ又は、前記生成するステップは、本質的に(1)特定ラウドネス、及び/又は、(2)部分特定ラウドネス、及び/又は、(3)目標特定ラウドネスを決定するルックアップテーブルを採用することを特徴とする請求項58に記載の方法。
  60. 前記修正するステップ又は、前記導き出すステップ又は、前記生成するステップは、本質的に(1)特定ラウドネス、及び/又は、(2)部分特定ラウドネス、及び/又は、(3)目標特定ラウドネスを決定する閉形式の数学表現を採用することを特徴とする請求項58に記載の方法。
  61. 前記修正するステップ又は、前記導き出すステップは、前記オーディオ信号と前記修正パラメータを(1)伝達しそして受け取り、又は(2)保存しそして再生することを特徴とする、請求項1及び請求項2及び請求項7のいずれか1項、及び、請求項1又は請求項2又は請求項7の従属項としての請求項8乃至請求項16と請求項18乃至請求項60のいずれか1項に記載の方法。
  62. 前記修正パラメータは時間的に平滑化されていることを特徴とする、請求項1及び請求項2及び請求項6及び請求項7のいずれか1項、及び、請求項1又は請求項2又は請求項6又は請求項7の従属項としての請求項8乃至請求項16と請求項18乃至請求項60のいずれか1項に記載の方法。
  63. 前記修正パラメータは、前記オーディオ信号の周波数帯域に関する複数の振幅スケールファクタを具備することを特徴とする請求項62に記載の方法。
  64. 前記複数の振幅スケールファクタの少なくともいくつかは、時間的に変化することを特徴とする請求項63に記載の方法。
  65. 前記修正パラメータは、1以上のフィルターを制御するためのフィルター係数を含むことを特徴とする請求項62に記載の方法。
  66. 前記1以上のフィルターの少なくともいくつかは時間的に変化し、前記フィルター係数の少なくともいくつかは時間的に変化することを特徴とする請求項65に記載の方法。
  67. 前記修正するステップ又は、前記導き出すステップ又は、前記生成するステップは、
    干渉性オーディオ信号の指標と、
    目標特定ラウドネスと、
    前記修正されたオーディオ信号の前記特定ラウドネス又は前記部分特定ラウドネスから導き出された修正されていないオーディオ信号の特定ラウドネスの推定値と、
    前記修正されていないオーディオ信号の特定ラウドネスと、
    前記修正されたオーディオ信号の前記特定ラウドネス又は前記部分特定ラウドネスから導き出された目標特定ラウドネスの近似値と、
    のうちの1以上と独立であることを特徴とする請求項1乃至請求項66のいずれか1項に記載の方法。
  68. 前記修正するステップ又は、前記導き出すステップは、少なくとも部分的には、
    干渉性オーディオ信号の指標と、
    目標特定ラウドネスと、
    前記修正されたオーディオ信号の前記特定ラウドネス又は前記部分特定ラウドネスから導き出された修正されていないオーディオ信号の特定ラウドネスの推定値と、
    前記修正されていないオーディオ信号の特定ラウドネスと、
    前記修正されたオーディオ信号の前記特定ラウドネス又は前記部分特定ラウドネスから導き出された目標特定ラウドネスの近似値と、
    のうちの1以上から修正パラメータを導き出すことを特徴とする、請求項1乃至請求項4及び請求項7、及び、請求項1乃至請求項4又は請求項7のいずれか1項の従属項としての請求項8乃至請求項16と請求項18乃至請求項60のいずれか1項に記載の方法。
  69. 前記修正するステップ又は、前記導き出すステップは、少なくとも部分的には、
    (1)目標特定ラウドネスと、
    前記修正されたオーディオ信号の前記特定ラウドネスから受け取った修正されていないオーディオ信号の特定ラウドネスの推定値と、
    のうちの1つと、
    (2)前記修正されていないオーディオ信号の特定ラウドネスと、
    前記修正されたオーディオ信号の前記特定ラウドネスから導き出された目標特定ラウドネスの近似値と、
    のうちの1つと、
    から修正パラメータを導き出すことを特徴とする、請求項68に記載の方法。
  70. 前記修正するステップ又は、前記導き出すステップは、少なくとも部分的には、
    (1)干渉性オーディオ信号の指標と、
    (2)目標特定ラウドネスと、
    前記修正されたオーディオ信号の前記部分特定ラウドネスから導き出された修正されていないオーディオ信号の特定ラウドネスの推定値と、
    のうちの1つと、
    (3)前記修正されていないオーディオ信号の特定ラウドネスと、
    前記修正されたオーディオ信号の前記部分特定ラウドネスから導き出された目標特定ラウドネスの近似値と、
    のうちの1つと、
    から修正パラメータを導き出すことを特徴とする、請求項68に記載の方法。
  71. 前記方法は、前記特定ラウドネスを前記オーディオ信号から導き出すフィードフォワード構成を採用し、前記修正するステップ又は前記導き出すステップが目標特定ラウドネスを保存するステップを含むとき、前記目標特定ラウドネスを前記方法の外部源又は保存場所から受け取ることを特徴とする請求項69又は請求項70に記載の方法。
  72. 前記方法は、前記目標特定ラウドネスの近似値を前記修正されたオーディオ信号から導き出すフィードフォワード/フィードバックのハイブリッド構成を採用し、前記修正するステップ又は前記導き出すステップが目標特定ラウドネスを保存するステップを含むとき、前記目標特定ラウドネスを前記方法の外部源又は保存場所から受け取ることを特徴とする請求項69又は請求項70に記載の方法。
  73. 前記修正するステップ又は前記導き出すステップは、それにより明示的又は黙示的に前記オーディオ信号の関数又は前記オーディオ信号の指標の関数を計算する目標特定ラウドネスを明示的又は黙示的に取得するための処理を含むことを特徴とする請求項69又は請求項70に記載の方法。
  74. 前記方法は、前記特定ラウドネスと目標特定ラウドネスとを前記オーディオ信号から導き出すフィードフォワード構成を採用し、前記目標特定ラウドネスの導出は、前記オーディオ信号の関数又は前記オーディオ信号の指標の関数を採用することを特徴とする請求項73に記載の方法。
  75. 前記方法は、前記目標特定ラウドネスの近似値を前記修正されたオーディオ信号から導き出して、前記目標特定ラウドネスをオーディオ信号から導き出すフィードフォワード/フィードバックのハイブリッド構成を採用し、前記目標特定ラウドネスの導出は、前記オーディオ信号の関数又は前記オーディオ信号の指標の関数を採用することを特徴とする請求項73に記載の方法。
  76. 前記修正するステップ又は前記導き出すステップは、それにより明示的又は黙示的に前記オーディオ信号の逆関数又は前記オーディオ信号の指標の逆関数を計算する、前記修正されたオーディオ信号に応答して前記修正されていないオーディオ信号の特定ラウドネスの推定値を明示的又は黙示的に取得するための処理を含むことを特徴とする請求項69又は請求項70に記載の方法。
  77. 前記方法は、前記修正されていないオーディオ信号の特定ラウドネスの推定値と前記目標特定ラウドネスの近似値とを前記修正されたオーディオ信号から導き出す、フィードバック構成を採用し、特定ラウドネスの推定値を前記オーディオ信号の逆関数又は前記オーディオ信号の指標の逆関数を用いて計算することを特徴とする請求項76に記載の方法。
  78. 前記方法は、前記特定ラウドネスを前記オーディオ信号から導き出し、前記修正されていないオーディオ信号の特定ラウドネスの推定値を修正されたオーディオ信号から導き出す、フィードフォワード/フィードバックのハイブリッド構成を採用し、前記推定値の導出を前記オーディオ信号の逆関数又は前記オーディオ信号の指標の逆関数を用いて計算することを特徴とする請求項76に記載の方法。
  79. 前記修正するステップ又は導き出すステップは、前記オーディオ信号及び前記目標特定ラウドネスを(1)伝達し及び受け取るか又は、(2)保存し及び再生する、ことを特徴とする請求項1乃至請求項4及び請求項17及び請求項1乃至請求項4又は請求項17に従属する請求項18乃至請求項78のいずれか1項に記載の方法。
  80. 前記目標特定ラウドネスを代理するものは、オーディオ信号又はオーディオ信号の指標を圧伸する1以上のスケールファクタであることを特徴とする、請求項20、請求項21、請求項39、請求項49、又は請求項52に従属する請求項79に記載の方法。
  81. 修正されたオーディオ信号を生成するために前記修正パラメータを前記オーディオ信号に適用するステップをさらに具備することを特徴とする請求項1及び請求項2及び請求項6及び請求項7、及び、請求項1又は請求項2又は請求項6又は請求項7のいずれか1項の従属項としての請求項8乃至請求項16と請求項18乃至請求項80のいずれか1項に記載の方法。
  82. 前記オーディオ信号及び前記目標特定ラウドネス又は前記目標特定ラウドネスを代理するものを伝達又は保存するステップをさらに具備することを特徴とする請求項1乃至請求項4及び請求項17及び請求項1乃至請求項4又は請求項17に従属する請求項18乃至請求項78のいずれか1項に記載の方法。
  83. オーディオ信号及び前記目標特定ラウドネス又は前記目標特定ラウドネスを代理するものを受信又は再生するステップをさらに具備することを特徴とする請求項82に記載の方法。
  84. オーディオ信号の特定ラウドネスと前記目標特定ラウドネスとの差を減少させるために、前記オーディオ信号と前記目標特定ラウドネス又はそれを代理するものに応答して前記オーディオ信号を修正するステップをさらに具備することを特徴とする請求項83に記載の方法。
  85. 前記目標特定ラウドネスを代理するものは、前記オーディオ信号又は前記オーディオ信号の指標を圧伸する1以上のスケールファクタであることを特徴とする請求項20乃至請求項60のいずれか1項に従属する請求項82乃至請求項84のいずれか1項に記載の方法。
  86. 前記オーディオ信号と前記修正パラメータとを伝達又は保存するステップをさらに具備することを特徴とする、請求項1及び請求項2及び請求項7及び、請求項1及び請求項2及び請求項7に従属する請求項18乃至請求項60のいずれか1項に記載の方法。
  87. 前記伝達又は保存されたオーディオ信号と前記修正パラメータとを受信し再生するステップをさらに具備することを特徴とする請求項86に記載の方法。
  88. 前記修正パラメータに応答して前記オーディオ信号を修正するステップをさらに具備することを特徴とする請求項87に記載の方法。
  89. 請求項1乃至請求項88のいずれか1項に記載の方法を実施するための装置。
  90. 請求項1乃至請求項88のいずれか1項に記載の方法をコンピュータに実行させるための、コンピュータ読取可能な媒体に保存されたコンピュータプログラム。
JP2007539070A 2004-10-26 2005-10-25 オーディオ信号の感知音量及び/又は感知スペクトルバランスの計算と調整 Active JP5101292B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US62245804P 2004-10-26 2004-10-26
US60/622,458 2004-10-26
US63860704P 2004-12-21 2004-12-21
US60/638,607 2004-12-21
PCT/US2005/038579 WO2006047600A1 (en) 2004-10-26 2005-10-25 Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal

Publications (3)

Publication Number Publication Date
JP2008518565A true JP2008518565A (ja) 2008-05-29
JP2008518565A5 JP2008518565A5 (ja) 2008-12-18
JP5101292B2 JP5101292B2 (ja) 2012-12-19

Family

ID=35788286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007539070A Active JP5101292B2 (ja) 2004-10-26 2005-10-25 オーディオ信号の感知音量及び/又は感知スペクトルバランスの計算と調整

Country Status (12)

Country Link
US (23) US8090120B2 (ja)
EP (2) EP1805891B1 (ja)
JP (1) JP5101292B2 (ja)
KR (1) KR101261212B1 (ja)
CN (1) CN101048935B (ja)
AU (1) AU2005299410B2 (ja)
BR (1) BRPI0518278B1 (ja)
CA (1) CA2581810C (ja)
HK (1) HK1103936A1 (ja)
IL (1) IL182097A (ja)
MX (1) MX2007005027A (ja)
WO (1) WO2006047600A1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010005033A1 (ja) * 2008-07-11 2010-01-14 クラリオン株式会社 音響処理装置
WO2010044439A1 (ja) * 2008-10-17 2010-04-22 シャープ株式会社 音声信号調整装置及び音声信号調整方法
JP2011509010A (ja) * 2007-12-21 2011-03-17 エスアールエス・ラブス・インコーポレーテッド オーディオ信号の知覚ラウドネスを調節するシステム
JP2011193442A (ja) * 2010-03-12 2011-09-29 Harman Becker Automotive Systems Gmbh オーディオ信号におけるラウドネスレベルの自動補正
JP2013501952A (ja) * 2009-08-14 2013-01-17 コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ オーディオ・システムの知覚品質を判定する方法およびシステム
JP2013168807A (ja) * 2012-02-15 2013-08-29 Tamura Seisakusho Co Ltd 番組ラウドネス自動管理システム及びその自動管理方法
JP2016514856A (ja) * 2013-03-21 2016-05-23 インテレクチュアル ディスカバリー カンパニー リミテッド オーディオ信号大きさの制御方法及び装置
JP2016520854A (ja) * 2013-03-21 2016-07-14 インテレクチュアル ディスカバリー カンパニー リミテッド オーディオ信号大きさの制御方法及び装置
CN110754040A (zh) * 2017-04-13 2020-02-04 弗劳恩霍夫应用研究促进协会 用于处理输入音频信号的装置和对应方法

Families Citing this family (192)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7928310B2 (en) * 2002-11-12 2011-04-19 MediaLab Solutions Inc. Systems and methods for portable audio synthesis
JP2004320628A (ja) * 2003-04-18 2004-11-11 Mitsubishi Electric Corp 音響装置
SG185134A1 (en) 2003-05-28 2012-11-29 Dolby Lab Licensing Corp Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
AU2005299410B2 (en) 2004-10-26 2011-04-07 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
EP1816891A1 (en) * 2004-11-10 2007-08-08 Hiroshi Sekiguchi Sound electronic circuit and method for adjusting sound level thereof
US8880205B2 (en) * 2004-12-30 2014-11-04 Mondo Systems, Inc. Integrated multimedia signal processing system using centralized processing of signals
US8015590B2 (en) 2004-12-30 2011-09-06 Mondo Systems, Inc. Integrated multimedia signal processing system using centralized processing of signals
US7653447B2 (en) * 2004-12-30 2010-01-26 Mondo Systems, Inc. Integrated audio video signal processing system using centralized processing of signals
KR100640477B1 (ko) * 2005-06-29 2006-10-30 삼성전자주식회사 디지털 멀티미디어 방송 채널에 따른 오디오 신호 출력방법 및 장치
CN1928807B (zh) * 2005-09-05 2010-09-29 鸿富锦精密工业(深圳)有限公司 声音输出系统及方法
TW200710714A (en) * 2005-09-09 2007-03-16 Hon Hai Prec Ind Co Ltd Sound outputting system and method
CN1936829B (zh) * 2005-09-23 2010-05-26 鸿富锦精密工业(深圳)有限公司 声音输出系统及方法
TWI316202B (en) * 2005-09-23 2009-10-21 Hon Hai Prec Ind Co Ltd Sound outputting system and method
AU2006338843B2 (en) * 2006-02-21 2012-04-05 Cirrus Logic International Semiconductor Limited Method and device for low delay processing
US20110311065A1 (en) * 2006-03-14 2011-12-22 Harman International Industries, Incorporated Extraction of channels from multichannel signals utilizing stimulus
JP5185254B2 (ja) * 2006-04-04 2013-04-17 ドルビー ラボラトリーズ ライセンシング コーポレイション Mdct領域におけるオーディオ信号音量測定と改良
ES2400160T3 (es) * 2006-04-04 2013-04-08 Dolby Laboratories Licensing Corporation Control de una característica percibida del volumen sonoro de una señal de audio
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
US8144881B2 (en) 2006-04-27 2012-03-27 Dolby Laboratories Licensing Corporation Audio gain control using specific-loudness-based auditory event detection
US7760893B1 (en) * 2006-07-26 2010-07-20 Starmark, Inc. Automatic volume control to compensate for speech interference noise
AU2007309691B2 (en) 2006-10-20 2011-03-10 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
WO2008073465A1 (en) * 2006-12-11 2008-06-19 Thx, Ltd. Constant balance volume control
CA2671496A1 (en) 2006-12-12 2008-06-19 Thx, Ltd. Dynamic surround channel volume control
US8194889B2 (en) 2007-01-03 2012-06-05 Dolby Laboratories Licensing Corporation Hybrid digital/analog loudness-compensating volume control
KR101356206B1 (ko) * 2007-02-01 2014-01-28 삼성전자주식회사 자동 오디오 볼륨 기능을 갖는 오디오 재생 방법 및 장치
US8275153B2 (en) * 2007-04-16 2012-09-25 Evertz Microsystems Ltd. System and method for generating an audio gain control signal
US8103008B2 (en) 2007-04-26 2012-01-24 Microsoft Corporation Loudness-based compensation for background noise
MX2009009942A (es) 2007-06-19 2009-09-24 Dolby Lab Licensing Corp Medicion de volumen con modificaciones expectrales.
EP2168122B1 (en) * 2007-07-13 2011-11-30 Dolby Laboratories Licensing Corporation Audio processing using auditory scene analysis and spectral skewness
CN101855901B (zh) * 2007-08-16 2012-11-14 Dts(英属维尔京群岛)有限公司 用于压缩数字电视的音频处理
TWI350653B (en) 2007-10-19 2011-10-11 Realtek Semiconductor Corp Automatic gain control device and method
EP2209326B1 (en) 2007-10-30 2012-12-12 Clarion Co., Ltd. Auditory sense correction device
US8300849B2 (en) * 2007-11-06 2012-10-30 Microsoft Corporation Perceptually weighted digital audio level compression
KR101439205B1 (ko) * 2007-12-21 2014-09-11 삼성전자주식회사 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치
KR100888049B1 (ko) * 2008-01-25 2009-03-10 재단법인서울대학교산학협력재단 부분 마스킹 효과를 도입한 음성 강화 방법
KR101459319B1 (ko) 2008-01-29 2014-11-07 삼성전자주식회사 오디오 볼륨 자동 조절 방법 및 장치
TWI429301B (zh) * 2008-05-05 2014-03-01 Mstar Semiconductor Inc 音量控制裝置與方法
WO2010013944A2 (en) * 2008-07-29 2010-02-04 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US20100054486A1 (en) * 2008-08-26 2010-03-04 Nelson Sollenberger Method and system for output device protection in an audio codec
WO2010033384A1 (en) 2008-09-19 2010-03-25 Dolby Laboratories Licensing Corporation Upstream quality enhancement signal processing for resource constrained client devices
ES2385293T3 (es) 2008-09-19 2012-07-20 Dolby Laboratories Licensing Corporation Procesamiento de señales ascendentes para dispositivos clientes en una red inalámbrica de células pequeñas
BRPI0922050A2 (pt) 2008-11-14 2019-09-24 That Corp proteção de processamento multi-espacial e controle de volume dinâmico
US9380385B1 (en) 2008-11-14 2016-06-28 That Corporation Compressor based dynamic bass enhancement with EQ
WO2010075377A1 (en) 2008-12-24 2010-07-01 Dolby Laboratories Licensing Corporation Audio signal loudness determination and modification in the frequency domain
JP5267115B2 (ja) * 2008-12-26 2013-08-21 ソニー株式会社 信号処理装置、その処理方法およびプログラム
US20110274284A1 (en) * 2009-01-30 2011-11-10 Phonak Ag System and method for providing active hearing protection to a user
US8068185B2 (en) * 2009-02-03 2011-11-29 Ali Corporation Volume adjusting method for channel switching of digital television
US20100215193A1 (en) * 2009-02-25 2010-08-26 Conexant Systems, Inc. Speaker Distortion Deduction System and Method
EP2237269B1 (en) * 2009-04-01 2013-02-20 Motorola Mobility LLC Apparatus and method for processing an encoded audio data signal
WO2010127024A1 (en) 2009-04-30 2010-11-04 Dolby Laboratories Licensing Corporation Controlling the loudness of an audio signal in response to spectral localization
EP2425426B1 (en) 2009-04-30 2013-03-13 Dolby Laboratories Licensing Corporation Low complexity auditory event boundary detection
TWI503816B (zh) * 2009-05-06 2015-10-11 Dolby Lab Licensing Corp 調整音訊信號響度並使其具有感知頻譜平衡保持效果之技術
WO2010138311A1 (en) * 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Equalization profiles for dynamic equalization of audio data
WO2010138309A1 (en) 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Audio signal dynamic equalization processing control
US20120096353A1 (en) * 2009-06-19 2012-04-19 Dolby Laboratories Licensing Corporation User-specific features for an upgradeable media kernel and engine
WO2011011438A2 (en) * 2009-07-22 2011-01-27 Dolby Laboratories Licensing Corporation System and method for automatic selection of audio configuration settings
WO2011015237A1 (en) * 2009-08-04 2011-02-10 Nokia Corporation Method and apparatus for audio signal classification
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
KR101591704B1 (ko) * 2009-12-04 2016-02-04 삼성전자주식회사 스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치
KR20110089020A (ko) * 2010-01-29 2011-08-04 주식회사 팬택 휴대용 단말기의 무선 헤드셋을 통한 음성 출력의 조절 방법 및 그 방법이 구현된 휴대용 단말기
NL2004294C2 (en) * 2010-02-24 2011-08-25 Ru Jacob Alexander De Hearing instrument.
CN101783656A (zh) * 2010-03-17 2010-07-21 北京爱德发科技有限公司 一种音响响度控制方法、模块和装置
WO2011141772A1 (en) * 2010-05-12 2011-11-17 Nokia Corporation Method and apparatus for processing an audio signal based on an estimated loudness
US8457321B2 (en) * 2010-06-10 2013-06-04 Nxp B.V. Adaptive audio output
TWI716169B (zh) 2010-12-03 2021-01-11 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
JP5304860B2 (ja) * 2010-12-03 2013-10-02 ヤマハ株式会社 コンテンツ再生装置およびコンテンツ処理方法
JP5585432B2 (ja) * 2010-12-16 2014-09-10 ソニー株式会社 音響信号処理装置および方法、並びに、プログラム
US8855322B2 (en) * 2011-01-12 2014-10-07 Qualcomm Incorporated Loudness maximization with constrained loudspeaker excursion
JP5707963B2 (ja) * 2011-01-20 2015-04-30 ヤマハ株式会社 オーディオアンプ
WO2012114696A1 (ja) * 2011-02-24 2012-08-30 パナソニック株式会社 回折音低減装置、回折音低減方法、及び、フィルタ係数決定方法
US8965756B2 (en) * 2011-03-14 2015-02-24 Adobe Systems Incorporated Automatic equalization of coloration in speech recordings
JP5106651B2 (ja) * 2011-03-31 2012-12-26 株式会社東芝 信号処理装置及び信号処理方法
JP6185457B2 (ja) * 2011-04-28 2017-08-23 ドルビー・インターナショナル・アーベー 効率的なコンテンツ分類及びラウドネス推定
US20120294459A1 (en) * 2011-05-17 2012-11-22 Fender Musical Instruments Corporation Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals in Consumer Audio and Control Signal Processing Function
US20120294457A1 (en) * 2011-05-17 2012-11-22 Fender Musical Instruments Corporation Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals and Control Signal Processing Function
US9509267B2 (en) 2011-11-08 2016-11-29 Nokia Technologies Oy Method and an apparatus for automatic volume leveling of audio signals
US9712127B2 (en) 2012-01-11 2017-07-18 Richard Aylward Intelligent method and apparatus for spectral expansion of an input signal
EP2624449B1 (en) * 2012-02-01 2016-12-07 Harman Becker Automotive Systems GmbH Peak detection when adapting a signal gain based on signal loudness
US9437213B2 (en) * 2012-03-05 2016-09-06 Malaspina Labs (Barbados) Inc. Voice signal enhancement
JP5827442B2 (ja) 2012-04-12 2015-12-02 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ信号におけるラウドネス変化をレベリングするシステム及び方法
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US8831935B2 (en) * 2012-06-20 2014-09-09 Broadcom Corporation Noise feedback coding for delta modulation and other codecs
US9685921B2 (en) * 2012-07-12 2017-06-20 Dts, Inc. Loudness control with noise detection and loudness drop detection
EP2693636A1 (en) * 2012-08-01 2014-02-05 Harman Becker Automotive Systems GmbH Automatic loudness control
US9735746B2 (en) 2012-08-01 2017-08-15 Harman Becker Automotive Systems Gmbh Automatic loudness control
EP2693637A1 (en) * 2012-08-01 2014-02-05 Harman Becker Automotive Systems GmbH Automatic loudness control
EP2693635A1 (en) * 2012-08-01 2014-02-05 Harman Becker Automotive Systems GmbH Automatic loudness control
CN103796136B (zh) * 2012-10-30 2017-02-08 广州三星通信技术研究有限公司 保证不同音效模式输出响度及音质的设备和方法
US10043535B2 (en) 2013-01-15 2018-08-07 Staton Techiya, Llc Method and device for spectral expansion for an audio signal
US9841941B2 (en) 2013-01-21 2017-12-12 Dolby Laboratories Licensing Corporation System and method for optimizing loudness and dynamic range across different playback devices
US9451230B1 (en) * 2013-03-15 2016-09-20 Google Inc. Playback adjustments for digital media items
CN104080024B (zh) * 2013-03-26 2019-02-19 杜比实验室特许公司 音量校平器控制器和控制方法以及音频分类器
CN104078050A (zh) * 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
KR102243688B1 (ko) * 2013-04-05 2021-04-27 돌비 인터네셔널 에이비 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더
MX342965B (es) * 2013-04-05 2016-10-19 Dolby Laboratories Licensing Corp Sistema y método de compansión para reducir el ruido de cuantificación usando extensión espectral avanzada.
US9253586B2 (en) 2013-04-26 2016-02-02 Sony Corporation Devices, methods and computer program products for controlling loudness
JP5969727B2 (ja) 2013-04-29 2016-08-17 ドルビー ラボラトリーズ ライセンシング コーポレイション 動的閾値を用いた周波数帯域圧縮
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
JP6216553B2 (ja) * 2013-06-27 2017-10-18 クラリオン株式会社 伝搬遅延補正装置及び伝搬遅延補正方法
JP6201460B2 (ja) * 2013-07-02 2017-09-27 ヤマハ株式会社 ミキシング管理装置
US20150043753A1 (en) * 2013-08-06 2015-02-12 Marvell World Trade Ltd. Systems and Methods for Noise Reduction
CN105556837B (zh) * 2013-09-12 2019-04-19 杜比实验室特许公司 用于各种回放环境的动态范围控制
JP6151619B2 (ja) * 2013-10-07 2017-06-21 クラリオン株式会社 音場測定装置、音場測定方法および音場測定プログラム
US10045135B2 (en) 2013-10-24 2018-08-07 Staton Techiya, Llc Method and device for recognition and arbitration of an input connection
US9391575B1 (en) * 2013-12-13 2016-07-12 Amazon Technologies, Inc. Adaptive loudness control
US10043534B2 (en) 2013-12-23 2018-08-07 Staton Techiya, Llc Method and device for spectral expansion for an audio signal
US9608588B2 (en) * 2014-01-22 2017-03-28 Apple Inc. Dynamic range control with large look-ahead
CN105612692B (zh) * 2014-01-30 2018-06-26 华为技术有限公司 用于压缩音频信号的数字压缩器
JP2017506038A (ja) * 2014-01-30 2017-02-23 ホアウェイ・テクノロジーズ・カンパニー・リミテッド オーディオ信号を圧縮するためのオーディオ圧縮システム
EP3108669B1 (en) 2014-02-18 2020-04-08 Dolby International AB Device and method for tuning a frequency-dependent attenuation stage
US9503803B2 (en) 2014-03-26 2016-11-22 Bose Corporation Collaboratively processing audio between headset and source to mask distracting noise
US20150281830A1 (en) 2014-03-26 2015-10-01 Bose Corporation Collaboratively Processing Audio between Headset and Source
GB201406574D0 (en) * 2014-04-11 2014-05-28 Microsoft Corp Audio Signal Processing
CN105142067B (zh) 2014-05-26 2020-01-07 杜比实验室特许公司 音频信号响度控制
CN105336341A (zh) 2014-05-26 2016-02-17 杜比实验室特许公司 增强音频信号中的语音内容的可理解性
US10013992B2 (en) 2014-07-11 2018-07-03 Arizona Board Of Regents On Behalf Of Arizona State University Fast computation of excitation pattern, auditory pattern and loudness
US9661435B2 (en) * 2014-08-29 2017-05-23 MUSIC Group IP Ltd. Loudness meter and loudness metering method
US10842418B2 (en) 2014-09-29 2020-11-24 Starkey Laboratories, Inc. Method and apparatus for tinnitus evaluation with test sound automatically adjusted for loudness
EP3259927A1 (en) * 2015-02-19 2017-12-27 Dolby Laboratories Licensing Corporation Loudspeaker-room equalization with perceptual correction of spectral dips
US20170078793A1 (en) * 2015-03-23 2017-03-16 Eric Jay Alexander Inversion Speaker and Headphone for Music Production
EP3286929B1 (en) 2015-04-20 2019-07-31 Dolby Laboratories Licensing Corporation Processing audio data to compensate for partial hearing loss or an adverse hearing environment
RU2703973C2 (ru) * 2015-05-29 2019-10-22 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ регулировки уровня громкости
ES2936089T3 (es) 2015-06-17 2023-03-14 Fraunhofer Ges Forschung Control de intensidad del sonido para interacción del usuario en sistemas de codificación de audio
US9837086B2 (en) 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
EP3342040B1 (en) 2015-08-24 2019-12-18 Dolby Laboratories Licensing Corporation Volume-levelling processing
US9590580B1 (en) 2015-09-13 2017-03-07 Guoguang Electric Company Limited Loudness-based audio-signal compensation
DE102015217565A1 (de) 2015-09-15 2017-03-16 Ford Global Technologies, Llc Verfahren und Vorrichtung zur Verarbeitung von Audio-Signalen
US10341770B2 (en) 2015-09-30 2019-07-02 Apple Inc. Encoded audio metadata-based loudness equalization and dynamic equalization during DRC
WO2017147428A1 (en) * 2016-02-25 2017-08-31 Dolby Laboratories Licensing Corporation Capture and extraction of own voice signal
US10142731B2 (en) 2016-03-30 2018-11-27 Dolby Laboratories Licensing Corporation Dynamic suppression of non-linear distortion
CN105845151B (zh) * 2016-05-30 2019-05-31 百度在线网络技术(北京)有限公司 应用于语音识别前端的音频增益调整方法和装置
CN109310525B (zh) 2016-06-14 2021-12-28 杜比实验室特许公司 媒体补偿通过和模式切换
US10374566B2 (en) * 2016-07-29 2019-08-06 Maxim Integrated Products, Inc. Perceptual power reduction system and method
CN109891504A (zh) 2016-10-07 2019-06-14 索尼公司 信息处理设备和方法以及程序
TWI590236B (zh) * 2016-12-09 2017-07-01 宏碁股份有限公司 語音信號處理裝置及語音信號處理方法
US11388533B2 (en) * 2016-12-13 2022-07-12 QSIC Pty Ltd Sound management method and system
KR102583931B1 (ko) * 2017-01-25 2023-10-04 삼성전자주식회사 음향 출력 장치 및 그의 제어 방법
WO2018144367A1 (en) * 2017-02-03 2018-08-09 iZotope, Inc. Audio control system and related methods
US20180268840A1 (en) * 2017-03-15 2018-09-20 Guardian Glass, LLC Speech privacy system and/or associated method
US10726855B2 (en) 2017-03-15 2020-07-28 Guardian Glass, Llc. Speech privacy system and/or associated method
US10374564B2 (en) * 2017-04-20 2019-08-06 Dts, Inc. Loudness control with noise detection and loudness drop detection
CN110574289B (zh) * 2017-05-04 2024-02-13 哈曼国际工业有限公司 用于调整音频信号的方法和装置以及音频系统
WO2018226418A1 (en) 2017-06-07 2018-12-13 iZotope, Inc. Systems and methods for identifying and remediating sound masking
KR102302683B1 (ko) 2017-07-07 2021-09-16 삼성전자주식회사 음향 출력 장치 및 그 신호 처리 방법
AT520176B1 (de) * 2017-07-10 2019-02-15 Isuniye Llc Verfahren zum Modifizieren eines Audiosignals
AT520106B1 (de) * 2017-07-10 2019-07-15 Isuniye Llc Verfahren zum Modifizieren eines Eingangssignals
KR102565447B1 (ko) * 2017-07-26 2023-08-08 삼성전자주식회사 청각 인지 속성에 기반하여 디지털 오디오 신호의 이득을 조정하는 전자 장치 및 방법
CN110799936B (zh) * 2017-08-18 2024-05-03 Oppo广东移动通信有限公司 音量调节方法、装置、终端设备及存储介质
US11594241B2 (en) * 2017-09-26 2023-02-28 Sony Europe B.V. Method and electronic device for formant attenuation/amplification
US11069369B2 (en) * 2017-09-28 2021-07-20 Sony Europe B.V. Method and electronic device
KR101992019B1 (ko) * 2017-09-29 2019-06-21 경성대학교 산학협력단 음향 출력 제어 장치 및 방법
US10389323B2 (en) 2017-12-18 2019-08-20 Tls Corp. Context-aware loudness control
US10959034B2 (en) 2018-01-09 2021-03-23 Dolby Laboratories Licensing Corporation Reducing unwanted sound transmission
CN110832830B (zh) * 2018-03-22 2021-07-09 华为技术有限公司 一种调节音量的方法和电子设备
EP4109446B1 (en) 2018-04-27 2024-04-10 Dolby Laboratories Licensing Corporation Background noise estimation using gap confidence
KR101942044B1 (ko) * 2018-05-25 2019-01-24 (주)유비아이사운드 다이나믹 부스트 오디오 신호 처리 장치 및 방법
WO2019246449A1 (en) * 2018-06-22 2019-12-26 Dolby Laboratories Licensing Corporation Audio enhancement in response to compression feedback
US11011180B2 (en) * 2018-06-29 2021-05-18 Guoguang Electric Company Limited Audio signal dynamic range compression
US11363380B2 (en) 2018-07-31 2022-06-14 Hewlett-Packard Development Company, L.P. Stereophonic devices
EP3609197B1 (en) 2018-08-06 2021-04-14 SONY Corporation Method of reproducing audio, computer software, non-transitory machine-readable medium, and audio processing apparatus
KR102106707B1 (ko) * 2018-09-18 2020-05-04 전자부품연구원 오디오 음량 컨트롤 방법 및 장치
JP7031543B2 (ja) * 2018-09-21 2022-03-08 株式会社Jvcケンウッド 処理装置、処理方法、再生方法、及びプログラム
EP3629475A1 (en) * 2018-09-25 2020-04-01 InterDigital CE Patent Holdings Audio device with learning and adaptive quiet mode capabilities
US10679602B2 (en) * 2018-10-26 2020-06-09 Facebook Technologies, Llc Adaptive ANC based on environmental triggers
WO2020111676A1 (ko) * 2018-11-28 2020-06-04 삼성전자 주식회사 음성 인식 장치 및 방법
WO2020153736A1 (en) 2019-01-23 2020-07-30 Samsung Electronics Co., Ltd. Method and device for speech recognition
CN109817193B (zh) * 2019-02-21 2022-11-22 深圳市魔耳乐器有限公司 一种基于时变多段式频谱的音色拟合系统
CN109889170B (zh) * 2019-02-25 2021-06-04 珠海格力电器股份有限公司 音频信号的控制方法和装置
US10674265B1 (en) * 2019-04-26 2020-06-02 Google Llc Background level dependent dynamic volume levels
WO2020231181A1 (en) * 2019-05-16 2020-11-19 Samsung Electronics Co., Ltd. Method and device for providing voice recognition service
CN110191396B (zh) * 2019-05-24 2022-05-27 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、装置、终端及计算机可读存储介质
CN112243151A (zh) * 2019-07-16 2021-01-19 腾讯科技(深圳)有限公司 一种音频播放控制方法、装置、设备及介质
EP3771202B1 (en) * 2019-07-23 2023-08-30 Top Victory Investments Limited Method and system for automatically controlling audio output of a television device based on ambient noise
SE543749C2 (en) * 2019-11-15 2021-07-13 Hearezanz Ab Volume dependent audio compensation
US11817114B2 (en) 2019-12-09 2023-11-14 Dolby Laboratories Licensing Corporation Content and environmentally aware environmental noise compensation
US11032642B1 (en) 2020-03-10 2021-06-08 Nuvoton Technology Corporation Combined frequency response and dynamic range correction for loudspeakers
WO2021183916A1 (en) * 2020-03-13 2021-09-16 Immersion Networks, Inc. Loudness equalization system
US11288036B2 (en) 2020-06-03 2022-03-29 Microsoft Technology Licensing, Llc Adaptive modulation of audio content based on background noise
US11317203B2 (en) 2020-08-04 2022-04-26 Nuvoton Technology Corporation System for preventing distortion of original input signal
US11202149B1 (en) 2020-09-11 2021-12-14 Ford Global Technologies, Llc Vehicle audio control
US11157114B1 (en) 2020-09-17 2021-10-26 Ford Global Technologies, Llc Vehicle surface deformation identification
US11387800B1 (en) * 2021-05-12 2022-07-12 Elite Semiconductor Microelectronics Technology Inc. Method for dynamically adjusting weighting values to equalize input signal to generate equalizer output signal and associated parametric equalizer
SE545513C2 (en) * 2021-05-12 2023-10-03 Audiodo Ab Publ Voice optimization in noisy environments
US11757420B2 (en) * 2021-05-19 2023-09-12 Elite Semiconductor Microelectronics Technology Inc. Method for dynamically adjusting adjustable gain value to equalize input signal to generate equalizer output signal and associated leveling equalizer
TWI781714B (zh) * 2021-08-05 2022-10-21 晶豪科技股份有限公司 用以等化輸入訊號以產生等化器輸出訊號的方法以及參數等化器
CN114486286B (zh) * 2022-01-12 2024-05-17 中国重汽集团济南动力有限公司 一种车辆关门声品质评价方法及设备
WO2023249939A1 (en) * 2022-06-21 2023-12-28 Immersion Networks, Inc. System and method for digital signal processing using adaptive soft clipping with lookahead
CN117354676B (zh) * 2023-10-30 2024-03-05 广州特美声电器有限公司 基于长距离的声音叠加放大方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05175772A (ja) * 1991-11-28 1993-07-13 Yamaha Corp 音響再生装置
JPH10341123A (ja) * 1997-06-06 1998-12-22 Matsushita Electric Ind Co Ltd 音響再生装置
JPH11225398A (ja) * 1998-02-05 1999-08-17 Matsushita Electric Ind Co Ltd ラウドネス調整方法および補聴器
JP2002078096A (ja) * 2000-08-29 2002-03-15 National Institute Of Advanced Industrial & Technology 聴覚障害を考慮した音の測定方法およびシステム
JP2002543703A (ja) * 1999-04-26 2002-12-17 ディーエスピーファクトリー・リミテッド デジタル補聴器用のラウドネス正常化制御
JP2003264892A (ja) * 2002-03-07 2003-09-19 Matsushita Electric Ind Co Ltd 音響処理装置、音響処理方法およびプログラム

Family Cites Families (197)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US34961A (en) 1862-04-15 Improvement in the manufacture of gun-barrels
US2808475A (en) 1954-10-05 1957-10-01 Bell Telephone Labor Inc Loudness indicator
US4281218A (en) 1979-10-26 1981-07-28 Bell Telephone Laboratories, Incorporated Speech-nonspeech detector-classifier
DE3314570A1 (de) 1983-04-22 1984-10-25 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zur einstellung der verstaerkung
US4739514A (en) 1986-12-22 1988-04-19 Bose Corporation Automatic dynamic equalizing
US4887299A (en) 1987-11-12 1989-12-12 Nicolet Instrument Corporation Adaptive, programmable signal processing hearing aid
US4953112A (en) 1988-05-10 1990-08-28 Minnesota Mining And Manufacturing Company Method and apparatus for determining acoustic parameters of an auditory prosthesis using software model
US5027410A (en) 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
RU2012994C1 (ru) 1989-03-01 1994-05-15 Белорусский государственный университет Устройство автоматической регулировки уровня сигнала
JPH02118322U (ja) 1989-03-08 1990-09-21
US5097510A (en) 1989-11-07 1992-03-17 Gs Systems, Inc. Artificial intelligence pattern-recognition-based noise reduction system for speech processing
US5369711A (en) 1990-08-31 1994-11-29 Bellsouth Corporation Automatic gain control for a headset
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
AU653582B2 (en) 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
EP0517233B1 (en) 1991-06-06 1996-10-30 Matsushita Electric Industrial Co., Ltd. Music/voice discriminating apparatus
US5278912A (en) 1991-06-28 1994-01-11 Resound Corporation Multiband programmable compression system
US5263188A (en) 1991-08-16 1993-11-16 Delco Electronics Corporation Fade compensated tone control method and apparatus
US5363147A (en) 1992-06-01 1994-11-08 North American Philips Corporation Automatic volume leveler
DE4335739A1 (de) * 1992-11-17 1994-05-19 Rudolf Prof Dr Bisping Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen
GB2272615A (en) 1992-11-17 1994-05-18 Rudolf Bisping Controlling signal-to-noise ratio in noisy recordings
US5548638A (en) 1992-12-21 1996-08-20 Iwatsu Electric Co., Ltd. Audio teleconferencing apparatus
US5457769A (en) 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5706352A (en) 1993-04-07 1998-01-06 K/S Himpp Adaptive gain and filtering circuit for a sound reproduction system
US5434922A (en) * 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
BE1007355A3 (nl) 1993-07-26 1995-05-23 Philips Electronics Nv Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling.
IN184794B (ja) 1993-09-14 2000-09-30 British Telecomm
JP2986345B2 (ja) 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
US5530760A (en) 1994-04-29 1996-06-25 Audio Products International Corp. Apparatus and method for adjusting levels between channels of a sound system
US5500902A (en) 1994-07-08 1996-03-19 Stockham, Jr.; Thomas G. Hearing aid device incorporating signal processing techniques
GB9419388D0 (en) 1994-09-26 1994-11-09 Canon Kk Speech analysis
US5548538A (en) * 1994-12-07 1996-08-20 Wiltron Company Internal automatic calibrator for vector network analyzers
US5682463A (en) 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
CA2167748A1 (en) 1995-02-09 1996-08-10 Yoav Freund Apparatus and methods for machine learning hypotheses
EP0661905B1 (de) 1995-03-13 2002-12-11 Phonak Ag Verfahren zur Anpassung eines Hörgerätes, Vorrichtung hierzu und Hörgerät
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
BR9609799A (pt) 1995-04-10 1999-03-23 Corporate Computer System Inc Sistema para compressão e descompressão de sinais de áudio para transmissão digital
US6301555B2 (en) 1995-04-10 2001-10-09 Corporate Computer Systems Adjustable psycho-acoustic parameters
US5601617A (en) 1995-04-26 1997-02-11 Advanced Bionics Corporation Multichannel cochlear prosthesis with flexible control of stimulus waveforms
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
US5663727A (en) 1995-06-23 1997-09-02 Hearing Innovations Incorporated Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same
US5712954A (en) 1995-08-23 1998-01-27 Rockwell International Corp. System and method for monitoring audio power level of agent speech in a telephonic switch
US6002776A (en) 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
US5907622A (en) 1995-09-21 1999-05-25 Dougherty; A. Michael Automatic noise compensation system for audio reproduction equipment
US6327366B1 (en) 1996-05-01 2001-12-04 Phonak Ag Method for the adjustment of a hearing device, apparatus to do it and a hearing device
US6108431A (en) 1996-05-01 2000-08-22 Phonak Ag Loudness limiter
US6430533B1 (en) 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
JPH09312540A (ja) 1996-05-23 1997-12-02 Pioneer Electron Corp ラウドネスボリュームコントロール装置
JP3765622B2 (ja) 1996-07-09 2006-04-12 ユナイテッド・モジュール・コーポレーション オーディオ符号化復号化システム
DE59713033D1 (de) 1996-07-19 2010-06-02 Bernafon Ag Lautheitsgesteuerte Verarbeitung akustischer Signale
JP2953397B2 (ja) 1996-09-13 1999-09-27 日本電気株式会社 ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器
JPH10124092A (ja) 1996-10-23 1998-05-15 Sony Corp 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
US6570991B1 (en) 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
US5862228A (en) 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
AU744008B2 (en) 1997-04-16 2002-02-14 Semiconductor Components Industries, Llc Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signals in hearing aids
US6125343A (en) 1997-05-29 2000-09-26 3Com Corporation System and method for selecting a loudest speaker by comparing average frame gains
US6272360B1 (en) 1997-07-03 2001-08-07 Pan Communications, Inc. Remotely installed transmitter and a hands-free two-way voice terminal device using same
US6185309B1 (en) 1997-07-11 2001-02-06 The Regents Of The University Of California Method and apparatus for blind separation of mixed and convolved sources
KR100261904B1 (ko) 1997-08-29 2000-07-15 윤종용 헤드폰 사운드 출력장치
US6088461A (en) 1997-09-26 2000-07-11 Crystal Semiconductor Corporation Dynamic volume control system
US6233554B1 (en) 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
TW358925B (en) 1997-12-31 1999-05-21 Ind Tech Res Inst Improvement of oscillation encoding of a low bit rate sine conversion language encoder
US6298139B1 (en) 1997-12-31 2001-10-02 Transcrypt International, Inc. Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control
US6182033B1 (en) 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
US6353671B1 (en) 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility
JPH11239093A (ja) * 1998-02-20 1999-08-31 Nec Corp 移動体無線通信装置
US6311155B1 (en) 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
DE69942521D1 (de) * 1998-04-14 2010-08-05 Hearing Enhancement Co Llc Vom benutzer einstellbare lautstärkensteuerung zur höranpassung
US6498855B1 (en) 1998-04-17 2002-12-24 International Business Machines Corporation Method and system for selectively and variably attenuating audio data
EP1086607B2 (en) 1998-06-08 2012-04-11 Cochlear Limited Hearing instrument
EP0980064A1 (de) 1998-06-26 2000-02-16 Ascom AG Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen
GB2340351B (en) 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6351731B1 (en) 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6823303B1 (en) 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6411927B1 (en) 1998-09-04 2002-06-25 Matsushita Electric Corporation Of America Robust preprocessing signal equalization system and method for normalizing to a target environment
FI113935B (fi) 1998-09-25 2004-06-30 Nokia Corp Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä
DE19848491A1 (de) 1998-10-21 2000-04-27 Bosch Gmbh Robert Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger
US6314396B1 (en) 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
DE69933929T2 (de) 1999-04-09 2007-06-06 Texas Instruments Inc., Dallas Bereitstellen von digitalen Audio- und Videoprodukten
US6263371B1 (en) 1999-06-10 2001-07-17 Cacheflow, Inc. Method and apparatus for seaming of streaming content
US6442278B1 (en) 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
AR024353A1 (es) 1999-06-15 2002-10-02 He Chunhong Audifono y equipo auxiliar interactivo con relacion de voz a audio remanente
US6481496B1 (en) 1999-06-17 2002-11-19 Schlumberger Technology Corporation Well packer and method
WO2001039370A2 (en) 1999-11-29 2001-05-31 Syfx Signal processing system and method
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
DE10018666A1 (de) 2000-04-14 2001-10-18 Harman Audio Electronic Sys Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
US6889186B1 (en) 2000-06-01 2005-05-03 Avaya Technology Corp. Method and apparatus for improving the intelligibility of digitally compressed speech
AUPQ952700A0 (en) 2000-08-21 2000-09-14 University Of Melbourne, The Sound-processing strategy for cochlear implants
US6625433B1 (en) 2000-09-29 2003-09-23 Agere Systems Inc. Constant compression automatic gain control circuit
US6807525B1 (en) 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
DK1206104T3 (da) 2000-11-09 2006-10-30 Koninkl Kpn Nv Måling af en samtalekvalitet af en telefonforbindelse i et telekommunikationsnetværk
US7457422B2 (en) 2000-11-29 2008-11-25 Ford Global Technologies, Llc Method and implementation for detecting and characterizing audible transients in noise
FR2820573B1 (fr) 2001-02-02 2003-03-28 France Telecom Methode et dispositif de traitement d'une pluralite de flux binaires audio
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
DE10107385A1 (de) 2001-02-16 2002-09-05 Harman Audio Electronic Sys Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken
US6915264B2 (en) 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
RU2206174C2 (ru) 2001-03-05 2003-06-10 Журин Дмитрий Вячеславович Способ регулирования громкости звуковоспроизведения и устройства для его реализации
GB2373975B (en) 2001-03-30 2005-04-13 Sony Uk Ltd Digital audio signal processing
DK1290914T3 (da) 2001-04-10 2004-09-27 Phonak Ag Fremgangsmåde til tilpasning af et höreapparat til et individ
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
ES2258575T3 (es) 2001-04-18 2006-09-01 Gennum Corporation Instrumento de audicion de multiples canales con comunicacion entre canales.
CA2354755A1 (en) 2001-08-07 2003-02-07 Dspfactory Ltd. Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank
US7242784B2 (en) * 2001-09-04 2007-07-10 Motorola Inc. Dynamic gain control of audio in a communication device
WO2003036621A1 (en) 2001-10-22 2003-05-01 Motorola, Inc., A Corporation Of The State Of Delaware Method and apparatus for enhancing loudness of an audio signal
SE520466C2 (sv) * 2001-11-12 2003-07-15 Ericsson Telefon Ab L M Metod och anordning vid en digital linjäriseringskoppling
US20040037421A1 (en) 2001-12-17 2004-02-26 Truman Michael Mead Parital encryption of assembled bitstreams
US7068723B2 (en) 2002-02-28 2006-06-27 Fuji Xerox Co., Ltd. Method for automatically producing optimal summaries of linear media
WO2003075457A2 (en) * 2002-03-01 2003-09-12 Andrew Corporation Apparatus and method for reducing peak-to-average signal power ratio
KR101016982B1 (ko) 2002-04-22 2011-02-28 코닌클리케 필립스 일렉트로닉스 엔.브이. 디코딩 장치
US7155385B2 (en) 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7072477B1 (en) 2002-07-09 2006-07-04 Apple Computer, Inc. Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file
JP4257079B2 (ja) 2002-07-19 2009-04-22 パイオニア株式会社 周波数特性調整装置および周波数特性調整方法
KR100467020B1 (ko) 2002-07-26 2005-01-24 삼성전자주식회사 자기 정렬된 접합영역 콘택홀을 갖는 반도체 장치 및 그제조 방법
ATE341923T1 (de) 2002-08-07 2006-10-15 Dolby Lab Licensing Corp Audiokanalumsetzung
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
US20060069550A1 (en) 2003-02-06 2006-03-30 Dolby Laboratories Licensing Corporation Continuous backup audio
DE10308483A1 (de) * 2003-02-26 2004-09-09 Siemens Audiologische Technik Gmbh Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
US7551745B2 (en) 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
SG185134A1 (en) 2003-05-28 2012-11-29 Dolby Lab Licensing Corp Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
GB0313649D0 (en) 2003-06-13 2003-07-16 Signature Ind Ltd Activation mechanism for a personal locator beacon
RU2347282C2 (ru) * 2003-07-07 2009-02-20 Конинклейке Филипс Электроникс Н.В. Система и способ обработки звукового сигнала
TWI233090B (en) 2003-07-24 2005-05-21 Inventec Multimedia & Telecom System and method of language translation for multimedia data
US20050069153A1 (en) 2003-09-26 2005-03-31 Hall David S. Adjustable speaker systems and methods
ATE430360T1 (de) 2004-03-01 2009-05-15 Dolby Lab Licensing Corp Mehrkanalige audiodekodierung
RU2260174C1 (ru) 2004-03-16 2005-09-10 Тульский государственный университет (ТулГУ) Оптико-электронное устройство для контроля угловых размеров
GB2413906A (en) 2004-04-21 2005-11-09 Imagination Tech Ltd Radio volume control system
US7454332B2 (en) * 2004-06-15 2008-11-18 Microsoft Corporation Gain constrained noise suppression
US7617109B2 (en) 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
AU2005299410B2 (en) * 2004-10-26 2011-04-07 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US8199933B2 (en) * 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US7729673B2 (en) 2004-12-30 2010-06-01 Sony Ericsson Mobile Communications Ab Method and apparatus for multichannel signal limiting
US8265295B2 (en) 2005-03-11 2012-09-11 Rane Corporation Method and apparatus for identifying feedback in a circuit
TWI397903B (zh) 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
US8280730B2 (en) * 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
US20070121966A1 (en) * 2005-11-30 2007-05-31 Microsoft Corporation Volume normalization device
AU2007230991A1 (en) 2006-03-22 2007-10-04 Syndexa Pharmaceuticals Corporation Compounds and methods for treatment of disorders associated with ER stress
ES2400160T3 (es) 2006-04-04 2013-04-08 Dolby Laboratories Licensing Corporation Control de una característica percibida del volumen sonoro de una señal de audio
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
JP5185254B2 (ja) 2006-04-04 2013-04-17 ドルビー ラボラトリーズ ライセンシング コーポレイション Mdct領域におけるオーディオ信号音量測定と改良
US8144881B2 (en) 2006-04-27 2012-03-27 Dolby Laboratories Licensing Corporation Audio gain control using specific-loudness-based auditory event detection
DE602006007685D1 (de) * 2006-05-10 2009-08-20 Harman Becker Automotive Sys Kompensation von Mehrkanalechos durch Dekorrelation
US20080025530A1 (en) 2006-07-26 2008-01-31 Sony Ericsson Mobile Communications Ab Method and apparatus for normalizing sound playback loudness
JP4952125B2 (ja) * 2006-08-04 2012-06-13 富士通株式会社 負荷分散装置
AU2007309691B2 (en) 2006-10-20 2011-03-10 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
US8194889B2 (en) 2007-01-03 2012-06-05 Dolby Laboratories Licensing Corporation Hybrid digital/analog loudness-compensating volume control
KR101163411B1 (ko) 2007-03-19 2012-07-12 돌비 레버러토리즈 라이쎈싱 코오포레이션 지각 모델을 사용한 스피치 개선
MX2009009942A (es) 2007-06-19 2009-09-24 Dolby Lab Licensing Corp Medicion de volumen con modificaciones expectrales.
US8300849B2 (en) * 2007-11-06 2012-10-30 Microsoft Corporation Perceptually weighted digital audio level compression
US20090253457A1 (en) 2008-04-04 2009-10-08 Apple Inc. Audio signal processing for certification enhancement in a handheld wireless communications device
US8315396B2 (en) 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
JP2010135906A (ja) 2008-12-02 2010-06-17 Sony Corp クリップ防止装置及びクリップ防止方法
US8422699B2 (en) * 2009-04-17 2013-04-16 Linear Acoustic, Inc. Loudness consistency at program boundaries
WO2010138309A1 (en) * 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Audio signal dynamic equalization processing control
US9071214B2 (en) * 2009-06-11 2015-06-30 Invensense, Inc. Audio signal controller
PL2381574T3 (pl) 2010-04-22 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób do modyfikacji wejściowego sygnału audio
JP5903758B2 (ja) 2010-09-08 2016-04-13 ソニー株式会社 信号処理装置および方法、プログラム、並びにデータ記録媒体
US8989884B2 (en) 2011-01-11 2015-03-24 Apple Inc. Automatic audio configuration based on an audio output device
JP2012235310A (ja) 2011-04-28 2012-11-29 Sony Corp 信号処理装置および方法、プログラム、並びにデータ記録媒体
US8965774B2 (en) 2011-08-23 2015-02-24 Apple Inc. Automatic detection of audio compression parameters
JP5845760B2 (ja) 2011-09-15 2016-01-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
JP2013102411A (ja) 2011-10-14 2013-05-23 Sony Corp 音声信号処理装置、および音声信号処理方法、並びにプログラム
EP2791938B8 (en) 2011-12-15 2016-05-04 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer programm for avoiding clipping artefacts
TWI517142B (zh) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
EP2757558A1 (en) 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
WO2014114781A1 (en) 2013-01-28 2014-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for normalized audio playback of media with and without embedded loudness metadata on new media devices
US9607624B2 (en) 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
US9253586B2 (en) * 2013-04-26 2016-02-02 Sony Corporation Devices, methods and computer program products for controlling loudness
JP2015050685A (ja) 2013-09-03 2015-03-16 ソニー株式会社 オーディオ信号処理装置および方法、並びにプログラム
CN105556837B (zh) * 2013-09-12 2019-04-19 杜比实验室特许公司 用于各种回放环境的动态范围控制
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
US9300268B2 (en) 2013-10-18 2016-03-29 Apple Inc. Content aware audio ducking
EP3522157B1 (en) 2013-10-22 2021-09-22 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Concept for combined dynamic range compression and guided clipping prevention for audio devices
US9240763B2 (en) 2013-11-25 2016-01-19 Apple Inc. Loudness normalization based on user feedback
US9276544B2 (en) 2013-12-10 2016-03-01 Apple Inc. Dynamic range control gain encoding
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
US9608588B2 (en) 2014-01-22 2017-03-28 Apple Inc. Dynamic range control with large look-ahead
US9654076B2 (en) 2014-03-25 2017-05-16 Apple Inc. Metadata for ducking control
WO2015144587A1 (en) 2014-03-25 2015-10-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
WO2015180866A1 (en) 2014-05-28 2015-12-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Data processor and transport of user control data to audio decoders and renderers
CN106415711A (zh) 2014-05-30 2017-02-15 索尼公司 信息处理装置和信息处理方法
SG11201610951UA (en) 2014-06-30 2017-02-27 Sony Corp Information processing apparatus and information processing method
TWI631835B (zh) 2014-11-12 2018-08-01 弗勞恩霍夫爾協會 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器
US20160315722A1 (en) 2015-04-22 2016-10-27 Apple Inc. Audio stem delivery and control
US10109288B2 (en) 2015-05-27 2018-10-23 Apple Inc. Dynamic range and peak control in audio using nonlinear filters
RU2703973C2 (ru) 2015-05-29 2019-10-22 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ регулировки уровня громкости
ES2936089T3 (es) 2015-06-17 2023-03-14 Fraunhofer Ges Forschung Control de intensidad del sonido para interacción del usuario en sistemas de codificación de audio
US9934790B2 (en) * 2015-07-31 2018-04-03 Apple Inc. Encoded audio metadata-based equalization
US9837086B2 (en) 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
US10341770B2 (en) 2015-09-30 2019-07-02 Apple Inc. Encoded audio metadata-based loudness equalization and dynamic equalization during DRC

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05175772A (ja) * 1991-11-28 1993-07-13 Yamaha Corp 音響再生装置
JPH10341123A (ja) * 1997-06-06 1998-12-22 Matsushita Electric Ind Co Ltd 音響再生装置
JPH11225398A (ja) * 1998-02-05 1999-08-17 Matsushita Electric Ind Co Ltd ラウドネス調整方法および補聴器
JP2002543703A (ja) * 1999-04-26 2002-12-17 ディーエスピーファクトリー・リミテッド デジタル補聴器用のラウドネス正常化制御
JP2002078096A (ja) * 2000-08-29 2002-03-15 National Institute Of Advanced Industrial & Technology 聴覚障害を考慮した音の測定方法およびシステム
JP2003264892A (ja) * 2002-03-07 2003-09-19 Matsushita Electric Ind Co Ltd 音響処理装置、音響処理方法およびプログラム

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011509010A (ja) * 2007-12-21 2011-03-17 エスアールエス・ラブス・インコーポレーテッド オーディオ信号の知覚ラウドネスを調節するシステム
WO2010005033A1 (ja) * 2008-07-11 2010-01-14 クラリオン株式会社 音響処理装置
US9214916B2 (en) 2008-07-11 2015-12-15 Clarion Co., Ltd. Acoustic processing device
JP5295238B2 (ja) * 2008-07-11 2013-09-18 クラリオン株式会社 音響処理装置
CN102257728A (zh) * 2008-10-17 2011-11-23 夏普株式会社 音频信号调节设备及音频信号调节方法
JP5236006B2 (ja) * 2008-10-17 2013-07-17 シャープ株式会社 音声信号調整装置及び音声信号調整方法
US8787595B2 (en) 2008-10-17 2014-07-22 Sharp Kabushiki Kaisha Audio signal adjustment device and audio signal adjustment method having long and short term gain adjustment
WO2010044439A1 (ja) * 2008-10-17 2010-04-22 シャープ株式会社 音声信号調整装置及び音声信号調整方法
JP2013501952A (ja) * 2009-08-14 2013-01-17 コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ オーディオ・システムの知覚品質を判定する方法およびシステム
JP2011193442A (ja) * 2010-03-12 2011-09-29 Harman Becker Automotive Systems Gmbh オーディオ信号におけるラウドネスレベルの自動補正
JP2013168807A (ja) * 2012-02-15 2013-08-29 Tamura Seisakusho Co Ltd 番組ラウドネス自動管理システム及びその自動管理方法
JP2016514856A (ja) * 2013-03-21 2016-05-23 インテレクチュアル ディスカバリー カンパニー リミテッド オーディオ信号大きさの制御方法及び装置
JP2016520854A (ja) * 2013-03-21 2016-07-14 インテレクチュアル ディスカバリー カンパニー リミテッド オーディオ信号大きさの制御方法及び装置
CN110754040A (zh) * 2017-04-13 2020-02-04 弗劳恩霍夫应用研究促进协会 用于处理输入音频信号的装置和对应方法
US10886883B2 (en) 2017-04-13 2021-01-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for processing an input audio signal and corresponding method
CN110754040B (zh) * 2017-04-13 2023-08-11 弗劳恩霍夫应用研究促进协会 用于处理输入音频信号的装置和对应方法

Also Published As

Publication number Publication date
EP2262108B1 (en) 2017-03-01
US10374565B2 (en) 2019-08-06
US10720898B2 (en) 2020-07-21
US20190115889A1 (en) 2019-04-18
US10411668B2 (en) 2019-09-10
US9608584B2 (en) 2017-03-28
CA2581810A1 (en) 2006-05-04
WO2006047600A1 (en) 2006-05-04
US20190115893A1 (en) 2019-04-18
KR101261212B1 (ko) 2013-05-07
BRPI0518278A2 (pt) 2008-11-11
US20210021247A1 (en) 2021-01-21
US8090120B2 (en) 2012-01-03
IL182097A (en) 2012-10-31
BRPI0518278B1 (pt) 2018-04-24
US20170155368A1 (en) 2017-06-01
HK1103936A1 (en) 2007-12-28
MX2007005027A (es) 2007-06-19
US20190115895A1 (en) 2019-04-18
US10396739B2 (en) 2019-08-27
US9979366B2 (en) 2018-05-22
JP5101292B2 (ja) 2012-12-19
EP1805891B1 (en) 2012-05-16
US10340869B2 (en) 2019-07-02
US9960743B2 (en) 2018-05-01
EP2262108A1 (en) 2010-12-15
US20170338784A1 (en) 2017-11-23
EP1805891A1 (en) 2007-07-11
US20190115891A1 (en) 2019-04-18
US20190115892A1 (en) 2019-04-18
US20170338786A1 (en) 2017-11-23
US20190115896A1 (en) 2019-04-18
US20190115887A1 (en) 2019-04-18
US10361671B2 (en) 2019-07-23
US10389319B2 (en) 2019-08-20
US20200067473A1 (en) 2020-02-27
US20170201221A1 (en) 2017-07-13
KR20070068379A (ko) 2007-06-29
US9705461B1 (en) 2017-07-11
US10389320B2 (en) 2019-08-20
US9768748B2 (en) 2017-09-19
CN101048935B (zh) 2011-03-23
US20170359045A1 (en) 2017-12-14
US20190115888A1 (en) 2019-04-18
US20070291959A1 (en) 2007-12-20
US9350311B2 (en) 2016-05-24
US20120163629A1 (en) 2012-06-28
US20190115890A1 (en) 2019-04-18
US20170346460A1 (en) 2017-11-30
US20130279708A1 (en) 2013-10-24
CN101048935A (zh) 2007-10-03
US8488809B2 (en) 2013-07-16
US20160248393A1 (en) 2016-08-25
US20170338785A1 (en) 2017-11-23
US10476459B2 (en) 2019-11-12
US20190115894A1 (en) 2019-04-18
US11296668B2 (en) 2022-04-05
AU2005299410B2 (en) 2011-04-07
US9966916B2 (en) 2018-05-08
IL182097A0 (en) 2007-07-24
CA2581810C (en) 2013-12-17
US10396738B2 (en) 2019-08-27
US10454439B2 (en) 2019-10-22
US10389321B2 (en) 2019-08-20
US9954506B2 (en) 2018-04-24
AU2005299410A1 (en) 2006-05-04

Similar Documents

Publication Publication Date Title
JP5101292B2 (ja) オーディオ信号の感知音量及び/又は感知スペクトルバランスの計算と調整
JP4981123B2 (ja) オーディオ信号の知覚音量及び/又は知覚スペクトルバランスの計算と調整
US8199933B2 (en) Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal

Legal Events

Date Code Title Description
A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20081024

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111018

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20111025

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120112

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120118

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120925

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120926

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151005

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5101292

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250