JP6093801B2 - 適応型低周波数補償によってオーディオ・データを符号化するための方法及びシステム - Google Patents

適応型低周波数補償によってオーディオ・データを符号化するための方法及びシステム Download PDF

Info

Publication number
JP6093801B2
JP6093801B2 JP2015106044A JP2015106044A JP6093801B2 JP 6093801 B2 JP6093801 B2 JP 6093801B2 JP 2015106044 A JP2015106044 A JP 2015106044A JP 2015106044 A JP2015106044 A JP 2015106044A JP 6093801 B2 JP6093801 B2 JP 6093801B2
Authority
JP
Japan
Prior art keywords
low frequency
audio data
band
compensation
frequency band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015106044A
Other languages
English (en)
Other versions
JP2015187743A (ja
Inventor
ビスワス,アリジット
メルコーテ,ヴィナイ
シュフーグ,ミヒャエル
エイ デイヴィッドソン,グラント
エイ デイヴィッドソン,グラント
エス ヴィントン,マーク
エス ヴィントン,マーク
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー・インターナショナル・アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー・インターナショナル・アーベー filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2015187743A publication Critical patent/JP2015187743A/ja
Application granted granted Critical
Publication of JP6093801B2 publication Critical patent/JP6093801B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

関連出願の相互参照
本出願は、「Method and System for Encoding Audio Data with Adaptive Low Frequency Compensation」という名称の2012年1月9日に出願した米国仮出願第61/584,478号、及び、「Method and System for Encoding Audio Data with Adaptive Low Frequency Compensation」という名称の2012年8月17日に出願した米国出願第13/588,890号の利益を主張するものであり、上記の出願の各々は、その全体が参照により本明細書により組み込まれている。
本発明は、オーディオ信号処理に関するものであり、より詳細には、適応型低周波数補償によるオーディオ・データの符号化に関する。本発明の一部の実施例は、Dolby Digital(商標)(AC−3)及びDolby Digital Plus(E−AC−3)として知られているフォーマットの1つによって、又は、別の符号化フォーマットによって、オーディオ・データを符号化するために有用である。Dolby(商標)、Dolby Digital、及びDolby Digital Plus(商標)は、Dolby Laboratories Licensing Corporationの商標である。
本発明は、AC−3(Dolby Digital)フォーマット(又はDolby Digital Plusフォーマット)によってオーディオ・データを符号化する際の使用に限定されないが、便宜上本発明は、本発明がAC−3フォーマットよってオーディオ・ビットストリームを符号化する実施例において説明される。AC−3で符号化されたビットストリームは、1から6個のチャネルのオーディオコンテンツ、及びオーディオコンテンツの少なくとも1つの特性を指示しているメタデータを含む。オーディオコンテンツは、知覚オーディオ・コーディングを使用して圧縮されているオーディオ・データである。
AC−3(Dolby Digitalとしても知られている)コーディングの詳細はよく知られており、以下のものを含む多くの公表されている参考文献に記載されている:
ATSC Standard A52/A: Digital Audio Compression Standard (AC−3)、Revision A、Advanced Television Systems Committee、2001年8月20日、
Flexible Perceptual Coding for Audio Transmission and Storage」、Craig C. Toddら、96th Convention of the Audio Engineering Society、1994年2月26日、Preprint 3796、
「Design and Implementation of AC−3 Coders」、Steve Vernon、IEEE Trans. Consumer Electronics、第41巻、第3号、1995年8月、
「Dolby Digital Audio Coding Standards」、Robert L. Andersen及びGrant A. Davidsonによる本の章、The Digital Signal Processing Handbook、第2版、Vijay K. Madisetti編集主任、CRC Press、2009年
「High Quality, Low−Rate Audio Transform Coding for Transmission and Multimedia Applications」、Bosiら、Audio Engineering Society Preprint 3365、93rd AES Convention、1992年10月、並びに、
米国特許第5,583,962号、第5,632,005号、第5,633,981号、第5,727,119号、及び第6,021,386号。
Dolby Digital(AC−3)及びDolby Digital Plus(拡張(Enhanced)AC−3又は「E−AC−3」と呼ばれる場合がある)コーディングの詳細は、「Introduction to Dolby Digital Plus, an Enhancement to the Dolby Digital Coding System」、AES Convention Paper 6196、117th AES Convention、2004年10月28日に、及び、
http://www.atsc.org/cms/index.php/standards/published−standards
で入手可能であるDolby Digital/Dolby Digital Plus仕様書(ATSC A/52:2010)に記載されている。
オーディオ・ビットストリームのAC−3符号化において、符号化されることになる入力オーディオ・サンプルのブロックは、時間−周波数領域変換を受け、その結果、普通は変換係数、周波数係数、又は周波数成分と呼ばれる、均一に隔置される周波数ビン内に位置する、周波数領域データのブロックとなる。次いで各々のビン内の周波数係数が、指数部及び仮数部を含む浮動小数点フォーマットに(例えば、図1のシステムのBFPE段7において)転換される。
AC−3(及びDolby Digital Plus)符号化器(及び他のオーディオ・データ符号化器)の典型的な実施例は、帯域設定された基準(すなわち、バーク尺度(Bark scale)として知られている、よく知られた心理音響尺度の周波数帯域に近い、典型的には50個の不均一の帯域)を基に周波数領域データを分析して、各々の仮数へのビットの最適な割り当てを決定するための心理音響モデルを履行する。次いで仮数データは、決定されたビット割り当てに対応するいくつかのビットに(例えば、図1のシステムの量子化器6において)量子化される。次いで量子化された仮数データは、符号化された出力ビットストリームに(例えば、図1のシステムのフォーマッタ8において)フォーマット設定される。
典型的には仮数ビット割り振りは、(各々の周波数ビンに対するパワー・スペクトル密度(PSD)値により表される)細粒度の信号スペクトルと(各々の周波数帯域に対するマスク値により表される)粗粒度のマスキング曲線との間の差に基づく。さらに典型的には心理音響モデルは、低周波数補償(「ローコンプ(lowcomp)」補償、又は「ローコンプ」と呼ばれる場合がある)を履行して、低周波数帯域に対するマスキング曲線値を補正するための補正値(本明細書では「ローコンプ」パラメータ値と呼ばれる場合がある)を決定する。各々のローコンプ・パラメータ値が、帯域に対する最終的なマスキング曲線値を生成するために、低周波数帯域の異なるものに対する予備的なマスキング曲線値から減算され得る(又は他の方法でその予備的なマスキング曲線値に適用され得る)。
記したようにオーディオ符号化においての仮数ビット割り振りは、信号スペクトルとマスキング曲線との間の差に基づくものであり得る。そのようなビット割り振りを履行するための単純なアルゴリズムでは、1つの特定の周波数帯域内の量子化雑音が、近隣の帯域でのビット割り振りと無関係であるということを想定する場合がある。しかしながらこのことは典型的には、特により低い周波数では合理的な想定ではなく、その理由は、復号化器のフィルタ・バンクにおいて周波数の選択性が有限であり、帯域間のオーバーラップの程度が高いため、及び、マスキング曲線の傾斜がフィルタ・バンク遷移の裾部の傾斜と等しい、又はそれを上回る場合がある低周波数では、1つの帯域から近隣の帯域への漏出があるためというものである。
したがってオーディオ符号化においての仮数ビット割り振り処理は、補正されたマスキング曲線を決定する低周波数補償処理を含むことが多い。次いで補正されたマスキング曲線が、オーディオ・データの各々の周波数成分に対する信号−マスク比値を決定するために使用される。低周波数補償は、顕著な低周波数トーン性成分を伴う信号に対する低周波数でのコーディング性能の改善のための復号化器選択性補償処理である。典型的には低周波数補償は、利便性のために、信号−マスク値を決定するために使用される励起関数の計算に組み込まれ得る、フィルタ・バンク応答補正である。下記でより詳細に解説するように、低周波数補償の典型的な履行では、次の(より高い周波数)帯域に対するPSD値より12dB小さいPSD値を伴う周波数帯域を探索することにより、顕著な低周波数信号成分を検索する。そのようなPSD値が見出されるとき、その帯域に対する励起関数値が直ちに、18dB(又は最高で18dBの量)だけ低減される。その後この低減は、後続の帯域ごとに3dBだけ徐々に程度が弱められる。
図1は、時間領域入力オーディオ・データ1に関してAC−3(又は拡張AC−3)符号化を遂行するように構成される符号化器である。分析フィルタ・バンク2は、時間領域入力オーディオ・データ1を周波数領域オーディオ・データ3に転換し、ブロック浮動小数点符号化(BFPE)段7は、各々の周波数ビンに対する指数部及び仮数部を含む、データ3の各々の周波数成分の浮動小数点表現を生成する。段7から出力される周波数領域データを、本明細書では周波数領域オーディオ・データ3と呼ぶ場合もある。次いで段7から出力される周波数領域オーディオ・データは、量子化器6においてのその周波数領域オーディオ・データの仮数の量子化、及び、(テンティング(tenting)段10においての)その周波数領域オーディオ・データの指数のテンティング、及び、段10において生成されたテンティングされた指数の(指数コーディング段11においての)符号化によることを含めて符号化される。フォーマッタ8は、量子化器6から出力される量子化されたデータ、及び、段11から出力されるコーディングされた差分指数データに応答して、AC−3(又は拡張AC−3)で符号化されたビットストリーム9を生成する。
量子化器6は、コントローラ4により生成される(マスキング・データを含む)制御データに基づいてビット割り当て及び量子化を遂行する。(マスキング曲線を決定する)マスキング・データは、人間の聴力及び聴覚の(コントローラ4により履行される)心理音響モデルの基準を基に、周波数領域データ3から生成される。心理音響モデリングは、人間の聴力の周波数依存のしきい値、及び、マスキングと呼ばれる心理音響現象を考慮するものであり、マスキングとは、1つ又は複数のより弱い周波数成分の近くの強い周波数成分が、それらのより弱い成分をマスクする傾向にあり、それらのより弱い成分を人間の聴取者が聞き取れないようにするというものである。このことによって、オーディオ・データを符号化するときに、より弱い周波数成分を除外することが可能になり、そのことにより、符号化されたオーディオ・データ(ビットストリーム9)の知覚される品質に悪影響を及ぼすことなく、より高い程度の圧縮が実現する。マスキング・データは、周波数領域オーディオ・データ3の各々の周波数帯域に対するマスキング曲線値を含む。これらのマスキング曲線値は、各々の周波数帯域での人間の耳によりマスクされる信号のレベルを表す。量子化器6は、この情報を使用して、利用可能な数のデータ・ビットをどのように最良に使用して、入力オーディオ信号の各々の周波数帯域の周波数領域データを表すかを確定する。
コントローラ4は、従来の低周波数補償処理(本明細書では「ローコンプ」補償と呼ばれる場合がある)を履行して、低周波数帯域に対するマスキング曲線値を補正するためのローコンプ・パラメータ値)を生成することが可能である。補正されたマスキング曲線値は、周波数領域オーディオ・データ3の各々の周波数成分に対する信号−マスク比値を生成するために使用される。低周波数補償は、典型的にはオーディオ・データのAC−3(及びDolby Digital Plus)符号化の間に履行される心理音響モデルの特徴である。ローコンプ補償は、(符号化されることになる入力オーディオ・データの)高度にトーン性の低周波数成分の符号化を、関連性のある周波数区域でのマスクを優先的に低減し、その結果、そのような成分を符号化するために用いられるコード・ワードに、より多くのビットを割り当てることにより改善する。
ローコンプ補償は、各々の低周波数帯域に対するローコンプ・パラメータを決定する。各々の帯域に対するローコンプ・パラメータは、帯域に対する(よく知られている様式で決定される)「励起」値から効果的に減算され、結果として得られる差の値が、補正されたマスキング曲線値を決定するために使用される。帯域に対する励起値を(例えば、その励起値からローコンプ・パラメータを減算すること、又は、その励起値から減算されるローコンプ・パラメータの値を増大することにより)低減すると、その結果、帯域内のオーディオの符号化されたバージョンに割り当てられるビットの数が、以下の理由で増大する。帯域に対する励起値が、(帯域に対するオーディオ・データ値から効果的に減算される)最終的な(補正された)マスク値と必ずしも等しくない間、その励起値は、最終的なマスク値の算出の際に使用される(最終的なマスク値は、絶対的な聴力しきい値、並びに場合によっては他の広帯域の、及び/又は帯域設定された調整を考慮する)。帯域内のオーディオに割り当てられるコーディング・ビットの数は、帯域に対する「信号−マスク」比がより大きければより大きいので、帯域に対するマスク値を低減することによって、その帯域内のオーディオの符号化されたバージョンに割り当てられるビットの数は増大することになる。したがって一般的には、帯域に対する励起値を低減することが、帯域に対するマスク値の低減に、及びその結果として、その帯域に対する割り当てられるビットの数の増大につながる。
本願では次に、従来のローコンプ補償が心理音響モデル(例えば、図1のコントローラ4により履行されるモデル)により典型的に遂行されることになる様式をより詳細に説明する。コントローラ4は、強いトーン性成分の1つの特性である、現在の周波数帯域と後に続く(より高い周波数)帯域との間のパワー・スペクトル密度(PSD)の急峻な(12dB)増大を探索するために、(48kHzのサンプリング周波数で、0Hzから2.05kHzまでの範囲において)低周波数帯域を通して探査することになる。強いトーン性成分を指示しているような低周波数帯域内のPSDを識別することに応答して、ローコンプ補償は、より多くのビットが、識別された強い低周波数トーン性成分を符号化するために用いられるデータに割り当てられるようにするように適用される。
AC−3及びDolby Digital Plus符号化において、周波数領域オーディオ・データ3の各々の成分(すなわち、各々の変換ビンのコンテンツ)は、仮数及び指数を含む浮動小数点表現を有することが理解されよう。マスキング曲線の算出を単純化するために、Dolby Digitalの一群のコーダは、指数のみを使用してマスキング曲線を導出する。又は言い換えれば、マスキング曲線は変換係数指数値に依存するが、変換係数仮数値には無関係である。指数の範囲はある程度制限されているので(一般的には0〜24の整数値)、指数値は、マスキング曲線を計算する目的で、より大きな範囲(一般的には0〜3072の整数値)を伴うPSD尺度上にマッピングされる。したがって最も音の大きな周波数成分(すなわち、0の指数を伴うもの)は3072のPSD値にマッピングされ、一方で最も静かな周波数領域データ成分(すなわち、24の指数を伴うもの)は0のPSD値にマッピングされる。
従来のDolby Digital(又はDolby Digital Plus)符号化において、差分指数(すなわち、連続的な指数間の差)が絶対値の指数の代わりにコーディングされることが知られている。差分指数は5つの値、すなわち2、1、0、−1、及び−2のうちの1つを用いることのみが可能である。この範囲の外側の差分指数が見出される場合には、(修正後に)差分指数が、記した範囲内にあるように、減算される指数の1つが修正される(この従来の方法は、「指数テンティング」又は「テンティング」として知られている)。図1の符号化器のテンティング段10は、そのようなテンティング動作を遂行することにより、テンティング段10に対してアサートされる未加工の指数に応答してテンティングされた指数を生成する。
心理音響モデル(例えば、図1のコントローラ4により履行されるモデル)が低周波数帯域を通して探査し、帯域「N+1」が次の帯域であり、現在の帯域「N」が次の帯域より低い周波数を有する、ローコンプ補償の典型的な履行の例を考えてみる。探査は、最も低い周波数帯域から帯域番号22まで、であってよく、典型的にはLFE(低周波数効果)チャネルの最後の帯域を含まない。帯域N+1に対するPSD値から帯域Nに対するPSD値を引いたものが256に等しいということが決定されるならば(このことは、現在の帯域Nから、次の(より高い周波数)帯域N+1までのPSDの急峻な増大(12dB)を指示している、ローコンプ補償が、18dBだけ直ちに、現在の帯域に対する励起関数算出結果を低減する(すなわち、帯域に対する励起値を低減する)ことにより遂行される。帯域に対する励起値は、384に等しいローコンプ・パラメータを、帯域に対して他の方法で決定されることになる励起値から減算することにより低減される。この励起値の低減は、(例えば、後続の帯域ごとに最高で3dBだけ)徐々に程度が弱められる。
後続の帯域、すなわち、ローコンプが最初に動作可能にされる対象の帯域より周波数が高い帯域に対して、1つの帯域と次の帯域との間のPSDの差が256より小さいということが決定されるならば、(帯域に対する励起値から減算される)ローコンプ・パラメータは、前の帯域に対するものと同じ値に維持されるか、より低い値に低減されるかのいずれかである。(すべての低周波数帯域を通しての探査の間に)2つの近接する帯域間のPSDの差が256に等しいということが最初に決定されるまで、ローコンプ補償は遂行されない(すなわち、値0を有するローコンプ・パラメータが帯域に対する励起値から「減算される」)。
従来のローコンプ処理が、顕著な低周波数成分を伴うトーン性信号に対して有益である一方で、不利な事柄は、マスク低減をトリガ(trigger)する12dBのPSD差の判定基準が、低周波数コンテンツを有する多数の非トーン性信号により頻繁に満たされるということである。群衆による拍手を指示しているオーディオ・データは、そのような非トーン性信号のよく知られている例であり、本明細書では(本発明の典型的な実施例においてトーン性信号と区別される)そのタイプの非トーン性信号の代表物として言及されることになる。本発明者らが認識しているのは、(従来のローコンプ補償による従来のAC−3又はE−AC−3符号化において用いられることになるコーディング・ビット配分に対して)低周波数から中/高周波数までコーディング・ビットを再配分することによって、信号のAC−3(又はE−AC−3)で符号化されたバージョンの復号の後に再現される拍手及び他の非トーン性信号の知覚される品質が向上するということ、したがって、そのような非トーン性信号のローコンプ補償を、それらの非トーン性信号のAC−3又はE−AC−3符号化の間は動作不能にすることが望ましいことになる(すなわち、そのような信号の符号化の間はローコンプをオフに切り替えることが望ましいことになる)ということである。本発明者らは、低周波数コンテンツを有するトーン性信号(例えば、ピッチ・パイプにより生み出される信号)のAC−3(又はE−AC−3)符号化の間のローコンプ補償を、そのような符号化の間に動作不能にすることによって、トーン性信号の知覚される品質が、それらのトーン性信号のAC−3(又はE−AC−3)で符号化されたバージョンの復号の後にそれらのトーン性信号が再現されるときに悪化するということもまた認識している。
したがって本発明者らは、顕著な低周波数トーン性成分を有するオーディオ信号の符号化の間にではあるが、顕著な低周波数トーン性成分を有さないオーディオ信号(例えば、低周波数非トーン性コンテンツを有するが、顕著なトーン性低周波数コンテンツを有さない、拍手信号又は他のオーディオ信号)の符号化の間にではなく、低周波数補償を適応的に適用することが可能である符号化器を実装すること、及び、そのように、復号化器の変更を必要としない様式で(すなわち、従来の復号化器が、本発明の符号化器により生成されている符号化されたオーディオを復号することを可能にする様式で)行うことが望ましいことになるということを認識している。
仮数ビット割り振りが信号スペクトルとマスキング曲線との間の差に基づく、一部の従来のオーディオ符号化方法は、帯域設定された、符号化されることになる周波数領域オーディオ・データに対するマスキング値の生成の間に、低周波数補償に加えて、少なくとも1つのマスキング値補正処理を遂行する。
例えば一部の従来のオーディオ符号化器(例えば、AC−3及びE−AC−3符号化器)は、追加的な改善された心理音響分析によって、符号化されることになる各々のオーディオ・チャネルに対するマスキング曲線をパラメータ的に調整することを可能にするものである、デルタ・ビット割り当てを履行する。符号化器は、用いられるマスキング曲線とデフォルトのマスキング曲線との間の差(すなわち、各々の周波数でのデフォルトのマスキング・モデルにより決定されるマスキング値と、同じ周波数での実際に用いられる改善されたマスキング・モデルにより決定されるマスキング値との間の差)を運搬する、デルタ(delta)として示される追加的なビット・ストリーム・コードを送信する。
デルタ・ビット割り当て関数は、典型的には階段ステップ関数(例えば、最高で±18dBの±6dBステップ)であるように制約される。階段ステップの各々のステップ幅は、整数個の隣接する2分の1のバーク帯域に対するマスキング・レベル調整に対応する。階段ステップは、いくつかの非オーバーラップの可変長セグメントを含む。セグメントは、送信効率のためにランレングスでコーディングされる。
デルタ・ビット割り当ての従来の用途は、マスキング・レベル補正のための従来のBABNDNORM処理である。BABNDNORM処理(マスキング値補正処理の例)では、(AC−3及び拡張AC−3符号化において用いられるバーク周波数(Bark frequency)帯域の)知覚帯域番号29及びそれより上に対して、励起関数を導出するために使用される各々の知覚帯域内の信号エネルギーが、知覚帯域幅の逆数に比例する値によりスケーリングされる。帯域29より下のすべての知覚帯域は単位帯域幅を有する(すなわち、単一の周波数ビンのみを含む)ので、29より下の帯域に対しては信号エネルギーをスケーリングする必要性はない。次第に、より高くなる周波数では、励起関数、したがってマスキングしきい値の推定値はより低くされる。このことによって、より高い周波数で、特に結合チャネルにおいて、ビット割り当てが増大する。AC−3(又はE−AC−3)符号化を履行する一部のオーディオ符号化器は、符号化のステップとしてBABNDNORM処理を履行するように構成される。
図5は、帯域設定された周波数領域オーディオ・データの、帯域設定されたPSD(知覚エネルギー)値のグラフ(最上部の曲線)、オーディオ・データに従来のBABNDNORM処理を適用することにより生成される、スケーリングされた帯域設定されたPSD値のグラフ(最上部から2番目の曲線)、オーディオ・データをマスクする際の使用のために(例えば、従来のAC−3又はE−AC−3符号化器により)生成される励起関数のグラフ(最上部から3番目の曲線)、及び、励起関数に従来のBABNDNORM処理を適用することにより(例えば、従来のAC−3又はE−AC−3符号化器により)生成される、励起関数のスケーリングされたバージョンのグラフ(最下部の曲線)である。4つの曲線の各々は、知覚帯域(バーク周波数)尺度上で表されている。上部の2つの曲線が帯域29で相互に分岐し始めていること、及び、下部の2つの曲線もまた帯域29で相互に分岐し始めていることが明白である。
図6は、オーディオ信号の周波数スペクトルのグラフ(最も広いダイナミック・レンジを有する図6の曲線)、オーディオ信号をマスクするためのデフォルトのマスキング曲線のグラフ(最下部から2番目の曲線)、及び、マスキング曲線に従来のBABNDNORM処理を適用することにより(例えば、従来のAC−3又はE−AC−3符号化器により)生成される、マスキング曲線のスケーリングされたバージョンのグラフ(最下部の曲線)である。図6からは、次第に、より高くなる周波数では、BABNDNORM処理によって、より大きな量だけマスキング曲線がより低くなることが明白である。
本発明は、オーディオ信号処理に関するものであり、より詳細には、適応型低周波数補償によるオーディオ・データの符号化に関する。本発明の一部の実施例は、Dolby Digital(AC−3)及びDolby Digital Plus(E−AC−3)として知られているフォーマットの1つによって、又は別の符号化フォーマットによって、オーディオ・データを符号化するために有用である。
実施例の第1のクラスでは本発明は、(量子化を受けることによることを含めて)符号化されることになる周波数領域オーディオ・データのオーディオ・データ値の仮数ビット割り当てを決定するための仮数ビット割り当て方法である。割り当て方法は、オーディオ・データの低周波数帯域の集合の各々の周波数帯域のオーディオ・データに関して適応型低周波数補償を遂行することによることを含めて、オーディオ・データ値に対するマスキング値を、マスキング値が、前記オーディオ・データに対する仮数ビット割り当てを決定する信号−マスク値を決定するために有用であるように決定するステップを含む。適応型低周波数補償は、
(a)オーディオ・データに関してトーナリティ検出を遂行して、低周波数帯域の集合内の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップと、
(b)補償制御データにより指示されるような顕著なトーン性コンテンツを有する低周波数帯域の集合内の各々の周波数帯域内のオーディオ・データに関して、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対する予備的なマスキング値を補正することによることを含めて、低周波数補償を遂行し、ただし、低周波数帯域の集合内のいずれの他の周波数帯域内のオーディオ・データに関しても、各々の前記他の周波数帯域に対するマスキング値が、補正されない予備的なマスキング値であるように、低周波数補償を遂行しないステップと
を含む。
第1のクラスでの一部の実施例ではステップ(a)は、オーディオ・データに関してトーナリティ検出を遂行して、オーディオ・データの周波数帯域(必ずしも低周波数帯域でない)の少なくとも部分集合の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップを含み、オーディオ・データ値に対するマスキング値を決定するステップは、
(c)補償制御データにより指示されるような顕著なトーン性コンテンツを有するオーディオ・データの前記各々の周波数帯域に対して、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して予備的なマスキング値を補正することによることを含めて、第1の様式でマスキング値補正処理を遂行し、補償制御データにより指示されるような顕著なトーン性コンテンツを欠くオーディオ・データの前記各々の周波数帯域に対して第2の様式でマスキング値補正処理を遂行するステップ
をさらに含む。
例えば、マスキング値補正処理はBABNDNORM処理であってよく、前記各々の周波数帯域は知覚帯域であってよく、ステップ(c)は、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して第1のスケーリング定数によってBABNDNORM処理を遂行し、顕著なトーン性コンテンツを欠く前記各々の周波数帯域に対して第2のスケーリング定数によってBABNDNORM処理を遂行するステップを含み得る。
本発明の別の実施例は、そのような仮数割り当て方法の任意の実施例を含む符号化方法である。
実施例の第2のクラスでは本発明は、(トーン性低周波数コンテンツを伴う信号、及び非トーン性低周波数コンテンツを伴う信号の両方を含む)すべての入力オーディオ信号に低周波数補償を適用する、又は、いずれの入力オーディオ信号にも低周波数補償を適用しない、従来の符号化方法の限界を克服するオーディオ符号化方法である。これらの実施例は、顕著な低周波数トーン性成分を有するオーディオ信号の符号化の間にではあるが、顕著な低周波数トーン性成分を有さないオーディオ信号(例えば、低周波数非トーン性コンテンツを有するが、顕著なトーン性低周波数コンテンツを有さない、拍手又は他のオーディオ信号)の符号化の間にではなく、低周波数補償を選択的に(適応的に)適用する。適応型低周波数補償は、復号化器が、低周波数補償が符号化の間に適用されたか否かを決定することなく(又はその適用されたか否かに関して通知されることなく)、符号化されたオーディオの復号を遂行することを可能にする様式で遂行される。
第2のクラスでの典型的な実施例は、
(a)周波数領域オーディオ・データに関してトーナリティ検出を遂行して、オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップと、
(b)低周波数補償を遂行して、補償制御データにより指示されるような顕著なトーン性コンテンツを有する各々の前記低周波数帯域内のオーディオ・データに対する補正されたマスキング値を生成し、低周波数補償を遂行することなく、集合内の各々の他の低周波数帯域内のオーディオ・データに対するマスキング値を生成するステップと
を含むオーディオ符号化方法である。
一部の実施例では、オーディオ符号化方法はAC−3又は拡張AC−3符号化方法である。これらの実施例では、低周波数補償は好ましくは、ローコンプが当初設計された対象の入力オーディオ・データの周波数帯域(すなわち、顕著な、長期間定常の(「トーン性」)、低周波数コンテンツを指示している周波数帯域)に対して遂行され(すなわち、オンであり、又は動作可能にされ)、そうでない場合は遂行されない(すなわち、オフである、又は効果的に動作不能にされる)。これらの実施例では、低周波数補償はオーディオ・データの周波数帯域に関して遂行されるべきではないということを指示する補償制御データ(例えば、帯域は非トーン性オーディオコンテンツを含むが、顕著なトーン性コンテンツを含まないということを指示する補償制御データ)に応答して、ステップ(b)は好ましくは、前記帯域内のオーディオ・データを、帯域に対する修正されたオーディオ・データを生成するように「再テンティング(”re−tenting”)」するステップであって、帯域に対する前記修正されたオーディオ・データが、修正された指数を含む、「再テンティング」するステップを含む。再テンティングするステップは、(例えば、次のより高い周波数帯域内のオーディオ・データの指数から、帯域に対する修正されたオーディオ・データの修正された指数を引いたものが、2、1、0、又は−1に等しくなければならないように)帯域に対する差分指数が−2に等しくなることが防止されるように、帯域に対する修正されたオーディオ・データを生成する。したがって、ローコンプ補償は帯域には適用されないことになるが、その理由は、帯域にローコンプ補償を適用するための判定基準(次のより低い周波数帯域に対するPSDに対しての、帯域に対する12dBのPSDの増大)が満たされないことになる(この判定基準は、帯域に対する修正された(「再テンティング」された)オーディオ・データの指数から、次のより低い周波数帯域に対する指数を引いたものが、−2に等しくなることが防止されるならば満たされ得ない)からというものである。
より具体的には、一部のそのような実施例では、差分指数が−2に等しくなることを再テンティングが防止する対象の各々の帯域(「第Nの」帯域)に対して、ローコンプ補償は、以下の意味で「適用されない」(又はオフに切り替えられる、又は効果的に動作不能にされる)。(再テンティングの結果として生じる)帯域に対する修正された差分指数は、−1、0、1、又は2である。したがって、前の(より低い周波数)帯域(「第(N−1)の」帯域)に対する差分指数が−2であるならば(このことは、トーナリティ検出ステップが、第「(N−1)」の帯域に対する再テンティングを防止すべき、第「(N−1)」の帯域に対する強いトーン性コンテンツを、及び、第「N」の帯域に対する再テンティングをトリガすべき、第「N」の帯域に対するトーン性コンテンツの欠乏を指示する場合に起こり得る)、及び、ローコンプが第「(N−1)」の帯域に完全なマスク調整を(従来の様式で)適用している(すなわち、本発明のトーン性検出が、ローコンプがそのように行うことを防止していない)ならば、(再テンティングなしの)従来のローコンプは、(第Nの帯域を含む、「第(N−1)の」帯域の後に続く小さな数の帯域に対して)一連の、次第に、より小さくなるマスク調整を、(これらの帯域に対する差分指数がどれも−2に等しくないということを想定すれば)その一連の調整がゼロ調整を行う対象の帯域にその一連の調整が達するまで適用することになる。本段落で説明する実施例において、(本発明による)再テンティングが、帯域(「第Nの」帯域)に対する差分指数が−2に等しくなることを防止するとき(すなわち、本発明のトーン性検出ステップが、帯域に対する非トーン性コンテンツを指示するため)、ローコンプが前の帯域(「第(N−1)の」帯域)にマスク調整を適用しているならば、ローコンプは、第Nの帯域に対して(及び場合によってはさらに、小さな数の後続の帯域に対して)そのローコンプの一連の、次第に、より小さくなるマスク調整を、その一連の調整がゼロ調整を行う対象の最初の帯域にその一連の調整が達するまで継続することが可能にされる。この点でローコンプは、本発明のトーン性検出がトーン性信号を指示するまで、何らかのさらなるマスク調整を行うことが防止される。
他の実施例では、本発明のトーナリティ検出ステップが、ローコンプが従来と同様に適用されることになる集合内のいずれかの低周波数帯域に対する(又は、一体で考慮されるすべての低周波数帯域に対する)非トーン性コンテンツを指示するとき、ローコンプ補償は、以下の意味で「適用されない」(又はオフに切り替えられる、又は効果的に動作不能にされる)。集合内の少なくとも1つの低周波数帯域に対する非トーン性コンテンツを指示する本発明のトーナリティ検出ステップに応答して、集合内のすべての帯域に対する励起関数からの非ゼロのローコンプ・パラメータの減算が、(例えば直ちに)終結する。この点でローコンプは、(周波数領域オーディオ・データの次の集合の帯域を通しての新しい走査の開始まで)何らかのマスク調整を行うことが防止される。
一部の実施例では補償制御データは、集合内の各々の個々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、低周波数補償は、集合内の各々の個々の低周波数帯域に選択的に適用される(又は適用されない)。他の実施例では補償制御データは、(一体で考慮される)集合内の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、低周波数補償は、(補償制御データの内容に応じて)集合内のすべての低周波数帯域に適用されるか、集合内の低周波数帯域のいずれにも適用されないかのいずれかである。
第2のクラスでの一部の実施例ではステップ(a)は、オーディオ・データに関してトーナリティ検出を遂行して、オーディオ・データの周波数帯域(必ずしも低周波数帯域でない)の少なくとも部分集合の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップを含み、オーディオ・データ値に対するマスキング値を決定するステップは、
(c)補償制御データにより指示されるような顕著なトーン性コンテンツを有するオーディオ・データの前記各々の周波数帯域に対して第1の様式でマスキング値補正処理を遂行し、補償制御データにより指示されるような顕著なトーン性コンテンツを欠くオーディオ・データの前記各々の周波数帯域に対して第2の様式でマスキング値補正処理を遂行するステップ、をさらに含む。
例えば、マスキング値補正処理はBABNDNORM処理であってよく、前記各々の周波数帯域は知覚帯域であってよく、ステップ(c)は、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して第1のスケーリング定数によってBABNDNORM処理を遂行し、顕著なトーン性コンテンツを欠く前記各々の周波数帯域に対して第2のスケーリング定数によってBABNDNORM処理を遂行するステップを含み得る。
別のクラスの実施例では本発明は、周波数領域オーディオ・データに応答して、オーディオ・データに関して適応型低周波数補償を遂行することによることを含めて、符号化されたオーディオ・データを生成するように構成されるオーディオ符号化器であって、
オーディオ・データに関してトーナリティ検出を遂行して、オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するように構成されるトーナリティ検出器(例えば、図2の要素15)と、
補償制御データに応答して、オーディオ・データの低周波数帯域の集合の各々の低周波数帯域への低周波数補償の適用を、適応的に動作可能にする(選択的に動作可能にする、又は効果的に動作不能にする)ように結合及び構成される(例えば、図2の要素4により実装される)低周波数補償制御段と、を含むオーディオ符号化器である。
トーナリティ検出器は、低周波数補償が、低周波数帯域の集合の各々の周波数帯域のオーディオ・データに適用されるべきであるかどうかを、(すなわち、低周波数帯域の集合の各々の周波数帯域の低周波数補償は、低周波数帯域の集合のオーディオ・データの符号化の間は、帯域は顕著なトーン性コンテンツを有するのでオンに切り替えられるべきであるか、それとも、帯域は顕著なトーン性コンテンツを欠くのでオフに切り替えられるべきであるかを指示する補償制御データを生成することにより)決定するように構成される。低周波数補償制御段は、補償制御データに応答して、低周波数帯域の集合の各々の帯域のオーディオ・データへの低周波数補償の適用を、適応的に動作可能にするように構成される。復号化器の変更を必要としない様式(すなわち、復号化器が、低周波数補償が符号化の間にいずれかの低周波数帯域に適用されたか否かを決定することなく(又はその適用されたか否かに関して通知されることなく)、符号化されたオーディオ・データの復号を遂行することを可能にする様式)においてである。
符号化されることになるオーディオ・データの周波数帯域が(低周波数補償が動作不能にされるべきである対象の)非トーン性信号を指示しているということを指示する補償制御データに応答して、低周波数補償制御段の好ましい実施例は、帯域のオーディオ・データを、その帯域のオーディオ・データの指数を人工的に修正することにより「再テンティング」する。再テンティングは、(例えば、帯域に対する修正されたオーディオ・データの修正された指数から、次のより低い周波数帯域内のオーディオ・データの指数を引いたものが、2、1、0、又は−1に等しくなければならないように)帯域に対する差分指数が−2に等しくなることが防止されるように、帯域に対する修正されたオーディオ・データを生成する。符号化器の典型的な実施例では、ローコンプ補償は帯域には適用されないことになるが、その理由は、帯域にローコンプ補償を適用するための判定基準(次のより低い周波数帯域に対するPSDに対しての、帯域に対する12dBのPSDの増大)が満たされないことになる(この判定基準は、帯域に対する修正されたオーディオ・データの指数から、次のより低い周波数帯域に対する指数を引いたものが、−2に等しくなることが防止されるならば満たされ得ない)からというものである。
本発明の別の態様は、符号化されたオーディオ・データを復号するための方法であって、符号化されたオーディオ・データを指示している信号を受信するステップであり、符号化されたオーディオ・データが、本発明の符号化方法の任意の実施例によってオーディオ・データを符号化することにより生成されている、受信するステップと、符号化されたオーディオ・データを復号して、オーディオ・データを指示している信号を生成するステップとを含む方法である。本発明の別の態様は、本発明の符号化方法の任意の実施例を遂行して、オーディオ・データに応答して、符号化されたオーディオ・データを生成するように構成される(例えば、プログラムされる)符号化器と、符号化されたオーディオ・データを復号して、オーディオ・データを復元するように構成される復号化器とを含むシステムである。
本発明の他の態様は、本発明の方法の任意の実施例を遂行するように構成される(例えば、プログラムされる)システム又はデバイス(例えば、符号化器又はプロセッサ)、及び、本発明の方法又は本発明の方法のステップの任意の実施例を実装するためのコードを記憶するコンピュータ可読媒体(例えばディスク)を含む。例えば本発明のシステムは、本発明の方法又は本発明の方法のステップの実施例を含む、データに関する種々の動作の任意のものを遂行するように、ソフトウェア若しくはファームウェアによってプログラムされ、及び/又は、他の方法で構成される、プログラマブル汎用プロセッサ、デジタル信号プロセッサ、又はマイクロプロセッサであり得る、又はそれらを含み得る。そのような汎用プロセッサは、入力デバイス、メモリ、及び、処理回路であり、アサートされるデータに応答して本発明の方法(又は本発明の方法のステップ)の実施例を実行するようにプログラム(及び/又は、他の方法で構成)された処理回路、を含むコンピュータ・システムであってよく、又は、そのコンピュータ・システムを含み得る。
従来の符号化システムのブロック図である。 本発明の方法の実施例を遂行するように構成される符号化システムのブロック図である。 周波数ビンの関数としての、ピッチ・パイプ(トーン性)信号を指示している周波数領域オーディオ・データの指数及びテンティングされた指数のグラフである。 周波数ビンの関数としての、拍手(非トーン性)信号を指示している周波数領域オーディオ・データの指数及びテンティングされた指数のグラフである。 帯域設定された周波数領域オーディオ・データの、帯域設定されたPSD(知覚エネルギー)値のグラフ(最上部の曲線)、オーディオ・データに従来のBABNDNORM処理を適用することにより生成される、スケーリングされた帯域設定されたPSD値のグラフ(最上部から2番目の曲線)、オーディオ・データをマスクする際の使用のために生成される励起関数のグラフ(最上部から3番目の曲線)、及び、励起関数に従来のBABNDNORM処理を適用することにより生成される、励起関数のスケーリングされたバージョンのグラフ(最下部の曲線)である。4つの曲線の各々は、知覚帯域(バーク周波数)尺度上において表されている。 オーディオ信号の周波数スペクトルのグラフ、オーディオ信号をマスクするためのデフォルトのマスキング曲線のグラフ(最下部から2番目の曲線)、及び、マスキング曲線に従来のBABNDNORM処理を適用することにより生成されるマスキング曲線のスケーリングされたバージョンのグラフ(最下部の曲線)である。 本発明の符号化方法の任意の実施例を実行して、オーディオ・データに応答して、符号化されたオーディオ・データを生成するように構成される符号化器と、符号化されたオーディオ・データを復号して、オーディオ・データを復元するように構成される復号化器とを含むシステムのブロック図である。
本発明の方法を実装するように構成されるシステムの実施例を、図2を参照して説明する。図2のシステムは、時間領域入力オーディオ・データ1に応答してAC−3(又は拡張AC−3)で符号化されたオーディオ・ビットストリーム9を生成するように構成される、AC−3(又は拡張AC−3)符号化器である。図2のシステムの要素2、4、6、7、8、10、及び11は、上記で説明した図1のシステムの同じように番号が付けられた要素と同一である。
分析フィルタ・バンク2は、時間領域入力オーディオ・データ1を周波数領域オーディオ・データ3に転換し、BFPE段7は、各々の周波数ビンに対する指数部及び仮数部を含む、データ3の各々の周波数成分の浮動小数点表現を生成する。次いで段7から出力される周波数領域オーディオ・データ(本明細書では周波数領域オーディオ・データ3と呼ばれる場合もある)は、量子化器6においてのその周波数領域オーディオ・データの仮数の量子化によることを含めて符号化される。フォーマッタ8は、量子化器6から出力される量子化された仮数データ、及び、段11から出力されるコーディングされた差分指数データに応答して、AC−3(又は拡張AC−3)で符号化されたビットストリーム9を生成するように構成される。量子化器6は、コントローラ4により生成される(マスキング・データを含む)制御データに基づいてビット割り当て及び量子化を遂行する。
コントローラ4は、オーディオ・データ3の低周波数帯域の集合の各々の低周波数帯域に関して、前記帯域に対する予備的なマスキング値(励起値)を補正することにより、低周波数補償を遂行するように構成される。帯域に対する、量子化器6に対してコントローラ4によりアサートされる補正されたマスキング・データは、前記帯域に対する補正されたマスキング値により決定される。
図2のシステムはAC−3(又は拡張AC−3)符号化器であるので、コントローラ4は、よく知られているバーク尺度の周波数帯域に近い、50個の不均一の知覚帯域の基準を基に周波数領域データを分析するための心理音響モデルを履行する。本発明の他の実施例は、別の帯域設定された基準を基に(すなわち、均一又は不均一の周波数帯域の任意の集合の基準を基に)周波数領域データを分析する(並びに/又は、低周波数補償を、及び随意には別のマスキング値補正処理もまた履行する)ための心理音響モデルを用いる。
図2の符号化器は、本発明の再テンティング段18及びトーナリティ検出器15を含む。図2のテンティング段10は、トーナリティ検出器15に対して、及び再テンティング段18に対して、テンティング段10が生成するテンティングされた指数をアサートするように結合及び構成される。再テンティング段18は、再テンティングされた指数を生成するように構成され、その再テンティングされた指数によって、(再テンティングされた指数に応答して動作する)コントローラ4は、低周波数補償が帯域に関して遂行されるべきであるということを指示する(検出器15により生成され、段18に対してアサートされる)補償制御データに応答してのみ、周波数帯域に関して低周波数補償を遂行する。低周波数補償がオーディオ・データ3の周波数帯域に関して遂行されるべきでないということを指示する(検出器15により生成され、段18に対してアサートされる)補償制御データに応答して、コントローラ4は帯域に関して低周波数補償を遂行せず、代わりに、帯域に対する、コントローラ4により量子化器6に対してアサートされるマスキング・データは、前記帯域に対する補正されない予備的なマスキング値(励起値)により決定される。
周波数領域データ3の各々の周波数帯域に対する、量子化器6に対してコントローラ4によりアサートされるマスキング・データは、帯域に対するマスキング曲線値を含む。これらのマスキング曲線値は、各々の周波数帯域での人間の耳によりマスクされる信号の量を表す。図1のシステムにおけるように、図2の量子化器6は、この情報を使用して、利用可能な数のデータ・ビットをどのように最良に使用して、入力オーディオ信号の各々の周波数帯域の成分を表すかを確定する。
より具体的にはコントローラ4は、段18からそのコントローラに対してアサートされる再テンティングされた指数に応答してPSD値を計算するように、PSD値に応答して、帯域設定されたPSD値を計算するように、帯域設定されたPSD値に応答してマスキング曲線を計算するように、及び、マスキング曲線に応答して仮数ビット割り当てデータ(図2で指示する「マスキング・データ」)を決定するように構成される。
図2のオーディオ符号化器は、オーディオ・データ3に関して適応型低周波数補償を遂行することによることを含めて、符号化されたオーディオ・データ9を生成するように構成される。そのような適応型低周波数補償を履行するために、図2のシステムは、示すように結合されるトーナリティ検出段(トーナリティ検出器)15及び適応型再テンティング段18を含み、コントローラ4は、段18により生成される再テンティングされた指数に応答して低周波数補償を遂行する。テンティング段10は、周波数領域オーディオ・データ3の未加工の指数を受信するように結合され、下記でより詳細に説明する様式で、オーディオ・データ3の低周波数帯域の上記で述べた集合の各々の低周波数帯域に対するテンティングされた指数を決定するように構成される。
トーナリティ検出器15は、オーディオ・データ3の低周波数帯域の集合を通しての(低周波数から高周波数までの)走査の間に、オーディオ・データ3の元の(未加工の)指数、及び、これらの元の指数に応答して段10により生成されるテンティングされた指数を受信するように結合される。
段10は、データ3の連続的な周波数帯域に対する周波数領域オーディオ・データ3の指数間の差を決定するように、及び、各々のそのような指数のテンティングされたバージョン(テンティングされた指数)を生成するように構成される。テンティングは、テンティングされた指数が走査の間に各々の周波数ビンに対して生成されるように、(適応型低周波数補償が遂行されることになる低周波数帯域の集合の周波数帯域を含む)周波数領域データ3を通しての(低周波数から高周波数までの)走査の間に、上記で述べた従来の様式で遂行される。段10は、各々の帯域に対する差分指数(各々の「次の」ビン「N+1」の指数から、現在の(より低い周波数)ビン「N」の指数を引いたもの)を決定する。ビン「N」に対する差分指数が2より大きい(すなわち、exp(N+1)−exp(N)>2)ならば、段10は、tentexp(N+1)−exp(N)=2を充足させる最小の指数(tentexp(N+1))であるようにビン「N+1」に対するテンティングされた指数を決定する。この場合、ビンNに対するテンティングされた指数(tentexp(N))は、ビンNに対する元の指数に等しく(tentexp(N)=exp(N))、段10は、ビンNに対する差分のテンティングされた指数値2を段18に対してアサートする。ビン「N」に対する差分指数が−2より小さい(すなわち、exp(N+1)−exp(N)<−2)ならば、段10は、exp(N+1)−tentexp(N)=−2を充足させる最大の指数(tentexp(N))であるようにビン「N」に対するテンティングされた指数を決定する。この場合、ビンN+1に対するテンティングされた指数(tentexp(N+1))は、ビンN+1に対する元の指数に等しく(tentexp(N+1)=exp(N+1))、段10は、ビンNに対する差分のテンティングされた指数値−2を段18に対してアサートする。
トーナリティ検出器15は、オーディオ・データ3の低周波数帯域の集合を通しての(低周波数から高周波数までの)走査の間に、オーディオ・データ3を構成する元の指数、及び、これらの元の指数に応答して段10により生成されるテンティングされた指数に関してトーナリティ検出を遂行するように構成される。トーン性信号の(周波数の関数としての)PSD値の急峻な上昇及び下降の特性は、そのような信号は、非トーン性信号(例えば、拍手を指示している非トーン性信号)であるよりテンティングされることが多いということを示唆する。
例えば図3は、周波数ビンの関数としての、トーン性信号(ピッチ・パイプ信号)を指示している周波数領域オーディオ・データの指数及びテンティングされた指数のグラフである。図4は、やはり周波数ビンの関数としてプロットされている、非トーン性(拍手)信号を指示している周波数領域オーディオ・データの指数及びテンティングされた指数のグラフである。低周波数補償が典型的には遂行される、より低い周波数では、(図3及び図4の)各々のビンは単一の周波数帯域に対応する。図3の精査から明白であるように、トーン性信号の指数と(例えば、段10により指数から生成される)対応するテンティングされた指数との間に非ゼロの差が存在する、低周波数範囲内の多くの周波数帯域(例えばビン7、11、14、15、20、及び23)が存在する。図4の精査から明白であるように、非トーン性信号の指数と、対応するテンティングされた指数との間に非ゼロの差が存在する、低周波数範囲内の周波数帯域はより少ない(ビン34のみ)。
したがってトーナリティ検出器15の典型的な実施例は、周波数領域オーディオ・データの集合の指数と、対応するテンティングされた指数との間の平均二乗差分量(又は、そのようなデータの指数と、対応するテンティングされた指数との間の差を指示している別の分量)を決定する。例えば、第1の(最も低い)周波数帯域から帯域N+1まで通しての(データ3の低周波数帯域の記した集合の)低周波数帯域を通しての(低周波数から高周波数までの)走査の間に、検出器15の実装形態は、第1の帯域から帯域N+1までの範囲内の各々の帯域に対する元の指数とテンティングされた指数との間の二乗差の平均となるように、帯域N+1に対するトーナリティ分量を生成する。
そのような平均二乗差分量は、最も低い周波数帯域から現在の周波数帯域(帯域N+1)まで通しての周波数範囲内のオーディオ信号のトーナリティ(顕著なトーン性コンテンツの存在又は欠乏)を指示している補償制御データを決定するために用いられる。(最も低い周波数帯域から現在の周波数帯域まで通しての)各々の周波数範囲に対して、(周波数範囲に対する)平均二乗差分量が、具体的なあらかじめ決定されたしきい値(例えば、実験的に決定されたしきい値)より小さな値を有するならば、検出器15は、非トーン性オーディオ信号を指示するために、第1の値を伴う補償制御データ(例えば、0に等しいバイナリ・ビット)を(段18に対して)アサートする。このことが、現在の帯域に対する段10によりアサートされた差分指数値の段18による再テンティングをトリガし、そのことにより、コントローラ4による、復号化器と共用可能なローコンプの切り替えオフをトリガする(すなわちコントローラ4が、現在の帯域に関して従来の低周波数補償を適用することを防止する)。下記で説明する例では、しきい値は0.05であるように採用される。
(最も低い周波数帯域から現在の周波数帯域まで通しての)各々の周波数範囲に対して、(周波数範囲に対する)平均二乗差分量がしきい値以上の値を有するならば、検出器15は、トーン性オーディオ信号を指示するために、第2の値を伴う補償制御データ(例えば、1に等しいバイナリ・ビット)を(段18に対して)アサートする。このことによって、現在の帯域に対する段10によりアサートされた差分指数値の段18による再テンティングが動作不能になり、そのことにより、(段10の出力でアサートされる)この値が、変更されずに段18を通ってコントローラ4に渡ることが可能になり、したがってこのことが、コントローラ4による、復号化器と共用可能なローコンプの切り替えオンをトリガする(すなわちコントローラ4が、現在の帯域に関して従来の低周波数補償を適用することを可能にする)。
代替的な実施例では検出器15は、補償制御データを別の様式で、ただし補償制御データが、適応型低周波数補償が遂行されることになる、データ3の各々の周波数帯域内の、又はデータ3の各々の低周波数帯域内の、又はデータ3の低周波数帯域の集合(又は部分集合)を含む周波数範囲内の、データ3により決定されるオーディオ信号のトーナリティ(又は非トーナリティ)を指示しているように生成する。例えば一部の実施例では検出器15は、(具体的に、BFPE段7の出力の指数、及び段10から出力されるテンティングされた指数に関してではなく)BFPE段7の出力に関して動作する専用のトーナリティ検出器として実装される。
別の例に関して、一部の実施例では検出器15(又は、実施例の任意のものにおいて用いられる別のトーナリティ検出器)は、オーディオ・データの低周波数帯域の集合が拍手を表すかどうか(例えば、集合の各々の低周波数帯域が拍手を表すかどうか)を指示している補償制御データを生成するように構成される拍手検出器である。本明細書のコンテクスト(context)において「拍手」は、拍手のみ、又は、拍手及び/若しくは群衆歓呼のいずれかを意味する場合がある、広範な意味で使用される。低周波数補償は、補償制御データにより指示されるような、拍手を指示している集合内の各々の周波数帯域に対して、又は、集合内の帯域の少なくとも1つが拍手を指示している場合に集合内のすべての帯域に関して、動作不能にされる(オフに切り替えられる)ことになる。低周波数補償は、補償制御データにより指示されるような拍手を指示していない集合内の各々の周波数帯域内のオーディオ・データに関して遂行されることになる。
非トーン性オーディオ信号を指示する検出器15からの補償制御データに応答して(例えば、データ3により決定されるオーディオ信号が、データ3の最も低い周波数帯域から現在の帯域(帯域N)まで通しての低周波数範囲内で非トーン性信号であることを指示するもの)、段18は、現在の帯域のテンティングされた指数に関して再テンティングを遂行する。具体的には、現在の帯域に対する差分のテンティングされた指数(帯域N+1のテンティングされた指数から、帯域Nのテンティングされた指数を引いたものが−2に等しいならば(このことは、前の帯域Nから現在の(より高い周波数)帯域N+1までのPSDの急峻な増大(12dB)を指示している、段18は、帯域「N+1」に対する差分の再テンティングされた指数を−1に等しくなるように決定する。したがって、非トーン性オーディオ信号を指示する(例えば、データ3により決定されるオーディオ信号が、データ3の最も低い周波数帯域からデータ3の現在の帯域(帯域N)まで通しての低周波数範囲内で非トーン性信号であるということを指示する)、検出器15からの補償制御データに応答して、コントローラ4は、オーディオ・データ3の現在の周波数帯域(N)に関して低周波数補償を遂行しない。
トーン性オーディオ信号を指示する検出器15からの補償制御データに応答して(例えば、データ3により決定されるオーディオ信号が、データ3の最も低い周波数帯域からデータ3の現在の帯域(帯域N)まで通しての低周波数範囲内におけるトーン性信号であるということを指示するもの)、段18は、現在の帯域に対するテンティングされた指数差を(テンティングされた指数差を変更することなく)コントローラ4に通しで渡し、コントローラ4は、オーディオ・データ3の現在の周波数帯域(N)について低周波数補償を遂行することが可能となる。具体的には、コントローラ4は、帯域に対する、段10から出力され(及び、段18を介してコントローラ4に通しで渡される)テンティングされた指数差値が−2に等しいならば、オーディオ・データ3の現在の周波数帯域(N)について低周波数補償を遂行する。
より一般的には、本発明の典型的な実施例のトーナリティ検出器は、低周波数補償が、低周波数帯域の集合の各々の周波数帯域のオーディオ・データに適用されるべきであるかどうかを、(すなわち、低周波数帯域の集合の各々の周波数帯域の低周波数補償は、低周波数帯域の集合のオーディオ・データの符号化の間は、帯域は顕著なトーン性コンテンツを有するのでオンに切り替えられるべきであるか、それとも、帯域は顕著なトーン性コンテンツを欠くのでオフに切り替えられるべきであるかを指示する補償制御データを生成することにより)決定するように構成される。本発明の典型的な実施例の低周波数補償制御段は、補償制御データに応答して、復号化器の変更を必要としない様式で、低周波数帯域の集合の各々の帯域のオーディオ・データへの低周波数補償の適用を、適応的に動作可能にするように構成される(すなわち、復号化器が、低周波数補償が符号化の間にいずれかの低周波数帯域に適用されたか否かを決定することなく(又はその適用されたか否かに関して通知されることなく)、符号化されたオーディオ・データの復号を遂行することを可能にする様式においてである)。
典型的な実施例では、符号化されることになるオーディオ・データの周波数帯域が(低周波数補償が動作不能にされるべきである対象の)非トーン性信号を指示しているということを指示する補償制御データに応答して、低周波数補償制御段の好ましい実施例は、帯域のテンティングされたオーディオ・データ(例えば、差分のテンティングされた指数)を、テンティングされたデータにより決定される関連性のある差分指数を人工的に修正することにより「再テンティング」する。再テンティングは、(例えば、帯域に対する修正されたオーディオ・データの修正された指数から、次のより低い周波数帯域内のオーディオ・データの指数を引いたものが、2、1、0、又は−1に等しくなければならないように)帯域に対する修正された(再テンティングされた)差分指数が−2に等しくなることが防止されるように、帯域に対する修正されたオーディオ・データを生成する。本発明の符号化器の典型的な実施例では、ローコンプ補償は帯域には適用されないことになるが、その理由は、帯域にローコンプ補償を適用するための判定基準(次のより低い周波数帯域に対するPSDに対しての、帯域に対する12dBのPSDの増大)が満たされないことになる(この判定基準は、帯域に対する修正されたオーディオ・データの指数から、次のより低い周波数帯域に対する指数を引いたものが、−2に等しくなることが防止されるので満たされ得ない)からというものである。
低周波数補償は、(近接する低周波数帯域に対する)差分指数が決して−2に等しくならないように、(すなわち、より低い周波数帯域から、より高い周波数帯域までの探査の間の、12dBのPSDの増大を回避するように、)したがってローコンプ補償の適用を回避するように、低周波数帯域に対する指数を人工的に修正する(「再テンティング」する)ことにより、復号化器の変更なしに(本発明の典型的な実施例によって)オフに切り替えられ得る。本発明のトーナリティ検出器が非トーン性信号を指示するとき、低周波数帯域に対するテンティングされた指数は、そのような効果のために再テンティングされる。このことは、仮数値を量子化するためのマスキング・データ(信号−マスク比)を生成するために用いられる心理音響モデルに対する変更を必要とせず、したがって、従来の復号化器により復号され得る符号化されたデータを生成する。より具体的には、帯域「N+1」が次の帯域であり、現在の帯域(「N」)が次の帯域より低い周波数を有する、低周波数帯域を通しての探査の間に、差分指数(帯域N+1に対する指数から、帯域Nに対する指数を引いたもの)が−2に等しいと予備的に決定されるならば、修正された指数値の差分指数が−1に等しくなる(すなわち、帯域N+1に対する修正された指数から、帯域Nに対する指数を引いたものが−1に等しくなる、又は、帯域N+1に対する指数から、帯域Nに対する修正された指数を引いたものが−1に等しくなる)ように、帯域の1つの指数が変更される(「再テンティング」される)。好ましくは、帯域N+1に対する指数から、帯域Nに対する指数を引いたものが−2に等しいならば、この差は、帯域N+1に対する指数から、帯域Nに対する修正された指数を引いたものが−1に等しくなるように、帯域N(現在の帯域)に対する指数を減少する(「再テンティング」する)ことにより−1に増大される。再テンティングの後者の履行が典型的には好ましく、その理由は一般的には、指数値を増大することは、対応する仮数が最大限度で正規化される可能性があるという想定が存在するので望ましくないからというものである。最大限度で正規化された仮数に対応する指数値を増大することは、結果として、仮数の限度を超えた正規化又は切り落としをもたらすことになり、このことは望ましくない。したがって、帯域N+1に対する指数から、帯域Nに対する指数を引いたものが−2に等しいならば、この差を−1に増大するためには、(帯域N+1に対する指数を1だけ増大することではなく)帯域Nに対する指数を1だけ減少することが典型的には好ましい。
本発明のトーナリティ検出器がトーン性信号を指示するとき、入力オーディオ周波数成分の指数は再テンティングされず、低周波数補償は、トーン性信号に従来の様式で(すなわち、トーン性信号を指示している従来と同様にテンティングされた値に)適用される。
本発明者らは、従来のE−AC−3符号化器の性能を、(図2を参照して説明したタイプの適応型ローコンプ補償を履行する)E−AC−3符号化器の修正されたバージョンの性能と比較した試聴テストを遂行した。テストは、テストされた拍手信号に対してだけでなく、一部の非拍手信号に対しても、後者の(修正された)符号化器の有益性を示した。より具体的には、192kb/sで、トーナリティ検出器しきい値が0.05に等しい(すなわちトーナリティ検出器が、周波数領域オーディオの指数とテンティングされた指数との間の平均二乗差分量が0.05のしきい値より小さな値を有するとき、(符号化されることになる周波数領域オーディオ・データの指数の再テンティングにより)ローコンプ補償がオフに切り替えられるべきである対象の非トーン性信号を指示する制御データを生成するように構成される)状態で、ローコンプ補償がオフに切り替えられた対象のブロックの平均パーセンテージは、ピッチ・パイプ(長期間の、高度にトーン性の、低周波数)入力オーディオ、及び拍手(高度に非トーン性の、低周波数)入力オーディオに対してそれぞれ、0.5%及び80%であった。
記したように、トーン性信号のPSDの急峻な上昇及び下降の特性は、そのような信号は、非トーン性信号よりテンティングされることが多いということを示唆し、したがって指数とテンティングされた指数との間の平均二乗差は、トーナリティの指標として役立ち得る。(実験的に決定された)具体的なしきい値より小さなトーナリティ指標値は、ローコンプがオフに切り替えられるべきである対象の非トーン性信号を示唆し、その逆も同様である。典型的な実装形態ではトーナリティ指標値は、(結合が使用されているときに)現在の周波数帯域の周波数が結合開始周波数に達するまで、符号化されることになるオーディオ・データ(例えば、図2のデータ3)の周波数帯域を通しての走査の間に(例えば、図2の検出器15により)計算される。適応型ハイブリッド変換(AHT)が使用されているならば、本発明の適応型ローコンプ処理の動作は動作不能にされ得るものであり、従来の(非適応型)ローコンプ処理が代わりに遂行され得る。AHTは、上記で言及したDolby Digital/Dolby Digital Plus仕様書において、並びに、上記で言及した「Dolby Digital Audio Coding Standards」、Robert L. Andersen及びGrant A. Davidsonによる本の章、The Digital Signal Processing Handbook、第2版、Vijay K. Madisetti編集主任、CRC Press、2009年において説明されている。
実施例の第1のクラスでは本発明は、(量子化を受けることによることを含めて)符号化されることになる周波数領域オーディオ・データのオーディオ・データ値の仮数ビット割り当てを決定するための仮数ビット割り当て方法である。割り当て方法は、オーディオ・データの低周波数帯域の集合の各々の周波数帯域のオーディオ・データに関して適応型低周波数補償を遂行することによることを含めて、(例えば、図2のコントローラ4において)オーディオ・データ値に対するマスキング値を、マスキング値が、前記オーディオ・データに対する仮数ビット割り当てを決定する信号−マスク値を決定するために有用であるように決定するステップを含む。適応型低周波数補償は、
(a)(例えば、図2のトーナリティ検出器15において)オーディオ・データに関してトーナリティ検出を遂行して、低周波数帯域の集合内の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップと、
(b)補償制御データにより指示されるような顕著なトーン性コンテンツを有する低周波数帯域の集合内の各々の周波数帯域内のオーディオ・データに関して、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対する予備的なマスキング値を補正することによることを含めて、低周波数補償を遂行し、ただし、低周波数帯域の集合内のいずれの他の周波数帯域内のオーディオ・データに関しても、各々の前記他の周波数帯域に対するマスキング値が、補正されない予備的なマスキング値であるように、低周波数補償を遂行しないステップと、を含む。
第1のクラスでの一部の実施例ではステップ(a)は、オーディオ・データに関して(例えば、図2のトーナリティ検出器15において)トーナリティ検出を遂行して、オーディオ・データの周波数帯域の少なくとも部分集合の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップを含み、オーディオ・データ値に対するマスキング値を決定するステップは、
(c)補償制御データにより指示されるような顕著なトーン性コンテンツを有するオーディオ・データの前記各々の周波数帯域に対して、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して予備的なマスキング値を補正することによることを含めて、第1の様式でマスキング値補正処理を遂行し、補償制御データにより指示されるような顕著なトーン性コンテンツを欠くオーディオ・データの前記各々の周波数帯域に対して第2の様式でマスキング値補正処理を遂行するステップと、をさらに含む。
例えば、マスキング値補正処理はBABNDNORM処理であってよく、前記各々の周波数帯域は知覚帯域であってよく、ステップ(c)は、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して第1のスケーリング定数によってBABNDNORM処理を遂行し、顕著なトーン性コンテンツを欠く前記各々の周波数帯域に対して第2のスケーリング定数によってBABNDNORM処理を遂行するステップを含み得る。
本発明の別の実施例は、そのような仮数割り当て方法の任意の実施例を含む符号化方法である。
実施例の第2のクラスでは本発明は、(トーン性低周波数コンテンツを伴う信号、及び非トーン性低周波数コンテンツを伴う信号の両方を含む)すべての入力オーディオ信号に低周波数補償を適用する、又は、いずれの入力オーディオ信号にも低周波数補償を適用しない、従来の符号化方法の限界を克服するオーディオ符号化方法である。これらの実施例は、顕著な低周波数トーン性成分を有するオーディオ信号の符号化の間にではあるが、顕著な低周波数トーン性成分を有さないオーディオ信号(例えば、低周波数非トーン性コンテンツを有するが、顕著なトーン性低周波数コンテンツを有さない、拍手又は他のオーディオ信号)の符号化の間にではなく、低周波数補償を選択的に(適応的に)適用する。適応型低周波数補償は、復号化器が、低周波数補償が符号化の間に適用されたか否かを決定することなく(又はその適用されたか否かに関して通知されることなく)、符号化されたオーディオの復号を遂行することを可能にする様式で遂行される。
第2のクラスでの典型的な実施例は、
(a)(例えば、図2のトーナリティ検出器15において)周波数領域オーディオ・データに関してトーナリティ検出を遂行して、オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップと、
(b)(例えば、図2のコントローラ4において)低周波数補償を遂行して、補償制御データにより指示されるような顕著なトーン性コンテンツを有する各々の前記低周波数帯域内のオーディオ・データに対する補正されたマスキング値を生成し、(例えば、図2のコントローラ4において)低周波数補償を遂行することなく、集合内の各々の他の低周波数帯域内のオーディオ・データに対するマスキング値を生成するステップと
を含むオーディオ符号化方法である。
第2のクラスでの一部の実施例では、オーディオ符号化方法はAC−3又は拡張AC−3符号化方法である。これらの実施例では、低周波数補償は好ましくは、ローコンプが当初設計された対象の入力オーディオ・データの周波数帯域(すなわち、顕著な、長期間定常の(「トーン性」)、低周波数コンテンツを指示している周波数帯域)に対して遂行され(すなわち、オンであり、又は動作可能にされ)、そうでない場合は遂行されない(すなわち、オフである、又は効果的に動作不能にされる)。これらの実施例では、低周波数補償はオーディオ・データの周波数帯域に関して遂行されるべきではないということを指示する補償制御データ(例えば、帯域は非トーン性オーディオコンテンツを含むが、顕著なトーン性コンテンツを含まないということを指示する補償制御データ)に応答して、ステップ(b)は好ましくは、前記帯域内のオーディオ・データを、帯域に対する修正されたオーディオ・データを生成するように「再テンティング」するステップであって、帯域に対する前記修正されたオーディオ・データが、修正された指数を含む、「再テンティング」するステップを含む。再テンティングするステップは、(例えば、帯域に対する修正されたオーディオ・データの修正された指数から、次のより低い周波数帯域内のオーディオ・データの指数を引いたものが、2、1、0、又は−1に等しくなければならないように)帯域に対する差分指数が−2に等しくなることが防止されるように、帯域に対する修正されたオーディオ・データを生成する。したがって、ローコンプ補償は帯域には適用されないことになるが、その理由は、帯域にローコンプ補償を適用するための判定基準(次のより低い周波数帯域に対するPSDに対しての、帯域に対する12dBのPSDの増大)が満たされないことになる(この判定基準は、帯域に対する修正された(「再テンティング」された)オーディオ・データの指数から、次のより低い周波数帯域に対する指数を引いたものが、−2に等しくなることが防止されるならば満たされ得ない)からというものである。
第2のクラスでの一部の実施例ではステップ(a)は、オーディオ・データに関して(例えば、図2のトーナリティ検出器15において)トーナリティ検出を遂行して、オーディオ・データの周波数帯域の少なくとも部分集合の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップを含み、オーディオ・データ値に対するマスキング値を決定するステップは、
(c)補償制御データにより指示されるような顕著なトーン性コンテンツを有するオーディオ・データの前記各々の周波数帯域に対して第1の様式で(例えば、図2のコントローラ4において)マスキング値補正処理を遂行し、補償制御データにより指示されるような顕著なトーン性コンテンツを欠くオーディオ・データの前記各々の周波数帯域に対して第2の様式でマスキング値補正処理を遂行するステップ
をさらに含む。
例えば、マスキング値補正処理はBABNDNORM処理であってよく、前記各々の周波数帯域は知覚帯域であってよく、ステップ(c)は、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して第1のスケーリング定数によってBABNDNORM処理を遂行し、顕著なトーン性コンテンツを欠く前記各々の周波数帯域に対して第2のスケーリング定数によってBABNDNORM処理を遂行するステップを含み得る。
記したように、本発明の符号化方法(及び仮数ビット割り当て方法)の一部の実施例は、本発明の補償制御データを使用して、符号化/復号化のBABNDNORM態様を修正する。
あるクラスの実施例では本発明の符号化方法は、以下のように、本発明の補償制御データを使用して、符号化/復号化のBABNDNORM態様を修正する。従来のBABNDNORM及び本発明の適応型低周波数補償の両方の方法は、同様の目的、すなわち、より低い周波数を犠牲にして、より高い周波数に向けてコーディング・ビットを再配分することを有する。しかし従来のBABNDNORMは、復号化器にデルタを送信する追加的な代価を伴う。
BABNDNORM及び本発明の適応型低周波数補償の両方の最適な使用法のために、符号化器は、帯域に対する適応型ローコンプ確定に基づいて知覚帯域に対するBABNDNORMスケーリング定数を調整するように構成される。例えば図2のシステムの実装形態では、帯域に対するトーナリティ検出器15により生成される補償制御データが、低周波数補償が動作不能(オフ)にされるべきであることを指示するならば、コントローラ4のマスキング・データ生成段は、マスキングしきい値がより小さな量によって、より低くされるように、(補償制御データに応答して)BABNDNORMのスケーリング定数を選定する。帯域に対するトーナリティ検出器15により生成される補償制御データが、低周波数補償が動作可能(オン)にされるべきであることを指示するならば、マスキング・データ生成段は、マスキングしきい値がより大きな量によって、より低くされるように、(補償制御データに応答して)BABNDNORMのスケーリング定数を選定する。
本発明の方法の一部の実施例では、トーナリティ検出ステップが、ローコンプが従来と同様に適用されることになる集合内のいずれかの低周波数帯域に対する(又は、一体で考慮されるすべての低周波数帯域に対する)非トーン性コンテンツを指示するとき、ローコンプ補償は、以下の意味で「適用されない」(又はオフに切り替えられる、又は効果的に動作不能にされる)。集合内の少なくとも1つの低周波数帯域に対する非トーン性コンテンツを指示する本発明のトーナリティ検出ステップに応答して、集合内のすべての帯域に対する励起値からの非ゼロのローコンプ・パラメータの減算が、(例えば直ちに)終結する。この点でローコンプは、(周波数領域オーディオ・データの次の集合の帯域を通しての新しい走査の開始まで)何らかのマスク調整を行うことが防止される。
上記のように、本発明の方法の一部の実施例では補償制御データは、集合内の各々の個々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、低周波数補償は、集合内の各々の個々の低周波数帯域に選択的に適用される(又は適用されない)。本発明の方法の他の実施例では補償制御データは、(一体で考慮される)集合内の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、低周波数補償は、(補償制御データの内容に応じて)集合内のすべての低周波数帯域に適用されるか、集合内の低周波数帯域のいずれにも適用されないかのいずれかである。1つのクラスの実施例は、低周波数区域全体に対してローコンプを動作可能にすべきか、それとも動作不能にすべきかに関するバイナリ(広帯域)確定を履行する。このクラスでの一部の実施例では、トーナリティ検出が、ローコンプが動作不能にされるべきであることを指示するならば、再テンティングが、ローコンプ・パラメータが常に0であるように、低周波数ローコンプ区域から値−2のすべての差分指数を除去することになる。これに対して本発明の方法の他の実施例は、ローコンプが、低周波数区域全体の一部の周波数区域に対して動作状態のままであることが可能にされるが、他の周波数区域では動作不能にされるような、より細かい粒度のトーナリティ確定を履行する。
本発明の別の態様は、本発明の符号化方法の任意の実施例を遂行して、オーディオ・データに応答して、符号化されたオーディオ・データを生成するように構成される符号化器と、符号化されたオーディオ・データを復号して、オーディオ・データを復元するように構成される復号化器とを含むシステムである。図7のシステムは、そのようなシステムの例である。図7のシステムは、本発明の符号化方法の任意の実施例を遂行して、オーディオ・データに応答して、符号化されたオーディオ・データを生成するように構成される(例えば、プログラムされる)符号化器90と、給送サブシステム91と、復号化器92とを含む。給送サブシステム91は、符号化器90により生成される符号化されたオーディオ・データを記憶するように、及び/又は、符号化されたオーディオ・データを指示している信号を送信するように構成される。復号化器92は、(例えば、サブシステム91内の記憶域から符号化されたオーディオ・データを読み出すこと若しくは索出すること、又は、サブシステム91により送信されている符号化されたオーディオ・データを指示している信号を受信することにより)サブシステム91から符号化されたオーディオ・データを受信するように、及び、符号化されたオーディオ・データを復号して、オーディオ・データを復元するように(並びに典型的にはさらに、オーディオ・データを指示している信号を生成及び出力するように)、結合及び構成される(例えば、プログラムされる)。
本発明の別の態様は、符号化されたオーディオ・データを復号するための方法(例えば、図7の復号化器92により遂行される方法)であって、符号化されたオーディオ・データを指示している信号を受信するステップであり、符号化されたオーディオ・データが、本発明の符号化方法の任意の実施例によってオーディオ・データを符号化することにより生成されている、受信するステップと、符号化されたオーディオ・データを復号して、オーディオ・データを指示している信号を生成するステップとを含む方法である。
本発明を、ハードウェア、ファームウェア若しくはソフトウェア、又は両者の組み合わせ(例えば、プログラマブル・ロジック・アレイとして)の形で実装することが可能である。別段の指定がない限り、本発明の部分として含まれるアルゴリズム又は処理は、任意の特定のコンピュータ又は他の装置に本質的に関係付けられたものではない。特に、様々な汎用機械を、本明細書での教示によって記述されるプログラムとともに使用することが可能であり、又は、より専用化された装置(例えば集積回路)を構築して、要求される方法ステップを遂行することがより好都合である場合がある。したがって本発明を、少なくとも1つのプロセッサ、(揮発性及び不揮発性の、メモリ及び/又は記憶要素を含む)少なくとも1つのデータ記憶システム、少なくとも1つの入力デバイス又はポート、及び、少なくとも1つの出力デバイス又はポートを各々が備える、1つ又は複数のプログラマブル・コンピュータ・システム(例えば、図2の符号化器を実装するコンピュータ・システム)上で実行する、1つ又は複数のコンピュータ・プログラムの形で実装することが可能である。プログラム・コードは、本明細書で説明した機能を遂行し、出力情報を生成するために、入力データに適用される。出力情報は、知られている方式で、1つ又は複数の出力デバイスに付与される。
各々のそのようなプログラムを、コンピュータ・システムと通信するように、(機械語、アセンブリ言語、又は、高水準の手続き型、論理型、若しくはオブジェクト指向のプログラミング言語を含む)任意の所望のコンピュータ言語の形で実装することが可能である。任意の場合において言語は、コンパイル型又はインタプリタ型の言語であり得る。
例えば、コンピュータ・ソフトウェア命令シーケンスにより実装するとき、本発明の実施例の様々な機能及びステップを、適したデジタル信号処理ハードウェアにおいて実行されるマルチスレッド型ソフトウェア命令シーケンスにより実装することが可能であり、その場合には、実施例の様々なデバイス、ステップ、及び機能は、ソフトウェア命令の一部分に対応し得る。
各々のそのようなコンピュータ・プログラムは、好ましくは、汎用又は専用のプログラマブル・コンピュータにより可読な、記憶媒体又はデバイス(例えば、固体のメモリ若しくは媒体、又は、磁気若しくは光学の媒体)であって、その記憶媒体又はデバイスが、本明細書で説明した処理手順を遂行するためのコンピュータ・システムにより読み込まれるときに、コンピュータを環境設定し動作させるためのものである、記憶媒体又はデバイス上に記憶される、或いは、その記憶媒体又はデバイスにダウンロードされる。本発明のシステムを、コンピュータ・プログラムを伴って(すなわち、記憶して)構成されるコンピュータ可読記憶媒体として実装することもまた可能であり、その場合、そのように構成される記憶媒体によって、コンピュータ・システムは、具体的な、及び既定の様式で動作して、本明細書で説明した機能を遂行する。
本発明のいくつかの実施例を説明した。それでも、様々な修正を、本発明の趣旨及び範囲から逸脱することなく行うことが可能であることが理解されよう。本発明の多数の修正及び変形が、上記の教示に照らして可能である。添付の特許請求の範囲内で、本発明を、本明細書で具体的に説明したものとは別の方法で実践することが可能であるということを理解されたい。
上記の実施例形態につき付記を残しておく。
(付記1)
(a)周波数領域オーディオ・データに関してトーナリティ検出を遂行して、前記オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップと、
(b)低周波数補償を遂行して、前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する各々の前記低周波数帯域内の前記オーディオ・データに対する補正されたマスキング値を生成し、低周波数補償を遂行することなく、前記集合内の各々の他の低周波数帯域内の前記オーディオ・データに対するマスキング値を生成するステップと、を含む、
オーディオ符号化方法。
(付記2)
前記補償制御データが、前記集合の少なくとも1つの帯域が拍手を表すかどうかを指示しているものであり、ステップ(b)が、
低周波数補償を遂行することなく、前記補償制御データにより指示されるような拍手を表す前記集合の各々の低周波数帯域内の前記オーディオ・データに対して、マスキング値を生成するステップ、を含む、
付記1に記載の方法。
(付記3)
前記補償制御データが、前記集合の少なくとも1つの帯域が群衆雑音及び拍手の少なくとも1つを表すかどうかを指示しているものであり、ステップ(b)が、
低周波数補償を遂行することなく、前記補償制御データにより指示されるような拍手及び群衆雑音の少なくとも1つを表す前記集合の各々の低周波数帯域内の前記オーディオ・データに対して、マスキング値を生成するステップ、を含む、
付記1に記載の方法。
(付記4)
ステップ(b)が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く前記集合の各々の低周波数帯域内の前記オーディオ・データを、顕著なトーン性コンテンツを欠く少なくとも1つの前記低周波数帯域に対する修正された指数を含む修正されたオーディオ・データを生成するように再テンティングするステップ、を含む、
付記1に記載の方法。
(付記5)
再テンティングする前記ステップが、顕著なトーン性コンテンツを欠く少なくとも1つの前記低周波数帯域に対する前記修正された指数を、次のより高い周波数帯域内の前記オーディオ・データの指数から、前記修正された指数を引いたものが、値2、1、0、及び−1のうちの1つを有さなければならないように生成する、
付記4に記載の方法。
(付記6)
ステップ(a)が、前記オーディオ・データに関してトーナリティ検出を遂行して、前記オーディオ・データの前記周波数帯域の少なくとも部分集合内の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップを含み、前記方法が、
(c)前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する前記オーディオ・データの前記各々の周波数帯域に対して第1の様式でマスキング値補正処理を遂行し、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く前記オーディオ・データの前記各々の周波数帯域に対して第2の様式で前記マスキング値補正処理を遂行するステップ、をさらに含む、
付記1に記載の方法。
(付記7)
前記マスキング値補正処理がBABNDNORM処理であり、ステップ(c)が、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して第1のスケーリング定数によって前記BABNDNORM処理を遂行し、顕著なトーン性コンテンツを欠く前記各々の周波数帯域に対して第2のスケーリング定数によって前記BABNDNORM処理を遂行するステップ、を含む、
付記6に記載の方法。
(付記8)
前記周波数領域オーディオ・データが、前記集合の前記各々の低周波数帯域に対する指数値を含み、ステップ(a)が、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の差の分量を決定するステップ、を含む、
付記1に記載の方法。
(付記9)
前記周波数領域オーディオ・データが、前記集合の前記各々の低周波数帯域に対する指数値を含み、ステップ(a)が、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の平均二乗差の分量を決定するステップ、を含む、
付記1に記載の方法。
(付記10)
前記補償制御データが、前記集合内の各々の個々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、ステップ(b)において低周波数補償が、前記集合内の各々の個々の低周波数帯域に関して選択的に遂行される、又は遂行されない、
付記1に記載の方法。
(付記11)
前記補償制御データが、一体で考慮される前記集合内の前記低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、低周波数補償が、ステップ(b)において、前記補償制御データが、一体で考慮される前記集合内の前記低周波数帯域が顕著なトーン性コンテンツを有するということを指示するとき、前記集合内のすべての前記低周波数帯域に関して遂行される、
付記1に記載の方法。
(付記12)
量子化を受けることによることを含めて、符号化されることになる周波数領域オーディオ・データのオーディオ・データ値の仮数ビット割り当てを決定するための方法であって、前記オーディオ・データの低周波数帯域の集合の各々の周波数帯域の前記オーディオ・データに関して適応型低周波数補償を遂行することによることを含めて、前記オーディオ・データ値に対するマスキング値を、前記マスキング値が、前記オーディオ・データに対する前記仮数ビット割り当てを決定する信号−マスク値を決定するために有用であるように決定するステップを含み、前記適応型低周波数補償が、
(a)前記オーディオ・データに関してトーナリティ検出を遂行して、低周波数帯域の前記集合内の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップと、
(b)前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する低周波数帯域の前記集合内の各々の周波数帯域内の前記オーディオ・データに関して、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対する予備的なマスキング値を補正することによることを含めて、低周波数補償を遂行し、ただし、低周波数帯域の前記集合内のいずれの他の周波数帯域内の前記オーディオ・データに関しても、各々の前記他の周波数帯域に対する前記マスキング値が、補正されない予備的なマスキング値であるように、低周波数補償を遂行しないステップと、
を含む、方法。
(付記13)
前記補償制御データが、前記集合の少なくとも1つの帯域が拍手を表すかどうかを指示しているものであり、ステップ(b)が、
前記補償制御データにより指示されるような拍手を表す前記集合の各々の低周波数帯域内の前記オーディオ・データに関して、低周波数補償の遂行を動作不能にするステップ、
を含む、
付記12に記載の方法。
(付記14)
前記補償制御データが、前記集合の少なくとも1つの帯域が群衆雑音及び拍手の少なくとも1つを表すかどうかを指示しているものであり、ステップ(b)が、
前記補償制御データにより指示されるような拍手及び群衆雑音の少なくとも1つを表す前記集合の各々の低周波数帯域内の前記オーディオ・データに関して、低周波数補償の遂行を動作不能にするステップ、を含む、
付記12に記載の方法。
(付記15)
ステップ(b)が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く前記集合の各々の周波数帯域内の前記オーディオ・データを、顕著なトーン性コンテンツを欠く少なくとも1つの前記周波数帯域に対する修正された指数を含む修正されたオーディオ・データを生成するように再テンティングするステップ、を含む、
付記12に記載の方法。
(付記16)
再テンティングする前記ステップが、顕著なトーン性コンテンツを欠く少なくとも1つの前記周波数帯域に対する前記修正された指数を、次のより高い周波数帯域内の前記オーディオ・データの指数から、前記修正された指数を引いたものが、値2、1、0、及び−1のうちの1つを有さなければならないように生成する、
付記15に記載の方法。
(付記17)
ステップ(a)が、前記オーディオ・データに関してトーナリティ検出を遂行して、前記オーディオ・データの前記周波数帯域の少なくとも部分集合内の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップを含み、前記オーディオ・データ値に対するマスキング値を決定する前記ステップが、
(c)前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する前記オーディオ・データの前記各々の周波数帯域に対して、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して予備的なマスキング値を補正することによることを含めて、第1の様式でマスキング値補正処理を遂行し、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く前記オーディオ・データの前記各々の周波数帯域に対して第2の様式で前記マスキング値補正処理を遂行するステップ、をさらに含む、
付記12に記載の方法。
(付記18)
前記マスキング値補正処理がBABNDNORM処理であり、ステップ(c)が、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して第1のスケーリング定数によって前記BABNDNORM処理を遂行し、顕著なトーン性コンテンツを欠く前記各々の周波数帯域に対して第2のスケーリング定数によって前記BABNDNORM処理を遂行するステップ、を含む、
付記17に記載の方法。
(付記19)
前記補償制御データが、前記集合内の各々の個々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、ステップ(b)において低周波数補償が、前記集合内の各々の個々の周波数帯域に関して選択的に遂行される、又は遂行されない、
付記12に記載の方法。
(付記20)
前記補償制御データが、一体で考慮される前記集合内の前記低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、低周波数補償が、ステップ(b)において、前記補償制御データが、一体で考慮される前記集合内の前記周波数帯域が顕著なトーン性コンテンツを有するということを指示するとき、前記集合内のすべての前記周波数帯域に関して遂行される、
付記12に記載の方法。
(付記21)
周波数領域オーディオ・データに応答して、前記オーディオ・データに関して適応型低周波数補償を遂行することによることを含めて、符号化されたオーディオ・データを生成するように構成されるオーディオ符号化器であって、
前記オーディオ・データに関してトーナリティ検出を遂行して、前記オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するように構成されるトーナリティ検出器と、
前記補償制御データに応答して、前記オーディオ・データの低周波数帯域の前記集合の各々の低周波数帯域への低周波数補償の適用を、適応的に動作可能にするように結合及び構成される低周波数補償制御段と、
を含む、オーディオ符号化器。
(付記22)
前記トーナリティ検出器が拍手検出器であり、前記補償制御データが、前記集合の少なくとも1つの帯域が拍手を表すかどうかを指示している、
付記21に記載の符号化器。
(付記23)
前記補償制御データが、前記集合の少なくとも1つの帯域が群衆雑音及び拍手の少なくとも1つを表すかどうかを指示している、
付記21に記載の符号化器。
(付記24)
前記低周波数補償制御段が、復号化器が、低周波数補償が前記符号化の間にいずれかの低周波数帯域に適用されたか否かを決定することなく、又は前記適用されたか否かに関して通知されることなく、前記符号化されたオーディオ・データの復号を遂行することを可能にする様式で、前記補償制御データに応答して、低周波数帯域の前記集合の各々の帯域の前記オーディオ・データへの低周波数補償の適用を、適応的に動作可能にするように構成される、
付記21に記載の符号化器。
(付記25)
前記低周波数補償制御段が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く各々の前記低周波数帯域内の前記オーディオ・データを、少なくとも1つの修正された指数を含む修正されたオーディオ・データを生成するように再テンティングするように構成される、
付記21に記載の符号化器。
(付記26)
前記低周波数補償制御段が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く各々の前記低周波数帯域内の前記オーディオ・データを、顕著なトーン性コンテンツを欠く少なくとも1つの前記低周波数帯域に対する前記修正された指数を、次のより高い周波数帯域内の前記オーディオ・データの指数から、前記修正された指数を引いたものが、値2、1、0、及び−1のうちの1つを有さなければならないように生成することによることを含めて、再テンティングするように構成される、
付記25に記載の符号化器。
(付記27)
前記周波数領域オーディオ・データが、前記集合の前記各々の低周波数帯域に対する指数値を含み、前記トーナリティ検出器が、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の差の分量を決定するように構成される、
付記21に記載の符号化器。
(付記28)
前記周波数領域オーディオ・データが、前記集合の前記各々の低周波数帯域に対する指数値を含み、前記トーナリティ検出器が、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の平均二乗差の分量を決定するように構成される、
付記21に記載の符号化器。
(付記29)
前記符号化器が、前記トーナリティ検出器及び前記低周波数補償制御段を実装するソフトウェアによってプログラムされるプロセッサである、付記21に記載の符号化器。
(付記30)
前記符号化器がデジタル信号プロセッサである、
付記21に記載の符号化器。
(付記31)
前記トーナリティ検出器が、前記オーディオ・データに関してトーナリティ検出を遂行して、前記オーディオ・データの前記周波数帯域の少なくとも部分集合の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するように構成され、符号化器が、前記低周波数補償制御段を含むマスキング値補正段を含み、前記マスキング値段が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する前記オーディオ・データの前記各々の周波数帯域に対して第1の様式でマスキング値補正処理を遂行するように、及び、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く前記オーディオ・データの前記各々の周波数帯域に対して第2の様式で前記マスキング値補正処理を遂行するように構成される、
付記21に記載の符号化器。
(付記32)
前記マスキング値補正処理がBABNDNORM処理であり、前記マスキング値補正段が、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して第1のスケーリング定数によって前記BABNDNORM処理を遂行するように、及び、顕著なトーン性コンテンツを欠く前記各々の周波数帯域に対して第2のスケーリング定数によって前記BABNDNORM処理を遂行するように構成される、
付記31に記載の符号化器。
(付記33)
周波数領域オーディオ・データに応答して、前記オーディオ・データに関して適応型低周波数補償を遂行することによることを含めて、符号化されたオーディオ・データを生成するように構成される符号化器と、
前記符号化されたオーディオ・データを復号して、前記オーディオ・データを復元するように構成される復号化器と
を含むシステムであって、前記符号化器が、
前記オーディオ・データに関してトーナリティ検出を遂行して、前記オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するように構成されるトーナリティ検出器と、
前記補償制御データに応答して、前記オーディオ・データの低周波数帯域の前記集合の各々の低周波数帯域への低周波数補償の適用を、適応的に動作可能にするように結合及び構成される低周波数補償制御段と
を含むシステム。
(付記34)
前記トーナリティ検出器が拍手検出器であり、前記補償制御データが、前記集合の少なくとも1つの帯域が拍手を表すかどうかを指示している、
付記33に記載のシステム。
(付記35)
前記補償制御データが、前記集合の少なくとも1つの帯域が群衆雑音及び拍手の少なくとも1つを表すかどうかを指示している、
付記33に記載のシステム。
(付記36)
前記復号化器が、低周波数補償が前記符号化の間にいずれかの低周波数帯域に適用されたか否かを決定することなく、又は前記適用されたか否かに関して通知されることなく、前記符号化されたオーディオ・データを復号するように構成される、
付記33に記載のシステム。
(付記37)
前記低周波数補償制御段が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く各々の前記低周波数帯域内の前記オーディオ・データを、少なくとも1つの修正された指数を含む修正されたオーディオ・データを生成するように再テンティングするように構成される、
付記33に記載の符号化器。
(付記38)
前記低周波数補償制御段が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く各々の前記低周波数帯域内の前記オーディオ・データを、顕著なトーン性コンテンツを欠く少なくとも1つの前記低周波数帯域に対する前記修正された指数を、次のより高い周波数帯域内の前記オーディオ・データの指数から、前記修正された指数を引いたものが、値2、1、0、及び−1のうちの1つを有さなければならないように生成することによることを含めて、再テンティングするように構成される、
付記37に記載の符号化器。
(付記39)
前記周波数領域オーディオ・データが、前記集合の前記各々の低周波数帯域に対する指数値を含み、前記トーナリティ検出器が、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の差の分量を決定するように構成される、
付記33に記載の符号化器。
(付記40)
符号化されたオーディオ・データを復号するための方法であって、
前記符号化されたオーディオ・データを指示している信号を受信するステップと、
前記符号化されたオーディオ・データを復号して、オーディオ・データを指示している信号を生成するステップと
を含み、
前記符号化されたオーディオ・データが、
(a)周波数領域オーディオ・データに関してトーナリティ検出を遂行して、前記オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップと、
(b)低周波数補償を遂行して、前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する各々の前記低周波数帯域内の前記オーディオ・データに対する補正されたマスキング値を生成し、低周波数補償を遂行することなく、前記集合内の各々の他の低周波数帯域内の前記オーディオ・データに対するマスキング値を生成するステップと、
により生成されている、方法。
(付記41)
前記補償制御データが、前記集合の少なくとも1つの帯域が拍手を表すかどうかを指示しているものであり、ステップ(b)が、
低周波数補償を遂行することなく、前記補償制御データにより指示されるような拍手を表す前記集合の各々の低周波数帯域内の前記オーディオ・データに対して、マスキング値を生成するステップ、を含む、
付記40に記載の方法。
(付記42)
前記補償制御データが、前記集合の少なくとも1つの帯域が群衆雑音及び拍手の少なくとも1つを表すかどうかを指示しているものであり、ステップ(b)が、
低周波数補償を遂行することなく、前記補償制御データにより指示されるような拍手及び群衆雑音の少なくとも1つを表す前記集合の各々の低周波数帯域内の前記オーディオ・データに対して、マスキング値を生成するステップ、を含む、
付記40に記載の方法。
(付記43)
ステップ(b)が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く前記集合の各々の低周波数帯域内の前記オーディオ・データを、顕著なトーン性コンテンツを欠く少なくとも1つの前記低周波数帯域に対する修正された指数を含む修正されたオーディオ・データを生成するように再テンティングするステップを含む、
付記40に記載の方法。
(付記44)
再テンティングする前記ステップが、顕著なトーン性コンテンツを欠く少なくとも1つの前記低周波数帯域に対する前記修正された指数を、次のより高い周波数帯域内の前記オーディオ・データの指数から、前記修正された指数を引いたものが、値2、1、0、及び−1のうちの1つを有さなければならないように生成する、
付記43に記載の方法。
2 分析フィルタ・バンク
4 コントローラ
6 量子化器
10 テンティング
11 指数コーディング
15 トーナリティ検出
90 符号化器
92 復号化器

Claims (20)

  1. (a)オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するために、周波数領域オーディオ・データに関してトーナリティ検出を遂行するステップであり、
    前記周波数領域オーディオ・データは、前記集合の前記各々の低周波数帯域に対する指数を含み、かつ、トーナリティ検出を遂行するステップは、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の差の分量を決定するステップを含み、
    前記テンティングされた指数は、連続する指数間の差を決定すること、および、前記差が、2、1、0、−1、−2の範囲内にあるように、引かれる前記指数の一つを変更すること、によって決定される、
    ステップと、
    (b)前記補償制御データに応答して、前記オーディオ・データの低周波数帯域の前記集合の各々の低周波数帯域への低周波数補償の適用を、適応的に動作可能にするために、低周波数補償を遂行して、前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する各々の前記低周波数帯域内の前記オーディオ・データに対する補正されたマスキング値を生成し、低周波数補償を遂行することなく、前記集合内の各々の他の低周波数帯域内の前記オーディオ・データに対するマスキング値を生成するステップと、を含む、
    オーディオ符号化方法。
  2. 前記補償制御データが、前記集合の少なくとも1つの帯域が拍手を表すかどうかを指示しているものであり、ステップ(b)が、
    低周波数補償を遂行することなく、前記補償制御データにより指示されるような拍手を表す前記集合の各々の低周波数帯域内の前記オーディオ・データに対して、マスキング値を生成するステップ、を含む、
    請求項1に記載の方法。
  3. 前記補償制御データが、前記集合の少なくとも1つの帯域が群衆雑音及び拍手の少なくとも1つを表すかどうかを指示しているものであり、ステップ(b)が、
    低周波数補償を遂行することなく、前記補償制御データにより指示されるような拍手及び群衆雑音の少なくとも1つを表す前記集合の各々の低周波数帯域内の前記オーディオ・データに対して、マスキング値を生成するステップ、を含む、
    請求項1に記載の方法。
  4. ステップ(b)が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く前記集合の各々の低周波数帯域内の前記オーディオ・データを、顕著なトーン性コンテンツを欠く少なくとも1つの前記低周波数帯域に対する修正された指数を含む修正されたオーディオ・データを生成するように再テンティングするステップ、を含む、
    請求項1に記載の方法。
  5. 再テンティングする前記ステップが、顕著なトーン性コンテンツを欠く少なくとも1つの前記低周波数帯域に対する前記修正された指数を、次のより高い周波数帯域内の前記オーディオ・データの指数から、前記修正された指数を引いたものが、値2、1、0、及び−1のうちの1つを有さなければならないように生成する、
    請求項4に記載の方法。
  6. 前記差の分量は、前記オーディオ・データの指数と、対応するテンティングされた指数との間の平均二乗差分量である、
    請求項1に記載の方法。
  7. 前記補償制御データが、前記集合内の各々の個々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、ステップ(b)において低周波数補償が、前記集合内の各々の個々の低周波数帯域に関して選択的に遂行される、又は遂行されない、
    請求項1に記載の方法。
  8. 前記補償制御データが、一体で考慮される前記集合内の前記低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、低周波数補償が、ステップ(b)において、前記補償制御データが、一体で考慮される前記集合内の前記低周波数帯域が顕著なトーン性コンテンツを有するということを指示するとき、前記集合内のすべての前記低周波数帯域に関して遂行される、
    請求項1に記載の方法。
  9. 周波数領域オーディオ・データに応答して、オーディオ・データに関して適応型低周波数補償を遂行することによることを含めて、符号化された前記オーディオ・データを生成するように構成されるオーディオ符号化器であって、
    オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するために、周波数領域オーディオ・データに関してトーナリティ検出を遂行するように構成されるトーナリティ検出器であり、
    前記周波数領域オーディオ・データは、前記集合の前記各々の低周波数帯域に対する指数を含み、かつ、トーナリティ検出を遂行するために、前記トーナリティ検出器は、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の差の分量を決定するように構成されており、
    前記テンティングされた指数は、連続する指数間の差を決定すること、および、前記差が、2、1、0、−1、−2の範囲内にあるように、引かれる前記指数の一つを変更すること、によって決定される、
    トーナリティ検出器と、
    前記補償制御データに応答して、前記オーディオ・データの低周波数帯域の前記集合の各々の低周波数帯域への低周波数補償の適用を、適応的に動作可能にするように結合及び構成される低周波数補償制御段であり、
    前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する各々の周波数帯域内の前記オーディオ・データに対する補正されたマスキング値を生成し、かつ、低周波数補償を遂行することなく、前記集合内の各々の他の低周波数帯域内でマスキング値を生成する、
    低周波数補償制御段と、
    を含む、オーディオ符号化器。
  10. 前記トーナリティ検出器が拍手検出器であり、前記補償制御データが、前記集合の少なくとも1つの帯域が拍手を表すかどうかを指示している、
    請求項9に記載の符号化器。
  11. 前記補償制御データが、前記集合の少なくとも1つの帯域が群衆雑音及び拍手の少なくとも1つを表すかどうかを指示している、
    請求項9に記載の符号化器。
  12. 前記低周波数補償制御段が、復号化器が、低周波数補償が前記符号化の間にいずれかの低周波数帯域に適用されたか否かを決定することなく、又は前記適用されたか否かに関して通知されることなく、前記符号化されたオーディオ・データの復号を遂行することを可能にする様式で、前記補償制御データに応答して、低周波数帯域の前記集合の各々の帯域の前記オーディオ・データへの低周波数補償の適用を、適応的に動作可能にするように構成される、
    請求項9に記載の符号化器。
  13. 前記低周波数補償制御段が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く各々の前記低周波数帯域内の前記オーディオ・データを、少なくとも1つの修正された指数を含む修正されたオーディオ・データを生成するように再テンティングするように構成される、
    請求項9に記載の符号化器。
  14. 前記低周波数補償制御段が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く各々の前記低周波数帯域内の前記オーディオ・データを、顕著なトーン性コンテンツを欠く少なくとも1つの前記低周波数帯域に対する前記修正された指数を、次のより高い周波数帯域内の前記オーディオ・データの指数から、前記修正された指数を引いたものが、値2、1、0、及び−1のうちの1つを有さなければならないように生成することによることを含めて、再テンティングするように構成される、
    請求項13に記載の符号化器。
  15. 前記分量は、前記オーディオ・データの指数と、対応するテンティングされた指数との間の平均二乗差分量である、
    請求項9に記載の符号化器。
  16. 前記オーディオ符号化器は、前記トーナリティ検出器及び前記低周波数補償制御段を実装するソフトウェアによってプログラムされるプロセッサである、
    請求項9に記載の符号化器。
  17. 前記オーディオ符号化器は、デジタル信号プロセッサである、
    請求項9に記載の符号化器。
  18. 符号化されたオーディオ・データを指示している信号を受信する受信器と、
    前記オーディオ・データを指示している信号を生成するために、前記符号化されたオーディオ・データを復号するように構成されている復号器と、
    を含む、装置であって、
    前記符号化されたオーディオ・データは、
    (a)オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するために、周波数領域オーディオ・データに関してトーナリティ検出を遂行するステップであり、
    前記周波数領域オーディオ・データは、前記集合の前記各々の低周波数帯域に対する指数を含み、かつ、トーナリティ検出を遂行するステップは、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の差の分量を決定するステップを含み、
    前記テンティングされた指数は、連続する指数間の差を決定すること、および、前記差が、2、1、0、−1、−2の範囲内にあるように、引かれる前記指数の一つを変更すること、によって決定される、
    ステップと、
    (b)前記補償制御データに応答して、前記オーディオ・データの低周波数帯域の前記集合の各々の低周波数帯域への低周波数補償の適用を、適応的に動作可能にするために、低周波数補償を遂行して、前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する各々の前記低周波数帯域内の前記オーディオ・データに対する補正されたマスキング値を生成し、低周波数補償を遂行することなく、前記集合内の各々の他の低周波数帯域内の前記オーディオ・データに対するマスキング値を生成するステップと、
    によって生成される、装置。
  19. 前記補償制御データは、一体で考慮される前記集合内の前記低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、かつ、
    前記補償制御データが、一体で考慮される前記集合内の前記低周波数帯域が顕著なトーン性コンテンツを有するということを指示する場合、低周波数補償が、ステップ(b)において、前記集合内のすべての前記低周波数帯域に関して遂行される、
    請求項18に記載の装置。
  20. 符号化されたオーディオ・データを指示している信号を受信するステップと、
    前記オーディオ・データを指示している信号を生成するために、前記符号化されたオーディオ・データを復号するステップと、を含み、
    前記符号化されたオーディオ・データは、
    (a)オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するために、周波数領域オーディオ・データに関してトーナリティ検出を遂行するステップであり、
    前記周波数領域オーディオ・データは、前記集合の前記各々の低周波数帯域に対する指数を含み、かつ、トーナリティ検出を遂行するステップは、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の差の分量を決定するステップを含み、
    前記テンティングされた指数は、連続する指数間の差を決定すること、および、前記差が、2、1、0、−1、−2の範囲内にあるように、引かれる前記指数の一つを変更すること、によって決定される、
    ステップと、
    (b)前記補償制御データに応答して、前記オーディオ・データの低周波数帯域の前記集合の各々の低周波数帯域への低周波数補償の適用を、適応的に動作可能にするために、低周波数補償を遂行して、前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する各々の前記低周波数帯域内の前記オーディオ・データに対する補正されたマスキング値を生成し、低周波数補償を遂行することなく、前記集合内の各々の他の低周波数帯域内の前記オーディオ・データに対するマスキング値を生成するステップと、
    によって生成される、方法。
JP2015106044A 2012-01-09 2015-05-26 適応型低周波数補償によってオーディオ・データを符号化するための方法及びシステム Active JP6093801B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201261584478P 2012-01-09 2012-01-09
US61/584,478 2012-01-09
US13/588,890 US8527264B2 (en) 2012-01-09 2012-08-17 Method and system for encoding audio data with adaptive low frequency compensation
US13/588,890 2012-08-17

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014551236A Division JP5755379B2 (ja) 2012-01-09 2012-09-25 適応型低周波数補償によってオーディオ・データを符号化するための方法及びシステム

Publications (2)

Publication Number Publication Date
JP2015187743A JP2015187743A (ja) 2015-10-29
JP6093801B2 true JP6093801B2 (ja) 2017-03-08

Family

ID=48744528

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2014551236A Active JP5755379B2 (ja) 2012-01-09 2012-09-25 適応型低周波数補償によってオーディオ・データを符号化するための方法及びシステム
JP2015106044A Active JP6093801B2 (ja) 2012-01-09 2015-05-26 適応型低周波数補償によってオーディオ・データを符号化するための方法及びシステム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2014551236A Active JP5755379B2 (ja) 2012-01-09 2012-09-25 適応型低周波数補償によってオーディオ・データを符号化するための方法及びシステム

Country Status (19)

Country Link
US (2) US8527264B2 (ja)
EP (1) EP2803067B1 (ja)
JP (2) JP5755379B2 (ja)
KR (1) KR101621704B1 (ja)
AR (1) AR088007A1 (ja)
AU (1) AU2012364749B2 (ja)
BR (1) BR112014016847B1 (ja)
CA (1) CA2858663C (ja)
CL (1) CL2014001805A1 (ja)
HK (1) HK1201976A1 (ja)
IL (1) IL233029A0 (ja)
IN (1) IN2014CN04457A (ja)
MX (1) MX335999B (ja)
MY (1) MY187728A (ja)
RU (1) RU2583717C1 (ja)
SG (1) SG11201402983UA (ja)
TW (1) TWI470621B (ja)
UA (1) UA110291C2 (ja)
WO (1) WO2013106098A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101983403B (zh) * 2008-07-29 2013-05-22 雅马哈株式会社 演奏相关信息输出装置、具有演奏相关信息输出装置的系统、以及电子乐器
EP2268057B1 (en) * 2008-07-30 2017-09-06 Yamaha Corporation Audio signal processing device, audio signal processing system, and audio signal processing method
JP5782677B2 (ja) 2010-03-31 2015-09-24 ヤマハ株式会社 コンテンツ再生装置および音声処理システム
EP2573761B1 (en) 2011-09-25 2018-02-14 Yamaha Corporation Displaying content in relation to music reproduction by means of information processing apparatus independent of music reproduction apparatus
JP5494677B2 (ja) 2012-01-06 2014-05-21 ヤマハ株式会社 演奏装置及び演奏プログラム
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
EP2956935B1 (en) 2013-02-14 2017-01-04 Dolby Laboratories Licensing Corporation Controlling the inter-channel coherence of upmixed audio signals
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
JP6492915B2 (ja) * 2015-04-15 2019-04-03 富士通株式会社 符号化装置、符号化方法、及びプログラム
EP3288031A1 (en) 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
JP7257975B2 (ja) * 2017-07-03 2023-04-14 ドルビー・インターナショナル・アーベー 密集性の過渡事象の検出及び符号化の複雑さの低減
CN108616277B (zh) * 2018-05-22 2021-07-13 电子科技大学 一种多通道频域补偿的快速校正方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4817155A (en) * 1983-05-05 1989-03-28 Briar Herman P Method and apparatus for speech analysis
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
WO1992012607A1 (en) 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5581653A (en) * 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JPH10261964A (ja) * 1997-03-19 1998-09-29 Sanyo Electric Co Ltd 情報信号処理装置
CA2230188A1 (en) * 1998-03-27 1999-09-27 William C. Treurniet Objective audio quality measurement
EP1228569A1 (en) * 1999-10-30 2002-08-07 STMicroelectronics Asia Pacific Pte Ltd. A method of encoding frequency coefficients in an ac-3 encoder
KR100898879B1 (ko) * 2000-08-16 2009-05-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 부수 정보에 응답하여 하나 또는 그 이상의 파라메터를변조하는 오디오 또는 비디오 지각 코딩 시스템
AU2211102A (en) * 2000-11-30 2002-06-11 Scient Generics Ltd Acoustic communication system
US7747655B2 (en) * 2001-11-19 2010-06-29 Ricoh Co. Ltd. Printable representations for time-based media
US7110941B2 (en) * 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
US7509257B2 (en) * 2002-12-24 2009-03-24 Marvell International Ltd. Method and apparatus for adapting reference templates
US7333930B2 (en) * 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
US7516064B2 (en) 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
JP2006018023A (ja) 2004-07-01 2006-01-19 Fujitsu Ltd オーディオ信号符号化装置、および符号化プログラム
CA2690433C (en) * 2007-06-22 2016-01-19 Voiceage Corporation Method and device for sound activity detection and sound signal classification
RU2010116748A (ru) 2007-09-28 2011-11-10 Войсэйдж Корпорейшн (Ca) Способ и устройство для эффективного квантования данных, преобразуемых во встроенных речевых и аудиокодеках
KR20090122142A (ko) 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치

Also Published As

Publication number Publication date
US20140324441A1 (en) 2014-10-30
KR20140104470A (ko) 2014-08-28
JP2015187743A (ja) 2015-10-29
MX2014007400A (es) 2015-03-05
CL2014001805A1 (es) 2015-02-27
AU2012364749B2 (en) 2015-08-13
HK1201976A1 (en) 2015-09-11
JP2015504179A (ja) 2015-02-05
IL233029A0 (en) 2014-07-31
BR112014016847A8 (pt) 2017-07-04
MY187728A (en) 2021-10-14
SG11201402983UA (en) 2014-09-26
US8527264B2 (en) 2013-09-03
JP5755379B2 (ja) 2015-07-29
US9275649B2 (en) 2016-03-01
BR112014016847B1 (pt) 2020-12-15
TW201329961A (zh) 2013-07-16
TWI470621B (zh) 2015-01-21
AR088007A1 (es) 2014-04-30
US20130179175A1 (en) 2013-07-11
CN104040623A (zh) 2014-09-10
CA2858663A1 (en) 2013-07-18
EP2803067B1 (en) 2017-04-05
AU2012364749A1 (en) 2014-07-03
KR101621704B1 (ko) 2016-05-17
MX335999B (es) 2016-01-07
RU2583717C1 (ru) 2016-05-10
WO2013106098A1 (en) 2013-07-18
UA110291C2 (en) 2015-12-10
BR112014016847A2 (pt) 2017-06-13
CA2858663C (en) 2017-03-14
EP2803067A1 (en) 2014-11-19
IN2014CN04457A (ja) 2015-09-04

Similar Documents

Publication Publication Date Title
JP6093801B2 (ja) 適応型低周波数補償によってオーディオ・データを符号化するための方法及びシステム
RU2660605C2 (ru) Концепция заполнения шумом
US7050972B2 (en) Enhancing the performance of coding systems that use high frequency reconstruction methods
US9754601B2 (en) Information signal encoding using a forward-adaptive prediction and a backwards-adaptive quantization
KR101157930B1 (ko) 오디오 인코딩에서 mdct 데이터에 기초한 윈도우 유형의 결정 방법
KR101726205B1 (ko) 감소된 복잡성 변환기 snr 계산
JP6181854B2 (ja) マルチチャネル・オーディオのハイブリッド・エンコード
TW201405548A (zh) 具多重子流之多通道音頻信號的有效編碼與解碼
JP7257975B2 (ja) 密集性の過渡事象の検出及び符号化の複雑さの低減
RU2828411C2 (ru) Звуковые кодирующее устройство и декодирующее устройство
CN104040623B (zh) 用于利用自适应低频补偿编码音频数据的方法和系统
TW202334940A (zh) 在音訊寫碼中使用不同雜訊填充方法進行頻譜時間上改良之頻譜間隙填充之方法及設備
JP2005003835A (ja) オーディオ信号符号化装置、オーディオ信号符号化方法、及びプログラム
JP2005351977A (ja) オーディオ信号符号化装置及びオーディオ信号符号化方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170213

R150 Certificate of patent or registration of utility model

Ref document number: 6093801

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250