JP6259930B2 - ダイナミックレンジ制御における効率的なゲイン符号化を有するオーディオ符号化装置及びオーディオ復号化装置 - Google Patents

ダイナミックレンジ制御における効率的なゲイン符号化を有するオーディオ符号化装置及びオーディオ復号化装置 Download PDF

Info

Publication number
JP6259930B2
JP6259930B2 JP2016559243A JP2016559243A JP6259930B2 JP 6259930 B2 JP6259930 B2 JP 6259930B2 JP 2016559243 A JP2016559243 A JP 2016559243A JP 2016559243 A JP2016559243 A JP 2016559243A JP 6259930 B2 JP6259930 B2 JP 6259930B2
Authority
JP
Japan
Prior art keywords
dynamic range
range control
dfr
control frame
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016559243A
Other languages
English (en)
Other versions
JP2017517020A (ja
Inventor
ケッヒ,ファビアン
ウーレ,クリスチャン
クラッツシュメール,ミヒャエル
ノイゲバウエル,ベルンハルト
マイエル,ミヒャエル
シュライネル,ステファン
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2017517020A publication Critical patent/JP2017517020A/ja
Application granted granted Critical
Publication of JP6259930B2 publication Critical patent/JP6259930B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Description

本明細書の文脈におけるダイナミックレンジ制御(DRC)とは、オーディオ信号のダイナミックレンジを制御された方法で低減させる、デジタル信号処理技術について言及するものである(非特許文献1)。ダイナミックレンジの望ましい低減は、大音量のサウンド要素のレベルを低減させ、及び/又はオーディオ信号のソフトな部分を増幅することで達成させる。
DRCについての典型的な適用例は、オーディオ信号のダイナミック特性をリスニング環境へと適応させることである。例えば、雑音が多い環境の中で音楽を聴いている場合、増幅された信号にクリッピングが発生しないような方法で全体的な信号増幅が可能となるように、ダイナミックレンジが低減されねばならない。この場合、高い信号ピークは、例えばリミッタにより減衰されるべきである。追加的に、ソフトな信号要素は、雑音が多いリスニング環境の中でそれらの了解度を向上させるため、大音量の部分と比較して増幅されるべきである。
D.Giannoulis,M.Massberg,J.D.Reiss,"Digital Dynamic Range Compressor Design-A Tutorial and Analysis" J.Audio Engineering Society, Vol.60,No.6, June 2012. ISO/IEC 13818-7, Advanced Audio Coding (MPEG-2 AAC) ISO/IEC 14496-3, subpart 4 (MPEG-4 AAC) ISO/IEC 23003-3, part 3, Unified Speech and Audio Coding (USAC).
本発明の目的は、オーディオ伝送の文脈におけるダイナミックレンジ制御についての改善された概念を提供することである。
この目的は、以下の構成を含むオーディオ符号化装置により達成される。即ち、
連続的なオーディオフレームを含むオーディオ信号から符号化済みオーディオビットストリームを生成するよう構成されたオーディオ符号器と、
前記オーディオ信号に対応しかつ連続的なダイナミックレンジ制御フレームを含むダイナミックレンジ制御シーケンスから、符号化済みダイナミックレンジ制御ビットストリームを生成するよう構成されたダイナミックレンジ制御符号器であって、前記ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレームは1つ以上のノードを含み、その1つ以上のノードの各ノードがオーディオ信号についてのゲイン情報とそのゲイン情報がどの時点に対応するかを示す時間情報とを含む、ダイナミックレンジ制御符号器と、を含み、
前記ダイナミックレンジ制御符号器は、符号化済みダイナミックレンジ制御ビットストリームが前記ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレームに対応する1つのビットストリーム部分を含むように構成されており、
前記ダイナミックレンジ制御符号器はシフト処理を実行するよう構成されており、そのシフト処理では、ダイナミックレンジ制御フレームうちの1つの基準ダイナミックレンジ制御フレームの1つ以上のノードがシフトノード(shifted nodes)として選択され、前記1つの基準ダイナミックレンジ制御フレームの前記1つ以上のシフトノードの各々のビット表現が前記1つの基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームに対応するビットストリーム部分の中に埋め込まれ、前記ダイナミックレンジ制御フレームのうちの前記1つの基準ダイナミックレンジ制御フレームのノードの各残りのノードのビット表現が前記1つの基準ダイナミックレンジ制御フレームに対応するビットストリーム部分の中に埋め込まれる。
本発明は、オーディオ信号の符号化を使用するオーディオ伝送の状況に関するものであり、その場合、ゲイン情報は、オーディオ信号に対して直接的に適用される訳ではなく、符号化されて、符号化済みオーディオ信号と一緒に伝送される。復号器においては、オーディオ信号及びゲイン情報の両方が復号化されてもよく、ゲイン情報が対応するオーディオ信号へと適用されてもよい。以下により詳細に説明するように、本発明はゲイン情報の効率的な符号化を達成する。より正確には、本発明は符号化済みダイナミックレンジ制御ビットストリーム内でのビットレートピークを防止する。
オーディオ信号に対してダイナミックレンジ制御を適用する処理は、オーディオ信号x(k)を時変ゲイン値g(k)で単純に乗算することで表現され得る。
[数1]
y(k)=g(k)x(k) (1)
ここで、kはサンプル時間インデックスを示す。ゲインg(k)の値は、例えばオーディオ信号x(k)の二乗平均平方根の短時間推定に基づいて計算され得る。適切なゲイン値を決定する手法のより詳細な説明は、非特許文献1に記載されている。以下では、時変ゲインg(k)をゲインシーケンスと呼ぶことにする。
以下に、ダイナミックレンジ制御ゲインシーケンスの符号化について説明する。まず、ダイナミックレンジ制御ゲインシーケンスは、固定数のゲインサンプルを含む、ゲインサンプルの所謂ダイナミックレンジ制御フレームへと分割される。通常、ダイナミックレンジ制御フレームについての時間的フレームサイズは、対応するオーディオ符号器のオーディオフレームの時間的サイズと等しくなるよう選択される。各ダイナミックレンジ制御フレーム内で、所謂ノードが好ましくは均一な時間グリッド上で選択される
このグリッドの間隔は、最高の利用可能な時間分解能を定義する。即ち、2つのノード間のサンプルにおける最短距離が、最高の利用可能な時間分解能を有するサンプルと等しい。各ノードは、ダイナミックレンジ制御フレーム内のサンプル位置と、その位置に関してゲイン値として表現され得るゲイン情報と、任意ではあるがノード位置におけるゲイン値の傾きに関する情報と、によって表現される。以下の説明では、1つのフレーム内で選択され得るノードの最大数を定義することが有益であろう。
ダイナミックレンジ制御符号器は、例えば連続的なゲインノードのペアの量子化された差分値を使用して、ノードからのゲイン情報を符号化する。復号器においては、ノードの伝送された情報(ゲイン値、ダイナミックレンジ制御フレーム内のサンプル位置、及びもし適用可能であれば傾き情報)に基づいて、スプライン補間又は線形補間を使用して、オリジナル・ゲインシーケンスができるだけ良好に再生される。
ダイナミックレンジ制御ゲインシーケンスを符号化する効率的な手法は、連続的なノードのペアの(典型的にはdBの)ゲイン差の量子化された値と、考慮対象のダイナミックレンジ制御フレーム内のこれらノードのサンプル位置同士の時間差と、を使用する。傾き情報は、通常、2つのノード間の差として表現されない。1つのフレーム内の最初のノードには先行するノードがないので、そのゲイン値は差分的な方法では符号化されず、それらの値は明示的に符号化される。最初のノードの時間差は、通常、ダイナミックレンジ制御フレームの開始点へのオフセットとして決定される。
次に、符号器は、例えば予め定義されたハフマンテーブル(符号帳)の固定の符号語を、ノードのペアのゲイン差及び時間差の各々に対して割り当ててもよい。
ダイナミックレンジ制御復号器において、ダイナミックレンジ制御ビットストリームが復号化され、伝送されたノードの位置における関連情報(ゲイン値、ダイナミックレンジ制御フレーム内のサンプル位置、及び、もし適用可能であれば傾き情報)が再生される。1フレーム内の残りのゲインサンプルについてのゲイン値は、伝送されかつ復号化されたノードのペア間の補間によって取得される。この補間は、ゲインノードの傾き情報が伝送されていた場合にはスプラインに基づいて実行可能であり、又は代替的に、ノードのペア間のゲイン差だけが使用可能であって傾き情報が廃棄されている場合には、線形補間を使用して実行可能である。
原則として、ダイナミックレンジ制御符号器/復号器の連鎖は2つのモードで操作され得る。所謂フルフレームモードと呼ばれる場合とは、基準ダイナミックレンジ制御フレームに対応する受信されたダイナミックレンジ制御ビットストリームを復号化した後で、基準ダイナミックレンジ制御フレームの各サンプル位置におけるゲインが、復号化されたノードに基づいて、補間の後で直ちに決定され得る場合である。これは、各フレーム境界で、即ち基準ダイナミックレンジ制御フレームの最後のサンプルに対応するサンプル位置で、1つのノードが伝送されねばならないことを暗示している。ダイナミックレンジ制御フレーム長さがNであれば、これはつまり、最後に伝送されたノードが、基準ダイナミックレンジ制御フレーム内のサンプル位置Nに配置されねばならないことを意味する。
本発明は、「遅延モード」と呼ばれる第2モードに基づくため、この欠点を防止する。その場合、基準ダイナミックレンジ制御フレーム内の最後のサンプル位置のために1つのノードを伝送する必要がない。従って、ダイナミックレンジ制御復号器は、基準ダイナミックレンジ制御フレーム内の最後のノードに続く全てのゲイン値の所要の補間を実行するために、基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームの復号化を待たなければならない。なぜなら、基準ダイナミックレンジ制御フレームの最後のノードと後続するダイナミックレンジ制御フレームの最初のノードとの間の補間を実行して、それらの間のゲイン値を補間によって決定するために、後続のダイナミックレンジ制御フレームの最初のノードの情報が既知となる必要があるからである。
現実には、ダイナミックレンジ制御情報の符号化のために遅延モードを使用することによって引き起こされる遅延は、問題ではない。なぜなら、通常ダイナミックレンジ制御符号化スキームを伴うオーディオコーデックは、後に符号化及び復号化ステップを適用する際に、1オーディオフレーム分の固有の遅延をも導入するからである。そのようなオーディオコーデックの重要な実例は、非特許文献2、非特許文献3又は非特許文献4である。そのようなオーディオ符号化スキームは、基準ダイナミックレンジ制御オーディオフレームに対応する正確なオーディオサンプルを(オーバーラップ加算構造を用いて)計算するために、基準オーディオフレームと、その基準オーディオフレームに後続するオーディオフレームとを必要とする。
注意すべき重要なことは、オリジナル・ダイナミックレンジ制御ゲインシーケンスを充分に近似するために必要となるノードの数は、ダイナミックレンジ制御フレーム毎に有意に変化することである。それは、高速で時間変化するゲインを表現する場合は、ゆっくりと変化するゲイン値が符号化されるべき場合と比較して、より多数のノードが必要となるという事実に起因する。この観点は、ゲインシーケンスを伝送するために必要なビットレートがフレーム毎に有意に変化し得ることを暗示している。あるフレームは符号化されるべき多数のノードを必要とするかもしれず、その場合、高いビットレートピークをもたらす。この状況は、特に、オーディオ信号とダイナミックレンジ制御ゲインシーケンスとが、符号化済みダイナミックレンジ制御ビットストリームと符号化済みオーディオビットストリームとを含むジョイントビットストリーム内で伝送される場合であって、略一定のビットレートを持つべき場合に、好ましくない。その場合、ダイナミックレンジ制御関連のビットレート内のピークが、オーディオ符号器のために使用可能なビットレートを低減させ、その結果、復号化後のオーディオ品質の劣化を招いてしまうことが多い。しかしながら、ダイナミックレンジ制御ゲインシーケンスを符号化するための現状技術の方法を用いると、あるフレームにおけるダイナミックレンジ制御関連のビットレートの低減は、そのフレーム内のゲインシーケンスを表現するために選択されたノードの数を減少させることにより達成されるだけである。このような方法では、オリジナル・ゲインシーケンスと、ダイナミックレンジ制御の復号化処理後に再生されたゲインシーケンスと、の間の大きな誤差をもたらす恐れがある。本発明は、オリジナル・シーケンスと再生されたダイナミックレンジ制御シーケンスとの間の誤差を増大させることなく、符号化済みダイナミックレンジ制御ビットストリームのピークビットレートを低減させることにより、これらの欠点を克服するものである。
このセクションでは、本発明に係るダイナミックレンジ制御ゲインシーケンスの符号化を提示する。本発明は、基準ダイナミックレンジ制御フレームのために必要なピークビットレートを、本提案方法が使用されない場合と比較して結果的なビットストリームシーケンスを変更せずに、制御可能にすることである。本提案の手法は、現状技術の符号器によって導入される1フレーム分の固有の遅延を活用して、1フレーム内のノード数のピークを、それらノードの幾つかの伝送を次の後続ダイナミックレンジ制御フレームへと分配することにより、低減させる。本提案方法の詳細を以下に提示する。
上述したように、ダイナミックレンジ制御ゲインと比較して1フレームの遅延を導入するオーディオ符号化スキームと組合せられた場合、復号化されたダイナミックレンジ制御ゲインは、オーディオ信号へと適用される前に1フレーム分だけ遅延される。つまり、基準ダイナミックレンジ制御フレームのノードが、基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームにおいて、有効なオーディオ復号器出力に適用されることになる。このことは、デフォルト遅延モードにおいて、基準ダイナミックレンジ制御フレームのノードとこの基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームのノードとを一緒に伝送し、復号器において、対応するダイナミックレンジ制御ゲインを対応するオーディオ出力信号へと遅延なく直接的に適用すれば、十分であることを暗示している。
本発明は、この事実を活用して、1つのダイナミックレンジ制御フレーム内で伝送されるノードの最大数を低減させる。本発明によれば、基準ダイナミックレンジ制御フレームのノードの幾つかは後続のダイナミックレンジ制御フレームへとシフトされるが、これは符号化の前に実行されてもよい。以下に説明するように、シフトノードは、ゲイン差及び傾き情報の符号化のためだけに、後続のダイナミックレンジ制御フレーム内の最初のノードに「先行」してもよい。時間差情報の符号化のためには、異なる方法が適用されてもよい。
本発明の好ましい一実施形態に従えば、基準ダイナミックレンジ制御フレームのノードの数が所定の閾値を上回る場合に、シフト処理が開始される。
本発明の好ましい一実施例によれば、基準ダイナミックレンジ制御フレームのノードの数と、基準ダイナミックレンジ制御フレームに先行するダイナミックレンジ制御フレームからのシフトノードの数であって、基準ダイナミックレンジ制御フレームに対応するビットストリーム部分に埋め込まれるべきシフトノードの数と、の合計が所定の閾値を上回る場合に、シフト処理が開始される。
本発明の好ましい一実施例によれば、基準ダイナミックレンジ制御フレームのノードの数と、基準ダイナミックレンジ制御フレームに先行するダイナミックレンジ制御フレームからのシフトノードの数であって、基準ダイナミックレンジ制御フレームに対応するビットストリーム部分に埋め込まれるべきシフトノードの数と、の合計が、基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームのノードの数を上回った場合に、シフト処理が開始される。
シフト処理が開始される前記定義された条件とは別に、基準ダイナミックレンジ制御フレームの最初のノードは、後続のダイナミックレンジ制御フレームにシフトされるべきではない。なぜなら、最初のノードの値は、基準ダイナミックレンジ制御フレームの開始点におけるゲイン制御値同士の補間に必要となるからである。更に、ビットストリームを復号化する際の遅延を防止するため、1つのノードはただ1度だけシフトされるべきである。
本発明の好ましい一実施例によれば、1つ以上のシフトノードの時間情報は、それら1つ以上のシフトノードがその時間情報を使用して識別され得るような方法で表現される。
本発明の好ましい一実施例によれば、1つ以上のシフトノードの時間情報は、個々のノードが帰属するダイナミックレンジ制御フレームの開始点から個々のノードが帰属するダイナミックレンジ制御フレーム内の個々のノードの時間的位置までの時間差と、個々のダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームの時間的サイズ以上の大きさを有するオフセット値と、の合計により表現される。
本発明の好ましい一実施例に従えば、基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームに対応するビットストリーム部分の最初の位置にあるシフトノードのビット表現のゲイン情報は、絶対ゲイン値によって表現され、他方、基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームに対応するビットストリーム部分の最初の位置にあるノードのビット表現よりも後の位置にあるシフトノードの各ビット表現のゲイン情報は、個々のシフトノードのビット表現のゲイン値と個々のノードのビット表現に先行するノードのビット表現のゲイン値との差に等しい相対ゲイン値によって表現される。
本発明の好ましい一実施形態に従えば、基準ダイナミックレンジ制御フレームの1つ以上のシフトノードのビット表現が基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームに対応するビットストリーム部分に埋め込まれる場合には、前記1つ以上のシフトノードのビット表現の1つ以上の位置より後で基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームに対応するビットストリーム部分の最初の位置にある、後続のダイナミックレンジ制御フレームのノードのビット表現のゲイン情報は、個々のノードのビット表現のゲイン値と個々のノードのビット表現に先行するシフトノードのビット表現のゲイン値との差に等しい、相対ゲイン値によって表現される。
本発明の好ましい実施形態に従えば、オーディオフレームの時間的サイズは、ダイナミックレンジ制御フレームの時間的サイズと等しい。
本発明の好ましい実施形態に従えば、ダイナミックレンジ制御フレームの1つのフレームの1つ以上のノードが均一な時間グリッドから選択される。
本発明の好ましい一実施形態に従えば、1つ以上のノードの各ノードは傾き情報を含む。
本発明の好ましい一実施形態に従えば、ダイナミックレンジ制御符号器は、ハフマン符号化又は算術符号化のようなエントロピー符号化技術を使用してノードを符号化するよう構成されている。
符号器は、例えば予め定義されたハフマンテーブル(符号帳)の固定の符号語を、ノードのペアのゲイン及び時間差の各々に対して割り当ててもよい。連続的なノードのペアの時間差を符号化するための適切なハフマンテーブルの実例を、表1及び表2においてそれぞれ提示する。
DRCゲインノードの時間差を符号化するためのハフマンテーブルの例
Figure 0006259930
DRCゲインノードの時間差を符号化するためのハフマンテーブルの例であり、Z=ceil(log2(2*nNodesMax))である。
Figure 0006259930
本発明の更なる態様において、その目的は、以下の構成を有するオーディオ復号化装置によって達成される。即ち、
符号化済みオーディオビットストリームを復号化して、連続的なオーディオフレームを含むオーディオ信号を再生するオーディオ復号器と、
符号化済みダイナミックレンジ制御ビットストリームを復号化して、前記オーディオ信号に対応しかつ連続的なダイナミックレンジ制御フレームを含むダイナミックレンジ制御シーケンスを再生するダイナミックレンジ制御復号器と、を含み、
前記符号化済みダイナミックレンジ制御ビットストリームは、ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレームに対応する1つのビットストリーム部分を含み、
前記符号化済みダイナミックレンジ制御ビットストリームは、複数のノードのビット表現を含み、それらノードの1つのノードの各ビット表現が、前記オーディオ信号ASについてのゲイン情報と、そのゲイン情報がどの時点に対応するかを示す時間情報とを含み、
前記符号化済みダイナミックレンジ制御ビットストリームは、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームのノードから選択されたシフトノードのビット表現を含み、そのシフトノードのビット表現は、前記1つの基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームに対応するビットストリーム部分に埋め込まれており、ダイナミックレンジ制御フレームの前記1つの基準ダイナミックレンジ制御フレームのノードの各残りのノードのビット表現は、前記1つの基準ダイナミックレンジ制御フレームに対応するビットストリーム部分に埋め込まれており、
ダイナミックレンジ制御復号器は、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームの残りのノードの各残りのノードのビット表現を復号化して、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームの各残りのノードを再生し、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームのノードから選択されたシフトノードの各シフトノードのビット表現を復号化して、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームのノードから選択されたシフトノードの各シフトノードを再生し、更に再生された残りのノードと再生されたシフトノードとを結合して、基準ダイナミックレンジ制御フレームを再生するよう構成されている。
ダイナミックレンジ制御復号器は、ダイナミックレンジ制御ビットストリームを受信する。ダイナミックレンジ制御ビットストリームは、ノード情報(サンプル位置、ゲイン値、及び、もし適用可能であれば傾き情報)に対応し、以下の方法で復号化されてもよい。
2つのノード間の時間差についての(例えば2つのノード間の最短距離の整数倍としての)値が、受信された符号語から、例えばハフマン符号帳内に示された規則に基づいて決定される。現時点で復号化されているノードの対応するサンプル位置は、先行ノードについて計算されたサンプル位置の値に時間差の値を加算することにより取得される。
基準ダイナミックレンジ制御フレームのノードを復号化した後で、後続のダイナミックレンジ制御フレームのノードが復号化される。
後続のダイナミックレンジ制御フレーム内の決定されたサンプル位置が後続のダイナミックレンジ制御フレームの長さよりも大きい値に対応する場合には、ダイナミックレンジ制御復号器は、現在の時間的ノード情報が元々は基準ダイナミックレンジ制御フレーム内に配置されていたノードに言及していると認識する。
基準ダイナミックレンジ制御フレーム内の正確なサンプル位置を取得するために、計算されたサンプル位置からオフセットが引き算される。現実的な一例は、ダイナミックレンジ制御フレームの長さに対応する値を減算することである(それは、符号器が同じ値をオリジナルのサンプル位置に加算したことを暗示している)。そのオフセット値のための典型的な実例は、ダイナミックレンジ制御フレームの時間的サイズである。
復号化と、もし適用可能であれば後続のダイナミックレンジ制御フレーム全体における全てのノードの時間情報の修正との後で、復号器は、何個のノードが基準ダイナミックレンジ制御フレームへとシフトバックされたか(符号器においてこの情報を明示的に提供することなく)、及び、基準ダイナミックレンジ制御フレーム内のどのサンプル位置にそれらノードが配置されているか、を認識する。
ダイナミックレンジ制御復号器は、ビットストリーム内の差分ゲイン情報を復号化することにより、受信されたフレームの全てのノードのゲイン値情報を更に決定する。
時間情報の復号化ステップから、復号器は、復号化されたゲイン値のうちの何個が基準ダイナミックレンジ制御フレームのノードに(及びどのサンプル位置に)割り当てられるべきか、及び、どのゲイン値が基準ダイナミックレンジ制御フレーム内のノードに割り当てられるか、を認識する。
傾き情報の復号化と正確なノードへの割り当てとは、ゲイン値の復号化処理と同様に実行される。
後続のダイナミックレンジ制御フレームの全てのノードを復号化した後で、基準ダイナミックレンジ制御フレームの各サンプルについてのゲイン値を補間を介して計算するために必要な全てのノードが利用可能になる、ということが保証され得る。補間ステップの後で、各サンプルについてのダイナミックレンジ制御ゲイン値が、対応する正確なオーディオサンプルに対して適用され得る。
本発明の好ましい一実施形態に従えば、ダイナミックレンジ制御復号器は、時間情報を使用して1つ以上のシフトノードを識別するよう構成されている。
本発明の好ましい一実施形態に従えば、ダイナミックレンジ制御復号器は、1つ以上のシフトノードの時間情報を復号化するよう構成され、その時間情報は、各ノードが帰属するダイナミックレンジ制御フレームの開始点から各ノードが帰属するダイナミックレンジ制御フレーム内の各ノードの時間的位置までの時間差と、それぞれのダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームの時間的サイズ以上の大きさを有するオフセット値と、の合計により表現される。
本発明の好ましい一実施形態に従えば、ダイナミックレンジ制御復号器は、基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームに対応するビットストリーム部分の最初の位置にあるシフトノードのビット表現のゲイン情報であって、絶対ゲイン値によって表現されるゲイン情報を復号化し、且つ、基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームに対応するビットストリーム部分の最初の位置にあるノードのビット表現よりも後の位置にあるシフトノードの各ビット表現のゲイン情報であって、それぞれのシフトノードのビット表現のゲイン値とそれぞれのノードのビット表現に先行するノードのビット表現のゲイン値との差に等しい、相対ゲイン値によって表現されるゲイン情報を復号化するよう構成されている。
本発明の好ましい一実施形態に従えば、ダイナミックレンジ制御復号器は、1つ以上のシフトノードのビット表現の1つ以上の位置より後で、基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームに対応するビットストリーム部分の最初の位置にある、後続のダイナミックレンジ制御フレームのノードのビット表現のゲイン情報を復号化するよう構成され、そのゲイン情報は、それぞれのノードのビット表現のゲイン値とそれぞれのノードのビット表現に先行するシフトノードのビット表現のゲイン値との差に等しい、相対ゲイン値によって表現される。
本発明の好ましい一実施形態に従えば、オーディオフレームの時間的サイズは、ダイナミックレンジ制御フレームの時間的サイズと等しい。
本発明の好ましい一実施形態に従えば、ダイナミックレンジ制御フレームのうちの1つのフレームの1つ以上のノードは、均一な時間グリッドから選択される。
本発明の好ましい一実施形態に従えば、1つ以上のノードの各ノードの1つ以上のノードは傾き情報を含む。
本発明の好ましい一実施形態に従えば、ダイナミックレンジ制御復号器は、エントロピー復号化技術を使用してノードのビット表現を復号化するよう構成されている。
本発明の目的は更に、本発明に係るオーディオ符号化装置と、本発明に係るオーディオ復号化装置とを含む、システムによって達成される。
本発明は更に、オーディオ符号器を操作する方法を提供し、その方法は、
連続的なオーディオフレームを含むオーディオ信号から符号化済みオーディオビットストリームを生成するステップと、
前記オーディオ信号に対応しかつ連続的なダイナミックレンジ制御フレームを含むダイナミックレンジ制御シーケンスから、符号化済みダイナミックレンジ制御ビットストリームを生成するステップであって、前記ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレームは1つ以上のノードを含み、それら1つ以上のノードの各ノードが、前記オーディオ信号についてのゲイン情報と、そのゲイン情報がどの時点に対応するかを示す時間情報とを含み、前記符号化済みダイナミックレンジ制御ビットストリームは、前記ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレームに対応するビットストリーム部分を含む、ステップと、
シフト処理を実行するステップであって、前記ダイナミックレンジ制御フレームのうちの1つの基準ダイナミックレンジ制御フレームのノードの1つ以上のノードがシフトノードとして選択され、前記1つの基準ダイナミックレンジ制御フレームの1つ以上のシフトノードの各々のビット表現が、前記1つの基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームに対応するビットストリーム部分に埋め込まれ、前記ダイナミックレンジ制御フレームのうちの前記1つの基準ダイナミックレンジ制御フレームのノードの各残りのノードのビット表現が、前記1つの基準ダイナミックレンジ制御フレームに対応するビットストリーム部分の中に埋め込まれる、ステップと、を含む。
本発明は更に、オーディオ復号器を操作する方法を提供し、その方法は、
符号化済みオーディオビットストリームを復号化して、連続的なオーディオフレームを含むオーディオ信号を再生するステップと、
符号化済みダイナミックレンジ制御ビットストリームを復号化して、オーディオ信号に対応しかつ連続的なダイナミックレンジ制御フレームを含むダイナミックレンジ制御シーケンスを再生するステップと、を含み、
前記符号化済みダイナミックレンジ制御ビットストリームは、ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレームに対応するビットストリーム部分を含み、
符号化済みダイナミックレンジ制御ビットストリームは、複数のノードのビット表現を含み、それらノードの1つのノードの各ビット表現が、オーディオ信号ASのためのゲイン情報と、そのゲイン情報がどの時点に対応するかを示す時間情報とを含み、
符号化済みダイナミックレンジ制御ビットストリームは、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームの複数のノードから選択されたシフトノードのビット表現であって、前記1つの基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームに対応するビットストリーム部分に埋め込まれたビット表現を含み、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームのノードの各残りのノードのビット表現は、1つの基準ダイナミックレンジ制御フレームに対応するビットストリーム部分内に埋め込まれており、
ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームの残りのノードの各残りのノードのビット表現が復号化されて、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームの各残りのノードを再生し、
ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームのノードから選択されたシフトノードの各シフトノードのビット表現が復号化されて、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームのノードから選択されたシフトノードの各シフトノードを再生し、
再生された残りのノードと再生されたシフトノードとを結合して、基準ダイナミックレンジ制御フレームを再生する。
他の態様において、本発明は、プロセッサ上で作動するとき、本発明に係る方法を実行するためのプログラムを提供する。
以下に、本願発明の好ましい実施形態について添付図面を参照しながら説明する。
本発明に従うオーディオ符号化装置の一実施形態を概略的に示す。 オーディオ符号化の文脈において適用されるダイナミックレンジ制御の原理を概略的に示す。 ダイナミックレンジ制御ゲインシーケンスの符号化のための異なるモードを概略的に示す。 オーディオ符号化の文脈におけるダイナミックレンジ制御の適用例を概略的に示す。 本発明に従うノードに関するシフト処理を概略的に示す。 本発明に従う時間情報の符号化を概略的に示す。 本発明に従うゲイン情報の符号化を概略的に示す。 本発明に従う傾き情報の符号化を概略的に示す。 本発明に従うオーディオ復号化装置の一実施形態を概略的に示す。
図1は本発明に従うオーディオ符号化装置の一実施形態を概略的に示す。オーディオ符号化装置1は、
連続的なオーディオフレームAFP,AFR,AFSを含むオーディオ信号ASから符号化済みオーディオビットストリームABSを生成するよう構成されたオーディオ符号器2と、
オーディオ信号ASに対応しかつ連続的なダイナミックレンジ制御フレームDFP,DFR,DFSを含むダイナミックレンジ制御シーケンスDSから、符号化済みダイナミックレンジ制御ビットストリームDBSを生成するよう構成されたダイナミックレンジ制御符号器3であって、ダイナミックレンジ制御フレームDFP,DFR,DFSの各ダイナミックレンジ制御フレームDFP,DFR,DFSは、1つ以上のノードA0...A5;B0...B2;C0を含み、それら1つ以上のノードA0...A5;B0...B2;C0の各ノードが、オーディオ信号ASについてのゲイン情報GA0...GA5;GB0...GB2;GC0と、それらゲイン情報GA0...GA5;GB0...GB2;GC0がどの時点に対応するかを示す時間情報TA0...TA5;TB0...TB2;TC0とを含む、ダイナミックレンジ制御符号器3と、を含み、
前記ダイナミックレンジ制御符号器3は、符号化済みダイナミックレンジ制御ビットストリームDBSが、前記ダイナミックレンジ制御フレームDFP,DFR,DFSの各ダイナミックレンジ制御フレームDFP,DFR,DFSに対応するビットストリーム部分DFP’,DFR’,DFS’を含むように構成されており、
前記ダイナミックレンジ制御符号器2はシフト処理を実行するよう構成されており、そのシフト処理では、ダイナミックレンジ制御フレームDFP,DFR,DFSのうちの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2の1つ以上のノードB1,B2がシフトノードB1,B2として選択され、前記1つの基準ダイナミックレンジ制御フレームDFRの1つ以上のシフトノードB1,B2の各々のビット表現B'1,B'2が、前記1つの基準ダイナミックレンジ制御フレームDFRに後続するダイナミックレンジ制御フレームDFSに対応するビットストリーム部分DFS’に埋め込まれ、前記ダイナミックレンジ制御フレームDFP,DFR,DFSのうちの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2の各残りのノードB0のビット表現B'0が、前記1つの基準ダイナミックレンジ制御フレームDFRに対応するビットストリーム部分DFR’の中に埋め込まれる。
本発明によれば、本提案の方法が使用されていない場合と比較して、結果的なビットストリームシーケンスDBSを変更せずに、基準ダイナミックレンジ制御フレームDFRに必要なピークビットレートを制御することが可能になる。本提案の手法は、現状技術のオーディオ符号器によって導入された1つのフレームの固有の遅延を利用して、1つのフレーム内のノード数のピークを、それらノードの幾つかの伝送を次の後続するダイナミックレンジ制御フレームへと分配することで、低減させる。本提案の方法の詳細について以下に説明する。
上述したように、ダイナミックレンジ制御ゲインと比較して1フレームの遅延を導入するようなオーディオ符号化スキームと組み合わされた場合、復号化されたダイナミックレンジ制御ゲインは、オーディオ信号へと適用される前に1フレーム分だけ遅延される。これは、基準ダイナミックレンジ制御フレームのノードが、基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームにおいて、有効なオーディオ復号器出力へと適用されることを意味する。つまり、デフォルト遅延モードにおいて、基準ダイナミックレンジ制御フレームのノードと、その基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームのノードとを一緒に伝送し、かつ復号器において、対応するダイナミックレンジ制御ゲインを対応するオーディオ信号に対して遅延なしで直接的に適用することで十分である、ということを暗示している。
本発明ではこの事実を活用して、1つのダイナミックレンジ制御フレーム内で伝送されるノードの最大数を低減させる。本発明によれば、基準ダイナミックレンジ制御フレームのノードの幾つかは後続のダイナミックレンジ制御フレームへとシフトされるが、このシフトは符号化の前に実行されてもよい。後段で説明するように、シフトノードは、ゲイン差及び傾き情報を符号化するためだけに、後続のダイナミックレンジ制御フレーム内の最初のノードよりも「先行する」ことができる。時間差情報を符号化するために、異なる方法が適用されてもよい。
図1に示す実例において、先行のダイナミックレンジ制御フレームDFPは6個のノードA0...A5を含み、その中でノードA4,A5はビットストリーム部分DFR’内へとシフトされる。さらに、基準ダイナミックレンジ制御フレームDFRは3個のノードB0...B2を含む。シフトノードA4,A5と基準ダイナミックレンジ制御フレームDFRのノードB0...B2との数の合計は5個に等しく、この数は後続のダイナミックレンジ制御フレームDFSのノードC0の数よりも大きい。よって、ノードB1,B2がビットストリーム部分DFS’内へとシフトされるような方法で、シフト処理が開始される。ダイナミックレンジ制御フレームDFS,DFR,DFP内のノードの最大数は6個に等しいが、ビットストリーム部分DFS’,DFR’,DFP’内のノードの最大数は4個に等しく、それによりビットストリームのピークが防止される。
本発明の好ましい実施形態に従えば、オーディオフレームAFP,AFR,AFSの時間的サイズは、ダイナミックレンジ制御フレームDFP,DFR,DFSの時間的サイズと等しい。
本発明の好ましい実施形態に従えば、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つのフレームの1つ以上のノードA0...A5;B0...B2;C0は、均一な時間グリッドから選択される。
本発明の好ましい一実施形態に従えば、ダイナミックレンジ制御符号器3は、エントロピー符号化技術を使用してノードA0...A5;B0...B2;C0を符号化するよう構成されている。
更なる態様において、本発明はオーディオ符号化装置1を操作する方法を提供し、その方法は、
連続的なオーディオフレームAFP,AFR,AFSを含むオーディオ信号ASから符号化済みオーディオビットストリームABSを生成するステップと、
オーディオ信号ASに対応しかつ連続的なダイナミックレンジ制御フレームDFP,DFR,DFSを含むダイナミックレンジ制御シーケンスDSから、符号化済みダイナミックレンジ制御ビットストリームDBSを生成するステップであって、前記ダイナミックレンジ制御フレームDFP,DFR,DFSの各ダイナミックレンジ制御フレームDFP,DFR,DFSは、1つ以上のノードA0...A5;B0...B2;C0を含み、それら1つ以上のノードA0...A5;B0...B2;C0の各ノードが、オーディオ信号ASについてのゲイン情報GA0...GA5;GB0...GB2;GC0と、それらゲイン情報GA0...GA5;GB0...GB2;GC0がどの時点に対応するかを示す時間情報TA0...TA5;TB0...TB2;TC0とを含むものであり、前記符号化済みダイナミックレンジ制御ビットストリームDBSは、前記ダイナミックレンジ制御フレームDFP,DFR,DFSの各ダイナミックレンジ制御フレームDFP,DFR,DFSに対応するビットストリーム部分DFP’,DFR’,DFS’を含む、ステップと、
シフト処理を実行するステップであって、前記ダイナミックレンジ制御フレームDFP,DFR,DFSのうちの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2の1つ以上のノードB1,B2がシフトノードB1,B2として選択され、前記1つの基準ダイナミックレンジ制御フレームDFRの1つ以上のシフトノードB1,B2の各々のビット表現B'1,B'2が、前記1つの基準ダイナミックレンジ制御フレームDFRに後続するダイナミックレンジ制御フレームDFSに対応するビットストリーム部分DFS’の中に埋め込まれ、前記ダイナミックレンジ制御フレームDFP,DFR,DFSのうちの前記1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2の各残りのノードB0のビット表現B'0が、前記1つの基準ダイナミックレンジ制御フレームDFRに対応するビットストリーム部分DFR’の中に埋め込まれる、ステップと、を含む。
図2は、オーディオ符号化の文脈において適用されるダイナミックレンジ制御の原理を概略的に示す。
信号に対してDRCを適用する処理は、オーディオ信号x(k)を時変ゲイン値g(k)で単純に乗算することで表現され得る。
[数1]
y(k)=g(k)x(k) (1)
ここで、kはサンプル時間インデックスである。ゲインg(k)の値は、例えば入力信号x(k)の二乗平均平方根の短時間推定に基づいて計算される。適切なゲイン値を決定するためのより詳細な手法については、非特許文献1で説明されている。以下では、時変ゲインg(k)をゲインシーケンスと呼ぶ。
本発明は、オーディオ信号ASとダイナミックレンジ制御シーケンスDSとの両方が符号化されかつ伝送されるような適用例のシナリオについて言及する。この場合、ダイナミックレンジ制御ゲインは、オーディオ信号ASに対して直接的に適用される訳ではなく、符号化されて、符号化済みオーディオ信号ABSと一緒に伝送される。復号化装置4では、オーディオビットストリームABSとダイナミックレンジ制御ビットストリームDBSとの両方が復号化され、そのダイナミックレンジ制御情報が対応するオーディオ信号ASに対して適用される。
一態様において、本発明は、本発明に係るオーディオ符号化装置1と、本発明に係るオーディオ復号化装置4とを含むシステムを提供する。
図3は、ダイナミックレンジ制御ゲインシーケンスを符号化するための異なるモード、即ちフルフレームモード(A)と遅延モード(B)とを概略的に示す。フレームnにおいて受信されたゲインノードは円形として示され、フレームn+1において受信されたゲインノードは四角形として示される。実線は、DRCフレームn+1までの補間されたDRCゲインを示す。
原則的に、ダイナミックレンジ制御符号化/復号化の連鎖は2つのモードで操作され得る。所謂フルフレームモードと呼ばれる場合とは、特定のダイナミックレンジ制御フレームに対応する受信されたダイナミックレンジ制御ビットストリームを復号化した後で、そのダイナミックレンジ制御フレームの各サンプル位置におけるゲインが、復号化されたノードに基づいて補間した後に直ちに決定され得る場合である。これは、各フレーム境界において、即ちそのダイナミックレンジ制御フレームの最後のサンプルに対応するサンプル位置において、1つのノードが伝送されねばならないことを暗示している。ダイナミックレンジ制御フレーム長さがNであれば、これはつまり、最後に伝送されるノードが、そのフレーム内のサンプル位置Nに配置されねばならないことを意味する。これは図3の上部において「A」によって示されている。図示するように、n番目のフレームのダイナミックレンジ制御ゲインは、対応するオーディオフレームに対して直ちに適用され得る。
第2のモードは「遅延モード」と呼ばれ、図3の下部において「B」で示される。この場合、フレームn内の最後のサンプル位置についてノードが伝送されない。よって、DRC復号器は、フレームn内の最後のノードに続く全てのゲイン値の必要な補間を実行するために、DRCフレームn+1の復号化を待たなければならない。なぜなら、フレームnの最後のノードとフレームn+1内の最初のノードとの間の補間を実行するために、フレームn+1の最初のノードの情報が既知でなければならないからであり、その補間を介してそれらノード間のゲイン値を決定できる。
図4はオーディオ符号化の文脈におけるダイナミックレンジ制御の適用例を概略的に示し、この場合、オーディオ符号器は、ダイナミックレンジ符号化スキームと比較して1フレームの遅延を導入する。
図5は本発明に従うノードに関するシフト処理を概略的に示す。左側には現状技術の手法を使用した場合の状況を示し、右側には本提案の方法を示す。各四角形はノードA0...A5;B0...B2;C0に対応する。
本発明の好ましい一実施例によれば、基準ダイナミックレンジ制御フレームDFRのノードB0...B2の数が所定の閾値を上回る場合に、シフト処理が開始される。
本発明の好ましい一実施例によれば、基準ダイナミックレンジ制御フレームDFRのノードB0...B2の数と、基準ダイナミックレンジ制御フレームDFRに先行するダイナミックレンジ制御フレームDFPからのシフトノードA4,A5の数であって、基準ダイナミックレンジ制御フレームDFRに対応するビットストリーム部分DFR'内に埋め込まれるべきシフトノードの数と、の合計が所定の閾値を上回る場合に、シフト処理が開始される。
本発明の好ましい一実施例によれば、基準ダイナミックレンジ制御フレームDFRのノードB0...B2の数と、基準ダイナミックレンジ制御フレームDFRに先行するダイナミックレンジ制御フレームDFPからのシフトノードA4,A5の数であって、基準ダイナミックレンジ制御フレームDFRに対応するビットストリーム部分DFR'内に埋め込まれるべきシフトノードの数と、の合計が基準ダイナミックレンジ制御フレームDFRに後続するダイナミックレンジ制御フレームDFSのノードC0の数を上回った場合に、シフト処理が開始される。
上述したように、ダイナミックレンジ制御フレームと比較して1フレームの遅延を導入するようなオーディオ符号化スキームと組み合わされた場合、復号化されたダイナミックレンジ制御ゲインは、オーディオ信号へと適用される前に1フレーム分だけ遅延される。図5の左側を考慮した場合、これは、n番目のフレームのノードAiが、有効なオーディオ復号器出力に対してフレームn+1において適用されることを意味する。つまり、デフォルト遅延モードにおいては、ノードAiとノードB0とを一緒にフレームn+1において伝送し、復号器では、対応するDRCゲインを対応するオーディオ出力信号に対して遅延なしで直接的に適用することで十分であることを暗示している。
この事実は、本提案の方法において、1フレーム内で伝送されるノードの最大数を低減させるために利用される。このことは、図5の右側に示されている。図示した実例においては、ノードA4,A5が符号化の前にフレームn+1へとシフトされ、フレームn内のノードの最大数が6から4へと低減されている。以下に説明するように、ノードA4及びA5は、ゲイン差と傾き情報を符号化するためだけに、フレームn+1内の最初のノード、即ちB0に「先行」している。時間差情報の符号化については、異なる方法が適用されねばならない。
図6は本発明に係る時間情報の符号化を概略的に示す。
本発明の好ましい実施例によれば、1つ以上のノードA0...A5;B0...B2;C0の時間情報TA0...TA5;TB0...TB2;TC0は、1つ以上のシフトノードA4,A5;B1,B2が、時間情報TA4,TA5;TB1,TB2を使用して識別され得るような方法で表現される。
本発明の好ましい一実施例によれば、1つ以上のシフトノードA4,A5;B1,B2の時間情報TA4,TA5;TB1,TB2は、各ノードA4,A5;B1,B2が帰属するダイナミックレンジ制御フレームDFP;DFRの開始点から、各ノードA4,A5;B1,B2が帰属するダイナミックレンジ制御フレームDFP;DFR内の各ノードA4,A5;B1,B2の時間的位置までの、時間差t_A4,t_A5;t_B1,t_B2と、各ダイナミックレンジ制御フレームDFP;DFRに後続するダイナミックレンジ制御フレームDFR;DFSの時間的サイズ以上の大きさを有するオフセット値drcFrameSizeと、の合計により表現される。
まず、ノードのペア間の時間差の符号化について考察する。図6において、ノードのペア間についての時間差を決定する状況を、図4に係る実例に関して示す。ここで、t_Aiは、1フレーム内の可能なノード位置のグリッド上でのノードAiのサンプル位置を表している。上述したように、ノードは均一な時間グリッド上で選択されることができ、その場合、このグリッドの間隔は最高の利用可能な時間分解能deltaTminを定義する。つまり、時間情報t_Aiは、2つのノード間の時間差が常にdeltaTminの整数倍となるサンプル位置で与えられる。
ノードの時間的位置情報は、差分的な方法で、即ち先行ノードの位置との相対関係において符号化される。あるノードが1つのフレーム内の最初のノードである場合、時間差はフレームの開始点との比較において決定される。図6の左側には、ノードシフトが全く適用されない場合の状況が描かれている。この場合、ノードA4の差分時間情報tDrcDelta_A4は、
tDrcDelta_A4=t_A4−t_A3
として計算される。この差分時間値は、次に、適切なハフマンテーブル内の対応するエントリを使用して、例えば表1又は表2に従って符号化される。他の実例として、ノードB0の符号化された時間差に注目する。ノードB0はフレームn+1の最初のノードであるため、対応する時間差はその符号化の開始点との比較において決定される。即ち、
tDrcDelta_B0=t_B0
となる。
ここで、ノードシフトを使用する本提案のノードリザーバ技術のためのノード位置の符号化について考察する。例えば、図6の右側に示す実例に関し、ノードA4及びA5が符号化のために次のフレームにシフトされている。ノードA0〜A3の表現には変更がなく、従って符号化された時間差にも変更がない。同様に、ノードB0の符号化された位置情報にも変更がない。しかしながら、ノードA4及びA5の時間情報は異なる方法で処理される。図6に示すように、ノードA4のサンプル位置を示すオリジナル値t_A4は、符号器においてオフセットdrcFrameSizeを加算することで修正される。結果として得られる位置情報が、通常の符号化の場合に可能な最大値を超えているので、そのオフセットは復号器に対し、対応するノードが先行フレームのコンテキスト内で更に処理されねばならないことを示す。更に復号器は、復号化された値からオフセットdrcFrameSizeを引き算することで、オリジナルサンプル位置t_A4が得られることを認識している。
次に、図6の右側に示す状況について、実際に符号化される時間差情報の計算について考察する。符号化の効率上の理由から、ノードA4のノードB0に対する差分位置情報が計算される。図6の左側に関して上述した状況とは対照的に、この場合の差分時間情報は、
tDrcDelta_A4=t_A4+drcFrameSize−t_B0
に従って、即ち、オフセットを含んで計算される。同様に、ノードA5については、
tDrcDelta_A5=t_A5+drcFrameSize−t_A4−drcFrameSize
が得られ、これは明らかに
tDrcDelta_A5=t_A5−t_A4
と同じである。これらの差分時間値は、正確なハフマンテーブルの対応する符号語エントリを使用して、例えば表1又は表2に従って符号化される。
時間位置情報を復号化する方法は以下のように要約され得る。復号器は、ビットストリームから、対応する符号語に基づいて、ノードの時間差情報を抽出する。この時間情報は、先行ノードの時間情報に対して時間差情報を加算することで取得される。結果として得られるサンプル位置がdrcFrameSizeよりも大きい場合には、復号器は、現在のノードがまるで先行フレームの最後のノードであったかのように処理されるべきこと、即ち、それが先行フレーム内で復号化されたノードに付加されるべきことを認識する。正確なサンプル位置は、復号化された時間値からオフセット値drcFrameSizeを引き算することで決定される。復号化されたフレーム内で更なるシフトノードが発生した場合には、同様の処理ステップが類似の方法で適用される。
1フレーム全体の時間情報を復号化しかつ修正した後で、復号器は、何個のノードが先行フレームへとシフトバックされていたかを(符号器においてこの情報を明示的に提供することなく)認知し、かつ、その先行フレーム内のどのサンプル位置にそれらノードが配置されるかも認知する。シフトノードの数についての情報は、以下のようなゲイン及び傾き情報を復号化する文脈において、更に活用されるであろう。
図7は、本発明に従うゲイン情報の符号化を概略的に示す。
本発明の好ましい一実施例に従えば、基準ダイナミックレンジ制御フレームDFRに後続するダイナミックレンジ制御フレームDFSに対応するビットストリーム部分DFS’の最初の位置にあるシフトノードB1のビット表現B'1のゲイン情報GB1は、絶対ゲイン値g_B1によって表現され、他方、基準ダイナミックレンジ制御フレームDFRに後続するダイナミックレンジ制御フレームDFSに対応するビットストリーム部分DFS’の最初の位置にあるノードB1のビット表現B'1よりも後の位置にあるシフトノードB2の各ビット表現B'2のゲイン情報GB2は、相対ゲイン値によって表現され、その相対ゲイン値は、それぞれのシフトノードB2のビット表現B'2のゲイン値g_B2と、それぞれのノードB2のビット表現B'2に先行するノードB1のビット表現B'1のゲイン値g_B1と、の差に等しい。
本発明の好ましい一実施形態に従えば、基準ダイナミックレンジ制御フレームDFRの1つ以上のシフトノードB1,B2のビット表現B'1,B'2が、基準ダイナミックレンジ制御フレームDFRに後続するダイナミックレンジ制御フレームDFSに対応するビットストリーム部分DFS’内に埋め込まれる場合には、1つ以上のシフトノードB1,B2のビット表現B'1,B'2の1つ以上の位置より後で、基準ダイナミックレンジ制御フレームDFRに後続するダイナミックレンジ制御フレームDFSに対応するビットストリーム部分DFS’の最初の位置にある、後続のダイナミックレンジ制御フレームDFSのノードC0のビット表現C'0のゲイン情報GC0は、相対ゲイン値によって表現され、その相対ゲイン値は、それぞれのノードC0のビット表現C'0のゲイン値g_C0と、それぞれのノードC0のビット表現C'0に先行するシフトノードB2のビット表現B'2のゲイン値g_B2と、の差に等しい。
図7には、ノードのペアについてのゲイン差を決定する状況が、図5に係る実例について示されており、ここで、g_AiはノードAiのゲイン値を示す。
まず、ノードA4に関する差分ゲイン値について考察する。図7の左側に示す、ノードリザーバを用いない手法については、差分ゲイン値gainDelta_A4が、先行ノードA3とノードA4の(dBにおける)ゲイン値の差から計算される。即ち、
gainDelta_A4=g_A4−g_A3
となる。この差分ゲイン値は、次に、適切なハフマンテーブルの中の対応するエントリを使用して符号化される。更に、図7の左側のフレームn+1の最初のノードについて考察する。B0はそのフレームの最初のノードであるから、そのゲイン値は、差分法では符号化されず、最初のゲイン値gainInitialの特異な符号化に従って符号化される。即ち、ゲイン値はその実際値として符号化される:
gainDelta_B0=g_B0
ノードA4が次のフレームn+1へとシフトされているような右側に示す状況については、符号化されたゲイン情報の値は異なる。図から分かるように、シフトされた後では、ゲイン差の符号化に関し、ノードA4がフレームn+1内の最初のノードとなる。よって、そのゲインは差分的方法で符号化されず、上述したように最初のゲイン値の特異な符号化が適用される。ノードA5の差分ゲイン値は、左側と右側とに示された両方の状況に関して同じままとなるであろう。ノードリザーバが使用された場合、ノードB0がノードA5の後に続くので、そのゲイン情報は、ノードB0とノードA5のゲイン差から決定されるであろう。即ち、
gainDelta_B0=g_B0−g_A5
となる。ノードリザーバ技術を適用する場合、ゲイン差を決定する方法だけが変化するものの、ゲインの再生された値は各ノードについて同じままであることに注意されたい。明らかに、フレームn及びn+1の全体のゲイン関連情報を復号化した後で、ノードA0〜B0について取得されるゲイン値は、左側に示す場合に取得されるゲイン値と同一であり、かつノードは、DRCゲインを対応するオーディオフレームへと適用するのに「間に合って」計算され得る。
前段で説明したように、シフトノードの数と先行フレーム内におけるそれらのサンプル位置とは、時間差情報を復号化した後では既知となる。図7の右側で示したように、フレームnからのシフトノードのゲイン値は、フレームn+1の受信されたゲイン情報の開始から直ちに開始する。従って、シフトノードの数についての情報は、復号器にとって、各ゲイン値を正しいフレーム内の正しいサンプル位置へと割り当てるために十分である。図7の右側に示す実例を考慮する場合、フレームn+1の最初の2個の復号化されたゲイン値は先行フレームの最後のゲイン値へと付加されるべきであり、他方、3番目のゲイン値は現フレーム内の最初のノードの正しいゲイン値に対応することを、復号器は認識している。
図8は本発明に従う傾き情報の符号化を概略的に示す。
本発明の好ましい一実施形態に従えば、1つ以上のノードA0...A5;B0...B2;C0の各ノードA0...A5;B0...B2;0は、傾き情報SA0...SA5;SB0...SB2;SC0を含む。
次に、図8に示された傾き情報の符号化について考察する。ノードの傾き情報は、ノードのペア間の差分的方法で符号化される訳ではなく、各ノードについて独立して符号化される。従って、傾き関連の情報は、ノードリザーバを使用する場合と使用しない場合との両方で変化が無い。ゲイン値を符号化する場合と同様に、傾き情報に関する符号語を生成するハフマンテーブルは、本提案のノードシフトを使用する場合と使用しない場合との両方で同じである。傾き情報を正しいフレーム内の正しいサンプル位置へと割り当てることは、ゲイン値を復号化する場合と同様に実行される。
フレームn+1について受信された全てのノード情報が復号化され、もし適用可能であれば先行フレームnへとシフトバックされた後に、フレームnについてスプライン又は線形補間を使用するゲイン補間が通常の方法で実行され、対応するオーディオフレームへとゲイン値が適用され得る。
図9は本発明に従うオーディオ復号化装置の一実施形態を概略的に示す。オーディオ復号化装置4は、
符号化済みオーディオビットストリームABSを復号化して、連続的なオーディオフレームAFP,AFR,AFSを含むオーディオ信号ASを再生するオーディオ復号器5と、
符号化済みダイナミックレンジ制御ビットストリームDBSを復号化して、オーディオ信号ASに対応しかつ連続的なダイナミックレンジ制御フレームDFP,DFR,DFSを含むダイナミックレンジ制御シーケンスDSを再生するダイナミックレンジ制御復号器6と、を含み、
前記符号化済みダイナミックレンジ制御ビットストリームDBSは、ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレームDFP,DFR,DFSに対応するビットストリーム部分DFP’,DFR’,DFS’を含み、
符号化済みダイナミックレンジ制御ビットストリームDBSは、ノードA0...A5;B0...B2;C0のビット表現A'0...A'5;B'0...B'2;C'0を含み、それらノードの1つのノードの各ビット表現が、オーディオ信号ASのためのゲイン情報GA0...GA5;GB0...GB2;GC0と、それらゲイン情報GA0...GA5;GB0...GB2;GC0がどの時点に対応するかを示す時間情報TA0...TA5;TB0...TB2;TC0とを含み、
符号化済みダイナミックレンジ制御ビットストリームDBSは、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2から選択されたシフトノードB1,B2のビット表現B'1,B'2であって、1つの基準ダイナミックレンジ制御フレームDFRに後続するダイナミックレンジ制御フレームDFSに対応するビットストリーム部分内に埋め込まれたビット表現を含み、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2の各残りのノードB0のビット表現B'0は、1つの基準ダイナミックレンジ制御フレームDFRに対応するビットストリーム部分DFR’内に埋め込まれており、
ダイナミックレンジ制御復号器6は、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRの各残りのノードB0のビット表現B'0を復号化して、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRの各残りのノードB0を再生し、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2から選択されたシフトノードB1,B2の各シフトノードB1,B2のビット表現B'1,B'2を復号化して、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードから選択されたシフトノードB1,B2の各シフトノードB1,B2を再生し、更に再生された残りのノードB0と再生されたシフトノードB1,B2とを結合して、基準ダイナミックレンジ制御フレームDFRを再生するよう構成されている。
本発明の好ましい一実施形態に従えば、ダイナミックレンジ制御復号器6は、時間情報TA4,TA5;TB1,TB2を使用して、1つ以上のシフトノードA4,A5;B1,B2を識別するよう構成されている。
本発明の好ましい一実施形態に従えば、1つ以上のシフトノードA4,A5;B1,B2の時間情報TA4,TA5;TB1,TB2であって、各ノードA4,A5;B1,B2が帰属するダイナミックレンジ制御フレームDFP;DFRの開始点から各ノードA4,A5;B1,B2が帰属するダイナミックレンジ制御フレームDFP;DFR内の各ノードA4,A5;B1,B2の時間的位置までの時間差t_A4,t_A5;t_B1,t_B2と、各ダイナミックレンジ制御フレームDFP;DFRに後続するダイナミックレンジ制御フレームDFR;DFSの時間的サイズ以上の大きさを有するオフセット値drcFrameSizeと、の合計により表現される時間情報を、ダイナミックレンジ制御復号器6が復号化するよう構成されている。
本発明の好ましい一実施形態に従えば、ダイナミックレンジ制御復号器6は、基準ダイナミックレンジ制御フレームDFRに後続するダイナミックレンジ制御フレームDFSに対応するビットストリーム部分DFS’の最初の位置にあるシフトノードB1のビット表現B'1のゲイン情報GB1であって、絶対ゲイン値g_B1によって表現されるゲイン情報GB1を復号化し、且つ、基準ダイナミックレンジ制御フレームDFRに後続するダイナミックレンジ制御フレームDFSに対応するビットストリーム部分DFS’の最初の位置にあるノードB1のビット表現B'1よりも後の位置にあるシフトノードB2の各ビット表現B'2のゲイン情報GB2であって、それぞれのシフトノードB2のビット表現B'2のゲイン値g_B2と、それぞれのノードB2のビット表現B'2に先行するノードB1のビット表現B'1のゲイン値g_B1との差に等しい、相対ゲイン値によって表現されるゲイン情報GB2を復号化するよう構成されている。
本発明の好ましい一実施形態に従えば、ダイナミックレンジ制御復号器6は、1つ以上のシフトノードB1,B2のビット表現B'1,B'2の1つ以上の位置より後で、基準ダイナミックレンジ制御フレームDFRに後続するダイナミックレンジ制御フレームDFSに対応するビットストリーム部分DFS’の最初の位置にある、後続のダイナミックレンジ制御フレームDFSのノードC0のビット表現C'0のゲイン情報GC0を復号化するよう構成され、そのゲイン情報GC0は、それぞれのノードC0のビット表現C'0のゲイン値g_C0と、それぞれのノードC0のビット表現C'0に先行するシフトノードB2のビット表現B'2のゲイン値g_B2と、の差に等しい相対ゲイン値によって表現される。
本発明の好ましい一実施形態に従えば、オーディオフレームAFP,AFR,AFSの時間的サイズは、ダイナミックレンジ制御フレームDFP,DFR,DFSの時間的サイズと等しい。
本発明の好ましい一実施形態に従えば、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つのフレームの1つ以上のノードA0...A5;B0...B2;C0は、均一な時間グリッドから選択される。
本発明の好ましい一実施形態に従えば、1つ以上のノードA0...A5;B0...B2;C0の各ノードの1つ以上のノードA0...A5;B0...B2;C0は、傾き情報SA0...SA5;SB0...SB2;SC0を含む。
本発明の好ましい一実施形態に従えば、ダイナミックレンジ制御復号器6は、ノードのビット表現A'0...A'5;B'0...B'2;C'0を、エントロピー復号化技術を使用して復号化するよう構成されている。
本発明の他の態様は、オーディオ復号化装置を操作する方法を提供し、その方法は、
符号化済みオーディオビットストリームABSを復号化して、連続的なオーディオフレームAFP,AFR,AFSを含むオーディオ信号ASを再生するステップと、
符号化済みダイナミックレンジ制御ビットストリームDBSを復号化して、オーディオ信号ASに対応しかつ連続的なダイナミックレンジ制御フレームDFP,DFR,DFSを含むダイナミックレンジ制御シーケンスDSを再生するステップと、を含み、
前記符号化済みダイナミックレンジ制御ビットストリームDBSは、ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレームDFP,DFR,DFSに対応するビットストリーム部分DFP’,DFR’,DFS’を含み、
符号化済みダイナミックレンジ制御ビットストリームDBSは、ノードA0...A5;B0...B2;C0のビット表現A'0...A'5;B'0...B'2;C'0を含み、それらノードの1つのノードの各ビット表現が、オーディオ信号ASのためのゲイン情報GA0...GA5;GB0...GB2;GC0と、それらゲイン情報GA0...GA5;GB0...GB2;GC0がどの時点に対応するかを示す時間情報TA0...TA5;TB0...TB2;TC0とを含み、
符号化済みダイナミックレンジ制御ビットストリームDBSは、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2から選択されたシフトノードB1,B2のビット表現B'1,B'2であって、1つの基準ダイナミックレンジ制御フレームDFRに後続するダイナミックレンジ制御フレームDFSに対応するビットストリーム部分内に埋め込まれたビット表現を含み、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2の各残りのノードB0のビット表現B'0は、1つの基準ダイナミックレンジ制御フレームDFRに対応するビットストリーム部分DFR’内に埋め込まれており、
ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードB 0 ...B 2 の各残りのノードB0のビット表現B'0が復号化されて、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRの各残りのノードB0が再生され、
ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2から選択されたシフトノードB1,B2の各シフトノードB1,B2のビット表現B'1,B'2が復号化されて、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードから選択されたシフトノードB1,B2の各シフトノードB1,B2が再生され、
再生された残りのノードB0と再生されたシフトノードB1,B2とが結合されて、基準ダイナミックレンジ制御フレームDFRが再生される。
復号化装置、符号化装置及び上述した方法に関し、以下の点に留意すべきである。
これまで装置の文脈で幾つかの態様を示してきたが、これらの態様は対応する方法の説明をも表しており、1つのブロック又は装置が1つの方法ステップ又は方法ステップの特徴に対応することは明らかである。同様に、方法ステップを説明する文脈で示した態様もまた、対応する装置の対応するブロックもしくは項目又は特徴を表している。
所定の構成要件にもよるが、本発明の実施形態は、ハードウエア又はソフトウエアにおいて構成可能である。この構成は、その中に格納される電子的に読み取り可能な制御信号を有し、本発明の各方法が実行されるようにプログラム可能なコンピュータシステムと協働する(又は協働可能な)、デジタル記憶媒体、例えばフレキシブルディスク,DVD,CD,ROM,PROM,EPROM,EEPROM,フラッシュメモリなどのデジタル記憶媒体を使用して実行することができる。
本発明に従う幾つかの実施形態は、上述した方法の1つを実行するようプログラム可能なコンピュータシステムと協働可能で、電子的に読み取り可能な制御信号を有するデータキャリアを含む。
一般的に、本発明の実施例は、プログラムコードを有するコンピュータプログラム製品として構成することができ、そのプログラムコードは当該コンピュータプログラム製品がコンピュータ上で作動するときに、本発明の方法の一つを実行するよう作動可能である。そのプログラムコードは例えば機械読み取り可能なキャリアに記憶されていても良い。
本発明の他の実施形態は、上述した方法の1つを実行するための、機械読み取り可能なキャリア又は非一時的記憶媒体に格納されたコンピュータプログラムを含む。
換言すれば、本発明の方法のある実施形態は、そのコンピュータプログラムがコンピュータ上で作動するときに、上述した方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
本発明の他の実施形態は、上述した方法の1つを実行するために記録されたコンピュータプログラムを含む、データキャリア(又はデジタル記憶媒体、又はコンピュータ読み取り可能な媒体)である。
本発明の他の実施形態は、上述した方法の1つを実行するためのコンピュータプログラムを表現するデータストリーム又は信号列である。そのデータストリーム又は信号列は、例えばインターネットのようなデータ通信接続を介して伝送されるよう構成されても良い。
他の実施形態は、上述した方法の1つを実行するように構成又は適応された、例えばコンピュータ又はプログラム可能な論理デバイスのような処理手段を含む。
他の実施形態は、上述した方法の1つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。
幾つかの実施形態においては、(例えば書換え可能ゲートアレイのような)プログラム可能な論理デバイスが、上述した方法の幾つか又は全ての機能を実行するために使用されても良い。幾つかの実施形態では、書換え可能ゲートアレイは、上述した方法の1つを実行するためにマイクロプロセッサと協働しても良い。一般的に、そのような方法は、好適には任意のハードウエア装置によって実行される。
本発明は複数の実施形態に関して説明されてきたが、本発明の範囲内における修正版、変更版及び同等版が存在可能である。本明細書に記載した方法及び要素の構成について多数の代替方法があることに注意すべきである。従って、添付した特許請求の範囲は、全てのそのような修正版、変更版及び同等版を、本発明の真正な精神と範囲の中に包含するものとして解釈されるべきである。
1 オーディオ符号化装置
2 オーディオ符号器
3 ダイナミックレンジ制御符号器
4 オーディオ復号化装置
5 オーディオ復号器
6 ダイナミックレンジ制御復号器
ABS 符号化済みオーディオビットストリーム
AS オーディオ信号
AFP 先行オーディオフレーム
AFR 基準オーディオフレーム
AFS 後続オーディオフレーム
DBS 符号化済みダイナミックレンジ制御ビットストリーム
DS ダイナミックレンジ制御シーケンス
DFP 先行ダイナミックレンジ制御フレーム
DFR 基準ダイナミックレンジ制御フレーム
DFS 後続ダイナミックレンジ制御フレーム
0...A5 先行オーディオフレームのノード
0...B2 基準オーディオフレームのノード
0 後続オーディオフレームのノード
DFP’ 先行ダイナミックレンジ制御フレームに対応するビットストリーム部分
DFR’ 基準ダイナミックレンジ制御フレームに対応するビットストリーム部分
DFS’ 後続ダイナミックレンジ制御フレームに対応するビットストリーム部分
TA0...TA5 先行ダイナミックレンジ制御フレームのノードの時間情報
TB0...TB2 基準ダイナミックレンジ制御フレームのノードの時間情報
TC0 後続ダイナミックレンジ制御フレームのノードの時間情報
t_A0...t_A5 先行ダイナミックレンジ制御フレームのノードの時間差
t_B0...t_B2 基準ダイナミックレンジ制御フレームのノードの時間差
t_C0 後続ダイナミックレンジ制御フレームのノードの時間差
GA0...GA5 先行ダイナミックレンジ制御フレームのノードのゲイン情報
GB0...GB2 基準ダイナミックレンジ制御フレームのノードのゲイン情報
GC0 後続ダイナミックレンジ制御フレームのノードのゲイン情報
g_A0...g_A5 先行ダイナミックレンジ制御フレームのノードのゲイン値
g_B0...g_B2 基準ダイナミックレンジ制御フレームのノードのゲイン値
g_C0 後続ダイナミックレンジ制御フレームのノードのゲイン値
SA0...SA5 先行ダイナミックレンジ制御フレームのノードの傾き情報
SB0...SB2 基準ダイナミックレンジ制御フレームのノードの傾き情報
SC0 後続ダイナミックレンジ制御フレームのノードの傾き情報

Claims (25)

  1. オーディオ符号化装置であって、
    連続的なオーディオフレーム(AFP,AFR,AFS)を含むオーディオ信号(AS)から符号化済みオーディオビットストリーム(ABS)を生成するよう構成されたオーディオ符号器(2)と、
    前記オーディオ信号(AS)に対応しかつ連続的なダイナミックレンジ制御フレーム(DFP,DFR,DFS)を含むダイナミックレンジ制御シーケンス(DS)から、符号化済みダイナミックレンジ制御ビットストリーム(DBS)を生成するよう構成されたダイナミックレンジ制御符号器(3)であって、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の各ダイナミックレンジ制御フレーム(DFP,DFR,DFS)は、1つ以上のノード(A0...A5;B0...B2;C0)を含み、それら1つ以上のノード(A0...A5;B0...B2;C0)の各ノードが、前記オーディオ信号(AS)についてのゲイン情報(GA0...GA5;GB0...GB2;GC0)と、それらゲイン情報(GA0...GA5;GB0...GB2;GC0)がどの時点に対応するかを示す時間情報(TA0...TA5;TB0...TB2;TC0)とを含む、ダイナミックレンジ制御符号器(3)と、を含み、
    前記ダイナミックレンジ制御符号器(3)は、前記符号化済みダイナミックレンジ制御ビットストリーム(DBS)が、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の各ダイナミックレンジ制御フレーム(DFP,DFR,DFS)に対応するビットストリーム部分(DFP’,DFR’,DFS’)を含むように構成されており、
    前記ダイナミックレンジ制御符号器()はシフト処理を実行するよう構成されており、そのシフト処理において、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)のうちの1つの基準ダイナミックレンジ制御フレーム(DFR)のノード(B0...B2)の1つ以上のノード(B1,B2)がシフトノード(B1,B2)として選択され、前記1つの基準ダイナミックレンジ制御フレーム(DFR)の前記1つ以上のシフトノード(B1,B2)の各々のビット表現(B'1,B'2)が、前記1つの基準ダイナミックレンジ制御フレーム(DFR)に後続するダイナミックレンジ制御フレーム(DFS)に対応するビットストリーム部分(DFS’)の中に埋め込まれ、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)の前記ノード(B0...B2)の各残りのノード(B0)のビット表現(B'0)が、前記1つの基準ダイナミックレンジ制御フレーム(DFR)に対応する前記ビットストリーム部分(DFR’)の中に埋め込まれる、オーディオ符号化装置。
  2. 請求項1に記載のオーディオ符号化装置において、前記基準ダイナミックレンジ制御フレームの前記ノードの数が所定の閾値を上回る場合に、前記シフト処理が開始される、オーディオ符号化装置。
  3. 請求項1に記載のオーディオ符号化装置において、前記基準ダイナミックレンジ制御フレームのノードの数と、前記基準ダイナミックレンジ制御フレームに先行する前記ダイナミックレンジ制御フレームからのシフトノードの数であって、前記基準ダイナミックレンジ制御フレームに対応するビットストリーム部分内に埋め込まれるべきシフトノードの数と、の合計が所定の閾値を上回る場合に、前記シフト処理が開始される、オーディオ符号化装置。
  4. 請求項1に記載のオーディオ符号化装置において、前記基準ダイナミックレンジ制御フレーム(DFR)のノード(B0...B2)の数と、前記基準ダイナミックレンジ制御フレーム(DFR)に先行する前記ダイナミックレンジ制御フレーム(DFP)からのシフトノード(A4,A5)であって、前記基準ダイナミックレンジ制御フレーム(DFR)に対応するビットストリーム部分(DFR’)内に埋め込まれるべきシフトノードの数との合計が、前記基準ダイナミックレンジ制御フレーム(DFR)の前記後続のダイナミックレンジ制御フレーム(DFS)のノード(C0)の数を上回った場合に、前記シフト処理が開始される、オーディオ符号化装置。
  5. 請求項1乃至4のいずれか一項に記載のオーディオ符号化装置において、前記1つ以上のノード(A0...A5;B0...B2;C0)の前記時間情報(TA0...TA5;TB0...TB2;TC0)は、前記1つ以上のシフトノード(A4,A5;B1,B2)が、前記時間情報(TA4,TA5;TB1,TB2)を使用して識別され得るような方法で表現される、オーディオ符号化装置。
  6. 請求項1乃至5のいずれか一項に記載のオーディオ符号化装置において、前記1つ以上のシフトノード(A4,A5;B1,B2)の時間情報(TA4,TA5;TB1,TB2)は、前記各シフトノード(A4,A5;B1,B2)が帰属する前記ダイナミックレンジ制御フレーム(DFP;DFR)の開始点から、前記各シフトノード(A4,A5;B1,B2)が帰属する前記ダイナミックレンジ制御フレーム(DFP;DFR)内の前記各シフトノード(A4,A5;B1,B2)の時間的位置までの、時間差(t_A4,t_A5;t_B1,t_B2)と、前記各ダイナミックレンジ制御フレーム(DFP;DFR)に後続する前記ダイナミックレンジ制御フレーム(DFR;DFS)の時間的サイズ以上の大きさを有するオフセット値(drcFrameSize)と、の合計により表現される、オーディオ符号化装置。
  7. 請求項1乃至6のいずれか一項に記載のオーディオ符号化装置において、前記基準ダイナミックレンジ制御フレーム(DFR)の前記後続のダイナミックレンジ制御フレーム(DFS)に対応する前記ビットストリーム部分(DFS’)の最初の位置にある前記シフトノード(B1)のビット表現(B'1)のゲイン情報(GB1)は、絶対ゲイン値(g_B1)によって表現され、前記基準ダイナミックレンジ制御フレーム(DFR)の前記後続のダイナミックレンジ制御フレーム(DFS)に対応する前記ビットストリーム部分(DFS’)の最初の位置にある前記シフトノード(B1)のビット表現(B'1)よりも後の位置にあるシフトノード(B2)の各ビット表現(B'2)のゲイン情報(GB2)は相対ゲイン値によって表現され、その相対ゲイン値は、それぞれのシフトノード(B2)のビット表現(B'2)のゲイン値(g_B2)と、前記それぞれのシフトノード(B2)のビット表現(B'2)に先行する前記シフトノード(B1)のビット表現(B'1)のゲイン値(g_B1)との差に等しい、オーディオ符号化装置。
  8. 請求項1乃至7のいずれか一項に記載のオーディオ符号化装置において、前記基準ダイナミックレンジ制御フレーム(DFR)の1つ以上のシフトノード(B1,B2)の前記ビット表現(B'1,B'2)が、前記基準ダイナミックレンジ制御フレーム(DFR)の前記後続のダイナミックレンジ制御フレーム(DFS)に対応する前記ビットストリーム部分(DFS’)内に埋め込まれる場合には、前記1つ以上のシフトノード(B1,B2)のビット表現(B'1,B'2)の1つ以上の位置より後で、前記基準ダイナミックレンジ制御フレーム(DFR)に後続する前記ダイナミックレンジ制御フレーム(DFS)に対応する前記ビットストリーム部分(DFS’)の最初の位置にある、前記後続のダイナミックレンジ制御フレーム(DFS)のノード(C0)のビット表現(C'0)のゲイン情報(GC0)は相対ゲイン値によって表現され、その相対ゲイン値は、前記それぞれのノード(C0)のビット表現(C'0)のゲイン値(g_C0)と前記それぞれのノード(C0)のビット表現(C'0)に先行する前記シフトノード(B2)のビット表現(B'2)のゲイン値(g_B2)との差に等しい、オーディオ符号化装置。
  9. 請求項1乃至8のいずれか一項に記載のオーディオ符号化装置において、前記オーディオフレーム(AFP,AFR,AFS)の時間的サイズは、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の時間的サイズと等しい、オーディオ符号化装置。
  10. 請求項1乃至9のいずれか一項に記載のオーディオ符号化装置において、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の1つのフレームの前記1つ以上のノード(A0...A5;B0...B2;C0)が均一な時間グリッドから選択される、オーディオ符号化装置。
  11. 請求項1乃至10のいずれか一項に記載のオーディオ符号化装置において、前記1つ以上のノード(A0...A5;B0...B2;0)の各ノード(A0...A5;B0...B2;C0)が傾き情報(SA0...SA5;SB0...SB2;SC0)を含む、オーディオ符号化装置。
  12. 請求項1乃至11のいずれか一項に記載のオーディオ符号化装置において、前記ダイナミックレンジ制御符号器(3)がエントロピー符号化技術を使用してノード(A0...A5;B0...B2;C0)を符号化するよう構成されている、オーディオ符号化装置。
  13. オーディオ復号化装置であって、
    符号化済みオーディオビットストリーム(ABS)を復号化して、連続的なオーディオフレーム(AFP,AFR,AFS)を含むオーディオ信号(AS)を再生するオーディオ復号器(5)と、
    符号化済みダイナミックレンジ制御ビットストリーム(DBS)を復号化して、前記オーディオ信号(AS)に対応しかつ連続的なダイナミックレンジ制御フレーム(DFP,DFR,DFS)を含むダイナミックレンジ制御シーケンス(DS)を再生するダイナミックレンジ制御復号器(6)と、を含み、
    前記符号化済みダイナミックレンジ制御ビットストリーム(DBS)は、前記ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレーム(DFP,DFR,DFS)に対応するビットストリーム部分(DFP’,DFR’,DFS’)を含み、
    前記符号化済みダイナミックレンジ制御ビットストリーム(DBS)は、ノード(A0...A5;B0...B2;C0)のビット表現(A'0...A'5;B'0...B'2;C'0)を含み、前記ノードの1つのノードの各ビット表現が、前記オーディオ信号(AS)のためのゲイン情報(GA0...GA5;GB0...GB2;GC0)と、それらゲイン情報(GA0...GA5;GB0...GB2;GC0)がどの時点に対応するかを示す時間情報(TA0...TA5;TB0...TB2;TC0)とを含み、
    前記符号化済みダイナミックレンジ制御ビットストリーム(DBS)は、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の1つの基準ダイナミックレンジ制御フレーム(DFR)の前記ノード(B0...B2)から選択されたシフトノード(B1,B2)のビット表現(B'1,B'2)であって、前記1つの基準ダイナミックレンジ制御フレーム(DFR)に後続するダイナミックレンジ制御フレーム(DFS)に対応するビットストリーム部分内に埋め込まれたビット表現を含み、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)の前記ノード(B0...B2)の各残りのノード(B0)のビット表現(B'0)は、前記1つの基準ダイナミックレンジ制御フレーム(DFR)に対応するビットストリーム部分(DFR’)内に埋め込まれており、
    前記ダイナミックレンジ制御復号器(6)は、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)のノード(B 0 ...B 2 の各残りのノード(B0)のビット表現(B'0)を復号化して、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)の各残りのノード(B0)を再生し、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)のノード(B0...B2)から選択された前記シフトノード(B1,B2)の各シフトノード(B1,B2)のビット表現(B'1,B'2)を復号化して、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)のノードから選択された前記シフトノード(B1,B2)の各シフトノード(B1,B2)を再生し、更に再生された残りのノード(B0)と再生されたシフトノード(B1,B2)とを結合して、前記基準ダイナミックレンジ制御フレーム(DFR)を再生するよう構成されている、オーディオ復号化装置。
  14. 請求項13に記載のオーディオ復号化装置であって、前記ダイナミックレンジ制御復号器(6)は、前記時間情報(TA4,TA5;TB1,TB2)を使用して、1つ以上のシフトノード(A4,A5;B1,B2)を識別するよう構成されている、オーディオ復号化装置。
  15. 請求項13又は14に記載のオーディオ復号化装置において、前記1つ以上のシフトノード(A4,A5;B1,B2)の時間情報(TA4,TA5;TB1,TB2)であって、前記各シフトノード(A4,A5;B1,B2)が帰属する前記ダイナミックレンジ制御フレーム(DFP;DFR)の開始点から前記各シフトノード(A4,A5;B1,B2)が帰属する前記ダイナミックレンジ制御フレーム(DFP;DFR)内の前記各シフトノード(A4,A5;B1,B2)の時間的位置までの時間差(t_A4,t_A5;t_B1,t_B2)と、前記各ダイナミックレンジ制御フレーム(DFP;DFR)に後続するダイナミックレンジ制御フレーム(DFR;DFS)の時間的サイズ以上の大きさを有するオフセット値(drcFrameSize)と、の合計により表現される時間情報を、前記ダイナミックレンジ制御復号器(6)が復号化するよう構成されている、オーディオ復号化装置。
  16. 請求項13乃至15のいずれか一項に記載のオーディオ復号化装置において、前記ダイナミックレンジ制御復号器(6)は、前記基準ダイナミックレンジ制御フレーム(DFR)の前記後続のダイナミックレンジ制御フレーム(DFS)に対応するビットストリーム部分(DFS’)の最初の位置にあるシフトノード(B1)のビット表現(B'1)のゲイン情報(GB1)であって、絶対ゲイン値(g_B1)によって表現されるゲイン情報(GB1)を復号化し、且つ、前記基準ダイナミックレンジ制御フレーム(DFR)の前記後続のダイナミックレンジ制御フレーム(DFS)に対応するビットストリーム部分(DFS’)の最初の位置にあるシフトノード(B1)のビット表現(B'1)よりも後の位置にあるシフトノード(B2)の各ビット表現(B'2)のゲイン情報(GB2)であって、それぞれの前記シフトノード(B2)のビット表現(B'2)のゲイン値(g_B2)とそれぞれの前記シフトノード(B2)のビット表現(B'2)に先行する前記シフトノード(B1)の前記ビット表現(B'1)の前記ゲイン値(g_B1)との差に等しい、相対ゲイン値によって表現されるゲイン情報(GB2)を復号化するよう構成されている、オーディオ復号化装置。
  17. 請求項13乃至16のいずれか一項に記載のオーディオ復号化装置において、前記ダイナミックレンジ制御復号器(6)は、前記1つ以上のシフトノード(B1,B2)の前記ビット表現(B'1,B'2)の1つ以上の位置より後で、前記基準ダイナミックレンジ制御フレーム(DFR)に後続するダイナミックレンジ制御フレーム(DFS)に対応するビットストリーム部分(DFS’)の最初の位置にある、前記後続のダイナミックレンジ制御フレーム(DFS)のノード(C0)のビット表現(C'0)のゲイン情報(GC0)を復号化するよう構成され、前記ゲイン情報(GC0)は、それぞれの前記ノード(C0)のビット表現(C'0)のゲイン値(g_C0)とそれぞれの前記ノードC0のビット表現(C'0)に先行するシフトノード(B2)のビット表現(B'2)のゲイン値(g_B2)との差に等しい、相対ゲイン値によって表現される、オーディオ復号化装置。
  18. 請求項13乃至17のいずれか一項に記載のオーディオ復号化装置において、前記オーディオフレーム(AFP,AFR,AFS)の時間的サイズは、前記ダイナミックレンジ制御フレームDFP,DFR,DFSの時間的サイズと等しい、オーディオ復号化装置。
  19. 請求項13乃至18のいずれか一項に記載のオーディオ復号化装置において、 前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の1つのフレームの前記1つ以上のノード(A0...A5;B0...B2;C0)が均一な時間グリッドから選択される、オーディオ復号化装置。
  20. 請求項13乃至19のいずれか一項に記載のオーディオ復号化装置において、 前記1つ以上のノード(A0...A5;B0...B2;C0)の各ノード(A0...A5;B0...B2;C0)が、傾き情報(SA0...SA5;SB0...SB2;SC0)を含む、オーディオ復号化装置。
  21. 請求項13乃至20のいずれか一項に記載のオーディオ復号化装置において、前記ダイナミックレンジ制御復号器(6)は、前記ノードのビット表現(A'0...A'5;B'0...B'2;C'0)を、エントロピー復号化技術を使用して復号化するよう構成されている、オーディオ復号化装置。
  22. 請求項1乃至12のいずれか一項に記載のオーディオ符号化装置(1)と、請求項13乃至21のいずれか一項に記載のオーディオ復号化装置(4)と、を含むシステム。
  23. オーディオ符号化装置を操作する方法であって、
    連続的なオーディオフレーム(AFP,AFR,AFS)を含むオーディオ信号(AS)から符号化済みオーディオビットストリーム(ABS)を生成するステップと、
    前記オーディオ信号(AS)に対応しかつ連続的なダイナミックレンジ制御フレーム(DFP,DFR,DFS)を含むダイナミックレンジ制御シーケンス(DS)から、符号化済みダイナミックレンジ制御ビットストリーム(DBS)を生成するステップであって、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の各ダイナミックレンジ制御フレーム(DFP,DFR,DFS)は、1つ以上のノード(A0...A5;B0...B2;C0)を含み、それら1つ以上のノード(A0...A5;B0...B2;C0)の各ノードが、前記オーディオ信号(AS)についてのゲイン情報(GA0...GA5;GB0...GB2;GC0)と、それらゲイン情報(GA0...GA5;GB0...GB2;GC0)がどの時点に対応するかを示す時間情報(TA0...TA5;TB0...TB2;TC0)とを含んでおり、前記符号化済みダイナミックレンジ制御ビットストリーム(DBS)は、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の各ダイナミックレンジ制御フレーム(DFP,DFR,DFS)に対応するビットストリーム部分(DFP’,DFR’,DFS’)を含む、ステップと、
    シフト処理を実行するステップであって、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)のうちの1つの基準ダイナミックレンジ制御フレーム(DFR)のノード(B0...B2)の1つ以上のノード(B1,B2)がシフトノード(B1,B2)として選択され、前記1つの基準ダイナミックレンジ制御フレーム(DFR)の前記1つ以上のシフトノード(B1,B2)の各々のビット表現(B'1,B'2)が、前記1つの基準ダイナミックレンジ制御フレーム(DFR)に後続するダイナミックレンジ制御フレーム(DFS)に対応するビットストリーム部分(DFS’)の中に埋め込まれ、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)の前記ノード(B0...B2)の各残りのノード(B0)のビット表現(B'0)が、前記1つの基準ダイナミックレンジ制御フレーム(DFR)に対応する前記ビットストリーム部分(DFR’)の中に埋め込まれる、ステップと、
    を含む、方法。
  24. オーディオ復号化装置を操作する方法であって、
    符号化済みオーディオビットストリーム(ABS)を復号化して、連続的なオーディオフレーム(AFP,AFR,AFS)を含むオーディオ信号(AS)を再生するステップと、
    符号化済みダイナミックレンジ制御ビットストリーム(DBS)を復号化して、前記オーディオ信号(AS)に対応しかつ連続的なダイナミックレンジ制御フレーム(DFP,DFR,DFS)を含むダイナミックレンジ制御シーケンス(DS)を再生するステップと、
    を含み、
    前記符号化済みダイナミックレンジ制御ビットストリーム(DBS)は、前記ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレーム(DFP,DFR,DFS)に対応するビットストリーム部分(DFP’,DFR’,DFS’)を含み、
    前記符号化済みダイナミックレンジ制御ビットストリーム(DBS)は、ノード(A0...A5;B0...B2;C0)のビット表現(A'0...A'5;B'0...B'2;C'0)を含み、前記ノードの1つのノードの各ビット表現が、前記オーディオ信号(AS)のためのゲイン情報(GA0...GA5;GB0...GB2;GC0)と、それらゲイン情報(GA0...GA5;GB0...GB2;GC0)がどの時点に対応するかを示す時間情報(TA0...TA5;TB0...TB2;TC0)とを含み、
    前記符号化済みダイナミックレンジ制御ビットストリーム(DBS)は、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の1つの基準ダイナミックレンジ制御フレーム(DFR)の前記ノード(B0...B2)から選択されたシフトノード(B1,B2)のビット表現(B'1,B'2)であって、前記1つの基準ダイナミックレンジ制御フレーム(DFR)に後続するダイナミックレンジ制御フレーム(DFS)に対応するビットストリーム部分に埋め込まれたビット表現を含み、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)の前記ノード(B0...B2)の各残りのノード(B0)のビット表現(B'0)は、前記1つの基準ダイナミックレンジ制御フレーム(DFR)に対応するビットストリーム部分(DFR’)内に埋め込まれており、
    前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)のノード(B 0 ...B 2 の各残りのノード(B0)のビット表現(B'0)が復号化されて、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)の各残りのノード(B0)が再生され、
    前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)のノード(B0...B2)から選択された前記シフトノード(B1,B2)の各シフトノード(B1,B2)のビット表現(B'1,B'2)が復号化されて、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)のノードから選択された前記シフトノード(B1,B2)の各シフトノード(B1,B2)が再生され、
    再生された残りのノード(B0)と再生されたシフトノード(B1,B2)とが結合されて、前記基準ダイナミックレンジ制御フレーム(DFR)が再生される、
    方法。
  25. プロセッサ上で作動するとき、請求項23又は24に記載の方法を実行するためのコンピュータプログラム。
JP2016559243A 2014-03-25 2015-03-20 ダイナミックレンジ制御における効率的なゲイン符号化を有するオーディオ符号化装置及びオーディオ復号化装置 Active JP6259930B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14161605 2014-03-25
EP14161605.2 2014-03-25
PCT/EP2015/055945 WO2015144587A1 (en) 2014-03-25 2015-03-20 Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control

Publications (2)

Publication Number Publication Date
JP2017517020A JP2017517020A (ja) 2017-06-22
JP6259930B2 true JP6259930B2 (ja) 2018-01-10

Family

ID=52727126

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016559243A Active JP6259930B2 (ja) 2014-03-25 2015-03-20 ダイナミックレンジ制御における効率的なゲイン符号化を有するオーディオ符号化装置及びオーディオ復号化装置

Country Status (20)

Country Link
US (3) US10074377B2 (ja)
EP (1) EP3123469B1 (ja)
JP (1) JP6259930B2 (ja)
KR (1) KR101890216B1 (ja)
CN (2) CN111326165B (ja)
AR (1) AR099836A1 (ja)
AU (1) AU2015238519B2 (ja)
BR (1) BR112016021382B1 (ja)
CA (1) CA2942743C (ja)
ES (1) ES2678068T3 (ja)
MX (1) MX355089B (ja)
MY (1) MY186155A (ja)
PL (1) PL3123469T3 (ja)
PT (1) PT3123469T (ja)
RU (1) RU2678487C2 (ja)
SG (1) SG11201607940WA (ja)
TR (1) TR201809427T4 (ja)
TW (1) TWI585751B (ja)
WO (1) WO2015144587A1 (ja)
ZA (1) ZA201607193B (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2005299410B2 (en) 2004-10-26 2011-04-07 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI447709B (zh) 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
JP6174129B2 (ja) 2012-05-18 2017-08-02 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
IN2015MN01766A (ja) 2013-01-21 2015-08-28 Dolby Lab Licensing Corp
IL287218B (en) 2013-01-21 2022-07-01 Dolby Laboratories Licensing Corp Audio encoder and decoder with program loudness and boundary metada
EP2959479B1 (en) 2013-02-21 2019-07-03 Dolby International AB Methods for parametric multi-channel encoding
CN107093991B (zh) 2013-03-26 2020-10-09 杜比实验室特许公司 基于目标响度的响度归一化方法和设备
US9635417B2 (en) 2013-04-05 2017-04-25 Dolby Laboratories Licensing Corporation Acquisition, recovery, and matching of unique information from file-based media for automated file detection
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
CN109903776B (zh) 2013-09-12 2024-03-01 杜比实验室特许公司 用于各种回放环境的动态范围控制
CN110675884B (zh) 2013-09-12 2023-08-08 杜比实验室特许公司 用于下混合音频内容的响度调整
AU2014371411A1 (en) 2013-12-27 2016-06-23 Sony Corporation Decoding device, method, and program
SG11201607940WA (en) 2014-03-25 2016-10-28 Fraunhofer Ges Forschung Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
CN105142067B (zh) 2014-05-26 2020-01-07 杜比实验室特许公司 音频信号响度控制
EP3518236B8 (en) 2014-10-10 2022-05-25 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
RU2144222C1 (ru) * 1998-12-30 2000-01-10 Гусихин Артур Владимирович Способ сжатия звуковой информации и система для его реализации
US6785655B1 (en) * 2000-05-15 2004-08-31 Lsi Logic Corporation Method for independent dynamic range control
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP4575609B2 (ja) * 2001-03-13 2010-11-04 旭化成エレクトロニクス株式会社 データ変換装置
KR100754439B1 (ko) * 2003-01-09 2007-08-31 와이더댄 주식회사 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
KR101087588B1 (ko) * 2004-07-02 2011-11-29 닐슨 미디어 리서치 인코퍼레이티드 압축 디지털 비트스트림을 믹싱하는 방법 및 장치
CN101046963B (zh) * 2004-09-17 2011-03-23 广州广晟数码技术有限公司 解码经编码的音频数据流的方法
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US8521314B2 (en) * 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
CN101587711B (zh) * 2008-05-23 2012-07-04 华为技术有限公司 基音后处理方法、滤波器以及基音后处理系统
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
EP4293665A3 (en) * 2008-10-29 2024-01-10 Dolby International AB Signal clipping protection using pre-existing audio gain metadata
KR101336891B1 (ko) * 2008-12-19 2013-12-04 한국전자통신연구원 G.711 코덱의 음질 향상을 위한 부호화 장치 및 복호화 장치
US8600179B2 (en) * 2009-09-17 2013-12-03 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding image based on skip mode
TWI447709B (zh) * 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
US9443534B2 (en) * 2010-04-14 2016-09-13 Huawei Technologies Co., Ltd. Bandwidth extension system and approach
JP5650227B2 (ja) * 2010-08-23 2015-01-07 パナソニック株式会社 音声信号処理装置及び音声信号処理方法
US9117455B2 (en) * 2011-07-29 2015-08-25 Dts Llc Adaptive voice intelligibility processor
WO2013041875A2 (en) * 2011-09-22 2013-03-28 Earsoft Limited Dynamic range control
JP6174129B2 (ja) * 2012-05-18 2017-08-02 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム
US9332373B2 (en) * 2012-05-31 2016-05-03 Dts, Inc. Audio depth dynamic range enhancement
US9460729B2 (en) * 2012-09-21 2016-10-04 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
US9607624B2 (en) * 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
SG11201607940WA (en) 2014-03-25 2016-10-28 Fraunhofer Ges Forschung Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control

Also Published As

Publication number Publication date
PL3123469T3 (pl) 2018-09-28
US20220277756A1 (en) 2022-09-01
EP3123469A1 (en) 2017-02-01
SG11201607940WA (en) 2016-10-28
ZA201607193B (en) 2018-08-30
CA2942743A1 (en) 2015-10-01
RU2016141556A (ru) 2018-04-25
TW201543470A (zh) 2015-11-16
US10074377B2 (en) 2018-09-11
AR099836A1 (es) 2016-08-24
MX355089B (es) 2018-04-04
TWI585751B (zh) 2017-06-01
CN111326165B (zh) 2023-12-12
ES2678068T3 (es) 2018-08-08
PT3123469T (pt) 2018-07-06
RU2016141556A3 (ja) 2018-04-25
CA2942743C (en) 2018-11-13
RU2678487C2 (ru) 2019-01-29
MY186155A (en) 2021-06-28
MX2016012421A (es) 2016-12-16
AU2015238519A1 (en) 2016-11-10
WO2015144587A1 (en) 2015-10-01
TR201809427T4 (tr) 2018-07-23
KR20160136390A (ko) 2016-11-29
KR101890216B1 (ko) 2018-08-22
CN106165014A (zh) 2016-11-23
BR112016021382B1 (pt) 2021-02-09
JP2017517020A (ja) 2017-06-22
EP3123469B1 (en) 2018-04-18
AU2015238519B2 (en) 2017-11-23
US20170011749A1 (en) 2017-01-12
USRE49107E1 (en) 2022-06-14
CN111326165A (zh) 2020-06-23
CN106165014B (zh) 2020-01-24

Similar Documents

Publication Publication Date Title
JP6259930B2 (ja) ダイナミックレンジ制御における効率的なゲイン符号化を有するオーディオ符号化装置及びオーディオ復号化装置
JP7215534B2 (ja) 復号化装置および方法、並びにプログラム
JP6531649B2 (ja) 符号化装置および方法、復号化装置および方法、並びにプログラム
JP2018151639A (ja) オーディオ装置のための組合せダイナミックレンジ圧縮および誘導クリッピング防止のための概念
JP4800379B2 (ja) 最大ビットレートを保証する情報の無損失符号化
KR20060007371A (ko) 음성 신호의 스펙트럼 재구성 방법 및 장치
KR102426965B1 (ko) 대화 향상을 위한 디코딩 방법 및 디코더

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171031

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171211

R150 Certificate of patent or registration of utility model

Ref document number: 6259930

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250