JP6259930B2 - ダイナミックレンジ制御における効率的なゲイン符号化を有するオーディオ符号化装置及びオーディオ復号化装置 - Google Patents
ダイナミックレンジ制御における効率的なゲイン符号化を有するオーディオ符号化装置及びオーディオ復号化装置 Download PDFInfo
- Publication number
- JP6259930B2 JP6259930B2 JP2016559243A JP2016559243A JP6259930B2 JP 6259930 B2 JP6259930 B2 JP 6259930B2 JP 2016559243 A JP2016559243 A JP 2016559243A JP 2016559243 A JP2016559243 A JP 2016559243A JP 6259930 B2 JP6259930 B2 JP 6259930B2
- Authority
- JP
- Japan
- Prior art keywords
- dynamic range
- range control
- dfr
- control frame
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 84
- 230000005236 sound signal Effects 0.000 claims description 70
- 230000002123 temporal effect Effects 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 9
- 239000008186 active pharmaceutical agent Substances 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Description
連続的なオーディオフレームを含むオーディオ信号から符号化済みオーディオビットストリームを生成するよう構成されたオーディオ符号器と、
前記オーディオ信号に対応しかつ連続的なダイナミックレンジ制御フレームを含むダイナミックレンジ制御シーケンスから、符号化済みダイナミックレンジ制御ビットストリームを生成するよう構成されたダイナミックレンジ制御符号器であって、前記ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレームは1つ以上のノードを含み、その1つ以上のノードの各ノードがオーディオ信号についてのゲイン情報とそのゲイン情報がどの時点に対応するかを示す時間情報とを含む、ダイナミックレンジ制御符号器と、を含み、
前記ダイナミックレンジ制御符号器は、符号化済みダイナミックレンジ制御ビットストリームが前記ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレームに対応する1つのビットストリーム部分を含むように構成されており、
前記ダイナミックレンジ制御符号器はシフト処理を実行するよう構成されており、そのシフト処理では、ダイナミックレンジ制御フレームうちの1つの基準ダイナミックレンジ制御フレームの1つ以上のノードがシフトノード(shifted nodes)として選択され、前記1つの基準ダイナミックレンジ制御フレームの前記1つ以上のシフトノードの各々のビット表現が前記1つの基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームに対応するビットストリーム部分の中に埋め込まれ、前記ダイナミックレンジ制御フレームのうちの前記1つの基準ダイナミックレンジ制御フレームのノードの各残りのノードのビット表現が前記1つの基準ダイナミックレンジ制御フレームに対応するビットストリーム部分の中に埋め込まれる。
[数1]
y(k)=g(k)x(k) (1)
ここで、kはサンプル時間インデックスを示す。ゲインg(k)の値は、例えばオーディオ信号x(k)の二乗平均平方根の短時間推定に基づいて計算され得る。適切なゲイン値を決定する手法のより詳細な説明は、非特許文献1に記載されている。以下では、時変ゲインg(k)をゲインシーケンスと呼ぶことにする。
符号化済みオーディオビットストリームを復号化して、連続的なオーディオフレームを含むオーディオ信号を再生するオーディオ復号器と、
符号化済みダイナミックレンジ制御ビットストリームを復号化して、前記オーディオ信号に対応しかつ連続的なダイナミックレンジ制御フレームを含むダイナミックレンジ制御シーケンスを再生するダイナミックレンジ制御復号器と、を含み、
前記符号化済みダイナミックレンジ制御ビットストリームは、ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレームに対応する1つのビットストリーム部分を含み、
前記符号化済みダイナミックレンジ制御ビットストリームは、複数のノードのビット表現を含み、それらノードの1つのノードの各ビット表現が、前記オーディオ信号ASについてのゲイン情報と、そのゲイン情報がどの時点に対応するかを示す時間情報とを含み、
前記符号化済みダイナミックレンジ制御ビットストリームは、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームのノードから選択されたシフトノードのビット表現を含み、そのシフトノードのビット表現は、前記1つの基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームに対応するビットストリーム部分に埋め込まれており、ダイナミックレンジ制御フレームの前記1つの基準ダイナミックレンジ制御フレームのノードの各残りのノードのビット表現は、前記1つの基準ダイナミックレンジ制御フレームに対応するビットストリーム部分に埋め込まれており、
ダイナミックレンジ制御復号器は、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームの残りのノードの各残りのノードのビット表現を復号化して、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームの各残りのノードを再生し、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームのノードから選択されたシフトノードの各シフトノードのビット表現を復号化して、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームのノードから選択されたシフトノードの各シフトノードを再生し、更に再生された残りのノードと再生されたシフトノードとを結合して、基準ダイナミックレンジ制御フレームを再生するよう構成されている。
連続的なオーディオフレームを含むオーディオ信号から符号化済みオーディオビットストリームを生成するステップと、
前記オーディオ信号に対応しかつ連続的なダイナミックレンジ制御フレームを含むダイナミックレンジ制御シーケンスから、符号化済みダイナミックレンジ制御ビットストリームを生成するステップであって、前記ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレームは1つ以上のノードを含み、それら1つ以上のノードの各ノードが、前記オーディオ信号についてのゲイン情報と、そのゲイン情報がどの時点に対応するかを示す時間情報とを含み、前記符号化済みダイナミックレンジ制御ビットストリームは、前記ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレームに対応するビットストリーム部分を含む、ステップと、
シフト処理を実行するステップであって、前記ダイナミックレンジ制御フレームのうちの1つの基準ダイナミックレンジ制御フレームのノードの1つ以上のノードがシフトノードとして選択され、前記1つの基準ダイナミックレンジ制御フレームの1つ以上のシフトノードの各々のビット表現が、前記1つの基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームに対応するビットストリーム部分に埋め込まれ、前記ダイナミックレンジ制御フレームのうちの前記1つの基準ダイナミックレンジ制御フレームのノードの各残りのノードのビット表現が、前記1つの基準ダイナミックレンジ制御フレームに対応するビットストリーム部分の中に埋め込まれる、ステップと、を含む。
符号化済みオーディオビットストリームを復号化して、連続的なオーディオフレームを含むオーディオ信号を再生するステップと、
符号化済みダイナミックレンジ制御ビットストリームを復号化して、オーディオ信号に対応しかつ連続的なダイナミックレンジ制御フレームを含むダイナミックレンジ制御シーケンスを再生するステップと、を含み、
前記符号化済みダイナミックレンジ制御ビットストリームは、ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレームに対応するビットストリーム部分を含み、
符号化済みダイナミックレンジ制御ビットストリームは、複数のノードのビット表現を含み、それらノードの1つのノードの各ビット表現が、オーディオ信号ASのためのゲイン情報と、そのゲイン情報がどの時点に対応するかを示す時間情報とを含み、
符号化済みダイナミックレンジ制御ビットストリームは、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームの複数のノードから選択されたシフトノードのビット表現であって、前記1つの基準ダイナミックレンジ制御フレームに後続するダイナミックレンジ制御フレームに対応するビットストリーム部分に埋め込まれたビット表現を含み、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームのノードの各残りのノードのビット表現は、1つの基準ダイナミックレンジ制御フレームに対応するビットストリーム部分内に埋め込まれており、
ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームの残りのノードの各残りのノードのビット表現が復号化されて、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームの各残りのノードを再生し、
ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームのノードから選択されたシフトノードの各シフトノードのビット表現が復号化されて、ダイナミックレンジ制御フレームの1つの基準ダイナミックレンジ制御フレームのノードから選択されたシフトノードの各シフトノードを再生し、
再生された残りのノードと再生されたシフトノードとを結合して、基準ダイナミックレンジ制御フレームを再生する。
連続的なオーディオフレームAFP,AFR,AFSを含むオーディオ信号ASから符号化済みオーディオビットストリームABSを生成するよう構成されたオーディオ符号器2と、
オーディオ信号ASに対応しかつ連続的なダイナミックレンジ制御フレームDFP,DFR,DFSを含むダイナミックレンジ制御シーケンスDSから、符号化済みダイナミックレンジ制御ビットストリームDBSを生成するよう構成されたダイナミックレンジ制御符号器3であって、ダイナミックレンジ制御フレームDFP,DFR,DFSの各ダイナミックレンジ制御フレームDFP,DFR,DFSは、1つ以上のノードA0...A5;B0...B2;C0を含み、それら1つ以上のノードA0...A5;B0...B2;C0の各ノードが、オーディオ信号ASについてのゲイン情報GA0...GA5;GB0...GB2;GC0と、それらゲイン情報GA0...GA5;GB0...GB2;GC0がどの時点に対応するかを示す時間情報TA0...TA5;TB0...TB2;TC0とを含む、ダイナミックレンジ制御符号器3と、を含み、
前記ダイナミックレンジ制御符号器3は、符号化済みダイナミックレンジ制御ビットストリームDBSが、前記ダイナミックレンジ制御フレームDFP,DFR,DFSの各ダイナミックレンジ制御フレームDFP,DFR,DFSに対応するビットストリーム部分DFP’,DFR’,DFS’を含むように構成されており、
前記ダイナミックレンジ制御符号器2はシフト処理を実行するよう構成されており、そのシフト処理では、ダイナミックレンジ制御フレームDFP,DFR,DFSのうちの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2の1つ以上のノードB1,B2がシフトノードB1,B2として選択され、前記1つの基準ダイナミックレンジ制御フレームDFRの1つ以上のシフトノードB1,B2の各々のビット表現B'1,B'2が、前記1つの基準ダイナミックレンジ制御フレームDFRに後続するダイナミックレンジ制御フレームDFSに対応するビットストリーム部分DFS’に埋め込まれ、前記ダイナミックレンジ制御フレームDFP,DFR,DFSのうちの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2の各残りのノードB0のビット表現B'0が、前記1つの基準ダイナミックレンジ制御フレームDFRに対応するビットストリーム部分DFR’の中に埋め込まれる。
連続的なオーディオフレームAFP,AFR,AFSを含むオーディオ信号ASから符号化済みオーディオビットストリームABSを生成するステップと、
オーディオ信号ASに対応しかつ連続的なダイナミックレンジ制御フレームDFP,DFR,DFSを含むダイナミックレンジ制御シーケンスDSから、符号化済みダイナミックレンジ制御ビットストリームDBSを生成するステップであって、前記ダイナミックレンジ制御フレームDFP,DFR,DFSの各ダイナミックレンジ制御フレームDFP,DFR,DFSは、1つ以上のノードA0...A5;B0...B2;C0を含み、それら1つ以上のノードA0...A5;B0...B2;C0の各ノードが、オーディオ信号ASについてのゲイン情報GA0...GA5;GB0...GB2;GC0と、それらゲイン情報GA0...GA5;GB0...GB2;GC0がどの時点に対応するかを示す時間情報TA0...TA5;TB0...TB2;TC0とを含むものであり、前記符号化済みダイナミックレンジ制御ビットストリームDBSは、前記ダイナミックレンジ制御フレームDFP,DFR,DFSの各ダイナミックレンジ制御フレームDFP,DFR,DFSに対応するビットストリーム部分DFP’,DFR’,DFS’を含む、ステップと、
シフト処理を実行するステップであって、前記ダイナミックレンジ制御フレームDFP,DFR,DFSのうちの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2の1つ以上のノードB1,B2がシフトノードB1,B2として選択され、前記1つの基準ダイナミックレンジ制御フレームDFRの1つ以上のシフトノードB1,B2の各々のビット表現B'1,B'2が、前記1つの基準ダイナミックレンジ制御フレームDFRに後続するダイナミックレンジ制御フレームDFSに対応するビットストリーム部分DFS’の中に埋め込まれ、前記ダイナミックレンジ制御フレームDFP,DFR,DFSのうちの前記1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2の各残りのノードB0のビット表現B'0が、前記1つの基準ダイナミックレンジ制御フレームDFRに対応するビットストリーム部分DFR’の中に埋め込まれる、ステップと、を含む。
[数1]
y(k)=g(k)x(k) (1)
ここで、kはサンプル時間インデックスである。ゲインg(k)の値は、例えば入力信号x(k)の二乗平均平方根の短時間推定に基づいて計算される。適切なゲイン値を決定するためのより詳細な手法については、非特許文献1で説明されている。以下では、時変ゲインg(k)をゲインシーケンスと呼ぶ。
tDrcDelta_A4=t_A4−t_A3
として計算される。この差分時間値は、次に、適切なハフマンテーブル内の対応するエントリを使用して、例えば表1又は表2に従って符号化される。他の実例として、ノードB0の符号化された時間差に注目する。ノードB0はフレームn+1の最初のノードであるため、対応する時間差はその符号化の開始点との比較において決定される。即ち、
tDrcDelta_B0=t_B0
となる。
tDrcDelta_A4=t_A4+drcFrameSize−t_B0
に従って、即ち、オフセットを含んで計算される。同様に、ノードA5については、
tDrcDelta_A5=t_A5+drcFrameSize−t_A4−drcFrameSize
が得られ、これは明らかに
tDrcDelta_A5=t_A5−t_A4
と同じである。これらの差分時間値は、正確なハフマンテーブルの対応する符号語エントリを使用して、例えば表1又は表2に従って符号化される。
gainDelta_A4=g_A4−g_A3
となる。この差分ゲイン値は、次に、適切なハフマンテーブルの中の対応するエントリを使用して符号化される。更に、図7の左側のフレームn+1の最初のノードについて考察する。B0はそのフレームの最初のノードであるから、そのゲイン値は、差分法では符号化されず、最初のゲイン値gainInitialの特異な符号化に従って符号化される。即ち、ゲイン値はその実際値として符号化される:
gainDelta_B0=g_B0
gainDelta_B0=g_B0−g_A5
となる。ノードリザーバ技術を適用する場合、ゲイン差を決定する方法だけが変化するものの、ゲインの再生された値は各ノードについて同じままであることに注意されたい。明らかに、フレームn及びn+1の全体のゲイン関連情報を復号化した後で、ノードA0〜B0について取得されるゲイン値は、左側に示す場合に取得されるゲイン値と同一であり、かつノードは、DRCゲインを対応するオーディオフレームへと適用するのに「間に合って」計算され得る。
符号化済みオーディオビットストリームABSを復号化して、連続的なオーディオフレームAFP,AFR,AFSを含むオーディオ信号ASを再生するオーディオ復号器5と、
符号化済みダイナミックレンジ制御ビットストリームDBSを復号化して、オーディオ信号ASに対応しかつ連続的なダイナミックレンジ制御フレームDFP,DFR,DFSを含むダイナミックレンジ制御シーケンスDSを再生するダイナミックレンジ制御復号器6と、を含み、
前記符号化済みダイナミックレンジ制御ビットストリームDBSは、ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレームDFP,DFR,DFSに対応するビットストリーム部分DFP’,DFR’,DFS’を含み、
符号化済みダイナミックレンジ制御ビットストリームDBSは、ノードA0...A5;B0...B2;C0のビット表現A'0...A'5;B'0...B'2;C'0を含み、それらノードの1つのノードの各ビット表現が、オーディオ信号ASのためのゲイン情報GA0...GA5;GB0...GB2;GC0と、それらゲイン情報GA0...GA5;GB0...GB2;GC0がどの時点に対応するかを示す時間情報TA0...TA5;TB0...TB2;TC0とを含み、
符号化済みダイナミックレンジ制御ビットストリームDBSは、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2から選択されたシフトノードB1,B2のビット表現B'1,B'2であって、1つの基準ダイナミックレンジ制御フレームDFRに後続するダイナミックレンジ制御フレームDFSに対応するビットストリーム部分内に埋め込まれたビット表現を含み、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2の各残りのノードB0のビット表現B'0は、1つの基準ダイナミックレンジ制御フレームDFRに対応するビットストリーム部分DFR’内に埋め込まれており、
ダイナミックレンジ制御復号器6は、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRの各残りのノードB0のビット表現B'0を復号化して、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRの各残りのノードB0を再生し、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2から選択されたシフトノードB1,B2の各シフトノードB1,B2のビット表現B'1,B'2を復号化して、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードから選択されたシフトノードB1,B2の各シフトノードB1,B2を再生し、更に再生された残りのノードB0と再生されたシフトノードB1,B2とを結合して、基準ダイナミックレンジ制御フレームDFRを再生するよう構成されている。
符号化済みオーディオビットストリームABSを復号化して、連続的なオーディオフレームAFP,AFR,AFSを含むオーディオ信号ASを再生するステップと、
符号化済みダイナミックレンジ制御ビットストリームDBSを復号化して、オーディオ信号ASに対応しかつ連続的なダイナミックレンジ制御フレームDFP,DFR,DFSを含むダイナミックレンジ制御シーケンスDSを再生するステップと、を含み、
前記符号化済みダイナミックレンジ制御ビットストリームDBSは、ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレームDFP,DFR,DFSに対応するビットストリーム部分DFP’,DFR’,DFS’を含み、
符号化済みダイナミックレンジ制御ビットストリームDBSは、ノードA0...A5;B0...B2;C0のビット表現A'0...A'5;B'0...B'2;C'0を含み、それらノードの1つのノードの各ビット表現が、オーディオ信号ASのためのゲイン情報GA0...GA5;GB0...GB2;GC0と、それらゲイン情報GA0...GA5;GB0...GB2;GC0がどの時点に対応するかを示す時間情報TA0...TA5;TB0...TB2;TC0とを含み、
符号化済みダイナミックレンジ制御ビットストリームDBSは、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2から選択されたシフトノードB1,B2のビット表現B'1,B'2であって、1つの基準ダイナミックレンジ制御フレームDFRに後続するダイナミックレンジ制御フレームDFSに対応するビットストリーム部分内に埋め込まれたビット表現を含み、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2の各残りのノードB0のビット表現B'0は、1つの基準ダイナミックレンジ制御フレームDFRに対応するビットストリーム部分DFR’内に埋め込まれており、
ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードB 0 ...B 2 の各残りのノードB0のビット表現B'0が復号化されて、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRの各残りのノードB0が再生され、
ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードB0...B2から選択されたシフトノードB1,B2の各シフトノードB1,B2のビット表現B'1,B'2が復号化されて、ダイナミックレンジ制御フレームDFP,DFR,DFSの1つの基準ダイナミックレンジ制御フレームDFRのノードから選択されたシフトノードB1,B2の各シフトノードB1,B2が再生され、
再生された残りのノードB0と再生されたシフトノードB1,B2とが結合されて、基準ダイナミックレンジ制御フレームDFRが再生される。
2 オーディオ符号器
3 ダイナミックレンジ制御符号器
4 オーディオ復号化装置
5 オーディオ復号器
6 ダイナミックレンジ制御復号器
ABS 符号化済みオーディオビットストリーム
AS オーディオ信号
AFP 先行オーディオフレーム
AFR 基準オーディオフレーム
AFS 後続オーディオフレーム
DBS 符号化済みダイナミックレンジ制御ビットストリーム
DS ダイナミックレンジ制御シーケンス
DFP 先行ダイナミックレンジ制御フレーム
DFR 基準ダイナミックレンジ制御フレーム
DFS 後続ダイナミックレンジ制御フレーム
A0...A5 先行オーディオフレームのノード
B0...B2 基準オーディオフレームのノード
C0 後続オーディオフレームのノード
DFP’ 先行ダイナミックレンジ制御フレームに対応するビットストリーム部分
DFR’ 基準ダイナミックレンジ制御フレームに対応するビットストリーム部分
DFS’ 後続ダイナミックレンジ制御フレームに対応するビットストリーム部分
TA0...TA5 先行ダイナミックレンジ制御フレームのノードの時間情報
TB0...TB2 基準ダイナミックレンジ制御フレームのノードの時間情報
TC0 後続ダイナミックレンジ制御フレームのノードの時間情報
t_A0...t_A5 先行ダイナミックレンジ制御フレームのノードの時間差
t_B0...t_B2 基準ダイナミックレンジ制御フレームのノードの時間差
t_C0 後続ダイナミックレンジ制御フレームのノードの時間差
GA0...GA5 先行ダイナミックレンジ制御フレームのノードのゲイン情報
GB0...GB2 基準ダイナミックレンジ制御フレームのノードのゲイン情報
GC0 後続ダイナミックレンジ制御フレームのノードのゲイン情報
g_A0...g_A5 先行ダイナミックレンジ制御フレームのノードのゲイン値
g_B0...g_B2 基準ダイナミックレンジ制御フレームのノードのゲイン値
g_C0 後続ダイナミックレンジ制御フレームのノードのゲイン値
SA0...SA5 先行ダイナミックレンジ制御フレームのノードの傾き情報
SB0...SB2 基準ダイナミックレンジ制御フレームのノードの傾き情報
SC0 後続ダイナミックレンジ制御フレームのノードの傾き情報
Claims (25)
- オーディオ符号化装置であって、
連続的なオーディオフレーム(AFP,AFR,AFS)を含むオーディオ信号(AS)から符号化済みオーディオビットストリーム(ABS)を生成するよう構成されたオーディオ符号器(2)と、
前記オーディオ信号(AS)に対応しかつ連続的なダイナミックレンジ制御フレーム(DFP,DFR,DFS)を含むダイナミックレンジ制御シーケンス(DS)から、符号化済みダイナミックレンジ制御ビットストリーム(DBS)を生成するよう構成されたダイナミックレンジ制御符号器(3)であって、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の各ダイナミックレンジ制御フレーム(DFP,DFR,DFS)は、1つ以上のノード(A0...A5;B0...B2;C0)を含み、それら1つ以上のノード(A0...A5;B0...B2;C0)の各ノードが、前記オーディオ信号(AS)についてのゲイン情報(GA0...GA5;GB0...GB2;GC0)と、それらゲイン情報(GA0...GA5;GB0...GB2;GC0)がどの時点に対応するかを示す時間情報(TA0...TA5;TB0...TB2;TC0)とを含む、ダイナミックレンジ制御符号器(3)と、を含み、
前記ダイナミックレンジ制御符号器(3)は、前記符号化済みダイナミックレンジ制御ビットストリーム(DBS)が、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の各ダイナミックレンジ制御フレーム(DFP,DFR,DFS)に対応するビットストリーム部分(DFP’,DFR’,DFS’)を含むように構成されており、
前記ダイナミックレンジ制御符号器(3)はシフト処理を実行するよう構成されており、そのシフト処理において、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)のうちの1つの基準ダイナミックレンジ制御フレーム(DFR)のノード(B0...B2)の1つ以上のノード(B1,B2)がシフトノード(B1,B2)として選択され、前記1つの基準ダイナミックレンジ制御フレーム(DFR)の前記1つ以上のシフトノード(B1,B2)の各々のビット表現(B'1,B'2)が、前記1つの基準ダイナミックレンジ制御フレーム(DFR)に後続するダイナミックレンジ制御フレーム(DFS)に対応するビットストリーム部分(DFS’)の中に埋め込まれ、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)の前記ノード(B0...B2)の各残りのノード(B0)のビット表現(B'0)が、前記1つの基準ダイナミックレンジ制御フレーム(DFR)に対応する前記ビットストリーム部分(DFR’)の中に埋め込まれる、オーディオ符号化装置。 - 請求項1に記載のオーディオ符号化装置において、前記基準ダイナミックレンジ制御フレームの前記ノードの数が所定の閾値を上回る場合に、前記シフト処理が開始される、オーディオ符号化装置。
- 請求項1に記載のオーディオ符号化装置において、前記基準ダイナミックレンジ制御フレームのノードの数と、前記基準ダイナミックレンジ制御フレームに先行する前記ダイナミックレンジ制御フレームからのシフトノードの数であって、前記基準ダイナミックレンジ制御フレームに対応するビットストリーム部分内に埋め込まれるべきシフトノードの数と、の合計が所定の閾値を上回る場合に、前記シフト処理が開始される、オーディオ符号化装置。
- 請求項1に記載のオーディオ符号化装置において、前記基準ダイナミックレンジ制御フレーム(DFR)のノード(B0...B2)の数と、前記基準ダイナミックレンジ制御フレーム(DFR)に先行する前記ダイナミックレンジ制御フレーム(DFP)からのシフトノード(A4,A5)であって、前記基準ダイナミックレンジ制御フレーム(DFR)に対応するビットストリーム部分(DFR’)内に埋め込まれるべきシフトノードの数との合計が、前記基準ダイナミックレンジ制御フレーム(DFR)の前記後続のダイナミックレンジ制御フレーム(DFS)のノード(C0)の数を上回った場合に、前記シフト処理が開始される、オーディオ符号化装置。
- 請求項1乃至4のいずれか一項に記載のオーディオ符号化装置において、前記1つ以上のノード(A0...A5;B0...B2;C0)の前記時間情報(TA0...TA5;TB0...TB2;TC0)は、前記1つ以上のシフトノード(A4,A5;B1,B2)が、前記時間情報(TA4,TA5;TB1,TB2)を使用して識別され得るような方法で表現される、オーディオ符号化装置。
- 請求項1乃至5のいずれか一項に記載のオーディオ符号化装置において、前記1つ以上のシフトノード(A4,A5;B1,B2)の時間情報(TA4,TA5;TB1,TB2)は、前記各シフトノード(A4,A5;B1,B2)が帰属する前記ダイナミックレンジ制御フレーム(DFP;DFR)の開始点から、前記各シフトノード(A4,A5;B1,B2)が帰属する前記ダイナミックレンジ制御フレーム(DFP;DFR)内の前記各シフトノード(A4,A5;B1,B2)の時間的位置までの、時間差(t_A4,t_A5;t_B1,t_B2)と、前記各ダイナミックレンジ制御フレーム(DFP;DFR)に後続する前記ダイナミックレンジ制御フレーム(DFR;DFS)の時間的サイズ以上の大きさを有するオフセット値(drcFrameSize)と、の合計により表現される、オーディオ符号化装置。
- 請求項1乃至6のいずれか一項に記載のオーディオ符号化装置において、前記基準ダイナミックレンジ制御フレーム(DFR)の前記後続のダイナミックレンジ制御フレーム(DFS)に対応する前記ビットストリーム部分(DFS’)の最初の位置にある前記シフトノード(B1)のビット表現(B'1)のゲイン情報(GB1)は、絶対ゲイン値(g_B1)によって表現され、前記基準ダイナミックレンジ制御フレーム(DFR)の前記後続のダイナミックレンジ制御フレーム(DFS)に対応する前記ビットストリーム部分(DFS’)の最初の位置にある前記シフトノード(B1)のビット表現(B'1)よりも後の位置にあるシフトノード(B2)の各ビット表現(B'2)のゲイン情報(GB2)は相対ゲイン値によって表現され、その相対ゲイン値は、それぞれのシフトノード(B2)のビット表現(B'2)のゲイン値(g_B2)と、前記それぞれのシフトノード(B2)のビット表現(B'2)に先行する前記シフトノード(B1)のビット表現(B'1)のゲイン値(g_B1)との差に等しい、オーディオ符号化装置。
- 請求項1乃至7のいずれか一項に記載のオーディオ符号化装置において、前記基準ダイナミックレンジ制御フレーム(DFR)の1つ以上のシフトノード(B1,B2)の前記ビット表現(B'1,B'2)が、前記基準ダイナミックレンジ制御フレーム(DFR)の前記後続のダイナミックレンジ制御フレーム(DFS)に対応する前記ビットストリーム部分(DFS’)内に埋め込まれる場合には、前記1つ以上のシフトノード(B1,B2)のビット表現(B'1,B'2)の1つ以上の位置より後で、前記基準ダイナミックレンジ制御フレーム(DFR)に後続する前記ダイナミックレンジ制御フレーム(DFS)に対応する前記ビットストリーム部分(DFS’)の最初の位置にある、前記後続のダイナミックレンジ制御フレーム(DFS)のノード(C0)のビット表現(C'0)のゲイン情報(GC0)は相対ゲイン値によって表現され、その相対ゲイン値は、前記それぞれのノード(C0)のビット表現(C'0)のゲイン値(g_C0)と前記それぞれのノード(C0)のビット表現(C'0)に先行する前記シフトノード(B2)のビット表現(B'2)のゲイン値(g_B2)との差に等しい、オーディオ符号化装置。
- 請求項1乃至8のいずれか一項に記載のオーディオ符号化装置において、前記オーディオフレーム(AFP,AFR,AFS)の時間的サイズは、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の時間的サイズと等しい、オーディオ符号化装置。
- 請求項1乃至9のいずれか一項に記載のオーディオ符号化装置において、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の1つのフレームの前記1つ以上のノード(A0...A5;B0...B2;C0)が均一な時間グリッドから選択される、オーディオ符号化装置。
- 請求項1乃至10のいずれか一項に記載のオーディオ符号化装置において、前記1つ以上のノード(A0...A5;B0...B2;C0)の各ノード(A0...A5;B0...B2;C0)が傾き情報(SA0...SA5;SB0...SB2;SC0)を含む、オーディオ符号化装置。
- 請求項1乃至11のいずれか一項に記載のオーディオ符号化装置において、前記ダイナミックレンジ制御符号器(3)がエントロピー符号化技術を使用してノード(A0...A5;B0...B2;C0)を符号化するよう構成されている、オーディオ符号化装置。
- オーディオ復号化装置であって、
符号化済みオーディオビットストリーム(ABS)を復号化して、連続的なオーディオフレーム(AFP,AFR,AFS)を含むオーディオ信号(AS)を再生するオーディオ復号器(5)と、
符号化済みダイナミックレンジ制御ビットストリーム(DBS)を復号化して、前記オーディオ信号(AS)に対応しかつ連続的なダイナミックレンジ制御フレーム(DFP,DFR,DFS)を含むダイナミックレンジ制御シーケンス(DS)を再生するダイナミックレンジ制御復号器(6)と、を含み、
前記符号化済みダイナミックレンジ制御ビットストリーム(DBS)は、前記ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレーム(DFP,DFR,DFS)に対応するビットストリーム部分(DFP’,DFR’,DFS’)を含み、
前記符号化済みダイナミックレンジ制御ビットストリーム(DBS)は、ノード(A0...A5;B0...B2;C0)のビット表現(A'0...A'5;B'0...B'2;C'0)を含み、前記ノードの1つのノードの各ビット表現が、前記オーディオ信号(AS)のためのゲイン情報(GA0...GA5;GB0...GB2;GC0)と、それらゲイン情報(GA0...GA5;GB0...GB2;GC0)がどの時点に対応するかを示す時間情報(TA0...TA5;TB0...TB2;TC0)とを含み、
前記符号化済みダイナミックレンジ制御ビットストリーム(DBS)は、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の1つの基準ダイナミックレンジ制御フレーム(DFR)の前記ノード(B0...B2)から選択されたシフトノード(B1,B2)のビット表現(B'1,B'2)であって、前記1つの基準ダイナミックレンジ制御フレーム(DFR)に後続するダイナミックレンジ制御フレーム(DFS)に対応するビットストリーム部分内に埋め込まれたビット表現を含み、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)の前記ノード(B0...B2)の各残りのノード(B0)のビット表現(B'0)は、前記1つの基準ダイナミックレンジ制御フレーム(DFR)に対応するビットストリーム部分(DFR’)内に埋め込まれており、
前記ダイナミックレンジ制御復号器(6)は、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)のノード(B 0 ...B 2 )の各残りのノード(B0)のビット表現(B'0)を復号化して、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)の各残りのノード(B0)を再生し、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)のノード(B0...B2)から選択された前記シフトノード(B1,B2)の各シフトノード(B1,B2)のビット表現(B'1,B'2)を復号化して、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)のノードから選択された前記シフトノード(B1,B2)の各シフトノード(B1,B2)を再生し、更に再生された残りのノード(B0)と再生されたシフトノード(B1,B2)とを結合して、前記基準ダイナミックレンジ制御フレーム(DFR)を再生するよう構成されている、オーディオ復号化装置。 - 請求項13に記載のオーディオ復号化装置であって、前記ダイナミックレンジ制御復号器(6)は、前記時間情報(TA4,TA5;TB1,TB2)を使用して、1つ以上のシフトノード(A4,A5;B1,B2)を識別するよう構成されている、オーディオ復号化装置。
- 請求項13又は14に記載のオーディオ復号化装置において、前記1つ以上のシフトノード(A4,A5;B1,B2)の時間情報(TA4,TA5;TB1,TB2)であって、前記各シフトノード(A4,A5;B1,B2)が帰属する前記ダイナミックレンジ制御フレーム(DFP;DFR)の開始点から前記各シフトノード(A4,A5;B1,B2)が帰属する前記ダイナミックレンジ制御フレーム(DFP;DFR)内の前記各シフトノード(A4,A5;B1,B2)の時間的位置までの時間差(t_A4,t_A5;t_B1,t_B2)と、前記各ダイナミックレンジ制御フレーム(DFP;DFR)に後続するダイナミックレンジ制御フレーム(DFR;DFS)の時間的サイズ以上の大きさを有するオフセット値(drcFrameSize)と、の合計により表現される時間情報を、前記ダイナミックレンジ制御復号器(6)が復号化するよう構成されている、オーディオ復号化装置。
- 請求項13乃至15のいずれか一項に記載のオーディオ復号化装置において、前記ダイナミックレンジ制御復号器(6)は、前記基準ダイナミックレンジ制御フレーム(DFR)の前記後続のダイナミックレンジ制御フレーム(DFS)に対応するビットストリーム部分(DFS’)の最初の位置にあるシフトノード(B1)のビット表現(B'1)のゲイン情報(GB1)であって、絶対ゲイン値(g_B1)によって表現されるゲイン情報(GB1)を復号化し、且つ、前記基準ダイナミックレンジ制御フレーム(DFR)の前記後続のダイナミックレンジ制御フレーム(DFS)に対応するビットストリーム部分(DFS’)の最初の位置にあるシフトノード(B1)のビット表現(B'1)よりも後の位置にあるシフトノード(B2)の各ビット表現(B'2)のゲイン情報(GB2)であって、それぞれの前記シフトノード(B2)のビット表現(B'2)のゲイン値(g_B2)とそれぞれの前記シフトノード(B2)のビット表現(B'2)に先行する前記シフトノード(B1)の前記ビット表現(B'1)の前記ゲイン値(g_B1)との差に等しい、相対ゲイン値によって表現されるゲイン情報(GB2)を復号化するよう構成されている、オーディオ復号化装置。
- 請求項13乃至16のいずれか一項に記載のオーディオ復号化装置において、前記ダイナミックレンジ制御復号器(6)は、前記1つ以上のシフトノード(B1,B2)の前記ビット表現(B'1,B'2)の1つ以上の位置より後で、前記基準ダイナミックレンジ制御フレーム(DFR)に後続するダイナミックレンジ制御フレーム(DFS)に対応するビットストリーム部分(DFS’)の最初の位置にある、前記後続のダイナミックレンジ制御フレーム(DFS)のノード(C0)のビット表現(C'0)のゲイン情報(GC0)を復号化するよう構成され、前記ゲイン情報(GC0)は、それぞれの前記ノード(C0)のビット表現(C'0)のゲイン値(g_C0)とそれぞれの前記ノードC0のビット表現(C'0)に先行するシフトノード(B2)のビット表現(B'2)のゲイン値(g_B2)との差に等しい、相対ゲイン値によって表現される、オーディオ復号化装置。
- 請求項13乃至17のいずれか一項に記載のオーディオ復号化装置において、前記オーディオフレーム(AFP,AFR,AFS)の時間的サイズは、前記ダイナミックレンジ制御フレームDFP,DFR,DFSの時間的サイズと等しい、オーディオ復号化装置。
- 請求項13乃至18のいずれか一項に記載のオーディオ復号化装置において、 前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の1つのフレームの前記1つ以上のノード(A0...A5;B0...B2;C0)が均一な時間グリッドから選択される、オーディオ復号化装置。
- 請求項13乃至19のいずれか一項に記載のオーディオ復号化装置において、 前記1つ以上のノード(A0...A5;B0...B2;C0)の各ノード(A0...A5;B0...B2;C0)が、傾き情報(SA0...SA5;SB0...SB2;SC0)を含む、オーディオ復号化装置。
- 請求項13乃至20のいずれか一項に記載のオーディオ復号化装置において、前記ダイナミックレンジ制御復号器(6)は、前記ノードのビット表現(A'0...A'5;B'0...B'2;C'0)を、エントロピー復号化技術を使用して復号化するよう構成されている、オーディオ復号化装置。
- 請求項1乃至12のいずれか一項に記載のオーディオ符号化装置(1)と、請求項13乃至21のいずれか一項に記載のオーディオ復号化装置(4)と、を含むシステム。
- オーディオ符号化装置を操作する方法であって、
連続的なオーディオフレーム(AFP,AFR,AFS)を含むオーディオ信号(AS)から符号化済みオーディオビットストリーム(ABS)を生成するステップと、
前記オーディオ信号(AS)に対応しかつ連続的なダイナミックレンジ制御フレーム(DFP,DFR,DFS)を含むダイナミックレンジ制御シーケンス(DS)から、符号化済みダイナミックレンジ制御ビットストリーム(DBS)を生成するステップであって、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の各ダイナミックレンジ制御フレーム(DFP,DFR,DFS)は、1つ以上のノード(A0...A5;B0...B2;C0)を含み、それら1つ以上のノード(A0...A5;B0...B2;C0)の各ノードが、前記オーディオ信号(AS)についてのゲイン情報(GA0...GA5;GB0...GB2;GC0)と、それらゲイン情報(GA0...GA5;GB0...GB2;GC0)がどの時点に対応するかを示す時間情報(TA0...TA5;TB0...TB2;TC0)とを含んでおり、前記符号化済みダイナミックレンジ制御ビットストリーム(DBS)は、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の各ダイナミックレンジ制御フレーム(DFP,DFR,DFS)に対応するビットストリーム部分(DFP’,DFR’,DFS’)を含む、ステップと、
シフト処理を実行するステップであって、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)のうちの1つの基準ダイナミックレンジ制御フレーム(DFR)のノード(B0...B2)の1つ以上のノード(B1,B2)がシフトノード(B1,B2)として選択され、前記1つの基準ダイナミックレンジ制御フレーム(DFR)の前記1つ以上のシフトノード(B1,B2)の各々のビット表現(B'1,B'2)が、前記1つの基準ダイナミックレンジ制御フレーム(DFR)に後続するダイナミックレンジ制御フレーム(DFS)に対応するビットストリーム部分(DFS’)の中に埋め込まれ、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)の前記ノード(B0...B2)の各残りのノード(B0)のビット表現(B'0)が、前記1つの基準ダイナミックレンジ制御フレーム(DFR)に対応する前記ビットストリーム部分(DFR’)の中に埋め込まれる、ステップと、
を含む、方法。 - オーディオ復号化装置を操作する方法であって、
符号化済みオーディオビットストリーム(ABS)を復号化して、連続的なオーディオフレーム(AFP,AFR,AFS)を含むオーディオ信号(AS)を再生するステップと、
符号化済みダイナミックレンジ制御ビットストリーム(DBS)を復号化して、前記オーディオ信号(AS)に対応しかつ連続的なダイナミックレンジ制御フレーム(DFP,DFR,DFS)を含むダイナミックレンジ制御シーケンス(DS)を再生するステップと、
を含み、
前記符号化済みダイナミックレンジ制御ビットストリーム(DBS)は、前記ダイナミックレンジ制御フレームの各ダイナミックレンジ制御フレーム(DFP,DFR,DFS)に対応するビットストリーム部分(DFP’,DFR’,DFS’)を含み、
前記符号化済みダイナミックレンジ制御ビットストリーム(DBS)は、ノード(A0...A5;B0...B2;C0)のビット表現(A'0...A'5;B'0...B'2;C'0)を含み、前記ノードの1つのノードの各ビット表現が、前記オーディオ信号(AS)のためのゲイン情報(GA0...GA5;GB0...GB2;GC0)と、それらゲイン情報(GA0...GA5;GB0...GB2;GC0)がどの時点に対応するかを示す時間情報(TA0...TA5;TB0...TB2;TC0)とを含み、
前記符号化済みダイナミックレンジ制御ビットストリーム(DBS)は、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の1つの基準ダイナミックレンジ制御フレーム(DFR)の前記ノード(B0...B2)から選択されたシフトノード(B1,B2)のビット表現(B'1,B'2)であって、前記1つの基準ダイナミックレンジ制御フレーム(DFR)に後続するダイナミックレンジ制御フレーム(DFS)に対応するビットストリーム部分に埋め込まれたビット表現を含み、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)の前記ノード(B0...B2)の各残りのノード(B0)のビット表現(B'0)は、前記1つの基準ダイナミックレンジ制御フレーム(DFR)に対応するビットストリーム部分(DFR’)内に埋め込まれており、
前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)のノード(B 0 ...B 2 )の各残りのノード(B0)のビット表現(B'0)が復号化されて、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)の各残りのノード(B0)が再生され、
前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)のノード(B0...B2)から選択された前記シフトノード(B1,B2)の各シフトノード(B1,B2)のビット表現(B'1,B'2)が復号化されて、前記ダイナミックレンジ制御フレーム(DFP,DFR,DFS)の前記1つの基準ダイナミックレンジ制御フレーム(DFR)のノードから選択された前記シフトノード(B1,B2)の各シフトノード(B1,B2)が再生され、
再生された残りのノード(B0)と再生されたシフトノード(B1,B2)とが結合されて、前記基準ダイナミックレンジ制御フレーム(DFR)が再生される、
方法。 - プロセッサ上で作動するとき、請求項23又は24に記載の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14161605 | 2014-03-25 | ||
EP14161605.2 | 2014-03-25 | ||
PCT/EP2015/055945 WO2015144587A1 (en) | 2014-03-25 | 2015-03-20 | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017517020A JP2017517020A (ja) | 2017-06-22 |
JP6259930B2 true JP6259930B2 (ja) | 2018-01-10 |
Family
ID=52727126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016559243A Active JP6259930B2 (ja) | 2014-03-25 | 2015-03-20 | ダイナミックレンジ制御における効率的なゲイン符号化を有するオーディオ符号化装置及びオーディオ復号化装置 |
Country Status (20)
Country | Link |
---|---|
US (3) | US10074377B2 (ja) |
EP (1) | EP3123469B1 (ja) |
JP (1) | JP6259930B2 (ja) |
KR (1) | KR101890216B1 (ja) |
CN (2) | CN111326165B (ja) |
AR (1) | AR099836A1 (ja) |
AU (1) | AU2015238519B2 (ja) |
BR (1) | BR112016021382B1 (ja) |
CA (1) | CA2942743C (ja) |
ES (1) | ES2678068T3 (ja) |
MX (1) | MX355089B (ja) |
MY (1) | MY186155A (ja) |
PL (1) | PL3123469T3 (ja) |
PT (1) | PT3123469T (ja) |
RU (1) | RU2678487C2 (ja) |
SG (1) | SG11201607940WA (ja) |
TR (1) | TR201809427T4 (ja) |
TW (1) | TWI585751B (ja) |
WO (1) | WO2015144587A1 (ja) |
ZA (1) | ZA201607193B (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2005299410B2 (en) | 2004-10-26 | 2011-04-07 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
TWI447709B (zh) | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
JP6174129B2 (ja) | 2012-05-18 | 2017-08-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
IN2015MN01766A (ja) | 2013-01-21 | 2015-08-28 | Dolby Lab Licensing Corp | |
IL287218B (en) | 2013-01-21 | 2022-07-01 | Dolby Laboratories Licensing Corp | Audio encoder and decoder with program loudness and boundary metada |
EP2959479B1 (en) | 2013-02-21 | 2019-07-03 | Dolby International AB | Methods for parametric multi-channel encoding |
CN107093991B (zh) | 2013-03-26 | 2020-10-09 | 杜比实验室特许公司 | 基于目标响度的响度归一化方法和设备 |
US9635417B2 (en) | 2013-04-05 | 2017-04-25 | Dolby Laboratories Licensing Corporation | Acquisition, recovery, and matching of unique information from file-based media for automated file detection |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
CN109903776B (zh) | 2013-09-12 | 2024-03-01 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
CN110675884B (zh) | 2013-09-12 | 2023-08-08 | 杜比实验室特许公司 | 用于下混合音频内容的响度调整 |
AU2014371411A1 (en) | 2013-12-27 | 2016-06-23 | Sony Corporation | Decoding device, method, and program |
SG11201607940WA (en) | 2014-03-25 | 2016-10-28 | Fraunhofer Ges Forschung | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
CN105142067B (zh) | 2014-05-26 | 2020-01-07 | 杜比实验室特许公司 | 音频信号响度控制 |
EP3518236B8 (en) | 2014-10-10 | 2022-05-25 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5701390A (en) * | 1995-02-22 | 1997-12-23 | Digital Voice Systems, Inc. | Synthesis of MBE-based coded speech using regenerated phase information |
RU2144222C1 (ru) * | 1998-12-30 | 2000-01-10 | Гусихин Артур Владимирович | Способ сжатия звуковой информации и система для его реализации |
US6785655B1 (en) * | 2000-05-15 | 2004-08-31 | Lsi Logic Corporation | Method for independent dynamic range control |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
JP4575609B2 (ja) * | 2001-03-13 | 2010-11-04 | 旭化成エレクトロニクス株式会社 | データ変換装置 |
KR100754439B1 (ko) * | 2003-01-09 | 2007-08-31 | 와이더댄 주식회사 | 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법 |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
KR101087588B1 (ko) * | 2004-07-02 | 2011-11-29 | 닐슨 미디어 리서치 인코퍼레이티드 | 압축 디지털 비트스트림을 믹싱하는 방법 및 장치 |
CN101046963B (zh) * | 2004-09-17 | 2011-03-23 | 广州广晟数码技术有限公司 | 解码经编码的音频数据流的方法 |
US7991610B2 (en) * | 2005-04-13 | 2011-08-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Adaptive grouping of parameters for enhanced coding efficiency |
US8521314B2 (en) * | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
CN101587711B (zh) * | 2008-05-23 | 2012-07-04 | 华为技术有限公司 | 基音后处理方法、滤波器以及基音后处理系统 |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
EP4293665A3 (en) * | 2008-10-29 | 2024-01-10 | Dolby International AB | Signal clipping protection using pre-existing audio gain metadata |
KR101336891B1 (ko) * | 2008-12-19 | 2013-12-04 | 한국전자통신연구원 | G.711 코덱의 음질 향상을 위한 부호화 장치 및 복호화 장치 |
US8600179B2 (en) * | 2009-09-17 | 2013-12-03 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding image based on skip mode |
TWI447709B (zh) * | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
US9443534B2 (en) * | 2010-04-14 | 2016-09-13 | Huawei Technologies Co., Ltd. | Bandwidth extension system and approach |
JP5650227B2 (ja) * | 2010-08-23 | 2015-01-07 | パナソニック株式会社 | 音声信号処理装置及び音声信号処理方法 |
US9117455B2 (en) * | 2011-07-29 | 2015-08-25 | Dts Llc | Adaptive voice intelligibility processor |
WO2013041875A2 (en) * | 2011-09-22 | 2013-03-28 | Earsoft Limited | Dynamic range control |
JP6174129B2 (ja) * | 2012-05-18 | 2017-08-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム |
US9332373B2 (en) * | 2012-05-31 | 2016-05-03 | Dts, Inc. | Audio depth dynamic range enhancement |
US9460729B2 (en) * | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
US9607624B2 (en) * | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
TWM487509U (zh) * | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
SG11201607940WA (en) | 2014-03-25 | 2016-10-28 | Fraunhofer Ges Forschung | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
-
2015
- 2015-03-20 SG SG11201607940WA patent/SG11201607940WA/en unknown
- 2015-03-20 KR KR1020167029370A patent/KR101890216B1/ko active IP Right Grant
- 2015-03-20 CA CA2942743A patent/CA2942743C/en active Active
- 2015-03-20 BR BR112016021382-3A patent/BR112016021382B1/pt active IP Right Grant
- 2015-03-20 PL PL15711734T patent/PL3123469T3/pl unknown
- 2015-03-20 ES ES15711734.2T patent/ES2678068T3/es active Active
- 2015-03-20 MY MYPI2016001726A patent/MY186155A/en unknown
- 2015-03-20 PT PT157117342T patent/PT3123469T/pt unknown
- 2015-03-20 MX MX2016012421A patent/MX355089B/es active IP Right Grant
- 2015-03-20 AU AU2015238519A patent/AU2015238519B2/en active Active
- 2015-03-20 CN CN201911392325.8A patent/CN111326165B/zh active Active
- 2015-03-20 EP EP15711734.2A patent/EP3123469B1/en active Active
- 2015-03-20 CN CN201580015978.8A patent/CN106165014B/zh active Active
- 2015-03-20 WO PCT/EP2015/055945 patent/WO2015144587A1/en active Application Filing
- 2015-03-20 JP JP2016559243A patent/JP6259930B2/ja active Active
- 2015-03-20 RU RU2016141556A patent/RU2678487C2/ru active
- 2015-03-20 TR TR2018/09427T patent/TR201809427T4/tr unknown
- 2015-03-24 TW TW104109407A patent/TWI585751B/zh active
- 2015-03-25 AR ARP150100878A patent/AR099836A1/es active IP Right Grant
-
2016
- 2016-09-22 US US15/272,653 patent/US10074377B2/en not_active Ceased
- 2016-10-19 ZA ZA2016/07193A patent/ZA201607193B/en unknown
-
2019
- 2019-05-06 US US16/404,503 patent/USRE49107E1/en active Active
-
2022
- 2022-05-20 US US17/664,381 patent/US20220277756A1/en not_active Abandoned
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6259930B2 (ja) | ダイナミックレンジ制御における効率的なゲイン符号化を有するオーディオ符号化装置及びオーディオ復号化装置 | |
JP7215534B2 (ja) | 復号化装置および方法、並びにプログラム | |
JP6531649B2 (ja) | 符号化装置および方法、復号化装置および方法、並びにプログラム | |
JP2018151639A (ja) | オーディオ装置のための組合せダイナミックレンジ圧縮および誘導クリッピング防止のための概念 | |
JP4800379B2 (ja) | 最大ビットレートを保証する情報の無損失符号化 | |
KR20060007371A (ko) | 음성 신호의 스펙트럼 재구성 방법 및 장치 | |
KR102426965B1 (ko) | 대화 향상을 위한 디코딩 방법 및 디코더 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171031 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171211 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6259930 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |