JP6224233B2 - 分配量子化及び符号化を使用したオーディオ信号包絡の分割によるオーディオ信号包絡符号化、処理及び復号化の装置と方法 - Google Patents
分配量子化及び符号化を使用したオーディオ信号包絡の分割によるオーディオ信号包絡符号化、処理及び復号化の装置と方法 Download PDFInfo
- Publication number
- JP6224233B2 JP6224233B2 JP2016518977A JP2016518977A JP6224233B2 JP 6224233 B2 JP6224233 B2 JP 6224233B2 JP 2016518977 A JP2016518977 A JP 2016518977A JP 2016518977 A JP2016518977 A JP 2016518977A JP 6224233 B2 JP6224233 B2 JP 6224233B2
- Authority
- JP
- Japan
- Prior art keywords
- signal envelope
- value
- audio signal
- envelope
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 327
- 238000000034 method Methods 0.000 title claims description 80
- 238000013139 quantization Methods 0.000 title description 29
- 238000012545 processing Methods 0.000 title description 9
- 230000002776 aggregation Effects 0.000 claims description 177
- 238000004220 aggregation Methods 0.000 claims description 177
- 238000004590 computer program Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 description 73
- 230000003595 spectral effect Effects 0.000 description 47
- 238000005192 partition Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 20
- 230000001186 cumulative effect Effects 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 12
- 238000001228 spectrum Methods 0.000 description 8
- 238000013459 approach Methods 0.000 description 5
- 238000007792 addition Methods 0.000 description 4
- 238000009499 grossing Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000006641 stabilisation Effects 0.000 description 3
- 238000011105 stabilization Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0016—Codebook for LPC parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Stereophonic System (AREA)
Description
−1つ以上の分割点に依存して再生オーディオ信号包絡を生成するステップと、
−再生オーディオ信号包絡を出力するステップと、
を含む。
−1つ以上の分割点に依存して再生オーディオ信号包絡を生成するステップと、
−再生オーディオ信号包絡を出力するステップと、
を含む。
−オーディオ信号包絡を受信するステップと、
−予め定義された割当規則に依存して、少なくとも2つの分割点構成の各々のために、2つ以上のオーディオ信号包絡部分の少なくとも1つのオーディオ信号包絡部分についての信号包絡部分値を決定するステップであって、少なくとも2つの分割点構成の各々は1つ以上の分割点を含み、その2つ以上の分割点構成の各々の1つ以上の分割点はオーディオ信号包絡を2つ以上のオーディオ信号包絡部分へと分割する、ステップと、
−少なくとも2つの分割点構成の1つの1つ以上の分割点を、オーディオ信号包絡を符号化するための1つ以上の選択された分割点として選択するステップであって、前記1つ以上の分割点を選択するステップは、少なくとも2つの分割点構成の各々の2つ以上のオーディオ信号包絡部分の少なくとも1つのオーディオ信号包絡部分の各々の信号包絡部分値に依存して実行されるステップと、
を含む。
[数1]
ここで、tilt(k)はk番目の符号化値における集計信号包絡の導関数を示し、c(k)は集計関数のk番目の集計点の集計値であり、f(k)は集計関数のk番目の集計点の引数値である。
[数2]
ここで、c(k)は符号化ユニットによって決定されるべきk番目の符号化値を示し、jは複数の引数値のj番目の引数値を示し、a(j)はそのj番目の引数値に割り当てられた集計値を示し、max(a)は引数値のうちの1つに割り当てられた集計値のうちの1つである最大値であり、引数値のうちの1つに割り当てられた集計値はいずれも前記最大値を上回らず、
[数11]
は、
[数12]
が最小となる、前記引数値のうちの1つである最小値を示す。
−1つ以上の符号化値を受信するステップと、
−1つ以上の符号化値に依存してオーディオ信号包絡を生成するステップと、
を含む。
−複数の引数値の各々について集計値を決定するステップであって、複数の引数値は、それら複数の引数値の第1引数値とそれら複数の引数値の第2引数値とが異なる場合、前記第1引数値が前記第2引数値に先行又は後続するように、順序付けられており、引数値の各々に対して1つの包絡値が割り当てられ、引数値の各々の包絡値はオーディオ信号包絡に依存しており、集計部は、前記引数値の包絡値に依存し、かつ前記引数値に先行する複数の引数値の各々の包絡値に依存して、複数の引数値の各引数値についての集計値を決定するステップと、
−複数の引数値の1つ以上の集計値に依存して1つ以上の符号化値を決定するステップと、
を含む。
[数3]
である、としてもよい。ここで、「lowerbound」は信号包絡部分mの下限値であり、「upperbound」は信号包絡部分mの上限値である。
[数4]
ここで、nはオーディオ信号包絡のサンプルの個数、例えばオーディオ信号包絡のスペクトル値の個数を示す。上述の実施例において、nは例えばn=33でもよい。
[数8]
ここで、totalenergy は全体エネルギーを示し、kは1つ以上の分割点のk番目の分割点を示し、Nは1つ以上の分割点数を示す。
x≧0のときa=x;
x<0のときa=−x;
を意味する。
(1)2つのシーケンスであって、そのうちの1つは純粋に実数であり、1つは純粋に虚数である。又は
(2)2つのシーケンスであって、そのうちの1番目は振幅を表現し、2番目は位相を表現する。
次に、両方の場合におけるこれら2つのシーケンスは2つの別個の包絡としてモデル化され得る。
[数10]
ここで、c(k)は符号化ユニットによって決定されるべきk番目の符号化値を示し、jは複数の引数値のj番目の引数値を示し、a(j)はそのj番目の引数値に割り当てられた集計値を示し、max(a)は引数値のうちの1つに割り当てられた集計値のうちの1つである最大値であり、引数値のうちの1つに割り当てられた集計値は、いずれも前記最大値を上回らず、
[数11]
は、
[数12]
が最小となる、前記引数値のうちの1つである最小値を示す。
[数13]
ここで、tilt(k)はk番目の符号化値における集計関数の導関数を示し、c(k+1)は前記第1集計値であり、f(k+1)は前記第1引数値であり、c(k-1)は前記第2集計値であり、f(k-1)は前記第2引数値であり、kは1つ以上の符号化値のうちの1つのインデックスを示す整数であり、c(k+1)-c(k-1)は2つの集計値c(k+1)及びc(k-1)の第1差分であり、f(k+1)-f(k-1)は2つの引数値f(k+1)及びf(k-1)の第2差分である。
[数14]
ここで、tilt(k)はk番目の符号化値における集計関数の導関数を示し、c(k+1)は前記第1集計値であり、f(k+1)は前記第1引数値であり、c(k)は前記第2集計値であり、f(k)は前記第2引数値であり、c(k-1)は集計関数の(複数の)集計点のうちの第3集計点の第3集計値であり、f(k-1)は集計関数の(複数の)集計点のうちの第3集計点の第3引数値であり、kは1つ以上の符号化値のうちの1つのインデックスを示す整数であり、c(k+1)-c(k)は2つの集計値c(k+1)及びc(k)の第1差分であり、f(k+1)-f(k)は2つの引数値f(k+1)及びf(k)の第2差分である。
[数15]
及び
[数16]
−オリジナルオーディオ信号からHF帯域のスペクトル振幅(spectral magnitude)又はエネルギー値を計算すること、及び/又は、
−スペクトル包絡を等しいブロックマスのK+1個のブロックへと分割するK個のサブバンド・インデックスの所定の(又は任意かつ伝送された)個数を計算すること、及び/又は、
−TSD(非特許文献5)と同じアルゴリズムを用いてインデックスを符号化すること、及び/又は、
−HF帯域の全体マスの(例えばハフマンを介する)量子化及び符号化と、全体マス及びインデックスのビットストリームへの書き込み。
−ビットストリームからの全体マスとインデックスとの読み出し、及び後続の復号化、及び/又は、
−スプライン補間を介する滑らかな累積マス曲線の近似、及び/又は、
−累積マス曲線の一次導関数を行ってスペクトル包絡を再生すること。
−スペクトル・エネルギー目標包絡曲線(例えば20個のサブバンドサンプルによって表現される)とその対応する全体エネルギーとの決定
−値の総数を削減する(例えば上側の8サブバンド値を平均化し、それにより20から16へと総数を削減する)ために、サブバンド値をペア毎に平均化することによる包絡ワーピングの適用
−包絡モデル性能と知覚的品質基準との間の良好な一致のための、包絡振幅変換の適用(例えば各サブバンド値についての4次ルート
の抽出)
−等しいマスの所定数のブロックへと包絡を分割するサブバンド・インデックスの複数回の決定(例えば、包絡を3、4、6及び8ブロックへ分割するための決定を4回繰り返す)
−分配量子化された包絡の全体の再生(「分析と合成」の手法、以下参照)
−包絡の最も正確な記述をもたらすブロック数の判定と決定(例えば分配量子化された包絡とオリジナルとのクロス相関を比較することによって)
−オリジナルと分配量子化された包絡との比較によるラウドネス修正と、それに応じた全体エネルギーの適応
−TSDツール(非特許文献5参照)と同様のアルゴリズムを用いた分割インデックスの符号化
−分配量子化に使用されたブロック数の信号化(例えば4個の所定数のブロックを2ビットで信号化)
−全体エネルギーの量子化と符号化(例えばハフマン符号化を用いて)
−分配量子化に使用されるべきブロック数の復号化と全体エネルギーの復号化
−TSDツール(非特許文献5参照)と同様のアルゴリズムを用いた分割インデックスの復号化
−スプライン補間を介する滑らかな累積マス曲線の近似
−一次導関数を介した累積ドメインからのスペクトル包絡の再生(例えば連続したサンプルの差を取ることによって)
−量子化エラーに起因する後続の包絡間の変動を相殺するための包絡安定化の適用(例えば、再生サブバンド値を次式により時間的に平滑化すること、
ここで、過渡信号部分を含むフレームについてはα=0.1であり、その他の場合にはα=0.25である)
−符号器におけるアプリケーションに従う包絡変換の逆転
−符号器におけるアプリケーションに従う包絡ワーピングの逆転
Nを可能な分割点位置の(全体)数とし、かつPを分割点の(全体)数とする。
個の異なる組合せがある。
個の可能な組合せの各々がある独特の分割点状態数によって表現されており、どの分割点状態数が分割点位置のどの組合せを表しているかを復号化装置が認識している場合、その復号化装置は、N,P及び分割点状態数を使用して、分割点の位置を復号化することができる。N及びPの多くの典型的な値について、そのような符号化技術は、他の概念に比べて、事象の分割点位置を符号化するためにより少ないビットを使用する。
となる。従って、必要となるビットの数は次の通りである。
[数17]
Nは可能な分割点位置の(全体)数であり、Pは分割点の数であると仮定する(これは、Nが全体位置数FSNであり、Pが分割点数ESONであり得ることを意味する)。第1の可能な分割点位置が考慮対象となる。2つの場合が区別されてもよい。
であってもよい。
へ減少する。逆に、その状態が
よりも大きい場合、第1の可能な分割点位置に分割点が配置されていると結論付けることが可能である。このことから、以下の復号化アルゴリズムが導かれる:
[数20]
分割点状態数/f(区分Bの分割点数,Nb)
[数23]
[数24]
Claims (25)
- 再生オーディオ信号包絡を得るために復号化する装置であって、
1つ以上の分割点に依存して前記再生オーディオ信号包絡を生成する信号包絡再生部(110)と、
前記再生オーディオ信号包絡を出力する出力インターフェース(120)と、を含み、
前記信号包絡再生部(110)は、前記1つ以上の分割点が前記再生オーディオ信号包絡を2つ以上のオーディオ信号包絡部分へと分割するように、前記再生オーディオ信号包絡を生成するよう構成されており、予め定義された割当規則が、前記2つ以上の信号包絡部分の各信号包絡部分についての信号包絡部分値を、前記信号包絡部分に依存して定義しており、
前記信号包絡再生部(110)は、前記2つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が他の信号包絡部分の各々の信号包絡部分値の絶対値の半分よりも大きくなるように、前記再生オーディオ信号包絡を生成するよう構成されている、装置。 - 請求項1に記載の装置であって、前記信号包絡再生部(110)は、前記2つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が前記他の信号包絡部分の各々の信号包絡部分値の絶対値の90%よりも大きくなるように、前記再生オーディオ信号包絡を生成するよう構成されている、装置。
- 請求項2に記載の装置であって、前記信号包絡再生部(110)は、前記2つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が前記他の信号包絡部分の各々の信号包絡部分値の絶対値の99%よりも大きくなるように、前記再生オーディオ信号包絡を生成するよう構成されている、装置。
- 請求項3に記載の装置であって、前記信号包絡再生部(110)は、前記2つ以上の信号包絡部分の各々の前記信号包絡部分値が、前記2つ以上の信号包絡部分の他の信号包絡部分の各々の前記信号包絡部分値と等しくなるように、前記再生オーディオ信号包絡を生成するよう構成されている、装置。
- 再生オーディオ信号包絡を得るために復号化する装置であって、
1つ以上の分割点に依存して前記再生オーディオ信号包絡を生成する信号包絡再生部(110)と、
前記再生オーディオ信号包絡を出力するための出力インターフェース(120)と、を含み、
前記信号包絡再生部(110)は、前記1つ以上の分割点が前記再生オーディオ信号包絡を2つ以上のオーディオ信号包絡部分へと分割するように、前記再生オーディオ信号包絡を生成するよう構成されており、予め定義された割当規則が、前記2つ以上の信号包絡部分の各信号包絡部分についての信号包絡部分値を、前記信号包絡部分に依存して定義しており、
前記2つ以上の信号包絡部分の各々に対して所定の包絡部分値が割り当てられており、
前記信号包絡再生部(110)は、前記2つ以上の信号包絡部分の各信号包絡部分について、前記信号包絡部分の信号包絡部分値の絶対値が、前記信号包絡部分に割り当てられた前記所定の包絡部分値の絶対値の90%よりも大きくなるように、かつ前記信号包絡部分の信号包絡部分値の絶対値が、前記信号包絡部分に割り当てられた前記所定の包絡部分値の絶対値の110%よりも小さくなるように、前記再生オーディオ信号包絡を生成するよう構成されている、装置。 - 請求項5に記載の装置であって、前記信号包絡再生部(110)は、前記2つ以上の信号包絡部分の各々の信号包絡部分値が、前記信号包絡部分に割り当てられた前記所定の包絡部分値と等しくなるように、前記再生オーディオ信号包絡を生成するよう構成されている、装置。
- 請求項5又は6に記載の装置であって、前記信号包絡部分の少なくとも2つの前記所定の包絡部分値は互いに異なる、装置。
- 請求項5又は6に記載の装置であって、前記信号包絡部分の各々の前記所定の包絡部分値は他の信号包絡部分の各々の前記所定の包絡部分値と異なる、装置。
- 請求項1乃至8のいずれか一項に記載の装置であって、前記2つ以上の信号包絡部分の各信号包絡部分の前記信号包絡部分値は、前記信号包絡部分の1つ以上のエネルギー値若しくは1つ以上のパワー値に依存するか、又は、前記オーディオ信号包絡のオリジナルレベル若しくは目標レベルを再生するために適切な他の任意の値に依存する、装置。
- 請求項1乃至9のいずれか一項に記載の装置であって、
前記信号包絡再生部(110)は、前記1つ以上の分割点に依存して集計関数を生成するよう構成され、前記集計関数は複数の集計点を含み、前記集計点の各々は引数値と集計値とを含み、前記集計関数は単調増加し、前記1つ以上の分割点の各々は、前記集計関数の集計点のうちの1つの前記引数値及び集計値の少なくとも1つを示すものであり、
前記信号包絡再生部(110)は、前記オーディオ信号包絡が複数の包絡点を含むように、前記オーディオ信号包絡を生成するよう構成され、前記包絡点の各々が引数値と包絡値とを含み、前記集計関数の集計点の各々について、前記包絡点の引数値が前記集計点の引数値と等しくなるように、前記オーディオ信号包絡の包絡点の1つが前記集計点に対して割り当てられており、
前記信号包絡再生部(110)は、前記オーディオ信号包絡の包絡点の各々の包絡値が、前記集計関数の少なくとも1つの集計点の集計値に依存するように、前記オーディオ信号包絡を生成するよう構成されている、装置。 - 請求項10に記載の装置であって、前記信号包絡再生部(110)は、第1差分と第2差分との比を決定することにより前記オーディオ信号包絡を決定するよう構成されており、前記第1差分は、前記集計関数の集計点のうちの第1集計点の第1集計値(c(k+1))と前記集計関数の集計点のうちの第2集計点の第2集計値(c(k-1);c(k))との差であり、前記第2差分は、前記集計関数の集計点のうちの前記第1集計点の第1引数値(f(k+1))と前記集計関数の集計点のうちの第2集計点の第2引数値(f(k-1);f(k))との差である、装置。
- 請求項11に記載の装置であって、前記信号包絡再生部(110)は、次式を適用することで前記オーディオ信号包絡を決定するよう構成されており、
[数13]
ここで、tilt(k)はk番目の分割点における前記集計関数の導関数を示し、
c(k+1)は前記第1集計値であり、
f(k+1)は前記第1引数値であり、
c(k-1)は前記第2集計値であり、
f(k-1)は前記第2引数値であり、
kは前記1つ以上の分割点のうちの1つのインデックスを示す整数であり、
c(k+1)-c(k-1)は前記2つの集計値c(k+1)及びc(k-1)の第1差分であり、
f(k+1)-f(k-1)は前記2つの引数値f(k+1)及びf(k-1)の第2差分である、装置。 - 請求項11に記載の装置であって、前記信号包絡再生部(110)は、次式を適用して前記オーディオ信号包絡を決定するよう構成されており、
[数14]
ここで、tilt(k)はk番目の分割点における前記集計関数の導関数を示し、
c(k+1)は前記第1集計値であり、
f(k+1)は前記第1引数値であり、
c(k)は前記第2集計値であり、
f(k)は前記第2引数値であり、
c(k-1)は前記集計関数の集計点のうちの第3集計点の第3集計値であり、
f(k-1)は前記集計関数の集計点のうちの第3集計点の第3引数値であり、
kは前記1つ以上の分割点のうちの1つのインデックスを示す整数であり、
c(k+1)-c(k)は前記2つの集計値c(k+1)及びc(k)の第1差分であり、
f(k+1)-f(k)は前記2つの引数値f(k+1)及びf(k)の第2差分である、装置。 - 請求項1乃至13のいずれか一項に記載の装置であって、前記装置は、ある復号化規則に従って1つ以上の符号化された点を復号化して前記1つ以上の分割点の各々の位置を取得する、分割点復号器(105)を更に含み、
前記分割点復号器(105)は、可能な分割点位置の全体数を示す全体位置数と、前記1つ以上の分割点の数を示す分割点数と、分割点状態数と、を分析するよう構成されており、
前記分割点復号器(105)は、前記全体位置数と前記分割点数と前記分割点状態数とを使用して、前記1つ以上の分割点の各々の位置の指示を生成するよう構成されている、装置。 - 請求項1乃至14のいずれか一項に記載の装置であって、前記信号包絡再生部(110)は、前記再生オーディオ信号包絡の全体エネルギーを示す全体エネルギー値に依存して、又は前記オーディオ信号包絡のオリジナルレベル若しくは目標レベルを再生するのに適切な他の任意の値に依存して、前記再生オーディオ信号包絡を生成するよう構成されている、装置。
- オーディオ信号を再生する装置であって、
前記オーディオ信号の再生オーディオ信号包絡を得るための請求項1乃至15のうちの一項に記載の復号化する装置(1510)と、
前記オーディオ信号のオーディオ信号包絡に依存し、かつ前記オーディオ信号の更なる信号特性に依存して、前記オーディオ信号を生成する信号生成部(1520)であって、前記更なる信号特性は前記オーディオ信号包絡とは異なる、信号生成部(1520)と、
を含む装置。 - オーディオ信号包絡を符号化する装置であって、
前記オーディオ信号包絡を受信するオーディオ信号包絡インターフェース(210)と、
予め定義された割当規則に依存して、少なくとも2つの分割点構成の各々のために、2つ以上のオーディオ信号包絡部分の少なくとも1つのオーディオ信号包絡部分についての信号包絡部分値を決定する、分割点決定部(220)と、を含み、
前記少なくとも2つの分割点構成の各々は1つ以上の分割点を含み、前記2つ以上の分割点構成の各々の1つ以上の分割点は、前記オーディオ信号包絡を前記2つ以上のオーディオ信号包絡部分へと分割するものであり、
前記分割点決定部(220)は、前記少なくとも2つの分割点構成の1つの前記1つ以上の分割点を、前記オーディオ信号包絡を符号化するための1つ以上の選択された分割点として選択するよう構成されており、前記分割点決定部(220)は、前記1つ以上の分割点を、前記少なくとも2つの分割点構成の各々の前記2つ以上のオーディオ信号包絡部分の前記少なくとも1つのオーディオ信号包絡部分の各々の前記信号包絡部分値に依存して、選択するよう構成されている、装置。 - 請求項17に記載の装置であって、前記2つ以上の信号包絡部分の各信号包絡部分の前記信号包絡部分値は、前記信号包絡部分の1つ以上のエネルギー値又は1つ以上のパワー値に依存するか、又は、前記オーディオ信号包絡のオリジナルレベル若しくは目標レベルを再生するために適切な他の任意の値に依存する、装置。
- 請求項17又は18に記載の装置であって、
前記装置は、前記1つ以上の分割点の各々の位置を符号化して1つ以上の符号化された点を取得する、分割点符号器(225)を更に含み、
前記分割点符号器(225)は、分割点状態数を符号化することにより、前記1つ以上の分割点の各々の位置を符号化するよう構成されており、
前記分割点符号器(225)は、可能な分割点位置の全体数を示す全体位置数と、前記1つ以上の分割点の数を示す分割点数とを提供するよう構成されており、
前記分割点状態数と前記全体位置数と前記分割点数とは共に、前記1つ以上の分割点の各々の位置を示す、装置。 - 請求項17乃至19のいずれか一項に記載の装置であって、
前記オーディオ信号包絡の全体エネルギーを決定し、かつ前記オーディオ信号包絡の前記全体エネルギーを符号化するためのエネルギー決定部(230)を更に含むか、又は、
前記オーディオ信号包絡のオリジナルレベル若しくは目標レベルを再生するために適切な任意の他の値を決定するよう更に構成されている、装置。 - オーディオ信号を符号化する装置であって、
前記オーディオ信号のオーディオ信号包絡を符号化するための、請求項17乃至20のいずれか一項に記載の符号化する装置(1410)と、
前記オーディオ信号の更なる信号特性を符号化するための二次的信号特性符号器(1420)であって、前記更なる信号特性は前記オーディオ信号包絡とは異なる、信号特性符号器(1420)と、
を含む装置。 - 再生オーディオ信号包絡を得るために復号化する方法であって、
1つ以上の分割点に依存して前記再生オーディオ信号包絡を生成するステップと、
前記再生オーディオ信号包絡を出力するステップと、を含み、
前記再生オーディオ信号包絡を生成するステップは、前記1つ以上の分割点が前記再生オーディオ信号包絡を2つ以上のオーディオ信号包絡部分へと分割するように実行され、予め定義された割当規則が、前記2つ以上の信号包絡部分の各信号包絡部分についての信号包絡部分値を、前記信号包絡部分に依存して定義しており、
前記再生オーディオ信号包絡を生成するステップは、前記2つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が他の信号包絡部分の各々の信号包絡部分値の絶対値の半分よりも大きくなるように実行される、方法。 - 再生オーディオ信号包絡を得るために復号化する方法であって、
1つ以上の分割点に依存して前記再生オーディオ信号包絡を生成するステップと、
前記再生オーディオ信号包絡を出力するステップと、を含み、
前記再生オーディオ信号包絡を生成するステップは、前記1つ以上の分割点が前記再生オーディオ信号包絡を2つ以上のオーディオ信号包絡部分へと分割するように実行され、予め定義された割当規則が、前記2つ以上の信号包絡部分の各信号包絡部分についての信号包絡部分値を、前記信号包絡部分に依存して定義しており、
前記2つ以上の信号包絡部分の各々に対して所定の包絡部分値が割り当てられており、
前記再生オーディオ信号包絡を生成するステップは、前記2つ以上の信号包絡部分の各信号包絡部分について、前記信号包絡部分の信号包絡部分値の絶対値が前記信号包絡部分に割り当てられた前記所定の包絡部分値の絶対値の90%よりも大きくなるように、かつ前記信号包絡部分の信号包絡部分値の絶対値が前記信号包絡部分に割り当てられた前記所定の包絡部分値の絶対値の110%よりも小さくなるように、実行される、方法。 - オーディオ信号包絡を符号化する方法であって、
前記オーディオ信号包絡を受信するステップと、
予め定義された割当規則に依存して、少なくとも2つの分割点構成の各々のために、2つ以上のオーディオ信号包絡部分の少なくとも1つのオーディオ信号包絡部分についての信号包絡部分値を決定するステップであって、前記少なくとも2つの分割点構成の各々は1つ以上の分割点を含み、前記2つ以上の分割点構成の各々の前記1つ以上の分割点は、前記オーディオ信号包絡を前記2つ以上のオーディオ信号包絡部分へと分割するものである、ステップと、
前記少なくとも2つの分割点構成の1つの前記1つ以上の分割点を、前記オーディオ信号包絡を符号化するための1つ以上の選択された分割点として選択するステップであって、前記1つ以上の分割点を選択するステップは、前記少なくとも2つの分割点構成の各々の前記2つ以上のオーディオ信号包絡部分の前記少なくとも1つのオーディオ信号包絡部分の各々の前記信号包絡部分値に依存して実行される、ステップと、
を含む方法。 - コンピュータ又は信号プロセッサ上で作動されたとき、請求項22乃至24のいずれか一項に記載の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13171314 | 2013-06-10 | ||
EP13171314.1 | 2013-06-10 | ||
EP14167065 | 2014-05-05 | ||
EP14167065.3 | 2014-05-05 | ||
PCT/EP2014/062032 WO2014198724A1 (en) | 2013-06-10 | 2014-06-10 | Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016524186A JP2016524186A (ja) | 2016-08-12 |
JP6224233B2 true JP6224233B2 (ja) | 2017-11-01 |
Family
ID=50897640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016518977A Active JP6224233B2 (ja) | 2013-06-10 | 2014-06-10 | 分配量子化及び符号化を使用したオーディオ信号包絡の分割によるオーディオ信号包絡符号化、処理及び復号化の装置と方法 |
Country Status (16)
Country | Link |
---|---|
US (1) | US10115406B2 (ja) |
EP (1) | EP3008725B1 (ja) |
JP (1) | JP6224233B2 (ja) |
KR (1) | KR101789085B1 (ja) |
CN (1) | CN105340010B (ja) |
AU (1) | AU2014280256B2 (ja) |
BR (1) | BR112015030672B1 (ja) |
CA (1) | CA2914418C (ja) |
ES (1) | ES2635026T3 (ja) |
HK (1) | HK1223726A1 (ja) |
MX (1) | MX353188B (ja) |
MY (1) | MY170179A (ja) |
RU (1) | RU2660633C2 (ja) |
SG (1) | SG11201510164RA (ja) |
WO (1) | WO2014198724A1 (ja) |
ZA (1) | ZA201600080B (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG11201510164RA (en) | 2013-06-10 | 2016-01-28 | Fraunhofer Ges Forschung | Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding |
ES2646021T3 (es) | 2013-06-10 | 2017-12-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Método y aparato para codificación, procesamiento y decodificación de envolvente de señal de audio mediante modelado de una representación de suma acumulativa que emplea cuantificación de distribución y codificación |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5765127A (en) * | 1992-03-18 | 1998-06-09 | Sony Corp | High efficiency encoding method |
JP3271193B2 (ja) * | 1992-03-31 | 2002-04-02 | ソニー株式会社 | 音声符号化方法 |
US5710863A (en) | 1995-09-19 | 1998-01-20 | Chen; Juin-Hwey | Speech signal quantization using human auditory models in predictive coding systems |
JP3283413B2 (ja) | 1995-11-30 | 2002-05-20 | 株式会社日立製作所 | 符号化復号方法、符号化装置および復号装置 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
ATE421845T1 (de) * | 2005-04-15 | 2009-02-15 | Dolby Sweden Ab | Zeitliche hüllkurvenformgebung von entkorrelierten signalen |
US7630882B2 (en) | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
WO2007080211A1 (en) * | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
RU2420816C2 (ru) | 2006-02-24 | 2011-06-10 | Франс Телеком | Способ двоичного кодирования показателей квантования огибающей сигнала, способ декодирования огибающей сигнала и соответствующие модули кодирования и декодирования |
PL1999997T3 (pl) * | 2006-03-28 | 2011-09-30 | Fraunhofer Ges Forschung | Udoskonalony sposób kształtowania sygnału podczas rekonstrukcji wielokanałowego sygnału audio |
US8392176B2 (en) * | 2006-04-10 | 2013-03-05 | Qualcomm Incorporated | Processing of excitation in audio coding and decoding |
US8532984B2 (en) * | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
DE102006049154B4 (de) * | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
US8417532B2 (en) * | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
EP2165328B1 (en) | 2007-06-11 | 2018-01-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding of an audio signal having an impulse-like portion and a stationary portion |
US20100207689A1 (en) * | 2007-09-19 | 2010-08-19 | Nec Corporation | Noise suppression device, its method, and program |
CN101430880A (zh) * | 2007-11-07 | 2009-05-13 | 华为技术有限公司 | 一种背景噪声的编解码方法和装置 |
CN101521010B (zh) * | 2008-02-29 | 2011-10-05 | 华为技术有限公司 | 一种音频信号的编解码方法和装置 |
AU2009267530A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | An apparatus and a method for generating bandwidth extension output data |
CA2699316C (en) * | 2008-07-11 | 2014-03-18 | Max Neuendorf | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing |
PL3300076T3 (pl) * | 2008-07-11 | 2019-11-29 | Fraunhofer Ges Forschung | Koder audio i dekoder audio |
CN102081927B (zh) * | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
CN102081926B (zh) | 2009-11-27 | 2013-06-05 | 中兴通讯股份有限公司 | 格型矢量量化音频编解码方法和系统 |
PL2596497T3 (pl) * | 2010-07-19 | 2014-10-31 | Dolby Int Ab | Przetwarzanie sygnałów audio podczas rekonstrukcji wysokiej częstotliwości |
CN103582913B (zh) | 2011-04-28 | 2016-05-11 | 杜比国际公司 | 有效内容分类及响度估计 |
DE102013104921A1 (de) * | 2013-05-14 | 2014-11-20 | A. Monforts Textilmaschinen Gmbh & Co. Kg | Vorrichtung zum Beschichten und/oder Imprägnieren einer textilen Warenbahn |
ES2646021T3 (es) | 2013-06-10 | 2017-12-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Método y aparato para codificación, procesamiento y decodificación de envolvente de señal de audio mediante modelado de una representación de suma acumulativa que emplea cuantificación de distribución y codificación |
SG11201510164RA (en) | 2013-06-10 | 2016-01-28 | Fraunhofer Ges Forschung | Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding |
-
2014
- 2014-06-10 SG SG11201510164RA patent/SG11201510164RA/en unknown
- 2014-06-10 JP JP2016518977A patent/JP6224233B2/ja active Active
- 2014-06-10 EP EP14728995.3A patent/EP3008725B1/en active Active
- 2014-06-10 CA CA2914418A patent/CA2914418C/en active Active
- 2014-06-10 WO PCT/EP2014/062032 patent/WO2014198724A1/en active Application Filing
- 2014-06-10 BR BR112015030672-1A patent/BR112015030672B1/pt active IP Right Grant
- 2014-06-10 KR KR1020157037061A patent/KR101789085B1/ko active IP Right Grant
- 2014-06-10 MY MYPI2015002890A patent/MY170179A/en unknown
- 2014-06-10 CN CN201480033298.4A patent/CN105340010B/zh active Active
- 2014-06-10 RU RU2015156587A patent/RU2660633C2/ru active
- 2014-06-10 MX MX2015016789A patent/MX353188B/es active IP Right Grant
- 2014-06-10 AU AU2014280256A patent/AU2014280256B2/en active Active
- 2014-06-10 ES ES14728995.3T patent/ES2635026T3/es active Active
-
2015
- 2015-12-09 US US14/964,234 patent/US10115406B2/en active Active
-
2016
- 2016-01-06 ZA ZA2016/00080A patent/ZA201600080B/en unknown
- 2016-10-13 HK HK16111810.7A patent/HK1223726A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
RU2660633C2 (ru) | 2018-07-06 |
SG11201510164RA (en) | 2016-01-28 |
EP3008725A1 (en) | 2016-04-20 |
KR20160028420A (ko) | 2016-03-11 |
ES2635026T3 (es) | 2017-10-02 |
CN105340010A (zh) | 2016-02-17 |
JP2016524186A (ja) | 2016-08-12 |
WO2014198724A1 (en) | 2014-12-18 |
AU2014280256B2 (en) | 2016-10-27 |
CA2914418A1 (en) | 2014-12-18 |
US20160148621A1 (en) | 2016-05-26 |
MY170179A (en) | 2019-07-09 |
BR112015030672A2 (pt) | 2017-08-22 |
US10115406B2 (en) | 2018-10-30 |
CN105340010B (zh) | 2019-06-04 |
EP3008725B1 (en) | 2017-05-17 |
MX2015016789A (es) | 2016-03-31 |
MX353188B (es) | 2018-01-05 |
ZA201600080B (en) | 2017-08-30 |
BR112015030672B1 (pt) | 2021-02-23 |
HK1223726A1 (zh) | 2017-08-04 |
RU2015156587A (ru) | 2017-07-14 |
AU2014280256A1 (en) | 2016-01-21 |
KR101789085B1 (ko) | 2017-11-20 |
CA2914418C (en) | 2017-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101953648B1 (ko) | 오디오 신호 디코딩 또는 인코딩을 위한 시간 도메인 레벨 조정 | |
TW201405549A (zh) | 使用改良機率分布估計之基於線性預測的音訊寫碼技術 | |
KR20160129891A (ko) | 정보의 인코딩에 대한 개념 | |
KR20240036029A (ko) | 장기 예측 및/또는 고조파 후치 필터링에 기초하여 예측 스펙트럼을 생성하기 위한 프로세서 | |
JP6224233B2 (ja) | 分配量子化及び符号化を使用したオーディオ信号包絡の分割によるオーディオ信号包絡符号化、処理及び復号化の装置と方法 | |
JP6224827B2 (ja) | 分配量子化及び符号化を使用した累積和表現のモデル化によるオーディオ信号包絡符号化、処理及び復号化の装置と方法 | |
KR102569784B1 (ko) | 오디오 코덱의 장기 예측을 위한 시스템 및 방법 | |
JP2023507073A (ja) | 音声符号化のための周波数領域における階調信号の長期予測のための符号化器、復号化器、符号化方法及び復号化方法 | |
JP5786044B2 (ja) | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 | |
KR20240042449A (ko) | 오디오 신호의 펄스 및 잔차 부분의 코딩 및 디코딩 | |
EP4371107A1 (en) | Integral band-wise parametric audio coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20160425 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20170221 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20170516 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170912 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171004 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6224233 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |