JP2016526695A - 分配量子化及び符号化を使用した累積和表現のモデル化によるオーディオ信号包絡符号化、処理及び復号化の装置と方法 - Google Patents
分配量子化及び符号化を使用した累積和表現のモデル化によるオーディオ信号包絡符号化、処理及び復号化の装置と方法 Download PDFInfo
- Publication number
- JP2016526695A JP2016526695A JP2016518979A JP2016518979A JP2016526695A JP 2016526695 A JP2016526695 A JP 2016526695A JP 2016518979 A JP2016518979 A JP 2016518979A JP 2016518979 A JP2016518979 A JP 2016518979A JP 2016526695 A JP2016526695 A JP 2016526695A
- Authority
- JP
- Japan
- Prior art keywords
- value
- envelope
- signal envelope
- argument
- values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 287
- 238000000034 method Methods 0.000 title claims description 78
- 238000013139 quantization Methods 0.000 title description 29
- 230000001186 cumulative effect Effects 0.000 title description 15
- 238000012545 processing Methods 0.000 title description 9
- 230000002776 aggregation Effects 0.000 claims abstract description 222
- 238000004220 aggregation Methods 0.000 claims abstract description 222
- 238000004590 computer program Methods 0.000 claims description 12
- 238000001228 spectrum Methods 0.000 claims description 9
- 230000001419 dependent effect Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 74
- 230000003595 spectral effect Effects 0.000 description 49
- 238000005192 partition Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 21
- 238000004422 calculation algorithm Methods 0.000 description 12
- 238000013459 approach Methods 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 238000007792 addition Methods 0.000 description 4
- 238000009499 grossing Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000006641 stabilisation Effects 0.000 description 3
- 238000011105 stabilization Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Description
[数1]
ここで、tilt(k)はk番目の符号化値における集計信号包絡の導関数を示し、c(k)は集計関数のk番目の集計点の集計値であり、f(k)は集計関数のk番目の集計点の引数値である。
[数2]
ここで、c(k)は符号化ユニットによって決定されるべきk番目の符号化値を示し、jは複数の引数値のj番目の引数値を示し、a(j)はそのj番目の引数値に割り当てられた集計値を示し、max(a)は引数値のうちの1つに割り当てられた集計値のうちの1つである最大値であり、引数値のうちの1つに割り当てられた集計値はいずれも前記最大値を上回らず、
[数11]
は、
[数12]
が最小となる、前記引数値のうちの1つである最小値を示す。
−1つ以上の符号化値を受信するステップと、
−1つ以上の符号化値に依存してオーディオ信号包絡を生成するステップと、
を含む。
−複数の引数値の各々について集計値を決定するステップであって、複数の引数値は、それら複数の引数値の第1引数値とそれら複数の引数値の第2引数値とが異なるとき、前記第1引数値が前記第2引数値に先行又は後続するように、順序付けられており、引数値の各々に対して1つの包絡値が割り当てられ、引数値の各々の包絡値はオーディオ信号包絡に依存しており、集計部は、前記引数値の包絡値に依存し、かつ前記引数値に先行する複数の引数値の各々の包絡値に依存して、複数の引数値の各引数値についての集計値を決定するステップと、
−複数の引数値の1つ以上の集計値に依存して1つ以上の符号化値を決定するステップと、
を含む。
−1つ以上の分割点に依存して再生オーディオ信号包絡を生成するステップと、
−再生オーディオ信号包絡を出力するステップと、
を含む。
−1つ以上の分割点に依存して再生オーディオ信号包絡を生成するステップと、
−再生オーディオ信号包絡を出力するステップと、
を含む。
−オーディオ信号包絡を受信するステップと、
−予め定義された割当規則に依存して、少なくとも2つの分割点構成の各々のために、2つ以上のオーディオ信号包絡部分の少なくとも1つのオーディオ信号包絡部分についての信号包絡部分値を決定するステップであって、少なくとも2つの分割点構成の各々は1つ以上の分割点を含み、その2つ以上の分割点構成の各々の1つ以上の分割点はオーディオ信号包絡を2つ以上のオーディオ信号包絡部分へと分割する、ステップと、
−少なくとも2つの分割点構成の1つの1つ以上の分割点を、オーディオ信号包絡を符号化するための1つ以上の選択された分割点として選択するステップであって、前記1つ以上の分割点を選択するステップは、少なくとも2つの分割点構成の各々の2つ以上のオーディオ信号包絡部分の少なくとも1つのオーディオ信号包絡部分の各々の信号包絡部分値に依存して実行されるステップと、
を含む。
[数3]
である、としてもよい。ここで、「lowerbound」は信号包絡部分mの下限値であり、「upperbound」は信号包絡部分mの上限値である。
[数4]
ここで、nはオーディオ信号包絡のサンプルの個数、例えばオーディオ信号包絡のスペクトル値の個数を示す。上述の実施例において、nは例えばn=33でもよい。
[数8]
ここで、totalenergy は全体エネルギーを示し、kは1つ以上の分割点のk番目の分割点を示し、Nは1つ以上の分割点数を示す。
x≧0のときa=x;
x<0のときa=−x;
を意味する。
(1)2つのシーケンスであって、そのうちの1つは純粋に実数であり、1つは純粋に虚数である。又は
(2)2つのシーケンスであって、そのうちの1番目は振幅を表現し、2番目は位相を表現する。
次に、両方の場合におけるこれら2つのシーケンスは2つの別個の包絡としてモデル化され得る。
[数10]
ここで、c(k)は符号化ユニットによって決定されるべきk番目の符号化値を示し、jは複数の引数値のj番目の引数値を示し、a(j)はそのj番目の引数値に割り当てられた集計値を示し、max(a)は引数値のうちの1つに割り当てられた集計値のうちの1つである最大値であり、引数値のうちの1つに割り当てられた集計値はいずれも前記最大値を上回らず、
[数11]
は、
[数12]
が最小となる、前記引数値のうちの1つである最小値を示す。
[数13]
ここで、tilt(k)はk番目の符号化値における集計関数の導関数を示し、c(k+1)は前記第1集計値であり、f(k+1)は前記第1引数値であり、c(k-1)は前記第2集計値であり、f(k-1)は前記第2引数値であり、kは1つ以上の符号化値のうちの1つのインデックスを示す整数であり、c(k+1)-c(k-1)は2つの集計値c(k+1)及びc(k-1)の第1差分であり、f(k+1)-f(k-1)は2つの引数値f(k+1)及びf(k-1)の第2差分である。
[数14]
ここで、tilt(k)はk番目の符号化値における集計関数の導関数を示し、c(k+1)は前記第1集計値であり、f(k+1)は前記第1引数値であり、c(k)は前記第2集計値であり、f(k)は前記第2引数値であり、c(k-1)は集計関数の(複数の)集計点のうちの第3集計点の第3集計値であり、f(k-1)は集計関数の(複数の)集計点のうちの第3集計点の第3引数値であり、kは1つ以上の符号化値のうちの1つのインデックスを示す整数であり、c(k+1)-c(k)は2つの集計値c(k+1)及びc(k)の第1差分であり、f(k+1)-f(k)は2つの引数値f(k+1)及びf(k)の第2差分である。
[数15]
及び
[数16]
−オリジナルオーディオ信号からHF帯域のスペクトル振幅(spectral magnitude)又はエネルギー値を計算すること、及び/又は、
−スペクトル包絡を等しいブロックマスのK+1個のブロックへと分割するK個のサブバンド・インデックスの所定の(又は任意かつ伝送された)個数を計算すること、及び/又は、
−TSD(非特許文献5)と同じアルゴリズムを用いてインデックスを符号化すること、及び/又は、
−HF帯域の全体マスの(例えばハフマンを介する)量子化及び符号化と、全体マス及びインデックスのビットストリームへの書き込み。
−ビットストリームからの全体マスとインデックスとの読み出し、及び後続の復号化、及び/又は、
−スプライン補間を介する滑らかな累積マス曲線の近似、及び/又は、
−累積マス曲線の一次導関数を行ってスペクトル包絡を再生すること。
−スペクトル・エネルギー目標包絡曲線(例えば20個のサブバンドサンプルによって表現される)とその対応する全体エネルギーとの決定
−値の総数を削減する(例えば上側の8サブバンド値を平均化し、それにより20から16へと総数を削減する)ために、サブバンド値をペア毎に平均化することによる包絡ワーピングの適用
−包絡モデル性能と知覚的品質基準との間の良好な一致のための、包絡振幅変換の適用(例えば各サブバンド値についての4次ルート
の抽出)
−等しいマスの所定数のブロックへと包絡を分割するサブバンド・インデックスの複数回の決定(例えば、包絡を3、4、6及び8ブロックへ分割するための決定を4回繰り返す)
−分配量子化された包絡の全体の再生(「分析と合成」の手法、以下参照)
−包絡の最も正確な記述をもたらすブロック数の判定と決定(例えば分配量子化された包絡とオリジナルとのクロス相関を比較することによって)
−オリジナルと分配量子化された包絡との比較によるラウドネス修正と、それに応じた全体エネルギーの適応
−TSDツール(非特許文献5参照)と同様のアルゴリズムを用いた分割インデックスの符号化
−分配量子化に使用されたブロック数の信号化(例えば4個の所定数のブロックを2ビットで信号化)
−全体エネルギーの量子化と符号化(例えばハフマン符号化を用いて)
−分配量子化に使用されるべきブロック数の復号化と全体エネルギーの復号化
−TSDツール(非特許文献5参照)と同様のアルゴリズムを用いた分割インデックスの復号化
−スプライン補間を介する滑らかな累積マス曲線の近似
−一次導関数を介した累積ドメインからのスペクトル包絡の再生(例えば連続したサンプルの差を取ることによって)
−量子化エラーに起因する後続の包絡間の変動を相殺するための包絡安定化の適用(例えば、再生サブバンド値を次式により時間的に平滑化すること、
ここで、過渡信号部分を含むフレームについてはα=0.1であり、その他の場合にはα=0.25である)
−符号器におけるアプリケーションに従う包絡変換の逆転
−符号器におけるアプリケーションに従う包絡ワーピングの逆転
Nを可能な分割点位置の(全体)数とし、かつPを分割点の(全体)数とする。
個の異なる組合せがある。
個の可能な組合せの各々がある独特の分割点状態数によって表現されており、どの分割点状態数が分割点位置のどの組合せを表しているかを復号化装置が認識している場合、その復号化装置は、N,P及び分割点状態数を使用して、分割点の位置を復号化することができる。N及びPの多くの典型的な値について、そのような符号化技術は、他の概念に比べて、事象の分割点位置を符号化するためにより少ないビットを使用する。
となる。従って、必要となるビットの数は次の通りである。
[数17]
Nは可能な分割点位置の(全体)数であり、Pは分割点の数であると仮定する(これは、Nが全体位置数FSNであり、Pが分割点数ESONであり得ることを意味する)。第1の可能な分割点位置が考慮対象となる。2つの場合が区別されてもよい。
であってもよい。
へ減少する。逆に、その状態が
よりも大きい場合、第1の可能な分割点位置に分割点が配置されていると結論付けることが可能である。このことから、以下の復号化アルゴリズムが導かれる:
[数20]
分割点状態数/f(区分Bの分割点数,Nb)
[数23]
[数24]
Claims (17)
- 1つ以上の符号化値からオーディオ信号包絡を生成する装置であって、
前記1つ以上の符号化値を受信する入力インターフェース(1610)と、
前記1つ以上の符号化値に依存して前記オーディオ信号包絡を生成する包絡生成部(1620)と、を含み、
前記包絡生成部(1620)は前記1つ以上の符号化値に依存して集計関数を生成するよう構成され、前記集計関数は複数の集計点を含み、前記集計点の各々は引数値と集計値とを含み、前記集計関数は単調増加し、前記1つ以上の符号化値の各々は前記集計関数の集計点の1つの前記引数値及び集計値の少なくとも1つを示しており、
前記包絡生成部(1620)は、前記オーディオ信号包絡が複数の包絡点を含むように前記オーディオ信号包絡を生成するよう構成され、前記包絡点の各々が引数値と包絡値とを含み、前記集計関数の集計点の各々について、前記包絡点の引数値が前記集計点の引数値と等しくなるように、前記オーディオ信号包絡の包絡点の1つが前記集計点に割り当てられており、
前記包絡生成部(1620)は、前記オーディオ信号包絡の包絡点の各々の包絡値が前記集計関数の少なくとも1つの集計点の集計値に依存するように、前記オーディオ信号包絡を生成するよう構成されている、装置。 - 請求項1に記載の装置であって、前記包絡生成部(1620)は、前記1つ以上の符号化値の各々について前記符号化値に依存して前記集計点の1つを決定することにより、かつ、前記1つ以上の符号化値の各々の前記集計点に依存して前記集計関数を得るために補間を適用することにより、前記集計関数を決定するよう構成されている、装置。
- 請求項1又は2に記載の装置であって、前記包絡生成部(1620)は、前記集計関数の複数の集計点において、前記集計関数の一次導関数を決定するよう構成されている、装置。
- 請求項1乃至3のいずれか一項に記載の装置であって、前記包絡生成部(1620)は、前記集計関数が連続的な一次導関数を持つように、前記符号化値に依存して前記集計関数を生成するよう構成されている、装置。
- 請求項1乃至4のいずれか一項に記載の装置であって、前記包絡生成部(1620)は、第1差分と第2差分との比を決定することで前記オーディオ信号包絡を決定するよう構成されており、前記第1差分は、前記集計関数の集計点のうちの第1の集計点の第1集計値(c(k+1))と、前記集計関数の集計点のうちの第2の集計点の第2集計値(c(k-1);c(k))との差であり、前記第2差分は、前記集計関数の集計点のうちの前記第1の集計点の第1引数値(f(k+1))と、前記集計関数の集計点のうちの第2の集計点の第2引数値(f(k-1);f(k))との差である、装置。
- 請求項5に記載の装置であって、前記包絡生成部(1620)は、次式を適用して前記オーディオ信号包絡を決定するよう構成されており、
[数13]
ここで、tilt(k)はk番目の符号化値における前記集計関数の導関数を示し、
c(k+1)は前記第1集計値であり、
f(k+1)は前記第1引数値であり、
c(k-1)は前記第2集計値であり、
f(k-1)は前記第2引数値であり、
kは前記1つ以上の符号化値のうちの1つのインデックスを示す整数であり、
c(k+1)-c(k-1)は前記2つの集計値c(k+1)及びc(k-1)の第1差分であり、
f(k+1)-f(k-1)は前記2つの引数値f(k+1)及びf(k-1)の第2差分である、装置。 - 請求項5に記載の装置であって、前記包絡生成部(1620)は、次式を適用して前記オーディオ信号包絡を決定するよう構成されており、
[数14]
ここで、tilt(k)はk番目の符号化値における前記集計関数の導関数を示し、
c(k+1)は前記第1集計値であり、
f(k+1)は前記第1引数値であり、
c(k)は前記第2集計値であり、
f(k)は前記第2引数値であり、
c(k-1)は前記集計関数の集計点のうちの第3の集計点の第3集計値であり、
f(k-1)は前記集計関数の集計点のうちの第3の集計点の第3引数値であり、
kは前記1つ以上の符号化値のうちの1つのインデックスを示す整数であり、
c(k+1)-c(k)は前記2つの集計値c(k+1)及びc(k)の第1差分であり、
f(k+1)-f(k)は前記2つの引数値f(k+1)及びf(k)の第2差分である、装置。 - 請求項1乃至7のいずれか一項に記載の装置であって、
前記入力インターフェース(1610)は、1つ以上の分割値を前記1つ以上の符号化値として受信するよう構成されており、
前記包絡生成部(1620)は、前記1つ以上の分割値に依存して前記集計関数を生成するよう構成されており、前記1つ以上の分割値の各々は前記集計関数の集計点の1つの集計値を示し、
前記包絡生成部(1620)は、前記1つ以上の分割点が再生オーディオ信号包絡を2つ以上のオーディオ信号包絡部分へと分割するように、前記再生オーディオ信号包絡を生成するよう構成されており、予め定義された割当規則が前記2つ以上の信号包絡部分の各信号包絡部分についての信号包絡部分値を前記信号包絡部分に依存して定義しており、
前記包絡生成部(1620)は、前記2つ以上の信号包絡部分の各々について、その信号包絡部分値の絶対値が他の信号包絡部分の各々の信号包絡部分値の絶対値の半分よりも大きくなるように、前記再生オーディオ信号包絡を生成するよう構成されている、装置。 - オーディオ信号包絡を符号化するための1つ以上の符号化値を決定する装置であって、
複数の引数値の各々のために集計値を決定する集計部(1710)を含み、
前記複数の引数値は、それら複数の引数値の第1引数値と第2引数値とが異なるとき、前記第1引数値が前記第2引数値に先行又は後続するように順序付けられており、
前記引数値の各々に対して1つの包絡値が割り当てられ、
前記引数値の各々の前記包絡値は前記オーディオ信号包絡に依存しており、
前記集計部(1710)は、前記複数の引数値の各引数値のための前記集計値を、前記引数値の包絡値に依存しかつ前記引数値に先行する複数の引数値の各々の包絡値に依存して、決定するよう構成されており、
前記複数の引数値の1つ以上の集計値に依存して1つ以上の符号化値を決定する、符号器ユニット(1720)を更に含む、装置。 - 請求項9に記載の装置であって、前記集計部(1710)は、前記複数の引数値の各引数値についての前記集計値を、前記引数値の包絡値と前記引数値に先行する引数値の包絡値とを加算することで、決定するよう構成されている、装置。
- 請求項9又は10に記載の装置であって、前記引数値の各々の包絡値は、前記オーディオ信号包絡を信号包絡として有する、オーディオ信号包絡のスペクトル値のn乗を示しており、nはゼロよりも大きい整数の偶数である、装置。
- 請求項9又は10に記載の装置であって、前記引数値の各々の包絡値は、時間ドメインで表現されかつ前記オーディオ信号包絡を信号包絡として有する、オーディオ信号包絡の振幅値のn乗を示しており、nはゼロよりも大きい整数の偶数である、装置。
- 請求項9乃至12のいずれか一項に記載の装置であって、前記符号化ユニット(1720)は、前記引数値の1つ以上の集計値に依存し、かつ前記1つ以上の符号化値として何個の値が前記符号化ユニット(1720)によって決定されるべきかを示す符号化値の数に依存して、前記1つ以上の符号化値を決定するよう構成されている、装置。
- 1つ以上の符号化値からオーディオ信号包絡を生成する方法であって、
前記1つ以上の符号化値を受信するステップと、
前記1つ以上の符号化値に依存して前記オーディオ信号包絡を生成するステップと、を含み、
前記オーディオ信号包絡を生成するステップは前記1つ以上の符号化値に依存して集計関数を生成することにより実行され、前記集計関数は複数の集計点を含み、前記集計点の各々は引数値と集計値とを含み、前記集計関数は単調増加し、前記1つ以上の符号化値の各々は前記集計関数の集計点のうちの1つの前記引数値及び集計値の少なくとも1つを示しており、
前記オーディオ信号包絡を生成するステップは、前記オーディオ信号包絡が複数の包絡点を含むように実行され、前記包絡点の各々が引数値と包絡値とを含み、前記集計関数の集計点の各々について、前記包絡点の引数値が前記集計点の引数値と等しくなるように、前記オーディオ信号包絡の包絡点の1つが前記集計点に割り当てられており、
前記オーディオ信号包絡を生成するステップは、前記オーディオ信号包絡の包絡点の各々の包絡値が前記集計関数の少なくとも1つの集計点の集計値に依存するように実行される、方法。 - オーディオ信号包絡を符号化するための1つ以上の符号化値を決定する方法であって、
複数の引数値の各々のために集計値を決定するステップを含み、
前記複数の引数値は、それら複数の引数値の第1引数値と第2引数値とが異なるとき、前記第1引数値が前記第2引数値に先行又は後続するように順序付けられており、
前記引数値の各々に対して1つの包絡値が割り当てられ、
前記引数値の各々の前記包絡値は前記オーディオ信号包絡に依存しており、
前記集計部(1710)は、前記複数の引数値の各引数値のための前記集計値を、前記引数値の包絡値に依存しかつ前記引数値に先行する複数の引数値の各々の包絡値に依存して、決定するよう構成されており、
前記複数の引数値の1つ以上の集計値に依存して1つ以上の符号化値を決定するステップを更に含む、方法。 - コンピュータ又は信号プロセッサ上で作動されたとき、請求項15又は16に記載の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13171314 | 2013-06-10 | ||
EP13171314.1 | 2013-06-10 | ||
EP14167070 | 2014-05-05 | ||
EP14167070.3 | 2014-05-05 | ||
PCT/EP2014/062034 WO2014198726A1 (en) | 2013-06-10 | 2014-06-10 | Apparatus and method for audio signal envelope encoding, processing and decoding by modelling a cumulative sum representation employing distribution quantization and coding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016526695A true JP2016526695A (ja) | 2016-09-05 |
JP6224827B2 JP6224827B2 (ja) | 2017-11-01 |
Family
ID=50928114
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016518979A Active JP6224827B2 (ja) | 2013-06-10 | 2014-06-10 | 分配量子化及び符号化を使用した累積和表現のモデル化によるオーディオ信号包絡符号化、処理及び復号化の装置と方法 |
Country Status (16)
Country | Link |
---|---|
US (2) | US9953659B2 (ja) |
EP (1) | EP3008726B1 (ja) |
JP (1) | JP6224827B2 (ja) |
KR (1) | KR101789083B1 (ja) |
CN (1) | CN105431902B (ja) |
AU (1) | AU2014280258B9 (ja) |
BR (1) | BR112015030686B1 (ja) |
CA (1) | CA2914771C (ja) |
ES (1) | ES2646021T3 (ja) |
HK (1) | HK1223725A1 (ja) |
MX (1) | MX353042B (ja) |
PL (1) | PL3008726T3 (ja) |
PT (1) | PT3008726T (ja) |
RU (1) | RU2662921C2 (ja) |
SG (1) | SG11201510162WA (ja) |
WO (1) | WO2014198726A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6224827B2 (ja) | 2013-06-10 | 2017-11-01 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 分配量子化及び符号化を使用した累積和表現のモデル化によるオーディオ信号包絡符号化、処理及び復号化の装置と方法 |
JP6224233B2 (ja) | 2013-06-10 | 2017-11-01 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 分配量子化及び符号化を使用したオーディオ信号包絡の分割によるオーディオ信号包絡符号化、処理及び復号化の装置と方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05281995A (ja) * | 1992-03-31 | 1993-10-29 | Sony Corp | 音声符号化方法 |
JPH09153811A (ja) * | 1995-11-30 | 1997-06-10 | Hitachi Ltd | 符号化復号方法、符号化復号装置およびそれを用いたテレビ会議装置 |
JP2016518977A (ja) * | 2013-04-16 | 2016-06-30 | マサチューセッツ インスティテュート オブ テクノロジー | エマルションまたは他の混合物の単極分離のためのシステムおよび方法 |
Family Cites Families (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5765127A (en) | 1992-03-18 | 1998-06-09 | Sony Corp | High efficiency encoding method |
JP3237089B2 (ja) * | 1994-07-28 | 2001-12-10 | 株式会社日立製作所 | 音響信号符号化復号方法 |
US5710863A (en) * | 1995-09-19 | 1998-01-20 | Chen; Juin-Hwey | Speech signal quantization using human auditory models in predictive coding systems |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
CN1494055A (zh) | 1997-12-24 | 2004-05-05 | ������������ʽ���� | 声音编码方法和声音译码方法以及声音编码装置和声音译码装置 |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
CN1202514C (zh) * | 2000-11-27 | 2005-05-18 | 日本电信电话株式会社 | 编码和解码语音及其参数的方法、编码器、解码器 |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
KR100477699B1 (ko) | 2003-01-15 | 2005-03-18 | 삼성전자주식회사 | 양자화 잡음 분포 조절 방법 및 장치 |
EP1638083B1 (en) * | 2004-09-17 | 2009-04-22 | Harman Becker Automotive Systems GmbH | Bandwidth extension of bandlimited audio signals |
US7573912B2 (en) | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
CN101138274B (zh) | 2005-04-15 | 2011-07-06 | 杜比国际公司 | 用于处理去相干信号或组合信号的设备和方法 |
US7630882B2 (en) | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
KR100803205B1 (ko) * | 2005-07-15 | 2008-02-14 | 삼성전자주식회사 | 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
WO2007080211A1 (en) | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
EP1989707A2 (fr) * | 2006-02-24 | 2008-11-12 | France Telecom | Procede de codage binaire d'indices de quantification d'une enveloppe d'un signal, procede de decodage d'une enveloppe d'un signal et modules de codage et decodage correspondants |
DE602006021347D1 (de) | 2006-03-28 | 2011-05-26 | Fraunhofer Ges Forschung | Verbessertes verfahren zur signalformung bei der mehrkanal-audiorekonstruktion |
US8392176B2 (en) | 2006-04-10 | 2013-03-05 | Qualcomm Incorporated | Processing of excitation in audio coding and decoding |
US8532984B2 (en) | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
US8417532B2 (en) * | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
CN101743586B (zh) * | 2007-06-11 | 2012-10-17 | 弗劳恩霍夫应用研究促进协会 | 音频编码器、编码方法、解码器、解码方法 |
WO2009038136A1 (ja) | 2007-09-19 | 2009-03-26 | Nec Corporation | 雑音抑圧装置、その方法及びプログラム |
GB2453117B (en) | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
CN101430880A (zh) | 2007-11-07 | 2009-05-13 | 华为技术有限公司 | 一种背景噪声的编解码方法和装置 |
CN101521010B (zh) | 2008-02-29 | 2011-10-05 | 华为技术有限公司 | 一种音频信号的编解码方法和装置 |
JP5010743B2 (ja) | 2008-07-11 | 2012-08-29 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトル傾斜で制御されたフレーミングを使用して帯域拡張データを計算するための装置及び方法 |
EP2301028B1 (en) | 2008-07-11 | 2012-12-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus and a method for calculating a number of spectral envelopes |
MY160260A (en) | 2008-07-11 | 2017-02-28 | Fraunhofer Ges Forschung | Audio encoder and audio decoder |
CN102081926B (zh) | 2009-11-27 | 2013-06-05 | 中兴通讯股份有限公司 | 格型矢量量化音频编解码方法和系统 |
CN102081927B (zh) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
CN103155033B (zh) | 2010-07-19 | 2014-10-22 | 杜比国际公司 | 高频重建期间的音频信号处理 |
WO2012146757A1 (en) * | 2011-04-28 | 2012-11-01 | Dolby International Ab | Efficient content classification and loudness estimation |
DE102013104921A1 (de) | 2013-05-14 | 2014-11-20 | A. Monforts Textilmaschinen Gmbh & Co. Kg | Vorrichtung zum Beschichten und/oder Imprägnieren einer textilen Warenbahn |
JP6224827B2 (ja) | 2013-06-10 | 2017-11-01 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 分配量子化及び符号化を使用した累積和表現のモデル化によるオーディオ信号包絡符号化、処理及び復号化の装置と方法 |
JP6224233B2 (ja) | 2013-06-10 | 2017-11-01 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 分配量子化及び符号化を使用したオーディオ信号包絡の分割によるオーディオ信号包絡符号化、処理及び復号化の装置と方法 |
-
2014
- 2014-06-10 JP JP2016518979A patent/JP6224827B2/ja active Active
- 2014-06-10 ES ES14729323.7T patent/ES2646021T3/es active Active
- 2014-06-10 PT PT147293237T patent/PT3008726T/pt unknown
- 2014-06-10 CN CN201480033295.0A patent/CN105431902B/zh active Active
- 2014-06-10 PL PL14729323T patent/PL3008726T3/pl unknown
- 2014-06-10 MX MX2015016984A patent/MX353042B/es active IP Right Grant
- 2014-06-10 CA CA2914771A patent/CA2914771C/en active Active
- 2014-06-10 RU RU2015156490A patent/RU2662921C2/ru active
- 2014-06-10 SG SG11201510162WA patent/SG11201510162WA/en unknown
- 2014-06-10 WO PCT/EP2014/062034 patent/WO2014198726A1/en active Application Filing
- 2014-06-10 BR BR112015030686-1A patent/BR112015030686B1/pt active IP Right Grant
- 2014-06-10 EP EP14729323.7A patent/EP3008726B1/en active Active
- 2014-06-10 AU AU2014280258A patent/AU2014280258B9/en active Active
- 2014-06-10 KR KR1020167000232A patent/KR101789083B1/ko active IP Right Grant
-
2015
- 2015-12-09 US US14/964,245 patent/US9953659B2/en active Active
-
2016
- 2016-10-13 HK HK16111808.1A patent/HK1223725A1/zh unknown
-
2018
- 2018-03-13 US US15/920,066 patent/US10734008B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05281995A (ja) * | 1992-03-31 | 1993-10-29 | Sony Corp | 音声符号化方法 |
JPH09153811A (ja) * | 1995-11-30 | 1997-06-10 | Hitachi Ltd | 符号化復号方法、符号化復号装置およびそれを用いたテレビ会議装置 |
US5983172A (en) * | 1995-11-30 | 1999-11-09 | Hitachi, Ltd. | Method for coding/decoding, coding/decoding device, and videoconferencing apparatus using such device |
JP2016518977A (ja) * | 2013-04-16 | 2016-06-30 | マサチューセッツ インスティテュート オブ テクノロジー | エマルションまたは他の混合物の単極分離のためのシステムおよび方法 |
Also Published As
Publication number | Publication date |
---|---|
US20180204582A1 (en) | 2018-07-19 |
RU2662921C2 (ru) | 2018-07-31 |
RU2015156490A (ru) | 2017-07-14 |
AU2014280258A1 (en) | 2016-01-28 |
CA2914771A1 (en) | 2014-12-18 |
EP3008726B1 (en) | 2017-08-23 |
BR112015030686A2 (pt) | 2017-08-22 |
AU2014280258B2 (en) | 2016-11-24 |
US20160155451A1 (en) | 2016-06-02 |
AU2014280258B9 (en) | 2017-04-20 |
US10734008B2 (en) | 2020-08-04 |
US9953659B2 (en) | 2018-04-24 |
JP6224827B2 (ja) | 2017-11-01 |
MX353042B (es) | 2017-12-18 |
HK1223725A1 (zh) | 2017-08-04 |
KR101789083B1 (ko) | 2017-10-23 |
PL3008726T3 (pl) | 2018-01-31 |
WO2014198726A1 (en) | 2014-12-18 |
PT3008726T (pt) | 2017-11-24 |
CN105431902A (zh) | 2016-03-23 |
EP3008726A1 (en) | 2016-04-20 |
SG11201510162WA (en) | 2016-01-28 |
KR20160022338A (ko) | 2016-02-29 |
ES2646021T3 (es) | 2017-12-11 |
CN105431902B (zh) | 2020-03-31 |
BR112015030686B1 (pt) | 2021-12-28 |
MX2015016984A (es) | 2016-04-25 |
CA2914771C (en) | 2018-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101953648B1 (ko) | 오디오 신호 디코딩 또는 인코딩을 위한 시간 도메인 레벨 조정 | |
TW201405549A (zh) | 使用改良機率分布估計之基於線性預測的音訊寫碼技術 | |
KR20240036029A (ko) | 장기 예측 및/또는 고조파 후치 필터링에 기초하여 예측 스펙트럼을 생성하기 위한 프로세서 | |
JP6224827B2 (ja) | 分配量子化及び符号化を使用した累積和表現のモデル化によるオーディオ信号包絡符号化、処理及び復号化の装置と方法 | |
JP6224233B2 (ja) | 分配量子化及び符号化を使用したオーディオ信号包絡の分割によるオーディオ信号包絡符号化、処理及び復号化の装置と方法 | |
JP2023507073A (ja) | 音声符号化のための周波数領域における階調信号の長期予測のための符号化器、復号化器、符号化方法及び復号化方法 | |
KR102569784B1 (ko) | 오디오 코덱의 장기 예측을 위한 시스템 및 방법 | |
JP5786044B2 (ja) | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 | |
KR20240042449A (ko) | 오디오 신호의 펄스 및 잔차 부분의 코딩 및 디코딩 | |
JP5800920B2 (ja) | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20170221 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20170516 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170818 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170912 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171005 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6224827 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |