JP2014513813A - 適応的な利得−シェイプのレート共用 - Google Patents

適応的な利得−シェイプのレート共用 Download PDF

Info

Publication number
JP2014513813A
JP2014513813A JP2014505105A JP2014505105A JP2014513813A JP 2014513813 A JP2014513813 A JP 2014513813A JP 2014505105 A JP2014505105 A JP 2014505105A JP 2014505105 A JP2014505105 A JP 2014505105A JP 2014513813 A JP2014513813 A JP 2014513813A
Authority
JP
Japan
Prior art keywords
shape
gain
quantizer
signal characteristic
decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2014505105A
Other languages
English (en)
Other versions
JP2014513813A5 (ja
Inventor
エリク ノーベル,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=45063198&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2014513813(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2014513813A publication Critical patent/JP2014513813A/ja
Publication of JP2014513813A5 publication Critical patent/JP2014513813A5/ja
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio

Abstract

本発明の複数の実施例の目的は、改善した利得−シェイプVQを提供することにある。このことは、現在のビットレートと第1の信号特性との複数の組み合わせに対して、利得調整及びシェイプ量子化器に割当てられるビット数を決定することにより達成される。その利得調整及びシェイプ量子化器に対して決定された割当てられたビット数により、単一の固定割当て方式を用いるよりも所与のビットレートと信号特性とに関してより良い結果が提供されるであろう。そのことは、トレーニングデータセットに対する最適なビット割当ての平均を用いてビット割当てを導出することにより達成される。従って、そのビットレートと第1の信号特性との複数の組み合わせに関して、利得調整及びシェイプ量子化器に対するビット数を予め計算し、そのビットレートと第1の信号特性との複数の組み合わせに関して、前記利得調整及びシェイプ量子化器に割当てられるビット数を示すテーブルを作成する。このようにして、そのテーブルを用いてビット割当ての改善を達成することができる。

Description

本発明の実施例はオーディオ符号化と復号化とに用いられる方法と機器に関し、特に、オーディオ符号化器と復号化器の利得−シェイプ量子化器に関する。
現在の通信サービスは多くの異なるタイプのオーディオ信号を処理することが期待されている。オーディオコンテンツの主なものは音声信号であるけれども、音楽や音楽と音声との混合体のようなもっと一般的な信号を処理する欲求がある。通信ネットワークにおける容量は常に増加しているが、依然として通信チャネル当りの要求バンド幅を制限することに大きな関心がある。移動体ネットワークにおいて、各呼についての送信バンド幅が小さいほど、移動体機器と基地局の両方での電力消費もより少なくなる。このことは移動体運用者にとってはエネルギーとコスト節約になると解釈できる一方で、エンドユーザも電池寿命が長くなり通話時間が長くなることを経験できることになる。さらに、ユーザ当りの消費バンド幅がより小さくなると、移動体ネットワークはより多数のユーザに並行にサービスを提供できる。
今日、移動体の音声サービスでの支配的な圧縮技術は符号励振線形予測(CELP)であり、それは小さなバンド幅で音声品質について良好なオーディオ品質を達成している。それは、GSM−EFR(GSM Enhanced Full Rate)、AMR(適応多重化レート)、AMR−WB(AMR広帯域)のような展開されたコーデックにおいて広く使用されている。しかしながら、音楽のような一般的なオーディオ信号に関して言えば、CELP技術は貧弱な性能しかない。これらの信号はしばしば、例えば、ITU−TコーデックG.722.1とG.719のような周波数変換をベースにした符号化を用いてより良く表現される。しかしながら、変換領域コーデックは一般に、音声コーデックよりも速いビットレートで動作する。符号化の点からすれば、音声領域と一般的なオーディオ領域との間にはギャップがあり、より低速のビットレートで変換領域のコーデックの性能を向上させることが望ましい。
変換領域でのコーデックは周波数領域の変換係数のコンパクトな表現を必要とする。これらの表現はしばしばベクトル量子化(VQ)に依存する。その場合、それらの係数は複数のグループで符号化される。ベクトル量子化の例は、利得−シェイプVQである。このアプローチは個々の係数を符号化する前に正規化をベクトルに適用する。正規化因子と正規化された係数とは、ベクトルの利得とシェイプとして言及され、これらは別々に符号化される。利得−シェイプ構造は、多くの利点がある。利得とシェイプとを分割することにより、コーデックは、利得量子化器を設計することにより変化するソース入力レベルに容易に適合される。それは、利得とシェイプとが異なる周波数領域において異なる重要性を伝える場合、知覚的な観点からも有益である。最後に、利得−シェイプ分割は量子化器の設計を簡単にし、制約を受けないベクトル量子化器と比べて、メモリと計算リソースの点から複雑さをより少なくする。従来技術に従う1つのベクトルに対する利得−シェイプ量子化器の機能的概観図が図1に示されている。それは、符号化器40と復号化器50との側を図示している。図1において、長さLの任意の入力データベクトルxが利得−シェイプ量子化方式にフィードされる。ここで、利得因子はベクトルのユークリッドノルム(2ノルム)として定義される。このことは、利得とノルムという用語が、この明細書を通して交換可能に用いられることを示唆している。まず、ノルムgはベクトルの全体サイズを表現するノルム計算器110により計算される、一般に、ユークリッドノルムが用いられる。それは、
g=√(ΣL i=1i 2) (1)
である。
それから、ノルムがノルム量子化器120により量子化され、g^と量子化ノルムを表現する量子化インデックスINを形成する。入力ベクトルは1/g^を用いてスケーリングされて正規化シェイプベクトルnを形成し、それは次にシェイプ量子化器130にフィードされる。シェイプ量子化器130とノルム量子化器120からの量子化器インデックスISはビットストリーム多重化器140により多重化されて格納されるか、或いは、復号化器50へと送信される、復号化器50は非多重化されたビットストリームからインデックスINとISとを取り出し、シェイプ復号化器150からの量子化シェイプベクトルn^とノルム復号化器160からの量子化ノルムとを取り出し、量子化シェイプをg^180でスケーリングすることにより再構築されたベクトルx^190を形成する。
利得−シェイプ量子化器は一般に制限された長さのベクトルで動作にするが、信号を最初により短いベクトルへと区分けし、利得−シェイプ量子化器を各ベクトルに適用することにより、より長いシーケンスを処理するように利用できる。この構造はしばしば、変換をベースにするオーディオコーデックにおいて用いられる。図2は、従来技術に従って、複数のベクトルのシーケンスに対する利得−シェイプ量子化のための変換をベースにした符号化システムを例示している。なお、図1は1つのベクトルに対する利得−シェイプ量子化器を図示する一方、図2における利得−シェイプ量子化は複数のベクトルのシーケンスに並列に適用される。ここで、それらのベクトルは共に周波数スペクトラムを構成している。その利得(ノルム)のシーケンスはスペクトラム包絡線を構成する。入力オーディオ200は、周波数変換210の準備として、最初に時間セグメント或いはフレームに分割される。各フレームは周波数領域へと変換され、周波数領域のスペクトラムXを形成する。このことは、MDCT、DCT、或いは、DFTのような何らかの適当な変換を用いてなされる。何の変換を選択するのかは、重要な特性がその変換でうまくモデリングされるように、入力信号の特性に依存する。それはまた、その変換がステレオ処理のような他の処理ステップに対して再利用されるなら、他の処理ステップに対する考慮も含むことができる。周波数スペクトラムはX(b)で表わされる、複数のより短い行ベクトルへと分割される。さて各ベクトルは周波数バンドbの係数を表わす。知覚的な観点からすれば、人間の聴覚系の周波数解像度に追従する不均一なバンド構造を用いて、そのスペクトラムを分割することには益がある。このことは一般には、狭いバンド幅が低周波数に用いられる一方で、広いバンド幅が高周波数に対して用いられることを意味する。
次に、各バンドのノルムが式(1)におけるように計算され230、スペクトラム包絡線を形成する利得値E(b)のシーケンスを形成する。それから、これらの値は包絡線量子化器240を用いて量子化され、量子化包絡線E^(b)を形成する。包絡線量子化240は何らかの量子化技術、例えば、微分スカラ量子化や何らかのベクトル量子化方式を用いて実行される。量子化包絡線係数E^(b)はバンドベクトルX(b)を正規化し250、対応する正規化シェイプベクトルN(b)を形成するのに用いられる。即ち、
N(b)=(1/E^(b))X(b) ……(2)
である。
なお、もし包絡線量子化が正確である、即ち、E^(b)≒X(b)であれば、正規化シェイプベクトルのノルムは1である。これは、復号化器でなされるプレ正規化に関係している。即ち、
E^(b)=E(b)⇒√{N(b)・N(b)T}=1
である。
正規化されたシェイプベクトルのシーケンスはスペクトラムの精細構造を構成する。スペクトラムの精細構造の知覚的な重要性は周波数と共に変化するが、スペクトラムの包絡線信号のような他の信号特性にも依存するかもしれない。変換コーダはしばしば聴覚モデルを採用し、その精細構造の重要部分を決定し、利用可能なリソースを最も重要な部分に割当てる。スペクトラム包絡線はしばしば、この聴覚モデルへの入力として用いられ、その出力は通常は、その包絡線係数に対応する各バンドに対するビット割当てである。ここで、ビット割当てアルゴリズム270は内部的な聴覚モデルとの組み合わせで量子化包絡線E^(b)を用いて多くのビットR(b)を割当てる。次に、それらのビットは精細構造の量子化器260により用いられる。包絡線量子化IEと精細構造の量子化IFからのインデックスはビットストリーム多重化器280により多重化され、格納されるか、或いは、復号化器に送信される。
復号化器はビットストリーム非多重化器285において通信チャネル或いは格納された媒体からのインデックスを非多重化し、インデックスIFを精細構造の逆量子化器265に転送し、インデックスIEを包絡線逆量子化器245に転送する。量子化包絡線E^(b)は包絡線逆量子化器245から得られ、復号化器におけるビット割当てエンティティ275にフィードされ、ビット割当R(b)を生成する。精細構造の逆量子化器265が精細構造のインデックスとビット割当てとを用いて精細構造の量子化ベクトルN^(b)を生成する。合成周波数スペクトラムX^(b)が包絡線シェイピングエンティティ235において量子化精細構造を量子化包絡線でスケーリングすることにより得られる。即ち、
X^(b)=E^(b)・N^(b) ……(3)
である。
逆変換215が合成周波数スペクトラムX^(b)に適用されて合成出力信号290を得る。
異なるビットレートに対する利得−シェイプVQの性能は、利得量子化器とシェイプ量子化器とがどれほど相互作用するかに依存する。特に、あるシェイプ量子化器は利得量子化から存在するかもしれない小さなエネルギー偏差を補償することができる。他のシェイプ量子化器は、利得情報を表現することができず、また、利得量子化器のエラーを全く補償できない純粋のシェイプ量子化器であると言われている。純粋のシェイプ量子化器については、利得−シェイプ系は利得とシェイプとの間のビット共有については敏感になる。可能性のある1つの解決策は、図3に示されているように、合成シェイプに基づいて利得を調整するためにシェイプ量子化後に、付加的な利得調整因子を割当てることである。図3は、各付加的な利得調整因子G(b)を割当てるために、図2で図示した符号化システムに基づく変換に利得調整解析器301の付加が伴っていることを示している。このことは、量子化精細構造N^(b)と精細構造N(b)とを比較することにより理解できる。即ち、
G(b)={N^(b)T・N(b)}/{N(b)T・N(b)}
である。
利得調整因子G(b)は量子化されインデックスIGを生成し、それは精細構造のインデックスIFと包絡線インデックスIEとともに多重化されて格納されるか、或いは、復号化器に送信される。
ここで、完全な包絡線量子化は√{N(b)・N(b)T}=1であることを思い出されたい。量子化精細構造の利得を前もって調整することにより、利得調整因子はまた、包絡線量子化からの量子化エラーを扱うことができる。このことは、式(1)を用いてプレ調整利得因子gn
n=1/√{N^(b)・N^(b)T}
を得るためになされる。
それは、√{gnN^(b)・gnN(b)^T}=1を与える。
さて、利得調整計算において、
G(b)={N^'(b)T・N(b)}/{N(b)T・N(b)}
であるように、N^(b)がN^'(b)=gnN^(b)で代用されるなら、利得調整因子G(b)はまた包絡線量子化におけるエラーを補償できる。この方法は従来技術であると考えられ、これ以後、√{N^(b)・N^(b)T}=1であるための前調整はシェイプ逆量子化器の整数部であると仮定する。
図3の復号化器は図2の復号化器と類似しているが、量子化利得調整因子G^(b)を再構築するために利得調整インデックスIGを用いる利得調整ユニット302が付加されている。次に、これが調整された利得の精細構造N~(b)を創成するために用いられる。即ち、
N~(b)=G^(b)・N^(b)
である。
図2に示すように、合成周波数スペクトラムX^(b)が、包絡線で調整された利得の精細構造をスケーリングすることにより得られる。即ち、
X^(b)=E^(b)・N~(b)
である。
逆変換が合成周波数スペクトラムX^(b)に適用され、合成出力信号を得る。
しかしながら、低いビットレートでは、利得調整はあまりにも多くのビットを消費してしまいシェイプ量子化器の性能を低下させ、全体的に性能が悪くなってしまう。
本発明の複数の実施例の目的は、改善した利得−シェイプVQを提供することにある。
このことは、現在のビットレートと第1の信号特性との複数の組み合わせに対して、利得調整及びシェイプ量子化器に割当てられる複数のビットを決定することにより達成される。その利得調整及びシェイプ量子化器に対して決定された割当てられた数のビットにより、単一の固定割当て方式を用いるよりも所与のビットレートと信号特性とに関してより良い結果が提供されるであろう。そのことは、トレーニングデータセットに対する最適なビット割当ての平均を用いてビット割当てを導出することにより達成される。従って、そのビットレートと第1の信号特性との複数の組み合わせに関して、利得調整及びシェイプ量子化器に対する複数のビットを予め計算し、そのビットレートと第1の信号特性との複数の組み合わせに関して、前記利得調整及びシェイプ量子化器に割当てられるビットを示すテーブルを作成するようにして、そのテーブルを用いてビット割当ての改善を達成することができる。
本発明の実施例を第1の側面から見れば、複数のビットを利得調整量子化器とシェイプ量子化器とに割当て、利得シェイプベクトルを符号化するために使用されるようにする符号化器における方法が備えられる。その方法では、現在のビットレートと第1の信号特性値とが決定される。1つのビット割当てが、ビットレートと第1の信号特性とにマッピングされた前記利得調整量子化器と前記シェイプ量子化器とのための少なくとも1つのビット割当てを示すテーブルからの情報を用いて、前記決定された現在のビットレートと第1の信号特性値とに関して、前記利得調整量子化器と前記シェイプ量子化器とのために識別される。さらに、前記利得シェイプベクトルを符号化する際に、前記識別されたビット割当てが適用される。
本発明の実施例を第2の側面から見れば、複数のビットを利得調整逆量子化器とシェイプ逆量子化器とに割当て、利得シェイプベクトル復号化するために使用されるようにする復号化器における方法が備えられる。その方法では、現在のビットレートと第1の信号特性値とが決定される。1つのビット割当てが、ビットレートと第1の信号特性とにマッピングされた前記利得調整逆量子化器と前記シェイプ逆量子化器とのための少なくとも1つのビット割当てを示すテーブルからの情報を用いて、前記決定された現在のビットレートと第1の信号特性値とに関して、前記利得調整逆量子化器と前記シェイプ逆量子化器とのために識別される。さらに、前記利得シェイプベクトルを復号化する際に、前記識別されたビット割当てが適用される。
本発明の実施例を第3の側面から見れば、複数のビットを利得調整量子化器とシェイプ量子化器とに割当て、利得シェイプベクトルを符号化するために使用されるようにする符号化器が備えられる。その符号化器は、現在のビットレートと第1の信号特性値とを決定するよう構成されたアダプティブビット共用エンティティを有する。そのアダプティブビット共用エンティティはさらに、ビットレートと第1の信号特性とにマッピングされた前記利得調整量子化器と前記シェイプ量子化器とのための少なくとも1つのビット割当てを示すテーブルからの情報を用いて、前記決定された現在のビットレートと第1の信号特性値とに関して、前記利得調整量子化器と前記シェイプ量子化器とのための1つのビット割当てを識別するよう構成される。その符号化器はさらに、前記利得シェイプベクトルを符号化する際に、前記識別されたビット割当てを適用するよう構成された利得調整及びシェイプ量子化器を有する。
本発明の実施例を第4の側面から見れば、複数のビットを利得調整逆量子化器とシェイプ逆量子化器とに割当て、利得シェイプベクトル復号化するために使用されるようにする復号化器が備えられる。その復号化器は、現在のビットレートと第1の信号特性値とを決定し、ビットレートと第1の信号特性とにマッピングされた前記利得調整逆量子化器と前記シェイプ逆量子化器とのための少なくとも1つのビット割当てを示すテーブルからの情報を用いて、前記決定された現在のビットレートと第1の信号特性値とに関して、前記利得調整逆量子化器と前記シェイプ逆量子化器とのための1つのビット割当てを識別するよう構成されたアダプティブビット共用エンティティを有する。その復号化器はさらに、前記利得シェイプベクトルを復号化する際に、前記識別されたビット割当てを適用するよう構成された利得調整及びシェイプ逆量子化器を有する。
本発明の実施例を更に別の側面から見れば、移動体機器が備えられる。1つの側面から見れば、その移動体機器は、複数の実施例に従う符号化器を有し、また別の側面からすれば、その移動体機器は、ここで説明する複数の実施例に従う復号化器を有する。
本発明の実施例に従う利点とは、それらの実施例が、シェイプVQがエネルギーを表現できず、それ故に利得量子化器の量子化エラーを補償できない場合における、利得−シェイプVQシステムに対して特に有益である点にある。
他の利点は、本発明の実施例に従うビット割当てが異なるビットレートに対して用いられ全体的により良い利得−シェイプVQ結果を得ることができる点にある。
従来例に従う利得−シェイプベクトル量子化方式の例である。 従来例に従う利得−シェイプベクトル量子化に基づいた変換領域符号化/復号化方式の例である。 従来例に従うシェイプ量子化後の符号化利得調整パラメータを用いた、利得−シェイプベクトル量子化に基づいた変換領域符号化/復号化方式の例である。 本発明の実施例に従う復号化器における方法のフローチャートである。 本発明の実施例に従う復号化器における方法のフローチャートである。 本発明の実施例に従うアダプティブビット共用アルゴリズムを用いた変換領域符号化/復号化方式に基づいた利得−シェイプVQを例示する図である。 複数のパルスとバンド幅とに基づいたビット共用アルゴリズムを実施するルックアップテーブルの例を示す図である。 シェイプ量子化器と逆量子化器とに関する複数のコードブックセットアップを用いた利得−シェイプVQ方式の例を示す図である。 利得ビット割当テーブルが、利得ビットの全ての考慮される組み合わせを用いた入力合成ベクトルと複数のパルスとの間で評価された平均二乗エラーを用いることによりどのように導出されるかの例を示す図である。その図で暗い影ほど、利得ビット/パルスの特定の組み合わせに対するより大きな平均歪を表わしており、太い実線は考慮されるバンド幅各々についてマトリクスを介したグリーディな経路を示しており、それはリソースが利得ビット或いは付加的なパルスにおいてより良く用いられるかどうかを各点において示している。また、その太い実線は図6におけるルックアップテーブルに対応している。 本発明の実施例に従う符号化器と復号化器とが移動体端末で実施されることを例示する図である。
従って、本発明は利得調整とシェイプ量子化として言及される、利得調整量子化とシェイプ量子化に複数のビットを割当てるための解決策に関するものである。それは、ビットレートと第1の信号特性との数多くの組み合わせに対する利得調整とシェイプ量子化器のためのビット割当てを示すテーブルを用いることにより達成される。そのビットレートは決定され、第1の信号特性は符号化器により前もって定義されるか、或いは、決定される。それから、利得調整量子化器とシェイプ量子化器とに関するビット割当てが、決定されたビットレートと第1の信号特性とに基づいた前記テーブルを用いて決定される。第1の信号特性とは、以下に示す第1の実施例に従えばバンド幅であり、或いは、第2の実施例に従えば信号長である。
さて、図4aには本発明に従う符号化器における方法を例示するフローチャートが示されている。その方法では、現在のビットレートと第1の信号特性値とがS1で決定される。それから、1つのビット割当てが、ビットレートと第1の信号特性とにマッピングされた利得調整量子化器とシェイプ量子化器とのための少なくとも1つのビット割当てを示す情報を含むテーブルを用いて、前記決定された現在のビットレートと第1の信号特性値とのために、その利得調整量子化器とシェイプ量子化器とに関してS2で識別される。さらに、その利得シェイプベクトルを符号化する際に、その識別されたビット割当てがS3で適用される。
図4bでは、フローチャートが複数のビットを利得調整逆量子化器とシェイプ逆量子化器とに割当て、利得シェイプベクトルを復号化するために使用される復号化器における方法を図示している。その方法では、現在のビットレートと第1の信号特性値とがS4で決定される。S5では、ビットレートと第1の信号特性とにマッピングされた利得調整逆量子化器とシェイプ逆量子化器とのための少なくとも1つのビット割当てを示すテーブルからの情報が用いられて、決定された現在のビットレートと第1の信号特性値とのために、利得調整逆量子化器とシェイプ逆量子化器とに関しての1つのビット割当てを識別する。さらに、利得シェイプベクトルを復号化する際に、S6では、その識別されたビット割当てが適用される。
本発明の第1の実施例を、図4cと図4dに示されるようにパルスを基本とするシェイプ量子化器を用いて変換領域でのオーディオ符号化器と復号化器のシステム環境において説明する。それ故に、第1の実施例は次のように例示される。
符号化器の周波数変換器410において、入力オーディオが50%オーバラップを用い対称正弦ウィンドウでウィンドウされたフレームへと抽出される。それから、ウィンドウされた各フレームはMDCTスペクトラムXへと変換される。そのスペクトラムは処理のために複数のサブバンドへと分割される。ここで、そのサブバンド幅は非均一である。バンドbに属するフレームmのスペクトラム係数はX(b,m)と表記され、バンド幅BW(b)をもつ。
第1の実施例では、第1の信号特性、即ち、バンド幅BW(b)は固定であり、符号化器と復号化器の両方に知られていると仮定される。しかしながら、コーデックのトータルビットレートに依存して、或いは、入力信号に適合して、バンド分割が可変である解決策を考慮することも可能である。入力信号に基づいたバンド分割を適合させる1つの方法は、高エネルギー領域或いは知覚的に重要であると思われる領域に対するバンド解像度を増加させることである。そのバンド幅解像度がビットレートに依存するなら、そのバンド解像度は通常ビットレートを増加させると増加する。
たいていの符号化器と復号化器のステップは1フレーム内で記述されるので、フレームインデックスmは省略され、表記X(b)420が用いられる。バンド幅は周波数が増すとともに増加し、人間の聴覚系の周波数解像度に適合させるのが好ましい。各バンドbの二乗平均平方根(RMS)の値は、正規化因子として用いられ、E(b)と表記される。E(b)は包絡線計算器430において決定される。即ち、
E(b)=√{X(b)T・X(b)/BW(b)} ……(4)
である。
そのRMS値は係数当りのエネルギー値として見ることもできる。b=1,2,……,Nbandsに関するシーケンスE(b)はMDCTスペクトラムの包絡線を形成する。ここで、Nbandsはバンドの数を示す。次に、そのシーケンスは復号化器に送信されるために量子化される。包絡線正規化エンティティ450においてなされる正規化は復号化器では逆の処理がなされることを保証するために、量子化包絡線E^(b)が包絡線量子化器440から取得される。この代表的な実施例では、包絡線係数は3dBのステップサイズを用いた対数領域においてスカラー量子化され、その量子化器のインデックスはハフマン符号化を用いて区別をつけて符号化される。量子化包絡線係数は各バンドbに対応するシェイプベクトルN(b)を生成するのに用いられる。即ち、
N(b)=(1/E^(b))X(b) ……(5)
である。
量子化された包絡線E^(b)は知覚モデルに入力され、ビット割当て器470によりビット割当てを取得する。各バンドに関し、割当てられたビットはシェイプ量子化器と利得調整因子G(b)を量子化することとの間で共用される。シェイプ量子化器と利得調整量子化器とに割当てられるビットの数は、適応ビット共用エンティティ403により決定される。ここで、
G(b)={N^(b)T・N(b)}/{N(b)T・N(b)} ……(6)
である。
利得調整エンティティ401により決定された利得調整因子は、包絡線量子化エラーとシェイプ量子化エラーの両方を補償できる。なお、包絡線量子化エラーの補償は量子化精細構造ベクトルがRMS=1であるように正規化されることを仮定している。
シェイプベクトルN(b)と利得調整因子G(b)との間でのビット共有を判断する時点で、合成シェイプN^(b)は知られていない。この代表的な実施例では、シェイプ量子化器は、RMS=1である合成シェイプベクトルを生成するパルス符号化方式を用いている。即ち、それは、利得量子化エラーに存在するエネルギー偏差を表現することができない。ビット共有は、ビットレートと第1の信号特性との複数の組み合わせに関して、利得調整量子化器とシェイプ量子化器とに対するビット割当てを含む、データベースに格納されたテーブル404を用いて決定される。この実施例では、第1の信号特性はバンド幅であり、これは符号化器と復号化器とによって知られている。利得量子化器とシェイプ量子化器とに対して割当てられるビットレートは次のステップを実行することにより決定される。
1.合成シェイプN^(b)におけるパルスの数はバンドビットレートR(b)から推定される。なお、そのバントビットレートは、利得量子化とシェイプ量子化との間で共有されるトータルビットレートである。このことは、利得調整RG_MAXのために用いられるビットの最大数を減算し、得られたレートR(b)−RG_MAXに関するパルス数P(b)を見出すためにルックアップテーブルを用いることによりなされる。ビットレートとパルス数との間の関係は用いられるシェイプ量子化器により与えられる。例として、もしパルスが固定数のビットb0を必要とするなら、ビットレートとパルスとの間の関係は次のように書くことができる。即ち、
P(b)=「R(b)/b0」 ……(6)
である。
ここで、「 ・ 」は最近接の整数値への端数切り捨てを示す。一般に、効率的な指標付け方式が複数のパルスに用いられるなら、ビット当りのパルス数は式(6)におけるように比例関係でしめすことは可能でないかもしれない。
ルックアップテーブルにおいてR(b)−RG_MAXを用いることにより、その解は利得調整よりもシェイプに対してより多くのビットを用いる方向へとバイアスされる。なぜなら、このことが知覚的な観点からは利点があると見られるからである。
2.パルス数を用いてG(b)を量子化するために望ましいビットレートRG(b)を見出す。この値は、データベース404のルックアップテーブルにおけるパルス数P(b)と現在のバンドのバンド幅BW(b)とを用いて取り出される。このテーブルは、関係するオーディオデータで量子化器方式を実行することにより取得される{P(b),BW(b)}のペアの組み合わせに対する平均化された最適ビット割当てを含む。そのことは、ビットの最適な分布がビットレートと信号特性との異なる組み合わせに対して計算されるものであることを示唆している。この実施例では、ビットレートは複数のパルスへと変換され、その信号特性はバンド幅に対応する。ルックアップテーブルにおける{P(b),BW(b)}のペアの組み合わせの例が図5に図式的に示されている。異なるバンド幅(BW=8,BW=16,BW=24,BW=32)に対するテーブルは、(ビットレートR(b)に基づいて決定される)パルス数を含んでいる。そのパルスから、G(b)を量子化するためのビットレートが決定される。利得に対して複数の“0”ビットが割当てられる場合については、ゼロビット利得調整のアプローチが用いられる。
3.シェイプ量子化器に対するビット割当ては、利得調整ビットをそのバンド幅に関するビット収支から減算することにより得られる。即ち、
S(b)=R(b)−RG(b) ……(7)
である。
S(b)とRG(b)とを決定後に、シェイプ量子化器にシェイプベクトルN(b)が適用され、その量子化処理において合成シェイプN^(b)が取得される。次に、利得調整因子が式(3)に記述されているように取得される。利得調整因子はスカラー量子化器を用いて量子化され、量子化利得調整G^(b)を生成するために用いられるインデックスを取得する。包絡線量子化器からの、精細構造の量子化器からの、そして、利得調整量子化器からのインデックスIE、IF、IGが多重化され、復号化器に送信されるか、或いは、格納される。
上記のステップ2で用いられるルックアップテーブルを取得するために、次の手順が用いられる。最初に、トレーニングデータが上述した解析ステップを実行することにより取得され、コーデックで用いられることが意図されている音声信号とオーディオ信号からM個の同じ長さのシェイプベクトルN(b)を抽出する。そのシェイプベクトルは考慮されている範囲における全ての数のパルスを用いて量子化され、その利得調整因子は考慮されている範囲における全ての数のビットを用いて量子化される。調整された利得合成シェイプN~mは、パルスpと利得ビットrとの全ての組み合わせに対して生成される。即ち、
N~m=QS(Nm,p)QG(Gm,r)
である。
これらの組み合わせ夫々に対する二乗エラー距離(歪)は三次元マトリクスで次のように表現される。即ち、
D(r,p,m)=(Nm−N~mT(Nm−N~m
である。
組み合わせ当りの平均歪は次のように評価される。即ち、
D_(r,p)=(1/M)ΣM m=1D(r,p,m)
である。
平均歪マトリクスD_(r,p)の例は図7に図示されている。ここで、分離した歪マトリクスはコーデックにおいて用いられる全てのバンド幅に対して示されている。マトリクスの強度は、灰色の影が薄くなるほど平均歪が小さくなるように対応付けして、平均歪を表わしている。(r=0,p=0)でパスが始まることがグリーディアプローチを用いたマトリクス全体を通じてみられる。ここで、各ステップは平均歪の低減を最大化するようにとられる。即ち、各反復において、位置(r+1,p)と(r,p+1)とが考慮され、D_(r+1,p)−D_(r,p)或いはD_(r、p+1)−D_(r,p)に対する最大の歪低減に基づいてその選択がなされる。
その処理はコーデックにおいて用いられる全てのベクトル長(バンド幅)に対して繰り返される。
第1の実施例に従う復号化器はビットストリーム逆多重化器485によりビットストリームからのインデックスを逆多重化し、その関係するインデックスを各復号化モジュール445、465に転送する。最初に、量子化された包絡線E^(b)が、包絡線インデックスIEを用いて包絡線量子化器445により取得される。それから、ビット割当てR(b)がE^(b)を用いてビット割当器475により導出される。バンド当りのパルス数を取得し、対応するRS(b)とRG(b)を見出すための符号化器のステップは、適応ビット共有エンティティ405とデータベースに格納されたテーブル406とを用いて繰り返される。そのテーブルは適応ビット共有エンティティに関係づけされるが、このことはそのテーブルがビット共有エンティティの内部に位置しても良いし、或いは、外部にあっても良いことを示唆している。精細構造の量子化器インデックスIFと利得調整インデックスIGとともに指定されたビットレートを用いて、合成シェイプN^(b)と量子化利得調整因子G^(b)とが利得調整エンティティ402と包絡線シェイピングエンティティ435により導出される。サブバンド合成X^(b)が包絡線係数、利得調整、シェイプ値との積から得られる。即ち、
X^(b)=E^(b)G^(b)N^(b) ……(8)
である。
合成ベクトルX^(b)の結合により合成スペクトラムX^を形成する。そのスペクトラムはさらに逆MDCT変換415を用いて処理され、対称正弦ウィンドウにより窓がかけられ、オーバラップ−アンド−アッド(追加)ストラテジを用いて出力合成に付加されて合成オーディオ490を提供する。
第2の実施例では、QMFフィルタバンクが用いられて信号を異なるサブバンドへと分割する。ここで、各サブバンドは、各バンドのダウンサンプルされた時間領域表示を表わす。各時間領域ベクトルは利得−シェイプVQストラテジーを用いて量子化されるベクトルとして扱われる。シェイプ量子化器は、マルチプル−コードブックの拘束を受けないベクトル量子化器を用いて実装される。その量子化器には、異なるサイズCB(n)のコードブックが格納される。シェイプに割当てられるビット数が多くなればなるほど、コードブックのサイズも大きくなる。例えば、もしnシェイプビットが割当てられるなら、CB(n+1)が用いられる。それはサイズ2nのコードブックである。そのコードブックCB(n)は、各ビット数に関しトレーニングデータシェイプベクトルの関連するセットについてトレーニングアルゴリズムを実行することによって、例えば、公知の一般化されたマックス−ロイド・アルゴリズム(Generalized Max-Lloyd Algorithm)を用いることにより、見いだされる。重心(再構築点)密度はサイズとともに増加し、それ故に増加したビットレートに対しては歪は低減する。シェイプVQの全てのエンティティはRMS=1であるように正規化される。それはシェイプVQはエネルギー偏差を表現することはできないことを意味している。マルチプル−コードブックシェイプVQを用いた利得−シェイプ量子化方式の例が図6に図示されている。概観すると、データベースDBに格納されるテーブルは、この設定に対する効率的な動作を保証するために、マルチプル−コードブックVQを用いて導出されるが、図4cと図4dに示されているように第2の実施例は説明される。
第2の実施例の符号化器はQMFフィルタバンクを適用してサブバンド時間領域の信号X(b)を取得する。なお、そのサブバンドは、バンドbに対応する非常に微妙にサブサンプルされた時間領域の信号により表現される。各サブバンド信号のRMS値が計算され、そして、そのサブバンド信号は正規化される。包絡線E(b)、量子化包絡線E^(b)、サブバンドビット割当R(b)、正規化されたシェイプベクトルN(b)は第1の実施例におけると同様に獲得される。サブバンド信号長はL(b)と表記され、それはサブバンド信号或いはベクトルN(b)の長さにおけるサンプル数と同じである(第1の実施例におけるBW(b)を参照)。次に、ビット共有{RS(b),RG(b)}は、レートR(b)と信号強度L(b)とに対して定義されるルックアップテーブルを用いて取得される。そのルックアップテーブルは第1の実施例におけるのと同様の方法で導出される。取得されたビットレートを用いて、シェイプと利得調整ベクトルとが量子化される。特に、シェイプ量子化は、利用可能なビット数RS(b)に依存するコードブックを選択し、シェイプベクトルN(b)への最小二乗距離をもつコードブックエントリを見出すことによりなされる。第2の実施例では、そのエントリは、徹底的探索、即ち、全てのベクトルに対する二乗距離を計算し、そして、最小距離を与えるエントリを選択することにより見出される。
包絡線量子化器、シェイプ量子化器、利得調整量子化器からのインデックスは多重化され、復号化器に送信されるか、或いは、格納される。
第2の実施例の復号化器はビットストリームからのインデックスを非多重化して、各復号化モジュールにその関係するインデックスを転送する。量子化包絡線E^(b)とビット割当てR(b)とは第1の実施例と同様に取得される。符号化器において用いられるものに対応するビット共有ルックアップテーブルを用いて、ビットレートRS(b)とRG(b)とが取得され、量子化器インデックスと共に、合成シェイプN^(b)と利得調整G^(b)とが取得される。一時的なサブバンド合成X^(b)が式(8)を用いて生成される。合成出力オーディオフレームは、合成QMFフィルタバンクを合成サブバンドに適用することにより生成される。
従って、図4cを参照すれば、複数のビットを利得調整量子化器とシェイプ量子化器とに割当て、利得シェイプベクトルを符号化するために用いられるようにする符号化器が備えられる。その符号化器は、現在のビットレートと第1の信号特性値とを決定し、ビットレートと第1の信号特性とにマッピングされた利得調整量子化器とシェイプ量子化器とのための少なくとも1つのビット割当てを示すテーブル404からの情報を用いて、前記テーブル404を用いて前記決定された現在のビットレートと第1の信号特性値とに関し、その利得調整量子化器とシェイプ量子化器とのための1つのビット割当てを識別するよう構成された適応ビット共有エンティティ403と、その利得シェイプベクトルを符号化する際に、前記識別されたビット割当てを適用するよう構成された利得調整エンティティとして言及される利得調整量子化器401と精細構造の量子化器として言及されるシェイプ量子化器403とを有する。なお、テーブル404は適応ビット共有エンティティ403と関係づけられる。そのことはそのテーブルがそのビット共有エンティティの内部に位置していても良いし、或いは、外部にあっても良いことを示唆している。
複数のビットを利得調整逆量子化器とシェイプ逆量子化器とに割当て、利得シェイプベクトルを復号化するために使用されるようにする復号化器が備えられる。その復号化器は、現在のビットレートと第1の信号特性値とを決定し、ビットレートと第1の信号特性とにマッピングされた利得調整逆量子化器とシェイプ逆量子化器とのための少なくとも1つのビット割当てを示すテーブル406からの情報を用いるよう構成された適応ビット共有エンティティ405を有する。その適応ビット共有エンティティ405はさらに、前記決定された現在のビットレートと第1の信号特性値とに関し、前記利得調整逆量子化器と前記シェイプ逆量子化器とのための1つのビット割当てを前記テーブル406を用いて識別するよう構成される。その復号化器はさらに、前記利得シェイプベクトルを復号化する際に、前記識別されたビット割当てを適用するようそれぞれ構成された、利得調整エンティティとしても言及される利得調整逆量子化器と精細構造の量子化器としても言及されるシェイプ逆量子化器とを有する。なお、テーブル406は適応ビット共有エンティティ405と関係づけられる。そのことはそのテーブルがそのビット共有エンティティの内部に位置していても良いし、或いは、外部にあっても良いことを示唆している。
なお、符号化器810と復号化器820のエンティティはそれぞれ、図8に図示されたようにそのエンティティの機能を提供するソフトウェア部分を処理するように構成されたプロセッサ815、825によって実装される。そのソフトウェア部分はメモリ817、827に格納され、処理されるときにそのメモリから取り出される。
本発明を更なる側面から見れば、実施例に従う符号化器810と復号化器820との内の少なくともいずれかを含む移動体機器800が備えられる。なお、その実施例の符号化器と復号化器とはネットワークノードにも実装される。

Claims (22)

  1. 複数のビットを利得調整量子化器とシェイプ量子化器とに割当て、利得シェイプベクトルを符号化するために使用されるようにする符号化器における方法であって、
    現在のビットレートと第1の信号特性値とを決定する工程(S1)と、
    ビットレートと第1の信号特性とにマッピングされた前記利得調整量子化器と前記シェイプ量子化器とのための少なくとも1つのビット割当てを示すテーブルからの情報を用いて、前記決定された現在のビットレートと第1の信号特性値とに関し、前記利得調整量子化器と前記シェイプ量子化器とのための1つのビット割当てを識別する工程(S2)と、
    前記利得シェイプベクトルを符号化する際に、前記識別されたビット割当てを適用する工程(S3)とを有することを特徴とする方法。
  2. 前記第1の信号特性はバンド幅であることを特徴とする請求項1に記載の方法。
  3. 前記第1の信号特性は信号長であることを特徴とする請求項1に記載の方法。
  4. 前記バンド幅は固定であり、前記符号化器で知られていることを特徴とする請求項2に記載の方法。
  5. 前記符号化器は変換領域オーディオ符号化器であることを特徴とする請求項1乃至4のいずれか1項に記載の方法。
  6. 複数のビットを利得調整逆量子化器とシェイプ逆量子化器とに割当て、利得シェイプベクトル復号化するために使用されるようにする復号化器における方法であって、
    現在のビットレートと第1の信号特性値とを決定する工程(S4)と、
    ビットレートと第1の信号特性とにマッピングされた前記利得調整逆量子化器と前記シェイプ逆量子化器とのための少なくとも1つのビット割当てを示すテーブルからの情報を用いて、前記決定された現在のビットレートと第1の信号特性値とに関し、前記利得調整逆量子化器と前記シェイプ逆量子化器とのための1つのビット割当てを識別する工程(S5)と、
    前記利得シェイプベクトルを復号化する際に、前記識別されたビット割当てを適用する工程(S6)とを有することを特徴とする方法。
  7. 前記第1の信号特性はバンド幅であることを特徴とする請求項6に記載の方法。
  8. 前記第1の信号特性は信号長であることを特徴とする請求項6に記載の方法。
  9. 前記バンド幅は固定であり、前記復号化器で知られていることを特徴とする請求項7に記載の方法。
  10. 前記復号化器は変換領域オーディオ復号化器であることを特徴とする請求項6乃至9のいずれか1項に記載の方法。
  11. 複数のビットを利得調整量子化器とシェイプ量子化器とに割当て、利得シェイプベクトルを符号化するために使用されるようにする符号化器であって、前記符号化器は、
    現在のビットレートと第1の信号特性値とを決定し、ビットレートと第1の信号特性とにマッピングされた前記利得調整量子化器と前記シェイプ量子化器とのための少なくとも1つのビット割当てを示すテーブル(404)からの情報を用いて、前記決定された現在のビットレートと第1の信号特性値とに関し、前記利得調整量子化器と前記シェイプ量子化器とのための1つのビット割当てを識別するよう構成された適応ビット共用エンティティ(403)と、
    前記利得シェイプベクトルを符号化する際に、前記識別されたビット割当てを適用するよう構成された利得調整及びシェイプ量子化器(403)とを有することを特徴とする符号化器。
  12. 前記第1の信号特性はバンド幅であることを特徴とする請求項11に記載の符号化器。
  13. 前記第1の信号特性は信号長であることを特徴とする請求項11に記載の符号化器。
  14. 前記バンド幅は固定であり、前記符号化器で知られていることを特徴とする請求項12に記載の符号化器。
  15. 前記符号化器は変換領域オーディオ符号化器であることを特徴とする請求項11乃至14のいずれか1項に記載の符号化器。
  16. 複数のビットを利得調整逆量子化器とシェイプ逆量子化器とに割当て、利得シェイプベクトル復号化するために使用されるようにする復号化器であって、前記復号化器は、
    現在のビットレートと第1の信号特性値とを決定し、ビットレートと第1の信号特性とにマッピングされた前記利得調整逆量子化器と前記シェイプ逆量子化器とのための少なくとも1つのビット割当てを示すテーブル(406)からの情報を用いて、前記決定された現在のビットレートと第1の信号特性値とに関し、前記利得調整逆量子化器と前記シェイプ逆量子化器とのための1つのビット割当てを前記テーブル(406)を用いて識別するよう構成された適応ビット共用エンティティ(505)と、
    前記利得シェイプベクトルを復号化する際に、前記識別されたビット割当てを適用するよう構成された利得調整及びシェイプ逆量子化器(405)とを有することを特徴とする復号化器。
  17. 前記第1の信号特性はバンド幅であることを特徴とする請求項16に記載の復号化器。
  18. 前記第1の信号特性は信号長であることを特徴とする請求項16に記載の復号化器。
  19. 前記バンド幅は固定であり、前記復号化器で知られていることを特徴とする請求項17に記載の復号化器。
  20. 前記復号化器は変換領域オーディオ復号化器であることを特徴とする請求項16乃至19のいずれか1項に記載の復号化器。
  21. 請求項11乃至15のいずれか1項に記載の符号化器を有する移動体機器。
  22. 請求項16乃至20のいずれか1項に記載の復号化器を有する移動体機器。
JP2014505105A 2011-04-15 2011-10-17 適応的な利得−シェイプのレート共用 Ceased JP2014513813A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161475767P 2011-04-15 2011-04-15
US61/475,767 2011-04-15
PCT/SE2011/051238 WO2012141635A1 (en) 2011-04-15 2011-10-17 Adaptive gain-shape rate sharing

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016202998A Division JP6388624B2 (ja) 2011-04-15 2016-10-14 方法、符号化器、復号化器、及び移動体機器

Publications (2)

Publication Number Publication Date
JP2014513813A true JP2014513813A (ja) 2014-06-05
JP2014513813A5 JP2014513813A5 (ja) 2014-11-06

Family

ID=45063198

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2014505105A Ceased JP2014513813A (ja) 2011-04-15 2011-10-17 適応的な利得−シェイプのレート共用
JP2016202998A Active JP6388624B2 (ja) 2011-04-15 2016-10-14 方法、符号化器、復号化器、及び移動体機器
JP2018152712A Active JP6600054B2 (ja) 2011-04-15 2018-08-14 方法、符号化器、復号化器、及び移動体機器

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2016202998A Active JP6388624B2 (ja) 2011-04-15 2016-10-14 方法、符号化器、復号化器、及び移動体機器
JP2018152712A Active JP6600054B2 (ja) 2011-04-15 2018-08-14 方法、符号化器、復号化器、及び移動体機器

Country Status (10)

Country Link
US (4) US9548057B2 (ja)
EP (2) EP2908313B1 (ja)
JP (3) JP2014513813A (ja)
DK (2) DK2908313T3 (ja)
ES (2) ES2741559T3 (ja)
PL (2) PL2908313T3 (ja)
PT (2) PT2908313T (ja)
TR (1) TR201907767T4 (ja)
WO (1) WO2012141635A1 (ja)
ZA (1) ZA201306709B (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI579831B (zh) * 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
EP3913808A1 (en) * 2013-11-12 2021-11-24 Telefonaktiebolaget LM Ericsson (publ) Split gain shape vector coding
US20150149157A1 (en) * 2013-11-22 2015-05-28 Qualcomm Incorporated Frequency domain gain shape estimation
US10366698B2 (en) 2016-08-30 2019-07-30 Dts, Inc. Variable length coding of indices and bit scheduling in a pyramid vector quantizer
PL3555885T3 (pl) * 2016-12-16 2021-01-11 Telefonaktiebolaget Lm Ericsson (Publ) Sposób i koder do obsługi współczynników reprezentacji obwiedni
WO2019056108A1 (en) * 2017-09-20 2019-03-28 Voiceage Corporation METHOD AND DEVICE FOR EFFICIENT DISTRIBUTION OF A BINARY BUDGET IN A CELP CODEC

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080140393A1 (en) * 2006-12-08 2008-06-12 Electronics & Telecommunications Research Institute Speech coding apparatus and method
JP2009501944A (ja) * 2005-07-15 2009-01-22 マイクロソフト コーポレーション ディジタル・メディア・スペクトル・データの効率的コーディングに使用される辞書内のコードワードの変更
JP2010538316A (ja) * 2007-08-27 2010-12-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 改良された音声及びオーディオ信号の変換符号化
US20130339038A1 (en) * 2011-03-04 2013-12-19 Telefonaktiebolaget L M Ericsson (Publ) Post-Quantization Gain Correction in Audio Coding

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5819215A (en) * 1995-10-13 1998-10-06 Dobson; Kurt Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
WO2010031049A1 (en) * 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
CN102918590B (zh) * 2010-03-31 2014-12-10 韩国电子通信研究院 编码方法和装置、以及解码方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009501944A (ja) * 2005-07-15 2009-01-22 マイクロソフト コーポレーション ディジタル・メディア・スペクトル・データの効率的コーディングに使用される辞書内のコードワードの変更
US20080140393A1 (en) * 2006-12-08 2008-06-12 Electronics & Telecommunications Research Institute Speech coding apparatus and method
JP2010538316A (ja) * 2007-08-27 2010-12-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 改良された音声及びオーディオ信号の変換符号化
US20130339038A1 (en) * 2011-03-04 2013-12-19 Telefonaktiebolaget L M Ericsson (Publ) Post-Quantization Gain Correction in Audio Coding

Also Published As

Publication number Publication date
ES2741559T3 (es) 2020-02-11
EP2697795B1 (en) 2015-06-17
US20200365164A1 (en) 2020-11-19
US10192558B2 (en) 2019-01-29
PL2697795T3 (pl) 2015-10-30
WO2012141635A1 (en) 2012-10-18
TR201907767T4 (tr) 2019-06-21
US20140025375A1 (en) 2014-01-23
JP6388624B2 (ja) 2018-09-12
JP6600054B2 (ja) 2019-10-30
US10770078B2 (en) 2020-09-08
US20170148446A1 (en) 2017-05-25
EP2697795A1 (en) 2014-02-19
EP2908313A1 (en) 2015-08-19
ES2545623T3 (es) 2015-09-14
JP2018205766A (ja) 2018-12-27
DK2908313T3 (da) 2019-06-11
EP2908313B1 (en) 2019-05-08
JP2017062477A (ja) 2017-03-30
US20190122671A1 (en) 2019-04-25
DK2697795T3 (en) 2015-09-07
ZA201306709B (en) 2014-11-26
PL2908313T3 (pl) 2019-11-29
PT2697795E (pt) 2015-09-25
PT2908313T (pt) 2019-06-19
US9548057B2 (en) 2017-01-17

Similar Documents

Publication Publication Date Title
JP6600054B2 (ja) 方法、符号化器、復号化器、及び移動体機器
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
JP5192099B2 (ja) 階層的オーディオ符号化、復号化方法及びシステム
US8099275B2 (en) Sound encoder and sound encoding method for generating a second layer decoded signal based on a degree of variation in a first layer decoded signal
US7769584B2 (en) Encoder, decoder, encoding method, and decoding method
CA2832032C (en) Device and method for execution of huffman coding
EP3457400B1 (en) Voice audio encoding device, voice audio decoding device, voice audio encoding method, and voice audio decoding method
US20080140393A1 (en) Speech coding apparatus and method
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
WO2012053150A1 (ja) 音声符号化装置および音声復号化装置
RU2505921C2 (ru) Способ и устройство кодирования и декодирования аудиосигналов (варианты)
KR20170035827A (ko) 음향 신호 부호화 장치, 음향 신호 복호 장치, 음향 신호 부호화 방법 및 음향 신호 복호 방법
JPWO2013118476A1 (ja) 音響/音声符号化装置、音響/音声復号装置、音響/音声符号化方法および音響/音声復号方法
WO2012004998A1 (ja) スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法
KR20110110044A (ko) 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
WO2011045926A1 (ja) 符号化装置、復号装置およびこれらの方法
KR20130047630A (ko) 통신 시스템에서 신호 부호화 장치 및 방법

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140912

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140912

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150601

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150703

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160222

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160519

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160916

A045 Written measure of dismissal of application

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20170130