JP5468092B2 - 高速格子ベクトル量子化 - Google Patents
高速格子ベクトル量子化 Download PDFInfo
- Publication number
- JP5468092B2 JP5468092B2 JP2012004209A JP2012004209A JP5468092B2 JP 5468092 B2 JP5468092 B2 JP 5468092B2 JP 2012004209 A JP2012004209 A JP 2012004209A JP 2012004209 A JP2012004209 A JP 2012004209A JP 5468092 B2 JP5468092 B2 JP 5468092B2
- Authority
- JP
- Japan
- Prior art keywords
- lattice
- coefficients
- coefficient
- audio
- quantization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000013598 vector Substances 0.000 title claims description 161
- 238000013139 quantization Methods 0.000 title claims description 114
- 238000000034 method Methods 0.000 claims description 98
- 230000005236 sound signal Effects 0.000 claims description 46
- 230000001131 transforming effect Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 description 34
- 230000008569 process Effects 0.000 description 22
- 238000009527 percussion Methods 0.000 description 18
- 238000001228 spectrum Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 13
- 230000003044 adaptive effect Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 241000282412 Homo Species 0.000 description 3
- 230000002427 irreversible effect Effects 0.000 description 3
- 238000010845 search algorithm Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
一実施例では、ロングフレーム及びショートフレームと呼ばれる2つのフレームサイズが使用される。簡単にするために、この開示は2重変換を示すが、ある実施例では、単一のフレームサイズが使用されてもよく、2より多くのフレームサイズが使用されてもよいことがわかる。
サブフレームの振幅エンベロープは量子化及び分析され、Huffman符号化が使用されるべきか否かを決定する。固定のビット割り当てが、初期設定及びベンチマークとして各振幅エンベロープに割り当てられてもよい。Huffman符号化の使用が固定のビットに比べていくつかのビットを節約することができる場合、これが使用されてもよい。振幅エンベロープのHuffmanフラグが設定されるため、デコーダはHuffman符号化を適用するか否かを認識する。節約されるビット数は、残りのエンコードに利用可能なビットに格納される。そうでない場合、Huffman符号化は使用されず、フラグがクリアされ、初期設定の固定のビットが使用される。
1≦r≦10である場合、M(r)は16であり、全てのこれらのサブフレームは第1のグループ0〜4kHzになる。
11≦r≦15である場合、M(r)は24であり、全てのこれらのサブフレームは第2のグループ4kHz〜7kHzになる。
16≦r≦24である場合、M(r)は32であり、全てのこれらのサブフレームは第3のグループ6.8kHz〜14kHzになる。
25≦r≦34である場合、M(r)は32であり、全てのこれらのサブフレームは第4のグループ14〜22kHzになる。
変換係数のグループのエネルギーに基づく適応ビット割り当て方式は、フレームの利用可能なビットをサブフレーム間に割り当てるために使用され得る。一実施例では、改善したビット割り当て方式が使用されてもよい。G.722.1に使用される方式とは異なり、係数インデックスの適応ビット割り当てはカテゴリにより固定されず、振幅エンベロープが量子化されるのと同時の割り当て処理により固定される。ビット割り当ては次のようにされてもよい。
従来技術の量子化及びエンコード方法は、前記の実施例を実装し、処理されたオーディオ信号を完全なオーディオスペクトルに拡張するために使用されてもよいが、広い視聴者に最大の可能性をもたらさないことがある。従来技術の方法を使用すると、ビットレートの要件は高くなり、処理された完全なスペクトルのオーディオ信号を送信することが困難になる。この開示の一実施例による新しい高速格子ベクトル量子化(FLVQ:Fast Lattice Vector Quantization)が使用可能であり、これは符号化効率を改善し、ビット要件を低減する。FLVQは、如何なるオーディオ信号の量子化及びエンコードに使用されてもよい。
高レート量子化器は、格子D8のVoronoiコードに基づき、2〜6ビット/係数のレートで正規化されたMLT係数を量子化するように設計されてもよい。このサブ量子化器のコードブックは格子D8の有限領域から構成されてもよく、メモリには格納されない。コードベクトルは簡単な代数方法により生成され得る。
いわゆる循環Gosset格子(rotated Gosset lattice)RE8に基づく低レート量子化は、1ビット/係数のレートで正規化されたMLT係数を量子化するように提供されてもよい。
MLT係数は均一に分布していない。8次元の係数ベクトルは原点の周囲で高い集積率を有することが観測されている。従って、格子ベクトル量子化器のコードブックは不均一のソースには最適ではない。
図3Aは、この開示の実施例によるエンコードされたビットストリームの例を示している。一実施例では、フレームの合計ビット数は、それぞれ32kbps、48kbps及び64kbpsのビットレートに対応して、640、960及び1280ビットである。チャネルで送信されるビットストリームは3つの部分(フラグビット、ノルムコードビット及びMLT係数のコードビット)で構成されてもよい。フラグビットが最初に送信され、ノルムコードビットが次に送信され、MLT係数のコードビットが最後に送信されてもよい。
この開示の一実施例による全体のエンコード処理の例示的な処理フロー図を示す図4を参照する。エンコード処理はステップ400で始まる。ステップ410において、時間内にオーディオサンプルが変換係数のフレームに変換されるように、2つのMLT変換がオーディオ信号に適用されてもよい。ロングフレーム変換係数は、低周波数(例えば、約20Hz〜約7kHz)の信号に使用され、ショートフレーム変換係数は、高周波数(例えば、約6.8kHz〜約22kHz)の信号に使用される。他の実施例では、単一の変換がオーディオ信号に適用されてもよい。
デコーダは、基本的にエンコーダの逆の順序で、エンコードされたビットストリームを処理する。合計のビットはわかっており、合意されている。デコーダでは、適切なデコーダがビットストリームに使用されることを確保するために、データ整合性及びエンコードプロトコルが検査される。ビットストリームが前記の例に従ってエンコーダでエンコードされることをデコーダが確かめると、図5に示して以下に説明するようにビットストリームをデコードする。
切り捨てられた格子からコードブックを構成し、前記格子は、偶数の和の整数座標を有する全てのコードベクトルの多次元格子を有し、
前記切り捨てられた格子の外側にある外れ値ソースベクトルを量子化することを有する方法。
(a)各外れ値ソースベクトルを半分にスケーリングし、スケーリングされた外れ値ソースベクトルを形成し、
(b)前記スケーリングされた外れ値ソースベクトルに最も近い格子点uを決定し、
(c)uのインデックスベクトルjを計算し、
(d)前記インデックスベクトルjからコードベクトルyを決定し、
(e)yとuとを比較し、
(f)yがuと異なる場合に、前記の動作(a)〜(e)を繰り返し、
(g)前記スケーリングされた外れ値ソースベクトルの16分の1を前記スケーリングされた外れ値ソースベクトルに加算し、新しいスケーリングされた外れ値ソースベクトルを形成し、
(h)前記の動作(b)〜(e)を繰り返し、
(i)yがuと等しい場合に、前記の動作(g)〜(h)を繰り返すことを有する、(1)に記載の方法。
同心球に入る全てのコードベクトルの多次元格子を有する格子からコードブックを構成し、
ソースベクトルを量子化することを有する方法。
(a)前記ソースベクトルをシフト及びスケーリングし、
(b)前記スケーリングされたソースベクトルの成分を降順に並び換え、
(c)平均2乗誤差に基づいて前記並び換えられたベクトルのリーダベクトルlを決定し、
(d)前記リーダベクトルlの成分の順序を、前記スケーリングされたソースベクトルの成分の元の順序に配置し、前記コードベクトルyを導き、
(e)前記リーダベクトルlのフラグベクトルを決定し、
(f)前記フラグベクトルの成分を元の順序に配置することにより、ベクトルzを導き、
(g)前記リーダベクトルlに関するインデックスオフセットKを決定し、
(h)前記リーダベクトルが(2,0,0,0,0,0,0,-2)であり、前記コードベクトルyが-2の成分より小さいインデックスでの2の成分を有する場合、28を加算することにより前記オフセットKを調整し、
(i)ベクトル内積i=zpTを計算し、p=(1,2,4,8,16,32,64,128)であり、
(j)前記コードベクトルyに関するインデックスインクリメントjを決定し、
(k)前記コードベクトルyのインデックスkを計算し、k=K+jである、(5)に記載の方法。
係数毎に1ビットより大きいレートで変換係数を量子化するために第1の格子ベクトル量子化器を使用し、
係数毎に1ビットのレートで変換係数を量子化するために第2の格子ベクトル量子化器を使用することを有する方法。
切り捨てられた格子からコードブックを構成し、前記格子は、偶数の和の整数座標を有する全てのコードベクトルの多次元格子を有し、
前記切り捨てられた格子の外側にある外れ値ソースベクトルを量子化することを有する、(8)に記載の方法。
同心球に入る全てのコードベクトルの多次元格子を有する格子からコードブックを構成し、
ソースベクトルを量子化することを有する、(8)に記載の方法。
前記オーディオ信号のサンプルのグループを時間ドメインから周波数ドメインに変換し、変換係数のフレームを形成し、
変換係数の各フレームを複数のグループにグループ化し、各グループは複数のサブフレームを有し、各サブフレームは特定の数の変換係数を有し、
前記サブフレームのrmsに基づいて前記サブフレームのそれぞれのノルムを決定し、
各サブフレームの前記rmsを量子化し、
前記サブフレームの前記量子化されたrmsで前記サブフレーム内の各係数を除算することにより、各サブフレームの係数を正規化し、
第1の格子ベクトル量子化を使用し、係数毎に1ビットより大きいレートで係数を量子化し、
第2の格子ベクトル量子化器を使用し、係数毎に1ビットのレートで係数を量子化することを有する方法。
切り捨てられた格子からコードブックを構成し、前記格子は、偶数の和の整数座標を有する全てのコードベクトルの多次元格子を有し、
前記切り捨てられた格子の外側にある外れ値ソースベクトルを量子化することを有する、(12)に記載の方法。
同心球に入る全てのコードベクトルの多次元格子を有する格子からコードブックを構成し、
ソースベクトルを量子化することを有する、(12)に記載の方法。
前記サブフレームのうち1つのrmsを計算し、
前記サブフレームの前記rmsで前記サブフレーム内の各係数を除算することにより、前記サブフレームの係数を正規化し、
各サブグループのHuffman符号化フラグを維持し、
各サブグループの固定のビット数を維持し、
サブグループについてHuffman符号化を使用するために必要なビット数を計算し、
前記Huffman符号化を使用するために必要なビット数が前記サブグループの固定のビット数より小さい場合に、前記Huffmanフラグを設定し、Huffman符号化を使用し、
前記Huffman符号化を使用するために必要なビット数が前記サブグループの固定のビット数より小さくない場合に、前記Huffmanフラグをクリアし、固定のビット符号化数を使用することを更に有する、(12)に記載の方法。
(1)、(5)、(8)又は(12)に記載の方法を実行するように機械により実行可能なコンピュータ可読媒体。
前記オーディオ信号の時間ドメインのサンプルのフレームを周波数ドメインに変換し、変換係数のフレームを形成するように動作可能な変換モジュールと、
係数毎に1ビットより大きいレートで変換係数を量子化するように動作可能な第1の格子ベクトル量子化モジュールと、
係数毎に1ビットのレートで変換係数を量子化するように動作可能な第2の格子ベクトル量子化モジュールと
を有する22kHzエンコーダ。
前記オーディオ入出力インタフェースに通信可能に結合されたマイクロフォンと、
前記オーディオ入出力インタフェースに通信可能に結合されたスピーカと、
前記オーディオ入出力インタフェースに通信可能に結合された22kHzオーディオエンコーダと
を有するエンドポイントであって、
前記22kHzオーディオエンコーダは、
オーディオ信号の時間ドメインのサンプルのフレームを周波数ドメインに変換し、変換係数のフレームを形成するように動作可能な変換モジュールと、
係数毎に1ビットより大きいレートで係数を量子化するように動作可能な第1の格子ベクトル量子化モジュールと、
係数毎に1ビットのレートで係数を量子化するように動作可能な第2の格子ベクトル量子化モジュールと
を有するエンドポイント。
前記オーディオ入出力インタフェースに通信可能に結合されたバスと、
前記バスに通信可能に結合されたビデオ入出力インタフェースと、
前記ビデオ入出力インタフェースに通信可能に結合されたカメラと、
前記ビデオ入出力インタフェースに通信可能に結合されたディスプレイ装置と
を更に有する、(20)に記載のエンドポイント。
812 オーディオコーデック
814 オーディオI/Oインタフェース
816 マイクロフォン
818 スピーカ
820 ネットワークインタフェース
822 ビデオI/Oインタフェース
824 ビデオコーデック
826 カメラ
828 ディスプレイ
832 CPU
834 メモリ
840 エンドポイント
850 ネットワーク
Claims (14)
- オーディオ信号を符号化する際に使用される量子化方法であって、
係数毎に1ビットより大きいレートで変換係数を量子化するために、第1の格子に基づく第1の格子ベクトル量子化器を使用し、
係数毎に1ビットのレートで変換係数を量子化するために、前記第1の格子と異なる第2の格子に基づく第2の格子ベクトル量子化器を使用することを有する方法。 - 前記第1の格子ベクトル量子化器を使用する動作は、
切り捨てられた格子からコードブックを構成し、前記格子は、偶数の和の整数座標を有する全てのコードベクトルの多次元格子を有し、
前記切り捨てられた格子の外側にある外れ値ソースベクトルを量子化することを有する、請求項1に記載の方法。 - 前記第2の格子ベクトル量子化器を使用する動作は、
同心球に入る全てのコードベクトルの多次元格子を有する格子からコードブックを構成し、
ソースベクトルを量子化することを有する、請求項1に記載の方法。 - 前記第1の格子ベクトル量子化器により量子化された係数の量子化のインデックスを可変ビット長符号化することを更に有する、請求項1に記載の方法。
- オーディオ信号をエンコードする方法であって、
前記オーディオ信号のサンプルのグループを時間ドメインから周波数ドメインに変換し、変換係数のフレームを形成し、
変換係数の各フレームを複数のグループにグループ化し、各グループは複数のサブフレームを有し、各サブフレームは特定の数の変換係数を有し、
前記サブフレームのrmsに基づいて前記サブフレームのそれぞれのノルムを決定し、
各サブフレームの前記rmsを量子化し、
前記サブフレームの前記量子化されたrmsで前記サブフレーム内の各係数を除算することにより、各サブフレームの係数を正規化し、
第1の格子に基づく第1の格子ベクトル量子化器を使用し、係数毎に1ビットより大きいレートで係数を量子化し、
前記第1の格子と異なる第2の格子に基づく第2の格子ベクトル量子化器を使用し、係数毎に1ビットのレートで係数を量子化することを有する方法。 - 前記第1の格子ベクトル量子化器を使用する動作は、
切り捨てられた格子からコードブックを構成し、前記格子は、偶数の和の整数座標を有する全てのコードベクトルの多次元格子を有し、
前記切り捨てられた格子の外側にある外れ値ソースベクトルを量子化することを有する、請求項5に記載の方法。 - 前記第2の格子ベクトル量子化器を使用する動作は、
同心球に入る全てのコードベクトルの多次元格子を有する格子からコードブックを構成し、
ソースベクトルを量子化することを有する、請求項5に記載の方法。 - 前記第1の格子ベクトル量子化器により量子化された係数の量子化のインデックスを可変ビット長符号化することを更に有する、請求項5に記載の方法。
- 請求項1又は5に記載の方法をコンピュータに実行させるプログラムを記録したコンピュータ可読記録媒体。
- オーディオ信号をエンコードする22kHzエンコーダであって、
前記オーディオ信号の時間ドメインのサンプルのフレームを周波数ドメインに変換し、変換係数のフレームを形成するように動作可能な変換モジュールと、
係数毎に1ビットより大きいレートで変換係数を量子化するように動作可能な、第1の格子に基づく第1の格子ベクトル量子化モジュールと、
係数毎に1ビットのレートで変換係数を量子化するように動作可能な、前記第1の格子と異なる第2の格子に基づく第2の格子ベクトル量子化モジュールと
を有する22kHzエンコーダ。 - 前記第1の格子ベクトル量子化モジュールにより量子化された係数の量子化のインデックスを可変ビット長符号化するように動作可能なコーダモジュールを更に有する、請求項10に記載のエンコーダ。
- オーディオ入出力インタフェースと、
前記オーディオ入出力インタフェースに通信可能に結合されたマイクロフォンと、
前記オーディオ入出力インタフェースに通信可能に結合されたスピーカと、
前記オーディオ入出力インタフェースに通信可能に結合された22kHzオーディオエンコーダと
を有するエンドポイントであって、
前記22kHzオーディオエンコーダは、
オーディオ信号の時間ドメインのサンプルのフレームを周波数ドメインに変換し、変換係数のフレームを形成するように動作可能な変換モジュールと、
係数毎に1ビットより大きいレートで係数を量子化するように動作可能な、第1の格子に基づく第1の格子ベクトル量子化モジュールと、
係数毎に1ビットのレートで係数を量子化するように動作可能な、前記第1の格子と異なる第2の格子に基づく第2の格子ベクトル量子化モジュールと
を有するエンドポイント。 - 前記22kHzオーディオエンコーダは、前記第1の格子ベクトル量子化モジュールにより量子化された係数の量子化のインデックスを可変ビット長符号化するように動作可能なコーダモジュールを更に有する、請求項12に記載のエンドポイント。
- 前記22kHzオーディオエンコーダは、
前記オーディオ入出力インタフェースに通信可能に結合されたバスと、
前記バスに通信可能に結合されたビデオ入出力インタフェースと、
前記ビデオ入出力インタフェースに通信可能に結合されたカメラと、
前記ビデオ入出力インタフェースに通信可能に結合されたディスプレイ装置と
を更に有する、請求項12に記載のエンドポイント。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/550,682 | 2006-10-18 | ||
US11/550,682 US7966175B2 (en) | 2006-10-18 | 2006-10-18 | Fast lattice vector quantization |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007269121A Division JP4942609B2 (ja) | 2006-10-18 | 2007-10-16 | 高速格子ベクトル量子化 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012118546A JP2012118546A (ja) | 2012-06-21 |
JP5468092B2 true JP5468092B2 (ja) | 2014-04-09 |
Family
ID=38819822
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007269121A Expired - Fee Related JP4942609B2 (ja) | 2006-10-18 | 2007-10-16 | 高速格子ベクトル量子化 |
JP2012004209A Expired - Fee Related JP5468092B2 (ja) | 2006-10-18 | 2012-01-12 | 高速格子ベクトル量子化 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007269121A Expired - Fee Related JP4942609B2 (ja) | 2006-10-18 | 2007-10-16 | 高速格子ベクトル量子化 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7966175B2 (ja) |
EP (1) | EP1914725B1 (ja) |
JP (2) | JP4942609B2 (ja) |
KR (1) | KR100955627B1 (ja) |
CN (1) | CN101165777B (ja) |
HK (1) | HK1111800A1 (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8091006B2 (en) * | 2006-06-02 | 2012-01-03 | Nec Laboratories America, Inc. | Spherical lattice codes for lattice and lattice-reduction-aided decoders |
EP2274833B1 (en) * | 2008-04-16 | 2016-08-10 | Huawei Technologies Co., Ltd. | Vector quantisation method |
CN101572092B (zh) * | 2008-04-30 | 2012-11-21 | 华为技术有限公司 | 编解码端的固定码本激励的搜索方法及装置 |
WO2010000305A1 (en) * | 2008-06-30 | 2010-01-07 | Nokia Corporation | An apparatus |
CN101577551A (zh) * | 2009-05-27 | 2009-11-11 | 华为技术有限公司 | 一种生成格型矢量量化码书的方法及装置 |
US8386266B2 (en) | 2010-07-01 | 2013-02-26 | Polycom, Inc. | Full-band scalable audio codec |
JP5746974B2 (ja) * | 2009-11-13 | 2015-07-08 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 符号化装置、復号装置およびこれらの方法 |
CN102081926B (zh) * | 2009-11-27 | 2013-06-05 | 中兴通讯股份有限公司 | 格型矢量量化音频编解码方法和系统 |
US8428959B2 (en) * | 2010-01-29 | 2013-04-23 | Polycom, Inc. | Audio packet loss concealment by transform interpolation |
CN102158692B (zh) | 2010-02-11 | 2013-02-13 | 华为技术有限公司 | 编码方法、解码方法、编码器和解码器 |
US8831932B2 (en) | 2010-07-01 | 2014-09-09 | Polycom, Inc. | Scalable audio in a multi-point environment |
KR101995694B1 (ko) | 2011-04-20 | 2019-07-02 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 허프만 부호화를 실행하기 위한 장치 및 방법 |
KR20140085453A (ko) * | 2011-10-27 | 2014-07-07 | 엘지전자 주식회사 | 음성 신호 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
KR101821532B1 (ko) * | 2012-07-12 | 2018-03-08 | 노키아 테크놀로지스 오와이 | 벡터 양자화 |
CN102801427B (zh) * | 2012-08-08 | 2015-05-06 | 深圳广晟信源技术有限公司 | 源信号变速率格矢量量化的编解码方法和系统 |
US9883312B2 (en) | 2013-05-29 | 2018-01-30 | Qualcomm Incorporated | Transformed higher order ambisonics audio data |
CN106030703B (zh) * | 2013-12-17 | 2020-02-04 | 诺基亚技术有限公司 | 音频信号编码器 |
US9852737B2 (en) * | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US10580416B2 (en) * | 2015-07-06 | 2020-03-03 | Nokia Technologies Oy | Bit error detector for an audio signal decoder |
RU2769429C2 (ru) * | 2018-08-17 | 2022-03-31 | Нокиа Текнолоджиз Ой | Кодер звукового сигнала |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62194296A (ja) * | 1986-02-21 | 1987-08-26 | 株式会社日立製作所 | 音声符号化方式 |
US5317672A (en) * | 1991-03-05 | 1994-05-31 | Picturetel Corporation | Variable bit rate speech encoder |
US5664057A (en) * | 1993-07-07 | 1997-09-02 | Picturetel Corporation | Fixed bit rate speech encoder/decoder |
TW272341B (ja) | 1993-07-16 | 1996-03-11 | Sony Co Ltd | |
US5675590A (en) * | 1994-11-23 | 1997-10-07 | At&T Wireless Services, Inc. | Cyclic trellis coded modulation |
JP3152109B2 (ja) * | 1995-05-30 | 2001-04-03 | 日本ビクター株式会社 | オーディオ信号の圧縮伸張方法 |
JP3552811B2 (ja) * | 1995-09-29 | 2004-08-11 | 三菱電機株式会社 | ディジタル映像信号符号化装置および復号化装置 |
US5883981A (en) * | 1995-10-20 | 1999-03-16 | Competitive Technologies Of Pa, Inc. | Lattice vector transform coding method for image and video compression |
JPH09127986A (ja) * | 1995-10-26 | 1997-05-16 | Sony Corp | 符号化信号の多重化方法及び信号符号化装置 |
JPH09127998A (ja) * | 1995-10-26 | 1997-05-16 | Sony Corp | 信号量子化方法及び信号符号化装置 |
KR19980022377A (ko) | 1996-09-21 | 1998-07-06 | 김광호 | 적응형 격자 양자화기법에 의한 비디오신호 부호화 및 또는 복호화방법 |
JP3707154B2 (ja) | 1996-09-24 | 2005-10-19 | ソニー株式会社 | 音声符号化方法及び装置 |
US5924064A (en) | 1996-10-07 | 1999-07-13 | Picturetel Corporation | Variable length coding using a plurality of region bit allocation patterns |
JPH10124092A (ja) | 1996-10-23 | 1998-05-15 | Sony Corp | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 |
JP3064947B2 (ja) * | 1997-03-26 | 2000-07-12 | 日本電気株式会社 | 音声・楽音符号化及び復号化装置 |
US5859788A (en) * | 1997-08-15 | 1999-01-12 | The Aerospace Corporation | Modulated lapped transform method |
AU3372199A (en) * | 1998-03-30 | 1999-10-18 | Voxware, Inc. | Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment |
US6242936B1 (en) * | 1998-08-11 | 2001-06-05 | Texas Instruments Incorporated | Circuit for driving conductive line and testing conductive line for current leakage |
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
JP2000134105A (ja) * | 1998-10-29 | 2000-05-12 | Matsushita Electric Ind Co Ltd | オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法 |
US6300888B1 (en) | 1998-12-14 | 2001-10-09 | Microsoft Corporation | Entrophy code mode switching for frequency-domain audio coding |
US6516297B1 (en) * | 1998-12-23 | 2003-02-04 | At&T Corp. | Multiple description lattice vector quantization |
US7039581B1 (en) * | 1999-09-22 | 2006-05-02 | Texas Instruments Incorporated | Hybrid speed coding and system |
US7315815B1 (en) * | 1999-09-22 | 2008-01-01 | Microsoft Corporation | LPC-harmonic vocoder with superframe structure |
US6594627B1 (en) * | 2000-03-23 | 2003-07-15 | Lucent Technologies Inc. | Methods and apparatus for lattice-structured multiple description vector quantization coding |
US7106794B2 (en) * | 2000-08-11 | 2006-09-12 | Broadcom Corporation | System and method for Huffman shaping in a data communication system |
JP2002094992A (ja) | 2000-09-19 | 2002-03-29 | Sony Corp | 符号化データ長検出装置とその方法および画像符号化装置 |
JP2002196792A (ja) * | 2000-12-25 | 2002-07-12 | Matsushita Electric Ind Co Ltd | 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム |
US6734920B2 (en) * | 2001-04-23 | 2004-05-11 | Koninklijke Philips Electronics N.V. | System and method for reducing error propagation in a decision feedback equalizer of ATSC VSB receiver |
US6606044B2 (en) * | 2002-01-02 | 2003-08-12 | Motorola, Inc. | Method and apparatus for generating a pulse width modulated signal |
CA2388358A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
US8090577B2 (en) * | 2002-08-08 | 2012-01-03 | Qualcomm Incorported | Bandwidth-adaptive quantization |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
EP1709743A1 (fr) | 2004-01-30 | 2006-10-11 | France Telecom S.A. | Quantification vectorielle en dimension et resolution variables |
FR2866166B1 (fr) * | 2004-02-06 | 2006-06-16 | Anagram Technologies Sa | Modulateur en treillis vectoriel |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
MXPA06012578A (es) | 2004-05-17 | 2006-12-15 | Nokia Corp | Codificacion de audio con distintos modelos de codificacion. |
CA2566368A1 (en) | 2004-05-17 | 2005-11-24 | Nokia Corporation | Audio encoding with different coding frame lengths |
EP1775718A4 (en) * | 2004-07-22 | 2008-05-07 | Fujitsu Ltd | AUDIOCODING DEVICE AND AUDIOCODING METHOD |
WO2006054583A1 (ja) * | 2004-11-18 | 2006-05-26 | Canon Kabushiki Kaisha | オーディオ信号符号化装置および方法 |
JP4639073B2 (ja) | 2004-11-18 | 2011-02-23 | キヤノン株式会社 | オーディオ信号符号化装置および方法 |
US7460150B1 (en) * | 2005-03-14 | 2008-12-02 | Avaya Inc. | Using gaze detection to determine an area of interest within a scene |
US7627481B1 (en) * | 2005-04-19 | 2009-12-01 | Apple Inc. | Adapting masking thresholds for encoding a low frequency transient signal in audio data |
US7587314B2 (en) * | 2005-08-29 | 2009-09-08 | Nokia Corporation | Single-codebook vector quantization for multiple-rate applications |
JP4801160B2 (ja) * | 2005-09-23 | 2011-10-26 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 逐次改善可能な格子ベクトル量子化 |
US20070168197A1 (en) * | 2006-01-18 | 2007-07-19 | Nokia Corporation | Audio coding |
-
2006
- 2006-10-18 US US11/550,682 patent/US7966175B2/en not_active Expired - Fee Related
-
2007
- 2007-09-28 EP EP07019186A patent/EP1914725B1/en active Active
- 2007-10-02 KR KR1020070099144A patent/KR100955627B1/ko active IP Right Grant
- 2007-10-16 JP JP2007269121A patent/JP4942609B2/ja not_active Expired - Fee Related
- 2007-10-18 CN CN2007101671287A patent/CN101165777B/zh active Active
-
2008
- 2008-06-03 HK HK08106188.1A patent/HK1111800A1/xx not_active IP Right Cessation
-
2012
- 2012-01-12 JP JP2012004209A patent/JP5468092B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US7966175B2 (en) | 2011-06-21 |
JP4942609B2 (ja) | 2012-05-30 |
JP2012118546A (ja) | 2012-06-21 |
CN101165777A (zh) | 2008-04-23 |
EP1914725B1 (en) | 2012-01-11 |
HK1111800A1 (en) | 2008-08-15 |
KR100955627B1 (ko) | 2010-05-04 |
KR20080035454A (ko) | 2008-04-23 |
US20080097755A1 (en) | 2008-04-24 |
EP1914725A1 (en) | 2008-04-23 |
CN101165777B (zh) | 2011-07-20 |
JP2008102521A (ja) | 2008-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5468092B2 (ja) | 高速格子ベクトル量子化 | |
JP4742087B2 (ja) | オーディオ信号の2重変換符号化 | |
US5983172A (en) | Method for coding/decoding, coding/decoding device, and videoconferencing apparatus using such device | |
JP5788833B2 (ja) | オーディオ信号の符号化方法、オーディオ信号の復号化方法及び記録媒体 | |
JP4570250B2 (ja) | 信号の量子化変換係数をエントロピーエンコードするシステムと方法 | |
US5819215A (en) | Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data | |
US7689427B2 (en) | Methods and apparatus for implementing embedded scalable encoding and decoding of companded and vector quantized audio data | |
EP0884850A2 (en) | Scalable audio coding/decoding method and apparatus | |
JPWO2006049205A1 (ja) | スケーラブル復号化装置およびスケーラブル符号化装置 | |
JPH11186911A (ja) | ビット率の調節可能なオーディオ符号化/復号化方法及びその装置及びその方法を記録した記録媒体 | |
TW201724087A (zh) | 對信號的包絡進行寫碼的設備及對其進行解碼的設備 | |
US20120232909A1 (en) | Method and system for two-step spreading for tonal artifact avoidance in audio coding | |
JP4603485B2 (ja) | 音声・楽音符号化装置及び音声・楽音符号化方法 | |
JP2001343997A (ja) | デジタル音響信号符号化装置、方法及び記録媒体 | |
JP3344944B2 (ja) | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 | |
JP3353868B2 (ja) | 音響信号変換符号化方法および復号化方法 | |
JP2003140692A (ja) | 符号化装置及び復号化装置 | |
JPWO2009153995A1 (ja) | 量子化装置、符号化装置およびこれらの方法 | |
KR100528327B1 (ko) | 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치 | |
JP2004246038A (ja) | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム | |
Strahl et al. | A dynamic fine-grain scalable compression scheme with application to progressive audio coding | |
Strahl et al. | An adaptive tree-based progressive audio compression scheme | |
WO2011090434A1 (en) | Method and device for determining a number of bits for encoding an audio signal | |
Liu | The perceptual impact of different quantization schemes in G. 719 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130219 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130517 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130522 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140128 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |