JP4394578B2 - 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置 - Google Patents
可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置 Download PDFInfo
- Publication number
- JP4394578B2 JP4394578B2 JP2004562408A JP2004562408A JP4394578B2 JP 4394578 B2 JP4394578 B2 JP 4394578B2 JP 2004562408 A JP2004562408 A JP 2004562408A JP 2004562408 A JP2004562408 A JP 2004562408A JP 4394578 B2 JP4394578 B2 JP 4394578B2
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- vector
- stage
- quantization
- error vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 239000013598 vector Substances 0.000 title claims abstract description 423
- 238000000034 method Methods 0.000 title claims abstract description 101
- 238000013139 quantization Methods 0.000 title claims description 149
- 238000012545 processing Methods 0.000 claims abstract description 25
- 230000005236 sound signal Effects 0.000 claims abstract description 24
- 230000008569 process Effects 0.000 claims description 15
- 238000004891 communication Methods 0.000 claims description 7
- 238000000926 separation method Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims 1
- 238000004148 unit process Methods 0.000 claims 1
- 230000005284 excitation Effects 0.000 description 9
- 230000003044 adaptive effect Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000013213 extrapolation Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
無線システムなどのディジタル音声通信システムは、通話符号化器を使用して、音声の高品質を維持しつつ容量の増大を図る。通話符号化器は、通話信号をディジタルビットストリームに変換し、ディジタルビットストリームを通信チャネルに送信する、あるいは記憶媒体に蓄積する。通話信号はディジタル化される、即ちサンプルされ、サンプル当たり通常16ビットにより量子化される。通話符号化器は、主体とする通話の良好な品質を維持しつつ、より少ないビット数によりこれらディジタルサンプルを表現する役割を有する。通話デコーダあるいは合成器は、送信あるいは蓄積されたビットストリームを操作し、音声信号に逆変換する。
幾つかの通信システム、例えば符号分割多重アクセス(CDMA)技術を使用する無線システムでは、ソース制御可変ビットレート(VBR)通話符号化の使用によりシステム容量を大きく改善する。ソース制御VBR符号化では、符号化器は幾つかのビットレートで動作することが出来、レート選択モジュールを使用して、例えば音声、非音声、非定常、背景雑音などの通話フレームの性格に基づいた各通話フレームの符号化に使用するビットレーを決定する。目標は平均データレート(ADR)とも呼ばれる、所与の平均ビットレートにおいて最良の通話品質を達成することにある。符号化器はまた、レート選択モジュールを調節することにより異なる動作モードに従って動作することが出来、異なるモードに対して異なるADRsを達成する、この場合符号化器の性能は、ADRの増加と共に改善される。これは、符号化器に通話品質とシステム容量との間のトレードオフの機構を付与する。CDMAシステム、例えばCDMA−1およびCDMA2000では、代表的に4ビットレートが使用され、フルレート(FR)、半レート(HR)、4分の1レート(QR)、8分の1レート(ER)と呼ばれる。このCDMAシステムでは、2組のレートがサポートされ、レートセットI、レートセットIIと呼ばれる。レートセットIIでは、レート選択機構を持つ可変レート符号化器は、14.4、7.2、3.6および1.8kbit/s(誤り検出のために追加した幾らかのビットを含む)の実ビットレートに対応して13.3(FR)、6.2(HR)、2.7(QR)および1.0(ER)8kbit/sのソース符号化ビットレートで動作する。
により計算される。次に、予測誤差ベクトルenが量子化され(プロセッサ303)、例
を加算する(プロセッサ304)ことにより得られる。予測器P(プロセッサ302)の一般形は以下の通りである:
を与える。それ故、特に予測ファクタが大きい(式(4)および(5)にいてαが1に近い)場合、予測ベクトル量子化はチャネル誤りに対して強くない。
測器P(プロセッサ402)の次数である。式(8)を説明する予測器の実施例においては、第1次予測が使用され、その結果MA予測誤差はただ1フレームにのみ伝搬しうるに過ぎない。
分離され、第2段量子化器Q21、Q22、...、Q2Kによりそれぞれ量子化される。第2の例証的実施例では、入力ベクトルは2つのサブベクトルに分離され、次いで各サブベクトルは、第1の例証的実施例におけるように第2段における分離をさらに使用する2段VQにより量子化される。
サ508は2段ベクトル量子化器からなり、両段において分離VQが使用され、第1段のベクトル量子化テーブルは、MAおよびAR両予測に対して同じである。2段ベクトル量子化器508は、プロセッサ504、505、506、507、および509からなる。第1段量子化器Q1では、スケーリング予測誤差ベクトルe’が量子化され、第1段量
グ予測誤差ベクトルe’から除去され(プロセッサ505)、第2段予測誤差ベクトルe2を生成する。次いでこの第2段予測誤差ベクトルe2は、第2段ベクトル量子化器QMAあるいは第2段ベクトル量子化器QARのいずれかにより量子化され(プロセッサ506)、
選択は、フレーム分類情報に依存する(例えば以前に示したように、もしフレームが安定な音声ならAR、もしフレームが安定な音声でないならMA)。量子化スケーリング予測
再構成される(プロセッサ509)。最後に、プロセッサ503のスケーリングの逆のス
り、両段で分離VQが使用される。量子化器Q1および量子化器QMAまたは量子化器QARからの量子化指標i1およびi2は乗算され、通信チャネルを介して伝送される(プロセッサ507)。
説明したように、第2段量子化(プロセッサ602)はMAおよびAR予測に対する2組のテーブルからなることに注目されたい。次いで、2段からの量子化予測誤差ベクトルの
構成される。プロセッサ609において、逆スケーリングが適用され、量子化予測誤差ベ
ロセッサ503により実行されるスケーリングの逆に相当することに注目されたい。次い
平均LPパラメータのベクトルμが符号器側で除去された場合、ベクトルμはプロセッサ
化器側の場合のように、フレーム分類情報に依存して、予測ベクトルpはMA予測器605の出力あるいはAR予測器606の出力のいずれかである;この選択はフレーム分類情報に対応してプロセッサ607の論理に従ってなされる、ことに注意すべきである。より詳細には、もしフレームが安定な音声であれば、その場合予測ベクトルpはAR予測器606の出力に等しい。そうでない場合、予測ベクトルpはMA予測器605の出力に等しい。
・ 現通話フレームの性質に依存する、可変レート符号化器の符号化モードに依存して、AR/MA切り替え型の予測方式が使用される。
・ ARあるいはMA予測のいずれが適用されようとも、本質的に同じ第1段量子化器が使用され、これによりメモリの節減が得られる。非制限、例証的実施形態では、16次のLP予測が使用され、LPパラメータはISF領域で表現される。第1段のコード帳は、MA予測を使用して設計されたAMR−WB符号化器の12.65kbit/sモードにおいて使用されるコード帳と同じである(16次元LPパラメータベクトルは、次元7および9の2つのサブベクトルに分離され、量子化の第1段において256エントリを有する2つのコード帳が使用される)。
・ 安定モード、特に半レート音声モードでは、MA予測の代わりにAR予測が使用され、そうでない場合はMA予測が使用される。
・ AR予測の場合、量子化器の第1段はMA予測の場合と同じである。しかしながら、第2段は、AR予測に適切となるように設計され学習させることが出来る。
・ 予測器のモードにこの切り替えを考慮に入れるために、MAおよびARの両予測が次のフレームに使用されうることを想定して、MAおよびARの両予測器のメモリがフレーム毎に更新される。
・ さらに、符号化利得の最適化のために、MA予測に設計された第1段の幾つかのベクトルは、AR予測に設計された新ベクトルによって置き換えることが出来る。この非制限、例証的実施形態によれば、AR予測を使用する場合、28個のベクトルが第1段コード帳において置き換えられる。
・ この拡張第1段コード帳は以下のように形成することが出来る:まず、AR予測を適用する場合は余り使用されない28個の第1段ベクトルがテーブルの始めに配置され、次いで残りの256−28=228個の第1段ベクトルがテーブルに配置され、最後に28個の新しいベクトルがテーブルの末尾に置かれる。テーブル長は、従って256+28=284ベクトルである。MA予測を使用する場合、テーブルの 最初の256個のベクトルが第1段で使用される;AR予測を使用する場合、テーブルの最後の256個のベクトルが使用される。
・ AMR−WB標準との相互運用性を保証するために、この新コード帳における第1段ベクトルの位置とAMR−WB第1段コード帳における元の位置との間のマッピングを含むテーブルが使用される。
・ 安定な信号に関して使用する場合、AR予測はMA予測よりより少ない予測誤差エネルギーを達成するので、スケーリングファクタが予測誤差に適用される。非制限、例証的実施形態では、MA予測が使用される場合スケーリングファクタは1であり、AR予測が使用される場合は1/0.8である。これはAR予測誤差をMA予測誤差と等しいダイナミックレンジに拡大する。従って、第1段において、MAおよびARの両予測方式に対して同じ量子化器が使用されうる。
Claims (57)
- 可変ビットレートの音声信号の符号化における線形予測パラメータの量子化方法であって、
入力線形予測パラメータベクトルを受信する段階、
前記入力線形予測パラメータベクトルに対応する音声信号フレームを、安定な音声フレームか安定でない音声フレームかに分類する段階、
予測ベクトルを計算する段階、
前記入力線形予測パラメータベクトルから前記計算した予測ベクトルを除去し、予測誤差ベクトルを生成する段階、
前記予測誤差ベクトルをスケーリングする段階、
前記スケーリングした予測誤差ベクトルを量子化する段階、
を含み、
・ 前記予測ベクトルを計算する段階は、前記音声信号フレームの前記分類に関連する複数の予測方式の1つを選択する段階、および該選択した予測方式に従って該予測ベクトルを計算する段階を含み、
・ 前記予測誤差ベクトルをスケーリングする段階は、前記選択した予測方式に関連する複数のスケーリングファクタの少なくとも1つを選択する段階、および該選択したスケーリングファクタに従って該予測誤差ベクトルをスケーリングする段階を含む、量子化方法。 - 請求項1に記載の線形予測パラメータの量子化方法であって、前記予測誤差ベクトルを量子化する段階が、
前記選択した予測方式を使用し、少なくとも1つの量子化器によって前記予測誤差ベクトルを処理する段階、
を含む、量子化方法。 - 請求項1または2に記載の線形予測パラメータの量子化方法であって、
前記複数の予測方式が、移動平均予測および自己回帰予測を含む、
量子化方法。 - 請求項1から3のいずれかに記載の線形予測パラメータの量子化方法であって、さらに、
平均線形予測パラメータのベクトルを生成する段階、および
前記入力線形予測パラメータベクトルから前記平均線形予測パラメータのベクトルを除去し、平均除去線形予測パラメータベクトルを生成する段階、
を含む、量子化方法。 - 請求項1から4のいずれかに記載の線形予測パラメータの量子化方法であって、
前記音声信号フレームを分類する段階において、該音声信号フレームが安定な音声フレームであると分類した場合、前記複数の予測方式の1つを選択する段階が、自己回帰予測を選択することを含み、
前記予測ベクトルを計算する段階が、自己回帰予測によって前記予測誤差ベクトルを計算することを含み、
前記予測誤差ベクトルをスケーリングする段階が、前記スケーリングファクタを使用して、量子化に先立って該予測誤差ベクトルをスケーリングすることを含む、
量子化方法。 - 請求項1から5のいずれかに記載の線形予測パラメータの量子化方法であって、
前記音声信号フレームを分類する段階において、該音声信号フレームが安定でない音声フレームであると分類した場合、前記予測ベクトルを計算する段階が、移動平均予測によって前記予測誤差ベクトルを計算することを含む、
量子化方法。 - 請求項1から5に記載の線形予測パラメータの量子化方法であって、前記スケーリングファクタが1より大きい、量子化方法。
- 請求項1から6のいずれかに記載の線形予測パラメータの量子化方法であって、前記予測誤差ベクトルを量子化する段階が、
2段ベクトル量子化過程によって前記予測誤差ベクトルを処理する段階、
を含む、量子化方法。 - 請求項8に記載の線形予測パラメータの量子化方法であって、さらに前記ベクトル量子化過程の前記2段において分離ベクトル量子化を使用する段階を含む、量子化方法。
- 請求項3に記載の線形予測パラメータの量子化方法であって、
前記予測誤差ベクトルを量子化する段階が、第1および第2段を含む2段ベクトル量子化過程によって前記予測誤差ベクトルを処理する段階を含み、かつ
前記2段ベクトル量子化過程によって前記予測誤差ベクトルを処理することが、移動平均および自己回帰の両予測に対して同一である前記第1段のベクトル量子化テーブルに前記予測誤差ベクトルを適用することを含む、
量子化方法。 - 請求項8または9に記載の線形予測パラメータの量子化方法であって、前記予測誤差ベクトルを量子化する段階が、
前記2段ベクトル量子化過程の第1段において、前記予測誤差ベクトルを量子化し、第1段量子化予測誤差ベクトルを生成する段階、
前記予測誤差ベクトルから前記第1段量子化予測誤差ベクトルを除去し、第2段予測誤差ベクトルを生成する段階、
前記2段ベクトル量子化過程の前記第2段において、前記第2段予測誤差ベクトルを量子化し、第2段量子化予測誤差ベクトルを生成する段階、および
前記第1段および前記第2段量子化予測誤差ベクトルの和によって量子化した予測誤差ベクトルを生成する段階、
を含む、量子化方法。 - 請求項11に記載の線形予測パラメータの量子化方法であって、前記第2段予測誤差ベクトルを量子化する段階が、
前記音声信号フレームの前記分類に応じ、移動平均予測量子化器または自己回帰予測量子化器によって前記第2段予測誤差ベクトルを処理すること、
を含む、量子化方法。 - 請求項8,9,11のいずれかに記載の線形予測パラメータの量子化方法であって、前記予測誤差ベクトルを量子化する段階が、
前記2段ベクトル量子化過程の前記2段に対する量子化指標を生成する段階、
通信チャネルを介し前記量子化指標を伝送する段階、
を含む、量子化方法。 - 請求項8に記載の線形予測パラメータの量子化方法であって、
前記音声信号フレームを分類する段階において、前記音声信号フレームが安定な音声フレームであると分類した場合、前記予測ベクトルを計算する段階が、
(a)前記第1段および前記第2段量子化予測誤差ベクトルの和によって生成された前記量子化した予測誤差ベクトルと(b)前記計算した予測ベクトルとを加算し、量子化した入力ベクトルを生成する段階、および
自己回帰予測によって前記量子化した入力ベクトルを生成する段階、
を含む、量子化方法。 - 請求項2に記載の線形予測パラメータの量子化方法であって、
・ 前記複数の予測方式が、移動平均予測および自己回帰予測を含み、
・ 前記予測誤差ベクトルを量子化する段階が、
第1段コード帳を含む2段ベクトル量子化器によって前記予測誤差ベクトルを処理する段階を含み、前記第1段コード帳自体が、連続して、
移動平均予測を適用するときに使用でき、テーブルの始めに配置された第1グループのベクトル、
移動平均および自己回帰予測のいずれかを適用するときに使用でき、前記テーブルの前記第1グループのベクトルと第3グループのベクトルとの中間に配置された第2グループのベクトル、
自己回帰予測を適用するときに使用でき、前記テーブルの末尾に配置された前記第3グループのベクトル、
を含み、
・ 前記選択した予測方式を使用して少なくとも1つの量子化器によって前記予測誤差ベクトルを処理する段階が、
前記選択した予測方式が移動平均予測であるとき、前記テーブルの前記第1および第2グループのベクトルによって前記予測誤差ベクトルを処理する段階、および
前記選択した予測方式が自己回帰予測であるとき、前記第2および前記第3グループのベクトルによって前記予測誤差ベクトルを処理する段階、
を含む、量子化方法。 - 請求項15に記載の線形予測パラメータの量子化方法であって、AMR−WB標準との相互運用性を保証するために、前記第1段コード帳の前記テーブルにおける第1段ベクトルの位置と前記AMR−WB第1段コード帳における前記第1段ベクトルの元の位置との間のマッピングがマッピングテーブルにより行われる、量子化方法。
- 請求項1−6,8,14のいずれかに記載の線形予測パラメータの量子化方法であって、
前記音声信号フレームを分類する段階において、該音声信号フレームは安定な音声フレームであると分類した場合、前記音声信号フレームの前記分類に関連する複数の予測方式の1つを選択する段階が、自己回帰予測を選択する段階を含み、前記選択した予測方式に従って前記予測ベクトルを計算する段階が、自己回帰予測によって前記予測誤差ベクトルを計算する段階を含み、前記選択した予測方式に関連する複数のスケーリングファクタの少なくとも1つを選択する段階が、1より大きいスケーリングファクタを選択する段階を含み、前記選択したスケーリングファクタに従って前記予測誤差ベクトルをスケーリングする段階が、1より大きい前記スケーリングファクタを使用する量子化に先立って前記予測誤差ベクトルをスケーリングする段階を含み、
前記音声信号フレームを分類する段階において、該音声信号フレームは安定でない音声フレームであると分類した場合、前記音声信号フレームの前記分類に関連する複数の予測方式の1つを選択する段階が、移動平均予測を選択する段階を含み、前記選択した予測方式に従って前記予測ベクトルを計算する段階が、移動平均予測によって前記予測誤差ベクトルを計算する段階を含み、前記選択した予測方式に関連する複数のスケーリングファクタの少なくとも1つを選択する段階が、1に等しいスケーリングファクタを選択する段階を含み、前記選択したスケーリングファクタに従って前記予測誤差ベクトルをスケーリングする段階が、1に等しいスケーリングファクタを使用する量子化に先立って前記予測誤差ベクトルをスケーリングする段階を含む、
量子化方法。 - 可変ビットレートの音声信号のデコーディングにおける線形予測パラメータの量子化解除方法であって、
少なくとも1つの量子化指標を受信する段階、
前記少なくとも1つの量子化指標に対応する音声信号フレームの分類に関する情報であって、該音声信号フレームが安定な音声フレームであるか安定でない音声フレームであるかを示す情報を受信する段階、
少なくとも1つの量子化テーブルに前記少なくとも1つの指標を適用することによって予測誤差ベクトルを回復する段階、
予測ベクトルを再構成する段階、
前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに対応する線形予測パラメータベクトルを生成する段階、
を含み、前記予測ベクトルを再構成する段階が、前記フレーム分類情報に応じ、複数の予測方式の1つによって前記回復した予測誤差ベクトルを処理する段階を含む、量子化解除方法。 - 請求項18に記載の線形予測パラメータの量子化解除方法であって、前記予測誤差ベクトルを回復する段階が、
前記1つの予測方式を使用し、少なくとも1つの量子化テーブルに前記少なくとも1つの指標および前記分類情報を適用する段階、
を含む、量子化解除方法。 - 請求項18または19に記載の線形予測パラメータの量子化解除方法であって、
前記少なくとも1つの量子化指標を受信する段階が、第1段量子化指標および第2段量子化指標を受信する段階を含み、
前記少なくとも1つの量子化テーブルに前記少なくとも1つの指標を適用する段階が、第1段量子化テーブルに前記第1段量子化指標を適用し、第1段予測誤差ベクトルを生成する段階、および第2段量子化テーブルに前記第2段量子化指標を適用し、第2段予測誤差ベクトルを生成する段階を含む、
量子化解除方法。 - 請求項20に記載の線形予測パラメータの量子化解除方法であって、
前記複数の予測方式が、移動平均予測および自己回帰予測を含み、
前記第2段量子化テーブルが、移動平均予測テーブルおよび自己回帰予測テーブルを含み、
前記方法が、さらに前記第2段量子化テーブルに前記音声信号フレームの分類を適用し、前記受信したフレームの分類情報に応じ、前記移動平均予測テーブルまたは前記自己回帰予測テーブルによって前記第2段量子化指標を処理する段階を含む、
量子化解除方法。 - 請求項20又は21に記載の線形予測パラメータの量子化解除方法であって、前記予測誤差ベクトルを回復する段階が、
前記第1段予測誤差ベクトルと前記第2段予測誤差ベクトルとを加え、前記回復した予測誤差ベクトルを生成する段階、
を含む、量子化解除方法。 - 請求項22に記載の線形予測パラメータの量子化解除方法であって、さらに、
前記回復したフレーム分類情報の関数として、前記回復した予測ベクトルへ逆スケーリング演算を実行する段階、
を含む、量子化解除方法。 - 請求項18から23のいずれかに記載の線形予測パラメータの量子化解除方法であって、前記線形予測パラメータベクトルを生成する段階が、
前記回復した予測誤差ベクトルと前記再構成した予測ベクトルとを加算し、前記線形予測パラメータベクトルを生成する段階、
を含む、量子化解除方法。 - 請求項24に記載の線形予測パラメータの量子化解除方法であって、さらに、前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに平均線形予測パラメータのベクトルを加算し、前記線形予測パラメータベクトルを生成する段階を含む、量子化解除方法。
- 請求項18から20のいずれかに記載の線形予測パラメータの量子化解除方法であって、
前記複数の予測方式が、移動平均予測および自己回帰予測を含み、
前記予測ベクトルを再構成する段階が、フレーム分類情報に応じ、前記回復した予測誤差ベクトルを移動平均予測によって処理するかまたは前記生成したパラメータベクトルを自己回帰予測によって処理する段階を含む、量子化解除方法。 - 請求項26に記載の線形予測パラメータの量子化解除方法であって、前記予測ベクトルを再構成する段階が、
前記音声信号フレームが安定な音声であることを前記フレーム分類情報が示すとき、前記生成したパラメータベクトルを自己回帰予測によって処理する段階、および
前記音声信号フレームが安定な音声でないことをフレーム分類情報が示すとき、前記回復した予測誤差ベクトルを移動平均予測によって処理する段階、
を含む、量子化解除方法。 - 可変ビットレートの音声信号の符号化における線形予測パラメータの量子化装置であって、
入力線形予測パラメータベクトルを受信する手段、
前記入力線形予測パラメータベクトルに対応する音声信号フレームが安定な音声フレームであるか否かを判断する手段、
予測ベクトルを計算する手段、
前記入力線形予測パラメータベクトルから前記計算した予測ベクトルを除去し、予測誤差ベクトルを生成する手段、
前記予測誤差ベクトルをスケーリングする手段、
前記スケーリングした予測誤差ベクトルを量子化する手段、
を含み、
・ 予測ベクトルを計算する前記手段が、前記音声信号フレームの前記分類に関連する複数の予測方式の1つを選択する手段、および該選択した予測方式に従って前記予測ベクトルを計算する手段を含み、
・ 前記予測誤差ベクトルをスケーリングする手段が、前記選択した予測方式に関連する複数のスケーリングファクタの少なくとも1つを選択する手段、および前記選択したスケーリングファクタに従って前記予測誤差ベクトルをスケーリングする手段を含む、
量子化装置。 - 可変ビットレートの音声信号の符号化における線形予測パラメータの量子化装置であって、
入力線形予測パラメータベクトルを受信する入力部、
前記入力線形予測パラメータベクトルに対応する音声信号フレームの分類器であって、該音声信号フレームが安定な音声フレームか安定でない音声フレームかを判断しうる分類器、
予測ベクトルの計算機、
前記入力線形予測パラメータベクトルから前記計算した予測ベクトルを除去し、予測誤差ベクトルを生成する減算器、
前記予測誤差ベクトルの供給を受け、前記予測誤差ベクトルをスケーリングするスケーリングユニット、および
前記スケーリングした予測誤差ベクトルの量子化器、
を含み、
・ 前記予測ベクトル計算機が、前記音声信号フレームの前記分類に関連する複数の予測方式から1つを選択する選択器を含み、前記選択した予測方式に従って前記予測ベクトルの計算を行い、
・ 前記スケーリングユニットが、前記選択した予測方式に関連する複数のスケーリングファクタから少なくとも1つを選択する選択器を含み、前記選択したスケーリングファクタに従って前記予測誤差ベクトルのスケーリングを行う、
量子化装置。 - 請求項29に記載の線形予測パラメータの量子化装置であって、
前記量子化器が、前記予前記測誤差ベクトルの供給を受け、前記選択した予測方式によって前記予測誤差ベクトルを処理する、
量子化装置。 - 請求項29または30に記載の線形予測パラメータの量子化装置であって、
前記複数の予測方式が、移動平均予測および自己回帰予測を含む、
量子化装置。 - 請求項29から31のいずれかに記載の線形予測パラメータの量子化装置であって、
平均線形予測パラメータをベクトル生成する手段、および
前記入力線形予測パラメータベクトルから平均線形予測パラメータの前記ベクトルを除去し、平均除去入力線形予測パラメータベクトルを生成する減算器、
を含む、量子化装置。 - 請求項29から32のいずれかに記載の線形予測パラメータの量子化装置であって、前記音声信号フレームが安定な音声フレームであると前記分類器が判定するとき、前記予測ベクトル計算機が、
前記予測誤差ベクトルに自己回帰予測を適用する自己回帰予測器、
を含む、量子化装置。 - 請求項29から33のいずれかに記載の線形予測パラメータの量子化装置であって、前記音声信号フレームが安定な音声フレームでないと前記分類器が判定するとき、
前記予測ベクトル計算機が、前記予測誤差ベクトルに移動平均予測を適用する移動平均予測器を含む、
量子化装置。 - 請求項29から33に記載の線形予測パラメータの量子化装置であって、前記スケーリングユニットが、
前記予測誤差ベクトルに1より大きいスケーリングファクタを適用する乗算器、
を含む、量子化装置。 - 請求項29から35のいずれかに記載の線形予測パラメータの量子化装置であって、前記量子化器が、2段ベクトル量子化器を含む、量子化装置。
- 請求項36に記載の線形予測パラメータの量子化装置であって、前記2段ベクトル量子化器が、分離ベクトル量子化を使用する前記2段を含む、量子化装置。
- 請求項31から37のいずれかに記載の線形予測パラメータの量子化装置であって、
前記量子化器が、第1段および第2段を含む2段ベクトル量子化器を含み、
前記2段ベクトル量子化器が、移動平均および自己回帰の両予測に対して同一である第1段量子化テーブルを含む、
量子化装置。 - 請求項36又は37に記載の線形予測パラメータの量子化装置であって、前記2段ベクトル量子化器が、
前記予測誤差ベクトルの供給を受け、前記予測誤差ベクトルを量子化し、第1段量子化予測誤差ベクトルを生成する第1段ベクトル量子化器、
前記予測誤差ベクトルから前記第1段量子化予測誤差ベクトルを除去し、第2段予測誤差ベクトルを生成する減算器、
前記第2段予測誤差ベクトルの供給を受け、前記第2段予測誤差ベクトルを量子化し、第2段量子化予測誤差ベクトルを生成する第2段ベクトル量子化器、および
第1段および第2段量子化予測誤差ベクトルの和によって量子化した予測誤差ベクトルを生成する加算器、
を含む、量子化装置。 - 請求項39に記載の線形予測パラメータの量子化装置であって、前記2段ベクトル量子化器が、
移動平均予測を使用して前記第2段予測誤差ベクトルを量子化する移動平均第2段ベクトル量子化器、および
自己回帰予測を使用して前記第2段予測誤差ベクトルを量子化する自己回帰第2段ベクトル量子化器、
を含む、量子化装置。 - 請求項36,37,39のいずれかに記載の線形予測パラメータの量子化装置であって、前記2段ベクトル量子化器が、
第1段量子化指標を生成する第1段ベクトル量子化器、
第2段量子化指標を生成する第2段ベクトル量子化器、および
通信チャネルを介し、前記第1段および前記第2段量子化指標を送信する送信機、
を含む、量子化装置。 - 請求項39に記載の線形予測パラメータの量子化装置であって、前記音声信号フレームが安定な音声フレームであると前記分類器が判定するとき、前記予測ベクトル計算機が、
(a)前記第1段および前記第2段量子化予測誤差ベクトルの和によって生成された前記量子化した予測誤差ベクトルと(b)前記計算した予測ベクトルとを加え、量子化入力ベクトルを生成する加算器、および
前記量子化した入力ベクトルを処理する自己回帰予測器、
を含む、量子化装置。 - 請求項30に記載の線形予測パラメータの量子化装置であって、
・ 前記複数の予想方式が、移動平均予測および自己回帰予測を含み、
・ 前記量子化器が、
第1段コード帳を含む2段ベクトル量子化器を含み、第1段コード帳自体が、連続して、
移動平均予測を適用するときに使用でき、テーブルの前記始めに配置された第1グループのベクトル、
移動平均および自己回帰予測のいずれかを適用するときに使用でき、前記テーブルの前記第1グループのベクトルと第3グループのベクトルとの中間に配置された第2グループのベクトル、
自己回帰予測を適用するときに使用でき、前記テーブルの前記末尾に配置された前記第3グループのベクトル、
を含み、
・ 前記予測誤差ベクトル処理手段が、
前記選択した予測方式が移動平均予測であるとき、前記テーブルの前記第1および第2グループのベクトルによって前記予測誤差ベクトルを処理する手段、および
前記選択した予測方式が自己回帰予測であるとき、前記第2および前記第3グループのベクトルによって前記予測誤差ベクトルを処理する手段、
を含む、量子化装置。 - 請求項43に記載の線形予測パラメータの量子化装置であって、さらに、前記AMR−WB標準との相互運用性を保証するために、前記第1段コード帳の前記テーブルにおける第1段ベクトルの前記位置とAMR−WB第1段コード帳における第1段ベクトルの元の位置との間のマッピングを確立するマッピングテーブルを含む、量子化装置。
- 請求項31または38に記載の線形予測パラメータの量子化装置であって、
前記予測ベクトル計算機が、前記予測誤差ベクトルに自己回帰予測を適用する自己回帰予測器および前記予測誤差ベクトルに移動平均予測を適用する移動平均予測器を含み、
前記自己回帰予測あるいは移動平均予測のいずれかが、次のフレームにおいて使用されうることを想定して、前記自己回帰予測器および移動平均予測器が、音声信号のフレーム毎に更新されるメモリをそれぞれ含む、
量子化装置。 - 可変ビットレートの音声信号のデコーディングにおける線形予測パラメータの量子化解除装置であって、
少なくとも1つの量子化指標を受信する手段、
前記少なくとも1つの量子化指標に対応する音声信号フレームの分類に関する情報であって、該音声信号フレームが安定な音声フレームであるか安定でない音声フレームであるかを示す情報を受信する手段、
少なくとも1つの量子化テーブルに前記少なくとも1つの指標を適用することによって予測誤差ベクトルを回復する手段、
予測ベクトルを再構成する手段、
前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに対応する線形予測パラメータベクトルを生成する手段、
を含み、
前記予測ベクトルを再構成する手段が、前記フレーム分類情報に応じ、複数の予測方式の1つによって前記回復した予測誤差ベクトルを処理する手段を含む、
量子化解除装置。 - 可変ビットレートの音声信号のデコーディングにおける線形予測パラメータの量子化解除装置であって、
少なくとも1つの量子化指標を受信する手段、
前記少なくとも1つの量子化指標に対応する音声信号フレームの分類に関する情報であって、該音声信号フレームが安定な音声フレームであるか安定でない音声フレームであるかを示す情報を受信する手段、
前記少なくとも1つの量子化指標の供給を受け、予測誤差ベクトルを回復する少なくとも1つの量子化テーブル、
予測ベクトルを再構成するユニット、
前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに対応する線形予測パラメータベクトルの生成器、
を含み、
前記予測ベクトル再構成ユニットは、回復した予測誤差ベクトルの供給を受けて、前記フレーム分類情報に応じ、複数の予測方式の1つによって前記回復した予測誤差ベクトルを処理する少なくとも1つの予測器を含む、
量子化解除装置。 - 請求項47に記載の線形予測パラメータの量子化解除装置であって、前記少なくとも1つの量子化テーブルが、
前記1つの予測方式を使用し、前記少なくとも1つの指標および前記分類情報の両者の供給を受ける量子化テーブル、
を含む、量子化解除装置。 - 請求項47または48に記載の線形予測パラメータの量子化解除装置であって、
前記量子化指標受信手段が、第1段量子化指標および第2段量子化指標を受信する2つの入力を含み、
前記少なくとも1つの量子化テーブルが、第1段予測誤差ベクトルを生成するために、前記第1段量子化指標の供給を受ける第1段量子化テーブルを含み、第2段予測誤差ベクトルを生成するために、前記第2段量子化指標の供給を受ける第2段量子化テーブルを含む、
量子化解除装置。 - 請求項49に記載の線形予測パラメータの量子化解除装置であって、
前記複数の予測方式が、移動平均予測および自己回帰予測を含み、
前記第2段量子化テーブルが、移動平均予測テーブルおよび自己回帰予測テーブルを含み、
前記装置が、さらに前記第2段量子化テーブルに前記音声信号フレームの分類を適用し、前記受信したフレームの分類情報に応じ、前記移動平均予測テーブルまたは前記自己回帰予測テーブルによって前記第2段量子化指標を処理する手段を含む、
量子化解除装置。 - 請求項49又は50に記載の線形予測パラメータの量子化解除装置であって、さらに
前記第1段予測誤差ベクトルと前記第2段予測誤差ベクトルを加え、前記回復した予測誤差ベクトルを生成する加算器、
を含む、量子化解除装置。 - 請求項51に記載の線形予測パラメータの量子化解除装置であって、さらに、
前記受信したフレームの分類情報の関数として、前記再構成した予測ベクトルに対し逆スケーリング演算を実行する手段、
を含む、量子化解除装置。 - 請求項47から52のいずれかに記載の線形予測パラメータの量子化解除装置であって、前記線形予測パラメータベクトルの生成器が、
前記回復した予測誤差ベクトルと前記再構成した予測ベクトルとを加算して、前記線形予測パラメータベクトルを生成する加算器、
を含む、量子化解除装置。 - 請求項53に記載の線形予測パラメータの量子化解除装置であって、さらに、前記回復した予測誤差ベクトルおよび前記再構成した予測ベクトルに平均線形予測パラメータのベクトルを加算し、前記線形予測パラメータベクトルを生成する手段を含む、量子化解除装置。
- 請求項47から49のいずれかに記載の線形予測パラメータの量子化解除装置であって、
前記複数の予測方式が、移動平均予測および自己回帰予測を含み、
前記予測ベクトル再構成ユニットが、前記フレーム分類情報に応じ、移動平均予測によって前記回復した予測誤差ベクトルを処理するか、または自己回帰予測によって前記生成したパラメータベクトルを処理する移動平均予測器および自己回帰予測器を含む、
量子化解除装置。 - 請求項55に記載の線形予測パラメータの量子化解除装置であって、前記予測ベクトル再構成ユニットが、
前記音声信号フレームが安定な音声であることを前記フレーム分類情報が示すとき、前記自己回帰予測器によって前記生成したパラメータベクトルを処理する手段、および
前記音声信号フレームが安定な音声でないことを前記フレーム分類情報が示すとき、前記移動平均予測器によって前記回復した予測誤差ベクトルを処理する手段、
を含む、量子化解除装置。 - 請求項55又は56に記載の線形予測パラメータの量子化解除装置であって、
前記少なくとも1つの予測器が、前記予測誤差ベクトルに自己回帰予測を適用する自己回帰予測器および前記予測誤差ベクトルに移動平均予測を適用する移動平均予測器を含み、
移動平均あるいは自己回帰予測のいずれかが次のフレームにおいて使用されうることを想定して、前記自己回帰予測器および移動平均予測器が、音声信号のフレーム毎に更新されるメモリをそれぞれ含む、
量子化解除装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CA002415105A CA2415105A1 (en) | 2002-12-24 | 2002-12-24 | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
PCT/CA2003/001985 WO2004059618A1 (en) | 2002-12-24 | 2003-12-18 | Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006510947A JP2006510947A (ja) | 2006-03-30 |
JP2006510947A5 JP2006510947A5 (ja) | 2009-03-26 |
JP4394578B2 true JP4394578B2 (ja) | 2010-01-06 |
Family
ID=32514130
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004562408A Expired - Lifetime JP4394578B2 (ja) | 2002-12-24 | 2003-12-18 | 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置 |
Country Status (16)
Country | Link |
---|---|
US (2) | US7149683B2 (ja) |
EP (1) | EP1576585B1 (ja) |
JP (1) | JP4394578B2 (ja) |
KR (1) | KR100712056B1 (ja) |
CN (1) | CN100576319C (ja) |
AT (1) | ATE410771T1 (ja) |
AU (1) | AU2003294528A1 (ja) |
BR (2) | BR0317652A (ja) |
CA (1) | CA2415105A1 (ja) |
DE (1) | DE60324025D1 (ja) |
HK (1) | HK1082587A1 (ja) |
MX (1) | MXPA05006664A (ja) |
MY (1) | MY141174A (ja) |
RU (1) | RU2326450C2 (ja) |
UA (1) | UA83207C2 (ja) |
WO (1) | WO2004059618A1 (ja) |
Families Citing this family (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2415105A1 (en) * | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
AU2006232364B2 (en) | 2005-04-01 | 2010-11-25 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband speech coding |
TWI317933B (en) * | 2005-04-22 | 2009-12-01 | Qualcomm Inc | Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same |
US9071344B2 (en) * | 2005-08-22 | 2015-06-30 | Qualcomm Incorporated | Reverse link interference cancellation |
US8630602B2 (en) * | 2005-08-22 | 2014-01-14 | Qualcomm Incorporated | Pilot interference cancellation |
US8594252B2 (en) * | 2005-08-22 | 2013-11-26 | Qualcomm Incorporated | Interference cancellation for wireless communications |
US8611305B2 (en) | 2005-08-22 | 2013-12-17 | Qualcomm Incorporated | Interference cancellation for wireless communications |
US8743909B2 (en) * | 2008-02-20 | 2014-06-03 | Qualcomm Incorporated | Frame termination |
US9014152B2 (en) * | 2008-06-09 | 2015-04-21 | Qualcomm Incorporated | Increasing capacity in wireless communications |
US7587314B2 (en) * | 2005-08-29 | 2009-09-08 | Nokia Corporation | Single-codebook vector quantization for multiple-rate applications |
KR100717401B1 (ko) * | 2006-03-02 | 2007-05-11 | 삼성전자주식회사 | 역방향 누적 히스토그램을 이용한 음성 특징 벡터의 정규화방법 및 그 장치 |
GB2436191B (en) * | 2006-03-14 | 2008-06-25 | Motorola Inc | Communication Unit, Intergrated Circuit And Method Therefor |
WO2007114290A1 (ja) * | 2006-03-31 | 2007-10-11 | Matsushita Electric Industrial Co., Ltd. | ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法 |
KR100900438B1 (ko) * | 2006-04-25 | 2009-06-01 | 삼성전자주식회사 | 음성 패킷 복구 장치 및 방법 |
WO2008022181A2 (en) * | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Updating of decoder states after packet loss concealment |
ES2533626T3 (es) | 2007-03-02 | 2015-04-13 | Telefonaktiebolaget L M Ericsson (Publ) | Métodos y adaptaciones en una red de telecomunicaciones |
US20080249783A1 (en) * | 2007-04-05 | 2008-10-09 | Texas Instruments Incorporated | Layered Code-Excited Linear Prediction Speech Encoder and Decoder Having Plural Codebook Contributions in Enhancement Layers Thereof and Methods of Layered CELP Encoding and Decoding |
JP5300733B2 (ja) * | 2007-10-12 | 2013-09-25 | パナソニック株式会社 | ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法 |
CN101335004B (zh) * | 2007-11-02 | 2010-04-21 | 华为技术有限公司 | 一种多级量化的方法及装置 |
US9277487B2 (en) | 2008-08-01 | 2016-03-01 | Qualcomm Incorporated | Cell detection with interference cancellation |
US9237515B2 (en) * | 2008-08-01 | 2016-01-12 | Qualcomm Incorporated | Successive detection and cancellation for cell pilot detection |
JP5188913B2 (ja) * | 2008-09-26 | 2013-04-24 | 株式会社エヌ・ティ・ティ・ドコモ | 量子化装置、量子化方法、逆量子化装置、逆量子化方法、音声音響符号化装置および音声音響復号装置 |
US20100097955A1 (en) * | 2008-10-16 | 2010-04-22 | Qualcomm Incorporated | Rate determination |
GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466671B (en) * | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
GB2466675B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466674B (en) | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
RU2519027C2 (ru) * | 2009-02-13 | 2014-06-10 | Панасоник Корпорэйшн | Устройство векторного квантования, устройство векторного обратного квантования и способы для этого |
US9160577B2 (en) | 2009-04-30 | 2015-10-13 | Qualcomm Incorporated | Hybrid SAIC receiver |
US8787509B2 (en) * | 2009-06-04 | 2014-07-22 | Qualcomm Incorporated | Iterative interference cancellation receiver |
KR20110001130A (ko) * | 2009-06-29 | 2011-01-06 | 삼성전자주식회사 | 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법 |
US8831149B2 (en) * | 2009-09-03 | 2014-09-09 | Qualcomm Incorporated | Symbol estimation methods and apparatuses |
US8452606B2 (en) | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
JP2013512593A (ja) | 2009-11-27 | 2013-04-11 | クゥアルコム・インコーポレイテッド | 無線通信における容量の増加 |
US9509452B2 (en) | 2009-11-27 | 2016-11-29 | Qualcomm Incorporated | Increasing capacity in wireless communications |
CN105374362B (zh) * | 2010-01-08 | 2019-05-10 | 日本电信电话株式会社 | 编码方法、解码方法、编码装置、解码装置以及记录介质 |
DE102010010736A1 (de) * | 2010-03-09 | 2011-09-15 | Arnold & Richter Cine Technik Gmbh & Co. Betriebs Kg | Verfahren zur Kompression von Bilddaten |
EP2372704A1 (en) * | 2010-03-11 | 2011-10-05 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Signal processor and method for processing a signal |
GB2486663A (en) * | 2010-12-21 | 2012-06-27 | Sony Comp Entertainment Europe | Audio data generation using parametric description of features of sounds |
TWI672691B (zh) | 2011-04-21 | 2019-09-21 | 南韓商三星電子股份有限公司 | 解碼方法 |
MX2013012301A (es) * | 2011-04-21 | 2013-12-06 | Samsung Electronics Co Ltd | Aparato para cuantificar coeficientes de codificacion predictiva lineal, aparato de codificacion de sonido, aparato para decuantificar coeficientes de codificacion predictiva lineal, aparato de decodificacion de sonido y dispositivo electronico para los mismos. |
JPWO2013061584A1 (ja) * | 2011-10-28 | 2015-04-02 | パナソニック株式会社 | 音信号ハイブリッドデコーダ、音信号ハイブリッドエンコーダ、音信号復号方法、及び音信号符号化方法 |
EP2831757B1 (en) | 2012-03-29 | 2019-06-19 | Telefonaktiebolaget LM Ericsson (publ) | Vector quantizer |
CN103928031B (zh) * | 2013-01-15 | 2016-03-30 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
CN104112451B (zh) * | 2013-04-18 | 2017-07-28 | 华为技术有限公司 | 一种选择编码模式的方法及装置 |
CN104282308B (zh) | 2013-07-04 | 2017-07-14 | 华为技术有限公司 | 频域包络的矢量量化方法和装置 |
EP3637620A1 (en) * | 2013-11-07 | 2020-04-15 | Telefonaktiebolaget LM Ericsson (publ) | Methods and devices for vector segmentation for coding |
EP2916319A1 (en) | 2014-03-07 | 2015-09-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for encoding of information |
EP3398191B1 (en) * | 2016-01-03 | 2021-04-28 | Auro Technologies Nv | A signal encoder, decoder and methods using predictor models |
CN105811995A (zh) * | 2016-03-04 | 2016-07-27 | 广东工业大学 | 一种减少量化噪声的方法 |
US10002086B1 (en) * | 2016-12-20 | 2018-06-19 | Sandisk Technologies Llc | Multi-channel memory operations based on bit error rates |
US11343301B2 (en) * | 2017-11-30 | 2022-05-24 | Goto Group, Inc. | Managing jitter buffer length for improved audio quality |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0286231A (ja) * | 1988-09-21 | 1990-03-27 | Matsushita Electric Ind Co Ltd | 音声予測符号化装置 |
JP3254696B2 (ja) * | 1991-09-25 | 2002-02-12 | 三菱電機株式会社 | 音声符号化装置、音声復号化装置および音源生成方法 |
US5614996A (en) * | 1994-03-03 | 1997-03-25 | Kyocera Corporation | Toner storage unit, residual toner collect unit, toner container with these units and image forming apparatus with such toner container |
JPH10505718A (ja) * | 1994-08-18 | 1998-06-02 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | オーディオ品質の解析 |
JPH0863198A (ja) * | 1994-08-22 | 1996-03-08 | Nec Corp | ベクトル量子化器 |
KR100322706B1 (ko) * | 1995-09-25 | 2002-06-20 | 윤종용 | 선형예측부호화계수의부호화및복호화방법 |
US5774839A (en) * | 1995-09-29 | 1998-06-30 | Rockwell International Corporation | Delayed decision switched prediction multi-stage LSF vector quantization |
JP2891193B2 (ja) * | 1996-08-16 | 1999-05-17 | 日本電気株式会社 | 広帯域音声スペクトル係数量子化装置 |
JP3067676B2 (ja) * | 1997-02-13 | 2000-07-17 | 日本電気株式会社 | Lspの予測符号化装置及び方法 |
US6064954A (en) * | 1997-04-03 | 2000-05-16 | International Business Machines Corp. | Digital audio signal coding |
TW408298B (en) * | 1997-08-28 | 2000-10-11 | Texas Instruments Inc | Improved method for switched-predictive quantization |
WO1999010719A1 (en) * | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
FI973873A (fi) * | 1997-10-02 | 1999-04-03 | Nokia Mobile Phones Ltd | Puhekoodaus |
KR100938017B1 (ko) * | 1997-10-22 | 2010-01-21 | 파나소닉 주식회사 | 벡터 양자화 장치 및 방법 |
EP0920204B1 (en) * | 1997-11-24 | 2006-02-15 | STMicroelectronics S.r.l. | MPEG-2 decoder with reduced RAM requisite by recompression using adaptive tree search vector quantization |
US6141640A (en) * | 1998-02-20 | 2000-10-31 | General Electric Company | Multistage positive product vector quantization for line spectral frequencies in low rate speech coding |
US6260010B1 (en) * | 1998-08-24 | 2001-07-10 | Conexant Systems, Inc. | Speech encoder using gain normalization that combines open and closed loop gains |
US6104992A (en) * | 1998-08-24 | 2000-08-15 | Conexant Systems, Inc. | Adaptive gain reduction to produce fixed codebook target signal |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
JP3578933B2 (ja) * | 1999-02-17 | 2004-10-20 | 日本電信電話株式会社 | 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体 |
JP2000305597A (ja) * | 1999-03-12 | 2000-11-02 | Texas Instr Inc <Ti> | 音声圧縮のコード化 |
US6691092B1 (en) * | 1999-04-05 | 2004-02-10 | Hughes Electronics Corporation | Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system |
US7423983B1 (en) * | 1999-09-20 | 2008-09-09 | Broadcom Corporation | Voice and data exchange over a packet based network |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US6505222B1 (en) * | 1999-10-29 | 2003-01-07 | International Business Machines Corporation | Systems methods and computer program products for controlling undesirable bias in an equalizer |
KR100324204B1 (ko) * | 1999-12-24 | 2002-02-16 | 오길록 | 예측분할벡터양자화 및 예측분할행렬양자화 방식에 의한선스펙트럼쌍 양자화기의 고속탐색방법 |
US7010482B2 (en) * | 2000-03-17 | 2006-03-07 | The Regents Of The University Of California | REW parametric vector quantization and dual-predictive SEW vector quantization for waveform interpolative coding |
US6785805B1 (en) * | 2000-08-08 | 2004-08-31 | Vi Technology, Inc. | Network-based configuration method for systems integration in test, measurement, and automation environments |
JP3916934B2 (ja) * | 2000-11-27 | 2007-05-23 | 日本電信電話株式会社 | 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置 |
KR100910282B1 (ko) * | 2000-11-30 | 2009-08-03 | 파나소닉 주식회사 | Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, 기록 매체, 음성 부호화 장치, 음성 복호화장치, 음성 신호 송신 장치, 및 음성 신호 수신 장치 |
KR20020075592A (ko) * | 2001-03-26 | 2002-10-05 | 한국전자통신연구원 | 광대역 음성 부호화기용 lsf 양자화기 |
US7042841B2 (en) * | 2001-07-16 | 2006-05-09 | International Business Machines Corporation | Controlling network congestion using a biased packet discard policy for congestion control and encoded session packets: methods, systems, and program products |
US7406411B2 (en) * | 2001-08-17 | 2008-07-29 | Broadcom Corporation | Bit error concealment methods for speech coding |
CA2415105A1 (en) * | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
-
2002
- 2002-12-24 CA CA002415105A patent/CA2415105A1/en not_active Abandoned
-
2003
- 2003-12-18 BR BR0317652-5A patent/BR0317652A/pt active IP Right Grant
- 2003-12-18 RU RU2005123381/09A patent/RU2326450C2/ru active
- 2003-12-18 WO PCT/CA2003/001985 patent/WO2004059618A1/en active Application Filing
- 2003-12-18 EP EP03785421A patent/EP1576585B1/en not_active Expired - Lifetime
- 2003-12-18 DE DE60324025T patent/DE60324025D1/de not_active Expired - Lifetime
- 2003-12-18 AU AU2003294528A patent/AU2003294528A1/en not_active Abandoned
- 2003-12-18 BR BRPI0317652-5A patent/BRPI0317652B1/pt unknown
- 2003-12-18 MX MXPA05006664A patent/MXPA05006664A/es active IP Right Grant
- 2003-12-18 UA UAA200505920A patent/UA83207C2/ru unknown
- 2003-12-18 CN CN200380107465A patent/CN100576319C/zh not_active Expired - Lifetime
- 2003-12-18 KR KR1020057011861A patent/KR100712056B1/ko active IP Right Grant
- 2003-12-18 JP JP2004562408A patent/JP4394578B2/ja not_active Expired - Lifetime
- 2003-12-18 AT AT03785421T patent/ATE410771T1/de active
- 2003-12-23 MY MYPI20034968A patent/MY141174A/en unknown
-
2005
- 2005-01-19 US US11/039,659 patent/US7149683B2/en not_active Expired - Lifetime
-
2006
- 2006-03-18 HK HK06103461.8A patent/HK1082587A1/xx not_active IP Right Cessation
- 2006-11-22 US US11/604,188 patent/US7502734B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
RU2005123381A (ru) | 2006-01-20 |
EP1576585B1 (en) | 2008-10-08 |
EP1576585A1 (en) | 2005-09-21 |
AU2003294528A1 (en) | 2004-07-22 |
KR20050089071A (ko) | 2005-09-07 |
WO2004059618A1 (en) | 2004-07-15 |
US20070112564A1 (en) | 2007-05-17 |
MY141174A (en) | 2010-03-31 |
ATE410771T1 (de) | 2008-10-15 |
CN100576319C (zh) | 2009-12-30 |
JP2006510947A (ja) | 2006-03-30 |
KR100712056B1 (ko) | 2007-05-02 |
DE60324025D1 (de) | 2008-11-20 |
BRPI0317652B1 (pt) | 2018-05-22 |
UA83207C2 (ru) | 2008-06-25 |
CN1739142A (zh) | 2006-02-22 |
MXPA05006664A (es) | 2005-08-16 |
US7502734B2 (en) | 2009-03-10 |
HK1082587A1 (en) | 2006-06-09 |
US20050261897A1 (en) | 2005-11-24 |
CA2415105A1 (en) | 2004-06-24 |
RU2326450C2 (ru) | 2008-06-10 |
BR0317652A (pt) | 2005-12-06 |
US7149683B2 (en) | 2006-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4394578B2 (ja) | 可変ビットレート通話符号化における線形予測パラメータの強力な予測ベクトル量子化方法と装置 | |
US6134518A (en) | Digital audio signal coding using a CELP coder and a transform coder | |
RU2696292C2 (ru) | Аудиокодер и декодер | |
JP4731775B2 (ja) | スーパーフレーム構造のlpcハーモニックボコーダ | |
KR101246991B1 (ko) | 오디오 신호 처리 방법 | |
JP4390803B2 (ja) | 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置 | |
RU2389085C2 (ru) | Способы и устройства для введения низкочастотных предыскажений в ходе сжатия звука на основе acelp/tcx | |
EP0981816B1 (en) | Audio coding systems and methods | |
EP2255358B1 (en) | Scalable speech and audio encoding using combinatorial encoding of mdct spectrum | |
KR101604774B1 (ko) | 멀티-레퍼런스 lpc 필터 양자화 및 역 양자화 장치 및 방법 | |
CN101180676B (zh) | 用于谱包络表示的向量量化的方法和设备 | |
KR101698905B1 (ko) | 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법 | |
JP4879748B2 (ja) | 最適化された複合的符号化方法 | |
CA2578610A1 (en) | Voice encoding device, voice decoding device, and methods therefor | |
JP2010020346A (ja) | 音声信号および音楽信号を符号化する方法 | |
JP2004517348A (ja) | 非音声のスピーチの高性能の低ビット速度コード化方法および装置 | |
US20040111257A1 (en) | Transcoding apparatus and method between CELP-based codecs using bandwidth extension | |
US8078457B2 (en) | Method for adapting for an interoperability between short-term correlation models of digital signals | |
US6611797B1 (en) | Speech coding/decoding method and apparatus | |
JPH0341500A (ja) | 低遅延低ビツトレート音声コーダ | |
KR20230129581A (ko) | 음성 정보를 갖는 개선된 프레임 손실 보정 | |
CA2511516C (en) | Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding | |
KR100463577B1 (ko) | 음성 부호화기용 선스펙트럼주파수 벡터 양자화 장치 | |
Leis | Spectral coding methods for speech compression and speaker identification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090129 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20090129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090625 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090903 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091009 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091015 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4394578 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121023 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131023 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |