JP2001519551A - 音声符号化 - Google Patents
音声符号化Info
- Publication number
- JP2001519551A JP2001519551A JP2000515270A JP2000515270A JP2001519551A JP 2001519551 A JP2001519551 A JP 2001519551A JP 2000515270 A JP2000515270 A JP 2000515270A JP 2000515270 A JP2000515270 A JP 2000515270A JP 2001519551 A JP2001519551 A JP 2001519551A
- Authority
- JP
- Japan
- Prior art keywords
- coefficients
- lpc
- lpc coefficients
- current frame
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 238000000034 method Methods 0.000 claims abstract description 39
- 230000005236 sound signal Effects 0.000 claims abstract description 15
- 230000003595 spectral effect Effects 0.000 claims abstract description 4
- 238000013139 quantization Methods 0.000 claims description 13
- 230000001413 cellular effect Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 239000013067 intermediate product Substances 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims description 2
- 239000013598 vector Substances 0.000 description 20
- 230000005540 biological transmission Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000015654 memory Effects 0.000 description 6
- 238000012937 correction Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 101710196810 Non-specific lipid-transfer protein 2 Proteins 0.000 description 1
- 101100219325 Phaseolus vulgaris BA13 gene Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
に関する。本発明は特に符号励振線形予測(CELP)音声符号器(必ずしもこ
れに限られるものではないが) に適用することができる。
の音声信号の伝送に必要とされるビットレートの最小化である。ビットレートを
最小化することにより、所定のチャネル帯域幅に対して、1つの伝送チャネルに
より搬送可能な通信数は増加する。したがって、すべてのデジタルセルラー電話
の認知された規格では、いくつかの種類の音声コーデック(speech codec)が指
定され、音声データをある程度まで圧縮するようになっている。特に、これらの
音声コーデックは、音声信号の符号化の際に存在する冗長な情報の除去に依存し
ている。
(移動通信用広域システム) という頭字語で知られている。GSMにはCELP
音声符号器(技術仕様GSM06.60)の仕様が含まれる。CELP符号器の
構造を示す非常に一般的な例を図1 に示す。サンプル化された音声信号は160
個のサンプル・ポイント(j=0〜159)からなる20msのフレームに分割
され、ベクトルx(j)によって定義される。これらのフレームはまず線形予測
符号器(LPC)1にかけられ順次符号化される。この線形予測符号器(LPC)1
によって各フレームx(j)について1セットのLPC係数a(i)(i=0〜
n)が生成される。これらのLPC係数はフレーム中の短時間冗長性(short te
rm redundancy)を表す。GSMではnは10と定義されている。
音声フレームからLPC分析フィルタを用いて短時間冗長性を除去することによ
り生成される残差信号r(j)とを有する。次いで、この残差信号は長時間予測
手段(LTP)2へ出力される。この長時間予測手段(LTP)2によって、残
差信号中の長時間冗長性(long term redundancy)を表す1セットのLTPパラ
メータbが生成される。実際には、長時間予測は2段階の処理からなり、LTP
係数についての第1の開ループ推定と推定されたパラメータについての第2のリ
ファインメント(refinement)閉ループが含まれる。
て、スケーリング・ユニット(scaling unit)4を介して、これらの励振コード
の各々がLTP合成フィルタ5に対して順次出力される。このフィルタ5によっ
て、LTP2からLTPパラメータが受信され、LTPパラメータによって予測
された長時間冗長性がコードの中へ導入される。次にこの結果生じるフレームは
LPC合成フィルタ6へ出力され、このLPC合成フィルタ6によってLPC係
数が受信され、予測された短時間冗長性がコードの中へ導入される。この予測フ
レームxpred(j)は比較器7で実際のフレームx(j)と比較され、フレーム
について誤差信号e(j)が生成される。重み付けフィルタ8による処理後、最
小誤差信号を生成するコードc(j)がコードブック検索装置9によって選択さ
れる。選択されたコードを特定するベクトルu(j)が伝送チャネル10を介し
て受信機へ伝送される。LPC係数とLTPパラメータも伝送されるが、伝送に
先行してこれらのLPC係数とLTPパラメータ自身も符号化され伝送ビットレ
ートが更に最少化される。
係数は以下に与えられる2つの多項式の根である。 P(z)=A(z)+z-(n+1)A(z-1) Q(z)=A(z)−z-(n+1)A(z-1)
量子化される。この量子化にはLSP係数の予め決められた平均集合の利用及び
現在のフレームLSP係数からのこの平均集合の減算を伴う。先行フレームのL
SP係数にそれぞれの(以前に決定された) 予測係数を掛けて1セットの予測L
SP係数が与えられる。次に、予測されたLSP係数から平均除去LSP係数を
減じることにより1セットの残差LSP係数が得られる。これらのLSP係数は
、LPC係数と比較するとフレーム毎にほとんど変らない傾向があり、この結果
生じる残差係数のセットは次に続く量子化に役立つものとなる(「24ビット/
フレームにおけるLPCパラメータの効率的ベクトル量子化」、Kuldip K.P. 及
びBishnu S.A. 社、IEEE Trans. 音声及びオーディオ処理、Vol.1 、No.1、1993
年1月) 。
決定される。しかし、すべての与えられたフレームについて、符号化の精確さと
圧縮比間のトレードオフであるLPC係数の最適個数が存在する。既に言及した
ように、現在のGSM規格ではLPCのオーダはn=10に固定されている。こ
の値(n=10)はすべての予想される音声フレームを十分な精確さで符号化す
るのに十分な大きさの個数である。これによってLPCが単純化され計算上の要
件が少なくなるものの、その一方で、多くのフレームの‘オーバーコーディング
(over coding) ’が結果として生じる。この固定レートによって指定された係数
より小さいLPC係数を用いてこれらのフレームを符号化することも可能である
。
化するような可変レートのLPCが提案される。可変レートのLPCはCDMA
ネットワーク、提案されているGSMフェーズ2規格及び将来の第3世代規格(
UTMS)に理想的に適合するものである。これらのネットワークでは、パケッ
ト(あるいはバースト) によるデータ転送を行うために‘パケット交換’伝送の
利用あるいはこの‘パケット交換’の利用を提案している。これは、一続きの固
定長時間フレームが通話時間の間所定のチャネル用として予約される「回線交換
」伝送を利用する現行のGSM 規格と対比されるものである。
にいくつかの技術的問題が解決されなければならない。特に、以下に説明する本
発明の発明者が認識したように、可変レートのLPCは上述のLSP係数量子化
スキームと互換性を有するものではない。すなわち、LSP係数の個数がフレー
ム毎に変わるとき、予測量子化LSP係数信号を直接生成することは不可能であ
る。更に、フレーム間にLPC(あるいはLSP)係数を補間してフレーム境界
間の遷移を滑らかにすることは不可能である。
提供される。この方法は音声信号を連続するフレーム(sequential frames)に分
割し、現在の各フレームについて、 線形フィルタの係数に対応し且つ現在のフレーム中の短時間冗長性を表す第1
のセットの線形予測分析(LPC)係数を生成し、 現在のフレームの前記第1のセットのLPC係数の個数が先行フレームの第1
のセットの個数と異なる場合、先行フレームについて生成された第1のセットの
LPC係数から拡大又は収縮した第2のセットのLPC係数を生成し、前記第2
のセットは、現在のフレームの前記第1のセットのLPC係数の個数に等しいL
PC係数が含まれ、 現在のフレームの前記第1のセットのLPC係数と、先行フレームの前記第2
のセットのLPC係数とを用いて現在のフレームを符号化する。
される、可変ビットレート無線電話ネットワークに対して適用可能である。また
本発明は、一定数のビットが種々のパラメータ間で動的に割り振られる固定ビッ
トレート・ネットワークなどに適用可能である。
化された音声信号と処理されサンプル化された音声信号が含まれる。後者のクラ
スの信号には、フィルタ、増幅等された音声信号が含まれる。サンプル化された
音声信号が分割される連続したフレームは隣接していたりオーバーラップしてい
たりしてもよい。
定されるわけではない) に対して特に適用可能である。この場合現在のフレーム
は直前の先行フレームに基づいて符号化される。
inson-Durbin algorithm) があり、このアルゴリズムによって反射係数が中間成
果物として生成される。このアルゴリズムを用いる実施形態では、ゼロ値の反射
係数を追加するか、又は既に計算された反射係数を除去するかのいずれかを行い
、修正されたセットの反射係数を用いてLPCの再計算を行うことにより、第2
の拡大又は収縮されたセットのLPC係数が生成される。
LPC係数と、先行フレームの第2のセットのLPC係数とを、それぞれのセッ
トの変換係数に変換することが望ましい。好ましくは、前記変換係数はライン・
スペクトル周波数(LSP)係数であり、周知の方法で変換が行われることが望
ましい。或いは、変換係数を逆サイン係数、イミッタンス・スペクトル対(immi
ttance spectral pairs)(ISP)あるいはログ・エリア(log-area)比にしても
よい。
関連した現在のフレームの第1のセットのLPC係数を符号化して、符号化され
た残差信号を提供することが望ましい。 前記符号化された残差信号は、前記2つのセットの変換係数間の残差を評価す
ることにより得ることができる。次いでこの差をベクトル量子化などにより符号
化してもよい。前記差の評価に先行して、1セットの平均されたすなわち平均変
換係数値を減じることなどにより、一方または双方のセットの変換係数を修正す
ることができる。
測分析(LPC)係数を含むサンプル化された音声信号を復号化する方法が提供
される。この方法は、現在の各フレームについて、 符号化された信号を復号化し、現在のフレームについて符号化されたLPC係
数の個数を決定し、 先行フレームについて得られた1セットのLPC係数中のLPC係数の個数が
現在のフレームについて符号化されたLPC係数の個数と異なる場合、前記セッ
トの先行フレームのLPC係数を拡大又は収縮させて第2のセットのLPC係数
を提供し、 先行フレームの前記第2のセットのLPC係数を現在のフレームのLPC係数
データと合成して、現在のフレームについて少なくとも1つのセットのLPC係
数を提供する。
号化された信号は復号化され残差信号が復元される。次いで、この残差信号は第
2のセットの先行フレームのLPC係数と合成して、現在のフレームのためのL
PC係数が与えられる。
いて得られた第2のセットのLPC係数とを合成して、各フレームのサブフレー
ムについて複数セットのLPC係数を提供することができる。好ましくは、これ
らのセットの係数が補間によって合成されることが望ましい。LSP係数または
反射係数を用いて補間を行ってもよい。この合成されたLPC係数は上記の補間
された係数から続いて導き出される。
の方法を実行するために構成され及びプログラムされたコンピュータ手段が提供
される。1つの実施形態ではコンピュータ手段が移動電話のような移動通信装置
中に提供される。別の実施形態では、コンピュータ手段はセルラー電話ネットワ
ークのインフラ・ストラクチャの一部を形成する。例えば、そのようなインフラ
・ストラクチャの基地局にコンピュータ手段を提供することができる。
面の参照を行う。
(d2 )の期待値を微分することにより、さらに、その結果生じる微分方程式が
ゼロのときa(i)について解を求めることにより最適セットの予測係数を決定
することができる。すなわち:
きる。
ダービン・アプローチ(Kondoz A. M. 、「デジタル音声(低ビットレート通信シ
ステム用符号化) 」(John Wiley & Sons社、ニューヨーク、1994年参照))を用い
てこの行列式を解くことができる。α(i)=−a(i)で、n=3の場合の例
を考えると、式(4)は以下のように書き直すことができる。
反復時に、推定値をα(2)=α2 (2)とし、α(1)=α2 (2)の推定値
を更新する。同様に、第2回の反復によって推定値α3 (3)及び更新推定値α 3 (1)とα3 (2)とが与えられる。n+1より少ないLPC係数を所望の場
合には、中間レベルで反復を中断することができることが理解できる。
いるような格子構造の中に図2の分析フィルタが設けられているとき、この反射
係数kp は図2の分析フィルタの利得である。また各レベルの反復で予測誤差d p が与えられる。この誤差は、レベルの増加として、またLPC係数の個数の減
少として見られ、この誤差を用いて所定のフレームに対して符号化されたLPC
係数の個数が決定される。一般に、nの最大値は10であるが、モデルオーダ(
model order)を増加させることにより達成される予測誤差の減少が非常に小さく
なり、必要とされるLPC係数の個数の増加がオフセットされるとき、この反復
は中断される。いくつかのモデルオーダの選択基準が知られているが、この基準
にはアカイケ(Akaike)情報基準(AIC)とリサネンの最小記述長(Rissanen's
Minimum Description Length)(MDL)選択基準とが含まれる。「ARオーダ
選択方法に関する比較研究する」(Dickie 、J.R. & Nandi、A.K.、信号処理40、
1994、pp.239-255) を参照されたい。
LSP係数に変換され、さらに効率的な量子化が行われる。前のフレームが3つ
のLSP係数しか生成しなかったのに対して、現在のサンプル化された音声フレ
ームが6つのLPC係数(従って5つのLSP係数) を生成する例について考察
してみる。この不適合に起因して、量子化を行うために1セットのLSP残差を
直接生成することは不可能である。この問題は、前のフレームk1、k2、k3
について生成された3つの反射係数へ戻って、更なる2つの反射係数k4、k5
=0を定義することにより解決される。上述の反復処理ステップ(6)〜(13
)(ステップ(12)でステップ(6)へジャンプする) を実行することにより
、先行フレームに対して新しい1セットの6つのLPC係数が新しい1セットの
反射係数用として生成される。初期値として、n=5、p=1、α0 (0)=1
、d0 =r0 が与えられる。この新しい1セットの(6つの)LPC係数が、対
応するセットのLSP係数へ変換される。次いで、1セットの符号化された残差
が、伝送に先行して上記に概説したように計算される。
生成された係数の個数を超える場合、1セットのLSP残差の計算を行う前に、
前の係数の個数を減らす必要がある。これは、先行フレームについて生成された
高次の反射係数を適切な数だけ取り去り(例えば、2つの余分なLPC係数が先
行フレーム中に存在する場合、2つの最も高いオーダの反射係数を除去する) 、
LPC係数の再計算を行うことによりなされる。ここで注意すべきことは、前の
パラグラフで説明した拡大処理とは対照的に、この収縮によって、元の音声信号
の微細構造(fine structure)の損失という結果が生じるという点である。しか
し、LPC符号化処理全体によって達成される利点と比較するとこの欠点は無視
できるものである。
たLPCの一部を示すブロック図である。
号を受信する復号器においても類似の処理を実行しなければならないことが理解
できる。特に、単一の(現在の) フレームに対応する符号化されたデータが受信
され、そのフレームの残差係数の個数が、先行フレームについて受信された個数
と異なるとき、前のフレームについて復号器で決定されたLPC係数は処理され
、以下のような1セットの反射係数が与えられる: (1) αp (i)=−a(i)、1≦i≦p (2) for i=p to 1 (3) k(i)=−α(i) (4) for j=1 to i−1 (5) αi-1 (j)=(αi (j)+k(i)αi (i−j))/( 1−k(i)2 ) (6) j=j+1 (6) i=i−1
とにより拡大され、あるいは、1つまたはそれ以上の既存の係数を除去すること
により収縮される。次いで、この修正されたセットは元の1セットのLPC係数
に変換され、今度はこの元の1セットのLPC係数が1セットのLSP係数に変
換される。現在のフレームのLSP係数は上述の予測量子化処理の逆を実行する
ことにより決定される。
精確さを更に改善することができるが、好ましくはすべての利用可能なモデルオ
ーダについて前に説明したモデルオーダ変換を利用することが望ましい。これら
の変換されたモデルを用いて、各モデルオーダの予測器を並列に駆動することが
でき、現在のフレームのモデルオーダに対応する予測器を利用することができる
。図5に例示する実施形態を用いてこの概念について説明する。
表すメモリブロック500、504、508が図示されている。現在のLSP(
M)ベクトルのモデルオーダによれば、モデルオーダMに対応するメモリ500
中の残差ベクトルが現在のベクトルの予測501に適用される。前記予測された
LSPベクトルと現在のフレームベクトルとを用いて予測残差が減算器502に
より導き出され、公知の方法による量子化ブロック503で量子化される。しか
し、量子化されたLSPベクトルを利用してこのモデルオーダの予測器が更新さ
れ、また複数の予測器が他のモデルオーダのために予約される。この実施形態で
は、すべての更なる利用可能なモデルオーダN、Pの予測器がブロック507、
511で更新される。モデルオーダN、Pに対応する予測されたベクトルは、既
に説明したようにブロック505と509で計算され、決定されたLSPベクト
ル、LSPQ(N)、LSPQ(P)を用いて、ブロック506と510で予測
残差の計算が行われる。次いでこれらの決定された残差RESQ(N)とRES
Q(P)は予測器メモリ502、508に記憶される。このようにして、現在の
フレームLSPの異なるモデルオーダ(及び当然のことであるがLPC)ベクト
ルについて、対応するモデルオーダを持つ予測器が利用可能である。
量子化された残差RESQ(M)と、メモリ600から得られる同じオーダMの
予測ベクトルと、予測ブロック601とを用いてブロック602で現在のLSP
ベクトルが計算される。モデルオーダMに対応する入力残差ベクトルRESQ(
M)がメモリ600に記憶され、復号化されたLSPベクトルLSPQ(M)が
すでに説明した方法でブロック606と610で修正され、異なるモデルオーダ
の復号化されたLSPベクトルが生成される。各予測ブロック604、608で
、対応するモデルオーダ予測ベクトルが決定され、予測残差RESQ(N)とR
ESQ(P)が対応するメモリ603、607の中に記憶される。
において一般に用いられることが理解できる。例えば、これらの符号器と復号器
とをローカル・エリア・ネットワーク、広域ネットワークあるいは電話ネットワ
ークと接続可能なマルチメディア・コンピュータで用いてもよい。本発明を具現
化する符号器と復号器はハードウェア、ソフトウェアあるいはこの双方を組み合
わせて実現することができる。
すブロック図である。
Claims (20)
- 【請求項1】 サンプル化された音声信号を符号化する方法において、音声
信号を連続するフレームに分割し、現在の各フレームについて、 線形フィルタの係数に対応し且つ現在のフレーム中の短時間冗長性を表す第1
のセットの線形予測分析(LPC) 係数を生成し、 現在のフレームの前記第1のセットのLPC係数の個数が先行フレームの第1
のセットの個数と異なる場合、先行フレームについて生成された第1のセットの
LPC係数から拡大又は収縮された第2のセットのLPC係数を生成し、前記第
2のセットは現在のフレームの前記第1のセットのLPC係数の個数に等しいL
PC係数が含まれ、 現在のフレームの前記第1のセットのLPC係数と先行フレームの前記第2の
セットのLPC係数とを用いて現在のフレームを符号化することを特徴とする方
法。 - 【請求項2】 先行フレームについて生成された前記第1のセットのLPC
係数から、少なくとも1つのセットの拡大又は収縮されたLPC係数が生成され
る請求項1に記載の方法。 - 【請求項3】 先行フレームについて生成された前記第1のセットのLPC
係数から1セット又は複数セットの拡大又は収縮されたLPC係数が、利用可能
な個数のLPCパラメータに対応して生成される請求項2に記載の方法。 - 【請求項4】 【外1】
- 【請求項5】 前記LPC係数に近似する再帰処理を用いて行列式の近似解
を得るステップを有する請求項4に記載の方法。 - 【請求項6】 中間成果物として反射係数が生成されるレビンソン−ダービ
ン・アルゴリズムを用いて前記行列式の解を求める請求項5に記載の方法。 - 【請求項7】 ゼロ値の反射係数を加えるか、又は既に計算された反射係数
を除去するかのいずれかを行い、さらに前記修正されたセットの反射係数を用い
て前記LPC係数の再計算を行うことにより前記第2の拡大又は収縮されたセッ
トのLPC係数が生成される請求項6に記載の方法。 - 【請求項8】 前記符号化並びに量子化を行うステップが、現在のフレーム
の第1のセットのLPC係数と、先行フレームの第2のセットのLPC係数とを
、それぞれのセットの変換係数に変換する請求項1〜7のいずれか一項に記載の
方法。 - 【請求項9】 前記変換係数はライン・スペクトル周波数(LSP)係数で
ある請求項8に記載の方法。 - 【請求項10】 前記符号化を行うステップが、先行フレームの第2のセッ
トのLPC係数と関連した現在のフレームの第1のセットのLPC係数を符号化
して、符号化された残差信号を提供する請求項1〜9のいずれか一項に記載の方
法。 - 【請求項11】 前記符号化並びに量子化を行うステップが、さらに前記2
つのセットの変換係数の間の差を評価することにより前記符号化された残差信号
を生成する請求項8に従属する場合の請求項10に記載の方法。 - 【請求項12】 信号の各フレームについて符号化された線形予測分析(L
PC) 係数を含むサンプル化された音声信号を復号化する方法において、現在の
各フレームについて、 符号化された信号を復号化し、現在のフレームについて符号化されたLPC係
数の個数を決定し、 先行フレームについて得られた1セットのLPC係数中のLPC係数の個数が
現在のフレームについて符号化されたLPC係数の個数と異なる場合、先行フレ
ームの前記セットのLPC係数を拡大又は収縮させて第2のセットのLPC係数
を提供し、 先行フレームの前記第2のセットのLPC係数を現在のフレームのLPC係数
データと合成して、現在のフレームについて少なくとも1つのセットのLPC係
数を提供することを特徴とする方法。 - 【請求項13】 少なくとも1つの先行フレームのセットの拡大又は収縮さ
れたLPC係数が生成されることを特徴とする請求項12に記載の方法。 - 【請求項14】 先行フレームの1つのセット又は複数のセットの拡大又は
収縮されたLPC係数が、各々の利用可能なLPCモデルオーダに対応して生成
される請求項13に記載の方法。 - 【請求項15】 前記符号化された信号の中には1セットの符号化された残
差信号が含まれ、さらに前記方法は、前記符号化された信号を復号化して、前記
残差信号を復元し、前記残差信号を前記先行フレームの第2のセットのLPC係
数と合成して、現在のフレームのためのLPC係数を提供する請求項12に記載
の方法。 - 【請求項16】 現在のフレームについて得られた1セットのLPC係数と
、先行フレームについて得られた第2のセットのLPC係数とを合成して、各フ
レームのサブフレームについて複数セットのLPC係数を提供する請求項12〜
15のいずれか一項に記載の方法。 - 【請求項17】 前記セットの係数が、補間によって、又は、LSP係数又
は反射係数を補間することにより合成される請求項16に記載の方法。 - 【請求項18】 請求項1〜17のいずれか一項に記載の方法を実行するよ
うに構成及びプログラムされたコンピュータ手段。 - 【請求項19】 請求項18に記載のコンピュータ手段を有するセルラー電
話ネットワークにおける基地局。 - 【請求項20】 請求項18に記載のコンピュータ手段を有する移動電話器
。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI973873 | 1997-10-02 | ||
FI973873A FI973873A (fi) | 1997-10-02 | 1997-10-02 | Puhekoodaus |
PCT/FI1998/000715 WO1999018565A2 (en) | 1997-10-02 | 1998-09-14 | Speech coding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001519551A true JP2001519551A (ja) | 2001-10-23 |
JP2001519551A5 JP2001519551A5 (ja) | 2006-01-05 |
Family
ID=8549657
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000515270A Ceased JP2001519551A (ja) | 1997-10-02 | 1998-09-14 | 音声符号化 |
Country Status (7)
Country | Link |
---|---|
US (1) | US6202045B1 (ja) |
EP (1) | EP1019907B1 (ja) |
JP (1) | JP2001519551A (ja) |
AU (1) | AU9164998A (ja) |
DE (1) | DE69804121T2 (ja) |
FI (1) | FI973873A (ja) |
WO (1) | WO1999018565A2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130086012A (ko) * | 2012-01-20 | 2013-07-30 | 한국전자통신연구원 | 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
JP2022505888A (ja) * | 2018-10-29 | 2022-01-14 | ドルビー・インターナショナル・アーベー | 生成モデルを用いたレート品質スケーラブル符号化のための方法及び装置 |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI116992B (fi) * | 1999-07-05 | 2006-04-28 | Nokia Corp | Menetelmät, järjestelmä ja laitteet audiosignaalin koodauksen ja siirron tehostamiseksi |
EP1959435B1 (en) * | 1999-08-23 | 2009-12-23 | Panasonic Corporation | Speech encoder |
US7315815B1 (en) * | 1999-09-22 | 2008-01-01 | Microsoft Corporation | LPC-harmonic vocoder with superframe structure |
US7110947B2 (en) * | 1999-12-10 | 2006-09-19 | At&T Corp. | Frame erasure concealment technique for a bitstream-based feature extractor |
US6606591B1 (en) * | 2000-04-13 | 2003-08-12 | Conexant Systems, Inc. | Speech coding employing hybrid linear prediction coding |
KR20020070373A (ko) * | 2000-11-03 | 2002-09-06 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 신호들의 사인 곡선 모델 기초 코딩 |
WO2004008437A2 (en) * | 2002-07-16 | 2004-01-22 | Koninklijke Philips Electronics N.V. | Audio coding |
US8090577B2 (en) * | 2002-08-08 | 2012-01-03 | Qualcomm Incorported | Bandwidth-adaptive quantization |
CA2415105A1 (en) * | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
US7386445B2 (en) * | 2005-01-18 | 2008-06-10 | Nokia Corporation | Compensation of transient effects in transform coding |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US7831420B2 (en) * | 2006-04-04 | 2010-11-09 | Qualcomm Incorporated | Voice modifier for speech processing systems |
CN101770777B (zh) * | 2008-12-31 | 2012-04-25 | 华为技术有限公司 | 一种线性预测编码频带扩展方法、装置和编解码系统 |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466674B (en) | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466671B (en) | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
GB2466675B (en) | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
US8447619B2 (en) * | 2009-10-22 | 2013-05-21 | Broadcom Corporation | User attribute distribution for network/peer assisted speech coding |
US9613630B2 (en) * | 2009-11-12 | 2017-04-04 | Lg Electronics Inc. | Apparatus for processing a signal and method thereof for determining an LPC coding degree based on reduction of a value of LPC residual |
KR101804922B1 (ko) * | 2010-03-23 | 2017-12-05 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4969192A (en) | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
US4890327A (en) * | 1987-06-03 | 1989-12-26 | Itt Corporation | Multi-rate digital voice coder apparatus |
US5243686A (en) * | 1988-12-09 | 1993-09-07 | Oki Electric Industry Co., Ltd. | Multi-stage linear predictive analysis method for feature extraction from acoustic signals |
CA2010830C (en) | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
US5630011A (en) * | 1990-12-05 | 1997-05-13 | Digital Voice Systems, Inc. | Quantization of harmonic amplitudes representing speech |
FI95085C (fi) | 1992-05-11 | 1995-12-11 | Nokia Mobile Phones Ltd | Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi |
FI91345C (fi) | 1992-06-24 | 1994-06-10 | Nokia Mobile Phones Ltd | Menetelmä kanavanvaihdon tehostamiseksi |
FI96248C (fi) | 1993-05-06 | 1996-05-27 | Nokia Mobile Phones Ltd | Menetelmä pitkän aikavälin synteesisuodattimen toteuttamiseksi sekä synteesisuodatin puhekoodereihin |
FI98163C (fi) | 1994-02-08 | 1997-04-25 | Nokia Mobile Phones Ltd | Koodausjärjestelmä parametriseen puheenkoodaukseen |
JP3235703B2 (ja) * | 1995-03-10 | 2001-12-04 | 日本電信電話株式会社 | ディジタルフィルタのフィルタ係数決定方法 |
US5890110A (en) * | 1995-03-27 | 1999-03-30 | The Regents Of The University Of California | Variable dimension vector quantization |
US5754733A (en) * | 1995-08-01 | 1998-05-19 | Qualcomm Incorporated | Method and apparatus for generating and encoding line spectral square roots |
FR2742568B1 (fr) * | 1995-12-15 | 1998-02-13 | Catherine Quinquis | Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application |
FI964975A (fi) * | 1996-12-12 | 1998-06-13 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen koodaamiseksi |
-
1997
- 1997-10-02 FI FI973873A patent/FI973873A/fi not_active Application Discontinuation
-
1998
- 1998-09-14 JP JP2000515270A patent/JP2001519551A/ja not_active Ceased
- 1998-09-14 EP EP98943923A patent/EP1019907B1/en not_active Expired - Lifetime
- 1998-09-14 AU AU91649/98A patent/AU9164998A/en not_active Abandoned
- 1998-09-14 WO PCT/FI1998/000715 patent/WO1999018565A2/en active IP Right Grant
- 1998-09-14 DE DE69804121T patent/DE69804121T2/de not_active Expired - Lifetime
- 1998-09-30 US US09/163,845 patent/US6202045B1/en not_active Expired - Lifetime
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101971077B1 (ko) * | 2012-01-20 | 2019-04-22 | 한국전자통신연구원 | 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
KR20140092287A (ko) * | 2012-01-20 | 2014-07-23 | 한국전자통신연구원 | 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
US10306228B2 (en) | 2012-01-20 | 2019-05-28 | Electronics And Telecommunications Research Institute | Method for encoding and decoding quantized matrix and apparatus using same |
KR101998390B1 (ko) * | 2012-01-20 | 2019-07-09 | 한국전자통신연구원 | 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
KR101527442B1 (ko) * | 2012-01-20 | 2015-06-11 | 한국전자통신연구원 | 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
KR101627085B1 (ko) | 2012-01-20 | 2016-06-03 | 한국전자통신연구원 | 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
US9866839B2 (en) | 2012-01-20 | 2018-01-09 | Electronics And Telecommunications Research Institute | Method for encoding and decoding quantized matrix and apparatus using same |
KR20180078212A (ko) * | 2012-01-20 | 2018-07-09 | 한국전자통신연구원 | 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
KR20180078213A (ko) * | 2012-01-20 | 2018-07-09 | 한국전자통신연구원 | 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
KR20180079274A (ko) * | 2012-01-20 | 2018-07-10 | 한국전자통신연구원 | 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
KR101875206B1 (ko) * | 2012-01-20 | 2018-08-02 | 한국전자통신연구원 | 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
CN104170382B (zh) * | 2012-01-20 | 2018-08-03 | 韩国电子通信研究院 | 用于编码和解码量化矩阵的方法和使用其的设备 |
US11778189B2 (en) | 2012-01-20 | 2023-10-03 | Electronics And Telecommunications Research Institute | Method for encoding and decoding quantized matrix and apparatus using same |
KR20140092288A (ko) * | 2012-01-20 | 2014-07-23 | 한국전자통신연구원 | 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
CN104170382A (zh) * | 2012-01-20 | 2014-11-26 | 韩国电子通信研究院 | 用于编码和解码量化矩阵的方法和使用其的设备 |
KR102020838B1 (ko) * | 2012-01-20 | 2019-09-11 | 한국전자통신연구원 | 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
KR102115318B1 (ko) | 2012-01-20 | 2020-05-26 | 한국전자통신연구원 | 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
KR20200057693A (ko) * | 2012-01-20 | 2020-05-26 | 한국전자통신연구원 | 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
US10708595B2 (en) | 2012-01-20 | 2020-07-07 | Electronics And Telecommunications Research Institute | Method for encoding and decoding quantized matrix and apparatus using same |
KR102313195B1 (ko) | 2012-01-20 | 2021-10-15 | 한국전자통신연구원 | 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
KR20130086012A (ko) * | 2012-01-20 | 2013-07-30 | 한국전자통신연구원 | 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치 |
US11252411B2 (en) | 2012-01-20 | 2022-02-15 | Electronics And Telecommunications Research Institute | Method for encoding and decoding quantized matrix and apparatus using same |
US11736696B2 (en) | 2012-01-20 | 2023-08-22 | Electronics And Telecommunications Research Institute | Method for encoding and decoding quantized matrix and apparatus using same |
US11621011B2 (en) | 2018-10-29 | 2023-04-04 | Dolby International Ab | Methods and apparatus for rate quality scalable coding with generative models |
JP7167335B2 (ja) | 2018-10-29 | 2022-11-08 | ドルビー・インターナショナル・アーベー | 生成モデルを用いたレート品質スケーラブル符号化のための方法及び装置 |
JP2022505888A (ja) * | 2018-10-29 | 2022-01-14 | ドルビー・インターナショナル・アーベー | 生成モデルを用いたレート品質スケーラブル符号化のための方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
WO1999018565A2 (en) | 1999-04-15 |
US6202045B1 (en) | 2001-03-13 |
FI973873A0 (fi) | 1997-10-02 |
FI973873A (fi) | 1999-04-03 |
AU9164998A (en) | 1999-04-27 |
WO1999018565A3 (en) | 1999-06-17 |
EP1019907B1 (en) | 2002-03-06 |
DE69804121T2 (de) | 2002-10-31 |
EP1019907A2 (en) | 2000-07-19 |
DE69804121D1 (de) | 2002-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2001519551A (ja) | 音声符号化 | |
JP3542610B2 (ja) | オーディオ信号処理装置およびオーディオ情報データ・フレーム処理方法 | |
US8880414B2 (en) | Low bit rate codec | |
JP2964344B2 (ja) | 符号化/復号化装置 | |
EP1203370B1 (en) | Method for improving the coding efficiency of an audio signal | |
MXPA03004513A (es) | Metodo y dispositivo para vincular posiciones y signos de pulso de vinculacion en libros de codigos algebraicos para codificacion eficiente de senales de banda ancha. | |
JP2004526213A (ja) | 音声コーデックにおける線スペクトル周波数ベクトル量子化のための方法およびシステム | |
JPH10513277A (ja) | ディジタル情報コーディング方法ならびに装置 | |
JP2003501675A (ja) | 時間同期波形補間によるピッチプロトタイプ波形からの音声を合成するための音声合成方法および音声合成装置 | |
US8055499B2 (en) | Transmitter and receiver for speech coding and decoding by using additional bit allocation method | |
KR100434275B1 (ko) | 패킷 변환 장치 및 그를 이용한 패킷 변환 방법 | |
US20040111257A1 (en) | Transcoding apparatus and method between CELP-based codecs using bandwidth extension | |
JP2003524796A (ja) | 音声コーダにおける線スペクトル情報量子化方法を交錯するための方法および装置 | |
US20030195745A1 (en) | LPC-to-MELP transcoder | |
JPH11259100A (ja) | 励起ベクトルの符号化方法 | |
US7684978B2 (en) | Apparatus and method for transcoding between CELP type codecs having different bandwidths | |
JP2002509294A (ja) | 暗騒音条件下における音声符号化の方法 | |
CA2293165A1 (en) | Method for transmitting data in wireless speech channels | |
JP3472279B2 (ja) | 音声符号化パラメータ符号化方法及び装置 | |
JP3453116B2 (ja) | 音声符号化方法及び装置 | |
KR100341398B1 (ko) | 씨이엘피형 보코더의 코드북 검색 방법 | |
JPH10260699A (ja) | 音声符号化方法および装置 | |
JP2853824B2 (ja) | 音声のパラメータ情報符号化法 | |
JPH09149104A (ja) | 擬似背景雑音生成方法 | |
JP2004061646A (ja) | Tfo機能を有する音声符号化器および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050902 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20050902 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081125 |
|
A045 | Written measure of dismissal of application [lapsed due to lack of payment] |
Free format text: JAPANESE INTERMEDIATE CODE: A045 Effective date: 20090324 |