JP2001519551A - 音声符号化 - Google Patents

音声符号化

Info

Publication number
JP2001519551A
JP2001519551A JP2000515270A JP2000515270A JP2001519551A JP 2001519551 A JP2001519551 A JP 2001519551A JP 2000515270 A JP2000515270 A JP 2000515270A JP 2000515270 A JP2000515270 A JP 2000515270A JP 2001519551 A JP2001519551 A JP 2001519551A
Authority
JP
Japan
Prior art keywords
coefficients
lpc
lpc coefficients
current frame
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2000515270A
Other languages
English (en)
Other versions
JP2001519551A5 (ja
Inventor
オーヤラ,パシ
ラカニエミ,アリ
テー. ルオッピラ,ベーサ
Original Assignee
ノキア モービル フォーンズ リミティド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ノキア モービル フォーンズ リミティド filed Critical ノキア モービル フォーンズ リミティド
Publication of JP2001519551A publication Critical patent/JP2001519551A/ja
Publication of JP2001519551A5 publication Critical patent/JP2001519551A5/ja
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 サンプル化された音声信号を符号化し連続するフレームに分割する方法。現在の各フレームについて、第1のセットの線形予測分析(LPC)係数が生成され、このLPC係数の個数は現在のフレームの特徴に依存する。現在のフレームの第1のセットのLPC係数の個数が先行フレームの第1のセットの個数と異なる場合、第2の拡大又は収縮されたセットのLPC係数が先行フレームの第1のセットのLPC係数から生成される。この第2のセットには、現在のフレームの第1のセットにある係数と同数のLPC係数が含まれる。それぞれのセットの線スペクトル周波数(LSP)係数が現在のフレームの第1のセットのLPC係数と、先行フレームの第2のセットのLPC係数について生成される。次いでこれらのセットのLSP係数が合成され、符号化された残差信号が与えられる。

Description

【発明の詳細な説明】
【0001】 本発明は音声符号化に関し、特に線形予測分析(LPC) を用いる音声符号化
に関する。本発明は特に符号励振線形予測(CELP)音声符号器(必ずしもこ
れに限られるものではないが) に適用することができる。
【0002】 デジタル化された音声信号の無線伝送を行う際の1つの根本的問題点は、個々
の音声信号の伝送に必要とされるビットレートの最小化である。ビットレートを
最小化することにより、所定のチャネル帯域幅に対して、1つの伝送チャネルに
より搬送可能な通信数は増加する。したがって、すべてのデジタルセルラー電話
の認知された規格では、いくつかの種類の音声コーデック(speech codec)が指
定され、音声データをある程度まで圧縮するようになっている。特に、これらの
音声コーデックは、音声信号の符号化の際に存在する冗長な情報の除去に依存し
ている。
【0003】 ヨーロッパでは、デジタルセルラー電話用として容認されている規格はGSM
(移動通信用広域システム) という頭字語で知られている。GSMにはCELP
音声符号器(技術仕様GSM06.60)の仕様が含まれる。CELP符号器の
構造を示す非常に一般的な例を図1 に示す。サンプル化された音声信号は160
個のサンプル・ポイント(j=0〜159)からなる20msのフレームに分割
され、ベクトルx(j)によって定義される。これらのフレームはまず線形予測
符号器(LPC)1にかけられ順次符号化される。この線形予測符号器(LPC)1
によって各フレームx(j)について1セットのLPC係数a(i)(i=0〜
n)が生成される。これらのLPC係数はフレーム中の短時間冗長性(short te
rm redundancy)を表す。GSMではnは10と定義されている。
【0004】 LPCからの出力は、LPC係数a(i)からなる上記セットと、入力された
音声フレームからLPC分析フィルタを用いて短時間冗長性を除去することによ
り生成される残差信号r(j)とを有する。次いで、この残差信号は長時間予測
手段(LTP)2へ出力される。この長時間予測手段(LTP)2によって、残
差信号中の長時間冗長性(long term redundancy)を表す1セットのLTPパラ
メータbが生成される。実際には、長時間予測は2段階の処理からなり、LTP
係数についての第1の開ループ推定と推定されたパラメータについての第2のリ
ファインメント(refinement)閉ループが含まれる。
【0005】 多数の励振コードを含む励振コードブック3が提供される。各フレームについ
て、スケーリング・ユニット(scaling unit)4を介して、これらの励振コード
の各々がLTP合成フィルタ5に対して順次出力される。このフィルタ5によっ
て、LTP2からLTPパラメータが受信され、LTPパラメータによって予測
された長時間冗長性がコードの中へ導入される。次にこの結果生じるフレームは
LPC合成フィルタ6へ出力され、このLPC合成フィルタ6によってLPC係
数が受信され、予測された短時間冗長性がコードの中へ導入される。この予測フ
レームxpred(j)は比較器7で実際のフレームx(j)と比較され、フレーム
について誤差信号e(j)が生成される。重み付けフィルタ8による処理後、最
小誤差信号を生成するコードc(j)がコードブック検索装置9によって選択さ
れる。選択されたコードを特定するベクトルu(j)が伝送チャネル10を介し
て受信機へ伝送される。LPC係数とLTPパラメータも伝送されるが、伝送に
先行してこれらのLPC係数とLTPパラメータ自身も符号化され伝送ビットレ
ートが更に最少化される。
【0006】
【外2】
【0007】 LPC係数は対応する数の線スペクトル対(LSP)係数に変換される。この
係数は以下に与えられる2つの多項式の根である。 P(z)=A(z)+z-(n+1)A(z-1) Q(z)=A(z)−z-(n+1)A(z-1
【0008】 一般に、現在のフレームのLSP係数は移動平均(MA)予測量子化を用いて
量子化される。この量子化にはLSP係数の予め決められた平均集合の利用及び
現在のフレームLSP係数からのこの平均集合の減算を伴う。先行フレームのL
SP係数にそれぞれの(以前に決定された) 予測係数を掛けて1セットの予測L
SP係数が与えられる。次に、予測されたLSP係数から平均除去LSP係数を
減じることにより1セットの残差LSP係数が得られる。これらのLSP係数は
、LPC係数と比較するとフレーム毎にほとんど変らない傾向があり、この結果
生じる残差係数のセットは次に続く量子化に役立つものとなる(「24ビット/
フレームにおけるLPCパラメータの効率的ベクトル量子化」、Kuldip K.P. 及
びBishnu S.A. 社、IEEE Trans. 音声及びオーディオ処理、Vol.1 、No.1、1993
年1月) 。
【0009】 LPC係数の個数(したがってLSP係数の個数) によってLPCの精確さが
決定される。しかし、すべての与えられたフレームについて、符号化の精確さと
圧縮比間のトレードオフであるLPC係数の最適個数が存在する。既に言及した
ように、現在のGSM規格ではLPCのオーダはn=10に固定されている。こ
の値(n=10)はすべての予想される音声フレームを十分な精確さで符号化す
るのに十分な大きさの個数である。これによってLPCが単純化され計算上の要
件が少なくなるものの、その一方で、多くのフレームの‘オーバーコーディング
(over coding) ’が結果として生じる。この固定レートによって指定された係数
より小さいLPC係数を用いてこれらのフレームを符号化することも可能である
【0010】 各フレームについて個々に最適化が行われフレーム毎にLPC係数の個数が変
化するような可変レートのLPCが提案される。可変レートのLPCはCDMA
ネットワーク、提案されているGSMフェーズ2規格及び将来の第3世代規格(
UTMS)に理想的に適合するものである。これらのネットワークでは、パケッ
ト(あるいはバースト) によるデータ転送を行うために‘パケット交換’伝送の
利用あるいはこの‘パケット交換’の利用を提案している。これは、一続きの固
定長時間フレームが通話時間の間所定のチャネル用として予約される「回線交換
」伝送を利用する現行のGSM 規格と対比されるものである。
【0011】 上記の利点にもかかわらず、可変レートのLPCの良好な実現が可能になる前
にいくつかの技術的問題が解決されなければならない。特に、以下に説明する本
発明の発明者が認識したように、可変レートのLPCは上述のLSP係数量子化
スキームと互換性を有するものではない。すなわち、LSP係数の個数がフレー
ム毎に変わるとき、予測量子化LSP係数信号を直接生成することは不可能であ
る。更に、フレーム間にLPC(あるいはLSP)係数を補間してフレーム境界
間の遷移を滑らかにすることは不可能である。
【0012】 本発明の第1の態様によれば、サンプル化された音声信号を符号化する方法が
提供される。この方法は音声信号を連続するフレーム(sequential frames)に分
割し、現在の各フレームについて、 線形フィルタの係数に対応し且つ現在のフレーム中の短時間冗長性を表す第1
のセットの線形予測分析(LPC)係数を生成し、 現在のフレームの前記第1のセットのLPC係数の個数が先行フレームの第1
のセットの個数と異なる場合、先行フレームについて生成された第1のセットの
LPC係数から拡大又は収縮した第2のセットのLPC係数を生成し、前記第2
のセットは、現在のフレームの前記第1のセットのLPC係数の個数に等しいL
PC係数が含まれ、 現在のフレームの前記第1のセットのLPC係数と、先行フレームの前記第2
のセットのLPC係数とを用いて現在のフレームを符号化する。
【0013】 本発明は、パケット交換伝送システムなどのような、データがバーストで伝送
される、可変ビットレート無線電話ネットワークに対して適用可能である。また
本発明は、一定数のビットが種々のパラメータ間で動的に割り振られる固定ビッ
トレート・ネットワークなどに適用可能である。
【0014】 本発明による符号化に適したサンプル化された音声信号には‘生の’サンプル
化された音声信号と処理されサンプル化された音声信号が含まれる。後者のクラ
スの信号には、フィルタ、増幅等された音声信号が含まれる。サンプル化された
音声信号が分割される連続したフレームは隣接していたりオーバーラップしてい
たりしてもよい。
【0015】 本発明は、サンプル化された音声信号のリアルタイム処理(必ずしもこれに限
定されるわけではない) に対して特に適用可能である。この場合現在のフレーム
は直前の先行フレームに基づいて符号化される。
【0016】
【外3】
【0017】 特に好ましいアルゴリズムとして、レビンソン−ダービン・アルゴリズム(Lev
inson-Durbin algorithm) があり、このアルゴリズムによって反射係数が中間成
果物として生成される。このアルゴリズムを用いる実施形態では、ゼロ値の反射
係数を追加するか、又は既に計算された反射係数を除去するかのいずれかを行い
、修正されたセットの反射係数を用いてLPCの再計算を行うことにより、第2
の拡大又は収縮されたセットのLPC係数が生成される。
【0018】 好ましくは、前記符号化を行うステップが、現在のフレームの第1のセットの
LPC係数と、先行フレームの第2のセットのLPC係数とを、それぞれのセッ
トの変換係数に変換することが望ましい。好ましくは、前記変換係数はライン・
スペクトル周波数(LSP)係数であり、周知の方法で変換が行われることが望
ましい。或いは、変換係数を逆サイン係数、イミッタンス・スペクトル対(immi
ttance spectral pairs)(ISP)あるいはログ・エリア(log-area)比にしても
よい。
【0019】 好ましくは、符号化ステップが、先行フレームの第2のセットのLPC係数と
関連した現在のフレームの第1のセットのLPC係数を符号化して、符号化され
た残差信号を提供することが望ましい。 前記符号化された残差信号は、前記2つのセットの変換係数間の残差を評価す
ることにより得ることができる。次いでこの差をベクトル量子化などにより符号
化してもよい。前記差の評価に先行して、1セットの平均されたすなわち平均変
換係数値を減じることなどにより、一方または双方のセットの変換係数を修正す
ることができる。
【0020】 本発明の第2の態様によれば、信号の各フレームについて符号化された線形予
測分析(LPC)係数を含むサンプル化された音声信号を復号化する方法が提供
される。この方法は、現在の各フレームについて、 符号化された信号を復号化し、現在のフレームについて符号化されたLPC係
数の個数を決定し、 先行フレームについて得られた1セットのLPC係数中のLPC係数の個数が
現在のフレームについて符号化されたLPC係数の個数と異なる場合、前記セッ
トの先行フレームのLPC係数を拡大又は収縮させて第2のセットのLPC係数
を提供し、 先行フレームの前記第2のセットのLPC係数を現在のフレームのLPC係数
データと合成して、現在のフレームについて少なくとも1つのセットのLPC係
数を提供する。
【0021】 符号化された信号に1セットの符号化された残差信号が含まれる場合、この符
号化された信号は復号化され残差信号が復元される。次いで、この残差信号は第
2のセットの先行フレームのLPC係数と合成して、現在のフレームのためのL
PC係数が与えられる。
【0022】 現在のフレームについて得られた1セットのLPC係数と、先行フレームにつ
いて得られた第2のセットのLPC係数とを合成して、各フレームのサブフレー
ムについて複数セットのLPC係数を提供することができる。好ましくは、これ
らのセットの係数が補間によって合成されることが望ましい。LSP係数または
反射係数を用いて補間を行ってもよい。この合成されたLPC係数は上記の補間
された係数から続いて導き出される。
【0023】 本発明の第3の態様によれば、本発明の上記第1の態様及び/又は第2の態様
の方法を実行するために構成され及びプログラムされたコンピュータ手段が提供
される。1つの実施形態ではコンピュータ手段が移動電話のような移動通信装置
中に提供される。別の実施形態では、コンピュータ手段はセルラー電話ネットワ
ークのインフラ・ストラクチャの一部を形成する。例えば、そのようなインフラ
・ストラクチャの基地局にコンピュータ手段を提供することができる。
【0024】 〔発明の実施の態様〕 本発明をよく理解し、同発明の実施方法を示すために、例を挙げながら添付図
面の参照を行う。
【0025】
【外4】
【0026】 予測フレームと現在のフレームとの間の差は予測誤差d(k)である。
【数1】
【0027】 a(λ)(ここでλは遅延である) に関して予測誤差の2乗(すなわち分散)E
(d2 )の期待値を微分することにより、さらに、その結果生じる微分方程式が
ゼロのときa(i)について解を求めることにより最適セットの予測係数を決定
することができる。すなわち:
【数2】 ここでrは自己相関関数の係数である。この式は以下の行列形式で書くことがで
きる。
【数3】
【外5】
【0028】 この相関行列は対称のテプリッツ(Toeplitz)型なので、周知のレビンソン−
ダービン・アプローチ(Kondoz A. M. 、「デジタル音声(低ビットレート通信シ
ステム用符号化) 」(John Wiley & Sons社、ニューヨーク、1994年参照))を用い
てこの行列式を解くことができる。α(i)=−a(i)で、n=3の場合の例
を考えると、式(4)は以下のように書き直すことができる。
【数4】 予測誤差dについての補助方程式は以下のように書くことができる。
【数5】 また式(6)にこの式を付加して次式を与えることができる。
【数6】
【0029】
【外6】
【0030】 第1回の反復時に、第1回の推定値をα(1)=α1 (1)とする。第2回の
反復時に、推定値をα(2)=α2 (2)とし、α(1)=α2 (2)の推定値
を更新する。同様に、第2回の反復によって推定値α3 (3)及び更新推定値α 3 (1)とα3 (2)とが与えられる。n+1より少ないLPC係数を所望の場
合には、中間レベルで反復を中断することができることが理解できる。
【0031】 上記反復解法により1セットの反射係数kp が与えられる。図3に例示されて
いるような格子構造の中に図2の分析フィルタが設けられているとき、この反射
係数kp は図2の分析フィルタの利得である。また各レベルの反復で予測誤差d p が与えられる。この誤差は、レベルの増加として、またLPC係数の個数の減
少として見られ、この誤差を用いて所定のフレームに対して符号化されたLPC
係数の個数が決定される。一般に、nの最大値は10であるが、モデルオーダ(
model order)を増加させることにより達成される予測誤差の減少が非常に小さく
なり、必要とされるLPC係数の個数の増加がオフセットされるとき、この反復
は中断される。いくつかのモデルオーダの選択基準が知られているが、この基準
にはアカイケ(Akaike)情報基準(AIC)とリサネンの最小記述長(Rissanen's
Minimum Description Length)(MDL)選択基準とが含まれる。「ARオーダ
選択方法に関する比較研究する」(Dickie 、J.R. & Nandi、A.K.、信号処理40、
1994、pp.239-255) を参照されたい。
【0032】 既に説明してきたように、結果として生じるこの(可変レート)LPC係数は
LSP係数に変換され、さらに効率的な量子化が行われる。前のフレームが3つ
のLSP係数しか生成しなかったのに対して、現在のサンプル化された音声フレ
ームが6つのLPC係数(従って5つのLSP係数) を生成する例について考察
してみる。この不適合に起因して、量子化を行うために1セットのLSP残差を
直接生成することは不可能である。この問題は、前のフレームk1、k2、k3
について生成された3つの反射係数へ戻って、更なる2つの反射係数k4、k5
=0を定義することにより解決される。上述の反復処理ステップ(6)〜(13
)(ステップ(12)でステップ(6)へジャンプする) を実行することにより
、先行フレームに対して新しい1セットの6つのLPC係数が新しい1セットの
反射係数用として生成される。初期値として、n=5、p=1、α0 (0)=1
、d0 =r0 が与えられる。この新しい1セットの(6つの)LPC係数が、対
応するセットのLSP係数へ変換される。次いで、1セットの符号化された残差
が、伝送に先行して上記に概説したように計算される。
【0033】 前のフレームについて生成されたLPC係数の個数が現在のフレームについて
生成された係数の個数を超える場合、1セットのLSP残差の計算を行う前に、
前の係数の個数を減らす必要がある。これは、先行フレームについて生成された
高次の反射係数を適切な数だけ取り去り(例えば、2つの余分なLPC係数が先
行フレーム中に存在する場合、2つの最も高いオーダの反射係数を除去する) 、
LPC係数の再計算を行うことによりなされる。ここで注意すべきことは、前の
パラグラフで説明した拡大処理とは対照的に、この収縮によって、元の音声信号
の微細構造(fine structure)の損失という結果が生じるという点である。しか
し、LPC符号化処理全体によって達成される利点と比較するとこの欠点は無視
できるものである。
【0034】 図4は、上述の処理を用いた可変レートのLPC係数の量子化を行うのに適し
たLPCの一部を示すブロック図である。
【0035】 上述の詳細な説明はCELP音声符号器に関するものである。符号化された信
号を受信する復号器においても類似の処理を実行しなければならないことが理解
できる。特に、単一の(現在の) フレームに対応する符号化されたデータが受信
され、そのフレームの残差係数の個数が、先行フレームについて受信された個数
と異なるとき、前のフレームについて復号器で決定されたLPC係数は処理され
、以下のような1セットの反射係数が与えられる: (1) αp (i)=−a(i)、1≦i≦p (2) for i=p to 1 (3) k(i)=−α(i) (4) for j=1 to i−1 (5) αi-1 (j)=(αi (j)+k(i)αi (i−j))/( 1−k(i)2 ) (6) j=j+1 (6) i=i−1
【0036】 上記の結果として生じる1セットの反射係数は、余分なゼロ値係数を加えるこ
とにより拡大され、あるいは、1つまたはそれ以上の既存の係数を除去すること
により収縮される。次いで、この修正されたセットは元の1セットのLPC係数
に変換され、今度はこの元の1セットのLPC係数が1セットのLSP係数に変
換される。現在のフレームのLSP係数は上述の予測量子化処理の逆を実行する
ことにより決定される。
【0037】
【外7】
【0038】 更に、各フレームにおけるLPCモデルを2以上に変換することにより、その
精確さを更に改善することができるが、好ましくはすべての利用可能なモデルオ
ーダについて前に説明したモデルオーダ変換を利用することが望ましい。これら
の変換されたモデルを用いて、各モデルオーダの予測器を並列に駆動することが
でき、現在のフレームのモデルオーダに対応する予測器を利用することができる
。図5に例示する実施形態を用いてこの概念について説明する。
【0039】 図5に、残差ベクトルについて、異なるモデルオーダM、N、Pのそれぞれを
表すメモリブロック500、504、508が図示されている。現在のLSP(
M)ベクトルのモデルオーダによれば、モデルオーダMに対応するメモリ500
中の残差ベクトルが現在のベクトルの予測501に適用される。前記予測された
LSPベクトルと現在のフレームベクトルとを用いて予測残差が減算器502に
より導き出され、公知の方法による量子化ブロック503で量子化される。しか
し、量子化されたLSPベクトルを利用してこのモデルオーダの予測器が更新さ
れ、また複数の予測器が他のモデルオーダのために予約される。この実施形態で
は、すべての更なる利用可能なモデルオーダN、Pの予測器がブロック507、
511で更新される。モデルオーダN、Pに対応する予測されたベクトルは、既
に説明したようにブロック505と509で計算され、決定されたLSPベクト
ル、LSPQ(N)、LSPQ(P)を用いて、ブロック506と510で予測
残差の計算が行われる。次いでこれらの決定された残差RESQ(N)とRES
Q(P)は予測器メモリ502、508に記憶される。このようにして、現在の
フレームLSPの異なるモデルオーダ(及び当然のことであるがLPC)ベクト
ルについて、対応するモデルオーダを持つ予測器が利用可能である。
【0040】 図5の実施形態に対応する復号化の方法が図6に例示されている。オーダMの
量子化された残差RESQ(M)と、メモリ600から得られる同じオーダMの
予測ベクトルと、予測ブロック601とを用いてブロック602で現在のLSP
ベクトルが計算される。モデルオーダMに対応する入力残差ベクトルRESQ(
M)がメモリ600に記憶され、復号化されたLSPベクトルLSPQ(M)が
すでに説明した方法でブロック606と610で修正され、異なるモデルオーダ
の復号化されたLSPベクトルが生成される。各予測ブロック604、608で
、対応するモデルオーダ予測ベクトルが決定され、予測残差RESQ(N)とR
ESQ(P)が対応するメモリ603、607の中に記憶される。
【0041】 上述の符号器と復号器がセルラー電話ネットワークの移動電話と基地局の双方
において一般に用いられることが理解できる。例えば、これらの符号器と復号器
とをローカル・エリア・ネットワーク、広域ネットワークあるいは電話ネットワ
ークと接続可能なマルチメディア・コンピュータで用いてもよい。本発明を具現
化する符号器と復号器はハードウェア、ソフトウェアあるいはこの双方を組み合
わせて実現することができる。
【図面の簡単な説明】
【図1】 通常のCELP音声符号器のブロック図である。
【図2】 LPC分析フィルタを示す図である。
【図3】 図2のLPC分析フィルタに相当する格子構造分析フィルタを示す図である。
【図4】 可変レベルのLPC係数を量子化するための本発明による方法の実施形態を示
すブロック図である。
【図5】 本発明による符号化方法の別の実施形態を示すブロック図である。
【図6】 本発明による復号化方法の別の実施形態を示すブロック図である。
【手続補正書】特許協力条約第34条補正の翻訳文提出書
【提出日】平成12年4月3日(2000.4.3)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】
【外1】
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SZ,UG,ZW),EA(AM ,AZ,BY,KG,KZ,MD,RU,TJ,TM) ,AL,AM,AT,AU,AZ,BA,BB,BG, BR,BY,CA,CH,CN,CU,CZ,DE,D K,EE,ES,FI,GB,GE,GH,GM,HR ,HU,ID,IL,IS,JP,KE,KG,KP, KR,KZ,LC,LK,LR,LS,LT,LU,L V,MD,MG,MK,MN,MW,MX,NO,NZ ,PL,PT,RO,RU,SD,SE,SG,SI, SK,SL,TJ,TM,TR,TT,UA,UG,U S,UZ,VN,YU,ZW (72)発明者 ルオッピラ,ベーサ テー. フィンランド国,エフイーエン−33720 タンペレ,ビルップランポルク 20 ベー 20 Fターム(参考) 5D045 CA01 CC07 5J064 AA05 BA01 BA13 BB01 BB03 BC01 BC11 BC16 BC21 BC27 BC29 BD02

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 サンプル化された音声信号を符号化する方法において、音声
    信号を連続するフレームに分割し、現在の各フレームについて、 線形フィルタの係数に対応し且つ現在のフレーム中の短時間冗長性を表す第1
    のセットの線形予測分析(LPC) 係数を生成し、 現在のフレームの前記第1のセットのLPC係数の個数が先行フレームの第1
    のセットの個数と異なる場合、先行フレームについて生成された第1のセットの
    LPC係数から拡大又は収縮された第2のセットのLPC係数を生成し、前記第
    2のセットは現在のフレームの前記第1のセットのLPC係数の個数に等しいL
    PC係数が含まれ、 現在のフレームの前記第1のセットのLPC係数と先行フレームの前記第2の
    セットのLPC係数とを用いて現在のフレームを符号化することを特徴とする方
    法。
  2. 【請求項2】 先行フレームについて生成された前記第1のセットのLPC
    係数から、少なくとも1つのセットの拡大又は収縮されたLPC係数が生成され
    る請求項1に記載の方法。
  3. 【請求項3】 先行フレームについて生成された前記第1のセットのLPC
    係数から1セット又は複数セットの拡大又は収縮されたLPC係数が、利用可能
    な個数のLPCパラメータに対応して生成される請求項2に記載の方法。
  4. 【請求項4】 【外1】
  5. 【請求項5】 前記LPC係数に近似する再帰処理を用いて行列式の近似解
    を得るステップを有する請求項4に記載の方法。
  6. 【請求項6】 中間成果物として反射係数が生成されるレビンソン−ダービ
    ン・アルゴリズムを用いて前記行列式の解を求める請求項5に記載の方法。
  7. 【請求項7】 ゼロ値の反射係数を加えるか、又は既に計算された反射係数
    を除去するかのいずれかを行い、さらに前記修正されたセットの反射係数を用い
    て前記LPC係数の再計算を行うことにより前記第2の拡大又は収縮されたセッ
    トのLPC係数が生成される請求項6に記載の方法。
  8. 【請求項8】 前記符号化並びに量子化を行うステップが、現在のフレーム
    の第1のセットのLPC係数と、先行フレームの第2のセットのLPC係数とを
    、それぞれのセットの変換係数に変換する請求項1〜7のいずれか一項に記載の
    方法。
  9. 【請求項9】 前記変換係数はライン・スペクトル周波数(LSP)係数で
    ある請求項8に記載の方法。
  10. 【請求項10】 前記符号化を行うステップが、先行フレームの第2のセッ
    トのLPC係数と関連した現在のフレームの第1のセットのLPC係数を符号化
    して、符号化された残差信号を提供する請求項1〜9のいずれか一項に記載の方
    法。
  11. 【請求項11】 前記符号化並びに量子化を行うステップが、さらに前記2
    つのセットの変換係数の間の差を評価することにより前記符号化された残差信号
    を生成する請求項8に従属する場合の請求項10に記載の方法。
  12. 【請求項12】 信号の各フレームについて符号化された線形予測分析(L
    PC) 係数を含むサンプル化された音声信号を復号化する方法において、現在の
    各フレームについて、 符号化された信号を復号化し、現在のフレームについて符号化されたLPC係
    数の個数を決定し、 先行フレームについて得られた1セットのLPC係数中のLPC係数の個数が
    現在のフレームについて符号化されたLPC係数の個数と異なる場合、先行フレ
    ームの前記セットのLPC係数を拡大又は収縮させて第2のセットのLPC係数
    を提供し、 先行フレームの前記第2のセットのLPC係数を現在のフレームのLPC係数
    データと合成して、現在のフレームについて少なくとも1つのセットのLPC係
    数を提供することを特徴とする方法。
  13. 【請求項13】 少なくとも1つの先行フレームのセットの拡大又は収縮さ
    れたLPC係数が生成されることを特徴とする請求項12に記載の方法。
  14. 【請求項14】 先行フレームの1つのセット又は複数のセットの拡大又は
    収縮されたLPC係数が、各々の利用可能なLPCモデルオーダに対応して生成
    される請求項13に記載の方法。
  15. 【請求項15】 前記符号化された信号の中には1セットの符号化された残
    差信号が含まれ、さらに前記方法は、前記符号化された信号を復号化して、前記
    残差信号を復元し、前記残差信号を前記先行フレームの第2のセットのLPC係
    数と合成して、現在のフレームのためのLPC係数を提供する請求項12に記載
    の方法。
  16. 【請求項16】 現在のフレームについて得られた1セットのLPC係数と
    、先行フレームについて得られた第2のセットのLPC係数とを合成して、各フ
    レームのサブフレームについて複数セットのLPC係数を提供する請求項12〜
    15のいずれか一項に記載の方法。
  17. 【請求項17】 前記セットの係数が、補間によって、又は、LSP係数又
    は反射係数を補間することにより合成される請求項16に記載の方法。
  18. 【請求項18】 請求項1〜17のいずれか一項に記載の方法を実行するよ
    うに構成及びプログラムされたコンピュータ手段。
  19. 【請求項19】 請求項18に記載のコンピュータ手段を有するセルラー電
    話ネットワークにおける基地局。
  20. 【請求項20】 請求項18に記載のコンピュータ手段を有する移動電話器
JP2000515270A 1997-10-02 1998-09-14 音声符号化 Ceased JP2001519551A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FI973873 1997-10-02
FI973873A FI973873A (fi) 1997-10-02 1997-10-02 Puhekoodaus
PCT/FI1998/000715 WO1999018565A2 (en) 1997-10-02 1998-09-14 Speech coding

Publications (2)

Publication Number Publication Date
JP2001519551A true JP2001519551A (ja) 2001-10-23
JP2001519551A5 JP2001519551A5 (ja) 2006-01-05

Family

ID=8549657

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000515270A Ceased JP2001519551A (ja) 1997-10-02 1998-09-14 音声符号化

Country Status (7)

Country Link
US (1) US6202045B1 (ja)
EP (1) EP1019907B1 (ja)
JP (1) JP2001519551A (ja)
AU (1) AU9164998A (ja)
DE (1) DE69804121T2 (ja)
FI (1) FI973873A (ja)
WO (1) WO1999018565A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130086012A (ko) * 2012-01-20 2013-07-30 한국전자통신연구원 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
JP2022505888A (ja) * 2018-10-29 2022-01-14 ドルビー・インターナショナル・アーベー 生成モデルを用いたレート品質スケーラブル符号化のための方法及び装置

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI116992B (fi) * 1999-07-05 2006-04-28 Nokia Corp Menetelmät, järjestelmä ja laitteet audiosignaalin koodauksen ja siirron tehostamiseksi
EP1959435B1 (en) * 1999-08-23 2009-12-23 Panasonic Corporation Speech encoder
US7315815B1 (en) * 1999-09-22 2008-01-01 Microsoft Corporation LPC-harmonic vocoder with superframe structure
US7110947B2 (en) * 1999-12-10 2006-09-19 At&T Corp. Frame erasure concealment technique for a bitstream-based feature extractor
US6606591B1 (en) * 2000-04-13 2003-08-12 Conexant Systems, Inc. Speech coding employing hybrid linear prediction coding
KR20020070373A (ko) * 2000-11-03 2002-09-06 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호들의 사인 곡선 모델 기초 코딩
WO2004008437A2 (en) * 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
US8090577B2 (en) * 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
US7386445B2 (en) * 2005-01-18 2008-06-10 Nokia Corporation Compensation of transient effects in transform coding
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7831420B2 (en) * 2006-04-04 2010-11-09 Qualcomm Incorporated Voice modifier for speech processing systems
CN101770777B (zh) * 2008-12-31 2012-04-25 华为技术有限公司 一种线性预测编码频带扩展方法、装置和编解码系统
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466671B (en) 2009-01-06 2013-03-27 Skype Speech encoding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
US8447619B2 (en) * 2009-10-22 2013-05-21 Broadcom Corporation User attribute distribution for network/peer assisted speech coding
US9613630B2 (en) * 2009-11-12 2017-04-04 Lg Electronics Inc. Apparatus for processing a signal and method thereof for determining an LPC coding degree based on reduction of a value of LPC residual
KR101804922B1 (ko) * 2010-03-23 2017-12-05 엘지전자 주식회사 오디오 신호 처리 방법 및 장치

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4969192A (en) 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
US4890327A (en) * 1987-06-03 1989-12-26 Itt Corporation Multi-rate digital voice coder apparatus
US5243686A (en) * 1988-12-09 1993-09-07 Oki Electric Industry Co., Ltd. Multi-stage linear predictive analysis method for feature extraction from acoustic signals
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5630011A (en) * 1990-12-05 1997-05-13 Digital Voice Systems, Inc. Quantization of harmonic amplitudes representing speech
FI95085C (fi) 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
FI91345C (fi) 1992-06-24 1994-06-10 Nokia Mobile Phones Ltd Menetelmä kanavanvaihdon tehostamiseksi
FI96248C (fi) 1993-05-06 1996-05-27 Nokia Mobile Phones Ltd Menetelmä pitkän aikavälin synteesisuodattimen toteuttamiseksi sekä synteesisuodatin puhekoodereihin
FI98163C (fi) 1994-02-08 1997-04-25 Nokia Mobile Phones Ltd Koodausjärjestelmä parametriseen puheenkoodaukseen
JP3235703B2 (ja) * 1995-03-10 2001-12-04 日本電信電話株式会社 ディジタルフィルタのフィルタ係数決定方法
US5890110A (en) * 1995-03-27 1999-03-30 The Regents Of The University Of California Variable dimension vector quantization
US5754733A (en) * 1995-08-01 1998-05-19 Qualcomm Incorporated Method and apparatus for generating and encoding line spectral square roots
FR2742568B1 (fr) * 1995-12-15 1998-02-13 Catherine Quinquis Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101971077B1 (ko) * 2012-01-20 2019-04-22 한국전자통신연구원 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
KR20140092287A (ko) * 2012-01-20 2014-07-23 한국전자통신연구원 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
US10306228B2 (en) 2012-01-20 2019-05-28 Electronics And Telecommunications Research Institute Method for encoding and decoding quantized matrix and apparatus using same
KR101998390B1 (ko) * 2012-01-20 2019-07-09 한국전자통신연구원 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
KR101527442B1 (ko) * 2012-01-20 2015-06-11 한국전자통신연구원 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
KR101627085B1 (ko) 2012-01-20 2016-06-03 한국전자통신연구원 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
US9866839B2 (en) 2012-01-20 2018-01-09 Electronics And Telecommunications Research Institute Method for encoding and decoding quantized matrix and apparatus using same
KR20180078212A (ko) * 2012-01-20 2018-07-09 한국전자통신연구원 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
KR20180078213A (ko) * 2012-01-20 2018-07-09 한국전자통신연구원 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
KR20180079274A (ko) * 2012-01-20 2018-07-10 한국전자통신연구원 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
KR101875206B1 (ko) * 2012-01-20 2018-08-02 한국전자통신연구원 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
CN104170382B (zh) * 2012-01-20 2018-08-03 韩国电子通信研究院 用于编码和解码量化矩阵的方法和使用其的设备
US11778189B2 (en) 2012-01-20 2023-10-03 Electronics And Telecommunications Research Institute Method for encoding and decoding quantized matrix and apparatus using same
KR20140092288A (ko) * 2012-01-20 2014-07-23 한국전자통신연구원 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
CN104170382A (zh) * 2012-01-20 2014-11-26 韩国电子通信研究院 用于编码和解码量化矩阵的方法和使用其的设备
KR102020838B1 (ko) * 2012-01-20 2019-09-11 한국전자통신연구원 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
KR102115318B1 (ko) 2012-01-20 2020-05-26 한국전자통신연구원 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
KR20200057693A (ko) * 2012-01-20 2020-05-26 한국전자통신연구원 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
US10708595B2 (en) 2012-01-20 2020-07-07 Electronics And Telecommunications Research Institute Method for encoding and decoding quantized matrix and apparatus using same
KR102313195B1 (ko) 2012-01-20 2021-10-15 한국전자통신연구원 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
KR20130086012A (ko) * 2012-01-20 2013-07-30 한국전자통신연구원 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
US11252411B2 (en) 2012-01-20 2022-02-15 Electronics And Telecommunications Research Institute Method for encoding and decoding quantized matrix and apparatus using same
US11736696B2 (en) 2012-01-20 2023-08-22 Electronics And Telecommunications Research Institute Method for encoding and decoding quantized matrix and apparatus using same
US11621011B2 (en) 2018-10-29 2023-04-04 Dolby International Ab Methods and apparatus for rate quality scalable coding with generative models
JP7167335B2 (ja) 2018-10-29 2022-11-08 ドルビー・インターナショナル・アーベー 生成モデルを用いたレート品質スケーラブル符号化のための方法及び装置
JP2022505888A (ja) * 2018-10-29 2022-01-14 ドルビー・インターナショナル・アーベー 生成モデルを用いたレート品質スケーラブル符号化のための方法及び装置

Also Published As

Publication number Publication date
WO1999018565A2 (en) 1999-04-15
US6202045B1 (en) 2001-03-13
FI973873A0 (fi) 1997-10-02
FI973873A (fi) 1999-04-03
AU9164998A (en) 1999-04-27
WO1999018565A3 (en) 1999-06-17
EP1019907B1 (en) 2002-03-06
DE69804121T2 (de) 2002-10-31
EP1019907A2 (en) 2000-07-19
DE69804121D1 (de) 2002-04-11

Similar Documents

Publication Publication Date Title
JP2001519551A (ja) 音声符号化
JP3542610B2 (ja) オーディオ信号処理装置およびオーディオ情報データ・フレーム処理方法
US8880414B2 (en) Low bit rate codec
JP2964344B2 (ja) 符号化/復号化装置
EP1203370B1 (en) Method for improving the coding efficiency of an audio signal
MXPA03004513A (es) Metodo y dispositivo para vincular posiciones y signos de pulso de vinculacion en libros de codigos algebraicos para codificacion eficiente de senales de banda ancha.
JP2004526213A (ja) 音声コーデックにおける線スペクトル周波数ベクトル量子化のための方法およびシステム
JPH10513277A (ja) ディジタル情報コーディング方法ならびに装置
JP2003501675A (ja) 時間同期波形補間によるピッチプロトタイプ波形からの音声を合成するための音声合成方法および音声合成装置
US8055499B2 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
KR100434275B1 (ko) 패킷 변환 장치 및 그를 이용한 패킷 변환 방법
US20040111257A1 (en) Transcoding apparatus and method between CELP-based codecs using bandwidth extension
JP2003524796A (ja) 音声コーダにおける線スペクトル情報量子化方法を交錯するための方法および装置
US20030195745A1 (en) LPC-to-MELP transcoder
JPH11259100A (ja) 励起ベクトルの符号化方法
US7684978B2 (en) Apparatus and method for transcoding between CELP type codecs having different bandwidths
JP2002509294A (ja) 暗騒音条件下における音声符号化の方法
CA2293165A1 (en) Method for transmitting data in wireless speech channels
JP3472279B2 (ja) 音声符号化パラメータ符号化方法及び装置
JP3453116B2 (ja) 音声符号化方法及び装置
KR100341398B1 (ko) 씨이엘피형 보코더의 코드북 검색 방법
JPH10260699A (ja) 音声符号化方法および装置
JP2853824B2 (ja) 音声のパラメータ情報符号化法
JPH09149104A (ja) 擬似背景雑音生成方法
JP2004061646A (ja) Tfo機能を有する音声符号化器および方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050902

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050902

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081125

A045 Written measure of dismissal of application [lapsed due to lack of payment]

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20090324