JP3296363B2

JP3296363B2 - 音声の線形予測パラメータ符号化方法

Info

Publication number: JP3296363B2
Application number: JP09917391A
Authority: JP
Inventors: 仲大室; 健弘守谷; 雅彰誉田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1991-04-30
Filing date: 1991-04-30
Publication date: 2002-06-24
Anticipated expiration: 2017-06-24
Also published as: JPH04328800A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は音声の伝送、蓄積など
に用いられ、情報量を減少するための音声スペクトル包
絡特性を表す線形予測パラメータを符号化する方法に関
する。

【０００２】

【従来の技術】従来の音声符号化系において、音声スペ
クトル包絡特性を表す線形フィルタの係数は、線形予測
分析を一定時間間隔で行って計算され、偏自己相関（Ｐ
ＡＲＣＯＲ）係数や、線スペクトル対（ＬＳＰ）などの
パラメータに変換、量子化され、ディジタル符号に変換
した後、記憶、または伝送された。これらの方法の詳細
は、例えば、古井貞煕著“ディジタル音声処理”（東海
大学出版会）に記載されている。

【０００３】このとき、係数を更新する時間間隔を長く
とれば、記憶または伝送のための情報量を減らすことが
できるが、あまり長くしすぎるともとの音声に合成する
ときに記憶または伝送しなかった時間におけるフィルタ
係数の推定精度が低下し、再生音声の品質劣化につなが
った。そこで、一般には上記時間間隔を２０ミリ秒程度
以下に設定している。

【０００４】

【発明が解決しようとする課題】この問題を解決し、よ
り高能率な符号化を行うための方法として、マトリクス
量子化と呼ばれる方法がある。これは、線形予測分析は
短い時間間隔、例えば１０ミリ秒から２０ミリ秒程度の
間隔で行っておき、数組の分析結果をひとまとめにして
符号化する方法である。しかしこの方法によって、直接
数組のフィルタ係数を量子化しようとすると、非常に多
くの計算量と、符号帳のための多くの記憶とが必要にな
り、現実的なハードウェア規模のもとではそれほど能率
をあげることができない。

【０００５】この発明の目的は、マトリクス量子化が量
子化歪を小さくする観点で高能率であるという利点を生
かしつつ、現実的な計算量と記憶量とのもとでの高能率
な予測パラメータ（フィルタ係数）の符号化（量子化）
方法を提供することにある。

【０００６】

【課題を解決するための手段】この発明は、音声の符号
化において、線形予測パラメータ（線形フィルタの係
数）を、最初に粗い時間間隔、例えば４０ミリ秒毎に符
号化（量子化）し（前段の符号化又は前段量子化と呼
ぶ）、この前段量子化値と、過去の時間における前段量
子化値とから、前段量子化の時間間隔よりも狭い時間間
隔の値を、適当な推定方法、例えば補間によって適当な
時間間隔、例えば１０ミリ秒毎に推定する。

【０００７】次に、上記推定値と上記狭い時間間隔の真
の線形予測パラメータ（線形フィルタ係数）との誤差系
列を、適当な時間の組、例えば４つをひと組にして符号
化（量子化）する（後段符号化又は後段量子化と呼
ぶ）。この後段量子化の方法には、例えばマトリクス量
子化などが用いられる。このように、この発明では、前
段量子化の後に後段量子化を行うが、前段量子化の最適
量子化値が、前段量子化と後段量子化とを組み合わせた
ときの最適値になっているとは限らない。そこで、請求
項２の発明では前段量子化では、一意に量子化値を決定
してしまうのではなく、数個の候補を残し、それぞれの
候補に対してそれぞれ後段量子化を行って、両者を組み
合わせた時の最適量子化値を求めて全体の性能を高め
る。この方法は、一般にディレイドディシジョンと呼ば
れる。

【０００８】再生（復号）側では、前段量子化値からこ
れら間の値を狭い時間間隔で推定し、この推定値の系列
と後段量子化値の系列とから再生される値を線形フィク
タ係数とする。音声信号を再生する場合には、上記再生
されたフィルタ係数をもつ線形フィルタを駆動音源信号
によって駆動して音声を合成する。なお、この量子化に
おける最小量子化時間単位、例えば１０ミリ秒以下の時
間間隔のフィルタ係数については、再生側で最も近い時
刻の係数をそのまま用いてもよいし、任意の時刻（通常
は前後の時刻）の量子化値から補間によって推定しても
よい。

【０００９】

【作用】この発明において、前段量子化と後段量子化と
に割り当てるビット数を適当に定めることにより、高能
率でかつ、現実的な計算量、記憶量のハードウェアで実
現可能とする。すなわち、前段量子化に線形フィルタ係
数を量子化するための全ビットを割り当てると、後段量
子化を使用しない従来と同様の量子化方法となり、後段
量子化にマトリクス量子化を用い、これに全ビットを割
り当てると、数組のフィルタ係数に直接マトリクス量子
化を適用する従来方法になる。既に指摘したように、前
者は計算量や記憶量の点で優れているが、性能的には限
界がある。一方、後者は性能の点では優れていると考え
られるが、そのままではハードウェア的な見地から好ま
しくない。そこで、この発明では、前者と後者とに適当
なビットを配分して、組み合わせることにより、現実的
でかつ高能率な量子化器を設計することができるように
したものである。

【００１０】

【実施例】以下、この発明の一実施例を図面を参照して
説明する。図１にこの発明による音声の線形予測パラメ
ータ符号化法の構成例を示し、図２にその再生側の構成
を示す。図１において、入力端子１からは、標本化され
たデジタル信号ｓ（ｔ）が入力される。線形予測分析部
２では、音声信号ｓ（ｔ）のＮ個のサンプルをいったん
データバッファに蓄えた後、これらのサンプルに対して
線形予測分析を行って、一組の線形予測係数ａ
_i（ｋ），（ｉ＝１，２，…，ｐ）を算出する。ここ
で、パラメータｐは分析次数と呼ばれ、一般には１０〜
１６程度の値が用いられる。また上記Ｎサンプルの単位
はフレーム更新周期または単にフレーム周期と呼ばれ
る。この結果、Ｎ個の入力サンプルに対してｐ個の線形
予測係数が出力されることになる。そこでここでは、線
形予測係数の時刻を表す単位として、Ｎ個のサンプルを
単位とした時間単位をｋで表し、「第ｋフレームのｉ次
の線形予測係数ａ _i（ｋ）」などと呼ぶことにする。な
お、これらの処理方法の詳細は、前述の古井の著書に記
載されている。

【００１１】線スペクトル対（ＬＳＰ）算出部３では、
ｐ個の線形予測係数を同じくｐ個の線スペクトル対、ｆ
_i（ｋ）に変換する。この実施例において線形予測係数
を線スペクトル対に変換したのは、線スペクトル対の性
質を用いると、より高品質な量子化結果が得られるから
である。しかし、この線スペクトル対算出部３は必ずし
も必要ではなく、線形予測係数ａ_i（ｋ）を直接バッフ
ァ部４に入力してもよい。また、線スペクトル対のほ
か、偏自己相関（ＰＡＲＣＯＲ）係数など、線形予測係
数と相互変換が可能な任意のパラメータに変換してもよ
い。

【００１２】バッファ部４では、ｐ個の線スペクトル対
をｍフレーム分、即ちｍ×ｐ個のパを蓄え、これらの値を前段量子化部５と後段量子化部と
してのマトリクス量子化部８とに供給する。図１では説
明を簡単にするため、ｍ＝４の場合について示した。

【００１３】前段量子化部５では、バッファ部４によっ
て供給されたｍ×ｐ個のパラメータのうち、最後のフレ
ームのｐ個のパラメータｆ_i（ｋ）を予め決められたビ
ット数Ｂ₁で量子化する。つまり予め決めた複数の代表
値の中の一つで表現する。なお、ここで用いる量子化法
は任意の方法を用いてよい。例えば図３に示す、ディレ
イドディシジョンを用いない多段ベクトル量子化法を用
いる。図は簡単のためＮ＝３段の場合について示す。多
段ベクトル量子化器は、符号帳２３_n（ｎ＝１，２，
３，…，Ｎ）、ベクトル加算器２７_n、歪判定部２８_n
を１組とする量子化段の直列的な組み合わせからなる。
ただし、１段目についてはベクトル加算器２７₁は不要
で省略されてある。

【００１４】まず、符号帳１（２３₁）の保持するＲ₁
個の各コードベクトルのうちｒ番目のベクトルをｃ_i
⁽¹⁾（ｒ）として順に歪判定部２８₁に送る。歪判定部
２８₁では予め定義された歪尺度に基づいて入力ベクト
ルｆ_i（ｋ），（ｉ＝１，２，…，ｐ）とｃ
_i ⁽¹⁾（ｒ）との歪を計算し、最も歪の小さくなったと
きのコードベクトルｃ_i ⁽¹⁾（ｒ₁）を１段目の量子化
値ｑ₁ ⁽¹⁾として出力する。次に２段目の量子化部で
は、符号帳２（２３₂）の保持するＲ₂個のコードベク
トルのうち、ｒ番目のベクトルをｃ_i ⁽²⁾（ｒ）とし、
これをベクトル加算式２７₂で１段目の量子化値ｑ_i
⁽¹⁾に加えてｑ_i ⁽¹⁾＋ｃ_i ⁽²⁾（ｒ）を求める。歪判
定部２８₂では、１段目と同様にしてｆ_i（ｋ）とｑ_i ⁽¹⁾＋ｃ_i ⁽²⁾（ｒ）との歪が最小となるｒをｒ₂として、ｑ_i ⁽²⁾＝ｑ_i ⁽¹⁾＋ｃ_i ⁽²⁾（ｒ₂）を２段目までの量子化値として決定する。同様にしてｎ
−１段目までの量子化値ｑ_i ^(n-1)が決まったとする
と、ｎ段目の量子化値ｑ_i ⁽ⁿ⁾は、ｆ_i（ｋ）とｑ_i ⁽ⁿ⁾＝ｑ_i ^(n-1)＋ｃ_i ⁽ⁿ⁾（ｒ_n）との歪が最小となるように決定する。こうして得られたＮ段目
までの量子化値（ベクトル）ｑ_i ^(N)をｆ_i（ｋ）の量
子化値ｆ_i ^*（ｋ）として出力する。

【００１５】少ない計算量でしかも量子化能率が高い点
から、図４に示すディレイドディシジョンにつき多段ベ
クトル量子化が好ましい。この量子化法の図３に示した
ものとの違いは、各量子化段で最適量子化値ｑ_i ⁽ⁿ⁾を
一意に決定してしまうのではなく、歪の小さい順にいく
つかの量子化値を量子化候補保持部３５_nに保持してお
く。そして次の段の歪判定部２８_n+1において前段の量
子化値としてどの候補を用いると歪が最も小さくなるか
を判断して前段の量子化値を決定する。具体的には、ｎ
−１段目までの量子化値の第ｕ番目候補をｑ
_i ^(n-1)（ｕ）とする。ｎ段目の符号帳のｒ番目のコー
ドベクトルをｃ_i ⁽ⁿ⁾（ｒ）とすると、まずｆ_i（ｋ）とｑ_i ^(n-1)（ｕ）＋ｃ_i ⁽ⁿ⁾（ｒ）との歪が最小となるようなｕをｕ_rとして決定する。こうして
すべてのｒについて上記ｕ_rを求めた後、ｒを変化させ
てｆ_i（ｋ）とｑ_i ^(n-1)（ｕ_r）＋ｃ_i ⁽ⁿ⁾（ｒ）との歪が小さい順にｎ段目のｕ番目の量子化候補ｑ
_i ⁽ⁿ⁾（ｕ）として保持する。

【００１６】一般にディレイドディシジョンつき多段ベ
クトル量子化は、最後段では量子化候補を保持する必要
がなく、最も歪の小さい量子化値に決定する。しかし請
求項２の発明では、上記ディレイドディシジョンつき多
段ベクトル量子化を、前段量子化器５として用いた場
合、後段量子化器であるマトリクス量子化においてもデ
ィレイドディシジョンを用いるため、最後段の後にも、
図４における最後段の歪判定部２８₃より複数の量子化
候補を出力させ、図１中の量子化候補保持部６に保持さ
せる。即ち、請求項２の発明では前段量子化部５として
図４のベクトル量子化器を用いる場合、その図４のベク
トル量子化の最後段目でも一意に量子化値を決定してし
まうのではなく、量子化候補保持部６にいくつかの候補
を残した後、図１におけるマトリクス量子化まで含めて
最適値となるように前段量子化値を決定する。そのため
の帰還を図１において歪判定部１０から量子化候補保持
部６に対して行う。

【００１７】図１において前段量子化部５でｆ_i（ｋ）
が量子化された値ｆ_i ^*（ｋ）は、バッファ部７と補間
部８とに供給される。バッファ部７では、既に量子化さ
れたｆ_i ^*（ｋ）のｍフレーム前の値ｆ_i ^*（ｋ−ｍ）
を保持し、これを補間部８へ供給する。補間部８では、
ｆ_i ^*（ｋ−ｍ）とｆ_i ^*（ｋ）との値とから、線形補
間によってこれら間の各フレームにおける量子化値ｆ_i
^*（ｋ−ｊ）（ｊ＝ｍ−１，ｍ−２，…，２，１）を推
定する。即ち、ｆ_i ^*（ｋ−ｊ）＝ｆ_i ^*（ｋ）＋ｊ・Δｆ_i ^* ただし、 Δｆ_i ^*＝〔ｆ_i ^*（ｋ−ｍ）−ｆ_i ^*（ｋ）〕／ｍで表される。

【００１８】補間部８によって推定された推定値ｆ_i ^*
（ｋ−ｊ）（ｊ＝ｍ−１，ｍ−２，…，２，１）とｆ_i
^*（ｋ）との各パラメータは、マトリクス量子化部９に
供給される。マトリクス量子化部９は上記ｆ_i ^*（ｋ−
ｊ）（ｊ＝ｍ−１，ｍ−２，…，１，０）の値と、バッ
ファ部４から出力されている真の値ｆ_i（ｋ−ｊ）とか
ら、最適量子化値Ｆ_ij ^*（ｋ′）と歪尺度ｄ_minとを出
力する。このマトリクス量子化部９の構成例を図５に示
す。符号帳４１はマトリクス量子化に割り当てられたビ
ット数に対応する数のコードマトリクスを保持してい
る。割り当てられるビット数をＢＭＱとすると、符号帳
４１に保持するコードマトリクスの数は、Ｒ_MQ＝２^BMQ
である。符号帳４１は、上記Ｒ_MQ個のコードマトリクス
を順に行列加算器４２に供給する。このとき、符号帳４
１から供給されるｒ番目のコードマトリクスをＣ _ij ^(MQ)
（ｒ）とする。行列加算器４２は、このＣ_ij ^(MQ)（ｒ）
と、前段量子化値と推定値ｆ_i ^*（ｋ−ｊ）（ｊ＝ｍ−
１，ｍ−２，…，２，１，０）とを加算して、マトリク
スＵ_ij（ｒ）を生成する。即ち歪判定部４３では、上記Ｕ_ij（ｒ）とバッファ部４から
の入力される真の値ｆ_i（ｋ−ｊ）との歪をはかり、歪
が最も小さくなるコード番号ｒ_MQを決定し、そのときの
Ｃ_ij ^(MQ)（ｒ_MQ）と歪ｄ_minとを出力する。歪尺度に
は、ＬＳＰユークリッド距離、重み付きＬＳＰユークリ
ッド距離、ケプストラム距離など、任意の尺度を用いて
よい。例えば、重み付きＬＳＰユークリッド距離なら
ば、ただし、最初のΣはｊ＝０からｍ−１まで、次のΣはｉ
＝１からｐまで、ｗ_ijは重み係数で、適当に定めること
によって量子化性能を高めることができる。例えば、とする。また、ケプストラム距離を用いる場合には、ｆ
_i（ｋ−ｊ）（ｉ＝１，２，…，ｐ）とＵ_ij（ｒ）をそ
れぞれケプストラムｆ_i ^c（ｋ−ｊ）とＵ_ij ^c（ｒ）
（ｉ＝１，２，…，ｎ_c）に変換した後ユークリッド距
離を求めればよい。ここで、ｎ_cはケプストラム次数と
呼ばれ、通常は分析次数ｐ〜３０程度の間の値が用いら
れる。

【００１９】前段量子化部５で１つの量子化値ｆ
_i ^*（ｋ）のみを出力する場合はｄ_minを出力すること
なく、マトリクス量子化部９で量子化したＦ
_ij ^*（ｋ′）を出力すればよい。前段量子化部５で複数
の候補を出力する場合は、マトリクス量子化部９の出力
ｄ_minは、前段の量子化部の量子化候補保持部６へ帰還
される。量子化候補保持部６は、図３又は図４中の歪判
定部２８ ₃における歪の小さい順にＭ個量子化候補を保
持し、マトリクス量子化部９から帰還するｄ_minの値が
最小となるｆ_i ^*（ｋ；ｕ）を最適な前段の量子化値ｆ
_i ^*（ｋ）として出力する。これを前述のように、ディ
レイドディシジョンと呼ぶ。なお、量子化候補保持部６
における候補の数Ｍは、前述のように大きいほどこの発
明の性能を高めることができるが、逆に計算量が増大し
ハードウェアに負担がかかる。そこで、Ｍは性能があま
り劣化しない範囲でできるだけ小さい数がよく、通常４
〜８程度の値を用いる。なお、Ｍ＝１ならばディレイド
ディシジョンを用いない場合に等しい。

【００２０】こうして、線形フィルタ係数分析部１２か
ら前段の量子化値ｆ_i ^*（ｋ）とマトリクス量子化値Ｆ
_ij ^*（ｋ′）とが出力される。これと前段量子化値ｆ_i
^*（ｋ）とが符号化部１３で符号化され、伝送又は蓄積
などされる。再生側では、図２に示すように符号化側に
よって伝送または蓄積された符号を復号化部１４で復号
し、それぞれｆ_i ^*（ｋ）とＦ_ij ^*（ｋ′）、を得る。
このうちｆ_i ^*（ｋ）は、補間部１６とバッファ部１５
とに供給される。バッファ部１５は、バッファ部７と同
様に、ｆ_i ^*（ｋ）のｍフレーム前の値ｆ_i ^*（ｋ−
ｍ）を蓄え、補間部１６に供給する。補間部１６補間部
８と同様の動作をし、ｆ _i ^*（ｋ）とｆ_i ^*（ｋ−ｍ）
とから線形補間によって、ｆ_i ^*（ｋ−ｊ）（ｊ＝ｍ−
１，ｍ−２，…，１）を推定する。即ち、を得る。ここでｆ′_i（ｋ−ｊ）は線スペクトル対ｆ_i（ｋ−ｊ）の量子化値に相当す
る。このｆ′_i（ｋ−ｊ）の組は、バッファ部１８に送
られる。バッファ部１８ではｍ×ｐ個のパラメータｆ′
_i（ｋ−ｊ）を蓄え、ｆ′_i（ｋ−（ｍ−１））、ｆ′
_i（ｋ−（ｍ−２））、…、ｆ′_i（ｋ）の順に１フレ
ーム（ｐ個）ずつフィルタ係数変換部１９に出力する。
フィルタ係数変換部１９は受け取ったｆ′_i（ｋ）、即
ち線スペクトル対を線形予測係数ａ′_i（ｋ）に変換す
る。

【００２１】以上の手順によって線スペクトル対が量子
化される様子を図６に模式的に示す。図６（ａ）は音声
波形を表す。線形予測分析は音声波形の下に枠で示すよ
うなフレームと呼ばれる一定の長さを単位として行わ
れ、Ｎサンプルずつフレームの位置をずらしながら分析
を続ける。各分析フレーム毎に得られたｐ個の線形予測
係数をｐ個の線スペクトル対（ＬＳＰ）に変換したもの
を図６（ｂ）に黒丸印で示す。周波数の低い方から順に
１次、２次、…、ｐ次のＬＳＰと呼ぶ。ここでは簡単の
ため、ｐ＝４として図示したが、実際の分析では、分析
次数ｐとして１０〜１６の値が用いられる。図のよう
に、線スペクトル対（ＬＳＰ）の値は時間とともに緩や
かに変化し、異なる次元のパラメータが互いに交差する
ことはない。この実施例ではこの線スペクトル対の緩や
かに変化する性質を利用して高品質な量子化を実現す
る。

【００２２】まずはじめに、ｍフレームに１回のｐ個の
線スペクトル対をひとまとめにしてベクトル量子化（Ｖ
Ｑ）する。これを図６（ｂ）に白丸印で示す。図はｍ＝
３の場合である。次に上記ベクトル量子化（ＶＱ）した
結果の量子化値を線形に補間する。これを図６（ｃ）に
破線で示す。このような線形補間だけでは図６（ｃ）に
示すように、ベクトル量子化しなかったフレームの線ス
ペクトル対は誤差が大きくなってしまう。そこで真の線
スペクトル対と破線で示される補間値との誤差をｐ個ず
つｍフレーム分、図６（ｃ）ではそれぞれ黒丸印と斜線
丸印とで示される１２個ずつのデータと破線との誤差を
ひとまとめにしてマトリクス量子化（ＭＱ）する。

【００２３】通信路または蓄積装置では、上記ベクトル
量子化値とマトリクス量子化値とを適当な符号で表現し
て伝送または蓄積する。再生側ではまずｍフレーム毎に
ベクトル量子化値を再生し、線形補間した後、マトリク
ス量子化値を線形補間値に加算して量子化されたｐ個の
線スペクトル対の組が再生される。

【００２４】なお、この発明は、全部を論理回路の組み
合わせによるハードウェアで実現してもよいし、一部ま
たは全部をマイクロプログラムを含めた、ソフトウェア
によって実現してもよい。変形例ベクトル量子化値を線
形補間する際に、ｍフレーム前のベクトル量子化値と線
形補間するのではなく、ｍフレーム前のマトリクス量子
化値を加えた値と現在のフレームのベクトル量子化値と
を線形補間すれば、符号帳作成手順は多少複雑になる
が、補間がより正確に行われマトリクス量子化の効率が
よい。

【００２５】また、補間部８および補間部１６におい
て、ｆ_i ^*（ｋ）とｆ_i ^*（ｋ−ｍ）とから線形補間に
よってｆ_i ^*（ｋ−ｊ），ｊ＝ｍ−１，ｍ−２，…，１
を推定すると推定が十分でない場合がある。そこでｆ_i
^*（ｋ）とマトリクス量子化値とを加えて既に量子化さ
れたｆ′_i（ｋ−ｍ）、ｆ′_i（ｋ−（ｍ＋１））の３
点から二次曲線で補間してもよいし、更に前の値を使っ
て最小二乗法で推定してもよい。

【００２６】前記実施例では、前段量子化値としてｆ_i
（ｋ）とｆ_i ^*（ｋ）との歪が最小になるようにｆ_i ^*
（ｋ）を決定した後、補間によってｆ_i ^*（ｋ−ｊ），ｊ＝ｍ−１，ｍ−２，…，１を推定しているが、補間する事を前提として前段の量子
化値を決定してもよい。即ち、ｆ_i（ｋ−ｊ），ｊ＝ｍ−１，ｍ−２，…，１，０とｆ_i ^*（ｋ−ｊ），ｊ＝ｍ−１，ｍ−２，…，１，０との歪が最小になるようにｆ_i ^*（ｋ）を決定する。な
お、ｆ_i（ｋ−ｊ）とｆ _i ^*（ｋ−ｊ）との歪尺度は適
当に定める。例えば重み付きＬＳＰユークリッド距離な
らば、ただし、最初のΣはｊ＝０からｍ−１まで、次のΣは
ｉ＝１からｐまで、ｆ₀ （ｋ−ｊ）＝０．０、ｆ_p+1（ｋ−ｊ）＝π のようにする。この場合は若干計算量が増大するが、量
子化性能は良い。上記効果はディレイドディシジョンの
候補数を十分多くとることによって包含されるが、ディ
レイドディシジョンの候補数を増やすよりは計算量の増
大は少ない。

【００２７】このほか前記実施例では、ベクトル量子化
をしたフレームにおける誤差も含めてマトリクス量子化
をしたが、ベクトル量子化にある程度十分なビットを割
り当てれば、ベクトル量子化したフレームはそのままに
して、純粋に補間されたフレーム（ｍ−１フレーム分）
における誤差のみをマトリクス量子化してもよい（マト
リクス量子化の負担が軽減される）。

【００２８】この発明を例えばディジタル自動車電話な
ど非常に品質の悪い通信路に応用する場合を考える。上
記通信路では伝送符号誤りが頻繁に生じ、再生された音
声に重大な劣化を招く。前記実施例では補間部８及び１
６において、過去に伝送したｆ_i ^*（ｋ−ｍ）を用いてｆ_i ^*（ｋ−ｊ），ｊ＝ｍ−１，ｍ−２，…，２，１の値を推定するため、もしｆ_i ^*（ｋ−ｍ）が伝送誤り
によって重大な劣化を生じた場合には、送信側と受信側
とで推定値ｆ_i ^*（ｋ−ｊ），ｊ＝ｍ−１，ｍ−２，…，２，１が異なる値に推定され、重大な劣化が後のフレームまで
伝搬するおそれがある。そこでこのような重大な劣化の
おそれのある場合には、ｆ_i ^*（ｋ）とｆ_i ^*（ｋ−
ｍ）の値を用いて間の値を補間によって推定することを
やめ、これから伝送すべきフレームの値のみを用いて量
子化した方がよい。図１における線形フィルタ係数分析
部１２の変形例を図７に示す。図１と対応する部分に同
一符号を付けてある。バッファ部４より得られたｍフレ
ーム分の線スペクトル対の値、は平均ＬＳＰ算出部４６に供給され、ｊについての平均
された線スペクトル対ｆ_i ^(ave)，ｉ＝１，２，…，ｐを得る。これを前段量子化部５と同様に例えばベクトル
量子化する。上記量子化値の第ｕ番目の候補をｆ_i
^(ave)*（ｕ）として、ｆ_i ^(ave)との歪の小さい順にい
くつかを量子化候補保持部６に保持して、マトリクス量
子化部９に供給する。このとき図１では補間された値ｆ_i ^*（ｋ−ｊ），ｊ＝ｍ−１，ｍ−２，…，１とｆ_i ^*（ｋ）をマトリクス量子化部９に供給したが、
ここではのように各フレームを同じ値として供給する。再生側で
も同様に補間部１６の出力ｆ_i ^*（ｋ−ｊ），ｊ＝ｍ−１，ｍ−２，…，１，０として入力する。図７に示す方法の場合、符号誤りのな
いところでは図１に比べて性能が劣化するが、ある時刻
における符号誤りによる劣化が後のフレームに伝搬する
ことはない。

【００２９】図７に示す例の更に簡単な構成の一例を図
８に示す。図７では平均ＬＳＰ算出部４６によってこれ
から量子化すべきｍフレーム分の平均ＬＳＰを求め、前
段量子化部４７で例えばベクトル量子化しているが、図
８ではこれから量子化すべきｍフレーム分の線スペクト
ル対のうち、あるフレームｊの線スペクトル対のみ前段
量子化部５で量子化する。この量子化値（ベクトル）をｆ_i ^*（ｋ−ｊ），ｊ＝ｍ−１，ｍ−２，…，１，０の推定値として図７と同様にしてマトリクス量子化部９
に供給する。この構成では図７に示した構成よりも線ス
ペクトル対の平均を求めない分、ハードウェア的に簡単
にできるうえ、図１に示す前段量子化部５と図８に示す
前段量子化部５とを同一にできるメリットがある。

【００３０】ここまではこの発明の音声符号化への適用
例を示したが、この他に音声合成、音声認識、話者認識
等の音声の音響的特徴を表現する一手法としても応用で
きることは明らかである。

【００３１】

【発明の効果】この発明による線形予測パラメータ符号
化方法の効果を調べるために、以下の条件で音声分析合
成実験を行った。０．３〜３．４ｋＨｚ帯域（電話帯
域）の音声を標本化周波数８ｋＨｚで標本化した後、入
力端子１に入力する。線形予測分析部２では、音声信号
に分析窓長３２ｍｓのハミング窓を乗じ、分析次数をｐ
＝１０〔次〕として自己相関法による線形予測分析を行
う。フレーム更新周期は１０ｍｓ、即ちＮ＝８０〔サン
プル〕、前段量子化の周期とマトリクス量子化の単位と
は４０ｍｓ、即ちｍ＝４〔フレーム〕とした。前段量子
化には、ディレイドディシジョン付き多段ベクトル量子
化を用い、ディレイドディシジョンの候補数は４つとし
た。段数は３段で、１、２段目に８ビット、３段目には
６ビットを割当て、前段量子化のための合計ビット数は
２２ビットとした。ただし、前段量子化のビット数を２
２ビット以外にする場合には、３段目を可変にし、２４
ビットを越える場合には１段増やして４段とし、３段目
を８ビットにして４段目を可変とした。

【００３２】前段量子化及びマトリクス量子化における
歪判定部に用いる距離尺度には、重み付きＬＳＰユーク
リッド距離とケプストラム距離を用い、各性能を比較し
た。性能そのものは後者の方が優れていることがわかっ
たが、後者はＬＳＰをいったんケプストラムに変換して
ユークリッド距離をとらなければならない分計算量が多
く、性能にあまり大きな差がなければ前者の方がハード
ウェア的な面で優れている。

【００３３】前段量子化であるベクトル量子化と、マト
リクス量子化のための各符号帳は、重み付きＬＳＰユー
クリッド距離を用いたＬＢＧアルゴリズムにより別途作
成した。なおＬＢＧアルゴリズムについては、文献Ｙ．
Ｌｉｎｄｅ，Ａ．ＢｕｚｏａｎｄＲ．Ｍ．Ｇｒａｙ：
“ＡｎＡｌｇｏｒｉｔｈｍｆｏｒＶｅｃｔｏｒ
ＱｕａｎｔｉｚｅｒＤｅｓｉｇｎ”，ＩＥＥＥＴｒ
ａｎｓ．Ｃｏｍｍｕｍ．ＣＯＭ−２８，ｐ．ｐ．８４−
９５１９８０に記載されている。

【００３４】この発明の効果は、再生された音声の品質
によって評価されるべきであるが、この発明による線形
予測パラメータの量子化性能が採用した音源パラメータ
の表現方式（性質）によって左右されることを防ぎ、純
粋にスペクトル再現性の効果を評価するため、今回の実
験では、評価尺度としてケプストラム歪尺度を用いた。
この尺度は、スペクトルの歪具合をデシベル単位で表し
たものに相当し、ケプストラム歪の値が小さいほど良好
な性能を有することを示す。

【００３５】図９は従来の方法である前段量子化のみ
（マトリクス量子化なし）で、前段量子化の周期を１０
ｍｓ（１フレーム）から６０ｍｓ（６フレーム）まで変
えたときのケプストラム歪の変化を示したものである。
この図からわかるように、前段量子化の周期を広げるほ
ど伝送または蓄積のための情報量を削減することができ
るが、逆に歪が増大していくことがわかる。

【００３６】図１０は、この発明を用いた結果で、前段
量子化は前記２２ビットのまま、この他に、マトリクス
量子化に６〜１０ビットを割り当てた場合の結果であ
る。図９と図１０とより、マトリクス量子化ＭＱに６ビ
ット程度割り当てるだけでも歪が１．８ｄＢ以下とな
り、３０ｍｓ（３フレーム）に１回前段の量子化のみを
する場合の歪１．９５ｄＢよりもはるかに優れ、マトリ
クス量子化に１０ビット割り当てれば歪が１．６ｄＢ程
度に小さくなり、２０ｍｓ（２フレーム）に１回前段の
量子化のみをするのに匹敵する性能が得られることがわ
かる。即ち、この発明を用いれば、２２ビットで２０ｍ
ｓ毎に多段ベクトル量子化をするのに比べて、同程度の
品質が４０ミリで（２２＋１０）ビットでよく、従来方
式に対し４４分の３２の情報量（ビットレート）で実現
でき、２８％の情報量削減になる。

【００３７】図１１は、線形予測パラメータの量子化の
ために合計３０ビットが割り当てられたと仮定した場合
に、前段量子化（ベクトル量子化）と後段量子化（マト
リクス量子化）とに割り当てるビットの割合を変えて、
歪を求めたものである。全ビットを前段量子化に割り当
てた場合に比べて、いくらかをマトリクス量子化に割り
当てた方がはるかに良い結果が得られ、この発明の有効
性が示される。図より、マトリクス量子化に割り当てる
ビット数を増やすと歪が徐々に減少するが、８〜１０ビ
ットのあたりでは減少率は小さくなる。マトリクス量子
化にあまり多量のビットを割り当てることは、計算量の
増大につながり、今回の実験は１０ビットまでとした
が、図１１の結果よりそれほど多量のビットをマトリク
ス量子化に割当なくとも、８〜１０ビット程度を割り当
てるだけで、十分高性能が維持できることが推測され
る。

【００３８】この発明の効果は、線形予測パラメータを
量子化する場合に、ベクトル量子化などの従来方法を一
定周期毎に適用する方法に比べて、それほど計算量を増
大させることなく、同一情報量の場合にはより高品質な
量子化結果を与える。また、同程度の品質を実現するた
めにはより少ない情報量で実現することができる。

【図面の簡単な説明】

【図１】この発明による線形予測パラメータ符号化法の
一例を示す構成図。

【図２】図１に示した符号化法に対する再生側の復号化
法の構成を示すブロック図。

【図３】前段量子化法としての多段ベクトル量子化法を
示すブロック図。

【図４】前段量子化法としてのディレイドディシジョン
付き多段ベクトル量子化法の構成例を示すブロック図。

【図５】マトリクス量子化法の一例を示す構成図。

【図６】この発明によって線スペクトル対が量子化され
る過程を模式的に説明するための図。

【図７】補間をしない変形例を示す構成図。

【図８】図７より更に簡単にした変形例を示す構成図。

【図９】従来法の範囲内で情報量を削減しようとしたと
きの品質の劣化を調べた実験結果を示すグラフ。

【図１０】この発明を適用したときの実験結果のグラフ
で、前段量子化のビット数を２２ビットに固定し、マト
リクス量子化のビット数を可変にした図。

【図１１】この発明を適用したときの実験結果のグラフ
で、全ビットを３０ビットに固定した場合に前段量子化
とマトリクス量子化とに割り当てるビット数の割合を変
えたときの歪の変化を示した図。

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平１−215141（ＪＰ，Ａ) 特開平１−240031（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 19/00 - 19/14 H03M 7/30 H04B 14/04

Claims

(57)【特許請求の範囲】

【請求項１】音声スペクトル包絡特性を表す線形予測
パラメータを符号化する符号化方法において、上記線形予測パラメータを粗い時間間隔ｍＴ（ｍは２以
上の整数）で算出し、その算出した線形予測パラメータ
を予め決められた複数の代表値の中の一つで表現する前
段符号化過程と、上記粗い時間間隔ｍＴよりも狭い時間間隔Ｔにおける上
記線形予測パラメータを上記粗い時間間隔ｍＴごとの代
表値より推定する過程と、その推定値と、上記狭い時間間隔Ｔの各時刻で算出した
真の線形予測パラメータとの誤差が最小となる代表値
を、予め決められた複数の代表値の中から選択する後段
符号化過程とを有し、上記線形予測パラメータを上記前段符号化過程で得られ
た代表値と上記後段符号化過程で得られた代表値とによ
って表現することを特徴とする音声の線形予測パラメー
タ符号化方法。
【請求項２】上記前段符号化過程で線形予測パラメー
タを表現する代表値として誤差の小さい順に複数の候補
を残し、上記後段符号化過程では、これら候補の各々に対して誤
差最小の代表値を決め、これら上記各候補とその対応す
る後段符号化過程とによって表現される線形予測パラメ
ータと真の線形予測パラメータとの誤差が最小となる組
合せを前段符号化過程の代表値と後段符号化過程の代表
値とを最終的に決定することを特徴とする請求項１記載
の音声の線形予測パラメータ符号化方法。
【請求項３】上記狭い時間間隔Ｔの推定値と、同時刻
における真の線形予測パラメータとの誤差を、狭い時間
間隔Ｔの各時刻でパラメータ次元方向にまとめてベクト
ル形式で表現し、これらベクトルを連続する時間間隔Ｔ
ごとの複数の時刻でまとめた行列形式で上記後段符号化
過程における代表値を表現することを特徴とする請求項
１または２記載の音声の線形予測パラメータ符号化方
法。
【請求項４】上記線形予測パラメータを線スペクトル
対と呼ばれるパラメータで表現し、上記推定過程で推定される上記推定値に、上記後段符号
化過程の代表値を加算することによって線形予測パラメ
ータを表現することを特徴とする請求項１乃至３の何れ
かに記載の音声の線形予測パラメータ符号化方法。
【請求項５】上記推定値を、前段符号化過程でｍＴご
とに得られた隣接する代表値から線形補間法によって決
定することを特徴とする請求項１乃至３の何れかに記載
の音声の線形予測パラメータ符号化方法。