WO1990013112A1

WO1990013112A1 - Voice encoder

Info

Publication number: WO1990013112A1
Application number: PCT/JP1990/000199
Authority: WO
Inventors: Masami Akamine; Kimio Miseki
Original assignee: Kabushiki Kaisha Toshiba
Priority date: 1989-04-25
Filing date: 1990-02-20
Publication date: 1990-11-01
Also published as: US5265167A; DE69029120D1; USRE36721E; EP0422232A4; EP0422232B1; EP0422232A1; DE69029120T2

Description

明細書音声符号化装置技術分野

この発明は、音声信号を髙能率で圧縮して符号化する音声符号化装置に係り、特に伝送ビットレートを低く、例えば 10Kb/s以下にできる適応密度駆動パルス列に基づく音声符号化装置に関する。

背景技術

, 現在、音声信号を 10Kb/s以下の低ビットレートで伝送する符号化技術が盛んに検討されている力《、その具体的方法として、一定間隔で並んだパルス列で音声合成フィルタの駆動信号を表現し、これを用いて符号化を行う方式がある。この詳細につレヽては、 PETER KR00N氏らによる IEEE会報、 1986年 10月、 Vol. ASSP-34, pp. 1054 - 1063に掲載の " Regu 1 ar - Pu 1 se

Excitation - A Novel Approach to Effective and

Efficient Multipulse Coding of Speech,，と題した論文（文献 1 ) に説明されている。

この論文に記載の音声符号化方式を第 1 図および第 2 図を用いて説明する。第 1 図および第 2 図はこの方式の符号化装置と復号化装置のプロック図である。

第 1 図において、予測フィルタ 1 の入力信号は Aノ D変換された音声信号系列 s (n)である。予測フィルタ 1 は s (n)の過去の系列と予測ノラメータ a i ( l ≤ i p ) を用い、次式に示されるよう予測残差信号 r (n)を計算し、出力する。 r (n) = s (n)— , a i - s ( n- i ) ··· ( 1 )

i = 1 ここで、 p は予測フィルタ 1 の次数であり、上述した論文では P = 12としている。予測フィルタ 1 の伝達関数 A (z)は次のように表わされる。

A ( Z) = 1 - £ ^ K · Z -^κ … (2) 駆動信号生成回路 2 は、予め定められた間隔で並んだ駆動パルス列 V (n)を駆動信号として発生する。この駆動パルス列 V ( n )のノターンの一例を第 3 図に示す。この図における K はパルス系列の位相を示し、各フレームにおける最初のノルスの位置を表わす。また、横軸は離散的な時刻を表わす。ここでは、 1 フレームの長さを 40サンプル（サンプリング周波数」8KHzで 5ms) 、パルスの間隔を 4 サンプルとした場合について示してある。

減算器 3 は、予測残差信号 r (n)と駆動信号 V (η)との差 e (n)を計算し、聴感重み付けフィルタ 4 へ出力する。このフィ' タ 4 は聴覚のマスキング効果を利用するために _e (ri)を周波数領域で整形するためのものであり、その伝達関数 W (z)は次式で与えちれる。

W ( z ) = 1 / A (zZ r)

= I / ( 1 - ^ Κ · Γ ^κ · Ζ - …（3)

( ただし、 0 ≤ r ≤ 1 )

重み ^！けフィルタやマスキング効果に関しては、例えば古井貞照著 I "ディジタル音声処理」 1985年東海大学出版会発行 (文献 2 ) に記述されているので、ここでは説明を省略する。重み付けフィルタ 4 によって重み付けされた誤差 e ' (n)は、誤差最小化回路 5 に入力される。この誤差最小化回路 5 は、 e ' (II)の 2 乗誤差が最小となるように駆動パルス列の振幅と位相を決定する。駆動信号生成回路 2 は、これら振幅と位相の情報を基に駆動信号を発生させる。誤差最小化回路 5 における駆動パルス列の振幅と位相の決定手順を文献 1 の記述に従って、以下に簡単に説明する。

まず、フレーム長を L サンプル、 1 フレーム中の駆動パルス数を Q個とし、駆動パルスの位置を表わす Q X L の行列を M Kとおく。 1^ の要素 111 は、次のように表わされる。また、 K は前述したように駆動パルス列の位相である。

m i j = 1 ； j = i X N + K — 1 のとき

m i j = 0；その他

0 ≤ 1 ≤ Q - 1 … ） 0 ≤ j ≤ L - 1

( ただし、 N = L / Q )

次に、位相 Kの駆動信号（駆動パルス列）の非零の振幅を要素とする行べクトルを b ^(K> とおくと、位相 Kの駆動信号を表わす行ベクトル u ^(K) は、次式のように表わされる。

u ( K ) = _b ( κ ) _Μ κ … （5)

重み付けフィルタ 4 のィンパルス応答を要素とする次の L X L 行列を H とおく。

このとき、重み付けされた誤差 e ' (n)を要素とする誤差べクトル e ^(κ > は、次式で記述される。

e <^κ > - _e 《ο) 一 b ） … （7)

( ただし、 K = 1, 2， … N )

ここで、 e ⁽⁰⁾ = e ₀ + r H … （8)

. H M _KH 〜（9)

ベクトル e 。は前フレームにおける重み付けフィルタの内部状態による重み付けフィルタの出力であり、べクトル r は予測残差信号ベクトルである。最適な駆動パルスの振幅を表わすベクトルは、次式で表わされる 2 乗誤差

E = e "》 e 《^κ> * ' … （ 10) を b " >で偏微分し、零とおくことにより、次式のように得られる，

<" .= e <^¾} H [ Η RH Κ*] -¹ - (11)

(ただし、 t は転置を示す）

このとき、駆動パルス列の位相 K は、次式を各 K について計算し、 E ( ^κ >が最小となるように選ぶ。

_E "〉 _{= e} (。） [ H R* [ H KH K*] -¹ H K ] e - (12) このようにして駆動パルス列の振幅および位相が決定される。次に、第 2 図に示した復号化装置について説明する。第 2 図において、駆動信号生成回路 7 は第 1 図の駆動信号生成回路 2 と同じものであり、符号化装置から伝送され入力端子 6 に入力された駆動パルス列の握幅と位相を基に駆動信号を発生する。合成フィルタ 8 は、この駆動信号を入力として合成音声信号 s ( n )を生成し、出力端子 9 へ出力する。合成フィルタ 8 は第 1 図の予測フィルタ 1 と逆フィルタの関係にあり、その伝達関数は 1 Z A ( z )である。

以上説明した従来例の符号化方式においては、伝送すべき情報は合成フィルタ 8 のパラメータ a i ( 1 ≤ i ≤ p ) と駆動ノルス列の振幅および位相であリ、駆動パルス列の間隔 N = L Z Q を変えることによって、伝送レートを自由に設定できる。しかしながら、この従来方式による実験結果では、伝送レートが低く、特に 1 0k b / s以下になると、合成音声に雑音が目立ち、品質が悪くなる。特に、ピッチ周期の短い女性の声で実験を行ったときの品質劣化が目立つ。

この原因は、駆動パルス列を常に一定間隔のパルス列で表現しているためである。すなわち、音声信号は、有声音の時、ピッチによる周期的な信号となるため、その予測残差信号もピッチ周期每にパワーが大きくなる周期的な信号となる。このように周期的にパワーが大きくなる予測残差信号では、ノヮ一の大きい部分が重要な情報を含んでいる。また、音韻等の劣化に伴って音声信号の相関が変わる部分や、発声の開始部分等、音声信号のパワーが大きくなる部分では、予測残差信号のノヮーもフレーム内で大きくなる。この場合も、残差信号のパワーの大きい部分は、音声信号の性質が変化した部分である-ので、重要である。

ところが、従来の方式では予測残差信号のパワーがフレーム内で変化しているにも関わらず、フレーム内で常に一定の間隔を持つ駆動パルス列で合成フィルタを駆動して合成音声を得ているため、合成音声の品質が著しく劣化してしまう。

上述したように、従来の音声符号化方式はフレーム内で常の一定の間隔を持つ駆動パルス列で合成フィルタを駆動しているため、伝送レートが低くなリ、例えば 1 0 k b / s以下になると、合成音声の品質が劣化するという問題点があった。

本発明はこのような問題に鑑みてなされたもので、低い伝送レートにおいても高品質の合成音声が得られる音声符号化装置を提供することを目的とする。

発明の開示

本発明は、駆動信号により合成フィルタを駆動して合成音声を得る音声符号化装置において、駆動信号のフレームを複数の等長または不等長のサブフレームに分割し、パルス間隔がサブフレーム単位で可変であり、各サブフレーム内では等間隔の駆動パルス列によって駆動信号を構成し、駆動信号によリ駆動される合成フィルタの出力信号と入力音声信号との誤差信号のパワーが最小となるように駆動パルス列の振幅または振幅および位相を決定するようにすると共に、入力音声信号に対する短期予測残差信号またはピッチ予測残差信号に基づいて駆動パルス列の密度を決定する。

本発明では駆動ルス列の密度、すなわちパルス間隔力重要な情報または多くの情報が含まれるサブフレームでは密に、そうでないサブフレームでは粗くとレヽうようにサブフレ一ム每に適応的に変化することにより、合成音声の品質が向上する。

図面の簡単な説明

第 1 図、第 2 図は従来技術による符号化装置、復号化装置の構成を示すブロック図、第 3 図は従来技術の駆動信号の例を示す図、第 4 図はこの発明による音声符号化装置の第 1 実施例に係る符号化装置の構成を示すブロック図、第 5 図は第 4 図における駆動信号生成部の詳細なブロック図、第 6 図は

'第 1 実施例に係る復号化装置の構成を示すブロック図、第 7 図はこの発明の第 2 実施例で生成される駆動信号の一例を示す図、第 8 図は第 2 実施例に係る符号化装置における駆動信号生成部の詳細なブロック図、第 9 図はこの発明の第 3 実施例に係る符号化装置のブック図、第 1 0 図は第 3 実施例における予測フィルタのブロック図、第 1 1 図は第 3 実施例に係る復号化装置のブロック図、第 1 2 図は第 3 実施例で生成される駆動信号の一例を示す図、第 1 3 図はこの発明の第 4 実施例に係る符号化装置のブロック図、第 1 4 図は第 4 実施例に係る復号化装置のブロック図、第 1 5 図はこの発明の第 5 実施例に係る符号化装置のブロック図、第 1 6 図は第 5 実施例に係る複号化装置のブロック図、第 1 7 図は第 5 実施例における予測フィルタのブロック図、第 1 8 図は第 5 実施例で生成される駆動信号の一例を示す図、第 1 9 図はこの発明の第 6 実施例に係る符号化装置のブロック図、第 2 0 図はこ . の発明の第 7 実施例に'係る符号化装置のブロック図、第 2 1 図はこの発明の第 8 実施例に係る符号化装置のプロック図、 2 2 図はこの発明の第 9 実施例に係る符号化装置のプロック図、第 2 3 図は第 9 実施例に係る復号化装置のブロック図、第 2 4 図は第 9 実施例の符号化装置における短期べクトル量子化回路の詳細なブロック図、第 2 5 図は第 9 実施例の復号化装置における駆動信号生成回路の詳細なプロック図、第 2 ' 6 図はこの発明の第 1 0 実施例に係る符号化装置のブロック図、第 2 7 図はこの発明の第 1 1 実施例に係る符号化装置のブロック図、第 2 8 図はこの発明の第 1 2 実施例に係る符号化装置のブロック図、第 2 9 図は予測フィルタ、合成フィルタを構成する極零モデルのブロック図、第 3 0 図は第 2 9 図スム ^ " ジング回路の詳細なブロック図、第 3 1 図、第 3 2 図は第 2 9 図の極零モデルの周波数特性を従来例と比較して示す図、第 3 3 図〜第 3 6 図は他の極零モデルのブロック図である。

' 発明を実施するための最良の形態

以下、図面を参照して、この発明による音声符号化装置の実施例を説明する。

第 4 図は第 1 実施例に係る符号化装置を示すプロック図である。 A Z D 変換された音声信号 s ( n )がフレームバッファ 1 0 2 に入力される。フレームノッファ 1 0 2 は、音声信号 ... s ( n )を：1 フレーム分蓄積する。第 4 図の各構成要素は 1 フレ一ム每に以下の処理を行う。

. 予測パラメーダ計算回路 1 0 8 は、フレームノッファ 1 0 2 からの音声信号 s (n)を入力し、予め定められた p 個の予測ノラメータ（ α ノラメータ又は k ノ S ラメータ）を自己相関法又は共分散法により計算する。求められた予測パラメータは予測パラメータ符号化回路 1 1 0 に入力される。予測パラメータ符号化回路 1 1 0 は、予測パラメータを予め定められた量子化ビット数に基づいて符号化し、この符号を復号化回路 1 1 2 とマルチプレクサ 1 1 8 に出力する。復号化回路 1 1 2 は入力した予測パラメータの符号を復号化し、復号値を予測フィルタ 1 0 6 と駆動信号生成部 1 0 4 に入力する。予測フィルタ 1 0 6 は、音声信号 s (n)と復号化された予測パラメータとして例えば α ノラメ一タ ^ iを入力し、次式に従って予測残差信号 r (n)を計算し、 r (n)を駆動信号生成部 1 0 4 に出力する。 r (n) = s (n) - £ a i - s (n-i) - (13)

1 = 1

駆動信号生成部 1 0 4 は、入力信号 s (n)と予測残差信号 r (n)と α ノラメータの量子ィヒ値 a i ( 1 ≤ i < p ) を入力し、予め定められた M個のサブフレームの各々についてノルスの間隔及び振幅を計算し、パルスの間隔を出力端子 1 2 6 から符号化回路 1 1 4 へ出力し、パルスの振幅を出力端子 1 2 8 から符号化回路 1 1 6 へ出力する。

符号化回路 1 1 4 は、各サブフレームのパルス間隔を予め定められたビット数で符号化してマルチプレクサ 1 1 8 へ出力する。パルス間隔の符号化法としては種々の方法が考えられるカ S、一例として、パルス間隔のとりうる値として複数個を予め定め、それに番号付けをしておき、その信号をパルス間隔の符号とする方法が考えられる。

符号化回路 1 1 6 は、各サブフレームの駆動パルスの振幅を予め定められたビット数で符号化してマルチプレクサ 1 1 6 へ出力する。駆動パルスの振幅の符号化法としても種々の方法が考えられるが、従来よく知られている方法を用いるこ t ができる。例えば、正規化されたパルス振幅の確率分布を予め調べ、その確率分布に対する最適量子化器（一般に M A X の量子化と呼ばれている）を用いる方法が考えられる。これについては、上述した文献 1 等に詳述されているのでここでは説明を省.略する。また他の方法として、パルス振幅を正規化した後、ベクドル量子化法によリ符号化する方法も考えられる，ぺクトル量子ィヒで用いられるコードブックは L B G アルゴリズム等により作成することができる。 L B Gァルゴリズムについては、 YOSEPH L INDLEによる IEEE会報， 1980年 1 月， vo 1. 1， COM - 28， pp. 84 - 95に記載の " An algo 1 ithm for Vector Quantizer Des i gn"と題した論文（文献 3 ) に詳述されているのでここでは説明を省く。

また、駆動パルス系列の符号化及び予測パラメータの符号ィヒに関してはここで説明した方法に限らず、周知の方法を用いること力 ίできる。

マルチプレクサ 1 1 8 は、予測パラメータ符号化回路 1 1 0 の出力符号と符号化回路 1 1 4、 1 1 6 の出力符号を組み合わせて、符号化装置出力信号を生成し、出力端子から通信路等へ出力する。次に、駆動信号生成部 1 0 4 の構成について説明する。第 5 図は、駆動信号生成部 1 0 4 の一例を示すブロック図である。図において端子 1 2 2 から 1 フレーム分の予測残差信号 r ( II )が入力され、ノッファメモリ 1 3 0 に入力される。ノ' ップアメモリ 1 3 0 は、入力した予測残差信号を予め定められた等長又は不等長の M個のサブフレームに分割し、サブフレ一ム每に蓄積する。パルス間隔計算回路 1 3 2 は、ノッファメモリ 1 3 0 に蓄積された予測残差信号を入力し、各サブフレームにおけるノ Sルス間隔を予め定められたアルゴリズムに従って計算し、駆動信号生成回路 1 3 4 と出力端子 1 2 6 に出力する。

パルス間隔を計算するアルゴリズムとしては種々考えられる。例えば、パルス間隔として予め 2 種類の値 N 1 と N 2 を設定しておき、サブフレームの予測残差信号の 2 乗和がある閾値よリ大きい場合はサブフレームのパルス間隔を N 1 とし、小さい場合は N 2 とする方法が考えられる。まだ、その他の方法として、各サブフレームの予測残差信号の 2 乗和を計算し、 2 乗和が大きい順に予め定められた個数のサブフレームのパルス間隔を N 1 とし、残りのサブフレームのパルス間隔を N 2 とする方法も考えられる。

駆動信号生成回路 1 3 4 は、パルス間隔計算回路 1 3 2 力ら出力されるパルス間隔と誤差最小化回路 1 4 4 から出力されるパルス振幅の情報をもとに、等間隔のパルス列からなる駆動信号 V (n)をサブフレーム每に発生し、合成フィルタ 1 3 6 へ出力する。合成フィルタ 1 3 6 は駆動信号 V (n)と、端子 1 2 4 から量子化された予測パラメ一タ ^ i ( 1 ≤ i ≤ p ) を入力し、次式に従って合成信号 (n)を計算し、 s (n)を減算器 1 3 8 へ出力する。 (n) = V (n) + 2 i · s(n-i ) 〜（U) 減算器 3 8 は端子 1 2 0 から入力された入力音声信号と合成信号との差 (n)を計算し、聴感重み付けフィルタ 1 4 0 へ出力する。重み付けフィルタ 1 4 0 は e (n)を周波数数軸上で重み付けを行ない 2 乗誤差計算回路 1 4 2 に出力する。

重みけフィルタ 1 4 0 の伝達関数は、合成フィルタ 1 3 6 の予測パラメータ a iを用いて次のように表される。

W (z)= ( l - 2 ^ i - Z -リ / ( 1 - 2 · · z ー（15) ここで、 y は重み付けフィルタの特性を与えるノラメータである。

この童み付けブイルタは、従来例のフィルタ 4 と同様に聴覚のマスキング効果を利用するものであり、文献 1 に詳述され、ている。

2 乗誤差計算回路 1 4 2 は重み付けされた誤差 e ' (n)のサブフレームにおける 2 乗和を計算し、誤差最小化回路 1 4 4 出；^する，誤差最小化回路 1 4 4 は、 2 乗誤差計算回路 1 4 2 で計算された重み付け 2 乗誤差を蓄積すると共に、駆動パルスの振幅を調攀し、振幅情報を駆動信号生成回路 1 3 4 へ出力する。駆動信号生成回路 1 3 4 は、駆動パルスの間隔と振幅の情報をもとに駆動信号 V (n)を再び発生させ、合成フィルタ 1 3 6 に出力する。

合成フィルタ 1 3 6 はこの駆動信号 V (n)と予測パラメータ iを用いて合成信号 s (n)を計算し、減算器 1 3 8 へ出力する。減算器 1 3 8 で計算された入力音声信号 s (n)と合成信号 (n)との誤差 e (n)は重み付けフィルタ 1 4 0 によリ、周波数軸上で重み付けされた後、 2 乗誤差計算回路 1 4 2 へ出力される。 2 乗誤差計算回路 1 4 2 は重み付けされた誤差の 2 乗和を計算し、誤差最小化回路 1 4 4 へ出力する。誤差最小ィヒ回路 1 4 4 は、重み付けされた 2 乗誤差を再び蓄積すると共に、駆動パルスの振幅を再び調整し、駆動信号生成回路 1 3 4 へ出力する。

以上のような駆動信号の発生から誤差最小化による駆動パルス振幅の調整までの一連の処理は、駆動パルス振幅のとリ得る全ての組み合せに対してサブフレーム每に行われ、重み付けされた 2 乗誤差を最小とする駆動パルス振幅が出力端子 1 2 8 へ出力される。なお、以上の一連の処理において、合成フィルタ及び重み付けフィルタの内部状態は駆動パルスの振幅の調整が終わる每に初期化する必要がある。

このように、第 1 実施例によれば、駆動信号のパルス間隔を重要な情報又は多くの情報が含まれるサブフレームでは密に、そうでないサブフレームでは粗くというように、サブフレームごとに変えることができる。

次に、第 1 実施例に係る復号化装置の説明を行う。第 6 図はそのブロック図である。符号化装置から通信路等を介して伝送された駆軌パルス間隔の符号と駆動パルス振幅の符号と予測パラメータの符号を組み合された符号がデマルチプレクサ 1 5 0 に入力される。デマルチプレクサ 1 5 0 は、入力した符号を駆動パルス間隔の符号と、駆動パルス振幅の符号と予測パラメータの符号に分離し、それぞれの符号を復号化回路 1 5 2, 1 5 4， 1 5 6 へ出力する。

復号回路 1 5 2, 1 5 4 は入力した符号を駆動パルス間隔 N m ( 1 ≤ m ≤ M, 1 ≤ i ≤ Q m, Q m= L / N m) に復号し駆動信号 $成回路 1 5 8 へ出力するが、復号の手順は、第 4 図で説明した符号化回路 1 1 4, 1 1 6 と逆の手順となる。ま f 、復号化回路 1 5 6 は、予測パラメータの符号を a i ( 1 ≤ i ^ P ) に復号し、合成フィルタ 1 6 0 へ出力するカ、復号の手順は、第 4 図における符号化回路 1 1 0 と逆の手順である' ■

駆動信号生成回路 1 5 8 は、入力した駆動パルス間隔及び振幅の情報をもとに、サブフレーム内で等間隔で、サブフレ一ム每に間隔の異なるパルス列からなる駆動信号 V ( j )を発生させ合蟓フィルタ 1 6 0 に出力する。合成フィルタ 1 6 0 は、駆動信号 V (j)と量子化された予測パラメータ a iを用いて、次式にぃ合成信号 y (j)を計算し出力する。

y (j) = V (j) +

T i · τ ¹ - y ( j-1)

( j = 1, 2, … N ) … (16) 次に、第 2 実施例を説明する。第 1 実施例では駆動パルスは A— b 一 S (Ana lysis by Symthesis)手法により計算されているが、その他の方法として、解析的に駆動パルスを計算する方法が考えられる。

ここでは、先ず、フレーム長を N ( サンプル）、サブフレ一ム数を M、サブフレーム長を L (サンプル）、 m番目のサブフレームにおける駆動パルスの間隔を N m ( 1 ≤ m < M ) , 駆動ノルス数を Q m、駆動パルスの振幅を g i(m) ( 1 ≤ i ≤ Q m) 駆動ノルスの位相を K mとおく。このとき

Q m= し L ノ N mj - (17)

の関係がある。ここでし · 」は切り捨てによる整数化の演算を示す。

第 7 図に、 M = 5、 L = 8、 N 1 = N 3= 1、 N 2= N 4 = N 5= 2、 Q 1= Q 3= 8、 Q 2 = Q 4 = Q 5 = 4、 K 1 = K 2 = K 3= K 4= 1 の場合の駆動信号の例を示す。 m番目のサブフレームに於ける駆動信号を V 〉（n)とおくと、 V 》（n)は、次式のように表される。

V 〉 (n) ^ίΛ> δ (n-l )

f

( n = 1, 2, - L ) … (18)

1 = ( i-1 ) N m+ K m

( 1 ≤ K m≤ N m) … （19) なお、 δ ( · ) はクロネヅカデルタ関数である。

次に、合成フィルタ 1 3 6 のインノルス反応を h (n)とおくと、合成フィルタ 1 3 6 の出力は駆動信号とィンパルス応答のたたみ込み和と、前フレームにおける合成フィルタの内部状態によるフィルタ出力との和として表される。従って、 m 番目のサブフレームにおける合成信号 y > ( n )は、次式で記 I 2

述することができる„ y <»> (n) = y „ { n+ ( m- 1 ) L } 4- ∑ < J > (n) · hi n+(m-l)L} j = 1

ここで、 * はたたみ込み和を表す。また、 y 。（ j )は前フレ —ムの最後における合成フィルタの内部状態によるフィルタ出力であり、前フレームの合成フィルタの出力を y _OLD (j)とおくと、 y 。（ j )は次のように表される。 y o ( J ) = ∑ a y o ( J - 1 )

ι=1

( j = 1， 2， … N ) … (21)

' なお、 y 。の初期状態は y。（0) = y _OLD (N)、 y 。（-i) = y O LD (N-i), y 。（― i ) = y _OLD (N - i )とす— . る。

ま ^ : 合成フィルタ 1 / A (z)と重み付 1*フ /— ィルタ W (z)の縦続接続フィルタの伝達関数を H w(z)、そのインパルス応答を h w(_z)とおくと、 V ^^ )を駆動信号とした場合の縦続接続フィルタの y ^ίΛ) (n)は次式のように書ける。 (^Λ} (η) = y 。{n+(m-l)L}

m L

t^J> ( i) h w{n-i+(m-j)L}

j = 1 1=1

( n 2, L ) (22) P

へ

ここで、 y _Q (j) = ∑ a i ' γ

i =l

( j = 1, 2, … N ) (23)

初期状態は y „ (0) Oレ D (N)， y (-1 )

A

= y OLD (N-i) (24) また、

H w(z) { 1 / A (z) } · {A (z)/ A (z/r) }

A

1 / A (z/r)

1 ノ ( 1 - Ύ Z ) (25) h w ( n ) = 2_ i - y ¹ · h w(n-i ) + 8 (o) (26) このとき、入力音声信号 s (n)と合成信号 y <»> (n)との重み付け誤差 e (»> (n)は次のように表わされる。

e <»> (n) = S w{n+(m-l)L}

= y (») (n) …（27) ただし、 S w(n)は入力音声信号 S (n)を重み付けフィルタに入力した場合の重み付けフィルタの出力である。

重み付け誤差のサブフレームの 2 乗和 J は式（18)，（19)，

(22) , (27)を用いて次のように書くことができる。

L. m L

J = ∑ [x{n+(m-l)L} - S - 2 V ^{{ J} > ( i ) h w{n- i + (m-j ) L} ]² n= I j = 1 i=l

= [x{n+(m-l)U - ， § s i ^{J )} h w { n- 1 + ( m- j ) L } ] 2 n= I j = 1 1 = Γ

(28) ただし、 1 = ( i - 1 ) N m + K m (29) x J = S w(j )— y 。） ( j = 1, 2, … N ) (30) 次に、式（28)をで偏微分して 0 とおくことにより次式を導出することができる。

§ ^ j <») φ _hh { ( i-l)Nm + Km, ( j - 1 ) Nm + Km } >

= Φ _xh〖（i-l》Nm + I }

- ¾~j _k ^{tJ ,}¥ hhi(j-l)L + Kj,m · L+(i-l)Nm + Km} 〜（31) この方程式は係数行列が対称行列となる Q m次の連立一次方程式となリ、 chol esky分解により Q m³のオーダで解くことができる，式において、 ø hh(i， j)及び"？ Thh(i, j)は h w(n)の相互相関係数を表わし、 ø xh ( i )は m番目のサブフレームにおける x (n)と h w(n)の自己相関係数を表わし、次のように表わされる。 0 hh(i，j)及び^ T hh(i, j)は音声信号処理の分野では共分散係数と呼ばれることが多いので、ここでもそのように呼ぶ.

φ hh , J ) = ∑ h w ( n- i ) h w(n - j)

( 1 ≤ i , j ≤ L ) …（32)

T hh(i, j) = ∑ h w(n-i) h w(n-j)

( 1 ≤ i ( M - 1 ) L, 1 ≤ j ≤ L ) … (33) ø hx <»> ( i ) = ∑ x (n) h w { ( n- i- ( m- 1 ) L }

( 1 ≤ j ≤ L ) … (34) 位相が K mの駆動パルスの振幅 g i(m) ( 1 ≤ i ≤ Q m) は式 (31)を解くことにより得られる。位相 K mは、 K mのそれぞれの値に封しパルスの振幅を求め、その時の重み付け 2 乗誤差をそれぞれ計算し、それが最小となるように選ぶことができる。

以上のような駆動パルス計算アルゴリズムを用いた第 2 実施例における駆動信号生成部 1 0 4 のブロック図を第 8 図に示す。第 8 図において、第 5 図と同一部分は同一番号を付し、説明を省略する。

インパルス応答計算回路 1 6 8 は、入力端子 1 2 4 から入力された予測パラメータの量子化値 a iと予め定められた重み付けフイリレタのノラメータ γ を用いて、合成フィルタと重み付けフィルタの縦続接続フィルタのィンパルス応答 h w(n)を式（ 26 )に従って予め定められたサンプル数だけ計算する。得れた h w(n)は共分散係数計算回路 1 7 0 と相互相関係数計算回路 1 6 4 へ出力される。共分散係数計算回路 1 6 4 は、インパルス応答系列 h w(n)を入力し、式（32)と式（31)に従つて h w(n)の共分散係数 0 hh(i, j)と 5"hh(i, j)を計算し、パルス振幅計算回路 1 6 6 へ出力する。減算器 1 7 1 は、重み付けフィルタ 1 4 0 の出力 S w(j)と縦続接続フィルタ 1 7 2 の出力 y 。（j)との差 x (j)を式（30)に従って 1 フレーム分計算し、相互相関係数計算回路 1 6 4 へ出力する。

相互相関係数計算回路 1 6 4 は、 X (j)と h w(n)を入力し、式（34)に従って X と h wの相互相閧係数 xht-^ )を計算しパルス振幅計算回路 1 6 6 へ出力する。パルス振幅計算回路

1 6 6 は、パルス間隔計算回路 1 3 2 で計算され出力されたパルス間隔 N mと相互相関係数 0 xh⁽»> (i)と共分散係数

0 hh(i，j)、 hh( i , j )を入力し、予め定められた L や K mのもとで式（31)の方程式を chores ky分解等の方法を用いて解くことにより駆動パルス振幅 g i (m)を計算し、 g i (m)を駆動信号生成回路 1 3 4 と出力端子 1 2 8 へ出力すると共に、パルス間隔 N と振幅 g i Gm)をメモリに蓄積する。

駆動信J 号生成回路 1 3 4 は、前述したように、 1 フレーム分の駆動パルスの間隔と振幅の情報 N m、 g i(m) ( 1 ≤ m ≤ M,

1 ≤ i ≤ Q ffl) をもとにサブフレームで一定の間隔をもつパルス列から構成され ¾¾る駆動信号を発生させ、縦続接続フィルタ

1 7 2 へ出力する。縦続接続フィルタ 1 7 2 は、駆動信号を

1 フレ ^-ム分メモリに蓄積すると共に、全サブフレームのパルス振幅の計算が終了していない場合は、ノ、" ッファメモリ 1 3 0 に蓄積された前フレームの出力 y _OLDと量子化された予測ノラメタ i及び予め定められた γ を用いて、式（23)に従つ；て . y。（J)を計算し減算器 1 7 1 へ出力する。全サブフレームフレーム分の駆出力 y (j)を計算

2, N ) (35)

厶

ノツファメモリ 1 3 0 は、 y (N)、 y (N - 1)、 y (N-p+ 1 )の

Λ

» 個のを蓄積する。

以上の一連の処理を 1 番目のサブフレーム（ m = l ) 力ら最後のサブフレーム（ m = M ) まで行う。

第 2 実施例によると、駆動パルスの振幅を解析的に求めているので第 5 図に示した第 1 実施例に比べて計算量が大幅に減少する効果がある。

第 7 図に示した第 2 実施例では、駆動パルスの位相 K mを固定とした力 S、前述したように、 K mをサブフレーム每に可変にし、その最適値を求めることができる。この場合、より良好な品質の合成音が得られる効果がある。

上述した第 1、第 2 実施例は種々変形可能である。例えば、上述の説明では、 1 フレーム内の駆動パルス振幅の符号化は、パルス振幅が全て求まった後に符号化を行っていた力符号ィ匕をパルス振幅の計算に含めて、パルス振幅を 1 サブフレーム分計算する每に符号化を行い、次のサブフレームのパルス振幅を計算するという構成にすることができる。このような構成をとると、符号化の誤差をも含めた誤差を最小にするようなパルス振幅が求まるので品質が向上するという効果がある。

また、予測パラメータは近接の相関を除去する線形予測フィルタが用いられていたが、その代りに、長期の相関を除去するピッチ予測フィルタと前記線形予測フィルタの縦続接続にする構成にすると共に、駆動パルス振幅の計算ループにピツチ合成フィルタを含める構成にしてもよい。このような構成により、音声信号に含まれるピッチ周期ごとの強い相関をも除去できるようになるので品質が向上する効果がある。

さらに、予測フィルタ及び合成フィルタとしては全極モデルを用いた力、極零モデルを用いる構成にしてもよい。極零モデルは、音声のスぺクトルに存在する零点をも良く表現できるので、さらに品質が向上する。また，駆動パルスの間隔は予測残差信号のパワーを基に計算していたが、合成フィルタのインノルス応答と予測残差信号との相互相関係数及びィンパルス応答の自己相関係数をもとに計算. する，こともできる。この場合、合成信号と入力信号との誤差が小さくなるようにパルスの間隔を求めることができるので、品質が向上する効果がある。また，サブフレーム長は一定としたが、サブフレーム每に可変にしてもよい。可変にすることによつて、サブフレーム内の駆動パルス数を音声信号の統計的性質に応じてきめ細かく制御できるようになるので符号化効率が向上する効果がある。

また, 予測ノラメータは α; ノラメータを用いていた力 a ノラメータの代りに、量子化特性のすぐれた周知のパラメ一タ例えば Kノ S ラメータゃ L S P ノラメ一タ及びログ · エリア . レシォ · ノラメ一タ等を用いてもよい。

また、駆動パルス振幅の計算式（31)においては、式（32)， (33)に従って共分散係数を計算したが、これは、次式のような自己栢闋係数を計算する構成にしてもよい。

ø hh(i j) = H» hh( i_f j)

= ^Ν~¾ ' ^J w(n) h w{n-(i-j)} (36) n = このような構成にすることによって、 φ hhの計算に要する演算量を大幅に減少させることができ、符号化全体の演算量も低減できる効果がある。第 9 図はこの発明の第 3 実施例に係る符号化装置のプロック図、第 1 1 図は第 3 実施例に係る復号化装置のブロック図である。第 9 図において、 A Z D 変換後の音声信号がフレームノッファ 2 0 2 に入力される。フレームノッファ 2 0 2 は、音声信号を 1 フレーム分蓄積する。そのため、第 9 図の各構成要素は 1 フレーム毎に以下の処理を行う。

予測パラメータ計算回路 2 0 4 は、予測パラメータを公知の方法を用いて計算する。予測フィルタ 2 0 6 が第 1 0 図に示すような長時間予測フィルタ（ピッチ予測フィルタ） 2 4 0 と短時間予測フィルタ 2 4 2 の縦続接続の構成をもつ場合、予測パラメータ計算回路 2 0 4 は、ピッチ周期とピッチ予測係数及び線形予測係数（ α パラメータ又は Kパラメータ）を自己相関法や共分散法等の公知の方法で計算する。計算法については、上述した文献 2 ( 「ディジタル音声処理」、古井貞熙著、 1 985年、東海大学出版会発行）に記述されている。

計算された予測パラメータは、予測パラメータ符号化回路 2 0 8 へ入力される。予測パラメータ符号化回路 2 0 8 は、予測パラメータを予め定められた量子化ビット数に基づいて符号化し、この符号をマルチプレクサ 2 1 0 に出力すると共に復号化回路 2 1 2 に供給する。復号化回路 2 1 2 は、復号値を予測フィルタ 2 0 6 と合成フィルタ 2 2 0 に出力する。予測フィルタ 2 0 6 は、音声信号と予測パラメータを入力し、予測残差信号を計算し、それを駆動信号パラメータ計算回路 2 1 4 へ出力する。

τ 駆動信号パラメータ計算回路 2 1 4 では、まず、 1 フレームの予測残差信号を複数個のサブフレームに分割し、それぞれのサプフレームの予測残差信号の 2 乗和を計算する。次に予測残差信号の 2 乗和を基に、各サブフレームでの駆動パルス列信号の密度，言い変えるとパルス間隔を求める。その具体的:な方法の一倒は、パルス間隔として、長短の 2 種類，ノルス間隔が長いサブフレームの個数とパルス間隔が短いサブフレームの個数 ¾ 予め設定しておき、予測残差信号の 2 乗和が大きいサブフレームの順にパルス間隔を短い値に選ぶ方法である, 駆動信号パラメータ計算回路 2 1 4 は、更に、駆動信号のゲインを例えば、パルス間隔の短い全サブフレームの予測残差信号の標準偏差とパルス間隔の長い全サブフレーム予測残差信号の標準偏差を用いて 2 種類求める。

得られた駆動信号パラメータすなわち、駆動パルス間隔とゲインは駆動信号パラメータ符号化回路 2 1 6 で符号化され、マルチプレクサ 2 1 0 に出力されると共に、それらの復号値が駆動儔号生成回路 2 1 8— へ出力される，駆動信号生成回路 2 1 8 は、駆動信号パラメータ符号化回路 2 1 6 から供給さ _:れる'，駆 ¾ ノルス間隔とゲイン、コードブック 2 3 2 力ら供給される駆動パルスの正規化された振幅と、位相探索回路 2 2 8 から供給される駆動パルスの位相をもとに、サブフレーム、単位で密度の異なる駆動信号を生成する。

第 1 2 図に駆動信号生成回路 2 1 8 で作成される駆動信号の一例を示す。 m番目のサブフレームにおける駆動パルスのゲインを G ( m )、駆動パルスの正規化された振幅を g i ( m )、パルス数を氣ノルス間隔を D m、ノルスの位相を K m、サブフレームの長さをとおくと、駆動信号 V ( n )は次式で記述できる。

V <»> (n) = G · | ^ i ) δ {(n-(i-l)Dm-Rm}

( n = 1， 2, - L； 1 < K m≤ D m) - (37) なお、位相 K mは、サブフレームにおけるノルスの先頭位置である。また、 S ( n )はクロネッ力のデルタ関数である。

駆動信号生成回路 2 1 8 で生成された駆動信号は合成フィルタ 2 2 0 へ入力され、合成信号が出力される。合成フィルタ 2 2 0 は予測フィルタ 2 0 6 と逆フィルタの関係にある。減算回路 2 2 2 の出力である入力音声信号と合成信号との誤差は、聴感重み付けフィルタ 2 2 4 によりそのスぺクトルカ変形された後、 2 乗誤差計算回路 2 2 6 へ入力される。聴感重み付けフィルタ 2 2 6 は、聴覚のマスキング効果を利用するためのものである。

2 乗誤差計算回路 2 2 6 は、聴感重み付けされた誤差信号の 2 乗和をコードブック 2 3 2 に蓄積されたコードワード単位と位相探索回路 2 2 8 から出力される駆動パルスの位相每に計算し、計算結果を位相探索回路 2 2 8 と振幅探索回路 2 3 0 へ出力する。振幅探索回路 2 3 0 は、位相探索回路 2 2 8 から出力される駆動パルスの位相 1 個ごとに、誤差信号の 2 乗和を最小とするコードワードをコードブック 2 3 2 力、ら探索し、 2 乗和の最小値を位相探索回路 2 2 8 へ出力するとともに、 2 乗和を最小とするコードワードのインデックスを保持する。位相探索回路 2 2 8 は、駆動パルス列の間隔 D mに応じて駆動パルスの位相 K mを 1 K m≤ D mの範囲で変ィヒさせ、 013112

その値を駆動信号生成回路に与え、 D m個の位相に対してそれぞれ決まる誤差信号の 2 乗和の最小値を振幅探索回路から入力し、その D m個の最小値の中で最も小さい 2 乗和に対応する位相をマルチプレクサ 2 1 0 に出力する。同時に、振幅探索回路 2 3 0 にその時の位相を知らせ、振幅探索回路 2 3 0 では、その位相に対応するコードワードのインデックスをマルチプレクサ 2 1 0 に出力する。

コードブッ _{2 3 2} は、正規化された駆動パルス列の搌幅を格納し、白色雑音又は、音声データに対して解析的に求められた駆動パルス列をトレーニングべクトルとして、 L B G

7ルゴリズムにより作成される。駆動パルス列を求める方法として第 2 実施例で説明したような聴感重み付け誤差信号の 2 乗和が最小になるように駆動パルス列を解析的に求める方法を採用することができる。この詳細は、式（17)〜（34) を参照して既に説明してあるので、説明は省略する。すなわち、位相が K mの駆動パルスの振幅 g i (»>は式（34)を解くことにより得られる。位相 K mのそれぞれの値に対しパルスの振幅を求め、その時の重み付 2 乗誤差をそれぞれ計算し、それが最小となるように選ぶ。

マルチプレクサ 2 1 0 は予測ノラメータ，駆動信号パラメータ，駆動パルスの位相，振幅の符号を多重化して図示せぬ伝送路等へ出力する。尚、重み付けフィルタ 2 2 4 を介さず直接減算回路 2 2 2 の出力を 2 乗誤差計算回路 2 2 6 へ入力してもよレヽ。

以上が符号化装置の説明であり、次に復号化装置の説明を

- ': 行う。第 1 1 図において、デマルチプレクサ 2 5 0 は伝送路等から入力された符号を、予測パラメータ，駆動信号パラメータ、駆動パルスの位相，駆動パルスの振幅の符号に分離する。駆動信号パラメータ復号化回路 2 5 2 は、駆動パルスの間隔と駆動パルスのゲインの符号を復号し、駆動信号生成回路 2 5 4 へ出力する。

コードブック 2 6 0 は符号化装置のコードブック 2 3 2 と同一のものであり、送られた駆動パルス振幅のインデックスに対応するコードワークを駆動信号生成回路 2 5 4 へ出力する。予測パラメータ復号化回路 2 5 8 は予測パラメータ符号化回路 4 0 8 で符号化された予測パラメータの符号を復号し、合成フィルタ 2 5 6 へ出力する。駆動信号生成回路 2 5 4 は、符号化装置内の生成回路 2 1 8 と同様に、入力した駆動パルス間隔と駆動パルスのゲイン，駆動パルスの正規化された振幅と、駆動パルスの位相をもとにサブフレーム単位で密度の異なる駆動信号を生成する。合成フィルタ 2 5 6 は符号化装置内の合成フィルタ 2 2 0 と同一のものであり、駆動信号と予測パラメータを入力して合成信号を出力する。

上述の第 3 実施例では、コードブックは一種類とした力、コードブックを複数個用意し、駆動パルスの間隔によって切リ替えて用いてもよい。駆動パルス列の統計的な性質は駆動ノルスの間隔によって異なるので、切り替えて用いることにより性能が向上する効果がある。この構成を採用した第 4 実施例に係る符号化装置と復号化装置のブロック図を第 1 3 図と第 1 4 図に示す。第 1 3 図と第 1 4 図において、第 9 図と 13112

第 1 1 図と同一の番号が付与された回路は同一の機能を有す . る。第 1 3 図の選択回路 2 6 6 と第 1 4 図の選択回路 2 6 8 は、駆動パルス 0位相によって、コードブックの出力を選択するコドブック選択回路である。

この ^: うに、第 3、第 4 実施例によっても、駆動信号のパルス間隔を重要な情報又は多くの情報が含まれるサブフレームでは密に、そうでないサブフレームでは粗くというようにサブフレームごとに変えることができるので合成信号の品質

' 、を向上きせる効果がある。

なお、第 3、第 4 実施例も第 1、第 2 実施例と同様に変形可能である。

第 1 '5 図、第 1 6 図は第 5 実施例に係る符号化装置および復号化装置のブロック図である。フレームノッファ 1 1 は入力端子 1 0 に入力される音声信号を 1 フレーム分蓄積する回路であ、第 1 5 図の各ブロックはフレームノッファ 1 1 を用いてフレ一 ^:ム每またはサブフレーム每に以下の処理を行う。 - 予測バメータ計算回路 1 2 は、予測パラメータを公知の方法を用いて計算する。予測フィルタ 1 4 が第 1 7 図に示すような長時間予測フィルタ 4 1 と短時間予測フィルタ 4 2 を

M. 接饞て;藤成される場合、予測パラメータ計算回路 1 2 はピッ周 _;期とピッチ予測係数および線形予測係数（ " ノラメータまたは Kパラメータ）を自己相関法や共分散法等の公知の方法で計算する。計算法については、例えば文献 2 (古井貞照著「ディジタル音声処理」 1 985年東海大学出版会発行）に記述されている。計算された予測パラメータは、予測パラメータ符号化回路 1 3 へ入力される。予測パラメータ符号化回路 1 3 は、予測ノラメータを予め定められた量子化ビット数に基づいて符号ィ匕し、この符号をマルチプレクサ 2 5 に出力すると共に、復号値を予測フィルタ 1 4 と合成フィルタ 1 5 および聴感重みフィルタ 2 0 に出力する。予測フィルタ 1 4 は、入力の音声信号と予測パラメータを入力として予測残差信号を計算し、それを密度パターン選択回路 1 5 へ出力する。

密度パターン選択回路 1 5 としては、後で述べる実施例のものも使うことができる力、本実施例においてはまず 1 フレームの予測残差信号を複数個のサブフレームに分割し、それぞれのサブフレームの予測残差信号の 2 乗和を計算する。次に、予測残差信号の 2 乗和を基に各サブフレームでの駆動パルス列信号の密度（パルス間隔）パターンを求める。その具体的な方法の一例は、密度パターンとしてパルス間隔が最短の 2 種類、パルス間隔が長いサブフレームの個数とパルス間隔が短いサブフレームの個数を予め設定しておき、予測残差信号の 2 乗和が大きいサブフレームの順にパルス間隔が短くなる密度パターンを選択する方法である。

ゲイン計算回路 2 7 は選択された密度パターンの情報を入力とし、駆動信号のゲインを例えばパルス間隔の短い全サブフレームの予測残差信号の標準偏差とパルス間隔の長い全サフ' フレームの予測残差信号の標準偏差を用いて 2 種類求める。得られた密度パターンとゲインはそれぞれ符号化回路 1 6 , 2 8 で符号化され、マルチプレクサ 2 5 に入力されると共に、 'それらの復号値が駆動信号生成回路 1 7 へ入力される。駆動信号生成回路 1 7 は、符号化回路 1 6, 2 8 カゝら入力される密度パーンとゲイン、コードブック 2 4 力、ら入力される駆動パルスの正規化された振幅、および位相探索回路 2 2 から入力される駆動パルスの位相を基に、サブフレーム単位で密度が可変の駆動信号を生成する。

' 第 1 8 図に駆動信号生成回路 1 7 で作成される駆動信号の例を示す。 m番目のサブフレームにおける駆動ノルスのゲインを G (m)、駆動パルスの正規ィヒされた振幅を g i (m)、ノルス数を Q ¾ ノルス間隔を D m、ノルスの位相を K m、サブフレーの長さを L とおくと、駆動信号 e x 》（n)は次式で記述できる。 e ⁽»> in) i ^ίΛ) · σ { (η- ( i-1) Dm - Km}

( n = 1, 2, - L； 1 ≤ K m≤ D m) - (38) なお、位栢 K mはサブフレームにおけるパルスの先頭位置である。また、び（ n )はクロネッ力のデルタ関数である。

駆動信号生成回路 1 7 で生成された駆動信号は合成フィルタ 1 8 に入力され、合成信号が出力される。合成フィルタ 1 8 は、予測フィルタ 1 4 と逆フィルタの関係にある。減算回路 1 9 0出力である入力音声信号と合成信号との誤差は、聴感重みフィルタ 2 0 によりそのスぺクトルが変形された後、 2 乗誤差計算回路 2 1 へ入力される。聴感重みフィルタ 2 0 は、伝達関数が W (z) = A (z)/ A (z/ γ )

( 0 ≤ 7 ≤ 1 ) … (39)

で表わされるフィルタで、重み付けフィルタと同様に聴感のマスキング効果を利用するためのものであり、文献 2 に詳述されているので説明は省略する。

2 乗誤差計算回路 2 1 は、聴感重み付けされた誤差信号の 2 乗和をコードブック 2 4 に蓄積されたコードベクトル毎に、および位相探索回路 2 2 から出力される駆動パルスの位相每に計算し、計算結果を位相探索回路 2 2 と振幅探索回路 2 3 へ出力する。振幅探索回路 2 3 は、位相探索回路 2 2 から出力される駆動パルスの位相 1 個毎に、誤差信号の 2 乗和を最小とするコードワードのインデックスをコードブック 2 4 から探索し、 2 乗和の最小値を位相探索回路 2 2 へ出力すると共に、 2 乗和を最小とするコードワードのインデックスを保持する。位相探索回路 2 2 は、選択された密度パターンの情報を入力とし、駆動パルス列の位相 K mを 1 K m≤ D mの範囲で変化させ、その値を駆動信号生成回路 1 7 に与え、 D m個の位相に対してそれぞれ決まる誤差信号の 2 乗和の最小値を振幅探索回路 2 3 から受け、その D m個の最小値の中で最も小さい 2 乗和に対応する位相をマルチプレクサ 2 5 に出力すると同時に、振幅探索回路 2 3 にその位相を知らせる。振幅探索回路 2 3 では、その位相に対応するコードワードのインデックスをマルチプレクサ 2 5 に出力する。

マルチプレクサ 2 5 は予測パラメータ、密度パターン、ゲイン、駆動パルスの位相および振幅の符号を多重化し、出力端子 2 6 を介して伝送路へ出力する。なお、減算回路 1 9 の出力を聽感重みフィルタ 2 0 を介さずに直接 2 乗誤差計算回路 2 1 入力してもよい。

次に、第 1 6 図に示す復号化装置について説明する。第 1 6 図において、デマルチプレクサ 3 1 は入力端子 3 0 から入ガされた符号を予測パラメータ、密度パターン、ゲイン、駆動パルスの位相 ' 振幅の符号に分離する。復号化回路 3 2、 3 7 はそれぞれ前記駆動パルスの密度パターンと駆動パルスのゲインの符号を復号し、 '駆動信号生成回路 3 3 へ出力する。コードブック 3 5 は第 1 図の符号化装置内のコードブック 2 4 と同じものであり、送られた駆動パルスの振幅のインデックスに対応するコードワードを駆動信号生成回路 3 3 へ出力する。

予測パラメータ復号化回路 3 6 は、第 1 5 図の予測パラメータ符号化回路 1 3 で符号化された予測パラメータの符号を復号し、合成フィルタ 3 4 へ出力する。駆動信号生成回路 3 3 は、符号化装置内の駆動信号生成回路 1 7 と同様に、入力れた駆動パルスの正規化された振幅と駆動パルスの位相を基に、サブフレーム単位で密度が可変の駆動信号を生成する。合成フィルタ 3 4 は符号化装置内の合成フィルタ 1 8 と同じものでり、駆動信号と予測パラメータを受けて、合成信号をノッファ 3 8 へ出力する。ノッファ 3 8 は、入力される信号をフレーム毎に結合し、合成信号を出力端子 3 9 へ出力する。

第 1 9 図はこの発明の第 6 実施例に係る符号化装置のブロック図である。この実施例は第 5 実施例の符号化装置と同一の機能を有しながら、駆動信号のパルス列の符号化に要する計算量を約 1 Z 2 に低減できるようにしたものである。

以下、この計算量低減の原理について簡単に説明する。第 1 5 図の 2 乗誤差計算回路 2 1 に入力される聴感重み付き誤差信号 e w(n)は

e w ( n )

= { s (n) - e xc(n) * h (n) } * W (n) 〜（40) ここで、 s (n)は入力音声信号、 e xc(n)は駆動信号の候補、 h (n)は合成フィルタ 1 8 のィンパルス応答、 W (n)は聴感重みフィルタ 2 0 のインパルス応答をそれぞれ示し、 * は時間域の畳み込み演算を表わす。

(40)式の両辺を z 変換すると、

E w、 z )

= { S (z) - E X c(z) · H (z) } W (z) … （）となる。

(41)式における H (z),W )はそれぞれ予測フィルタ 1 4 の伝達関数 A (_Z)を用いて、

H (z)= 1 ノ A (z) … （42)

( 0 ≤ γ ≤ 1 ) … (43) と定義されるので、（42 )，（43)式を（41)式に代入すると、次式が得られる。

W (z) = { S (ζ) Α (ζ)} · { 1 / Α (ζ/ γ )}

- Ε χ c(z) { 1 / A (ζ/ γ )} … (44) 013112

これを逆 z 変換すると、次式が得られる。

e w(n) = X (n · e c(n) * n w(n) ··· ( 5 ) ここで、 x (ii)は聴感重み付き入力信号、 e xc(n)は駆動信号の候補、 h w(n)は ΐ Ζ Α ίζΖ γ )の伝達関数を持つ聴感重みフィルタのィンパルス応答を示す。

(40)式と（45)式を比較すると、（40)式では聴感重み付き誤差信号 e w(n) を計算するのに 1 つの駆動信号候補 e xc(n)につき 2 つのフィルタの畳み込み演算が必要であるが、（45)式では 1 つのフィルタの畳み込み演算でよいことが分かる。実際の符号化処理では、数百〜数千の駆動信号の候補について隳感重み付き誤差信号を計算するため、この部分の計算量が符号化装置の全計算量の大部分を占めている。従って、（40) 式の代わりに（45)式を用いるように符号化装置の構成を変えた場合、 1 / 2 のオーダで符号化に要する計算量が低減されるため、 _ 符号化装置の実用化が一層容易となる。

第 1 9 図に示す第 6 実施例の符号化装置において、第 1 5 図に示す第 5 実施例と同一番号が付されているプロックは第 1 5 図と同一機能を有するため、ここでは説明を省略する。伝達関数が Ι Ζ Α (ΖΖ Ύ ) の第 1 の聴感重みフィルタ 5 1 は予測パラメータを入力とし、予測フィルタ 1 4 からの予測残差信号 r (n)を受け、聴感重み付き入力信号 χ (η)を出力する。一方、第 1 の聴感重みフィルタ 5 1 と同一特性の第 2 の聴感重みフィルタ 5 2 は予測パラメータを入力とし、駆動信号生成回路 1 7 からの駆動信号の候補 e xc(n)を受けて聴感重み付き合成信号候補 X c(n)を出力する。減算回路 5 3 は聴感重み付き入力信号 x (n)と聴感重み付き合成信号候補 x c(n)との誤差、すなわち聴感重み付き誤差信号 e w(n)を 2 乗誤差計算回路 2 1 へ出力する。

第 2 0 図はこの発明の第 7 実施例に係る符号化装置のプロック図である。この符号化装置は、第 1 9 図の符号化装置と同一の機能を有しながら、駆動パルスのゲインを閉ループ型で最適に決定することができるようにし、さらに合成音声の品質を改良したものである。

第 1 5 図と第 1 9 図の符号化装置においては、駆動パルスのゲインは入力信号の予測残差信号の標準偏差を用いて正規化されたコードブックから引き出される全てのコードべクトルに共通のゲイン G を乗じて、位相 J、コードブックのインデックス I を探索する構成となっていた。この方法は、確定したゲイン G に対して最適な位相 J とィンデックス I が選ばれるが、ゲイン、位相およびインデックスが同時に最適化されている訳ではない。ゲイン、位相およびインデックスを同時に最適化できれば、さらに駆動パルスを精度良く表現できるため、合成音声の品質が大幅に向上する。

次に、ゲイン、位相およびインデックスを効率良く同時に最適化する方法の原理について説明する。

前記（45)式は、次の（46)式に書き替えることができる。

e w(n) = x (n) - G ij - x j ^{( 1} > ( n ) … （46) ここで、 e w(n)は聴感重み付き誤差信号、 X (n)は聴感重み付き入力信号、 G i jはインデックス i , 位相 j の駆動パルスに最適なゲイン、 X j ( ( _n )はインデックス i , 位相 j のゲインを乗じない駆動パルスを、前述の 1 ノ A (zノア）の伝達関数の聴感重みフィルタで重み付けした聴感重み付き合成信号候補を示す。聴感重み付き誤差信号のパワー

を最適ゲインで偏微分した値 E wZ G ijを零とおくことにより、最適ゲイン G Uが決定される。

G ij = [∑ X (n) · x j ^{{ 1} (n)]/ [∑ { x j <«> (n) } 2 ] … （48) n n 今、

A j " > = ∑ x ( n ) · x j < ¹ > ( n ) (49)

B j ( i ) = ∑ {x j (^l> (n) } 2 (50)

n

とおくと、（48)式は

G ij = A j ( i ) / B j(i) … （51)

と表わすことができる。（51)式を（47)式に代入すると、聴感重み付き誤差信号のパワーの極小値は次式で表わすことがでさる。

( E w) min = ∑ {x (n)}² - {A j <»> } 2 / B j t i > 〜（52) (52)式の聴感重み付き誤差信号のパワーを最小化するィン 'デ、ック： I i および位相 j は、 { A jい）） ²/ B jい）を最大にするインデックス i および位相 j と等しい。従って、最適なィンデッグス I .'と位相 J およびゲイン G I Jを同時に求めるには、 —例として、まずインデックス i , 位相 j の候補について (49)，（50)式により A j ( "， B j (" をそれぞれ求め、次に、 { A j ( } 2ノ B j ( ¹ )が最大となるィンデックス I , 位相 J の組を探索し、（51)式を用いて G IJを求め符号化すればよい。

第 2 0 図の符号化装置は、上記のインデックス、位相およびゲインを同時に最適化する方法を組み込んでいる点だけが第 1 9 図の符号化装置と異なるため、第 1 9 図と同一機能を有するブロックは第 1 9 図と同一番号を付して説明を省略する。第 2 0 図において、位相探索回路 2 2 は密度パターン情報とインデックス · 位相選択回路 5 6 よりの位相更新情報を入力として、正規化駆動信号生成回路 5 8 に位相情報 j を出力する。正規化駆動信号生成回路 5 8 は、コードブック 2 4 に格納される予め正規化されたコードべクトル C (i ) ( i はコ r- ドべクトルのィンデックス）と密度パターン情報および位相情報 j を入力とし、密度パターン情報に基づき上記コードべクトルの各要素の後ろに所定数の零を内揷することでサブフレーム内で一定のパルス間隔となる正規化駆動信号を生成し、入力された位相情報 j に基づき正規化駆動信号を時間軸の正方向へシフ卜させたものを最終出力として聴感重みフィルタ 5 2 へ出力する。

内積計算回路 5 4 は聴感重み付き入力信号 X (n)と聴感重み付き合成信号候補 x j "> (n)との内積値 A j (^l> を（49)式により計算し、これをインデックス · 位相選択回路 5 6 へ出力する。パワー計算回路 5 5 は聴感重み付き合成信号候補 x j ⁽') (n)のノヮ一 B jい）を（50)式により計算し、これをインデックス ' 位相選択回路 5 6 へ出力する。インデックス · 位相選択回路 5 6 は入力された内積値の 2 乗とパワーの比 { A j ( i > } 2ノ B j ( が最大となるィンデックス I と位相 J を探索するため 90/13112

に、顒次インデックスと位相の更新情報をコードブック 2 4 および位相探索回路 2 2 へ出力する。この探索によって得られる最適なインデックス I と位相 J の情報は、マルチプレクサ 2 5 へ出力され、 A J <»>, B J">は一時保存される。ゲイン符号化回路 5 7 はインデックス · 位相選択回路 5 6 よりの A J"), を入力とし、最適ゲイン A JM^ B J ）の量子化 ♦ 符号化を行い、このゲインの情報をマルチプレクサ 2 5 へ出力する。

第 2 1 図はこの発明の第 8 実施例に係る符号化装置のプロヅク図である，この符号化装置は、第 2 0 図の符号化装置と同一の機能を有しながら、駆動信号の位相探索に要する計算量を減らすことができるように構成したものである。

第 2 1 図において、位相シフト回路 5 9 は聴感重みフィルタ 5 2 から出力される位相 1 の聴感重み付き合成信号候補 X 1 ( ¹ ) ( n )を入力とし、インデックス i について取り得る全ての位相状態を単に x l^{( l >} (n)のサンプル点を時間軸の正方向にシフトさせることで簡単に作り出すことができる。

今、コードブック 2 4 内のインデックスの候補数を N I、位相の候捕数を N Jとすれば、第 2 0 図における聴感重みフィルタ 5 2 の使用回数は 1 回の駆動信号探索につき N I X N Jのォーダであるにのに対し、第 2 1 図における聴感重みフィルタ 5 2 の使用回数は 1 回の駆動信号探索につき N Iのオーダとなリ、約 1 / N に計算量を減らすことができる。

次に、密度パターン選択回路 1 5 をその前処理部分を含めてより具体的に示した第 9 〜第 1 2 実施例を説明する。上述した第 5 〜第 8 実施例では、予測フィルタ 1 4 を第 1 7 図に示したように長時間予測フィルタ 4 1 と短時間予測フィルタ 4 2 の縦続構成とし、それらの予測パラメータを入力音声信号の分析により求めていた力、以下の第 9 〜第 1 2 実施例では長期予測フィルタの及びその逆フィルタである長期合成フィルタのパラメータを閉ループで、すなわち入力音声信号と合成信号との 2 乗平均誤差が最小となるように求める構成とする。この構成によると、合成信号のレベルで誤差が最小となるようにノラメータを求めるので、合成音声の品質がさらに向上する。

' 第 2 2 図、第 2 3 図は第 9 実施例の符号化装置、復号化装置のブロック図である。

第 2 2 図において、フレームバッファ 3 0 1 は入力端子 3 0 0 に入力される音声信号を 1 フレーム分蓄積する回路であり、第 8 図の各ブロックはフレームノッファ 3 0 1 を用いて 1 フレーム、またはサブフレーム毎に以下の処理を行う。

まず、 1 フレーム分の音声信号に対し予測パラメータ計算回路 3 0 2 において、公知の方法を用いて短時間予測パラメータを計算する。通常、この予測パラメータは 8 〜 12個計算される。計算法については、例えば前記文献 2 (古井貞照著 Γ ディジタル音声処理」）に記述されている。計算された予測パラメータは、予測パラメータ符号化回路 3 0 3 に入力される。予測パラメータ符号化回路 3 0 3 は、予測パラメータを予め定められた量子化ビッ卜数に基づいて符号化し、その符号をマルチプレクサ 3 1 5 へ出力すると共に、復号値 P を予測フルタ 3 0 4、聴感重みフィルタ 3 0 5、影響信号作成回路 3 0 7、長期ベクトル量子化（ V Q ) 回路 3 0 9 および短期ベクトル量子化回路 3 1 1 へ出力する。

予測フィルタ 3 0 4 は、フレームノッファ 3 0 1 からの入力音声信号と符号化回路 3 0 3 からの予測パラメータの復号値から短期予測残差信号 r を計算し、それを聴感重みフィルタ 3 0 & へ出力する。聴感重みフィルタ 3 0 5 は、予測パラメータの復号値 P を基に構成されるフィルタで短期予測残差信号 r のスぺクトルを変形した信号 X を減算回路 3 0 6 へ出力する。この聴感重みフィタ 3 0 5 は聴覚のマスキング効果を利用するためのものであり、その詳細は前記文献 2 に記載されているので、説明は省略する。

影響信号作成回路 3 0 7 は、加算回路 3 1 2 からの過去の重み付けされた合成信号 X と、予測パラメータの復号値 P を入力とし、過去の影響信号 f を出力する。具体的には過去の重み付けされた合成信号 X をフィルタの内部状態とする聴感重みフィルタの零入力応答を計算し、それを影響信号 f として、予め設定されるサブフレーム単位で出力する。 8 kH zサンブリング時のサブフレーム中の典型的な値としては、 1 フレーム（ 1 80サンプル）を 4 分割した 40サンプル程度が使用される。影響信号作成画路 3 0 7 は、第 1 サブフレームにおいては前フレームで決定した密度パターン K に基づいて作成された前フレームの合成信号を入力として影響信号 f を作成す - る _a 減算回路 3 0 6 は、サブフレーム単位で聴感重み付け入力信号 X から過去の影響信号 f を差し引いた信号 u を減算回路 3 0 8 および長期べクトル量子化回路 3 0 9 へ出力する。

Λ ヮ一計算回路 3 1 3 は、予測フィルタ 3 0 4 の出力である短期予測残差信号のパワー（ 2 乗和）をサブフレーム単位で計算し、各サブフレームのパワーを密度パターン選択回路 3 1 4 へ出力する。

密度パターン選択回路 3 1 4 は、パワー計算回路 3 1 5 から出力されるサブフレーム每の短期予測残差信号のパワーを基に、予め設定された駆動信号の密度パターンの中から一つを選択する。具体的には、パワーの大きいサブフレームの順密度が高くなるように密度パターンを選択する。例えば、等長のサブフレームが 4 個、密度の種類が 2 つで、密度パタ — ンを次表のように設定した場合、密度パターン選択回路 3 1 5 はサブフレーム每の上記パワーを比較し、パワーが最大となるサブフレームが密となる密度パターンの番号 K を選択し、それを密度パターン情報として短期べク卜ル量子化回路 3 1 1 とマルチプレクサ 3 1 5 へ出力する。

長期ベクトル量子化回路 3 0 9 は、減算回路 3 0 6 からの 1

差信号 u、後述の駆動信号保持回路 3 1 0 からの過去の駆動信号 e Xおよ符号化回路 3 0 3 からの予測パラメータ P を入力とし、サブフレーム単位で差信号 u の量子化出力信号 ί を滅算回路 3 0 8 および加算回路 3 1 2 へ、ベクトルゲイン ^ およびインデックス Τ をマルチプレクサ 3 1 5 へ、長期駆動信号 t を駆動信号保持回路 3 1 0 へそれぞれ出力する。このとき t ととの間には、 u = t * h ( h は聴感重みフィルタ 3 0 5 のインパルス応答、 * は畳み込みを表わす）という関係がある。

サブフレーム単位のべクトルゲイン β <») とィンデックス .Τ <-> ( m はサブフレームの番号）の求め方の一例を以下に詳細に示す。

予め設定されるインデックス T とゲインと過去の駆動信号を用いて現サブフレームの駆動信号候補を作成し、これを聰感重みフィルタに入力して差信号 u の量子化信号の候補を作成し、差信号 u と量子化信号の候補との誤差が最小となるように最適なィンデックス T ( と最適な β 》を決定する。このとき Τ と最適な /9 ("^ を用いて作成される現サブフレームの駆動信号を t とし、 t を聴感重みフィルタに入力して得られる信号を差信号 u の量子化出力信号 u とする。

これと同様な方法は、例えば PETER KR00N氏らによる IEEE 会報、 1988年 2 月、 Vol · SAC - 6， ρρ· 353 - 363に掲載の， 'A class of Analysis-by-Synthesic Predicative Coders for High Qual ity Speech Coding at Rates Between 4.8 and 16 k bits / s"と題する論文（文献 3 ) 中の閉ループでピッチ予測器の係数を求める方法と同様の公知の方法を用いることができるので、ここでは説明を省略する。

一方、減算回路 3 0 8 ではサブフレーム単位で差信号 u 力ら量子化出力信号 u を減じた差信号 V を短期べクトル量子化回路 3 1 1 へ出力する。

短期ベクトル量子化回路 3 1 1 は、差信号 V、予測パラメータ P および密度パターン選択回路 3 1 4 より出力される密度パターン番号 K を入力とし、サブフレーム単位で差信号 V の量子化出力信号 V を加算回路 3 1 2 へ、短期駆動信号 y を駆動信号保持回路 3 1 0 へそれぞれ出力する。ここで V と y 上の間には、 V = y * h という闋係がある。

また、これと共に短期ベクトル量子化回路 3 1 1 は駆動パルス列のゲイン G、位相情報 J およびコードべクトルのインデックス I をマルチプレクサ 3 1 5 へ出力する。このとき、サブフレーム単位で出力されるノラメ一タ G， J , I は、密度パターン番号 K で決まる現サブフレーム（第 mサブフレーム）の密度（パルス間隔）に応じたパルス数 N 〈》> をサブフレーム内で符号ィ匕しなければならないので、予め設定されるコ一ドべクトルの次元数 N D ( 1 つずつのコードべクトルを構成するパルス数）に応じた個数、すなわち N i ^ Z N D個ずつ現サブフレームで出力される。

例えば、フレーム長が 1 6 0 サンプル、サブフレームが 4 つの等長の 4 0 サンプルで構成され、コードべクトルの次元カ 2 0 であるとする。この場合、予め用意される密度パターンの 1 つが第 1 サブフレームのパルス間隔 1、第 2 〜第 4 サ 9 13112,;

ブフレームのノルス間隔 2 とすると、この密度パターンに対して短期べクトル量子化回路 3 1 1 カゝら出力されるゲイン、嫁栢およびインデックスの個数は、それぞれ第 1 サブフレー . ムで 40 20= 2 (锢）（ただし、この場合はパルス間隔が 1 なので、位相情報は出力しない）、第 2 〜第 4 サブフレームで 20/20= 1 (個）となる。

短期ベクトル量子化回路 3 1 1 の具体的な構成例を第 2 4 、図に示す。第 2 4 図において、合成べクトル生成回路 5 0 1 ' は予測ラメータ P と、予め設定されるコードブック 5 0 2 内のコードベクトル C い） ( i はコードベクトルのインデック X ) および密度パターン情報 K とから、密度パターン情報 K 対応する予め設定されたパルス間隔となるように C ( 1 > の第 1 サンプル以降に所定の周期で零を内挿して密度情報を持つ -: パルス列を作成し、このノルス列を予測パラメータ P力ら生成される聴感重みフィルタで合成することにより、合成べクトル V 1 < ¹ ) を生'威する。

-. 位相シフト.画路 5 0 3 は、この合成ベクトル V 1 tいを密度ノターン情報 κに基づいて所定のサンプル数だけ遅延させて位相の異なる合成ベクトル V 2(い， V 3< ， ···， V j < ¹ , を作成し、内積計算回路 5 0 4 およびパワー計算回路 5 0 5 へ出力する。コードブック 5 0 2 は適応密度パルスの振幅情報を格納し、インデックス i に対して予め定められたコードクトル C t "が i き出し可能なメモリ回路またはべクトル発生簡路で構成される。内積計算回路 5 0 4 は、第 2 2 図の減、算回路 3 0 8 からの差信号 V と、合成ベクトル V j (いとの内積値 A j ）を求め、インデックス · 位相選択回路 5 0 6 へ出力する。ノヮー計算回路 5 0 5 は、合成ベクトル V jい）のパヮ一 B j (i) を求め、インデックス · 位相選択回路 3 0 6 へ出力する。

インデックス · 位相選択回路 3 0 6 では、内積値 A j ⁽i) とパワー B jい）を用いて、次式の評価値

{ A j ^{{ 1} > } ² / B j < ¹ > … （53)

が最も大きくなるような位相 J とインデックス I を位相候補 j とインデックス候補 i の中から選択し、対応する内積値 A J"> とノ S ヮー B J">の組をゲイン符号化回路 5 0 7 へ出力する。また、インデックス · 位相選択回路 5 0 6 はさらに位相 J の情報を短期駆動信号生成回路 5 0 8 および第 2 2 図のマルチプレクサ 3 1 5 へ出力し、インデックス I の情報をコードブック 5 0 2 および第 2 2 図のマルチプレクサ 3 1 5 へ出力する。 ―

ゲイン符号化回路 5 0 7 では、インデックス · 位相選択回路 5 0 6 からの内積値 A J^{( I >} とノヮー B J^{( I >} との比

A Jい〉ノ B J(^{I }} … （54)

を所定の方法で符号化して、そのゲイン情報 G を短期駆動信号生成回路 5 0 8 および第 2 2 図のマルチプレクサ 3 1 5 へ出力する。

上記（53) , (54)式は、例えば I.M. Trancoso氏らによる

Interna ional Conierence on Acoustic, Speech and Signal Processing の論文 " EFFICIENT PROCEDURES FOR FINDING THE OPTIMUM INNOVATION IN STOCHATIC CODERS" (文献 4 ) 1

によって提案されたものを用レヽることができる。

短期駆動信号生成回路 5 0 8 は、密度パターン情報 K、ゲイン情報 G、位相情報 J およびインデックス I に対応するコードベクトル C ( D を入力とし、 K および C " ) を用いて上記合成べクトル生成回路 5 0 1 での方法と同様の方法で密度情報を持つパルス列を作成し、そのパルス振幅にゲイン情報 G に対応する値を乗じ、位相情報 J に基づき所定のサンプル数だけパルス列を遅延することにより、短期駆動信号« y を生成する。この短期駆動信号 y は、聴感重みフィルタ 5 0 9 および第 2 2 図の駆動信号保持回路 3 1 0 へ出力される。聴感重みフィルタ 5 0 9 は第 2 2 図の聴感重みフィルタ 3 0 5 と同様の特性を持つフィルタであり、予測パラメータ P を基にして作ら、短期駆勤信号 y を入力として差信号 Vの量子化出力 V を第 2 2 図の加算回路 3 1 2 へ出力する。

第 2 2 図に説明を戻すと、駆動信号保持回路 3 1 0 は長期ベクトル量子化回路 3 0 9 より出力される長期駆動信号 t および短期べクトル量子化回路 3 1 1 より出力される短期駆動信号 y を入力とし、駆動信号 e xをサブフレーム単位で長期べクトル量子化回路 3 0 9 へ出力する。具体的には、例えば t と y をサブフレーム単位でサンプル毎に加算したものを駆動信号 e Xとすればよい。現サブフレームの駆動信号 e Xは、次のサブフレームにおいて過去の駆動信号として長期べクトル量子化回路 3 0 9 において使用できるように、駆動信号保持回路 3 3 0 内のノッファメモリに保持される。

加算回路 3 レ 2 は、サブフレーム単位で量子化出力 u ( " および（と、現サブフレームで作成された過去の影響信号 f との和信号 X を求め、影響信号作成回路 3 0 7 へ出力する。

以上のようにして求められた各パラメータ P, β, Τ, G, I, J, Kの情報がマルチプレクサ 3 1 5 により多重化され、伝送符号として出力端子 3 1 6 より伝送される。

次に、第 2 2 図の符号化装置から伝送された符号を復号する第 2 3 図の復号化装置について説明する。

第 2 3 図において、入力端子 4 0 0 には伝送された符号が入力される。デマルチプレクサ 4 0 1 はこの入力符号をまず予測パラメータ、密度パターン情報 Κ、ザイン β、ゲイン G、インデックス！、インデックス I および位相情報 J の符号に分離する。復号化回路 4 0 2 〜 4 0 7 は、それぞれ密度パターン情報 K、ゲイン G、位相 J、インデックス I、ゲイン /5 およびインデックス T の符号を復号し、駆動信号生成回路 4 0 9 へ出力する。他の復号化回路 4 0 8 は、符号化された予測パラメータを復号し、合成フィルタ 4 1 0 へ出力する。駆動信号生成回路 4 0 9 は、復号された各パラメータを入力とし、密度パターン情報 K に基づいてサブフレーム単位で密度の異なる駆動信号を生成する。

駆動信号生成回路 4 0 9 は、具体的には例えば第 2 5 図に示すように構成される。第 2 5 図において、コードブック 6 0 0 は符号化装置内の第 2 4 図に示すコードブック 5 0 2 と同一機能を有するものであり、インデックス I に対応するコードベクトル C (I)を短期駆動信号生成回路 6 0 1 へ tB力する。短期駆動信号生成回路 6 0 1 は、符号化装置内の第 2 4 図に }

示す短期駆動信号生成回路 3 0 8 と同一機能を有するものであり、密度パターン情報 K、位相情報 J およびゲイン G を入力とし、短期駆動信号 y を加算回路 6 0 6 へ出力する。加算回路 6 0 6 ( 短期駆動信号 y と長期駆動信号生成回路 6 0 2 で生成された長期駆動信号 t との和信号、すなわち駆動信号 e xを駆動信号ノくヅファ 6 0 3 および第 2 3 図の合成フィルタ 4 1 0 へ出力する。

駆働信号ノッファ 6 0 3 は、加算回路 6 0 6 から出力される駆動 #号を現在から所定のサンプル数だけ過去のものまで保持し、インデックス T が入力されると T サンプル過去の駆動信号から順にサブフレーム長に相当するサンプル数だけ出 ' 力する構成となっている。長期駆動信号生成回路 6 0 2 は、インデックス T に基づき駆動信号バッファ 6 0 3 より出力される信号を入力とし、この入力信号にゲインを乗じると共に、 T 會ンプルの周期で繰り返す長期駆動信号を生成し、加算回路 6 0 6 へサブフレーム単位で出力する。

, 第 2 3 囱に説明を戻すと、合成フィルタ 4 1 0 は符号化装 - ：置内の第 2 . 2 図に示す予測フィルタ 3 0 4 と逆の周波数特性を持つフィルタであり、駆動信号と予測パラメータを入力として、合成信号を出力する。

ポストフィ 'ルタ 4 1 1 は予測ノラメータ、ゲインおよびインデックス T を用いて合成フィルタ 4 1 0 から出力される合成信号のスぺクトルを主観的に雑音が減少するように整形て、ノヅファ 4 1 2 へ出力する。ポストフィルタの具体的な構成法については例えば前記文献 5 に記載されているような方法を用いればよい。また、ポストフィルタ 4 1 1 を用いずに直接合成フィルタ 4 1 0 の出力をノッファ 4 1 2 へ供給する構成としてもよい。ノくッファ 4 1 2 は入力される信号をフレーム毎に結合し、合成音声信号を出力端子 4 1 3 へ出力する。

上述の実施例では駆動信号の密度パターン選択を短期予測残差信号のパワーに基づいて行った力短期予測残差信号の零交差数に基づいて行うこともできる。この構成の第 1 0 実施例の符号化装置を第 2 6 図に示す。

第 2 6 図において、零交差数計算回路 3 1 7 はサブフレーム単位で短期予測残差信号 r が 0 を交差する回数を力ゥントし、その値を密度パターン選択回路 3 1 4 へ出力する。この場合、密度パターン選択回路 3 1 4 はサブフレーム每の零交差数の大きさに基づいて、予め設定された密度パターンの中力、ら一つのパターンを選択する。

また、密度パターン選択を短期予測残差信号にピッチ予測を適用して得られるピッチ予測残差信号のパワーまたは零交差数に基づいて行うこともできる。第 2 7 図に、ピッチ予測残差信号のパワーに基づいて密度パターン選択を行う第 1 1 実施例の符号化装置のブロック図を示し、第 2 8 図にピッチ予測残差信号の零交差数に基づいて密度パターン選択を行う第 1 2 実施例の符号化装置のブロック図を示す。第 2 7 図および第 2 8 図は、それぞれ第 2 2 図および第 2 6 図におけるパワー計算回路 3 1 3 および零交差数計算回路 3 1 7 の前にピッチ分析回路 3 2 1、ピッチ予測フィルタ 3 2 2 を配置した構成となっている。ピッチ分析回路 3 2 1 はピッチ周期とピッチゲインを計算する回路であり、その計算結果をピッチ予測フィルタ 3 2 2 へ出力し、ピッチ予測フィルタ 3 2 2 はピッチ予測残差信号をパワー計算回路 3 1 3 または零交差数計算回路 3 1 7 へ出力する。ピッチ周期とピッチゲインは、公知の方法、例えば自己相関法や共分散法で求めるごとができる。次に、予測フィルタや合成フィルタの一例としての極零予測分析モデルを説明する。第 2 9 図にその極零モデルのプロック図を示す，第 2 9 図において、音声信号 s (n)は端子 7 0 ュに入力され、極ノラメータ推定回路 7 0 2 に入力される。極パラメータの推定方法としては、いくつか知されているカ例えば前述した文献 2 ( 「ディジタル音声処理 j 東海大学出版会）に示される自己相閧法を用いることができる。入力音声信号は、次にこの極パラメータ推定回路 7 0 2 で得られた極ノラメ一タをもつ全極形逆フィルタ 3 に入力される。ここでは、次式に従って予測残差信号 d (n)を計算し、出力する。 d (n) = s (n) - i · s (n-i

i 2 a ) … （55)

=l

ここで、 s ( n )は入力信号系列、 a iは全極モデルのパラメータ、 P は予測次数である。

次に、高速フーリヱ変換（ F F T ) 回路 7 0 4 と 2 乗回路 7 0 5 によリ残差镡号 d (n)のパワースぺクトルを求めると共に、ピッチ分析処理回路 7.0 6 により、ピッチ周期の抽出と有声 Z無声の判定を行う。なお、 F F T 回路 7 0 4 の代りに離散フーリエ変換（ D F T ) を用いることもできる。また、ピッチ分析の方法としては、上記した文献 2 に記載されている変形相関法を用いることができる。

F F T 回路 7 0 4 と 2 乗回路 7 0 5 によって求められた残差信号のパワースぺクトルはスムージング回路 7 0 7 に入力される。スムージング回路 7 0 7 は、ピッチ分析処理回路 7 0 6 により得られたピッチ周期と有声無声の状態をノラメータとしてノワースぺクトルを平滑化する。

スム一ジング回路 7 0 7 の詳細を第 3 0 図に示す。この回路の時定数、すなわちインパルス応答力 1 / e になるサンプル数 T は

T = - 1 / 1 η ( α ) …（56)

と表される。この時定数 Τ をピッチ周期の値に応じて適応的に変化させる。ピッチ周期を Τ ρ (サンプル）、サンプリング周期数 f s (Hz), F F T 又は D F T の次数を N とすれば残差信号のパワースペクトルに現れるピッチによる微細構造の周期 m (サンプル）は次式で記述することができる。

m = ( f s / T p ) · ( Ν / f s )

= N / T p … (57)

従って時定数 T を m に応じて適応的に変化させるには、 T = N Z T p に（56)式を代入し、 α について解き

a = l / e x p ( T p / N - L ) … (58)

と定めればよい。ただし、 L はスム一ジングを行う微細構造の数を表すパラメータである。また、無音声の場合、 T p は得られないので、ピッチ分析処理回路 7 0 6 が無声と判定し：、だ場合には、 T p を予め適当に定めた値に設定する。

- - さらに、第 3 0 図に示したフィルタによリノワースぺクトルを平滑化する際、フィルタは零位相とする。零位相とするには、例えば、ノワースぺクトソレを前向きと後向きに各々、フィルタリングし、各々得られる出力を平均すればよレ、。残差信号パワースぺクトルを D (ncu o)、前向きにフィルタリングした場合のフィルタ出力を (nw o) _f、後向きにフィルタリングした場合のフィルタ出力を D (nw o)_bとおくと、平滑化は次のように記述される。

^ (η ω o) _f = (I- ) - D (ηω o) + a · . { (n- 1 ) ω o } - (59) - JD { (N-n) ω o)_b = (1- a ) · D { (N-n+1) ω o)

+ a · D. { (N-n + 1) ω o} … (60) T7 (n ^» o) = (1/2) {ΤΓ (ηω o) _f + TJ (ηω o)_b}

' Cたし、 n = 0, 1, … N - 1 ) … （61)

. ω 0 = 2 ji / N 一 … （62) : 伹し、 D ( n ω 0)は平滑化されたパワースぺクトルであり、 Ν は F F Τ 又は D F Τ の次数である。

スム一ジング回路 7 0 7 により平滑化されたスぺクトルは、逆数回路 7 0 8 によって、逆スペクトルに変換される。この結残差信号スペクトルの零点は極へ変換される。逆スぺクトルは逆 F F T 処理回路 7 0 9 により逆 F F T が施され、自己相関系列へと変換され、零予測パラメータ推定回路 7 1 0 へ入力される。零予測パラメ一ダ推定回路 7 1 0 は、入力した自己相関系

Μから、自己相関法を用いて零予測パラメータを求め、全零

- ' 形逆フィルタ 7 1 1 は、全極形逆フィルタの残差信号を入力とし、零予測パラメータ推定回路 7 1 0 により求められた零予測パラメータを用いて予測を行い、予測残差信号 e ( n )を出力する。 e ( n )は次式に従い計算される。 e 、 n ) = d ( n ) - ₁ §₌f e ( n - i ) ( 6 3 ) ここで、 b iは零予測パラメータ、 Q は零予測の次数である。以上の処理により、音声信号の極零予測分析が行われる。次に実音声に対する実験結果を示す。成人の発声した「雨」に対する分析結果を第 3 1 図に示す。第 3 2 図は平滑化を行なわない場合のスぺクトル波形である。これらの図から分力、るように、平滑化を行わない場合には、極零モデルのスぺクトルに偽の零点や強調された零点が現れ、スぺクトルの近似が悪零ノラメータの推定を誤ること力あった。し力、し、ピッチ周期に応じて時定数を適応的に変化させるフィルタにより残差信号のパワースぺクトルを周波数領域で平滑化し、その後、逆スペクトルィ匕し零ノラメータを抽出することによリ、スペクトルの微細構造に影響されず、常にノ S ラメ一タカ誤りなく抽出できるようになった。

第 2 9 図に示すスムージング回路 7 0 7 として、ノワースベクトルのピークを検出し、検出したピーク間を 2 次曲線で補間する方法によっても行うことができる。具体的には、 3 点のピークを通、る 2 次方程式の係数を求め、 2 点のピーク間をその 2 次曲線で補間する。この場合、ピッチ分析が要らなくなるので演算量が少なくなるという効果がある。第 2 9 図に示すスムージング回路 7 0 7 は、逆数回路 7 0 8 の次に揷入することもでき、この場合のブロック図を第 3 3 図に示す。

また、周波数領域で行っている第 2 9 図、第 3 3 図のスム — ジングは時間領域で行うこともできる。残差信号 d (n)のパワースベクトルの逆数を D ' (no) o)，（η = 0， 1, ··· Ν-1)、第 3 0 図のディジタルフィルタのインパルス応答と伝達関数を各々 h (n), Η (ηω ο)とおくと、スム一ジングは次式で表されるように周波数領域でのフィルタリングによって行われる。

∞

ΤΤ (η ω ο) = ∑ (η ω 0 · h ( n - i ) (64) ω ο = 2 π / Ν …（65) ここで ΤΤ (ηω ο)はスムージングされたノワースぺクトルである。 ΤΤ (ηω o)と ϋ ' (ηω ο)の逆フーリヱ変換を各々 " γ (η), Ύ ' ( n )とすれば、フーリエ変換の性質から、式（64)は時間領域で次式のように記述される。

Y ( n ) = 7 ' ( n ) · Η (ηω ο) … (66)

すなわち、窓 H ( n ω 0 )をかけるのと等しい。このとき、 Η (ηω ο)をラグゥィンドと呼ぶ。 Η (ηω ο)はピッチ周期に応じて適応的に変化する。

第 3 4 図に、スムージングを時間領域で行う場合のプロック図を示す。

また、第 2 9 図，第 3 3 図，第 3 4 図の例では、周波数領域で零点の極への変換を行っている力これを時間領域で行うこともできる。極予測の残差信号 d (n)の自己相関系列を Ύ (n)、そのフーリェ変換であるノワースぺクトルを

D (no) o)とおくと、 D (no) o)とその逆数 D ' (n u o)の間には次の関係がある。

D (η ω 0 ) · D，（η ω 0 ) = 1 - (67)

フーリエ変換の性質から、上式は時間領域で次のように表される。

Ύ ( η ) = ¾ _η γ ( i ) · γ ' (n-i ) = δ (η-ηο )

ι=0

(ただし、 ηο= 0 ) … (68) 自己相関係数は γ (0)について対称であるので、（68)式は行列の形で次のように書くこと力できる。

Ύ (0) γ (1) Ύ (Ν-1)_Ί 「7 ' (0)

Ύ (1) Τ (0) γ (1) γ (Ν-2)| |γ ，（1)

Ύ (2) γ (1) γ (0) Ύ (Ν-3) I | γ ' (2) (69) し y (Ν-1) γ (Ν-2) ··· Ύ (0) J LT ' (Ν-1

この方程式は Levinsonァルゴリズムにより再帰的に解くことができる。この方法は例えば、「ディジタル信号処理の理論 1 基礎 · 制御」（コロナ社）（文献 5 ) に記載されている。

時間領域で零点の変換とスムージングを行う場合のブロック図を第 3 5 図と第 3 6 図に示す。これらの図において逆たたみ込み回路 7 5 7， 7 6 7 【ま式（69)を計算することにより、式（68)を γ ' (η)について解くものである。

尚、第 3 6 図において、逆たたみ込み回路 7 6 7 にかえてラグウィンド 7 6 6 の出力を、 F F T あるいは D F T処理し、 *

絶封値の. 2 乗逆数 ( 1 Z 1 - 1 ² ) を施し、逆 F F T あるいは逆. D F T-処理する方法もある。この場合、演算量が逆ただみ込みによるものよりさらに少なくなるという効果がある。

このように、全極モデルの残差信号のパワースぺクトル又 i . そのノヮ一スベクトルの逆数を平滑化し、平滑化されたパワースぺクトルの逆数から逆フーリエ変換により自己相関係数を求め、求めた自己相関係数に全極モデルの分析法を適用することにより零点のパラメータを抽出し、平滑化の度合いはピツチ周期の値に応じて適応的に変化させることにより、発生者や音韻に依らず常にスぺクトルの平滑化を良好に行ことができ、微細構造による為の零点や強調され過ぎた零点を除去 T ることができる。また、平滑化に用いられるフィルタを零 '相とすることにより、フィルタの位相特性のためスぺクトルの零点がずれる問題を防止でき、音声のスぺクトルを良好に近似する極零モデルを得ることができる。

産業上の利用可能性

以上説明したように、この発明によれば、駆動信号のパルス間隔を童要情報又は多くの情報が含まれるサブフレームでは密に、そうでないサブフレームでは粗くとレヽうようにサブフレ —ムごとに変えることができるので合成信号の品質を向上させる効果がある。

Claims

「一 90/13112 ' PCT/JP90/00199 請求の範囲

( 1 ) 駆動信号により合成フィルタを駆動し、合成信号を得る音声符号化装置において、前記駆動信号のフレームを複数の等長または不等長のサブフレームに分割し、駆動信号のパルス間隔が予測残差信号のパワーに応じてサブフレームで異なる等間隔のパルス列をもつことを特徴とする音声符号化装 So

( 2 ) 駆動信号のフレームを複数の等長または不等長のサブフレームに分割し、駆動パルスの間隔がサブフレーム単位'で異なる等間隔の駆動パルス列となるよう設定する手段と、パルス列の振幅または駆動パルス列の振幅と位相の情報を予め格納する記憶手段と、

前記記憶手段に格納されている情報を基に駆動信号を生成する手段と、

前記駆動信号生成手段から生成された駆動信号により駆動される合成フィルタと、

前記合成フィルタからの合成信号と入力信号との誤差信号のパワーが最小になるように前記記憶手段の情報を選択し、符号化する手段とを具備する音声符号化装 ft

( 3 ) 駆動信号のフレームを複数の等長または不等長のサブフレームに分割し、駆動パルスの間隔がサブフレーム単位で異なる等間隔の駆動パルス列となるよう設定する手段と、パルス列の振幅または駆動パルス列の振幅と位相の情報を予め格納する記憶手段と、前記記億手段に格納されている情報を基に駆動信号を生成する手段と、

前記駆動信号生成手段から生成された駆動信号によリ駆動される合成フィルタと、

前記合成フィルタからの合成信号と入力信号との誤差信号を聴感重み付けフィルタを通して得られる聴感重み付け誤差信号のパワーが最小になるように前記記億手段の情報を選択し、符号化する手段とを具備する音声符号化装氍

( 4 ) フレームが複数のサブフレームに分割され、サブフレーム単位でパルス間隔が可変の駆動パルス列からなる駆動信号を生成する手段と、

前記駆動信号によリ駆動される合成フィルタと、

前記合成フィルタの出力信号と入力音声信号との聴感重み付き誤差信号のパワーが最小となるように、前記駆動パルス列の振幅または振幅および位相を決定する手段と、

前記入力音声信号に対する短期予測残差信号に基づいて前記駆動パルス列の密度を決定する手段とを具備する音声符号化装

( 5 ) フレームが複数のサブフレームに分割され、サブフレーム単位でパルス間隔が可変の駆動パルス列からなる駆動信号を生成する手段と、

前記駆動信号により駆動される合成フィルタと、

前記合成フィルタの出力信号と入力音声信号との聴感重み付き誤差信号のパワーが最小となるように、前記駆動パルス列の振幅また振幅および位相を決定する手段と、目 tf 入力音声信号に対するピッチ予測残差信号に基づいて前記駆動パルス列の密度を決定する手段とを具備する音声符号化装 Mo

( 6 ) フレームが複数のサプフレームに分割され、サブフレーム単位でパルス間隔が可変の駆動パルス列からなる駆動信号を生成する手段と、

目【J記駆動信号により駆動される合成フィルタと、

目 U g己合成フィルタの出力信号と入力音声信号との聴感重み付き誤差信号のパヮ一が最小となるように、前記駆動パルス列の振幅または振幅および位相を決定する手段と、

s己入力音声信号に対する短期予測残差信号をピッチ予測して得られるピッチ予測残差信号に基づいて前記駆動パルス列の密度を決定する手段とを具備する音声符号化装氍