WO2001015144A1

WO2001015144A1 - Vocodeur et procede correspondant

Info

Publication number: WO2001015144A1
Application number: PCT/JP2000/005621
Authority: WO
Inventors: Kazutoshi Yasunaga; Toshiyuki Morii
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 1999-08-23
Filing date: 2000-08-23
Publication date: 2001-03-01
Also published as: CA2348659C; AU6725500A; CA2722110C; US20050171771A1; EP1959435A2; EP1132892A4; CN1503222A; EP1959435A3; EP1959434B1; CN1242378C; WO2001015144A8; CA2722110A1; EP1959434A3; CN1503221A; US20050197833A1; US6988065B1; CA2348659A1; CN1242379C; US7289953B2; KR100391527B1

Description

明細書音声符号化装置及び音声符号化方法技術分野

本発明は、ディジタル通信システムにおいて使用される音声符号化装置および音声符号化方法に関する。背景技術

携帯電話などのディジ夕ル移動通信の分野では、加入者の増加に対処するために低ビットレートの音声の圧縮符号化法が求められており、各研究機関において研究開発が進んでいる。

日本国内においては、モトローラ社が開発したビットレート 1 1. 2 kb p sの V S E L Pという符号化法がディジ夕ル携帯電話用の標準符号化方式として採用され、同方式を搭載したディジタル携帯電話は 1994年秋から国内において発売されている。

また、 NTT移動通信網株式会社の開発したビットレート 5. 6 k b p sの

PS I—CELPという符号化方式が現在製品化されている。これらの方式はいずれも C E L P (Code Exited Linear Prediction: M . R . Schroeder" High Quality Speech at Low Bit Rates " Proc . ICASSP ' 85 pp.937-940に記載されている）という方式を改良したものである。

この CE LP方式は、音声を音源情報と声道情報とに分離し、音源情報については符号帳に格納された複数の音源サンプルのィンデクスによって符号化し、声道情報については LPC (線形予測係数）を符号化するということ及び音源情報符号化の際に声道情報を加味して入力音声とを比較することを行う方法（A— b— S： Analysis by Synthesis )を採用していることに特徴がある。この C E L P方式においては、まず、入力された音声データ（入力音声）に対して自己相関分析と L P C分析を行って L P C係数を得て、得られた L P C 係数の符号化を行って L P C符号を得る。さらに、得られた L P C符号を復号化して復号化 L P C係数を得る。一方、入力音声は、 L P C係数を用いた聴感重み付けフィル夕を用いて聴感重み付けされる。

適応符号帳と確率的符号帳に格納された音源サンプル（それぞれ適応コードベクトル（又は適応音源）、確率的コードベクトル（又は、確率的音源）と呼ぶ）のそれぞれのコードベクトルに対して、得られた復号化 L P C係数によつてフィル夕リングを行い、 2つの合成音を得る。

そして、得られた 2つの合成音と、聴感重み付けされた入力音声との関係を分析し、 2つの合成音の最適値（最適ゲイン）を求め、求められた最適ゲインによって合成音をパワー調整し、それぞれの合成音を加算して総合合成音を得る。その後、得られた総合合成音と入力音声との間の符号化歪みを求める。このようにして、全ての音源サンプルに対して総合合成音と入力音声との間の符号化歪みを求め、符号化歪みが最も小さいときの音源サンプルのインデクスを求める。

このようにして得られたゲイン及び音源サンプルのインデクスを符号化し、これらの符号化されたゲイン及び音源サンプルを L P C符号と共に伝送路に送る。また、ゲイン符号と音源サンプルのインデクスに対応する 2つの音源から実際の音源信号を作成し、それを適応符号帳に格納すると同時に古い音源サンプルを破棄する。

なお、一般的には、適応符号帳と確率的符号帳に対する音源探索は、分析区間をさらに細かく分けた区間（サブフレームと呼ばれる）で行われる。

ゲインの符号化（ゲイン量子化）は、音源サンプルのインデクスに対応する 2つの合成音を用いてゲインの量子化歪を評価するベクトル量子化（V Q) によって行われる。

このアルゴリズムにおいては、予めパラメ一夕べクトルの代表的サンプル (コードベクトル）が複数格納されたベクトル符号帳を作成しておく。次いで、聴感重み付けした入力音声と、適応音源及び確率的音源を聴感重み付け L P C 合成したものとに対して、べクトル符号帳に格納されたゲインコードべクトルを用いて符号化歪を下記式 1により計算する。

I 2

En = ^ (Xi - gn X Ai - hn Si) 式 l ここで、

E _n： n番のゲインコードべクトルを用いたときの符号化歪み

X i ：聴感重み付け音声

A , ：聴感重み付け L P C合成済み適応音源

S i ：聴感重み付け L P C合成済み確率的音源

g _n：コードべクトルの要素（適応音源側のゲイン）

h _n：コードべクトルの要素（確率的音源側のゲイン）

n ：コ一ドべクトルの番号

i ：音源データのインデクス

I ：サブフレーム長（入力音声の符号化単位）

次いで、べクトル符号帳を制御することによって各コ一ドべクトルを用いたときの歪 E _nを比較し、最も歪の小さいコードべクトルの番号をべクトルの符号とする。また、ベクトル符号帳に格納された全てのコードベクトルの中で最も歪みが小さくなるコードベクトルの番号を求め、これをベクトルの符号とする。

上記式 1は一見して各 n毎に多くの計算を必要とするように見えるが、予め iについての積和を計算しておけばよいので、少ない計算量で nの探索を行うことができる。

一方、音声復号化装置（デコーダ）では、伝送されてきたベクトルの符号に基づいてコードべクトルを求めることによって符号化されたデータを復号化してコ一ドべクトルを得る。

また、上記アルゴリズムを基本として、従来よりさらなる改良がなされてきた。例えば、人間の音圧の聴覚特性が対数であることを利用し、パヮを対数化して量子化し、そのパヮで正規化した 2つのゲインを V Qする。この方法は、日本国 P D Cハーフレートコ一デックの標準方式で用いられている方法である。また、ゲインパラメ一夕のフレーム間相関を利用して符号化する方法（予測符号化）がある。この方法は、 I T U— T国際標準 G . 7 2 9で用いられている方法である。しかしな力ら、これらの改良によっても十分な性能を得ることができていない。

これまで人間の聴覚特性やフレーム間相関を利用したゲイン情報符号化法が開発され、ある程度効率の良いゲイン情報の符号化が可能になった。特に、予測量子化によって性能は大きく向上したが、その従来法では、状態としての値として以前のサブフレームの値をそのまま用いて予測量子化を行っていた。しかしながら、状態として格納される値の中には、極端に大きな（小さな）値をとるものがあり、その値を次のサブフレームに用いると、次のサブフレームの量子化がうまくいかず、局所的異音になる場合がある。発明の開示

本発明の目的は、予測量子化を用いて局所的異音を生じることなく音声符号化を行うことができる C E L P型音声符号化装置及び方法を提供することである。

本発明の主題は、予測量子化において前のサブフレームでの状態値が極端に大きな値や極端に小さな値である場合に、自動的に予測係数を調整することにより、局所的異音の発生を防止することである。図面の簡単な説明

図 1は、本発明の音声符号化装置を備えた無線通信装置の構成を示すプロック図；

図 2は、本発明の実施の形態 1に係る音声符号化装置の構成を示すプロック図；

図 3は、図 2に示す音声符号化装置におけるゲイン演算部の構成を示すプロック図；

図 4は、図 2に示す音声符号化装置におけるパラメータ符号化部の構成を示すブロック図；

図 5は、本発明の実施の形態 1に係る音声符号化装置で符号化された音声デ一夕を復号する音声複号化装置の構成を示すプロック図；

図 6は、適応符号帳探索を説明するための図；

図 7は、本発明の実施の形態 2に係る音声符号化装置の構成を示すプロック図；

図 8は、パルス拡散符号帳を説明するためのブロック図；

図 9は、パルス拡散符号帳の詳細な構成の一例を示すブロック図；図 1 0は、パルス拡散符号帳の詳細な構成の一例を示すプロック図；図 1 1は、本発明の実施の形態 3に係る音声符号化装置の構成を示すブロック図；

図 1 2は、本発明の実施の形態 3に係る音声符号化装置で符号化された音声データを復号する音声復号化装置の構成を示すブロック図；

図 1 3 Aは、本発明の実施の形態 3に係る音声符号化装置で用いるパルス拡散符号帳の一例を示す図；

図 1 3 Bは、本発明の実施の形態 3に係る音声復号化装置で用いるパルス拡散符号帳の一例を示す図；

図 1 4 Aは、本発明の実施の形態 3に係る音声符号化装置で用いるパルス拡散符号帳の一例を示す図；並びに

図 1 4 Bは、本発明の実施の形態 3に係る音声復号化装置で用いるパルス拡散符号帳の一例を示す図である。発明を実施するための最良の形態

以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。

(実施の形態 1 )

図 1は、本発明の実施の形態 1〜 3に係る音声符号化装置を備えた無線通信装置の構成を示すブロック図である。

この無線通信装置において、送信側で音声がマイクなどの音声入力装置 1 1 によって電気的アナログ信号に変換され、 AZD変換器 1 2に出力される。ァナログ音声信号は、 AZD変換器 1 2によってディジタル音声信号に変換され、音声符号化部 1 3に出力される。音声符号化部 1 3は、ディジタル音声信号に対して音声符号化処理を行い、符号化した情報を変復調部 1 4に出力する。変復調部 1 4は、符号化された音声信号をディジタル変調して、無線送信部 1 5 に送る。無線送信部 1 5では、変調後の信号に所定の無線送信処理を施す。この信号は、アンテナ 1 6を介して送信される。なお、プロセッサ 2 1は、適宜 R AM 2 2及び R OM 2 3に格納されたデータを用いて処理を行う。

一方、無線通信装置の受信側では、アンテナ 1 6で受信した受信信号は、無線受信部 1 7で所定の無線受信処理が施され、変復調部 1 4に送られる。変復調部 1 4では、受信信号に対して復調処理を行い、復調後の信号を音声復号化部 1 8に出力する。音声複号化部 1 8は、復調後の信号に復号処理を行ってディジ夕ル復号音声信号を得て、そのディジ夕ル復号音声信号を D ZA変換器 1 9へ出力する。 D ZA変換器 1 9は、音声復号化部 1 8から出力されたデイジ夕ル復号音声信号をアナログ復号音声信号に変換してスピーカなどの音声出力装置 2 0に出力する。最後に音声出力装置 2 0が電気的アナログ復号音声信号を復号音声に変換して出力する。

ここで、音声符号化部 1 3及び音声復号化部 1 8は、 R AM 2 2及び R O M 2 3に格納された符号帳を用いて D S Pなどのプロセッサ 2 1により動作する。また、これらの動作プログラムは、 R O M 2 3に格納されている。図 2は、本発明の実施の形態 1に係る CE LP型音声符号化装置の構成を示すブロック図である。この音声符号化装置は、図 1に示す音声符号化部 13に含まれている。なお、図 2に示す適応符号帳 103は図 1に示す RAM22に格納されており、図 2に示す確率的符号帳 104は図 1に示す ROM 23に格納されている。

図 2に示す音声符号化装置においては、 L PC分析部 102において、入力された音声データ 10 1に対して自己相関分析及び LP C分析を行って LP C係数を得る。また、 L PC分析部 102では、得られた LP C係数の符号化を行って LP C符号を得る。さらに、 L PC分析部 102では、得られた LP C符号を復号化して復号化 L PC係数を得る。入力された音声データ 101は、聴感重み付け部 107に送られ、そこで上記 LP C係数を用いた聴感重み付けフィル夕を用いて聴感重み付けされる。

次に、音源作成部 105において、適応符号帳 103に格納された音源サンプル（適応コードべクトル又は適応音源）と確率的符号帳 104に格納された音源サンプル（確率的コードベクトル又は、確率的音源）を取り出し、それぞれのコードベクトルを聴感重み L P C合成部 106へ送る。さらに、聴感重みし？じ合成部106において、音源作成部 105で得られた 2つの音源に対して、し？( 分析部102で得られた復号化 LP C係数によってフィルタリングを行い、 2つの合成音を得る。

なお、聴感重み LP C合成部 106においては、 LPC係数や高域強調フィル夕ゃ長期予測係数（入力音声の長期予測分析を行うことによって得られる）を用いた聴感重み付けフィルターを併用してそれぞれの合成音に対して聴感重み付け LP C合成を行う。

聴感重み LP C合成部 106は、 2つの合成音をゲイン演算部 108に出力する。ゲイン演算部 108は、図 3に示す構成を有する。ゲイン演算部 108 においては、聴感重み LP C合成部 106で得られた 2つの合成音及びを聴感重み付けされた入力音声を分析部 108 1に送り、そこで 2つの合成音と入力音声との関係を分析し、 2つの合成音の最適値（最適ゲイン）を求める。この最適ゲインは、パヮ調整部 1 0 8 2に出力される。

パヮ調整部 1 0 8 2では、求められた最適ゲインによって 2つの合成音をパヮ調整する。パヮ調整された合成音は、合成部 1 0 8 3に出力されて、そこで加算されて総合合成音となる。この総合合成音は、符号化歪算出部 1 0 8 4に出力される。符号化歪算出部 1 0 8 4では、得られた総合合成音と入力音声との間の符号化歪みを求める。

符号化歪算出部 1 0 8 4は、音源作成部 1 0 5を制御して、適応符号帳 1 0 3及び確率的符号帳 1 0 4の全ての音源サンプルを出力させ、全ての音源サンプルに対して総合合成音と入力音声との間の符号化歪みを求め、符号化歪みが最も小さいときの音源サンプルのインデクスを求める。

次に、分析部 1 0 8 1は、音源サンプルのインデクス、そのインデクスに対応する 2つの聴感重み付け L P C合成された音源、及び入力音声をパラメ一夕符号化部 1 0 9に送る。

パラメ一夕符号化部 1 0 9では、ゲインの符号化を行うことによってゲイン符号を得、 L P C符号、音源サンプルのインデクスをまとめて伝送路へ送る。また、ゲイン符号とィンデクスに対応する 2つの音源から実際の音源信号を作成し、それを適応符号帳 1 0 3に格納すると同時に古い音源サンプルを破棄する。なお、一般的には、適応符号帳と確率的符号帳に対する音源探索は、分析区間をさらに細かく分けた区間（サブフレームと呼ばれる）で行われる。ここで、上記構成を有する音声符号化装置のパラメ一夕符号化部 1 0 9のゲイン符号化の動作について説明する。図 4は、本発明の音声符号化装置のパラメータ符号化部の構成を示すプロック図である。

図 4において、聴感重み付け入力音声（Χ ; ) 、聴感重み付け L P C合成済み適応音源（Α 、及び聴感重み付け L P C合成済み確率的音源（S i ) がパラメ一夕計算部 1 0 9 1に送られる。パラメ一夕計算部 1 0 9 1では、符号化歪計算に必要なパラメ一夕を計算する。パラメ一夕計算部 1 0 9 1で計算されたパラメ一夕は、符号化歪計算部 1 0 9 2に出力され、そこで符号化歪が計算される。この符号化歪は、比較部 1 0 9 3に出力される。比較部 1 0 9 3では、符号化歪計算部 1 0 9 2及びべクトル符号帳 1 0 9 4を制御して、得られた符号化歪から最も適当とされる符号（復号化ベクトル）を求め、この符号を基にべクトル符号帳 1 0 9 4から得られるコードべクトルを複号化べクトル格納部 1 0 9 6に出力し、復号化べクトル格納部 1 0 9 6を更新する。

予測係数格納部 1 0 9 5は、予測符号化に用いる予測係数を格納する。この予測係数はパラメ一夕計算及び符号化歪計算に用いられるために、パラメ一夕計算部 1 0 9 1及び符号化歪計算部 1 0 9 2に出力される。復号化べクトル格納部 1 0 9 6は、予測符号化のために状態を格納する。この状態は、パラメ一夕計算に用いられるため、パラメ一夕計算部 1 0 9 1に出力される。ベクトル符号帳 1 0 9 4は、コードベクトルを格納する。

次に、本発明に係るゲイン符号化方法のァルゴリズムについて説明する。予め、量子化対象ベクトルの代表的サンプル（コードベクトル）が複数格納されたベクトル符号帳 1 0 9 4を作成しておく。各ベクトルは、 A Cゲイン、 S Cゲインの対数値に対応する値、及び S Cの予測係数の調整係数の 3つの要素からなる。

この調整係数は、以前のサブフレームの状態に応じて予測係数を調整する係数である。具体的には、この調整係数は、以前のサブフレームの状態が極端に大きな値又は極端に小さな値である場合に、その影響を小さくするように設定される。この調整係数は、多数のベクトルサンプルを用いた本発明者らが開発した学習アルゴリズムにより求めることが可能である。ここでは、この学習ァルゴリズムについての説明は省略する。

例えば、有声音に多くの頻度で用いるコードべクトルは調整係数を大きく設定する。すなわち、同じ波形が並んでいる場合には、以前のサブフレームの状態の信頼性が高いので調整係数を大きくして、以前のサブフレームの予測係数をそのまま利用できるようにする。これにより、より効率的な予測を行うことができる。

一方、語頭などに使用するあまり使用頻度の少ないコードべクトルは調整係数を小さくする。すなわち、前の波形と全然違う場合には、以前のサブフレームの状態の信頼性が低い（適応符号帳が機能しないと考えられる）ので、調整係数を小さくして、以前のサブフレームの予測係数の影響を小さくする。これにより、次の予測の弊害を防いで良好な予測符号化を実現することができる。このように、各コードベクトル（状態）に応じて予測係数を制御することにより、これまでの予測符号化の性能をさらに向上させることができる。

また、予測係数格納部 1 0 9 5には、予測符号化を行うための予測係数を格納しておく。この予測係数は M A (moving average )の予測係数で A Cと S Cの 2種類を予測次数分格納する。これらの予測係数値は、一般に、予め多くのデータを用いた学習により求めておく。また、複号化ベクトル格納部 1 0 9 6には、初期値として無音状態を示す値を格納しておく。

次に、符号化方法について詳細に説明する。まず、パラメ一夕計算部 1 0 9 1に聴感重み付け入力音声（X 、聴感重み付け L P C合成済み適応音源（A 、聴感重み付け L P C合成済み確率的音源（S を送り、さらに復号化べクトル格納部 1 0 9 6に格納された復号化ベクトル（A C、 S C、調整係数）、予測係数格納部 1 0 9 5に格納された予測係数（A C、 S O を送る。これらを用いて符号化歪計算に必要なパラメ一夕を計算する。

符号化歪計算部 1 0 9 2における符号化歪計算は、下記式 2にしたがって行 Ό。

I 2

En = (Xi - Gan χ Ai - Gsn χ Si) 式 2 ここで、

G _{a n} , G _{s n}：復号化ゲイン

E _n ： n番のゲインコードべクトルを用いたときの符号化歪み Xi 聴感重み付け音声

聴感重み付け L P C合成済み適応音源

S i 聴感重み付け L P C合成済み確率的音源

n コードべクトルの番号

i 音源べクトルのインデクス

I サブフレーム長（入力音声の符号化単位）

この場合、演算量を少なくするために、パラメ一夕計算部 1 09 1では、コ —ドベクトルの番号に依存しない部分の計算を行う。計算しておくものは、上記予測ベクトルと 3つの合成音（Χ Α_;, S i) 間の相関、パヮである。この計算は、下記式 3にしたがって行う。

Dxx = jXixXi Dxa = Xi χ Ai χ 2

Dxs = Xi x Si x 2

Daa = ^ Ai x Ai

Dss = SixSi 式 3

D_xx， D_xa， D_xs， D_aa， D_a! D_s ·合成音間の相関値、パヮ

X i ：聴感重み付け音声

A_s ：聴感重み付け L P C合成済み適応音源

S ：聴感重み付け L P C合成済み確率的音源

n ：コードべクトルの番号

i ：音源ベクトルのインデクス

I ：サブフレーム長（入力音声の符号化単位) また、パラメ一夕計算部 1091では、復号化ベクトル格納部 1096に格納された過去のコードべクトルと、予測係数格納部 1095に格納された予測係数を用いて下記式 4に示す 3つの予測値を計算しておく。

Pra = 2 am x Sam

m-0

M

Prs = P^m x Scm x Ssm

m-0

M

Psc = ^pm Scm

m-0 式 4 ここで、

P_ra：予測値

P _{r B} ：予測値

P_s ：予測値（予測係数）

a_m :予測係数（ACゲイン、固定値）

i3_m :予測係数（SCゲイン、固定値）

S_am：状態（過去のコードベクトルの要素、 ACゲイン）

S ：状態（過去のコードベクトルの要素、 SCゲイン）

S_cm：状態（過去のコードベクトルの要素、 SC予測係数調整係数）

m：予測インデクス

M：予測次数

上記式 4から分かるように、 P_rs、 P_scについては、従来と異なり調整係数が乗算されている。したがって、 S Cゲインの予測値及び予測係数については、調整係数により、以前のサブフレームにおける状態の値が極端に大きいか小さい場合に、それを緩和する（影響を小さくする）ことができる。すなわち、状態に応じて適応的に S Cゲインの予測値及び予測係数を変化させることが可能となる。

次に、符号化歪計算部 1092において、パラメ一夕計算部 1091で計算した各パラメ一夕、予測係数格納部 1095に格納された予測係数、及びべクトル符号帳 1094に格納されたコードべクトルを用いて、下記式 5にしたがつて符号化歪を算出する。

En = Dxx + (Gan)² χ Daa + (Gsn)² x Dss - Gan x Dxa 一 Gsn χ Dxs + Gan χ Gsn χ Das

Gan = Pr a + (1 - Pac ) χ Can

Gsn = 10^A{Pr s + (1 -Psc)xCsn 式 5 ここで、

E_n： n番のゲインコードべクトルを用いたときの符号化歪み

D_xx， D_xa， D_xs， D_aa， D_as， D_{s s} ：合成音間の相関値、パヮ

G_an, G_sn：復号化ゲイン

P_ra：予測値（ACゲイン）

P_{r s} ：予測値（SCゲイン）

P_ac：予測係数の和（固定値）

P_sc ：予測係数の和（上記式 4で算出）

C_an， C_{s n}，：コードベクトル、 C_enは予測係数調整係数であるがここでは使用しない

n ：コードべクトルの番号

なお、実際には D_xxはコードベクトルの番号 nに依存しないので、その加算を省略することができる。

次いで、比較部 1093は、べクトル符号帳 1094と符号化歪計算部 10 92を制御し、ベクトル符号帳 1094に格納された複数のコードベクトルの中で符号化歪計算部 1092にて算出された符号化歪みの最も小さくなるコードベクトルの番号を求め、これをゲインの符号とする。また、得られたゲインの符号を用いて復号化べクトル格納部 1096の内容を更新する。更新は、下記式 6にしたがって行う。

Sam=Sam-l(M=M〜l)，SaO=CaJ

Ssm=Ssm-l(M=M〜 1)，SS0=CSJ

Scm=Scm-l(M=M〜l),ScO=CcJ

式 6 ここで、

S _{a m}, S _{s m}， S _{c m}：状態ベクトル（A C、 S C、予測係数調整係数） m：予測インデクス

M：予測次数

J ：比較部で求められた符号

式 4から式 6までで分かるように、本実施の形態では、複号化ベクトル格納部 1 0 9 6で状態べクトル S _{e m}を格納しておいて、この予測係数調整係数を用いて予測係数を適応的に制御している。

図 5は、本発明の実施の形態の音声復号化装置の構成を示すプロック図である。この音声復号化装置は、図 1に示す音声復号化部 1 8に含まれている。なお、図 5に示す適応符号帳 2 0 2は図 1に示す R AM 2 2に格納されており、図 5に示す確率的符号帳 2 0 3は図 1に示す R OM 2 3に格納されている。図 5に示す音声復号化装置において、パラメ一夕復号化部 2 0 1は、伝送路から、符号化された音声信号を得ると共に、各音源符号帳（適応符号帳 2 0 2、確率的符号帳 2 0 3 ) の音源サンプルの符号、 L P C符号、及びゲイン符号を得る。そして、 L P C符号から復号化された L P C係数を得て、ゲイン符号から復号化されたゲインを得る。

そして、音源作成部 2 0 4は、それぞれの音源サンプルに復号化されたゲインを乗じて加算することによって復号化された音源信号を得る。この際、得られた復号化された音源信号を、音源サンプルとして適応符号帳 2 0 4へ格納し、同時に古い音源サンプルを破棄する。そして、し？じ合成部2 0 5では、復号化された音源信号に復号化された L P C係数によるフィル夕リングを行うことによって、合成音を得る。

また、 2つの音源符号帳は、図 2に示す音声符号化装置に含まれるもの（図 2の参照符号 1 0 3， 1 0 4 ) と同様のものであり、音源サンプルを取り出すためのサンプル番号（適応符号帳への符号と確率的符号帳への符号）は、いずれもパラメ一夕復号化部 2 0 1から供給される。

このように、本実施の形態の音声符号化装置では、各コードベクトルに応じて予測係数を制御することが可能になり、音声の局所的特徴により適応したより効率的な予測や、非定常部における予測の弊害を防ぐことが可能になり、従来得られなかつた格別の効果を得ることができる。

(実施の形態 2 )

音声符号化装置において、上述したように、ゲイン演算部では、音源作成部から得られた適応符号帳、確率的符号帳の全ての音源について合成音と入力音声との間の比較を行う。このとき、演算量の都合上、通常は 2つの音源（適応符号帳と確率的符号帳）はオープンループに探索される。以下、図 2を参照して説明する。

このオープンループ探索においては、まず、音源作成部 1 0 5は適応符号帳 1 0 3からのみ音源候補を次々に選び、聴感重み L P C合成部 1 0 6を機能させて合成音を得て、ゲイン演算部 1 0 8へ送り、合成音と入力音声との間の比較を行って最適な適応符号帳 1 0 3の符号を選択する。

次いで、上記適応符号帳 1 0 3の符号を固定して、適応符号帳 1 0 3からは同じ音源を選択し、確率的符号帳 1 0 4からはゲイン演算部 1 0 8の符号に対応した音源を次々に選択して聴感重み L P C合成部 1 0 6へ伝送する。ゲイン演算部 1 0 8で両合成音の和と入力音声との間の比較を行って確率的符号帳 1 0 4の符号を決定する。

このアルゴリズムを用いた場合、全ての符号帳の符号をそれぞれに対して全て探索するよりは符号化性能は若干劣化するが、計算量は大幅に削減される。このため一般にはこのオープンループ探索が用いられる。ここで、従来のオープンループの音源探索の中で代表的なアルゴリズムについて説明する。ここでは、 1つの分析区間（フレーム）に対して 2つのサブフレームで構成する場合の音源探索手順について説明する。

まず、ゲイン演算部 1 0 8の指示を受けて、音源作成部 1 0 5は適応符号帳 1 0 3から音源を引出して聴感重み L P C合成部 1 0 6へ送る。ゲイン演算部 1 0 8において、合成された音源と第 1サブフレームの入力音声との間の比較を繰り返して最適な符号を求める。ここで、適応符号帳の特徴を示す。適応符号帳は過去において合成に使用した音源である。そして、符号は、図 6に示すようにタイムラグに対応している。

次に、適応符号帳 1 0 3の符号が決まった後に、確率的符号帳の探索を行う。音源作成部 1 0 5は適応符号帳 1 0 3の探索で得られた符号の音源とゲイン演算部 1 0 8で指定された確率的符号帳 1 0 4の音源とを取り出して聴感重み L P C合成部 1 0 6へ送る。そして、ゲイン演算部 1 0 8において、聴感重み付け済みの合成音と聴感重み付け済みの入力音声との間の符号化歪みを計算し、最も適当な（二乗誤差が最小となるもの）確率的音源 1 0 4の符号を決める。 1つの分析区間（サブフレームが 2の場合）での音源符号探索の手順を以下に示す。

1 ) 第 1サブフレームの適応符号帳の符号を決定

2 ) 第 1サブフレームの確率的符号帳の符号を決定

3 ) パラメ一夕符号化部 1 0 9でゲインを符号化し、復号化ゲインで第 1サブフレームの音源を作成し、適応符号帳 1 0 3を更新する。

4 ) 第 2サブフレームの適応符号帳の符号を決定

5 ) 第 2サブフレームの確率的符号帳の符号を決定

6 ) パラメ一夕符号化部 1 0 9でゲインを符号化し、復号化ゲインで第 2サブフレームの音源を作成し、適応符号帳 1 0 3を更新する。

上記アルゴリズムによって効率よく音源の符号化を行うことができる。しかしながら、最近では、さらなる低ビットレート化を目指し、音源のビット数を節約する工夫が行われている。特に注目されているのは、適応符号帳のラグに大きな相関があることを利用して、第 1サブフレームの符号はそのままで、第 2サブフレームの探索範囲を第 1サブフレームのラグの近くに狭めて（ェントリ数を減らして）ビット数を少なくするというアルゴリズムである。

このアルゴリズムでは、分析区間（フレーム）の途中から音声が変化する場合や、 2つのサブフレームの様子が大きく異なる場合には局所的劣化を引き起こすことが考えられる。

本実施の形態では、符号化の前に 2つのサブフレーム両方についてピッチ分析を行って相関値を算出し、得られた相関値に基づいて 2つのサブフレームのラグの探索範囲を決定する探索方法を実現する音声符号化装置を提供する。具体的には、本実施の形態の音声符号化装置は、 1つのフレームを複数のサブフレームに分解してそれぞれを符号化する C E L P型符号化装置において、最初のサブフレームの適応符号帳探索の前に、フレームを構成する複数のサブフレームのピッチ分析を行って相関値を算出するピッチ分析部と、上記ピッチ分析部がフレームを構成する複数のサブフレームの相関値を算出すると共に、その相関値の大小から各サブフレームで最もピッチ周期らしい値（代表ピッチと呼ぶ）を求め、ピッチ分析部にて得られた相関値と代表ピッチとに基づいて複数のサブフレームのラグの探索範囲を決定する探索範囲設定部と、を備えることを特徴としている。そして、この音声符号化装置では、探索範囲設定部において、ピッチ分析部で得た複数のサブフレームの代表ピッチと相関値を利用して採索範囲の中心となる仮のピッチ（仮ピッチと呼ぶ）を求め、探索範囲設定部において、求めた仮ピッチの周りの指定の範囲にラグの探索区間を設定し、ラグの探索区間を設定するときに、仮ピッチの前後に探索範囲を設定する。また、その際に、ラグの短い部分の候補を少なくし、ラグのより長い範囲を広く設定し、適応符号帳探索の際に上記探索範囲設定部で設定された範囲でラグの探索を行う。

以下、本実施の形態に係る音声符号化装置について添付図面を用いて詳細に

c説明する。ここでは、 1フレームは 2サブフレームに分割されているものとする。 3サブフレーム以上の場合でも同様の手順で符号化を行うことができる。この音声符号化装置においては、いわゆるデルタラグ方式によるピッチ探索において、分割されたサブフレームについてすべてピッチを求め、ピッチ間でどの程度の相関があるかどうかを求めて、その相関結果に応じて探索範囲を決定する。

図 7は、本発明の実施の形態 2に係る音声符号化装置の構成を示すプロック図である。まず、 L PC分析部 302において、入力された音声デ一夕（入力音声） 301に対して自己相関分析と LP C分析を行うことによって LP C係数を得る。また、 L PC分析部 302にぼいて、得られた LPC係数の符号化を行って L PC符号を得る。さらに、 L PC分析部 302において、得られた L P C符号を復号化して復号化 L P C係数を得る。

次いで、ピッチ分析部 310において、 2サブフレーム分の入力音声のピッチ分析を行い、ピッチ候補とパラメ一夕を求める。 1サブフレームに対するァルゴリズムを以下に示す。相関係数は、下記式 7により、 2つ求められる。なおこの時、 C_ppは P_{mi n}についてまず求め、あとの P_{mi n+1}、 P_{mi n + 2}については、フレーム端の値の足し引きで効率的に計算できる。

Vp = ^XixXi P (P=Pmm~ max)

式 7 ここで、

Xi， X _P：入力音声

v_p：自己相関関数

c_pp：パヮ成分

i：入力音声のサンプル番号 L ：サブフレームの長さ

P ：ピッチ

P_{mi n}， P_max：ピッチの探索を行う最小値と最大値

そして、上記式 7で求めた自己相関関数とパヮ成分はメモリに蓄えておき、次の手順で代表ピッチ Piを求める。これは V_pが正で VpXVpZCppを最大にするピッチ Pを求める処理となっている。ただし、割り算は一般的に計算量がかかるので、分子と分母を 2つとも格納し、掛け算に直して効率化を図っている。

ここでは、入力音声と入力音声からピッチ分過去の適応音源との差分の二乗和が最も小さくなるようなピッチを探す。この処理は V _p X V _p z c _{p p}を最大にするピッチ Pを求める処理と等価となる。具体的な処理は以下のようになる。

1) 初期化（P = P_{mi n}、 vv = c=o、 P^P^J

2) もし（V_PXV_PXC<VVXC_PP) 又は（V_p<0) ならば 4) へ。それ以外なら 3) へ。

3) VV = V_PXV_P、 C = C_PP、 P_{1 =} Pとして 4) へ

4) P = P+ 1とする。この時 P〉P_maxであれば終了、それ以外の場合には 2) へ。

上記作業を 2サブフレームのそれぞれについて行い、代表ピッチ Pい P₂と自己相関係数 V_{l p}、 V_2p、パワー成分 C_lpp、 C_2pp (P_{mi n}<p<P_max) を求める。

次に、探索範囲設定部 31 1で適応符号帳のラグの探索範囲を設定する。まず、その探索範囲の軸となる仮ピッチを求める。仮ピッチはピッチ分析部 31 0で求めた代表ピッチとパラメ一夕を用いて行う。

仮ピッチ Q₂は以下の手順で求める。なお、以下の説明においてラグの範囲として定数 Th (具体的には 6程度が適当である）を用いる。また、相関値は上記式 7で求めたものを用いる。

まず、 Piを固定した状態で Piの付近（土 Th) で相関の最も大きい仮ピッチ（Q₂) を見つける。

1) 初期化（p Pi— Th、 C_max=0、 Q^P^ Q₂ = P

2) もし（V_lplXV_{l pl}ZC_{l plpl} + V_2pXV_2pZC_2pp<C_max) または (V_2p<0) ならば 4) へ。それ以外なら 3) へ。

3) C_max = V_lplXV_{l pl}ZC_lplpl + V_2pXV_2pZC_2pp、 Q₂=pとして 4) へ

4) p = p+ lとして 2) へ。ただし、この時 p〉Pェ + Thであれば 5) へ。

このようにして 2) 〜4) の処理を P i— Th〜P + Thまで行って、相関の最も大きいもの C_maxと仮ピッチ Q₂を求める。

次に、 P₂を固定した状態で P₂の付近（土 Th) で相関の最も大きい仮ピッチ（《2 を求める。この場合、 C_maxは初期化しない。 Q₂を求めた際の C_ma _xを含めて相関が最大となるを求めることにより、第 1，第 2サブフレーム間で最大の相関を持つ Qい Q₂を求めることが可能となる。

5) 初期化（p = P₂— Th)

6)もし（V_{l p}XV₁ C_{l pp} + V_2p2XV_2pノC_2p2p2<C_max)又は（V _{l p}<0) ならば 8) へ。それ以外は 7) へ。

7) C_max = V_{l p}XV_lp/C_lpp + V_2p2XV_{2 p2}ZC_2p2p2、 Q₁ = p、 Q ₂ = P₂として 8) へ。

8) p = p+ lとして 6) へ。ただし、この時 p〉P₂ + Thであれば 9) へ。

9) 終了。

このようにして 6) 〜8) の処理を P₂— Th〜P₂ + Thまで行って、相関の最も大きいもの C_maxと仮ピッチ <3ぃ Q₂を求める。この時の Q₂が第 1サブフレームと第 2サブフレームの仮ピッチである。

上記アルゴリズムにより、 2つのサブフレームの相関を同時に評価しながら大きさに比較的差のない（差の最大は Thである）仮ピッチを 2つ選択することができる。この仮ピッチを用いることにより、第 2サブフレームの適応符号帳探索の際に、探索の範囲を狭く設定しても符号化性能を大きく劣化させることを防止できる。例えば、第 2サブフレームから音質が急に変化した場合などで、第 2サブフレームの相関が強い場合は、第 2サブフレームの相関を反映した Q を用いることで第 2サブフレームの劣化を回避出来る。

さらに、探索範囲設定部 3 1 1は、求めた仮ピッチを用いて適応符号帳の探索を行う範囲（L— _{S T}〜L— _{E N}) を下記式 8のようにして設定する。

第 1サブフレーム

L_ST=Ql-5 (ただし、 L一 STく Lminの時 L— ST=Lmin) L_EN=L— ST+20 (ただし、 L— ST>Lmaxの時 L一 ST=Lmax) 第 2サブフレーム

L— ST=T1-10 (ただし、 L一 ST<Lminの時 L— ST=Lmin) L_EN=L_ST+21 (ただし、 L— ST〉 maxの時 L_ST=Lmax) 式 8 ここで、

L__{S T}：探索範囲の最小

L__{E N}：探索範囲の最大

L _{m i n}：ラグの最小値（例： 2 0 )

L _{m a x}：ラグの最大値（例： 1 4 3 )

T\ ：第 1フレームの適応符号帳ラグ

上記設定において、第 1サブフレームは探索範囲を狭める必要はない。しかしながら、本発明者らは、入力音声のピッチに基づいた値の付近を探索区間とした方が性能が良いことを実験により確認しており、本実施の形態では 2 6サンプルに狭めて探索するアルゴリズムを使用している。

また、第 2サブフレームは第 1サブフレームで求められたラグを中心にその付近に探索範囲を設定している。したがって、合計 3 2エントリで、第 2 サブフレームの適応符号帳のラグを 5ビッ卜で符号化できることになる。また、本発明者らは、この時もラグの小さい候補を少なく、ラグの大きい候補を多く設定することにより、より良い性能が得られることを実験により確認している。ただし、これまでの説明でわかるように、本実施の形態においては、仮ピッチ Q ₂は使用しない。

ここで、本実施の形態における効果について説明する。探索範囲設定部 3 1 1によって得られた第 1サブフレームの仮ピッチの近くには、第 2サブフレームの仮ピッチも存在している（定数 T hで制限したため）。また、第 1サブフレームにおいて探索範囲を絞って探索しているので、探索の結果得られるラグは第 1サブフレームの仮ピッチから離れない。

したがって、第 2サブフレームの探索の時には、第 2サブフレームの仮ピッチから近い範囲を探索できることになり、第 1，第 2サブフレームの両方において適当なラグが探索できることになる。

例として、第 1サブフレームが無音で、第 2サブフレームから音声が立ち上がった場合を考える。従来法では、探索範囲を狭めることで第 2サブフレームのピッチが探索区間に含まれなくなると、音質は大きく劣化してしまう。本実施の形態に係る方法においては、ピッチ分析部の仮ピッチの分析において、代表ピッチ P ₂の相関は強く出る。したがって、第 1サブフレームの仮ピッチは P ₂付近の値になる。このため、デル夕ラグによる探索の際に、音声が立ち上がった部分に近い部分を仮ピッチとすることができる。すなわち、第 2サブフレームの適応符号帳の探索の時には、 P ₂付近の値を探索できることになり、途中で音声の立ち上がり生じても劣化なくデルダラグにより第 2サブフレームの適応符号帳探索を行うことができる。

次に、音源作成部 3 0 5において、適応符号帳 3 0 3に格納された音源サンプル（適応コードベクトル又は適応音源）と確率的符号帳 3 0 4に格納された音源サンプル（確率的コードベクトル又は確率的音源）を取り出し、それぞれを聴感重み L P C合成部 3 0 6へ送る。さらに、聴感重み L P C合成部 3 0 6 において、音源作成部 3 0 5で得られた 2つの音源に対して、 L P C分析部 3 0 2で得られた復号化 L P C係数によってフィルタリングを行って 2つの合成音を得る。

さらに、ゲイン演算部 3 0 8においては、聴感重み L P C合成部 3 0 6で得られた 2つの合成音と入力音声との関係を分析し、 2つの合成音の最適値（最適ゲイン）を求める。また、ゲイン演算部 3 0 8においては、その最適ゲインによってパヮ調整したそれぞれの合成音を加算して総合合成音を得る。そして、ゲイン演算部 3 0 8は、その総合合成音と入力音声の符号化歪みの計算を行う。また、ゲイン演算部 3 0 8においては、適応符号帳 3 0 3と確率的符号帳 3 0 4の全ての音源サンプルに対して音源作成部 3 0 5、聴感重み L P C合成部 3 0 6を機能させることによって得られる多くの合成音と入力音声との間の符号化歪みを行い、その結果得られる符号化歪みの中で最も小さいときの音源サンプルのィンデクスを求める。

次に、得られた音源サンプルのインデクス、そのインデクスに対応する 2つの音源、及び入力音声をパラメ一夕符号化部 3 0 9へ送る。パラメ一夕符号化部 3 0 9では、ゲインの符号化を行うことによってゲイン符号を得て、 L P C 符号、音源サンプルのインデクスと共に伝送路へ送る。

また、パラメ一夕符号化部 3 0 9は、ゲイン符号と音源サンプルのインデクスに対応する 2つの音源から実際の音源信号を作成し、それを適応符号帳 3 0 3に格納すると同時に古い音源サンプルを破棄する。

なお、聴感重み L P C合成部 3 0 6においては、 L P C係数や高域強調フィル夕ゃ長期予測係数（入力音声の長期予測分析を行うことによって得られる）を用いた聴感重み付けフィル夕を用いる。

上記ゲイン演算部 3 0 8は、音源作成部 3 0 5から得られた適応符号帳 3 0 3、確率的符号帳 3 0 4の全ての音源について入力音声との間の比較を行うが、計算量削減のため、 2つの音源（適応符号帳 3 0 3と確率的符号帳 3 0 4 ) については上述したようにしてオープンループにより探索する。

このように、本実施の形態におけるピッチ探索方法により、最初のサブフレームの適応符号帳探索の前に、フレームを構成する複数のサブフレームのピッチ分析を行つて相関値を算出することにより、フレーム内の全サブフレームの相関値を同時に把握することができる。

そして、各サブフレームの相関値を算出すると共に、その相関値の大小から各サブフレームで最もピッチ周期らしい値（代表ピッチと呼ぶ）を求め、ピッチ分析で得られた相関値と代表ピッチに基づいて複数のサブフレームのラグの探索範囲を設定する。この探索範囲の設定においては、ピッチ分析で得た複数のサブフレームの代表ピッチと相関値を利用して探索範囲の中心となる差の少ない適当な仮のピッチ（仮ピッチと呼ぶ）を求める。

さらに、上記探索範囲の設定で求めた仮ピッチの前後の指定の範囲にラグの探索区間を限定するので、適応符号帳の効率の良い探索を可能にする。その際、ラグの短い部分の候補を少なくし、ラグのより長い範囲を広く設定するので、良好な性能が得られる適当な探索範囲を設定することができる。また、適応符号帳探索の際に上記探索範囲の設定で設定された範囲でラグの探索を行うので、良好な復号化音を得ることができる符号化が可能になる。

このように、本実施の形態によれば、探索範囲設定部 3 1 1によって得られた第 1サブフレームの仮ピッチの近くには第 2サブフレームの仮ピッチも存在しており、第 1サブフレームにおいて探索範囲を絞っているので、探索の結果得られるラグは仮ピッチから離れて行かない。したがって、第 2サブフレームの探索の時には第 2サブフレームの仮ピッチ付近を探索できることになり、フレームの後半から音声が始まる場合などの非定常なフレームでも、第 1 , 第 2サブフレームにおいて適当なラグ探索が可能になり、従来得られなかった格別の効果を得ることができる。

(実施の形態 3 )

初期の C E L P方式では、ランダム数列が確率的音源ベクトルとして複数種類エントリーされた確率的符号帳、すなわち複数種類のランダム数列をメモリに直接記録した確率的符号帳が使われていた。一方、近年の低ビットレート C E LP符号化 ·復号化装置においては、振幅が + 1か— 1の非零要素（非零要素以外の要素の振幅は零）を少数個含んだ確率的音源べクトルを生成する代数的符号帳を確率的符号帳部に備えるものが多く開発されている。

なお、代数的符号帳は、「Fast CELP Coding based on Algebraic codesj , J . Adoul et al, Proc - IEEE Int. Conf . Acoustics , Speech, Signal Processing, 1987 , pp. 1957 -1960や「Comparison of Some Algebraic Structure for CELP Coding of Speech」， J. Adoul et al , Proc . IEEE Int. Conf . Acoustics , Speech, Signal Processing, 1987, pp. 1953-1956など Ίこ開示されてレる。

上記文献に開示されている代数的符号帳は、（1) ビットレートが 8kb/s 程度の CELP方式に適用した場合、品質の高い合成音を生成できる、（2) 少ない演算量で確率的音源符号帳を探索できる、（3) 確率的音源ベクトルを、直接格納しておくデータ ROM容量が不要になる、といった優れた特徴を有する符号帳である。

そして、代数符号帳を確率的符号帳として用いることを特徴とする CS— A CELP (ビットレート 8kb/s) や AC E L P (ビットレート 5. 3kb/s) 力 G. 729、 g 723. 1として、それぞれ I TU— Tから 1996年に勧告化されている。なお、 C S— AC E L Pに関しては、「Design and Description of CS-ACELP:A Toll Quality 8 kb/s Speech Coder」， Redwan Salami et al, IEEE trans . SPEECH AND AUDIO PROCESSING, vol. 6, no. 2, March 1998などに、その詳細技術が開示されている。代数的符号帳は、上記のように優れた特徴を有する符号帳である。しかしながら、代数的符号帳を CELP符号化，復号化装置の確率的符号帳に適用した場合、確率的音源ターゲットは、比零要素を少数個だけ含んだ確率的音源べクトルで常に符号化（ベクトル量子化）されることになるので、確率的音源夕一ゲットの忠実な符号表現は不可能であるという課題も生じている。そして、処理フレームが、無声子音区間や背景雑音区間などに相当する場合に、この課題は特に顕著になる。

無声子音区間や背景雑音区間では、確率的音源夕ーゲッ卜が複雑な形状になることが多いためである。またさらには、ビットレートが 8kb/s 程度よりさらに低い C E L P符号化 ·復号化装置に代数的符号帳を適用した場合には、確率的音源ベクトル中の比零要素数を少なくすることになるため、確率的音源夕ーゲッ卜がパルス的形状になりやすい有声区間でさえも、上記課題が問題になる場合がある。

代数的符号帳の有する上記課題を解決する一方法として、代数的符号帳より出力される少数個の非零要素（非零要素以外の要素はゼロの値を持つ）を含むベクトルと、拡散パタンと呼ばれる固定波形とを重畳して得られるベクトルを、合成フィル夕の駆動音源とするパルス拡散符号帳を用いる方法が開示されている。パルス拡散符号帳は、特開平 10— 232696号公報、「パルス拡散構造音源を併用する AC E LP符号化」安永他，電子情報通信学会平成 9年度春季全国大会発表予稿集， D-14-11, p. 253, 1997-03、「パルス拡散音源を用いた低レート音声符号化」安永他，日本音響学会平成 10年秋期研究発表会講演論文集， pp. 281-282, 1998-10など (こ開示されて！^る。

そこで次に、上記文献で開示されたパルス拡散符号帳の概要を、図 8及び図 9を用いて説明する。なお、図 9は、図 8のパルス拡散符号帳のさらに詳細な一例を示すものである。

図 8及び図 9のパルス拡散符号帳において、代数的符号帳 401 1は、少数個の非零要素（振幅は + 1又は一 1) からなるパルスベクトルを生成する符号帳である。上記文献に記載されている CEL P符号化装置 ·復号化装置では、代数的符号帳 40 1 1の出力であるパルスべクトル（少数個の非零要素によつて構成される）がそのまま、確率的音源ベクトルとして用いられている。

拡散パタン格納部 4012には、拡散パタンと呼ばれる固定波形が、各チヤネルあたり 1種類以上ずつ格納されている。なお、各チャネルごとに格納された前記拡散パタンは、チャネル毎で異なる形状の拡散パタンが格納される場合、各チャネルに同一形状（共通の）の拡散パタンが格納される場合の双方が考えられる。各チャネル用に格納される拡散パタンが共通の場合は、各チャネル用に格納される拡散パタンが格納される場合を簡単化したものに相当するので、本明細書の以下の説明では、チャネル毎に格納される拡散パタンの形状がそれぞれ異なる場合について説明を進めることとする。

パルス拡散符号帳 4 0 1は、代数的符号帳 4 0 1 1からの出力べクトルをそのまま確率的音源べクトルとして出力するのではなく、代数的符号帳 4 0 1 1 から出力されるべクトルと、拡散パタン格納部 4 0 1 2から読み出される拡散パタンとを、パルス拡散部 4 0 1 3でチャネルごとに重畳し、重畳演算によつて得られるべクトルを加算して得られるべクトルを確率的音源べクトルとして利用する。

なお、上記文献において開示されている C E L P符号化 '復号化装置は、符号化装置と復号化装置で同一構成（代数的符号帳部のチャネル数、拡散パタン格納部に登録されている拡散パタンの種類数および形状などが、符号化装置側と復号化装置側で共通）のパルス拡散符号帳を用いることを特徴としている。そして、拡散パタン格納部 4 0 1 2に登録しておく拡散パタンの形状、種類数、複数種類以上登録している場合にはそれらの選択方法を効率的に設定することによって、合成音声の品質を向上を図っている。

なお、パルス拡散符号帳に関するここでの説明は、少数個の非零要素からなるパルスベクトルを生成する符号帳として、非零要素の振幅を + 1もしくは— 1に限定した代数的符号帳を用いた場合についての説明であるが、当該パルスべクトルを生成する符号帳としては、非零要素の振幅を限定しないマルチパルス符号帳や、レギュラーパルス符号帳を用いることも可能であり、その場合にも、パルスべクトルを拡散パタンと重畳したものを確率的音源べクトルとして利用することで合成音声の品質向上を実現できる。

これまでに、多くの確率的音源ターゲットの形状を統計学習し、確率的音源夕ーゲッ卜中に統計的に高い頻度で含まれる形状の拡散パタン、無声子音区間や雑音区間を効率的に表現するための乱数的な形状の拡散パタン、有声定常区間を効率的に表現するためのパルス的な形状の拡散パタン、代数的符号帳から出力されるパルスべクトルのエネルギー（非零要素の位置にエネルギーが集中している）を周囲に分散させるような作用を与える形状の拡散パタン、適当に用意したいくつかの拡散パタン候補について、音声信号を、符号化、複号化、合成音声の視聴評価を繰り返し、品質の高い合成音声を出力しうるよう選択した拡散パタン、又は音声学的な知見をもとに作成した拡散パタンなどを、代数的符号帳から出力される音源ベクトル中の非零要素（チャネル）あたり 1種類以上ずつ登録しておき、登録しておいた拡散パタンと、代数的符号帳によって生成されるベクトル（少数個の非零要素によって構成される）とをチャネルごとに重畳し、各チャネルの重畳結果を加算したものを確率的音源べクトルとして用いることにより、合成音声を有効に品質向上させることができることが開示されてきた。

また、特に、拡散パタン格納部 4 0 1 2が、チャネルあたり複数種類（2種類以上）の拡散パタンを登録している場合については、それら複数の拡散パ夕ンの選択方法として、登録された拡散パタンの全組合わせについて実際に符号化 ·復号化を行い、その結果生じる符号化歪みが最小になるような拡散パタンをクローズド選択する方法や、確率的符号帳探索を行う時点で既に明らかになつている音声的情報（ここでいう音声的情報とは、例えば、ゲイン符号の動的変動情報もしくはゲイン値の（予め設定したしきい値との）大小関係情報などを利用して判定した有声性の強弱情報、あるいは、線形予測符号の動的変動を利用して判定した有声性の強弱情報などのことである）利用して、拡散パタンをオープン選択する方法などが開示されている。

なお、以降の説明では、説明を簡単にするため、図 9のパルス拡散符号帳内の拡散パタン格納部 4 0 1 3が、チャネルあたり 1種類だけの拡散パタンを登録していることを特徴とする図 1 0のパルス拡散符号帳に限定して説明する。ここでは次に、代数的符号帳を C E L P符号化装置に適用した場合の確率的符号帳探索処理と比較して、パルス拡散符号帳を C E L P符号化装置に適用した場合の確率的符号帳探索処理を説明する。まず、代数的符号帳を確率的符号帳部に用いた場合の符号帳探索処理を説明する。

代数的符号帳によって出力されるべクトル内の非零要素数を N (代数的符号帳のチャネル数を N) 、チャネルごとに出力する振幅が + 1か一 1の非零要素を 1本だけ含むベクトル（非零要素以外の要素の振幅はゼロ）を d i ( iはチャネル番号： 0≤ i≤N— l ) 、サブフレーム長を Lとした時、代数的符号帳によって出力されるエントリ一番号 kの確率的音源べクトル c kは、下記式 9 となる。

N-1

Ck = ^ di

Ck:代数的符号帳によるェントリ番号 Kの確率的音源べクトル

di:非零要素ベクトル（di = ±S(n - pi) ただし、 pi：非零要素位置）

N:代数的符号帳のチャネル数（=確率的音源べクトル中の非零要素数）式 9 そして、式 9を式 1 0に代入することで、下記式 1 1が得られる。

V ： V (確率的音源ターゲット）の転置ベクトル H^t ： H (合成フィル夕のインパルス応答行列）の転置行列 ck :エントリ番号 k番目の確率的音源べクトル式 1 0

V :確率的音源夕ーゲットベクトル

H :合成フィル夕のィンパルス応答畳み込み行列

di :非零要素ベクトル（di= ± S(n - Pi) ただし、 pi：非零要素位置）

N :代数的符号帳のチャネル数（=確率的音源べクトル中の非零要素数）

X =ν^ι Η

Μ=Η^ι Η

式 1 1 この式 1 0を整理して得られる下記式 1 2を最大化するようなエントリ番号 kを特定する処理が確率的符号帳探索処理となる。

式 1 2 ただし、式 1 2において、 X^H、 Μ=Η"Η ( 7は確率的音源夕ーゲッ卜）である。ここで各エントリ番号 kについて式 1 2の値を計算する場合、その前処理段階で ^及び ^ を計算し、計算結果をメモリに展開（記憶）させておく。この前処理を導入することで、確率的音源ベクトルとしてェントリしている各候補ごとに式 1 2を計算する際の演算量を大幅に削減でき、この結果として、確率的符号帳探索に要するトータルの演算量を少なくおさえられることが、上記文献などに開示されており、一般に知られている。

次に、パルス拡散符号帳を確率的符号帳に用いた場合の確率的符号帳探索処理を説明する。パルス拡散符号帳の構成一部位である代数的符号帳によって出力される非零要素数を N (代数的符号帳のチャネル数を N) 、チャネルごとに出力する振幅が + 1か一 1の非零要素を 1本だけ含むべクトル（非零要素以外の要素の振幅はゼロ）を d i ( iはチャネル番号： 0≤ i≤N— l ) 、拡散パタン格納部が格納しているチャネル番号 i用の拡散パタンを wi、サブフレーム長をとした時、パルス拡散符号帳によって出力されるエントリー番号 kの確率的音源ベクトル c kは、下記式 1 3となる。

N-1

1=0

Ck:パルス拡散符号帳によるェントリ番号 Kの確率的音源べクトル

Wi：拡散パタン（wi )重畳行列

di:代数的符号帳部が出力する非零要素べクトル

( =± <5 (n-Pi) ただし、 p_{i :}非零要素位置）

N:代数的符号帳部のチャネル数

式 1 3 したがってこの場合、式 1 3を式 1 0に代入することで、下記式 1 4が得られる。

v:確率的音源ターゲットベクトル

H：合成フィルタのィンパルス応答畳み込み行列

Wi：拡散パタン（ w:L )重畳行列

di:代表的符号帳部が出力する非零要素べクトル

(di= ± δ(η - ただし、 _Pl：非零要素位置）

N:代数的符号帳のチャネル数（=確率的音源べクトル中の非零要素数） Hi=HWi

X； =v^lHi

R=HiHj

X

i t 式 1 4 この式 1 4を整理して得られる下記式 1 5を最大化する確率的音源べクトルのェン卜リ番号 kを特定する処理が、パルス拡散符号帳を用いた場合の確率的符号帳探索処理となる。

Dk = N - 1 N-1

式 1 5 ただし、式 1 5において、 xt- v^IIi (ただし、 = ；¾ ： Wiは拡散パタン重畳行列）、である。各エントリ番号 kについて式 1 5の値計算する場合、その前処理として =HWi及び ν"Η1及び R-Hi 'Hjを計算しメモリに記録しておくことが可能である。すると、確率的音源ベクトルとしてエントリしている各候補ごとに式 1 5を計算する際の演算量が、代数的符号帳を用いた場合に式 1 2を計算する際の演算量と同じになり（式 1 2と式 1 5が同形であることから明らか）、パルス拡散符号帳を用いた場合も、少ない演算量で確率的符号帳探索を行うことができる。

上記技術においては、パルス拡散符号帳を C E L P符号化装置 ·復号化装置の確率的符号帳部に用いることの効果、及びパルス拡散符号帳を確率的符号帳部に用いた場合に、代数的符号帳を確率的符号帳部に用いた場合と同様の方法で確率的符号帳探索を行えることを示した。代数的符号帳を確率的符号帳部に用いた場合の確率的符号帳探索に要する演算量と、パルス拡散符号帳を確率的符号帳部に用いた場合の確率的符号帳探索に要する演算量の違いは、式 1 2と式 1 5それぞれの前処理段階に要する演算量の違い、すなわち、前処理、 Hi M=lfH) と前処理 Hi=HWi x'^Hi , R^i'Hj に要する演算量の違いである。

一般に、 C E L P符号化装置 '復号化装置では、そのビットレートが低くなるほど確率的符号帳部に割り当て可能なビット数も減少する傾向にある。そしてこの傾向は、代数的符号帳やパルス拡散符号帳を確率的符号帳部に用いる場合、確率的音源べクトルを構成する際の非零要素数の減少につながつていく。したがって、 C E L P符号化装置 ·復号化装置のビットレー卜が低くなるほど、代数的符号帳を用いた場合とパルス拡散符号帳を用いた場合の演算量の差は少なくなる。しかしビットレートが比較的高い場合や、ビットレートが低くても演算量を極力少なく押さえる必要がある場合には、パルス拡散符号帳を用いることによって生じる前処理段階の演算量の増加が無視できなくなることがある。

本実施の形態では、パルス拡散符号帳を確率的符号帳部に用いた C E L P方式の音声符号化装置と音声復号化装置、及び音声符号化複号化システムにおいて、代数的符号帳を確率的符号帳部に用いる場合と比べて増加する、符号探索処理における前処理部分の演算量増加分を少なく抑えながら、復号化側では高品質な合成音声を得ることについて説明する。

具体的には、本実施の形態に係る技術は、パルス拡散符号帳を C E L P符号化装置 ·復号化装置の確率的符号帳部に用いる場合に生じることがある上記課題を解決するためのものであり、符号化装置側と復号化装置側で異なる拡散パタンを用いることを特徴である。すなわち、本実施の形態においては、音声復号化装置側の拡散パタン格納部には、上述した拡散パタンを登録し、それを用いることで、代数的符号帳を用いる場合より品質の高い合成音声を生成する。一方、音声符号化装置側では、復号化装置側の拡散パタン格納部に登録する拡散パタンを簡素化した拡散パタン（例えば、一定間隔で間引いた拡散パタンや、ある長さで打ち切った拡散パタン）を登録し、それを用いて確率的符号帳探索を行うようにする。これにより、パルス拡散符号帳を確率的符号帳部に用いる場合に、符号化側では、代数的符号帳を確率的符号帳部に用いる場合と比べて増加する、前処理段階の符号探索時の演算量を少なく抑えることができ、復号化側では、高品質の合成音声を得ることができる。

符号化装置側と復号化装置側で異なる拡散パタンを用いることとは、予め用意された（復号化装置用の）拡散ベクトルを、その特性を残しつつ変形することにより、エンコーダ用の拡散べクトルを獲得することである。

ここで、復号化装置用の拡散ベクトルを予め用意する方法としては、本発明者らが以前に出願した特許（特開平 1 0— 6 3 3 0 0号公報）に開示された方法、すなわち音源探索用夕ーゲッ卜べクトルの統計的傾向を学習することによつて用意する方法、音源ターゲットを実際に符号化し、その時生じる符号化歪みの総和をより小さくする方向に徐々に変形させる操作を反復することで用意する方法、及び合成音声を高品質化すべく音声学的な知見に基づいて設計する方法などや、パルス音源の高域位相成分をランダマイズさせることを目的に設計する方法などが考えられる。これらの内容はすべてここに含めておく。このようにして得られた拡散べクトルは、いずれも拡散べクトルの先頭サンプルに近いサンプル（前方のサンプル）の振幅が、後方のサンプルの振幅より、比較的大きめになるという特徴がある。中でも、先頭のサンプルの振幅が、拡散べクトル内の全サンプル中で最大となることが多い（ほとんどの場合そのようになる）。

復号化装置用の拡散べクトルを、その特性を残しつつ変形することでェンコーダ用の拡散べクトルを獲得する具体的方法としては、以下の方法が挙げられる。

1 ) 復号化装置用の拡散ベクトルのサンプル値を、適当な間隔ごとにゼロに置き換えることで、エンコーダ用の拡散ベクトルを獲得する。

2 ) ある長さの復号化装置用の拡散ベクトルを、適当な長さで打ち切ることによって、エンコーダ用の拡散ベクトルを獲得する。 3 ) 振幅のしきい値を予め設定し、復号化装置用の拡散ベクトルに対して設定したしきい値より振幅の小さいサンプルをゼロに置き換えることで、ェンコーダ用の拡散べクトルを獲得する。

4 ) ある長さの復号化装置用の拡散ベクトルを、先頭サンプルを含む適当な間隔ごとのサンプル値を保存し、それ以外のサンプルの値をゼロに置きかえることで、符号化装置用の拡散ベクトルを獲得する。

ここで例えば上記 1 ) の方法のように、拡散ベクトルの前方からの数サンプルを用いた場合でも、拡散ベクトルの概形（大まかな特性）を保存したまま、符号化装置用の拡散べクトルを新たに獲得することが可能となっている。また例えば、上記 2 ) の方法のように、適当な間隔ごとにサンプル値をゼロに置き換えてももとの拡散ベクトルの概形（大まかな特性）を保存したまま、符号化装置用の拡散ベクトルを新たに獲得することが可能となる。特に、上記 4 ) の方法の場合は、振幅が最大であることの多い先頭サンプルの振幅をそのまま必ず保存するという限定を付けているので、もとの拡散べクトルの概形をより確実に保存しておくことが可能である。

また、 3 ) の方法のように、特定値以上の振幅を有するサンプルをそのまま保存し、前記特定値以下の振幅を有するサンプルの振幅をゼロに置き換えても拡散べクトルの概形（大まかな特性）を保存したまま、符号化装置用の拡散べクトルを獲得することが可能となる。

以下、本実施の形態に係る音声符号化装置及び音声復号化装置について、添付図面を参照して詳細に説明する。なお、添付図面に記載の C E L P音声符号化装置（図 1 1 ) 、および、 C E L P音声復号化装置（図 1 2 ) は、従来の C E L P音声装置および C E L P音声復号化装置における確率的符号帳部分に、上記のパルス拡散符号帳を用いている点に特徴を有している。従って、以降の説明において、確率的符号帳、確率的音源ベクトル、確率的音源ゲインと記載された部分は、それぞれ、パルス拡散符号帳、パルス拡散音源ベクトル、パルス拡散音源ゲインと読み替えることが可能である。なお、 C E L P音声符号化装置および C E L P音声復号化装置における確率的符号帳は、雑音符号帳、あるいは、複数種類の固定波形を格納する作用を有することから固定符号帳と呼ばれることもある。図 1 1の C E L P音声符号化装置では、まず始めに、線形予測分析部 5 0 1力入力音声を線形予測分析して線形予測係数を算出し、算出した線形予測係数を線形予測係数符号化部 5 0 2へ出力する。次に、線形予測係数符号化部 5 0 2力線形予測係数を符号化（ベクトル量子化）し、ベクトル量子化によつて得られる量子化インデクス（以下、線形予測符号と呼ぶ）を符号出力部 5 1 3及び線形予測符号復号化部 5 0 3へ出力する。

次いで、線形予測符号復号化部 5 0 3が、線形予測係数符号化部 5 0 2で得た線形予測符号を復号化（逆量子化）して合成フィル夕 5 0 4へ出力する。合成フィル夕 5 0 4は、線形予測符号復号化部 5 0 3で復号化して得られた復号化線形予測符号を係数に持つ全極型モデルの合成フィル夕を構成する。

そして、適応符号帳 5 0 6から選出される適応音源べクトルに適応音源ゲイン 5 0 9を乗じて得られるべクトルと、パルス拡散符号帳 5 0 7から選出した確率的音源べクトルに確率的音源ゲイン 5 1 0を乗じて得られるべクトルとをベクトル加算部 5 1 1で加算して駆動音源ベクトルを生成する。そして、歪み計算部 5 0 5力当該駆動音源べクトルで合成フィル夕 5 0 4を駆動したときの出力ベクトルと、入力音声との歪みを下記式 1 6により計算し、歪み E R を符号特定部 5 1 2へ出力する。

ER = ||u - (g_aHp + g_cHc" u:入力音声（べクトル）

H:合成フィル夕のィンパルス応答行列

p :適応音源ベクトル

c :確率的音源べクトル g_a :適応音源ゲイン

g_e :確率的音源ゲイン

式 1 6 ただし、式 1 6において、 uは処理フレーム内の入力音声ベクトル、 Hは合成フィルタのインパルス応答行列、 g aは適応音源ゲイン、 g cは確率的音源ゲイン、 pは適応音源ベクトル、 cは確率的音源ベクトルを示す。

ここで、適応符号帳 5 0 6は、過去数フレーム分の駆動音源ベクトルを格納したバッファ（動的メモリ）であり、上記適応符号帳 5 0 6から選出される適応音源べクトルは、入力音声を合成フィル夕の逆フィルタに通して得られる線形予測残差べクトル中の周期成分を表現するために使われる。

一方、パルス拡散符号帳 5 0 7から選出される音源ベクトルは、線形予測残差べクトルに現処理フレームで新たに加わった非周期成分（線形予測残差べクトルから周期性（適応音源ベクトル成分）を除去した成分）を表現するために使われる。

そして、適応音源べクトルゲイン乗算部 5 0 9及び確率的音源べクトルゲイン乗算部 5 1 0は、適応符号帳 5 0 6から選出される適応音源べクトル及びパルス拡散符号帳 5 0 7から選出される確率的音源べクトルに対して、ゲイン符号帳 5 0 8から読みだした適応音源ゲイン及び確率的音源ゲインを乗じる機能を有している。なお、ゲイン符号帳 5 0 8とは、適応音源ベクトルに乗じる適応音源ゲインと、確率的音源ベクトルに乗じる確率的音源ゲインとのセットを複数種類格納した静的メモリである。

符号特定部 5 1 2は、歪み計算部 5 0 5で計算した式 1 6の歪み E Rを最小化する上記 3つの符号帳（適応符号帳、パルス拡散符号帳、ゲイン符号帳）のインデクスの最適組み合わせを選択する。そして、歪み特定部 5 1 2は、上記歪みが最小になるときに選択していた各符号帳のインデクスを、それぞれ適応音源符号、確率的音源符号、ゲイン符号として符号出力部 5 1 3へ出力する。そして最後に、符号出力部 5 1 3は、線形予測係数符号化部 5 0 2で得られた線形予測符号と、符号特定部 5 1 2で特定された適応音源符号、確率的音源符号及びゲイン符号を、全てまとめて現処理フレーム内の入力音声を表現する符号（ビット情報）とし、複号化装置側へ出力する。

なお、符号特定部 5 1 2で行う適応音源符号、確率的音源符号、ゲイン符号の特定は、一定時間間隔のフレームを、サブフレームと呼ぶさらに短い時間間隔に分割した上で行われることがある。ただし、本明細書では、フレームとサブフレームと特に区別しないで（フレームという呼び方に統一した上で）、以下の説明を行う。

次に、 C E L P音声復号化装置の概要を、図 1 2を用いて説明する。

図 1 2の C E L P復号化装置では、まず、符号入力部 6 0 1が、 C E L P音声符号化装置（図 1 1 ) で特定した符号（フレーム区間内の音声信号を符号表現するためのビット情報）を受け、受けた符号を線形予測符号、適応音源符号、確率的音源符号、及びゲイン符号の 4種類の符号に分解する。そして、線形予測符号を線形予測係数復号化部 6 0 2へ、適応音源符号を適応符号帳 6 0 3へ、確率的音源符号をパルス拡散符号帳 6 0 4へ、ゲイン符号をゲイン符号帳 6 0 5へ出力する。

次に、線形予測係数複号化部 6 0 2は、符号入力部 6 0 1から入力される線形予測符号を復号化して復号化線形予測符号を得て、この復号化線形予測符号を合成フィル夕 6 0 9へ出力する。

合成フィル夕 6 0 9は、線形予測係数復号化部 6 0 2で得た復号化線形予測符号を係数にもつ全極型モデルの合成フィル夕を構成する。また、適応符号帳 6 0 3は、符号入力部 6 0 1から入力された適応音源符号に対応する適応音源ベクトルを出力する。また、パルス拡散符号帳 6 0 4は、符号入力部 6 0 1から入力された確率的音源符号に対応する確率的音源べクトルを出力する。また、ゲイン符号帳 6 0 5は、符号入力部 6 0 1から入力されるゲイン符号に対応する適応音源ゲイン及び確率的音源ゲインを読み出し、それぞれ適応音源ゲイン乗算部 6 0 6及び確率的音源ゲイン乗算部 6 0 7へ出力する。そして、適応音源ゲイン乗算部 6 0 6が、適応符号帳 6 0 3から出力された適応音源べクトルに、ゲイン符号帳 6 0 5から出力された適応音源ゲインを乗算し、確率的音源ゲイン乗算部 6 0 7力パルス拡散符号帳 6 0 4から出力された確率的音源べクトルに、ゲイン符号帳 6 0 5で出力された確率的音源ゲインを乗算する。そしてべクトル加算部 6 0 8が、適応音源ゲイン乗算部 6 0 6 及び確率的音源ゲイン乗算部 6 0 7それぞれの出力べクトルを加算して駆動音源ベクトルを生成する。そして、当該駆動音源ベクトルで、合成フィル夕 6 0 9を駆動し、受信したフレーム区間の合成音声を出力する。

このような C E L P方式の音声符号化装置 ·音声復号化装置において、品質の高い合成音声を得るためには、式 1 6の歪み E Rを小さく抑えることが必要になる。そのためには、式 1 6の E Rを最小化するように、適応音源符号、確率的音源符号、ゲイン符号の組み合わせを閉ループで特定することが望ましい。しかしながら、式 1 6の歪み E Rをクローズドループで特定しょうとすると演算処理量が大きくなりすぎるため、上記 3種類の符号はオープンループで特定していくことが一般的である。

具体的には、まず、適応符号帳探索を行う。ここで、適応符号帳探索処理とは、入力音声を逆フィル夕に通して得られる予測残差べクトル中の周期性成分を、過去フレームの駆動音源べクトルを格納した適応符号帳から出力される適応音源ベクトルによってベクトル量子化する処理である。そして、線形予測残差べクトル内の周期成分と、近い周期成分を有する適応音源べクトルのェントリー番号を適応音源符号として特定する。なお、適応符号帳探索によって、同時に、理想適応音源ゲインが暫定的に確定されることになる。

次いで、パルス拡散符号帳探索を行う。パルス拡散符号帳探索は、処理フレームの線形予測残差ベクトルから周期成分を除去した成分、すなわち、線形予測残差べクトルから適応音源べクトル成分を差し引いた成分（以下、確率的音源ターゲットと呼ぶこともある）を、パルス拡散符号帳に格納された複数の確率的音源ベクトル候補を用いてベクトル量子化する処理である。そして、このパルス拡散符号帳探索処理により、確率的音源ターゲットを、もっとも歪み少なく符号化する確率的音源べクトルのェントリ番号を確率的音源符号として特定する。なお、パルス拡散符号帳探索によって、同時に、理想確率的ゲインも暫定的に確定されることになる。

そして最後に、ゲイン符号帳探索を行う。ゲイン符号帳探索は、適応符号帳探索時に暫定的に得られた理想適応ゲインと、パルス拡散符号帳探索時に暫定的に得られた理想確率的ゲインとの 2要素からなるべクトルを、ゲイン符号帳に格納されたゲイン候補べクトル（適応音源ゲイン候補と確率的音源ゲイン候補の 2要素からなるベクトル候補）で歪みが最小になるように符号化（べク卜ル量子化）する処理である。そして、ここで選択されるゲイン候補ベクトルのェントリ番号がゲイン符号として符号出力部へ出力される。

ここでは、次に、 C E L P音声符号化装置における上記一般的な符号探索処理のうち、パルス拡散符号帳探索処理（適応音源符号を特定した後に、確率的音源符号を特定する処理）についてさらに詳しく説明を行う。

説明したように、一般的な C E L P符号化装置では、パルス拡散符号帳探索を行う時点では、線形予測符号及び適応音源符号は、既に特定されている。ここで、既に特定されている線形予測符号によって構成される合成フィル夕のィンパルス応答行列を H、適応音源符号と対応する適応音源ベクトルを p、適応音源符号を特定した時点で同時に求まる理想適応音源ゲイン（暫定値）を g a とすると、式 1 6の歪み E Rは、下記式 1 7へと変形される。

ER_k = ||v - g_cHc_k v:確率的音源ターゲット（ただし、 v=u-g_aHp)

g_e:確率的音源ゲイン

H:合成フィルタのインパルス応答行列

:確率的音源べクトル（k：ェントリー番号）

式 1 7 ただし、式 1 7内のベクトル vは、フレーム区間内の入力音声信号 ii、合成フィル夕のインパルス応答行列 H (既定）、適応音源ベクトル p (既定）、理想適応音源ゲイン g a (暫定値）を用いた、下記式 1 8の確率的音源夕ーゲットである。

v = u - g_aHp

U :入力音声（べクトル）

g_a：適応音源ゲイン（暫定値）

H:合成フィル夕のインパルス応答行列

p :適応音源ベクトル式 1 8 なお、式 1 6では確率的音源ベクトルが cと表現されており、一方、式 1 7 では確率的音源ベクトルは c kと表現がされている。これは、式 1 6では確率的音源ベクトルのエントリ一番号（kのこと）を違いを明示していないことに対して、式 1 7ではエントリ一番号を明示していることによるものであり、表現上の違いはあるものの意味する対象は同じものである。

したがって、パルス拡散符号帳探索とは、式 1 7の歪み E Rkを最小化するような確率的音源べクトル c kのエントリ番号 kを求める処理である。そして、式 1 7の歪み E Rl を最小化するような確率的音源べクトル c kのエントリ番号 kを特定する際には、確率的音源ゲイン g cは任意の値をとりうると仮定できる。したがって、式 1 7の歪みを最小化するようなエントリ番号を求める処理は、上記式 1 0の分数式 Dkを最大化するような確率的音源べクトル c kのエントリ番号 kを特定する処理に置き換えられる。

そして、パルス拡散符号帳探索は、確率的音源ベクトル C kのエントリ番号 kごとに式 1 0の分数式 Dkを歪み計算部 5 0 5で計算し、その値を符号特定部 5 1 2へ出力し、符号特定部 5 1 2で、エントリ番号 kごとの式 1 0の値を大小比較して、その値が最大になるときのエントリ番号 kを確率的音源符号と決定して符号出力部 5 1 3へ出力する、といった 2段階の処理によって行われることになる。

以下、本実施の形態における音声符号化装置及び音声復号化装置の動作について説明する。

図 1 1に示す音声符号化装置におけるパルス拡散符号帳 5 0 7の構成を図 1 3 Aに示し、図 1 2に示す音声復号化装置におけるパルス拡散符号帳 6 0 4 の構成を図 1 3 Bに示す。図 1 3 Aに示すパルス拡散符号帳 5 0 7と図 1 3 B に示すパルス拡散符号帳 6 0 4を比較した場合、構成上の異なる点は、拡散パタン格納部に登録している拡散パタンの形状が異なっている点である。

図 1 3 Bの音声復号化装置側では、拡散パタン格納部 4 0 1 2には、（1 ) 多くの確率的音源夕ーゲッ卜の形状を統計学習し、確率的音源夕ーゲッ卜中に統計的に高い頻度で含まれる形状の拡散パタン、（2 ) 無声子音区間や雑音区間を効率的に表現するための乱数的な形状の拡散パタン、（3 ) 有声定常区間を効率的に表現するためのパルス的な形状の拡散パタン、（4 ) 代数的符号帳から出力される音源べクトルのエネルギー（非零要素の位置にエネルギーが集中している）を周囲に分散させるような作用を与える形状の拡散パタン、（5 ) 適当に用意したいくつかの拡散パタン候補について、音声信号を、符号化、復号化、合成音声の視聴評価を繰り返し、品質の高い合成音声を出力しうるよう選択した拡散パタン、（6 ) 音声学的な知見をもとに作成した拡散パタンのうちのいずれかの拡散パタンが各チャネルあたり 1種類ずつ登録されている。一方、図 1 3 Aの音声符号化装置側では、拡散パタン格納部 4 0 1 2には、図 1 3 Bの音声復号化装置側の拡散パタン格納部 4 0 1 2に登録されている拡散パタンを、 1サンプルおきにゼロに置き換えた拡散パタンが登録されている。

そして、上述のように構成された C E L P音声符号化装置音声復号化装置では、符号化装置側と復号化装置側で異なる拡散パタンが登録されていることを意識せずに、上記と同様の方法で、音声信号を符号化 ·復号化する。

符号化装置では、パルス拡散符号帳を確率的符号帳部に用いた場合の確率的符号帳探索時の前処理演算量を削減することができ（Hi= HtWi 及び x it = v tHi の演算量をおよそ半分に削減でき）、復号化装置側では、従来どおりの拡散パタンをパルスベクトルに重畳することで、非零要素位置に集中しているエネルギーを周囲に拡散することができ、合成音声の品質を向上することが可能となる。

なお、本実施の形態では、図 1 3 A及び図 1 3 Bに示すように、音声符号化装置側では、音声復号化装置側で用いる拡散パタンを 1サンプルおきにゼロに置き換えた拡散パタンを用いる場合について説明したが、音声符号化装置側では、音声復号化装置側で用いる拡散パタンの要素を N (N≥ 1 ) サンプルおきにゼロに置き換えて得られる拡散パタンを用いた場合にも、本実施の形態をそのまま適用することができ、その場合にも同様の作用を得ることができる。また、本実施の形態では、拡散パタン格納部が、チャネルあたり 1種類ずつの拡散パタンを登録している場合の実施の形態を説明したが、チャネルあたり 2種類以上の拡散パ夕ンが登録されており、それら拡散パタンを選択して用いることを特徴とするパルス拡散符号帳を確率的符号帳部に用いる C E L P音声符号化装置 ·復号化装置においても本発明を適用することが可能であり、その場合にも同様の作用 ·効果を得ることができる。

また、本実施の形態では、代数的符号帳部が 3個の非零要素を含むベクトルを出力するパルス拡散符号帳を用いた場合について実施の形態を説明したが、代数的符号帳部が出力するベクトル中の非零要素数が M個（M≥l ) の場合においても本実施の形態を適用することが可能であり、その場合にも同様の作用 ·効果を得ることができる。

また、本実施の形態では、少数個の非零要素からなるパルスベクトルを生成する符号帳として代数的符号帳を用いた場合について説明したが、当該パルスべクトルを生成する符号帳としては、マルチパルス符号帳やレギュラーパルス符号帳など、その他の符号帳を用いる場合にも本実施の形態を適用することが可能であり、その場合にも同様の作用 ·効果を得ることができる。

次に、図 1 1に示す音声符号化装置におけるパルス拡散符号帳の構成を図 1 4 Aに示す、図 1 2に示す音声復号化装置におけるパルス拡散符号帳の構成を図 1 4 Bに示す。

図 1 4 Aに示すパルス拡散符号帳と図 1 4 Bに示すパルス拡散符号帳の構成を比較した場合、構成上の異なる点は、拡散パタン格納部に登録している拡散パタンの長さが異なっている。図 1 4 Bの音声復号化装置側では、拡散パ夕ン格納部 4 0 1 2には、上述した拡散パタンと同様の拡散パタン、すなわち、 ( 1 ) 多くの確率的音源ターゲットの形状を統計学習し、確率的音源ターゲット中に統計的に高い頻度で含まれる形状の拡散パタン、（2 ) 無声子音区間や雑音区間を効率的に表現するための乱数的な形状の拡散パタン、（3 ) 有声定常区間を効率的に表現するためのパルス的な形状の拡散パタン、（4 ) 代数的符号帳から出力される音源べクトルのエネルギー（非零要素の位置にエネルギ一が集中している）を周囲に分散させるような作用を与える形状の拡散パタン、 ( 5 ) 適当に用意したいくつかの拡散パタン候補について、音声信号を、符号化、復号化、合成音声の視聴評価を繰り替えし、品質の高い合成音声を出力しうるよう選択した拡散パタン、（6 ) 音声学的な知見をもとに作成した拡散パタンのうちのいずれかの拡散パタンが各チャネルあたり 1種類ずつ登録されている。

一方、図 1 4 Aの音声符号化装置側では、拡散パタン格納部 4 0 1 2には、図 1 4 Bの音声復号化装置側の拡散パタン格納部に登録されている拡散パ夕ンを、半分の長さで打ち切った拡散パタンが登録されている。

そして、上述のように構成された C E L P音声符号化装置 ·復号化装置では、符号化装置側と復号化装置側で異なる拡散パ夕ンが登録されていることを意識せずに、上述した場合と同様の方法で、音声信号を符号化 ·復号化する。符号化装置では、パルス拡散符号帳を確率的符号帳部に用いた場合の確率的符号帳探索時の前処理演算量を削減することができ（Hi= HtWi および X it= v tHi の演算量をおよそ半分に削減でき）、復号化装置側では、従来どおりの拡散パ夕ンを利用することで、合成音声の品質向上を実現することが可能となる。

なお、本実施の形態では、図 1 4 A及び図 1 4 Bに示すように、音声符号化装置側では、音声復号化装置側で用いる拡散パタンを半分の長さで打ち切った拡散パタンを用いる場合について説明したが、音声符号化装置側では、音声符号化装置側で用いる拡散パタンを、さらに短い長さ N (N≥ 1 ) で打ち切った場合には、確率的符号帳探索時の前処理演算量をさらに削減することが可能になるといつた作用が得られる。ただしここで、音声符号化装置側で用いる拡散パタンを長さ 1で打ち切る場合は、拡散パタンを用いない音声符号化装置に相当する（音声復号化装置には拡散パタンが適用されている）。

また、本実施の形態では、拡散パタン格納部が、チャネルあたり 1種類ずつの拡散パタンを登録している場合を説明したが、チャネルあたり 2種類以上の拡散パタンが登録されており、それら拡散パタンを選択して用いることを特徴とするパルス拡散符号帳を確率的符号帳部に用いる音声符号化装置音声復号化装置においても本実施の形態を適用することが可能であり、その場合にも同様の作用 ·効果を得ることができる。

また、本実施の形態では、音声符号化装置側では、音声復号化装置側で用いる拡散パタンを半分の長さで打ち切った拡散パタンを用いる場合について説明したが、音声符号化装置側では、音声復号化装置側で用いる拡散パタンを長さ N (N≥ l ) で打ち切り、さらに、打ち切り後の拡散パタンを M (M≥l ) サンプルおきにゼロに置き換えることも可能であり、その場合には、符号探索演算量をさらに低減することが可能になる。

このように本実施の形態によれば、パルス拡散符号帳を確率的符号帳部に用いる C E L P方式の音声符号化装置と復号化装置、及び音声符号化復号化システムにおいて、学習によって獲得された確率的音源ターゲット中に頻繁に含まれる固定波形を拡散パタンとして登録しておき、当該拡散パタンをパルスべクトルに重畳する（反映させる）ことで、確率的音源ターゲットにより近い確率的音源べクトルを利用することができるため、復号化側で合成音声の品質向上を実現でき、さらには、符号化側で、パルス拡散符号帳を確率的符号帳部に用いる場合に問題となることがある確率的符号帳探索の演算量を、従来よりも低く抑えることが可能となるという有利な効果が得られる。

なお、少数個の非零要素からなるパルスべクトルを生成する符号帳として、マルチパルス符号帳やレギュラーパルス符号帳など、その他の符号帳を用いた場合にも同様の作用 ·効果を得ることができる。

上記実施の形態 1〜 3に係る音声符号化/復号化は、音声符号化装置ノ音声復号化装置として説明しているが、これらの音声符号化 Z復号化をソフトゥェァとして構成しても良い。例えば、上記音声符号化 Z復号化のプログラムを R OMに格納し、そのプログラムにしたがって C P Uの指示により動作させるように構成しても良い。また、プログラム，適応符号帳，及び確率的符号帳（パルス拡散符号帳）をコンピュータで読み取り可能な記憶媒体に格納し、この記憶媒体のプログラム，適応符号帳，及び確率的符号帳（パルス拡散符号帳）をコンピュータの R AMに記録して、プログラムにしたがって動作させるようにしても良い。このような場合においても、上記実施の形態 1〜3と同様の作用、効果を呈する。さらに、実施の形態 1〜3におけるプログラムを通信端末でダゥンロードし、その通信端末でプログラムを動作させるようにしても良い。なお、上記実施の形態 1〜3については、個々に実施しても良く、組み合わせて実施しても良い。本明細書は、 1999年 8月 23日出願の特願平 1 1— 235050号、 1 999年 8月 24日出願の特願平 1 1—236728号、及び 1999年 9月 2日出願の特願平 1 1— 248363号に基づく。これらの内容はすべてここに含めておく。産業上の利用可能性

本発明は、ディジ夕ル通信システムにおける基地局装置や通信端末装置に適用することができる。

Claims

請求の範囲

1 . 適応符号帳及び確率的符号帳に格納された適応音源及び確率的音源に対して、入力音声から求めた L P C係数を用いてフィルタリングすることにより、合成音を得る L P C合成手段と、前記適応音源及び前記確率的音源のゲインを求め、さらに前記ゲインを用いて得られる前記入力音声と前記合成音との間の符号化歪みを用いて適応音源及び確率的音源の符号を探索するゲイン演算手段と、求められた符号に対応する適応音源及び確率的音源を用いてゲインの予測符号化を行うパラメ一夕符号化手段と、を具備し、

前記パラメ一夕符号化手段は、以前のサブフレームの状態に応じて前記予測符号化に用いる予測係数を調整する予測係数調整手段を備える音声符号化装置。

2 . 前記予測係数調整手段は、以前のサブフレームの状態が極端に大きな値又は極端に小さな値である場合に、その影響を小さくするように前記予測係数を調整する請求項 1記載の音声符号化装置。

3 . 前記パラメ一夕符号化手段は、適応音源のゲインのベクトル及び確率的音源のゲインのべクトル、並びに予測係数を調整する係数を含む符号帳を有することを特徴とする請求項 1記載の音声符号化装置。

4 . 予測符号化において、状態と予測係数との間の積和を求めるときに、その状態に対応した予測係数調整係数を乗じる請求項 3記載の音声符号化装置。 5 . 前記適応音源及び前記確率的音源、並びに予測係数調整係数を状態毎に対応させて格納する格納手段を具備する請求項 1記載の音声符号化装置。

6 . 前記格納手段に格納された前記適応音源及び前記確率的音源の状態を更新する際に、前記予測係数調整係数も更新する請求項 5記載のべクトル量子化装置。

7 . 適応符号帳及び確率的符号帳に格納された適応音源及び確率的音源に対して、入力音声から求めた L P C係数を用いてフィル夕リングすることにより、合成音を得る L P C合成手段と、前記適応音源及び前記確率的音源のゲインを求めるゲイン演算手段と、前記入力音声と前記合成音との間の符号化歪みを用いて求められた適応音源及び確率的音源、並びに前記ゲインのべクトル量子化を行うパラメ一夕符号化手段と、を具備し、 1つのフレームを複数のサブフレームに分解して符号化を行う C E L P型音声符号化装置であって、

最初のサブフレームの適応符号帳探索の前に、フレームを構成する複数のサブフレームのピッチ分析を行つて相関値を求め、前記相関値を用いて最もピッチ周期に近似する値を算出するピッチ分析手段を備える音声符号化装置。 8 . 前記ピッチ分析手段において得られた相関値及び最もピッチ周期に近似する値に基づいて複数のサブフレームのラグの探索範囲を決定する探索範囲設定手段を具備する請求項 7記載の音声符号化装置。

9 . 探索範囲設定手段は、前記ピッチ分析手段において得られた相関値及び最もピッチ周期に近似する値を用いて探索範囲の中心となる仮ピッチを求める請求項 8記載の音声符号化装置。

1 0 . 探索範囲設定手段は、仮ピッチの周りの指定の範囲にラグの探索区間を設定する請求項 9記載の音声符号化装置。

1 1 . 探索範囲設定手段は、ラグが短い候補を少なくしてラグの探索区間を設定する請求項 8記載の音声符号化装置。

1 2 . 探索範囲設定手段は、適応符号帳探索の際に、設定された範囲でラグの探索を行う請求項 8記載の音声符号化装置。

1 3 . 音声符号化プログラム；過去に合成した音源信号が格納された適応符号帳；複数の音源べクトルを格納した確率的符号帳；を格納し、コンピュータにより読み取り可能な記録媒体であつて、前記音声符号化プログラムは、前記適応符号帳及び前記確率的符号帳に格納された適応音源及び確率的音源に対して、入力音声から求めた L P C係数を用いてフィルタリングすることにより、合成音を得る手順と、

前記適応音源及び前記確率的音源のゲインを求める手順と、

前記入力音声と前記合成音との間の符号化歪みを用いて求められた適応音源及び確率的音源、並びに前記ゲインのべクトル量子化を行う手順と、を含み、

ベクトル量子化を行う手順において、複数の量子化対象ベクトルと、予測符号化に用いる予測係数との間の符号化歪みに基づいて量子化対象べクトルを求める手順と、以前のサブフレームの状態に応じて前記予測係数を調整する手川頁と、を含む。

1 4 . 音声符号化プログラム；過去に合成した音源信号が格納された適応符号帳；複数の音源べクトルを格納した確率的符号帳；を格納し、コンピュータにより読み取り可能な記録媒体であって、前記音声符号化プログラムは、前記適応符号帳及び前記確率的符号帳に格納された適応音源及び確率的音源に対して、入力音声から求めた L P C係数を用いてフィルタリングすることにより、合成音を得る手順と、

前記入力音声と前記合成音との間の符号化歪みを用いて求められた適応音源及び確率的音源、並びに前記ゲインのベクトル量子化を行う手順と、最初のサブフレームの適応符号帳探索の前に、フレームを構成する複数のサブフレームのピッチ分析を行つて相関値を求め、前記相関値を用いて最もピッチ周期に近似する値を算出する手順と、

を含む。

補正書の請求の範囲

[ 2 0 0 0年 1 2月 2 2日（2 2 , 1 2 . 0 0 ) 国際事務局受理：出願当初の請求の範囲は補正された；新しい請求の範囲 1 5— 3 8が加えられた；他の請求の範囲は変更なし。 ( 6頁) ]

1 . 適応符号帳及び確率的符号帳に格納された適応音源及び確率的音源に対して、入力音声から求めた L P C係数を用いてフィルタリングすることにより、合成音を得る L P C合成手段と、前記適応音源及ぴ前記確率的音源のゲインを求め、さらに前記ゲインを用いて得られる前記入力音声と前記合成音との間の符号化歪みを用いて適応音源及び確率的音源の符号を探索するゲイン演算手段と、求められた符号に対応する適応音源及び確率的音源を用いてゲインの予測符号化を行うパラメータ符号化手段と、を具備し、

3 . 前記パラメータ符号化手段は、適応音源のゲインのベクトル及び確率的音源のゲインのべクトル、並びに予測係数を調整する係数を含む符号帳を有することを特徴とする請求項 1記載の音声符号化装置。

4 . 予測符号化において、状態と予測係数との間の積和を求めるときに、その状態に対応した予測係数調整係数を乗じる請求項 3記載の音声符号化装置。

5 . 前記適応音源及び前記確率的音源、並びに予測係数調整係数を状態毎に対応させて格納する格納手段を具備する請求項 1記載の音声符号化装置。

6 . (補正後）前記格納手段に格納された前記適応音源及び前記確率的音源の状態を更新する際に、前記予測係数調整係数も更新する請求項 5記載の音声符号化装置。

7 . 適応符号帳及び確率的符号帳に格納された適応音源及び確率的音源に対して、入力音声から求めた L P C係数を用いてフィルタリングすることにより、合成音を得る L P C合成手段と、前記適応音源及び前記確率的音源のゲインを補正された用紙 (条約第 19条) 求めるゲイン演算手段と、前記入力音声と前記合成音との間の符号化歪みを用いて求められた適応音源及び確率的音源、並びに前記ゲインのべクトル量子化を行うパラメ一夕符号化手段と、を具備し、 1つのフレームを複数のサブフレームに分解して符号化を行う C E L P型音声符号化装置であつて、

最初のサブフレームの適応符号帳探索の前に、フレームを構成する複数のサブフレームのピッチ分析を行って相関値を求め、前記相関値を用いて最もピッチ周期に近似する値を算出するピッチ分析手段を備える音声符号化装置。

8 . 前記ピッチ分析手段において得られた相関値及び最もピッチ周期に近似する値に基づいて複数のサブフレームのラグの探索範囲を決定する探索範囲設定手段を具備する請求項 7記載の音声符号化装置。

1 0 . 採索範囲設定手段は、仮ピッチの周りの指定の範囲にラグの探索区間を設定する請求項 9記載の音声符号化装置。

1 3 . 音声符号化プログラム；過去に合成した音源信号が格納された適応符号帳；複数の音源べクトルを格納した確率的符号帳；を格納し、コンピュータにより読み取り可能な記録媒体であって、前記音声符号化プログラムは、前記適応符号帳及び前記確率的符号帳に格納された適応音源及び確率的音源に対して、入力音声から求めた L P C係数を用いてフィルタリングすることにより、合成音を得る手順と、

前記入力音声と前記合成音との間の符号化歪みを用いて求められた適応音補正きれた用紙 (条約第 19条) 源及び確率的音源、並びに前記ゲインのべクトル量子化を行う手順と、を含み、

ベクトル量子化を行う手順において、複数の量子化対象ベクトルと、予測符号化に用いる予測係数との間の符号化歪みに基づいて量子化対象べクトルを求める手順と、以前のサブフレームの状態に応じて前記予測係数を調整する手順と、を含む。

1 4 . 音声符号化プログラム；過去に合成した音源信号が格納された適応符号帳；複数の音源べクトルを格納した確率的符号帳；を格納し、コンピュータにより読み取り可能な記録媒体であつて、前記音声符号化プログラムは、前記適応符号帳及び前記確率的符号帳に格納された適応音源及び確率的音源に対して、入力音声から求めた L P C係数を用いてフィルタリングすることにより、合成音を得る手順と、

を含む。

1 5 . (追加）少なくとも一つの非零要素（非零要素以外の要素はゼロの値を持つ）を含むベクトルと、拡散パタンと呼ばれる固定波形とを重畳してべクトルを生成するパルス拡散符号帳を備え、前記パルス拡散符号帳が、音声復号化装置側のパルス拡散符号帳の構成と異なる構成を有する音声符号化装置。

1 6 . (追加）パルス拡散符号帳の構成部位である拡散パタン格納部が、音声復号化装置側の拡散パ夕ン格納部が格納している拡散パタンと異なる拡散パタンを格納している請求項 1 5記載の音声符号化装置。

1 7 . (追加）拡散パタン格納部が、音声復号化装置側の拡散パタン格納部が補正きれた用紙 (条約第 19条) 格納している拡散パタンを簡素化して選られる得られる拡散パタンを格納している請求項 1 6記載の音声符号化装置。

1 8 . (追加）拡散パタン格納部が、音声復号化装置側の拡散パタン格納部が格納している拡散パタンの構成要素を、所定の間隔ごとにゼロに置き換えて得られる拡散パタンを格納している請求項 1 6記載の音声符号化装置。

1 9 . (追加）拡散パタン格納部が、音声復号化装置側の拡散パタン格納部が格納している拡散パタンの構成要素を、 Nサンプル（Nは自然数）ごとにゼロに置き換えて得られる拡散パタンを格納している請求項 1 6記載の音声符号化装置。

2 0 . (追加）拡散パタン格納部が、音声復号化装置側の拡散パタン格納部が格納している拡散パタンの構成要素を、 1サンプルごとにゼロに置き換えて得られる拡散パタンを格納している請求項 1 9記載の音声符号化装置。

2 1 . (追加）拡散パタン格納部が、音声復号化装置側の拡散パタン格納部が格納している拡散パタンの構成要素を、適当な長さで打ち切って得られる拡散パタンを格納している請求項 1 6記載の音声符号化装置。

2 2 . (追加）拡散パタン格納部が、音声復号化装置側の拡散パタン格納部が格納している拡散パタンの構成要素を、 Nサンプル（Nは自然数）の長さで打ち切って得られる拡散パタンを格納していることを特徵とする請求項 1 6記載の音声符号化装置。

2 3 . (追加）拡散パタン格納部が、音声復号化装置側の拡散パタン格納部が格納している拡散パタンの構成要素を、半分の長さに打ち切って得られる拡散パタンを格納している請求項 1 6記載の音声符号化装置。

2 4. (追加）請求項 1 5音声符号化装置で生成された音声符号を有する音声信号を復号化する音声復号化装置。

2 5 . (追加）請求項 1 5音声符号化装置を実現するソフトウェアプログラムを記述した信号処理用プロセッサ。

2 6 . (追加）請求項 2 4記載の音声復号化装置を実現するソフトウェアプロ補正きれた用紙 (条約第 19条）グラムを記述した信号処理用プロセッサ。

2 7 . (追加）音声符号化装置側が有するパルス拡散符号帳の構成と、音声復号化装置側が有するパルス拡散符号帳の構成とが異なる音声符号化復号化システム。

2 8 . (追加）音声符号化装置側が有するパルス拡散符号帳の構成と、音声符号化装置側が有するパルス拡散符号帳の構成との違いが、それぞれのパルス拡散符号帳に備えられた拡散パタンの形状である請求項 2 7記載の音声符号化復号化システム。

2 9 . (追加）音声符号化装置側の拡散パタンの形状が、音声復号化装置側の拡散パタンの形状を簡素化したのもである請求項 2 8記載の音声符号化復号化システム。

3 0 . (追加）音声符号化装置側の拡散パタンの形状が、音声復号化装置側の拡散パタンの構成要素を、適当な間隔ごとにゼロに置き換えて得られる形状である請求項 2 7記載の音声符号化復号化システム。

3 1 . (追加）音声符号化装置側の拡散パタンの形状が、音声復号化装置側の拡散パタンの構成要素を、 Nサンプル（Nは自然数）ごとにゼロに置き換えて得られる形状である請求項 2 7記載の音声符号化復号化システム。

3 2 . (追加）音声符号化装置側の拡散パタンの形状が、音声復号化装置側の拡散パタンの構成要素を、 1サンプルごとにゼロに置き換えて得られる形状である請求項 3 1記載の音声符号化復号化システム。

3 3 . (追加）音声符号化装置側の拡散パタンの形状が、音声復号化装置側の拡散パタンの構成要素を、適当な長さで打ち切って得られる形状である請求項 2 7記載の音声符号化復号化システム。

3 4. (追加）音声符号化装置側の拡散パタンの形状が、音声符号化装置側の拡散パタンの構成要素を、 Nサンプル（Nは自然数）の長さで打ち切って得られる形状である請求項 2 7記載の音声符号化復号化システム。

3 5 . (追加）音声符号化装置側の拡散パタンの形状が、音声復号化装置側の補正きれた用紙 (^第 19条) 拡散パタンの構成要素を、半分の長さに打ち切って得られる形状である請求項 2 7記載の音声符号化復号化システム。

3 6 . (追加）請求項 2 5記載の信号処理用プロセッサを備える通信用基地局 3 7 . (追加）請求項 2 5記載の信号処理用プロセッサを備える通信用端末。 3 8 . (追加）請求項 3 6記載の通信用基地局及び請求項 3 7記載の通信端末を無線ネットワークでつないだ無線通信システム。

補正された用紙 (^第 19条)