WO2004097796A1

WO2004097796A1 - 音声符号化装置、音声復号化装置及びこれらの方法

Info

Publication number: WO2004097796A1
Application number: PCT/JP2004/006294
Authority: WO
Inventors: Kaoru Sato; Toshiyuki Morii
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2003-04-30
Filing date: 2004-04-30
Publication date: 2004-11-11
Also published as: CN101615396A; US7299174B2; US7729905B2; EP1619664B1; US20060173677A1; US20080033717A1; EP1619664A4; CN101615396B; KR101000345B1; CA2524243C; KR20060022236A; EP1619664A1; CA2524243A1; CN100583241C; CN1795495A

Abstract

基本レイヤ符号化部１０１は入力信号を符号化し基本レイヤ符号化情報を得る。基本レイヤ復号化部１０２は基本レイヤ符号化情報を復号化し基本レイヤ復号化信号及び長期予測情報（ピッチラグ）を得る。加算部１０３は入力信号に基本レイヤ復号化信号を極性反転して加算し残差信号を得る。拡張レイヤ符号化部１０４は長期予測情報及び残差信号を用いて算出した長期予測係数を符号化し拡張レイヤ符号化情報を得る。基本レイヤ復号化部１５２は基本レイヤ符号化情報を復号化し基本レイヤ復号化信号及び長期予測情報を得る。拡張レイヤ復号化部１５３は長期予測情報を利用して拡張レイヤ符号化情報を復号化し拡張レイヤ復号化信号を得る。加算部１５４は基本レイヤ復号化信号と拡張レイヤ復号化信号とを加算し音声・楽音信号を得る。これにより、少ない計算量及び符号化情報量でスケーラブル符号化を実現することができる。

Description

明細書音声符号化装置、音声復号化装置及びこれらの方法技術分野

本発明は、音声 ·楽音信号を符号化して伝送する通信システムに使用される音声符号化装置、音声復号化装置及びこれらの方法に関する。背景技術

ディジタ /レ無線通信や、インターネット通信に代表されるパケット通信、あるいは音声蓄積などの分野においては、電波などの伝送路容量や記憶媒体の有効利用を図るため、音声信号の符号化 Z復号化技術が不可欠であり、これまでに多くの音声符号化復号化方式が開発されてきた。その中で、 C E L P方式の音声符号化 Z複号化方式が主流の方式として実用化されている。

C E L P方式の音声符号化装置は、予め記憶された音声モデルに基づいて入力音声をコード化する。具体的には、ディジタル化された音声信号を 2 O ms 程度のフレームに区切り、フレーム毎に音声信号の線形予測分析を行い、線形予測係数と線形予測残差べクトルを求め、線形予測係数と線形予測残差べクトルをそれぞれ個別に符号化する。

低ビットレートの通信を実行するためには、記憶できる音声モデルの量が限られるため、従来の C E L Pタイプの音声符号化ノ複号化方式では、主に発声音のモデルを記憶している。

また、インターネット通信のようなバケツトを伝送する通信システムでは、ネットワークの状態によりバケツト損失が起こるため、符号化情報の一部が欠損した場合であっても符号化情報の残りの一部から音声、楽音を複号化できることが望ましい。同様に、通信容量に応じてビットレートを変化させる可変レート通信システムにおいては、通信容量が低下した場合、符号化情報の一部のみを伝送することにより通信容量の負担を軽減させることが容易であることが望ましい。このように、符号化情報の全てもしくは符号化情報の一部のみを用いて音声、楽音を復号化できる技術として、最近、スケーラブル符号化技術が注目を浴ぴている。従来にもいくつかのスケーラプル符号化方式が開示されている。

スケーラプル符号化方式は、一般的に、基本レイヤと拡張レイヤとからなり、各レイヤは、基本レイヤを最も下位のレイヤとし、階層構造を形成している。そして、各レイヤでは、より下位のレイヤの入力信号と出力信号との差である残差信号について符号化が行われる。この構成により、全レイヤの符号化情報もしくは下位レイヤの符号化情報のみを用いて、音声 ·楽音信号を復号化することができる。

しかしながら、従来のスケーラブル符号化方式では、基本レイヤおよび拡張レイャの符号化方式として C E L Pタイプの音声符号化復号化方式を用いるため、計算量、符号ィ匕情報共に相応の量が必要となる。発明の開示

本発明の目的は、少ない計算量及び符号化情報量でスケーラブル符号化を実現することができる音声符号化装置、音声復号化装置及びこれらの方法を提供することである。

この目的は、長期予測を行う拡張レイヤを設け、音声'楽音の長期的な相関の性質を利用して拡張レイヤにおいて残差信号の長期予測を行うことにより復号化信号の品質の向上を図り、基本レイヤの長期予測情報を利用して長期予測ラグを求めることにより演算量の削減を図ることにより達成される。図面の簡単な説明

図 1は、本発明の実施の形態 1に係る音声符号化装置 Z音声復号化装置の構成を示すプロック図、図 2は、上記実施の形態に係る基本レイヤ符号化部の内部構成を示すプロック図、

図 3は、上記実施の形態に係る基本レイャ符号化部の內のパラメータ決定部が適応音源符号帳から生成される信号を決定する処理を説明するための図、図 4は、上記実施の形態に係る基本レイャ復号化部の内部構成を示すプロック図、

図 5は、上記実施の形態に係る拡張レイヤ符号化部の内部構成を示すプロック図、

図 6は、上記実施の形態に係る拡張レイヤ復号化部の内部構成を示すプロック図、

図 7は、本発明の実施の形態 2に係る拡張レイャ符号化部の内部構成を示すブロック図、

図 8は、上記実施の形態に係る拡張レイヤ複号化部の内部構成を示すプロック図、及び、

図 9は、本発明の実施の形態 3係る音声信号送信装置音声信号受信装置の構成を示すプロック図である。発明を実施するための最良の形態

以下、本発明の実施の形態について、図面を用いて説明する。なお、以下の各本実施の形態では、基本レイヤと拡張レイヤとで構成される二階層の音声符号ィ匕 Z複号化方法において拡張レイヤで長期予測を行う場合について説明する。ただし、本発明は階層について制限はなく、三階層以上の階層的な音声符号化

Z復号化方法において下位レイヤの長期予測情報を利用して上位レイヤで長期予測を行う場合についても適用することができる。階層的な音声符号化方法とは、残差信号 (下位レイャの入力信号と下位レイャの複号化信号との差) を長期予測によって符号化して符号化情報を出力する音声符号化方法が上位レイャに複数存在して階層構造を成している方法である。また、階層的な音声復号化方法とは、残差信号を復号化する音声複号化方法が上位レイヤに複数存在して P皆層構造を成している方法である。ここで、最下のレイヤに存在する音声'楽音符号化復号化方法を基本レイヤとする。また、基本レイヤより上位レイヤに存在する音声 ·楽音符号化 Z復号化方法を拡張レイヤとする。

また、本宪明の各実施の形態では、基本レイヤが C E L Pタイプの音声符号化 Z複号化を行う場合を例にして説明する。

(実施の形態 1 )

図 1は、本発明の実施の形態 1に係る音声符号化装置/音声複号化装置の構成を示すプロック図である。

図 1において、音声符号化装置 1 0 0は、基本レイヤ符号化部 1 0 1と、基本レイヤ復号化部 1 0 2と、加算部 1 0 3と、拡張レイヤ符号化部 1 0 4と、多重化部 1 0 5とから主に構成される。また、音声復号化装置 1 5 0は、多重化分離部 1 5 1と、基本レイヤ復号化部 1 5 2と、拡張レイヤ複号化部 1 5 3 と、加算部 1 5 4とから主に構成される。

基本レイャ符号化部 1 0 1は、音声'楽音信号を入力し、 C E L Pタイプの音声符号化方法を用いて入力信号を符号化し、符号化によって求められる基本レイヤ符号化情報を基本レイヤ複号化部 1 0 2に出力するとともに、多重化部 1 0 5に出力する。

基本レイヤ復号化部 1 0 2は、 C E L Pタイプの音声複号化方法を用いて基本レイヤ符号化情報を復号化し、復号化によって求められる基本レイヤ復号ィ匕信号を加算部 1 0 3に出力する。また、基本レイヤ複号化部 1 0 2は、ピッチラグを基本レイヤの長期予測情報として拡張レイヤ符号化部 1 0 4に出力する。ここで、「長期予測情報」とは、音声 ·楽音信号が有する長期的な相関を表す情報である。また、「ピッチラグ」とは、基本レイヤで特定される位置情報であり、詳細な説明は後述する。

加算部 1 0 3は、入力信号に、基本レイヤ復号化部 1 0 2から出力された基本レイャ復号化信号を極性反転してから加算し、加算結果である残差信号を拡張レイヤ符号化部 1 0 4に出力する。

拡張レイャ符号化部 1 0 4は、基本レイャ復号化部 1 0 2より出力された長期予測情報及び加算部 1 0 3より出力された残差信号を用いて長期予測係数を算出し、長期予測係数を符号化し、符号化によつて求められる拡張レイャ符号化情報を多重化部 1 0 5に出力する。

多重化部 1 0 5は、基本レイヤ符号化部 1 0 1から出力された基本レイヤ符号化情報と、拡張レイャ符号化部 1 0 4から出力された拡張レイャ符号化情報と、を多重ィヒして多重化情報として伝送路を介して多重ィヒ分離部 1 5 1に出力する。

多重化分離部 1 5 1は、音声符号化装置 1 0 0から伝送された多重化情報を、基本レイャ符号化情報と拡張レイャ符号化情報とに分離し、分離された基本レィャ符号化情報を基本レイヤ復号化部 1 5 2に出力し、また、分離された拡張レイヤ符号化情報を拡張レイヤ復号化部 1 5 3に出力する。

基本レイヤ複号化部 1 5 2は、 C E L Pタイプの音声複号化方法を用いて基本レイヤ符号化情報を復号化し、復号化によって求められる基本レイヤ復号化信号を加算部 1 5 4に出力する。また、基本レイヤ復号化部 1 5 2は、ピッチラグを基本レイヤの長期予測情報として拡張レイヤ復号化部 1 5 3に出力する。拡張レイヤ複号化部 1 5 3は、長期予測情報を利用して拡張レイヤ符号化情報を複号化し、復号化によって求められる拡張レイヤ復号化信号を加算部 1 5 4に出力する。

加算部 1 5 4は、基本レイヤ複号化部 1 5 2から出力された基本レイヤ復号化信号と拡張レイヤ復号ィヒ部 1 5 3から出力された拡張レイヤ復号化信号とを加算し、加算結果である音声 ·楽音信号を後工程の装置に出力する。

次に、図 1の基本レイャ符号化部 1 0 1の内部構成を図 2のブロック図を用いて説明する。

基本レイヤ符号化部 1 0 1の入力信号は、前処理部 2 0 0に入力される。前処理部 2 0 0は、 D C成分を取り除くハイパスフィルタ処理や後続する符号ィ匕処理の性能改善につながるような波形整形処理やプリエンファシス処理を行い、これらの処理後の信号（Xin) を L P C分析部 2 0 1および加算器 2 0 4に出力する。

L P C分析部 2 0 1は、 Xinを用いて線形予測分析を行い、分析結果（線形予測係数）を L P C量子化部 2 0 2へ出力する。 L P C量子化部 2 0 2は、 L P C分析部 2 0 1から出力された線形予測係数（L P C)の量子化処理を行い、量子化 L P Cを合成フィルタ 2 0 3へ出力するとともに量子化 L P Cを表す符号（L) を多重化部 2 1 3へ出力する。

合成フィルタ 2 0 3は、量子化 L P Cに基づくフィルタ係数により、後述する加算器 2 1 0から出力される駆動音源に対してフィルタ合成を行うことにより合成信号を生成し、合成信号を加算器 2 0 4へ出力する。

加算器 2 0 4は、合成信号の極性を反転させて Xinに加算することにより誤差信号を算出し、誤差信号を聴覚重み付け部 2 1 1へ出力する。 ' 適応音源符号帳 2 0 5は、過去に加算器 2 1 0によって出力された駆動音源信号をバッファに記憶しており、パラメータ決定部 2 1 2から出力された信号によって特定される過去の駆動音源信号サンプルから 1フレーム分のサンプルを適応音源べクトルとして切り出して乗算器 2 0 8へ出力する。

量子化利得生成部 2 0 6は、パラメータ決定部 2 1 2から出力された信号によって特定される適応音源利得と固定音源利得とをそれぞれ乗算器 2 0 8と 2 0 9へ出力する。

固定音源符号帳 2 0 7は、パラメータ決定部 2 1 2から出力された信号によつて特定される形状を有するパルス音源べクトルに拡散べクトルを乗算して得られた固定音源べグトルを乗算器 2 0 9へ出力する。

乗算器 2 0 8は、量子化利得生成部 2 0 6から出力された量子化適応音源利得を、適応音源符号帳 2 0 5から出力された適応音源べクトルに乗じて、加算器 2 1 0へ出力する。乗算器 2 0 9は、量子化利得生成部 2 0 6から出力された量子化固定音源利得を、固定音源符号帳 2 0 7から出力された固定音源べクトルに乗じて、加算器 2 1 0へ出力する。

加算器 2 1 0は、利得乗算後の適応音源べクトルと固定音源べクトルとをそれぞれ乗算器 2 0 8と乗算器 2 0 9から入力し、これらをベクトルカ卩算し、カロ算結果である駆動音源を合成フィルタ 2 0 3および適応音源符号帳 2 0 5へ出力する。なお、適応音源符号帳 2 0 5に入力された駆動音源は、バッファに記憶される。

聴覚重み付け部 2 1 1は、カロ算器 2 0 4から出力された誤差信号に対して聴覚的な重み付けをおこない、聴覚重み付け領域での ¾nと合成信号との歪みを算出し、パラメータ決定部 2 1 2へ出力する。

パラメータ決定部 2 1 2は、聴覚重み付け部 2 1 1から出力された符号化歪みを最小とする適応音源べクトル、固定音源べクトル及び量子化利得を、各々適応音源符号帳 2 0 5、固定音源符号帳 2 0 7及び量子化利得生成部 2 0 6から選択し、選択結果を示す適応音源べクトル符号（A) 、音源利得符号（G) 及び固定音源べクトル符号（F ) を多重化部 2 1 3に出力する。なお、適応音源ベクトル符号（A) は、ピッチラグに対応する符号である。

多重化部 2 1 3は、 L P C量子化部 2 0 2から量子化 L P Cを表す符号（L ) を入力し、パラメータ決定部 2 1 2から適応音源べクトルを表す符号（A) 、固定音源べクトルを表す符号（F ) および量子化利得を表す符号（G) を入力し、これらの情報を多重化して基本レイヤ符号化情報として出力する。

以上が、図 1の基本レイヤ符号化部 1 0 1の内部構成の説明である。

次に、図 3を用いて、パラメータ決定部 2 1 2が、適応音源符号帳 2 0 5から生成される信号を決定する処理を簡単に説明する。図 3において、バッファ 3 0 1は適応音源符号帳 2 0 5が備えるバッファであり、位置 3 0 2は適応音源べクトルの切り出し位置であり、ベクトル 3 0 3は、切り出された適応音源ベクトルである。また、数値「4 1」、「2 9 6」は、切り出し位置 3 0 2を動かす範囲の下限と上限とに対応している。

切り出し位置 3 0 2を動かす範囲は、適応音源べクトルを表す符号（A) に割り当てるビット数を「8」とする場合、「2 5 6」の長さの範囲（例えば、 4 1〜2 9 6 ) に設定することができる。また、切り出し位置 3 0 2を動力す範囲は、任意に設定することができる。

パラメータ決定部 2 1 2は、切り出し位置 3 0 2を設定された範囲内で動かし、適応音源べクトル 3 0 3をそれぞれフレームの長さだけ切り出す。そして、パラメータ決定部 2 1 2は、聴覚重み付け部 2 1 1から出力される符号化歪みが最小となる切り出し位置 3 0 2を求める。

このように、パラメータ決定部 2 1 2によって求められるバッファの切り出し位置 3 0 2が「ピッチラグ」である。

次に、図 1の基本レイヤ複号化部 1 0 2 ( 1 5 2 ) の内部構成について図 4 を用いて説明する。

図 4において、基本レイヤ復号化部 1 0 2 ( 1 5 2 ) に入力された基本レイャ符号化情報は、多重化分離部 4 0 1によって個々の符号（L、 A、 G、 F ) に分離される。分離された L P C符号（L ) は L P C復号化部 4 0 2に出力され、分離された適応音源ベクトル符号（A) は適応音源符号帳 4 0 5に出力され、分離された音源利得符号（G) は量子化利得生成部 4 0 6に出力され、分離された固定音源べクトル符号（F ) は固定音源符号帳 4 0 7へ出力される。

？じ復号化部4 0 2は、多重化分離部 4 0 1から出力された符号（L ) から L P Cを復号し、合成フィルタ 4 0 3に出力する。

適応音源符号帳 4 0 5は、多重化分離部 4 0 1から出力された符号（A) で指定される過去の駆動音源信号サンプルから 1フレーム分のサンプルを適応音源ベクトルとして取り出して乗算器 4 0 8へ出力する。また、適応音源符号帳 4 0 5は、ピッチラグを長期予測情報として拡張レイャ符号化部 1 0 4 (拡張レイヤ復号化部 1 5 3 ) に出力する。

量子化利得生成部 4 0 6は、多重化分離部 4 0 1から出力された音源利得符号（G) で指定される適応音源ベクトル利得と固定音源ベクトル利得を復号し乗算器 4 0 8及び乗算器 4 0 9へ出力する。固定音源符号帳 4 0 7は、多重化分離部 4 0 1から出力された符号（F ) で指定される固定音源べクトルを生成し、乗算器 4 0 9へ出力する。

乗算器 4 0 8は、適応音源べクトルに適応音源べクトル利得を乗算して、加算器 4 1 0へ出力する。乗算器 4 0 9は、固定音源べクトルに固定音源べクトル利得を乗算して、加算器 4 1 0へ出力する。

加算器 4 1 0は、乗算器 4 0 8 , 4 0 9から出力された利得乗算後の適応音源べクトルと固定音源べクトルの加算を行って駆動音源べクトルを生成し、これを合成フィルタ 4 0 3及び適応音源符号帳 4 0 5に出力する。

合成フィルタ 4 0 3は、加算器 4 1 0から出力された駆動音源べクトルを駆動信号として、 L P C復号ィヒ部 4 0 2によって復号されたフィルタ係数を用いて、フィルタ合成を行い、合成した信号を後処理部 4 0 4へ出力する。

後処理部 4 0 4は、合成フィルタ 4 0 3から出力された信号に対して、ホルマント強調やピッチ強調といったような音声の主観的な品質を改善する処理や、定常雑音の主観的品質を改善する処理などを施し、基本レイヤ復号化信号として出力する。

以上が、図 1の基本レイヤ複号化部 1 0 2 ( 1 5 2 ) の内部構成の説明である。

次に、図 1の拡張レイヤ符号化部 1 0 4の内部構成について図 5のブロック図を用いて説明する。

拡張レイヤ符号化部 1 0 4では、残差信号を Nサンプルずつ区切り（Nは自然数）、 Nサンプルを 1フレームとしてフレーム毎に符号化を行う。以下、残差信号を e ( 0 ) 〜e (X - l ) と表し、符号化の対象となるフレームを e ( n ) 〜e ( n + N—l ) と表すこととする。ここで、 Xは残差信号の長さであり、 Nはフレームの長さに相当する。また、 nは各フレームの先頭に位置するサンプルであり、 nは Nの整数倍に相当する。なお、あるフレームの信号を過去に生成された信号から予測して生成する方法は長期予測と呼ばれる。また、長期予測を行うフィルタはピッチフィルタ、コムフィルタ等と呼ばれる。図 5において、長期予測ラグ指示部 501は、基本レイャ復号化部 102で求められる長期予測情報 tを入力し、これに基づいて拡張レイヤの長期予測ラグ Tを求め、これを長期予測信号記憶部 502に出力する。なお、基本レイヤと拡張レイヤとの間でサンプリング周波数の違いが生じる場合、長期予測ラグ Tは、以下の式 (1) により求めることができる。なお、式 (1) において、 Dは拡張レイヤのサンプリング周波数、 dは基本レイヤのサンプリング周波数、あ。。

T = DX t/d …式（1)

長期予測信号記憶部 502は、過去に生成された長期予測信号を記憶するバッファを備える。バッファの長さを Mとした場合、バッファは過去に生成された長期予測信号の系列 s (n-M- 1) 〜s (n-1) で構成される。長期予測信号記憶部 502は、長期予測ラグ指示部 501より長期予測ラグ Tを入力すると、バッファに記憶されている過去の長期予測信号の系列から長期予測ラグ Tだけ遡った長期予測信号 s (n— T) 〜s (n— T + N— 1)を切り出し、これを長期予測係数計算部 503及び長期予測信号生成部 506に出力する。また、長期予測信号記憶部 502は、長期予測信号生成部 506から長期予測信号 s (n) 〜s (n+N— 1) を入力し、以下の式（2) によりバッファの更新を行う。 s(i) =s (i+N) (i=n—M—l, ·'·，η—1) …^ ）

s(i) =s(i) (i=n—M-l, - ' ·,η - 1) 、なお、長期予測ラグ Τがフレーム長 Νより短く、長期予測信号記憶部 502 が長期予測信号を切り出すことができない場合、長期予測ラグ Τをフレーム長 Νより長くなるまで整数倍することにより長期予測信号を切り出すことができる。あるいは、長期予測ラグ Τだけ遡った長期予測信号 s (n-T) 〜s (n -T + N- 1) を繰り返して、フレーム長 Nの長さまで充当させることにより切り出すことができる。

長期予測係数計算部 503は、残差信号 e (n) 〜e (n + N— 1) 及び長期予測信号 s (n-T) 〜s (n-T + N- 1) を入力し、これらを用いて以下の式（3) により、長期予測係数 ]3を算出し、これを長期予測係数符号化部 504に出力する。式 (3)

長期予測係数符号化部 504は、長期予測係数 βを符号化し、符号化によつて求められる拡張レイヤ符号化情報を長期予測係数復号化部 505に出力し、伝送路を介して拡張レイヤ復号化部 153に出力する。なお、長期予測係数 j8 の符号化方法として、スカラ量子化により行う方法等が知られている。

長期予測係数複号化部 505は、拡張レイヤ符号化情報を復号化し、これによって求められる復号化長期予測係数 qを長期予測信号生成部 506に出力する。

長期予測信号生成部 506は、復号化長期予測係数 ]3 q及び長期予測信号 s (n-T) 〜s (n-T + N- 1) を入力し、これらを用いて以下の式（4) により、長期予測信号 s (n) 〜s (n+N-1) を算出し、これを長期予測信号記憶部 502に出力する。

s (n +i) = AXs (n - T+l) (i=0,'-',N - 1) ■■■式（4) 以上が、図 1の拡張レイヤ符号化部 104の内部構成の説明である。

次に、図 1の拡張レイヤ復号化部 153の内部構成について図 6のブロック図を用いて説明する。

図 6において、長期予測ラグ指示部 601は、基本レイヤ復号化部 152から出力された長期予測情報を用いて拡張レイヤの長期予測ラグ Tを求め、これを長期予測信号記憶部 602に出力する。

長期予測信号記憶部 602は、過去に生成された長期予測信号を記憶するバッファを備える。バッファの長さを Mとした場合、バッファは過去に生成された長期予測信号の系列 s (n-M- 1) 〜s (n— 1) で構成される。長期予測信号記憶部 602は、長期予測ラグ指示部 601より長期予測ラグ Tを入力すると、バッファに記憶されている過去の長期予測信号の系列から長期予測ラグ Tだけ遡つた長期予測信号 s (n-T)〜s (n-T + N- 1)を切り出し、これを長期予測信号生成部 604に出力する。また、長期予測信号記憶部 60 2は、長期予測信号生成部 604から長期予測信号 s (n)〜s (n + N-1) を入力し、上記式（2) によりバッファの更新を行う。

長期予測係数複号化部 603は、拡張レイヤ符号化情報を複号化し、複号化によつて求められる複号化長期予測係数 β qを長期予測信号生成部 604に出力する。

長期予測信号生成部 604は、復号化長期予測係数 ]3 q及び長期予測信号 s (n-T)〜s (n-T + N- 1) を入力し、これらを用いて上記式（4) により、長期予測信号 s (n) 〜s (n+N- 1) を算出し、これを長期予測信号記憶部 602及び加算部 153に拡張レイヤ復号化信号として出力する。以上が、図 1の拡張レイヤ復号化部 153の内部構成の説明である。

このように、長期予測を行う拡張レイヤを設け、音声 '楽音の長期的な相関の性質を利用して残差信号を拡張レイヤにおいて長期予測することにより、少ない符号化情報で周波数帯域の広い音声■楽音信号を効果的に符号化ノ復号化することができ、また、演算量の削減を図ることができる。

このとき、長期予測ラグを符号化ノ復号化するのではなく、基本レイヤの長期予測情報を利用して長期予測ラグを求めることにより、符号化情報の削減を図ることができる。

また、基本レイヤ符号ィ匕情報を復号ィ匕することによって、基本レイヤの復号化信号のみを得ることができ、 C E L Pタイプの音声符号化/複号化方法において、符号化情報の一部からでも音声'楽音を復号化できる機能（スケ一ラブル符号化）を実現することができる。

また、長期予測においては、音声 ·楽音が有する長期的な相関を利用し、現フレ^ "ムとの相関が最も高いフレームをバッファから切り出し、切り出したフレームの信号を用いて現フレームの信号を表現する。しかしながら、現フレムとの相関が最も高いフレームをバッファから切り出す手段において、ピッチラグなどの音声■楽音が有する長期的な相関を表わす情報が無い場合には、パッファからフレームを切り出す際の切り出し位置を変化させながら、切り出したフレームと現フレームとの自己相関関数を計算し、最も相関が高くなるフレームを探索する必要があり、探索に掛かる計算量は非常に大きくなつてしまう。ところが、基本レイヤ符号化部 101で求めたピッチラグを用いて切り出し位置を一意に定めることにより、通常の長期予測を行う際に掛かる計算量を大幅に削減することができる。

なお、本実施の形態で説明した拡張レイヤ長期予測方法では、基本レイヤ復号化部より出力される長期予測情報がピッチラグである場合について説明した is 本発明はこれに限られず、音声 ·楽音が有する長期的な相関を表す情報であれば長期予測情報として用いることができる。

また、本実施の形態では、長期予測信号記憶部 502がバッファから長期予測信号を切り出す位置を長期予測ラグ τとする場合について説明したが、これを長期予測ラグ T付近の位置 Τ+α ( は微小な数であり、任意に設定可能）とする場合についても本発明は適用することができ、長期予測ラグ τに微小な誤差が生じる場合でも本実施の形態と同様の作用 ·効果を得ることができる。例えば、長期予測信号記憶部 502は、長期予測ラグ指示部 501より長期予測ラグ Τを入力し、バッファに記憶されている過去の長期予測信号の系列から Τ+ αだけ遡った長期予測信号 s (n—T— a；)〜 s (η— Τ—α+Ν— 1) を切り出し、以下の式（5) を用いて判定値 Cを算出し、判定値 Cが最大となる αを求め、これを符号化する。復号化を行う場合、長期予測信号記憶部 60 2は、 αの符号ィヒ情報を復号化してひを求め、また、長期予測ラグ Τを用いて長期予測信号 s (η-Τ-α) 〜s (η-Τ-α+Ν- 1) を切り出す。 …式 (5)

また、本実施の形態では、音声 ·楽音信号を用いて長期予測を行う場合について説明したが、 MDCT、 QMF等の直交変換を用いて音声'楽音信号を時間領域から周波数領域へ変換し、変換後の信号（周波数パラメータ）を用いて長期予測を行う場合についても本発明は適用することができ、本実施の形態と同様の作用■効果を得ることができる。例えば、音声 ·楽音信号の周波数パラメータで拡張レイヤ長期予測を行う場合には、図 5において、長期予測係数計算部 503に、長期予測信号 s (n— T) 〜s (n-T + N- 1) を時間領域から周波数領域へ変換する機能及び残差信号を周波数パラメータへ変換する機能を新たに設け、長期予測信号生成部 506に、長期予測信号 s (n)〜 s (n + N- 1)を周波数領域から時間領域へ逆変換する機能を新たに設ける。また、図 6において、長期予測信号生成部 604に、長期予測信号 s (n) 〜s (n + N- 1) を周波数領域から時間領域へ逆変換する機能を新たに設ける。また、通常の音声，楽音符号化複号化方法では、伝送路において誤り検出もしくは誤り訂正に用いる冗長ビットを符号化情報に付加させて、冗長ビットを含む符号化情報を伝送することが一般的であるが、本発明では、基本レイヤ符号化部 1 0 1より出力される符号化情報（A) と拡張レイヤ符号化部 104 より出力される符号化情報（B) とに割り当てる冗長ビットのビット配分を符号化情報（A) に重みを付けて振り分けることができる。

(実施の形態 2)

実施の形態 2では、残差信号と長期予測信号との差（長期予測残差信号）の符号化/復号化を行う場合について説明する。

本実施の形態の音声符号化装置 Z音声復号化装置は、構成が図 1と同様であり、拡張レイヤ符号化部 1 04及び拡張レイヤ複号化部 1 5 3の内部構成のみが異なる。図 7は、本実施の形態に係る拡張レイヤ符号化部 1 04の内部構成を示すブロック図である。なお、図 7において、図 5と共通する構成部分には図 5と同一符号を付して説明を省略する。

図 7の拡張レイャ符号化部 1 04は、図 5と比較して、加算部 70 1、長期予測残差信号符号化部 702、符号化情報多重化部 703、長期予測残差信号復号化部 704及び加算部 705を追加した構成を採る。

長期予測信号生成部 506は、算出した長期予測信号 s ( n ) 〜 s (n+N - 1 ) を加算部 70 1及び加算部 705に出力する。

加算部 70 1は、以下の式（6) に示すように、長期予測信号 s (n) 〜s (n+N-1) の極性を反転させて残差信号 e (n) 〜e (n+N— 1) に加算し、加算結果である長期予測残差信号 p (n) 〜p (n+N- 1) を長期予測残差信号符号化部 702に出力する。

p (n +i) =e (n +i) s (n +i) (ί=0,···,Ν-1) ■■■式（6)

長期予測残差信号符号化部 702は、長期予測残差信号 ρ (η) 〜ρ (η + N- l) の符号化を行い、符号化によって求められる符号化情報（以下、「長期予測残差符号化情報」という）を符号化情報多重化部 703及び長期予測残差信号復号化部 704に出力する。なお、長期予測残差信号の符号化は、ベタトル量子化が一般的である。

ここで、長期予測残差信号！） (n) 〜p (n+N- 1) の符号化方法について 8ビットでベクトル量子化を行う場合を例に説明する。この場合、長期予測残差信号符号化部 702の内部には、予め作成された 256種類のコードべクトルが格納されたコードプックが用意される。このコードべクトル CODE ( k ) (0) —CODE (k) (N- l) は、 Nの長さのべクトルである。また、 kはコードべクトルのインデクスであり、 0から 25 5までの値をとる。長期予測残差信号符号化部 702は、以下の式（8) により長期予測残差信号 p (n) 〜！） (n+N- 1) とコードベクトル CODE (k) (0) -CODE (k) (N - 1) との二乗誤差 er を求める。 ' "式 (7)

そして、長期予測残差信号符号化部 702は、二乗誤差 erが最小となる k の値を長期予測残差符号化情報として決定する。

符号化情報多重化部 703は、長期予測係数符号化部 504より入力した拡張レイャ符号化情報と、長期予測残差信号符号化部 702より入力した長期予測残差符号化情報を多重化し、多重化後の情報を伝送路を介して拡張レイャ復号化部 153に出力する。

長期予測残差信号複号化部 704は、長期予測残差符号化情報の複号化を行い、復号化によって求められた復号化長期予測残差信号 P q (n) 〜： p q (n +N-1) を加算部 705に出力する。

加算部 705は、長期予測信号生成部 506より入力した長期予測信号 s (n) 〜s (n+N-1) と長期予測残差信号復号化部 704より入力した復号化長期予測残差信号 P q (n) 〜！） q (n+N-1) とを加算し、加算結果を長期予測信号記憶部 502に出力する。この結果、長期予測信号記憶部 50 2は、以下の式（8) によりバッファの更新を行う。 s(i) =s (i+N) (i=n一 - -· η - Ν - 1) 1 .

s(i) =s (i+N) +p, (i-N) (i=n—N， -· η-1) J …式（ 8 )

s(i) =s(i) (i=n—M-l, ' ' -,n-l) 以上が、本実施の形態に係る拡張レイヤ符号化部 104の内部構成の説明である。

次に、本実施の形態に係る拡張レイヤ復号化部 153の内部構成について、図 8のプロック図を用いて説明する。なお、図 8において、図 6と共通する構成部分には図 6と同一符号を付して説明を省略する。

図 8の拡張レイヤ複号化部 153は、図 6と比較して、符号化情報分離部 8 01、長期予測残差信号復号化部 802及び加算部 803を追加した構成を採る。符号化情報分離部 801は、伝送路より受信した多重化されている符号化情報を、拡張レイヤ符号化情報と長期予測残差符号化情報とに分離し、拡張レイャ符号化情報を長期予測係数復号化部 603に出力し、長期予測残差符号化情報を長期予測残差信号複号化部 802に出力する。

長期予測残差信号復号化部 802は、長期予測残差符号化情報を複号化して複号化長期予測残差信号 P q (n) 〜p q (n + N— 1) を求め、これを加算部 803に出力する。

加算部 803は、長期予測信号生成部 604より入力した長期予測信号 s (n) 〜s (n+N— 1) と長期予測残差信号復号化部 802より入力した復号化長期予測残差信号 p q (n) 〜！） q (n+N— 1) とを加算し、加算結果を長期予測信号記憶部 602に出力し、加算結果を拡張レイヤ複号化信号として出力する。

以上が、本実施の形態に係る拡張レイヤ復号化部 153の内部構成の説明である。

このように、残差信号と長期予測信号との差（長期予測残差信号）を符号化ノ復号化することにより、上記実施の形態 1よりもさらに高品質な復号化信号を得ることができる。

なお、本実施の形態では、ベクトル量子化により長期予測残差信号の符号化を行う場合について説明したが、本発明は符号化方法に制限はなく、例えば、形状-利得 V Q、分割 V Q、変換 V Q、多段階 V Qにより符号化を行ってもよい。以下、 13ビットで形状 8ビット、利得 5ビットの形状-利得 V Qにより符号化を行う場合について説明する。この場合、コードブックは形状コードブック、利得コードプックの二種類が用意される。形状コードプックは 256種類の形状コードべクトルから成り、形状コードべクトル SCODE (k 1) (0) 〜 SCODE (k 1) (N- 1) は、 Nの長さのベクトルである。ここで、 k 1は形状コードべクトルのインデクスであり、 0から 255までの値をとる。また、利得コードプックは 32種類の利得コードから成り、利得コード GCODE ( k 2) はスカラの値をとる。ここで、 k 2は利得コードのインデクスであり、 0 から 31までの値をとる。長期予測残差信号符号化部 702は、以下の式（ 9 ) により長期予測残差信号 p (n)〜p (n+M-1) の利得 gainと形状べタトル shape (0) 〜shape (N- 1) を求め、以下の式（10) により利得 gain と利得コード GCODE (k 2) との利得誤差 gainer と、形状べクトル shape

(0)〜shape(N— 1)と形状コードべクトル SCODE(k 1) (0)〜SCODE

(k 1) (N- 1) との二乗誤差 shapeerとを求める。 gain= J∑p(n+i)

…式 (9)

shape(i)= ^0=0, . , ·'Ν-1) gainer: \ gatn- GCODE ^(K2>\

n_ ₂ …式（10)

shapeer=∑ (shape (i)一 SCODE (i))²

i=0 そして、長期予測残差信号符号化部 702は、利得誤差 gainerが最小となる k 2の値と二乗誤差 shapperが最小となる k 1の値とを求め、これらの求めた値を長期予測残差符号化情報とする。

次に、 8ビットで分割 VQにより符号化を行う場合について説明する。この場合、コードブックは第 1分割コードプック、第 2分割コードプックの二種類が用意される。第 1分割コードプックは 16種類の第 1分割コ一ドべクトル SPCODE (k 3) (0) 〜SPCODE (k 3) (N/2- 1) から成り、第 2 分割コードプック SPCODE (k 4) (0)〜SPCODE (k 4) (N/2-1) は 16種類の第 2分割コードべクトノレ力ら成り、それぞれコードべクトルは N /2の長さのベクトルである。ここで、 k 3は第 1分割コードべクトルのィンデクスであり、 0から 15までの値をとる。また、 k4は第 2分割コードべクトルのインデクスであり、 0から 15までの値をとる。長期予測残差信号符号化部 702は、以下の式（11) により長期予測残差信号!） (n) 〜p (n + N— 1) を、第 1分割べクトノレ s p l (0) 〜s p l (N/2-1) と第 2分割べクトル s p 2 (0) 〜s p 2 (N/2-1) とに分割し、以下の式（12) により第 1分割ベクトル s p 1 (0) 〜s p l (N/2-1) と第 1分割コードべクトル SPCODE (k 3) (0) -SPCODE (k 3) (N/2-1) との二乗誤差 spliterlと、第 2分割べクトル s p 2 (0) ~ s p 2 (N/2-1) と第 2分割コードブック SPCODE (k 4) (0) 〜SPCODE (k 4) (N/

2-1) との二乗誤差 spHter 2とを求める。 spfi) =p (n+1) (i=0, · ' -,Ν/2-1) •式（11)

sp/i) =ρ (η+Ν/2+i) (i=0， . - ·,Ν/2-1) spliter= ∑ (spfi SPCODE, ( J

N/2-1/ , (X4) 、 \² ,式（12)

spliter= ∑ (sp₂(i)SPCODE₂ (i)J そして、長期予測残差信号符号化部 702は、二乗誤差 spliterlが最小となる k 3の値と二乗誤差 spliter2が最小となる k 4の値とを求め、これらの求めた値を長期予測残差符号化情報とする。

次に、 8ビットで離散フーリエ変換を用いた変換 VQにより符号化を行う場合について説明する。この場合、 256種類の変換コードベクトルから成る変換コードブックが用意され、変換コードベクトル TCODE (k 5) (0) 〜 TCODE (k 5) (N/2 - 1) は Nの長さのベクトルである。ここで、 k 5 は変換コードベクトルのインデクスであり、 0から 255までの値をとる。長期予測残差信号符号化部 702は、以下の式（13) により長期予測残差信号 p (n) 〜： p (n+N— 1) を離散フーリエ変換して変換ベクトル tp (0) 〜 tp (N— 1) を求め、以下の式（14) により変換ベクトル tp (0) 〜tp (N — 1) と変換コードベクトル TCODE (k 5) (0) -TCODE (k 5) (N /2— 1) との二乗誤差 transerを求める。 (H---N-1) …式（13)

transer= ¾ (tp(i)-TCODE (i))² …式（ 14) そして、長期予測残差信号符号化部 702は、二乗誤差 transerが最小となる k 5の値を求め、この値を長期予測残差符号化情報とする。

次に、 13ビットで一段目 5ビット、二段目 8ビットの二段 V Qにより符号化を行う場合について説明する。この場合、一段目コードプック、二段目コードプックの二種類のコードブックを用意する。一段目コードプックは 32種類の一段目コードベクトル PHC0DE1 (k 6) ( 0 )〜PHCODE 1 ( k 6 ) (N — 1) から成り、二段目コードプックは 256種類の二段目コードベクトル PHCODE 2 (k 7) (0) 〜； PHCODE2 (k 7) (N— 1) から成り、それぞれコードベクトルは Nの長さのベクトルである。ここで、 k 6は一段目コードベクトルのインデクスであり、 0から 31までの値をとる。また、 k 7は二段目コードベクトルのインデクスであり、 0から 255までの値をとる。長期予測残差信号符号化部 702は、以下の式（15) により長期予測残差信号 p (n) 〜！） (n+N- 1) と一段目コードベクトル PHCODE 1 (k 6) (0) 〜PHC0DE 1 (k 6) (N— 1 ) との二乗誤差 phaseer 1を求め、二乗誤差 phaseer 1が最小となる k 6の値を求め、この値を kmaxとする。

ヽ

phaseer尸∑ ( tp(i) - TCODE (i) ) '■■式（ 15 ) そして、長期予測残差信号符号化部 702は、以下の式（16) により誤差ベタトル ep (0) ~ep (N-1) を求め、以下の式（17) により誤差べクトル ep (0) 〜ep (N-1) と二段目コードベクトル PHCODE 2 (k 7) (0) 〜PHC0DE2 (k 7) (N-1) との二乗誤差 phaseer 2を求め、二乗誤差 phaseer 2が最小となる k 7の値を求め、この値と k maxとを長期予測残差符号化情報とする。 ep (i) =p (n +i) -PHCODE, (、i) (i=0, ' ' ·,Ν-1)■ · ·式（ 16) phaseer = ^Ni(ep(i)-PHCODE₂ (i)) ' 式（1 7)

(実施の形態 3 )

図 9は、上記実施の形態 1 2で説明した音声符号化装置及び音声復号化装置を含む音声信号送信装置および音声信号受信装置の構成を示すプロック図である。

図 9において、音声信号 9 0 1は入力装置 9 0 2によって電気的信号に変換され AZD変換装置 9 0 3に出力される。 AZD変換装置 9 0 3は入力装置 9 0 2から出力された（アナログ）信号をディジタ信号に変換し音声符号化装置 9 0 4 出力する。音声符号化装置 9 0 4は、図 1に示した音声符号化装置 1 0 0を実装し、 AZD変換装置 9 0 3から出力されたディジタル音声信号を符号化し符号化情報を R F変調装置 9 0 5 出力する。 R F変調装置 9 0 5は音声符号化装置 9 0 4から出力された音声符号化情報を電波等の伝播媒体に載せて送出するための信号に変換し送信アンテナ 9 0 6 出力する。送信アンテナ 9 0 6は R F変調装置 9 0 5から出力された出力信号を電波（R F信号）として送出する。なお、図中の R F信号 9 0 7は送信アンテナ 9 0 6から送出された電波（R F信号）を表す。以上が音声信号送信装置の構成および動作である。

R F信号 9 0 8は受信アンテナ 9 0 9によって受信され R F復調装置 9 1 0 に出力される。なお、図中の R F信号 9 0 8は受信アンテナ 9 0 9に受信された電波を表し、伝播路において信号の減衰や雑音の重畳がなければ R F信号 9 0 7と全く同じものになる。

R F復調装置 9 1 0は受信アンテナ 9 0 9から出力された R F信号から音声符号化情報を復調し音声複号化装置 9 1 1 出力する。音声復号化装置 9 1 1 は、図 1に示した音声復号化装置 1 5 0を実装し、 R F復調装置 9 1 0から出力された音声符号化情報から音声信号を復号し DZA変換装置 9 1 2 出力する。 D/A変換装置 9 1 2は音声復号化装置 9 1 1から出力されたディジタル音声信号をアナログの電気的信号に変換し出力装置 9 1 3へ出力する。

出力装置 9 1 3は電気的信号を空気の振動に変換し音波として人間の耳に聴こえるように出力する。なお、図中、参照符号 9 1 4は出力された音波を表す。以上が音声信号受信装置の構成およぴ動作である。

無線通信システムにおける基地局装置おょぴ通信端末装置に、上記のような音声信号送信装置および音声信号受信装置を備えることにより、高品質な復号化信号を得ることができる。

以上説明したように、本発明によれば、少ない符号化情報で周波数帯域の広い音声 ·楽音信号を効果的に符号化 z復号化することができ、また、演算量の削減を図ることができる。また、基本レイヤの長期予測情報を利用して長期予測ラグを求めることにより、符号化情報を削減することができる。また、基本レイャ符号化情報を復号化することによって、基本レイャの復号化信号のみを得ることができ、 C E L Pタイプの音声符号化復号化方法において、符号化情報の一部からでも音声'楽音を復号化できる機能（スケーラブル符号化）を実現することができる。

本明細書は、 2 0 0 3年 4月 3 0日出願の特願 2 0 0 3 - 1 2 5 6 6 5に基づくものである。この内容をここに含めておく。産業上の利用可能性

本発明は、音声 ·楽音信号を符号化して伝送する通信システムに使用される音声符号化装置、音声複号化装置に用いるに好適である。

Claims

請求の範囲

1 .入力信号を符号化して第 1符号化情報を生成する基本レイャ符号化手段と、前記第 1符号化情報を複号化して第 1復号化信号を生成するとともに、音声- 楽音が有する長期的な相関を表す情報である長期予測情報を生成する基本レイャ復号化手段と、前記入力信号と前記第 1復号化信号との差分である残差信号を求める加算手段と、前記長期予測情報及び前記残差信号を用いて長期予測係数を算出し、前記長期予測係数を符号化して第 2符号化情報を生成する拡張レィャ符号化手段と、を具備する音声符号化装置。

2 . 基本レイヤ復号化手段は、駆動音源信号サンプルから切り出された適応音源べクトルの切り出し位置を示す情報を長期予測情報とする請求項 1記載の音声符号化装置。

3 . 拡張レイヤ符号化手段は、前記長期予測情報に基づいて拡張レイヤの長期予測ラグを求める手段と、バッファに記憶されている過去の長期予測信号系列から前記長期予測ラグだけ遡った長期予測信号を切り出す手段と、前記残差信号及び前記長期予測信号を用いて長期予測係数を算出する手段と、前記長期予測係数を符号化することにより前記拡張レイャ符号化情報を生成する手段と、前記拡張レイャ符号化情報を複号化して複号化長期予測係数を生成する手段と、前記複号化長期予測係数及び前記長期予測信号を用いて新たな長期予測信号を算出し、前記新たな長期予測信号を用いて前記バッファを更新する手段と、を有する請求項 1記載の音声符号化装置。

4. 拡張レイヤ符号化手段は、前記残差信号と前記長期予測信号との差分である長期予測残差信号を求める手段と、前記長期予測残差信号を符号化することにより長期予測残差符号化情報を生成する手段と、前記長期予測残差符号化情報を復号化して複号化長期予測残差信号算出する手段と、前記新たな長期予測信号と前記復号化長期予測残差信号とを加算し、加算結果を用いて前記バッファを更新する手段と、をさらに有する請求項 3記載の音声符号化装置。

5 . 請求項 1記載の音声符号化装置から第 1符号化情報及び第 2符号化情報を受信して音声を復号化する音声復号化装置であって、

前記第 1符号化情報を復号化して第 1復号化信号を生成するとともに、音声■楽音が有する長期的な相関を表す情報である長期予測情報を生成する基本レイャ復号化手段と、前記長期予測情報を用いて前記第 2符号化情報を復号化して第 2復号化信号を生成する拡張レイャ複号化手段と、前記第 1復号化信号と前記第 2復号化信号とを加算し、加算結果である音声 ·楽音信号を出力する加算手段と、を具備する音声復号化装置。

6 . 基本レイヤ復号化手段は、駆動音源信号サンプルから切り出された適応音源べクトルの切り出し位置を示す情報を長期予測情報とする請求項 5記載の音声複号化装置。

7 . 拡張レイヤ複号化手段は、前記長期予測情報に基づいて拡張レイヤの長期予測ラグを求める手段と、バッファに記憶されている過去の長期予測信号系列から長期予測ラグだけ遡った長期予測信号を切り出す手段と、前記拡張レイヤ符号化情報を複号化して復号化長期予測係数を求める手段と、前記復号化長期予測係数及び長期予測信号を用いて長期予測信号を算出し、前記長期予測信号を用いて前記バッファを更新する手段と、を有し、前記長期予測信号を拡張レィャ復号化信号とする請求項 5記載の音声復号化装置。

8 . 拡張レイヤ複号化手段は、前記長期予測残差符号化情報を復号化して復号化長期予測残差信号を求める手段と、前記長期予測信号と前記復号化長期予測残差信号とを加算する手段と、を有し、前記加算結果を拡張レイヤ複号化信号とする請求項 7記載の音声復号化装置。

9 . 音声符号化装置を具備する音声信号送信装置であって、

前記音声符号化装置は、入力信号を符号化して第 1符号化情報を生成する基本レイャ符号化手段と、前記第 1符号化情報を復号化して第 1複号化信号を生成するとともに、音声.楽音が有する長期的な相関を表す情報である長期予測情報を生成する基本レイャ復号化手段と、前記入力信号と前記第 1複号化信号との差分である残差信号を求める加算手段と、前記長期予測情報及び前記残差信号を用いて長期予測係数を算出し、前記長期予測係数を符号化して第 2符号化情報を生成する拡張レイヤ符号ィヒ手段と、を具備する。

1 0 . 請求項 1記載の音声符号化装置から第 1符号化情報及び第 2符号化情報を受信して音声を復号化する音声復号化装置を具備する音声信号受信装置であつて、

前記第 1符号化情報を復号化して第 1復号化信号を生成するとともに、音声 ·楽音が有する長期的な相関を表す情報である長期予測情報を生成する基本レイャ復号化手段と、前記長期予測情報を用いて前記第 2符号化情報を復号化して第 2復号化信号を生成する拡張レイャ復号化手段と、前記第 1複号化信号と前記第 2複号化信号とを加算し、加算結果である音声■楽音信号を出力する加算手段と、を具備する。

1 1 . 入力信号を符号化して第 1符号化情報を生成する工程と、前記第 1符号化情報を復号化して第 1複号化信号を生成するとともに、音声■楽音が有する長期的な相関を表す情報である長期予測情報を生成する工程と、前記入力信号と前記第 1複号化信号との差分である残差信号を求める工程と、前記長期予測情報及び前記残差信号を用いて長期予測係数を算出し、前記長期予測係数を符号化して第 2符号化情報を生成する工程と、を具備する音声符号化方法。

1 2 . 請求項 1 1記載の音声符号化方法で生成された第 1符号化情報及び第 2 符号化情報を用いて音声を復号化する音声復号化方法であって、

前記第 1符号化情報を復号化して第 1復号化信号を生成するとともに、音声■楽音が有する長期的な相関を表す情報である長期予測情報を生成する工程と、前記長期予測情報を用いて前記第 2符号化情報を復号化して第 2復号化信号を生成する工程と、前記第 1復号化信号と前記第 2復号化信号とを加算し、加算結果である音声 ·楽音信号を出力する工程と、を具備する音声復号化方法。