JP3003531B2

JP3003531B2 - 音声符号化装置

Info

Publication number: JP3003531B2
Application number: JP7000300A
Authority: JP
Inventors: 一範小澤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1995-01-05
Filing date: 1995-01-05
Publication date: 2000-01-31
Anticipated expiration: 2015-01-31
Also published as: JPH08185199A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、音声信号を低いビット
レートで高品質に符号化するための音声符号化装置に関
するものである。

【０００２】

【従来の技術】音声信号を高能率に符号化する方式とし
て、例えば、Ｍ．ＳｃｈｒｏｅｄｅｒａｎｄＢ．Ａｔ
ａｌ氏による“Ｃｏｄｅ−ｅｘｃｉｔｅｄｌｉｎｅａ
ｒｐｒｅｄｉｃｔｉｏｎ：Ｈｉｇｈｑｕａｌｉｔｙ
ｓｐｅｅｃｈａｔｖｅｒｙｌｏｗｂｉｔｒ
ａｔｅｓ”（Ｐｒｏｃ．ＩＣＡＳＳＰ，ｐｐ．９３７−
９４０，１９８５年）と題した論文（文献１）や、Ｋｌ
ｅｉｊｎ氏らによる“Ｉｍｐｒｏｖｅｄｓｐｅｅｃｈ
ｑｕａｌｉｔｙａｎｄｅｆｆｉｃｉｅｎｔｖｅ
ｃｔｏｒｑｕａｎｔｉｚａｔｉｏｎｉｎＳＥＬ
Ｐ”（Ｐｒｏｃ．ＩＣＡＳＳＰ，ｐｐ．１５５−１５
８，１９８８年）と題した論文（文献２）などに記載さ
れているＣＥＬＰ（ＣｏｄｅＥｘｃｉｔｅｄＬｉｎ
ｅａｒＰｒｅｄｉｃｔｉｖｅＣｏｄｉｎｇ）が知ら
れている。この従来例では、送信側では、フレーム毎
（例えば２０ｍｓ）に音声信号から線形予測（ＬＰＣ）
分析を用いて、音声信号のスペクトル特性を表すスペク
トルパラメータを抽出する。フレームをさらにサブフレ
ーム（例えば５ｍｓ）に分割し、サブフレーム毎に過去
の音源信号を基に適応コードブックにおけるパラメータ
（ピッチ周期に対応する遅延パラメータとゲインパラメ
ータ）を抽出し、適応コードブックにより前記サブフレ
ームの音声信号をピッチ予測する。ピッチ予測して求め
た音源信号に対して、予め定められた種類の雑音信号か
らなる音源コードブック（ベクトル量子化コードブッ
ク）から最適音源コードベクトルを選択し最適なゲイン
を計算することにより、音源信号を量子化する。音源コ
ードベクトルの選択の仕方は、選択した音源コードベク
トルにより合成した信号と、前記残差信号との誤差電力
を最小化するように行なう。そして、選択されたコード
ベクトルの種類を表すインデクスとゲインならびに、前
記スペクトルパラメータと適応コードブックのパラメー
タをマルチプレクサ部により組み合わせて伝送する。受
信側の説明は省略する。

【０００３】

【発明が解決しようとする課題】前記従来法では、適応
コードブックにおいて、サブフレーム毎に遅延パラメー
タを求めて独立に伝送していた。例えば、音声の場合、
遅延は１６−１４０サンプルの範囲に存在するが、ピッ
チ周期の短い女性音などで十分な精度を得るためには、
遅延を整数サンプルきざみではなく、小数サンプルきざ
みとする必要がある。このため、遅延を表すのにサブフ
レーム当たり最低８ビット必要であり、１フレームに４
サブフレーム収容されるとすればフレーム当たりで３２
ビット必要であった。これはフレーム長を４０ｍｓとし
た場合、１秒当たりの伝送量にして、１．６ｋｂ／ｓで
あった。

【０００４】このため、音声信号を４ｋｂ／ｓ以下で良
好に送ろうとした場合、遅延の伝送に必要な情報を低減
する必要があった。しかしながら、単純にサブフレーム
当たりのビット数を低減したのでは、ピッチ変化範囲が
狭まったり、精度が不十分になったりして音質が大幅に
劣化するという問題があった。

【０００５】本発明は、上述の問題を解決し、少ないビ
ット数で遅延の伝送を可能とするので、音声信号を４ｋ
ｂ／ｓ以下で良好に符号化することが可能となる。

【０００６】

【課題を解決するための手段】第１の発明によれば、音
声信号を予め定めたフレーム単位に区切るフレーム分割
部(110)と、前記音声信号からスペクトルパラメータを
求め量子化符号を出力するスペクトルパラメータ計算部
(200,210,211)と、スペクトルパラメータ計算部の出力
にもとづき遅延分過去の音源信号を切り出してピッチ予
測を行ない遅延を表す符号を出力する適応コードブック
部(500)とスペクトルパラメータ計算部の出力にもとづ
き音源信号を量子化し量子化符号を出力する音源量子化
部(350,351）と前記符号を多重化して送出するマルチプ
レクサ(400)を有する音声符号化装置において、前記適
応コードブックで求めた遅延を符号化する際に、過去の
差分量子化値(540)と予測係数(525)を用いて遅延値を予
測し(520)、予測した値と前記遅延との差分値を量子化
(530)し差分量子化符号を出力する適応コードブック部
(500)を有することを特徴とする音声符号化装置が得ら
れる。

【０００７】第２の発明によれば、音声信号を予め定め
たフレーム単位に区切るフレーム分割部(110)と、前記
音声信号からスペクトルパラメータを求め量子化符号を
出力するスペクトルパラメータ計算部(200,210,211)
と、スペクトルパラメータ計算部の出力にもとづき遅延
分過去の音源信号を切り出してピッチ予測を行ない遅延
を表す符号を出力する適応コードブック部(600)とスペ
クトルパラメータ計算部の出力にもとづき音源信号を量
子化し量子化符号を出力する音源量子化部(350,351)と
前記符号を多重化して送出するマルチプレクサ(400)を
有する音声符号化装置において、前記適応コードブッ
クで求めた遅延を符号化する際に、過去の差分量子化値
(540)と予測係数(525)を用いて遅延値を予測し(520)、
予測した値と前記遅延との差分値を求め、前記差分値を
もとに前記差分値を量子化するかあるいは予測をせずに
前記遅延値をそのまま量子化するかを判別(610)する適
応コードブック部(600)を有することを特徴とする音声
符号化装置が得られる。

【０００８】第３の発明によれば、音声信号を予め定め
たフレーム単位に区切るフレーム分割部(110)と、前記
音声信号から特徴量を計算しモード判別を行なうモード
判別部(700)と、前記音声信号からスペクトルパラメー
タを求め量子化符号を出力するスペクトルパラメータ計
算部(200,210,211)と、スペクトルパラメータ計算部の
出力にもとづき遅延分過去の音源信号を切り出してピッ
チ予測を行ない遅延を表す符号を出力する適応コードブ
ック部(800)とスペクトルパラメータ計算部の出力にも
とづき音源信号を量子化し量子化符号を出力する音源量
子化部(350,351)と前記符号を多重化して送出するマル
チプレクサ(400)を有する音声符号化装置において、
前記適応コードブックで求めた遅延を符号化する際に、
過去の差分量子化値(540)と予測係数(525)を用いて遅延
値を予測し(520)、予測した値と前記遅延との差分値を
量子化し(530)、差分量子化値を出力する適応コードブ
ック部(800)を有することを特徴とする音声符号化装置
が得られる。

【０００９】第４の発明によれば、音声信号を予め定め
たフレーム単位に区切るフレーム分割部(110)と、前記
音声信号から特徴量を計算しモード判別を行なうモード
判別部(700)と、前記音声信号からスペクトルパラメー
タを求め量子化符号を出力するスペクトルパラメータ計
算部(200,210,211)と、スペクトルパラメータ計算部の
出力にもとづき遅延分過去の音源信号を切り出してピッ
チ予測を行ない遅延を表す符号を出力する適応コードブ
ック部(900)とスペクトルパラメータ計算部の出力にも
とづき音源信号を量子化し量子化符号を出力する音源量
子化部(350,351)と前記符号を多重化して送出するマル
チプレクサ(400)を有する音声符号化装置において、
前記適応コードブックで求めた遅延を符号化する際に、
過去の差分量子化値(540)と予測係数(525)を用いて遅延
値を予測し(520)、予測した値と前記遅延との差分値を
求め、前記差分値をもとに前記差分値を量子化(530)す
るかあるいは予測をせずに前記遅延値をそのまま量子化
するかを判別(910)する適応コードブック部(900)を有す
ることを特徴とする音声符号化装置が得られる。

【００１０】

【実施例】図１は第１の発明による音声符号化装置の一
実施例を示すブロック図である。

【００１１】図において、入力端子１００から音声信号
を入力し、フレーム分割回路１１０では音声信号をフレ
ーム（例えば４０ｍｓ）毎に分割し、サブフレーム分割
回路１２０では、フレームの音声信号をフレームよりも
短いサブフレーム（例えば８ｍｓ）に分割する。

【００１２】スペクトルパラメータ計算回路２００で
は、少なくとも一つのサブフレームの音声信号に対し
て、サブフレーム長よりも長い窓（例えば２４ｍｓ）を
かけて音声を切り出してスペクトルパラメータを予め定
められた次数（例えばＰ＝１０次）を計算する。ここで
スペクトルパラメータの計算には、周知のＬＰＣ分析
や、Ｂｕｒｇ分析等を用いることができる。ここでは、
Ｂｕｒｇ分析を用いることとする。Ｂｕｒｇ分析の詳細
については、中溝著による“信号解析とシステム同定”
と題した単行本（コロナ社１９８８年刊）の８２〜８７
頁（文献３）等に記載されているので説明は省略する。
さらにスペクトルパラメータ計算部では、Ｂｕｒｇ法に
より計算された線形予測係数α_i（ｉ＝１，…，１０）
を量子化や補間に適したＬＳＰパラメータに変換する。
ここで、線形予測係数からＬＳＰへの変換は、菅村他に
よる“線スペクトル対（ＬＳＰ）音声分析合成方式によ
る音声情報圧縮”と題した論文（電子通信学会論文誌、
Ｊ６４−Ａ、ｐｐ．５９９−６０６、１９８１年）（文
献４）を参照することができる。例えば、第１、３、５
サブフレームでＢｕｒｇ法により求めた線形予測係数
を、ＬＳＰパラメータに変換し、第２、４サブフレーム
のＬＳＰを直線補間により求めて、第２、４サブフレー
ムのＬＳＰを逆変換して線形予測係数に戻し、第１−５
サブフレームの線形予測係数α_il（ｉ＝１，…，１０，
ｌ＝１，…，５）を聴感重み付け回路２３０に出力す
る。また、第５サブフレームのＬＳＰをスペクトルパラ
メータ量子化回路２１０へ出力する。

【００１３】スペクトルパラメータ量子化回路２１０で
は、あらかじめ定められたサブフレームのＬＳＰパラメ
ータを効率的に量子化する。以下では、量子化法とし
て、ベクトル量子化を用いるものとし、第５サブフレー
ムのＬＳＰパラメータを量子化するものとする。ＬＳＰ
パラメータのベクトル量子化の手法は周知の手法を用い
ることができる。具体的な方法は例えば、特開平４−１
７１５００号公報（特願平２−２９７６００号）（文献
５）や特開平４−３６３０００号公報（特願平３−２６
１９２５号）（文献６）や、特開平５−６１９９号公報
（特願平３−１５５０４９号）（文献７）や、Ｔ．Ｎｏ
ｍｕｒａｅｔａｌ．，による“ＬＳＰＣｏｄｉｎｇ
ＵｓｉｎｇＶＱ−ＳＶＱＷｉｔｈＩｎｔｅｒｐ
ｏｌａｔｉｏｎｉｎ４．０７５ｋｂｐｓＭ−ＬＣ
ＥＬＰＳｐｅｅｃｈＣｏｄｅｒ”と題した論文（Ｐ
ｒｏｃ．ＭｏｂｉｌｅＭｕｌｔｉｍｅｄｉａＣｏｍ
ｍｕｎｉｃａｔｉｏｎｓ，ｐｐ．Ｂ．２．５，１９９
３）（文献８）等を参照できるのでここでは説明は省略
する。

【００１４】また、スペクトルパラメータ量子化回路２
１０では、第５サブフレームで量子化したＬＳＰパラメ
ータをもとに、第１〜第４サブフレームのＬＳＰパラメ
ータを復元する。ここでは、現フレームの第５サブフレ
ームの量子化ＬＳＰパラメータと１つ過去のフレームの
第５サブフレームの量子化ＬＳＰを直線補間して、第１
〜第４サブフレームのＬＳＰを復元する。ここで、量子
化前のＬＳＰと量子化後のＬＳＰとの誤差電力を最小化
するコードベクトルを１種類選択した後に、直線補間に
より第１〜第４サブフレームのＬＳＰを復元できる。さ
らに性能を向上させるためには、前記誤差電力を最小化
するコードベクトルを複数候補選択したのちに、各々の
候補について、累積歪を評価し、累積歪を最小化する候
補と補間ＬＳＰの組を選択するようにすることができ
る。詳細は、例えば、特願平５−８７３７号明細書（文
献９）を参照することができる。

【００１５】以上により復元した第１−４サブフレーム
のＬＳＰと第５サブフレームの量子化ＬＳＰをサブフレ
ーム毎に線形予測係数α′_il（ｉ＝１，…，１０，ｌ＝
１，…，５）に変換し、インパルス応答計算回路３１０
へ出力する。また、第５サブフレームの量子化ＬＳＰの
コードベクトルを表すインデクスをマルチプレクサ４０
０に出力する。

【００１６】上記において、直線補間のかわりに、ＬＳ
Ｐの補間パターンを予め定められたビット数（例えば２
ビット）分用意しておき、これらのパターンの各々に対
して１〜４サブフレームのＬＳＰを復元して累積歪を最
小化するコードベクトルと補間パターンの組を選択する
ようにしてもよい。このようにすると補間パターンのビ
ット数だけ伝送情報が増加するが、ＬＳＰのフレーム内
での時間的な変化をより精密に表すことができる。ここ
で、補間パターンは、トレーニング用のＬＳＰデータを
用いて予め学習して作成してもよいし、予め定められた
パターンを格納しておいてもよい。予め定められたパタ
ーンとしては、例えば、Ｔ．Ｔａｎｉｇｕｃｈｉｅｔ
ａｌによる“ＩｍｐｒｏｖｅｄＣＥＬＰｓｐｅｅ
ｃｈｃｏｄｉｎｇａｔ４ｋｂ／ｓａｎｄｂｅ
ｌｏｗ”と題した論文（Ｐｒｏｃ．ＩＣＳＬＰ，ｐｐ．
４１−４４，１９９２）（文献１０）等に記載のパター
ンを用いることができる。また、さらに性能を改善する
ためには、補間パターンを選択した後に、予め定められ
たサブフレームにおいて、ＬＳＰの真の値とＬＳＰの補
間値との誤差信号を求め、前記誤差信号をさらに誤差コ
ードブックで表すようにしてもよい。

【００１７】聴感重み付け回路２３０は、スペクトルパ
ラメータ計算回路２００から、各サブフレーム毎に量子
化前の線形予測係数α_il（ｉ＝１，…，１０，ｌ＝１，
…，５）を入力し、前記文献１にもとづき、サブフレー
ムの音声信号に対して聴感重み付けを行い、聴感重み付
け信号ｘ_w（ｎ）を出力する。

【００１８】応答信号計算回路２４０は、スペクトルパ
ラメータ計算回路２００から、各サブフレーム毎に線形
予測係数α_ilを入力し、スペクトルパラメータ量子化回
路２１０から、量子化、補間して復元した線形予測係数
α′_ilをサブフレーム毎に入力し、保存されているフィ
ルタメモリの値を用いて、入力信号ｄ（ｎ）＝０とした
応答信号を１サブフレーム分計算し、減算器２３５へ出
力する。ここで、応答信号ｘ_z（ｎ）は下式で表され
る。

【００１９】

【数１】

【００２０】ここで、γは、聴感重み付け量を制御する
重み係数であり、下記の式（３）と同一の値である。

【００２１】減算器２３５は、下式により、聴感重み付
け信号から応答信号を１サブフレーム分減算し、ｘ′_w
（ｎ）を適応コードブック回路５００へ出力する。

【００２２】ｘ′_w（ｎ）＝ｘ_w（ｎ）−ｘ_z（ｎ）（２）インパルス応答計算回路３１０は、ｚ変換が下式で表さ
れる重み付けフィルタのインパルス応答ｈ_w（ｎ）を予
め定められた点数Ｌだけ計算し、適応コードブック回路
３００、音源量子化回路３５０へ出力する。

【００２３】

【数２】

【００２４】適応コードブック回路５００の構成を図２
に示す。図２において、遅延計算部５１０では、端子５
０１、５０２、５０３の各々から、過去の音源信号ｖ
（ｎ）、減算器２３５の出力信号ｘ’_w（ｎ）、インパ
ルス応答ｈ_w(ｎ）を入力し、適応コードブックの遅延
Ｔを下式を最小化するように求める。なお、遅延Ｔの時
間長は音声信号のピッチ周期に対応する。

【００２５】

【数３】

【００２６】ここで、ｙ_w（ｎ−Ｔ）＝ｖ（ｎ−Ｔ）＊ｈ_w（ｎ）（５）であり、記号＊は畳み込み演算を表す。

【００２７】ゲインβを下式に従い求める。

【００２８】

【数４】

【００２９】ここで、女性音や子供の声に対して、遅延
の抽出精度を向上させるために、遅延を整数サンプルで
はなく、小数サンプル値で求めてもよい。具体的な方法
は、例えば、Ｐ．Ｋｒｏｏｎらによる、“Ｐｉｔｃｈ
ｐｒｅｄｉｃｔｏｒｓｗｉｔｈｈｉｇｈｔｅｍｐ
ｏｒａｌｒｅｓｏｌｕｔｉｏｎ”と題した論文（Ｐｒ
ｏｃ．ＩＣＡＳＳＰ，ｐｐ．６６１−６６４，１９９０
年）（文献１１）等を参照することができる。

【００３０】遅延予測部５２０では、遅延Ｔを入力し、
さらに、サブフレーム遅延部５４０から過去のサブフレ
ームの遅延の差分量子化値を、予測係数コードブック５
２５から予測係数を入力して、現在のサブフレームの遅
延をＭＡ（ＭｏｖｉｎｇＡｖｅｒａｇｅ）予測する。
一例として過去の一つのサブフレームの量子化値を予測
に用いる場合について下式に示す。

【００３１】Ｔ_h＝ηｅ_h ^l-1 （７）ここで、ηは予測係数コードブックに格納された固定の
予測係数である。差分量子化部５３０では、下式に従い
差分を計算する。

【００３２】ｅ^l＝Ｔ−Ｔ_h （８）差分値ｅ^lを予め定められた量子化ビット数で表して量
子化し、量子化値ｅ_h ^lを求め、遅延復元部５５０へ出
力する。量子化値ｅ_h ^lはサブフレーム遅延部５４０へ
出力する。また、量子化値ｅ_h ^lを表すインデクスを端
子５０５から出力する。

【００３３】遅延復元部５５０では、下式に従い、遅延
Ｔ′を復元し出力する。

【００３４】Ｔ′＝Ｔ_h＋ｅ_h ^l （９）また、ピッチ予測部５６０では、下式に従いピッチ予測
を行い、適応コードブック予測算差信号ｚ（ｎ）を端子
５０４から出力する。

【００３５】ｚ（ｎ）＝ｘ′_w（ｎ）−βｖ（ｎ−Ｔ′）＊ｈ_w（ｎ）（１０）以上で適応コードブック回路５００の説明を終える。

【００３６】音源量子化回路３５０では、音源コードブ
ックを探索する例について示す。音源コードブック３５
１に格納されているコードベクトルを探索することによ
り、音源信号を量子化する。音源コードベクトルの探索
は、式を最小化するように、最良の音源コードベクトル
ｃ_j（ｎ）を選択する。このとき、最良のコードベクト
ルを１種選択してもよいし、２種以上のコードベクトル
を選んでおいて、ゲイン量子化の際に、１種に本選択し
てもよい。ここでは、２種以上のコードベクトルを選ん
でおくものとする。

【００３７】

【数５】

【００３８】なお、一部の音源コードベクトルに対して
のみ、下式を適用するときには、複数個の音源コードベ
クトルをあらかじめ予備選択しておき、予備選択された
音源コードベクトルに対して、下式を適用することもで
きる。

【００３９】ゲイン量子化回路３６５は、ゲインコード
ブック３５５からゲインコードベクトルを読みだし、選
択された音源コードベクトルに対して、下式を最小化す
るように、音源コードベクトルとゲインコードベクトル
の組み合わせを選択する。

【００４０】

【数６】

【００４１】ここで、β′_k、γ′_kは、ゲインコード
ブック３５５に格納された２次元ゲインコードブックに
おけるｋ番目のコードベクトルである。選択された音源
コードベクトルとゲインコードベクトルを表すインデク
スをマルチプレクサ４００に出力する。

【００４２】重み付け信号計算回路３６０は、スペクト
ルパラメータ計算回路の出力パラメータ及び、それぞれ
のインデクスを入力し、インデクスからそれに対応する
コードベクトルを読みだし、まず下式にもとづき駆動音
源信号ｖ（ｎ）を求める。

【００４３】ｖ（ｎ）＝β′_kｖ（ｎ−Ｔ）＋γ′_kｃ_j（ｎ）（１３）次に、スペクトルパラメータ計算回路２００の出力パラ
メータ、スペクトルパラメータ量子化回路２１０の出力
パラメータを用いて下式により、応答信号ｓ_w（ｎ）を
サブフレーム毎に計算し、応答信号計算回路２４０へ出
力する。

【００４４】

【数７】

【００４５】以上により、第１の発明に対応する実施例
の説明を終える。

【００４６】第２の発明の一実施例を示すブロック図を
図３に示す。第２の発明では、第１の発明と適応コード
ブック回路６００の動作が異なるので、適応コードブッ
ク回路６００の動作を図４を用いて説明する。なお、図
４において、図２と同一の番号を付した構成要素は、図
２と同一の動作を行なうので説明は省略する。

【００４７】判別部６１０は、遅延予測部５２０の出力
である遅延予測値Ｔ_hと、遅延計算部５１０から現サブ
フレームの遅延Ｔを入力し、下式により誤差を求める。

【００４８】ｅ^l＝Ｔ−Ｔ_h （１５）誤差ｅ^lの例えば絶対値を予め定められたしきい値と比
較し、しきい値よりも小さい時は、予測を用い、しきい
値よりも大きいときは予測しないという予測判別信号を
求め、スイッチ６２０₁，６２０₂と端子５０６に出力
する。

【００４９】スイッチ６２０₁は、予測判別信号を入力
し、予測なしのときはスイッチを上側に倒し、予測あり
のときは下側に倒すことにより、予測なしのときは、遅
延計算部５１０からの出力であるＴを、予測ありのとき
は遅延復元部５５０からの出力であるＴ′をピッチ予測
部５６０に出力する。スイッチ６２０₂は、予測判別信
号を入力し、予測なしのときは遅延Ｔに対応するインデ
クスを、予測ありのときは、差分量子化のインデクスを
端子５０５に出力する。

【００５０】以上で説明を終える。

【００５１】図５は第３の発明の一実施例を示すブロッ
ク図である。図において、図１と同一の番号を付した構
成要素は、図１と同一の動作を行なうので、説明は省略
する。図５において、モード判別回路７００は、聴感重
み付け回路２３０からフレーム単位で聴感重み付け信号
を受取り、モード判別情報を出力する。ここでは、モー
ド判別に、現在のフレームの特徴量を用いる。特徴量と
しては、例えばピッチ予測ゲインを用いる。ピッチ予測
ゲインの計算は、例えば下式を用いる。

【００５２】

【数８】

【００５３】ここで、Ｔは予測ゲインを最大化する最適
遅延である。

【００５４】ピッチ予測ゲインをあらかじめ定められた
複数個のしきい値と比較して複数種類のモードに分類す
る。モードの個数としては、例えば４を用いることがで
きる。

【００５５】モード判別回路７００は、モード判別情報
を適応コードブック回路８００へ出力する。

【００５６】適応コードブック回路８００の構成を図６
に示す。図において、図２、４と同一の番号を付した構
成要素は、図２、４と同一の働きをするので説明は省略
する。図６において、スイッチ８２０₁、８２０₂は、
端子８０１からモード判別情報を入力し、モードに応じ
て、遅延の予測あり／なしを切替える。

【００５７】また、モード情報に応じて、ピッチ予測部
８６０の動作を変える。例えば、予め定められたモード
のみ（例えばモード０）、適応コードブック回路を使用
しないようにすることもできる。このようにするには、
ピッチ予測部８６０の演算において、（９）式を実行す
るときに、ゲインβを０として実行すれば良い。

【００５８】図７は第４の発明の一実施例を示すブロッ
ク図である。図において、図１、３、５と同一の番号を
付した構成要素は、同一の動作を行なうので、説明は省
略する。図７では、適応コードブック回路９００の動作
が異なるので、この構成を図８に示す。図８において、
図４、６と同一の番号を付した構成要素は、同一の動作
を行なうので、説明は省略する。図８において、端子９
０１からモード情報を入力し、判別部９１０へ出力す
る。判別部９１０では、予め定められたモードについて
予測残差の判別を行ない、予測あり／なしの判別信号を
スイッチ６２０₁、６２０₂に出力する。あらかじめ定
められたモード以外では、予測なしとしておく。

【００５９】以上で本発明の実施例の説明を終える。

【００６０】上述した実施例に限らず、種々の変形が可
能である。

【００６１】適応コードブック回路において、遅延予測
部５２０では、過去の複数フレームの差分量子化値から
遅延を予測する高次予測としてもよい。予測の次数をＬ
とすると、予測式は下式を使用する。

【００６２】

【数９】

【００６３】また、予測係数コードブックは、モード毎
に切替えてもよい。

【００６４】音源量子化回路の音源コードブックの構成
としては、他の周知な構成、例えば、多段構成や、スパ
ース構成などを用いることができる。

【００６５】モード判別情報を用いて音源量子化回路に
おける音源コードブックを切替える構成とすることもで
きる。

【００６６】音源量子化回路では、音源コードブックを
探索する例について示したが、複数個の位置と振幅の異
なるマルチパルスを探索するようにしてもよい。ここ
で、マルチパルスの振幅と位置は、下式を最小化するよ
うに行なう。

【００６７】

【数１０】

【００６８】ここで、ｇ_j，ｍ_jはそれぞれ、ｊ番目の
マルチパルスの振幅、位置を示す。ｋはマルチパルスの
個数である。

【００６９】

【発明の効果】以上説明したように、本発明によれば、
音声符号化装置において、遅延を過去の差分量子化値を
用いて予測することにより、遅延を表すのに必要なビッ
ト数をサブフレーム当たり例えば８ビットから５ビット
程度に低減化することができる。これは、１秒当たりの
遅延伝送量にすると、１．６ｋｂ／ｓから１ｋｂ／ｓに
低減化できるので、音声全体の符号化速度を４ｋｂ／ｓ
以下に低減化することが容易となり、低減化しても従来
よりも良好な音質が得られるという効果がある。

【図面の簡単な説明】

【図１】第１の発明の実施例を示す図。

【図２】適応コードブック回路５００の構成を示す図。

【図３】第２の発明の実施例を示す図。

【図４】適応コードブック回路６００の構成を示す図。

【図５】第３の発明の実施例を示す図。

【図６】適応コードブック回路８００の構成を示す図。

【図７】第４の発明の実施例を示す図。

【図８】適応コードブック回路９００の構成を示す図。

【符号の説明】

１１０フレーム分割回路１２０サブフレーム分割回路２００スペクトルパラメータ計算回路２１０スペクトルパラメータ量子化回路２１１ＬＳＰコードブック２３０重み付け回路２３５減算回路２４０応答信号計算回路５００，６００，８００，９００適応コードブック回
路３１０インパルス応答計算回路３５０音源量子化回路３５１音源コードブック３５５ゲインコードブック３６０重み付け信号計算回路３６５ゲイン量子化回路４００マルチプレクサ５１０遅延計算部５２０遅延予測部５２５予測係数コードブック５３０差分量子化部５４０サブフレーム遅延部５５０遅延復元部５６０，８６０ピッチ予測部６２０₁，６２０₂，８２０₁，８２０₂ スイッチ回
路７００モード判別回路

Claims

(57)【特許請求の範囲】

【請求項１】フレーム分割部（１１０）、スペクトルパ
ラメータ計算部（２００）、適応コードブック部（５０
０）、音源信号算出部（３５０，３５１，３５５，３６
５）、応答信号作成部（２４０）、マルチプレクサ（４
００）を備える音声符号化装置において、フレーム分割部（１１０）は、入力される音声信号をフ
レーム音声信号に分割し、スペクトルパラメータ計算部（２００）は、フレーム音
声信号からスペクトルパラメータを算出し、適応コードブック部（５００）は、遅延計算部（５１
０）、遅延予測部（５２０）、予測係数コードブック
（５２５）、差分量子化部（５３０）、遅延部（５４
０）、遅延復元部（５５０）、ピッチ予測部（５６
０）、を備えると共に、音源信号、フレーム音声信号か
ら応答信号を減算した信号である差分信号と、スペクト
ルパラメータを入力し、予測残差信号、差分量子化値を
出力し、遅延計算部（５１０）は、音源信号、差分信号、スペク
トルパラメータに基づいて遅延値（Ｔ）、ゲイン（β）
を計算し、遅延予測部（５２０）は、この遅延値、遅延部の出力、
予測係数コードブック（５２５）の記憶する予測係数に
基づいて予測遅延値を計算し、差分量子化部（５３０）は、遅延値と予測遅延値の差分
値を量子化し差分量子化符号をマルチプレクサに出力
し、遅延部は、この量子化された差分値に所定の遅延を付与
して遅延予測部に供給し、遅延復元部（５５０）は、予測遅延値と差分値に基づい
て復元遅延値を算出し、ピッチ予測部は、復元遅延値、差分信号、スペクトルパ
ラメータ、ゲイン（β）に基づいて予測残差信号を出力
し、音源信号算出部は、予測残差信号、スペクトルパラメー
タに基づいて音源信号を算出し、マルチプレクサに出力
し応答信号作成部は、音源信号、スペクトルパラメータ
に基づいて前記応答信号を生成する音声符号化装置。
【請求項２】フレーム分割部（１１０）、スペクトルパ
ラメータ計算部（２００）、適応コードブック部（６０
０）、音源信号算出部（３５０，３５１，３５５，３６
５）、応答信号作成部（２４０）、マルチプレクサ（４
００）を備える音声符号化装置において、フレーム分割部（１１０）は、入力される音声信号をフ
レーム音声信号に分割し、スペクトルパラメータ計算部（２００）は、フレーム音
声信号からスペクトルパラメータを算出し、適応コードブック部（５００）は、遅延計算部（５１
０）、遅延予測部（５２０）、予測係数コードブック
（５２５）、差分量子化部（５３０）、遅延部（５４
０）、遅延復元部（５５０）、ピッチ予測部（５６
０）、判別部（６１０）、第１スイッチ（６２０ _１）、
第２スイッチ（６２０ _２）を備えると共に、音源信号、
フレーム音声信号から応答信号を減算した信号である差
分信号と、スペクトルパラメータを入力し、予測残差信
号、差分量子化値を出力し、遅延計算部（５１０）は、音源信号、差分信号、スペク
トルパラメータに基づいて遅延値（Ｔ）、ゲイン（β）
を計算して、遅延値（Ｔ）を遅延予測部と第１スイッチ
の第１の入力に供給し、遅延予測部（５２０）は、この遅延値（Ｔ）、遅延部の
出力、予測係数コードブック（５２５）の記憶する予測
係数に基づいて予測遅延値（Ｔｈ）を計算し、差分量子化部（５３０）は、遅延値と予測遅延値の差分
値を量子化し差分量子化符号を第２のスイッチの第２の
入力に供給し、遅延部は、この量子化された差分値に所定の遅延を付与
して遅延予測部に供給し、遅延復元部（５５０）は、予測遅延値と差分値に基づい
て復元遅延値を算出して、第１スイッチの第２の入力に
供給し、判別部（６１０）は、遅延計算部出力の遅延値Ｔと遅延
予測部出力の遅延予測値（Ｔｈ）との差（｜Ｔ−Ｔｈ
｜）が閾値より大であるか否かを判定し、第１のスイッチ（６２０ _１）は、判別部出力が、｜Ｔ−
Ｔｈ｜が閾値より大であることを示しているときはその
第１の入力を出力し、そうでない場合にはその第２の入
力を出力し、第２のスイッチ（６２０ _２）は、判別部出力が、｜Ｔ−
Ｔｈ｜が閾値より大であることを示しているときはその
第１の入力を出力し、そうでない場合にはその第２の入
力を出力し、ピッチ予測部は、第１のスイッチ出力、差分信号、スペ
クトルパラメータ、ゲイン（β）に基づいて予測残差信
号を出力し、音源信号算出部は、予測残差信号、スペクトルパラメー
タに基づいて音源信号を算出し、マルチプレクサに出力
し応答信号作成部は、音源信号、スペクトルパラメータ
に基づいて前記応答信号を生成する音声符号化装置。
【請求項３】フレーム分割部（１１０）、スペクトルパ
ラメータ計算部（２００）、適応コードブック部（８０
０）、音源信号算出部（３５０，３５１，３５５，３６
５）、応答信号作成部（３６０，２４０）、マルチプレ
クサ（４００）、モード判別回路（７００）を備える音
声符号化装置において、フレーム分割部（１１０）は、入力される音声信号をフ
レーム音声信号に分割し、スペクトルパラメータ計算部（２００）は、フレーム音
声信号からスペクトルパラメータを算出し、判別回路（７００）は、フレーム音声信号の性質を示す
モード信号を生成し、マルチプレクサ及び適応コードブ
ック部に出力し、適応コードブック部（５００）は、遅延計算部（５１
０）、遅延予測部（５２０）、予測係数コードブック
（５２５）、差分量子化部（５３０）、遅延部（５４
０）、遅延復元部（５５０）、ピッチ予測部（５６
０）、第１スイッチ（６２０ _１）、第２スイッチ（６２
０ _２）を備えると共に、音源信号、フレーム音声信号か
ら応答信号を減算した信号である差分信号と、スペクト
ルパラメータとモード信号を入力し、予測残差信号、差
分量子化値を出力し、遅延計算部（５１０）は、音源信号、差分信号、スペク
トルパラメータに基づいて遅延値（Ｔ）、ゲイン（β）
を計算して、遅延値（Ｔ）を遅延予測部と第１スイッチ
の第１の入力に供給し、遅延予測部（５２０）は、この遅延値（Ｔ）、遅延部の
出力、予測係数コードブック（５２５）の記憶する予測
係数に基づいて予測遅延値（Ｔｈ）を計算し、差分量子化部（５３０）は、遅延値と予測遅延値の差分
値を量子化し差分量子化符号を第２のスイッチの第２の
入力に供給し、遅延部は、この量子化された差分値に所定の遅延を付与
して遅延予測部に供給し、遅延復元部（５５０）は、予測遅延値と差分値に基づい
て復元遅延値を算出して、第１スイッチの第２の入力に
供給し、第１のスイッチ（６２０ _１）は、モード信号に応じてそ
の第１の入力または第２の入力を選択出力し、第２のスイッチ（６２０ _２）は、モード信号に応じてそ
の第１の入力または第２の入力を選択出力し、ピッチ予測部は、第１のスイッチ出力、差分信号、スペ
クトルパラメータ、ゲイン（β）に基づいて予測残差信
号を出力し、音源信号算出部（３５０，３５１，３５５，３６５）
は、予測残差信号、スペクトルパラメータに基づいて音
源信号を算出し、マルチプレクサに出力し応答信号作成
部（２４０，３６０）は、音源信号、スペクトルパラメ
ータに基づいて前記応答信号を生成する音声符号化装
置。
【請求項４】フレーム分割部（１１０）、スペクトルパ
ラメータ計算部（２００）、適応コードブック部（８０
０）、音源信号算出部（３５０，３５１，３５５，３６
５）、応答信号作成部（３６０，２４０）、マルチプレ
クサ（４００）、モード判別回路（７００）を備える音
声符号化装置において、フレーム分割部（１１０）は、入力される音声信号をフ
レーム音声信号に分割し、スペクトルパラメータ計算部（２００）は、フレーム音
声信号からスペクトルパラメータを算出し、モード判別回路（７００）は、フレーム音声信号の性質
を示すモード信号を生成し、マルチプレクサ及び適応コ
ードブック部に出力し、適応コードブック部（５００）は、遅延計算部（５１
０）、遅延予測部（５２０）、予測係数コードブック
（５２５）、差分量子化部（５３０）、遅延部（５４
０）、遅延復元部（５５０）、ピッチ予測部（５６
０）、判別部（９１０）、第１スイッチ（６２０ _１）、
第２スイッチ（６２０ _２）を備えると共に、音源信号、
フレーム音声信号と応答信号との差である差分信号と、
スペクトルパラメータとモード信号を入力し、予測残差
信号、差分量子化値を出力し、遅延計算部（５１０）は、音源信号、差分信号、スペク
トルパラメータに基づいて遅延値（Ｔ）、ゲイン（β）
を計算して、遅延値（Ｔ）を遅延予測部と第１スイッチ
の第１の入力に供給し、遅延予測部（５２０）は、この遅延値（Ｔ）、遅延部の
出力、予測係数コードブック（５２５）の記憶する予測
係数に基づいて予測遅延値（Ｔｈ）を計算し、判別部（９１０）は、モード信号を受け、予め定められ
たモードにおいて、遅延値（Ｔ）と遅延予測値（Ｔｈ）
差が閾値以下の場合にのみ「予測あり」を示す信号を送
出し、それ以外の場合には、「予測なし」を示す信号を
出力し、差分量子化部（５３０）は、遅延値と予測遅延値の差分
値を量子化し差分量子化符号を第２のスイッチの第２の
入力に供給し、遅延部は、この量子化された差分値に所定の遅延を付与
して遅延予測部に供給し、遅延復元部（５５０）は、予測遅延値と差分値に基づい
て復元遅延値を算出して、第１スイッチの第２の入力に
供給し、第１のスイッチ（６２０ _１）は、判別部出力が「予測あ
り」を示しているときはその第２の入力を選択出力し、
そうでない場合には、第１の入力を選択出力し、第２のスイッチ（６２０ _２）は、判別部出力「予測あ
り」を示しているときはその第２の入力を選択出力し、
そうでない場合には、第１の入力を選択出力し、ピッチ予測部は、第１のスイッチ出力、差分信号、スペ
クトルパラメータ、ゲイン（β）に基づいて予測残差信
号を出力し、音源信号算出部（３５０，３５１，３５５，３６５）
は、予測残差信号、スペクトルパラメータに基づいて音
源信号を算出し、マルチプレクサに出力し応答信号作成
部（２４０，３６０）は、音源信号、スペクトルパラメ
ータに基づいて前記応答信号を生成する音声符号化装
置。