JP2004177982A

JP2004177982A - 音声音楽信号の符号化装置および復号装置

Info

Publication number: JP2004177982A
Application number: JP2004027981A
Authority: JP
Inventors: Atsushi Murashima; 淳村島; Kazunori Ozawa; 一範小澤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2004-02-04
Filing date: 2004-02-04
Publication date: 2004-06-24
Anticipated expiration: 2018-06-15
Also published as: JP4293005B2

Abstract

【課題】帯域分割構成の音声音楽信号符号化復号装置において、音声音楽信号を全帯域にわたって良好に符号化する。
【解決手段】第１の差分器（図１の１８０）より出力される差分ベクトルから逆フィルタ（図１の２３０）を用いて残差ベクトルを生成する。帯域選択回路（図１の２５０）は、直交変換された残差ベクトルにおいて、任意の帯域に含まれる成分を用いてｎ個のサブベクトルを生成する。直交変換係数量子化回路（図１の２６０）は、前記ｎ個のサブベクトルを量子化する。
【選択図】図１

Description

本発明は、音声音楽信号を低ビットレートで伝送するための符号化装置および復号装置に関するものである。

音声信号を中低ビットレートで高能率に符号化する方法として、音声信号を線形予測フィルタとその駆動音源信号（音源信号）に分離して符号化する方法が広く用いられている。

その代表的な方法の一つにＣＥＬＰ（Code Excited Linear Prediction）がある。ＣＥＬＰでは、入力音声を線形予測分析して求めた線形予測係数が設定された線形予測フィルタを、音声のピッチ周期を表す信号と雑音的な信号との和で表される音源信号により駆動することで、合成音声信号（再生信号）が得られる。ＣＥＬＰに関してはM. Schroederらによる「Code excited linear prediction:High quality speech at very low bit rates」（Proc. ICASSP, pp.937-940, 1985 ）（非特許文献１）を参照できる。また、前記ＣＥＬＰを帯域分割構成とすることで、音楽信号に対する符号化性能を改善できる。この構成では、各帯域に対応する音源信号を加算して得られる励振信号で、線形予測合成フィルタを駆動することによって、再生信号を生成する。

帯域分割構成のＣＥＬＰに関しては、A. Ubaleらによる「Multi-band CELP Coding of Speech and Music」（IEEE Workshop on Speech Coding for Telec
ommunications, pp.101-102, 1997)（非特許文献２）を参照できる。

図３１は従来の音声音楽信号符号化装置の一例を示すブロック図である。ここでは簡単のため、帯域数を２とする。音声または音楽信号をサンプリングし、この複数サンプルを１フレームとして一つのベクトルにまとめて生成した入力信号（入力ベクトル）は、入力端子１０から入力される。

線形予測係数計算回路１７０は、入力端子１０から入力ベクトルを入力し、前記入力ベクトルに対して線形予測分析を行い、線形予測係数を求め、さらに前記線形予測係数を量子化し、量子化線形予測係数を求める。そして前記線形予測係数を重みづけフィルタ１４０と重みづけフィルタ１４１へ出力し、量子化線形予測係数に対応するインデックスを線形予測合成フィルタ１３０と線形予測合成フィルタ１３１および符号出力回路１９０へ出力する。

第１の音源生成回路１１０は、第１の最小化回路１５０から出力されるインデックスを入力し、前記インデックスに対応する第１の音源ベクトルを、複数個の音源ベクトルが格納されたテーブルより読み出し、第１のゲイン回路１６０へ出力する。

第２の音源生成回路１１１は、第２の最小化回路１５１から出力されるインデックスを入力し、前記インデックスに対応する第２の音源ベクトルを、複数個の音源ベクトルが格納されたテーブルより読み出し、第２のゲイン回路１６１へ出力する。

第１のゲイン回路１６０は、第１の最小化回路１５０から出力されるインデックスと第１の音源生成回路１１０から出力される第１の音源ベクトルとを入力し、前記インデックスに対応する第１のゲインを、ゲインの値が複数個格納されたテーブルより読み出し、前記第１のゲインと前記第１の音源ベクトルとを乗算し、第３の音源ベクトルを生成し、前記第３の音源ベクトルを第１の帯域通過フィルタ１２０へ出力する。

第２のゲイン回路１６１は、第２の最小化回路１５１から出力されるインデックスと第２の音源生成回路１１１から出力される第２の音源ベクトルとを入力し、前記インデックスに対応する第２のゲインを、ゲインの値が複数個格納されたテーブルより読み出し、前記第２のゲインと前記第２の音源ベクトルとを乗算し、第４の音源ベクトルを生成し、前記第４の音源ベクトルを第２の帯域通過フィルタ１２１へ出力する。

第１の帯域通過フィルタ１２０は、第１のゲイン回路１６０から出力される第３の音源ベクトルを入力する。前記第３の音源ベクトルは、このフィルタにより第１の帯域に帯域制限され、第１の励振ベクトルを得る。第１の帯域通過フィルタ１２０は、前記第１の励振ベクトルを線形予測合成フィルタ１３０へ出力する。

第２の帯域通過フィルタ１２１は、第２のゲイン回路１６１から出力される第４の音源ベクトルを入力する。前記第４の音源ベクトルは、このフィルタにより第２の帯域に帯域制限され、第２の励振ベクトルを得る。第２の帯域通過フィルタ１２１は、前記第２の励振ベクトルを線形予測合成フィルタ１３１へ出力する。

線形予測合成フィルタ１３０は、第１の帯域通過フィルタ１２０から出力される第１の励振ベクトルと線形予測係数計算回路１７０から出力される量子化線形予測係数に対応するインデックスとを入力し、前記インデックスに対応する量子化線形予測係数を、量子化線形予測係数が複数個格納されたテーブルより読み出し、この量子化線形予測係数が設定されたフィルタを、前記第１の励振ベクトルにより駆動することで、第１の再生信号（再生ベクトル）を得る。そして前記第１の再生ベクトルを第１の差分器１８０へ出力する。

線形予測合成フィルタ１３１は、第２の帯域通過フィルタ１２１から出力される第２の励振ベクトルと線形予測係数計算回路１７０から出力される量子化線形予測係数に対応するインデックスとを入力し、前記インデックスに対応する量子化線形予測係数を、量子化線形予測係数が複数個格納されたテーブルより読み出し、この量子化線形予測係数が設定されたフィルタを、前記第２の励振ベクトルにより駆動することで、第２の再生ベクトルを得る。そして前記第２の再生ベクトルを第２の差分器１８１へ出力する。

第１の差分器１８０は、入力端子１０を介して入力ベクトルを入力し、線形予測合成フィルタ１３０から出力される第１の再生ベクトルを入力し、それらの差分を計算し、これを第１の差分ベクトルとして、重みづけフィルタ１４０と第２の差分器１８１へ出力する。

第２の差分器１８１は、第１の差分器１８０から第１の差分ベクトルを入力し、線形予測合成フィルタ１３１から出力される第２の再生ベクトルを入力し、それらの差分を計算し、これを第２の差分ベクトルとして、重みづけフィルタ１４１へ出力する。

重みづけフィルタ１４０は、第１の差分器１８０から出力される第１の差分ベクトルと線形予測係数計算回路１７０から出力される線形予測係数を入力し、前記線形予測係数を用いて、人間の聴覚特性に対応した重みづけフィルタを生成し、前記重みづけフィルタを前記第１の差分ベクトルで駆動することで、第１の重
みづけ差分ベクトルを得る。そして前記第１の重みづけ差分ベクトルを第１の最小化回路１５０へ出力する。

重みづけフィルタ１４１は、第２の差分器１８１から出力される第２の差分ベクトルと線形予測係数計算回路１７０から出力される線形予測係数を入力し、前記線形予測係数を用いて、人間の聴覚特性に対応した重みづけフィルタを生成し、前記重みづけフィルタを前記第２の差分ベクトルで駆動することで、第２の重みづけ差分ベクトルを得る。そして前記第２の重みづけ差分ベクトルを第２の最小化回路１５１へ出力する。

第１の最小化回路１５０は、第１の音源生成回路１１０に格納されている第１の音源ベクトル全てに対応するインデックスを、前記第１の音源生成回路１１０へ順次出力し、第１のゲイン回路１６０に格納されている第１のゲイン全てに対応するインデックスを、前記第１のゲイン回路１６０へ順次出力する。また、重みづけフィルタ１４０から出力される第１の重みづけ差分ベクトルを順次入力し、そのノルムを計算し、前記ノルムが最小となるような、前記第１の音源ベクトルおよび前記第１のゲインを選択し、これらに対応するインデックスを符号出力回路１９０へ出力する。

第２の最小化回路１５１は、第２の音源生成回路１１１に格納されている第２の音源ベクトル全てに対応するインデックスを、前記第２の音源生成回路１１１へ順次出力し、第２のゲイン回路１６１に格納されている第２のゲイン全てに対応するインデックスを、前記第２のゲイン回路１６１へ順次出力する。また、重みづけフィルタ１４１から出力される第２の重みづけ差分ベクトルを順次入力し、そのノルムを計算し、前記ノルムが最小となるような、前記第２の音源ベクトルおよび前記第２のゲインを選択し、これらに対応するインデックスを符号出力回路１９０へ出力する。

符号出力回路１９０は、線形予測係数計算回路１７０から出力される量子化線形予測係数に対応するインデックスを入力する。また、第１の最小化回路１５０から出力される、第１の音源ベクトルおよび第１のゲインの各々に対応するインデックスを入力し、第２の最小化回路１５１から出力される、第２の音源ベクトルおよび第２のゲインの各々に対応するインデックスを入力する。そして各インデックスをビット系列の符号に変換し、出力端子２０を介して出力する。

図３２は、従来の音声音楽信号復号装置の一例を示すブロック図である。入力端子３０からビット系列の符号を入力する。

符号入力回路３１０は、入力端子３０から入力したビット系列の符号をインデックスに変換する。第１の音源ベクトルに対応するインデックスは、第１の音源生成回路１１０へ出力される。第２の音源ベクトルに対応するインデックスは、第２の音源生成回路１１１へ出力される。第１のゲインに対応するインデックスは、第１のゲイン回路１６０へ出力される。第２のゲインに対応するインデックスは、第２のゲイン回路１６１へ出力される。量子化線形予測係数に対応するインデックスは、線形予測合成フィルタ１３０および線形予測合成フィルタ１３１へ出力される。

第１の音源生成回路１１０は、符号入力回路３１０から出力されるインデックスを入力し、前記インデックスに対応する第１の音源ベクトルを、複数個の音源ベクトルが格納されたテーブルより読み出し、第１のゲイン回路１６０へ出力する。

第２の音源生成回路１１１は、符号入力回路３１０から出力されるインデックスを入力し、前記インデックスに対応する第２の音源ベクトルを、複数個の音源ベクトルが格納されたテーブルより読み出し、第２のゲイン回路１６１へ出力する。

第１のゲイン回路１６０は、符号入力回路３１０から出力されるインデックスと第１の音源生成回路１１０から出力される第１の音源ベクトルとを入力し、前記インデックスに対応する第１のゲインを、ゲインの値が複数個格納されたテーブルより読み出し、前記第１のゲインと前記第１の音源ベクトルとを乗算し、第３の音源ベクトルを生成し、前記第３の音源ベクトルを第１の帯域通過フィルタ１２０へ出力する。

第２のゲイン回路１６１は、符号入力回路３１０から出力されるインデックスと第２の音源生成回路１１１から出力される第２の音源ベクトルとを入力し、前記インデックスに対応する第２のゲインを、ゲインの値が複数個格納されたテーブルより読み出し、前記第２のゲインと前記第２の音源ベクトルとを乗算し、第４の音源ベクトルを生成し、前記第４の音源ベクトルを第２の帯域通過フィルタ１２１へ出力する。

線形予測合成フィルタ１３０は、第１の帯域通過フィルタ１２０から出力される第１の励振ベクトルと符号入力回路３１０から出力される量子化線形予測係数に対応するインデックスとを入力し、前記インデックスに対応する量子化線形予測係数を、量子化線形予測係数が複数個格納されたテーブルより読み出し、この量子化線形予測係数が設定されたフィルタを、前記第１の励振ベクトルにより駆動することで、第１の再生ベクトルを得る。そして前記第１の再生ベクトルを加算器１８２へ出力する。

線形予測合成フィルタ１３１は、第２の帯域通過フィルタ１２１から出力される第２の励振ベクトルと符号入力回路３１０から出力される量子化線形予測係数に対応するインデックスとを入力し、前記インデックスに対応する量子化線形予測係数を、量子化線形予測係数が複数個格納されたテーブルより読み出し、この量子化線形予測係数が設定されたフィルタを、前記第２の励振ベクトルにより駆動することで、第２の再生ベクトルを得る。そして前記第２の再生ベクトルを加算器１８２へ出力する。

加算器１８２は、線形予測合成フィルタ１３０から出力される第１の再生ベクトルと、線形予測合成フィルタ１３１から出力される第２の再生ベクトルを入力し、これらの和を計算し、これを第３の再生ベクトルとして、出力端子４０を介して、出力する。
Code excited linear prediction:High quality speech at very low bit rates（Proc. ICASSP, pp.937-940, 1985 ） Multi-band CELP Coding of Speech and Music（IEEE Workshop on Speech Coding for Telecommunications, pp.101-102, 1997

問題点は、上述した従来の音声音楽信号符号化装置では、入力信号の低域に対応する帯域特性を有する励振信号と、前記入力信号の高域に対応する帯域特性を有する励振信号とを加算して得られる励振信号により、前記入力信号から求めた線形予測合成フィルタを駆動することで再生信号を生成する構成であることから、高周波数域に属する帯域においてＣＥＬＰに基づく符号化を行うため、高周波数域に属する帯域において符号化性能が低下することにより、全帯域における音声音楽信号の符号化品質が劣化することである。

その理由は、高周波数域に属する帯域における信号は、音声とは大きく異なる性質を有しているため、音声の生成過程をモデル化しているＣＥＬＰでは高周波数域に属する帯域における信号を高精度に生成できないからである。本発明の目的は、上述の問題を解決し、音声音楽信号を全帯域にわたって良好に符号化できる音声音楽信号符号化装置を提供することである。

本発明の第１の装置は、第１の帯域に対応する励振信号により入力信号から求めた線形予測合成フィルタを駆動することで第１の再生信号を生成し、入力信号と前記第１の再生信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第２の帯域に対応する成分を、直交変換後に符号化する。
具体的には、第１の帯域に対応する励振信号により前記線形予測合成フィルタを駆動することで第１の再生信号を生成する手段（図１の１１０、１６０、１２０、１３０）と、入力信号と前記第１の再生信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成する手段（図１の１８０、２３０）と、前記残差信号における第２の帯域に対応する成分を直交変換後に符号化する手段（図１の２４０、２５０、２６０）とを有する。

本発明の第２の装置は、第１と第２の帯域に対応する励振信号により、入力信号から求めた線形予測合成フィルタを駆動することで第１と第２の再生信号を生成し、前記第１と第２の再生信号を加算した信号と前記入力信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第３の帯域に対応する成分を、直交変換後に符号化する。具体的には、第１と第２の帯域に対応する励振信号により前記線形予測合成フィルタを駆動することで第１と第２の再生信号を生成する手段（図８の１００１，１００２）と、前記第１と第２の再生信号を加算した信号と前記入力信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第３の帯域に対応する成分を直交変換後に符号化する手段（図８の１００３）とを有する。

本発明の第３の装置は、第１から第Ｎ−１の帯域に対応する励振信号により、入力信号から求めた線形予測合成フィルタを駆動することで第１から第Ｎ−１の再生信号を生成し、前記第１から第Ｎ−１の再生信号を加算した信号と前記入力信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第Ｎの帯域に対応する成分を、直交変換後に符号化する。具体的には、第１から第Ｎ−１の帯域に対応する励振信号により前記線形予測合成フィルタを駆動することで第１から第Ｎ−１の再生信号を生成する手段（図９の１００１、１００４）と、前記第１から第Ｎ−１の再生信号を加算した信号と前記入力信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第Ｎの帯域に対応する成分を直交変換後に符号化する手段（図９の１００５）とを有する。

本発明の第４の装置は、第２の符号化において、第１の符号化復号信号と入力信号との差分信号により、入力信号から求めた線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する。具体的には、第１の符号化復号信号と入力信号との差分を計算する手段（図１１の１８０）と、入力信号から求めた線形予測合成フィルタの逆フィルタを前記差分信号で駆動することにより残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する手段（図１１の１００２）とを有する。

本発明の第５の装置は、第３の符号化において、第１と第２の符号化復号信号を加算した信号と入力信号との差分信号により、入力信号から求めた線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する。具体的には、第１と第２の符号化復号信号を加算した信号と入力信号との差分信号を計算する手段（図１２の１８０１、１８０２）と、入力信号から求めた線形予測合成フィルタの逆フィルタを前記差分信号で駆動することにより残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する手段（図１２の１００３）とを有する。

本発明の第６の装置は、第Ｎの符号化において、第１から第Ｎ−１の符号化復号信号を加算した信号と入力信号との差分信号により、入力信号から求めた線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する。具体的には、第１から第Ｎ−１の符号化復号信号を加算した信号と入力信号との差分信号を計算する手段（図１３の１８０１、１８０２）と、入力信号から求めた線形予測合成フィルタの逆フィルタを前記差分信号で駆動することにより残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する手段（図１３の１００５）とを有する。

本発明の第７の装置は、入力信号の第１の帯域に対応する励振信号を生成する際にピッチ予測フィルタを用いる。具体的には、ピッチ予測手段（図１４の１１２、１６２、１８４、５１０）を有する。

本発明の第８の装置は、第１のサンプリング周波数でサンプリングされた第１の入力信号を第２のサンプリング周波数にダウンサンプリングして第２の入力信号を生成し、前記第２の入力信号から求めた第１の線形予測係数が設定された合成フィルタを励振信号により駆動することで、第１の再生信号を生成し、前記第１の再生信号を前記第１のサンプリング周波数にアップサンプリングすることにより第２の再生信号を生成し、さらに、前記第１の入力信号から求めた線形予測係数と前記第１の線形予測係数を第１のサンプリング周波数にサンプリング周波数変換して得られる第２の線形予測係数との差分から第３の線形予測係数を計算し、前記第２の線形予測係数と前記第３の線形予測係数との和から第４の線形予測係数を計算し、前記第１の入力信号と前記第２の再生信号との差分信号により前記第４の線形予測係数が設定された逆フィルタを駆動することで残差信号を生成し、前記残差信号における任意の帯域に対応する成分を、直交変換後に符号化する。具体的には、第１のサンプリング周波数でサンプリングされた第１の入力信号を第２のサンプリング周波数にダウンサンプリングして第２の入力信号を生成する手段（図１５の７８０）と、前記第２の入力信号から求めた第１の線形予測係数が設定された合成フィルタを励振信号により駆動することで、第１の再生信号を生成する手段（図１５の７７０、１３２）と、前記第１の再生信号を前記第１のサンプリング周波数にアップサンプリングすることにより第２の再生信号を生成する手段（図１５の７８１）と、前記第１の入力信号から求めた線形予測係数と前記第１の線形予測係数と第１のサンプリング周波数にサンプリング周波数変換して得られる第２の線形予測係数との差分から第３の線形予測係数を計算する手段（図１５の７７１、７７２）と、前記第２の線形予測係数と前記第３の線形予測係数との和から第４の線形予測係数を計算し、前記第１の入力信号と前記第２の再生信号との差分信号により前記第４の線形予測係数が設定された逆フィルタを駆動することで残差信号を生成する手段（図１５の１８０、７３０）と、前記残差信号における任意の帯域に対応する成分を、直交変換後に符号化する手段（図１５の２４０、２５０、２６０）とを有する。

本発明の第９の装置は、復号した直交変換係数を直交逆変換することにより、第２の帯域に対応する励振信号を生成し、前記励振信号により線形予測合成フィルタを駆動することで第２の再生信号を生成し、さらに、復号した第１の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第１の再生信号を生成し、前記第１の再生信号と前記第２の再生信号を加算することで復号音声音楽を生成する。具体的には、復号信号と直交変換係数を直交逆変換することにより、第２の帯域に対応する励振信号を生成する手段（図１６の４４０、４６０）と、線形予測合成フィルタを前記励振信号で駆動することにより第２の再生信号を生成する手段（図１６の１３１）と、第１の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第１の再生信号を生成する手段（図１６の１１０、１２０、１３０、１６０）と、前記第１の再生信号と前記第２の再生信号とを加算することで復号音声音楽を生成する手段（図１６の１８２）とを有する。

本発明の第１０の装置は、復号した直交変換係数を直交逆変換することにより、第３の帯域に対応する励振信号を生成し、前記励振信号により線形予測合成フィルタを駆動することで第３の再生信号を生成し、さらに、復号した第１と第２の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第１と第２の再生信号を生成し、前記第１から第３の再生信号を加算することで復号音声音楽を生成する。具体的には、復号した直交変換係数を直交逆変換することにより、第３の帯域に対応する励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することより第３の再生信号を生成する手段（図２２の１０５３）と、第１と第２の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第１と第２の再生信号を生成する手段（図２２の１０５１、１０５２）と、前記第１から第３の再生信号を加算することで復号音声音楽を生成する手段（図２２の１８２１、１８２２）とを有する。

本発明の第１１の装置は、復号した直交変換係数を直交逆変換することにより、第Ｎの帯域に対応する励振信号を生成し、前記励振信号により線形予測合成フィルタを駆動することで第Ｎの再生信号を生成し、さらに、復号した第１から第Ｎ−１の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第
１から第Ｎｎ−１の再生信号を生成し、前記第１から第Ｎの再生信号を加算することで復号音声音楽を生成する。具体的には、復号した直交変換係数を直交逆変換することにより、第Ｎの帯域に対応する励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することより第Ｎの再生信号を生成する手段（図２３の１０５５）と、第１から第Ｎ−１の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第１から第Ｎ−１の再生信号を生成する手段（図２３の１０５１、１０５４）と、前記第１から第Ｎの再生信号を加算することで復号音声音楽を生成する手段（図２３の１８２１、１８２２）とを有する。

本発明の第１２の装置は、第２の復号において、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成し、前記再生信号と第１の復号信号とを加算することで復号音声音楽を生成する。具体的には、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成する手段（図２４の１０５２）と、前記再生信号と第１の復号信号とを加算することで復号音声音楽を生成する手段（図２４の１８２）とを有する。

本発明の第１３の装置は、第３の復号において、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成し、前記再生信号と第１および第２の復号信号とを加算することで復号音声音楽を生成する。具体的には、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成する手段（図２５の１０５３）と、前記再生信号と第１および第２の復号信号とを加算することで復号音声音楽を生成する手段（図２５の１８２１、１８２２）とを有する。

本発明の第１４の装置は、第Ｎの復号において、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成し、前記再生信号と第１から第Ｎ−１の復号信号とを加算することで復号音声音楽を生成する。具体的には、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成する手段（図２６の１０５５）と、前記再生信号と第１から第Ｎ−１の復号信号とを加算することで復号音声音楽を生成する手段（図２６の１８２１、１８２２）とを有する。

本発明の第１５の装置は、第１の帯域に対応する励振信号を生成する際にピッチ予測フに係るルタを用いる。具体的には、ピッチ予測手段（図２７の１１２、１６２、１８４、５１０）を有する。

本発明の第１６の装置は、第１の帯域に対る第１の励振信号により第１の線形予測合成フィルタを駆動して得られる信号を、第１のサンプリング周波数にアップサンプリングして第１の再生信号を生成し、復号した直交変換係数を直交逆変換することにより、第２の帯域に対応する第２の励振信号を生成し、前記第２の励振信号により第２の線形予測合成フィルタを駆動することで第２の再生信号を生成し、前記第１の再生信号と前記第２の再生信号とを加算することで復号音声音楽を生成する。具体的には、第１の帯域に対応する第１の励振信号により第１の線形予測合成フィルタを駆動して得られる信号を、第１のサンプリング周波数にアップサンプリングして第１の再生信号を生成する手段（図２８の１３２、７８１）と、復号した直交変換係数を直交逆変換することにより、第２の帯域に対応する第２の励振信号を生成し、前記第２の励振信号により第２の線形予測合成フィルタを駆動することで第２の再生信号を生成する手段（図２８の４４０、８３１）と、前記第１の再生信号と前記第２の再生信号とを加算することで復号音声音楽を生成する手段（図２８の１８２）とを有する。

本発明１７の装置は、本発明１の装置から出力される符号を、本発明９の装置で復号する。具体的には、音声音楽信号符号化手段（図１）と、音声音楽信号復号手段（図１６）とを有する。

本発明１８の装置は、本発明２の装置から出力される符号を、本発明１０の装置で復号する。具体的には、音声音楽信号符号化手段（図８）と、音声音楽信号復号手段（図２２）とを有する。

本発明１９の装置は、本発明３の装置から出力される符号を、本発明１１の装置で復号する。具体的には、音声音楽信号符号化手段（図９）と、音声音楽信号復号手段（図２３）とを有する。

本発明２０の装置は、本発明４の装置から出力される符号を、本発明１２の装置で復号する。具体的には、音声音楽信号符号化手段（図１１）と、音声音楽信号復号手段（図２４）とを有する。

本発明２１の装置は、本発明５の装置から出力される符号を、本発明１３の装置で復号する。具体的には、音声音楽信号符号化手段（図１２）と、音声音楽信号復号手段（図２５）とを有する。

本発明２２の装置は、本発明６の装置から出力される符号を、本発明１４の装置で復号する。具体的には、音声音楽信号符号化手段（図１３）と、音声音楽信号復号手段（図２６）とを有する。

本発明２３の装置は、本発明７の装置から出力される符号を、本発明１５の装置で復号する。具体的には、音声音楽信号符号化手段（図１４）と、音声音楽信号復号手段（図２７）とを有する。

本発明２４の装置は、本発明８の装置から出力される符号を、本発明１６の装置で復号する。具体的には、音声音楽信号符号化手段（図１５）と、音声音楽信号復号手段（図２８）とを有する。
（作用）
本発明では、入力信号の低域に対応する帯域特性を有する励振信号により入力信号から求めた線形予測合成フィルタを駆動することで第１の再生信号を生成し、前記入力信号と前記第１の再生信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号の高域成分を、直交変換に基づく符号化方式を用いて符号化する。すなわち、高周波数域に属する帯域における、音声とは異なる性質を有する信号に対しては、ＣＥＬＰに代わり、直交変換に基づく符号化を行う。前記直交変換に基づく符号化は、音声と異なる性質を有する信号に対する符号化性能がＣＥＬＰに比べて高い。このため、前記入力信号の高域成分に対する符号化性能が改善される。その結果、音声音楽信号を全帯域にわたって良好に符号化することが可能となる。

本発明による効果は、音声音楽信号を全帯域にわたって良好に符号化できることである。その理由は、入力信号の低域に対応する帯域特性を有する音源信号により前記入力信号から求めた線形予測合成フィルタを駆動することで第１の再生信号を生成し、前記入力信号と前記第１の再生信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号の高域成分を、直交変換に基づく符号化方式を用いて符号化するため、前記入力信号の高域成分に対する符号化性能が改善されるからである。

図１は、本発明の第１の実施例による音声音楽信号符号化装置の構成を示すブロック図である。ここでは、帯域数を２として説明する。音声または音楽信号をサンプリングし、この複数サンプルを１フレームとして一つのベクトルにまとめて生成した入力信号（入力ベクトル）は、入力端子１０から入力される。
入力ベクトルは、ｘ（ｎ），ｎ＝０，…，Ｌ−１と表される。ただし、Ｌは、ベクトル長である。また、入力信号はＦ_s0［Ｈｚ］からＦ_e0［Ｈｚ］に帯域制限される。例えば、サンプリング周波数を１６［ｋＨｚ］として、Ｆ_s0＝５０［Ｈｚ］、Ｆ_e0＝７０００［Ｈｚ］とする。

線形予測係数計算回路１７０は、入力端子１０から入力ベクトルを入力し、前記入力ベクトルに対して線形予測分析を行い、線形予測係数αi ，ｉ＝１，…，Ｎ_ｐを求め、さらに前記線形予測係数を量子化し、量子化線形予測係数αi ′，ｉ＝１，…，Ｎ_ｐを求める。ここで、Ｎ_ｐは、線形予測次数であり、例えば、１６である。また、線形予測係数計算回路１７０は、前記線形予測係数を重みづけフィルタ１４０へ出力し、前記量子化線形予測係数に対応するインデックスを線形予測合成フィルタ１３０と線形予測逆フィルタ２３０および符号出力回路２９０へ出力する。線形予測係数の量子化に関しては、例えば、線スペクトル対（Line Spectrum Pair, LSP ）へ変換し、量子化する方法がある。線形予測係数のＬＳＰへの変換に関しては、菅村らによる「線スペクトル対（ＬＳＰ）音声分析合成方式による音声情報圧縮」（電子情報通信学会論文誌Ａ，Vol.J64-A, No.8, pp.599-606, 1981 ）（文献３）を、ＬＳＰの量子化に関しては、大室らによる「移動平均型フレーム間予測を用いるＬＳＰパラメータのベクトル量子化」（電子情
報通信学会論文誌Ａ，Vol.J77-A, No.3, pp.303-312, 1994 ）（文献４）を参照できる。

第１の音源生成回路１１０は、第１の最小化回路１５０から出力されるインデックスを入力し、前記インデックスに対応する第１の音源ベクトルを、複数個の音源信号（音源ベクトル）が格納されたテーブルより読み出し、第１のゲイン回路１６０へ出力する。ここで、第１の音源生成回路１１０の構成について図２を用いて補足する。第１の音源生成回路１１０が備えているテーブル１１０１には、Ｎ_e 個の音源ベクトルが格納されている。例えば、Ｎ_e は２５６である。スイッチ１１０２は入力端子１１０３を介して、第１の最小化回路１５０から出力されるインデックスｉを入力し、前記インデックスに対応する音源ベクトルを前記テーブルより選択し、これを第１の音源ベクトルとして出力端子１１０４を介して、第１のゲイン回路１６０へ出力する。また、音源信号の符号化については、複数のパルスから成り、パルスの位置とパルスの振幅により規定される、マルチパルス信号により音源信号を効率的に表現する方法を用いることができる。マルチパルス信号を用いた音源信号の符号化に関しては、小澤らによる「マルチパルスベクトル量子化音源と高速探索に基づくＭＰ−ＣＥＬＰ音声符号化」（電子情報通信学会論文誌Ａ，pp.1655-1663, 1996）（文献５）を参照できる。以上で、第１の音源生成回路１１０の説明を終え、図１の説明に戻る。

第１のゲイン回路１６０は、ゲインの値が格納されたテーブルを備えている。第１のゲイン回路１６０は、第１の最小化回路１５０から出力されるインデックスと第１の音源生成回路１１０から出力される第１の音源ベクトルとを入力し、前記インデックスに対応する第１のゲインを前記テーブルより読み出し、前記第１のゲインと前記第１の音源ベクトルとを乗算し、第２の音源ベクトルを生成し、生成した前記第２の音源ベクトルを第１の帯域通過フィルタ１２０へ出力する。

第１の帯域通過フィルタ１２０は、第１のゲイン回路１６０から出力される第２の音源ベクトルを入力する。前記第２の音源ベクトルは、このフィルタにより第１の帯域に帯域制限され、第１の励振ベクトルを得る。第１の帯域通過フィルタ１２０は、前記第１の励振ベクトルを線形予測合成フィルタ１３０へ出力する。ここで、第１の帯域は、Ｆ_s1［Ｈｚ］からＦ_e1［Ｈｚ］とする。ただし、Ｆ_s0≦Ｆ_s1≦Ｆ_e1≦Ｆ_e0である。例えば、Ｆ_s1＝５０［Ｈｚ］、Ｆ_e1＝４０００［Ｈｚ］である。また、第１の帯域通過フィルタ１２０は、第１の帯域に帯域制限する特性をもち、かつ１００次程度の線形予測次数をもつことを特徴とする高次線形予測フィルタ１／Ｂ（ｚ）で実現することもできる。ここで、Ｎ_phを線形予測次数、線形予測係数をβ_ｉ，ｉ＝１，…，Ｎ_phとすると高次線形予測フィルタの伝達関数１／Ｂ（ｚ）は、

と表される。前記高次線形予測フィルタに関しては（文献２）を参照できる。

線形予測合成フィルタ１３０は、量子化線形予測係数が格納されたテーブルを備えている。線形予測合成フィルタ１３０は、第１の帯域通過フィルタ１２０から出力される第１の励振ベクトルと線形予測係数計算回路１７０から出力される量子化線形予測係数に対応するインデックスとを入力する。また、前記インデックスに対応する量子化線形予測係数を、前記テーブルより読み出し、この量子化線形予測係数が設定された合成フィルタ１／Ａ（ｚ）を、前記第１の励振ベクトルにより駆動することで、第１の再生信号（再生ベクトル）を得る。そして前記第１の再生ベクトルを第１の差分器１８０へ出力する。ここで、合成フィルタの伝達関数１／Ａ（ｚ）は、

と表される。

第１の差分器１８０は、入力端子１０を介して入力ベクトルを入力し、線形予測合成フィルタ１３０から出力される第１の再生ベクトルを入力し、それらの差分を計算し、これを第１の差分ベクトルとして、重みづけフィルタ１４０と線形予測逆フィルタ２３０へ出力する。

第１の重みづけフィルタ１４０は、第１の差分器１８０から出力される第１の差分ベクトルと線形予測係数計算回路１７０から出力される線形予測係数を入力し、前記線形予測係数を用いて、人間の聴覚特性に対応した重みづけフィルタＷ（ｚ）を生成し、前記重みづけフィルタを前記第１の差分ベクトルで駆動することで、第１の重みづけ差分ベクトルを得る。そして前記第１の重みづけ差分ベクトルを第１の最小化回路１５０へ出力する。ここで、重みづけフィルタの伝達関数Ｗ（ｚ）は、Ｗ（ｚ）＝Ｑ（ｚ／γ1 ）／Ｑ（ｚ／γ2 ）と表される。ただし、

である。γ_１およびγ_２は定数であり、例えば、γ_１＝０．９、γ_２＝０．６である。また、重みづけフィルタの詳細に関しては、（文献１）を参照できる。

第１の最小化回路１５０は、第１の音源生成回路１１０に格納されている第１の音源ベクトル全てに対応するインデックスを、前記第１の音源生成回路１１０へ順次出力し、第１のゲイン回路１６０に格納されている第１のゲイン全てに対応するインデックスを、前記第１のゲイン回路１６０へ順次出力する。また、重みづけフィルタ１４０から出力される第１の重みづけ差分ベクトルを順次入力し、そのノルムを計算し、前記ノルムが最小となるような、前記第１の音源ベクトルおよび前記第１のゲインを選択し、これらに対応するインデックスを符号出力回路２９０へ出力する。

線形予測逆フィルタ２３０は、量子化線形予測係数が格納されたテーブルを備えている。線形予測逆フィルタ２３０は、線形予測係数計算回路１７０から出力される量子化線形予測係数に対応するインデックスと第１の差分器１８０から出力される第１の差分ベクトルとを入力する。また、前記インデックスに対応する量子化線形予測係数を、前記テーブルより読み出し、この量子化線形予測係数が設定された逆フィルタＡ（ｚ）を、前記第１の差分ベクトルにより駆動することで、第１の残差ベクトルを得る。そして前記第１の残差ベクトルを直交変換回路２４０へ出力する。ここで、逆フィルタの伝達関数Ａ（ｚ）は、

と表される。

直交変換回路２４０は、線形予測逆フィルタ２３０から出力される第１の残差ベクトルを入力し、前記第１の残差ベクトルを直交変換し、第２の残差ベクトルを得る。そして前記第２の残差ベクトルを帯域選択回路２５０へ出力する。ここで直交変換としては、離散コサイン変換（Discrete Cosine Transform, ＤＣＴ）を用いることができる。

帯域選択回路２５０は、直交変換回路２４０から出力される第２の残差ベクトルを入力し、図３に示すように、前記第２の残差ベクトルにおいて、第２の帯域に含まれる成分を用いてＮ_sbv 個のサブベクトルを生成する。第２の帯域としては、任意の帯域が設定できるが、ここではＦ_s2［Ｈｚ］からＦ_e2［Ｈｚ］とする。
ただし、Ｆ_s0≦Ｆ_s2≦Ｆ_e2≦Ｆ_e0である。ここでは、第１の帯域と第２の帯域が重ならない、すなわち、Ｆ_e1≦Ｆ_s2とする。例えば、Ｆ_s2＝４０００［Ｈｚ］、Ｆ_e2＝７０００［Ｈｚ］である。帯域選択回路２５０は、前記Ｎ_sbv 個のサブベクトルを直交変換係数量子化回路２６０へ出力する。

直交変換係数量子化回路２６０は、帯域選択回路２５０から出力されるＮ_sbv個のサブベクトルを入力する。直交変換係数量子化回路２６０は、前記サブベクトルの形状に対する量子化値（形状コードベクトル）が格納されたテーブルと、前記サブベクトルのゲインに対する量子化値（量子化ゲイン）が格納されたテーブルとを備えており、入力された前記Ｎ_sbv 個のサブベクトル各々に対して、量子化誤差が最小となる、形状の量子化値とゲインの量子化値とを、前記テーブルより選択し、対応するインデックスを符号出力回路２９０へ出力する。ここで、直交変換係数量子化回路２６０の構成について図４を用いて補足する。図４において、点線で囲まれたブロックはＮ_sbv 個あり、その各ブロックで前記Ｎ_sbv 個のサブベクトルが量子化される。前記Ｎ_sbv 個のサブベクトルを

と表す。各サブベクトルに対する処理は共通であるので、ｅ_sb,0（ｎ），ｎ＝０，…，Ｌ−１に対する処理について説明する。

サブベクトルｅ_sb,0（ｎ），ｎ＝０，…，Ｌ−１は、入力端子２６５０を介して入力される。テーブル２６１０には、形状コードベクトルｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１，ｊ＝０，…，Ｎ_c,0 −１がＮ_c,0 個格納されている。ここで、Ｌはベクトル長を表し、ｊはインデックスを表す。テーブル２６１０は、最小化回路２６３０から出力されるインデックスを入力し、前記インデックスに対応する前記形状コードベクトルｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１をゲイン回路２６２０へ出力する。ゲイン回路２６２０が備えているテーブルには、量子化ゲインｇ₀ ^[k]，ｋ＝０，…，Ｎ_g,0 −１がＮ_g,0 個格納されている。ここで、ｋはインデックスを表す。ゲイン回路２６２０は、テーブル２６１０から出力される前記形状コードベクトルｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１を入力し、最小化回路２６３０から出力されるインデックスを入力し、前記インデックスに対応する量子化ゲインｇ₀ ^[k]を前記テーブルより読み出し、前記量子化ゲインｇ₀ ^[k]と前記形状コードベクトルｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１とを乗算して得られる量子化サブベクトルｅ′_sb,0（ｎ），ｎ＝０，…，Ｌ−１を差分器２６４０へ出力する。差分器２６４０は、入力端子２６５０を介して入力される前記サブベクトルｅ_sb,0（ｎ），ｎ＝０，…，Ｌ−１とゲイン回路２６２０から入力される前記量子化サブベクトルｅ′_sb,0（ｎ），ｎ＝０，…，Ｌ−１との差分を計算し、これを差分ベクトルとして最小化回路２６３０へ出力する。最小化回路２６３０は、テーブル２６１０に格納されている前記形状コードベクトルｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１，ｊ＝０，…，Ｎ_c,₀ −１全てに対応するインデックスを、前記テーブル２６１０へ順次出力し、ゲイン回路２６２０に格納されている前記量子化ゲインｇ₀ ^[k]，ｋ＝０，…，Ｎ_g,0 −１全てに対応するインデックスを、ゲイン回路２６２０へ順次出力する。また、差分器２６４０から前記差分ベクトルを順次入力し、そのノルムＤ₀ を計算し、前記ノルムＤ₀ が最小となる前記形状コードベクトルｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１および前記量子化ゲインｇ₀ ^[k]を選択し、これらに対応するインデックスをインデックス出力回路２６６０へ出力する。サブベクトル

に対しても同様の処理を行う。インデックス出力回路２６６０は、Ｎ_sbv 個の最小化回路から出力されるインデックスを入力し、これらをまとめたインデックスのセットを出力端子２６７０を介して符号出力回路２９０へ出力する。また、ノルムＤ₀ が最小となる前記形状コードベクトルｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−
１および前記量子化ゲインｇ₀ ^[k]の決定については、以下の方法を用いることもできる。ノルムＤ₀ は、

と表される。ここで、最適なゲインｇ′₀ を

と設定すると、ノルムＤ₀ は、

と変形できる。したがって、Ｄ₀ が最小となるｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１，ｊ＝０，…，Ｎ_c,0 −１を求めることは、（式３）の第２項が最大と
なるｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１，ｊ＝０，…，Ｎ_c,0 −１を求めることと等価である。そこで、（式３）の第２項が最大となるｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１，ｊ＝ｊ_opt を求めた後、このｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１，ｊ＝ｊ_opt について（式１）が最小となるｇ₀ ^[k]，ｋ＝ｋ_opt を求める。ここで、ｃ₀ ^[j] （ｎ），ｎ＝０，…，Ｌ−１，ｊ＝ｊ_opt としては、（式３）の第２項の値が大きいものから順に複数個の候補を選んでおき、その各々に対して（式１）が最小となるｇ₀ ^[k]，ｋ＝ｋ_opt を求め、それらの中からノルムＤ₀ が最小となるｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１，ｊ＝ｊ_opt とｇ₀ ^[k]，ｋ＝ｋ_opt を最終的に選択することもできる。サブベクトル

に対しても同様の方法を適用できる。以上で図４を用いた直交変換係数量子化回路２６０の説明を終え、図１の説明に戻る。

符号出力回路２９０は、線形予測係数計算回路１７０から出力される量子化線形予測係数に対応するインデックスを入力する。また、第１の最小化回路１５０から出力される、第１の音源ベクトルおよび第１のゲインの各々に対応するインデックスを入力し、直交変換係数量子化回路２６０から出力される、Ｎ_sbv 個のサブベクトルに対する形状コードベクトルおよび量子化ゲインのインデックスから構成されるインデックスのセットを入力する。そして、図２９に模式的に示すように各インデックスをビット系列の符号に変換し、出力端子２０を介して出力する。

図１を用いて説明した第１の実施例は、帯域数が２の場合であるが、帯域数を３以上に拡張した場合について以下で説明する。

図１は、図５のように書き直すことができる。ここで、図５の第１の符号化回路１００１は、図６と等価であり、図５の第２の符号化回路１００２は、図７と等価であり、図６、図７を構成する各ブロックは、図１で説明した各ブロックと同じである。

本発明の第２の実施例は、第１の実施例において帯域数を３に拡張することで実現される。本発明の第２の実施例による音声音楽信号符号化装置の構成は、図８に示すブロック図で表すことができる。ここで、第１の符号化回路１００１は図６と等価であり、第２の符号化回路１００２は図６と等価であり、第３の符
号化回路１００３は図７と等価である。符号出力回路２９０１は、線形予測係数計算回路１７０から出力されるインデックスを入力し、第１の符号化回路１００１から出力されるインデックスを入力し、第２の符号化回路１００２から出力されるインデックスを入力し、第３の符号化回路１００３から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子２０を介して出力する。

本発明の第３の実施例は、第１の実施例において帯域数をＮに拡張することで実現される。本発明の第３の実施例による音声音楽信号符号化装置の構成
は、図９に示すブロック図で表すことができる。ここで、第１の符号化回路１００１から第Ｎ−１の符号化回路１００４は図６と等価であり、第Ｎの符号化回路１００５は図７と等価である。符号出力回路２９０２は、線形予測係数計算回路１７０から出力されるインデックスを入力し、第１の符号化回路１００１から第Ｎ−１の符号化回路１００４の各々より出力されるインデックスを入力し、第Ｎの符号化回路１００５から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子２０を介して出力する。

第１の実施例では、図５における第１の符号化回路１００１がＡ−ｂ−Ｓ（Analysis-by-Synthesis ）法を用いた符号化方式に基づいているが、第１の符号化回路１００１に対して、Ａ−ｂ−Ｓ法以外の符号化方式を適用することもできる。以下では、Ａ−ｂ−Ｓ法以外の符号化方式として時間周波数変換を用いた符号化方式を第１の符号化回路１００１に対して適用した場合について説明する。

本発明の第４の実施例は、第１の実施例において時間周波数変換を用いた符号化方式を適用することで実現される。本発明の第４の実施例による音声音楽信号符号化装置の構成は、図１１に示すブロック図で表すことができる。ここで、第１の符号化回路１０１１は図１０と等価であり、第２の符号化回路１００２は図７と等価である。図１０を構成するブロックのうち、線形予測逆フィルタ２３０、直交変換回路２４０、帯域選択回路２５０および直交変換係数量子化回路２６０は、図１で説明した各ブロックと同じである。また、直交変換係数逆量子化回路４６０、直交逆変換回路４４０および線形予測合成フィルタ１３１は、後述する第９の実施例による、第１の実施例に対応する音声音楽復号装置を構成するブロックと同じである。直交変換係数逆量子化回路４６０、直交逆変換回路４４０および線形予測合成フィルタ１３１の説明は、図１３を用いた第９の実施例の説明において行うのでここでは割愛する。符号出力回路２９０３は、線形予測係数計算回路１７０から出力されるインデックスを入力し、第１の符号化回路１０１１から出力されるインデックスのセットを入力し、第２の符号化回路１００２から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子２０を介して出力する。

本発明の第５の実施例は、第４の実施例において帯域数を３に拡張することで実現される。本発明の第５の実施例による音声音楽信号符号化装置の構成は、図１２に示すブロック図で表すことができる。ここで、第１の符号化回路１０１１は図１０と等価であり、第２の符号化回路１０１２は図１０と等価であり、第３の符号化回路１００３は図７と等価である。符号出力回路２９０４は、線形予測係数計算回路１７０から出力されるインデックスを入力し、第１の符号化回路１０１１から出力されるインデックスのセットを入力し、第２の符号化回路１０１２から出力されるインデックスのセットを入力し、第３の符号化回路１００３から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子２０を介して出力する。

本発明の第６の実施例は、第４の実施例において帯域数をＮに拡張することで実現される。本発明の第６の実施例による音声音楽信号符号化装置の構成は、図１３に示すブロック図で表すことができる。ここで、第１の符号化回路１０１１から第Ｎ−１の符号化回路１０１４の各々は図１０と等価であり、第Ｎの符号化回路１００５は図７と等価である。符号出力回路２９０５は、線形予測係数計算回路１７０から出力されるインデックスを入力し、第１の符号化回路１０１１から第Ｎ−１の符号化回路１０１４の各々より出力されるインデックスのセットを入力し、第Ｎの符号化回路１００５から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子２０を介して出力する。

図１４は、本発明の第７の実施例による音声音楽信号符号化装置の構成を示すブロック図である。図中の点線で囲まれたブロックをピッチ予測フィルタといい、図１にピッチ予測フィルタを付加することで図１４が得られる。以下では、図１と異なるブロックである、記憶回路５１０、ピッチ信号生成回路１１２、第３のゲイン回路１６２、加算器１８４、第１の最小化回路５５０、符号出力回路５９０について説明する。

記憶回路５１０は、加算器１８４から第５の音源信号を入力し、保持する。記憶回路５１０は、過去に入力されて保持されている前記第５の音源信号をピッチ信号生成回路１１２へ出力する。

ピッチ信号生成回路１１２は、記憶回路５１０に保持されている過去の第５の音源信号と第１の最小化回路５５０から出力されるインデックスとを入力する。前記インデックスは、遅延ｄを指定する。そして、図３０に示すように、前記過去の第５の音源信号において、現フレームの始点よりｄサンプル過去の点から、ベクトル長に相当するＬサンプル分の信号を切り出し、第１のピッチベクトルを生成する。ここで、ｄ＜Ｌの場合にはｄサンプル分の信号を切り出し、この切り出したｄサンプルを繰り返し接続して、ベクトル長がＬサンプルである第１のピッチベクトルを生成する。ピッチ信号生成回路１１２は、前記第１のピッチベクトルを第３のゲイン回路１６２へ出力する。

第３のゲイン回路１６２は、ゲインの値が格納されたテーブルを備えている。第３のゲイン回路１６２は、第１の最小化回路５５０から出力されるインデックスとピッチ信号生成回路１１２から出力される第１のピッチベクトルとを入力し、前記インデックスに対応する第３のゲインを前記テーブルより読み出し、前記第３のゲインと前記第１のピッチベクトルとを乗算し、第２のピッチベクトルを生成し、生成した前記第２のピッチベクトルを加算器１８４へ出力する。

加算器１８４は、第１のゲイン回路１６０から出力される第２の音源ベクトルと、第３のゲイン回路１６２から出力される第２のピッチベクトルを入力し、これらの和を計算し、これを第５の音源ベクトルとして、第１の帯域通過フィルタ１２０へ出力する。

第１の最小化回路５５０は、第１の音源生成回路１１０に格納されている第１の音源ベクトル全てに対応するインデックスを、前記第１の音源生成回路１１０へ順次出力し、ピッチ信号生成回路１１２において規定された範囲内の遅延ｄ全てに対応するインデックスを、前記ピッチ信号生成回路１１２へ順次出力し、第１のゲイン回路１６０に格納されている第１のゲイン全てに対応するインデックスを、前記第１のゲイン回路１６０へ順次出力し、第３のゲイン回路１６２に格納されている第３のゲイン全てに対応するインデックスを、前記第３のゲイン回路１６２へ順次出力する。また、重みづけフィルタ１４０から出力される第１の重みづけ差分ベクトルを順次入力し、そのノルムを計算し、前記ノルムが最小となるような、前記第１の音源ベクトル、前記遅延ｄ、前記第１のゲインおよび前記第３のゲインを選択し、これらに対応するインデックスをまとめて符号出力回路５９０へ出力する。

符号出力回路５９０は、線形予測係数計算回路１７０から出力される量子化線形予測係数に対応するインデックスを入力する。また、第１の最小化回路５５０から出力される、第１の音源ベクトル、遅延ｄ、第１のゲインおよび第３のゲインの各々に対応するインデックスを入力し、直交変換係数量子化回路２６０から出力される、Ｎ_sbv 個のサブベクトルに対する形状コードベクトルおよび量子化ゲインのインデックスから構成されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子２０を介して出力する。

図１５は、本発明の第８の実施例による音声音楽信号符号化装置の構成を示すブロック図である。以下では、図１４と異なるブロックである、ダウンサンプル回路７８０、第１の線形予測係数計算回路７７０、第１の線形予測合成フィルタ１３２、第３の差分器１８３、アップサンプル回路７８１、第１の差分器１８０、
第２の線形予測係数計算回路７７１、第３の線形予測係数計算回路７７２、線形予測逆フィルタ７３０、符号出力回路７９０について説明する。

ダウンサンプル回路７８０は、入力端子１０から入力ベクトルを入力し、これをダウンサンプルして得られる、第１の帯域を有する第２の入力ベクトルを第１の線形予測係数計算回路７７０および第３の差分器１８３へ出力する。ここで、第１の帯域は、第１の実施例と同様にＦ_s1［Ｈｚ］からＦ_e1［Ｈｚ］とし、入力ベクトルの帯域はＦ_s0［Ｈｚ］からＦ_e0［Ｈｚ］（第３の帯域）とする。ダウンサンプル回路の構成については、P. P. Vaidyanathanによる「Multirate Systems and Filter Banks」と題した文献（文献６）の４．１．１節を参照できる。

第１の線形予測係数計算回路７７０は、ダウンサンプル回路７８０から第２の入力ベクトルを入力し、前記第２の入力ベクトルに対して線形予測分析を行い、第１の帯域を有する第１の線形予測係数を求め、さらに前記第１の線形予測係数を量子化し、第１の量子化線形予測係数を求める。第１の線形予測係数計算回路７７０は、前記第１の線形予測係数を第１の重みづけフィルタ１４０へ出力し、第１の量子化線形予測係数に対応するインデックスを第１の線形予測合成フィルタ１３２と線形予測逆フィルタ７３０と第３の線形予測係数計算回路７７２および符号出力回路７９０へ出力する。

第１の線形予測合成フィルタ１３２は、第１の量子化線形予測係数が格納されたテーブルを備えている。第１の線形予測合成フィルタ１３２は、加算器１８４から出力される第５の音源ベクトルと第１の線形予測係数計算回路７７０から出力される第１の量子化線形予測係数に対応するインデックスとを入力する。また、前記インデックスに対応する第１の量子化線形予測係数を、前記テーブルより読み出し、前記第１の量子化線形予測係数が設定された合成フィルタを、前記第５の音源ベクトルにより駆動することで、第１の帯域を有する第１の再生ベクトルを得る。そして前記第１の再生ベクトルを第３の差分器１８３とアップサンプル回路７８１へ出力する。

第３の差分器１８３は、第１の線形予測合成フィルタ１３２から出力される第１の再生ベクトルとダウンサンプル回路７８０から出力される第２の入力ベクトルとを入力し、それらの差分を計算し、これを第２の差分ベクトルとして重みづけフィルタ１４０へ出力する。

アップサンプル回路７８１は、第１の線形予測合成フィルタ１３２から出力される第１の再生ベクトルを入力し、これをアップサンプルして第３の帯域を有する第３の再生ベクトルを得る。ここで、第３の帯域はＦ_s0［Ｈｚ］からＦ_e0［Ｈｚ］である。アップサンプル回路７８１は、前記第３の再生ベクトルを第１の差分器１８０へ出力する。アップサンプル回路の構成については、P. P. Vaidyanathanによる「Multirate Systems and Filter Banks」と題した文献（文献６）の４．１．１節を参照できる。

第１の差分器１８０は、入力端子１０を介して入力ベクトルを入力し、アップサンプル回路７８１から出力される第３の再生ベクトルを入力し、それらの差分を計算し、これを第１の差分ベクトルとして、線形予測逆フィルタ７３０へ出力する。

第２の線形予測係数計算回路７７１は、入力端子１０から入力ベクトルを入力し、前記入力ベクトルに対して線形予測分析を行い、第３の帯域を有する第２の線形予測係数を求め、前記第２の線形予測係数を第３の線形予測係数計算回路７７２へ出力する。

第３の線形予測係数計算回路７７２は、第１の量子化線形予測係数が格納されたテーブルを備えている。第３の線形予測係数計算回路７７２は、第２の線形予測係数計算回路７７１から出力される第２の線形予測係数と、第１の線形予測係数計算回路７７０から出力される第１の量子化線形予測係数に対応するインデックスとを入力する。そして前記インデックスに対応する第１の量子化線形予測係数を、前記テーブルより読み出し、前記第１の量子化線形予測係数をＬＳＰに変換し、さらに、これをサンプリング周波数変換することで、入力信号のサンプリング周波数に対応する第１のＬＳＰを得る。また、前記第２の線形予測係数をＬＳＰに変換し、第２のＬＳＰを得る。前記第２のＬＳＰと前記第１のＬＳＰとの差分を計算し、これを第３のＬＳＰとする。ここで、ＬＳＰのサンプリング周波数変換については、特願平９−２０２４７５号（文献７）を参照できる。前記第３のＬＳＰを量子化し、これを線形予測係数に変換し、第３の帯域を有する第３の量子化線形予測係数を得る。そして前記第３の量子化線形予測係数に対応するインデックスを線形予測逆フィルタ７３０および符号出力回路７９０へ出力する。

線形予測逆フィルタ７３０は、第１の量子化線形予測係数が格納された第１のテーブルと第３の量子化線形予測係数が格納された第２のテーブルとを備えている。線形予測逆フィルタ７３０は、第１の線形予測係数計算回路７７０から出力される第１の量子化線形予測係数に対応する第１のインデックスと第３の線形予測係数計算回路７７２から出力される第３の量子化線形予測係数に対応する第２のインデックスと第１の差分器１８０から出力される第１の差分ベクトルとを入力する。線形予測逆フィルタ７３０は、前記第１のインデックスに対応する第１の量子化線形予測係数を前記第１のテーブルより読み出し、ＬＳＰに変換し、さらに、これをサンプリング周波数変換することで、入力信号のサンプリング周波数に対応する第１のＬＳＰを得る。そして前記第２のインデックスに対応する第３の量子化線形予測係数を、前記第２のテーブルより読み出し、ＬＳＰに変換
し、第３のＬＳＰを得る。次に、前記第１のＬＳＰと前記第３のＬＳＰとを加算し、第２のＬＳＰを得る。線形予測逆フィルタ７３０は、前記第２のＬＳＰを線形予測係数に変換し、第２の量子化線形予測係数を得、前記第２の量子化線形予測係数が設定された逆フィルタを、前記第１の差分ベクトルにより駆動することで、第１の残差ベクトルを得る。そして前記第１の残差ベクトルを直交変換回路２４０へ出力する。

符号出力回路７９０は、第１の線形予測係数計算回路７７０から出力される第１の量子化線形予測係数に対応するインデックスを入力し、第３の線形予測係数計算回路７７２から出力される第３の量子化線形予測係数に対応するインデックスを入力し、第１の最小化回路５５０から出力される、第１の音源ベクトル、遅延ｄ、第１のゲインおよび第３のゲインの各々に対応するインデックスを入力し、直交変換係数量子化回路２６０から出力される、Ｎ_sbv 個のサブベクトルに対する形状コードベクトルおよび量子化ゲインのインデックスから構成されるインデックスのセットを入力する。そして各インデックスをビット系列の符号に変換し、出力端子２０を介して出力する。

図１６は、本発明の第９の実施例による、第１の実施例に対応する音声音楽信号復号装置の構成を示すブロック図である。本復号装置は、入力端子３０からビット系列の符号を入力する。

符号入力回路４１０は、入力端子３０から入力したビット系列の符号をインデックスに変換する。第１の音源ベクトルに対応するインデックスは、第１の音源生成回路１１０へ出力される。第１のゲインに対応するインデックスは、第１のゲイン回路１６０へ出力される。量子化線形予測係数に対応するインデックスは、線形予測合成フィルタ１３０および線形予測合成フィルタ１３１へ出力される。サブベクトルに対する形状コードベクトルおよび量子化ゲインの各々に対応するインデックスＮ_sbv を個のサブベクトル分まとめたインデックスのセットは、直交変換係数逆量子化回路４６０へ出力される。

第１の音源生成回路１１０は、符号入力回路４１０から出力されるインデックスを入力し、前記インデックスに対応する第１の音源ベクトルを、複数個の音源ベクトルが格納されたテーブルより読み出し、第１のゲイン回路１６０へ出力する。

第１のゲイン回路１６０は、量子化ゲイン
格納されたテーブルを備えている。第１のゲイン回路１６０は、符号入力回路４１０から出力されるインデックスと第１の音源生成回路１１０から出力される第１の音源ベクトルとを入力し、前記インデックスに対応する第１のゲインを前記テーブルより読み出し、前記第１のゲインと前記第１の音源ベクトルとを乗算し、第２の音源ベクトルを生成し、生成した前記第２の音源ベクトルを第１の帯域通過フィルタ１２０へ出力する。

第１の帯域通過フィルタ１２０は、第１のゲイン回路１６０から出力される第２の音源ベクトルを入力する。前記第２の音源ベクトルは、このフィルタにより第１の帯域に帯域制限され、第１の励振ベクトルを得る。第１の帯域通過フィルタ１２０は、前記第１の励振ベクトルを線形予測合成フィルタ１３０へ出力する。

直交変換係数逆量子化回路４６０の構成について図１８を用いて説明する。図１８において、点線で囲まれたブロックはＮ_sbv 個ある。その各ブロックで図１の帯域選択回路２５０において規定されるＮ_sbv 個の量子化サブベクトル

が復号される。各量子化サブベクトルに対する復号処理は共通であるので、ｅ′_sb,0（ｎ），ｎ＝０，…，Ｌ−１に対する処理について説明する。量子化サブベクトルｅ′_sb,0（ｎ），ｎ＝０，…，Ｌ−１は、図１における直交変換係数量子化回路２６０での処理と同様に、形状コードベクトルｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１と量子化ゲインｇ₀ ^[k]との積で表される。ここで、ｊ，ｋはインデックスを表す。インデックス入力回路４６３０は、入力端子４６５０を介して、符号入力回路４１０から出力されるＮ_sbv 個の量子化サブベクトルに対する形状コードベクトルおよび量子化ゲインのインデックスから構成されるインデックスのセットｉ_ｆを入力する。そして前記インデックスのセットｉ_ｆから、形状コードベクトルｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１を指定するインデックスｉ_sbs,0 と量子化ゲインｇ0[k]を指定するインデックスｉ_sbg,0 とを取り出し、ｉ_sbs,0 をテーブル４６１０へ出力し、ｉ_sbg,0 をゲイン回路４６２０へ出力する。テーブル４６１０には、ｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１，ｊ＝０，…，Ｎ_c,0 −１が格納されている。テーブル４６１０は、インデックス入力回路４６３０から出されるインデックスｉ_sbs,0 を入力し、ｉ_sbs,0 に対応する形状コードベクトルｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１，ｊ＝ｉ_sbs,0 をゲイン回路４６２０へ出力する。ゲイン回路４６２０が備えているテーブルには、ｇ₀ ^[k]，ｋ＝０，…，Ｎ_g,0 −１が格納されている。ゲイン回路４６２０は、テーブル４６１０から出力されるｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１，ｊ＝ｉ_sbs,0 を入力し、インデックス入力回路４６３０から出力されるインデックスｉ_sbg,0 を入力し、ｉ_sbg,0 に対応する量子化ゲインｇ₀ ^[k]，ｋ＝ｉ_sbg,0 を前記テーブルより読み出し、ｃ₀ ^[j]（ｎ），ｎ＝０，…，Ｌ−１，ｊ＝ｉ_sbg,0 とｇ₀ ^[k]，ｋ＝ｉ_sbg,0 とを乗算して得られる量子化サブベクトルｅ′_sb,0（ｎ），ｎ＝０，…，Ｌ−１を全帯域ベクトル生成回路４６４０へ出力する。全帯域ベクトル生成回路４６４０は、ゲイン回路４６２０から出力される量子化サブベクトルｅ′_sb,0（ｎ），ｎ＝０，…，Ｌ−１を入力する。また、全帯域ベクトル生成回路４６４０は、ｅ′_sb,0（ｎ），ｎ＝０，…，Ｌ−１と同様の処理で得られる、

を入力する。そして図１７に示すように、
前記Ｎ_sbv 個の量子化サブベクトル

を、図１の帯域選択回路２５０において規定される第２の帯域に配置し、前記第２の帯域以外には零ベクトルを配置することにより、全帯域（例えば、再生信号のサンプリング周波数が１６ｋＨｚのときは、８ｋＨｚ帯域）に相当する第２の励振ベクトルを生成し、これを出力端子４６６０を介して直交逆変換回路４４０へ出力する。

直交逆変換回路４４０は、直交変換係数逆量子化回路４６０から出力される第２の励振ベクトルを入力し、前記第２の励振ベクトルを直交逆変換し、第３の励振ベクトルを得る。そして前記第３の励振ベクトルを線形予測合成フィルタ１３１へ出力する。ここで、直交逆変換としては、離散コサイン逆変換（Inverse Discrete Cosine Transform, IDCT ）を用いることができる。

線形予測合成フィルタ１３０は、量子化線形予測係数が格納されたテーブルを備えている。線形予測合成フィルタ１３０は、第１の帯域通過フィルタ１２０から出力される第１の励振ベクトルと符号入力回路４１０から出力される量子化線形予測係数に対応するインデックスとを入力する。また、前記インデックスに対応する量子化線形予測係数を、前記テーブルより読み出し、この量子化線形予測係数が設定された合成フィルタ１／Ａ（ｚ）を、前記第１の励振ベクトルにより駆動することで、第１の再生ベクトルを得る。そして前記第１の再生ベクトルを加算器１８２へ出力する。

線形予測合成フィルタ１３１は、量子化線形予測係数が格納されたテーブルを備えている。線形予測合成フィルタ１３１は、直交逆変換回路４４０から出力される第３の励振ベクトルと符号入力回路４１０から出力される量子化線形予測係数に対応するインデックスとを入力する。また、前記インデックスに対応する量子化線形予測係数を、前記テーブルより読み出し、この量子化線形予測係数が設定された合成フィルタ１／Ａ（ｚ）を、前記第３の励振ベクトルにより駆動することで、第２の再生ベクトルを得る。そして前記第２の再生ベクトルを加算器１８２へ出力する。

加算器１８２は、線形予測合成フィルタ１３０から出力される第１の再生ベクトルと、線形予測合成フィルタ１３１から出力される第２の再生ベクトルとを入力し、これらの和を計算し、これを第３の再生ベクトルとして、出力端子４０を介して、出力する。

図１６を用いて説明した第９の実施例は、帯域数が２の場合であるが、帯域数を３以上に拡張した場合について以下で説明する。

図１６は、図１９のように書き直すことができる。ここで、図１９の第１の復号回路１０５１は、図２０と等価であり、図１９の第２の復号回路１０５２は、図２１と等価であり、図２０、図２１を構成する各ブロックは、図１６で説明した各ブロックと同じである。

本発明の第１０の実施例は、第９の実施例において帯域数を３に拡張することで実現される。本発明の第１０の実施例による音声音楽信号復号装置の構成は、図２２に示すブロック図で表すことができる。ここで、第１の復号回路１０５１は図２０と等価であり、第２の復号回路１０５２は図２０と等価であり、第３の復号回路１０５３は図２１と等価である。符号入力回路４１０１は、入力端子３０から入力したビット系列の符号をインデックスに変換し、量子化線形予測係数に対応するインデックスを第１の復号回路１０５１、第２の復号回路１０５２および第３の復号回路１０５３へ出力し、音源ベクトルとゲインに対応するインデックスを第１の復号回路１０５１および第２の復号回路１０５２へ出力し、サブベクトルに対する形状コードベクトルおよび量子化ゲインに対応するインデックスのセットを第３の復号回路１０５３へ出力する。

本発明の第１１の実施例は、第９の実施例において帯域数をＮに拡張することで実現される。本発明の第１１の実施例による音声音楽信号復号装置の構成は、図２３に示すブロック図で表すことができる。ここで、第１の復号回路１０５１から第Ｎ−１の復号回路１０５４の各々は図２０と等価であり、第Ｎの復号回路１０５５は図２１と等価である。符号入力回路４１０２は、入力端子３０から入力したビット系列の符号をインデックスに変換し量子化線形予測係数に対応するインデックスを第１の復号回路１０５１から第Ｎ−１の復号回路１０５４および第Ｎの復号回路１０５５の各々へ出力し、音源ベクトルとゲインに対応するインデックスを第１の復号回路１０５１から第Ｎ−１の復号回路１０５４の各々へ出力し、サブベクトルに対する形状コードベクトルおよび量子化ゲインに対応するインデックスのセットを第Ｎの復号回路１０５５へ出力する。

第９の実施例では、図１９における第１の復号回路１０５１がＡ−ｂ−Ｓ法を用いた符号化方式に対応する復号方式に基づいているが、第１の復号回路１０５１に対して、Ａ−ｂ−Ｓ法以外の符号化方式に対応する復号方式を適用することもできる。以下では、時間周波数変換を用いた符号化方式に対応する復号方式を第１の復号回路１０５１に対して適用した場合について説明する。

本発明の第１２の実施例は、第９の実施例において時間周波数変換を用いた符号化方式に対応する復号方式を適用することで実現される。本発明の第１２の実施例による音声音楽信号復号装置の構成は、図２４に示すブロック図で表すことができる。ここで、第１の復号回路１０６１は図２１と等価であり、第２の復号回路１０５２は図２１と等価である。符号入力回路４１０３は、入力端子３０から入力したビット系列の符号をインデックスに変換し、量子化線形予測係数に対応するインデックスを第１の復号回路１０６１および第２の復号
回路１０５２へ出力し、サブベクトルに対する形状コードベクトルおよび量子化ゲインに対応するインデックスのセットを第１の復号回路１０６１および第２の復号回路１０５２へ出力する。

本発明の第１３の実施例は、第１２の実施例において帯域数を３に拡張することで実現される。本発明の第１３の実施例による音声音楽信号復号装置の構成は、図２５に示すブロック図で表すことができる。ここで、第１の復号回路１０６１は図２１と等価であり、第２の復号回路１０６２は図２１と等価であり、第３の復号回路１０５３は図２１と等価である。符号入力回路４１０４は、入力端子３０から入力したビット系列の符号をインデックスに変換し、量子化線形予測係数に対応するインデックスを第１の復号回路１０６１、第２の復号回路１０６２および第３の復号回路１０５３へ出力し、サブベクトルに対する形状コードベクトルおよび量子化ゲインに対応するインデックスのセットを第１の復号回路１０６１、第２の復号回路１０６２および第３の復号回路１０５３へ出力する。

本発明の第１４の実施例は、第１２の実施例において帯域数をＮに拡張することで実現される。本発明の第１４の実施例による音声音楽信号復号装置の構成は、図２６に示すブロック図で表すことができる。ここで、第１の復号回路１０６１から第Ｎ−１の復号回路１０６４の各々は図２１と等価であり、第Ｎの復号回路１０５５は図２１と等価である。符号入力回路４１０５は、入力端子３０から入力したビット系列の符号をインデックスに変換し、量子化線形予測係数に対応するインデックスを第１の復号回路１０６１から第Ｎ−１の復号回路１０６４および第Ｎの復号回路１０５５の各々へ出力し、サブベクトルに対する形状コードベクトルおよび量子化ゲインに対応するインデックスのセットを第１の復号回路１０６１から第Ｎ−１の復号回路１０６４および第Ｎの復号回路１０５５の各々へ出力する。

図２７は、本発明の第１５の実施例による、第７の実施例に対応する音声音楽信号復号装置の構成を示すブロック図である。図２７において、図１６の第９の実施例と異なるブロックは、記憶回路５１０、ピッチ信号生成回路１１２、第３のゲイン回路１６２、加算器１８４および符号入力回路６１０であるが、記憶回路５１０、ピッチ信号生成回路１１２、第３のゲイン回路１６２および加算器１８４は、図１４と同様であるので説明を省略し、符号入力回路６１０について説明する。

符号入力回路６１０は、入力端子３０から入力したビット系列の符号をインデックスに変換する。第１の音源ベクトルに対応するインデックスは、第１の音源生成回路１１０へ出力される。遅延ｄに対応するインデックスは、ピッチ信号生成回路１１２へ出力される。第１のゲインに対応するインデックスは、第１のゲイン回路１６０へ出力される。第３のゲインに対応するインデックスは、第３のゲイン回路１６２へ出力される。量子化線形予測係数に対応するインデックスは、線形予測合成フィルタ１３０および線形予測合成フィルタ１３１へ出力される。サブベクトルに対する形状コードベクトルおよび量子化ゲインの各々に対応するインデックスをＮ_sbv 個のサブベクトル分まとめたインデックスのセットは、直交変換係数逆量子化回路４６０へ出力される。

図２８は、本発明の第１６の実施例による、第８の実施例に対応する音声音楽信号復号装置の構成を示すブロック図である。以下では、図２７と異なるブロックである、符号入力回路８１０、第１の線形予測係数合成フィルタ１３２、アップサンプル回路７８１および第２の線形予測合成フィルタ８３１について説明する。

符号入力回路８１０は、入力端子３０から入力したビット系列の符号をインデックスに変換する。第１の音源ベクトルに対応するインデックスは、第１の音源生成回路１１０へ出力される。遅延ｄに対応するインデックスは、ピッチ信号生成回路１１２へ出力される。第１のゲインに対応するインデックスは、第１のゲイン回路１６０へ出力される。第３のゲインに対応するインデックスは、第３のゲイン回路１６２へ出力される。第１の量子化線形予測係数に対応するインデックスは、第１の線形予測合成フィルタ１３２および第２の線形予測合成フィルタ８３１へ出力される。第３の量子化線形予測係数に対応するインデックスは、第２の線形予測合成フィルタ８３１へ出力される。サブベクトルに対する形状コードベクトルおよび量子化ゲインの各々に対応するインデックスをＮ_sbv 個のサブベクトル分まとめたインデックスのセットは、直交変換係数逆量子化回路
４６０へ出力される。

第１の線形予測合成フィルタ１３２は、第１の量子化線形予測係数が格納されたテーブルを備えている。第１の線形予測合成フィルタ１３２は、加算器１８４から出力される第５の音源ベクトルと符号入力回路８１０から出力される第１の量子化線形予測係数に対応するインデックスとを入力する。また、前記インデックスに対応する第１の量子化線形予測係数を、前記テーブルより読み出し、前記第１の量子化線形予測係数が設定された合成フィルタを、前記第５の音源ベクトルにより駆動することで、第１の帯域を有する第１の再生ベクトルを得る。そして前記第１の再生ベクトルをアップサンプル回路７８１へ出力する。

アップサンプル回路７８１は、第１の線形予測合成フィルタ１３２から出力される第１の再生ベクトルを入力し、これをアップサンプルして第３の帯域を有する第３の再生ベクトルを得る。そして前記第３の再生ベクトルを第１の加算器１８２へ出力する。

第２の線形予測合成フィルタ８３１は、第１の帯域を有する第１の量子化線形予測係数が格納された第１のテーブルと、第３の帯域を有する第３の量子化線形予測係数が格納された第２のテーブルとを備えている。第２の線形予測合成フィルタ８３１は、直交逆変換回路４４０から出力される第３の励振ベクトルと、符号入力回路８１０から出力される第１の量子化線形予測係数に対応する第１のインデックスと、第３の量子化線形予測係数に対応する第２のインデックスとを入力する。第２の線形予測合成フィルタ８３１は、前記第１のインデックスに対応する第１の量子化線形予測係数を前記第１のテーブルより読み出し、これをＬＳＰに変換し、さらに、これをサンプリング周波数変換することで、第３の再生ベクトルのサンプリング周波数に対応する第１のＬＳＰを得る。次に、前記第２のインデックスに対応する第３の量子化線形予測係数を、前記第２のテーブルより読み出し、これをＬＳＰに変換し、第３のＬＳＰを得る。そして前記第１のＬＳＰと前記第３のＬＳＰとを加算して得られる第２のＬＳＰを、線形予測係数に変換し、第２の線形予測係数を得る。第２の線形予測合成フィルタ８３１は、前記第２の線形予測係数が設定された合成フィルタを、前記第３の励振ベクトルにより駆動することで、第３の帯域を有する第２の再生ベクトルを得る。そして前記第２の再生ベクトルを加算器１８２へ出力する。

加算器１８２は、アップサンプル回路７８１から出力される第３の再生ベクトルと、第２の線形予測合成フィルタ８３１から出力される第２の再生ベクトルを入力し、これらの和を計算し、これを第４の再生ベクトルとして、出力端子４０を介して、出力する。

本発明の第１の実施例による音声音楽信号符号化装置の構成を示すブロック図である。第１の音源生成回路１１０の構成を示すブロック図である。帯域選択回路２５０においてサブベクトル生成する方法を説明するための図である。直交変換係数量子化回路２６０の構成を示すブロック図である。本発明の第１の実施例による音声音楽信号符号化装置の構成を示す、図１と等価なブロック図である。図５における第１の符号化回路１００１の構成を示すブロック図である。図５における第２の符号化回路１００２の構成を示すブロック図である。本発明の第２の実施例による音声音楽信号符号化装置の構成を示すブロック図である。本発明の第３の実施例による音声音楽信号符号化装置の構成を示すブロック図である。図１１における第１の符号化回路１０１１の構成を示すブロック図である。本発明の第４の実施例による音声音楽信号符号化装置の構成を示すブロック図である。本発明の第５の実施例による音声音楽信号符号化装置の構成を示すブロック図である。本発明の第６の実施例による音声音楽信号符号化装置の構成を示すブロック図である。本発明の第７の実施例による音声音楽信号符号化装置の構成を示すブロック図である。本発明の第８の実施例による音声音楽信号符号化装置の構成を示すブロック図である。本発明の第９の実施例による音声音楽信号復号装置の構成を示すブロック図である。直交変換係数逆量子化回路４６０において第２の励振ベクトル生成する方法を説明するための図である。直交変換係数逆量子化回路４６０の構成を示すブロック図である。本発明の第９の実施例による音声音楽信号復号装置の構成を示す、図１６と等価なブロック図である。図１９における第１の復号回路１０５１の構成を示すブロック図である。図１９における第２の復号回路１０５２の構成を示すブロック図である。本発明の第１０の実施例による音声音楽信号復号装置の構成を示すブロック図である。本発明の第１１の実施例による音声音楽信号復号装置の構成を示すブロック図である。本発明の第１２の実施例による音声音楽信号復号装置の構成を示すブロック図である。本発明の第１３の実施例による音声音楽信号復号装置の構成を示すブロック図である。本発明の第１４の実施例による音声音楽信号復号装置の構成を示すブロック図である。本発明の第１５の実施例による音声音楽信号復号装置の構成を示すブロック図である。本発明の第１６の実施例による音声音楽信号復号装置の構成を示すブロック図である。符号出力回路２９０における、インデックスとビット系列の符号との対応を説明するための図である。ピッチ信号生成回路１１２において、第１のピッチベクトルを生成する方法を説明するための図である。従来法による音声音楽信号符号化装置の実施の形態を示すブロック図である。従来法による音声音楽信号復号装置の実施の形態を示すブロック図である。

符号の説明

１０，３０入力端子
２０，４０出力端子
１１０第１の音源生成回路
１１１第２の音源生成回路
１６０第１のゲイン回路
１６１第２のゲイン回路
１２０第１の帯域通過フィルタ
１２１第２の帯域通過フィルタ
１８２，１８４加算器
１８０第１の差分器
１８１第２の差分器
１８３第３の差分器
１７０線形予測係数計算回路
７７０第１の線形予測係数計算回路
７７１第２の線形予測係数計算回路
７７２第３の線形予測係数計算回路
１３０線形予測合成フィルタ
１３１線形予測合成フィルタ
１３２第１の線形予測合成フィルタ
８３１第２の線形予測合成フィルタ
１４０重みづけフィルタ
１４１重みづけフィルタ
１５０，５５０第１の最小化回路
１５１第２の最小化回路
２３０，７３０線形予測逆フィルタ
２４０直交変換回路
２５０帯域選択回路
２６０直交変換係数量子化回路
４４０直交逆変換回路
４６０直交変換係数逆量子化回路
１９０，２９０，５９０，７９０符号出力回路
３１０，４１０，６１０，８１０符号入力回路
７８０ダウンサンプル回路
７８１アップサンプル回路
５１０記憶回路
１１２ピッチ信号生成回路
１６２第３のゲイン回路
１１０１テーブル
１１０２スイッチ
１１０３入力端子
１１０４出力端子
２６５０，２６５１入力端子
２６１０，２６１１テーブル
２６２０，２６２１ゲイン回路
２６３０，２６３１最小化回路
２６４０，２６４１差分器
２６６０インデックス出力回路
２６７０出力端子
１００１，１０１１第１の符号化回路
１００２，１０１２第２の符号化回路
１００３第３の符号化回路
１００４，１０１４第Ｎ−１の符号化回路
１００５第Ｎの符号化回路
２９０１，２９０２，２９０３，２９０４，２９０５符号出力回路
１８０１，１８０２差分器
４６１０，４６１１テーブル
４６２０，４６２１ゲイン回路
４６３０インデックス入力回路
４６４０全帯域ベクトル生成回路
４６５０入力端子
４６６０出力端子
１０５１，１０６１第１の復号回路
１０５２，１０６２第２の復号回路
１０５３第３の復号回路
１０５４，１０６４第Ｎ−１の復号回路
１０５５第Ｎの復号回路
４１０１，４１０２，４１０３，４１０４，４１０５符号入力回路
１８２１，１８２２加算器

Claims

第１のサンプリング周波数でサンプリングされた第１の入力信号を第２のサンプリング周波数にダウンサンプリングして第２の入力信号を生成し、前記第２の入力信号から求めた第１の線形予測係数が設定された合成フィルタを励振信号により駆動することで、第１の再生信号を生成し、前記第１の再生信号を前記第１のサンプリング周波数にアップサンプリングすることにより第２の再生信号を生成し、さらに、前記第１の入力信号から求めた線形予測係数に対応する周波数領域パラメータと、前記第１の線形予測係数を第１のサンプリング周波数にサンプリング周波数変換して得られる第２の線形予測係数に対応する周波数領域パラメータとの差分から第３の線形予測係数を計算し、前記第２の線形予測係数に対応する周波数領域パラメータと前記第３の線形予測係数に対応する周波数領域パラメータとの和から第４の線形予測係数を計算し、前記第１の入力信号と前記第２の再生信号との差分信号により前記第４の線形予測係数が設定された逆フィルタを駆動することで残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化することを特徴とする音声音楽信号符号化装置。
第１の帯域に対応する第１の励振信号により第１の線形予測合成フィルタを駆動して得られる信号を、第１のサンプリング周波数にアップサンプリングして第１の再生信号を生成し、復号した直交変換係数を直交逆変換することにより、第２の帯域に対応する第２の励振信号を生成し、前記第２の励振信号により第２の線形予測合成フィルタを駆動することで第２の再生信号を生成し、前記第１の再生信号と前記第２の再生信号とを加算することで復号音声音楽を生成することを特徴とする音声音楽信号復号装置。
請求項１記載の音声音楽信号符号化装置から出力される符号を、請求項２記載の音声音楽信号復号装置で復号する音声音楽信号符号化復号装置。