JP2002222000A

JP2002222000A - データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体

Info

Publication number: JP2002222000A
Application number: JP2001016870A
Authority: JP
Inventors: Tetsujiro Kondo; 哲二郎近藤; Hiroto Kimura; 裕人木村; Tsutomu Watanabe; 勉渡辺; Masaaki Hattori; 正明服部
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2001-01-25
Filing date: 2001-01-25
Publication date: 2002-08-09
Anticipated expiration: 2021-01-25
Also published as: DE60222627T2; CN1216367C; JP4857468B2; US7269559B2; WO2002059877A1; CN1459093A; EP1355297B1; EP1355297A4; EP1355297A1; DE60222627D1; US20030163317A1; KR100875784B1; KR20020088088A

Abstract

(57)【要約】【課題】高音質の合成音等を得る。【解決手段】タップ生成部１２１は、CELP方式で符号
化された音声の符号化データを復号した合成音データの
うちの注目している注目データのサブフレームにおける
４０サンプルの合成音データと、注目サブフレームか
ら、その注目サブフレームに配置されているＬコードが
表すラグだけ過去の位置を始点とする４０サンプルの合
成音データとから、予測タップを生成する。そして、予
測部１２５は、その予測タップと、係数メモリ１２４に
記憶されたタップ係数とを用いて、所定の予測演算を行
うことにより、高音質の音声データを復号する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、データ処理装置お
よびデータ処理方法、並びにプログラムおよび記録媒体
に関し、特に、例えば、ＣＥＬＰ(Code Excited Liner
Prediction coding)方式で符号化された音声を、高音質
の音声に復号することができるようにするデータ処理装
置およびデータ処理方法、並びにプログラムおよび記録
媒体に関する。

【０００２】

【従来の技術】図１および図２は、従来の携帯電話機の
一例の構成を示している。

【０００３】この携帯電話機では、音声を、ＣＥＬＰ方
式により所定のコードに符号化して送信する送信処理
と、他の携帯電話機から送信されてくるコードを受信し
て、音声に復号する受信処理とが行われるようになって
おり、図１は、送信処理を行う送信部を、図２は、受信
処理を行う受信部を、それぞれ示している。

【０００４】図１に示した送信部では、ユーザが発話し
た音声が、マイク（マイクロフォン）１に入力され、そ
こで、電気信号としての音声信号に変換され、Ａ／Ｄ(A
nalog/Digital)変換部２に供給される。Ａ／Ｄ変換部２
は、マイク１からのアナログの音声信号を、例えば、８
ｋＨｚ等のサンプリング周波数でサンプリングすること
により、ディジタルの音声信号にＡ／Ｄ変換し、さら
に、所定のビット数で量子化を行って、演算器３とＬＰ
Ｃ(Liner Prediction Coefficient)分析部４に供給す
る。

【０００５】ＬＰＣ分析部４は、Ａ／Ｄ変換部２からの
音声信号を、例えば、１６０サンプル分の長さを１フレ
ームとし、その１フレームを４０サンプルごとのサブフ
レームに分割して、サブフレームごとにＬＰＣ分析し、
Ｐ次の線形予測係数α₁，α₂，・・・，α_Pを求める。
そして、ＬＰＣ分析部４は、このＰ次の線形予測係数α
_p（ｐ＝１，２，・・・，Ｐ）を要素とするベクトル
を、音声の特徴ベクトルとして、ベクトル量子化部５に
供給する。

【０００６】ベクトル量子化部５は、線形予測係数を要
素とするコードベクトルとコードとを対応付けたコード
ブックを記憶しており、そのコードブックに基づいて、
ＬＰＣ分析部４からの特徴ベクトルαをベクトル量子化
し、そのベクトル量子化の結果得られるコード（以下、
適宜、Ａコード(A_code)という）を、コード決定部１５
に供給する。

【０００７】さらに、ベクトル量子化部５は、Ａコード
に対応するコードベクトルα’を構成する要素となって
いる線形予測係数α₁’，α₂’，・・・，α_P’を、音
声合成フィルタ６に供給する。

【０００８】音声合成フィルタ６は、例えば、ＩＩＲ(I
nfinite Impulse Response)型のディジタルフィルタ
で、ベクトル量子化部５からの線形予測係数α_p’（ｐ
＝１，２，・・・，Ｐ）をＩＩＲフィルタのタップ係数
とするとともに、演算器１４から供給される残差信号ｅ
を入力信号として、音声合成を行う。

【０００９】即ち、ＬＰＣ分析部４で行われるＬＰＣ分
析は、現在時刻ｎの音声信号（のサンプル値）ｓ_n、お
よびこれに隣接する過去のＰ個のサンプル値ｓ_n-1，ｓ
_n-2，・・・，ｓ_n-Pに、式ｓ_n＋α₁ｓ_n-1＋α₂ｓ_n-2＋・・・＋α_Pｓ_n-P＝e_n ・・・（１）で示す線形１次結合が成立すると仮定し、現在時刻ｎの
サンプル値ｓ_nの予測値（線形予測値）ｓ_n’を、過去の
Ｐ個の標本値ｓ_n-1，ｓ_n-2，・・・，ｓ_n-Pを用いて、
式ｓ_n’＝−（α₁ｓ_n-1＋α₂ｓ_n-2＋・・・＋α_Pｓ_n-P）・・・（２）によって線形予測したときに、実際のサンプル値ｓ_nと
線形予測値ｓ_n’との間の自乗誤差を最小にする線形予
測係数α_pを求めるものである。

【００１０】ここで、式（１）において、｛e_n｝（・・
・，e_n-1，e_n，e_n+1，・・・）は、平均値が０で、分散
が所定値σ²の互いに無相関な確率変数である。

【００１１】式（１）から、サンプル値ｓ_nは、式ｓ_n＝e_n−（α₁ｓ_n-1＋α₂ｓ_n-2＋・・・＋α_Pｓ_n-P）・・・（３）で表すことができ、これを、Ｚ変換すると、次式が成立
する。

【００１２】Ｓ＝Ｅ／（１＋α₁ｚ^-1＋α₂ｚ^-2＋・・・＋α_Pｚ^-P）・・・（４）但し、式（４）において、ＳとＥは、式（３）における
ｓ_nとｅ_nのＺ変換を、それぞれ表す。

【００１３】ここで、式（１）および（２）から、ｅ_n
は、式ｅ_n＝ｓ_n−ｓ_n’ ・・・（５）で表すことができ、実際のサンプル値ｓ_nと線形予測値
ｓ_n’との間の残差信号と呼ばれる。

【００１４】従って、式（４）から、線形予測係数α_p
をＩＩＲフィルタのタップ係数とするとともに、残差信
号ｅ_nをＩＩＲフィルタの入力信号とすることにより、
音声信号ｓ_nを求めることができる。

【００１５】そこで、音声合成フィルタ６は、上述した
ように、ベクトル量子化部５からの線形予測係数α_p’
をタップ係数とするとともに、演算器１４から供給され
る残差信号ｅを入力信号として、式（４）を演算し、音
声信号（合成音データ）ｓｓを求める。

【００１６】なお、音声合成フィルタ６では、ＬＰＣ分
析部４によるＬＰＣ分析の結果得られる線形予測係数α
_pではなく、そのベクトル量子化の結果得られるコード
に対応するコードベクトルとしての線形予測係数α_p’
が用いられるため、音声合成フィルタ６が出力する合成
音信号は、Ａ／Ｄ変換部２が出力する音声信号とは、基
本的に同一にはならない。

【００１７】音声合成フィルタ６が出力する合成音デー
タｓｓは、演算器３に供給される。演算器３は、音声合
成フィルタ６からの合成音データｓｓから、Ａ／Ｄ変換
部２が出力する音声信号ｓを減算し、その減算値を、自
乗誤差演算部７に供給する。自乗誤差演算部７は、演算
器３からの減算値の自乗和（第ｋサブフレームのサンプ
ル値についての自乗和）を演算し、その結果得られる自
乗誤差を、自乗誤差最小判定部８に供給する。

【００１８】自乗誤差最小判定部８は、自乗誤差演算部
７が出力する自乗誤差に対応付けて、長期予測ラグを表
すコードとしてのＬコード(L_code)、ゲインを表すコー
ドとしてのＧコード(G_code)、および符号語（励起コー
ドブック）を表すコードとしてのＩコード(I_code)を記
憶しており、自乗誤差演算部７が出力する自乗誤差に対
応するＬコード、Ｇコード、およびＬコードを出力す
る。Ｌコードは、適応コードブック記憶部９に、Ｇコー
ドは、ゲイン復号器１０に、Ｉコードは、励起コードブ
ック記憶部１１に、それぞれ供給される。さらに、Ｌコ
ード、Ｇコード、およびＩコードは、コード決定部１５
にも供給される。

【００１９】適応コードブック記憶部９は、例えば７ビ
ットのＬコードと、所定の遅延時間（ラグ）とを対応付
けた適応コードブックを記憶しており、演算器１４から
供給される残差信号ｅを、自乗誤差最小判定部８から供
給されるＬコードに対応付けられた遅延時間（長期予測
ラグ）だけ遅延して、演算器１２に出力する。

【００２０】ここで、適応コードブック記憶部９は、残
差信号ｅを、Ｌコードに対応する時間だけ遅延して出力
することから、その出力信号は、その遅延時間を周期と
する周期信号に近い信号となる。この信号は、線形予測
係数を用いた音声合成において、主として、有声音の合
成音を生成するための駆動信号となる。従って、Ｌコー
ドは、概念的には、音声のピッチ周期を表す。なお、CE
LPの規格によれば、レコードは、２０乃至１４６の範囲
の整数値をとる。

【００２１】ゲイン復号器１０は、Ｇコードと、所定の
ゲインβおよびγとを対応付けたテーブルを記憶してお
り、自乗誤差最小判定部８から供給されるＧコードに対
応付けられたゲインβおよびγを出力する。ゲインβと
γは、演算器１２と１３に、それぞれ供給される。ここ
で、ゲインβは、長期フィルタ状態出力ゲインと呼ばれ
るものであり、また、ゲインγは、励起コードブックゲ
インと呼ばれるものである。

【００２２】励起コードブック記憶部１１は、例えば９
ビットのＩコードと、所定の励起信号とを対応付けた励
起コードブックを記憶しており、自乗誤差最小判定部８
から供給されるＩコードに対応付けられた励起信号を、
演算器１３に出力する。

【００２３】ここで、励起コードブックに記憶されてい
る励起信号は、例えば、ホワイトノイズ等に近い信号で
あり、線形予測係数を用いた音声合成において、主とし
て、無声音の合成音を生成するための駆動信号となる。

【００２４】演算器１２は、適応コードブック記憶部９
の出力信号と、ゲイン復号器１０が出力するゲインβと
を乗算し、その乗算値ｌを、演算器１４に供給する。演
算器１３は、励起コードブック記憶部１１の出力信号
と、ゲイン復号器１０が出力するゲインγとを乗算し、
その乗算値ｎを、演算器１４に供給する。演算器１４
は、演算器１２からの乗算値ｌと、演算器１３からの乗
算値ｎとを加算し、その加算値を、残差信号ｅとして、
音声合成フィルタ６と適応コードブック記憶部９に供給
する。

【００２５】音声合成フィルタ６では、以上のようにし
て、演算器１４から供給される残差信号ｅを入力信号
が、ベクトル量子化部５から供給される線形予測係数α
_p’をタップ係数とするＩＩＲフィルタでフィルタリン
グされ、その結果得られる合成音データが、演算器３に
供給される。そして、演算器３および自乗誤差演算部７
において、上述の場合と同様の処理が行われ、その結果
得られる自乗誤差が、自乗誤差最小判定部８に供給され
る。

【００２６】自乗誤差最小判定部８は、自乗誤差演算部
７からの自乗誤差が最小（極小）になったかどうかを判
定する。そして、自乗誤差最小判定部８は、自乗誤差が
最小になっていないと判定した場合、上述のように、そ
の自乗誤差に対応するＬコード、Ｇコード、およびＬコ
ードを出力し、以下、同様の処理が繰り返される。

【００２７】一方、自乗誤差最小判定部８は、自乗誤差
が最小になったと判定した場合、確定信号を、コード決
定部１５に出力する。コード決定部１５は、ベクトル量
子化部５から供給されるＡコードをラッチするととも
に、自乗誤差最小判定部８から供給されるＬコード、Ｇ
コード、およびＩコードを順次ラッチするようになって
おり、自乗誤差最小判定部８から確定信号を受信する
と、そのときラッチしているＡコード、Ｌコード、Ｇコ
ード、およびＩコードを、チャネルエンコーダ１６に供
給する。チャネルエンコーダ１６は、コード決定部１５
からのＡコード、Ｌコード、Ｇコード、およびＩコード
を多重化し、コードデータとして出力する。このコード
データは、伝送路を介して送信される。

【００２８】以上から、コードデータは、復号に用いら
れる情報であるＡコード、Ｌコード、Ｇコード、および
Ｉコードを、サブフレーム単位ごとに有する符号化デー
タとなっている。

【００２９】なお、ここでは、Ａコード、Ｌコード、Ｇ
コード、およびＩコードは、サブフレームごとに求めら
れるものとしているが、例えば、Ａコードについては、
フレームごとに求められる場合があり、この場合、その
フレームを構成する４つのサブフレームの復号には、同
一のＡコードが用いられる。但し、この場合でも、その
１フレームを構成する４つのサブフレームそれぞれが、
同一のＡコードを有していると見ることができ、そのよ
うに考えることによって、コードデータは、復号に用い
られる情報であるＡコード、Ｌコード、Ｇコード、およ
びＩコードを、サブフレーム単位ごとに有する符号化デ
ータとなっているとみなすことができる。

【００３０】ここで、図１（後述する図２、図５、図
９、図１１、図１６、図１８、および図２１においても
同様）では、各変数に、[k]が付され、配列変数とされ
ている。このkは、サブフレーム数を表すが、明細書中
では、その記述は、適宜省略する。

【００３１】次に、以上のようにして、他の携帯電話機
の送信部から送信されてくるコードデータは、図２に示
した受信部のチャネルデコーダ２１で受信される。チャ
ネルデコーダ２１は、コードデータから、Ｌコード、Ｇ
コード、Ｉコード、Ａコードを分離し、それぞれを、適
応コードブック記憶部２２、ゲイン復号器２３、励起コ
ードブック記憶部２４、フィルタ係数復号器２５に供給
する。

【００３２】適応コードブック記憶部２２、ゲイン復号
器２３、励起コードブック記憶部２４、演算器２６乃至
２８は、図１の適応コードブック記憶部９、ゲイン復号
器１０、励起コードブック記憶部１１、演算器１２乃至
１４とそれぞれ同様に構成されるもので、図１で説明し
た場合と同様の処理が行われることにより、Ｌコード、
Ｇコード、およびＩコードが、残差信号ｅに復号され
る。この残差信号ｅは、音声合成フィルタ２９に対し
て、入力信号として与えられる。

【００３３】フィルタ係数復号器２５は、図１のベクト
ル量子化部５が記憶しているのと同一のコードブックを
記憶しており、Ａコードを、線形予測係数α_p’に復号
し、音声合成フィルタ２９に供給する。

【００３４】音声合成フィルタ２９は、図１の音声合成
フィルタ６と同様に構成されており、フィルタ係数復号
器２５からの線形予測係数α_p’をタップ係数とすると
ともに、演算器２８から供給される残差信号ｅを入力信
号として、式（４）を演算し、これにより、図１の自乗
誤差最小判定部８において自乗誤差が最小と判定された
ときの合成音データを生成する。この合成音データは、
Ｄ／Ａ(Digital/Analog)変換部３０に供給される。Ｄ／
Ａ変換部３０は、音声合成フィルタ２９からの合成音デ
ータを、ディジタル信号からアナログ信号にＤ／Ａ変換
し、スピーカ３１に供給して出力させる。

【００３５】なお、コードデータにおいて、Ａコード
が、サブフレーム単位でなく、フレーム単位で配置され
ている場合、図２の受信部では、フレームを構成する４
つのサブフレームすべての復号に、そのフレームに配置
されたＡコードに対応する線形予測係数を用いることが
できる他、各サブフレームについて、隣接するフレーム
のＡコードに対応する線形予測係数を用いて補間を行
い、その補間の結果得られる線形予測係数を、各サブフ
レームの復号に用いることが可能である。

【００３６】

【発明が解決しようとする課題】以上のように、携帯電
話機の送信部では、受信部の音声合成フィルタ２９に与
えられる入力信号としての残差信号と線形予測係数がコ
ード化されて送信されてくるため、受信部では、そのコ
ードが、残差信号と線形予測係数に復号される。しかし
ながら、この復号された残差信号や線形予測係数（以
下、適宜、それぞれを、復号残差信号または復号線形予
測係数という）には、量子化誤差等の誤差が含まれるた
め、音声をＬＰＣ分析して得られる残差信号と線形予測
係数には一致しない。

【００３７】このため、受信部の音声合成フィルタ２９
が出力する合成音データは、歪み等を有する、音質の劣
化したものとなる。

【００３８】本発明は、このような状況に鑑みてなされ
たものであり、高音質の合成音等を得ることができるよ
うにするものである。

【００３９】

【課題を解決するための手段】本発明の第１のデータ処
理装置は、所定のデータのうちの注目している注目デー
タにつき、周期情報に応じて、所定のデータを抽出する
ことにより、所定の処理に用いるタップを生成するタッ
プ生成手段と、タップを用いて、注目データについて、
所定の処理を行う処理手段とを備えることを特徴とす
る。

【００４０】本発明の第１のデータ処理方法は、所定の
データのうちの注目している注目データにつき、周期情
報に応じて、所定のデータを抽出することにより、所定
の処理に用いるタップを生成するタップ生成ステップ
と、タップを用いて、注目データについて、所定の処理
を行う処理ステップとを備えることを特徴とする。

【００４１】本発明の第１のプログラムは、所定のデー
タのうちの注目している注目データにつき、周期情報に
応じて、所定のデータを抽出することにより、所定の処
理に用いるタップを生成するタップ生成ステップと、タ
ップを用いて、注目データについて、所定の処理を行う
処理ステップとを備えることを特徴とする。

【００４２】本発明の第１の記録媒体は、所定のデータ
のうちの注目している注目データにつき、周期情報に応
じて、所定のデータを抽出することにより、所定の処理
に用いるタップを生成するタップ生成ステップと、タッ
プを用いて、注目データについて、所定の処理を行う処
理ステップとを備えるプログラムが記録されていること
を特徴とする。

【００４３】本発明の第２のデータ処理装置は、学習の
教師となる教師データから、所定のデータと周期情報
を、学習の生徒となる生徒データとして生成する生徒デ
ータ生成手段と、生徒データとしての所定のデータのう
ちの注目している注目データにつき、周期情報に応じ
て、所定のデータを抽出することにより、教師データを
予測するのに用いる予測タップを生成する予測タップ生
成手段と、予測タップとタップ係数とを用いて、所定の
予測演算を行うことにより得られる教師データの予測値
の予測誤差が、統計的に最小になるように学習を行い、
タップ係数を求める学習手段とを備えることを特徴とす
る。

【００４４】本発明の第２のデータ処理方法は、学習の
教師となる教師データから、所定のデータと周期情報
を、学習の生徒となる生徒データとして生成する生徒デ
ータ生成ステップと、生徒データとしての所定のデータ
のうちの注目している注目データにつき、周期情報に応
じて、所定のデータを抽出することにより、教師データ
を予測するのに用いる予測タップを生成する予測タップ
生成ステップと、予測タップとタップ係数とを用いて、
所定の予測演算を行うことにより得られる教師データの
予測値の予測誤差が、統計的に最小になるように学習を
行い、タップ係数を求める学習ステップとを備えること
を特徴とする。

【００４５】本発明の第２のプログラムは、学習の教師
となる教師データから、所定のデータと周期情報を、学
習の生徒となる生徒データとして生成する生徒データ生
成ステップと、生徒データとしての所定のデータのうち
の注目している注目データにつき、周期情報に応じて、
所定のデータを抽出することにより、教師データを予測
するのに用いる予測タップを生成する予測タップ生成ス
テップと、予測タップとタップ係数とを用いて、所定の
予測演算を行うことにより得られる教師データの予測値
の予測誤差が、統計的に最小になるように学習を行い、
タップ係数を求める学習ステップとを備えることを特徴
とする。

【００４６】本発明の第２の記録媒体は、学習の教師と
なる教師データから、所定のデータと周期情報を、学習
の生徒となる生徒データとして生成する生徒データ生成
ステップと、生徒データとしての所定のデータのうちの
注目している注目データにつき、周期情報に応じて、所
定のデータを抽出することにより、教師データを予測す
るのに用いる予測タップを生成する予測タップ生成ステ
ップと、予測タップとタップ係数とを用いて、所定の予
測演算を行うことにより得られる教師データの予測値の
予測誤差が、統計的に最小になるように学習を行い、タ
ップ係数を求める学習ステップとを備えるプログラムが
記録されていることを特徴とする。

【００４７】本発明の第１のデータ処理装置およびデー
タ処理方法、並びにプログラムおよび記録媒体において
は、所定のデータのうちの注目している注目データにつ
き、周期情報に応じて、所定のデータを抽出することに
より、所定の処理に用いるタップが生成され、そのタッ
プを用いて、注目データについて、所定の処理が行われ
る。

【００４８】本発明の第２のデータ処理装置およびデー
タ処理方法、並びにプログラムおよび記録媒体において
は、学習の教師となる教師データから、所定のデータと
周期情報が、学習の生徒となる生徒データとして生成さ
れる。そして、生徒データとしての所定のデータのうち
の注目している注目データにつき、周期情報に応じて、
所定のデータを抽出することにより、教師データを予測
するのに用いる予測タップが生成され、予測タップとタ
ップ係数とを用いて、所定の予測演算を行うことにより
得られる教師データの予測値の予測誤差が、統計的に最
小になるように学習が行われ、タップ係数が求められ
る。

【００４９】

【発明の実施の形態】図３は、本発明を適用した伝送シ
ステム（システムとは、複数の装置が論理的に集合した
物をいい、各構成の装置が同一筐体中にあるか否かは問
わない）の一実施の形態の構成を示している。

【００５０】この伝送システムでは、携帯電話機１０１
₁と１０１₂が、基地局１０２₁と１０２₂それぞれとの間
で、無線による送受信を行うとともに、基地局１０２₁
と１０２₂それぞれが、交換局１０３との間で送受信を
行うことにより、最終的には、携帯電話機１０１₁と１
０１₂との間において、基地局１０２₁および１０２₂、
並びに交換局１０３を介して、音声の送受信を行うこと
ができるようになっている。なお、基地局１０２₁と１
０２₂は、同一の基地局であっても良いし、異なる基地
局であっても良い。

【００５１】ここで、以下、特に区別する必要がない限
り、携帯電話機１０１₁と１０１₂を、携帯電話機１０１
と記述する。

【００５２】次に、図４は、図３の携帯電話機１０１の
構成例を示している。

【００５３】この携帯電話機１０１では、CELP方式によ
って、音声の送受信が行われるようになっている。

【００５４】即ち、アンテナ１１１は、基地局１０２₁
または１０２₂からの電波を受信し、その受信信号を、
変復調部１１２に供給するとともに、変復調部１１２か
らの信号を、電波で、基地局１０２₁または１０２₂に送
信する。変復調部１１２は、アンテナ１１１からの信号
を復調し、その結果得られる、図１で説明したようなコ
ードデータを、受信部１１４に供給する。また、変復調
部１１２は、送信部１１３から供給される、図１で説明
したようなコードデータを変調し、その結果得られる変
調信号を、アンテナ１１１に供給する。送信部１１３
は、図１に示した送信部と同様に構成され、そこに入力
されるユーザの音声を、CELP方式によって、コードデー
タに符号化して、変復調部１１２に供給する。受信部１
１４は、変復調部１１２からのコードデータを受信して
CELP方式により復号し、さらに、高音質の音声を復号し
て出力する。

【００５５】即ち、受信部１１４では、例えば、クラス
分類適応処理を利用して、CELP方式で復号された合成音
が、さらに、真の高音質の音声（の予測値）に復号され
る。

【００５６】ここで、クラス分類適応処理は、クラス分
類処理と適応処理とからなり、クラス分類処理によっ
て、データを、その性質に基づいてクラス分けし、各ク
ラスごとに適応処理を施すものであり、適応処理は、以
下のような手法のものである。

【００５７】即ち、適応処理では、例えば、合成音と、
所定のタップ係数との線形結合により、高音質の音声の
予測値が求められる。

【００５８】具体的には、例えば、いま、高音質の音声
（のサンプル値）を教師データとするとともに、その高
音質の音声を、ＣＥＬＰ方式によって、Ｌコード、Ｇコ
ード、Ｉコード、およびＡコードに符号化し、それらの
コードを、図２に示した受信部で復号することにより得
られる合成音を生徒データとして、教師データである高
音質の音声ｙの予測値Ｅ［ｙ］を、幾つかの合成音（の
サンプル値）ｘ₁，ｘ₂，・・・の集合と、所定のタップ
係数ｗ₁，ｗ₂，・・・の線形結合により規定される線形
１次結合モデルにより求めることを考える。この場合、
予測値Ｅ［ｙ］は、次式で表すことができる。

【００５９】Ｅ［ｙ］＝ｗ₁ｘ₁＋ｗ₂ｘ₂＋・・・・・・（６）

【００６０】式（６）を一般化するために、タップ係数
ｗ_jの集合でなる行列Ｗ、生徒データｘ_ijの集合でなる
行列Ｘ、および予測値Ｅ［ｙ_j］の集合でなる行列Ｙ’
を、

【数１】で定義すると、次のような観測方程式が成立する。

【００６１】ＸＷ＝Ｙ’ ・・・（７）ここで、行列Ｘの成分ｘ_ijは、ｉ件目の生徒データの集
合（ｉ件目の教師データｙ_iの予測に用いる生徒データ
の集合）の中のｊ番目の生徒データを意味し、行列Ｗの
成分ｗ_jは、生徒データの集合の中のｊ番目の生徒デー
タとの積が演算されるタップ係数を表す。また、ｙ
_iは、ｉ件目の教師データを表し、従って、Ｅ［ｙ_i］
は、ｉ件目の教師データの予測値を表す。なお、式
（６）の左辺におけるｙは、行列Ｙの成分ｙ_iのサフィ
ックスｉを省略したものであり、また、式（６）の右辺
におけるｘ₁，ｘ₂，・・・も、行列Ｘの成分ｘ_ijのサフ
ィックスｉを省略したものである。

【００６２】そして、この観測方程式に最小自乗法を適
用して、真の高音質の音声ｙに近い予測値Ｅ［ｙ］を求
めることを考える。この場合、教師データとなる真の高
音質の音声ｙの集合でなる行列Ｙ、および高音質の音声
ｙに対する予測値Ｅ［ｙ］の残差ｅの集合でなる行列Ｅ
を、

【数２】で定義すると、式（７）から、次のような残差方程式が
成立する。

【００６３】ＸＷ＝Ｙ＋Ｅ・・・（８）

【００６４】この場合、元の高音質の音声ｙに近い予測
値Ｅ［ｙ］を求めるためのタップ係数ｗ_jは、自乗誤差

【数３】を最小にすることで求めることができる。

【００６５】従って、上述の自乗誤差をタップ係数ｗ_j
で微分したものが０になる場合、即ち、次式を満たすタ
ップ係数ｗ_jが、元の高音質の音声ｙに近い予測値Ｅ
［ｙ］を求めるため最適値ということになる。

【００６６】

【数４】・・・（９）

【００６７】そこで、まず、式（８）を、タップ係数ｗ
_jで微分することにより、次式が成立する。

【００６８】

【数５】・・・（１０）

【００６９】式（９）および（１０）より、式（１１）
が得られる。

【００７０】

【数６】・・・（１１）

【００７１】さらに、式（８）の残差方程式における生
徒データｘ_ij、タップ係数ｗ_j、教師データｙ_i、および
誤差ｅ_iの関係を考慮すると、式（１１）から、次のよ
うな正規方程式を得ることができる。

【００７２】

【数７】・・・（１２）

【００７３】なお、式（１２）に示した正規方程式は、
行列（共分散行列）Ａおよびベクトルｖを、

【数８】で定義するとともに、ベクトルＷを、数１で示したよう
に定義すると、式ＡＷ＝ｖ・・・（１３）で表すことができる。

【００７４】式（１２）における各正規方程式は、生徒
データｘ_ijおよび教師データｙ_iのセットを、ある程度
の数だけ用意することで、求めるべきタップ係数ｗ_jの
数Ｊと同じ数だけたてることができ、従って、式（１
３）を、ベクトルＷについて解くことで（但し、式（１
３）を解くには、式（１３）における行列Ａが正則であ
る必要がある）、最適なタップ係数（ここでは、自乗誤
差を最小にするタップ係数）ｗ_jを求めることができ
る。なお、式（１３）を解くにあたっては、例えば、掃
き出し法（Gauss-Jordanの消去法）などを用いることが
可能である。

【００７５】以上のようにして、最適なタップ係数ｗ_j
を求めておき、さらに、そのタップ係数ｗ_jを用い、式
（６）により、真の高音質の音声ｙに近い予測値Ｅ
［ｙ］を求めるのが適応処理である。

【００７６】なお、例えば、教師データとして、高いサ
ンプリング周波数でサンプリングした音声信号、または
多ビットを割り当てた音声信号を用いるとともに、生徒
データとして、その教師データとしての音声信号を間引
いたり、低ビットで再量子化したした音声信号をＣＥＬ
Ｐ方式により符号化し、その符号化結果を復号して得ら
れる合成音を用いた場合、タップ係数としては、高いサ
ンプリング周波数でサンプリングした音声信号、または
多ビットを割り当てた音声信号を生成するのに、予測誤
差が、統計的に最小となる高音質の音声が得られること
になる。従って、この場合、より高音質の合成音を得る
ことが可能となる。

【００７７】図４の受信部１１４では、以上のようなク
ラス分類適応処理により、コードデータを復号して得ら
れる合成音を、さらに、高音質の音声に復号するように
なっている。

【００７８】即ち、図５は、図４の受信部１１４の第１
の構成例を示している。なお、図中、図２における場合
と対応する部分については、同一の符号を付してあり、
以下では、その説明は、適宜省略する。

【００７９】タップ生成部１２１と１２２には、音声合
成フィルタ２９が出力する、サブフレームごとの合成音
データと、チャネルデコーダ２１が出力する、サブフレ
ームごとのＬコード、Ｇコード、Ｉコード、Ａコードの
うちのＬコードとが供給されるようになっている。タッ
プ生成部１２１と１２２は、そこに供給される合成音デ
ータから、高音質の音声の予測値を予測するのに用いる
予測タップとするものと、クラス分類に用いるクラスタ
ップとするものを、Ｌコードに基づいて、それぞれ抽出
する。予測タップは、予測部１２５に供給され、クラス
タップは、クラス分類部１２３に供給される。

【００８０】クラス分類部１２３は、タップ生成部１２
２から供給されるクラスタップに基づいて、クラス分類
を行い、そのクラス分類結果としてのクラスコードを、
係数メモリ１２４に供給する。

【００８１】ここで、クラス分類部１２３におけるクラ
ス分類の方法としては、例えば、KビットADRC(Adaptive
Dynamic Range Coding)処理を利用した方法等がある。

【００８２】ここで、KビットADRC処理においては、例
えば、クラスタップを構成するデータの最大値MAXと最
小値MINが検出され、DR=MAX-MINを、集合の局所的なダ
イナミックレンジとし、このダイナミックレンジDRに基
づいて、クラスタップを構成する各データがKビットに
再量子化される。即ち、クラスタップを構成する各デー
タから、最小値MINが減算され、その減算値がDR/2^Kで除
算（量子化）される。そして、以上のようにして得られ
る、クラスタップを構成する各データのKビットの値
を、所定の順番で並べたビット列が、ADRCコードとして
出力される。

【００８３】このようなKビットADRC処理を、クラス分
類に利用する場合には、例えば、そのKビットADRC処理
の結果得られるADRCコードを、クラスコードとすること
が可能である。

【００８４】なお、クラス分類は、その他、例えば、ク
ラスタップを、それを構成する各データを要素とするベ
クトルと見なして、そのベクトルとしてのクラスタップ
をベクトル量子化すること等によって行うことも可能で
ある。

【００８５】係数メモリ１２４は、後述する図９の学習
装置において学習処理が行われることにより得られる、
クラスごとのタップ係数を記憶しており、クラス分類部
１２３が出力するクラスコードに対応するアドレスに記
憶されているタップ係数を、予測部１２５に供給する。

【００８６】予測部１２５は、タップ生成部１２１が出
力する予測タップと、係数メモリ１２４が出力するタッ
プ係数とを取得し、その予測タップとタップ係数とを用
いて、式（６）に示した線形予測演算を行う。これによ
り、予測部１２５は、注目している注目サブフレームに
ついて、高音質の音声（の予測値）を求めて、Ｄ／Ａ変
換部３０に供給する。

【００８７】次に、図６のフローチャートを参照して、
図５の受信部１１４の処理について説明する。

【００８８】チャネルデコーダ２１は、そこに供給され
るコードデータから、Ｌコード、Ｇコード、Ｉコード、
Ａコードを分離し、それぞれを、適応コードブック記憶
部２２、ゲイン復号器２３、励起コードブック記憶部２
４、フィルタ係数復号器２５に供給する。さらに、Ｌコ
ードは、タップ生成部１２１および１２２にも供給され
る。

【００８９】そして、適応コードブック記憶部２２、ゲ
イン復号器２３、励起コードブック記憶部２４、演算器
２６乃至２８は、図２における場合と同様の処理を行
い、これにより、Ｌコード、Ｇコード、およびＩコード
が、残差信号ｅに復号される。この残差信号は、音声合
成フィルタ２９に供給される。

【００９０】さらに、フィルタ係数復号器２５は、図２
で説明したように、そこに供給されるＡコードを、線形
予測係数に復号し、音声合成フィルタ２９に供給する。
音声合成フィルタ２９は、演算器２８からの残差信号
と、フィルタ係数復号器２５からの線形予測係数を用い
て音声合成を行い、その結果得られる合成音を、タップ
生成部１２１と１２２に供給する。

【００９１】タップ生成部１２１は、音声合成フィルタ
２９が順次出力する合成音のサブフレームを、順次、注
目サブフレームとし、ステップＳ１において、その注目
サブフレームの合成音データを抽出するとともに、その
注目サブフレームから見て時間的に過去方向または未来
方向の合成音データを、そこに供給されるＬコードに基
づいて抽出することにより、予測タップを生成し、予測
部１２５に供給する。さらに、ステップＳ１では、タッ
プ生成部１２２が、例えば、やはり、注目サブフレーム
の合成音データを抽出するとともに、その注目サブフレ
ームから見て時間的に過去方向または未来方向の合成音
データを、そこに供給されるＬコードに基づいて抽出す
ることにより、クラスタップを生成し、クラス分類部１
２３に供給する。

【００９２】そして、ステップＳ２に進み、クラス分類
部１２３は、タップ生成部１２２から供給されるクラス
タップに基づいて、クラス分類を行い、その結果得られ
るクラスコードを、係数メモリ１２４に供給して、ステ
ップＳ３に進む。

【００９３】ステップＳ３では、係数メモリ１２４は、
クラス分類部１２３から供給されるクラスコードに対応
するアドレスから、タップ係数を読み出し、予測部１２
５に供給する。

【００９４】そして、ステップＳ４に進み、予測部１２
５は、係数メモリ１２４が出力するタップ係数を取得
し、そのタップ係数と、タップ生成部１２１からの予測
タップとを用いて、式（６）に示した積和演算を行い、
注目サブフレームの高音質の音声データ（の予測値）を
得る。

【００９５】なお、ステップＳ１乃至Ｓ４の処理は、注
目サブフレームの合成音データのサンプル値それぞれ
を、注目データとして行われる。即ち、サブフレームの
合成音データは、前述したことから、４０サンプルで構
成されるから、その４０サンプルの合成音データそれぞ
れについて、ステップＳ１乃至Ｓ４の処理が行われる。

【００９６】以上のようにして得られた高音質の音声デ
ータは、予測部１２５から、Ｄ／Ａ変換部３０を介し
て、スピーカ３１に供給され、これにより、スピーカ３
１からは、高音質の音声が出力される。

【００９７】ステップＳ４の処理後は、ステップＳ５に
進み、まだ、注目サブフレームとして処理すべきサブフ
レームがあるかどうかが判定され、あると判定された場
合、ステップＳ１に戻り、次に注目サブフレームとすべ
きサブフレームを、新たに注目サブフレームとして、以
下、同様の処理を繰り返す。また、ステップＳ５におい
て、注目サブフレームとして処理すべきサブフレームが
ないと判定された場合、処理を終了する。

【００９８】次に、図７および図８を参照して、図５の
タップ生成部１２１での予測タップの生成方法について
説明する。

【００９９】タップ生成部１２１は、例えば、図７に示
すように、注目サブフレームにおける４０サンプルの合
成音データを抽出するとともに、注目サブフレームか
ら、その注目サブフレームに配置されているＬコードが
表すラグだけ過去の位置を始点とする４０サンプルの合
成音データ（以下、適宜、ラグ対応の過去データとい
う）を抽出し、注目データについての予測タップとす
る。

【０１００】あるいは、タップ生成部１２１は、例え
ば、図８に示すように、注目サブフレームの４０サンプ
ルの合成音データを抽出するとともに、Ｌコードが表す
ラグだけ過去の位置が注目サブフレーム内の合成音デー
タ（例えば、注目データ等）の位置となるＬコードが配
置された、注目サブフレームから見て未来方向のサブフ
レームに配置された４０サンプルの合成音データ（以
下、適宜、ラグ対応の未来データという）を抽出し、注
目データについての予測タップとする。

【０１０１】また、タップ生成部１２１は、例えば、注
目サブフレームの合成音データ、ラグ対応の過去デー
タ、およびラグ対応の未来データを抽出し、注目データ
についての予測タップとする。

【０１０２】ここで、注目データを、クラス分類適応処
理によって予測するにあたり、注目サブフレームの合成
音データの他、注目サブフレーム以外のサブフレームの
合成音データを、予測タップとして用いることにより、
より高音質の音声を得ることができると考えられる。そ
して、この場合、予測タップは、例えば、単純に、注目
サブフレームの合成音データの他、注目サブフレームの
直前と直後のサブフレームの合成音データによって構成
することが考えられる。

【０１０３】しかしながら、このように、予測タップ
を、単純に、注目サブフレームの合成音データ、および
注目サブフレームの直前と直後のサブフレームの合成音
データによって構成する場合には、予測タップの構成の
仕方に、合成音データの波形特性がほとんど考慮されて
いないことから、その分、高音質化に影響が生じると考
えられる。

【０１０４】そこで、タップ生成部１２１は、上述のよ
うに、予測タップとする合成音データを、Ｌコードに基
づいて抽出するようになっている。

【０１０５】即ち、サブフレームに配置されているＬコ
ードが表すラグ（長期予測ラグ）は、注目データ部分の
合成音の波形が、過去のどの時点における合成音の波形
に類似しているかを表すので、注目データの部分の波形
と、ラグ対応の過去データやラグ対応の未来データの部
分の波形とは、大きな相関性を有する。

【０１０６】従って、予測タップを、注目サブフレーム
の合成音データと、その合成音データに対して大きな相
関を有するラグ対応の過去データもしくはラグ対応の未
来データのうちの一方または両方とによって構成するこ
とにより、さらに高音質の音声を得ることが可能とな
る。

【０１０７】ここで、図５のタップ生成部１２２におい
ても、例えば、タップ生成部１２１における場合と同様
にして、注目サブフレームの合成音データと、ラグ対応
の過去データもしくはラグ対応の未来データのうちの一
方または両方とからクラスタップを生成することが可能
であり、図５の実施の形態では、そのようになってい
る。

【０１０８】なお、予測タップやクラスタップの構成パ
ターンは、上述したパターンのものに限定されるもので
はない。即ち、予測タップやクラスタップには、注目サ
ブフレームのすべての合成音データを含める他、１サン
プルおき等の合成音データだけを含めるようにしたり、
注目サブフレームに配置されているＬコードが表すラグ
だけ過去の位置のサブフレームから、そのサブフレーム
に配置されているＬコードが表すラグだけ過去の位置の
サブフレームの合成音データ等を含めるようにすること
等が可能である。

【０１０９】また、上述の場合には、クラスタップと予
測タップを同一構成にするようにしたが、クラスタップ
と予測タップは、異なる構成とすることができる。

【０１１０】さらに、上述の場合には、Ｌコードが表す
ラグだけ過去の位置が注目サブフレーム内の合成音デー
タ（例えば、注目データ等）の位置となるＬコードが配
置された、注目サブフレームから見て未来方向のサブフ
レームに配置された４０サンプルの合成音データを、ラ
グ対応の未来データとして、予測タップに含めるように
したが、ラグ対応の未来データとしては、その他、例え
ば、次のような合成音データを用いるようにすることも
可能である。

【０１１１】即ち、ＣＥＬＰ方式において符号化データ
に含まれるＬコードは、上述したように、そのＬコード
が配置されているサブフレームの合成音データの波形と
類似する過去の合成音データの位置を表すが、符号化デ
ータには、そのような過去の類似波形の位置を表すＬコ
ードの他、未来の類似波形の位置を表すＬコード（以
下、適宜、未来Ｌコードという）を含めるようにするこ
とが可能である。この場合、注目データについてのラグ
対応の未来データとしては、注目サブフレームに配置さ
れている未来Ｌコードが表すラグだけ未来の位置にある
合成音データを始点とする１以上のサンプルを用いるこ
とが可能である。

【０１１２】次に、図９は、図５の係数メモリ１２４に
記憶させるタップ係数の学習処理を行う学習装置の一実
施の形態の構成例を示している。

【０１１３】マイク２０１乃至コード決定部２１５は、
図１のマイク１乃至コード決定部１５とそれぞれ同様に
構成される。マイク１には、学習用の音声信号が入力さ
れるようになっており、従って、マイク２０１乃至コー
ド決定部２１５では、その学習用の音声信号に対して、
図１における場合と同様の処理が施される。

【０１１４】但し、コード決定部２１５は、Ｌコード、
Ｇコード、Ｉコード、およびＡコードのうち、本実施の
形態において予測タップやクラスタップを構成する合成
音データを抽出するのに用いられるＬコードだけを出力
するようになっている。

【０１１５】そして、タップ生成部１３１と１３２に
は、自乗誤差最小判定部２０８において自乗誤差が最小
になったと判定されたときの音声合成フィルタ２０６が
出力する合成音データが供給される。さらに、タップ生
成部１３１と１３２には、コード決定部２１５が、自乗
誤差最小判定部２０８から確定信号を受信したときに出
力するＬコードも供給される。また、正規方程式加算回
路１３４には、Ａ／Ｄ変換部２０２が出力する音声デー
タが、教師データとして供給される。

【０１１６】タップ生成部１３１は、音声合成フィルタ
２０６が出力する合成音データから、コード決定部２１
５が出力するＬコードに基づいて、図５のタップ生成部
１２１における場合と同一の予測タップを生成し、生徒
データとして、正規方程式加算回路１３４に供給する。

【０１１７】タップ生成部１３２も、音声合成フィルタ
２０６が出力する合成音データから、コード決定部２１
５が出力するＬコードに基づいて、図５のタップ生成部
１２２における場合と同一のクラスタップを生成し、ク
ラス分類部１３３に供給する。

【０１１８】クラス分類部１３３は、タップ生成部１３
２からのクラスタップに基づいて、図５のクラス分類部
１２３における場合と同様のクラス分類を行い、その結
果得られるクラスコードを、正規方程式加算回路１３４
に供給する。

【０１１９】正規方程式加算回路１３４は、Ａ／Ｄ変換
部２０２からの音声データを、教師データとして受信す
るとともに、タップ生成部１３１からの予測タップを、
生徒データとして受信し、その教師データおよび生徒デ
ータを対象として、クラス分類部１３３からのクラスコ
ードごとに足し込みを行う。

【０１２０】即ち、正規方程式加算回路１３４は、クラ
ス分類部１３３から供給されるクラスコードに対応する
クラスごとに、予測タップ（生徒データ）を用い、式
（１３）の行列Ａにおける各コンポーネントとなってい
る、生徒データどうしの乗算（ｘ_inｘ_im）と、サメーシ
ョン（Σ）に相当する演算を行う。

【０１２１】さらに、正規方程式加算回路１３４は、や
はり、クラス分類部１３３から供給されるクラスコード
に対応するクラスごとに、生徒データおよび教師データ
を用い、式（１３）のベクトルｖにおける各コンポーネ
ントとなっている、生徒データと教師データの乗算（ｘ
_inｙ_i）と、サメーション（Σ）に相当する演算を行
う。

【０１２２】正規方程式加算回路１３４は、以上の足し
込みを、そこに供給される学習用の音声データのサブフ
レームすべてを注目サブフレームとし、かつその注目サ
ブフレームの音声データすべてを注目データとして行
い、これにより、各クラスについて、式（１３）に示し
た正規方程式をたてる。

【０１２３】タップ係数決定回路１３５は、正規方程式
加算回路１３４においてクラスごとに生成された正規方
程式を解くことにより、クラスごとに、タップ係数を求
め、係数メモリ１３６の、各クラスに対応するアドレス
に供給する。

【０１２４】なお、学習用の音声信号として用意した音
声信号によっては、正規方程式加算回路１３４におい
て、タップ係数を求めるのに必要な数の正規方程式が得
られないクラスが生じる場合があり得るが、タップ係数
決定回路１３５は、そのようなクラスについては、例え
ば、デフォルトのタップ係数を出力する。

【０１２５】係数メモリ１３６は、タップ係数決定回路
１３５から供給されるクラスごとのタップ係数を、その
クラスに対応するアドレスに記憶する。

【０１２６】次に、図１０のフローチャートを参照し
て、図９の学習装置で行われる、高音質の音声を復号す
るためのタップ係数を求める学習処理について説明す
る。

【０１２７】学習装置には、学習用の音声信号が供給さ
れ、ステップＳ１１では、その学習用の音声信号から、
教師データと生徒データが生成される。

【０１２８】即ち、学習用の音声信号は、マイク２０１
に入力され、マイク２０１乃至コード決定部２１５は、
図１のマイク１乃至コード決定部１５における場合とそ
れぞれ同様の処理を行う。

【０１２９】その結果、Ａ／Ｄ変換部２０２で得られる
ディジタル信号の音声データは、教師データとして、正
規方程式加算回路１３４に供給される。また、自乗誤差
最小判定部２０８において自乗誤差が最小になったと判
定されたときに、音声合成フィルタ２０６が出力する合
成音データは、生徒データとして、タップ生成部１３１
と１３２に供給される。さらに、自乗誤差最小判定部２
０８において自乗誤差が最小になったと判定されたとき
に、コード決定部２１５が出力するＬコードも、生徒デ
ータとして、タップ生成部１３１と１３２に供給され
る。

【０１３０】その後、ステップＳ１２に進み、タップ生
成部１３１は、音声合成フィルタ２０６から生徒データ
として供給される合成音のサブフレームを注目サブフレ
ームとし、さらに、その注目サブフレームの合成音デー
タを、順次、注目データとして、各注目データについ
て、音声合成フィルタ２０６からの合成音データを用
い、コード決定部２１５からのＬコードに基づいて、図
５のタップ生成部１２１における場合と同様にして、予
測タップを生成し、正規方程式加算回路１３４に供給す
る。さらに、ステップＳ１２では、タップ生成部１３２
が、やはり、合成音データを用い、Ｌコードに基づい
て、図５のタップ生成部１２２における場合と同様にし
て、クラスタップを生成し、クラス分類部１３３に供給
する。

【０１３１】ステップＳ１２の処理後は、ステップＳ１
３に進み、クラス分類部１３３が、タップ生成部１３２
からのクラスタップに基づいて、クラス分類を行い、そ
の結果得られるクラスコードを、正規方程式加算回路１
３４に供給する。

【０１３２】そして、ステップＳ１４に進み、正規方程
式加算回路１３４は、Ａ／Ｄ変換器２０２からの教師デ
ータとしての高音質の音声データである学習用の音声デ
ータのうちの注目データに対応するもの、およびタップ
生成部１３２からの生徒データとしての予測タップを対
象として、式（１３）の行列Ａとベクトルｖの、上述し
たような足し込みを、クラス分類部１３３からの注目デ
ータについてのクラスコードごとに行い、ステップＳ１
５に進む。

【０１３３】ステップＳ１５では、まだ、注目サブフレ
ームとして処理すべきサブフレームがあるかどうかが判
定される。ステップＳ１５において、まだ、注目サブフ
レームとして処理すべきサブフレームがあると判定され
た場合、ステップＳ１１に戻り、次のサブフレームを新
たに注目サブフレームとして、以下、同様の処理が繰り
返される。

【０１３４】また、ステップＳ１５において、注目サブ
フレームとして処理すべきサブフレームがないと判定さ
れた場合、ステップＳ１６に進み、タップ係数決定回路
１３５は、正規方程式加算回路１３４で各クラスごとに
生成された正規方程式を解くことにより、各クラスごと
に、タップ係数を求め、係数メモリ１３６の、各クラス
に対応するアドレスに供給して記憶させ、処理を終了す
る。

【０１３５】以上のようにして、係数メモリ１３６に記
憶された各クラスごとのタップ係数が、図５の係数メモ
リ１２４に記憶されている。

【０１３６】以上のように、図５の係数メモリ１２４に
記憶されたタップ係数は、線形予測演算を行うことによ
り得られる高音質の音声予測値の予測誤差（自乗誤差）
が、統計的に最小になるように学習を行うことにより求
められたものであるから、図５の予測部１２５が出力す
る音声は、高音質のものとなる。

【０１３７】なお、例えば、図５および図９の実施の形
態では、予測タップやクラスタップを、音声合成フィル
タ２０６が出力する合成音データから構成するようにし
たが、予測タップやクラスタップは、図５および図９に
おいて点線で示すように、Ｉコードや、Ｌコード、Ｇコ
ード、Ａコード、Ａコードから得られる線形予測係数α
_p、Ｇコードから得られるゲインβ，γ、その他の、Ｌ
コード、Ｇコード、Ｉコード、またはＡコードから得ら
れる情報（例えば、残差信号ｅや、残差信号ｅを得るた
めのｌ，ｎ、さらには、ｌ／β，ｎ／γなど）のうちの
１以上を含めて構成することが可能である。また、ＣＥ
ＬＰ方式では、符号化データとしてのコードデータに、
リスト補間ビットやフレームエネルギ等が含められる場
合があるが、この場合、予測タップやクラスタップは、
ソフト補間ビットやフレームエネルギ等を含めて構成す
ることも可能である。

【０１３８】次に、図１１は、図４の受信部１１４の第
２の構成例を示している。なお、図中、図５における場
合と対応する部分については、同一の符号を付してあ
り、以下では、その説明は、適宜省略する。即ち、図１
１の受信部１１４は、タップ生成部１２１と１２２に替
えて、タップ生成部３０１と３０２がそれぞれ設けられ
ている他は、図５における場合と同様に構成されてい
る。

【０１３９】図５の実施の形態においては、タップ生成
部１２１や１２２において（図９のタップ生成部１３１
と１３２においても同様）、予測タップやクラスタップ
が、注目サブフレームにおける４０サンプルの合成音デ
ータの他、ラグ対応の過去データもしくはラグ対応の未
来データのうちの一方または両方から構成されるが、ラ
グ対応の過去データだけ、ラグ対応の未来データだけ、
またはその両方のうちのいずれを予測タップやクラスタ
ップに含めるかを、特に制御するようにはなっていない
ことから、いずれを含めるかを、あらかじめ決めてお
き、固定にしておく必要がある。

【０１４０】しかしながら、注目サブフレームを含むフ
レーム（以下、適宜、注目フレームという）等が、例え
ば、発話の開始時等に相当する場合には、図１２（Ａ）
に示すように、注目フレームよりも過去のフレーム等
は、無音の状態（雑音だけが存在するのと等しい状態）
となっていると考えられる。同様に、注目フレームが、
例えば、発話の終了時等に相当する場合には、図１２
（Ｂ）に示すように、注目フレームよりも未来のフレー
ム等は、無音の状態となっていると考えられる。そし
て、このような無音部分については、予測タップやクラ
スタップに含めても、音質の向上にほとんど寄与せず、
むしろ、最悪の場合には、音質の向上を妨げるおそれが
ある。

【０１４１】一方、注目フレームが、発話の開始時や終
了時等以外の定常な発話が行われている状態に相当する
場合には、図１２（Ｃ）に示すように、注目フレームか
ら過去方向および未来方向のいずれにも、定常的な音声
に相当する合成音データが存在すると考えられる。そし
て、このような場合には、ラグ対応の過去データと、ラ
グ対応の未来データのうちのいずれか一方だけでなく、
その両方を、予測タップやクラスタップに含めることに
よって、さらなる音質の向上を図ることができると考え
られる。

【０１４２】そこで、図１１のタップ生成部３０１と３
０２は、合成音データの波形の推移が、例えば、図１２
（Ａ）乃至図１２（Ｃ）に示したうちのいずれであるか
を判定し、その判定結果に基づいて、予測タップとクラ
スタップを、それぞれ生成するようになっている。

【０１４３】即ち、図１３は、図１１のタップ生成部３
０１の構成例を示している。

【０１４４】合成音メモリ３１１には、音声合成フィル
タ２９（図１１）が出力する合成音データが順次供給さ
れるようになっており、合成音メモリ３１１は、その合
成音データを、順次記憶する。なお、合成音メモリ３１
１は、注目データとされる合成音データについて予測タ
ップとされる可能性のある合成音データのうちの、最も
過去のサンプルから、最も未来のサンプルまでの間の合
成音データを記憶することのできる記憶容量を少なくと
も有している。また、合成音メモリ３１１は、その記憶
容量分だけ、合成音データを記憶すると、次に供給され
る合成音データを、最も古い記憶値に上書きする形で記
憶するようになっている。

【０１４５】Ｌコードメモリ３１２には、チャネルデコ
ーダ２１（図１１）が出力するサブフレーム単位のＬコ
ードが順次供給されるようになっており、Ｌコードメモ
リ３１２は、そのＬコードを、順次記憶する。なお、Ｌ
コードメモリ３１２は、注目データとされる合成音デー
タについて予測タップとされる可能性のある合成音デー
タのうちの、最も過去のサンプルが配置されるサブフレ
ームから、最も未来のサンプルが配置されるサブフレー
ムまでの間のＬコードを記憶することのできる記憶容量
を少なくとも有しており、また、その記憶容量分だけ、
Ｌコードを記憶すると、次に供給されるＬコードを、最
も古い記憶値に上書きする形で記憶するようになってい
る。

【０１４６】フレームパワー計算部３１３は、合成音メ
モリ３１１に記憶された合成音データを用い、所定のフ
レーム単位で、そのフレームにおける合成音データのパ
ワーを求め、バッファ３１４に供給する。なお、フレー
ムパワー計算部３１３でパワーを求める単位であるフレ
ームは、CELP方式におけるフレームやサブフレームに一
致していても良いし、一致していなくても良い。従っ
て、フレームパワー計算部３１３でパワーを求める単位
であるフレームは、CELP方式におけるフレームを構成す
る１６０サンプルや、サブフレームを構成する４０サン
プル以外の値である、例えば、１２８サンプル等で構成
することが可能である。但し、本実施の形態では、説明
を簡単にするため、フレームパワー計算部３１３でパワ
ーを求める単位であるフレームは、CELP方式におけるフ
レームと一致するものとする。

【０１４７】バッファ３１４は、フレームパワー計算部
３１３から順次供給される合成音データのパワーを、順
次記憶する。なお、バッファ３１４は、少なくとも、注
目フレーム、およびその直前と直後のフレームの、合計
で３フレーム分の合成音データのパワーを記憶すること
ができるようになっており、また、その記憶容量分だ
け、パワーを記憶すると、次にフレームパワー計算部３
１３から供給されるパワーを、最も古い記憶値に上書き
する形で記憶するようになっている。

【０１４８】状態判定部３１５は、バッファ３１４に記
憶されたパワーに基づき、注目データ付近の合成音デー
タの波形の推移を判定する。即ち、状態判定部３１５
は、注目データ付近の合成音データの波形の推移が、図
１２（Ａ）に示したように、注目フレームの直前のフレ
ームが無音の状態（以下、適宜、立ち上がり状態とい
う）、図１２（Ｂ）に示したように、注目フレームの直
後のフレームが無音の状態（以下、適宜、たち下がり状
態という）、または図１２（Ｃ）に示したように、注目
フレームの直前から直後にかけて定常になっている状態
（以下、適宜、定常状態という）のうちのいずれの状態
になっているかを判定する。そして、状態判定部３１５
は、その判定結果を、データ抽出部３１６に供給する。

【０１４９】データ抽出部３１６は、合成音メモリ３１
１から、注目サブフレームの合成音データを読み出すこ
とにより抽出する。さらに、データ抽出部３１６は、状
態判定部３１５からの波形の推移の判定結果に基づき、
Ｌコードメモリ３１２を参照して、合成音メモリ３１１
から、ラグ対応の過去データもしくはラグ対応の未来デ
ータのうちの一方または両方を読み出すことにより抽出
する。そして、データ抽出部３１６は、合成音メモリ３
１１から読み出した注目サブフレームの合成音データ
と、ラグ対応の過去データもしくはラグ対応の未来デー
タのうちの一方または両方とを、予測タップとして出力
する。

【０１５０】次に、図１４のフローチャートを参照し
て、図１３のタップ生成部３０１の処理について説明す
る。

【０１５１】合成音メモリ３１１には、音声合成フィル
タ２９（図１１）が出力する合成音データが順次供給さ
れ、合成音メモリ３１１は、その合成音データを、順次
記憶する。また、Ｌコードメモリ３１２には、チャネル
デコーダ２１（図１１）が出力するサブフレーム単位の
Ｌコードが順次供給され、Ｌコードメモリ３１２は、そ
のＬコードを、順次記憶する。

【０１５２】一方、フレームパワー計算部３１３は、合
成音メモリ３１１に記憶された合成音データを、フレー
ム単位で順次読み出し、各フレームにおける合成音デー
タのパワーを求めて、バッファ３１４に記憶させてい
る。

【０１５３】そして、状態判定部３１５は、ステップＳ
２１において、バッファ３１４から、注目フレームのパ
ワーＰ_n、その直前のフレームのパワーＰ_n-1、およびそ
の直後のフレームのパワーＰ_n+1を読み出し、注目フレ
ームのパワーＰ_nと、直前のフレームのパワーＰ_n-1との
差分値Ｐ_n−Ｐ_n-1を計算するとともに、直後のフレーム
のパワーＰ_n+1と、注目フレームのパワーＰ_nとの差分値
Ｐ_n+1−Ｐ_nとを計算して、ステップＳ２２に進む。

【０１５４】ステップＳ２２では、状態判定部３１５
は、差分値Ｐ_n−Ｐ_n-1の絶対値、および差分値Ｐ_n+1−
Ｐ_nの絶対値が、いずれも、所定の閾値εよりも大であ
るか（以上であるか）どうかを判定する。

【０１５５】ステップＳ２２において、差分値Ｐ_n−Ｐ
_n-1の絶対値、または差分値Ｐ_n+1−Ｐ_nの絶対値のうち
の少なくとも一方が、所定の閾値εより大でないと判定
された場合、状態判定部３１５は、注目データ付近の合
成音データの波形の推移が、図１２（Ｃ）に示したよう
に、注目フレームの直前から直後にかけて定常になって
いる定常状態になっていると判定し、その旨を表す「定
常状態」メッセージを、データ抽出部３１６に供給し
て、ステップＳ２３に進む。

【０１５６】ステップＳ２３では、データ抽出部３１６
は、状態判定部３１５から「定常状態」メッセージを受
信すると、合成音メモリ３１１から、注目サブフレーム
の合成音データを読み出すとともに、さらに、Ｌコード
メモリ３１２を参照して、タグ対応の過去データおよび
タグ対応の未来データとしての合成音データを読み出
す。そして、データ抽出部３１６は、これらの合成音デ
ータを予測タップとして出力し、処理を終了する。

【０１５７】また、ステップＳ２２において、差分値Ｐ
_n−Ｐ_n-1の絶対値、および差分値Ｐ _n+1−Ｐ_nの絶対値
が、いずれも、所定の閾値εより大であると判定された
場合、ステップＳ２４に進み、状態判定部３１５は、差
分値Ｐ_n−Ｐ_n-1と、差分値Ｐ_n+ ₁−Ｐ_nが、いずれも正で
あるかどうかを判定する。ステップＳ２４において、差
分値Ｐ_n−Ｐ_n-1と、差分値Ｐ_n+1−Ｐ_nが、いずれも正で
あると判定された場合、状態判定部３１５は、注目デー
タ付近の合成音データの波形の推移が、図１２（Ａ）に
示したように、注目フレームの直前のフレームが無音の
状態である立ち上がり状態になっていると判定し、その
旨を表す「立ち上がり状態」メッセージを、データ抽出
部３１６に供給して、ステップＳ２５に進む。

【０１５８】ステップＳ２５では、データ抽出部３１６
は、状態判定部３１５から「立ち上がり状態」メッセー
ジを受信すると、合成音メモリ３１１から、注目サブフ
レームの合成音データを読み出すとともに、さらに、Ｌ
コードメモリ３１２を参照して、タグ対応の未来データ
としての合成音データを読み出す。そして、データ抽出
部３１６は、これらの合成音データを予測タップとして
出力し、処理を終了する。

【０１５９】一方、ステップＳ２４において、差分値Ｐ
_n−Ｐ_n-1と、差分値Ｐ_n+1−Ｐ_nのうちの少なくとも一方
が、正でないと判定された場合、ステップＳ２６に進
み、状態判定部３１５は、差分値Ｐ_n−Ｐ_n-1と、差分値
Ｐ_n+1−Ｐ_nが、いずれも負であるかどうかを判定する。
ステップＳ２６において、差分値Ｐ_n−Ｐ_n-1と、差分値
Ｐ_n+1−Ｐ_nのうちの少なくとも一方が、負でないと判定
された場合、状態判定部３１５は、注目データ付近の合
成音データの波形の推移が、定常状態になっていると判
定し、その旨を表す「定常状態」メッセージを、データ
抽出部３１６に供給して、ステップＳ２３に進む。

【０１６０】ステップＳ２３では、データ抽出部３１６
は、上述したように、合成音メモリ３１１から、注目サ
ブフレームの合成音データと、タグ対応の過去データお
よびタグ対応の未来データを読み出し、予測タップとし
て出力して、処理を終了する。

【０１６１】また、ステップＳ２６において、差分値Ｐ
_n−Ｐ_n-1と、差分値Ｐ_n+1−Ｐ_nが、いずれも負であると
判定された場合、状態判定部３１５は、注目データ付近
の合成音データの波形の推移が、図１２（Ｂ）に示した
ように、注目フレームの直後のフレームが無音の状態で
ある立ち下がり状態になっていると判定し、その旨を表
す「立ち下がり状態」メッセージを、データ抽出部３１
６に供給して、ステップＳ２７に進む。

【０１６２】ステップＳ２７では、データ抽出部３１６
は、状態判定部３１５から「立ち下がり状態」メッセー
ジを受信すると、合成音メモリ３１１から、注目サブフ
レームの合成音データを読み出すとともに、さらに、Ｌ
コードメモリ３１２を参照して、タグ対応の過去データ
としての合成音データを読み出す。そして、データ抽出
部３１６は、これらの合成音データを予測タップとして
出力し、処理を終了する。

【０１６３】なお、図１１のタップ生成部３０２も、図
１３に示したタップ生成部３０１と同様に構成すること
ができ、この場合、図１４で説明したようにして、クラ
スタップを構成させることができる。但し、図１３にお
いて、合成音メモリ３１１、Ｌコードメモリ３１２、フ
レーパワー計算部３１３、バッファ３１４、および状態
判定部３１５は、タップ生成部３０１と３０２とで兼用
することが可能である。

【０１６４】また、上述の場合には、注目フレームと、
その直前または直後のフレームそれぞれとにおけるパワ
ーを比較して、注目データ付近の合成音データの波形の
推移を判定するようにしたが、注目データ付近の合成音
データの波形の推移を判定は、その他、例えば、注目フ
レームと、より過去または未来に亘るフレームそれぞれ
とにおけるパワーを比較して行うことも可能である。

【０１６５】さらに、上述の場合には、注目データ付近
の合成音データの波形の推移を、「定常状態」、「立ち
上がり状態」、または「たち下がり状態」の３つの状態
のうちのいずれかに判定するようにしたが、４以上の状
態のいずれかに判定することも可能である。即ち、例え
ば、図１４では、ステップＳ２２において、差分値Ｐ _n
−Ｐ_n-1の絶対値、および差分値Ｐ_n+1−Ｐ_nの絶対値
を、いずれも、１つの閾値εと比較し、その大小関係を
判定しているが、差分値Ｐ_n−Ｐ_n-1の絶対値や、差分値
Ｐ_n+1−Ｐ_nの絶対値を、複数の閾値と比較するようにす
ることで、注目データ付近の合成音データの波形の推移
を、４以上の状態のいずれかに判定することが可能であ
る。

【０１６６】そして、このように、注目データ付近の合
成音データの波形の推移を、４以上の状態のいずれかに
判定する場合においては、予測タップは、注目サブフレ
ームの合成音データと、タグ対応の過去データまたはタ
グ対応の未来データの他、例えば、そのタグ対応の過去
データまたはタグ対応の未来データを注目データとした
ときに、タグ対応の過去データまたはタグ対応の未来デ
ータとなる合成音データを含めて構成すること等が可能
である。

【０１６７】ところで、タップ生成部３０１において、
以上のように予測タップを生成する場合には、その予測
タップを構成する合成音データのサンプル数は変化す
る。このことは、タップ生成部３０２において生成され
るクラスタップについても同様である。

【０１６８】予測タップについては、それを構成するデ
ータの数（タップ数）が変化しても、その予測タップと
同一の数のタップ係数を、後述する図１６の学習装置に
おいて学習し、係数メモリ１２４に記憶させておけば良
いから問題はない。

【０１６９】一方、クラスタップについては、それを構
成するタップ数が変化すると、各タップ数のクラスタッ
プごとに得られる全クラス数が変化することから、処理
が複雑になるおそれがある。そこで、クラスタップのタ
ップ数が変化しても、そのクラスタップにより得られる
クラス数が変化しないようなクラス分類を行うのが望ま
しい。

【０１７０】このように、クラスタップのタップ数が変
化しても、そのクラスタップにより得られるクラス数が
変化しないようなクラス分類を行う方法としては、クラ
ス分類において、例えば、クラスタップの構成を考慮す
る方法がある。

【０１７１】即ち、本実施の形態では、クラスタップ
が、注目サブフレームの合成音データの他に、タグ対応
の過去データもしくはタグ対応の未来データの一方また
は両方を含めて構成されることによって、クラスタップ
のタップ数が増減する。そこで、例えば、いま、クラス
タップが、注目サブフレームの合成音データと、タグ対
応の過去データもしくはタグ対応の未来データの一方と
から構成される場合に、そのタップ数がＳ個であると
し、クラスタップが、注目サブフレームの合成音データ
と、タグ対応の過去データおよびタグ対応の未来データ
の両方とから構成される場合に、そのタップ数がＬ（＞
Ｓ）個であるとする。そして、タップ数がＳ個の場合
は、ｎビットのクラスコードが得られ、タップ数がＬ個
の場合は、ｎ＋ｍビットのクラスコードが得られるとす
る。

【０１７２】この場合、クラスコードとして、ｎ＋ｍ＋
２ビットを用いるとともに、そのｎ＋ｍ＋２ビットのう
ちの、例えば、上位ビットの２ビットを、クラスタップ
が、タグ対応の過去データを含む場合、タグ対応の未来
データを含む場合、その両方を含む場合の３つの場合と
で、それぞれ、例えば、”００”，”０１”，”１０”
に設定することにより、タップ数がＳ個とＬ個のいずれ
であっても、全クラス数が２^n+m+2クラスのクラス分類
が可能となる。

【０１７３】即ち、クラスタップが、タグ対応の過去デ
ータと、タグ対応の未来データの両方を含み、そのタッ
プ数がＬ個の場合には、ｎ＋ｍビットのクラスコードが
得られるクラス分類を行い、そのｎ＋ｍビットのクラス
コードに、その上位２ビットとして、クラスタップが、
タグ対応の過去データと、タグ対応の未来データの両方
を含むことを表す”１０”を付加したｎ＋ｍ＋２ビット
を最終的なクラスコードとすれば良い。

【０１７４】また、クラスタップが、タグ対応の過去デ
ータを含み、そのタップ数がＳ個の場合には、ｎビット
のクラスコードが得られるクラス分類を行い、そのｎビ
ットのクラスコードに、その上位ビットとして、ｍビッ
トの”０”を付加してｎ＋ｍビットとし、さらに、その
ｎ＋ｍビットに、上位ビットとして、クラスタップが、
タグ対応の過去データを含むことを表す”００”を付加
したｎ＋ｍ＋２ビットを最終的なクラスコードとすれば
良い。

【０１７５】さらに、クラスタップが、タグ対応の未来
データを含み、そのタップ数がＳ個の場合には、ｎビッ
トのクラスコードが得られるクラス分類を行い、そのｎ
ビットのクラスコードに、その上位ビットとして、ｍビ
ットの”０”を付加してｎ＋ｍビットとし、さらに、そ
のｎ＋ｍビットに、上位ビットとして、クラスタップ
が、タグ対応の未来データを含むことを表す”０１”を
付加したｎ＋ｍ＋２ビットを最終的なクラスコードとす
れば良い。

【０１７６】次に、図１３のタップ生成部３０１では、
フレームパワー計算部３１３において、合成音データか
ら、そのフレーム単位のパワーを計算するようにした
が、CELP方式によって、音声を符号化した符号化データ
（コードデータ）には、上述したように、フレームエネ
ルギが含められる場合があり、この場合には、そのフレ
ームエネルギを、そのフレームにおける合成音のパワー
として採用することが可能である。

【０１７７】図１５は、フレームエネルギを、そのフレ
ームにおける合成音のパワーとして採用する場合の、図
１１のタップ生成部３０１の構成例を示している。な
お、図中、図１３における場合と対応する部分について
は、同一の符号を付してある。即ち、図１５のタップ生
成部３０１は、フレームパワー計算部３１３が設けられ
ていない他は、図１３における場合と同様に構成されて
いる。

【０１７８】但し、バッファ３１４には、受信部１１４
（図１１）に供給される符号化データ（コードデータ）
に含まれる、フレームごとのフレームエネルギが供給さ
れているようになっており、バッファ３１４は、このフ
レームエネルギを記憶するようになっている。そして、
状態判定部３１５は、このフレームエネルギを、上述し
た、合成音データから求められるフレーム単位のパワー
と同様に用いて、注目データ付近の合成音データの波形
の推移を判定する。

【０１７９】ここで、符号化データに含まれる、フレー
ムごとのフレームエネルギは、チャネルエンコーダ２１
において、符号化データから分離され、タップ生成部３
０１に供給される。

【０１８０】なお、タップ生成部３０２も、図１５に示
したように構成することが可能である。

【０１８１】次に、図１６は、受信部１１４が図１１に
示したように構成される場合に、その係数メモリ１２４
に記憶されるタップ係数を学習する学習装置の一実施の
形態の構成例を示している。なお、図中、図９における
場合と対応する部分については、同一の符号を付してあ
り、以下では、その説明は、適宜省略する。即ち、図１
６の学習装置は、タップ生成部１３１と１３２に替え
て、タップ生成部３２１と３２２がそれぞれ設けられて
いる他は、図９における場合と同様に構成される。

【０１８２】タップ生成部３２１と３２２は、図１１の
タップ生成部３０１と３０２における場合とそれぞれ同
様にして、予測タップとクラスタップを構成する。

【０１８３】従って、この場合、より高音質の音声を復
号することのできるタップ係数を得ることができる。

【０１８４】なお、学習装置において、予測タップやク
ラスタップの生成にあたり、注目データ付近の合成音デ
ータの波形の推移の判定を、図１５で説明したように、
フレームごとのフレームエネルギを用いて行う場合に
は、そのフレームエネルギは、ＬＰＣ分析部２０４にお
けるＬＰＣ分析の過程で得られる自己相関係数を用いて
計算することができる。

【０１８５】そこで、図１７は、自己相関係数からフレ
ームエネルギを求める場合の図１６のタップ生成部３２
１の構成例を示している。なお、図中、図１３のタップ
生成部３０１における場合と対応する部分については、
同一の符号を付してあり、以下では、その説明は、適宜
省略する。即ち、図１７のタップ生成部３２１は、フレ
ームパワー計算部３１３に替えてフレームエネルギ計算
部３３１が設けられている他は、図１３におけるタップ
生成部３０１と同様に構成されている。

【０１８６】フレームエネルギ計算部３３１には、図１
６のＬＰＣ分析部２０４がＬＰＣ分析を行う過程で求め
られる音声の自己相関係数が供給されるようになってお
り、フレームエネルギ計算部３３１は、その自己相関係
数から、符号化データ（コードデータ）に含められるフ
レームエネルギを計算し、バッファ３１４に供給する。

【０１８７】従って、図１７の実施の形態では、状態判
定部３１５は、このフレームエネルギを、上述した、合
成音データから求められるフレーム単位のパワーと同様
に用いて、注目データ付近の合成音データの波形の推移
を判定する。

【０１８８】なお、図１６のクラスタップを生成するタ
ップ生成部３２２も、図１７に示したように構成するこ
とが可能である。

【０１８９】次に、図１８は、図４の受信部１１４の第
３の構成例を示している。なお、図中、図５または図１
１における場合と対応する部分については、同一の符号
を付してあり、その説明は、適宜省略する。

【０１９０】図５や図１１の受信部１１４は、音声合成
フィルタ２９が出力する合成音データに対して、クラス
分類適応処理を施すことによって、高音質の音声を復号
するようになっていたが、図１８の受信部１１４は、音
声合成フィルタ２９に入力される残差信号（復号残差信
号）と、線形予測係数（復号線形予測係数）に対して、
クラス分類適応処理を施すことによって、高音質の音声
を復号するようになっている。

【０１９１】即ち、適応コードブック記憶部２２、ゲイ
ン復号器２３、励起コードブック記憶部２４、および演
算器２６乃至２８において、Ｌコード、Ｇコード、およ
びＩコードから復号される残差信号である復号残差信号
や、フィルタ係数復号器２５において、Ａコードから復
号される線形予測係数である復号線形予測係数は、前述
したように、誤差を含むものとなっており、そのまま音
声合成フィルタ２９に入力したのでは、音声合成フィル
タ２９から出力される合成音データの音質が劣化する。

【０１９２】そこで、図１８の受信部１１４では、学習
により求めたタップ係数を用いた予測演算を行うことに
より、真の残差信号と線形予測係数の予測値を求め、こ
れらを音声合成フィルタ２９に与えることで、高音質の
合成音を生成するようになっている。

【０１９３】即ち、図１８の受信部１１４では、例え
ば、クラス分類適応処理を利用して、復号残差信号が、
真の残差信号（の予測値）に復号されるとともに、復号
線形予測係数が、真の線形予測係数（の予測値）に復号
され、その残差信号と線形予測係数を、音声合成フィル
タ２９に与えることで、高音質の合成音データが求めら
れる。

【０１９４】そのために、演算器２８が出力する復号残
差信号は、タップ生成部３４１と３２に供給される。ま
た、タップ生成部３４１と３４２には、チャネルデコー
ダ２１が出力するＬコードも供給されるようになってい
る。

【０１９５】そして、タップ生成部３４１は、図５のタ
ップ生成部１２１や図１１のタップ生成部３０１と同様
にして、そこに供給される復号残差信号から、予測タッ
プとするサンプルを、Ｌコードに基づいて抽出し、予測
部３４５に供給する。

【０１９６】タップ生成部３４２も、図５のタップ生成
部１２２や図１１のタップ生成部３０２と同様にして、
そこに供給される復号残差信号から、クラスタップとす
るサンプルを、Ｌコードに基づいて抽出し、予測部３４
５に供給する。

【０１９７】クラス分類部３４３は、タップ生成部３４
２から供給されるクラスタップに基づいて、クラス分類
を行い、そのクラス分類結果としてのクラスコードを、
係数メモリ３４４に供給する。

【０１９８】係数メモリ３４４は、後述する図２１の学
習装置において学習処理が行われることにより得られ
る、クラスごとの残差信号についてのタップ係数ｗ_(e)
を記憶しており、クラス分類部３４３が出力するクラス
コードに対応するアドレスに記憶されているタップ係数
を、予測部３４５に供給する。

【０１９９】予測部３４５は、タップ生成部３４１が出
力する予測タップと、係数メモリ３４４が出力する残差
信号についてのタップ係数とを取得し、その予測タップ
とタップ係数とを用いて、式（６）に示した線形予測演
算を行う。これにより、予測部３４５は、注目サブフレ
ームの残差信号（の予測値）ｅｍを求めて、音声合成フ
ィルタ２９に、入力信号として供給する。

【０２００】タップ生成部３５１と３５２には、フィル
タ係数復号器２５が出力する、サブフレームごとの復号
線形予測係数α_p’が供給されるようになっており、タ
ップ生成部３５１と３５２は、その復号線形予測係数か
ら、予想タップとクラスタップとするものをそれぞれ抽
出する。ここで、タップ生成部３５１と３５２は、例え
ば、注目サブフレームの線形予測係数すべてを、それぞ
れ、予測タップとクラスタップとする。予測タップは、
タップ生成部３５１から予測部３５５に供給され、クラ
スタップは、タップ生成部３５２からクラス分類部３５
３に供給される。

【０２０１】クラス分類部３５３は、タップ生成部３５
２から供給されるクラスタップに基づいて、クラス分類
を行い、そのクラス分類結果としてのクラスコードを、
係数メモリ３５４に供給する。

【０２０２】係数メモリ３５４は、後述する図２１の学
習装置において学習処理が行われることにより得られ
る、クラスごとの線形予測係数についてのタップ係数ｗ
_(a)を記憶しており、クラス分類部３５３が出力するク
ラスコードに対応するアドレスに記憶されているタップ
係数を、予測部３５５に供給する。

【０２０３】予測部３５５は、タップ生成部３５１が出
力する予測タップと、係数メモリ３５４が出力する線形
予測係数についてのタップ係数とを取得し、その予測タ
ップとタップ係数とを用いて、式（６）に示した線形予
測演算を行う。これにより、予測部３５５は、注目サブ
フレームの線形予測係数（の予測値）ｍα_pを求めて、
音声合成フィルタ２９に供給する。

【０２０４】次に、図１９のフローチャートを参照し
て、図１８の受信部１１４の処理について説明する。

【０２０５】チャネルデコーダ２１は、そこに供給され
るコードデータから、Ｌコード、Ｇコード、Ｉコード、
Ａコードを分離し、それぞれを、適応コードブック記憶
部２２、ゲイン復号器２３、励起コードブック記憶部２
４、フィルタ係数復号器２５に供給する。さらに、Ｌコ
ードは、タップ生成部３４１と３４２にも供給される。

【０２０６】そして、適応コードブック記憶部２２、ゲ
イン復号器２３、励起コードブック記憶部２４、演算器
２６乃至２８では、図１の適応コードブック記憶部９、
ゲイン復号器１０、励起コードブック記憶部１１、演算
器１２乃至１４における場合と同様の処理が行われ、こ
れにより、Ｌコード、Ｇコード、およびＩコードが、残
差信号ｅに復号される。この復号残差信号は、演算器２
８からタップ生成部３４１と３４２に供給される。

【０２０７】さらに、フィルタ係数復号器２５は、図２
で説明したように、そこに供給されるＡコードを、復号
線形予測係数に復号し、タップ生成部３５１と３５２に
供給する。

【０２０８】そして、ステップＳ３１において、予測タ
ップとクラスタップが生成される。

【０２０９】即ち、タップ生成部３４１は、そこに供給
される復号残差信号のサブフレームを、順次、注目サブ
フレームとし、さらに、その注目サブフレームの復号残
差信号のサンプル値を、順次、注目データとして、注目
サブフレームにおける復号残差信号を抽出するととも
に、チャネルデコーダ２１が出力する注目サブフレーム
に配置されたＬコード等に基づいて、注目サブフレーム
以外の復号残差信号を抽出し、即ち、注目サブフレーム
に配置されているＬコードが表すラグだけ過去の位置を
始点とする４０サンプルの復号残差信号（これも、以
下、適宜、ラグ対応の過去データという）、またはＬコ
ードが表すラグだけ過去の位置が注目データの位置とな
るＬコードが配置された、注目サブフレームから見て未
来方向のサブフレームに配置された４０サンプルの復号
残差信号（これも、以下、適宜、ラグ対応の未来データ
という）を抽出し、予測タップを生成する。タップ生成
部３４２も、タップ生成部３４１と同様にして、クラス
タップを生成する。

【０２１０】さらに、ステップＳ３１では、タップ生成
部３５１と３５２が、フィルタ係数復号器３５が出力す
る注目サブフレームの復号線形予測係数を、それぞれ、
予測タップとクラスタップとして抽出する。

【０２１１】そして、タップ生成部３４１で得られた予
測タップは予測部３４５に、タップ生成部３４２で得ら
れたクラスタップはクラス分類部３４３に、タップ生成
部３５１で得られた予測タップは予測部３５５に、タッ
プ生成部３５２で得られたクラスタップはクラス分類部
３５３に、それぞれ供給される。

【０２１２】そして、ステップＳ３２に進み、クラス分
類部３４３が、タップ生成部３４２から供給されるクラ
スタップに基づいて、クラス分類を行い、その結果得ら
れるクラスコードを、係数メモリ３４４に供給するとと
もに、クラス分類部３５３が、タップ生成部３５２から
供給されるクラスタップに基づいて、クラス分類を行
い、その結果得られるクラスコードを、係数メモリ３５
４に供給して、ステップＳ３３に進む。

【０２１３】ステップＳ３３では、係数メモリ３４４
が、クラス分類部３４３から供給されるクラスコードに
対応するアドレスから、残差信号についてのタップ係数
を読み出し、予測部３４５に供給するとともに、係数メ
モリ３５４が、クラス分類部３４３から供給されるクラ
スコードに対応するアドレスから、線形予測係数につい
てのタップ係数を読み出し、予測部３５５に供給する。

【０２１４】そして、ステップＳ３４に進み、予測部３
４５は、係数メモリ３４４が出力する残差信号について
のタップ係数を取得し、そのタップ係数と、タップ生成
部３４１からの予測タップとを用いて、式（６）に示し
た積和演算を行い、注目サブフレームの真の残差信号
（の予測値）を得る。さらに、ステップＳ３４では、予
測部３５５は、係数メモリ３４４が出力する線形予測係
数についてのタップ係数を取得し、そのタップ係数と、
タップ生成部３５１からの予測タップとを用いて、式
（６）に示した積和演算を行い、注目サブフレームの真
の線形予測係数（の予測値）を得る。

【０２１５】以上のようにして得られた残差信号および
線形予測係数は、音声合成フィルタ２９に供給され、音
声合成フィルタ２９では、その残差信号および線形予測
係数を用いて、式（４）の演算が行われることにより、
注目サブフレームの注目データに対応する合成音データ
が生成される。この合成音データは、音声合成フィルタ
２９から、Ｄ／Ａ変換部３０を介して、スピーカ３１に
供給され、これにより、スピーカ３１からは、その合成
音データに対応する合成音が出力される。

【０２１６】予測部３４５と３５５において、残差信号
と線形予測係数がそれぞれ得られた後は、ステップＳ３
５に進み、まだ、注目サブフレームとして処理すべきサ
ブフレームのＬコード、Ｇコード、Ｉコード、およびＡ
コードがあるかどうかが判定される。ステップＳ３５に
おいて、まだ、注目サブフレームとして処理すべきフレ
ームのＬコード、Ｇコード、Ｉコード、およびＡコード
があると判定された場合、ステップＳ３１に戻り、次に
注目サブフレームとすべきサブフレームを、新たに注目
サブフレームとして、以下、同様の処理を繰り返す。ま
た、ステップＳ３５において、注目サブフレームとして
処理すべきフレームのＬコード、Ｇコード、Ｉコード、
およびＡコードがないと判定された場合、処理を終了す
る。

【０２１７】次に、図１８のタップ生成部３４１におい
ては（クラスタップを生成するタップ生成部３４２につ
いても同様）、予測タップが、注目サブフレームの復号
残差信号と、ラグ対応の過去データもしくはラグ対応の
未来データのうちの一方または両方から構成されるが、
その構成は、固定とすることもできるが、残差信号の波
形の推移に基づいて可変にすることもできる。

【０２１８】図２０は、残差信号の波形の推移に基づい
て、予測タップの構成を可変にする場合のタップ生成部
３４１の構成例を示している。なお、図中、図１３にお
ける場合と対応する部分については、同一の符号を付し
てあり、以下では、その説明は、適宜省略する。即ち、
図２０のタップ生成部３４１は、合成音メモリ３１１と
フレームパワー計算部３１３に替えて、残差信号メモリ
３６１とフレームパワー計算部３６３が設けられている
他は、図１３のタップ生成部３０１と同様に構成されて
いる。

【０２１９】残差信号メモリ３６１には、演算器２８
（図１８）が出力する復号残差信号が順次供給されるよ
うになっており、残差信号メモリ３６１は、その復号残
差信号を、順次記憶する。なお、残差信号メモリ３６１
は、注目データについて予測タップとされる可能性のあ
る復号残差信号のうちの、最も過去のサンプルから、最
も未来のサンプルまでの間の復号残差信号を記憶するこ
とのできる記憶容量を少なくとも有している。また、残
差信号メモリ３６１は、その記憶容量分だけ、復号残差
信号を記憶すると、次に供給される復号残差信号のサン
プル値を、最も古い記憶値に上書きする形で記憶するよ
うになっている。

【０２２０】フレームパワー計算部３６３は、残差信号
メモリ３６１に記憶された残差信号を用い、所定のフレ
ーム単位で、そのフレームにおける残差信号のパワーを
求め、バッファ３１４に供給する。なお、フレームパワ
ー計算部３６３でパワーを求める単位であるフレーム
は、図１３のフレームパワー計算部３１３における場合
と同様に、CELP方式におけるフレームやサブフレームに
一致していても良いし、一致していなくても良い。

【０２２１】従って、図２０のタップ生成部３４１で
は、合成音データのパワーでなく、復号残差信号のパワ
ーが求められ、そのパワーに基づいて、残差信号の波形
の推移が、例えば、図１２で説明したように、立ち上が
り状態、たち下がり状態、定常状態のうちのいずれであ
るかが判定される。そして、その判定結果に基づいて、
注目サブフレームの復号残差信号の他、ラグ対応の過去
データもしくはラグ対応の未来データのうちの一方また
は両方が抽出され、予測タップが生成される。

【０２２２】なお、図１８のタップ生成部３４２も、図
２０に示したタップ生成部３４１と同様に構成すること
ができる。

【０２２３】また、図１８の実施の形態では、復号残差
信号についてだけ、Ｌコードに基づいて、予測タップや
クラスタップを生成するようにしたが、復号線形予測係
数についても、Ｌコードに基づいて、注目サブフレーム
以外の復号線形予測係数を抽出し、予測タップやクラス
タップを生成するようにすることが可能である。この場
合、図１８において点線で示すように、チャネルデコー
ダ２１が出力するＬコードを、タップ生成部３５１や３
５２に供給するようにすれば良い。

【０２２４】さらに、上述の場合においては、予測タッ
プやクラスタップを、合成音データから生成するときに
は、合成音データのパワーを求め、そのパワーに基づ
き、合成音データの波形の推移を判定し、また、復号残
差信号から生成するときには、復号残差信号のパワーを
求め、そのパワーに基づき、合成音データの波形の推移
を判定するようにしたが、合成音データの波形の推移
は、残差信号のパワーに基づいて判定することが可能で
あり、同様に、残差信号の波形の推移は、合成音データ
のパワーに基づいて判定することが可能である。

【０２２５】次に、図２１は、図１８の係数メモリ３４
４と３５４に記憶させるタップ係数の学習処理を行う学
習装置の一実施の形態の構成例を示している。なお、図
中、図１６における場合と対応する部分については、同
一の符号を付してあり、以下では、その説明は、適宜省
略する。

【０２２６】予測フィルタ３７０には、Ａ／Ｄ変換部２
０２が出力する、ディジタル信号とされた学習用の音声
信号と、ＬＰＣ分析部２０４が出力する線形予測係数が
供給される。また、タップ生成部３７１と３７２には、
演算器２１４が出力する復号残差信号（音声合成フィル
タ２０６に供給されるのと同一の残差信号）、およびコ
ード決定部２１５が出力するＬコードが供給され、タッ
プ生成部３８１と３８２には、ベクトル量子化部２０５
が出力する復号線形予測係数（ベクトル量子化に用いら
れるコードブックのコードベクトル（セントロイドベク
トル）を構成する線形予測係数）が供給される。さら
に、正規方程式加算回路３８４には、ＬＰＣ分析部２０
４が出力する線形予測係数が供給される。

【０２２７】予測フィルタ３７０は、Ａ／Ｄ変換部２０
２から供給される学習用の音声信号のサブフレームを、
順次、注目サブフレームとして、その注目サブフレーム
の音声信号と、ＬＰＣ分析部２０４から供給される線形
予測係数を用いて、例えば、式（１）にしたがった演算
を行うことにより、注目フレームの残差信号を求める。
この残差信号は、教師データとして、正規方程式加算回
路３７４に供給される。

【０２２８】タップ生成部３７１は、演算器２１４から
供給される復号残差信号を用い、コード決定部２１５が
出力するＬコードに基づいて、図１８のタップ生成部３
４１における場合と同一の予測タップを生成し、正規方
程式加算回路３７４に供給する。タップ生成部３７２
も、演算器２１４から供給される復号残差信号を用い、
コード決定部２１５が出力するＬコードに基づいて、図
１８のタップ生成部３４２における場合と同一のクラス
タップを生成し、クラス分類部３７３に供給する。

【０２２９】クラス分類部３７３は、タップ生成部３７
１から供給されるクラスタップに基づき、図１８のクラ
ス分類部３４３における場合と同様にのクラス分類を行
い、その結果得られるクラスコードを、正規方程式加算
回路３７４に供給する。

【０２３０】正規方程式加算回路３７４は、予測フィル
タ３７０からの注目サブフレームの残差信号を、教師デ
ータとして受信するとともに、タップ生成部３７１から
の予測タップを、生徒データとして受信し、その教師デ
ータおよび生徒データを対象として、クラス分類部３７
３からのクラスコードごとに、図９や図１６の正規方程
式加算回路１３４における場合と同様の足し込みを行う
ことにより、各クラスについて、残差信号に関する式
（１３）に示した正規方程式をたてる。

【０２３１】タップ係数決定回路３７５は、正規方程式
加算回路３７４においてクラスごとに生成された正規方
程式それぞれを解くことにより、クラスごとに、残差信
号についてのタップ係数をそれぞれ求め、係数メモリ３
７６の、各クラスに対応するアドレスにそれぞれ供給す
る。

【０２３２】係数メモリ３７６は、タップ係数決定回路
３７５から供給されるクラスごとの残差信号についての
タップ係数を記憶する。

【０２３３】タップ生成部３８１は、ベクトル量子化部
２０５から供給される、コードベクトルの要素となって
いる線形予測係数、即ち、復号線形予測係数を用いて、
図１８のタップ生成部３５１における場合と同一の予測
タップを生成し、正規方程式加算回路３８４に供給す
る。タップ生成部３８２も、ベクトル量子化部２０５か
ら供給される復号線形予測係数を用い、図１８のタップ
生成部３５２における場合と同一のクラスタップを生成
し、クラス分類部３８３に供給する。

【０２３４】なお、図１８の実施の形態において、復号
線形予測係数につき、Ｌコードに基づいて、注目サブフ
レーム以外の復号線形予測係数を抽出して、予測タップ
やクラスタップを生成する場合には、図２１のタップ生
成部３８１や３８２においても、同様にして、予測タッ
プやクラスタップを生成する必要があり、この場合、タ
ップ生成部３８１や３８２には、図２１において点線で
示すように、コード決定部２１５が出力するＬコードが
供給される。

【０２３５】クラス分類部３８３は、図１８のクラス分
類部３５３における場合と同様に、タップ生成部３８２
からのクラスタップに基づいて、クラス分類を行い、そ
の結果得られるクラスコードを、正規方程式加算回路３
８４に供給する。

【０２３６】正規方程式加算回路３８４は、ＬＰＣ分析
部２０４からの注目サブフレームの線形予測係数を、教
師データとして受信するとともに、タップ生成部３８１
からの予測タップを、生徒データとして受信し、その教
師データおよび生徒データを対象として、クラス分類部
３８３からのクラスコードごとに、図９や図１６の正規
方程式加算回路１３４における場合と同様の足し込みを
行うことにより、各クラスについて、線形予測係数に関
する式（１３）に示した正規方程式をたてる。

【０２３７】タップ係数決定回路３８５は、正規方程式
加算回路３８４においてクラスごとに生成された正規方
程式を解くことにより、クラスごとに、線形予測係数に
ついてのタップ係数をそれぞれ求め、係数メモリ３８６
の、各クラスに対応するアドレスに供給する。

【０２３８】係数メモリ３８６は、タップ係数決定回路
３８５から供給されるクラスごとの線形予測係数につい
てのタップ係数を記憶する。

【０２３９】なお、学習用の音声信号として用意する音
声信号によっては、正規方程式加算回路３７４や３８４
において、タップ係数を求めるのに必要な数の正規方程
式が得られないクラスが生じる場合があり得るが、タッ
プ係数決定回路３７５と３８５は、そのようなクラスに
ついては、例えば、デフォルトのタップ係数を出力す
る。

【０２４０】次に、図２２のフローチャートを参照し
て、図２１の学習装置が行う、残差信号と線形予測係数
それぞれについてのタップ係数を求める学習処理につい
て説明する。

【０２４１】学習装置には、学習用の音声信号が供給さ
れ、ステップＳ４１において、その学習用の音声信号か
ら、教師データと生徒データが生成される。

【０２４２】即ち、学習用の音声信号は、マイク２０１
に入力され、マイク２０１乃至コード決定部２１５は、
図１のマイク１乃至コード決定部１５における場合とそ
れぞれ同様の処理を行う。

【０２４３】その結果、ＬＰＣ分析部２０４で得られる
線形予測係数は、教師データとして、正規方程式加算回
路３８４に供給される。また、この線形予測係数は、予
測フィルタ３７０にも供給される。さらに、演算器２１
４で得られる復号残差信号は、生徒データとして、タッ
プ生成部３７１および３７２に供給される。

【０２４４】また、Ａ／Ｄ変換部２０２が出力するディ
ジタルの音声信号は、予測フィルタ３７０に供給され、
ベクトル量子化部２０５が出力する復号線形予測係数
は、生徒データとして、タップ生成部３８１および３８
２に供給される。さらに、コード決定部２１５は、自乗
誤差最小判定部２０８から確定信号を受信したときの、
自乗誤差最小判定部２０８からのＬコードを、タップ生
成部３７１および３７２に供給する。

【０２４５】そして、予測フィルタ３７０は、Ａ／Ｄ変
換部２０２から供給される学習用の音声信号のサブフレ
ームを、順次、注目サブフレームとして、その注目サブ
フレームの音声信号と、ＬＰＣ分析部２０４から供給さ
れる線形予測係数（注目サブフレームの音声信号から求
められた線形予測係数）を用いて、式（１）にしたがっ
た演算を行うことにより、注目サブフレームの残差信号
を求める。この予測フィルタ３７０で得られる残差信号
は、教師データとして、正規方程式加算回路３７４に供
給される。

【０２４６】以上のようにして、教師データと生徒デー
タが得られた後は、ステップＳ４２に進み、タップ生成
部３７１と３７２が、演算器２１４から供給される復号
残差信号を用い、コード決定部２１５からのＬコードに
基づいて、残差信号についての予測タップとクラスタッ
プをそれぞれ生成する。即ち、タップ生成部３７１と３
７２は、演算器２１４からの注目サブフレームの復号残
差信号と、ラグ対応の過去データまたはラグ対応の未来
データとから、残差信号についての予測タップとクラス
タップをそれぞれ生成する。

【０２４７】さらに、ステップＳ４２では、タップ生成
部３８１と３８２が、ベクトル量子化部２０５から供給
される注目サブフレームの線形予測係数から、線形予測
係数についての予測タップとクラスタップを生成する。

【０２４８】そして、残差信号についての予測タップ
は、タップ生成部３７１から正規方程式加算回路３７４
に供給され、残差信号についてのクラスタップは、タッ
プ生成部３７２からクラス分類部３７３に供給される。
また、線形予測係数についての予測タップは、タップ生
成部３８１から正規方程式加算回路３８４に供給され、
線形予測係数についてのクラスタップは、タップ生成部
３８２からクラス分類回路３８３に供給される。

【０２４９】その後、ステップＳ４３において、クラス
分類部３７３と３８３が、そこに供給されるクラスタッ
プに基づいて、クラス分類を行い、その結果得られるク
ラスコードを、正規方程式加算回路３８４と３７４に、
それぞれ供給する。

【０２５０】そして、ステップＳ４４に進み、正規方程
式加算回路３７４が、予測フィルタ３７０からの教師デ
ータとしての注目サブフレームの残差信号、およびタッ
プ生成部３７１からの生徒データとしての予測タップを
対象として、式（１３）の行列Ａとベクトルｖの、上述
したような足し込みを、クラス分類部３７３からのクラ
スコードごとに行う。さらに、ステップＳ４４では、正
規方程式加算回路３８４が、ＬＰＣ分析部２０４からの
教師データとしての注目サブフレームの線形予測係数、
およびタップ生成部３８１からの生徒データとしての予
測タップを対象として、式（１３）の行列Ａとベクトル
ｖの、上述したような足し込みを、クラス分類部３８３
からのクラスコードごとに行い、ステップＳ４５に進
む。

【０２５１】ステップＳ４５では、まだ、注目サブフレ
ームとして処理すべきフレームの学習用の音声信号があ
るかどうかが判定される。ステップＳ４５において、ま
だ、注目サブフレームとして処理すべきサブフレームの
学習用の音声信号があると判定された場合、ステップＳ
４１に戻り、次のサブフレームを新たに注目サブフレー
ムとして、以下、同様の処理が繰り返される。

【０２５２】また、ステップＳ４５において、注目サブ
フレームとして処理すべきサブフレームの学習用の音声
信号がないと判定された場合、ステップＳ４６に進み、
タップ係数決定回路３７５は、各クラスごとに生成され
た正規方程式を解くことにより、各クラスごとに、残差
信号についてのタップ係数を求め、係数メモリ３７６
の、各クラスに対応するアドレスに供給して記憶させ
る。さらに、タップ係数決定回路３８５も、各クラスご
とに生成された正規方程式を解くことにより、各クラス
ごとに、線形予測係数についてのタップ係数を求め、係
数メモリ３８６の、各クラスに対応するアドレスに供給
して記憶させ、処理を終了する。

【０２５３】以上のようにして、係数メモリ３７６に記
憶された各クラスごとの残差信号についてのタップ係数
が、図１８の係数メモリ３４４に記憶され、係数メモリ
３８６に記憶された各クラスごとの線形予測係数につい
てのタップ係数が、図１８の係数メモリ３５４に記憶さ
れている。

【０２５４】従って、図１８の係数メモリ３４４と３５
４に記憶されたタップ係数は、それぞれ、線形予測演算
を行うことにより得られる真の残差信号と線形予測係数
の予測値の予測誤差（自乗誤差）が、統計的に最小にな
るように学習を行うことにより求められたものであるか
ら、図１８の予測部３４５と３５５が出力する残差信号
と線形予測係数は、それぞれ真の残差信号と線形予測係
数にほぼ一致することとなり、その結果、これらの残差
信号と線形予測係数によって生成される合成音は、歪み
の少ない、高音質のものとなる。

【０２５５】次に、上述した一連の処理は、ハードウェ
アにより行うこともできるし、ソフトウェアにより行う
こともできる。一連の処理をソフトウェアによって行う
場合には、そのソフトウェアを構成するプログラムが、
汎用のコンピュータ等にインストールされる。

【０２５６】そこで、図２３は、上述した一連の処理を
実行するプログラムがインストールされるコンピュータ
の一実施の形態の構成例を示している。

【０２５７】プログラムは、コンピュータに内蔵されて
いる記録媒体としてのハードディスク４０５やＲＯＭ４
０３に予め記録しておくことができる。

【０２５８】あるいはまた、プログラムは、フロッピー
（登録商標）ディスク、CD-ROM(Compact Disc Read Onl
y Memory)，MO(Magneto optical)ディスク，DVD(Digita
l Versatile Disc)、磁気ディスク、半導体メモリなど
のリムーバブル記録媒体４１１に、一時的あるいは永続
的に格納（記録）しておくことができる。このようなリ
ムーバブル記録媒体４１１は、いわゆるパッケージソフ
トウエアとして提供することができる。

【０２５９】なお、プログラムは、上述したようなリム
ーバブル記録媒体４１１からコンピュータにインストー
ルする他、ダウンロードサイトから、ディジタル衛星放
送用の人工衛星を介して、コンピュータに無線で転送し
たり、LAN(Local Area Network)、インターネットとい
ったネットワークを介して、コンピュータに有線で転送
し、コンピュータでは、そのようにして転送されてくる
プログラムを、通信部４０８で受信し、内蔵するハード
ディスク４０５にインストールすることができる。

【０２６０】コンピュータは、CPU(Central Processing
Unit)４０２を内蔵している。CPU４０２には、バス４
０１を介して、入出力インタフェース４１０が接続され
ており、CPU４０２は、入出力インタフェース４１０を
介して、ユーザによって、キーボードや、マウス、マイ
ク等で構成される入力部４０７が操作等されることによ
り指令が入力されると、それにしたがって、ROM(Read O
nly Memory)４０３に格納されているプログラムを実行
する。あるいは、また、CPU４０２は、ハードディスク
４０５に格納されているプログラム、衛星若しくはネッ
トワークから転送され、通信部４０８で受信されてハー
ドディスク４０５にインストールされたプログラム、ま
たはドライブ４０９に装着されたリムーバブル記録媒体
４１１から読み出されてハードディスク４０５にインス
トールされたプログラムを、RAM(Random Access Memor
y)４０４にロードして実行する。これにより、CPU４０
２は、上述したフローチャートにしたがった処理、ある
いは上述したブロック図の構成により行われる処理を行
う。そして、CPU４０２は、その処理結果を、必要に応
じて、例えば、入出力インタフェース４１０を介して、
LCD(Liquid CryStal Display)やスピーカ等で構成され
る出力部４０６から出力、あるいは、通信部４０８から
送信、さらには、ハードディスク４０５に記録等させ
る。

【０２６１】ここで、本明細書において、コンピュータ
に各種の処理を行わせるためのプログラムを記述する処
理ステップは、必ずしもフローチャートとして記載され
た順序に沿って時系列に処理する必要はなく、並列的あ
るいは個別に実行される処理（例えば、並列処理あるい
はオブジェクトによる処理）も含むものである。

【０２６２】また、プログラムは、１のコンピュータに
より処理されるものであっても良いし、複数のコンピュ
ータによって分散処理されるものであっても良い。さら
に、プログラムは、遠方のコンピュータに転送されて実
行されるものであっても良い。

【０２６３】なお、本実施の形態においては、学習用の
音声信号として、どのようなものを用いるかについて
は、特に言及しなかったが、学習用の音声信号として
は、人が発話した音声の他、例えば、曲（音楽）等を採
用することが可能である。そして、上述したような学習
処理によれば、学習用の音声信号として、人の発話を用
いた場合には、そのような人の発話の音声の音質を向上
させるようなタップ係数が得られ、曲を用いた場合に
は、曲の音質を向上させるようなタップ係数が得られる
ことになる。

【０２６４】また、係数メモリ１２４等には、タップ係
数をあらかじめ記憶させておくようにしたが、係数メモ
リ１２４等に記憶させるタップ係数は、携帯電話機１０
１において、図３の基地局１０２（あるいは交換局１０
３）や、図示しないＷＷＷ(World Wide Web)サーバ等か
らダウンロードするようにすることができる。即ち、上
述したように、タップ係数は、人の発話用や曲用等のよ
うに、ある種類の音声信号に適したものを、学習によっ
て得ることができる。さらに、学習に用いる教師データ
および生徒データによっては、合成音の音質に差が生じ
るタップ係数を得ることができる。従って、そのような
各種のタップ係数を、基地局１０２等に記憶させてお
き、ユーザには、自身の所望するタップ係数をダウンロ
ードさせるようにすることができる。そして、このよう
なタップ係数のダウンロードサービスは、無料で行うこ
ともできるし、有料で行うこともできる。さらに、タッ
プ係数のダウンロードサービスを有料で行う場合には、
タップ係数のダウンロードに対する対価としての代金
は、例えば、携帯電話機１０１の通話料等とともに請求
するようにすることが可能である。

【０２６５】また、係数メモリ１２４等は、携帯電話機
１０１に対して着脱可能なメモリカード等で構成するこ
とができる。この場合、上述したような各種のタップ係
数それぞれを記憶させた、異なるメモリカードを提供す
るようにすれば、ユーザは、場合に応じて、所望のタッ
プ係数が記憶されたメモリカードを、携帯電話機１０１
に装着して使用することが可能となる。

【０２６６】さらに、本発明は、例えば、ＶＳＥＬＰ(V
ector Sum Excited Liner Prediction)，ＰＳＩ−ＣＥ
ＬＰ(Pitch Synchronous Innovation CELP)，ＣＳ−Ａ
ＣＥＬＰ(Conjugate Structure Algebraic CELP)等のＣ
ＥＬＰ方式による符号化の結果得られるコードから合成
音を生成する場合に、広く適用可能である。

【０２６７】また、本発明は、ＣＥＬＰ方式による符号
化の結果得られるコードから合成音を生成する場合に限
らず、あるコードから、残差信号と線形予測係数を得
て、合成音を生成する場合に、広く適用可能である。

【０２６８】さらに、本発明は、音声に限らず、例え
ば、画像等にも適用可能である。即ち、本発明は、Ｌコ
ードのような、周期を表す周期情報を用いて処理される
データに、広く適用可能である。

【０２６９】また、本実施の形態では、タップ係数を用
いた線形１次予測演算によって、高音質の音声や、残差
信号、線形予測係数の予測値を求めるようにしたが、こ
の予測値は、その他、２次以上の高次の予測演算によっ
て求めることも可能である。

【０２７０】さらに、本実施の形態では、係数メモリ１
２４等に、タップ係数自体を記憶させておくようにした
が、係数メモリ１２４等には、その他、例えば、無段階
の調整が可能な（アナログ的な変化が可能な）タップ係
数の元（種）となる情報としての係数種を記憶させてお
き、ユーザの操作に応じて、その係数種から、ユーザの
所望する音質の音声が得られるようなタップ係数を生成
するようにすることが可能である。

【０２７１】

【発明の効果】本発明の第１のデータ処理装置およびデ
ータ処理方法、並びにプログラムおよび記録媒体によれ
ば、所定のデータのうちの注目している注目データにつ
き、周期情報に応じて、所定のデータを抽出することに
より、所定の処理に用いるタップが生成され、そのタッ
プを用いて、注目データについて、所定の処理が行われ
る。従って、従って、例えば、品質の良いデータの復号
等が可能となる。

【０２７２】本発明の第２のデータ処理装置およびデー
タ処理方法、並びにプログラムおよび記録媒体によれ
ば、学習の教師となる教師データから、所定のデータと
周期情報が、学習の生徒となる生徒データとして生成さ
れる。そして、生徒データとしての所定のデータのうち
の注目している注目データにつき、周期情報に応じて、
所定のデータを抽出することにより、教師データを予測
するのに用いる予測タップが生成され、予測タップとタ
ップ係数とを用いて、所定の予測演算を行うことにより
得られる教師データの予測値の予測誤差が、統計的に最
小になるように学習が行われ、タップ係数が求められ
る。従って、例えば、品質の良いデータを得るためのタ
ップ係数を得ることが可能となる。

【図面の簡単な説明】

【図１】従来の携帯電話機の送信部の一例の構成を示す
ブロック図である。

【図２】従来の携帯電話機の受信部の一例の構成を示す
ブロック図である。

【図３】本発明を適用した伝送システムの一実施の形態
の構成例を示す図である。

【図４】携帯電話機１０１₁と１０１₂の構成例を示すブ
ロック図である。

【図５】受信部１１４の第１の構成例を示すブロック図
である。

【図６】図５の受信部１１４の処理を説明するフローチ
ャートである。

【図７】予測タップとクラスタップの生成方法を説明す
る図である。

【図８】予測タップとクラスタップの生成方法を説明す
る図である。

【図９】本発明を適用した学習装置の第１実施の形態の
構成例を示すブロック図である。

【図１０】図９の学習装置の処理を説明するフローチャ
ートである。

【図１１】受信部１１４の第２の構成例を示すブロック
図である。

【図１２】合成音データの波形の推移を示す図である。

【図１３】タップ生成部３０１と３０２の構成例を示す
ブロック図である。

【図１４】タップ生成部３０１と３０２の処理を説明す
るフローチャートである。

【図１５】タップ生成部３０１と３０２の他の構成例を
示すブロック図である。

【図１６】本発明を適用した学習装置の第２実施の形態
の構成例を示すブロック図である。

【図１７】タップ生成部３２１と３２２の構成例を示す
ブロック図である。

【図１８】受信部１１４の第３の構成例を示すブロック
図である。

【図１９】図１８の受信部１１４の処理を説明するフロ
ーチャートである。

【図２０】タップ生成部３４１と３４２の構成例を示す
ブロック図である。

【図２１】本発明を適用した学習装置の第３実施の形態
の構成例を示すブロック図である。

【図２２】図２１の学習装置の処理を説明するフローチ
ャートである。

【図２３】本発明を適用したコンピュータの一実施の形
態の構成例を示すブロック図である。

【符号の説明】

２１チャネルデコーダ，２２適応コードブック記
憶部，２３ゲイン復号器，２４励起コードブッ
ク記憶部，２５フィルタ係数復号器，２６乃至２
８演算器，２９音声合成フィルタ，３０Ｄ／
Ａ変換部，３１スピーカ，１０１₁，１０１₂ 携
帯電話機，１０２₁，１０２₂ 基地局，１０３交
換局，１１１アンテナ，１１２変復調部，１
１３送信部，１１４受信部，１２１，１２２
タップ生成部，１２３クラス分類部，１２４係
数メモリ，１２５予測部，１３１，１３２タッ
プ生成部，１３３クラス分類部，１３４正規方
程式加算回路，１３５タップ係数決定回路，１３６
係数メモリ，２０１マイク，２０２Ａ／Ｄ変
換部，２０３演算器，２０４ＬＰＣ分析部，
２０５ベクトル量子化部，２０６音声合成フィル
タ，２０７自乗誤差演算部，２０８自乗誤差最小
判定部，２０９適応コードブック記憶部，２１０
ゲイン復号器，２１１励起コードブック記憶部，
２１２乃至２１４演算器，３０１，３０２タップ
生成部，３１１合成音メモリ，３１２Ｌコード
メモリ，３１３フレームパワー計算部，３１４
バッファ，３１５状態判定部，３１６データ抽
出部，３２１，３２２タップ生成部，３３１フ
レームエネルギ計算部，３４１，３４２タップ生成
部，３４３クラス分類部，３４４係数メモリ，
３４５予測部，３５１，３５２タップ生成部，
３５３クラス分類部，３５４係数メモリ，３
５５予測部，３６１残差信号メモリ，３６３
フレームパワー計算部，３７０予測フィルタ，３７
１，３７２タップ生成部，３７３クラス分類部，
３７４正規方程式加算回路，３７５タップ係数決
定回路，３７６係数メモリ，３８１，３８２タ
ップ生成部，３８３クラス分類部，３８４正規方
程式加算回路，３８５タップ係数決定回路，３８
６係数メモリ，４０１バス，４０２ CPU，
４０３ ROM，４０４ RAM，４０５ハードディス
ク，４０６出力部，４０７入力部，４０８
通信部，４０９ドライブ，４１０入出力インタフ
ェース，４１１リムーバブル記録媒体

───────────────────────────────────────────────────── フロントページの続き (72)発明者渡辺勉東京都品川区北品川６丁目７番35号ソニー株式会社内 (72)発明者服部正明東京都品川区北品川６丁目７番35号ソニー株式会社内Ｆターム(参考） 5D045 CA01 5J064 AA01 BB03 BC14 BC28 BD03

Claims

【特許請求の範囲】

【請求項１】所定のデータと、周期を表す周期情報と
を処理するデータ処理装置であって、前記所定のデータのうちの注目している注目データにつ
き、前記周期情報に応じて、前記所定のデータを抽出す
ることにより、所定の処理に用いるタップを生成するタ
ップ生成手段と、前記タップを用いて、前記注目データについて、所定の
処理を行う処理手段とを備えることを特徴とするデータ
処理装置。
【請求項２】学習を行うことにより求められたタップ
係数を取得するタップ係数取得手段をさらに備え、前記タップ生成手段は、前記タップ係数との所定の予測
演算を行う予測タップを生成し、前記処理手段は、前記予測タップとタップ係数とを用い
て、所定の予測演算を行うことにより、前記学習におい
て教師として用いられた教師データに対応する予測値を
求めることを特徴とする請求項１に記載のデータ処理装
置。
【請求項３】前記処理手段は、前記予測タップとタッ
プ係数とを用いて、線形１次予測演算を行うことによ
り、前記予測値を求めることを特徴とする請求項２に記
載のデータ処理装置。
【請求項４】前記タップ生成手段は、前記注目データ
をクラス分けするクラス分類を行うのに用いるクラスタ
ップを生成し、前記処理手段は、前記クラスタップに基づき、前記注目
データについて、クラス分類を行うことを特徴とする請
求項１に記載のデータ処理装置。
【請求項５】前記タップ生成手段は、学習を行うこと
により求められたタップ係数との所定の予測演算を行う
予測タップを生成するとともに、前記注目データをクラ
ス分けするクラス分類を行うのに用いられるクラスタッ
プを生成し、前記処理手段は、前記クラスタップに基づき、前記注目
データについて、クラス分類を行い、そのクラス分類の
結果得られるクラスに対応する前記タップ係数と、前記
予測タップとを用いて、所定の予測演算を行うことによ
り、前記学習において教師として用いられた教師データ
に対応する予測値を求めることを特徴とする請求項１に
記載のデータ処理装置。
【請求項６】前記所定のデータと周期情報は、音声を
符号化した符号化データから得られるものであることを
特徴とする請求項１に記載のデータ処理装置。
【請求項７】前記符号化データは、音声を、ＣＥＬＰ
(Code Excited Liner Prediction coding)方式によって
符号化したものであることを特徴とする請求項６に記載
のデータ処理装置。
【請求項８】前記周期情報は、ＣＥＬＰ方式で規定さ
れている長期予測ラグであることを特徴とする請求項７
に記載のデータ処理装置。
【請求項９】前記所定のデータは、前記符号化データ
を復号した復号音声データであることを特徴とする請求
項６に記載のデータ処理装置。
【請求項１０】前記所定のデータは、前記符号化デー
タを音声データに復号するのに用いられる残差信号であ
ることを特徴とする請求項６に記載のデータ処理装置。
【請求項１１】前記所定のデータは、時系列のデータ
であり、前記タップ生成手段は、前記注目データから、前記周期
情報に対応する時間だけ離れた位置の前記所定のデータ
を抽出することにより、前記タップを生成することを特
徴とする請求項１に記載のデータ処理装置。
【請求項１２】前記タップ生成手段は、前記注目デー
タから、前記周期情報に対応する時間だけ過去方向もし
くは未来方向に離れた位置の前記所定のデータのうちの
一方または両方を抽出することにより、前記タップを生
成することを特徴とする請求項１１に記載のデータ処理
装置。
【請求項１３】前記所定のデータの波形の推移を判定
する判定手段をさらに備え、前記タップ生成手段は、前記判定手段による判定結果に
基づいて、前記周期情報に対応する時間だけ過去方向も
しくは未来方向に離れた位置の前記所定のデータのうち
の一方または両方を抽出することを特徴とする請求項１
２に記載のデータ処理装置。
【請求項１４】前記判定手段は、前記所定のデータの
パワーに基づいて、その波形の推移を判定することを特
徴とする請求項１３に記載のデータ処理装置。
【請求項１５】所定のデータと、周期を表す周期情報
とを処理するデータ処理方法であって、前記所定のデータのうちの注目している注目データにつ
き、前記周期情報に応じて、前記所定のデータを抽出す
ることにより、所定の処理に用いるタップを生成するタ
ップ生成ステップと、前記タップを用いて、前記注目データについて、所定の
処理を行う処理ステップとを備えることを特徴とするデ
ータ処理方法。
【請求項１６】所定のデータと、周期を表す周期情報
とを、コンピュータに処理させるプログラムであって、前記所定のデータのうちの注目している注目データにつ
き、前記周期情報に応じて、前記所定のデータを抽出す
ることにより、所定の処理に用いるタップを生成するタ
ップ生成ステップと、前記タップを用いて、前記注目データについて、所定の
処理を行う処理ステップとを備えることを特徴とするプ
ログラム。
【請求項１７】所定のデータと、周期を表す周期情報
とを、コンピュータに処理させるプログラムが記録され
ている記録媒体であって、前記所定のデータのうちの注目している注目データにつ
き、前記周期情報に応じて、前記所定のデータを抽出す
ることにより、所定の処理に用いるタップを生成するタ
ップ生成ステップと、前記タップを用いて、前記注目データについて、所定の
処理を行う処理ステップとを備えるプログラムが記録さ
れていることを特徴とする記録媒体。
【請求項１８】所定のデータと、周期を表す周期情報
とを処理するのに用いられる所定のタップ係数を学習す
るデータ処理装置であって、学習の教師となる教師データから、前記所定のデータと
周期情報を、学習の生徒となる生徒データとして生成す
る生徒データ生成手段と、前記生徒データとしての所定のデータのうちの注目して
いる注目データにつき、前記周期情報に応じて、前記所
定のデータを抽出することにより、前記教師データを予
測するのに用いる予測タップを生成する予測タップ生成
手段と、前記予測タップとタップ係数とを用いて、所定の予測演
算を行うことにより得られる前記教師データの予測値の
予測誤差が、統計的に最小になるように学習を行い、前
記タップ係数を求める学習手段とを備えることを特徴と
するデータ処理装置。
【請求項１９】前記学習手段は、前記予測タップとタ
ップ係数とを用いて、線形一次予測演算を行うことによ
り得られる前記教師データの予測値の予測誤差が、統計
的に最小になるように学習を行うことを特徴とする請求
項１８に記載のデータ処理装置。
【請求項２０】前記生徒データとしての所定のデータ
から、前記注目データをクラス分けするクラス分類を行
うのに用いるクラスタップとするものを生成するクラス
タップ生成手段と、前記クラスタップに基づき、前記注目データについて、
クラス分類を行うクラス分類手段とをさらに備え、前記学習手段は、前記クラス分類手段によるクラス分類
の結果得られるクラスごとに、前記タップ係数を求める
ことを特徴とする請求項１８に記載のデータ処理装置。
【請求項２１】前記クラスタップ生成手段は、前記注
目データにつき、前記周期情報に応じて、前記所定のデ
ータを抽出することにより、前記クラスタップを生成す
ることを特徴とする請求項２０に記載のデータ処理装
置。
【請求項２２】前記教師データは、音声データであ
り、前記所定のデータと周期情報は、前記教師データとして
の音声データを符号化した符号化データから得られるも
のであることを特徴とする請求項１８に記載のデータ処
理装置。
【請求項２３】前記符号化データは、音声データを、
ＣＥＬＰ(Code Excited Liner Prediction coding)方式
によって符号化したものであることを特徴とする請求項
２２に記載のデータ処理装置。
【請求項２４】前記周期情報は、ＣＥＬＰ方式で規定
されている長期予測ラグであることを特徴とする請求項
２３に記載のデータ処理装置。
【請求項２５】前記所定のデータは、前記符号化デー
タを復号した復号音声データであることを特徴とする請
求項２２に記載のデータ処理装置。
【請求項２６】前記所定のデータは、前記符号化デー
タを音声データに復号するのに用いられる残差信号であ
ることを特徴とする請求項２２に記載のデータ処理装
置。
【請求項２７】前記所定のデータは、時系列のデータ
であり、前記予測タップ生成手段は、前記注目データから、前記
周期情報に対応する時間だけ離れた位置の前記所定のデ
ータを抽出することにより、前記予測タップを生成する
ことを特徴とする請求項１８に記載のデータ処理装置。
【請求項２８】前記予測タップ生成手段は、前記注目
データから、前記周期情報に対応する時間だけ過去方向
もしくは未来方向に離れた位置の前記所定のデータのう
ちの一方または両方を抽出することにより、前記予測タ
ップを生成することを特徴とする請求項２７に記載のデ
ータ処理装置。
【請求項２９】前記所定のデータの波形の推移を判定
する判定手段をさらに備え、前記予測タップ生成手段は、前記判定手段による判定結
果に基づいて、前記周期情報に対応する時間だけ過去方
向もしくは未来方向に離れた位置の前記所定のデータの
うちの一方または両方を抽出することを特徴とする請求
項２８に記載のデータ処理装置。
【請求項３０】前記判定手段は、前記所定のデータの
パワーに基づいて、その波形の推移を判定することを特
徴とする請求項２９に記載のデータ処理装置。
【請求項３１】所定のデータと、周期を表す周期情報
とを処理するのに用いられる所定のタップ係数を学習す
るデータ処理方法であって、学習の教師となる教師データから、前記所定のデータと
周期情報を、学習の生徒となる生徒データとして生成す
る生徒データ生成ステップと、前記生徒データとしての所定のデータのうちの注目して
いる注目データにつき、前記周期情報に応じて、前記所
定のデータを抽出することにより、前記教師データを予
測するのに用いる予測タップを生成する予測タップ生成
ステップと、前記予測タップとタップ係数とを用いて、所定の予測演
算を行うことにより得られる前記教師データの予測値の
予測誤差が、統計的に最小になるように学習を行い、前
記タップ係数を求める学習ステップとを備えることを特
徴とするデータ処理方法。
【請求項３２】所定のデータと、周期を表す周期情報
とを処理するのに用いられる所定のタップ係数を学習す
るデータ処理を、コンピュータに行わせるプログラムで
あって、学習の教師となる教師データから、前記所定のデータと
周期情報を、学習の生徒となる生徒データとして生成す
る生徒データ生成ステップと、前記生徒データとしての所定のデータのうちの注目して
いる注目データにつき、前記周期情報に応じて、前記所
定のデータを抽出することにより、前記教師データを予
測するのに用いる予測タップを生成する予測タップ生成
ステップと、前記予測タップとタップ係数とを用いて、所定の予測演
算を行うことにより得られる前記教師データの予測値の
予測誤差が、統計的に最小になるように学習を行い、前
記タップ係数を求める学習ステップとを備えることを特
徴とするプログラム。
【請求項３３】所定のデータと、周期を表す周期情報
とを処理するのに用いられる所定のタップ係数を学習す
るデータ処理を、コンピュータに行わせるプログラムが
記録されている記録媒体であって、学習の教師となる教師データから、前記所定のデータと
周期情報を、学習の生徒となる生徒データとして生成す
る生徒データ生成ステップと、前記生徒データとしての所定のデータのうちの注目して
いる注目データにつき、前記周期情報に応じて、前記所
定のデータを抽出することにより、前記教師データを予
測するのに用いる予測タップを生成する予測タップ生成
ステップと、前記予測タップとタップ係数とを用いて、所定の予測演
算を行うことにより得られる前記教師データの予測値の
予測誤差が、統計的に最小になるように学習を行い、前
記タップ係数を求める学習ステップとを備えるプログラ
ムが記録されていることを特徴とする記録媒体。