WO2003001709A1

WO2003001709A1 - Transmission apparatus, transmission method, reception apparatus, reception method, and transmission/reception apparatus

Info

Publication number: WO2003001709A1
Application number: PCT/JP2002/006179
Authority: WO
Inventors: Tetsujiro Kondo; Masaaki Hattori; Tsutomu Watanabe; Hiroto Kimura
Original assignee: Sony Corporation
Priority date: 2001-06-26
Filing date: 2002-06-20
Publication date: 2003-01-03
Also published as: US7366660B2; JP2003005795A; EP1401130A1; US20040024589A1; KR100895745B1; JP4711099B2; CN1465149A; KR20030046419A; CN1465149B; EP1401130A4

Description

送信装置および送信方法、受信装置および受信方法、並びに送受信装置技術分野

本発明は、送信装置および送信方法、受信装置および受信方法、並びに送受信装置に関し、特に、例えば、携帯電話機等において、高音質の音声による通話を行うことができるようにする送信装置および送信方法、受信装置および受信方法、並びに送受信装置に関する。背景技術

例えば、携帯電話機での音声通話においては、伝送帯域が制限されていること等に起因して、受信された音声の音質は、ユーザが発した実際の音声の音質よりも比較的大きく劣化したものとなる。

そこで、.従来の携帯電話機では、受信した音声の音質を改善するために、受信した音声に対して、例えば、その音声の周波数スペクトルを調整するフィルタリング等の信号処理が施される。

しかしながら、ユーザの音声は、ユーザごとに特徴があるため、同一のタツプ係数のフィルタによって、受信した音声のフィルタリングを行うのでは、ュ一ザごとに異なる音声の周波数特性によっては、その音声の音質を十分に改善することができない場合がある。発明の開示

本発明は、このような状況に鑑みてなされたものであり、ユーザごとに、音質を十分に改善した音声を得ることができるようにするものである。

本発明の送信装置は、音声データを符号化し、符号化音声データを出力する符号化手段と、符号化音声データを受信する受信側において出力される音声の品質を向上させる高品質化データの学習を、過去の学習に用いられた音声データと、新たに入力された音声データとに基づいて行う学習手段と、符号化音声データと高品質化データとを送信する送信手段とを備えることを特徴とする。本発明の送信方法は、音声データを符号化し、符号化音声データを出力する符号化ステップと、符号化音声データを受信する受信側において出力される音声の品質を向上させる高品質化データの学習を、過去の学習に用いられた音声データと、新たに入力された音声データとに基づいて行う学習ステップと、符号化音声データと高品質化データとを送信する送信ステップとを備えることを特徴とする。

本発明の第 1のプログラムは、音声データを符号化し、符号化音声データを出力する符号化ステップと、符号化音声データを受信する受信側において出力される音声の品質を向上させる高品質化データの学習を、過去の学習に用いられた音声データと、新たに入力された音声データとに基づいて行う学習ステツプと、符号化音声データと高品質化データとを送信する送信ステップとを備えることを特徴とする。

本発明の第 1の記録媒体は、音声データを符号化し、符号化音声データを出力する符号化ステップと、符号化音声データを受信する受信側において出力される音声の品質を向上させる高品質化データの学習を、過去の学習に用いられた音声データと、新たに入力された音声データとに基づいて行う学習ステップと、符号化音声データと高品質化データとを送信する送信ステップとを備えるプログラムが記録されていることを特徴とする。

本発明の受信装置は、符号化音声データを受信する受信手段と、符号化音声データを復号した復号音声データの品質を向上させる高品質化データを、符号化音声データを送信してくる送信側を特定する特定情報とともに記憶する記憶手段と、符号化音声データを送信してきた送信側の特定情報と対応付けられている高品質化データを選択する選択手段と、選択手段において選択された高品質化データに基づいて、受信手段において受信された符号化音声データを復号する復号手段とを備えることを特徴とする。本発明の受信方法は、符号化音声データを受信する受信ステップと、符号化音声データを復号した復号音声データの品質を向上させる高品質化データを、符号化音声データを送信してくる送信側を特定する特定情報とともに記憶する記憶ステツプと、符号化音声データを送信してきた送信側の特定情報と対応付けられている高品質化データを選択する選択ステップと、選択ステップにおいて選択された高品質化データに基づいて、受信ステップにおいて受信された符号化音声データを復号する復号ステップとを備えることを特徴とする。

本発明の第 2のプログラムは、符号化音声データを受信する受信ステップと符号化音声データを復号した復号音声データの品質を向上させる高品質化データを、符号化音声データを送信してくる送信側を特定する特定情報とともに記憶する記憶ステツプと、符号化音声データを送信してきた送信側の特定情報と対応付けられている高品質化データを選択する選択ステップと、選択ステップにおいて選択された高品質化データに基づいて、受信ステップにおいて受信された符号化音声データを復号する復号ステップとを備えることを特徴とする。本発明の第 2の記録媒体は、符号化音声データを受信する受信ステップと、符号化音声データを復号した復号音声データの品質を向上させる高品質化データを、符号化音声データを送信してくる送信側を特定する特定情報とともに記憶する記憶ステップと、符号化音声データを送信してきた送信側の特定情報と対応付けられている高品質化データを選択する選択ステップと、選択ステップにおいて選択された高品質化データに基づいて、受信ステップにおいて受信された符号化音声データを復号する復号ステップとを備えるプログラムが記録されていることを特徴とする。

本発明の送受信装置は、入力された音声データを符号化し、符号化音声データを出力する符号化手段と、符号化音声データを受信する他の送受信装置において出力される音声の品質を向上させる高品質化データの学習を、過去の学習に用いられた音声データと、新たに入力された音声データとに基づいて行う学習手段と、符号化音声データと高品質化データとを送信する送信手段と、他の送受信装置から送信されてくる符号化音声データを受信する受信手段と、高品質化データを、符号化音声データを送信してくる他の送受信装置を特定する特定情報とともに記憶する記憶手段と、符号化音声データを送信してきた他の送受信装置の特定情報と対応付けられている高品質化データを選択する選択手段と、選択手段において選択された高品質化データに基づいて、受信手段において受信された符号化音声データを復号する復号手段とを備えることを特徴とする。

本発明の送信装置および送信方法、並びに第 1のプログラムにおいては、音声データが符号化され、符号化音声データが出力される。一方、符号化音声データを受信する受信側において出力される音声の品質を向上させる高品質化データの学習が、過去の学習に用いられた音声データと、新たに入力された音声データとに基づいて行われ、符号化音声データと高品質化データとが送信される。

本発明の受信装置及び受信方法、並びに第 1のプログラムにおいては、符号化音声データが受信され、その符号化音声データを送信してきた送信側の特定情報と対応付けられている高品質化データが選択される。そして、その選択された高品質化データに基づいて、受信された符号化音声データが復号される。本発明の送受信装置においては、入力された音声データが符号化され、符号化音声データが出力される。そして、符号化音声データを受信する他の送受信装置において出力される音声の品質を向上させる高品質化データの学習が、過去の学習に用いられた音声データと、新たに入力された音声データとに基づいて行われ、符号化音声データと高品質化データとが送信される。一方、他の送受信装置から送信されてくる符号化音声データが受信され、その符号化音声データを送信してきた他の送受信装置の特定情報と対応付けられている高品質化データが選択される。そして、その選択された高品質化データに基づいて、受信された符号化音声データが復号される。図面の簡単な説明

図 1は、本発明を適用した伝送システムの一実施の形態の構成例を示すプロック図である。

図 2は、携帯電話機 1 0 1の構成例を示すブロック図である。

図 3は、送信部 1 1 3の構成例を示すプロック図である。

図 4は、受信部 1 1 4の構成例を示すプロック図である。

図 5は、受信部 1 1 4による高品質化データ設定処理を説明するフローチヤ一トである。

図 6は、発信側の高品質化データ送信処理の第 1実施の形態を示すフ口ーチヤートである。

図 7は、着信側の高品質化データ更新処理の第 1実施の形態を示すフ口ーチヤートである。

図 8は、発信側の高品質化データ送信処理の第 2実施の形態を示すフ口ーチヤートである。 '

図 9は、着信側の高品質化データ更新処理の第 2実施の形態を示すフローチヤートである。

図 1 0は、発信側の高品質化データ送信処理の第 3実施の形態を示すフローチヤ一トである。

図 1 1は、着信側の高品質化データ更新処理の第 3実施の形態を示すフローチャートである。

図 1 2は、発信側の高品質化データ送信処理の第 4実施の形態を示すフローチヤ一トである。

図 1 3は、着信側の高品質化データ更新処理の第 4実施の形態を示すフローチャートである。

図 1 4は、学習部 1 2 5の構成例を示すプロック図である。

図 1 5は、学習部 1 2 5の学習処理を説明するフローチヤ一トである。図 1 6は、復号部 1 3 2の構成例を示すブロック図である。図 1 7は、復号部 1 3 2の処理を説明するフローチャートである。

図 1 8は、 C E L P方式の符号化部 1 2 3の構成例を示すプロック図である _c 図 1 9は、 C E L P方式の符号化部 1 23を採用した場合の復号部 1 32の構成例を示すプロック図である。

図 20は、 CELP方式の符号化部 1 23を採用した場合の学習部 1 25の構成例を示すプロック図である。

図 21は、ベタトル量子化を行う符号化部 1 23の構成例を示すプロック図である。

図 22は、符号化部 1 23がべクトル量子化を行う場合の学習部 1 25の構成例を示すブロック図である。

図 23は、符号化部 1 23がべクトル量子化を行う場合の学習部 1 25の学習処理を説明するフローチャートである。

図 24は、符号化部 1 23がべクトル量子化を行う場合の復号部 1 32の構成例を示すブロック図である。

図 25は、符号化部 1 23がべクトル量子化を行う場合の復号部 1 32の処理を説明するフローチャートである。

図 26は、本発明を適用したコンピュータの一実施の形態の構成例を示すプ口ック図である。発明を実施するための最良の形態

図 1は、本発明を適用した伝送システム（システムとは、複数の装置が論理的に集合した物をいい、各構成の装置が同一筐体中にあるか否かは問わない）の一実施の形態の構成を示している。

この伝送システムでは、携帯電話機 10 1 と 1 0 1₂が、基地局 102tと 1 02₂それぞれとの間で、無線による送受信を行うとともに、基地局 l O Ziと 1 02₂それぞれが、交換局 1 03との間で送受信を行うことにより、最終的には、携帯電話機 1 0 と 10 1₂との間において、基地局 102iおよび 102₂、並びに交換局 1 0 3を介して、音声の送受信を行うことができるようになつている。なお、基地局 1 0 2 tと 1 0 2 ₂は、同一の基地局であっても良いし、異なる基地局であっても良い。

ここで、以下、特に区別する必要がない限り、携帯電話機 1 0 と 1 0 1 ₂を、携帯電話機 1 0 1と記述する。

次に、図 2は、図 1の携帯電話機 1 0 1^の構成例を示している。なお、携帯電話機 1 0 1 ₂も、以下説明する携帯電話機 1 0 と同様に構成されるため、その説明は省略する。

アンテナ 1 1 1は、基地局 1 0 2 iまたは 1 0 2 ₂からの電波を受信し、その受信信号を、変復調部 1 1 2に供給するとともに、変復調部 1 1 2からの信号を、電波で、基地局 1 0 2 iまたは 1 0 2 ₂に送信する。変復調部 1 1 2は、アンテナ 1 1 1からの信号を、例えば、 C D MA (Code Division Multiple Access)方式等によって復調し、その結果得られる復調信号を、受信部 1 1 4 供給する。

また、変復調部 1 1 2は、送信部 1 1 3から供給される送信データを、例えば、 C D MA方式等で変調し、その結果得られる変調信号を、アンテナ 1 1 1に供給する。送信部 1 1 3は、ユーザの音声を符号化する等の所定の処理を行い、送信データを得て、変復調部 1 1 2に供給する。受信部 1 1 4は、変復調部 1 1 2からの復調信号である受信データを受信し、高音質の音声を復号して出力する。

操作部 1 1 5は、発呼先の電話番号や、所定のコマンド等を入力するときに、ユーザによって操作され、その操作に対応する操作信号は、送信部 1 1 3ゃ受信部 1 1 4に供給される。

なお、送信部 1 1 3と受信部 1 1 4との間では、必要に応じて情報をやりとりすることができるようになっている。

次に、図 3は、図 2の送信部 1 1 3の構成例を示している。

マイク 1 2 1には、ユーザの音声が入力され、マイク 1 2 1は、そのユーザの音声を、電気信号としての音声信号として、 A/D (Analog/Digital)変換部 1 2 2に出力する。 0変換部1 2 2は、マイク 1 2 1からのアナログの音声信号を AZD変換することにより、ディジタルの音声データとし、符号化部 1 2 3および学習部 1 2 5に出力する。

符号化部 1 2 3は、 A/D変換部 1 2 2からの音声データを所定の符号化方式によって符号化し、その結果得られる符号化音声データ S 1を、送信制御部 1 2 4に出力する。

送信制御部 1 2 4は、符号化部 1 2 3が出力する符号化音声データと、後述する管理部 1 2 7が出力する高品質化データ等の送信制御を行う。即ち、送信制御部 1 2 4は、符号化部 1 2 3が出力する符号化音声データ、または後述する管理部 1 2 7が出力する高品質化データ等を選択し、所定の送信タイミングにおいて、送信データとして、弯復調部 1 1 2 (図 2 ) に出力する。なお、送信制御部 1 2 4は、符号化音声データおよび高品質化データの他、操作部 1 1 5が操作されることによって入力される、発信先の電話番号や、発信元である自身の電話番号、その他の必要な情報を、必要に応じて、送信データとして出力する。

学習部 1 2 5は、符号化部 1 2 3が出力する符号化音声データを受信する受信側において出力される音声の品質を向上させる高品質化データの学習を、過去の学習に用いられた音声データと、新たに A/D変換部 1 2 2から入力される音声データに基づいて行う。学習部 1 2 5は、学習を行うことにより、新たな高品質化データを得ると、その高品質化データを、記憶部 1 2 6に供給する, 記憶部 1 2 6は、学習部 1 2 5から供給される高品質化データを記憶する。

管理部 1 2 7は、受信部 1 1 4から供給される情報を必要に応じて参照しながら、記憶部 1 2 6に記憶された高品質化データの送信を管理する。

以上のように構成される送信部 1 1 3では、マイク 1 2 1に入力されたユーザの音声が、 A/D変換部 1 2 2を介して、符号化部 1 2 3および学習部 1 2 5に供給される。

符号化部 1 2 3は、 A/D変換部 1 2 2から供給される音声データを符号化し、その結果得られる符号化音声データを、送信制御部 1 2 4に出力する。送信制御部 1 2 4は、符号化部 1 2 3から供給される符号化音声データを送信データとして、変復調部 1 1 2 (図 2 ) に出力する。

一方、学習部 1 2 5は、過去の学習に用いられた音声データと、新たに AZ

D変換部 1 2 2から入力される音声データに基づいて、高品質化データを学習し、その結果得られる高品質化データを、記憶部 1 2 6に供給して記憶させる, ここで、このように、学習部 1 2 5では、新たに入力されたユーザの音声データだけではなく、過去の学習に用いられた音声データにも基づいて、高品質化データの学習が行われるので、ユーザが通話を行うほど、より、そのユーザの音声データを符号化した符号化音声データを、高品質の音声データに復号することのできる高品質化データが得られることになる。

そして、管理部 1 2 7は、所定のタイミングにおいて、記憶部 1 2 6に記憶された高品質化データを、記憶部 1 2 6から読み出し、送信制御部 1 2 4に供給する。送信制御部 1 2 4は、管理部 1 2 7が出力する高品質化データを、所定の送信タイミングにおいて、送信データとして、変復調部 1 1 2 (図 2 ) に出力する。

以上のように、送信部 1 1 3では、通常の通話のための音声としての符号化音声データの他に、高品質化データも送信される。

次に、図 4は、図 2の受信部 1 1 4の構成例を示している。

図 2の変復調部 1 1 2が出力する復調信号としての受信データは、受信制御部 1 3 1に供給され、受信制御部 1 3 1は、その受信データを受信する。そして、受信制御部 1 3 1は、受信データが符号化音声データである場合には、その符号化音声データを、復号部 1 3 2に供給し、受信データが高品質化データである場合には、その高品質化データを、管理部 1 3 5に供給する。

なお、受信データには、符号化音声データおよび高品質化データの他、必要に応じて、発信元の電話番号その他の情報が含まれており、受信制御部 1 3 1 は、そのような情報を、必要に応じて、管理部 1 3 5や、送信部 1 1 3 (の管理部 1 2 7 ) に供給する。

復号部 1 3 2は、受信制御部 1 3 2から供給される符号化音声データを、管理部 1 3 5から供給される高品質化データを用いて復号し、これにより、高品質の復号音声データを得て、 D ZA (Digital /Analog)変換部 1 3 3に供給する, 0 / 変換部1 3 3は、復号部 1 3 2が出力するディジタルの復号音声データを D /A変換し、その結果得られるアナログの音声信号を、スピーカ 1 3 4 に供給する。スピーカ 1 3 4は、 D /A変換部 1 3 3からの音声信号に対応する音声を出力する。

管理部 1 3 5は、高品質化データの管理を行う。即ち、管理部 1 3 5は、着呼時に、受信制御部 1 3 1から、発信元の電話番号を受信し、その電話番号に基づいて、記憶部 1 3 6またはデフォルトデータメモリ 1 3 7に記憶された高品質化データを選択し、復号部 1 3 2に供給する。また、管理部 1 3 5は、受信制御部 1 3 1から、最新の高品質化データを受信し、その最新の高品質化データによって、記憶部 1 3 6の記憶内容を更新する。

記憶部 1 3 6は、例えば、書き換え可能な E E P R O M (Electrically Erasa ble Programmable Read-only Memory)で構成され、管理部 1 3 5力ら供給される高品質化データを、その高品質化データを送信してきた発信元を特定する特定情報としての、例えば、その発信元の電話番号と対応付けて記憶する。

デフォルトデータメモリ 1 3 7は、例えば、 R O Mで構成され、デフォルトの高品質化データを、あらかじめ記憶している。

以上のように構成される受信部 1 1 4では、着呼があると、受信制御部 1 3 1は、そこに供給される受信データを受信し、その受信データに含まれる発信元の電話番号を、管理部 1 3 5に供給する。管理部 1 3 5は、例えば、受信制御部 1 3 1から発信元の電話番号を受信し、音声通話が可能な状態となると、その音声通話で用いる高品質化データを設定する高品質化データ設定処理を、図 5のフローチヤ一トにしたがって行う。

即ち、高品質化データ設定処理では、まず最初に、ステップ S 1 4 1において、管理部 1 3 5は、発信元の電話番号を、記憶部 1 3 6から検索し、ステツプ S 1 4 2に進む。ステップ S 1 4 2では、管理部 1 3 5は、ステップ S 1 4 1の検索によって、発信元の電話番号が見つかつたかどうか（記憶部 1 3 6に記憶されているかどう力を判定する。

ステップ S 1 4 2において、発信元の電話番号が見つかつたと判定された場合、ステップ S 1 4 3に進み、管理部 1 3 5は、記憶部 1 3 6に記憶されている高品質化データの中から、発信元の電話番号に対応付けられている高品質化データを選択し、復号部 1 3 2に供給、設定して、高品質化データ設定処理を終了する。

また、ステップ S 1 4 2において、発信元の電話番号が見つからなかったと判定された場合、ステップ S 1 4 4に進み、管理部 1 3 5は、デフォルトデータメモリ 1 3 7から、デフォルトの高品質化データ（以下、適宜、デフォルトデータという）を読み出し、復号部 1 3 2に供給、設定して、高品質化データ設定処理を終了する。

なお、図 5の実施の形態では、発信元の電話番号が見つかった場合、即ち、発信元の電話番号が、記憶部 1 3 6に記憶されている場合に、その発信元の電話番号に対応付けられている高品質化データを、復号部 1 3 2に設定するようにしたが、操作部 1 1 5 (図 2 ) を操作することにより、発信元の電話番号が見つかった場合であっても、デフォルトデータを、復号部 1 3 2に設定するように、管理部 1 3 5を制御することが可能である。

以上のようにして、高品質化データが、復号部 1 3 2に設定された後、受信制御部 1 3 1に対し、受信データとして、発信元から送信されてきた符号化音声データの供給が開始されると、その符号化音声データは、受信制御部 1 3 1 から復号部 1 3 2に供給される。復号部 1 3 2は、受信制御部 1 3 1から供給される、発信元から送信されてきた符号化音声データを、着呼直後に行われた図 5の高品質化データ設定処理で設定された高品質化データ、即ち、発信元の電話番号と対応付けられている高品質化データに基づいて復号し、復号音声データを出力する。この復号音声データは、復号部 1 3 2から、 D /A変換部 1 3 3を介してスピーカ 1 3 4に供給されて出力される。

一方、受信制御部 1 3 1は、受信データとして、発信元から送信されてきた高品質化データを受信すると、その高品質化データを、管理部 1 3 5に供給する。管理部 1 3 5は、受信制御部 1 3 1から供給される高品質化データを、その高品質化データを送信してきた発信元の電話番号と対応付け、記憶部 1 3 6 に供給して記憶させる。

ここで、上述のように、記憶部 1 3 5において、発信元の電話番号と対応付けられて記憶される高品質化データは、発信元の送信部 1 1 3 (図 3 ) の学習部 1 2 5において、その発信元のユーザの音声に基づいて学習を行うことにより得られたものであり、発信元のユーザの音声を符号化した符号化音声データを、高品質の復号音声データに復号するためのものである。

そして、受信部 1 1 4の復号部 1 3 2では、発信元から送信されてきた符号化音声データが、発信元の電話番号と対応付けられている高品質化データに基づいて復号されるので、発信元から送信されてきた符号化音声データに適した復号処理（その符号化音声データに対応する音声を発話したユーザの音声の特性ごとに異なる復号処理）が施されることになり、高品質の復号音声データを得ることができる。

ところで、上述のように、発信元から送信されてきた符号化音声データに適した復号処理を施すことにより、高品質の復号音声データを得るには、復号部 1 3 2において、その発信元の送信部 1 1 3 (図 3 ) の学習部 1 2 5で学習された高品質化データを用いて処理を行う必要がある。そのためには、記憶部 1 3 6に、その高品質符号化データが、発信元の電話番号と対応付けて記憶されている必要がある。

そこで、発信元（送信側）の送信部 1 1 3 (図 3 ) は、学習により得られた最新の高品質化データを、着信側（受信側）に送信する高品質化データ送信処理を行い、着信側の受信部 1 1 4は、発信元において、その高品質化データ送信処理が行われることにより送信されてくる高品質化データによって、記憶部 1 3 6の記憶内容を更新する高品質化データ更新処理を行うようになつている, そこで、いま、例えば、携帯電話機 1 0 を発信元とするとともに、携帯電話機 101₂を着信側として、高品質化データ送信処理と、高品質化データ更新処理について説明する。

図 6は、高品質化データ送信処理の第 1実施の形態を示すフローチヤ一トでめる。

発信元である携帯電話機 10 では、ユーザが、操作部 1 1 5 (図 2) を操作して、着信側としての携帯電話機 10 1₂の電話番号を入力すると、送信部 1 1 3において、高品質化データ送信処理が開始される。

即ち、高品質化データ送信処理では、まず最初に、ステップ S 1において、送信部 1 1 3 (図 3 ) の送信制御部 1 24 、操作部 1 1 5が操作されることにより入力された携帯電話機 10 1₂の電話番号を、送信データとして出力することにより、携帯電話機 101₂の呼び出しが行われる。

そして、携帯電話機 101₂のユーザが、携帯電話機 10 からの呼び出しに応じて、操作部 1 1 5を操作することにより、携帯電話機 10 1₂をオフフック状態にすると、ステップ S 2に進み、送信制御部 1 24は、着信側の携帯電話機 101₂との間の通信リンクを確立し、ステップ S 3に進む。

ステップ S 3では、管理部 1 27が、記憶部 1 26に記憶された高品質化データの更新の状況を表す更新情報を、送信制御部 1 24に送信し、送信制御部 1 24は、その更新情報を、送信データとして選択、出力して、ステップ S 4 に進む。

ここで、学習部 1 25は、学習を行って、新たな高品質化データを得ると、例えば、その高品質化データを得た日時（年月を含む）を、その高品質化データと対応付けて、記憶部 1 26に記憶させるようになつており、更新情報としては、この高品質化データと対応付けられている日時を用いることができる。

着信側の携帯電話機 101₂は、発信元の携帯電話機 10 から更新情報を受信すると、後述するように、最新の高品質化データが必要な場合は、その送信を要求する転送要求を送信してくるので、ステップ S 4において、管理部 1 2 7は、着信側の携帯電話機 1 0 1 ₂から転送要求が送信されてきたかどうかを判定する。

ステップ S 4において、転送要求が送信されてきていないと判定された場合、即ち、携帯電話機 1 0 の受信部 1 1 4の受信制御部 1 3 1において、受信データとして、着信側の携帯電話機 1 0 1 ₂からの転送要求が受信されなかった場合、ステップ S 5をスキップして、ステップ S 6に進む。

また、ステップ S 4において、転送要求が送信されてきたと判定された場合、即ち、携帯電話機 1 0 1 iの受信部 1 1 4の受信制御部 1 3 1において、受信データとして、着信側の携帯電話機 1 0 1 ₂からの転送要求が受信され、その転送要求が、送信部 1 1 3の管理部 1 2 7に供給された場合、ステップ S 5に進み、管理部 1 2 7は、記憶部 1 2 6から最新の高品質化データを読み出し、送信制御部 1 2 4に供給する。さらに、ステップ S 5では、送信制御部 1 2 4が、管理部 1 2 7からの最新の高品質化データを選択し、送信データとして送信する _c なお、高品質化データは、 'その高品質化データが学習によって得られた日時、即ち、更新情報とともに送信されるようになっている。

その後、ステップ S 5から S 6に進み、管理部 1 2 7は、準備完了通知が、着信側の携帯電話機 1 0 1 ₂から送信されてきたかどうかを判定する。

即ち、着信側の携帯電話機 1 0 1 ₂は、通常の音声通話が可能な状態となると- 音声通話の準備が完了したことを表す準備完了通知を送信するようになっており、ステップ S 6では、そのような準備完了通知が、携帯電話機 1 0 1 ₂から送信されてきたかどうかが判定される。

ステップ S 6において、準備完了通知が送信されてきていないと判定された場合、即ち、携帯電話機 1 0 1 iの受信部 1 1 4の受信制御部 1 3 1において、受信データとして、着信側の携帯電話機 1 0 1 ₂からの準備完了通知が受信されていない場合、ステップ S 6に戻り、準備完了通知が送信されてくるまで待つ _c そして、ステップ S 6において、準備完了通知が送信されてきたと判定された場合、即ち、携帯電話機 1 0 1 iの受信部 1 1 4の受信制御部 1 3 1において、受信データとして、着信側の携帯電話機 1 0 1 ₂からの準備完了通知が受信され、その準備完了通知が、送信部 1 1 3の管理部 1 2 7に供給された場合、ステツプ S 7に進み、送信制御部 1 2 4は、符号化部 1 2 3の出力を選択することにより、音声通話が可能な状態、即ち、符号化部 1 2 3が出力する符号化音声データを、送信データとして選択する状態となって、高品質化データ送信処理を終了する。

次に、図 7のフローチャートを参照して、発信側の携帯電話機 1 0 で図 6 の高品質化データ送信処理が行われる場合の、着信側の携帯電話機 1 0 1 ₂による高品質化データ更新処理について説明する。

着信側の携帯電話機 1 0 1 ₂では、例えば、着呼があると、受信部 1 1 4 (図 4 ) において、高品質化データ更新処理が開始される。

即ち、高品質化データ更新処理では、まず最初に、ステップ S 1 1において、受信制御部 1 3 1が、ユーザが操作部 1 1 5を操作することにより帯電話機 1 0 1 ₂がオフフック状態とされたかどうかを判定し、オフフック状態とされてレ、ないと判定した場合、ステップ S 1 1に戻る。

また、ステップ S 1 1において、携帯電話機 1 0 1 ₂がオフフック状態とされたと判定された場合、ステップ S 1 2に進み、受信制御部 1 3 1は、発信側の携帯電話機 1 0 との通信リンクを確立し、ステップ S 1 3に進む。

ステップ S 1 3では、図 6のステップ S 3で説明したように、発信側の携帯電話機 1 0 から更新情報が送信されてくるので、受信制御部 1 3 1は、この更新情報を含む受信データを受信し、管理部 1 3 5に供給する。

管理部 1 3 5は、ステップ S 1 4において、発信側の携帯電話機 1 0 から受信した更新情報を参照し、記憶部 1 3 6に、発信側の携帯電話機 1 0 1 Lのュ一ザについての最新の高品質化データが記憶されているかどうかを判定する。

即ち、図 1の伝送システムにおける通信では、発信側の携帯電話機 1 0 1 ₁ (または 1 0 1 ₂) から、着信側の携帯電話機 1 0 1 ₂ (または 1 0 の着呼時に、発信側の携帯電話機 1 0 の電話番号が送信されるようになっており、この電話番号は、受信データとして、受信制御部 1 3 1で受信され、管理部 1 3 5に供給されるようになっている。管理部 1 3 5は、その発信側である携帯電話機 1 0 の電話番号と対応付けられている高品質化データが、記憶部 1 3 6 に既に記憶されているかどう力 \ さらに、記憶されている場合には、その記憶されている高品質化データが最新のものかどうかを調査することにより、ステップ S 1 4の判定処理を行う。

ステップ S 1 4において、記憶部 1 3 6に、発信側の携帯電話機 1 0；^のュ一ザについての最新の高品質化データが記憶されていると判定された場合、即ち、記憶部 1 3 6に、発信元の携帯電話機 1 0 の電話番号と対応付けられている高品質化データが記憶されており、その高品質化データに対応付けられている更新情報が表す日時が、ステップ S 1 3で受信された更新情報が表す日時と一致する場合、記憶部 1 3 6における、発信元の携帯電話機 1 0 の電話番号と対応付けられている高品質化データを更新する必要はないので、ステップ S 1 5乃至 S 1 8をスキップして、ステップ S 1 9に進む。

ここで、図 6のステップ S 5で説明したように、発信側の携帯電話機 1 0 1 は、高品質化データを、その更新情報とともに送信してくるようになっており着信側の携帯電話機 1 0 1 ₂の管理部 1 3 5は、発信側の携帯電話機 1 0 からの高品質化データを記憶部 1 3 6に記憶させる場合、その高品質化データに、その高品質化データとともに送信されてくる更新情報を対応付けて記憶させるようになつている。ステップ S 1 4では、このようにして、記憶部 1 3 6に記憶されている高品質化データに対応付けられている更新情報と、ステップ S 1 3で受信された更新情報とを比較することにより、記憶部 1 3 6に記憶されている高品質化データが最新のものであるかどうかが判定される。

—方、ステップ S 1 4において、記憶部 1 3 6に、発信側の携帯電話機 1 0 のユーザについての最新の高品質化データが記憶されていないと判定された場合、即ち、記憶部 1 3 6に、発信元の携帯電話機 1 0 の電話番号と対応付けられている高品質化データが記憶されていないか、または記憶されていても. その高品質化データに対応付けられている更新情報が表す日時が、ステップ S 1 3で受信された更新情報が表す日時よりも過去を表す（古い）もので！)る場合、ステップ S 1 5に進み、管理部 1 3 5は、最新の高品質化データへの更新が禁止されているかどうかを判定する。

即ち、例えば、ユーザは、操作部 1 1 5を操作することにより、高品質化データの更新を行わないように、管理部 1 3 5を設定することが可能であり、管理部 1 3 5は、高品質化データの更新を行うかどうかの設定に基づいて、ステップ S 1 5の判定処理を行う。

ステップ S 1 5において、最新の高品質化データへの更新が禁止されていると判定された場合、即ち、管理部 1 3 5が、高品質化データの更新を行わないように設定されている場合、ステップ S 1 6乃至 S 1 8をスキップして、ステップ S 1 9に進む。

また、ステップ S 1 5において、最新の高品質化データへの更新が禁止されていないと判定された場合、即ち、管理部 1 3 5が、高品質化データの更新を行わないように設定されていない場合、ステップ S 1 6に進み、管理部 1 3 5 は、発信元の携帯電話機 1 0 に対して、最新の高品質化データの送信を要求する転送要求を、送信部 1 1 3 (図 3 ) の送信制御部 1 2 4に供給する。これにより、送信部 1 1 3の送信制御部 1 2 4は、転送要求を、送信データとして送信する。

図 6のステップ S 4および S 5で説明したように、転送要求を受信した発信元の携帯電話機 1 0 は、最新の高品質化データを、その更新情報とともに送信してくるので、受信制御部 1 3 1は、ステップ S 1 7において、その最新の高品質化データおよび更新情報を含む受信データを受信し、管理部 1 3 5に供給する。

管理部 1 3 5は、ステップ S 1 8において、ステップ S 1 7で得た最新の高品質化データを、着呼時に受信した発信側の携帯電話機 1 0 の電話番号、さらには、その高品質化データとともに送信されてきた更新情報と対応付けて、記憶部 1 3 6に記憶させることにより、記憶部 1 3 6の記憶内容を更新する。即ち、管理部 1 3 5は、発信側の携帯電話機 1 0 の電話番号と対応付けられた高品質化データが、記憶部 1 3 6に記憶されていない場合には、ステップ S 1 7で得た最新の高品質化データ、着呼時に受信した発信側の携帯電話機 1 0 の電話番号、および更新情報（最新の高品質化データの更新情報）を、記憶部 1 3 6に、新たに記憶させる。

また、管理部 1 3 5は、発信側の携帯電話機 1 0 l iの電話番号と対応付けられた高品質化データ（最新でない高品質化データ）力記憶部 1 3 6に記憶されている場合には、その高品質化データと、その高品質化データに対応付けられている電話番号および更新情報に代えて、ステップ S 1 7で得た最新の高品質化データ、着呼時に受信した発信側の携帯電話機 1 0 の電話番号、および更新情報を、記憶部 1 3 6に記憶させる（上書きする）。

そして、ステップ S 1 9に進み、管理部 1 3 5は、送信部 1 1 3の送信制御部 1 2 4を制御することにより、音声通話の準備が完了したことを表す準備完了通知を、送信データとして送信させ、ステップ S 2 0に進む。

ステップ S 2 0では、受信制御部 1 3 1は、そこに供給される受信データに含まれる符号化音声データを復号部 1 3 2に出力する、音声通話が可能な状態となって、高品質化データ更新処理を終了する。

次に、図 8は、高品質化データ送信処理の第 2実施の形態を示すフローチヤ一トである。

図 6における場合と同様に、発信元である携帯電話機 1 0 1ェでは、ユーザが. 操作部 1 1 5 (図 2 ) を操作して、着信側としての携帯電話機 1 0 1 ₂の電話番号を入力すると、送信部 1 1 3において、高品質化データ送信処理が開始される。

即ち、高品質化データ送信処理では、まず最初に、ステップ S 3 1において. 送信部 1 1 3 (図 3 ) の送信制御部 1 2 4力 S、操作部 1 1 5が操作されることにより入力された携帯電話機 1 0 1 ₂の電話番号を、送信データとして出力することにより、携帯電話機 1 0 1 ₂の呼び出しが行われる。

そして、携帯電話機 1 0 1 ₂のユーザが、携帯電話機 1 0 からの呼び出しに応じて、操作部 1 1 5を操作することにより、携帯電話機 1 0 1 ₂をオフフック状態にすると、ステップ S 3 2に進み、送信制御部 1 2 4は、着信側の携帯電話機 1 0 1 ₂との間の通信リンクを確立し、ステップ S 3 3に進む。

ステップ S 3 3では、管理部 1 2 7は、記憶部 1 2 6から最新の高品質化データを読み出し、送信制御部 1 2 4に供給する。さらに、ステップ S 3 3では. 送信制御部 1 2 4が、管理部 1 2 7からの最新の高品質化データを選択し、送信データとして送信する。なお、高品質化データは、上述したように、その高品質化データが学習によって得られた日時を表す更新情報とともに送信される _t その後、ステップ S 3 3から S 3 4に進み、管理部 1 2 7は、図 6のステツプ S 6における場合と同様に、準備完了通知が、着信側の携帯電話機 1 0 1 ₂から送信されてきたかどうかを判定し、準備完了通知が送信されてきていないと判定した場合、ステップ S 3 4に戻り、準備完了通知が送信されてくるまで待つ。

そして、ステップ S 3 4において、準備完了通知が送信されてきたと判定された場合、ステップ S 3 5に進み、送信制御部 1 2 4は、図 6のステップ S 7 における場合と同様に、音声通話が可能な状態となって、高品質化データ送信処理を終了する。

次に、図 9のフローチャートを参照して、発信側の携帯電話機 1 0 で図 8 の高品質化データ送信処理が行われる場合の、着信側の携帯電話機 1 0 1 ₂による高品質化データ更新処理について説明する。

着信側の携帯電話機 1 0 1 ₂では、図 7における場合と同様に、着呼があると. 受信部 1 1 4 (図 4 ) において、高品質化データ更新処理が開始され、まず最初に、ステップ S 4 1において、受信制御部 1 3 1が、ユーザが操作部 1 1 5 を操作することによりオフフック状態としたかどうかを判定し、オフフック状態とされていないと判定した場合、ステップ S 4 1に戻る。

また、ステップ S 4 1において、オフフック状態とされたと判定された場合、ステップ S 4 2に進み、図 7のステップ S 1 2における場合と同様に、通信リンクが確立され、ステップ S 4 3に進む。ステップ S 4 3では、受信制御部 1 3 1は、発信側の携帯電話機 1 0 1^から送信されてくる最新の高品質化データを含む受信データを受信し、管理部 1 3 5に供給する。

即ち、図 8の高品質化データ送信処理では、上述したように、ステップ S 3 3において、携帯電話機 1 0 が、最新の高品質化データを、更新情報とともに送信してくるので、ステップ S 4 3では、その高品質化データと更新情報が受信される。

その後、ステップ S 4 4に進み、管理部 1 3 5は、図 7のステップ S 1 4における場合と同様にして、発信側の携帯電話機 1 0 から受信した更新情報を参照し、記憶部 1 3 6に、発信側の携帯電話機 1 0 のユーザについての最新の高品質化データが記憶されているかどうかを判定する。

ステップ S 4 4において、記憶部 1 3 6に、発信側の携帯電話機 1 0 1 ₁のュ一ザについての最新の高品質化データが記憶されていると判定された場合、ステツプ S 4 5に進み、管理部 1 3 5は、ステップ S 4 3で受信した高品質化データと更新情報を破棄し、ステップ S 4 7に進む。

また、ステップ S 4 4において、記憶部 1 3 6に、発信側の携帯電話機 1 0 1 のユーザについての最新の高品質化データが記憶されていないと判定された場合、ステップ S 4 6に進み、管理部 1 3 5は、図 7のステップ S 1 8における場合と同様に、ステップ S 4 3で得た最新の高品質化データを、着呼時に受信した発信側の携帯電話機 1 0 の電話番号、さらには、その高品質化データとともに送信されてきた更新情報と対応付けて、記憶部 1 3 6に記憶させることにより、記憶部 ί 3 6の記憶内容を更新する。

そして、ステップ S 4 7に進み、管理部 1 3 5は、送信部 1 1 3の送信制御部 1 2 4を制御することにより、音声通話の準備が完了したことを表す準備完了通知を、送信データとして送信させ、ステップ S 4 8に進む。

ステップ S 4 8では、受信制御部 1 3 1は、そこに供給される受信データに含まれる符号化音声データを復号部 1 3 2に出力する、音声通話が可能な状態となって、高品質化データ更新処理を終了する。

図 9の高品質化データ更新処理によれば、着信側の携帯電話機 1 0 1 ₂において、発信側の携帯電話機 1 0 のユーザについての最新の高品質化データが記憶されていない限り、必ず、記憶部 1 3 6の記憶内容が更新されることになる, 次に、図 1 0は、高品質化データ送信処理の第 3実施の形態を示すフローチヤートである。

発信元である携帯電話機 1 0 では、ユーザが、操作部 1 1 5 (図 2 ) を操作して、着信側としての携帯電話機 1 0 1 ₂の電話番号を入力すると、送信部 1 1 3 (図 3 ) において、高品質化データ送信処理が開始され、まず最初に、ステツプ S 5 1において、管理部 1 2 7は、操作部 1 1 5が操作されることにより入力された電話番号に対応する携帯電話機 1 0 1 ₂への高品質化データの送信履歴を検索する。

即ち、図 1 0の実施の形態では、管理部 1 2 7は、後述するステップ S 5 8 において、高品質化データを、着信側へ送信した場合、その高品質化データの送信履歴として、着信側の電話番号と、送信した高品質化データの更新情報とを対応付けた情報を、その内蔵するメモリ（図示せず）に記憶しておくようになっており、ステップ S 5 2では、そのような送信履歴の中から、操作部 1 1 5が操作されることにより入力された着信側の電話番号が記述されているものが検索される。

そして、ステップ S 5 2に進み、管理部 1 2 7は、ステップ S 5 1での検索結果に基づき、着信側に対して、最新の高品質化データが、既に送信されているかどうかを判定する。

ステップ S 5 2において、最新の高品質化データが、着信側に対して送信されていないと判定された場合、即ち、送信履歴の中に、着信側の電話番号が記述されたものがなかったか、または、そのような送信履歴があっても、その送信履歴に記述されている更新情報が、最新の高品質化データの更新情報と一致しない場合、ステップ S 5 3に進み、管理部 1 2 7は、最新の高品質化データを送信すベきであるかどうかを表す転送フラグをオン状態にして、ステップ S

5 5に進む。

ここで、転送フラグは、例えば、 1ビットのフラグであり、例えば、オン状態のときは 1とされ、オフ状態とのときは 0とされる。

また、ステップ S 5 2において、最新の高品質化データが、着信側に対して、既に送信されていると判定された場合、即ち、送信履歴の中に、着信側の電話番号が記述されたものがあり、その送信履歴に記述されている更新情報が、最新の更新情報と一致する場合、ステップ S 5 4に進み、管理部 1 2 7は、転送フラグをオフ状態にして、ステップ S 5 5に進む。

ステップ S 5 5では、送信制御部 1 2 4力操作部 1 1 5が操作されることにより入力された着信側である携帯電話機 1 0 1 ₂の電話番号を、送信データとして出力することにより、携帯電話機 1 0 1 ₂の呼び出しが行われる。

そして、携帯電話機 1 0 1 ₂のユーザが、携帯電話機 1 0 からの呼び出しに応じて、操作部 1 1 5を操作することにより、携帯電話機 1 0 1 ₂をオフフック状態にすると、ステップ S 5 6に進み、送信制御部 1 2 4は、着信側の携帯電話機 1 0 1 ₂との間の通信リンクを確立し、ステップ S 5 7に進む。

ステップ S 5 7では、管理部 1 2 7は、転送フラグがオン状態になっているかどうかを判定し、オン状態になっていないと判定した場合、即ち、転送フラグがオフ状態になっている場合、ステップ S 5 8をスキップして、ステップ S 5 9に進む。

また、ステップ S 5 7において、転送フラグがオン状態になっていると判定された場合、ステップ S 5 8に進み、管理部 1 2 7は、記憶部 1 2 6から最新の高品質化データと更新情報を読み出し、送信制御部 1 2 4に供給する。さらに、ステップ S 5 8では、送信制御部 1 2 4が、管理部 1 2 7からの最新の高品質化データと更新情報を選択し、送信データとして送信する。さらに、ステップ S 5 8では、管理部 1 2 7は、最新の高品質化データを送信した携帯電話機 1 0 1 ₂の電話番号（着信側の電話番号）と、その更新情報とを対応付けた情報を、送信履歴として記憶し、ステップ S 5 9に進む。

なお、携帯電話機 1 0 1 ₂の電話番号が、送信履歴に既に記憶されている場合、管理部 1 2 7は、例えば、その電話番号と更新情報に対して、上書きする形で、最新の高品質化データを送信した携帯電話機 1 0 1 ₂の電話番号と、その最新の高品質化データの更新情報を記憶する。

ステップ S 5 9では、管理部 1 2 7は、図 6のステップ S 6における場合と同様に、準備完了通知が、着信側の携帯電話機 1 0 1 ₂から送信されてきたかどうかを判定し、送信されてきていないと判定した場合、ステップ S 5 9に戻り、準備完了通知が送信されてくるまで待つ。

そして、ステップ S 5 9において、準備完了通知が送信されてきたと判定された場合、ステップ S 6 0に進み、送信制御部 1 2 4は、音声通話が可能な状態となつて、高品質化データ送信処理を終了する。

次に、図 1 1のフローチャートを参照して、発信側の携帯電話機 1 0 で図 1 0の高品質化データ送信処理が行われる場合の、着信側の携帯電話機 1 0 1 ₂ による高品質化データ更新処理について説明する。

着信側の携帯電話機 1 0 1 ₂では、例えば、着呼があると、受信部 1 1 4 (図 4 ) において、高品質化データ更新処理が開始される。 '

即ち、高品質化データ更新処理では、まず最初に、ステップ S 7 1において、受信制御部 1 3 1力ユーザが操作部 1 1 5を操作することによりオフフック状態とされたかどうかを判定し、オフフック状態とされていないと判定した場合、ステップ S 7 1に戻る。

また、ステップ S 7 1において、オフフック状態とされたと判定された場合、

7 2に進み、受信制御部 1 3 1は、発信側の携帯電話機 1 0 1 iとの通信リンクを確立し、ステップ S 7 3に進む。

ステップ S 7 3では、受信制御部 1 3 1が、高品質化データが送信されてきたかどうかを判定し、送信されてこなかったと判定した場合、ステップ S 7 4 および S 7 5をスキップして、ステップ S 7 6に進む。

また、ステップ S 7 3において、高品質化データが送信されてきたと判定された場合、即ち、図 1 0のステップ S 5 8において、発信側の携帯電話機 1 0 から、最新の高品質化データおよび更新情報が送信された場合、ステップ S 7 4に進み、受信制御部 1 3 1は、その最新の高品質化データおよび更新情報を含む受信データを受信し、管理部 1 3 5に供給する。

管理部 1 3 5は、ステップ S 7 5において、図 7のステップ S 1 8における場合と同様に、ステップ S 7 4で得た最新の高品質化データを、着呼時に受信した発信側の携帯電話機 1 0 の電話番号、さらには、その高品質化データとともに送信されてきた更新情報と対応付けて、記憶部 1 3 6に記憶させることにより、記憶部 1 3 6の記憶内容を更新する。

そして、ステップ S 7 6に進み、管理部 1 3 5は、送信部 1 1 3の送信制御部 1 2 4を制御することにより、音声通話の準備が完了したことを表す準備完了通知を、送信データとして送信させ、ステップ S 7 7に進む。

ステップ S 7 7では、受信制御部 1 3 1は、音声通話が可能な状態となって- 高品質化データ更新処理を終了する。

次に、図 6乃至図 1 1で説明した高品質化データ送信処理または高品質化データ更新処理は、発呼時または着呼時に行われるが、高品質化データ送信処理または高品質化データ更新処理は、その他、任意のタイミングで行うことも可能である。

そこで、図 1 2は、発信側としての携帯電話機 1 0 1ェにおいて、例えば、最新の高品質化データが学習により得られた後に、送信部 1 1 3 (図 3 ) で行われる高品質化データ送信処理を示すフローチャートである。

まず最初に、ステップ S 8 1において、管理部 1 2 7は、電子メールのメッセージとして、記憶部 1 2 6に記憶された最新の高品質化データとその更新情報、および自身の電話番号を配置し、ステップ S 8 2に進む。

ステップ S 8 2では、管理部 1 2 7は、最新の高品質化データ、その更新情報、自身の電話番号をメッセージとして配置した電子メール（以下、適宜、高品質化データ送信用電子メールという）のサブジェクト（件名）として、その電子メールが、最新の高品質化データを含むものであることを表すものを配置する。即ち、管理部 1 2 7は、例えば、「更新通知」等を、高品質化データ送信用電子メールのサブジェクトに配置する。

そして、ステップ S 8 3に進み、管理部 1 2 7は、高品質化データ送信用電子メールに、その宛先となるメールアドレスを設定する。ここで、高品質化データ送信用電子メールの宛先となるメールアドレスとしては、例えば、過去に電子メールのやりとりをしたことがある相手のメールァドレスを記憶しておき、そのメールアドレスすべて、あるいは、そのメールァドレスのうちのユーザが指定したもの等を配置することが可能である。

その後、ステップ S 8 4に進み、管理部 1 2 7は、高品質化データ送信用電子メールを、送信制御部 1 2 4に供給し、送信データとして送信させ、高品質化データ送信処理を終了する。

以上のようにして送信された高品質化データ送信用電子メールは、所定のサーバを経由して、高品質化データ送信用電子メールの宛先に配置されたメールアドレスの端末で受信されることになる。

次に、図 1 3のフローチャートを参照して、発信側の携帯電話機 1 0 で図 1 2の高品質化データ送信処理が行われる場合の、着信側の携帯電話機 1 0 1 ₂ による高品質化データ更新処理について説明する。

着信側の携帯電話機 1 0 1 ₂では、例えば、任意のタイミングや、ユーザからの指示に応じて、所定のメールサーバに対して、電子メールの受信が要求され、この要求が行われると、受信部 1 1 4 (図 4 ) において、高品質化データ更新処理が開始される。即ち、まず最初に、ステップ S 9 1において、上述の電子メールの受信の要求に応じてメールサーバから送信されてくる電子メールが、受信データとして. 受信制御部 1 3 1で受信され、管理部 1 3 5に供給される。

管理部 1 3 5は、ステップ S 9 2において、受信制御部 1 3 1から供給された電子メールのサブジェクトが、最新の高品質化データを含むものであることを表す「更新通知」であるかどうかを判定し、「更新通知」でないと判定した場合、即ち、電子メールが、高品質化データ送信用電子メールではない場合、高品質化データ更新処理を終了する。

また、ステップ S 9 2において、電子メールのサブジェクトが、「更新通知」であると判定された場合、即ち、電子メールが、高品質化データ送信用電子メールである場合、ステップ S 9 3に進み、管理部 1 3 5は、その高品質化データ送信用電子メールのメッセージとして配置されている最新の高品質化データ、更新情報、および発信側の電話番号を取得し、ステップ S 9 4に進む。

ステップ S 9 4では、管理部 1 3 5は、図 7のステップ S 1 4における場合と同様にして、高品質化データ送信用電子メールから取得した更新情報および発信側の電話番号を参照し、記憶部 1 3 6に、発信側の携帯電話機 1 0 のュ一ザについての最新の高品質化データが記憶されているかどうかを判定する。

ステップ S 9 4において、記憶部 1 3 6に、発信側の携帯電話機 1 0 のュ一ザについての最新の高品質化データが記憶されていると判定された場合、ステツプ S 9 5に進み、管理部 1 3 5は、ステップ S 9 3で取得した高品質化データ、更新情報、および電話番号を破棄し、高品質化データ更新処理を終了する。

また、ステップ S 9 4において、記憶部 1 3 6に、発信側の携帯電話機 1 0 のユーザについての最新の高品質化データが記憶されていないと判定された場合、ステップ S 9 6に進み、管理部 1 3 5は、図 7のステップ S 1 8における場合と同様に、ステップ S 9 3で取得した高品質化データ、更新情報、およぴ発信側の携帯電話機 1 0 の電話番号を、記憶部 1 3 6に記憶させることにより、記憶部 1 3 6の記憶内容を更新し、高品質化データ更新処理を終了する。次に、図 1 4は、図 3の送信部 1 1 3における学習部 1 2 5の構成例を示している。

図 1 4の実施の形態においては、学習部 1 2 5は、本件出願人が先に提案したクラス分類適応処理に用いられるタップ係数を、高品質化データとして学習するようになっている。

クラス分類適応処理は、クラス分類処理と適応処理とからなり、クラス分類処理によって、データが、その性質に基づいてクラス分けされ、各クラスごとに適応処理が施される。

ここで、適応処理について、低音質の音声（以下、適宜、低音質音声という）を、高音質の音声（以下、適宜、高音質音声という）に変換する場合を例に説明する。

この場合、適応処理では、低音質音声を構成する音声サンプル（以下、適宜、低音質音声サンプルという）と、所定のタップ係数との線形結合により、その低音質音声の音質を向上させた高音質音声の音声サンプルの予測値を求めることで、その低音質音声の音質を高くした音声が得られる。

具体的には、例えば、いま、ある高音質音声データを学習の教師となる教師データとするとともに、その高音質音声の音質を劣化させた低音質音声データを学習の生徒となる生徒データとして、高音質音声を構成する音声サンプル (以下、適宜、高音質音声サンプルという） yの予測値 E [ y ] を、幾つかの低音質音声サンプル（低音質音声を構成する音声サンプル） _{X l}， x ₂, · ■ ·の集合と、所定のタップ係数 w_u w₂, · ■ 'の線形結合により規定される線形 1 次結合モデルにより求めることを考える。この場合、予測値 E [ y ] は、次式で表すことができる。

E [ y ] = w₁ x ₁+ w₂ x ₂+ ■ · ■

… ( 1 ) 式（1 ) を一般化するために、タップ係数の集合でなる行列 W、生徒データ _Xijの集合でなる行列 X、および予測値 E [_yj] の集合でなる行列 Y' を、【数 1】

X11 X12

X21 22 X2J

x=

XI1 12 XlJ

で定義すると、次のような観測方程式が成立する。

XW=Y'

(2) ここで、行列 Xの成分 _Xijは、 i件目の生徒データの集合（ i件目の教師データ y_£の予測に用いる生徒データの集合）の中の；！番目の生徒データを意味し、行列 Wの成分 Wjは、生徒データの集合の中の j番目の生徒データとの積が演算されるタップ係数を表す。また、 _yiは、 i件目の教師データを表し、従って、 E

[yj は、 i件目の教師データの予測値を表す。なお、式（1) の左辺における yは、行列 YO成分 yiのサフィックス iを省略したものであり、また、式

( 1) の右辺における • ■ ■ も、 Tタ' (I Xの成力- X ijのサフィックス i を省略したものである。

式（2) の観測方程式に最小自乗法を適用して、高音質音声サンプル yに近い予測値 E [y] を求めることを考える。この場合、教師データとなる高音質音声サンプルの真値 yの集合でなる行列 Y、および高音質音声サンプル yの予測値 E [y] の残差（真値 yに対する誤差） eの集合でなる行列 Eを、【数 2】

ei yi

Θ2

E- ei yi

J で定義すると、式（2) から、次のような残差方程式が成立する。

XW=Y+E

• · · (3) この場合、高音質音声サンプル yに近い予測値 E [y] を求めるためのタツプ係数 Wjは、自乗誤差

【数 3】

を最小にすることで求めることができる。

従って、上述の自乗誤差をタップ係数 Wjで微分したものが 0になる場合、即ち、次式を満たすタップ係数 Wjが、高音質音声サンプル yに近い予測値 E [y] を求めるため最適値ということになる。

【数 4】

…，

• · ■ (4) そこで、まず、式 (3) を、タップ係数 Wjで微分することにより、次式が成立する。

【数 5】 θννι 3w₂ ， 8wj ^{v 1}

• · · (5) 式（4) および（5) より、式（6) が得られる。

【数 6】

• · · (6) さらに、式（3) の残差方程式における生徒データ _Xij、タップ係数 w_j 教師データ _yi、およぴ残差 _{e i}の関係を考慮すると、式（6) から、次のような正規方程式を得ることができる。

【数 7】

• · · (7) なお、式（7) に示した正規方程式は、行列（共分散行列） Aおよびべクトル Vをヽ

【数 8】

で定義するとともに、ベクトル Wを、数 1で示したように定義すると、式

• · · (8) で表すことができる。

式（7) における各正規方程式は、生徒データおよび教師データ _yiのセットを、ある程度の数だけ用意することで、求めるべきタップ係数 Wjの数 Jと同じ数だけたてることができ、従って、式（8) を、ベタトル Wについて解くことで（但し、式（8) を解くには、式（8) における行列 Aが正則である必要がある）、最適なタップ係数 Wjを求めることができる。なお、式（8) を解くにあたっては、例えば、掃き出し法（Gauss- Jordanの消去法）などを用いることが可能である。

以上のように、生徒データと教師データを用いて、最適なタップ係数 Wjを求める学習をしておき、さらに、そのタップ係数 Wjを用い、式（1) により、教師データ yに近い予測値 E [ y ] を求めるのが適応処理である。

なお、適応処理は、低音質音声には含まれていないが、高音質音声に含まれる成分が再現される点で、単なる補間とは異なる。即ち、適応処理では、式 ( 1 ) だけを見る限りは、いわゆる補間フィルタを用いての単なる補間と同一に見えるが、その補間フィルタのタップ係数に相当するタップ係数 wが、教師データ yを用いての、いわば学習により求められるため、高音質音声に含まれる成分を再現することができる。このことから、適応処理は、いわば音声の創造作用がある処理ということができる。

また、上述の場合には、高音質音声の予測値を、線形一次予測するようにしたが、その他、予測：は、 2以上の式によって予測することも可能である。図 1 4の学習部 1 2 5は、以上のようなクラス分類適応処理で用いられるタップ係数を、高品質化データとして学習する。

即ち、バッファ 1 4 1には、 0変換部1 2 2 (図 3 ) が出力する音声データが、学習用のデータとして供給されるようになっており、バッファ 1 4 1 は、その音声データを、学習の教師となる教師データとして一時記憶する。生徒データ生成部 1 4 2は、バッファ 1 4 1に記憶された教師データとしての音声データから、学習の生徒となる生徒データを生成する。

即ち、生徒データ生成部 1 4 2は、エンコーダ 1 4 2 Eとデコーダ 1 4 2 D とから構成されている。エンコーダ 1 4 2 Eは、送信部 1 1 3 (図 3 ) の符号化部 1 2 3と同様に構成されており、バッファ 1 4 1に記憶された教師データを、符号化部 1 2 3と同様にして符号化して、符号化音声データを出力する。デコーダ 1 4 2 Dは、後述する図 1 6のデコーダ 1 6 1と同様に構成されており、符号化音声データを、符号化部 1 2 3における符号化方式に対応する復号方式で復号し、その結果得られる復号音声データを、生徒データとして出力する。

なお、ここでは、教師データを、符号化部 1 2 3における場合と同様に、符号化音声データに符号化し、さらに、その符号化音声データを復号することによって、生徒データを生成するようにしたが、その他、生徒データは、例えば、教師データとしての音声データを、ローパスフィルタ等によってフィルタリングすることで、その音質を劣化させることにより生成すること等が可能である _c また、生徒データ生成部 1 4 2を構成するエンコーダ 1 4 2 Eとしては、符号化部 1 2 3を用いることが可能であり、さらに、デコーダ 1 4 2 Dとしては、後述する図 1 6のデコーダ 1 6 1を用いることが可能である。

生徒データメモリ 1 4 3は、生徒データ生成部 1 4 2のデコーダ 1 4 2 Dが出力する生徒データを一時記憶する。

予測タップ生成部 1 4 4は、バッファ 1 4 1に記憶された教師データの音声サンプルを、順次、注目データとし、さらに、その注目データを予測するのに用いる生徒データとしての幾つかの音声サンプルを、生徒データメモリ 1 4 3 から読み出すことにより、予測タップ（注目データの予測値を求めるためのタップ）を生成する。この予測タップは、予測タップ生成部 1 4 4から足し込み部 1 4 7に供給される。

クラスタップ生成部 1 4 5は、注目データをクラス分けするクラス分類に用いる生徒データとしての幾つかの音声サンプルを、生徒データメモリ 1 4 3から読み出すことにより、クラスタップ（クラス分類に用いるタップ）を生成する。このクラスタップは、クラスタップ生成部 1 4 5からクラス分類部 1 4 6 に供給される。

ここで、予測タップやクラスタップを構成する音声サンプルとしては、例えば、注目データとなっている教師データの音声サンプルに対応する生徒データの音声サンプルに対して時間的に近い位置にある音声サンプルを用いることができる。

また、予測タップとクラスタップを構成する音声サンプルとしては、同一の音声サンプルを用いることもできるし、異なる音声サンプルを用いることも可 fta Cめる。

クラス分類部 1 4 6は、クラスタツプ生成部 1 4 5からのクラスタツプに基づき、注目データをクラス分類し、その結果得られるクラスに対応するクラスコードを、足し込み部 1 4 7に出力する。

ここで、クラス分類を行う方法としては、例えば、 ADRC (Adaptive Dynamic R ange Coding)等を採用することができる。

ADRCを用いる方法では、クラスタップを構成する音声サンプルが、 ADRC処理され、その結果得られる ADRCコードにしたがって、注目データのクラスが決定される。

なお、 Kビット ADRCにおいては、例えば、クラスタップを構成する音声サンプルの最大値 MAXと最小値 MINが検出され、 DR二 MAX - MINを、集合の局所的なダイナミックレンジとし、このダイナミックレンジ DRに基づいて、クラスタップを構成する音声サンプルが Kビットに再量子化される。即ち、クラスタップを構成する各音声サンプルから、最小値 MINが減算され、その減算値が DR/^2Kで除算（量子化）される。そして、以上のようにして得られる、クラスタップを構成する Kビットの各音声サンプルを、所定の順番で並べたビット列が、 ADRCコードとして出力される。従って、クラスタップが、例えば、 1ビット ADRC処理された場合には、そのクラスタップを構成する各音声サンプルは、最小値 MIN が減算された後に、最大値 MAXと最小値 MINとの平均値で除算され、これにより、各音声サンプルが 1ビットとされる（2値化される）。そして、その 1ビットの音声サンプルを所定の順番で並べたビット列が、 ADRCコードとして出力される。

なお、クラス分類部 1 4 6には、例えば、クラスタップを構成する音声サンプルのレベル分布のパターンを、そのままクラスコードとして出力させることも可能であるが、この場合、クラスタップが、 N個の音声サンプルで構成され、各音声サンプルに、 Kビットが割り当てられているとすると、クラス分類部 1 4 6が出力するクラスコードの場合の数は、（2 ^N) ^κ通りとなり、音声サンプルのビット数 Κに指数的に比例した膨大な数となる。

従って、クラス分類部 1 4 6においては、クラスタップの情報量を、上述の A DRC処理や、あるいはベクトル量子化等によって圧縮してから、クラス分類を行うのが好ましい。

足し込み部 1 4 7は、ノッファ 1 4 1から、注目データとなっている教師データの音声サンプルを読み出し、予測タップ生成部 1 4 4からの予測タップを構成する生徒データ、および注目データとしての教師データを対象とした足し込みを、初期コンポーネント記憶部 1 4 8およびユーザ用コンポーネント記憶部 1 4 9の記憶内容を必要に応じて用いながら、クラス分類部 1 4 6から供給されるクラスごとに行う。

即ち、足し込み部 1 4 7は、基本的には、クラス分類部 1 4 6から供給されるクラスコードに対応するクラスごとに、予測タップ (生徒データ) を用い、式 ( 8 ) の行列 Aにおける各コンポーネントとなっている、生徒データどうしの乗算（x _in x _im) と、サメーシヨン（∑) に相当する演算を行う。

さらに、足し込み部 1 4 7は、やはり、クラス分類部 1 4 6から供給されるクラスコードに対応するクラスごとに、予測タップ (生徒データ) および注目データ（教師データ）を用い、式（8 ) のベクトル Vにおける各コンポーネントとなっている、生徒データと教師データの乗算 ( x _{in Y i}) と、サメーシヨン (∑) に相当する演算を行う。

一方、初期コンポーネント記憶部 1 4 8は、例えば、 R OMで構成され、あらかじめ用意された不特定多数の話者の音声データを学習用のデータとして学習を行うことにより得られた、式（8 ) における行列 Aのコンポーネントと、ベタトル Vのコンポーネントを、クラスごとに記憶している。

また、ユーザ用コンポーネント記憶部 1 4 9は、例えば、 E E P R OMで構成され、足し込み部 1 4 7において前回の学習で求められた式（8 ) における行歹 U Aのコンポーネントと、ベクトノレ Vのコンポーネントを、クラスごとに記憶する。

足し込み部 1 4 7は、新たに入力された音声データを用いて学習を行う場合、ユーザ用コンポーネント記憶部 1 4 9に記憶された、前回の学習で求められた式（8 ) における行列 Aのコンポ一ネントと、ベクトル Vのコンポーネントを読み出し、その行列 Aまたはベクトル Vのコンポーネントに対して、新たに入力された音声データから得られる教師データ _{y i}および生徒データ x_in (x_ira)を用いて計算される、対応するコンポーネント x _in x _iraまたは x _in y iを足し込むことにより（行列 A、ベクトル Vにおけるサメーシヨンで表される加算を行うことにより）、各クラスについて、式（8 ) に示した正規方程式をたてる。

従って、足し込み部 1 4 7では、新たに入力された音声データだけではなく過去の学習に用いられた音声データにも基づいて、式（8 ) の正規方程式がたてられる。

なお、学習部 1 2 5で、初めて学習が行われる場合や、ユーザ用コンポーネント記憶部 1 4 9がクリアされた直後等に学習が行われる場合おいては、ユーザ用コンポーネント記憶部 1 4 9には、前回の学習で求められた行列 Aとべクトル Vのコンポーネントは記憶されていないため、式（8 ) の正規方程式は、ユーザから入力された音声データだけを用いてたてられることになる。

この場合、入力される音声データのサンプル数が十分でないこと等に起因して、タップ係数を求めるのに必要な数の正規方程式が得られないクラスが生じることがあり得る。

そこで、初期コンポーネント記憶部 1 4 8は、あらかじめ用意された不特定十分な数の話者の音声データを学習用のデータとして学習を行うことにより得られた、式 ( 8 ) における行列 Aのコンポーネントと、ベタトル Vのコンポ一ネントを、クラスごとに記憶しており、学習部 1 2 5は、この初期コンポーネント記憶部 1 4 8に記憶された行列 Aおよびべクトル Vのコンポーネントと、入力された音声データから得られる行列 Aおよびべクトル Vのコンポーネントとを必要に応じて用いて、式（8 ) の正規方程式をたてることで、タップ係数を求めるのに必要な数の正規方程式が得られないクラスが生じることを防止するようになっている。

足し込み部 1 4 7は、新たに入力された音声データから得られた行列 Aおよびベクトル vのコンポーネントと、ユーザ用コンポーネント記憶部 1 4 9 (または初期コンポーネント記憶部 1 4 8 ) に記憶された行列 Aおよびべクトル V のコンポーネントと用いて、新たに、クラスごとの行列 Aおよびベクトル Vのコンポーネントを求めると、それらのコンポーネントを、ユーザ用コンポーネント記憶部 1 4 9に供給し、上書きする形で記憶させる。

さらに、足し込み部 1 4 7は、新たに求めたクラスごとの行列 Aおよびべクトル Vのコンポーネントで構成される式（8 ) の正規方程式を、タップ係数決定部 1 5 0に供給する。

その後、タップ係数決定部 1 5 0は、足し込み部 1 4 7から供給されるクラスごとの正規方程式を解くことにより、クラスごとに、タップ係数を求め、このクラスごとのタップ係数を、高品質化データとして、その更新情報とともに、記憶部 1 2 6に供給し、上書きする形で記憶させる。

次に、図 1 5のフローチャートを参照して、図 1 4の学習部 1 2 5で行われる、高品質化データとしてのタップ係数の学習処理について説明する。

例えば、ユーザが通話時に行った発話、あるいは任意のタイミングで行った発話による音声デタが、 /0変換部1 2 2 (図 3 ) からバッファ 1 4 1に供給され、バッファ 1 4 1は、そこに供給される音声データを記憶する。

そして、例えば、ユーザが通話を終了すると、あるいは、発話を開始してから所定時間が経過すると、学習部 1 2 5は、通話中に、バッファ 1 4 1に記憶された音声データ、あるいは、一連の発話を開始してから終了するまでに、バッファ 1 4 1に記憶された音声データを、新たに入力された音声データとして. 学習処理を開始する。

即ち、まず最初に、生徒データ生成部 1 4 2は、ステップ S 1 0 1において. バッファ 1 4 1に記憶された音声データを教師データとして、その教師データから生徒データを生成し、生徒データメモリ 1 4 3に供給して記憶させ、ステップ S 1 0 2に進む。

ステップ S 1 0 2では、予測タップ生成部 1 4 4は、ノッファ 1 4 1に記憶された教師データとしての音声サンプルのうち、まだ注目データとしていないものの 1つを注目データとして、その注目データについて、生徒データメモリ 1 4 3に記憶された生徒データとしての音声サンプルの幾つかを読み出すことにより、予測タップを生成して、足し込み部 1 4 7に供給する。

さらに、ステップ S 1 0 2では、クラスタップ生成部 1 4 5が、予測タップ生成部 1 4 4における場合と同様にして、注目データについて、クラスタップを生成し、クラス分類部 1 4 6に供給する。

ステップ S 1 0 2の処理後は、ステップ S 1 0 3に進み、クラス分類部 1 4 6が、クラスタップ生成部 1 4 5からのクラスタップに基づいて、クラス分類を行い、その結果得られるクラスコードを、足し込み部 1 4 7に供給する。

そして、ステップ S 1 0 4に進み、足し込み部 1 4 7は、ノッファ 1 4 1力ら注目データを読み出し、その注目データと、予測タップ生成部 1 4 4からの予測タップを用いて、行列 Aとベクトル Vのコンポーネントを計算する。さらに、足し込み部 1 4 7は、ユーザ用コンポーネント記憶部 1 4 9に記憶された行列 Aとべクトノレ Vのコンポーネントのうち、クラス分類部 1 4 6からのクラスコードに対応するものに対して、注目データと予測タップから求められた行列 Aとべクト^/ Vのコンポーネントを足し込み、ステップ S 1 0 5に進む。

ステップ S 1 0 5では、予測タップ生成部 1 4 4力ノッファ 1 4 1に、まだ、注目データとしていない教師データが存在するかどうかを判定し、存在すると判定した場合、ステップ S 1 0 2に戻り、まだ、注目データとされていない教師データを、新たに注目データとして、以下、同様の処理が繰り返される, また、ステップ S 1 0 5において、バッファ 1 4 1に、注目データとしてレヽない教師データが存在しないと判定された場合、足し込み部 1 4 7は、ユーザ用コンポーネント記憶部 1 4 9に記憶されたクラスごとの行列 Aおよびべクトル Vのコンポーネントで構成される式（8 ) の正規方程式を、タップ係数決定部 1 5 0に供給し、ステップ S 1 0 6に進む。

ステップ S 1 0 6では、タップ係数決定部 1 5 0は、足し込み部 1 4 7から供給される各クラスごとの正規方程式を解くことにより、各クラスごとに、タップ係数を求める。さらに、ステップ S 1 0 6では、タップ係数決定部 1 5 0 は、各クラスごとのタップ係数を、更新情報とともに、記憶部 1 2 6に供給し、上書きする形で記憶させ、学習処理を終了する。

なお、ここでは、学習処理をリアルタイムで行わないようにしたが、ハードウェアが十分な性能を有する場合には、リアルタイムで行っても良い。

以上のように、学習部 1 2 5では、新たに入力された音声データと、過去の学習に用いられた音声データに基づく学習処理が、通話時その他の任意のタイミングで行われ、これにより、ユーザが発話を行うほど、符号化音声データを、そのユーザの音声に近い音声に復号することのできるタップ係数が求められる _c 従って、通話相手側において、そのようなタップ係数を用いて、符号化音声デ一タの復号を行うことにより、ユーザの音声の特性に適した処理が施され、十分に音質を改善した復号音声データを得ることができ、ユーザが携帯電話機 1 0 1を使い込むことにより、通話相手側において、より品質の良い音声が出力されることになる。

ここで、送信部 1 1 3 (図 3 ) の学習部 1 2 5が図 1 4に示したように構成される場合には、高品質化データはタップ係数であるから、受信部 1 1 4 (図 4 ) の記憶部 1 3 6には、タップ係数が記憶される。なお、この場合、受信部 1 1 4のデフォルトデータメモリ 1 3 7には、例えば、図 1 4の初期コンポ一ネント記憶部 1 4 8に記憶されたコンポーネントによる正規方程式を解くことによって得られるクラスごとのタップ係数が、デフオルトデータとして記憶される。

次に、図 1 6は、送信部 1 1 3 (図 3 ) の学習部 1 2 5が図 1 4に示したように構成される場合の、受信部 1 1 4 (図 4 ) の復号部 1 3 2の構成例を示している。

デコーダ 1 6 1には、受信制御部 1 3 1 (図 4 ) が出力する符号化音声データが供給されるようになっており、デコーダ 1 6 1は、その符号化音声データを、送信部 1 1 3 (図 3 ) の符号化部 1 2 3における符号化方式に対応する復号方式で復号し、その結果得られる復号音声データを、バッファ 1 6 2に出力する。

バッファ 1 6 2は、デコーダ 1 6 1が出力する復号音声データを一時記憶する。

予測タップ生成部 1 6 3は、復号音声データの音質を向上させた音質向上データを、順次、注目データとして、その注目データの予測値を、式（1 ) の線形一次予測演算により求めるのに用いる予測タップを、バッファ 1 6 2に記憶された復号音声データのうちの幾つかの音声サンプルによって構成（生成）し- 予測部 1 6 7に供給する。なお、予測タップ生成部 1 6 3は、図 1 4の学習部 1 2 5における予測タップ生成部 1 4 4が生成するのと同一の予測タップを生成する。

クラスタツプ生成部 1 6 4は、バッファ 1 6 2に記憶された復号音声データのうちの幾つかの音声サンプルによって、注目データについて、クラスタップを構成 (生成) し、クラス分類部 1 6 5に供給する。なお、クラスタップ生成部 1 6 4は、図 1 4の学習部 1 2 5におけるクラスタップ生成部 1 4 5が生成するのと同一のクラスタップを生成する。

クラス分類部 1 6 5は、クラスタツプ生成部 1 6 4からのクラスタツプを用い、図 1 4の学習部 1 2 5におけるクラス分類部 1 4 6と同様のクラス分類を行い、その結果得られるクラスコードを、係数メモリ 1 6 6に供給する。

係数メモリ 1 6 6は、管理部 1 3 5から供給される高品質化データとしてのクラスごとのタップ係数を、そのクラスに対応するァドレスに記慷する。さらに、係数メモリ 1 6 6は、クラス分類部 1 6 5から供給されるクラスコ一ドに対応するアドレスに記憶されているタップ係数を、予測部 1 6 7に供給する。

予測部 1 6 7は、予測タップ生成部 1 6 3が出力する予測タップと、係数メモリ 1 6 6が出力するタップ係数とを取得し、その予測タップとタツプ係数とを用いて、式（1 ) に示した線形予測演算を行う。これにより、予測部 1 6 7 は、注目データとしての音質向上データ（の予測値）を求め、 D /A変換部 1 3 3 (図 4 ) に供給する。

次に、図 1 7のフローチャートを参照して、図 1 6の復号部 1 3 2の処理について説明する。

デコーダ 1 6 1は、受信制御部 1 3 1 (図 4 ) が出力する符号化音声データを復号し、その結果得られる復号音声データを、バッファ 1 6 2に出力して記憶させている。

そして、まず最初に、ステップ S 1 1 1において、予測タップ生成部 1 6 3 力復号音声データの音質を向上させた音質向上データのうち、例えば、時系列順で、まだ注目データとしていない時間的に最も先行する音声サンプルを、注目データとし、その注目データについて、バッファ 1 6 2から復号音声データのうちの幾つかの音声サンプルを読み出すことにより、予測タップを構成して、予測部 1 6 7に供給する。

さらに、ステップ S 1 1 1では、クラスタップ生成部 1 6 4が、バッファ 1 6 2に記憶された復号音声データのうちの幾つかの音声サンプルを読み出すことにより、注目データについて、クラスタップを構成し、クラス分類部 1 6 5 に供給する。

クラス分類部 1 6 5は、クラスタツプ生成部 1 6 4からクラスタップを受信すると、ステップ S 1 1 2に進み、そのクラスタップを用いてクラス分類を行い、その結果得られるクラスコードを、係数メモリ 1 6 6に供給して、ステツプ S 1 1 3に進む。

ステップ S 1 1 3では、係数メモリ 1 6 6は、クラス分類部 1 6 5からのクラスコードに対応するァドレスに記憶されているタップ係数を読み出し、予測部 1 6 7に供給して、ステップ S 1 1 4に進む。

ステップ S 1 1 4では、予測部 1 6 7は、係数メモリ 1 6 6が出力するタツプ係数を取得し、そのタツプ係数と、予測タップ生成部 1 6 3カゝらの予測タップとを用いて、式（1 ) に示した積和演算を行い、音質向上データ（の予測値）を得る。

以上のようにして得られた音質向上データは、予測部 1 6 7から、 D ZA変換部 1 3 3 (図 4 ) を介して、スピーカ 1 3 4に供給され、これにより、スピ一力 1 3 4からは、高音質の音声が出力される。

即ち、タップ係数は、ユーザの音声を教師とするとともに、その音声を符号化し、さらに復号したものを生徒として、その教師と生徒との関係を学習することにより得られたものであるので、デコーダ 1 6 1が出力する復号音声データから、元のユーザの音声を、精度良く予測することを可能とするものであり従って、スピーカ 1 3 4からは、通信相手のユーザの音声の肉声により近い音声、即ち、デコーダ 1 6 1 (図 1 6 ) が出力する復号音声データの音質を向上させたものが出力されることになる。

ステップ S 1 1 4の処理後は、ステップ S 1 1 5に進み、まだ、注目データとして処理すべき音質向上データがあるかどうかが判定され、あると判定された場合、ステップ S 1 1 1に戻り、以下、同様の処理が繰り返される。また、ステップ S 1 1 5において、注目データとして処理すべき音質向上データがないと判定された場合、処理を終了する。

なお、携帯電話機 1 0 と 1 0 1 ₂との間で通話が行われる場合、携帯電話機 1 0 1 ₂では、図 5で説明したことから、高品質化データとしてのタップ係数として、通話相手である携帯電話機 1 0 1^の電話番号と対応付けられたもの、即ち、携帯電話機 1 0 を所有するユーザの音声データを学習用のデータとして学習したものが用いられる。従って、携帯電話機 1 0 から携帯電話機 1 0 1 ₂ に対して送信されてくる音声が、携帯電話機 1 0 l iのユーザの音声であれば、携帯電話機 1 0 1 ₂において、携帯電話機 1 0 のユーザ用のタップ係数を用いて復号が行われることにより、高音質の音声が出力されることとなる。

しカゝしな力ら、携帯電話機 1 0 から携帯電話機 1 0 1 ₂に対して送信されてくる音声が、携帯電話機 1 0 のユーザの音声でない場合、即ち、携帯電話機 1 0 の所有者でないユーザが、携帯電話機 1 0 3^を使用している場合、携帯電話機 101₂では、やはり、携帯電話機 10 のユーザ用のタップ係数を用いて復号が行われることから、その復号によって得られる音声は、基本的に、携帯電話機 10 1^の真のユーザ（所有者）の音声における場合よりも、音質が向上したものにはならない。即ち、単純には、携帯電話機 10 1₂では、携帯電話機 1 0 を、そのの所有者が使用していれば、高音質の音声が出力され、携帯電話機 10 を、その所有者以外のユーザが使用している場合には、音質の良い音声は出力されない。この点に注目すれば、携帯電話機 10 1によって、簡易な個人認証が可能であるということができる。

次に、図 1 8は、携帯電話機 10 1力例えば、 C E L P (Code Excited Lin er Prediction coding)方式のものである場合の、送信部 1 1 3 (図 3 ) を構成する符号化部 1 23の構成例を示している。

AZD変換部 1 22 (図 3) が出力する音声データは、演算器 3と LPC(Li ner Prediction Coefficient)分析部 4に供給される。

L PC分析部 4は、 /0変換部1 22 (図 3) からの音声データを、所定の音声サンプルを 1フレームとして、フレームごとに LP C分析し、 P次の線形予測係数いひ ₂， ■ · · ， Q;_pを求める。そして、 L PC分析部 4は、この P次の線形予測係数ひ _p (p = 1 , 2， ■ ■ ■， P) を要素とするベクトルを、音声の特徴べクトルとして、ベタトル量子化部 5に供給する。

ベタトル量子化部 5は、線形予測係数を要素とするコードべクトルとコードとを対応付けたコ一ドブックを記憶しており、そのコードブックに基づいて、 L P C分析部 4からの特徴べクトル αをべクトル量子化し、そのべクトル量子化の結果得られるコード（以下、適宜、 Αコード（A_code)という）を、コード決定部 1 5に供給する。

さらに、ベクトル量子化部 5は、 Aコードに対応するコードベクトル a，を構成する要素となっている線形予測係数 ο^' , α₂' , ■ · ■， α_Ρ' を、音声合成フィルタ 6に供給する。

音声合成フィルタ 6は、例えば、 I I R (Infinite Impulse Response)型のデイジタルフィルタで、ベタトル量子化部 5からの線形予測係数 a; _p ' (p = 1 , 2 , ■ ■ ■， P) を I I Rフィルタのタップ係数とするとともに、演算器 1 4 から供給される残差信号 eを入力信号として、音声合成を行う。

即ち、 L P C分析部 4で行われる L P C分析は、現在時刻 nの音声データ (のサンプル値） s _n、およびこれに隣接する過去の P個のサンプル値 s い s _n_

2， · · ·， S _n_p k "ヽェ C

S _n+ O!！ S _η__χ+ (¾ 2 ^S r-""'- ' · ■ + ^α P ^S π-Ρ ^{= θ}π

• · · ( 9) で示す線形 1次結合が成立すると仮定し、現在時刻 ηのサンプル値 s _ηの予測値 (線形予測値） s _n' を、過去の P個の標本値 s _n— s _n_₂， ■ · ·， s _n__Pを用いて、式

S _n =― ( « 1 S „_!+ ₂ S _n_₂+ - ■ ■ + K p S _n__p)

• · ■ ( 1 0) によつて線形予測したときに、実際のサンプル値 s _nと線形予測値 s _η' との間の自乗誤差を最小にする線形予測係数ひ _ρを求めるものである。

ここで、式（9) において、 {e_n} ( · · · , e_n—い e_n, e_n+1, · ■ ■ ) は、平均値が 0で、分散が所定値 σ₂の互いに無相関な確率変数である。

式（9) から、サンプル値 s _nは、式

s _n=e_n一 t _L s _η__χ + a s _n_₂ + ■ ■ ■ + a; p s _n—pノ

· ■ ■ ( 1 1 ) で表すことができ、これを、 Z変換すると、次式が成立する。

S = E/ { 1 + a_x z^_1+ 2 z - · · + a _P z "^p)

• · · ( 1 2) 但し、式（1 2 ) において、 Sと Eは、式（1 1 ) における s _nと e_nの Z変換を、それぞれ表す。

ここで、式（9 ) および（1 0) から、 e_nは、式 • · · ( 1 3 ) で表すことができ、実際のサンプル値 s _nと線形予測値 s _n' との間の残差信号と呼ばれる。

従って、式（1 2 ) から、線形予測係数ひ _pを I I Rフィルタのタップ係数とするとともに、残差信号 e _nを I I Rフィルタの入力信号とすることにより、音声データ s _nを求めることができる。

そこで、音声合成フィルタ 6は、上述したように、ベタトル量子化部 5からの線形予測係数ひ _ρ' をタップ係数とするとともに、演算器 1 4から供給される残差信号 eを入力信号として、式（1 2 ) を演算し、音声データ（合成音データ） s sを求める。

なお、音声合成フィルタ 6では、 L P C分析部 4による L P C分析の結果得られる線形予測係数 α _ρではなく、そのべクトル量子化の結果得られるコードに対応するコードベクトルとしての線形予測係数ひ _ρ' が用いられるため、音声合成フィルタ 6が出力する合成音信号は、 A/D変換部 1 2 2 (図 3 ) が出力する音声データとは、基本的に同一にはならない。

音声合成フィルタ 6が出力する合成音データ s sは、演算器 3に供給される, 演算器 3は、音声合成フィルタ 6からの合成音データ s sから、 A/D変換部 1 2 2 (図 3 ) が出力する音声データ sを減算し、その減算値を、自乗誤差演算部 7に供給する。自乗誤差演算部 7は、演算器 3からの減算値の自乗和（第 kフレームのサンプル値についての自乗和）を演算し、その結果得られる自乗誤差を、自乗誤差最小判定部 8に供給する。

自乗誤差最小判定部 8は、自乗誤差演算部 7が出力する自乗誤差に対応付けて、長期予測ラグを表すコードとしての Lコード（L— code)、ゲインを表すコードとしての Gコード（G— code)、および符号語（励起コードプック）を表すコ一ドとしての Iコード（I_code)を記憶しており、自乗誤差演算部 7が出力する自乗誤差に対応する Lコード、 Gコード、および Lコードを出力する。 Lコードは、適応コードブック記憶部 9に、 Gコードは、ゲイン復号器 1 0に、 Iコードは、励起コードプック記憶部 1 1に、それぞれ供給される。さらに、 Lコード、 Gコード、および Iコードは、コード決定部 1 5にも供給される。

適応コードプック記憶部 9は、例えば 7ビットの Lコードと、所定の遅延時間（ラグ）とを対応付けた適応コードプックを記憶しており、演算器 1 4から供給される残差信号 eを、自乗誤差最小判定部 8から供給される Lコードに対応付けられた遅延時間（長期予測ラグ）だけ遅延して、演算器 1 2に出力する _c ここで、適応コードプック記憶部 9は、残差信号 eを、 Lコードに対応する時間だけ遅延して出力することから、その出力信号は、その遅延時間を周期とする周期信号に近い信号となる。この信号は、線形予測係数を用いた音声合成において、主として、有声音の合成音を生成するための駆動信号となる。従つて、 Lコードは、概念的には、音声のピッチ周期を表す。なお、 CELPの規格によれば、レコードは、 2 0乃至 1 4 6の範囲の整数値をとる。

ゲイン復号器 1 0は、 Gコードと、所定のゲイン ]3および 0；とを対応付けたテ一ブルを記憶しており、自乗誤差最小判定部 8から供給される Gコードに対応付けられたゲイン ]3および γを出力する。ゲインと γは、演算器 1 2と 1 3に、それぞれ供給される。ここで、ゲインは、長期フィルタ状態出力ゲインと呼ばれるものであり、また、ゲイン γは、励起コードブックゲインと呼ばれるものである。

励起コードブック記憶部 1 1は、例えば 9ビットの Iコードと、所定の励起信号とを対応付けた励起コードブックを記憶しており、自乗誤差最小判定部 8 から供給される I コードに対応付けられた励起信号を、演算器 1 3に出力する, ここで、励起コードブックに記憶されている励起信号は、例えば、ホワイトノイズ等に近い信号であり、線形予測係数を用いた音声合成において、主として、無声音の合成音を生成するための駆動信号となる。

演算器 1 2は、適応コードブック記憶部 9の出力信号と、ゲイン復号器 1 0 が出力するゲイン ]3とを乗算し、その乗算値 1を、演算器 1 4に供給する。演算器 1 3は、励起コードプック記憶部 1 1の出力信号と、ゲイン復号器 1 0が出力するゲイン γとを乗算し、その乗算値 ηを、演算器 1 4に供給する。演算器 1 4は、演算器 1 2からの乗算値 1 と、演算器 1 3からの乗算値 ηとを加算し、その加算値を、残差信号 eとして、音声合成フィルタ 6と適応コードプック記憶部 9に供給する。

音声合成フィルタ 6では、以上のようにして、演算器 1 4から供給される残差信号 eを入力信号が、ベタトル量子化部 5から供給される線形予測係数ひをタップ係数とする I I Rフィルタでフィルタリングされ、その結果得られる合成音データが、演算器 3に供給される。そして、演算器 3および自乗誤差演算部 7において、上述の場合と同様の処理が行われ、その結果得られる自乗誤差が、自乗誤差最小判定部 8に供給される。

自乗誤差最小判定部 8は、自乗誤差演算部 7からの自乗誤差が最小（極小）になったかどうかを判定する。そして、自乗誤差最小判定部 8は、自乗誤差が最小になっていないと判定した場合、上述のように、その自乗誤差に対応する Lコード、 Gコード、および Lコドを出力し、以下、同様の処理が繰り返される。

—方、自乗誤差最小判定部 8は、自乗誤差が最小になったと判定した場合、確定信号を、コード決定部 1 5に出力する。コード決定部 1 5は、ベタトル量子化部 5から供給される Αコードをラツチするとともに、自乗誤差最小判定部 8から供給される Lコード、 Gコード、および Iコードを順次ラッチするようになっており、自乗誤差最小判定部 8から確定信号を受信すると、そのときラツチしている Aコード、 Lコード、 Gコード、および Iコードを多重化し、符号化音声データとして出力する。

以上から、符号化音声データは、復号に用いられる情報である Aコード、 L コード、 Gコード、および Iコードを、フレーム単位ごとに有するものとなつている。

ここで、図 1 8 (後述する図 1 9および図 2 0においても同様）では、各変数に、 [k]が付され、配列変数とされている。この kは、フレーム数を表すが、明細書中では、その記述は、適宜省略する。

次に、図 1 9は、携帯電話機 1 0 1が、 C E L P方式のものである場合の、受信部 1 1 4 (図 4 ) を構成する復号部 1 3 2の構成例を示している。なお、図中、図 1 6における場合と対応する部分については、同一の符号を付してある。

受信制御部 1 3 1 (図 4 ) が出力する符号化音声データは、 D E MU X (デマルチプレクサ) 2 1に供給され、 D E MU X 2 1は、符号化音声データから Lコード、 Gコード、 Iコード、 Aコードを分離し、それぞれを、適応コードプック記憶部 2 2、ゲイン復号器 2 3、励起コードブック記憶部 2 4、フィルタ係数復号器 2 5に供給する。

適応コードブック記憶部 2 2、ゲイン復号器 2 3、励起コードブック記憶部 2 4、演算器 2 6乃至 2 8は、図 1 8の適応コードブック記憶部 9、ゲイン復号器 1 0、励起コードブック記憶部 1 1、演算器 1 2乃至 1 4とそれぞれ同様に構成されるもので、図 1で説明した場合と同様の処理が行われることにより. Lコード、 Gコード、および Iコードが、残差信号 eに復号される。この残差信号 eは、音声合成フィルタ 2 9に対して、入力信号として与えられる。

フィルタ係数復号器 2 5は、図 1 8のべクトル量子化部 5が記憶しているのと同一のコードブックを記憶しており、 Aコードを、線形予測係数 α _ρ' に復号し、音声合成フィルタ 2 9に供給する。

音声合成フィルタ 2 9は、図 1 8の音声合成フィルタ 6と同様に構成されており、フィルタ係数復号器 2 5からの線形予測係数ひ ρ ' をタツプ係数とするとともに、演算器 2 8から供給される残差信号 eを入力信号として、式（1 2 ) を演算し、これにより、図 1 8の自乗誤差最小判定部 8において自乗誤差が最小と判定されたときの合成音データを生成し、復号音声データとして出力する, ここで、発信側の符号化部 1 2 3から、着信側の復号部 1 3 2に対しては、図 1 8で説明したことから、復号部 1 3 2の音声合成フィルタ 2 9に与えられる入力信号としての残差信号と線形予測係数がコード化されて送信されてくるため、復号部 1 3 2では、そのコードが、残差信号と線形予測係数に復号される。しかしながら、この復号された残差信号や線形予測係数（以下、適宜、それぞれを、復号残差信号または復号線形予測係数という）には、量子化誤差等の誤差が含まれるため、発信側におけるユーザの音声を L P C分析して得られる残差信号と線形予測係数には一致しない。

このため、復号部 1 3 2の音声合成フィルタ 2 9が出力する合成音データである復号音声データは、発信側のユーザの音声データに対して、歪み等を有する、音質の劣化したものとなる。

そこで、復号部 1 3 2は、上述のクラス分類適応処理を行うことによって、復号音声データを、歪みのない（歪みを低減した）、発信側のユーザの音声データに近い音質向上データに変換するようになっている。

即ち、音声合成フィルタ 2 9が出力する合成音データである復号音声データは、バッファ 1 6 2に供給され、バッファ 1 6 2は、その復号音声データを一時記' I思 ^る。

そして、予測タップ生成部 1 6 3は、復号音声データの音質を向上させた音質向上データを、順次、注目データとし、その注目データについて、バッファ 1 6 2から復号音声データのうちの幾つかの音声サンプルを読み出すことにより、予測タップを構成して、予測部 1 6 7に供給する。また、クラスタップ生成部 1 6 4は、バッファ 1 6 2に記憶された復号音声データのうちの幾つかの音声サンプルを読み出すことにより、注目データについて、クラスタップを構成し、クラス分類部 1 6 5に供給する。

クラス分類部 1 6 5は、クラスタップ生成部 1 6 4からクラスタップを用いてクラス分類を行い、その結果得られるクラスコ一ドを、係数メモリ 1 6 6に供給する。係数メモリ 1 6 6は、クラス分類部 1 6 5からのクラスコードに対応するアドレスに記憶されているタップ係数を読み出し、予測部 1 6 7に供給する。

そして、予測部 1 6 7は、係数メモリ 1 6 6が出力するタップ係数と、予測タップ生成部 1 6 3からの予測タップとを用いて、式（1 ) に示した積和演算を行い、音質向上データ（の予測値）を得る。

以上のようにして得られた音質向上データは、予測部 1 6 7から、 D /A変換部 1 3 3 (図 4 ) を介して、スピーカ 1 3 4に供給され、これにより、スピ一力 1 3 4からは、高音質の音声が出力される。

次に、図 2 0は、携帯電話機 1 0 1が、 C E L P方式のものである場合の、送信部 1 1 3 (図 3 ) を構成する学習部 1 2 5の構成例を示している。なお、図中、図 1 4における場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

演算器 1 8 3乃至コード決定部 1 9 5は、図 1 8の演算器 3乃至コード決定部 1 5とそれぞれ同様に構成される。演算器 1 8 3には、 AZD変換部 1 2 2 (図 3 ) が出力する音声データが、学習用のデータとして入力されるようになつており、従って、演算器 1 8 3乃至コード決定部 1 9 5では、その学習用の音声データに対して、図 1 8の符号化部 1 2 3における場合と同様の処理が施される。

そして、自乗誤差最小判定部 1 8 8において自乗誤差が最小になったと判定されたときの音声合成フィルタ 1 8 6が出力する合成音データが、生徒データとして、生徒データメモリ 1 4 3に供給される。

その後は、生徒データメモリ 1 4 3乃至タップ係数決定部 1 5 0において、図 1 4および 1 5における場合と同様の処理が行われ、これにより、クラスごとのタップ係数が、高品質化データとして生成される。

なお、図 1 9または図 2 0の実施の形態では、予測タップやクラスタップを、音声合成フィルタ 2 9または 1 8 6が出力する合成音データから構成するようにしたが、予測タップゃクラスタップは、図 1 9または図 2 0において点線で示すように、 Iコードや、 Lコード、 Gコード、 Aコード、 Aコードから得られる線形予測係数 _p、 Gコードから得られるゲイン， γ、その他の、 Lコード、 Gコード、 Iコード、または Αコードから得られる情報（例えば、残差信号 eや、残差信号 eを得るための 1， n、さらには、 1 / 0 , η / γなど）のうちの 1以上を含めて構成することが可能である。

次に、図 2 1は、送信部 1 1 3 (図 3 ) を構成する符号化部 1 2 3の他の構成例を示している。

図 2 1の実施の形態においては、符号化部 1 2 3は、 A/D変換部 1 2 2 (図 3 ) が出力する音声デ ^タをべクトル量子化することにより符号化するようになっている。

即ち、 /0変換部1 2 2 (図 3 ) が出力する音声データは、バッファ 2 0 1に供給され、バッファ 2 0 1は、そこに供給される音声データを一時記憶する。

べクトル化部 2 0 2は、バッファ 2 0 1に記憶された音声データを時系列に読み出して、所定数の音声サンプルを 1フレームとし、各フレームの音声データをべクトル化する。

ここで、べクトル化部 2 0 2では、例えば、 1フレームの各音声サンプルを、そのまま、ベクトルの各コンポーネントとすることにより、音声データをべクトル化することも可能であるし、また、例えば、 1フレームを構成する音声サンプルについて、 L P C分析等の音響分析を施し、その結果得られる音声の特徴量を、ベクトルのコンポーネントとすることにより、音声データをベクトル化することも可能である。なお、ここでは、説明を簡単にするために、例えば、 1フレームの各音声サンプノレを、そのまま、ベタトの各コンポーネントとすることにより、音声データをベクトル化するものとする。

ベクトル化部 2 0 2は、 1フレームの各音声サンプルを、そのままコンポ一ネントとして構成したべクトル（以下、適宜、音声べクトルとする）を、距離計算部 2 0 3に出力する。

距離計算部 2 0 3は、コードブック記憶部 2 0 4に記憶されたコードブックに登録されている各コードべクトルと、ベタトル化部 2 0 2からの音声べクトルとの距離（例えば、ユークリッド距離など）を計算し、各コードべクトルについて求められた距離を、そのコードベクトルに対応するコードとともに、コード決定部 2 0 5に供給する。

即ち、コードブック記憶部 2 0 4は、後述する図 2 2の学習部 1 2 5における学習によって得られる高品質化データとしてのコードプックを記憶し、距離計算部 2 0 3は、そのコードプックに登録されている各コードベクトルについて、ベタトル化部 2 0 2からの音声べクトルとの距離を計算して、各コードべクトルに対応するコードとともに、コード決定部 2 0 5に供給する。

コード決定部 2 0 5は、距離計算部 2 0 3から供給される、各コードべクトルについての距離のうち、最も短いものを検出し、その最も短い距離を与えるコードべクトル、即ち、音声べクトルについての量子化誤差（ベタトル量子化誤差）を最も小さくするコードべクトルに対応するコードを、ベクトル化部 2 0 2が出力した音声べクトルについてのベタトル量子化結果として決定する。

そして、コード決定部 2 0 5は、そのベクトル量子化結果としてのコードを、符号化音声データとして、送信制御部 1 2 4 (図 3 ) に出力する。

従って、図 2 1の実施の形態では、距離計算部 2 0 3、コードブック記憶部 2 0 4、およびコード決定部 2 0 5で、ベクトル量子化器が構成されている。

次に、図 2 2は、符号化部 1 2 3が図 2 1に示したように構成される場合の. 図 3の送信部 1 1 3を構成する学習部 1 2 5の構成例を示している。

バッファ 2 1 1には、 A/D変換部 1 2 2が出力する音声データが供給されるようになっており、バッファ 2 1 1は、そこに供給される音声データを記憶する。

ベタトル化部 2 1 2は、バッファ 2 1 1に記憶された音声デ^"タを用いて、図 2 1のべクトル化部 2 0 2における場合と同様にして、音声べクトルを構成し、ユーザ用べクトル記憶部 2 1 3に供給する。

ユーザ用べクトル記憶部 2 1 3は、例えば、 E E P R OMなどで構成され、ベタトル化部 2 1 2から供給される音声べクトルを順次記憶する。初期べクトル記憶部 2 1 4は、例えば、 R OMなどで構成され、不特定多数のユーザの音声データを用いて構成された多数の音声べクトルをあらかじめ記憶している。

コードプック生成部 2 1 5は、初期べクトル記憶部 2 1 4およびユーザべクトル記憶部 2 1 3に記憶された音声ベクトルをすベて用い、例えば、 L B G (L inde, Buzo, Gray) ァノレゴリズムによって、コードプックを生成する学習を行い、その学習の結果得られるコードブックを、高品質化データとして出力する, なお、コードブック生成部 2 1 5が出力する高品質化データとしてのコードブックは、記憶部 1 2 6 (図 3 ) に供給され、更新情報（コードブックが得られた日時）とともに記憶されるとともに、符号化部 1 2 3 (図 2 1 ) にも供給され、そのコードブック記憶部 2 0 4に書き込まれる（上書きされる）。

ここで、図 2 2の学習部 1 2 5で、初めて学習が行われる場合や、ユーザ用ベタトル記憶部 2 1 3がクリアされた直後等に学習が行われる場合おいては、ユーザ用べクトル記憶部 2 1 3には、音声べクトルが記憶されていないため、コ一ドブック生成部 2 1 5において、ユーザ用べクトル記憶部 2 1 3だけを参照するのでは、コードブックを生成することができないことがある。また、携帯電話機 1 0 1の使用が開始されてから間もない場合においては、ユーザ用べクトル記憶部 2 1 3には、それほど多くの音声べクトルが記憶されていない。

この場合、コードブック生成部 2 1 5において、ユーザ用べクトル記憶部 2 1 3を参照するだけでも、コードブックを生成することは可能ではあるが、そのようなコードブックを用いたベクトル量子化は、かなり精度の悪いもの（量子化誤差が大きいもの）となることがある。

そこで、初期べクトル記憶部 2 1 4には、上述のように、多数の音声べクトルが記憶されており、コードブック生成部 2 1 5は、ユーザ用べタトル記憶部 2 1 3だけでなく、初期べクトル記憶部 2 1 4も参照することで、上述のような精度の悪いべクトル量子化が行われるようなコードブックが生成されることを防止するようになっている。

なお、ユーザ用べクトル記憶部 2 1 3に、ある程度の数の音声べクトルが記憶された後は、コードブック生成部 2 1 5において、初期べクトル記憶部 2 1 4を参照せずに、ユーザ用ベクトル記憶部 2 1 3だけを参照して、コードブックを生成するようにすることが可能である。

次に、図 2 3のフローチャートを参照して、図 2 2の学習部 1 2 5で行われる、高品質化データとしてのドブックの学習処理について説明する。

例えば、ユーザが通話時に行った発話、あるいは任意のタイミングで行った発話による音声データが、 0変換部1 2 2 (図 3 ) からバッファ 2 1 1に供給され、バッファ 2 1 1は、そこに供給される音声データを記憶する。

そして、例えば、ユーザが通話を終了すると、あるいは、発話を開始してから所定時間が経過すると、学習部 1 2 5は、通話中に、バッファ 2 1 1に記憶された音声データ、あるいは、一連の発話を開始してから終了するまでに、ッファ 2 1 1に記憶された音声データを、新たに入力された音声データとして、学習処理を開始する。

即ち、ベタトル化部 2 1 2は、バッファ 2 1 1に記憶された音声データを時系列に読み出し、所定数の音声サンプルを 1フレームとして、各フレームの音声データをべクトル化する。そして、ベタトル化部 2 1 2は、そのべクトル化の結果得られる音声べクトルを、ユーザ用べクトル記憶部 2 1 3に供給して追加記憶させる。

バッファ 2 1 1に記憶された音声データすぺてのベタトル化が終了すると、コードブック生成部 2 1 5は、ステップ S 1 2 1において、ユーザ用べクトル記憶部 2 1 3と初期べタトル記憶部 2 1 4に記憶された各音声べクトルとの距離の総和を最小にするベクトル _{y i}を求める。そして、ドブック生成部 2 1 5は、そのべクトル y を、トべクトノレ _{y i}として、ステップ S 1 2 2に進む _c ステップ S 1 2 2では、コードプック生成部 2 1 5は、現在得られているコードベクトルの総数を変数 nに設定し、ドべクトノレ yい y ₂, · · ■ , y _n それぞれを 2分割する。即ち、コードブック生成部 2 1 5は、例えば、厶を微小なベタトルとするとき、ドべクトル y i ( i = 1 2 , · · · η ) 力ら、ベタトル y i + Δおよび y i— Δを生成し、ベクトル _{y i} + Aを、新たなコードべクトル y iとするとともに、ベクトル y i—△を、新たなコードべクトル y_n+iとする _c そして、ステップ S 1 23に進み、コードプック生成部 21 5は、ユーザ用べクトル記憶部 21 3と初期べクトル記憶部 214に記憶された各音声べクトル X j ( j = 1 , 2， ■ ■ · , J (ユーザ用ベクトル記憶部 21 3と初期べクトル記憶部 2 14に記憶された音声べクトルの総数））を、その音声べクトノレ X j と最も距離が近いコードベクトル yi ( i = l ， 2， ■ . ·， 2 n) に分類し、ステップ S I 24に進む。

ステップ S 1 24では、コードプック生成部 21 5は、各コードべクトノレ _{y i} を、そのコードべクトル _yiに分類された各音声べクトルとの距離の総和が最小になるように更新する。なお、この更新は、例えば、コードベクトル _yiに分類された 0個以上の音声べクトルが指す点の重心を求めることによって行うことができる。即ち、その重心を指すベクトルが、コードベクトル _yiに分類された各音声べクトルとの距離の総和を最小にするものとなる。伹し、コードべクトル yiに分類された音声ベクトルが 0個の場合は、コードベクトル _yiは、例えば、そのままとされる。

その後、ステップ S 1 25に進み、コードブック生成部 2 1 5は、更新後の各コードべクトル _yiについて、そのコードべクトル y iに分類された各音声べクトルとの距離の総和（以下、適宜、コードベクトル _yiについての距離の総和という）を求め、さらに、すべてのコードベクトル yiについての距離の総和の総和 (以下、適宜、全総和という) を求める。そして、コードブック生成部 2 1 5は、その全総和の変化、即ち、今回のステップ S 1 25で求めた全総和（以下、適宜、今回の全総和という）と、前回のステップ S 1 25で求めた全総和 (以下、適宜、前回の全総和という）との差の絶対値が、所定の閾値以下であるかどうかを判定する。

ステップ S 1 2 5において、今回の全総和と前回の全総和との差の絶対値が、所定の閾値以下でないと判定された場合、即ち、コードベクトル _yiを更新することにより、全総和が大きく変化した場合、ステップ S 1 23に戻り、以下、同様の処理を繰り返す。

また、ステップ S 1 2 5において、今回の全総和と前回の全総和との差の絶対値が、所定の閾値以下であると判定された場合、即ち、コードベクトル _{y i}を更新しても、全総和がほとんど変化しない場合、ステップ S 1 2 6に進み、コ一ドブック生成部 2 1 5は、現在得られているコードべクトルの総数を表す変数 nが、コードブックにあらかじめ設定されているコードべクトルの数 (以下、適宜、設定コードベクトル数という） Nに等しいかどうかを判定する。 .

ステップ S 1 2 6において、変数 nが、設定コードベクトル数 Nに等しくないと判定された場合、即ち、まだ、設定コードベクトル数 Nに等しい数のコードベクトル _{y i}が得られていない場合、ステップ S 1 2 2に戻り、以下、同様の処理を繰り返す。

また、ステップ S 1 2 6において、変数 11が、設定コードベクトル数 Nに等しいと判定された場合、即ち、設定コードベクトル数 Nに等しい数のコードべクトル _{y i}が得られた場合、コードプック生成部 2 1 5は、その N個のコードべクトル _{y i}で構成されるコードプックを、高品質化データとして出力し、学習処理を終了する。

なお、図 2 3の学習処理では、ユーザ用べクトル記憶部 2 1 3に、いままでに入力された音声べクトルを記憶しておき、その音声べクトルを用いて、コードブックを更新（生成）するようにしたが、コードブックの更新は、過去に入力された音声べクトルを記憶しておかずに、今回入力された音声べクトルと、既に得られているコードブックを用い、ステップ S 1 2 3および S 1 2 4の処理により、いわば簡略化した形で行うことも可能である。

即ち、この場合、コードブック生成部 2 1 5は、ステップ S 1 2 3において, 今回入力された各音声べクトル X j ( j = 1 , 2， · · ■， J (今回入力された音声ベクトルの総数））を、その音声ベクトル X jと最も距離が近いコードべクトル _{y i} ( i = l， 2， · · ■ , N (コードブックにおけるコードベクトルの総数））に分類し、ステップ S 1 2 4に進む。ステップ S 1 24では、コードブック生成部 21 5は、各コードべクトノレ y i を、そのコードべクトル _yiに分類された各音声べクトルとの距離の総和が最小になるように更新する。なお、この更新は、上述したように、コードベクトル y iに分類された 0個以上の音声べクトルが指す点の重心を求めることによって行うことができるから、例えば、いま、更新後のコードベクトルを _yi' と、更新前のコードべクトル y iに分類されている過去に入力された音声べクトルを X 2, · . ·， X _M一 Lと、コードべクトル y iに分類された今回の音声べクトルを X _M-_L+1, M-_l+2, · ■ · , χ_Μと、それぞれ表すと、更新前のコードベクトル y iと、更新後のコードベクトルは、それぞれ式（14) と式（1 5) を計算することによって求めることができる。

y i= ( X !+ X ₂+■ ■ - +x_M__L)/(M- L)

• · · (14) i

· · ■ ⁺ X_M-L⁺ X_M-L₊I⁺X_M-L½⁺ ■ ■ ■ + x _M)

• · - (1 5) ところで、いまの場合、過去に入力された音声ベクトル x₂, ■ · ■， x _M__Lは記憶されていない。そこで、式（1 5) を次式にように変形する。

Υ i = ( X ι+ X 2+ ■ · ■ + X M-L+ ^X M-L+1 )

+ (x_M— _L+2+■ · ■ +x_M) /M

= (_Xl+x₂+ . ■ ' +x_M__L+x_M__L+1)/(M-L) X (M-D/M

• · · (16) 式（1 6) に、式（14) を代入すると次式が得られる。

Yi' =_{y i}X (M-L)/M+(x_M__L+2+ - · - +x_M)/M

• · · (1 7) 式（ 1 7) によれば、今回入力された音声ベクトル x_M-_L+1， X M-L+2, ■ · · , χ_Μと、既に得られているコードプックにおけるコードべクトル yiを用いることによって、そのコードベクトル yiを更新し、更新後のコードベクトル yiを求めることができる。

この場合、過去に入力された音声べクトルを記憶しておく必要がないので、ユーザ用ベクトル記憶部 2 1 3の記憶容量が少なくて済む。但し、この場合、ユーザ用べクトル記憶部 2 1 3には、今回入力された音声べクトルの他、いままでに各コードべクトル y iに分類された音声べクトルの総数を記憶させておくとともに、コードベクトル y iの更新に伴って、その更新後のコードベクトル y ' についても、そのコードベクトルに分類された音声ベクトルの総数を更新する必要がある。さらに、初期べクトル記憶部 2 1 4には、不特定多数のュ一ザの音声データを用いて構成された多数の音声べクトルではなく、そのような多数の音声べクトルを用いて生成されたコードブックと各コードべクトルに分類された音声べクトルの総数を記憶させておく必要がある。図 2 2の学習部 1 2 5で、初めて学習が行われる場合や、ユーザ用べクトル記憶部 2 1 3がクリアされた直後等に学習が行われる場合おいては、初期べクトル記憶部 2 1 4 に記憶されたコードプックを用いて、そのコードブックの更新が行われることになる。

以上のように、図 2 2の実施の形態における学習部 1 2 5でも、新たに入力された音声データと、過去の学習に用いられた音声データに基づく図 2 3の学習処理が、通話時その他の任意のタイミングで行われ、これにより、ユーザが発話を行うほど、そのユーザに適したコードプック、即ち、そのユーザの音声に対して量子化誤差を小さくするコードブックが求められる。従って、通話相手側において、そのようなコードプックを用いて、符号化音声データの復号

(ここでは、ベクトル逆量子化）を行うことにより、やはり、ユーザの音声の特性に適した処理（べクトル逆量子化処理）が施され、従来の場合（不特定多数の話者の発話から求められたコードブックを用いる場合）に比較して、十分に音質を改善した復号音声データを得ることができることになる。

次に、図 2 4は、送信部 1 1 3 (図 3 ) の学習部 1 2 5が図 2 2に示したように構成される場合の、受信部 1 1 4 (図 4 ) の復号部 1 3 2の構成例を示している。

バッファ 2 2 1は、受信制御部 1 3 1 (図 4 ) が出力する符号化音声データ (ここでは、ベクトル量子化結果としてのコード）を一時記憶する。ベクトル逆量子化部 2 2 2は、バッファ 2 2 1に記憶されたコードを読み出し、コードブック記憶部 2 2 3に記憶されたコードブックを参照することでベタトル逆量子化を行うことにより、そのコードを、音声ベクトルに復号し、逆べクトル化部 2 2 4に供給する。

コードブック記憶部 2 2 3は、管理部 1 3 5が高品質化データとして供給するコードブックを記憶する。

ここで、送信部 1 1 3 (図 3 ) の学習部 1 2 5が図 2 2に示したように構成される場合には、高品質化データはコードプックであるから、受信部 1 1 4 (図 4 ) の記憶部 1 3 6には、コードブックが記憶される。なお、この場合、受信部 1 1 4のデフォルトデータメモリ 1 3 7には、例えば、図 2 2の初期べクトル記憶部 2 1 4に記憶された音声べクトルを用いて生成されたコードブックが、デフォルトデータとして記憶される。

逆べクトル化部 2 2 4は、ベタトル逆量子化部 2 2 2が出力する音声べクトルを、時系列の音声データに逆べクトル化して出力する。

次に、図 2 5のフローチャートを参照して、図 2 4の復号部 1 3 2の処理 (復号処理）について説明する。

バッファ 2 2 1は、そこに供給される符号化音声データとしてのコードを順次記憶する。

そして、ベクトル逆量子化部 2 2 2は、ステップ S 1 3 1において、バッファ 2 2 1に記憶されたコードのうち、まだ読み出していない時間的に最も古いものを、注目コードとして読み出し、ベクトル逆量子化する。即ち、ベクトル逆量子化部 2 2 2は、コードプック記憶部 2 2 3に記憶されたコードブックのコードべクトルのうち、注目コードが対応付けられているものを検出し、そのコードべクトルを、音声べクトルとして、逆べクトル化部 2 2 4に出力する。逆べクトノレ化部 2 2 4は、ステップ S 1 3 2において、ベタトル逆量子化部 2 2からの音声べクトルを逆べクトル化することにより、音声データに復号して出力し、ステップ S 1 3 3に進む。

ステップ S 1 3 3では、ベタトル逆量子化部 2 2 2が、バッファ 2 2 1に、注目コードとされていないコードが、まだ記憶されているかどうかを判定する, ステップ S 1 3 3において、ノッファ 2 2 1に、注目コードとされていないコードが、まだ記憶されていると判定された場合、ステップ S 1 3 1に戻り、ノッファ 2 2 1に記憶されたコードのうち、まだ読み出していない時間的に最も古いものを、新たな注目コードとして、以下、同様の処理が繰り返される。

また、ステップ S 1 3 3において、バッファ 2 2 1に、注目コードとされていないコードが記憶されていないと判定された場合、処理を終了する。

次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウエアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にィンストーノレされる。

そこで、図 2 6は、上述した一連の処理を実行するプログラムがインスト一ルされるコンピュータの一実施の形態の構成例を示している。

プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク 4 0 5や R OM 4 0 3に予め記録しておくことができる。

あるいはまた、プログラムは、フレキシブルディスク、 CD- ROM (Compact Disc Read Only Memory; , MO (Magneto optical)アイスク， DVD (Digital Versatile Disc) , 磁気ディスク、半導体メモリなどのリムーバブル記録媒体 4 1 1に、一時的あるいは永続的に格納（記録）しておくことができる。このようなリムーバブル記録媒体 4 1 1は、いわゆるパッケージソフトウエアとして提供することができる。

なお、プログラムは、上述したようなリムーバブル記録媒体 4 1 1からコンピュータにインストールする他、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、 LAN (Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを、通信部 4 0 8で受信し、内蔵するハードディスク 4 0 5にインストールすることができる。

コンピュータは、 CPU (Central Processing Unit) 4 0 2を内蔵している。 CPU 4 0 2には、バス 4 0 1を介して、入出力ィンタフェース 4 1 0が接続されており、 CPU 4 0 2は、入出力インタフェース 4 1 0を介して、ユーザによって、キーボードや、マウス、マイク等で構成される入力部 4 0 7が操作等されることにより指令が入力されると、それにしたがって、 ROM (Read Only Memory) 4 0 3に格納されているプログラムを実行する。あるいは、また、 CPU 4 0 2は、ノヽ一ドディスク 4 0 5に格納されているプログラム、衛星若しくはネットワークから転送され、通信部 4 0 8で受信されてハードディスク 4 0 5にィンストールされたプログラム、またはドライブ 4 0 9に装着されたリムーバブル記録媒体 4 1 1から読み出されてハードディスク 4 0 5にィンストールされたプログラムを、 RAM ORandom Access Memory) 4 ◦ 4にロードして実行する。これにより- CPU 4 0 2は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、 CPU 4 0 2は、その処理結果を、必要に応じて、例えば、入出力インタフェース 4 1 0を介して、 LCD (Liq uid Crystal Display)やスピーカ等で構成される出力部 4 0 6から出力、あるいは、通信部 4 0 8から送信、さらには、ハードディスク 4 0 5に記録等させる。

ここで、本明細書において、コンピュータに各種の処理を行わせるためのプログラムを記述する処理ステップは、必ずしもフローチヤ一トとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理（例えば、並列処理あるいはオブジェクトによる処理）も含むものである。また、プログラムは、 1のコンピュータにより処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。

なお、本実施の形態では、着信側において、着呼時に、発信側から送信されてくる電話番号を、発信側を特定する特定情報とするようにしたが、その他、例えば、ユーザ等に、ユニークな ID (IdenUfication)を割り当てておき、その IDを、特定情報として用いることも可能である。

また、本実施の形態では、本発明を、携帯電話機どうしで音声通話を行う伝送システムに適用した場合について説明したが、本発明は、その他、音声通信を行うシステムに広く適用可能である。

さらに、図 4の実施の形態において、記憶部 1 3 6とデフォルトメモリ 1 3 7は、書き換え可能な 1つのメモリで構成することが可能である。

また、高品質化データは、携帯電話機 1 0 から、図示せぬサーバにァップロードしておき、携帯電話機 1 0 1 ₂において、そのサーバから、必要に応じてダウンロードするようにすること等が可能である。産業上の利用可能性

本発明の送信装置および送信方法、並びに第 1のプログラムによれば、音声データが符号化され、符号化音声データが出力される。一方、符号化音声データを受信する受信側において出力される音声の品質を向上させる高品質化データの学習が、過去の学習に用いられた音声データと、新たに入力された音声データとに基づいて行われ、符号化音声データと高品質化データとが送信される, 従って、受信側において、高品質の音声を復号することが可能となる。

本発明の受信装置及び受信方法、並びに第 1のプログラムによれば、符号化音声データが受信され、その符号化音声データを送信してきた送信側の特定情報と対応付けられている高品質化データが選択される。そして、その選択された高品質化データに基づいて、受信された符号化音声データが復号される。従つて、高品質の音声を復号することが可能となる。

本発明の送受信装置によれば、入力された音声データが符号化され、符号化音声データが出力される。そして、符号化音声データを受信する他の送受信装置において出力される音声の品質を向上させる高品質化データの学習が、過去の学習に用いられた音声データと、新たに入力された音声データとに基づいて行われ、符号化音声データと高品質化データとが送信される。一方、他の送受信装置から送信されてくる符号化音声データが受信され、その符号化音声データを送信してきた他の送受信装置の特定情報と対応付けられている高品質化データが選択される。そして、その選択された高品質化データに基づいて、受信された符号化音声データが復号される。従って、高品質の音声を復号することが可能となる。

Claims

請求の範囲

1 . 入力された音声データを送信する送信装置であって、

前記音声データを符号化し、符号化音声データを出力する符号化手段と、前記符号化音声データを受信する受信側において出力される音声の品質を向上させる高品質化データの学習を、過去の学習に用いられた音声データと、新たに入力された音声データとに基づいて行う学習手段と、

前記符号化音声データと前記高品質化データとを送信する送信手段とを備えることを特徴とする送信装置。

2 . 前記高品質化データの送信を管理する管理手段をさらに備える

ことを特徴とする請求の範囲第 1項に記載の送信装置。

3 . 前記管理手段は、前記送信装置と前記受信側との間で通信リンクを確立した後に、最新の前記高品質化データが送信されるように、前記高品質化データの送信を管理する

ことを特徴とする請求の範囲第 1項に記載の送信装置。

4 . 前記管理手段は、前記送信装置と前記受信側との間で通信リンクを確立した後、前記受信側から、高品質化データの要求があった場合に、最新の前記高品質化データが送信されるように、前記高品質化データの送信を管理することを特徴とする請求の範囲第 2項に記載の送信装置。

5 . 前記受信側への高品質化データの送信履歴を記憶する履歴記憶手段をさらに備え、 .

前記管理手段は、

前記送信履歴に基づいて、前記送信側への最新の前記高品質化データの送信が済んでいるかを判定し、

前記送信側への最新の前記高品質化データの送信が済んでいない場合に、その最新の前記高品質化データが送信されるように、前記高品質化データの送信を管理する

ことを特徴とする請求の範囲第 1項に記載の送信装置。

6 . 前記学習手段は、前記符号化音声データを復号した復号音声データを高品質化した高品質音声データの予測値を求める予測演算を行うために、前記復号音声データとともに用いるタップ係数を、前記高品質化データとして求める学習を行う

ことを特徴とする請求の範囲第 1項に記載の送信装置。

7 . 前記学習手段は、

前記音声データを第 1のデータとして、前記第 1のデータから前記第 1のデータよりもクオリティの低い第 2のデータを生成する低クオリティデータ生成手段と、

前記タップ係数および前記第 2のデータを用いて予測演算を行うことにより得られる前記第 1のデータの予測値と前記第 1のデータとの予測誤差を、統計的に最小にする前記タップ係数を演算する演算手段と

を有する

ことを特徵とする請求の範囲第 6項に記載の送信装置。

8 . 前記低クオリティデータ生成手段は、前記第 1のデータを前記符号化音声データに符号化し、さらに、その符号化音声データを復号して得られる復号音声データを、前記第 2のデータとして生成する

ことを特徴とする請求の範囲第 7項に記載の送信装置。

9 . 前記学習手段は、

注目している前記第 1のデータである注目第 1のデータをクラス分けするクラス分類を行うのに用いるクラスタツプを生成するクラスタツプ生成手段と、前記クラスタップに基づいて、前記注目第 1のデータをクラス分類し、そのクラスを表すクラスを求めるクラス分類手段と

をさらに有し、

前記演算手段は、前記クラスごとに、前記タップ係数を求める

ことを特徴とする請求の範囲第 7項に記載の送信装置。

1 0 . コードブックを記憶するコードブック記憶手段をさらに備え、前記符号化手段は、前記音声データを、前記コードブック記憶手段に記憶されている所定のコードプックに基づいてベタトル量子化し、その結果得られるコードを、前記符号化音声データとして出力する

ことを特徴とする請求の範囲第 1項に記載の送信装置。

1 1 . 前記学習手段は、新たな前記コードブックを、前記高品質化データとレて求める学習を行う

ことを特徴とする請求の範囲第 1 0項に記載の送信装置。

1 2 . 入力された音声データを送信する送信方法であって、

前記音声データを符号化し、符号化音声データを出力する符号化ステップと前記符号化音声データを受信する受信側において出力される音声の品質を向上させる高品質化データの学習を、過去の学習に用いられた音声データと、新たに入力された音声データとに基づいて行う学習ステップと、

前記符号化音声データと前記高品質化データとを送信する送信ステップとを備えることを特徴とする送信方法。

1 3 . 入力された音声データを送信する送信処理を、コンピュータに行わせるプログラムであって、

前記符号化音声データと前記高品質化データとを送信する送信ステップとを備えることを特徴とするプログラム。

1 4 . 入力された音声データを送信する送信処理を、コンピュータに行わせるプログラムが記録されている記録媒体であって、

前記音声データを符号化し、符号化音声データを出力する符号化ステップと前記符号化音声データを受信する受信側において出力される音声の品質を向上させる高品質化データの学習を、過去の学習に用いられた音声データと、新たに入力された音声データとに基づいて行う学習ステップと、前記符号化音声データと前記高品質化データとを送信する送信ステップとを備えるプログラムが記録されている

ことを特徴とする記録媒体。

1 5 . 音声データを符号化した符号化音声データを受信する受信装置であつて、

前記符号化音声データを受信する受信手段と、

前記符号化音声データを復号した復号音声データの品質を向上させる高品質化データを、前記符号化音声データを送信してくる送信側を特定する特定情報とともに記憶する記憶手段と、

前記符号化音声データを送信してきた送信側の特定情報と対応付けられている前記高品質化データを選択する選択手段と、

前記選択手段において選択された前記高品質化データに基づいて、前記受信手段において受信された符号化音声データを復号する復号手段と

を備えることを特徴とする受信装置。

1 6 . 前記記憶手段は、デフォルトの高品質化データをあらかじめ記憶している

ことを特徴とする請求の範囲第 1 5項に記載の受信装置。

1 7 . 前記特定情報に基づいて、前記符号化音声データを送信してくる前記送信側に対応する前記高品質化データが前記記憶手段に記憶されているかを判定する判定手段をさらに備え、

前記判定手段において、前記送信側に対応する前記高品質化データが前記記憶手段に記憶されていないと判定された際に、前記選択手段は、前記デフオルトの高品質化データを選択する

ことを特徴とする請求の範囲第 1 6項に記載の受信装置。

1 8 . 前記受信手段は、前記送信側から送信されてくる前記高品質化データも受信し、前記受信手段において受信された前記高品質化データによる、前記記憶手段の記憶内容の更新を管理する管理手段をさらに備える

ことを特徴とする請求の範囲第 1 5項に記載の受信装置。

1 9 . 前記管理手段は、前記受信装置と前記送信側との間で通信リンクを確立した後に、前記送信側から送信されてくる最新の前記高品質化データによつて、前記記憶手段の記憶内容を更新する

ことを特徴とする請求の範囲第 1 8項に記載の受信装置。

2 0 . 前記送信側にデータを送信する送信手段をさらに備え、

前記管理手段は、

前記受信装置と前記送信側との間で通信リンクを確立した後、前記送信側に対して、高品質化データの送信を要求する高品質化データ送信要求を前記送信手段で送信し、

前記高品質化データ送信要求に応じて、前記送信側から送信されてくる最新の前記高品質化データによって、前記記憶手段の記憶内容を更新する

ことを特徴とする請求の範囲第 1 9項に記載の受信装置。

2 1 . 前記管理手段は、

前記記憶手段に最新の前記高品質化データが記憶されているかを判定し、前記記憶手段に最新の前記高品質化データが記憶されていない場合に、前記送信側から送信されてくる最新の前記高品質化データによって、前記記憶手段の記憶内容を更新する

ことを特徴とする請求の範囲第 1 8項に記載の受信装置。

2 2 . 前記記憶手段には、前記高品質化データに対する更新情報がさらに記憶されており、

前記管理手段は、前記記憶手段の前記更新情報に基づいて、最新の前記高品質化データが記憶されているかを判定する

ことを特徴とする請求の範囲第 2 1項に記載の受信装置。

2 3 . 前記更新情報は、前記高品質化データを得た日時であることを特徴とする請求の範囲第 2 2項に記載の受信装置。

2 4 . 前記送信側から送信されてくる最新の前記高品質化データによって. 前記記憶手段の記憶内容の更新を行うことを禁止するように設定する更新禁止設定手段をさらに備える

ことを特徴とする請求の範囲第 2 1項に記載の受信装置。

2 5 . 前記送信側は、電話機であり、

前記送信側の特定情報は、その送信側の電話機の電話番号である

ことを特徴とする請求の範囲第 1 5項に記載の受信装置。

2 6 . 前記高品質化データは、前記符号化音声データを復号した復号音声データを高品質化した高品質音声データの予測値を求める予測演算を行う際に、前記復号音声データとともに用いるタップ係数であり、

前記復号手段は、

前記符号化音声データを復号し、復号音声データを出力する処理を行う第 1 の処理手段と、

前記復号音声データおよびタップ係数を用いて予測演算を行うことにより、前記高品質音声データの予測値を求める処理を行う第 2の処理手段と

を有する

ことを特徴とする請求の範囲第 1 5項に記載の受信装置。

2 7 . 前記タップ係数は、

前記高品質音声データを、第 1のデータとして、前記第 1のデータから、前記第 1のデータよりもクオリティの低い第 2のデータを生成し、

前記タップ係数および前記第 2のデータを用いて予測演算を行うことにより得られる前記第 1のデータの予測値と前記第 1のデータとの予測誤差を、統計的に最小にする前記タップ係数を演算することにより求められたものであることを特徴とする請求の範囲第 2 6項に記載の受信装置。

2 8 . 前記第 2のデータは、前記第 1のデータを前記符号化音声データに符号化し、さらに、その符号化音声データを復号して得られる復号音声データである

ことを特徴とする請求の範囲第 2 7項に記載の受信装置。

2 9 . 前記タップ係数は、所定のクラスごとにクラス分けされており、前記第 2の処理手段は、

前記予測値を求めようとする前記高品質音声データを注目データとして、その注目データをクラス分けするクラス分類を行うのに用いるクラスタップを生成するクラスタツプ生成手段と、

前記クラスタップに基づいて、前記注目データをクラス分類し、そのクラスを表すクラスを求めるクラス分類手段と、

前記注目データのクラスに対応する前記タップ係数と、前記復号音声データとを用いて予測演算を行うことにより、前記注目データの予測値を求める予測手段と

を有する

ことを特徴とする請求の範囲第 2 6項に記載の受信装置。

3 0 . 前記符号化音声データは、前記音声データをベクトル量子化して得られるコ一ドであり、

前記高品質化データは、前記コードをべクトル逆量子化するのに用いられるコードブックであり、

前記復号手段は、前記コードブックに基づいて、前記コードをべクトル逆量子化することにより、前記符号化音声データを復号する

ことを特徴とする請求の範囲第 1 5項に記載の受信装置。

3 1 . 音声データを符号化した符号化音声データを受信する受信方法であつて、

前記符号化音声データを受信する受信ステップと、

前記符号化音声データを復号した復号音声データの品質を向上させる高品質化データを、前記符号化音声データを送信してくる送信側を特定する特定情報とともに記憶する記憶前記符号化音声データを送信してきた送信側の特定情報と対応付けられている前記高品質化データを選択する選択ステップと、

前記選択ステップにおいて選択された前記高品質化データに基づいて、前記受信ステップにおいて受信された符号化音声データを復号する復号ステップとを備えることを特徴とする受信方法。

3 2 . 音声データを符号化した符号化音声データを受信する受信処理を、コンピュータに行わせるプログラムであって、

前記符号化音声データを受信する受信ステップと、

前記符号化音声データを復号した復号音声データの品質を向上させる高品質化データを、前記符号化音声データを送信してくる送信側を特定する特定情報とともに記憶する記憶ステツプと、

前記符号化音声データを送信してきた送信側の特定情報と対応付けられている前記高品質化データを選択する選択ステップと、

前記選択ステップにおいて選択された前記高品質化データに基づいて、前記受信ステップにおいて受信された符号化音声データを復号する復号ステツプとを備えることを特徴とするプログラム。

3 3 . 音声データを符号化した符号化音声データを受信する受信処理'を、コンピュータに行わせるプログラムが記録されている記録媒体であって、前記符号化音声データを受信する受信ステップと、

前記符号化音声データを復号した復号音声データの品質を向上させる高品質化データを、前記符号化音声データを送信してくる送信側を特定する特定情報とともに記憶する記憶ステップと、

前記符号化音声データを送信してきた送信側の特定情報と対応付けられている前記高品質化データを選択する選択ステツプと、

前記選択ステップにおいて選択された前記高品質化データに基づいて、前記受信ステップにおいて受信された符号化音声データを復号する復号ステツプとを備えるプログラムが記録されていることを特徴とする記録媒体。

3 4 . 送信装置と受信装置とから構成される送受信装置であって、

前記送信装置は、

入力された音声データを符号化し、符号化音声データを出力する符号化手段と、

前記符号化音声データを受信する他の送受信装置において出力される音声の品質を向上させる高品質化データの学習を、過去の学習に用いられた音声データと、新たに入力された音声データとに基づいて行う学習手段と、

前記符号化音声データと前記高品質化データとを送信する送信手段とを備え、

前記受信装置は、

前記他の送受信装置から送信されてくる符号化音声データを受信する受信手段と、

前記高品質化データを、前記符号化音声データを送信してくる前記他の送受信装置を特定する特定情報とともに記憶する記憶手段と、

前記符号化音声データを送信してきた前記他の送受信装置の特定情報と対応付けられている前記高品質化データを選択する選択手段と、

前記選択手段において選択された前記高品質化データに基づいて、前記受信手段において受信された前記符号化音声データを復号する復号手段と

を備える

ことを特徴とする送受信装置。