WO2003001709A1 - Transmission apparatus, transmission method, reception apparatus, reception method, and transmission/reception apparatus - Google Patents

Transmission apparatus, transmission method, reception apparatus, reception method, and transmission/reception apparatus Download PDF

Info

Publication number
WO2003001709A1
WO2003001709A1 PCT/JP2002/006179 JP0206179W WO03001709A1 WO 2003001709 A1 WO2003001709 A1 WO 2003001709A1 JP 0206179 W JP0206179 W JP 0206179W WO 03001709 A1 WO03001709 A1 WO 03001709A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
quality
unit
receiving
transmission
Prior art date
Application number
PCT/JP2002/006179
Other languages
English (en)
French (fr)
Inventor
Tetsujiro Kondo
Masaaki Hattori
Tsutomu Watanabe
Hiroto Kimura
Original Assignee
Sony Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corporation filed Critical Sony Corporation
Priority to EP02743668A priority Critical patent/EP1401130A4/en
Priority to CN028026632A priority patent/CN1465149B/zh
Priority to KR1020037002805A priority patent/KR100895745B1/ko
Priority to US10/362,582 priority patent/US7366660B2/en
Publication of WO2003001709A1 publication Critical patent/WO2003001709A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/18Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals

Description

送信装置および送信方法、 受信装置および受信方法、 並びに送受信装置 技術分野
本発明は、 送信装置および送信方法、 受信装置および受信方法、 並びに送受 信装置に関し、 特に、 例えば、 携帯電話機等において、 高音質の音声による通 話を行うことができるようにする送信装置および送信方法、 受信装置および受 信方法、 並びに送受信装置に関する。 背景技術
例えば、 携帯電話機での音声通話においては、 伝送帯域が制限されているこ と等に起因して、 受信された音声の音質は、 ユーザが発した実際の音声の音質 よりも比較的大きく劣化したものとなる。
そこで、.従来の携帯電話機では、 受信した音声の音質を改善するために、 受 信した音声に対して、 例えば、 その音声の周波数スペク トルを調整するフィル タリング等の信号処理が施される。
しかしながら、 ユーザの音声は、 ユーザごとに特徴があるため、 同一のタツ プ係数のフィルタによって、 受信した音声のフィルタリングを行うのでは、 ュ 一ザごとに異なる音声の周波数特性によっては、 その音声の音質を十分に改善 することができない場合がある。 発明の開示
本発明は、 このような状況に鑑みてなされたものであり、 ユーザごとに、 音 質を十分に改善した音声を得ることができるようにするものである。
本発明の送信装置は、 音声データを符号化し、 符号化音声データを出力する 符号化手段と、 符号化音声データを受信する受信側において出力される音声の 品質を向上させる高品質化データの学習を、 過去の学習に用いられた音声デー タと、 新たに入力された音声データとに基づいて行う学習手段と、 符号化音声 データと高品質化データとを送信する送信手段とを備えることを特徴とする。 本発明の送信方法は、 音声データを符号化し、 符号化音声データを出力する 符号化ステップと、 符号化音声データを受信する受信側において出力される音 声の品質を向上させる高品質化データの学習を、 過去の学習に用いられた音声 データと、 新たに入力された音声データとに基づいて行う学習ステップと、 符 号化音声データと高品質化データとを送信する送信ステップとを備えることを 特徴とする。
本発明の第 1のプログラムは、 音声データを符号化し、 符号化音声データを 出力する符号化ステップと、 符号化音声データを受信する受信側において出力 される音声の品質を向上させる高品質化データの学習を、 過去の学習に用いら れた音声データと、 新たに入力された音声データとに基づいて行う学習ステツ プと、 符号化音声データと高品質化データとを送信する送信ステップとを備え ることを特徴とする。
本発明の第 1の記録媒体は、 音声データを符号化し、 符号化音声データを出 力する符号化ステップと、 符号化音声データを受信する受信側において出力さ れる音声の品質を向上させる高品質化データの学習を、 過去の学習に用いられ た音声データと、 新たに入力された音声データとに基づいて行う学習ステップ と、 符号化音声データと高品質化データとを送信する送信ステップとを備える プログラムが記録されていることを特徴とする。
本発明の受信装置は、 符号化音声データを受信する受信手段と、 符号化音声 データを復号した復号音声データの品質を向上させる高品質化データを、 符号 化音声データを送信してくる送信側を特定する特定情報とともに記憶する記憶 手段と、 符号化音声データを送信してきた送信側の特定情報と対応付けられて いる高品質化データを選択する選択手段と、 選択手段において選択された高品 質化データに基づいて、 受信手段において受信された符号化音声データを復号 する復号手段とを備えることを特徴とする。 本発明の受信方法は、 符号化音声データを受信する受信ステップと、 符号化 音声データを復号した復号音声データの品質を向上させる高品質化データを、 符号化音声データを送信してくる送信側を特定する特定情報とともに記憶する 記憶ステツプと、 符号化音声データを送信してきた送信側の特定情報と対応付 けられている高品質化データを選択する選択ステップと、 選択ステップにおい て選択された高品質化データに基づいて、 受信ステップにおいて受信された符 号化音声データを復号する復号ステップとを備えることを特徴とする。
本発明の第 2のプログラムは、 符号化音声データを受信する受信ステップと 符号化音声データを復号した復号音声データの品質を向上させる高品質化デー タを、 符号化音声データを送信してくる送信側を特定する特定情報とともに記 憶する記憶ステツプと、 符号化音声データを送信してきた送信側の特定情報と 対応付けられている高品質化データを選択する選択ステップと、 選択ステップ において選択された高品質化データに基づいて、 受信ステップにおいて受信さ れた符号化音声データを復号する復号ステップとを備えることを特徴とする。 本発明の第 2の記録媒体は、 符号化音声データを受信する受信ステップと、 符号化音声データを復号した復号音声データの品質を向上させる高品質化デー タを、 符号化音声データを送信してくる送信側を特定する特定情報とともに記 憶する記憶ステップと、 符号化音声データを送信してきた送信側の特定情報と 対応付けられている高品質化データを選択する選択ステップと、 選択ステップ において選択された高品質化データに基づいて、 受信ステップにおいて受信さ れた符号化音声データを復号する復号ステップとを備えるプログラムが記録さ れていることを特徴とする。
本発明の送受信装置は、 入力された音声データを符号化し、 符号化音声デー タを出力する符号化手段と、 符号化音声データを受信する他の送受信装置にお いて出力される音声の品質を向上させる高品質化データの学習を、 過去の学習 に用いられた音声データと、 新たに入力された音声データとに基づいて行う学 習手段と、 符号化音声データと高品質化データとを送信する送信手段と、 他の 送受信装置から送信されてくる符号化音声データを受信する受信手段と、 高品 質化データを、 符号化音声データを送信してくる他の送受信装置を特定する特 定情報とともに記憶する記憶手段と、 符号化音声データを送信してきた他の送 受信装置の特定情報と対応付けられている高品質化データを選択する選択手段 と、 選択手段において選択された高品質化データに基づいて、 受信手段におい て受信された符号化音声データを復号する復号手段とを備えることを特徴とす る。
本発明の送信装置および送信方法、 並びに第 1のプログラムにおいては、 音 声データが符号化され、 符号化音声データが出力される。 一方、 符号化音声デ ータを受信する受信側において出力される音声の品質を向上させる高品質化デ ータの学習が、 過去の学習に用いられた音声データと、 新たに入力された音声 データとに基づいて行われ、 符号化音声データと高品質化データとが送信され る。
本発明の受信装置及び受信方法、 並びに第 1のプログラムにおいては、 符号 化音声データが受信され、 その符号化音声データを送信してきた送信側の特定 情報と対応付けられている高品質化データが選択される。 そして、 その選択さ れた高品質化データに基づいて、 受信された符号化音声データが復号される。 本発明の送受信装置においては、 入力された音声データが符号化され、 符号 化音声データが出力される。 そして、 符号化音声データを受信する他の送受信 装置において出力される音声の品質を向上させる高品質化データの学習が、 過 去の学習に用いられた音声データと、 新たに入力された音声データとに基づい て行われ、 符号化音声データと高品質化データとが送信される。 一方、 他の送 受信装置から送信されてくる符号化音声データが受信され、 その符号化音声デ ータを送信してきた他の送受信装置の特定情報と対応付けられている高品質化 データが選択される。 そして、 その選択された高品質化データに基づいて、 受 信された符号化音声データが復号される。 図面の簡単な説明
図 1は、 本発明を適用した伝送システムの一実施の形態の構成例を示すプロ ック図である。
図 2は、 携帯電話機 1 0 1の構成例を示すブロック図である。
図 3は、 送信部 1 1 3の構成例を示すプロック図である。
図 4は、 受信部 1 1 4の構成例を示すプロック図である。
図 5は、 受信部 1 1 4による高品質化データ設定処理を説明するフローチヤ 一トである。
図 6は、 発信側の高品質化データ送信処理の第 1実施の形態を示すフ口ーチ ヤートである。
図 7は、 着信側の高品質化データ更新処理の第 1実施の形態を示すフ口ーチ ヤートである。
図 8は、 発信側の高品質化データ送信処理の第 2実施の形態を示すフ口ーチ ヤートである。 '
図 9は、 着信側の高品質化データ更新処理の第 2実施の形態を示すフローチ ヤートである。
図 1 0は、 発信側の高品質化データ送信処理の第 3実施の形態を示すフロー チヤ一トである。
図 1 1は、 着信側の高品質化データ更新処理の第 3実施の形態を示すフロー チャートである。
図 1 2は、 発信側の高品質化データ送信処理の第 4実施の形態を示すフロー チヤ一トである。
図 1 3は、 着信側の高品質化データ更新処理の第 4実施の形態を示すフロー チャートである。
図 1 4は、 学習部 1 2 5の構成例を示すプロック図である。
図 1 5は、 学習部 1 2 5の学習処理を説明するフローチヤ一トである。 図 1 6は、 復号部 1 3 2の構成例を示すブロック図である。 図 1 7は、 復号部 1 3 2の処理を説明するフローチャートである。
図 1 8は、 C E L P方式の符号化部 1 2 3の構成例を示すプロック図である c 図 1 9は、 C E L P方式の符号化部 1 23を採用した場合の復号部 1 32の 構成例を示すプロック図である。
図 20は、 CELP方式の符号化部 1 23を採用した場合の学習部 1 25の 構成例を示すプロック図である。
図 21は、 ベタ トル量子化を行う符号化部 1 23の構成例を示すプロック図 である。
図 22は、 符号化部 1 23がべクトル量子化を行う場合の学習部 1 25の構 成例を示すブロック図である。
図 23は、 符号化部 1 23がべクトル量子化を行う場合の学習部 1 25の学 習処理を説明するフローチャートである。
図 24は、 符号化部 1 23がべクトル量子化を行う場合の復号部 1 32の構 成例を示すブロック図である。
図 25は、 符号化部 1 23がべクトル量子化を行う場合の復号部 1 32の処 理を説明するフローチャートである。
図 26は、 本発明を適用したコンピュータの一実施の形態の構成例を示すプ 口ック図である。 発明を実施するための最良の形態
図 1は、 本発明を適用した伝送システム (システムとは、 複数の装置が論理 的に集合した物をいい、 各構成の装置が同一筐体中にあるか否かは問わない) の一実施の形態の構成を示している。
この伝送システムでは、 携帯電話機 10 1 と 1 0 12が、 基地局 102tと 1 022それぞれとの間で、 無線による送受信を行うとともに、 基地局 l O Ziと 1 022それぞれが、 交換局 1 03との間で送受信を行うことにより、 最終的には、 携帯電話機 1 0 と 10 12との間において、 基地局 102iおよび 1022、 並 びに交換局 1 0 3を介して、 音声の送受信を行うことができるようになつてい る。 なお、 基地局 1 0 2 tと 1 0 2 2は、 同一の基地局であっても良いし、 異なる 基地局であっても良い。
ここで、 以下、 特に区別する必要がない限り、 携帯電話機 1 0 と 1 0 1 2を、 携帯電話機 1 0 1と記述する。
次に、 図 2は、 図 1の携帯電話機 1 0 1^の構成例を示している。 なお、 携帯 電話機 1 0 1 2も、 以下説明する携帯電話機 1 0 と同様に構成されるため、 そ の説明は省略する。
アンテナ 1 1 1は、 基地局 1 0 2 iまたは 1 0 2 2からの電波を受信し、 その受 信信号を、 変復調部 1 1 2に供給するとともに、 変復調部 1 1 2からの信号を、 電波で、 基地局 1 0 2 iまたは 1 0 2 2に送信する。 変復調部 1 1 2は、 アンテナ 1 1 1からの信号を、 例えば、 C D MA (Code Division Multiple Access)方式 等によって復調し、 その結果得られる復調信号を、 受信部 1 1 4 供給する。
また、 変復調部 1 1 2は、 送信部 1 1 3から供給される送信データを、 例えば、 C D MA方式等で変調し、 その結果得られる変調信号を、 アンテナ 1 1 1に供 給する。 送信部 1 1 3は、 ユーザの音声を符号化する等の所定の処理を行い、 送信データを得て、 変復調部 1 1 2に供給する。 受信部 1 1 4は、 変復調部 1 1 2からの復調信号である受信データを受信し、 高音質の音声を復号して出力 する。
操作部 1 1 5は、 発呼先の電話番号や、 所定のコマンド等を入力するときに、 ユーザによって操作され、 その操作に対応する操作信号は、 送信部 1 1 3ゃ受 信部 1 1 4に供給される。
なお、 送信部 1 1 3と受信部 1 1 4との間では、 必要に応じて情報をやりと りすることができるようになっている。
次に、 図 3は、 図 2の送信部 1 1 3の構成例を示している。
マイク 1 2 1には、 ユーザの音声が入力され、 マイク 1 2 1は、 そのユーザ の音声を、 電気信号としての音声信号として、 A/D (Analog/Digital)変換部 1 2 2に出力する。 0変換部1 2 2は、 マイク 1 2 1からのアナログの音 声信号を AZD変換することにより、 ディジタルの音声データとし、 符号化部 1 2 3および学習部 1 2 5に出力する。
符号化部 1 2 3は、 A/D変換部 1 2 2からの音声データを所定の符号化方 式によって符号化し、 その結果得られる符号化音声データ S 1を、 送信制御部 1 2 4に出力する。
送信制御部 1 2 4は、 符号化部 1 2 3が出力する符号化音声データと、 後述 する管理部 1 2 7が出力する高品質化データ等の送信制御を行う。 即ち、 送信 制御部 1 2 4は、 符号化部 1 2 3が出力する符号化音声データ、 または後述す る管理部 1 2 7が出力する高品質化データ等を選択し、 所定の送信タイミング において、 送信データとして、 弯復調部 1 1 2 (図 2 ) に出力する。 なお、 送 信制御部 1 2 4は、 符号化音声データおよび高品質化データの他、 操作部 1 1 5が操作されることによって入力される、 発信先の電話番号や、 発信元である 自身の電話番号、 その他の必要な情報を、 必要に応じて、 送信データとして出 力する。
学習部 1 2 5は、 符号化部 1 2 3が出力する符号化音声データを受信する受 信側において出力される音声の品質を向上させる高品質化データの学習を、 過 去の学習に用いられた音声データと、 新たに A/D変換部 1 2 2から入力され る音声データに基づいて行う。 学習部 1 2 5は、 学習を行うことにより、 新た な高品質化データを得ると、 その高品質化データを、 記憶部 1 2 6に供給する, 記憶部 1 2 6は、 学習部 1 2 5から供給される高品質化データを記憶する。
管理部 1 2 7は、 受信部 1 1 4から供給される情報を必要に応じて参照しな がら、 記憶部 1 2 6に記憶された高品質化データの送信を管理する。
以上のように構成される送信部 1 1 3では、 マイク 1 2 1に入力されたユー ザの音声が、 A/D変換部 1 2 2を介して、 符号化部 1 2 3および学習部 1 2 5に供給される。
符号化部 1 2 3は、 A/D変換部 1 2 2から供給される音声データを符号化 し、 その結果得られる符号化音声データを、 送信制御部 1 2 4に出力する。 送 信制御部 1 2 4は、 符号化部 1 2 3から供給される符号化音声データを送信デ ータとして、 変復調部 1 1 2 (図 2 ) に出力する。
一方、 学習部 1 2 5は、 過去の学習に用いられた音声データと、 新たに AZ
D変換部 1 2 2から入力される音声データに基づいて、 高品質化データを学習 し、 その結果得られる高品質化データを、 記憶部 1 2 6に供給して記憶させる, ここで、 このように、 学習部 1 2 5では、 新たに入力されたユーザの音声デ ータだけではなく、 過去の学習に用いられた音声データにも基づいて、 高品質 化データの学習が行われるので、 ユーザが通話を行うほど、 より、 そのユーザ の音声データを符号化した符号化音声データを、 高品質の音声データに復号す ることのできる高品質化データが得られることになる。
そして、 管理部 1 2 7は、 所定のタイミングにおいて、 記憶部 1 2 6に記憶 された高品質化データを、 記憶部 1 2 6から読み出し、 送信制御部 1 2 4に供 給する。 送信制御部 1 2 4は、 管理部 1 2 7が出力する高品質化データを、 所 定の送信タイミングにおいて、 送信データとして、 変復調部 1 1 2 (図 2 ) に 出力する。
以上のように、 送信部 1 1 3では、 通常の通話のための音声としての符号化 音声データの他に、 高品質化データも送信される。
次に、 図 4は、 図 2の受信部 1 1 4の構成例を示している。
図 2の変復調部 1 1 2が出力する復調信号としての受信データは、 受信制御 部 1 3 1に供給され、 受信制御部 1 3 1は、 その受信データを受信する。 そし て、 受信制御部 1 3 1は、 受信データが符号化音声データである場合には、 そ の符号化音声データを、 復号部 1 3 2に供給し、 受信データが高品質化データ である場合には、 その高品質化データを、 管理部 1 3 5に供給する。
なお、 受信データには、 符号化音声データおよび高品質化データの他、 必要 に応じて、 発信元の電話番号その他の情報が含まれており、 受信制御部 1 3 1 は、 そのような情報を、 必要に応じて、 管理部 1 3 5や、 送信部 1 1 3 (の管 理部 1 2 7 ) に供給する。
復号部 1 3 2は、 受信制御部 1 3 2から供給される符号化音声データを、 管 理部 1 3 5から供給される高品質化データを用いて復号し、 これにより、 高品 質の復号音声データを得て、 D ZA (Digital /Analog)変換部 1 3 3に供給する, 0 / 変換部1 3 3は、 復号部 1 3 2が出力するディジタルの復号音声デー タを D /A変換し、 その結果得られるアナログの音声信号を、 スピーカ 1 3 4 に供給する。 スピーカ 1 3 4は、 D /A変換部 1 3 3からの音声信号に対応す る音声を出力する。
管理部 1 3 5は、 高品質化データの管理を行う。 即ち、 管理部 1 3 5は、 着 呼時に、 受信制御部 1 3 1から、 発信元の電話番号を受信し、 その電話番号に 基づいて、 記憶部 1 3 6またはデフォルトデータメモリ 1 3 7に記憶された高 品質化データを選択し、 復号部 1 3 2に供給する。 また、 管理部 1 3 5は、 受 信制御部 1 3 1から、 最新の高品質化データを受信し、 その最新の高品質化デ ータによって、 記憶部 1 3 6の記憶内容を更新する。
記憶部 1 3 6は、 例えば、 書き換え可能な E E P R O M (Electrically Erasa ble Programmable Read-only Memory)で構成され、 管理部 1 3 5力 ら供給され る高品質化データを、 その高品質化データを送信してきた発信元を特定する特 定情報としての、 例えば、 その発信元の電話番号と対応付けて記憶する。
デフォルトデータメモリ 1 3 7は、 例えば、 R O Mで構成され、 デフォルト の高品質化データを、 あらかじめ記憶している。
以上のように構成される受信部 1 1 4では、 着呼があると、 受信制御部 1 3 1は、 そこに供給される受信データを受信し、 その受信データに含まれる発信 元の電話番号を、 管理部 1 3 5に供給する。 管理部 1 3 5は、 例えば、 受信制 御部 1 3 1から発信元の電話番号を受信し、 音声通話が可能な状態となると、 その音声通話で用いる高品質化データを設定する高品質化データ設定処理を、 図 5のフローチヤ一トにしたがって行う。
即ち、 高品質化データ設定処理では、 まず最初に、 ステップ S 1 4 1におい て、 管理部 1 3 5は、 発信元の電話番号を、 記憶部 1 3 6から検索し、 ステツ プ S 1 4 2に進む。 ステップ S 1 4 2では、 管理部 1 3 5は、 ステップ S 1 4 1の検索によって、 発信元の電話番号が見つかつたかどうか (記憶部 1 3 6に 記憶されているかどう力 を判定する。
ステップ S 1 4 2において、 発信元の電話番号が見つかつたと判定された場 合、 ステップ S 1 4 3に進み、 管理部 1 3 5は、 記憶部 1 3 6に記憶されてい る高品質化データの中から、 発信元の電話番号に対応付けられている高品質化 データを選択し、 復号部 1 3 2に供給、 設定して、 高品質化データ設定処理を 終了する。
また、 ステップ S 1 4 2において、 発信元の電話番号が見つからなかったと 判定された場合、 ステップ S 1 4 4に進み、 管理部 1 3 5は、 デフォルトデー タメモリ 1 3 7から、 デフォルトの高品質化データ (以下、 適宜、 デフォルト データという) を読み出し、 復号部 1 3 2に供給、 設定して、 高品質化データ 設定処理を終了する。
なお、 図 5の実施の形態では、 発信元の電話番号が見つかった場合、 即ち、 発信元の電話番号が、 記憶部 1 3 6に記憶されている場合に、 その発信元の電 話番号に対応付けられている高品質化データを、 復号部 1 3 2に設定するよう にしたが、 操作部 1 1 5 (図 2 ) を操作することにより、 発信元の電話番号が 見つかった場合であっても、 デフォルトデータを、 復号部 1 3 2に設定するよ うに、 管理部 1 3 5を制御することが可能である。
以上のようにして、 高品質化データが、 復号部 1 3 2に設定された後、 受信 制御部 1 3 1に対し、 受信データとして、 発信元から送信されてきた符号化音 声データの供給が開始されると、 その符号化音声データは、 受信制御部 1 3 1 から復号部 1 3 2に供給される。 復号部 1 3 2は、 受信制御部 1 3 1から供給 される、 発信元から送信されてきた符号化音声データを、 着呼直後に行われた 図 5の高品質化データ設定処理で設定された高品質化データ、 即ち、 発信元の 電話番号と対応付けられている高品質化データに基づいて復号し、 復号音声デ ータを出力する。 この復号音声データは、 復号部 1 3 2から、 D /A変換部 1 3 3を介してスピーカ 1 3 4に供給されて出力される。
一方、 受信制御部 1 3 1は、 受信データとして、 発信元から送信されてきた 高品質化データを受信すると、 その高品質化データを、 管理部 1 3 5に供給す る。 管理部 1 3 5は、 受信制御部 1 3 1から供給される高品質化データを、 そ の高品質化データを送信してきた発信元の電話番号と対応付け、 記憶部 1 3 6 に供給して記憶させる。
ここで、 上述のように、 記憶部 1 3 5において、 発信元の電話番号と対応付 けられて記憶される高品質化データは、 発信元の送信部 1 1 3 (図 3 ) の学習 部 1 2 5において、 その発信元のユーザの音声に基づいて学習を行うことによ り得られたものであり、 発信元のユーザの音声を符号化した符号化音声データ を、 高品質の復号音声データに復号するためのものである。
そして、 受信部 1 1 4の復号部 1 3 2では、 発信元から送信されてきた符号 化音声データが、 発信元の電話番号と対応付けられている高品質化データに基 づいて復号されるので、 発信元から送信されてきた符号化音声データに適した 復号処理 (その符号化音声データに対応する音声を発話したユーザの音声の特 性ごとに異なる復号処理) が施されることになり、 高品質の復号音声データを 得ることができる。
ところで、 上述のように、 発信元から送信されてきた符号化音声データに適 した復号処理を施すことにより、 高品質の復号音声データを得るには、 復号部 1 3 2において、 その発信元の送信部 1 1 3 (図 3 ) の学習部 1 2 5で学習さ れた高品質化データを用いて処理を行う必要がある。 そのためには、 記憶部 1 3 6に、 その高品質符号化データが、 発信元の電話番号と対応付けて記憶され ている必要がある。
そこで、 発信元 (送信側) の送信部 1 1 3 (図 3 ) は、 学習により得られた 最新の高品質化データを、 着信側 (受信側) に送信する高品質化データ送信処 理を行い、 着信側の受信部 1 1 4は、 発信元において、 その高品質化データ送 信処理が行われることにより送信されてくる高品質化データによって、 記憶部 1 3 6の記憶内容を更新する高品質化データ更新処理を行うようになつている, そこで、 いま、 例えば、 携帯電話機 1 0 を発信元とするとともに、 携帯電 話機 1012を着信側として、 高品質化データ送信処理と、 高品質化データ更新 処理について説明する。
図 6は、 高品質化データ送信処理の第 1実施の形態を示すフローチヤ一トで める。
発信元である携帯電話機 10 では、 ユーザが、 操作部 1 1 5 (図 2) を操 作して、 着信側としての携帯電話機 10 12の電話番号を入力すると、 送信部 1 1 3において、 高品質化データ送信処理が開始される。
即ち、 高品質化データ送信処理では、 まず最初に、 ステップ S 1において、 送信部 1 1 3 (図 3 ) の送信制御部 1 24 、 操作部 1 1 5が操作されること により入力された携帯電話機 10 12の電話番号を、 送信データとして出力する ことにより、 携帯電話機 1012の呼び出しが行われる。
そして、 携帯電話機 1012のユーザが、 携帯電話機 10 からの呼び出しに 応じて、 操作部 1 1 5を操作することにより、 携帯電話機 10 12をオフフック 状態にすると、 ステップ S 2に進み、 送信制御部 1 24は、 着信側の携帯電話 機 1012との間の通信リンクを確立し、 ステップ S 3に進む。
ステップ S 3では、 管理部 1 27が、 記憶部 1 26に記憶された高品質化デ ータの更新の状況を表す更新情報を、 送信制御部 1 24に送信し、 送信制御部 1 24は、 その更新情報を、 送信データとして選択、 出力して、 ステップ S 4 に進む。
ここで、 学習部 1 25は、 学習を行って、 新たな高品質化データを得ると、 例えば、 その高品質化データを得た日時 (年月を含む) を、 その高品質化デー タと対応付けて、 記憶部 1 26に記憶させるようになつており、 更新情報とし ては、 この高品質化データと対応付けられている日時を用いることができる。
着信側の携帯電話機 1012は、 発信元の携帯電話機 10 から更新情報を受 信すると、 後述するように、 最新の高品質化データが必要な場合は、 その送信 を要求する転送要求を送信してくるので、 ステップ S 4において、 管理部 1 2 7は、 着信側の携帯電話機 1 0 1 2から転送要求が送信されてきたかどうかを判 定する。
ステップ S 4において、 転送要求が送信されてきていないと判定された場合、 即ち、 携帯電話機 1 0 の受信部 1 1 4の受信制御部 1 3 1において、 受信デ ータとして、 着信側の携帯電話機 1 0 1 2からの転送要求が受信されなかった場 合、 ステップ S 5をスキップして、 ステップ S 6に進む。
また、 ステップ S 4において、 転送要求が送信されてきたと判定された場合、 即ち、 携帯電話機 1 0 1 iの受信部 1 1 4の受信制御部 1 3 1において、 受信デ ータとして、 着信側の携帯電話機 1 0 1 2からの転送要求が受信され、 その転送 要求が、 送信部 1 1 3の管理部 1 2 7に供給された場合、 ステップ S 5に進み、 管理部 1 2 7は、 記憶部 1 2 6から最新の高品質化データを読み出し、 送信制 御部 1 2 4に供給する。 さらに、 ステップ S 5では、 送信制御部 1 2 4が、 管 理部 1 2 7からの最新の高品質化データを選択し、 送信データとして送信する c なお、 高品質化データは、 'その高品質化データが学習によって得られた日時、 即ち、 更新情報とともに送信されるようになっている。
その後、 ステップ S 5から S 6に進み、 管理部 1 2 7は、 準備完了通知が、 着信側の携帯電話機 1 0 1 2から送信されてきたかどうかを判定する。
即ち、 着信側の携帯電話機 1 0 1 2は、 通常の音声通話が可能な状態となると- 音声通話の準備が完了したことを表す準備完了通知を送信するようになってお り、 ステップ S 6では、 そのような準備完了通知が、 携帯電話機 1 0 1 2から送 信されてきたかどうかが判定される。
ステップ S 6において、 準備完了通知が送信されてきていないと判定された 場合、 即ち、 携帯電話機 1 0 1 iの受信部 1 1 4の受信制御部 1 3 1において、 受信データとして、 着信側の携帯電話機 1 0 1 2からの準備完了通知が受信され ていない場合、 ステップ S 6に戻り、 準備完了通知が送信されてくるまで待つ c そして、 ステップ S 6において、 準備完了通知が送信されてきたと判定され た場合、 即ち、 携帯電話機 1 0 1 iの受信部 1 1 4の受信制御部 1 3 1において、 受信データとして、 着信側の携帯電話機 1 0 1 2からの準備完了通知が受信され、 その準備完了通知が、 送信部 1 1 3の管理部 1 2 7に供給された場合、 ステツ プ S 7に進み、 送信制御部 1 2 4は、 符号化部 1 2 3の出力を選択することに より、 音声通話が可能な状態、 即ち、 符号化部 1 2 3が出力する符号化音声デ ータを、 送信データとして選択する状態となって、 高品質化データ送信処理を 終了する。
次に、 図 7のフローチャートを参照して、 発信側の携帯電話機 1 0 で図 6 の高品質化データ送信処理が行われる場合の、 着信側の携帯電話機 1 0 1 2によ る高品質化データ更新処理について説明する。
着信側の携帯電話機 1 0 1 2では、 例えば、 着呼があると、 受信部 1 1 4 (図 4 ) において、 高品質化データ更新処理が開始される。
即ち、 高品質化データ更新処理では、 まず最初に、 ステップ S 1 1において、 受信制御部 1 3 1が、 ユーザが操作部 1 1 5を操作することにより帯電話機 1 0 1 2がオフフック状態とされたかどうかを判定し、 オフフック状態とされてレ、 ないと判定した場合、 ステップ S 1 1に戻る。
また、 ステップ S 1 1において、 携帯電話機 1 0 1 2がオフフック状態とされ たと判定された場合、 ステップ S 1 2に進み、 受信制御部 1 3 1は、 発信側の 携帯電話機 1 0 との通信リンクを確立し、 ステップ S 1 3に進む。
ステップ S 1 3では、 図 6のステップ S 3で説明したように、 発信側の携帯 電話機 1 0 から更新情報が送信されてくるので、 受信制御部 1 3 1は、 この 更新情報を含む受信データを受信し、 管理部 1 3 5に供給する。
管理部 1 3 5は、 ステップ S 1 4において、 発信側の携帯電話機 1 0 から 受信した更新情報を参照し、 記憶部 1 3 6に、 発信側の携帯電話機 1 0 1 Lのュ 一ザについての最新の高品質化データが記憶されているかどうかを判定する。
即ち、 図 1の伝送システムにおける通信では、 発信側の携帯電話機 1 0 1 1 (または 1 0 1 2) から、 着信側の携帯電話機 1 0 1 2 (または 1 0 の着呼時 に、 発信側の携帯電話機 1 0 の電話番号が送信されるようになっており、 こ の電話番号は、 受信データとして、 受信制御部 1 3 1で受信され、 管理部 1 3 5に供給されるようになっている。 管理部 1 3 5は、 その発信側である携帯電 話機 1 0 の電話番号と対応付けられている高品質化データが、 記憶部 1 3 6 に既に記憶されているかどう力 \ さらに、 記憶されている場合には、 その記憶 されている高品質化データが最新のものかどうかを調査することにより、 ステ ップ S 1 4の判定処理を行う。
ステップ S 1 4において、 記憶部 1 3 6に、 発信側の携帯電話機 1 0;^のュ 一ザについての最新の高品質化データが記憶されていると判定された場合、 即 ち、 記憶部 1 3 6に、 発信元の携帯電話機 1 0 の電話番号と対応付けられて いる高品質化データが記憶されており、 その高品質化データに対応付けられて いる更新情報が表す日時が、 ステップ S 1 3で受信された更新情報が表す日時 と一致する場合、 記憶部 1 3 6における、 発信元の携帯電話機 1 0 の電話番 号と対応付けられている高品質化データを更新する必要はないので、 ステップ S 1 5乃至 S 1 8をスキップして、 ステップ S 1 9に進む。
ここで、 図 6のステップ S 5で説明したように、 発信側の携帯電話機 1 0 1 は、 高品質化データを、 その更新情報とともに送信してくるようになっており 着信側の携帯電話機 1 0 1 2の管理部 1 3 5は、 発信側の携帯電話機 1 0 から の高品質化データを記憶部 1 3 6に記憶させる場合、 その高品質化データに、 その高品質化データとともに送信されてくる更新情報を対応付けて記憶させる ようになつている。 ステップ S 1 4では、 このようにして、 記憶部 1 3 6に記 憶されている高品質化データに対応付けられている更新情報と、 ステップ S 1 3で受信された更新情報とを比較することにより、 記憶部 1 3 6に記憶されて いる高品質化データが最新のものであるかどうかが判定される。
—方、 ステップ S 1 4において、 記憶部 1 3 6に、 発信側の携帯電話機 1 0 のユーザについての最新の高品質化データが記憶されていないと判定された 場合、 即ち、 記憶部 1 3 6に、 発信元の携帯電話機 1 0 の電話番号と対応付 けられている高品質化データが記憶されていないか、 または記憶されていても. その高品質化データに対応付けられている更新情報が表す日時が、 ステップ S 1 3で受信された更新情報が表す日時よりも過去を表す (古い) もので!)る場 合、 ステップ S 1 5に進み、 管理部 1 3 5は、 最新の高品質化データへの更新 が禁止されているかどうかを判定する。
即ち、 例えば、 ユーザは、 操作部 1 1 5を操作することにより、 高品質化デ ータの更新を行わないように、 管理部 1 3 5を設定することが可能であり、 管 理部 1 3 5は、 高品質化データの更新を行うかどうかの設定に基づいて、 ステ ップ S 1 5の判定処理を行う。
ステップ S 1 5において、 最新の高品質化データへの更新が禁止されている と判定された場合、 即ち、 管理部 1 3 5が、 高品質化データの更新を行わない ように設定されている場合、 ステップ S 1 6乃至 S 1 8をスキップして、 ステ ップ S 1 9に進む。
また、 ステップ S 1 5において、 最新の高品質化データへの更新が禁止され ていないと判定された場合、 即ち、 管理部 1 3 5が、 高品質化データの更新を 行わないように設定されていない場合、 ステップ S 1 6に進み、 管理部 1 3 5 は、 発信元の携帯電話機 1 0 に対して、 最新の高品質化データの送信を要求 する転送要求を、 送信部 1 1 3 (図 3 ) の送信制御部 1 2 4に供給する。 これ により、 送信部 1 1 3の送信制御部 1 2 4は、 転送要求を、 送信データとして 送信する。
図 6のステップ S 4および S 5で説明したように、 転送要求を受信した発信 元の携帯電話機 1 0 は、 最新の高品質化データを、 その更新情報とともに送 信してくるので、 受信制御部 1 3 1は、 ステップ S 1 7において、 その最新の 高品質化データおよび更新情報を含む受信データを受信し、 管理部 1 3 5に供 給する。
管理部 1 3 5は、 ステップ S 1 8において、 ステップ S 1 7で得た最新の高 品質化データを、 着呼時に受信した発信側の携帯電話機 1 0 の電話番号、 さ らには、 その高品質化データとともに送信されてきた更新情報と対応付けて、 記憶部 1 3 6に記憶させることにより、 記憶部 1 3 6の記憶内容を更新する。 即ち、 管理部 1 3 5は、 発信側の携帯電話機 1 0 の電話番号と対応付けら れた高品質化データが、 記憶部 1 3 6に記憶されていない場合には、 ステップ S 1 7で得た最新の高品質化データ、 着呼時に受信した発信側の携帯電話機 1 0 の電話番号、 および更新情報 (最新の高品質化データの更新情報) を、 記 憶部 1 3 6に、 新たに記憶させる。
また、 管理部 1 3 5は、 発信側の携帯電話機 1 0 l iの電話番号と対応付けら れた高品質化データ (最新でない高品質化データ) 力 記憶部 1 3 6に記憶さ れている場合には、 その高品質化データと、 その高品質化データに対応付けら れている電話番号および更新情報に代えて、 ステップ S 1 7で得た最新の高品 質化データ、 着呼時に受信した発信側の携帯電話機 1 0 の電話番号、 および 更新情報を、 記憶部 1 3 6に記憶させる (上書きする) 。
そして、 ステップ S 1 9に進み、 管理部 1 3 5は、 送信部 1 1 3の送信制御 部 1 2 4を制御することにより、 音声通話の準備が完了したことを表す準備完 了通知を、 送信データとして送信させ、 ステップ S 2 0に進む。
ステップ S 2 0では、 受信制御部 1 3 1は、 そこに供給される受信データに 含まれる符号化音声データを復号部 1 3 2に出力する、 音声通話が可能な状態 となって、 高品質化データ更新処理を終了する。
次に、 図 8は、 高品質化データ送信処理の第 2実施の形態を示すフローチヤ 一トである。
図 6における場合と同様に、 発信元である携帯電話機 1 0 1ェでは、 ユーザが. 操作部 1 1 5 (図 2 ) を操作して、 着信側としての携帯電話機 1 0 1 2の電話番 号を入力すると、 送信部 1 1 3において、 高品質化データ送信処理が開始され る。
即ち、 高品質化データ送信処理では、 まず最初に、 ステップ S 3 1において. 送信部 1 1 3 (図 3 ) の送信制御部 1 2 4力 S、 操作部 1 1 5が操作されること により入力された携帯電話機 1 0 1 2の電話番号を、 送信データとして出力する ことにより、 携帯電話機 1 0 1 2の呼び出しが行われる。
そして、 携帯電話機 1 0 1 2のユーザが、 携帯電話機 1 0 からの呼び出しに 応じて、 操作部 1 1 5を操作することにより、 携帯電話機 1 0 1 2をオフフック 状態にすると、 ステップ S 3 2に進み、 送信制御部 1 2 4は、 着信側の携帯電 話機 1 0 1 2との間の通信リンクを確立し、 ステップ S 3 3に進む。
ステップ S 3 3では、 管理部 1 2 7は、 記憶部 1 2 6から最新の高品質化デ ータを読み出し、 送信制御部 1 2 4に供給する。 さらに、 ステップ S 3 3では. 送信制御部 1 2 4が、 管理部 1 2 7からの最新の高品質化データを選択し、 送 信データとして送信する。 なお、 高品質化データは、 上述したように、 その高 品質化データが学習によって得られた日時を表す更新情報とともに送信される t その後、 ステップ S 3 3から S 3 4に進み、 管理部 1 2 7は、 図 6のステツ プ S 6における場合と同様に、 準備完了通知が、 着信側の携帯電話機 1 0 1 2か ら送信されてきたかどうかを判定し、 準備完了通知が送信されてきていないと 判定した場合、 ステップ S 3 4に戻り、 準備完了通知が送信されてくるまで待 つ。
そして、 ステップ S 3 4において、 準備完了通知が送信されてきたと判定さ れた場合、 ステップ S 3 5に進み、 送信制御部 1 2 4は、 図 6のステップ S 7 における場合と同様に、 音声通話が可能な状態となって、 高品質化データ送信 処理を終了する。
次に、 図 9のフローチャートを参照して、 発信側の携帯電話機 1 0 で図 8 の高品質化データ送信処理が行われる場合の、 着信側の携帯電話機 1 0 1 2によ る高品質化データ更新処理について説明する。
着信側の携帯電話機 1 0 1 2では、 図 7における場合と同様に、 着呼があると. 受信部 1 1 4 (図 4 ) において、 高品質化データ更新処理が開始され、 まず最 初に、 ステップ S 4 1において、 受信制御部 1 3 1が、 ユーザが操作部 1 1 5 を操作することによりオフフック状態としたかどうかを判定し、 オフフック状 態とされていないと判定した場合、 ステップ S 4 1に戻る。
また、 ステップ S 4 1において、 オフフック状態とされたと判定された場合、 ステップ S 4 2に進み、 図 7のステップ S 1 2における場合と同様に、 通信リ ンクが確立され、 ステップ S 4 3に進む。 ステップ S 4 3では、 受信制御部 1 3 1は、 発信側の携帯電話機 1 0 1^から送信されてくる最新の高品質化データ を含む受信データを受信し、 管理部 1 3 5に供給する。
即ち、 図 8の高品質化データ送信処理では、 上述したように、 ステップ S 3 3において、 携帯電話機 1 0 が、 最新の高品質化データを、 更新情報ととも に送信してくるので、 ステップ S 4 3では、 その高品質化データと更新情報が 受信される。
その後、 ステップ S 4 4に進み、 管理部 1 3 5は、 図 7のステップ S 1 4に おける場合と同様にして、 発信側の携帯電話機 1 0 から受信した更新情報を 参照し、 記憶部 1 3 6に、 発信側の携帯電話機 1 0 のユーザについての最新 の高品質化データが記憶されているかどうかを判定する。
ステップ S 4 4において、 記憶部 1 3 6に、 発信側の携帯電話機 1 0 1 1のュ 一ザについての最新の高品質化データが記憶されていると判定された場合、 ス テツプ S 4 5に進み、 管理部 1 3 5は、 ステップ S 4 3で受信した高品質化デ ータと更新情報を破棄し、 ステップ S 4 7に進む。
また、 ステップ S 4 4において、 記憶部 1 3 6に、 発信側の携帯電話機 1 0 1 のユーザについての最新の高品質化データが記憶されていないと判定された 場合、 ステップ S 4 6に進み、 管理部 1 3 5は、 図 7のステップ S 1 8におけ る場合と同様に、 ステップ S 4 3で得た最新の高品質化データを、 着呼時に受 信した発信側の携帯電話機 1 0 の電話番号、 さらには、 その高品質化データ とともに送信されてきた更新情報と対応付けて、 記憶部 1 3 6に記憶させるこ とにより、 記憶部 ί 3 6の記憶内容を更新する。
そして、 ステップ S 4 7に進み、 管理部 1 3 5は、 送信部 1 1 3の送信制御 部 1 2 4を制御することにより、 音声通話の準備が完了したことを表す準備完 了通知を、 送信データとして送信させ、 ステップ S 4 8に進む。
ステップ S 4 8では、 受信制御部 1 3 1は、 そこに供給される受信データに 含まれる符号化音声データを復号部 1 3 2に出力する、 音声通話が可能な状態 となって、 高品質化データ更新処理を終了する。
図 9の高品質化データ更新処理によれば、 着信側の携帯電話機 1 0 1 2におい て、 発信側の携帯電話機 1 0 のユーザについての最新の高品質化データが記 憶されていない限り、 必ず、 記憶部 1 3 6の記憶内容が更新されることになる, 次に、 図 1 0は、 高品質化データ送信処理の第 3実施の形態を示すフローチ ヤートである。
発信元である携帯電話機 1 0 では、 ユーザが、 操作部 1 1 5 (図 2 ) を操 作して、 着信側としての携帯電話機 1 0 1 2の電話番号を入力すると、 送信部 1 1 3 (図 3 ) において、 高品質化データ送信処理が開始され、 まず最初に、 ス テツプ S 5 1において、 管理部 1 2 7は、 操作部 1 1 5が操作されることによ り入力された電話番号に対応する携帯電話機 1 0 1 2への高品質化データの送信 履歴を検索する。
即ち、 図 1 0の実施の形態では、 管理部 1 2 7は、 後述するステップ S 5 8 において、 高品質化データを、 着信側へ送信した場合、 その高品質化データの 送信履歴として、 着信側の電話番号と、 送信した高品質化データの更新情報と を対応付けた情報を、 その内蔵するメモリ (図示せず) に記憶しておくように なっており、 ステップ S 5 2では、 そのような送信履歴の中から、 操作部 1 1 5が操作されることにより入力された着信側の電話番号が記述されているもの が検索される。
そして、 ステップ S 5 2に進み、 管理部 1 2 7は、 ステップ S 5 1での検索 結果に基づき、 着信側に対して、 最新の高品質化データが、 既に送信されてい るかどうかを判定する。
ステップ S 5 2において、 最新の高品質化データが、 着信側に対して送信さ れていないと判定された場合、 即ち、 送信履歴の中に、 着信側の電話番号が記 述されたものがなかったか、 または、 そのような送信履歴があっても、 その送 信履歴に記述されている更新情報が、 最新の高品質化データの更新情報と一致 しない場合、 ステップ S 5 3に進み、 管理部 1 2 7は、 最新の高品質化データ を送信すベきであるかどうかを表す転送フラグをオン状態にして、 ステップ S
5 5に進む。
ここで、 転送フラグは、 例えば、 1ビットのフラグであり、 例えば、 オン状 態のときは 1とされ、 オフ状態とのときは 0とされる。
また、 ステップ S 5 2において、 最新の高品質化データが、 着信側に対して、 既に送信されていると判定された場合、 即ち、 送信履歴の中に、 着信側の電話 番号が記述されたものがあり、 その送信履歴に記述されている更新情報が、 最 新の更新情報と一致する場合、 ステップ S 5 4に進み、 管理部 1 2 7は、 転送 フラグをオフ状態にして、 ステップ S 5 5に進む。
ステップ S 5 5では、 送信制御部 1 2 4力 操作部 1 1 5が操作されること により入力された着信側である携帯電話機 1 0 1 2の電話番号を、 送信データと して出力することにより、 携帯電話機 1 0 1 2の呼び出しが行われる。
そして、 携帯電話機 1 0 1 2のユーザが、 携帯電話機 1 0 からの呼び出しに 応じて、 操作部 1 1 5を操作することにより、 携帯電話機 1 0 1 2をオフフック 状態にすると、 ステップ S 5 6に進み、 送信制御部 1 2 4は、 着信側の携帯電 話機 1 0 1 2との間の通信リンクを確立し、 ステップ S 5 7に進む。
ステップ S 5 7では、 管理部 1 2 7は、 転送フラグがオン状態になっている かどうかを判定し、 オン状態になっていないと判定した場合、 即ち、 転送フラ グがオフ状態になっている場合、 ステップ S 5 8をスキップして、 ステップ S 5 9に進む。
また、 ステップ S 5 7において、 転送フラグがオン状態になっていると判定 された場合、 ステップ S 5 8に進み、 管理部 1 2 7は、 記憶部 1 2 6から最新 の高品質化データと更新情報を読み出し、 送信制御部 1 2 4に供給する。 さら に、 ステップ S 5 8では、 送信制御部 1 2 4が、 管理部 1 2 7からの最新の高 品質化データと更新情報を選択し、 送信データとして送信する。 さらに、 ステ ップ S 5 8では、 管理部 1 2 7は、 最新の高品質化データを送信した携帯電話 機 1 0 1 2の電話番号 (着信側の電話番号) と、 その更新情報とを対応付けた情 報を、 送信履歴として記憶し、 ステップ S 5 9に進む。
なお、 携帯電話機 1 0 1 2の電話番号が、 送信履歴に既に記憶されている場合、 管理部 1 2 7は、 例えば、 その電話番号と更新情報に対して、 上書きする形で、 最新の高品質化データを送信した携帯電話機 1 0 1 2の電話番号と、 その最新の 高品質化データの更新情報を記憶する。
ステップ S 5 9では、 管理部 1 2 7は、 図 6のステップ S 6における場合と 同様に、 準備完了通知が、 着信側の携帯電話機 1 0 1 2から送信されてきたかど うかを判定し、 送信されてきていないと判定した場合、 ステップ S 5 9に戻り、 準備完了通知が送信されてくるまで待つ。
そして、 ステップ S 5 9において、 準備完了通知が送信されてきたと判定さ れた場合、 ステップ S 6 0に進み、 送信制御部 1 2 4は、 音声通話が可能な状 態となつて、 高品質化データ送信処理を終了する。
次に、 図 1 1のフローチャートを参照して、 発信側の携帯電話機 1 0 で図 1 0の高品質化データ送信処理が行われる場合の、 着信側の携帯電話機 1 0 1 2 による高品質化データ更新処理について説明する。
着信側の携帯電話機 1 0 1 2では、 例えば、 着呼があると、 受信部 1 1 4 (図 4 ) において、 高品質化データ更新処理が開始される。 '
即ち、 高品質化データ更新処理では、 まず最初に、 ステップ S 7 1において、 受信制御部 1 3 1力 ユーザが操作部 1 1 5を操作することによりオフフック 状態とされたかどうかを判定し、 オフフック状態とされていないと判定した場 合、 ステップ S 7 1に戻る。
また、 ステップ S 7 1において、 オフフック状態とされたと判定された場合、
7 2に進み、 受信制御部 1 3 1は、 発信側の携帯電話機 1 0 1 iとの 通信リンクを確立し、 ステップ S 7 3に進む。
ステップ S 7 3では、 受信制御部 1 3 1が、 高品質化データが送信されてき たかどうかを判定し、 送信されてこなかったと判定した場合、 ステップ S 7 4 および S 7 5をスキップして、 ステップ S 7 6に進む。
また、 ステップ S 7 3において、 高品質化データが送信されてきたと判定さ れた場合、 即ち、 図 1 0のステップ S 5 8において、 発信側の携帯電話機 1 0 から、 最新の高品質化データおよび更新情報が送信された場合、 ステップ S 7 4に進み、 受信制御部 1 3 1は、 その最新の高品質化データおよび更新情報 を含む受信データを受信し、 管理部 1 3 5に供給する。
管理部 1 3 5は、 ステップ S 7 5において、 図 7のステップ S 1 8における 場合と同様に、 ステップ S 7 4で得た最新の高品質化データを、 着呼時に受信 した発信側の携帯電話機 1 0 の電話番号、 さらには、 その高品質化データと ともに送信されてきた更新情報と対応付けて、 記憶部 1 3 6に記憶させること により、 記憶部 1 3 6の記憶内容を更新する。
そして、 ステップ S 7 6に進み、 管理部 1 3 5は、 送信部 1 1 3の送信制御 部 1 2 4を制御することにより、 音声通話の準備が完了したことを表す準備完 了通知を、 送信データとして送信させ、 ステップ S 7 7に進む。
ステップ S 7 7では、 受信制御部 1 3 1は、 音声通話が可能な状態となって- 高品質化データ更新処理を終了する。
次に、 図 6乃至図 1 1で説明した高品質化データ送信処理または高品質化デ ータ更新処理は、 発呼時または着呼時に行われるが、 高品質化データ送信処理 または高品質化データ更新処理は、 その他、 任意のタイミングで行うことも可 能である。
そこで、 図 1 2は、 発信側としての携帯電話機 1 0 1ェにおいて、 例えば、 最 新の高品質化データが学習により得られた後に、 送信部 1 1 3 (図 3 ) で行わ れる高品質化データ送信処理を示すフローチャートである。
まず最初に、 ステップ S 8 1において、 管理部 1 2 7は、 電子メールのメッ セージとして、 記憶部 1 2 6に記憶された最新の高品質化データとその更新情 報、 および自身の電話番号を配置し、 ステップ S 8 2に進む。
ステップ S 8 2では、 管理部 1 2 7は、 最新の高品質化データ、 その更新情 報、 自身の電話番号をメッセージとして配置した電子メール (以下、 適宜、 高 品質化データ送信用電子メールという) のサブジェクト (件名) として、 その 電子メールが、 最新の高品質化データを含むものであることを表すものを配置 する。 即ち、 管理部 1 2 7は、 例えば、 「更新通知」 等を、 高品質化データ送 信用電子メールのサブジェクトに配置する。
そして、 ステップ S 8 3に進み、 管理部 1 2 7は、 高品質化データ送信用電 子メールに、 その宛先となるメールアドレスを設定する。 ここで、 高品質化デ ータ送信用電子メールの宛先となるメールアドレスとしては、 例えば、 過去に 電子メールのやりとりをしたことがある相手のメールァドレスを記憶しておき、 そのメールアドレスすべて、 あるいは、 そのメールァドレスのうちのユーザが 指定したもの等を配置することが可能である。
その後、 ステップ S 8 4に進み、 管理部 1 2 7は、 高品質化データ送信用電 子メールを、 送信制御部 1 2 4に供給し、 送信データとして送信させ、 高品質 化データ送信処理を終了する。
以上のようにして送信された高品質化データ送信用電子メールは、 所定のサ ーバを経由して、 高品質化データ送信用電子メールの宛先に配置されたメール ア ドレスの端末で受信されることになる。
次に、 図 1 3のフローチャートを参照して、 発信側の携帯電話機 1 0 で図 1 2の高品質化データ送信処理が行われる場合の、 着信側の携帯電話機 1 0 1 2 による高品質化データ更新処理について説明する。
着信側の携帯電話機 1 0 1 2では、 例えば、 任意のタイミングや、 ユーザから の指示に応じて、 所定のメールサーバに対して、 電子メールの受信が要求され、 この要求が行われると、 受信部 1 1 4 (図 4 ) において、 高品質化データ更新 処理が開始される。 即ち、 まず最初に、 ステップ S 9 1において、 上述の電子メールの受信の要 求に応じてメールサーバから送信されてくる電子メールが、 受信データとして. 受信制御部 1 3 1で受信され、 管理部 1 3 5に供給される。
管理部 1 3 5は、 ステップ S 9 2において、 受信制御部 1 3 1から供給され た電子メールのサブジェクトが、 最新の高品質化データを含むものであること を表す 「更新通知」 であるかどうかを判定し、 「更新通知」 でないと判定した 場合、 即ち、 電子メールが、 高品質化データ送信用電子メールではない場合、 高品質化データ更新処理を終了する。
また、 ステップ S 9 2において、 電子メールのサブジェクトが、 「更新通 知」 であると判定された場合、 即ち、 電子メールが、 高品質化データ送信用電 子メールである場合、 ステップ S 9 3に進み、 管理部 1 3 5は、 その高品質化 データ送信用電子メールのメッセージとして配置されている最新の高品質化デ ータ、 更新情報、 および発信側の電話番号を取得し、 ステップ S 9 4に進む。
ステップ S 9 4では、 管理部 1 3 5は、 図 7のステップ S 1 4における場合 と同様にして、 高品質化データ送信用電子メールから取得した更新情報および 発信側の電話番号を参照し、 記憶部 1 3 6に、 発信側の携帯電話機 1 0 のュ 一ザについての最新の高品質化データが記憶されているかどうかを判定する。
ステップ S 9 4において、 記憶部 1 3 6に、 発信側の携帯電話機 1 0 のュ 一ザについての最新の高品質化データが記憶されていると判定された場合、 ス テツプ S 9 5に進み、 管理部 1 3 5は、 ステップ S 9 3で取得した高品質化デ ータ、 更新情報、 および電話番号を破棄し、 高品質化データ更新処理を終了す る。
また、 ステップ S 9 4において、 記憶部 1 3 6に、 発信側の携帯電話機 1 0 のユーザについての最新の高品質化データが記憶されていないと判定された 場合、 ステップ S 9 6に進み、 管理部 1 3 5は、 図 7のステップ S 1 8におけ る場合と同様に、 ステップ S 9 3で取得した高品質化データ、 更新情報、 およ ぴ発信側の携帯電話機 1 0 の電話番号を、 記憶部 1 3 6に記憶させることに より、 記憶部 1 3 6の記憶内容を更新し、 高品質化データ更新処理を終了する。 次に、 図 1 4は、 図 3の送信部 1 1 3における学習部 1 2 5の構成例を示し ている。
図 1 4の実施の形態においては、 学習部 1 2 5は、 本件出願人が先に提案し たクラス分類適応処理に用いられるタップ係数を、 高品質化データとして学習 するようになっている。
クラス分類適応処理は、 クラス分類処理と適応処理とからなり、 クラス分類 処理によって、 データが、 その性質に基づいてクラス分けされ、 各クラスごと に適応処理が施される。
ここで、 適応処理について、 低音質の音声 (以下、 適宜、 低音質音声とい う) を、 高音質の音声 (以下、 適宜、 高音質音声という) に変換する場合を例 に説明する。
この場合、 適応処理では、 低音質音声を構成する音声サンプル (以下、 適宜、 低音質音声サンプルという) と、 所定のタップ係数との線形結合により、 その 低音質音声の音質を向上させた高音質音声の音声サンプルの予測値を求めるこ とで、 その低音質音声の音質を高くした音声が得られる。
具体的には、 例えば、 いま、 ある高音質音声データを学習の教師となる教師 データとするとともに、 その高音質音声の音質を劣化させた低音質音声データ を学習の生徒となる生徒データとして、 高音質音声を構成する音声サンプル (以下、 適宜、 高音質音声サンプルという) yの予測値 E [ y ] を、 幾つかの 低音質音声サンプル (低音質音声を構成する音声サンプル) X l, x 2, · ■ ·の 集合と、 所定のタップ係数 wu w2, · ■ 'の線形結合により規定される線形 1 次結合モデルにより求めることを考える。 この場合、 予測値 E [ y ] は、 次式 で表すことができる。
E [ y ] = w1 x 1+ w2 x 2+ ■ · ■
… ( 1 ) 式 (1 ) を一般化するために、 タップ係数 の集合でなる行列 W、 生徒デー タ Xijの集合でなる行列 X、 および予測値 E [yj] の集合でなる行列 Y' を、 【数 1】
X11 X12
X21 22 X2J
x=
XI1 12 XlJ
Figure imgf000030_0001
で定義すると、 次のような観測方程式が成立する。
XW=Y'
(2) ここで、 行列 Xの成分 Xijは、 i件目の生徒データの集合 ( i件目の教師データ y£の予測に用いる生徒データの集合) の中の;!番目の生徒データを意味し、 行 列 Wの成分 Wjは、 生徒データの集合の中の j番目の生徒データとの積が演算さ れるタップ係数を表す。 また、 yiは、 i件目の教師データを表し、 従って、 E
[yj は、 i件目の教師データの予測値を表す。 なお、 式 (1) の左辺におけ る yは、 行列 YO成分 yiのサフィックス iを省略したものであり、 また、 式
( 1) の右辺における • ■ ■ も、 Tタ' (I Xの成力- X ijのサフィックス i を省略したものである。
式 (2) の観測方程式に最小自乗法を適用して、 高音質音声サンプル yに近 い予測値 E [y] を求めることを考える。 この場合、 教師データとなる高音質 音声サンプルの真値 yの集合でなる行列 Y、 および高音質音声サンプル yの予 測値 E [y] の残差 (真値 yに対する誤差) eの集合でなる行列 Eを、 【数 2】
ei yi
Θ2
E- ei yi
J で定義すると、 式 (2) から、 次のような残差方程式が成立する。
XW=Y+E
• · · (3) この場合、 高音質音声サンプル yに近い予測値 E [y] を求めるためのタツ プ係数 Wjは、 自乗誤差
【数 3】
を最小にすることで求めることができる。
従って、 上述の自乗誤差をタップ係数 Wjで微分したものが 0になる場合、 即 ち、 次式を満たすタップ係数 Wjが、 高音質音声サンプル yに近い予測値 E [y] を求めるため最適値ということになる。
【数 4】
…,
• · ■ (4) そこで、 まず、 式 (3) を、 タップ係数 Wjで微分することにより、 次式が成 立する。
【数 5】 θννι 3w2 , 8wj v 1
• · · (5) 式 (4) および (5) より、 式 (6) が得られる。
【数 6】
Figure imgf000031_0001
• · · (6) さらに、 式 (3) の残差方程式における生徒データ Xij、 タップ係数 wj 教師 データ yi、 およぴ残差 e iの関係を考慮すると、 式 (6) から、 次のような正規 方程式を得ることができる。
【数 7】
Figure imgf000032_0001
• · · (7) なお、 式 (7) に示した正規方程式は、 行列 (共分散行列) Aおよびべク ト ル Vをヽ
【数 8】
Figure imgf000033_0001
Figure imgf000033_0002
で定義するとともに、 ベクトル Wを、 数 1で示したように定義すると、 式
• · · (8) で表すことができる。
式 (7) における各正規方程式は、 生徒データ および教師データ yiのセ ットを、 ある程度の数だけ用意することで、 求めるべきタップ係数 Wjの数 Jと 同じ数だけたてることができ、 従って、 式 (8) を、 ベタ トル Wについて解く ことで (但し、 式 (8) を解くには、 式 (8) における行列 Aが正則である必 要がある) 、 最適なタップ係数 Wjを求めることができる。 なお、 式 (8) を解 くにあたっては、 例えば、 掃き出し法 (Gauss- Jordanの消去法) などを用いる ことが可能である。
以上のように、 生徒データと教師データを用いて、 最適なタップ係数 Wjを求 める学習をしておき、 さらに、 そのタップ係数 Wjを用い、 式 (1) により、 教 師データ yに近い予測値 E [ y ] を求めるのが適応処理である。
なお、 適応処理は、 低音質音声には含まれていないが、 高音質音声に含まれ る成分が再現される点で、 単なる補間とは異なる。 即ち、 適応処理では、 式 ( 1 ) だけを見る限りは、 いわゆる補間フィルタを用いての単なる補間と同一 に見えるが、 その補間フィルタのタップ係数に相当するタップ係数 wが、 教師 データ yを用いての、 いわば学習により求められるため、 高音質音声に含まれ る成分を再現することができる。 このことから、 適応処理は、 いわば音声の創 造作用がある処理ということができる。
また、 上述の場合には、 高音質音声の予測値を、 線形一次予測するようにし たが、 その他、 予測 :は、 2以上の式によって予測することも可能である。 図 1 4の学習部 1 2 5は、 以上のようなクラス分類適応処理で用いられるタ ップ係数を、 高品質化データとして学習する。
即ち、 バッファ 1 4 1には、 0変換部1 2 2 (図 3 ) が出力する音声デ ータが、 学習用のデータとして供給されるようになっており、 バッファ 1 4 1 は、 その音声データを、 学習の教師となる教師データとして一時記憶する。 生徒データ生成部 1 4 2は、 バッファ 1 4 1に記憶された教師データとして の音声データから、 学習の生徒となる生徒データを生成する。
即ち、 生徒データ生成部 1 4 2は、 エンコーダ 1 4 2 Eとデコーダ 1 4 2 D とから構成されている。 エンコーダ 1 4 2 Eは、 送信部 1 1 3 (図 3 ) の符号 化部 1 2 3と同様に構成されており、 バッファ 1 4 1に記憶された教師データ を、 符号化部 1 2 3と同様にして符号化して、 符号化音声データを出力する。 デコーダ 1 4 2 Dは、 後述する図 1 6のデコーダ 1 6 1と同様に構成されてお り、 符号化音声データを、 符号化部 1 2 3における符号化方式に対応する復号 方式で復号し、 その結果得られる復号音声データを、 生徒データとして出力す る。
なお、 ここでは、 教師データを、 符号化部 1 2 3における場合と同様に、 符 号化音声データに符号化し、 さらに、 その符号化音声データを復号することに よって、 生徒データを生成するようにしたが、 その他、 生徒データは、 例えば、 教師データとしての音声データを、 ローパスフィルタ等によってフィルタリン グすることで、 その音質を劣化させることにより生成すること等が可能である c また、 生徒データ生成部 1 4 2を構成するエンコーダ 1 4 2 Eとしては、 符 号化部 1 2 3を用いることが可能であり、 さらに、 デコーダ 1 4 2 Dとしては、 後述する図 1 6のデコーダ 1 6 1を用いることが可能である。
生徒データメモリ 1 4 3は、 生徒データ生成部 1 4 2のデコーダ 1 4 2 Dが 出力する生徒データを一時記憶する。
予測タップ生成部 1 4 4は、 バッファ 1 4 1に記憶された教師データの音声 サンプルを、 順次、 注目データとし、 さらに、 その注目データを予測するのに 用いる生徒データとしての幾つかの音声サンプルを、 生徒データメモリ 1 4 3 から読み出すことにより、 予測タップ (注目データの予測値を求めるためのタ ップ) を生成する。 この予測タップは、 予測タップ生成部 1 4 4から足し込み 部 1 4 7に供給される。
クラスタップ生成部 1 4 5は、 注目データをクラス分けするクラス分類に用 いる生徒データとしての幾つかの音声サンプルを、 生徒データメモリ 1 4 3か ら読み出すことにより、 クラスタップ (クラス分類に用いるタップ) を生成す る。 このクラスタップは、 クラスタップ生成部 1 4 5からクラス分類部 1 4 6 に供給される。
ここで、 予測タップやクラスタップを構成する音声サンプルとしては、 例え ば、 注目データとなっている教師データの音声サンプルに対応する生徒データ の音声サンプルに対して時間的に近い位置にある音声サンプルを用いることが できる。
また、 予測タップとクラスタップを構成する音声サンプルとしては、 同一の 音声サンプルを用いることもできるし、 異なる音声サンプルを用いることも可 fta Cめる。
クラス分類部 1 4 6は、 クラスタツプ生成部 1 4 5からのクラスタツプに基 づき、 注目データをクラス分類し、 その結果得られるクラスに対応するクラス コードを、 足し込み部 1 4 7に出力する。
ここで、 クラス分類を行う方法としては、 例えば、 ADRC (Adaptive Dynamic R ange Coding)等を採用することができる。
ADRCを用いる方法では、 クラスタップを構成する音声サンプルが、 ADRC処理 され、 その結果得られる ADRCコードにしたがって、 注目データのクラスが決定 される。
なお、 Kビット ADRCにおいては、 例えば、 クラスタップを構成する音声サン プルの最大値 MAXと最小値 MINが検出され、 DR二 MAX - MINを、 集合の局所的なダ イナミックレンジとし、 このダイナミックレンジ DRに基づいて、 クラスタップ を構成する音声サンプルが Kビットに再量子化される。 即ち、 クラスタップを 構成する各音声サンプルから、 最小値 MINが減算され、 その減算値が DR/2Kで除 算 (量子化) される。 そして、 以上のようにして得られる、 クラスタップを構 成する Kビットの各音声サンプルを、 所定の順番で並べたビット列が、 ADRCコ ードとして出力される。 従って、 クラスタップが、 例えば、 1ビット ADRC処理 された場合には、 そのクラスタップを構成する各音声サンプルは、 最小値 MIN が減算された後に、 最大値 MAXと最小値 MINとの平均値で除算され、 これによ り、 各音声サンプルが 1ビットとされる (2値化される) 。 そして、 その 1ビ ットの音声サンプルを所定の順番で並べたビット列が、 ADRCコードとして出力 される。
なお、 クラス分類部 1 4 6には、 例えば、 クラスタップを構成する音声サン プルのレベル分布のパターンを、 そのままクラスコードとして出力させること も可能であるが、 この場合、 クラスタップが、 N個の音声サンプルで構成され、 各音声サンプルに、 Kビットが割り当てられているとすると、 クラス分類部 1 4 6が出力するクラスコードの場合の数は、 (2 N) κ通りとなり、 音声サンプル のビット数 Κに指数的に比例した膨大な数となる。
従って、 クラス分類部 1 4 6においては、 クラスタップの情報量を、 上述の A DRC処理や、 あるいはベク トル量子化等によって圧縮してから、 クラス分類を行 うのが好ましい。
足し込み部 1 4 7は、 ノ ッファ 1 4 1から、 注目データとなっている教師デ ータの音声サンプルを読み出し、 予測タップ生成部 1 4 4からの予測タップを 構成する生徒データ、 および注目データとしての教師データを対象とした足し 込みを、 初期コンポーネント記憶部 1 4 8およびユーザ用コンポーネント記憶 部 1 4 9の記憶内容を必要に応じて用いながら、 クラス分類部 1 4 6から供給 されるクラスごとに行う。
即ち、 足し込み部 1 4 7は、 基本的には、 クラス分類部 1 4 6から供給され るクラスコードに対応するクラスごとに、 予測タップ (生徒データ) を用い、 式 ( 8 ) の行列 Aにおける各コンポーネントとなっている、 生徒データどうし の乗算 (x in x im) と、 サメーシヨン (∑) に相当する演算を行う。
さらに、 足し込み部 1 4 7は、 やはり、 クラス分類部 1 4 6から供給される クラスコードに対応するクラスごとに、 予測タップ (生徒データ) および注目 データ (教師データ) を用い、 式 (8 ) のベク トル Vにおける各コンポーネン トとなっている、 生徒データと教師データの乗算 ( x in Y i) と、 サメーシヨン (∑) に相当する演算を行う。
一方、 初期コンポーネント記憶部 1 4 8は、 例えば、 R OMで構成され、 あ らかじめ用意された不特定多数の話者の音声データを学習用のデータとして学 習を行うことにより得られた、 式 (8 ) における行列 Aのコンポーネントと、 ベタ トル Vのコンポーネントを、 クラスごとに記憶している。
また、 ユーザ用コンポーネント記憶部 1 4 9は、 例えば、 E E P R OMで構 成され、 足し込み部 1 4 7において前回の学習で求められた式 (8 ) における 行歹 U Aのコンポーネントと、 ベク トノレ Vのコンポーネントを、 クラスごとに記 憶する。
足し込み部 1 4 7は、 新たに入力された音声データを用いて学習を行う場合、 ユーザ用コンポーネント記憶部 1 4 9に記憶された、 前回の学習で求められた 式 (8 ) における行列 Aのコンポ一ネントと、 ベクトル Vのコンポーネントを 読み出し、 その行列 Aまたはベク トル Vのコンポーネントに対して、 新たに入 力された音声データから得られる教師データ y iおよび生徒データ xin (xira)を用い て計算される、 対応するコンポーネント x in x iraまたは x in y iを足し込むことに より (行列 A、 ベクトル Vにおけるサメーシヨンで表される加算を行うことに より) 、 各クラスについて、 式 (8 ) に示した正規方程式をたてる。
従って、 足し込み部 1 4 7では、 新たに入力された音声データだけではなく 過去の学習に用いられた音声データにも基づいて、 式 (8 ) の正規方程式がた てられる。
なお、 学習部 1 2 5で、 初めて学習が行われる場合や、 ユーザ用コンポーネ ント記憶部 1 4 9がクリアされた直後等に学習が行われる場合おいては、 ユー ザ用コンポーネント記憶部 1 4 9には、 前回の学習で求められた行列 Aとべク トル Vのコンポーネントは記憶されていないため、 式 (8 ) の正規方程式は、 ユーザから入力された音声データだけを用いてたてられることになる。
この場合、 入力される音声データのサンプル数が十分でないこと等に起因し て、 タップ係数を求めるのに必要な数の正規方程式が得られないクラスが生じ ることがあり得る。
そこで、 初期コンポーネント記憶部 1 4 8は、 あらかじめ用意された不特定 十分な数の話者の音声データを学習用のデータとして学習を行うことにより得 られた、 式 ( 8 ) における行列 Aのコンポーネントと、 ベタ トル Vのコンポ一 ネントを、 クラスごとに記憶しており、 学習部 1 2 5は、 この初期コンポーネ ント記憶部 1 4 8に記憶された行列 Aおよびべクトル Vのコンポーネントと、 入力された音声データから得られる行列 Aおよびべクトル Vのコンポーネント とを必要に応じて用いて、 式 (8 ) の正規方程式をたてることで、 タップ係数 を求めるのに必要な数の正規方程式が得られないクラスが生じることを防止す るようになっている。
足し込み部 1 4 7は、 新たに入力された音声データから得られた行列 Aおよ びベクトル vのコンポーネントと、 ユーザ用コンポーネント記憶部 1 4 9 (ま たは初期コンポーネント記憶部 1 4 8 ) に記憶された行列 Aおよびべク トル V のコンポーネントと用いて、 新たに、 クラスごとの行列 Aおよびベクトル Vの コンポーネントを求めると、 それらのコンポーネントを、 ユーザ用コンポーネ ント記憶部 1 4 9に供給し、 上書きする形で記憶させる。
さらに、 足し込み部 1 4 7は、 新たに求めたクラスごとの行列 Aおよびべク トル Vのコンポーネントで構成される式 (8 ) の正規方程式を、 タップ係数決 定部 1 5 0に供給する。
その後、 タップ係数決定部 1 5 0は、 足し込み部 1 4 7から供給されるクラ スごとの正規方程式を解くことにより、 クラスごとに、 タップ係数を求め、 こ のクラスごとのタップ係数を、 高品質化データとして、 その更新情報とともに、 記憶部 1 2 6に供給し、 上書きする形で記憶させる。
次に、 図 1 5のフローチャートを参照して、 図 1 4の学習部 1 2 5で行われ る、 高品質化データとしてのタップ係数の学習処理について説明する。
例えば、 ユーザが通話時に行った発話、 あるいは任意のタイミングで行った 発話による音声デ タが、 /0変換部1 2 2 (図 3 ) からバッファ 1 4 1に 供給され、 バッファ 1 4 1は、 そこに供給される音声データを記憶する。
そして、 例えば、 ユーザが通話を終了すると、 あるいは、 発話を開始してか ら所定時間が経過すると、 学習部 1 2 5は、 通話中に、 バッファ 1 4 1に記憶 された音声データ、 あるいは、 一連の発話を開始してから終了するまでに、 バ ッファ 1 4 1に記憶された音声データを、 新たに入力された音声データとして. 学習処理を開始する。
即ち、 まず最初に、 生徒データ生成部 1 4 2は、 ステップ S 1 0 1において. バッファ 1 4 1に記憶された音声データを教師データとして、 その教師データ から生徒データを生成し、 生徒データメモリ 1 4 3に供給して記憶させ、 ステ ップ S 1 0 2に進む。
ステップ S 1 0 2では、 予測タップ生成部 1 4 4は、 ノ ッファ 1 4 1に記憶 された教師データとしての音声サンプルのうち、 まだ注目データとしていない ものの 1つを注目データとして、 その注目データについて、 生徒データメモリ 1 4 3に記憶された生徒データとしての音声サンプルの幾つかを読み出すこと により、 予測タップを生成して、 足し込み部 1 4 7に供給する。
さらに、 ステップ S 1 0 2では、 クラスタップ生成部 1 4 5が、 予測タップ 生成部 1 4 4における場合と同様にして、 注目データについて、 クラスタップ を生成し、 クラス分類部 1 4 6に供給する。
ステップ S 1 0 2の処理後は、 ステップ S 1 0 3に進み、 クラス分類部 1 4 6が、 クラスタップ生成部 1 4 5からのクラスタップに基づいて、 クラス分類 を行い、 その結果得られるクラスコードを、 足し込み部 1 4 7に供給する。
そして、 ステップ S 1 0 4に進み、 足し込み部 1 4 7は、 ノ ッファ 1 4 1力 ら注目データを読み出し、 その注目データと、 予測タップ生成部 1 4 4からの 予測タップを用いて、 行列 Aとベク トル Vのコンポーネントを計算する。 さら に、 足し込み部 1 4 7は、 ユーザ用コンポーネント記憶部 1 4 9に記憶された 行列 Aとべク トノレ Vのコンポーネントのうち、 クラス分類部 1 4 6からのクラ スコードに対応するものに対して、 注目データと予測タップから求められた行 列 Aとべク ト^/ Vのコンポーネントを足し込み、 ステップ S 1 0 5に進む。
ステップ S 1 0 5では、 予測タップ生成部 1 4 4力 ノ ッファ 1 4 1に、 ま だ、 注目データとしていない教師データが存在するかどうかを判定し、 存在す ると判定した場合、 ステップ S 1 0 2に戻り、 まだ、 注目データとされていな い教師データを、 新たに注目データとして、 以下、 同様の処理が繰り返される, また、 ステップ S 1 0 5において、 バッファ 1 4 1に、 注目データとしてレヽ ない教師データが存在しないと判定された場合、 足し込み部 1 4 7は、 ユーザ 用コンポーネント記憶部 1 4 9に記憶されたクラスごとの行列 Aおよびべク ト ル Vのコンポーネントで構成される式 (8 ) の正規方程式を、 タップ係数決定 部 1 5 0に供給し、 ステップ S 1 0 6に進む。
ステップ S 1 0 6では、 タップ係数決定部 1 5 0は、 足し込み部 1 4 7から 供給される各クラスごとの正規方程式を解くことにより、 各クラスごとに、 タ ップ係数を求める。 さらに、 ステップ S 1 0 6では、 タップ係数決定部 1 5 0 は、 各クラスごとのタップ係数を、 更新情報とともに、 記憶部 1 2 6に供給し、 上書きする形で記憶させ、 学習処理を終了する。
なお、 ここでは、 学習処理をリアルタイムで行わないようにしたが、 ハード ウェアが十分な性能を有する場合には、 リアルタイムで行っても良い。
以上のように、 学習部 1 2 5では、 新たに入力された音声データと、 過去の 学習に用いられた音声データに基づく学習処理が、 通話時その他の任意のタイ ミングで行われ、 これにより、 ユーザが発話を行うほど、 符号化音声データを、 そのユーザの音声に近い音声に復号することのできるタップ係数が求められる c 従って、 通話相手側において、 そのようなタップ係数を用いて、 符号化音声デ 一タの復号を行うことにより、 ユーザの音声の特性に適した処理が施され、 十 分に音質を改善した復号音声データを得ることができ、 ユーザが携帯電話機 1 0 1を使い込むことにより、 通話相手側において、 より品質の良い音声が出力 されることになる。
ここで、 送信部 1 1 3 (図 3 ) の学習部 1 2 5が図 1 4に示したように構成 される場合には、 高品質化データはタップ係数であるから、 受信部 1 1 4 (図 4 ) の記憶部 1 3 6には、 タップ係数が記憶される。 なお、 この場合、 受信部 1 1 4のデフォルトデータメモリ 1 3 7には、 例えば、 図 1 4の初期コンポ一 ネント記憶部 1 4 8に記憶されたコンポーネントによる正規方程式を解くこと によって得られるクラスごとのタップ係数が、 デフオルトデータとして記憶さ れる。
次に、 図 1 6は、 送信部 1 1 3 (図 3 ) の学習部 1 2 5が図 1 4に示したよ うに構成される場合の、 受信部 1 1 4 (図 4 ) の復号部 1 3 2の構成例を示し ている。
デコーダ 1 6 1には、 受信制御部 1 3 1 (図 4 ) が出力する符号化音声デー タが供給されるようになっており、 デコーダ 1 6 1は、 その符号化音声データ を、 送信部 1 1 3 (図 3 ) の符号化部 1 2 3における符号化方式に対応する復 号方式で復号し、 その結果得られる復号音声データを、 バッファ 1 6 2に出力 する。
バッファ 1 6 2は、 デコーダ 1 6 1が出力する復号音声データを一時記憶す る。
予測タップ生成部 1 6 3は、 復号音声データの音質を向上させた音質向上デ ータを、 順次、 注目データとして、 その注目データの予測値を、 式 (1 ) の線 形一次予測演算により求めるのに用いる予測タップを、 バッファ 1 6 2に記憶 された復号音声データのうちの幾つかの音声サンプルによって構成 (生成) し- 予測部 1 6 7に供給する。 なお、 予測タップ生成部 1 6 3は、 図 1 4の学習部 1 2 5における予測タップ生成部 1 4 4が生成するのと同一の予測タップを生 成する。
クラスタツプ生成部 1 6 4は、 バッファ 1 6 2に記憶された復号音声データ のうちの幾つかの音声サンプルによって、 注目データについて、 クラスタップ を構成 (生成) し、 クラス分類部 1 6 5に供給する。 なお、 クラスタップ生成 部 1 6 4は、 図 1 4の学習部 1 2 5におけるクラスタップ生成部 1 4 5が生成 するのと同一のクラスタップを生成する。
クラス分類部 1 6 5は、 クラスタツプ生成部 1 6 4からのクラスタツプを用 い、 図 1 4の学習部 1 2 5におけるクラス分類部 1 4 6と同様のクラス分類を 行い、 その結果得られるクラスコードを、 係数メモリ 1 6 6に供給する。
係数メモリ 1 6 6は、 管理部 1 3 5から供給される高品質化データとしての クラスごとのタップ係数を、 そのクラスに対応するァドレスに記慷する。 さら に、 係数メモリ 1 6 6は、 クラス分類部 1 6 5から供給されるクラスコ一ドに 対応するアドレスに記憶されているタップ係数を、 予測部 1 6 7に供給する。
予測部 1 6 7は、 予測タップ生成部 1 6 3が出力する予測タップと、 係数メ モリ 1 6 6が出力するタップ係数とを取得し、 その予測タップとタツプ係数と を用いて、 式 (1 ) に示した線形予測演算を行う。 これにより、 予測部 1 6 7 は、 注目データとしての音質向上データ (の予測値) を求め、 D /A変換部 1 3 3 (図 4 ) に供給する。
次に、 図 1 7のフローチャートを参照して、 図 1 6の復号部 1 3 2の処理に ついて説明する。
デコーダ 1 6 1は、 受信制御部 1 3 1 (図 4 ) が出力する符号化音声データ を復号し、 その結果得られる復号音声データを、 バッファ 1 6 2に出力して記 憶させている。
そして、 まず最初に、 ステップ S 1 1 1において、 予測タップ生成部 1 6 3 力 復号音声データの音質を向上させた音質向上データのうち、 例えば、 時系 列順で、 まだ注目データとしていない時間的に最も先行する音声サンプルを、 注目データとし、 その注目データについて、 バッファ 1 6 2から復号音声デー タのうちの幾つかの音声サンプルを読み出すことにより、 予測タップを構成し て、 予測部 1 6 7に供給する。
さらに、 ステップ S 1 1 1では、 クラスタップ生成部 1 6 4が、 バッファ 1 6 2に記憶された復号音声データのうちの幾つかの音声サンプルを読み出すこ とにより、 注目データについて、 クラスタップを構成し、 クラス分類部 1 6 5 に供給する。
クラス分類部 1 6 5は、 クラスタツプ生成部 1 6 4からクラスタップを受信 すると、 ステップ S 1 1 2に進み、 そのクラスタップを用いてクラス分類を行 い、 その結果得られるクラスコードを、 係数メモリ 1 6 6に供給して、 ステツ プ S 1 1 3に進む。
ステップ S 1 1 3では、 係数メモリ 1 6 6は、 クラス分類部 1 6 5からのク ラスコードに対応するァドレスに記憶されているタップ係数を読み出し、 予測 部 1 6 7に供給して、 ステップ S 1 1 4に進む。
ステップ S 1 1 4では、 予測部 1 6 7は、 係数メモリ 1 6 6が出力するタツ プ係数を取得し、 そのタツプ係数と、 予測タップ生成部 1 6 3カゝらの予測タッ プとを用いて、 式 (1 ) に示した積和演算を行い、 音質向上データ (の予測 値) を得る。
以上のようにして得られた音質向上データは、 予測部 1 6 7から、 D ZA変 換部 1 3 3 (図 4 ) を介して、 スピーカ 1 3 4に供給され、 これにより、 スピ 一力 1 3 4からは、 高音質の音声が出力される。
即ち、 タップ係数は、 ユーザの音声を教師とするとともに、 その音声を符号 化し、 さらに復号したものを生徒として、 その教師と生徒との関係を学習する ことにより得られたものであるので、 デコーダ 1 6 1が出力する復号音声デー タから、 元のユーザの音声を、 精度良く予測することを可能とするものであり 従って、 スピーカ 1 3 4からは、 通信相手のユーザの音声の肉声により近い音 声、 即ち、 デコーダ 1 6 1 (図 1 6 ) が出力する復号音声データの音質を向上 させたものが出力されることになる。
ステップ S 1 1 4の処理後は、 ステップ S 1 1 5に進み、 まだ、 注目データ として処理すべき音質向上データがあるかどうかが判定され、 あると判定され た場合、 ステップ S 1 1 1に戻り、 以下、 同様の処理が繰り返される。 また、 ステップ S 1 1 5において、 注目データとして処理すべき音質向上データがな いと判定された場合、 処理を終了する。
なお、 携帯電話機 1 0 と 1 0 1 2との間で通話が行われる場合、 携帯電話機 1 0 1 2では、 図 5で説明したことから、 高品質化データとしてのタップ係数と して、 通話相手である携帯電話機 1 0 1^の電話番号と対応付けられたもの、 即 ち、 携帯電話機 1 0 を所有するユーザの音声データを学習用のデータとして 学習したものが用いられる。 従って、 携帯電話機 1 0 から携帯電話機 1 0 1 2 に対して送信されてくる音声が、 携帯電話機 1 0 l iのユーザの音声であれば、 携帯電話機 1 0 1 2において、 携帯電話機 1 0 のユーザ用のタップ係数を用い て復号が行われることにより、 高音質の音声が出力されることとなる。
しカゝしな力 ら、 携帯電話機 1 0 から携帯電話機 1 0 1 2に対して送信されて くる音声が、 携帯電話機 1 0 のユーザの音声でない場合、 即ち、 携帯電話機 1 0 の所有者でないユーザが、 携帯電話機 1 0 3^を使用している場合、 携帯 電話機 1012では、 やはり、 携帯電話機 10 のユーザ用のタップ係数を用い て復号が行われることから、 その復号によって得られる音声は、 基本的に、 携 帯電話機 10 1^の真のユーザ (所有者) の音声における場合よりも、 音質が向 上したものにはならない。 即ち、 単純には、 携帯電話機 10 12では、 携帯電話 機 1 0 を、 そのの所有者が使用していれば、 高音質の音声が出力され、 携帯 電話機 10 を、 その所有者以外のユーザが使用している場合には、 音質の良 い音声は出力されない。 この点に注目すれば、 携帯電話機 10 1によって、 簡 易な個人認証が可能であるということができる。
次に、 図 1 8は、 携帯電話機 10 1力 例えば、 C E L P (Code Excited Lin er Prediction coding)方式のものである場合の、 送信部 1 1 3 (図 3 ) を構成 する符号化部 1 23の構成例を示している。
AZD変換部 1 22 (図 3) が出力する音声データは、 演算器 3と LPC(Li ner Prediction Coefficient)分析部 4に供給される。
L PC分析部 4は、 /0変換部1 22 (図 3) からの音声データを、 所定 の音声サンプルを 1フレームとして、 フレームごとに LP C分析し、 P次の線 形予測係数 い ひ 2, ■ · · , Q;pを求める。 そして、 L PC分析部 4は、 この P次の線形予測係数ひ p (p = 1 , 2, ■ ■ ■, P) を要素とするベク トルを、 音声の特徴べク トルとして、 ベタトル量子化部 5に供給する。
ベタ トル量子化部 5は、 線形予測係数を要素とするコードべクトルとコード とを対応付けたコ一ドブックを記憶しており、 そのコードブックに基づいて、 L P C分析部 4からの特徴べクトル αをべクトル量子化し、 そのべク トル量子 化の結果得られるコード (以下、 適宜、 Αコード(A_code)という) を、 コード 決定部 1 5に供給する。
さらに、 ベク トル量子化部 5は、 Aコードに対応するコードベク トル a, を 構成する要素となっている線形予測係数 ο^' , α2' , ■ · ■, αΡ' を、 音声合 成フィルタ 6に供給する。
音声合成フィルタ 6は、 例えば、 I I R (Infinite Impulse Response)型のデ イジタルフィルタで、 ベタトル量子化部 5からの線形予測係数 a; p ' (p = 1 , 2 , ■ ■ ■, P) を I I Rフィルタのタップ係数とするとともに、 演算器 1 4 から供給される残差信号 eを入力信号として、 音声合成を行う。
即ち、 L P C分析部 4で行われる L P C分析は、 現在時刻 nの音声データ (のサンプル値) s n、 およびこれに隣接する過去の P個のサンプル値 s い s n_
2, · · ·, S n_p k "ヽ ェ C
S n+ O!! S η_χ+ (¾ 2 S r-""'- ' · ■ + α P S π-Ρ = θπ
• · · ( 9) で示す線形 1次結合が成立すると仮定し、 現在時刻 ηのサンプル値 s ηの予測値 (線形予測値) s n' を、 過去の P個の標本値 s n— s n_2, ■ · ·, s n_Pを用い て、 式
S n =― ( « 1 S „_!+ 2 S n_2+ - ■ ■ + K p S n_p)
• · ■ ( 1 0) によつて線形予測したときに、 実際のサンプル値 s nと線形予測値 s η' との間の 自乗誤差を最小にする線形予測係数ひ ρを求めるものである。
ここで、 式 (9) において、 {en} ( · · · , en—い en, en+1, · ■ ■ ) は、 平 均値が 0で、 分散が所定値 σ2の互いに無相関な確率変数である。
式 (9) から、 サンプル値 s nは、 式
s n=en一 t L s η_χ + a s n_2 + ■ ■ ■ + a; p s n—pノ
· ■ ■ ( 1 1 ) で表すことができ、 これを、 Z変換すると、 次式が成立する。
S = E/ { 1 + ax z_1+ 2 z - · · + a P z "p)
• · · ( 1 2) 但し、 式 (1 2 ) において、 Sと Eは、 式 (1 1 ) における s nと enの Z変換を、 それぞれ表す。
ここで、 式 (9 ) および (1 0) から、 enは、 式 • · · ( 1 3 ) で表すことができ、 実際のサンプル値 s nと線形予測値 s n' との間の残差信号と 呼ばれる。
従って、 式 (1 2 ) から、 線形予測係数ひ pを I I Rフィルタのタップ係数と するとともに、 残差信号 e nを I I Rフィルタの入力信号とすることにより、 音 声データ s nを求めることができる。
そこで、 音声合成フィルタ 6は、 上述したように、 ベタ トル量子化部 5から の線形予測係数ひ ρ' をタップ係数とするとともに、 演算器 1 4から供給される 残差信号 eを入力信号として、 式 (1 2 ) を演算し、 音声データ (合成音デー タ) s sを求める。
なお、 音声合成フィルタ 6では、 L P C分析部 4による L P C分析の結果得 られる線形予測係数 α ρではなく、 そのべクトル量子化の結果得られるコードに 対応するコードベクトルとしての線形予測係数ひ ρ' が用いられるため、 音声合 成フィルタ 6が出力する合成音信号は、 A/D変換部 1 2 2 (図 3 ) が出力す る音声データとは、 基本的に同一にはならない。
音声合成フィルタ 6が出力する合成音データ s sは、 演算器 3に供給される, 演算器 3は、 音声合成フィルタ 6からの合成音データ s sから、 A/D変換部 1 2 2 (図 3 ) が出力する音声データ sを減算し、 その減算値を、 自乗誤差演 算部 7に供給する。 自乗誤差演算部 7は、 演算器 3からの減算値の自乗和 (第 kフレームのサンプル値についての自乗和) を演算し、 その結果得られる自乗 誤差を、 自乗誤差最小判定部 8に供給する。
自乗誤差最小判定部 8は、 自乗誤差演算部 7が出力する自乗誤差に対応付け て、 長期予測ラグを表すコードとしての Lコード(L— code)、 ゲインを表すコー ドとしての Gコード(G— code)、 および符号語 (励起コードプック) を表すコ一 ドとしての Iコード(I_code)を記憶しており、 自乗誤差演算部 7が出力する自 乗誤差に対応する Lコード、 Gコード、 および Lコードを出力する。 Lコード は、 適応コードブック記憶部 9に、 Gコードは、 ゲイン復号器 1 0に、 Iコー ドは、 励起コードプック記憶部 1 1に、 それぞれ供給される。 さらに、 Lコー ド、 Gコード、 および Iコードは、 コード決定部 1 5にも供給される。
適応コードプック記憶部 9は、 例えば 7ビットの Lコードと、 所定の遅延時 間 (ラグ) とを対応付けた適応コードプックを記憶しており、 演算器 1 4から 供給される残差信号 eを、 自乗誤差最小判定部 8から供給される Lコードに対 応付けられた遅延時間 (長期予測ラグ) だけ遅延して、 演算器 1 2に出力する c ここで、 適応コードプック記憶部 9は、 残差信号 eを、 Lコードに対応する 時間だけ遅延して出力することから、 その出力信号は、 その遅延時間を周期と する周期信号に近い信号となる。 この信号は、 線形予測係数を用いた音声合成 において、 主として、 有声音の合成音を生成するための駆動信号となる。 従つ て、 Lコードは、 概念的には、 音声のピッチ周期を表す。 なお、 CELPの規格に よれば、 レコードは、 2 0乃至 1 4 6の範囲の整数値をとる。
ゲイン復号器 1 0は、 Gコードと、 所定のゲイン ]3および 0;とを対応付けた テ一ブルを記憶しており、 自乗誤差最小判定部 8から供給される Gコードに対 応付けられたゲイン ]3および γを出力する。 ゲイン と γは、 演算器 1 2と 1 3に、 それぞれ供給される。 ここで、 ゲイン は、 長期フィルタ状態出力ゲイ ンと呼ばれるものであり、 また、 ゲイン γは、 励起コードブックゲインと呼ば れるものである。
励起コードブック記憶部 1 1は、 例えば 9ビットの Iコードと、 所定の励起 信号とを対応付けた励起コードブックを記憶しており、 自乗誤差最小判定部 8 から供給される I コードに対応付けられた励起信号を、 演算器 1 3に出力する, ここで、 励起コードブックに記憶されている励起信号は、 例えば、 ホワイト ノイズ等に近い信号であり、 線形予測係数を用いた音声合成において、 主とし て、 無声音の合成音を生成するための駆動信号となる。
演算器 1 2は、 適応コードブック記憶部 9の出力信号と、 ゲイン復号器 1 0 が出力するゲイン ]3とを乗算し、 その乗算値 1を、 演算器 1 4に供給する。 演 算器 1 3は、 励起コードプック記憶部 1 1の出力信号と、 ゲイン復号器 1 0が 出力するゲイン γとを乗算し、 その乗算値 ηを、 演算器 1 4に供給する。 演算 器 1 4は、 演算器 1 2からの乗算値 1 と、 演算器 1 3からの乗算値 ηとを加算 し、 その加算値を、 残差信号 eとして、 音声合成フィルタ 6と適応コードプッ ク記憶部 9に供給する。
音声合成フィルタ 6では、 以上のようにして、 演算器 1 4から供給される残 差信号 eを入力信号が、 ベタ トル量子化部 5から供給される線形予測係数ひ をタップ係数とする I I Rフィルタでフィルタリングされ、 その結果得られる 合成音データが、 演算器 3に供給される。 そして、 演算器 3および自乗誤差演 算部 7において、 上述の場合と同様の処理が行われ、 その結果得られる自乗誤 差が、 自乗誤差最小判定部 8に供給される。
自乗誤差最小判定部 8は、 自乗誤差演算部 7からの自乗誤差が最小 (極小) になったかどうかを判定する。 そして、 自乗誤差最小判定部 8は、 自乗誤差が 最小になっていないと判定した場合、 上述のように、 その自乗誤差に対応する Lコード、 Gコード、 および Lコ ドを出力し、 以下、 同様の処理が繰り返さ れる。
—方、 自乗誤差最小判定部 8は、 自乗誤差が最小になったと判定した場合、 確定信号を、 コード決定部 1 5に出力する。 コード決定部 1 5は、 ベタトル量 子化部 5から供給される Αコードをラツチするとともに、 自乗誤差最小判定部 8から供給される Lコード、 Gコード、 および Iコードを順次ラッチするよう になっており、 自乗誤差最小判定部 8から確定信号を受信すると、 そのときラ ツチしている Aコード、 Lコード、 Gコード、 および Iコードを多重化し、 符 号化音声データとして出力する。
以上から、 符号化音声データは、 復号に用いられる情報である Aコード、 L コード、 Gコード、 および Iコードを、 フレーム単位ごとに有するものとなつ ている。
ここで、 図 1 8 (後述する図 1 9および図 2 0においても同様) では、 各変 数に、 [k]が付され、 配列変数とされている。 この kは、 フレーム数を表すが、 明細書中では、 その記述は、 適宜省略する。
次に、 図 1 9は、 携帯電話機 1 0 1が、 C E L P方式のものである場合の、 受信部 1 1 4 (図 4 ) を構成する復号部 1 3 2の構成例を示している。 なお、 図中、 図 1 6における場合と対応する部分については、 同一の符号を付してあ る。
受信制御部 1 3 1 (図 4 ) が出力する符号化音声データは、 D E MU X (デ マルチプレクサ) 2 1に供給され、 D E MU X 2 1は、 符号化音声データから Lコード、 Gコード、 Iコード、 Aコードを分離し、 それぞれを、 適応コード プック記憶部 2 2、 ゲイン復号器 2 3、 励起コードブック記憶部 2 4、 フィル タ係数復号器 2 5に供給する。
適応コードブック記憶部 2 2、 ゲイン復号器 2 3、 励起コードブック記憶部 2 4、 演算器 2 6乃至 2 8は、 図 1 8の適応コードブック記憶部 9、 ゲイン復 号器 1 0、 励起コードブック記憶部 1 1、 演算器 1 2乃至 1 4とそれぞれ同様 に構成されるもので、 図 1で説明した場合と同様の処理が行われることにより. Lコード、 Gコード、 および Iコードが、 残差信号 eに復号される。 この残差 信号 eは、 音声合成フィルタ 2 9に対して、 入力信号として与えられる。
フィルタ係数復号器 2 5は、 図 1 8のべクトル量子化部 5が記憶しているの と同一のコードブックを記憶しており、 Aコードを、 線形予測係数 α ρ' に復号 し、 音声合成フィルタ 2 9に供給する。
音声合成フィルタ 2 9は、 図 1 8の音声合成フィルタ 6と同様に構成されて おり、 フィルタ係数復号器 2 5からの線形予測係数ひ ρ ' をタツプ係数とすると ともに、 演算器 2 8から供給される残差信号 eを入力信号として、 式 (1 2 ) を演算し、 これにより、 図 1 8の自乗誤差最小判定部 8において自乗誤差が最 小と判定されたときの合成音データを生成し、 復号音声データとして出力する, ここで、 発信側の符号化部 1 2 3から、 着信側の復号部 1 3 2に対しては、 図 1 8で説明したことから、 復号部 1 3 2の音声合成フィルタ 2 9に与えられ る入力信号としての残差信号と線形予測係数がコード化されて送信されてくる ため、 復号部 1 3 2では、 そのコードが、 残差信号と線形予測係数に復号され る。 しかしながら、 この復号された残差信号や線形予測係数 (以下、 適宜、 そ れぞれを、 復号残差信号または復号線形予測係数という) には、 量子化誤差等 の誤差が含まれるため、 発信側におけるユーザの音声を L P C分析して得られ る残差信号と線形予測係数には一致しない。
このため、 復号部 1 3 2の音声合成フィルタ 2 9が出力する合成音データで ある復号音声データは、 発信側のユーザの音声データに対して、 歪み等を有す る、 音質の劣化したものとなる。
そこで、 復号部 1 3 2は、 上述のクラス分類適応処理を行うことによって、 復号音声データを、 歪みのない (歪みを低減した) 、 発信側のユーザの音声デ ータに近い音質向上データに変換するようになっている。
即ち、 音声合成フィルタ 2 9が出力する合成音データである復号音声データ は、 バッファ 1 6 2に供給され、 バッファ 1 6 2は、 その復号音声データを一 時記' I思 ^る。
そして、 予測タップ生成部 1 6 3は、 復号音声データの音質を向上させた音 質向上データを、 順次、 注目データとし、 その注目データについて、 バッファ 1 6 2から復号音声データのうちの幾つかの音声サンプルを読み出すことによ り、 予測タップを構成して、 予測部 1 6 7に供給する。 また、 クラスタップ生 成部 1 6 4は、 バッファ 1 6 2に記憶された復号音声データのうちの幾つかの 音声サンプルを読み出すことにより、 注目データについて、 クラスタップを構 成し、 クラス分類部 1 6 5に供給する。
クラス分類部 1 6 5は、 クラスタップ生成部 1 6 4からクラスタップを用い てクラス分類を行い、 その結果得られるクラスコ一ドを、 係数メモリ 1 6 6に 供給する。 係数メモリ 1 6 6は、 クラス分類部 1 6 5からのクラスコードに対 応するアドレスに記憶されているタップ係数を読み出し、 予測部 1 6 7に供給 する。
そして、 予測部 1 6 7は、 係数メモリ 1 6 6が出力するタップ係数と、 予測 タップ生成部 1 6 3からの予測タップとを用いて、 式 (1 ) に示した積和演算 を行い、 音質向上データ (の予測値) を得る。
以上のようにして得られた音質向上データは、 予測部 1 6 7から、 D /A変 換部 1 3 3 (図 4 ) を介して、 スピーカ 1 3 4に供給され、 これにより、 スピ 一力 1 3 4からは、 高音質の音声が出力される。
次に、 図 2 0は、 携帯電話機 1 0 1が、 C E L P方式のものである場合の、 送信部 1 1 3 (図 3 ) を構成する学習部 1 2 5の構成例を示している。 なお、 図中、 図 1 4における場合と対応する部分については、 同一の符号を付してあ り、 以下では、 その説明は、 適宜省略する。
演算器 1 8 3乃至コード決定部 1 9 5は、 図 1 8の演算器 3乃至コード決定 部 1 5とそれぞれ同様に構成される。 演算器 1 8 3には、 AZD変換部 1 2 2 (図 3 ) が出力する音声データが、 学習用のデータとして入力されるようにな つており、 従って、 演算器 1 8 3乃至コード決定部 1 9 5では、 その学習用の 音声データに対して、 図 1 8の符号化部 1 2 3における場合と同様の処理が施 される。
そして、 自乗誤差最小判定部 1 8 8において自乗誤差が最小になったと判定 されたときの音声合成フィルタ 1 8 6が出力する合成音データが、 生徒データ として、 生徒データメモリ 1 4 3に供給される。
その後は、 生徒データメモリ 1 4 3乃至タップ係数決定部 1 5 0において、 図 1 4および 1 5における場合と同様の処理が行われ、 これにより、 クラスご とのタップ係数が、 高品質化データとして生成される。
なお、 図 1 9または図 2 0の実施の形態では、 予測タップやクラスタップを、 音声合成フィルタ 2 9または 1 8 6が出力する合成音データから構成するよう にしたが、 予測タップゃクラスタップは、 図 1 9または図 2 0において点線で 示すように、 Iコードや、 Lコード、 Gコード、 Aコード、 Aコードから得ら れる線形予測係数 p、 Gコードから得られるゲイン , γ、 その他の、 Lコー ド、 Gコード、 Iコード、 または Αコードから得られる情報 (例えば、 残差信 号 eや、 残差信号 eを得るための 1, n、 さらには、 1 / 0 , η / γなど) の うちの 1以上を含めて構成することが可能である。
次に、 図 2 1は、 送信部 1 1 3 (図 3 ) を構成する符号化部 1 2 3の他の構 成例を示している。
図 2 1の実施の形態においては、 符号化部 1 2 3は、 A/D変換部 1 2 2 (図 3 ) が出力する音声デ ^タをべクトル量子化することにより符号化するよ うになっている。
即ち、 /0変換部1 2 2 (図 3 ) が出力する音声データは、 バッファ 2 0 1に供給され、 バッファ 2 0 1は、 そこに供給される音声データを一時記憶す る。
べク トル化部 2 0 2は、 バッファ 2 0 1に記憶された音声データを時系列に 読み出して、 所定数の音声サンプルを 1フレームとし、 各フレームの音声デー タをべク トル化する。
ここで、 べク トル化部 2 0 2では、 例えば、 1フレームの各音声サンプルを、 そのまま、 ベク トルの各コンポーネントとすることにより、 音声データをべク トル化することも可能であるし、 また、 例えば、 1フレームを構成する音声サ ンプルについて、 L P C分析等の音響分析を施し、 その結果得られる音声の特 徴量を、 ベク トルのコンポーネントとすることにより、 音声データをベクトル 化することも可能である。 なお、 ここでは、 説明を簡単にするために、 例えば、 1フレームの各音声サンプノレを、 そのまま、 ベタ ト の各コンポーネントとす ることにより、 音声データをベクトル化するものとする。
ベク トル化部 2 0 2は、 1フレームの各音声サンプルを、 そのままコンポ一 ネントとして構成したべク トル (以下、 適宜、 音声べク トルとする) を、 距離 計算部 2 0 3に出力する。
距離計算部 2 0 3は、 コードブック記憶部 2 0 4に記憶されたコードブック に登録されている各コードべクトルと、 ベタトル化部 2 0 2からの音声べクト ルとの距離 (例えば、 ユークリッド距離など) を計算し、 各コードべク トルに ついて求められた距離を、 そのコードベクトルに対応するコードとともに、 コ ード決定部 2 0 5に供給する。
即ち、 コードブック記憶部 2 0 4は、 後述する図 2 2の学習部 1 2 5におけ る学習によって得られる高品質化データとしてのコードプックを記憶し、 距離 計算部 2 0 3は、 そのコードプックに登録されている各コードベクトルについ て、 ベタ トル化部 2 0 2からの音声べク トルとの距離を計算して、 各コードべ クトルに対応するコードとともに、 コード決定部 2 0 5に供給する。
コード決定部 2 0 5は、 距離計算部 2 0 3から供給される、 各コードべクト ルについての距離のうち、 最も短いものを検出し、 その最も短い距離を与える コードべク トル、 即ち、 音声べク トルについての量子化誤差 (ベタ トル量子化 誤差) を最も小さくするコードべク トルに対応するコードを、 ベク トル化部 2 0 2が出力した音声べクトルについてのベタトル量子化結果として決定する。
そして、 コード決定部 2 0 5は、 そのベクトル量子化結果としてのコードを、 符号化音声データとして、 送信制御部 1 2 4 (図 3 ) に出力する。
従って、 図 2 1の実施の形態では、 距離計算部 2 0 3、 コードブック記憶部 2 0 4、 およびコード決定部 2 0 5で、 ベク トル量子化器が構成されている。
次に、 図 2 2は、 符号化部 1 2 3が図 2 1に示したように構成される場合の. 図 3の送信部 1 1 3を構成する学習部 1 2 5の構成例を示している。
バッファ 2 1 1には、 A/D変換部 1 2 2が出力する音声データが供給され るようになっており、 バッファ 2 1 1は、 そこに供給される音声データを記憶 する。
ベタトル化部 2 1 2は、 バッファ 2 1 1に記憶された音声デ^"タを用いて、 図 2 1のべクトル化部 2 0 2における場合と同様にして、 音声べクトルを構成 し、 ユーザ用べク トル記憶部 2 1 3に供給する。
ユーザ用べクトル記憶部 2 1 3は、 例えば、 E E P R OMなどで構成され、 ベタトル化部 2 1 2から供給される音声べクトルを順次記憶する。 初期べクト ル記憶部 2 1 4は、 例えば、 R OMなどで構成され、 不特定多数のユーザの音 声データを用いて構成された多数の音声べクトルをあらかじめ記憶している。
コードプック生成部 2 1 5は、 初期べク トル記憶部 2 1 4およびユーザべク トル記憶部 2 1 3に記憶された音声ベク トルをすベて用い、 例えば、 L B G (L inde, Buzo, Gray) ァノレゴリズムによって、 コードプックを生成する学習を行 い、 その学習の結果得られるコードブックを、 高品質化データとして出力する, なお、 コードブック生成部 2 1 5が出力する高品質化データとしてのコード ブックは、 記憶部 1 2 6 (図 3 ) に供給され、 更新情報 (コードブックが得ら れた日時) とともに記憶されるとともに、 符号化部 1 2 3 (図 2 1 ) にも供給 され、 そのコードブック記憶部 2 0 4に書き込まれる (上書きされる) 。
ここで、 図 2 2の学習部 1 2 5で、 初めて学習が行われる場合や、 ユーザ用 ベタ トル記憶部 2 1 3がクリアされた直後等に学習が行われる場合おいては、 ユーザ用べク トル記憶部 2 1 3には、 音声べク トルが記憶されていないため、 コ一ドブック生成部 2 1 5において、 ユーザ用べクトル記憶部 2 1 3だけを参 照するのでは、 コードブックを生成することができないことがある。 また、 携 帯電話機 1 0 1の使用が開始されてから間もない場合においては、 ユーザ用べ クトル記憶部 2 1 3には、 それほど多くの音声べク トルが記憶されていない。
この場合、 コードブック生成部 2 1 5において、 ユーザ用べクトル記憶部 2 1 3を参照するだけでも、 コードブックを生成することは可能ではあるが、 その ようなコードブックを用いたベクトル量子化は、 かなり精度の悪いもの (量子 化誤差が大きいもの) となることがある。
そこで、 初期べク トル記憶部 2 1 4には、 上述のように、 多数の音声べク ト ルが記憶されており、 コードブック生成部 2 1 5は、 ユーザ用べタトル記憶部 2 1 3だけでなく、 初期べクトル記憶部 2 1 4も参照することで、 上述のよう な精度の悪いべクトル量子化が行われるようなコードブックが生成されること を防止するようになっている。
なお、 ユーザ用べク トル記憶部 2 1 3に、 ある程度の数の音声べクトルが記 憶された後は、 コードブック生成部 2 1 5において、 初期べクトル記憶部 2 1 4を参照せずに、 ユーザ用ベクトル記憶部 2 1 3だけを参照して、 コードブッ クを生成するようにすることが可能である。
次に、 図 2 3のフローチャートを参照して、 図 2 2の学習部 1 2 5で行われ る、 高品質化データとしての ドブックの学習処理について説明する。
例えば、 ユーザが通話時に行った発話、 あるいは任意のタイミングで行った 発話による音声データが、 0変換部1 2 2 (図 3 ) からバッファ 2 1 1に 供給され、 バッファ 2 1 1は、 そこに供給される音声データを記憶する。
そして、 例えば、 ユーザが通話を終了すると、 あるいは、 発話を開始してか ら所定時間が経過すると、 学習部 1 2 5は、 通話中に、 バッファ 2 1 1に記憶 された音声データ、 あるいは、 一連の発話を開始してから終了するまでに、 ッファ 2 1 1に記憶された音声データを、 新たに入力された音声データとして、 学習処理を開始する。
即ち、 ベタトル化部 2 1 2は、 バッファ 2 1 1に記憶された音声データを時 系列に読み出し、 所定数の音声サンプルを 1フレームとして、 各フレームの音 声データをべクトル化する。 そして、 ベタトル化部 2 1 2は、 そのべクトル化 の結果得られる音声べクトルを、 ユーザ用べクトル記憶部 2 1 3に供給して追 加記憶させる。
バッファ 2 1 1に記憶された音声データすぺてのベタトル化が終了すると、 コードブック生成部 2 1 5は、 ステップ S 1 2 1において、 ユーザ用べク トル 記憶部 2 1 3と初期べタ トル記憶部 2 1 4に記憶された各音声べク トルとの距 離の総和を最小にするベクトル y iを求める。 そして、 ドブック生成部 2 1 5は、 そのべク トル y を、 トべクトノレ y iとして、 ステップ S 1 2 2に進む c ステップ S 1 2 2では、 コードプック生成部 2 1 5は、 現在得られているコ ードベクトルの総数を変数 nに設定し、 ドべクトノレ yい y 2, · · ■ , y n それぞれを 2分割する。 即ち、 コードブック生成部 2 1 5は、 例えば、 厶を微 小なベタ トルとするとき、 ドべクトル y i ( i = 1 2 , · · · η ) 力 ら、 ベタ トル y i + Δおよび y i— Δを生成し、 ベクトル y i + Aを、 新たなコードべク トル y iとするとともに、 ベクトル y i—△を、 新たなコードべクトル yn+iとする c そして、 ステップ S 1 23に進み、 コードプック生成部 21 5は、 ユーザ用 べク トル記憶部 21 3と初期べクトル記憶部 214に記憶された各音声べク ト ル X j ( j = 1 , 2, ■ ■ · , J (ユーザ用ベク トル記憶部 21 3と初期べク ト ル記憶部 2 14に記憶された音声べク トルの総数) ) を、 その音声べクトノレ X j と最も距離が近いコードベクトル yi ( i = l , 2, ■ . ·, 2 n) に分類し、 ステップ S I 24に進む。
ステップ S 1 24では、 コードプック生成部 21 5は、 各コードべクトノレ y i を、 そのコードべクトル yiに分類された各音声べクトルとの距離の総和が最小 になるように更新する。 なお、 この更新は、 例えば、 コードベク トル yiに分類 された 0個以上の音声べクトルが指す点の重心を求めることによって行うこと ができる。 即ち、 その重心を指すベクトルが、 コードベクトル yiに分類された 各音声べク トルとの距離の総和を最小にするものとなる。 伹し、 コードべク ト ル yiに分類された音声ベクトルが 0個の場合は、 コードベクトル yiは、 例えば、 そのままとされる。
その後、 ステップ S 1 25に進み、 コードブック生成部 2 1 5は、 更新後の 各コードべクトル yiについて、 そのコードべクトル y iに分類された各音声べク トルとの距離の総和 (以下、 適宜、 コードベクトル yiについての距離の総和と いう) を求め、 さらに、 すべてのコードベク トル yiについての距離の総和の総 和 (以下、 適宜、 全総和という) を求める。 そして、 コードブック生成部 2 1 5は、 その全総和の変化、 即ち、 今回のステップ S 1 25で求めた全総和 (以 下、 適宜、 今回の全総和という) と、 前回のステップ S 1 25で求めた全総和 (以下、 適宜、 前回の全総和という) との差の絶対値が、 所定の閾値以下であ るかどうかを判定する。
ステップ S 1 2 5において、 今回の全総和と前回の全総和との差の絶対値が、 所定の閾値以下でないと判定された場合、 即ち、 コードベクトル yiを更新する ことにより、 全総和が大きく変化した場合、 ステップ S 1 23に戻り、 以下、 同様の処理を繰り返す。
また、 ステップ S 1 2 5において、 今回の全総和と前回の全総和との差の絶 対値が、 所定の閾値以下であると判定された場合、 即ち、 コードベクトル y iを 更新しても、 全総和がほとんど変化しない場合、 ステップ S 1 2 6に進み、 コ 一ドブック生成部 2 1 5は、 現在得られているコードべクトルの総数を表す変 数 nが、 コードブックにあらかじめ設定されているコードべク トルの数 (以下、 適宜、 設定コードベク トル数という) Nに等しいかどうかを判定する。 .
ステップ S 1 2 6において、 変数 nが、 設定コードベクトル数 Nに等しくな いと判定された場合、 即ち、 まだ、 設定コードベク トル数 Nに等しい数のコー ドベクトル y iが得られていない場合、 ステップ S 1 2 2に戻り、 以下、 同様の 処理を繰り返す。
また、 ステップ S 1 2 6において、 変数 11が、 設定コードベクトル数 Nに等 しいと判定された場合、 即ち、 設定コードベク トル数 Nに等しい数のコードべ クトル y iが得られた場合、 コードプック生成部 2 1 5は、 その N個のコードべ クトル y iで構成されるコードプックを、 高品質化データとして出力し、 学習処 理を終了する。
なお、 図 2 3の学習処理では、 ユーザ用べクトル記憶部 2 1 3に、 いままで に入力された音声べク トルを記憶しておき、 その音声べクトルを用いて、 コー ドブックを更新 (生成) するようにしたが、 コードブックの更新は、 過去に入 力された音声べクトルを記憶しておかずに、 今回入力された音声べクトルと、 既に得られているコードブックを用い、 ステップ S 1 2 3および S 1 2 4の処 理により、 いわば簡略化した形で行うことも可能である。
即ち、 この場合、 コードブック生成部 2 1 5は、 ステップ S 1 2 3において, 今回入力された各音声べクトル X j ( j = 1 , 2, · · ■, J (今回入力された 音声ベク トルの総数) ) を、 その音声ベク トル X jと最も距離が近いコードべク トル y i ( i = l, 2, · · ■ , N (コードブックにおけるコードベクトルの総 数) ) に分類し、 ステップ S 1 2 4に進む。 ステップ S 1 24では、 コードブック生成部 21 5は、 各コードべクトノレ y i を、 そのコードべクトル yiに分類された各音声べクトルとの距離の総和が最小 になるように更新する。 なお、 この更新は、 上述したように、 コードベクトル y iに分類された 0個以上の音声べクトルが指す点の重心を求めることによって 行うことができるから、 例えば、 いま、 更新後のコードベクトルを yi' と、 更 新前のコードべクトル y iに分類されている過去に入力された音声べク トルを X 2, · . ·, X M一 Lと、 コードべク トル y iに分類された今回の音声べクトルを X M-L+1, M-l+2, · ■ · , χΜと、 それぞれ表すと、 更新前のコードベクトル y iと、 更新後のコードベクトル は、 それぞれ式 (14) と式 (1 5) を計算する ことによって求めることができる。
y i= ( X !+ X 2+■ ■ - +xM_L)/(M- L)
• · · (14) i
Figure imgf000059_0001
· · ■ + XM-L+ XM-L+I+XM-L½+ ■ ■ ■ + x M)
• · - (1 5) ところで、 いまの場合、 過去に入力された音声ベクトル x2, ■ · ■, x M_Lは記憶されていない。 そこで、 式 (1 5) を次式にように変形する。
Υ i = ( X ι+ X 2+ ■ · ■ + X M-L+ X M-L+1 )
+ (xML+2+■ · ■ +xM) /M
= (Xl+x2+ . ■ ' +xM_L+xM_L+1)/(M-L) X (M-D/M
Figure imgf000059_0002
• · · (16) 式 (1 6) に、 式 (14) を代入すると次式が得られる。
Yi' =y iX (M-L)/M+(xM_L+2+ - · - +xM)/M
• · · (1 7) 式 ( 1 7) によれば、 今回入力された音声ベク トル xM-L+1, X M-L+2, ■ · · , χΜと、 既に得られているコードプックにおけるコードべクトル yiを用いること によって、 そのコードベクトル yiを更新し、 更新後のコードベクトル yiを求め ることができる。
この場合、 過去に入力された音声べクトルを記憶しておく必要がないので、 ユーザ用ベクトル記憶部 2 1 3の記憶容量が少なくて済む。 但し、 この場合、 ユーザ用べクトル記憶部 2 1 3には、 今回入力された音声べクトルの他、 いま までに各コードべクトル y iに分類された音声べクトルの総数を記憶させておく とともに、 コードベクトル y iの更新に伴って、 その更新後のコードベクトル y ' についても、 そのコードベク トル に分類された音声ベク トルの総数を更 新する必要がある。 さらに、 初期べクトル記憶部 2 1 4には、 不特定多数のュ 一ザの音声データを用いて構成された多数の音声べクトルではなく、 そのよう な多数の音声べクトルを用いて生成されたコードブックと各コードべクトルに 分類された音声べクトルの総数を記憶させておく必要がある。 図 2 2の学習部 1 2 5で、 初めて学習が行われる場合や、 ユーザ用べクトル記憶部 2 1 3がク リアされた直後等に学習が行われる場合おいては、 初期べク トル記憶部 2 1 4 に記憶されたコードプックを用いて、 そのコードブックの更新が行われること になる。
以上のように、 図 2 2の実施の形態における学習部 1 2 5でも、 新たに入力 された音声データと、 過去の学習に用いられた音声データに基づく図 2 3の学 習処理が、 通話時その他の任意のタイミングで行われ、 これにより、 ユーザが 発話を行うほど、 そのユーザに適したコードプック、 即ち、 そのユーザの音声 に対して量子化誤差を小さくするコードブックが求められる。 従って、 通話相 手側において、 そのようなコードプックを用いて、 符号化音声データの復号
(ここでは、 ベクトル逆量子化) を行うことにより、 やはり、 ユーザの音声の 特性に適した処理 (べクトル逆量子化処理) が施され、 従来の場合 (不特定多 数の話者の発話から求められたコードブックを用いる場合) に比較して、 十分 に音質を改善した復号音声データを得ることができることになる。
次に、 図 2 4は、 送信部 1 1 3 (図 3 ) の学習部 1 2 5が図 2 2に示したよ うに構成される場合の、 受信部 1 1 4 (図 4 ) の復号部 1 3 2の構成例を示し ている。
バッファ 2 2 1は、 受信制御部 1 3 1 (図 4 ) が出力する符号化音声データ (ここでは、 ベクトル量子化結果としてのコード) を一時記憶する。 ベク トル 逆量子化部 2 2 2は、 バッファ 2 2 1に記憶されたコードを読み出し、 コード ブック記憶部 2 2 3に記憶されたコードブックを参照することでベタ トル逆量 子化を行うことにより、 そのコードを、 音声ベク トルに復号し、 逆べク トル化 部 2 2 4に供給する。
コードブック記憶部 2 2 3は、 管理部 1 3 5が高品質化データとして供給す るコードブックを記憶する。
ここで、 送信部 1 1 3 (図 3 ) の学習部 1 2 5が図 2 2に示したように構成 される場合には、 高品質化データはコードプックであるから、 受信部 1 1 4 (図 4 ) の記憶部 1 3 6には、 コードブックが記憶される。 なお、 この場合、 受信部 1 1 4のデフォルトデータメモリ 1 3 7には、 例えば、 図 2 2の初期べ クトル記憶部 2 1 4に記憶された音声べク トルを用いて生成されたコードブッ クが、 デフォルトデータとして記憶される。
逆べク トル化部 2 2 4は、 ベタトル逆量子化部 2 2 2が出力する音声べクト ルを、 時系列の音声データに逆べクトル化して出力する。
次に、 図 2 5のフローチャートを参照して、 図 2 4の復号部 1 3 2の処理 (復号処理) について説明する。
バッファ 2 2 1は、 そこに供給される符号化音声データとしてのコードを順 次記憶する。
そして、 ベク トル逆量子化部 2 2 2は、 ステップ S 1 3 1において、 バッフ ァ 2 2 1に記憶されたコードのうち、 まだ読み出していない時間的に最も古い ものを、 注目コードとして読み出し、 ベクトル逆量子化する。 即ち、 ベクトル 逆量子化部 2 2 2は、 コードプック記憶部 2 2 3に記憶されたコードブックの コードべク トルのうち、 注目コードが対応付けられているものを検出し、 その コードべクトルを、 音声べク トルとして、 逆べク トル化部 2 2 4に出力する。 逆べク トノレ化部 2 2 4は、 ステップ S 1 3 2において、 ベタ トル逆量子化部 2 2からの音声べク トルを逆べク トル化することにより、 音声データに復号し て出力し、 ステップ S 1 3 3に進む。
ステップ S 1 3 3では、 ベタ トル逆量子化部 2 2 2が、 バッファ 2 2 1に、 注目コードとされていないコードが、 まだ記憶されているかどうかを判定する, ステップ S 1 3 3において、 ノ ッファ 2 2 1に、 注目コードとされていないコ ードが、 まだ記憶されていると判定された場合、 ステップ S 1 3 1に戻り、 ノ ッファ 2 2 1に記憶されたコードのうち、 まだ読み出していない時間的に最も 古いものを、 新たな注目コードとして、 以下、 同様の処理が繰り返される。
また、 ステップ S 1 3 3において、 バッファ 2 2 1に、 注目コードとされて いないコードが記憶されていないと判定された場合、 処理を終了する。
次に、 上述した一連の処理は、 ハードウェアにより行うこともできるし、 ソ フトウェアにより行うこともできる。 一連の処理をソフトウエアによって行う 場合には、 そのソフトウェアを構成するプログラムが、 汎用のコンピュータ等 にィンストーノレされる。
そこで、 図 2 6は、 上述した一連の処理を実行するプログラムがインス ト一 ルされるコンピュータの一実施の形態の構成例を示している。
プログラムは、 コンピュータに内蔵されている記録媒体としてのハードディ スク 4 0 5や R OM 4 0 3に予め記録しておくことができる。
あるいはまた、 プログラムは、 フレキシブルディスク、 CD- ROM (Compact Disc Read Only Memory; , MO (Magneto optical)アイスク, DVD (Digital Versatile Disc) , 磁気ディスク、 半導体メモリなどのリムーバブル記録媒体 4 1 1に、 一 時的あるいは永続的に格納 (記録) しておくことができる。 このようなリムー バブル記録媒体 4 1 1は、 いわゆるパッケージソフトウエアとして提供するこ とができる。
なお、 プログラムは、 上述したようなリムーバブル記録媒体 4 1 1からコン ピュータにインス トールする他、 ダウンロードサイ トから、 ディジタル衛星放 送用の人工衛星を介して、 コンピュータに無線で転送したり、 LAN (Local Area Network)、 インターネットといったネットワークを介して、 コンピュータに有 線で転送し、 コンピュータでは、 そのようにして転送されてくるプログラムを、 通信部 4 0 8で受信し、 内蔵するハードディスク 4 0 5にインストールするこ とができる。
コンピュータは、 CPU (Central Processing Unit) 4 0 2を内蔵している。 CPU 4 0 2には、 バス 4 0 1を介して、 入出力ィンタフェース 4 1 0が接続されて おり、 CPU 4 0 2は、 入出力インタフェース 4 1 0を介して、 ユーザによって、 キーボードや、 マウス、 マイク等で構成される入力部 4 0 7が操作等されるこ とにより指令が入力されると、 それにしたがって、 ROM (Read Only Memory) 4 0 3に格納されているプログラムを実行する。 あるいは、 また、 CPU 4 0 2は、 ノヽ 一ドディスク 4 0 5に格納されているプログラム、 衛星若しくはネットワーク から転送され、 通信部 4 0 8で受信されてハードディスク 4 0 5にィンストー ルされたプログラム、 またはドライブ 4 0 9に装着されたリムーバブル記録媒 体 4 1 1から読み出されてハードディスク 4 0 5にィンストールされたプログ ラムを、 RAM ORandom Access Memory) 4 ◦ 4にロードして実行する。 これにより- CPU 4 0 2は、 上述したフローチャートにしたがった処理、 あるいは上述したブ ロック図の構成により行われる処理を行う。 そして、 CPU 4 0 2は、 その処理結 果を、 必要に応じて、 例えば、 入出力インタフェース 4 1 0を介して、 LCD (Liq uid Crystal Display)やスピーカ等で構成される出力部 4 0 6から出力、 ある いは、 通信部 4 0 8から送信、 さらには、 ハードディスク 4 0 5に記録等させ る。
ここで、 本明細書において、 コンピュータに各種の処理を行わせるためのプ ログラムを記述する処理ステップは、 必ずしもフローチヤ一トとして記載され た順序に沿って時系列に処理する必要はなく、 並列的あるいは個別に実行され る処理 (例えば、 並列処理あるいはオブジェクトによる処理) も含むものであ る。 また、 プログラムは、 1のコンピュータにより処理されるものであっても良 いし、 複数のコンピュータによって分散処理されるものであっても良い。 さら に、 プログラムは、 遠方のコンピュータに転送されて実行されるものであって も良い。
なお、 本実施の形態では、 着信側において、 着呼時に、 発信側から送信され てくる電話番号を、 発信側を特定する特定情報とするようにしたが、 その他、 例えば、 ユーザ等に、 ユニークな ID (IdenUfication)を割り当てておき、 その IDを、 特定情報として用いることも可能である。
また、 本実施の形態では、 本発明を、 携帯電話機どうしで音声通話を行う伝 送システムに適用した場合について説明したが、 本発明は、 その他、 音声通信 を行うシステムに広く適用可能である。
さらに、 図 4の実施の形態において、 記憶部 1 3 6とデフォルトメモリ 1 3 7は、 書き換え可能な 1つのメモリで構成することが可能である。
また、 高品質化データは、 携帯電話機 1 0 から、 図示せぬサーバにァ ップロードしておき、 携帯電話機 1 0 1 2において、 そのサーバから、 必要 に応じてダウンロードするようにすること等が可能である。 産業上の利用可能性
本発明の送信装置および送信方法、 並びに第 1のプログラムによれば、 音声 データが符号化され、 符号化音声データが出力される。 一方、 符号化音声デー タを受信する受信側において出力される音声の品質を向上させる高品質化デー タの学習が、 過去の学習に用いられた音声データと、 新たに入力された音声デ ータとに基づいて行われ、 符号化音声データと高品質化データとが送信される, 従って、 受信側において、 高品質の音声を復号することが可能となる。
本発明の受信装置及び受信方法、 並びに第 1のプログラムによれば、 符号化 音声データが受信され、 その符号化音声データを送信してきた送信側の特定情 報と対応付けられている高品質化データが選択される。 そして、 その選択され た高品質化データに基づいて、 受信された符号化音声データが復号される。 従 つて、 高品質の音声を復号することが可能となる。
本発明の送受信装置によれば、 入力された音声データが符号化され、 符号化 音声データが出力される。 そして、 符号化音声データを受信する他の送受信装 置において出力される音声の品質を向上させる高品質化データの学習が、 過去 の学習に用いられた音声データと、 新たに入力された音声データとに基づいて 行われ、 符号化音声データと高品質化データとが送信される。 一方、 他の送受 信装置から送信されてくる符号化音声データが受信され、 その符号化音声デー タを送信してきた他の送受信装置の特定情報と対応付けられている高品質化デ ータが選択される。 そして、 その選択された高品質化データに基づいて、 受信 された符号化音声データが復号される。 従って、 高品質の音声を復号すること が可能となる。

Claims

請求の範囲
1 . 入力された音声データを送信する送信装置であって、
前記音声データを符号化し、 符号化音声データを出力する符号化手段と、 前記符号化音声データを受信する受信側において出力される音声の品質を向 上させる高品質化データの学習を、 過去の学習に用いられた音声データと、 新 たに入力された音声データとに基づいて行う学習手段と、
前記符号化音声データと前記高品質化データとを送信する送信手段と を備えることを特徴とする送信装置。
2 . 前記高品質化データの送信を管理する管理手段をさらに備える
ことを特徴とする請求の範囲第 1項に記載の送信装置。
3 . 前記管理手段は、 前記送信装置と前記受信側との間で通信リンクを確立 した後に、 最新の前記高品質化データが送信されるように、 前記高品質化デー タの送信を管理する
ことを特徴とする請求の範囲第 1項に記載の送信装置。
4 . 前記管理手段は、 前記送信装置と前記受信側との間で通信リンクを確立 した後、 前記受信側から、 高品質化データの要求があった場合に、 最新の前記 高品質化データが送信されるように、 前記高品質化データの送信を管理する ことを特徴とする請求の範囲第 2項に記載の送信装置。
5 . 前記受信側への高品質化データの送信履歴を記憶する履歴記憶手段をさ らに備え、 .
前記管理手段は、
前記送信履歴に基づいて、 前記送信側への最新の前記高品質化データの送信 が済んでいるかを判定し、
前記送信側への最新の前記高品質化データの送信が済んでいない場合に、 そ の最新の前記高品質化データが送信されるように、 前記高品質化データの送信 を管理する
ことを特徴とする請求の範囲第 1項に記載の送信装置。
6 . 前記学習手段は、 前記符号化音声データを復号した復号音声データを高 品質化した高品質音声データの予測値を求める予測演算を行うために、 前記復 号音声データとともに用いるタップ係数を、 前記高品質化データとして求める 学習を行う
ことを特徴とする請求の範囲第 1項に記載の送信装置。
7 . 前記学習手段は、
前記音声データを第 1のデータとして、 前記第 1のデータから前記第 1のデ ータよりもクオリティの低い第 2のデータを生成する低クオリティデータ生成 手段と、
前記タップ係数および前記第 2のデータを用いて予測演算を行うことにより 得られる前記第 1のデータの予測値と前記第 1のデータとの予測誤差を、 統計 的に最小にする前記タップ係数を演算する演算手段と
を有する
ことを特徵とする請求の範囲第 6項に記載の送信装置。
8 . 前記低クオリティデータ生成手段は、 前記第 1のデータを前記符号化音 声データに符号化し、 さらに、 その符号化音声データを復号して得られる復号 音声データを、 前記第 2のデータとして生成する
ことを特徴とする請求の範囲第 7項に記載の送信装置。
9 . 前記学習手段は、
注目している前記第 1のデータである注目第 1のデータをクラス分けするク ラス分類を行うのに用いるクラスタツプを生成するクラスタツプ生成手段と、 前記クラスタップに基づいて、 前記注目第 1のデータをクラス分類し、 その クラスを表すクラスを求めるクラス分類手段と
をさらに有し、
前記演算手段は、 前記クラスごとに、 前記タップ係数を求める
ことを特徴とする請求の範囲第 7項に記載の送信装置。
1 0 . コードブックを記憶するコードブック記憶手段をさらに備え、 前記符号化手段は、 前記音声データを、 前記コードブック記憶手段に記憶さ れている所定のコードプックに基づいてベタトル量子化し、 その結果得られる コードを、 前記符号化音声データとして出力する
ことを特徴とする請求の範囲第 1項に記載の送信装置。
1 1 . 前記学習手段は、 新たな前記コードブックを、 前記高品質化データと レて求める学習を行う
ことを特徴とする請求の範囲第 1 0項に記載の送信装置。
1 2 . 入力された音声データを送信する送信方法であって、
前記音声データを符号化し、 符号化音声データを出力する符号化ステップと 前記符号化音声データを受信する受信側において出力される音声の品質を向 上させる高品質化データの学習を、 過去の学習に用いられた音声データと、 新 たに入力された音声データとに基づいて行う学習ステップと、
前記符号化音声データと前記高品質化データとを送信する送信ステップと を備えることを特徴とする送信方法。
1 3 . 入力された音声データを送信する送信処理を、 コンピュータに行わせ るプログラムであって、
前記音声データを符号化し、 符号化音声データを出力する符号化ステップと 前記符号化音声データを受信する受信側において出力される音声の品質を向 上させる高品質化データの学習を、 過去の学習に用いられた音声データと、 新 たに入力された音声データとに基づいて行う学習ステップと、
前記符号化音声データと前記高品質化データとを送信する送信ステップと を備えることを特徴とするプログラム。
1 4 . 入力された音声データを送信する送信処理を、 コンピュータに行わせ るプログラムが記録されている記録媒体であって、
前記音声データを符号化し、 符号化音声データを出力する符号化ステップと 前記符号化音声データを受信する受信側において出力される音声の品質を向 上させる高品質化データの学習を、 過去の学習に用いられた音声データと、 新 たに入力された音声データとに基づいて行う学習ステップと、 前記符号化音声データと前記高品質化データとを送信する送信ステップと を備えるプログラムが記録されている
ことを特徴とする記録媒体。
1 5 . 音声データを符号化した符号化音声データを受信する受信装置であつ て、
前記符号化音声データを受信する受信手段と、
前記符号化音声データを復号した復号音声データの品質を向上させる高品質 化データを、 前記符号化音声データを送信してくる送信側を特定する特定情報 とともに記憶する記憶手段と、
前記符号化音声データを送信してきた送信側の特定情報と対応付けられてい る前記高品質化データを選択する選択手段と、
前記選択手段において選択された前記高品質化データに基づいて、 前記受信 手段において受信された符号化音声データを復号する復号手段と
を備えることを特徴とする受信装置。
1 6 . 前記記憶手段は、 デフォルトの高品質化データをあらかじめ記憶して いる
ことを特徴とする請求の範囲第 1 5項に記載の受信装置。
1 7 . 前記特定情報に基づいて、 前記符号化音声データを送信してくる前記 送信側に対応する前記高品質化データが前記記憶手段に記憶されているかを判 定する判定手段をさらに備え、
前記判定手段において、 前記送信側に対応する前記高品質化データが前記記 憶手段に記憶されていないと判定された際に、 前記選択手段は、 前記デフオル トの高品質化データを選択する
ことを特徴とする請求の範囲第 1 6項に記載の受信装置。
1 8 . 前記受信手段は、 前記送信側から送信されてくる前記高品質化データ も受信し、 前記受信手段において受信された前記高品質化データによる、 前記記憶手段 の記憶内容の更新を管理する管理手段をさらに備える
ことを特徴とする請求の範囲第 1 5項に記載の受信装置。
1 9 . 前記管理手段は、 前記受信装置と前記送信側との間で通信リンクを確 立した後に、 前記送信側から送信されてくる最新の前記高品質化データによつ て、 前記記憶手段の記憶内容を更新する
ことを特徴とする請求の範囲第 1 8項に記載の受信装置。
2 0 . 前記送信側にデータを送信する送信手段をさらに備え、
前記管理手段は、
前記受信装置と前記送信側との間で通信リンクを確立した後、 前記送信側に 対して、 高品質化データの送信を要求する高品質化データ送信要求を前記送信 手段で送信し、
前記高品質化データ送信要求に応じて、 前記送信側から送信されてくる最新 の前記高品質化データによって、 前記記憶手段の記憶内容を更新する
ことを特徴とする請求の範囲第 1 9項に記載の受信装置。
2 1 . 前記管理手段は、
前記記憶手段に最新の前記高品質化データが記憶されているかを判定し、 前記記憶手段に最新の前記高品質化データが記憶されていない場合に、 前記 送信側から送信されてくる最新の前記高品質化データによって、 前記記憶手段 の記憶内容を更新する
ことを特徴とする請求の範囲第 1 8項に記載の受信装置。
2 2 . 前記記憶手段には、 前記高品質化データに対する更新情報がさらに 記憶されており、
前記管理手段は、 前記記憶手段の前記更新情報に基づいて、 最新の前記高 品質化データが記憶されているかを判定する
ことを特徴とする請求の範囲第 2 1項に記載の受信装置。
2 3 . 前記更新情報は、 前記高品質化データを得た日時である ことを特徴とする請求の範囲第 2 2項に記載の受信装置。
2 4 . 前記送信側から送信されてくる最新の前記高品質化データによって. 前記記憶手段の記憶内容の更新を行うことを禁止するように設定する更新禁 止設定手段をさらに備える
ことを特徴とする請求の範囲第 2 1項に記載の受信装置。
2 5 . 前記送信側は、 電話機であり、
前記送信側の特定情報は、 その送信側の電話機の電話番号である
ことを特徴とする請求の範囲第 1 5項に記載の受信装置。
2 6 . 前記高品質化データは、 前記符号化音声データを復号した復号音声デ ータを高品質化した高品質音声データの予測値を求める予測演算を行う際に、 前記復号音声データとともに用いるタップ係数であり、
前記復号手段は、
前記符号化音声データを復号し、 復号音声データを出力する処理を行う第 1 の処理手段と、
前記復号音声データおよびタップ係数を用いて予測演算を行うことにより、 前記高品質音声データの予測値を求める処理を行う第 2の処理手段と
を有する
ことを特徴とする請求の範囲第 1 5項に記載の受信装置。
2 7 . 前記タップ係数は、
前記高品質音声データを、 第 1のデータとして、 前記第 1のデータから、 前 記第 1のデータよりもクオリティの低い第 2のデータを生成し、
前記タップ係数および前記第 2のデータを用いて予測演算を行うことにより 得られる前記第 1のデータの予測値と前記第 1のデータとの予測誤差を、 統計 的に最小にする前記タップ係数を演算することにより求められたものである ことを特徴とする請求の範囲第 2 6項に記載の受信装置。
2 8 . 前記第 2のデータは、 前記第 1のデータを前記符号化音声データに符 号化し、 さらに、 その符号化音声データを復号して得られる復号音声データで ある
ことを特徴とする請求の範囲第 2 7項に記載の受信装置。
2 9 . 前記タップ係数は、 所定のクラスごとにクラス分けされており、 前記第 2の処理手段は、
前記予測値を求めようとする前記高品質音声データを注目データとして、 そ の注目データをクラス分けするクラス分類を行うのに用いるクラスタップを生 成するクラスタツプ生成手段と、
前記クラスタップに基づいて、 前記注目データをクラス分類し、 そのクラス を表すクラスを求めるクラス分類手段と、
前記注目データのクラスに対応する前記タップ係数と、 前記復号音声データ とを用いて予測演算を行うことにより、 前記注目データの予測値を求める予測 手段と
を有する
ことを特徴とする請求の範囲第 2 6項に記載の受信装置。
3 0 . 前記符号化音声データは、 前記音声データをベク トル量子化して得ら れるコ一ドであり、
前記高品質化データは、 前記コードをべクトル逆量子化するのに用いられる コードブックであり、
前記復号手段は、 前記コードブックに基づいて、 前記コードをべクトル逆量 子化することにより、 前記符号化音声データを復号する
ことを特徴とする請求の範囲第 1 5項に記載の受信装置。
3 1 . 音声データを符号化した符号化音声データを受信する受信方法であつ て、
前記符号化音声データを受信する受信ステップと、
前記符号化音声データを復号した復号音声データの品質を向上させる高品質 化データを、 前記符号化音声データを送信してくる送信側を特定する特定情報 とともに記憶する記憶 前記符号化音声データを送信してきた送信側の特定情報と対応付けられてい る前記高品質化データを選択する選択ステップと、
前記選択ステップにおいて選択された前記高品質化データに基づいて、 前記 受信ステップにおいて受信された符号化音声データを復号する復号ステップと を備えることを特徴とする受信方法。
3 2 . 音声データを符号化した符号化音声データを受信する受信処理を、 コ ンピュータに行わせるプログラムであって、
前記符号化音声データを受信する受信ステップと、
前記符号化音声データを復号した復号音声データの品質を向上させる高品質 化データを、 前記符号化音声データを送信してくる送信側を特定する特定情報 とともに記憶する記憶ステツプと、
前記符号化音声データを送信してきた送信側の特定情報と対応付けられてい る前記高品質化データを選択する選択ステップと、
前記選択ステップにおいて選択された前記高品質化データに基づいて、 前記 受信ステップにおいて受信された符号化音声データを復号する復号ステツプと を備えることを特徴とするプログラム。
3 3 . 音声データを符号化した符号化音声データを受信する受信処理'を、 コ ンピュータに行わせるプログラムが記録されている記録媒体であって、 前記符号化音声データを受信する受信ステップと、
前記符号化音声データを復号した復号音声データの品質を向上させる高品質 化データを、 前記符号化音声データを送信してくる送信側を特定する特定情報 とともに記憶する記憶ステップと、
前記符号化音声データを送信してきた送信側の特定情報と対応付けられてい る前記高品質化データを選択する選択ステツプと、
前記選択ステップにおいて選択された前記高品質化データに基づいて、 前記 受信ステップにおいて受信された符号化音声データを復号する復号ステツプと を備えるプログラムが記録されている ことを特徴とする記録媒体。
3 4 . 送信装置と受信装置とから構成される送受信装置であって、
前記送信装置は、
入力された音声データを符号化し、 符号化音声データを出力する符号化手段 と、
前記符号化音声データを受信する他の送受信装置において出力される音声の 品質を向上させる高品質化データの学習を、 過去の学習に用いられた音声デー タと、 新たに入力された音声データとに基づいて行う学習手段と、
前記符号化音声データと前記高品質化データとを送信する送信手段と を備え、
前記受信装置は、
前記他の送受信装置から送信されてくる符号化音声データを受信する受信手 段と、
前記高品質化データを、 前記符号化音声データを送信してくる前記他の送受 信装置を特定する特定情報とともに記憶する記憶手段と、
前記符号化音声データを送信してきた前記他の送受信装置の特定情報と対応 付けられている前記高品質化データを選択する選択手段と、
前記選択手段において選択された前記高品質化データに基づいて、 前記受信 手段において受信された前記符号化音声データを復号する復号手段と
を備える
ことを特徴とする送受信装置。
PCT/JP2002/006179 2001-06-26 2002-06-20 Transmission apparatus, transmission method, reception apparatus, reception method, and transmission/reception apparatus WO2003001709A1 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
EP02743668A EP1401130A4 (en) 2001-06-26 2002-06-20 TRANSMISSION DEVICE, TRANSMISSION METHOD, RECEIVING DEVICE, RECEPTION METHOD AND TRANSMISSION OR TRANSMISSION. RECEPTION DEVICE
CN028026632A CN1465149B (zh) 2001-06-26 2002-06-20 发送设备及方法、接收设备及方法和发送/接收设备
KR1020037002805A KR100895745B1 (ko) 2001-06-26 2002-06-20 송신 장치 및 송신 방법, 수신 장치 및 수신 방법, 및송수신 장치
US10/362,582 US7366660B2 (en) 2001-06-26 2002-06-20 Transmission apparatus, transmission method, reception apparatus, reception method, and transmission/reception apparatus

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2001-192379 2001-06-26
JP2001192379A JP4711099B2 (ja) 2001-06-26 2001-06-26 送信装置および送信方法、送受信装置および送受信方法、並びにプログラムおよび記録媒体

Publications (1)

Publication Number Publication Date
WO2003001709A1 true WO2003001709A1 (en) 2003-01-03

Family

ID=19030838

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2002/006179 WO2003001709A1 (en) 2001-06-26 2002-06-20 Transmission apparatus, transmission method, reception apparatus, reception method, and transmission/reception apparatus

Country Status (6)

Country Link
US (1) US7366660B2 (ja)
EP (1) EP1401130A4 (ja)
JP (1) JP4711099B2 (ja)
KR (1) KR100895745B1 (ja)
CN (1) CN1465149B (ja)
WO (1) WO2003001709A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10240899A1 (de) * 2002-09-04 2004-03-18 Siemens Ag Teilnehmerseitige Geräteanordnung für Datenübermittlungsdienste und zugehörige Komponenten
US20050053127A1 (en) * 2003-07-09 2005-03-10 Muh-Tian Shiue Equalizing device and method
US7756051B2 (en) * 2004-07-02 2010-07-13 Microsoft Corporation Content distribution using network coding
US8140849B2 (en) * 2004-07-02 2012-03-20 Microsoft Corporation Security for network coding file distribution
US20070033009A1 (en) * 2005-08-05 2007-02-08 Samsung Electronics Co., Ltd. Apparatus and method for modulating voice in portable terminal
US7970395B2 (en) * 2005-11-21 2011-06-28 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for improving call quality
JP4437486B2 (ja) * 2006-10-10 2010-03-24 ソニー・エリクソン・モバイルコミュニケーションズ株式会社 音声通信装置、音声通信システム、音声通信制御方法、及び音声通信制御プログラム
KR101394152B1 (ko) * 2007-04-10 2014-05-14 삼성전자주식회사 모바일 단말의 콘텐츠 다운로드 방법, 장치 및 시스템
JP4735610B2 (ja) * 2007-06-26 2011-07-27 ソニー株式会社 受信装置及び方法、プログラム、並びに記録媒体
CN102025454B (zh) * 2009-09-18 2013-04-17 富士通株式会社 预编码矩阵码本的生成方法及装置
CN110503965B (zh) * 2019-08-29 2021-09-14 珠海格力电器股份有限公司 一种调制解调器语音编解码器的选择方法和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10105197A (ja) * 1996-09-30 1998-04-24 Matsushita Electric Ind Co Ltd 音声符号化装置
JPH10243406A (ja) * 1996-12-26 1998-09-11 Sony Corp 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに記録媒体
JP2000132196A (ja) * 1998-10-23 2000-05-12 Toshiba Corp ディジタル携帯電話及びデータ通信方法
JP2002123299A (ja) * 2000-08-09 2002-04-26 Sony Corp 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1009428B (zh) * 1988-05-10 1990-09-05 中国人民解放军空军总医院 微型电脑中频治疗仪
JP3183944B2 (ja) * 1992-04-24 2001-07-09 オリンパス光学工業株式会社 音声符号化装置
US5432883A (en) * 1992-04-24 1995-07-11 Olympus Optical Co., Ltd. Voice coding apparatus with synthesized speech LPC code book
AU675322B2 (en) 1993-04-29 1997-01-30 Unisearch Limited Use of an auditory model to improve quality or lower the bit rate of speech synthesis systems
US5819213A (en) * 1996-01-31 1998-10-06 Kabushiki Kaisha Toshiba Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks
US5883891A (en) 1996-04-30 1999-03-16 Williams; Wyatt Method and apparatus for increased quality of voice transmission over the internet
CN1163076C (zh) 1996-12-26 2004-08-18 索尼株式会社 图像编码装置和图像编码方法及图像解码装置和图像解码方法
US6160845A (en) 1996-12-26 2000-12-12 Sony Corporation Picture encoding device, picture encoding method, picture decoding device, picture decoding method, and recording medium
US6202046B1 (en) * 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
JP3557426B2 (ja) 1997-11-19 2004-08-25 株式会社三技協 移動体通信ネットワークの通話品質監視装置
AU4141400A (en) * 1999-04-29 2000-11-17 Gil Israeli Information retrieval system
JP4218134B2 (ja) * 1999-06-17 2009-02-04 ソニー株式会社 復号装置及び方法、並びにプログラム提供媒体
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
KR100819623B1 (ko) 2000-08-09 2008-04-04 소니 가부시끼 가이샤 음성 데이터의 처리 장치 및 처리 방법
US6650762B2 (en) * 2001-05-31 2003-11-18 Southern Methodist University Types-based, lossy data embedding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10105197A (ja) * 1996-09-30 1998-04-24 Matsushita Electric Ind Co Ltd 音声符号化装置
JPH10243406A (ja) * 1996-12-26 1998-09-11 Sony Corp 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに記録媒体
JP2000132196A (ja) * 1998-10-23 2000-05-12 Toshiba Corp ディジタル携帯電話及びデータ通信方法
JP2002123299A (ja) * 2000-08-09 2002-04-26 Sony Corp 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1401130A4 *

Also Published As

Publication number Publication date
US7366660B2 (en) 2008-04-29
JP2003005795A (ja) 2003-01-08
EP1401130A1 (en) 2004-03-24
US20040024589A1 (en) 2004-02-05
KR100895745B1 (ko) 2009-04-30
JP4711099B2 (ja) 2011-06-29
CN1465149A (zh) 2003-12-31
KR20030046419A (ko) 2003-06-12
CN1465149B (zh) 2010-05-26
EP1401130A4 (en) 2007-04-25

Similar Documents

Publication Publication Date Title
US7688922B2 (en) Transmitting apparatus and transmitting method, receiving apparatus and receiving method, transceiver apparatus, communication apparatus and method, recording medium, and program
AU2006286177C1 (en) Single-codebook vector quantization for multiple-rate applications
WO2003001709A1 (en) Transmission apparatus, transmission method, reception apparatus, reception method, and transmission/reception apparatus
US7587312B2 (en) Method and apparatus for pitch modulation and gender identification of a voice signal
JP4857468B2 (ja) データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
KR101243568B1 (ko) 무선 전화기 네트워크의 음성 채널을 통한 데이터 전송을 위한 시스템, 방법 및 장치
WO2002013183A1 (fr) Procede et dispositif de traitement de donnees vocales
KR100875783B1 (ko) 데이터 처리 장치
JP3362534B2 (ja) ベクトル量子化による符号化復号方式
JPH08179800A (ja) 音声符号化装置
JP4736266B2 (ja) 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
JP4517262B2 (ja) 音声処理装置および音声処理方法、学習装置および学習方法、並びに記録媒体
Anselam et al. Quality Enhancement of Low Bit Rate Speech Coder with Nonlinear Prediction
JP2002062899A (ja) データ処理装置およびデータ処理方法、学習装置および学習方法、並びに記録媒体
Heise et al. Audio re-synthesis based on waveform lookup tables
JPH11352999A (ja) 音声圧縮符号化装置

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CN KR US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR

WWE Wipo information: entry into national phase

Ref document number: 2002743668

Country of ref document: EP

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 1020037002805

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 028026632

Country of ref document: CN

WWP Wipo information: published in national office

Ref document number: 1020037002805

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 10362582

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 2002743668

Country of ref document: EP