JPH08123484A

JPH08123484A - 信号合成方法および信号合成装置

Info

Publication number: JPH08123484A
Application number: JP6265324A
Authority: JP
Inventors: Yoshihisa Nakato; 良久中藤; Mineo Tsushima; 峰生津島; Takeshi Norimatsu; 武志則松
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1994-10-28
Filing date: 1994-10-28
Publication date: 1996-05-17
Anticipated expiration: 2016-07-16
Also published as: JP3189598B2

Abstract

(57)【要約】【目的】帯域制限された入力信号を、入力信号の持つ
周波数帯域を包含する広い周波数帯域を有する広帯域信
号に変換することで高音質な信号を合成する信号合成装
置を提供する。【構成】帯域制限された入力信号を音響分析してスペ
クトル情報を抽出する音響分析器１０１と、学習データ
から狭帯域スペクトル情報を抽出する狭帯域データ処理
器１０２と、学習データから広帯域スペクトル情報を抽
出する広帯域データ処理器１０３と、狭帯域スペクトル
情報と広帯域スペクトル情報から写像関数を推定する写
像関数推定器１０４と、入力信号のスペクトル情報を写
像関数で広帯域化して広帯域化スペクトル情報に変換す
る広帯域化器１０５と、広帯域化スペクトル情報から入
力信号の周波数帯域を包含する広い周波数帯域を有する
広帯域信号を合成する信号合成器１０６とを備えた構成
を有する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、ある周波数帯域に帯域
制限された入力信号を、入力信号の持つ周波数帯域を包
含するような広い周波数帯域を有する広帯域信号に変換
することで高音質な信号を合成する信号合成方法および
装置に関する。

【０００２】

【従来の技術】アナログ電話による通信の大部分は、Ｎ
ＴＴの管轄する公衆回線網を通して行われているが、回
線の物理的な制約により３００Ｈｚから３.４ｋＨｚに
帯域制限されており、３００Ｈｚ以下の低域部分と３.
４ｋＨｚ以上の高域部分が失われることによる音質劣化
が起こる。そこで回線はそのままで、アナログ電話音声
のみを高品質化する技術が切望されており、最近この問
題に関する研究が最近始まりつつある。

【０００３】例えば、Y.Cheng、D.O'Shaughnessy、P.Me
rmelctein："Statical Recovery ofWide-band Speech f
rom Narrowband Speech",Proc. ICSLP,pp.1577-1580,
（1992）.による方法である。この方法は、狭帯域音声
のスペクトルから広帯域な音声スペクトルを直接的に推
定する方法であるが、処理量が多いため実用化は困難で
あると考えられる。

【０００４】また、吉田、阿部：“コードブックマッピ
ングによる狭帯域音声から広帯域音声の復元法”,音響
学会講演論文集,１−８−１８,pp.179-180,（1993.3）.
がある。この方法は狭帯域音声と広帯域音声のコードブ
ックの対応付けを基本にしており、ＶＱして得られた電
話音声のコードに対する広帯域コードを広帯域コードブ
ックから引き出すことで間接的に広帯域スペクトルを求
め、さらにピッチでＬＰＣ合成することにより広帯域音
声を得ているため、ベクトル量子化歪による合成音の劣
化が大きく、また処理量も比較的多い。

【０００５】

【発明が解決しようとする課題】上記したように、上述
した高品質化技術のうち、前者の方法では、処理量が大
きいため実用化は困難であると考えられる。また、後者
の方法では、ベクトル量子化歪による合成音の劣化が大
きく、また処理量も比較的多い。

【０００６】本発明は、上記の課題を解決するもので、
ある周波数帯域に帯域制限された入力信号を、入力信号
の持つ周波数帯域を包含するような広い周波数帯域を有
する広帯域信号に変換し、合成することにより、通信回
線により帯域制限されたアナログ電話や帯域制限された
携帯電話の帯域を広げ、通話品質を向上させることを可
能にする信号合成方法および装置を提供することを目的
とする。

【０００７】また、本発明は、あらかじめ多量の学習用
データから狭帯域スペクトル情報を広帯域スペクトル情
報に変換する写像関数を推定しておき、これにより入力
音声のスペクトル包絡情報を広帯域化スペクトル情報へ
と直接的に変換することにより、高音質な信号が得られ
る、高性能でしかも簡単な構成による信号合成方法およ
び装置を提供することを目的とする。

【０００８】

【課題を解決するための手段】上記目的を達成するため
に、本発明の信号合成方法は、特定の周波数帯域に帯域
制限された入力信号を、前記入力信号の周波数帯域を包
含する広い周波数帯域を有する広帯域信号に変換する信
号合成方法であって、あらかじめ多量の学習用データか
ら前記入力信号と同じ周波数帯域の狭帯域信号を作成
し、前記狭帯域信号を音響分析により狭帯域スペクトル
情報を抽出し、また前記多量の学習用データから前記入
力信号の周波数帯域を包含する広い周波数帯域を有する
広帯域信号を作成し、前記広帯域信号を音響分析により
広帯域スペクトル情報を抽出し、前記狭帯域スペクトル
情報と前記広帯域スペクトル情報との関係を写像関数と
して推定しておき、前記入力信号をフレーム毎に音響分
析することにより入力スペクトル情報を抽出し、前記入
力スペクトル情報を前記写像関数により広帯域化した広
帯域化スペクトル情報を算出し、前記算出後の広帯域化
スペクトル情報から前記入力信号の周波数帯域を包含す
る広い周波数帯域を有する広帯域信号を合成することを
特徴とするものである。

【０００９】また、上記目的を達成するために、本発明
の信号合成装置は、ある特定の周波数帯域に制限された
入力信号をフレーム毎に音響分析することによりスペク
トル情報を抽出する音響分析器と、あらかじめ多量の学
習用データから前記入力信号と同じ周波数帯域の狭帯域
信号を作成し、前記狭帯域信号を前記音響分析器により
音響分析して狭帯域スペクトル情報を抽出する狭帯域デ
ータ処理器と、また前記多量の学習用データから前記入
力信号の周波数帯域を包含する広い周波数帯域を有する
広帯域信号を作成し、前記広帯域信号を前記音響分析器
により音響分析して広帯域スペクトル情報を抽出する広
帯域データ処理器と、前記狭帯域スペクトル情報と前記
広帯域スペクトル情報との関係を写像関数として推定す
る写像関数推定器と、前記入力信号のスペクトル情報を
前記写像関数推定器で推定した写像関数により広帯域化
した広帯域化スペクトル情報を算出する広帯域化器と、
前記算出後の広帯域化スペクトル情報から前記入力信号
の周波数帯域を包含する広い周波数帯域を有する広帯域
信号を合成する信号合成器を備えたものである。

【００１０】

【作用】本発明は、上記した構成により、ある周波数帯
域に帯域制限された入力信号を、入力信号の持つ周波数
帯域を包含する広い周波数帯域を有する広帯域信号に変
換するため、あらかじめ多量の学習用データから狭帯域
スペクトル情報を広帯域スペクトル情報へと変換する写
像関数を推定しておき、これにより入力音声のスペクト
ル包絡情報を広帯域化スペクトル情報へと変換している
ので、高音質な信号が得られ、しかも高性能で簡単な構
成による帯域制限された信号の広帯域化が可能となる。

【００１１】

【実施例】携帯電話をはじめとする通信端末の高度化が
進み、その際通話品質の議論が盛んになされている。電
話は多くの人にとって、なくてはならない重要な通信手
段であり、その品質を向上させることは非常に重要な研
究課題である。

【００１２】本発明の信号合成方法および装置は、回線
特性のため劣化したアナログ電話音声を広帯域化するこ
とによる高音質化のみならず、ビットレートの制限のた
めに帯域制限されたディジタル信号の広帯域化をも実現
する信号合成方法および信号合成装置である。たとえ
ば、携帯電話をはじめとするディジタル無線電話では、
アナログ電話に比較して０.３〜３.４ｋＨｚの電話帯域
音声の品質はある程度保持できるものの、ビットレート
の制限のため３.４ｋＨｚ以上の高域部分は伝達されな
いという原理的な制約がある。本発明は、この帯域制限
された信号をもとの広帯域な信号に戻すための方法と装
置を提供するものである。以下、帯域制限された音声を
広帯域化する本発明の第１の実施例について説明する。

【００１３】図１は本発明の第１の実施例の全体構成を
示すブロック構成図である。図１において、１０１は信
号をフレーム毎に音響分析してスペクトル情報を抽出す
る音響分析器で、例えばフレーム毎にＰＳＥ分析して得
られるケプストラム係数を算出する。また、フレーム毎
にケプストラム分析して得られるケプストラム係数や、
或いはフレーム毎にウェーブレット変換して得られる係
数などを用いても、信号の周波数軸上の特性を表現して
いる特徴量であることには代わりないので、使用しても
何等差し支えない。また、これらの係数を求める方法は
すでに公知であり、例えば、ＰＳＥ分析に関しては、中
島、鈴木：“パワースペクトル包絡（ＰＳＥ）音声分析
・合成系”,日本音響学会誌,４４巻、１１号,pp.824-83
2,（1988）に詳しく記載されており、またケプストラム
分析に関しては、L.R.RabinerとR.W.Schaferの共著、鈴
木久喜訳の、”音声のディジタル信号処理（上）
（下）”、コロナ社、に記載されている。ウェーブレッ
ト変換に関しては、河原：“ウェーブレット解析の聴覚
研究への応用”,日本音響学会誌,４７巻、６号,pp.424-
429,（1991）、に記載されている。

【００１４】１０２は、あらかじめ多量の学習用データ
からフィルタ処理により狭帯域信号を作成し、音響分析
器１０１により狭帯域スペクトル情報を抽出する狭帯域
データ処理器である。ここで言うフィルタ処理とは、広
帯域化しようとしている入力音声が何らかの帯域制限を
受けた際の伝送特性やフィルタ等に相当するフィルタ特
性を学習データに与えるための処理のことである。

【００１５】１０３は、学習用データから理想的なスペ
クトル特性を持つ広帯域スペクトル情報を抽出するため
の広帯域データ処理器である。学習用データとしては例
えば、ある標準話者１名の様々に発声した音声を用いて
もよいし、さらに、複数の話者のデータを用いること
で、話者の発声の変動に強い写像関数を作成する時に有
用である。

【００１６】１０４は、狭帯域スペクトル情報と広帯域
スペクトル情報との関係を写像関数として推定する写像
関数推定器であり、推定する写像関数として、本実施例
では線形写像によるスペクトル変換を行う。さらに、線
形写像以外に２次変換や、ニューラルネットワークなど
の非線形変換を用いても、狭帯域スペクトルから広帯域
スペクトルを直接的に変換している点では同じなので何
等差し支えない。２次変換に関しては、F.Class、A.Kal
tenmeier、P.Regel、and K.Trottler："Fast speaker a
daptation for speech recognition systems",Proc. IE
EE ICASSP,pp.133-136,（Apr.1990）に記載されてお
り、またニューラルネットワークによる変換は、磯、麻
生、吉田、渡辺：”ニューラルネットワークによる話者
適応”、音響学会講演論文集,１−６−１６,（1989.3）
に記載されている。

【００１７】次に１０５は、入力信号のスペクトル情報
を音響分析器１０１により抽出し、このスペクトル情報
を写像関数で直接的に広帯域化して広帯域化スペクトル
情報に変換する広帯域化器であり、さらに１０６はこの
広帯域化スペクトル情報から入力信号の周波数帯域を包
含する広い周波数帯域を有する広帯域信号を合成する信
号合成器である。

【００１８】以下、本発明の第１の実施例について、図
１のブロック構成図を参照しながら詳細に説明する。こ
こでは音響信号として、音声データを用いる。勿論、音
声以外の音響信号、たとえば音楽や画像信号なども使用
できる。まず、音声が電話回線やあるいは帯域制限フィ
ルタなどを通ってから音響分析器１０１に入力される
と、音響分析器１０１ではフレームｉでのＭ次のＰＳＥ
ケプストラム係数Ｃ_i(M)が抽出される。一定の時間間隔
は、ここでは例えばサンプリング周波数を８ＫＨｚ（帯
域幅４ＫＨｚ）としたとき、１６０点（２０ｍｓ）であ
り、この時間単位をフレームと呼ぶ。一方、広帯域化後
の広帯域信号では、サンプリング周波数を１６ＫＨｚ
（帯域幅８ＫＨｚ）として、３２０点（２０ｍｓ）とす
れば良い。

【００１９】一方、狭帯域データ処理器１０２では、あ
らかじめ用意した多数の学習用音声データをフィルタ処
理して狭帯域信号を作成する。フィルタとしては、たと
えば電話回線の特性を模擬したものや、ディジタル化の
際に使用する低域通過フィルタ等を模擬したものを使用
する。この処理により、入力音声と学習用音声を同じ環
境で得た共通のデータとして扱うことが可能になる。さ
らにこの狭帯域信号から前述の音響分析器１０１により
狭帯域スペクトル情報を抽出する。また、広帯域データ
処理器１０３は前述の多数の学習用データをフィルタ処
理しないで、最も理想的な信号すなわち広帯域信号を作
成し、この広帯域信号から音響分析器１０１により広帯
域スペクトル情報を抽出する部分である。以上の処理手
順を図２に示す。

【００２０】次に、写像関数推定器１０４では、狭帯域
スペクトル情報と広帯域スペクトル情報との関係を写像
関数として推定する。本実施例では写像関数として線形
写像を用い、狭帯域スペクトル情報から広帯域スペクト
ル情報へスペクトル変換を行う。具体的には、写像関数
{Ａ} の推定には、入力されたスペクトル情報ｘ_iの変換
後の広帯域化スペクトル情報ｚ_iと目標となる広帯域ス
ペクトル情報ｙ_iとの間の差の二乗誤差を最小化するこ
とで推定する。すなわち、全学習データの全フレームに
おける（数１）で与えられる目的関数を最小化すること
で求められる。

【００２１】

【数１】

【００２２】ただし、{Ａ} はＭ×Ｍ次元のマトリック
スであり、ｙ_iとｚ_iはＭ次元のベクトルである。

【００２３】この推定で用いる広帯域スペクトル情報と
狭帯域スペクトル情報は同じ学習音声データから求めて
いるので、フレーム毎に完全に一対一に対応づけするこ
とができ、いわゆる話者適応などで用いられる教師あり
の学習よりもさらに強力な対応付けといえる。

【００２４】次に１０５は、ｉフレーム目の入力信号の
スペクトル情報ｘ_i を音響分析器１０１により抽出し、
写像関数{Ａ}で広帯域化スペクトル情報ｚ_i に変換する
広帯域化器である。具体的には、（数２）により変換を
行う。

【００２５】

【数２】

【００２６】最後に、音声合成器１０６において、広帯
域化スペクトル情報から広帯域信号をＰＳＥ合成により
音声合成する。

【００２７】以上のように、本実施例の構成によれば、
比較的簡単な構成で、帯域制限された入力信号を、広い
周波数帯域を有する広帯域信号に正確に変換することが
できる信号合成装置を提供することができる。

【００２８】次に、本発明の第２の実施例について説明
する。図３は本実施例の全体構成を示すブロック構成図
である。本実施例は、第１の実施例よりさらに高性能な
装置例である。本実施例が第１の実施例と大きく異なる
部分、すなわち本実施例において最も重要な部分は、入
力信号のスペクトル情報をいくつかの部分空間に選別
し、それぞれ区分化した複数の部分空間毎に直接的に写
像を行う部分であり、より精密なスペクトル写像が実現
できることにある。ここでも写像関数としては、線形写
像、２時変換、あるいはニューラルネットワークなどの
非線形変換のいずれを用いても差し支えない。また、他
のスペクトルの変換方法として、クラスタリング処理に
よりいくつかのコードに離散化された符号帳を用いて、
狭帯域コードから広帯域コードへと写像する方法があ
り、コードの頻度とスペクトルとの重ね合わせを用いる
ことでより正確なスペクトル変換が可能となる方法も考
えられる。本実施例においては、写像関数として線形写
像を用いることにする。

【００２９】以下、本発明の第２の実施例について、図
３のブロック構成図を参照しながら詳細に説明する。図
３において、２０１は信号をフレーム毎に、例えばＰＳ
Ｅ分析等をして得られるスペクトル情報を抽出する音響
分析器である。狭帯域データ処理器２０２および広帯域
データ処理器２０３の構成は第１の実施例と同様であ
る。２０４は、狭帯域データ処理器２０２で得られた狭
帯域スペクトル情報を類似したスペクトルのグループに
クラスタリングし、各グループを代表的に表現するいく
つかの代表コードを持つ狭帯域符号帳を作成する狭帯域
符号帳作成器である。この代表コードにより、スペクト
ル情報をコード数個の部分空間に区分化する。クラスタ
リング方法としては、代表的なものとしてベクトル量子
化法があり、多量のデータ（母集団）の特徴を少ないデ
ータで効率的に表現することが可能となる。

【００３０】以下、本実施例ではクラスタリングのアル
ゴリズムとしてベクトル量子化法を用いることとする。
また符号帳を作成する方法としては、ＬｉｎｄｅらのＬ
ＢＧアルゴリズム（Y.Linde, A.buzo and R.M.Gray :"
An algorithm for vector quantizer design",IEEE Tra
ns.Commun.,COM-28,1,pp.84-95(Jan.1980)）が代表的な
手法としてある。また別のクラスタリング方法として
は、音声をいくつかの音韻毎にグループ分けして、各音
韻毎のスペクトル情報の平均値と標準偏差を求めてお
き、各音韻に対応する写像関数により広帯域化すること
も可能である。この時グループ分けの際に用いる距離尺
度としては、音韻毎の平均値と標準偏差を用いた統計的
距離、たとえばマハラノビス距離や対数尤度などが有効
である。そして、広帯域化の際には、音韻毎の写像関数
により変換を行うことで、各音韻のスペクトル特徴に基
づいた変換が可能となる。このように、音声データ中の
話者の特徴空間（スペクトル空間）を効率的に表現して
いる方法であれば、いかなる手法を用いても差し支えな
い。

【００３１】２０５は、狭帯域データ処理器２０２で得
られた狭帯域スペクトル情報が狭帯域符号帳中のどの代
表コードに最も近い距離にあるかを判定し、最も近い距
離にある狭帯域スペクトル情報をその代表コードに対す
る狭帯域スペクトル情報とし、これを全学習用データに
亘って行うことで狭帯域スペクトル情報群を作成する狭
帯域データ蓄積器である。実際に、ベクトル量子化によ
り狭帯域スペクトル情報群を作成する際には、まずｊフ
レーム目の狭帯域スペクトル情報ｘ_jに対するｋ番目の
コードＶ_k（コード数Ｌ）に対する量子化歪Ｄ_jkは、
（数３）で計算される。

【００３２】

【数３】

【００３３】ただし、ｘ_j、Ｖ_kはＭ次元のベクトル（Ｍ
次元の特徴量）である。そして、この歪が最も小さいコ
ードがｊフレーム目の狭帯域スペクトル情報に対するコ
ードになる。この狭帯域スペクトル情報とコードとの対
応関係を全ての学習データについて調べ、各コード毎の
狭帯域スペクトル情報群を作成する。さらに２０６は、
すでに明かな狭帯域スペクトル情報と広帯域スペクトル
情報との時間対応関係から、この狭帯域スペクトル情報
とコードとの対応関係を全ての学習データについて調
べ、各コード毎の広帯域スペクトル情報群を作成する広
帯域データ蓄積器である。

【００３４】２０７は、この狭帯域スペクトル情報群と
広帯域スペクトル情報群とを用いて写像関数を推定する
写像関数推定器である。図４に、写像関数として線形写
像を用いた場合の、写像関数の推定方法を示す。以下、
その具体的な手順を［ステップ１］〜［ステップ５］に
示す。［ステップ１］学習用音声データから得られた広帯域信
号と狭帯域信号から、それぞれのスペクトル情報を音響
分析器により抽出する。［ステップ２］ＬＢＧアルゴリズムにより、［ステップ
１］で求めた狭帯域スペクトルから狭帯域符号帳を作成
する。ここでは距離尺度としてユークリッド距離を用い
るが、絶対値距離や他の歪尺度など種々考えられ、入力
信号の特徴量が狭帯域符号帳中のどのコードに対応する
かを決定する意味ではどのような距離尺度を用いても差
し支えない。［ステップ３］狭帯域スペクトル情報を狭帯域符号帳に
よりベクトル量子化して対応するコードを検索し、各コ
ード（各部分空間の代表点）に対応する狭帯域スペクト
ル情報を蓄積し、部分空間毎の狭帯域スペクトル情報群
（クラスタ）を作成する。［ステップ４］狭帯域スペクトル情報と広帯域スペクト
ル情報の時間対応をとることにより、各コードに対応す
る広帯域スペクトル情報を蓄積し、広帯域スペクトル情
報群を求める。［ステップ５］各クラスタ毎（部分空間毎）の広帯域ス
ペクトル情報と狭帯域スペクトル情報との組を教師デー
タとして、写像関数を推定する。

【００３５】具体的には、例えばｋ番目のコードに対応
する写像関数{Ａ_k} の推定は、入力信号のスペクトル情
報の変換後のスペクトル情報、すなわち広帯域化スペク
トル情報ｚ_iと目標となる広帯域スペクトル情報ｙ_iとの
間の差の二乗誤差を最小化することにより推定される。
具体的には、全学習データの全フレームに関する目的関
数、（数４）により求められる。

【００３６】

【数４】

【００３７】ただし、{Ａ_k} はＭ×Ｍ次元のマトリック
スであり、{ｙ_i}と{ｚ_i}はＭ次元のベクトルである。

【００３８】この推定で用いる広帯域スペクトル情報と
狭帯域スペクトル情報は同じ学習音声データから求めて
いるので、フレーム毎に完全に一対一に対応づけするこ
とができる。この推定方法は、いわゆる話者適応などで
用いられる教師ありの学習よりもさらに強力な対応付け
といえる。この（数４）を解くと写像関数{Ａ_k} は（数
５）のように与えられる。

【００３９】

【数５】

【００４０】ただし、Ｒのs行t列の小行列をＲ_stとする
と、Ｒ_stとＢ_mはそれぞれ（数６）、（数７）で与えら
れる。

【００４１】

【数６】

【００４２】

【数７】

【００４３】次に２０８は、入力信号のスペクトル情報
を音響分析器２０１により抽出し、このスペクトル情報
が狭帯域符号帳中のどの代表コードに最も近い距離にあ
るかを判定するコード判定器である。具体的な処理は、
狭帯域データ蓄積器２０５の中で行っている、狭帯域ス
ペクトル情報に最も近い狭帯域符号帳中の代表コードを
判定する手続きと同様である。そして２０９は、コード
判定器２０８で得られたコードに対応する写像関数で、
入力信号のスペクトル情報を広帯域化する広帯域化器で
ある。具体的には、狭帯域スペクトルｘ_i を広帯域スペ
クトルｚ_i へと変換する方法として、スペクトル空間を
Ｍ個の部分空間{Ω_k} に分割し、各部分空間毎にあらか
じめ推定しておいた変換行列Ａ_k により線形写像を行
い、更にそれらを（数９）のような重み係数ｗ_ikで補間
した（数８）により広帯域化を行う。

【００４４】

【数８】

【００４５】

【数９】

【００４６】ここで、部分空間{Ω_k}はベクトル量子化
符号帳の代表点{Ｖ_k} との最小距離で分類され、またｐ
は内挿の平滑度を制御するパラメータである。また、上
記の説明でスペクトル空間をＭ個の代表点でファジィ区
分化したと考えれば、内挿パラメータｐはファジネスと
（数１０）の関係がある。

【００４７】

【数１０】

【００４８】このように、各部分空間毎の線形写像で変
換したスペクトル情報を重み係数で補間すなわち内挿す
ることで、より精密な変換あるいは広帯域化が行える。
ここで、重み係数で補間せずに、入力信号のスペクトル
情報を最も近い部分空間の写像関数で変換してもよい。
さらに部分空間数が１の場合には、第１の実施例の場合
と全く同じになる。

【００４９】２１０は、この広帯域化スペクトル情報を
用いて入力信号の周波数帯域を包含する広い周波数帯域
を有する広帯域信号をＰＳＥ合成により合成する音声合
成器である。

【００５０】このように、帯域制限された信号のスペク
トル情報（狭帯域スペクトル）から元の信号のスペクト
ル情報（広帯域スペクトル）を推定することを考えると
き、音声ならば音韻や個人差などに相当する個々のスペ
クトルの持つ特徴を踏まえて、いくつかのグループ毎に
スペクトル変換を施せば、誤差の少ない正確な変換が可
能になると考えられる。

【００５１】ここで以下に、本方式におけるスペクトル
情報の広帯域化の手順を示す。［ステップ１］帯域制限された信号（狭帯域信号）を音
響分析し、スペクトル情報を抽出する。［ステップ２］入力のスペクトル情報を、あらかじめ求
めておいた狭帯域符号帳によりベクトル量子化し、どの
空間に属すスペクトル情報であるか（対応コード）を求
める。［ステップ３］学習用音声を用いてあらかじめ作成して
おいた写像関数の中で、［ステップ２］で得られた対応
コードに対応する写像関数により入力スペクトル情報を
変換し、広帯域化スペクトル情報を求める。［ステップ４］広帯域化スペクトル包絡から合成により
広帯域信号を得る。

【００５２】以下に、実際に本実施例によりコンピュー
タシミュレーション実験した結果を示す。写像関数とし
ては、線形写像を用いて実験している。音声データは、
東北大−松下音声データベース中の男性１０名と女性１
０名が発声した２１２単語の単語音声であり、同一話者
内の１０〜１００番目の１００単語をの推定に用い、そ
れ以外の１０１〜１３０番目の３０単語を評価に用いる
こととする。収録条件としては、防音室で１インチマイ
クロフォンで収録後、８０Ｈｚの遮断周波数を持つハイ
パスフィルタと９ｋＨｚの遮断周波数を持つローパスフ
ィルターに通した後、サンプリング周波数２４ｋＨｚで
Ａ／Ｄ変換され、１２ｂｉｔに量子化されている。本実
験では、元の音声データベース（２４ｋＨｚサンプリン
グ）をフィルタリング処理して狭帯域音声（帯域幅０.
３〜３.４ｋＨｚ、８ｋＨｚサンプリング）および広帯
域音声（帯域幅０.０５〜７.４ｋＨｚ、１６ｋＨｚサン
プリング）をそれぞれ作成して実験に使用している。ま
た、スペクトル情報としては線形予測分析により得られ
る１５次のＬＰＣケプストラム係数を用いた。この係数
は、スペクトルの包絡情報を表現している。音声の分析
条件は１−０.９８ｚ^- ¹の固定プリエンファシスを施
し、２０ｍｓのハミング窓にて１０ｍｓのフレーム周期
で係数を抽出している。本報告では、分析窓、分析周期
等の条件は狭帯域・広帯域音声とも共通とし、分析次数
等が異なることによる影響をできるだけ排除した。また
入力スペクトル情報が、どの部分空間に属しているかを
判定するために用いる狭帯域符号帳は、ＬＢＧアルゴリ
ズムにより求めた。

【００５３】最初に、内挿パラメータの値をｐ＝∞、す
なわち内挿を行わないとき（最小距離分類による空間分
割）の部分空間数Ｍとスペクトル距離との関係を、学習
単語数Ｎをいろいろ変えて調べた。図５が男性１０名の
場合、図６が女性１０名の場合の平均スペクトル距離で
あり、それぞれ学習単語数が１０、３０、５０、１００
単語の場合を示している。それぞれの図において、横軸
は部分空間数を表し、縦軸は平均スペクトル距離［ｄ
Ｂ］を示している。この結果、男女とも同じような傾向
を示しており、部分空間数を増加させるにしたがってス
ペクトル歪は減少し、ある部分空間数において最小値を
取ることが伺える。学習単語数毎の最適な部分空間数
は、Ｎ＝１０、３０、５０、１００のとき、それぞれＭ
＝２、８、８、１６となり、本手法の有効性が確認でき
た。結局、Ｎ＝１００、Ｍ＝１６の場合の平均スペクト
ル距離は、男性平均で３.８１ｄＢ、女性平均で３.５９
ｄＢとなり、空間分割しない場合（Ｍ＝１）と比較して
それぞれ０.６２ｄＢ、０.４７ｄＢ向上している。

【００５４】次に、学習単語数をＮ＝１００として、部
分空間数を固定したときの内挿パラメータの効果を調べ
た。図７は男性１０名の、また図８は女性１０名の内挿
パラメータと平均スペクトル距離との関係を示したもの
である。それぞれの図において、横軸が内挿パラメータ
の値を、縦軸が平均スペクトル距離を示している。その
結果、各部分空間毎の内挿パラメータの最適値が存在
し、Ｍ＝２、４、８、１６、３２のときはそれぞれｐ＝
２.０、２.０、２.０、０.２、０.５となり、内挿しな
い場合（Ｉｎｆ）に比較して約０.１ｄＢ程度向上して
いる。結局、Ｎ＝１００、Ｍ＝１６、ｐ＝０.２の場合
に平均スペクトル距離が最小となり、男性平均で３.７
２ｄＢ、女性平均で３.４９ｄＢとなり、内挿しないと
きと比較してそれぞれ０.０９ｄＢ、０.１０ｄＢ向上し
ている。よってスペクトル距離を最小にする条件は、
（Ｎ、Ｍ、ｐ）＝（１００、１６、０.２）の場合とな
る。

【００５５】以上のように、本実施例の構成によれば、
帯域制限された入力信号を広い周波数帯域を有する広帯
域信号に正確に変換することができる信号合成装置を提
供することができる。

【００５６】次に、本発明の第３の実施例について説明
する。図９は本実施例の全体構成を示すブロック構成図
である。本実施例には、第１の実施例、第２の実施例と
共通する部分は多いが、本実施例が第１、第２の実施例
と大きく異なる部分は、入力信号のスペクトル情報とし
て、ＬＰＣ分析（線形予測分析）により得られる情報、
すなわちスペクトル包絡情報と音源情報であり、これら
を別々に広帯域化するところにある。ここでスペクトル
包絡情報としては、例えば線形予測係数、ＰＡＲＣＯＲ
係数、反射係数、ＬＳＰ係数、ＬＰＣケプストラム係
数、ＬＰＣメルケプストラム係数等が考えられる。例え
ば線形予測係数、ＰＡＲＣＯＲ係数、反射係数、ＬＰＣ
ケプストラム係数、ＬＰＣメルケプストラム係数などの
特徴量に関しては、L.R.RabinerとR.W.Schaferの共著、
鈴木久喜訳の、”音声のディジタル信号処理（上）
（下）”、コロナ社、に詳しく記載されている。またＬ
ＳＰ係数に関しては、F.K.Soong,B.H.Juang："Line Spe
ctrum Pair(LSP) and Speech Data Compression",Proc.
ICASSP,84,pp.1.10.1-1.10.4、に記載されている。これ
らは全て音声のスペクトル上の特徴を表現しているの
で、いずれの係数を用いても差し支えない。本実施例で
は、線形予測係数を使用することにする。また音源情報
の表現の方法としては、ピッチやマルチパルス列、音源
符号帳を用いる方法等、種々考えられるが、これらはす
べて音声のＬＰＣ分析後に得られる残差波形を非線形表
現したものに相当するので、いずれの情報を用いても差
し支えない。ピッチやマルチパルス列に関しては、古
井：”音響・音声工学”、近代科学社に詳しく記載され
ている。また音源符号帳に関しては、小野：“音声符号
化技術の最近の進展”,日本音響学会誌,４８巻、１号,p
p.52-59,（1992）に記載されている。本実施例では以
下、音源情報として音源符号帳を用いる方法を使用する
ことにする。

【００５７】以下、本発明の第３の実施例について、図
９のブロック構成図を参照しながら詳細に説明する。図
９において、３０１は信号をフレーム毎に音声分析して
スペクトル情報として線形予測係数と音源コードを抽出
する音声分析器である。具体的には、伝送路やフィルタ
によって帯域制限された音響信号が入力されると、フレ
ームｉにおけるＭ次の線形予測係数Ａ_i(M)が線形予測分
析により求められる。また音源符号帳は、乱数から発生
させた白色雑音を用いて用意に作成することができる。

【００５８】次に、第２の実施例と同様に学習用データ
から音声分析器３０１を用いて狭帯域スペクトル包絡情
報と狭帯域音源符号帳を抽出し、同様に学習用データか
ら音声分析器３０１により広帯域スペクトル包絡情報と
広帯域音源符号帳を抽出する。そして、狭帯域スペクト
ル包絡情報から狭帯域包絡符号帳を作成すると同時に、
この狭帯域スペクトル包絡情報と広帯域スペクトル包絡
情報とから包絡写像関数を第２の実施例と同様に推定す
る。本実施例では、狭帯域音源符号帳と広帯域音源符号
帳とから、さらに音源写像関数を推定する。すなわち、
それぞれの符号帳内のコードの時間軸を合わせ込んでお
き、各符号帳内のコードの対応関係をあらかじめ音源写
像関数として求めておくことで、狭帯域音源情報から広
帯域音源情報に変換することが可能になる。

【００５９】３０２は、まず入力信号の音声分析器３０
１により得られたスペクトル包絡情報を狭帯域包絡符号
帳でコード化し、どの部分空間に属しているかを判定す
る包絡符号判定器であり、３０３は、得られたスペクト
ル包絡情報を包絡写像関数を使って広帯域化して広帯域
化スペクトル情報に変換する包絡広帯域化器である。３
０２は第２の実施例のコード判定器と、また３０３は第
２の実施例の広帯域化器と同じ働きをする。

【００６０】３０４は、入力信号の音声分析器３０１に
より得られた音源情報を狭帯域音源符号帳で符号化する
音源符号判定器であり、３０５はこのとき得られた狭帯
域音源コードに対応する広帯域音源コードを探索し、こ
のコードから広帯域化音源情報に変換する音源広帯域化
器である。音源コードの探索は、たとえばあらかじめ作
成しておいた狭帯域音源符号帳中の音源コードｊと、前
述したＭ次の線形予測係数を用いて合成したｉフレーム
における合成音声をｓ_j(ｉ)とすると、元の音声ｓ(ｉ)
との（数１１）のような差の二乗誤差を最小化する音源
コードｋを見つけることで、実現できる。

【００６１】

【数１１】

【００６２】そして、この狭帯域音源コードと時間的に
対応する広帯域音源コードを広帯域音源符号帳中から見
つけだすことで、音源の広帯域化が可能になる。

【００６３】３０６は、求めた広帯域化スペクトル包絡
情報と広帯域化音源情報とを用いてＬＰＣ合成により、
入力信号の周波数帯域を包含する広い周波数帯域を有す
る広帯域信号を合成する音声合成器である。

【００６４】以上のように、本実施例によれば、上記の
構成により帯域制限された入力信号を広い周波数帯域を
有する広帯域信号に正確に変換することができる信号合
成装置を提供することができる。

【００６５】次に、本発明の第４の実施例について説明
する。図１０は本実施例の全体構成を示すブロック構成
図である。本実施例には、第２の実施例と共通する部分
が多く、共通する部分については、詳しい説明は割愛す
る。本実施例が第２の実施例と大きく異なる部分は、第
２の実施例では線形写像により広帯域化スペクトル情報
を求めていたのに対し、本実施例では広帯域コードの重
みづけ加算により広帯域化スペクトル情報求めている部
分である。具体的には、本実施例では入力信号のスペク
トル情報を狭帯域符号帳を用いてベクトル量子化して狭
帯域コードを求め、このコードに対応する広帯域コード
をあらかじめ作成しておいた頻度テーブルから頻度の大
きい順に検索し、この広帯域コードと頻度との重みづけ
加算を行うことで広帯域化スペクトル包絡情報に変換し
ている。

【００６６】以下、本発明の第４の実施例について、図
１０のブロック構成図を参照しながら詳細に説明する。
図１０において、４０１は信号をフレーム毎に音響分析
して得られるスペクトル情報を抽出する音声分析器であ
る。４０２の狭帯域データ処理器および４０３の広帯域
データ処理器の構成は第２の実施例と同様である。４０
４は、狭帯域データ処理器４０２で得られた狭帯域スペ
クトル情報を類似したスペクトルのグループにクラスタ
リングし、各グループを代表的に表現するいくつかの代
表コードを持つ狭帯域符号帳を作成する狭帯域符号帳作
成器である。

【００６７】４０５は、狭帯域データ処理器４０２で得
られた狭帯域スペクトル情報が狭帯域符号帳中のどの代
表コードに最も近い距離にあるかを判定し、最も近い距
離にある狭帯域スペクトル情報をその代表コードに対す
る狭帯域スペクトル情報とし、これを全学習用データに
亘って行うことで各コード毎の狭帯域スペクトル情報の
集合すなわち狭帯域スペクトル情報群を作成する狭帯域
データ蓄積器である。さらに４０６は、この狭帯域スペ
クトル情報とコードとの対応関係を用いて、すでに明か
な狭帯域スペクトル情報と広帯域スペクトル情報との時
間対応関係から、広帯域スペクトル情報とコードとの対
応関係を全ての学習データについて調べ、各コード毎の
広帯域スペクトル情報の集合すなわち広帯域スペクトル
情報群を作成する広帯域データ蓄積器である。いずれ
も、第２の実施例と同様である。

【００６８】４０７は、広帯域スペクトル情報群を用い
て各コード毎の平均広帯域スペクトル情報を算出して広
帯域符号帳を作成し、さらに特定の狭帯域コードに対応
した広帯域コードの数を頻度として算出し、これを全て
の狭帯域コードに対して行い頻度テーブルを作成する頻
度テーブル作成器である。ここで用いる広帯域スペクト
ル情報と狭帯域スペクトル情報は同じ学習音声データか
ら求めているので、フレーム毎に完全に一対一に対応づ
けすることができる。

【００６９】４０８は、入力信号のスペクトル情報を音
声分析器４０１により抽出し、このスペクトル情報が狭
帯域符号帳中のどのコードに最も近い距離にあるかを判
定するコード判定器である。具体的な処理は、第２の実
施例の狭帯域データ蓄積器２０５の中で行っている手続
きと同様である。そして４０９は、コード判定器４０８
で得られた狭帯域コードに対応する広帯域コードにより
入力信号のスペクトル情報を広帯域化する広帯域化器で
ある。具体的には、ｉフレームにおける入力信号のスペ
クトル情報ｘ_iを狭帯域符号帳｛Ｘ_k｝でベクトル量子化
したときの狭帯域コード番号をｍとすると、コード番号
ｍに対する各広帯域コード毎の頻度Ｈ(m,l)、但し（ｌ
＝１〜Ｌ）を変換テーブルの中から求め、この頻度と広
帯域符号帳｛Ｙ_l｝中の各広帯域コードとの重み付け加
算を（数１２）のように行うことで広帯域化スペクトル
ｚ_iへと変換する。

【００７０】

【数１２】

【００７１】ここで、（数１２）において復元時のコー
ド数を符号帳中の全コード数Ｌ以下に制限することによ
って、計算量を削減し、必要以上のスペクトルの平滑化
を防ぐことができる。

【００７２】４１０は、求めた広帯域化スペクトル情報
を用いて入力信号の周波数帯域を包含する広い周波数帯
域を有する広帯域信号を合成する音声合成器である。

【００７３】以上のように、本実施例によれば、上記の
構成により帯域制限された入力信号を広い周波数帯域を
有する広帯域信号に正確に変換することができる信号合
成装置を提供することができる。

【００７４】

【発明の効果】以上の実施例から明らかなように、本発
明によれば、ある特定の周波数帯域に制限された入力信
号を一定フレーム毎に音響分析することによりスペクト
ル情報を抽出し、あらかじめ多量の学習用データから前
記入力信号と同じ周波数帯域の狭帯域信号を作成し、前
記狭帯域信号を音響分析により狭帯域スペクトル情報を
抽出し、また前記多量の学習用データから前記入力信号
の周波数帯域を包含する広い周波数帯域を有する広帯域
信号を作成し、前記広帯域信号を音響分析により広帯域
スペクトル情報を抽出し、前記狭帯域スペクトル情報と
前記広帯域スペクトル情報との関係を写像関数として推
定しておき、前記入力信号のスペクトル情報を前記写像
関数により広帯域化した広帯域化スペクトル情報を算出
し、前記算出後の広帯域化スペクトル情報から前記入力
信号の周波数帯域を包含する広い周波数帯域を有する広
帯域信号を合成するするように構成しているので、比較
的簡単な構成で、帯域制限された入力信号を入力信号の
持つ周波数帯域を包含するような広い周波数帯域を有す
る広帯域信号に正確に変換することができる信号合成方
法および装置を提供することができる。

【図面の簡単な説明】

【図１】本発明の第１の実施例における信号合成装置の
全体構成を示すブロック図

【図２】本発明の第１の実施例における信号合成装置の
狭帯域データ処理器、広帯域データ処理器による処理手
順を説明するための図

【図３】本発明の第２の実施例における信号合成装置の
全体構成を示すブロック図

【図４】本発明の第２の実施例における信号合成装置の
写像関数として線形写像を用いた場合の写像関数の推定
方法を説明するための図

【図５】本発明の実施例において、内挿を行わないとき
の部分空間数Ｍとスペクトル距離との関係（男性１０
名）を示した図

【図６】本発明の実施例において、内挿を行わないとき
の部分空間数Ｍとスペクトル距離との関係（女性１０
名）を示した図

【図７】本発明の実施例において、学習単語数をＮ＝１
００として、部分空間数を固定したときの内挿パラメー
タと平均スペクトル距離との関係（男性１０名）を示し
た図

【図８】本発明の実施例において、学習単語数をＮ＝１
００として、部分空間数を固定したときの内挿パラメー
タと平均スペクトル距離との関係（女性１０名）を示し
た図

【図９】本発明の第３の実施例における信号合成装置の
全体構成を示すブロック図

【図１０】本発明の第４の実施例における信号合成装置
の全体構成を示すブロック図

【符号の説明】

１０１音響分析器１０２狭帯域データ処理器１０３広帯域データ処理器１０４写像関数推定器１０５広帯域化器１０６信号合成器

Claims

【特許請求の範囲】

【請求項１】特定の周波数帯域に帯域制限された入力信
号を、前記入力信号の周波数帯域を包含する広い周波数
帯域を有する広帯域信号に変換する信号合成方法であっ
て、あらかじめ多量の学習用データから前記入力信号と同じ
周波数帯域の狭帯域信号を作成し、前記狭帯域信号を音
響分析により狭帯域スペクトル情報を抽出し、また前記
多量の学習用データから前記入力信号の周波数帯域を包
含する広い周波数帯域を有する広帯域信号を作成し、前
記広帯域信号を音響分析により広帯域スペクトル情報を
抽出し、前記狭帯域スペクトル情報と前記広帯域スペクトル情報
との関係を写像関数として推定しておき、前記入力信号をフレーム毎に音響分析することにより入
力スペクトル情報を抽出し、前記入力スペクトル情報を
前記写像関数により広帯域化した広帯域化スペクトル情
報を算出し、前記算出後の広帯域化スペクトル情報から前記入力信号
の周波数帯域を包含する広い周波数帯域を有する広帯域
信号を合成することを特徴とする信号合成方法。
【請求項２】写像関数を用いて入力信号の周波数帯域を
包含する周波数帯域を有する広帯域信号を推定する方法
として、あらかじめ多量の学習用データから前記入力信号と同じ
周波数帯域を有する狭帯域スペクトル情報を抽出し、同
時に前記狭帯域スペクトル情報を類似したスペクトル毎
にクラスタリングにより適当なグループ毎に分割して、
前記狭帯域スペクトル情報の各グループを代表的に表現
するいくつかの代表コードを持つ狭帯域符号帳を作成
し、前記狭帯域スペクトル情報が前記狭帯域符号帳中のどの
代表コードに最も近い距離にあるかを判定し、最も近い
距離にある狭帯域スペクトル情報をその代表コードに対
する狭帯域スペクトル情報とし、これを全学習用データ
に亘って行うことで狭帯域スペクトル情報群として蓄積
し、また前記狭帯域スペクトル情報と時間的に対応づけされ
る広帯域スペクトル情報を前記代表コード毎に選別し、
これを全学習用データに亘って行うことで広帯域スペク
トル情報群として蓄積し、前記狭帯域スペクトル情報群と前記広帯域スペクトル情
報群を用いて各代表コード毎の写像関数を作成し、前記入力信号のスペクトル情報を抽出し、前記スペクト
ル情報が前記狭帯域符号帳中のどの代表コードに最も近
い距離にあるかを判定し、判定された代表コードに対応
する写像関数を用いて、前記入力信号のスペクトル情報
を前記入力信号の周波数帯域を包含する広い周波数帯域
を有する広帯域化スペクトル情報に変換し、前記入力信号の周波数帯域を包含する広い周波数帯域を
有する広帯域信号を合成することを特徴とする請求項１
記載の信号合成方法。
【請求項３】写像関数を用いて入力信号の周波数帯域を
包含する周波数帯域を有する広帯域信号を推定する方法
として、あらかじめ多量の学習用データから前記入力信号と同じ
周波数帯域を有する狭帯域スペクトル情報を抽出し、同
時に前記狭帯域スペクトル情報を類似したスペクトル毎
にクラスタリングにより適当なグループ毎に分割して、
前記狭帯域スペクトル情報の各グループを代表的に表現
するいくつかの代表コードを持つ狭帯域符号帳を作成
し、前記狭帯域スペクトル情報が前記狭帯域符号帳中のどの
代表コードに最も近い距離にあるかを判定し、最も近い
距離にある狭帯域スペクトル情報をその代表コードに対
する狭帯域スペクトル情報とし、これを全学習用データ
に亘って行うことで狭帯域スペクトル情報群として蓄積
し、また前記狭帯域スペクトル情報と時間的に対応づけされ
る広帯域スペクトル情報を前記代表コード毎に選別し、
これを全学習用データに亘って行うことで広帯域スペク
トル情報群として蓄積し、前記狭帯域スペクトル情報群と前記広帯域スペクトル情
報群を用いて前記代表コード毎の写像関数を作成し、前記入力信号のスペクトル情報を抽出し、前記スペクト
ル情報と前記狭帯域符号帳中の各代表コードとの距離計
算して得られた距離を計算し、前記入力信号の狭帯域ス
ペクトル情報を前記狭帯域符号帳中の各代表コードに対
応する写像関数を用いて前記入力信号の周波数帯域を包
含する広い周波数帯域を有する広帯域化スペクトル情報
に変換し、各代表コード毎に得られた前記距離と各代表
コード毎に得られた前記広帯域化スペクトル情報との重
みづけ加算により、前記入力信号の周波数帯域を包含す
る広い周波数帯域を有する広帯域化スペクトル情報に変
換し、前記入力信号の周波数帯域を包含する広い周波数帯域を
有する広帯域信号を合成することを特徴とすることを請
求項１記載の信号合成方法。
【請求項４】特定の周波数帯域に帯域制限された入力信
号を、前記入力信号の周波数帯域を包含する広い周波数
帯域を有する広帯域信号に変換する信号合成方法であっ
て、あらかじめ多量の学習用データからフィルタ処理により
前記入力信号の周波数帯域と同じ周波数帯域を有する狭
帯域信号を作成し、前記狭帯域信号からフレーム毎に音
響分析により狭帯域スペクトル情報を抽出し、また同様
に前記学習用データからフィルタ処理により前記入力信
号の周波数帯域を包含する周波数帯域を有する広帯域信
号を作成し、前記広帯域信号からフレーム毎に音響分析
して得られる広帯域スペクトル情報を抽出し、前記狭帯域スペクトル情報から各音韻毎の平均値と、各
音韻毎の標準偏差とを算出しておき、前記各音韻毎の平均値と標準偏差とを用い前記狭帯域ス
ペクトル情報がどの音韻に最も近い距離にあるかを判定
し、最も近い距離にある狭帯域スペクトル情報をその音
韻に対する狭帯域スペクトル情報とし、これを全学習用
データに亘って行うことで狭帯域スペクトル情報群とし
て蓄積し、また前記狭帯域スペクトル情報と時間的に対応づけされ
る前記広帯域スペクトル情報を用いて、各音韻毎の広帯
域スペクトル情報として選別し、これを全学習用データ
に亘って行うことで広帯域スペクトル情報群として蓄積
し、前記狭帯域スペクトル情報と前記広帯域スペクトル情報
を用いて各音韻毎の写像関数を推定しておき、前記入力信号をフレーム毎に音響分析して入力スペクト
ル情報を抽出し、前記入力スペクトル情報が前記各音韻
毎の平均値と標準偏差とを用いて、どの音韻であるかを
判定し、あらかじめ設定しておいた音韻に関してのみ、
前記音韻の写像関数により前記入力信号の周波数帯域を
包含する広い周波数帯域を有する広帯域スペクトル情報
に変換し、入力信号を広帯域信号に変換することを特徴とする信号
合成方法。
【請求項５】入力スペクトル情報を広帯域化スペクトル
情報に変換する方法として、前記入力スペクトル情報と
各音韻との距離を前記各音韻毎の平均値と標準偏差とを
用いて計算し、前記入力信号のスペクトル情報を前記狭
帯域符号帳中の各音韻に対応する写像関数を用いて前記
入力信号の周波数帯域を包含する広い周波数帯域を有す
る広帯域化スペクトル情報に変換し、各音韻毎に得られ
た前記距離と各音韻毎に得られた前記広帯域化スペクト
ル情報との重みづけ加算により、前記入力信号の周波数
帯域を包含する広い周波数帯域を有する広帯域化スペク
トル情報に変換し、前記入力信号の周波数帯域を包含する広い周波数帯域を
有する広帯域信号を合成することを特徴とすることを請
求項４記載の信号合成方法。
【請求項６】写像関数を用いて前記入力信号の周波数帯
域を包含する周波数帯域を有する広帯域信号を推定する
方法として、あらかじめ多量の学習用データから前記入力信号と同じ
周波数帯域の狭帯域信号を作成し、前記狭帯域信号を音
響分析して得られる狭帯域スペクトル情報をベクトル量
子化して狭帯域符号帳を作成し、同様に前記多量の学習
用データから前記入力信号の周波数帯域を包含する広帯
域信号の広帯域スペクトル情報をベクトル量子化して広
帯域符号帳を作成し、前記学習用データから得た狭帯域スペクトル情報を前記
狭帯域符号帳でベクトル量子化して得られる狭帯域コー
ド列を作成し、一方前記学習用データから得た広帯域ス
ペクトル情報を前記広帯域符号帳でベクトル量子化して
広帯域コード列を作成し、前記狭帯域コード列と前記広
帯域コード列との時間対応から、各コード同士の対応の
頻度を示した頻度テーブルを作成しておき、前記入力信号を音響分析して得られるスペクトル情報を
前記狭帯域符号帳を用いてベクトル量子化したときの狭
帯域コードに対応する広帯域コードを前記頻度テーブル
から頻度の高いものから順に検索し、前記広帯域コード
の表す広帯域スペクトル情報と前記頻度テーブルで与え
られる頻度との重みづけ加算により、前記入力信号の周
波数帯域を包含する広い周波数帯域を有する広帯域化ス
ペクトル情報に変換し、前記入力信号の周波数帯域を包含する広い周波数帯域を
有する広帯域信号を合成することを特徴とする請求項１
記載の信号合成方法。
【請求項７】特定の周波数帯域に帯域制限された入力信
号と、前記入力信号から推定した前記入力信号の周波数
帯域を包含する広い周波数帯域を有する広帯域信号を、
周波数軸上あるいは時間軸上で重畳することにより高品
質の広帯域信号を得ることを特徴とする請求項１、請求
項２、請求項３、請求項４、請求項６のいずれかに記載
の信号合成方法。
【請求項８】特定の周波数帯域に帯域制限された入力信
号を前記入力信号の周波数帯域を包含する広い周波数帯
域に変換する方法として、前記入力信号の周波数帯域以
外の周波数帯域に関してのみ推定を行い、前記入力信号
の周波数帯域外の周波数帯域を有する帯域外信号を求
め、前記入力信号と前記帯域外信号とを周波数軸上ある
いは時間軸上で重畳することにより高品質の広帯域信号
を得ることを特徴とする請求項１、請求項２、請求項
３、請求項４、請求項６のいずれかに記載の信号合成方
法。
【請求項９】入力信号として音声信号を用いることを特
徴とする請求項１、請求項２、請求項３、請求項４、請
求項６のいずれかに記載の信号合成方法。
【請求項１０】写像関数として線形写像を用いることを
特徴とする請求項１、請求項２、請求項３、請求項４、
請求項６のいずれかに記載の信号合成方法。
【請求項１１】写像関数として２次変換を用いることを
特徴とする請求項１、請求項２、請求項３、請求項４、
請求項６のいずれかに記載の信号合成方法。
【請求項１２】写像関数としてニューラルネットワーク
を含む非線形写像を用いることを特徴とする請求項１、
請求項２、請求項３、請求項４、請求項６のいずれかに
記載の信号合成方法。
【請求項１３】クラスタリングする方法としてベクトル
量子化を用いることを特徴とする請求項２または請求項
３記載の信号合成方法。
【請求項１４】スペクトル情報として信号をフレーム毎
に音響分析することにより得られるスペクトル包絡情報
と音源情報を用いることを特徴とする請求項１、請求項
２、請求項３、請求項４、請求項６のいずれかに記載の
信号合成方法。
【請求項１５】信号から得られるスペクトル情報とし
て、フレーム毎にＰＳＥ分析して得られるケプストラム
係数を用いることで前記入力信号の周波数帯域を包含す
る広い周波数帯域を有する広帯域信号を得ることを特徴
とする請求項１、請求項２、請求項３、請求項４、請求
項６のいずれかに記載の信号合成方法。
【請求項１６】信号から得られるスペクトル情報とし
て、フレーム毎にケプストラム分析して得られるケプス
トラム係数を用いることで前記入力信号の周波数帯域を
包含する広い周波数帯域を有する広帯域信号を得ること
を特徴とする請求項１、請求項２、請求項３、請求項
４、請求項６のいずれかに記載の信号合成方法。
【請求項１７】信号から得られるスペクトル情報とし
て、フレーム毎にウェーブレット変換して得られる特徴
量を用いることで前記入力信号の周波数帯域を包含する
広い周波数帯域を有する広帯域信号を得ることを特徴と
する請求項１、請求項２、請求項３、請求項４、請求項
６のいずれかに記載の信号合成方法。
【請求項１８】特定の周波数帯域に帯域制限された入力
信号を、前記入力信号の周波数帯域を包含する広い周波
数帯域を有する広帯域信号に変換する信号合成装置にお
いて、特定の周波数帯域に制限された入力信号をフレー
ム毎に音響分析することによりスペクトル情報を抽出す
る音響分析器と、あらかじめ多量の学習用データから前
記入力信号と同じ周波数帯域の狭帯域信号を作成し、前
記狭帯域信号を前記音響分析器により音響分析して狭帯
域スペクトル情報を抽出する狭帯域データ処理器と、ま
た前記多量の学習用データから前記入力信号の周波数帯
域を包含する広い周波数帯域を有する広帯域信号を作成
し、前記広帯域信号を前記音響分析器により音響分析し
て広帯域スペクトル情報を抽出する広帯域データ処理器
と、前記狭帯域スペクトル情報と前記広帯域スペクトル
情報との関係を写像関数として推定する写像関数推定器
と、前記入力信号のスペクトル情報を前記写像関数推定
器で推定した写像関数により広帯域化した広帯域化スペ
クトル情報を算出する広帯域化器と、前記算出後の広帯
域化スペクトル情報から前記入力信号の周波数帯域を包
含する広い周波数帯域を有する広帯域信号を合成する信
号合成器を備えたことを特徴とする信号合成装置。
【請求項１９】特定の周波数帯域に帯域制限された入力
信号を、前記入力信号の周波数帯域を包含する広い周波
数帯域を有する広帯域信号に変換する信号合成装置にお
いて、特定の周波数帯域に制限された入力信号をフレー
ム毎に音響分析することによりスペクトル包絡情報と音
源情報を抽出する音響分析器と、あらかじめ多量の学習
用データから前記入力信号と同じ周波数帯域の狭帯域信
号を作成し、前記狭帯域信号を前記音響分析器により音
響分析して狭帯域スペクトル包絡情報と狭帯域音源情報
を抽出する狭帯域データ処理器と、また前記多量の学習
用データから前記入力信号の周波数帯域を包含する広い
周波数帯域を有する広帯域信号を作成し、前記広帯域信
号を前記音響分析器により音響分析して広帯域スペクト
ル包絡情報と広帯域音源情報を抽出する広帯域データ処
理器と、前記狭帯域スペクトル包絡情報と前記広帯域ス
ペクトル包絡情報との関係を包絡写像関数として推定す
る包絡写像関数推定器と、前記狭帯域音源情報と前記広
帯域音源情報との関係を音源写像関数として推定する音
源写像関数推定器と、前記入力信号のスペクトル包絡情
報を包絡写像関数推定器で推定した包絡写像関数により
広帯域化した広帯域化スペクトル包絡情報を算出する包
絡広帯域化器と、前記入力信号の音源情報を前記音源写
像関数推定器で推定した音源写像関数により広帯域化し
た広帯域化音源情報を算出する音源広帯域化器と、前記
算出後の広帯域化スペクトル包絡情報と広帯域化音源情
報から前記入力信号の周波数帯域を包含する広い周波数
帯域を有する広帯域信号を合成する信号合成器を備えた
ことを特徴とする信号合成装置。
【請求項２０】特定の周波数帯域に帯域制限された入力
音声を、前記入力音声の周波数帯域を包含する広い周波
数帯域を有する広帯域音声に変換する信号合成装置にお
いて、特定の周波数帯域に制限された入力音声をフレー
ム毎に音声分析することによりスペクトル包絡情報と音
源情報を抽出する音声分析器と、あらかじめ多量の学習
用音声データから前記入力音声と同じ周波数帯域の狭帯
域音声を作成し、前記狭帯域音声を前記音声分析器によ
り音声分析して狭帯域スペクトル包絡情報と狭帯域音源
情報を抽出する狭帯域データ処理器と、また前記多量の
学習用音声データから前記入力音声の周波数帯域を包含
する広い周波数帯域を有する広帯域音声を作成し、前記
広帯域音声を前記音声分析器により音響分析して広帯域
スペクトル包絡情報と広帯域音源情報を抽出する広帯域
データ処理器と、前記狭帯域スペクトル包絡情報と前記
広帯域スペクトル包絡情報との関係をスペクトル包絡写
像関数として推定する包絡写像関数推定器と、前記狭帯
域音源情報と前記広帯域音源情報との関係を音源写像関
数として推定する音源写像関数推定器と、前記入力音声
のスペクトル包絡情報を包絡写像関数推定器で推定した
包絡写像関数により広帯域化した広帯域化スペクトル包
絡情報を算出する包絡広帯域化器と、前記入力音声の音
源情報を前記音源写像関数推定器で推定した音源写像関
数により広帯域化した広帯域化音源情報を算出する音源
広帯域化器と、前記算出後の広帯域化スペクトル包絡情
報と広帯域化音源情報から前記入力音声の周波数帯域を
包含する広い周波数帯域を有する広帯域音声を合成する
音声合成器を備えたことを特徴とする信号合成装置。
【請求項２１】特定の周波数帯域に制限された入力音声
を音声分析して得たスペクトル包絡情報から前記入力音
声の周波数帯域を包含する広い周波数帯域を有する広帯
域なスペクトル包絡情報を推定する方法として、あらか
じめ多量の学習用音声データから前記入力音声と同じ周
波数帯域を有する狭帯域スペクトル包絡情報を抽出する
狭帯域データ処理器と、前記多量の学習用音声データか
ら前記入力音声の周波数帯域を包含する広い周波数帯域
を有する広帯域スペクトル包絡情報を抽出する広帯域デ
ータ処理器と、前記狭帯域スペクトル包絡情報を類似し
たスペクトル包絡毎にクラスタリングして適当なグルー
プ毎に分割し、前記狭帯域スペクトル包絡情報を代表的
に表現するいくつかの代表コードを持つ狭帯域符号帳を
作成する狭帯域符号帳作成器と、前記狭帯域スペクトル
包絡情報が前記狭帯域符号帳中のどの代表コードに最も
近い距離にあるかを判定し、それぞれの代表コードに対
して最も近い距離にある狭帯域スペクトル包絡情報を各
代表コード毎に全学習用データに亘って蓄積し、狭帯域
スペクトル包絡情報群を作成する狭帯域データ蓄積器
と、また前記狭帯域スペクトル包絡情報群中の狭帯域ス
ペクトル包絡情報と時間的に対応づけされる広帯域スペ
クトル包絡情報を各代表コード毎に全学習用データに亘
って蓄積し、広帯域スペクトル包絡情報群を作成する広
帯域データ蓄積器と、前記狭帯域スペクトル包絡情報群
と前記広帯域スペクトル包絡情報群とを用いて各代表コ
ード毎の写像関数を推定する写像関数推定器と、前記入
力音声のスペクトル包絡情報が前記狭帯域符号帳中のど
の代表コードに最も近い距離にあるかを判定するコード
判定器と、前記入力音声のスペクトル包絡情報が最も近
い距離にあると判定された代表コードに対応する写像関
数を用いて、前記入力音声のスペクトル包絡情報を前記
入力音声の周波数帯域を包含する広い周波数帯域を有す
る広帯域化スペクトル包絡情報に変換する包絡広帯域化
器とを備えたことを特徴とする請求項２０記載の信号合
成装置。
【請求項２２】特定の周波数帯域に制限された入力音声
を音響分析して得たスペクトル包絡情報から前記入力音
声の周波数帯域を包含する広い周波数帯域を有する広帯
域なスペクトル包絡情報を推定する方法として、あらか
じめ多量の学習用音声データから前記入力音声と同じ周
波数帯域を有する狭帯域スペクトル包絡情報を抽出する
狭帯域データ処理器と、前記多量の学習用音声データか
ら前記入力音声の周波数帯域を包含する広い周波数帯域
を有する広帯域スペクトル包絡情報を抽出する広帯域デ
ータ処理器と、前記狭帯域スペクトル包絡情報を類似し
たスペクトル包絡毎にクラスタリングして適当なグルー
プ毎に分割し、前記狭帯域スペクトル包絡情報を代表的
に表現するいくつかの代表コードを持つ狭帯域符号帳を
作成する狭帯域符号帳作成器と、前記狭帯域スペクトル
包絡情報が前記狭帯域符号帳中のどの代表コードに最も
近い距離にあるかを判定するコード判定器と、前記コー
ド判定器においてそれぞれの代表コードに対して最も近
い距離にある狭帯域スペクトル包絡情報を各代表コード
毎に全学習用データに亘って蓄積し、狭帯域スペクトル
包絡情報群を作成する狭帯域データ蓄積器と、また前記
狭帯域スペクトル包絡情報群中の狭帯域スペクトル包絡
情報と時間的に対応づけされる広帯域スペクトル包絡情
報を各代表コード毎に全学習用データに亘って蓄積し、
広帯域スペクトル包絡情報群を作成する広帯域データ蓄
積器と、前記広帯域データ蓄積器により得られた前記狭
帯域スペクトル包絡情報群と前記広帯域スペクトル包絡
情報群とを用いて各代表コード毎の写像関数を推定する
写像関数推定器と、前記入力音声のスペクトル包絡情報
と前記狭帯域符号帳中の各代表コードとの距離を計算し
て距離値を計算する距離計算器と、前記入力音声のスペ
クトル包絡情報を前記狭帯域符号帳中の各代表コードに
対応する写像関数を用いて前記入力音声の周波数帯域を
包含する広い周波数帯域を有する広帯域化スペクトル包
絡情報に変換する包絡広帯域化器と、さらに各代表コー
ド毎に前記距離計算器により得られた前記距離値と各代
表コード毎に前記包絡広帯域化器により得られた前記広
帯域化スペクトル包絡情報との重みづけ加算により広帯
域化スペクトル包絡情報に変換する重みづけ加算器とを
備えたことを特徴とする請求項２０記載の信号合成装
置。
【請求項２３】特定の周波数帯域に帯域制限された入力
音声を、前記入力音声の周波数帯域を包含する広い周波
数帯域を有する広帯域音声に変換する信号合成装置にお
いて、あらかじめ多量の学習用データからフィルタ処理
により前記入力音声の周波数帯域と同じ周波数帯域を有
する狭帯域音声を作成し、前記狭帯域音声からフレーム
毎に音声分析により狭帯域スペクトル包絡情報を抽出す
る狭帯域データ処理器と、同様に前記学習用データから
フィルタ処理により前記入力信号の周波数帯域を包含す
る周波数帯域を有する広帯域信号を作成し、前記広帯域
信号からフレーム毎に音声分析して得られる広帯域スペ
クトル包絡情報を抽出する広帯域データ処理器と、前記
狭帯域スペクトル包絡情報から各音韻毎の平均値と、各
音韻毎の標準偏差とを算出する音韻標準パターン作成器
と、前記各音韻毎の平均値と標準偏差とを用い前記狭帯
域スペクトル情報がどの音韻に最も近い距離にあるかを
判定し、最も近い距離にある狭帯域スペクトル情報をそ
の音韻に対する狭帯域スペクトル情報とし、これを全学
習用データに亘って選別し、狭帯域スペクトル情報群と
して蓄積する狭帯域データ蓄積器と、また前記狭帯域ス
ペクトル情報と時間的に対応づけされる前記広帯域スペ
クトル情報を用いて、各音韻毎の広帯域スペクトル情報
を選別し、これを全学習用データに亘って行うことで広
帯域スペクトル情報群として蓄積する広帯域データ蓄積
器と、前記狭帯域スペクトル情報群と前記広帯域スペク
トル情報群を用いて各音韻毎の写像関数を推定する写像
関数推定器と、前記入力信号をフレーム毎に音声分析し
て入力スペクトル包絡情報を抽出し、前記各音韻毎の平
均値と標準偏差とを用いて、前記入力スペクトル情報と
前記各音韻との距離を計算する距離計算器と、さらに前
記入力信号のスペクトル情報を各音韻に対応する写像関
数を用いて前記入力信号の周波数帯域を包含する広い周
波数帯域を有する広帯域化スペクトル情報に変換し、各
音韻毎に得られた前記距離と各音韻毎に得られた前記広
帯域化スペクトル情報との重みづけ加算により、前記入
力信号の周波数帯域を包含する広い周波数帯域を有する
広帯域化スペクトル情報に変換する広帯域化器と、前記
広帯域化スペクトル情報を用いて前記入力信号の周波数
帯域を包含する広い周波数帯域を有する広帯域信号を合
成することを特徴とする請求項２０記載の信号合成装
置。
【請求項２４】写像関数として線形写像を用いることを
特徴とする請求項２０、請求項２１、請求項２２、請求
項２３のいずれかに記載の信号合成装置。
【請求項２５】写像関数として２次変換を用いることを
特徴とする請求項２０、請求項２１、請求項２２、請求
項２３のいずれかに記載の信号合成装置。
【請求項２６】写像関数としてニューラルネットワーク
を含む非線形変換を用いることを特徴とする請求項２
０、請求項２１、請求項２２、請求項２３のいずれかに
記載の信号合成装置。
【請求項２７】写像関数としてコードブック写像を用い
ることを特徴とする請求項２０、請求項２１、請求項２
２、請求項２３のいずれかに記載の信号合成装置。
【請求項２８】特定の周波数帯域に制限された入力音声
を音声分析して得たスペクトル包絡情報から前記入力音
声の周波数帯域を包含する広い周波数帯域を有する広帯
域なスペクトル包絡情報を推定する方法として、あらか
じめ多量の学習用音声データから前記入力音声と同じ周
波数帯域を有する狭帯域スペクトル包絡情報を抽出する
狭帯域データ処理器と、前記多量の学習用音声データか
ら前記入力音声の周波数帯域を包含する広い周波数帯域
を有する広帯域スペクトル包絡情報を抽出する広帯域デ
ータ処理器と、前記狭帯域データ処理器から得られる狭
帯域スペクトル包絡情報をベクトル量子化して狭帯域符
号帳を作成する狭帯域符号帳作成器と、同様に前記広帯
域データ処理器から得られる前記広帯域スペクトル包絡
情報をベクトル量子化して広帯域符号帳を作成する広帯
域符号帳作成器と、前記学習用音声データから同一時刻
に得られた狭帯域スペクトル包絡情報と広帯域スペクト
ル包絡情報とをそれぞれ前記狭帯域符号帳と前記広帯域
符号帳とでベクトル量子化して狭帯域コードおよび広帯
域コードを求めるベクトル量子化器と、前記狭帯域コー
ドおよび広帯域コードの対応頻度を全学習音声データに
ついて抽出し、各符号同士の対応の頻度を示した頻度テ
ーブルを作成する頻度テーブル作成器と、前記入力音声
のスペクトル包絡情報を前記狭帯域符号帳を用いてベク
トル量子化したときのコードに対応する広帯域コードを
前記頻度テーブルから頻度の高いものから順に検索する
コード検索器と、前記広帯域コードの持つスペクトル包
絡情報と前記頻度テーブルで与えられる頻度との重みづ
け加算を頻度の高いものから適当な個数分行い、広帯域
化スペクトル包絡情報を回復する重みづけ加算器とを備
えたことを特徴とする請求項２０記載の信号合成装置。
【請求項２９】特定の周波数帯域に帯域制限された入力
音声と、前記入力音声から推定した前記入力音声の周波
数帯域を包含する広い周波数帯域を有する広帯域音声
を、周波数軸上あるいは時間軸上で重畳することにより
高品質の広帯域音声を得ることを特徴とする請求項２
０、請求項２１、請求項２２、請求項２３、請求項２８
のいずれかに記載の信号合成装置。
【請求項３０】特定の周波数帯域に帯域制限された入力
音声を前記入力音声の周波数帯域を包含する広い周波数
帯域に変換する方法として、前記入力音声の周波数帯域
以外の周波数帯域に関してのみ推定を行い、前記入力音
声と前記帯域外音声とを周波数軸上あるいは時間軸上で
重畳することにより高品質の広帯域音声を得ることを特
徴とする請求項２０、請求項２１、請求項２２、請求項
２３、請求項２８のいずれかに記載の信号合成装置。
【請求項３１】スペクトル包絡情報として、フレーム毎
にＬＰＣ分析することで得られる線形予測係数を用いる
ことで入力信号の周波数帯域を包含する広い周波数帯域
を有する広帯域音声を得ることを特徴とする請求項２
０、請求項２１、請求項２２、請求項２３、請求項２８
のいずれかに記載の信号合成装置。
【請求項３２】スペクトル包絡情報として、フレーム毎
にＬＰＣ分析することで得られるＰＡＲＣＯＲ係数を用
いることで前記入力信号の周波数帯域を包含する広い周
波数帯域を有する広帯域音声を得ることを特徴とする請
求項２０、請求項２１、請求項２２、請求項２３、請求
項２８のいずれかに記載の信号合成装置。
【請求項３３】スペクトル包絡情報として、フレーム毎
にＬＰＣ分析して得られるＬＳＰ係数を用いることで前
記入力信号の周波数帯域を包含する広い周波数帯域を有
する広帯域音声を得ることを特徴とする請求項２０、請
求項２１、請求項２２、請求項２３、請求項２８のいず
れかに記載の信号合成装置。
【請求項３４】特定の周波数帯域に制限された入力信号
から得られる音源情報を非線形に歪ませる非線形変換器
と、前記入力信号の音源情報を前記入力信号の周波数帯
域を包含する広い周波数帯域を有する広帯域音源情報へ
変換する音源広帯域化器とを備えたことを特徴とする請
求項１９または請求項２０記載の信号合成装置。
【請求項３５】入力信号を前記入力信号の周波数帯域を
包含する広い周波数帯域を有する広帯域信号へと変換す
るため、音源情報を非線形に歪ませて変換する方法とし
て、あらかじめ多量の学習用データから前記入力信号の
周波数帯域と同じ周波数帯域を有する狭帯域音声から狭
帯域音源情報を抽出する狭帯域音源抽出器と、前記入力
信号の周波数帯域を包含する広い周波数帯域を有する広
帯域音声から広帯域音源情報を抽出する広帯域音源抽出
器と、前記狭帯域音源情報を代表的に表現するいくつか
の狭帯域音源コードを求める狭帯域音源符号帳作成器
と、前記広帯域音源情報を代表的に表現するいくつかの
広帯域音源コードを求める広帯域音源符号帳作成器と、
前記狭帯域音源コードと前記広帯域音源コードとの対応
関係を音源写像関数としてあらかじめ学習させる音源写
像関数推定器と、前記入力信号から抽出した音源情報を
前記狭帯域音源符号帳で量子化し、得られたコード番号
から前記音源写像関数を用いて広帯域音源符号帳の中か
ら広帯域音源コードを検索する音源コード検索器と、前
記広帯域音源コードにより前記入力信号の周波数帯域を
包含する広い周波数帯域を有する広帯域化音源情報へと
変換する音源広帯域化器を備えたことを特徴とする請求
項１９または請求項２０記載の信号合成装置。
【請求項３６】音源写像関数としてコードブック写像を
用いることを特徴とする請求項３５記載の信号合成装
置。
【請求項３７】特定の周波数帯域に制限された入力信号
から得られる音源情報として、フレーム毎のピッチおよ
びパワーを用い、前記ピッチおよび前記パワーを抽出す
るピッチ抽出器およびパワー算出器を有し、前記入力信
号の音源情報を前記入力信号の周波数帯域を包含する広
い周波数帯域を有する広帯域音源情報へ変換する音声こ
とを特徴とする請求項１９、請求項２０、請求項３４、
請求項３５のいずれかに記載の信号合成装置。
【請求項３８】入力信号を前記入力信号の周波数帯域を
包含する広い周波数帯域を有する広帯域信号へと変換す
るため、音源情報を非線形に歪ませて変換する方法とし
て、前記音源情報から得られたマルチパルス列を用いる
信号合成装置であって、あらかじめ多量の学習用データ
から前記入力信号の周波数帯域と同じ周波数帯域を有す
る狭帯域音声から狭帯域マルチパルス列を抽出する狭帯
域音源抽出器と、前記入力信号の周波数帯域を包含する
広い周波数帯域を有する広帯域音声から広帯域マルチパ
ルス列を抽出する広帯域音源抽出器と、前記狭帯域マル
チパルス列と前記広帯域マルチパルス列との対応関係を
音源写像関数としてあらかじめ学習させる音源写像関数
推定器と、前記入力信号から抽出したマルチパルス列を
前記音源写像関数を用いて広帯域マルチパルス列に変換
するパルス列変換器と、前記パルス列変換器で得られた
前記広帯域マルチパルス列を用いて、入力信号の周波数
帯域を包含する広い周波数帯域を有する広帯域音声を合
成する音声合成器を備えたことを特徴とする請求項１
９、請求項２０、請求項３４、請求項３５のいずれかに
記載の信号合成装置。