JP3563756B2

JP3563756B2 - 音声合成システム

Info

Publication number: JP3563756B2
Application number: JP01249294A
Authority: JP
Inventors: 達郎松本
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1994-02-04
Filing date: 1994-02-04
Publication date: 2004-09-08
Anticipated expiration: 2019-09-08
Also published as: US5848390A; JPH07219576A

Description

【０００１】
【産業上の利用分野】
本発明は、入力テキストの合成音声信号を生成するソフトウェア構成の音声合成システムに関し、特に、走行する計算機に最適となる音声合成処理を実現する音声合成システムに関する。
【０００２】
【従来の技術】
図２７に、ソフトウェアで構成される音声合成システムの全体構成を図示する。
【０００３】
図中、１は二次記憶装置に展開される単語辞書であって、単語の表記や、読みや、アクセントや、品詞情報等の単語情報を管理するもの、２は二次記憶装置に展開される音声辞書であって、合成単位毎に、音声波形あるいは音声パラメータ（ＰＡＲＣＯＲ係数等といった音声を特徴付けるパラメータ）といった音声データを管理するものである。
【０００４】
３はソフトウェアで構成される言語処理部であって、形態素解析部１０／係り受け解析部１１／韻律記号生成部１２／単語辞書バッファ１３を備えることで、入力テキストに対して、音声合成のための言語処理を実行するもの、４はソフトウェアで構成される音響処理部であって、音声時間長決定部１４／基本周波数パターン生成部１５／波形生成部１６／音声辞書バッファ１７を備えることで、入力テキストの合成音声信号を生成するもの、５はハードウェアで構成されるＤＡ変換器であって、音響処理部４の生成する合成音声信号をアナログ信号に変換するものである。
【０００５】
このように構成される音声合成システムでは、最初に、形態素解析部１０が、単語辞書バッファ１３に展開される単語辞書１の単語情報を参照しつつ、入力テキストを構成する形態素（単語）を解析して、各単語の読みを決定するとともに、アクセントや品詞等の情報を得る。続いて、係り受け解析部１１が、形態素解析部１０の得た品詞情報等から、各文節の係り受け（修飾）関係を解析する。続いて、韻律記号生成部１２が、アクセントや息継ぎを示す韻律記号を生成するとともに、各単語のアクセント情報とアクセント接続規則から最終的な単語のアクセント位置を決定し、更に、文節の係り受け情報から息継ぎ位置を決定する。
【０００６】
続いて、音声時間長決定部１４が、読みに対応する各音節（音素）の時間長を決定する。続いて、基本周波数パターン生成部１５が、韻律記号からイントネーションやアクセントに相当する物理量である基本周波数の時間変化パターンを生成する。続いて、波形生成部１６が、音声辞書バッファ１７に展開される音声辞書２の音声データの中から、合成すべき音節（音素）に対応する音声データを読み出し、時間長と基本周波数パターンとに基づいて合成音声信号を生成する。
【０００７】
そして、最後に、ＤＡ変換器５が、波形生成部１６の生成する合成音声信号をアナログ信号に変換して出力する。
このような構成を採る音声合成システムでは、従来、実用的な音声合成性能（処理速度や音質レベル）を実現するために、ソフトウェアを展開する計算機として規定のハードウェア性能を持つものを要求して、その計算機でもって音声合成処理を実行するという構成を採っていた。
【０００８】
すなわち、実用的な音声合成機能を実現するためには、単語辞書１に登録される単語数を多くする必要があるとともに、音声辞書２に登録される音声データのサンプリング周波数や量子化レベル数を大きくする必要があり、また、合成音声信号をアナログ信号に変換するＤＡ変換器５の変換機能もそれに応じたものである必要があることから、そのようなものを扱えるハードウェアを持つ計算機を要求して、その計算機でもって音声合成処理を実行するという構成を採っていたのである。
【０００９】
【発明が解決しようとする課題】
しかしながら、このような従来技術に従っていると、ユーザは、音声合成システムを構築する場合には、その音声合成システムの要求するハードウェア性能を持つ計算機を用意しなければならないという問題点があった。
【００１０】
また、メーカからすると、ユーザの持つ計算機のハードウェア性能に合わせて、いくつかのレベルの音声合成機能を実現する複数のソフトウェアを用意しなけれはならないという問題点があった。
【００１１】
本発明はかかる事情に鑑みてなされたものであって、走行する計算機に最適となる音声合成処理を実現する新たな音声合成システムの提供を目的とする。
【００１２】
【課題を解決するための手段】
図１に本発明の原理構成を図示する。
図中、１００は本発明の音声合成システムのソフトウェアを展開する計算機、１は計算機１００の持つ二次記憶装置に展開されて、音声合成処理に必要となる単語情報を管理する単語辞書、２は計算機１００の持つ二次記憶装置に展開されて、音声合成処理に必要となる音声データ（４８ＫＨｚ×１６ビットといった時系列データ）を管理する音声辞書である。
【００１３】
計算機１００は、音声合成システムを構築するために、言語処理部３と、音響処理部４と、ＤＡ変換器５と、検出部６と、調整部７と、ビット調整部７ａと、周波数調整部７ｂと、単語情報展開域８と、音声データ展開域９とを備える。
【００１４】
この言語処理部３は、入力テキストに対して、単語辞書１の管理する単語情報データを使って音声合成のための言語処理を実行する。音響処理部４は、言語処理部３の処理結果を受けて、音声辞書２の管理する音声データを使って入力テキストの合成音声信号を生成する。ＤＡ変換器５は、音響処理部４の生成する合成音声信号をハード的にアナログ信号に変換する。
【００１５】
検出部６は、システムの走行する計算機の持つハードウェアの性能又は状態を検出する。この検出部６として、ＣＰＵの性能又はＣＰＵの負荷を検出するＣＰＵ機能検出部や、メモリの容量又はメモリの使用状況を検出するメモリ機能検出部や、二次記憶装置のアクセス性能を検出する二次記憶装置機能検出部や、ＤＡ変換器５のＤＡ変換性能を検出するＤＡ変換機能検出部があって、これらの内の少なくとも１つが備えられることになる。
【００１６】
調整部７は、検出部６の検出結果に応じて、言語処理部３及び音響処理部４に与える辞書情報を調整する。
この調整部７は、具体的には、（イ）検出部６の検出結果に応じて、言語処理部３に与える単語情報の量に関する情報を決定し、また、音響処理部４に与える音声データの質又は量に関する情報を決定する決定部と、（ロ）決定部の決定に応じて、単語辞書１から言語処理部３に与える単語情報を読み出して、言語処理部３がアクセスする単語情報展開域８に展開したり、音声辞書２から音響処理部４に与える音声データを読み出して、音響処理部４がアクセスする音声データ展開域９に展開する展開部とを備えることで、検出部６の検出結果に応じて、言語処理部３及び音響処理部４に与える辞書情報を調整する処理を行う。
ビット調整部７ａは、音響処理部４の後段に備えられて、検出部６として備えられるＤＡ変換機能検出部の検出結果に応じて、音響処理部４の生成する合成音声信号のビットデータを調整する。周波数調整部７ｂは、音響処理部４の後段に備えられて、検出部６として備えられるＤＡ変換機能検出部の検出結果に応じて、音響処理部４の生成する合成音声信号のサンプリング周波数を調整する。
【００１７】
単語情報展開域８は、調整部７の調整する単語情報を展開する。この単語情報展開域８に展開される単語情報が、言語処理部３によりアクセスされることになる。音声データ展開域９は、調整部７の調整する音声データを展開する。この音声データ展開域９に展開される音声データが、音響処理部４によりアクセスされることになる。
【００１８】
ここで、この構成を採るときにあって、検出部６の代わりに、対話処理に従って、ハードウェアの能力情報を設定する設定部を備える構成を採ることも可能である。
【００１９】
【作用】
本発明では、検出部６は、ＣＰＵ機能検出部に従って、ＣＰＵの性能又はＣＰＵの負荷を検出したり、メモリ機能検出部に従って、メモリの容量又はメモリの使用状況を検出したり、二次記憶装置機能検出部に従って、二次記憶装置のアクセス性能を検出したり、ＤＡ変換機能検出部に従って、ＤＡ変換器５の量子化性能や周波数性能を検出する。
【００２０】
このようにして、検出部６が計算機１００の持つハードウェアの性能又は状態を検出すると、調整部７は、例えば、メモリに余裕があるときには、単語辞書１に格納される単語情報を沢山読み出して単語情報展開域８に展開していくというように、その検出結果に応じて、言語処理部３に与える単語情報を調整し、そして、例えば、ＣＰＵの能力が十分あるときには、例えば、音声辞書２に格納される音声データを密にサンプリングして音声データ展開域９に展開していくというように、その検出結果に応じて、音声データの量子化ビット数を調整して音声データ展開域９に展開したり、音声データのサンプリング周波数を調整して音声データ展開域９に展開したり、音声データの供給量を調整して音声データ展開域９に展開したり、あるいは、これらの組み合わせを使うことで、音響処理部４に与える音声データを調整する。
【００２１】
一方、ビット調整部７ａは、検出部６がＤＡ変換器５の量子化ビット数を検出するときにあって、検出された量子化ビット数と、音響処理部４に与えられる音声データの量子化ビット数とが一致しないことで、ＤＡ変換器５の量子化ビット数と、音響処理部４の生成する合成音声信号の量子化ビット数とが一致しないときには、その検出された量子化ビット数に従って、音響処理部４の生成する合成音声信号のビットデータを調整する。
【００２２】
そして、周波数調整部７ｂは、検出部６がＤＡ変換器５のサンプリング周波数を検出するときにあって、検出されたサンプリング周波数と、音響処理部４に与えられる音声データのサンプリング周波数とが一致しないことで、ＤＡ変換器５のサンプリング周波数と、音響処理部４の生成する合成音声信号のサンプリング周波数とが一致しないときには、その検出されたサンプリング周波数に従って、音響処理部４の生成する合成音声信号のサンプリング周波数を調整する。
【００２３】
これらの調整処理を受けて、言語処理部３／音響処理部４は、ハードウェア能力が十分あるときには、優れた性能の音声合成処理を実行するとともに、ハードウェア能力が十分でないときにも、その範囲内で最適な性能を発揮する音声合成処理を実行できるようになる。
【００２４】
このように、本発明を用いることで、走行する計算機１００に最適となる音声合成処理を実現できるようになるので、ユーザは、手持ちの計算機１００を使って、快適な音声合成システムを構築できるようになる。
【００２５】
【実施例】
以下、実施例に従って本発明を詳細に説明する。
図２ないし図５に、検出部６として、ＣＰＵ機能検出部６０を用いる構成の一実施例を図示する。ここで、図中の９０は、音声データ展開域９に対応する音声データバッファである。
【００２６】
このＣＰＵ機能検出部６０は、例えば、テストプログラムを実行して、その実行時間を評価することでＣＰＵの性能又はＣＰＵの負荷を検出したり、オペレーティングシステムに問い合わせることで、３２ビットマシンといったようなＣＰＵの性能を検出するものであり、例えば、この検出結果を予め定められるレベル値で表現するよう処理することになる。
【００２７】
図２に示す実施例では、異なるサンプリング周波数の音声データを管理する複数の音声辞書２−ｉ（ｉ＝１〜ｎ）を備える構成を採るとともに、調整部７として、サンプリング周波数決定部７００及び音声辞書選択部７０１から構成されるものを用いる構成を採っている。
【００２８】
このように構成される図２の実施例では、ＣＰＵ機能検出部６０がＣＰＵの性能又はＣＰＵの負荷を検出して、その検出結果のレベル値を求めると、サンプリング周波数決定部７００は、ＣＰＵ機能検出部６０から高いＣＰＵ能力を表示するレベル値が与えられるときには、処理能力が高いことから、例えば、４８ＫＨｚのサンプリング周波数の音声データの使用を決定し、また、低いＣＰＵ能力を表示するレベル値が与えられるときには、処理能力が低いことから、例えば、８ＫＨｚのサンプリング周波数の音声データの使用を決定するというように、ＣＰＵ機能検出部６０の検出するレベル値に応じて音声データのサンプリング周波数を決定する。
【００２９】
そして、音声辞書選択部７０１は、このサンプリング周波数決定部７００の決定結果を受けて、その決定されたサンプリング周波数の音声データを管理する音声辞書２−ｉから対応の音声データを読み出して音声データバッファ９０に展開していく。
【００３０】
このようにして、図２の実施例では、ＣＰＵの能力に応じて、音声データバッファ９０に展開する音声データのサンプリング周波数を変化させていくことで、音響処理部４に与える音声データのデータ量を調整して、ＣＰＵの能力にあった音声合成処理を実現していくよう処理するものである。
【００３１】
一方、図３に示す実施例では、例えば、４８ＫＨｚといった高いサンプリング周波数の音声データを管理する単一の音声辞書２を備える構成を採るとともに、調整部７として、サンプリング周波数決定部７００及びダウンサンプリング処理部７０２から構成されるものを用いる構成を採っている。
【００３２】
このように構成される図３の実施例では、ＣＰＵ機能検出部６０がＣＰＵの性能又はＣＰＵの負荷を検出して、その検出結果のレベル値を求めると、サンプリング周波数決定部７００は、上述のように、そのレベル値に応じて音声データのサンプリング周波数を決定する。
【００３３】
そして、ダウンサンプリング処理部７０２は、このサンプリング周波数決定部７００の決定結果を受けて、例えば、サンプリング周波数決定部７００が４８ＫＨｚのサンプリング周波数を決定するときには、音声辞書２に格納される音声データをそのまま読み出して音声データバッファ９０に展開し、また、例えば、１６ＫＨｚのサンプリング周波数を決定するときには、音声辞書２に格納される音声データを１６ＫＨｚにダウンサンプリングしながら読み出して音声データバッファ９０に展開していく。
【００３４】
このようにして、図３の実施例では、ＣＰＵの能力に応じて、音声データバッファ９０に展開する音声データのサンプリング周波数を変化させていくことで、音響処理部４に与える音声データのデータ量を調整して、ＣＰＵの能力にあった音声合成処理を実現していくよう処理するものである。
【００３５】
一方、図４に示す実施例では、異なる量子化ビット数の音声データを管理する複数の音声辞書２−ｉ（ｉ＝１〜ｎ）を備える構成を採るとともに、調整部７として、量子化ビット決定部７０３及び音声辞書選択部７０１から構成されるものを用いる構成を採っている。
【００３６】
このように構成される図４の実施例では、ＣＰＵ機能検出部６０がＣＰＵの性能又はＣＰＵの負荷を検出して、その検出結果のレベル値を求めると、量子化ビット決定部７０３は、ＣＰＵ機能検出部６０から高いＣＰＵ能力を表示するレベル値が与えられるときには、処理能力が高いことから、例えば、１６ビットの音声データの使用を決定し、また、低いＣＰＵ能力を表示するレベル値が与えられるときには、処理能力が低いことから、例えば、８ビットの音声データの使用を決定するというように、ＣＰＵ機能検出部６０の検出するレベル値に応じて音声データの量子化ビット数を決定する。
【００３７】
そして、音声辞書選択部７０１は、この量子化ビット決定部７０３の決定結果を受けて、その決定された量子化ビット数の音声データを管理する音声辞書２−ｉから対応の音声データを読み出して音声データバッファ９０に展開していく。
【００３８】
このようにして、図４の実施例では、ＣＰＵの能力に応じて、音声データバッファ９０に展開する音声データの量子化ビット数を変化させていくことで、音響処理部４に与える音声データのデータ量を調整して、ＣＰＵの能力にあった音声合成処理を実現していくよう処理するものである。
【００３９】
一方、図５に示す実施例では、例えば、１６ビットといった大きい量子化ビット数の音声データを管理する単一の音声辞書２を備える構成を採るとともに、調整部７として、量子化ビット決定部７０３及び量子化ビット変更部７０４から構成されるものを用いる構成を採っている。
【００４０】
このように構成される図５の実施例では、ＣＰＵ機能検出部６０がＣＰＵの性能又はＣＰＵの負荷を検出して、その検出結果のレベル値を求めると、量子化ビット決定部７０３は、上述のように、そのレベル値に応じて音声データの量子化ビット数を決定する。
【００４１】
そして、量子化ビット変更部７０４は、この量子化ビット決定部７０３の決定結果を受けて、例えば、量子化ビット決定部７０３が１６ビットの量子化ビット数を決定するときには、音声辞書２に格納される音声データをそのまま読み出して音声データバッファ９０に展開し、また、例えば、８ビットの量子化ビット数を決定するときには、音声辞書２に格納される音声データを８ビットに変更しながら読み出して音声データバッファ９０に展開していく。
【００４２】
このようにして、図５の実施例では、ＣＰＵの能力に応じて、音声データバッファ９０に展開する音声データの量子化ビット数を変化させていくことで、音響処理部４に与える音声データのデータ量を調整して、ＣＰＵの能力にあった音声合成処理を実現していくよう処理するものである。
【００４３】
以上説明したように、図２ないし図５の実施例では、ＣＰＵ機能検出部６０の検出結果に応じて、音響処理部４に与える音声データのデータ量を調整して、ＣＰＵの能力にあった音声合成処理を実現していくよう処理するものである。なお、ＣＰＵ機能検出部６０の検出結果に応じて、言語処理部３に与える単語情報のデータ量を調整していくことで、ＣＰＵの能力にあった音声合成処理を実現していく構成を採ることも可能である。
【００４４】
図６ないし図１４に、検出部６として、メモリ機能検出部６１を用いる構成の一実施例を図示する。ここで、図中の８０は、単語情報展開域８に対応する単語情報バッファである。
【００４５】
このメモリ機能検出部６１は、例えば、オペレーティングシステムに問い合わせることで、メモリの容量又はメモリの使用状況を検出するものであり、例えば、この検出結果を予め定められるレベル値で表現するよう処理することになる。
【００４６】
図６に示す実施例では、異なるサンプリング周波数の音声データを管理する複数の音声辞書２−ｉ（ｉ＝１〜ｎ）を備える構成を採るとともに、調整部７として、サンプリング周波数決定部７００及び音声辞書選択部７０１から構成されるものを用いる構成を採っている。
【００４７】
このように構成される図６の実施例では、メモリ機能検出部６１がメモリの容量又はメモリの使用状況を検出して、その検出結果のレベル値を求めると、サンプリング周波数決定部７００は、メモリ機能検出部６１から高いメモリ能力を表示するレベル値が与えられるときには、メモリに余裕があることから、例えば、４８ＫＨｚのサンプリング周波数の音声データの使用を決定し、また、低いメモリ能力を表示するレベル値が与えられるときには、メモリに余裕がないことから、例えば、１６ＫＨｚのサンプリング周波数の音声データの使用を決定するというように、メモリ機能検出部６１の検出するレベル値に応じて音声データのサンプリング周波数を決定する。
【００４８】
そして、音声辞書選択部７０１は、このサンプリング周波数決定部７００の決定結果を受けて、その決定されたサンプリング周波数の音声データを管理する音声辞書２−ｉから対応の音声データを読み出して音声データバッファ９０に展開していく。
【００４９】
このようにして、図６の実施例では、メモリの能力に応じて、音声データバッファ９０に展開する音声データのサンプリング周波数を変化させていくことで、音響処理部４に与える音声データのデータ量を調整して、メモリの能力にあった音声合成処理を実現していくよう処理するものである。
【００５０】
一方、図７に示す実施例では、例えば、４８ＫＨｚといった高いサンプリング周波数の音声データを管理する単一の音声辞書２を備える構成を採るとともに、調整部７として、サンプリング周波数決定部７００及びダウンサンプリング処理部７０２から構成されるものを用いる構成を採っている。
【００５１】
このように構成される図７の実施例では、メモリ機能検出部６１がメモリの容量又はメモリの使用状況を検出して、その検出結果のレベル値を求めると、サンプリング周波数決定部７００は、上述のように、そのレベル値に応じて音声データのサンプリング周波数を決定する。
【００５２】
そして、ダウンサンプリング処理部７０２は、このサンプリング周波数決定部７００の決定結果を受けて、例えば、サンプリング周波数決定部７００が４８ＫＨｚのサンプリング周波数を決定するときには、音声辞書２に格納される音声データをそのまま読み出して音声データバッファ９０に展開し、また、例えば、１６ＫＨｚのサンプリング周波数を決定するときには、音声辞書２に格納される音声データを１６ＫＨｚにダウンサンプリングしながら読み出して音声データバッファ９０に展開していく。
【００５３】
このようにして、図７の実施例では、メモリの能力に応じて、音声データバッファ９０に展開する音声データのサンプリング周波数を変化させていくことで、音響処理部４に与える音声データのデータ量を調整して、メモリの能力にあった音声合成処理を実現していくよう処理するものである。
【００５４】
一方、図８に示す実施例では、異なる量子化ビット数の音声データを管理する複数の音声辞書２−ｉ（ｉ＝１〜ｎ）を備える構成を採るとともに、調整部７として、量子化ビット決定部７０３及び音声辞書選択部７０１から構成されるものを用いる構成を採っている。
【００５５】
このように構成される図８の実施例では、メモリ機能検出部６１がメモリの容量又はメモリの使用状況を検出して、その検出結果のレベル値を求めると、量子化ビット決定部７０３は、メモリ機能検出部６１から高いメモリ能力を表示するレベル値が与えられるときには、メモリに余裕があることから、例えば、１６ビットの音声データの使用を決定し、また、低いメモリ能力を表示するレベル値が与えられるときには、メモリに余裕がないことから、例えば、８ビットの音声データの使用を決定するというように、メモリ機能検出部６１の検出するレベル値に応じて音声データの量子化ビット数を決定する。
【００５６】
そして、音声辞書選択部７０１は、この量子化ビット決定部７０３の決定結果を受けて、その決定された量子化ビット数の音声データを管理する音声辞書２−ｉから対応の音声データを読み出して音声データバッファ９０に展開していく。
【００５７】
このようにして、図８の実施例では、メモリの能力に応じて、音声データバッファ９０に展開する音声データの量子化ビット数を変化させていくことで、音響処理部４に与える音声データのデータ量を調整して、メモリの能力にあった音声合成処理を実現していくよう処理するものである。
【００５８】
一方、図９に示す実施例では、例えば、１６ビットといった大きい量子化ビット数の音声データを管理する単一の音声辞書２を備える構成を採るとともに、調整部７として、量子化ビット決定部７０３及び量子化ビット変更部７０４から構成されるものを用いる構成を採っている。
【００５９】
このように構成される図９の実施例では、メモリ機能検出部６１がメモリの容量又はメモリの使用状況を検出して、その検出結果のレベル値を求めると、量子化ビット決定部７０３は、上述のように、そのレベル値に応じて音声データの量子化ビット数を決定する。
【００６０】
そして、量子化ビット変更部７０４は、この量子化ビット決定部７０３の決定結果を受けて、例えば、量子化ビット決定部７０３が１６ビットの量子化ビット数を決定するときには、音声辞書２に格納される音声データをそのまま読み出して音声データバッファ９０に展開し、また、例えば、８ビットの量子化ビット数を決定するときには、音声辞書２に格納される音声データを８ビットに変更しながら読み出して音声データバッファ９０に展開していく。
【００６１】
このようにして、図９の実施例では、メモリの能力に応じて、音声データバッファ９０に展開する音声データの量子化ビット数を変化させていくことで、音響処理部４に与える音声データのデータ量を調整して、メモリの能力にあった音声合成処理を実現していくよう処理するものである。
【００６２】
一方、図１０に示す実施例では、単一の音声辞書２を備える構成を採るとともに、調整部７として、複数の音声辞書インデックス７０５−ｉ（ｉ＝１〜ｍ）と、音声辞書インデックス選択部７０６と、音声辞書ダウンロード制御部７０７とから構成されるものを用いる構成を採っている。
【００６３】
このように構成される図１０の実施例では、メモリ機能検出部６１がメモリの容量又はメモリの使用状況を検出して、その検出結果のレベル値を求めると、音声辞書インデックス選択部７０６は、メモリ機能検出部６１から高いメモリ能力を表示するレベル値が与えられるときには、メモリに余裕があることから、高い品質の音声合成処理を実現する音声データを指すインデックスを管理対象とする音声辞書インデックス７０５−ｉの使用を決定し、また、低いメモリ能力を表示するレベル値が与えられるときには、メモリに余裕がないことから、低い品質の音声合成処理を実現する音声データを指すインデックスを管理対象とする音声辞書インデックス７０５−ｉの使用を決定するというように、メモリ機能検出部６１の検出するレベル値に応じて使用する音声辞書インデックス７０５−ｉを決定する。
【００６４】
すなわち、メモリに余裕がないときには、例えば、音声データ「ＳＡ」にも兼用できる音声データ「Ａ」だけを指すインデックスを管理対象するような音声辞書インデックス７０５−ｉの使用を決定し、メモリに余裕があるときには、例えば、音声データ「ＳＡ」と音声データ「Ａ」の双方を指すインデックスを管理するような音声辞書インデックス７０５−ｉの使用を決定するのである。
【００６５】
そして、音声辞書ダウンロード制御部７０７は、この音声辞書インデックス選択部７０６の決定結果を受けて、音声辞書２から、その決定された音声辞書インデックス７０５−ｉの管理するインデックスの指す音声データを読み出して音声データバッファ９０に展開していく。
【００６６】
このようにして、図１０の実施例では、メモリの能力に応じて、音声データバッファ９０に展開する音声データの品質を変化させていくことで、音響処理部４に与える音声データのデータ量を調整して、メモリの能力にあった音声合成処理を実現していくよう処理するものである。
【００６７】
一方、図１１に示す実施例では、単一の音声辞書２を備える構成を採るとともに、調整部７として、音声データ頻度テーブル７０８と、頻度閾値決定部７０９と、音声辞書ダウンロード制御部７０７とから構成されるものを用いる構成を採っている。
【００６８】
このように構成される図１１の実施例では、メモリ機能検出部６１がメモリの容量又はメモリの使用状況を検出して、その検出結果のレベル値を求めると、頻度閾値決定部７０９は、メモリ機能検出部６１から高いメモリ能力を表示するレベル値が与えられるときには、メモリに余裕があることから、沢山の音声データの展開を実現すべく使用頻度の閾値として小さな値を決定し、また、低いメモリ能力を表示するレベル値が与えられるときには、メモリに余裕がないことから、少ない音声データの展開を実現すべく使用頻度の閾値として大きな値を決定するというように、メモリ機能検出部６１の検出するレベル値に応じて音声データの使用頻度の閾値を決定する。
【００６９】
そして、音声辞書ダウンロード制御部７０７は、この頻度閾値決定部７０９の決定結果を受けて、音声データの頻度情報を管理する音声データ頻度テーブル７０８の管理データに従って、音声辞書２から、その決定された頻度閾値よりも大きな使用頻度を示す音声データを読み出して音声データバッファ９０に展開していく。
【００７０】
このようにして、図１１の実施例では、メモリの能力に応じて、音声データバッファ９０に展開する音声データの数を変化させていくことで、音響処理部４に与える音声データのデータ量を調整して、メモリの能力にあった音声合成処理を実現していくよう処理するものである。
【００７１】
一方、図１２に示す実施例では、男の声、女の声、子供の声、老人の声といった異なる声質の音声データを管理する複数の音声辞書２−ｉ（ｉ＝１〜ｎ）を備える構成を採るとともに、調整部７として、声質決定部７１０及び音声辞書選択部７０１から構成されるものを用いる構成を採っている。
【００７２】
このように構成される図１２の実施例では、メモリ機能検出部６１がメモリの容量又はメモリの使用状況を検出して、その検出結果のレベル値を求めると、声質決定部７１０は、メモリ機能検出部６１から高いメモリ能力を表示するレベル値が与えられるときには、メモリに余裕があることから、沢山の声質の音声データの展開を実現すべく複数の声質を決定し、また、低いメモリ能力を表示するレベル値が与えられるときには、メモリに余裕がないことから、例えば１つの声質の音声データの展開を実現すべく特定の声質を決定するというように、メモリ機能検出部６１の検出するレベル値に応じて音声データの声質を決定する。
【００７３】
そして、音声辞書選択部７０１は、この声質決定部７１０の決定結果を受けて、その決定された声質の音声データを管理する音声辞書２−ｉから対応の音声データを読み出して音声データバッファ９０に展開していく。
【００７４】
このようにして、図１２の実施例では、メモリの能力に応じて、音声データバッファ９０に展開する音声データの声質の種類数を変化させていくことで、音響処理部４に与える音声データのデータ量を調整して、メモリの能力にあった音声合成処理を実現していくよう処理するものである。
【００７５】
一方、図１３に示す実施例では、単一の単語辞書１を備える構成を採るとともに、調整部７として、複数の単語辞書インデックス７１１−ｉ（ｉ＝１〜ｍ）と、単語辞書インデックス選択部７１２と、単語辞書ダウンロード制御部７１３とから構成されるものを用いる構成を採っている。
【００７６】
このように構成される図１３の実施例では、メモリ機能検出部６１がメモリの容量又はメモリの使用状況を検出して、その検出結果のレベル値を求めると、単語辞書インデックス選択部７１２は、メモリ機能検出部６１から高いメモリ能力を表示するレベル値が与えられるときには、メモリに余裕があることから、高い品質の音声合成処理を実現する単語情報を指すインデックスを管理対象とする単語辞書インデックス７１１−ｉの使用を決定し、また、低いメモリ能力を表示するレベル値が与えられるときには、メモリに余裕がないことから、低い品質の音声合成処理を実現する単語情報を指すインデックスを管理対象とする単語辞書インデックス７１１−ｉの使用を決定するというように、メモリ機能検出部６１の検出するレベル値に応じて使用する単語辞書インデックス７１１−ｉを決定する。
【００７７】
そして、単語辞書ダウンロード制御部７１３は、この単語辞書インデックス選択部７１２の決定結果を受けて、単語辞書１から、その決定された単語辞書インデックス７１１−ｉの管理するインデックスの指す単語情報を読み出して単語情報バッファ８０に展開していく。
【００７８】
このようにして、図１３の実施例では、メモリの能力に応じて、単語情報バッファ８０に展開する単語情報の品質を変化させていくことで、言語処理部３に与える単語情報のデータ量を調整して、メモリの能力にあった音声合成処理を実現していくよう処理するものである。
【００７９】
一方、図１４に示す実施例では、単一の単語辞書１を備える構成を採るとともに、調整部７として、単語頻度テーブル７１４と、単語頻度閾値決定部７１５と、単語辞書ダウンロード制御部７１３とから構成されるものを用いる構成を採っている。
【００８０】
このように構成される図１４の実施例では、メモリ機能検出部６１がメモリの容量又はメモリの使用状況を検出して、その検出結果のレベル値を求めると、単語頻度閾値決定部７１５は、メモリ機能検出部６１から高いメモリ能力を表示するレベル値が与えられるときには、メモリに余裕があることから、沢山の単語情報の展開を実現すべく使用頻度の閾値として小さな値を決定し、また、低いメモリ能力を表示するレベル値が与えられるときには、メモリに余裕がないことから、少ない単語情報の展開を実現すべく使用頻度の閾値として大きな値を決定するというように、メモリ機能検出部６１の検出するレベル値に応じて単語情報の使用頻度の閾値を決定する。
そして、単語辞書ダウンロード制御部７１３は、この単語頻度閾値決定部７１５の決定結果を受けて、単語情報の頻度情報を管理する単語頻度テーブル７１４の管理データに従って、単語辞書１から、その決定された頻度閾値よりも大きな使用頻度を示す単語情報を読み出して単語情報バッファ８０に展開していく。
【００８１】
このようにして、図１４の実施例では、メモリの能力に応じて、単語情報バッファ８０に展開する単語情報の数を変化させていくことで、言語処理部３に与える単語情報のデータ量を調整して、メモリの能力にあった音声合成処理を実現していくよう処理するものである。
【００８２】
以上説明したように、図６ないし図１４の実施例では、メモリ機能検出部６１の検出結果に応じて、音響処理部４に与える音声データのデータ量や、言語処理部３に与える単語情報のデータ量を調整していくことで、メモリの能力にあった音声合成処理を実現していくよう処理するものである。
【００８３】
図１５ないし図１８に、検出部６として、二次記憶装置機能検出部６２を用いる構成の一実施例を図示する。
この二次記憶装置機能検出部６２は、例えば、実際にリード処理を実行することで、二次記憶装置のアクセス性能を検出するものであり、例えば、この検出結果を予め定められるレベル値で表現するよう処理することになる。
【００８４】
図１５に示す実施例では、単一の音声辞書２を備える構成を採るとともに、調整部７として、複数の音声辞書インデックス７０５−ｉ（ｉ＝１〜ｍ）と、音声辞書インデックス選択部７０６と、音声辞書ダウンロード制御部７０７とから構成されるものを用いる構成を採っている。
【００８５】
このように構成される図１５の実施例では、二次記憶装置機能検出部６２が音声辞書２の音声データをリードすることで、音声辞書２を展開する二次記憶装置のアクセス性能を検出して、その検出結果のレベル値を求めると、音声辞書インデックス選択部７０６は、二次記憶装置機能検出部６２から高速のアクセス性能を表示するレベル値が与えられるときには、その都度音声辞書２にアクセスすることでも対処できることから、低い品質の音声合成処理を実現する音声データを指すインデックスを管理対象とする音声辞書インデックス７０５−ｉの使用を決定し、また、低速のアクセス性能を表示するレベル値が与えられるときには、その都度音声辞書２にアクセスすることでは対処できないことから、高い品質の音声合成処理を実現する音声データを指すインデックスを管理対象とする音声辞書インデックス７０５−ｉの使用を決定するというように、二次記憶装置機能検出部６２の検出するレベル値に応じて使用する音声辞書インデックス７０５−ｉを決定する。
【００８６】
すなわち、音声辞書２を展開する二次記憶装置のアクセス性能が良いときには、例えば、音声データ「ＳＡ」にも兼用できる音声データ「Ａ」だけを指すインデックスを管理対象するような音声辞書インデックス７０５−ｉの使用を決定し、アクセス性能が悪いときには、例えば、音声データ「ＳＡ」と音声データ「Ａ」の双方を指すインデックスを管理するような音声辞書インデックス７０５−ｉの使用を決定するのである。
【００８７】
そして、音声辞書ダウンロード制御部７０７は、この音声辞書インデックス選択部７０６の決定結果を受けて、音声辞書２から、その決定された音声辞書インデックス７０５−ｉの管理するインデックスの指す音声データを読み出して音声データバッファ９０に展開していく。ここで、この構成を採るときにあって、音響処理部４は、音声データバッファ９０に高い品質の音声合成処理を実現するための音声データが展開されていないときには、その音声データを高速アクセスを実行する二次記憶装置の音声辞書２に直接アクセスしていくよう処理することになる。
【００８８】
このようにして、図１５の実施例では、二次記憶装置のアクセス性能に応じて、音声データバッファ９０に展開する音声データの品質を変化させていくことで、音響処理部４に与える音声データのデータ量を調整して、二次記憶装置のアクセス性能にあった音声合成処理を実現していくよう処理するものである。
【００８９】
一方、図１６に示す実施例では、単一の音声辞書２を備える構成を採るとともに、調整部７として、音声データ頻度テーブル７０８と、頻度閾値決定部７０９と、音声辞書ダウンロード制御部７０７とから構成されるものを用いる構成を採っている。
【００９０】
このように構成される図１６の実施例では、二次記憶装置機能検出部６２が上述のように音声辞書２を展開する二次記憶装置のアクセス性能を検出して、その検出結果のレベル値を求めると、頻度閾値決定部７０９は、二次記憶装置機能検出部６２から高速のアクセス性能を表示するレベル値が与えられるときには、その都度音声辞書２にアクセスすることでも対処できることから、少ない音声データの展開を実現すべく使用頻度の閾値として大きな値を決定し、また、低速のアクセス性能を表示するレベル値が与えられるときには、その都度音声辞書２にアクセスすることでは対処できないことから、沢山の音声データの展開を実現すべく使用頻度の閾値として小さな値を決定するというように、二次記憶装置機能検出部６２の検出するレベル値に応じて音声データの使用頻度の閾値を決定する。
【００９１】
そして、音声辞書ダウンロード制御部７０７は、この頻度閾値決定部７０９の決定結果を受けて、音声データの頻度情報を管理する音声データ頻度テーブル７０８の管理データに従って、音声辞書２から、その決定された頻度閾値よりも大きな使用頻度を示す音声データを読み出して音声データバッファ９０に展開していく。
【００９２】
このようにして、図１６の実施例では、二次記憶装置のアクセス性能に応じて、音声データバッファ９０に展開する音声データの数を変化させていくことで、音響処理部４に与える音声データのデータ量を調整して、二次記憶装置のアクセス性能にあった音声合成処理を実現していくよう処理するものである。
【００９３】
一方、図１７に示す実施例では、単一の単語辞書１を備える構成を採るとともに、調整部７として、複数の単語辞書インデックス７１１−ｉ（ｉ＝１〜ｍ）と、単語辞書インデックス選択部７１２と、単語辞書ダウンロード制御部７１３とから構成されるものを用いる構成を採っている。
【００９４】
このように構成される図１７の実施例では、二次記憶装置機能検出部６２が単語辞書１の単語情報をリードすることで、単語辞書１を展開する二次記憶装置のアクセス性能を検出して、その検出結果のレベル値を求めると、単語辞書インデックス選択部７１２は、二次記憶装置機能検出部６２から高速のアクセス性能を表示するレベル値が与えられるときには、その都度単語辞書１にアクセスすることでも対処できることから、低い品質の音声合成処理を実現する単語情報を指すインデックスを管理対象とする単語辞書インデックス７１１−ｉの使用を決定し、また、低速のアクセス性能を表示するレベル値が与えられるときには、その都度単語辞書１にアクセスすることでは対処できないことから、高い品質の音声合成処理を実現する単語情報を指すインデックスを管理対象とする単語辞書インデックス７１１−ｉの使用を決定するというように、二次記憶装置機能検出部６２の検出するレベル値に応じて使用する単語辞書インデックス７１１−ｉを決定する。
【００９５】
すなわち、単語辞書１を展開する二次記憶装置のアクセス性能が良いときには、主的な単語情報を指すインデックスを管理対象とする単語辞書インデックス７１１−ｉの使用を決定し、アクセス性能が悪いときには、この主的な単語情報と補足的な単語情報の双方を指すインデックスを管理対象とする単語辞書インデックス７１１−ｉの使用を決定するというように決定するのである。
【００９６】
そして、単語辞書ダウンロード制御部７１３は、この単語辞書インデックス選択部７１２の決定結果を受けて、単語辞書１から、その決定された単語辞書インデックス７１１−ｉの管理するインデックスの指す単語情報を読み出して単語情報バッファ８０に展開していく。ここで、この構成を採るときにあって、言語処理部３は、単語情報バッファ８０に高い品質の音声合成処理を実現するための単語情報が展開されていないときには、その単語情報を高速アクセスを実行する二次記憶装置の単語辞書１に直接アクセスしていくよう処理することになる。
【００９７】
一方、図１８に示す実施例では、単一の単語辞書１を備える構成を採るとともに、調整部７として、単語頻度テーブル７１４と、単語頻度閾値決定部７１５と、単語辞書ダウンロード制御部７１３とから構成されるものを用いる構成を採っている。
【００９８】
このように構成される図１８の実施例では、二次記憶装置機能検出部６２が上述のように単語辞書１を展開する二次記憶装置のアクセス性能を検出して、その検出結果のレベル値を求めると、単語頻度閾値決定部７１５は、二次記憶装置機能検出部６２から高速のアクセス性能を表示するレベル値が与えられるときには、その都度単語辞書１にアクセスすることでも対処できることから、少ない単語情報の展開を実現すべく使用頻度の閾値として大きな値を決定し、また、低速のアクセス性能を表示するレベル値が与えられるときには、その都度単語辞書１にアクセスすることでは対処できないことから、沢山の単語情報の展開を実現すべく使用頻度の閾値として小さな値を決定するというように、二次記憶装置機能検出部６２の検出するレベル値に応じて単語情報の使用頻度の閾値を決定する。
【００９９】
そして、単語辞書ダウンロード制御部７１３は、この単語頻度閾値決定部７１５の決定結果を受けて、単語情報の頻度情報を管理する単語頻度テーブル７１４の管理データに従って、単語辞書１から、その決定された頻度閾値よりも大きな使用頻度を示す単語情報を読み出して単語情報バッファ８０に展開していく。
【０１００】
このようにして、図１８の実施例では、二次記憶装置のアクセス性能に応じて、単語情報バッファ８０に展開する単語情報の数を変化させていくことで、言語処理部３に与える単語情報のデータ量を調整して、二次記憶装置のアクセス性能にあった音声合成処理を実現していくよう処理するものである。
【０１０１】
以上説明したように、図１５ないし図１８の実施例では、二次記憶装置機能検出部６２の検出結果に応じて、音響処理部４に与える音声データのデータ量や、言語処理部３に与える単語情報のデータ量を調整していくことで、単語辞書１や音声辞書２を展開する二次記憶装置のアクセス性能にあった音声合成処理を実現していくよう処理するものである。
【０１０２】
図１９及び図２０に、検出部６として、ＤＡ変換器サンプリング周波数検出部６３を用いる構成の一実施例を図示する。
このＤＡ変換器サンプリング周波数検出部６３は、例えば、オペレーティングシステムに問い合わせることで、ＤＡ変換器５のサンプリング周波数を検出することになる。
【０１０３】
図１９に示す実施例では、異なるサンプリング周波数の音声データを管理する複数の音声辞書２−ｉ（ｉ＝１〜ｎ）を備える構成を採るとともに、調整部７として、音声辞書選択部７０１から構成されるものを用いる構成を採っている。
【０１０４】
このように構成される図１９の実施例では、ＤＡ変換器サンプリング周波数検出部６３がＤＡ変換器５のサンプリング周波数を検出すると、音声辞書選択部７０１は、この検出結果を受けて、その検出されたサンプリング周波数の音声データを管理する音声辞書２−ｉから対応の音声データを読み出して音声データバッファ９０に展開していく。
【０１０５】
このようにして、図１９の実施例では、音声データバッファ９０に展開する音声データのサンプリング周波数をＤＡ変換器５に整合するものに変化させていくことで、ＤＡ変換器５にあった音声合成処理を実現していくよう処理するものである。
【０１０６】
一方、図２０に示す実施例では、例えば、４８ＫＨｚといった高いサンプリング周波数の音声データを管理する単一の音声辞書２を備える構成を採るとともに、調整部７として、ダウンサンプリング処理部７０２から構成されるものを用いる構成を採っている。
【０１０７】
このように構成される図２０の実施例では、ＤＡ変換器サンプリング周波数検出部６３がＤＡ変換器５のサンプリング周波数を検出すると、ダウンサンプリング処理部７０２は、この検出結果を受けて、例えば、ＤＡ変換器５のサンプリング周波数が４８ＫＨｚであるときには、音声辞書２に格納される音声データをそのまま読み出して音声データバッファ９０に展開し、また、例えば、１６ＫＨｚであるときには、音声辞書２に格納される音声データを１６ＫＨｚにダウンサンプリングしながら読み出して音声データバッファ９０に展開していく。
【０１０８】
このようにして、図２０の実施例では、音声データバッファ９０に展開する音声データのサンプリング周波数をＤＡ変換器５に整合するものに変化させていくことで、ＤＡ変換器５にあった音声合成処理を実現していくよう処理するものである。
【０１０９】
以上説明したように、図１９及び図２０の実施例では、ＤＡ変換器サンプリング周波数検出部６３の検出結果に応じて、音響処理部４に与える音声データのサンプリング周波数を調整していくことで、ＤＡ変換器５にあった音声合成処理を実現していくよう処理するものである。
【０１１０】
図２１及び図２２に、検出部６として、ＤＡ変換器量子化ビット検出部６４を用いる構成の一実施例を図示する。
このＤＡ変換器量子化ビット検出部６４は、例えば、オペレーティングシステムに問い合わせることで、ＤＡ変換器５の量子化ビット数を検出することになる。
【０１１１】
図２１に示す実施例では、異なる量子化ビット数の音声データを管理する複数の音声辞書２−ｉ（ｉ＝１〜ｎ）を備える構成を採るとともに、調整部７として、音声辞書選択部７０１から構成されるものを用いる構成を採っている。
【０１１２】
このように構成される図２１の実施例では、ＤＡ変換器量子化ビット検出部６４がＤＡ変換器５の量子化ビット数を検出すると、音声辞書選択部７０１は、この検出結果を受けて、その検出された量子化ビット数の音声データを管理する音声辞書２−ｉから対応の音声データを読み出して音声データバッファ９０に展開していく。
【０１１３】
このようにして、図２１の実施例では、音声データバッファ９０に展開する音声データの量子化ビット数をＤＡ変換器５に整合するものに変化させていくことで、ＤＡ変換器５にあった音声合成処理を実現していくよう処理するものである。
【０１１４】
一方、図２２に示す実施例では、例えば、１６ビットといった大きい量子化ビット数の音声データを管理する単一の音声辞書２を備える構成を採るとともに、調整部７として、量子化ビット変更部７０４から構成されるものを用いる構成を採っている。
【０１１５】
このように構成される図２２の実施例では、ＤＡ変換器量子化ビット検出部６４がＤＡ変換器５の量子化ビット数を検出すると、量子化ビット変更部７０４は、この検出結果を受けて、例えば、ＤＡ変換器５の量子化ビット数が１６ビットであるときには、音声辞書２に格納される音声データをそのまま読み出して音声データバッファ９０に展開し、また、例えば、８ビットであるときには、音声辞書２に格納される音声データを８ビットに変更しながら読み出して音声データバッファ９０に展開していく。
【０１１６】
このようにして、図２２の実施例では、音声データバッファ９０に展開する音声データの量子化ビット数をＤＡ変換器５に整合するものに変化させていくことで、ＤＡ変換器５にあった音声合成処理を実現していくよう処理するものである。
【０１１７】
以上説明したように、図２１及び図２２の実施例では、ＤＡ変換器量子化ビット検出部６４の検出結果に応じて、音響処理部４に与える音声データの量子化ビット数を調整していくことで、ＤＡ変換器５にあった音声合成処理を実現していくよう処理するものである。
【０１１８】
図２ないし図２２の実施例では、検出部６として、ＣＰＵ機能検出部６０、メモリ機能検出部６１、二次記憶装置機能検出部６２、ＤＡ変換器サンプリング周波数検出部６３、ＤＡ変換器量子化ビット検出部６４のいずれか１つを備える構成を採って、その検出部の検出結果に従って、音声データバッファ９０に展開する音声データのサンプリング周波数や量子化ビット数や数を変更したり、単語情報バッファ８０に展開する単語情報の数を変更するという構成を開示したが、本発明では、複数の検出部を備える構成を採ったり、音声データのサンプリング周波数と量子化ビット数とを同時に変更するというような複合的な構成を採ることも可能である。
【０１１９】
図２３ないし図２６に、そのような構成の一実施例を図示する。
図２３に示す実施例は、検出部６として、メモリ機能検出部６１／二次記憶装置機能検出部６２を備える構成を採るとともに、調整部７として、音声辞書ダウンロード制御部７０７と、音声データ頻度テーブル７０８と、頻度閾値決定部７０９とから構成されるものを用いる構成を採っている。
【０１２０】
このように構成される図２３の実施例では、頻度閾値決定部７０９は、メモリ機能検出部６１／二次記憶装置機能検出部６２の検出結果に応じて、音声データの使用頻度の閾値を決定する。例えば、二次記憶装置のアクセス性能が良くて、音声データバッファ９０に沢山の音声データを展開する必要がなくても、メモリ容量に余裕があるときには、沢山の音声データの展開を実現すべく使用頻度の閾値として小さな値を決定するというように、２つの検出部の検出結果を評価することで、音声データの使用頻度の閾値を決定するのである。
【０１２１】
そして、音声辞書ダウンロード制御部７０７は、この頻度閾値決定部７０９の決定結果を受けて、音声データ頻度テーブル７０８の管理データに従って、音声辞書２から、その決定された頻度閾値よりも大きな使用頻度を示す音声データを読み出して音声データバッファ９０に展開していく。
【０１２２】
一方、図２４に示す実施例では、検出部６として、メモリ機能検出部６１／二次記憶装置機能検出部６２を備える構成を採るとともに、調整部７として、単語辞書ダウンロード制御部７１３と、単語頻度テーブル７１４と、単語頻度閾値決定部７１５とから構成されるものを用いる構成を採っている。
【０１２３】
このように構成される図２４の実施例では、単語頻度閾値決定部７１５は、メモリ機能検出部６１／二次記憶装置機能検出部６２の検出結果に応じて、単語情報の使用頻度の閾値を決定する。例えば、二次記憶装置のアクセス性能が悪くて、メモリ容量に十分な余裕があるときには、最大限に沢山の音声データの展開を実現すべく使用頻度の閾値としてかなり小さな値を決定するというように、２つの検出部の検出結果を評価することで、単語情報の使用頻度の閾値を決定するのである。
【０１２４】
そして、単語辞書ダウンロード制御部７１３は、この単語頻度閾値決定部７１５の決定結果を受けて、単語頻度テーブル７１４の管理データに従って、単語辞書１から、その決定された頻度閾値よりも大きな使用頻度を示す単語情報を読み出して単語情報バッファ８０に展開していく。
【０１２５】
一方、図２５に示す実施例では、検出部６として、ＣＰＵ機能検出部６０／メモリ機能検出部６１を備える構成を採るとともに、調整部７として、サンプリング周波数決定部７００と、ダウンサンプリング処理部７０２と、音声辞書ダウンロード制御部７０７と、音声データ頻度テーブル７０８と、頻度閾値決定部７０９とから構成されるものを用いる構成を採っている。
【０１２６】
このように構成される図２５の実施例では、頻度閾値決定部７０９が、メモリ機能検出部６１の検出結果に応じて、音声データの使用頻度の閾値を決定し、この決定結果を受けて、音声辞書ダウンロード制御部７０７が、音声データ頻度テーブル７０８の管理データに従って、音声辞書２から、その決定された頻度閾値よりも大きな使用頻度を示す音声データを読み出していく。
【０１２７】
そして、サンプリング周波数決定部７００が、ＣＰＵ機能検出部６０／メモリ機能検出部６１の検出結果に応じて、音声データのサンプリング周波数を決定し、この決定結果を受けて、ダウンサンプリング処理部７０２が、音声辞書ダウンロード制御部７０７の読み出していく音声データをそのサンプリング周波数にダウンサンプリングして音声データバッファ９０に展開していく。
【０１２８】
一方、図２６に示す実施例では、検出部６として、ＣＰＵ機能検出部６０／メモリ機能検出部６１を備える構成を採るとともに、調整部７として、サンプリング周波数決定部７００と、ダウンサンプリング処理部７０２と、量子化ビット決定部７０３と、量子化ビット変更部７０４とから構成されるものを用いる構成を採っている。
【０１２９】
このように構成される図２６の実施例では、サンプリング周波数決定部７００が、ＣＰＵ機能検出部６０／メモリ機能検出部６１の検出結果に応じて、音声データのサンプリング周波数を決定し、この決定結果を受けて、ダウンサンプリング処理部７０２が、音声辞書２の音声データをそのサンプリング周波数にダウンサンプリングしながら読み出していく。
【０１３０】
そして、量子化ビット決定部７０３が、ＣＰＵ機能検出部６０／メモリ機能検出部６１の検出結果に応じて、音声データの量子化ビット数を決定し、この決定結果を受けて、量子化ビット変更部７０４が、ダウンサンプリング処理部７０２の読み出していく音声データをその量子化ビット数に変更して音声データバッファ９０に展開していく。
【０１３１】
このように、本発明では、検出部６として、ＣＰＵ機能検出部６０、メモリ機能検出部６１、二次記憶装置機能検出部６２、ＤＡ変換器サンプリング周波数検出部６３、ＤＡ変換器量子化ビット検出部６４の内の複数を備える構成を採って、それらの検出部の検出結果に従って、音声データバッファ９０に展開する音声データを調整したり、単語情報バッファ８０に展開する単語情報を調整したりする構成を採ることも可能なのである。
【０１３２】
このようにして音声データが音声データバッファ９０に展開されるときにあって、その展開される音声データのサンプリング周波数が、ＤＡ変換器５のサンプリング周波数と一致しないことで、音響処理部４の生成する合成音声信号のサンプリング周波数が、ＤＡ変換器５のサンプリング周波数と一致しないことが起きたり、その展開される音声データの量子化ビット数が、ＤＡ変換器５の量子化ビット数と一致しないことで、音響処理部４の生成する合成音声信号の量子化ビット数が、ＤＡ変換器５の量子化ビット数と一致しないことが起こる。
【０１３３】
図１で説明したビット調整部７ａは、ＤＡ変換器量子化ビット検出部６４の検出結果に従って、この量子化ビット数の不一致を検出すると、音響処理部４の生成する合成音声信号のビットデータをシフトすることで、合成音声信号の量子化ビット数がＤＡ変換器５のものと一致することになるようにと調整することになる。
【０１３４】
また、図１で説明した周波数調整部７ｂは、ＤＡ変換器サンプリング周波数検出部６３の検出結果に従って、このサンプリング周波数の不一致を検出すると、音響処理部４の生成する合成音声信号のビットデータをダウンサンプリングすること等で、合成音声信号のサンプリング周波数がＤＡ変換器５のものと一致することになるようにと調整することになる。
【０１３５】
本発明は、音声合成システムのソフトウェアを展開する計算機の持つハードウェア性能に適合するようにと、音声合成処理で用いられる辞書情報を変更していく構成を採ることを特徴とするものであり、これを実現するために、実施例では検出部６を備える構成を開示したが、本発明はこれに限られるものではなくて、検出部６の代わりに、対話処理に従って、ハードウェアの能力情報を設定する設定部を備えることで実現することも可能である。
【０１３６】
図示実施例について説明したが、本発明はこれに限定されるものではない。例えば、図２３ないし図２６に示した組み合わせの実施例はあくまで一例に過ぎないのである。
【０１３７】
【発明の効果】
以上説明したように、本発明では、音声合成システムのソフトウェアを展開する計算機の持つハードウェア性能に適合するようにと、音声合成処理で用いられる辞書情報を変更していく構成を採ることから、走行する計算機に最適となる音声合成処理を実現できるようになる。従って、ユーザは、手持ちの計算機を使って、快適な音声合成システムを構築できるようになる。
【図面の簡単な説明】
【図１】本発明の原理構成図である。
【図２】本発明の一実施例である。
【図３】本発明の一実施例である。
【図４】本発明の一実施例である。
【図５】本発明の一実施例である。
【図６】本発明の一実施例である。
【図７】本発明の一実施例である。
【図８】本発明の一実施例である。
【図９】本発明の一実施例である。
【図１０】本発明の一実施例である。
【図１１】本発明の一実施例である。
【図１２】本発明の一実施例である。
【図１３】本発明の一実施例である。
【図１４】本発明の一実施例である。
【図１５】本発明の一実施例である。
【図１６】本発明の一実施例である。
【図１７】本発明の一実施例である。
【図１８】本発明の一実施例である。
【図１９】本発明の一実施例である。
【図２０】本発明の一実施例である。
【図２１】本発明の一実施例である。
【図２２】本発明の一実施例である。
【図２３】本発明の一実施例である。
【図２４】本発明の一実施例である。
【図２５】本発明の一実施例である。
【図２６】本発明の一実施例である。
【図２７】音声合成システムの全体構成図である。
【符号の説明】
１単語辞書
２音声辞書
３言語処理部
４音響処理部
５ＤＡ変換器
６検出部
７調整部
７ａビット調整部
７ｂ周波数調整部
８単語情報展開域
９音声データ展開域
１００計算機

Claims

二次記憶装置に展開されて単語情報を管理する単語辞書と、二次記憶装置に展開されて音声データを管理する音声辞書と、入力テキストに対して、該単語辞書の管理データを使って音声合成のための言語処理を実行する言語処理部と、該言語処理部の処理結果を受けて、該音声辞書の管理データを使って入力テキストの合成音声信号を生成する音響処理部と、該音響処理部の生成する合成音声信号をハード的にアナログ信号に変換するＤＡ変換器とから構成される音声合成システムにおいて、
対話処理に従って、システムの走行する計算機の持つハードウェアの性能又は状態を設定する設定部と、
上記言語処理部に与える辞書情報を調整する調整部とを備え、
かつ、上記調整部は、
上記設定部の設定したハードウェアの性能又は状態に応じて、処理能力に合った形で上記言語処理部に与える単語情報の量に関する情報を決定する決定部と、
上記決定部の決定した単語情報量に従って、上記単語辞書から上記言語処理部に与える単語情報を読み出して、上記言語処理部がアクセスする単語情報展開域に展開する展開部とを備えることを、
特徴とする音声合成システム。
二次記憶装置に展開されて単語情報を管理する単語辞書と、二次記憶装置に展開されて音声データを管理する音声辞書と、入力テキストに対して、該単語辞書の管理データを使って音声合成のための言語処理を実行する言語処理部と、該言語処理部の処理結果を受けて、該音声辞書の管理データを使って入力テキストの合成音声信号を生成する音響処理部と、該音響処理部の生成する合成音声信号をハード的にアナログ信号に変換するＤＡ変換器とから構成される音声合成システムにおいて、
対話処理に従って、システムの走行する計算機の持つハードウェアの性能又は状態を設定する設定部と、
上記音響処理部に与える辞書情報を調整する調整部とを備え、
かつ、上記調整部は、
上記設定部の設定したハードウェアの性能又は状態に応じて、処理能力に合った形で上記音響処理部に与える音声データの質又は量に関する情報を決定する決定部と、
上記決定部の決定した音声データの質又は量に関する情報に従って、上記音声辞書から上記音響処理部に与える音声データを読み出して、上記音響処理部がアクセスする音声データ展開域に展開する展開部とを備えることを、
特徴とする音声合成システム。
請求項１又は２記載の音声合成システムにおいて、
上記設定部の設定するＤＡ変換器の量子化ビット数と、上記音響処理部の生成する合成音声信号の量子化ビット数とが一致しないときに、上記設定部の設定するＤＡ変換器の量子化ビット数に従って、上記音響処理部の生成する合成音声信号のビットデータを調整するビット調整部を備えることを、
特徴とする音声合成システム。
請求項１又は２記載の音声合成システムにおいて、
上記設定部の設定するＤＡ変換器のサンプリング周波数と、上記音響処理部の生成する合成音声信号のサンプリング周波数とが一致しないときに、上記設定部の設定するＤＡ変換器のサンプリング周波数に従って、上記音響処理部の生成する合成音声信号のサンプリング周波数を調整する周波数調整部を備えることを、
特徴とする音声合成システム。
二次記憶装置に展開されて単語情報を管理する単語辞書と、二次記憶装置に展開されて音声データを管理する音声辞書と、入力テキストに対して、該単語辞書の管理データを使って音声合成のための言語処理を実行する言語処理部と、該言語処理部の処理結果を受けて、該音声辞書の管理データを使って入力テキストの合成音声信号を生成する音響処理部と、該音響処理部の生成する合成音声信号をハード的にアナログ信号に変換するＤＡ変換器とから構成される音声合成システムにおいて、
システムの走行する計算機の持つハードウェアの性能又は状態を検出する検出部と、
上記言語処理部に与える辞書情報を調整する調整部とを備え、
かつ、上記調整部は、
上記検出部の検出したハードウェアの性能又は状態に応じて、処理能力に合った形で上記言語処理部に与える単語情報の量に関する情報を決定する決定部と、
上記決定部の決定した単語情報量に従って、上記単語辞書から上記言語処理部に与える単語情報を読み出して、上記言語処理部がアクセスする単語情報展開域に展開する展開部とを備えることを、
特徴とする音声合成システム。
二次記憶装置に展開されて単語情報を管理する単語辞書と、二次記憶装置に展開されて音声データを管理する音声辞書と、入力テキストに対して、該単語辞書の管理データを使って音声合成のための言語処理を実行する言語処理部と、該言語処理部の処理結果を受けて、該音声辞書の管理データを使って入力テキストの合成音声信号を生成する音響処理部と、該音響処理部の生成する合成音声信号をハード的にアナログ信号に変換するＤＡ変換器とから構成される音声合成システムにおいて、
システムの走行する計算機の持つハードウェアの性能又は状態を検出する検出部と、
上記音響処理部に与える辞書情報を調整する調整部とを備え、
かつ、上記調整部は、
上記検出部の検出したハードウェアの性能又は状態に応じて、処理能力に合った形で上記音響処理部に与える音声データの質又は量に関する情報を決定する決定部と、
上記決定部の決定した音声データの質又は量に関する情報に従って、上記音声辞書から上記音響処理部に与える音声データを読み出して、上記音響処理部がアクセスする音声データ展開域に展開する展開部とを備えることを、
特徴とする音声合成システム。
請求項５又は６記載の音声合成システムにおいて、
上記検出部として、ＣＰＵの性能又はＣＰＵの負荷を検出するＣＰＵ機能検出部と、メモリの容量又はメモリの使用状況を検出するメモリ機能検出部と、二次記憶装置のアクセス性能を検出する二次記憶装置機能検出部と、ＤＡ変換器のＤＡ変換性能を検出するＤＡ変換機能検出部という４つの検出部の全てあるいは一部が備えられるよう構成されることを、
特徴とする音声合成システム。
請求項５又は６記載の音声合成システムにおいて、
上記検出部として、ＤＡ変換器のＤＡ変換性能を検出するＤＡ変換機能検出部が備えられ、
かつ、上記ＤＡ変換機能検出部の検出するＤＡ変換器の量子化ビット数と、上記音響処理部の生成する合成音声信号の量子化ビット数とが一致しないときに、上記ＤＡ変換機能検出部の検出する量子化ビット数に従って、上記音響処理部の生成する合成音声信号のビットデータを調整するビット調整部を備えることを、
特徴とする音声合成システム。
請求項５又は６記載の音声合成システムにおいて、
上記検出部として、ＤＡ変換器のＤＡ変換性能を検出するＤＡ変換機能検出部が備えられ、
かつ、上記ＤＡ変換機能検出部の検出するＤＡ変換器のサンプリング周波数と、上記音響処理部の生成する合成音声信号のサンプリング周波数とが一致しないときに、上記ＤＡ変換機能検出部の検出するサンプリング周波数に従って、上記音響処理部の生成する合成音声信号のサンプリング周波数を調整する周波数調整部を備えることを、
特徴とする音声合成システム。