JP2004170887A

JP2004170887A - データ処理システム及びデータ格納方法

Info

Publication number: JP2004170887A
Application number: JP2002339756A
Authority: JP
Inventors: Masahiro Rikuno; 将弘陸野; Toshiaki Fukada; 俊明深田
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2002-11-22
Filing date: 2002-11-22
Publication date: 2004-06-17

Abstract

【課題】サーバからクライアントへ、参照データのデータ量を縮小して送信しても、通信状況によっては中断されてしまうこともあり、クライアントで安定した処理を行えないことがあった。
【解決手段】サーバにおいて、クライアントからの要求に応じて、格納手段に格納された所定の参照データを該クライアントへ送信し、クライアントにおいて、サーバから受信した前記参照データを参照してデータ処理を行うデータ処理システムにおいて、前記格納手段が例えば音響モデルを格納する場合、データ処理の際の重要度に応じて、音素環境に依存しないモデル、依存するモデルの順に構成し、該依存するモデルについては出現頻度順の並びで、格納する。
【選択図】図２

Description

【０００１】
【発明の属する技術分野】
本発明は、ダウンロードした参照データに基づく処理を行うデータ処理システム及び該システムにおけるデータ格納方法に関する。
【０００２】
【従来の技術】
近年の通信手段の発達に伴い、画像や音声等、多種多様な形態のデータを送受信する機会が増えている。しかし、特に大容量のデータを送信する場合には、通信状況によっては全データの受信（ダウンロード）が完了する前に、通信そのものが終了してしまうことが危惧される。このような場合に備え、送信データの容量を縮小してから送信する方法が知られている。
【０００３】
【発明が解決しようとする課題】
しかしながら、上記従来のデータ容量を縮小して送信を行う通信方法においても、以下のような問題があった。
【０００４】
データ量を縮小して送信しても、全データが完全に受信される可能性が高まったに過ぎず、通信の安定度に対するデータの安全性が確保されるものではない。すなわち、通信状況によってはダウンロードが途中で止まってしまうこともあり得る。
【０００５】
本発明は上記問題を解決するためになされたものであり、クライアントにおいて、サーバからダウンロードした参照データを用いたデータ処理を行う際に、ダウンロードが中断した場合でも最低限の処理を実行可能とするデータ処理システム及び該システムにおけるデータ格納方法を提供することを目的とする。
【０００６】
【課題を解決するための手段】
上記目的を達成するための一手段として、本発明のデータ処理システムは以下の構成を備える。
【０００７】
すなわち、クライアントとサーバからなるデータ処理システムであって、前記クライアントは、前記サーバから所定の参照データを受信する受信手段と、前記参照データを参照してデータ処理を行うデータ処理手段と、を有し、前記サーバは、前記参照データを前記データ処理手段における重要度に応じたデータ順で格納する格納手段と、前記クライアントからの要求に応じて前記格納手段に格納された参照データを前記クライアントへ送信する送信手段と、を有することを特徴とする。
【０００８】
例えば、前記格納手段は、前記参照データを前記データ処理手段における重要度に依存する上位構成から下位構成へ順次格納することを特徴とする。
【０００９】
【発明の実施の形態】
以下、本発明に係る一実施形態について、図面を参照して詳細に説明する。
【００１０】
＜第１実施形態＞
本実施形態は、入力される音声を認識する音声認識システムに適用される。図１は、本実施形態の音声認識システムの構成を示すブロック図である。同図において、１０４はネットワークであり、その左側の構成がクライアントを、右側構成がサーバを示す。
【００１１】
クライアント側では、サーバから辞書等を受信する受信部１０１と、辞書等を記憶する記憶部１０２、ダウンロードした辞書等を用いて音声合成あるいは音声認識または言語処理を行う処理部１０３より構成される。
【００１２】
サーバ側では、クライアントからの要求に対して、ネットワーク１０４を介して辞書等を送信する送信部１０５、クライアント側で音声認識処理等を行う処理部１０３において必要となるデータ（音響モデル、言語モデル、発音辞書など）により構成されるモデル辞書データ１０６を有する。
【００１３】
本実施形態においては、ネットワーク１０４への接続機能を有するクライアント機器において音声認識のアプリケーションを使用する際に、必要に応じて音響モデル、言語モデルなどのモデル辞書データ１０６を、ネットワーク１０４を介してサーバからダウンロードする例について説明する。
【００１４】
クライアントが処理部１０３においてアプリケーションを使用する際に、サーバに対して、使用するモデル辞書データ１０６を受信部１０１より要求する。するとサーバ側では、クライアントの処理部１０３で行われる処理、任意のデータをモデル辞書データ１０６より選択して送信部１０５に送り、該データはネットワーク１０４を介してクライアントの受信部１０１に送られる。するとクライアント側では、受信部１０１で受信したモデル辞書データを記憶部１０２に記憶し、処理部１０３において該モデル辞書データを用いた音声認識処理を行う。
【００１５】
ここで上記従来例においても説明したように、サーバからクライアントへモデル辞書データ１０６を送信する場合に、ネットワーク１０４を含む通信環境によっては、ダウンロードが不完全なままで通信が終了してしまう場合がある。そこで本実施形態においては、モデル辞書データ１０６を以下に示すような構造で、サーバ側に保存しておく。以下、本実施形態におけるモデル辞書データ１０６のデータ構造例を示す。
【００１６】
モデル辞書データ１０６が音響モデルである場合には、音素環境を考慮しない音素モデル、音素環境を考慮した音素モデル、等の順に並べる。具体的には、例えば図２に示すように、モノフォン、トライフォンなどの順にデータを配置しておく。ここで各データフォーマットとしては例えばＨＭＭにより構成され、音素名、平均分散などを含むものとする。またモノフォンの並びとしては例えば、ａ，ｉ，ｕ，ｅ，ｏのような母音順としてもよい。またトライフォンであれば、音声認識において出現頻度の高い音素の順に並べれば良い。なお、出現頻度の決定方法としては例えば、予め言語コーパスなどのデータを用いて出現頻度をサーバ側で計算しておけば良い。
【００１７】
また、モデル辞書データ１０６が言語モデルである場合には、隣接単語を考慮しないモデル、隣接単語を考慮したモデル、等の順に並べる。例えば図３に示すように、言語モデルがＮグラムモデルで構成されている場合には、ユニグラム、バイグラム、トライグラム・・・などの順に並べる。ここで例えばユニグラムに含まれる情報としては、表記、読み、確率値などを含むとする。また、バイグラムやトライグラムなどの場合には、頻度情報を用いて内部の単語を並べておく。なお、モデルを並べる際の頻度情報としては、音響モデルの場合と同様に言語コーパスなどに基づく出現頻度情報が用いられる。
【００１８】
また、モデル辞書データ１０６が発音辞書である場合には、構成する発音辞書の中で頻度順に並べる。辞書内部に含まれる情報としては、図４に示すように、読み、表記、ＩＤ情報などがある。辞書内の単語を並べる際の頻度情報としては、言語コーパスなどに基づく出現頻度情報が用いられる。
【００１９】
クライアント側の処理部１０３においては、通信エラー等の発生に伴ってデータ受信が途中で終了していた場合、受信したデータ構造を解析し、該データのどこまでが使用可能であるかを調べる。そして使用可能なデータのみを読み込んで、これを用いた音声認識処理を行う。
【００２０】
以上説明したように本実施形態によれば、サーバからクライアントへダウンロードされる音声認識用のモデル辞書データを、最低限必要な要素順による構成としておくことにより、ダウンロードが中断された場合でも、クライアント側において音声認識処理を動作させることができる。
【００２１】
＜第２実施形態＞
以下、本発明に係る第２実施形態について説明する。
【００２２】
第２実施形態は、テキストを音声に変換する音声合成システムに適用される。第２実施形態における音声合成システムの構成は、上述した第１実施形態において図１に示した構成とほぼ同様である。ただし、クライアント側の処理部１０３において、第１実施形態で示した音声認識処理に代えて、音声合成処理を行うことを特徴とする。また、サーバ側のモデル辞書データ１０６は、クライアント側で音声合成処理を行う処理部１０３において必要となるデータ（言語辞書、波形辞書、言語モデル、韻律辞書など）を有する。
【００２３】
第２実施形態においては、ネットワーク１０４への接続機能を有するクライアント機器において音声合成のアプリケーションを使用する際に、必要に応じて言語辞書、波形辞書、言語モデル、韻律辞書などのモデル辞書データ１０６を、ネットワーク１０４を介してサーバからダウンロードする例について説明する。
【００２４】
なお、クライアントがサーバからモデル辞書データ１０６をダウンロードする方法は、上述した第１実施形態と同様であるため、ここでは詳細な説明を省略する。
【００２５】
第２実施形態におけるモデル辞書データ１０６は、以下のような構造によってサーバに保持されていることを特徴とする。
【００２６】
モデル辞書データ１０６が言語モデルである場合には、上述した第１実施形態と同様に例えば図３に示すように、隣接単語を考慮しないモデル、隣接単語を考慮したモデル、等の順に並べる。
【００２７】
また、モデル辞書データ１０６が言語辞書である場合には、構成する言語辞書の中で頻度順に並べる。例えば図５に示すように、単漢辞書、固有名詞辞書、などの順に並べておく。辞書内部に含まれる情報としては、読み、表記、品詞情報などがある。辞書内の単語を並べる際の頻度情報としては、言語コーパスなどに基づく出現頻度情報が用いられる。
【００２８】
また、モデル辞書データ１０６が波形辞書である場合には、音素環境を考慮しない音素モデル、音素環境を考慮した音素モデルなどの順に並べる。例えば図６に示すように、モノフォン、ダイフォン、の順に辞書を配置しておく。そして各音素の構成要素として、音素名、波形、音素境界情報、ピッチマーク情報などが含まれるとする。また、波形辞書における音素も頻度順に並べておく。辞書内の波形を並べる際の頻度情報としては、言語コーパスなどに基づく出現頻度情報が用いられる。
【００２９】
また、モデル辞書データ１０６が韻律辞書であれば、環境を考慮しないモデル、環境を考慮したモデルなどの順に並べる。韻律辞書の構成要素としては、基本周波数、継続時間長、パワーなどが辞書に含まれ、基本周波数においては図７に示すように、モーラ位置、アクセント型、モーラ数、ｆ０パラメータ、などが含まれる。辞書内の構成要素を並べる際の頻度情報としては、言語コーパスなどに基づく出現頻度情報が用いられる。
【００３０】
第２実施形態におけるクライアント側の処理部１０３においては、通信エラー等の発生に伴ってデータ受信が途中で終了していた場合、第１実施形態と同様に、受信したデータの使用可能範囲を調べて読み込むことによって、音声合成処理を行う。
【００３１】
以上説明したように第２実施形態によれば、サーバからクライアントへダウンロードされる音声合成用のモデル辞書データを、最低限必要な要素順による構成としておくことにより、ダウンロードが中断された場合でも、クライアント側において音声合成処理を動作させることができる。
【００３２】
＜第３実施形態＞
以下、本発明に係る第３実施形態について説明する。
【００３３】
第３実施形態は、テキストを解析する言語処理システムに適用される。第３実施形態における言語処理システムの構成は、上述した第１実施形態において図１に示した構成とほぼ同様である。ただし、クライアント側の処理部１０３において、第１実施形態で示した音声認識処理に代えて、言語処理を行うことを特徴とする。また、サーバ側のモデル辞書データ１０６は、クライアント側で言語処理を行う処理部１０３において必要となるデータ（言語辞書、言語モデルなど）を有する。
【００３４】
第３実施形態においては、ネットワーク１０４への接続機能を有するクライアント機器において言語処理のアプリケーションを使用する際に、必要に応じて言語辞書、言語モデルなどのモデル辞書データ１０６を、ネットワーク１０４を介してサーバからダウンロードする例について説明する。
【００３５】
なお、クライアントがサーバからモデル辞書データ１０６をダウンロードする方法は、上述した第１実施形態と同様であるため、ここでは詳細な説明を省略する。
【００３６】
第３実施形態におけるモデル辞書データ１０６は、以下のような構造によってサーバに保持されていることを特徴とする。
【００３７】
モデル辞書データ１０６が言語モデルである場合には、上述した第１実施形態と同様に例えば図３に示すように、隣接単語を考慮しないモデル、隣接単語を考慮したモデル、等の順に並べる。
【００３８】
また、モデル辞書データ１０６が言語辞書である場合には、上述した第２実施形態と同様に、例えば図５に示すような、構成する言語辞書の中での頻度順に並べる。
【００３９】
第３実施形態におけるクライアント側の処理部１０３においては、通信エラー等の発生に伴ってデータ受信が途中で終了していた場合、第１実施形態と同様に、受信したデータの使用可能範囲を調べて読み込むことによって、言語処理を行う。
【００４０】
以上説明したように第３実施形態によれば、サーバからクライアントへダウンロードされる言語処理用のモデル辞書データを、最低限必要な要素順による構成としておくことにより、ダウンロードが中断された場合でも、クライアント側において言語処理を動作させることができる。
【００４１】
＜第４実施形態＞
以下、本発明に係る第４実施形態について説明する。
【００４２】
第４実施形態は、音声認識処理、音声合成処理、言語処理等を行う音声処理システムに適用される。第４実施形態における音声処理システムの構成は、上述した第１実施形態において図１に示した構成とほぼ同様であるが、サーバ側のモデル辞書データ１０６として、クライアント側の処理部１０３で必要となる複数種類のデータ（言語辞書、言語モデルなど）を、その主要部から順次合成した複合構造とすることを特徴とする。
【００４３】
以下、クライアントにおいてディクテーションの音声認識処理（聞き取り）を行う場合を例として説明する。
【００４４】
クライアントのユーザがディクテーションの音声認識を行いたい場合、サーバに対して音声認識用データのダウンロードを促す。ここで、ディクテーションの音声認識に必要なモデル辞書データ１０６として、音響モデル、言語モデルの順に個別にダウンロードしていくと仮定する。この場合、ネットワークの不具合等によって、音響モデルのダウンロード途中で通信が途絶えてしまうと、クライアントの処理部１０３において音声認識のアプリケーションを動作させることができない。そこで第４実施形態においては、ダウンロードされるモデル辞書データ１０６の構造を、以下に示すようにしておく。
【００４５】
すなわち、モデル辞書データ１０６を音響モデル、言語モデル等の各モデル辞書順、例えば、まず音響モデルの音素環境に依存しないデータ、次に言語モデルの隣接単語を考慮しないデータ、のように、第１実施形態で示した各構造の上位部分から順に、構成していく。
【００４６】
例えば、モデル辞書データ１０６が音声認識に関するデータであれば、図８に示すように、音響モデルのモノフォン、言語モデルのユニグラム、つぎに音響モデルのトライフォン、言語モデルのバイグラム・・・などの順に、データを構成していく。なお、音響モデルと言語モデルの並び順は図８に示す例に限定されるものではなく、まず言語モデル、次に音響モデル、などの順であっても良い。また、モデル辞書データ１０６を構成するデータ種類も、音響モデルと言語モデルの２種類に限定されるものではなく、発音辞書などを含んでいても良い。
【００４７】
また、クライアント側において音声合成処理を行う場合にも同様に、音声合成用のデータとして言語辞書および波形辞書が必要であれば、モデル辞書データ１０６を図９に示すように、言語辞書の単漢データ、波形辞書の音素環境に依存しないモノフォンデータ、言語辞書の固有名詞、波形辞書の音素環境に依存するバイフォンデータ・・・のように、各辞書構造の上位部分から順次並べた複合構成とする。なお、この場合も、言語辞書と波形辞書の並び順は図９に示す例に限定されるものではなく、また、データ種類もこの２種類に限定されず、韻律辞書や言語モデルなどを含んでいても良い。
【００４８】
また、クライアント側において言語処理を行う場合にも同様に、言語処理用のデータとして言語モデルや韻律辞書が必要であれば、モデル辞書データ１０６をこれらの複合構成とする。
【００４９】
モデル辞書データ１０６を以上のような複合構成とすることにより、サーバからクライアントへモデル辞書データ１０６（音響モデル、言語モデル、言語辞書、波形辞書など）を送信し、クライアントでは受信したモデル辞書データ１０６に基づいて、各種音声処理（音声認識、音声合成、言語処理）を行う。
【００５０】
第４実施形態においても上述した第１実施形態と同様に、クライアント側の処理部１０３では、受信したデータ構造の使用可能範囲を調べて読み込むことによって、各種音声処理を行う。
【００５１】
以上説明したように第４実施形態によれば、サーバからクライアントへダウンロードされる音声処理用のモデル辞書データを、該処理に必要となる複数種類のデータの複合構造としておくことにより、ダウンロードが中断された場合でも、クライアント側において音声処理を動作させることができる。
【００５２】
＜第５実施形態＞
以下、本発明に係る第５実施形態について説明する。
【００５３】
第５実施形態は、音声認識処理、音声合成処理、言語処理等を行う音声処理システムに適用される。第５実施形態における音声処理システムの構成は、上述した第１実施形態において図１に示した構成とほぼ同様であるが、クライアントの機器のリソースに応じて、サーバからダウンロードするモデル辞書データ１０６のデータ量を自動的に変更することを特徴とする。
【００５４】
以下、第５実施形態においてクライアントがサーバからモデル辞書データ１０６を取得する手順を、図１０のフローチャートを用いて説明する。
【００５５】
まず、クライアントからサーバへ、ダウンロードを行う旨のメッセージを送ると（Ｓ２０１）、サーバはクライアントにその機器情報を問い合わせる（Ｓ２０２）。するとクライアントはサーバへ機器情報を送信し、サーバはクライアントからの機器情報を受け取る（Ｓ２０３）。ここで、クライアントにおける機器情報としては例えば、クライアント内で使用可能な記憶容量などの情報であるとする。
【００５６】
するとサーバは、クライアントから受け取った機器情報に基づいて、ダウンロード可能なモデル辞書データ１０６のサイズを決定する（Ｓ２０４）。例えば、クライアントの機器情報として、クライアント内でモデル辞書データ１０６用として使用可能な記憶容量が設定されていれば、該記憶容量に基づいてダウンロード可能サイズを算出する。
【００５７】
そしてサーバにおいては、算出したダウンロード可能サイズと取得されるモデル辞書データ１０６のサイズを比較し、モデル辞書データ１０６がダウンロード可能サイズ内であれば、該ダウンロード可能サイズをそのままダウンロードサイズとして決定する。一方、モデル辞書データ１０６のダウンロード可能サイズ分について、その一部が使用不可能である場合には、使用可能なデータサイズのみを、ダウンロードサイズとして決定する。
【００５８】
以上のように決定されたダウンロードサイズに従い、サーバはクライアントへモデル辞書データ１０６を送信する（Ｓ２０５）。
【００５９】
なお、ダウンロード対象となるモデル辞書データ１０６としては、上述した第１，第２及び第３実施形態のような構造であってもよいし、第４実施形態のように２種類以上のデータからなる複合構造であってもよい。例えば第１実施形態で示したようにクライアントにおいて音声認識を行う場合、サーバはモデル辞書データ１０６として、音響モデル、言語モデルのそれぞれを順次送信する。
【００６０】
以上説明したように第５実施形態によれば、クライアントの機器情報に応じて、サーバからダウンロードするモデル辞書データ１０６のデータ量を自動的に調整することによって、ダウンロードされるモデル辞書データを、必要最低限に留めることができる。これにより、ダウンロードの中断によりクライアント側で処理不具合が発生する可能性を、最小限とすることができる。
【００６１】
＜第６実施形態＞
以下、本発明に係る第６実施形態について説明する。
【００６２】
第６実施形態は、音声認識処理、音声合成処理、言語処理等を行う音声処理システムに適用される。第６実施形態における音声処理システムの構成は、上述した第１実施形態において図１に示した構成とほぼ同様であるが、サーバからダウンロードするモデル辞書データ１０６のデータ量を、クライアントのユーザが指定することを特徴とする。
【００６３】
以下、第６実施形態においてクライアントがサーバからモデル辞書データ１０６を取得する手順について説明する。
【００６４】
まずクライアントからサーバへ、ダウンロードを行う旨のメッセージを送る。するとサーバは、クライアントにモデル辞書データの使用サイズを問い合わせ、クライアントは該問い合わせに応じて、サーバへダウンロードサイズを送信する。するとサーバは、クライアントから受け取ったダウンロードサイズに基づいて、モデル辞書データ１０６を送信する。
【００６５】
クライアントからサーバへのダウンロードサイズの通知は、例えば図１１に示すようなダイアログによって、ダウンロード可能なサイズを種々提示し、ユーザが選択することによって行われる。同図の例では、モデル辞書データ１０６として音響モデルをダウンロードする場合に、モノフォンのみのダウンロードであれば１２Ｋバイトが、モノフォンとトライフォンをダウンロードするのであれば、３つのレベル毎にそれぞれ１０００Ｋバイト，２０００Ｋバイト，５０００Ｋバイトが、ダウンロード可能サイズとしてユーザに提示される。なお、これらのダウンロードサイズは、サーバ側において予め複数種類を設定しておいてもよいし、第５実施形態のようにクライアント機器情報に基づいて複数種類を設定しても良い。
【００６６】
また、上述した第５実施形態で説明したように、クライアントの機器情報に基づいて、ダウンロードするモデル辞書データ１０６のデータ量を提示しても良い。
【００６７】
なお、ダウンロード対象となるモデル辞書データ１０６としては、上述した第１，第２及び第３実施形態のような構造であってもよいし、第４実施形態のように２種類以上のデータからなる複合構造であってもよい。
【００６８】
以上説明したように第６実施形態によれば、クライアント側のユーザが、サーバからダウンロードするモデル辞書データ１０６のデータ量を指定することができる。これにより、ユーザにとって最低限のモデル辞書データ１０６をダウンロードすることができる。
【００６９】
＜第７実施形態＞
以下、本発明に係る第７実施形態について説明する。
【００７０】
第７実施形態は、音声認識処理、音声合成処理、言語処理等を行う音声処理システムに適用される。第７実施形態における音声処理システムの構成は、上述した第１実施形態において図１に示した構成とほぼ同様であり、モデル辞書データ１０６の構造も、第１実施形態と同様であるとする。
【００７１】
第７実施形態においては、サーバからモデル辞書データ１０６をダウンロードする際に、その進行状況を段階的にクライアントへ通知することを特徴とする。例えば、モデル辞書データ１０６が音響モデルであれば、第１実施形態と同様にモノフォン、トライフォンの順にクライアントへ送信されるが、その状況を段階的にユーザに通知する。
【００７２】
具体的には、図１２に示すダイアログ等を用いて、モノフォンのダウンロードが終了した時点で、ユーザにモノフォン完了を伝える。また、トライフォンを予め複数段階に分けておき、１段階のダウンロードが終了した時点でユーザに通知する。なお、このダウンロード終了が通知された時点で、ユーザはダウンロードの終了を指示することも可能であり、この場合、ダウンロード途中で終了可能である旨を報知しても良い。なお、ダウンロードの複数段階としては、モデル辞書データ１０６の要素種ごとに限らず、サイズや認識性能によって段階を分けても良い。
【００７３】
なお、ダウンロード対象となるモデル辞書データ１０６としては、上述した第１，第２及び第３実施形態のような構造であってもよいし、第４実施形態のように２種類以上のデータからなる複合構造であってもよい。
【００７４】
以上説明したように第７実施形態によれば、クライアント側のユーザは、サーバからモデル辞書データ１０６をダウンロードする際に、その進行状況を把握することができ、操作性が向上する。また、ダウンロードが中断してしまった場合でも、どこまでダウンロードできたかをユーザが把握できるため、クライアント側において最低限の処理を行うために再度ダウンロードすべきか否かを、適切に判断することができる。
【００７５】
【発明の効果】
以上説明したように本発明によれば、クライアントにおいて、サーバからダウンロードした参照データを用いたデータ処理を行う際に、ダウンロードが中断した場合でも最低限の処理を実行することができる。
【図面の簡単な説明】
【図１】本発明に係る一実施形態におけるシステム構成を示すブロック図である。
【図２】モデル辞書データとして音響モデルを格納する際の構成例を示す図である。
【図３】モデル辞書データとして言語モデルを格納する際の構成例を示す図である。
【図４】モデル辞書データとして発話辞書を格納する際の構成例を示す図である。
【図５】モデル辞書データとして言語辞書を格納する際の構成例を示す図である。
【図６】モデル辞書データとして波形辞書を格納する際の構成例を示す図である。
【図７】モデル辞書データとして韻律辞書を格納する際の構成例を示す図である。
【図８】モデル辞書データとして音声認識用の複合データを格納する際の構成例を示す図である。
【図９】モデル辞書データとして音声合成用の複合データを格納する際の構成例を示す図である。
【図１０】ダウンロードサイズの自動決定処理を示すフローチャートである。
【図１１】ダウンロードサイズの設定ダイアログ例を示す図である。
【図１２】ダウンロード状況の通知ダイアログ例を示す図である。
【符号の説明】
１０１受信部
１０２記憶部
１０３処理部
１０４ネットワーク
１０５送信部
１０６モデル辞書データ

Claims

クライアントとサーバからなるデータ処理システムであって、
前記クライアントは、
前記サーバから所定の参照データを受信する受信手段と、
前記参照データを参照してデータ処理を行うデータ処理手段と、を有し、
前記サーバは、
前記参照データを前記データ処理手段における重要度に応じたデータ順で格納する格納手段と、
前記クライアントからの要求に応じて前記格納手段に格納された参照データを前記クライアントへ送信する送信手段と、
を有することを特徴とするデータ処理システム。
前記格納手段は、前記参照データを前記データ処理手段における重要度に依存する上位構成から下位構成へ順次格納することを特徴とする請求項１記載のデータ処理システム。
前記データ処理手段は、入力される音声を認識する音声認識処理を行い、
前記格納手段は、前記参照データとして音響モデル、言語モデル、発音辞書の少なくとも１つを格納することを特徴とする請求項１記載のデータ処理システム。
前記データ処理手段は、テキストを音声に変換する音声合成処理を行い、
前記格納手段は、言語辞書、言語モデル、波形辞書、韻律辞書の少なくとも１つを格納することを特徴とする請求項１記載のデータ処理システム。
前記データ処理手段は、テキストを解析する言語処理を行い、
前記格納手段は、言語辞書、言語モデルの少なくとも１つを格納することを特徴とする請求項１記載のデータ処理システム。
前記格納手段は、音響モデルを、音素環境に依存しないデータ、依存するデータの順に構成し、該依存するデータについては出現頻度順の並びで、格納することを特徴とする請求項２記載のデータ処理システム。
前記格納手段は、言語モデルを、隣接単語あるいはクラスを考慮しないデータ、考慮するデータの順に構成し、該考慮するデータについては出現頻度順の並びで、格納することを特徴とする請求項２記載のデータ処理システム。
前記格納手段は、波形辞書を、音素環境に依存しないデータ、依存するデータの順に構成し、該依存するデータについては出現頻度順の並びで、格納することを特徴とする請求項２記載のデータ処理システム。
前記格納手段は、言語辞書を、単漢、固有名詞の順に構成し、固有名詞については出現頻度順の並びで、格納することを特徴とする請求項２記載のデータ処理システム。
前記格納手段は、発音辞書を、出現頻度順の並びで格納することを特徴とする請求項２記載のデータ処理システム。
前記格納手段は、韻律辞書を、環境に依存しないデータ、依存するデータの順に構成し、該依存するデータについては出現頻度順の並びで、格納することを特徴とする請求項２記載のデータ処理システム。
前記格納手段は、複数種類の前記参照データからなる複合データを格納することを特徴とする請求項２記載のデータ処理システム。
前記複合データは、前記参照データの前記上位構成から順次、該参照データの種類毎に並べた構成であることを特徴とする請求項１２記載のデータ処理システム。
前記複合データは、音響モデルおよび言語モデルによって構成されることを特徴とする請求項１３記載のデータ処理システム。
前記複合データは、言語辞書および波形辞書によって構成されることを特徴とする請求項１３記載のデータ処理システム。
前記サーバはさらに、
前記クライアントの機器情報に基づき、該クライアントへ送信すべきデータサイズを決定するデータサイズ決定手段を有し、
前記送信手段は、前記データサイズ決定手段によって決定されたデータサイズに基づいて、前記参照データを前記クライアントへ送信することを特徴とする請求項１記載のデータ処理システム。
前記クライアントはさらに、
前記受信手段において前記サーバから受信すべきデータサイズをユーザ指示に基づいて決定するデータサイズ指示手段を有し、
前記送信手段は、前記データサイズ指示手段によって指示されたデータサイズに基づいて、前記参照データを前記クライアントへ送信することを特徴とする請求項１記載のデータ処理システム。
前記サーバはさらに、
前記送信手段における前記クライアントへの前記参照データの送信状況を、該クライアントへ段階的に通知する状況通知手段を有することを特徴とする請求項１記載のデータ処理システム。
サーバにおいて、クライアントからの要求に応じて、格納手段に格納された所定の参照データを前記クライアントへ送信し、前記クライアントにおいて、前記サーバから受信した前記参照データを参照してデータ処理を行うデータ処理システムにおけるデータ格納方法であって、
前記格納手段は、前記データ処理の際の重要度に応じたデータ順で、前記参照データを格納することを特徴とするデータ格納方法。
前記格納手段は、前記参照データを前記データ処理の際の重要度に依存する上位構成から下位構成へ順次格納することを特徴とする請求項１９記載のデータ格納方法。
コンピュータ上で実行されることによって、該コンピュータを請求項１乃至１８のいずれかに記載のサーバとして動作させることを特徴とするプログラム。
請求項２１記載のプログラムを記録した記録媒体。