JP2004133699A - 自動応答処理システムのクライアント端末装置およびサーバ装置 - Google Patents

自動応答処理システムのクライアント端末装置およびサーバ装置 Download PDF

Info

Publication number
JP2004133699A
JP2004133699A JP2002297767A JP2002297767A JP2004133699A JP 2004133699 A JP2004133699 A JP 2004133699A JP 2002297767 A JP2002297767 A JP 2002297767A JP 2002297767 A JP2002297767 A JP 2002297767A JP 2004133699 A JP2004133699 A JP 2004133699A
Authority
JP
Japan
Prior art keywords
processing
processing unit
client terminal
terminal device
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2002297767A
Other languages
English (en)
Inventor
Toshiyuki Ito
伊藤 俊之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2002297767A priority Critical patent/JP2004133699A/ja
Publication of JP2004133699A publication Critical patent/JP2004133699A/ja
Abandoned legal-status Critical Current

Links

Images

Landscapes

  • Multi Processors (AREA)

Abstract

【課題】クライアントで実行可能な処理はクライアントで実行することによりトラフィックまたはサーバの処理量の負荷を低減できる自動音声応答処理システムのクライアント端末装置およびサーバ装置を得る。
【解決手段】クライアント端末装置10の音声応答シナリオ処理部16がサーバ装置20の記憶装置28に格納されている音声応答シナリオをダウンロードし、振分判断処理部17が次に実行する処理の音声応答シナリオとクライアント端末装置10の処理能力とを比較して、その音声応答シナリオをクライアント端末装置10自身で実行できるか否かを判断し、振分処理部12が、前記判断結果が「実行可能」の場合は音声入力データを音声認識処理部13に供給し、「実行不可能」の場合はサーバ装置20の音声認識処理部23に供給する。
【選択図】    図1

Description

【0001】
【発明の属する技術分野】
この発明は、ユーザに対して自動的に応答処理を行う自動応答処理システムのクライアント端末装置およびサーバ装置に関するものである。
【0002】
【従来の技術】
ユーザに対して自動的に音声、テキストまたは画像を介して応答処理を行う各種の自動応答技術が提案されている。かかる自動応答技術の一種として、クライアント端末装置がユーザの入力を受け付け、入力に基づいた処理をサーバが実行し、サーバの処理に基づいてクライアント端末装置がユーザに返答するシステムがある。この種の自動応答処理システムでは、ユーザの入力に基づいた画像や音声データがネットワークを通じてサーバに転送され、高速な処理が要求される認識処理や合成処理はサーバで蓄積データを利用して行われる。例えば、特許文献1はこの種の自動応答処理システムを開示する。
【0003】
【特許文献1】
特開平10−214258号公報(第3−5頁、第1図)
【特許文献2】
特開2001−337695公報
【特許文献3】
特開平5−233565号公報
【0004】
【発明が解決しようとする課題】
従来のデータ処理システムでは、高速の処理や大規模な記憶容量を必要とする音声の認識処理や合成処理は専らサーバで行っていた。しかし、最近ではクライアントの処理能力が向上し、簡単な認識処理や合成処理はクライアントでも実行可能となっている。また、近年のモバイル通信環境の発展により大量のデータの交換が可能になってきているため、クライアントとサーバ間のトラフィックおよびサーバの処理量の負荷が増大している。この問題が重要視されるようになったため、クライアント側で実行可能な処理はクライアントで実行することによりトラフィックまたはサーバの処理量の負荷を低減することが望まれている。しかし、上記のシステムではこのような要求に対応できないという課題があった。
【0005】
この発明は、上記のような課題を解決するためになされたもので、クライアントで実行可能な処理はクライアントで実行することによりトラフィックまたはサーバの処理量の負荷を低減できる自動音声応答処理システムのクライアント端末装置およびサーバ装置を得ることを目的とする。
【0006】
【課題を解決するための手段】
この発明に係る自動応答処理システムのクライアント端末装置は、自動応答シナリオに従って入力データを自動的に処理して応答データを生成することができる外部装置と通信可能な自動応答処理システムのクライアント端末装置であって、入力データを生成する入力手段と、自動応答シナリオに従って入力データを自動的に処理して応答データを生成する応答処理手段と、自動応答シナリオの処理内容に基づいて、入力データを前記応答処理手段と前記外部装置のいずれに供給するかを判断する判断手段と、前記判断手段の判断に従って、入力データを前記応答処理手段または前記外部装置に供給する振分処理手段と、前記処理手段または前記外部装置で生成された応答データに基づいてユーザに応答する出力手段とを備えたものである。
【0007】
【発明の実施の形態】
以下、この発明の様々な実施の形態を説明する。
実施の形態1.
図1はこの発明の実施の形態1による自動音声応答処理システムのブロック図である。図1に示すように、この自動応答処理システムは、クライアント端末装置10およびサーバ装置(外部装置)20を備える。クライアント端末装置10は、音声入力処理部(入力手段)11、振分処理部(振分処理手段)12、音声認識処理部(応答処理手段)13、音声合成処理部(応答処理手段)14、音声出力処理部(出力手段)15、音声応答シナリオ処理部(応答処理手段)16、振分判断処理部(判断手段)17および記憶装置18を有する。一方、サーバ装置20は、音声認識処理部23、音声合成処理部24、音声応答シナリオ処理部26、および記憶装置28を有する。
クライアント端末装置10およびサーバ装置20は、ネットワークまたは専用回線で接続されている。使用しうるネットワークは、LAN(local area network)でもインターネットでもよく、その通信形式は無線でも有線でもよい。
【0008】
クライアント端末装置10においては、ユーザから発せられた音声が音声入力処理部11、すなわちマイクロフォンに入力され、音声入力処理部11は音声を音声入力データに変換し、この音声入力データを振分処理部12に供給する。振分処理部12は、音声応答シナリオ処理部16の振分判断処理部17の判断(後述する)に基づいて、音声入力データをクライアント端末装置10の音声認識処理部13またはサーバ装置20の音声認識処理部23に供給する。
【0009】
音声入力データが音声認識処理部13に供給される場合には、音声認識処理部13は音声認識を行う。すなわち音声入力データをテキストデータに変換する。変換されたテキストデータは、音声応答シナリオ処理部16に供給される。音声応答シナリオ処理部16はテキストデータに基づいて適切な処理を実行する。音声応答シナリオ処理部16が実行する処理には、ユーザへの応答のための新たなテキストデータの作成および音声合成処理部14へのそのテキストデータの供給や、音声認識処理部13から供給されたテキストデータ自体の音声合成処理部14への転送も含まれる。音声応答シナリオ処理部16から供給されたテキストデータに基づいて音声合成処理部14は音声を合成する。すなわち、テキストデータを音声出力データに変換する。この音声出力データを音声出力処理部15すなわちスピーカが音声に変換してユーザに音声の応答を与える。
【0010】
他方、振分処理部12から音声入力データがサーバ装置20の音声認識処理部23に供給される場合には、音声認識処理部23が音声認識を行う。すなわち音声入力データをテキストデータに変換する。変換されたテキストデータは、音声応答シナリオ処理部26に供給される。音声応答シナリオ処理部26はテキストデータに基づいて適切な処理を実行する。音声応答シナリオ処理部26が実行する処理には、ユーザへの応答のための新たなテキストデータの作成および音声合成処理部24へのそのテキストデータの供給や、音声認識処理部23から供給されたテキストデータ自体の音声合成処理部24への転送も含まれる。音声応答シナリオ処理部26から供給されたテキストデータに基づいて音声合成処理部24は音声を合成する。すなわち、テキストデータを音声出力データに変換する。音声合成処理部24はこの音声出力データをクライアント端末装置10に送信し、クライアント端末装置10では音声出力データを音声出力処理部15が音声に変換してユーザに音声の応答を与える。
【0011】
この自動音声応答処理システムが行う自動音声応答処理は、振分判断処理部17の判断に応じて、クライアント端末装置10の音声応答シナリオ処理部16またはサーバ装置20の音声応答シナリオ処理部26で実行される。クライアント端末装置10において、音声応答シナリオ処理部16は、自動音声応答シナリオに規定された手順に従って、音声認識処理、音声に基づく各種の処理、および音声合成処理を実行する。具体的には、音声応答シナリオ処理部16は、音声認識処理部13を制御して音声認識処理を実行させ、音声に基づく各種の処理を実行し、音声合成処理部14を制御して音声合成処理を実行させる。また、サーバ装置20において、音声応答シナリオ処理部26は、自動音声応答シナリオに規定された手順に従って、音声認識処理部23を制御して音声認識処理を実行させ、音声に基づく各種の処理を実行し、音声合成処理部24を制御して音声合成処理を実行させる。
【0012】
自動音声応答シナリオとは、音声認識処理、音声合成処理およびそれらを繋ぐ処理のフロー、さらに他システムまたは他装置との連携処理に関する処理のフローなどを規定した複数のスクリプトファイルの集合であって、自動音声応答処理全体が規定されたものである。例えば、住所を取得するスクリプト、名前を取得するスクリプト、取得したデータを記憶装置に格納するスクリプト等がある。連携処理としての認証処理および認証に続くサービス処理のためのスクリプトが設けられていてもよい。
【0013】
サーバ装置20の記憶装置28には自動音声応答シナリオが格納されており、音声応答シナリオ処理部26は、記憶装置28から読み出された音声応答シナリオ中のスクリプトに従って動作する。また、サーバ装置20の音声応答シナリオ処理部26は、記憶装置28から音声応答シナリオを読み出してクライアント端末装置10に転送する機能を有しており、このようにダウンロードされた音声応答シナリオはクライアント端末装置10の記憶装置18に一時的に格納される。音声応答シナリオ処理部16は、記憶装置18から読み出された音声応答シナリオ中のスクリプトに従って動作する。記憶装置18には、このクライアント端末装置10の音声認識処理能力および音声認識処理能力に関する情報があらかじめ格納されている。
【0014】
次に動作について説明する。
自動音声応答処理用プログラムがクライアント端末装置10で起動されると、クライアント端末装置10の音声応答シナリオ処理部16がサーバ装置20の記憶装置28に格納されている音声応答シナリオをダウンロードする。ダウンロードする対象は、自動音声応答処理の全てのスクリプトつまりシナリオ全体でもよいし、一部のスクリプトでもよい。例えば、高性能なクライアント端末装置10の場合は、全てのスクリプトをダウンロードするなど、クライアント端末装置10が自分の処理能力に応じて決定してもよい。
【0015】
また、クライアント端末装置10の処理能力に関わらず、サーバ装置20の音声応答シナリオ処理部26がダウンロードするスクリプトを決定してもよい。例えば、音声応答処理全体が軽い処理であれば音声応答シナリオ全体をダウンロードし、重い処理が含まれる場合には重い処理と軽い処理とを分割して軽い処理のスクリプトだけをダウンロードするようにしてもよい。音声認識・音声合成処理に関するスクリプトだけをダウンロードしてもよい。ダウンロードしたシナリオまたはスクリプトは記憶装置18に格納される。
【0016】
続いて、音声応答シナリオ処理部16は、自動音声応答処理用プログラムに従って動作する。自動音声応答処理用プログラムの実行中に、音声応答シナリオ処理部16は振分判断処理部17により、次に実行する処理段階について調べる。具体的には、次に実行する処理の音声応答シナリオまたはスクリプトと、記憶装置18に格納されているクライアント端末装置10の処理能力、例えば音声認識・合成処理能力とを比較して、その音声応答シナリオまたはスクリプトをクライアント端末装置10自身で実行できるか否かを判断し、この判断結果を振分処理部12に供給する。
【0017】
判断結果が「実行可能」である場合は、クライアント端末装置10の音声応答シナリオ処理部16が、次の音声応答シナリオまたはスクリプトに従って音声応答処理を実行する。また、判断結果が「実行不可能」である場合は、音声応答シナリオ処理部16は、この判断結果を次に実行すべき音声応答シナリオまたはスクリプトの指定とともに、サーバ装置20の音声応答シナリオ処理部26に通知する。音声応答シナリオ処理部26はこれに応答して適切な音声応答処理を実行可能に待機する。
【0018】
上記判断結果に応じて、音声入力処理部11で生成された音声入力データを振分処理部12は、音声認識処理部13とサーバ装置20の音声認識処理部23のいずれかに供給する。具体的には、振分処理部12は上記判断結果が「実行可能」である場合は上記音声入力データを音声認識処理部13に供給し、「実行不可能」である場合は上記音声入力データをサーバ装置20の音声認識処理部23に転送する。例えば、実行すべきスクリプトが、ユーザの名前の入力を要求する名前取得スクリプトである場合には、音声入力処理部11はユーザが発音した名前を表す音声入力データを生成して振分処理部12に供給し、振分処理部12はその音声入力データを音声認識処理部13または音声認識処理部23に供給する。
【0019】
振分処理部12の判断が「実行可能」である場合、音声認識処理部13は取得した音声入力データを認識、すなわち音声入力データをテキストデータに変換し、これを音声応答シナリオ処理部16に転送する。音声応答シナリオに従って音声応答シナリオ処理部16は、このテキストデータに基づいて適切な処理を実行する。また、音声応答シナリオ処理部16から供給されたテキストデータに基づいて、音声合成処理部14は音声出力データを生成し、続いてこの音声出力データを振分処理部12に供給する。振分処理部12は、取得した音声出力データを音声出力処理部15に伝達し、音声出力処理部15は音声を出力する。
例えば、名前取得スクリプトにおいては、音声応答シナリオ処理部16は、音声認識処理部13が生成したユーザの名前を表すテキストデータを音声合成処理部14に転送し、音声合成処理部14は、音声認識処理部13が認識した名前が正しいか否かをユーザに確認させるために、このテキストデータから音声出力データを生成し、音声出力処理部15はその名前を発音する。
【0020】
一方、判断結果が「実行不可能」である場合、サーバ装置20の音声認識処理部23は取得した音声入力データを認識、すなわち音声入力データをテキストデータに変換し、これを音声応答シナリオ処理部26に転送する。音声応答シナリオに従って音声応答シナリオ処理部26は、このテキストデータに基づいて適切な処理を実行する。また、音声応答シナリオ処理部26から供給されたテキストデータに基づいて、音声合成処理部24は音声出力データを生成し、続いてこの音声出力データをクライアント端末装置10の振分処理部12に転送する。振分処理部12は、取得した音声出力データを音声出力処理部15に伝達し、音声出力処理部15は音声を出力する。
例えば、名前取得スクリプトにおいては、音声応答シナリオ処理部26は、音声認識処理部23が生成したユーザの名前を表すテキストデータを音声合成処理部24に転送し、音声合成処理部24は、音声認識処理部23が認識した名前が正しいか否かをユーザに確認させるために、このテキストデータから音声出力データを生成し、音声出力処理部15はその名前を発音する。
【0021】
実行中の音声応答シナリオまたはスクリプトに残りの工程があれば、クライアント端末装置10またはサーバ装置20は残りの工程に従った処理を続行する一方、音声応答シナリオまたはスクリプトが終了すれば次の音声応答シナリオまたはスクリプトに従って処理を開始する。例えば、名前取得スクリプトでは、ユーザから音声認識が誤っている旨を示す音声入力が音声入力処理部11に与えられると、音声応答シナリオ処理部16または26は名前取得スクリプトを再試行する。他方、ユーザから音声認識が正しい旨を示す音声入力が音声入力処理部11に与えられると、名前を示すテキストデータを音声応答シナリオ処理部16または26は記憶装置18または28に格納して名前取得スクリプトは終了する。名前取得スクリプトの終了後、例えばユーザの住所の入力を要求する住所取得スクリプトを開始する。音声応答シナリオまたはスクリプトの処理をサーバ装置20で実行した場合には、音声応答シナリオ処理部26はそのスクリプト処理の終了をクライアント端末装置10に通知し、自動音声応答プログラムの次の処理の開始を円滑化すると好ましい。
【0022】
次に実行する音声応答シナリオまたはスクリプトについても、上記と同様に音声応答シナリオ処理部16は振分判断処理部17により、音声応答シナリオまたはスクリプトをクライアント端末装置10自身で実行できるか否かを判断し、この判断に従ってクライアント端末装置10またはサーバ装置20がその音声応答シナリオまたはスクリプトを実行する。以降、同様に音声応答シナリオまたはスクリプトに従って自動音声応答処理を行う。
【0023】
なお、自動音声応答処理用プログラム起動時に、音声応答シナリオのうち一部のスクリプトファイルのみをダウンロードした場合は、次のスクリプトファイルが必要になった時点で、音声応答シナリオ処理部16はその旨をサーバ装置20に通知し、サーバ装置20より必要なスクリプトファイルをダウンロードする。続いて、クライアント端末装置10の処理能力に基づいてクライアント端末装置10で実行可能か否かを振分判断処理部17で判断して、上記と同様に処理を行う。
【0024】
以上のように、この実施の形態1によれば、クライアント端末装置10が音声応答シナリオ処理部16の振分判断処理部17により、自動応答シナリオの処理内容に基づいて、音声入力データの供給先を判断するようにしたので、クライアントの処理能力に応じてクライアント端末装置10で実行可能な音声応答シナリオの処理内容はクライアント端末装置10で実行し、実行不可能な処理内容は音声入力データをサーバ装置20に転送してサーバ装置20で実行するようにすることができる。従って、トラフィックまたはサーバの処理量の負荷を軽減させた自動音声応答処理システムを提供できるという効果が得られる。
【0025】
実施の形態2.
図2は、この発明の実施の形態2による自動音声応答処理システムのブロック図である。図1と共通する構成要素を示すには同一の符号を用いて、それらの詳細な説明は省略する。
図2に示す自動音声応答処理システムおいて、クライアント端末装置10の音声応答シナリオ処理部16には振分判断処理部17が設けられておらず、サーバ装置(外部装置)20の音声応答シナリオ処理部26に振分判断処理部(判断手段)27が設けられている。音声入力処理部11で生成された音声入力データをクライアント端末装置10の音声応答シナリオ処理部(応答処理手段)16とサーバ装置20の音声応答シナリオ処理部(応答処理手段)26のいずれで処理すべきかをサーバ装置20の振分判断処理部27が判断する。
【0026】
この判断の基準としてクライアント端末装置10の処理能力、例えば音声認識・合成処理能力が使用される。このため、クライアント端末装置10には、音声応答処理能力通知部(処理能力通知手段)19が設けられており、音声応答処理能力通知部19は、クライアント端末装置10の音声認識・合成処理能力に関する情報をサーバ装置20に転送する。
【0027】
自動音声応答処理用プログラムがクライアント端末装置10で起動されると、クライアント端末装置10の音声応答シナリオ処理部16が、実行する音声応答シナリオをサーバ装置20の音声応答シナリオ処理部26に対して通知する。実行する音声応答シナリオは自動音声応答処理の全てでもよいし、一部でもよい。また、このとき通知するのは、音声応答シナリオの概要、または音声応答シナリオの種類を区別するID等でよい。続いて、音声応答処理能力通知部19がクライアント端末装置10の音声認識・合成処理能力に関する情報をサーバ装置20の音声応答シナリオ処理部26に対して通知する。
【0028】
音声応答シナリオ処理部26は、クライアント端末装置10から通知された音声応答シナリオのID等に対応する音声応答シナリオを記憶装置28から取得する。続いて、振分判断処理部27が、次に実行すべき処理段階について調べる。具体的には、実行する音声応答シナリオと通知されたクライアント端末装置10の処理能力とを比較してクライアント端末装置10で当該音声応答シナリオを実行できるか否かを判断する。なお、実行する音声応答シナリオは、クライアント端末装置10の音声応答シナリオ処理部16が通知する代わりにサーバ装置20の音声応答シナリオ処理部26が決定するようにしてもよい。
【0029】
音声応答シナリオ処理部26は、判断通知手段として上記判断結果をクライアント端末装置10の音声応答シナリオ処理部16に転送する。また、判断結果がクライアント端末装置10で「実行可能」である場合は、当該音声応答シナリオをダウンロードする。音声応答シナリオ処理部16は、取得した判断結果を振分処理部(振分処理手段)12に供給すると共に、ダウンロードした音声応答シナリオに従って音声応答処理を開始する。また、判断結果が「実行不可能」である場合は、音声応答シナリオ処理部26が音声応答処理を開始する。
【0030】
以降、実施の形態1と同様に、音声入力処理部11がユーザから音声入力データを取得すると、振分処理部12は上記判断結果が「実行可能」である場合は音声入力データを音声認識処理部13に供給し、「実行不可能」である場合は音声入力データをサーバ装置20の音声認識処理部23に転送する。判断結果が「実行可能」である場合、音声認識処理部13は取得した音声入力データをテキストデータに変換し、これを音声応答シナリオ処理部16に転送する。音声応答シナリオに従って音声応答シナリオ処理部16はテキストデータに適切な処理を施す。また、音声応答シナリオ処理部16から供給されたテキストデータに基づいて、音声合成処理部14は音声出力データを生成し、振分処理部12に供給する。振分処理部12は音声出力データを音声出力処理部15に伝達し、音声出力処理部15は音声を出力する。
【0031】
一方、判断結果が「実行不可能」である場合、音声認識処理部23は取得した音声入力データをテキストデータに変換してこれを音声応答シナリオ処理部26に転送する。音声応答シナリオに従って音声応答シナリオ処理部26はテキストデータに基づいた適切な処理を行う。また、音声応答シナリオ処理部26から供給されたテキストデータに基づいて、音声合成処理部24は音声出力データを生成し、振分処理部12に転送する。振分処理部12は音声出力データを音声出力処理部15に伝達し、音声出力処理部15は音声を出力する。
【0032】
上記の手順により、音声応答シナリオに従って自動音声応答処理を行う。音声応答シナリオの処理をサーバ装置20で実行した場合には、音声応答シナリオ処理部26はその音声応答シナリオの処理の終了をクライアント端末装置10に通知し、自動音声応答プログラムの次の処理の開始を円滑化すると好ましい。
自動音声応答処理用プログラム起動時に、実行する音声応答シナリオとして音声応答シナリオ処理部16が一部のスクリプトファイルのみを通知した場合は、次のスクリプトファイルが必要になった時点で音声応答シナリオ処理部16は必要なスクリプトファイルを通知する。続いて、クライアント端末装置10の処理能力に基づいてクライアント端末装置10でそのスクリプトファイルを実行可能か否かを振分判断処理部27で判断して、実行可能である場合のみそのスクリプトファイルをダウンロードし、上記と同様に処理を行う。
【0033】
以上のように、この実施の形態2によれば、クライアント端末装置10が音声認識・合成処理能力に関する情報をサーバ装置20に通知する音声応答処理能力通知部19を備え、サーバ装置20の振分判断処理部27が自動音声応答シナリオの処理内容とクライアント端末装置の処理能力に応じて音声入力データの供給先を判断するようにしたので、クライアントの処理能力に応じてクライアント端末装置10で実行可能な音声応答シナリオの処理内容はクライアント端末装置10で実行し、実行不可能な処理内容は音声入力データをサーバ装置20に転送してサーバ装置20で実行するようにすることができる。従って、サーバの処理量の負荷を軽減させた自動音声応答処理システムを提供できるという効果が得られる。
【0034】
また、クライアント端末装置10で実行可能な音声応答シナリオのみをダウンロードするようにしたので、クライアント端末装置10で実行不可能な音声応答シナリオまでダウンロードすることがないため、トラフィックを軽減させることができる。
【0035】
実施の形態3.
図3は、この発明の実施の形態3による自動音声応答処理システムのブロック図である。図3において、図2と共通する構成要素を示すには同一の符号を用いて、それらの詳細な説明を省略する。この実施の形態では、クライアント端末装置10の記憶装置18に汎用的な音声応答シナリオ(以下、組込音声応答シナリオと呼ぶ)があらかじめ格納されている。
【0036】
自動音声応答処理用プログラムがクライアント端末装置10で起動されると、クライアント端末装置10の音声応答シナリオ処理部16が、実行する音声応答シナリオをサーバ装置20の音声応答シナリオ処理部26に対して通知する。実行する音声応答シナリオは自動音声応答処理の全てでもよいし、一部でもよい。続いて、音声応答処理能力通知部19が既存シナリオ通知手段として機能し、クライアント端末装置10の音声認識処理・合成処理能力および記憶装置18にあらかじめ格納されている組込音声応答シナリオをサーバ装置20の音声応答シナリオ処理部26に対して通知する。これらの音声応答シナリオの通知については、音声応答シナリオの概要、または音声応答シナリオの種類を区別するID等を通知すればよい。
【0037】
音声応答シナリオ処理部26は、クライアント端末装置10から通知された音声応答シナリオのID等に対応する音声応答シナリオを記憶装置28から取得する。続いて、振分判断処理部27が、次に実行する処理段階について調べる。具体的には、実行する音声応答シナリオと通知されたクライアント端末装置10の処理能力とを比較してクライアント端末装置10で当該音声応答シナリオを実行できるか否かを判断する。さらに振分判断処理部27はクライアント端末装置10で「実行可能」と判断した場合に、クライアント端末装置10から与えられた組込音声応答シナリオの通知から、実行する音声応答シナリオがクライアント端末装置10の記憶装置18に格納されているか否か判断する。なお、実行する音声応答シナリオは、クライアント端末装置10の音声応答シナリオ処理部16が通知する代わりにサーバ装置20の音声応答シナリオ処理部26が決定するようにしてもよい。
【0038】
音声応答シナリオ処理部26は、判断通知手段として上記判断結果をクライアント端末装置10の音声応答シナリオ処理部16に通知する。また、判断結果がクライアント端末装置10で「実行可能」であり、かつ当該音声応答シナリオが記憶装置18に格納されていないと判断された場合は、クライアント端末装置10でその音声応答シナリオを実行させるために、音声応答シナリオ処理部26は送信手段として、音声応答シナリオをクライアント端末装置10に送信する。クライアント端末装置10の振分処理部12は、受信手段として、このようにダウンロードした不足の音声応答シナリオを記憶装置18に格納する。
また、判断結果が「実行可能」である場合、音声応答シナリオ処理部16は、取得した判断結果を振分処理部12に供給すると共に、あらかじめ記憶装置18に格納されていたかまたは新たにダウンロードした音声応答シナリオに従って音声応答処理を開始する。
また、判断結果が「実行不可能」である場合は、音声応答シナリオ処理部26が音声応答処理を開始する。
【0039】
以降、実施の形態1,2と同様に、音声入力処理部11がユーザから音声入力データを取得すると、振分処理部12は上記判断結果が「実行可能」である場合は音声入力データを音声認識処理部13に供給し、「実行不可能」である場合は音声入力データをサーバ装置20の音声認識処理部23に転送する。判断結果が「実行可能」である場合、音声認識処理部13は取得した音声入力データをテキストデータに変換し、これを音声応答シナリオ処理部16に転送する。音声応答シナリオに従って音声応答シナリオ処理部16はテキストデータに適切な処理を施す。また、音声応答シナリオ処理部16から供給されたテキストデータに基づいて、音声合成処理部14は音声出力データを生成し、振分処理部12に供給する。振分処理部12は音声出力データを音声出力処理部15に伝達し、音声出力処理部15は音声を出力する。
一方、判断結果が「実行不可能」である場合、音声認識処理部23は取得した音声入力データをテキストデータに変換してこれを音声応答シナリオ処理部26に転送する。音声応答シナリオに従って音声応答シナリオ処理部26はテキストデータに基づいた適切な処理を行う。また、音声応答シナリオ処理部26から供給されたテキストデータに基づいて、音声合成処理部24は音声出力データを生成し、振分処理部12に転送する。振分処理部12は音声出力データを音声出力処理部15に伝達し、音声出力処理部15は音声を出力する。
【0040】
上記の手順により、音声応答シナリオに従って自動音声応答処理を行う。音声応答シナリオの処理をサーバ装置20で実行した場合には、音声応答シナリオ処理部26はその音声応答シナリオの処理の終了をクライアント端末装置10に通知し、自動音声応答プログラムの次の処理の開始を円滑化すると好ましい。
自動音声応答処理用プログラム起動時に、実行する音声応答シナリオとして音声応答シナリオ処理部16が一部のスクリプトファイルのみを通知した場合は、次のスクリプトファイルが必要になった時点で音声応答シナリオ処理部16は必要なスクリプトファイルを通知する。続いて、クライアント端末装置10の処理能力に基づいてクライアント端末装置10でそのスクリプトファイルを実行可能か否かを振分判断処理部27で判断して、実行可能である場合のみそのスクリプトファイルをダウンロードし、上記と同様に処理を行う。
【0041】
以上のように、この実施の形態3によれば、クライアント端末装置10の記憶装置18に汎用的な音声応答シナリオをあらかじめ格納し、サーバ装置20の振分判断処理部27が自動音声応答シナリオの処理内容とクライアント端末装置のあらかじめ格納された音声応答シナリオに基づいて、クライアント端末装置に格納されていない自動音声応答シナリオを送信するようにしたので、格納した音声応答シナリオについてはダウンロードする必要がなく、実施の形態2に比べてトラフィックを軽減させた自動音声応答処理システムを提供できるという効果が得られる。
【0042】
以上の実施の形態1〜3は、ユーザが音声を入力し、ユーザに音声で返答する自動音声応答システムに関するが、この発明を以上の実施の形態に限定することを意図するものではない。例えば、ユーザが音声、テキストおよび画像のいずれか、またはこれらの組合せを入力し、ユーザに音声、テキストおよび画像のいずれか、またはこれらの組合せで返答する自動応答システムにも上記の原理を応用することが可能であり、そのような原理が応用された実施の形態もこの発明の範囲内にある。
【0043】
【発明の効果】
以上のように、この発明によれば、自動応答シナリオ中の処理内容に基づいて、入力データの供給先を判断するようにしたので、クライアントの処理能力に応じてクライアント端末装置で実行可能な音声応答シナリオの処理内容はクライアント端末装置で実行し、実行不可能な処理内容は入力データをサーバ装置に転送してサーバ装置で実行するようにすることができる。従って、トラフィックまたはサーバの処理量の負荷を軽減させることができるという効果がある。
【図面の簡単な説明】
【図1】この発明の実施の形態1による自動音声応答処理システムのブロック図である。
【図2】同実施の形態2による自動音声応答処理システムのブロック図である。
【図3】同実施の形態3による自動音声応答処理システムのブロック図である。
【符号の説明】
10 クライアント端末装置、11 音声入力処理部(入力手段)、12 振分処理部(振分処理手段、受信手段)、13,23 音声認識処理部(応答処理手段)、14,24 音声合成処理部(応答処理手段)、15 音声出力処理部(出力手段)、16 音声応答シナリオ処理部(応答処理手段)、17,27 振分判断処理部(判断手段)、18,28 記憶装置、19 音声応答処理能力通知部(処理能力通知手段、既存シナリオ通知手段)、20 サーバ装置(外部装置)、26 音声応答シナリオ処理部(応答処理手段、送信手段)。

Claims (5)

  1. 自動応答シナリオに従って入力データを自動的に処理して応答データを生成することができる外部装置と通信可能な自動応答処理システムのクライアント端末装置であって、
    入力データを生成する入力手段と、
    自動応答シナリオに従って入力データを自動的に処理して応答データを生成する応答処理手段と、
    自動応答シナリオの処理内容に基づいて、入力データを前記応答処理手段と前記外部装置のいずれに供給するかを判断する判断手段と、
    前記判断手段の判断に従って、入力データを前記応答処理手段または前記外部装置に供給する振分処理手段と、
    前記処理手段または前記外部装置で生成された応答データに基づいてユーザに応答する出力手段とを備えた自動応答処理システムのクライアント端末装置。
  2. 自動応答シナリオに従って入力データを自動的に処理して応答データを生成することができる外部装置と通信可能な自動応答処理システムのクライアント端末装置であって、
    入力データを生成する入力手段と、
    自動応答シナリオに従って入力データを自動的に処理して応答データを生成する応答処理手段と、
    入力データを前記応答処理手段と前記外部装置のいずれに供給するかを前記外部装置で判断させるために、当該クライアント端末装置の処理能力を前記外部装置に通知する処理能力通知手段と、
    前記外部装置の判断に従って、前記入力データを前記応答処理手段または前記外部装置に供給する振分処理手段と、
    前記応答処理手段または前記外部装置で生成された応答データに基づいてユーザに応答する出力手段とを備えた自動応答処理システムのクライアント端末装置。
  3. 自動応答シナリオを格納した記憶手段と、
    前記記憶手段に格納された自動応答シナリオを外部装置に通知する既存シナリオ通知手段と、
    前記記憶手段に格納されていない自動応答シナリオを前記外部装置から受信する受信手段とを備えたことを特徴とする請求項2記載の自動応答処理システムのクライアント端末装置。
  4. 自動応答シナリオに従って入力データを自動的に処理して応答データを生成することができるクライアント端末装置と通信可能な自動応答処理システムのサーバ装置であって、
    前記クライアント端末装置から受信した入力データを自動応答シナリオに従って自動的に処理して応答データを生成し、前記応答データを前記クライアント端末装置に与える応答処理手段と、
    自動応答シナリオの処理内容と前記クライアント端末装置の処理能力に基づいて、入力データを前記応答処理手段と前記クライアント端末装置のいずれで処理すべきかを判断する判断手段と、
    前記判断手段の判断を前記クライアント端末装置に通知する判断通知手段とを備えた自動応答処理システムのサーバ装置。
  5. 判断手段が入力データをクライアント端末装置で処理すべきと判断したとき、自動応答シナリオの処理内容と前記クライアント端末装置に既に格納されている自動応答シナリオの内容に基づいて、前記クライアント端末装置に格納されていない自動応答シナリオを送信する送信手段を備えたことを特徴とする請求項4記載の自動応答処理システムのサーバ装置。
JP2002297767A 2002-10-10 2002-10-10 自動応答処理システムのクライアント端末装置およびサーバ装置 Abandoned JP2004133699A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002297767A JP2004133699A (ja) 2002-10-10 2002-10-10 自動応答処理システムのクライアント端末装置およびサーバ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002297767A JP2004133699A (ja) 2002-10-10 2002-10-10 自動応答処理システムのクライアント端末装置およびサーバ装置

Publications (1)

Publication Number Publication Date
JP2004133699A true JP2004133699A (ja) 2004-04-30

Family

ID=32287383

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002297767A Abandoned JP2004133699A (ja) 2002-10-10 2002-10-10 自動応答処理システムのクライアント端末装置およびサーバ装置

Country Status (1)

Country Link
JP (1) JP2004133699A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7809562B2 (en) 2005-07-27 2010-10-05 Nec Corporation Voice recognition system and method for recognizing input voice information
JP2018060568A (ja) * 2007-08-16 2018-04-12 クリムソン コーポレイション 音声を利用できるテルネットインターフェイス
US10873621B1 (en) 2014-08-20 2020-12-22 Ivanti, Inc. Terminal emulation over html
US11100278B2 (en) 2016-07-28 2021-08-24 Ivanti, Inc. Systems and methods for presentation of a terminal application screen

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7809562B2 (en) 2005-07-27 2010-10-05 Nec Corporation Voice recognition system and method for recognizing input voice information
JP2018060568A (ja) * 2007-08-16 2018-04-12 クリムソン コーポレイション 音声を利用できるテルネットインターフェイス
US10938886B2 (en) 2007-08-16 2021-03-02 Ivanti, Inc. Scripting support for data identifiers, voice recognition and speech in a telnet session
US10873621B1 (en) 2014-08-20 2020-12-22 Ivanti, Inc. Terminal emulation over html
US11100278B2 (en) 2016-07-28 2021-08-24 Ivanti, Inc. Systems and methods for presentation of a terminal application screen

Similar Documents

Publication Publication Date Title
US8189754B2 (en) Image sharing system
JP2009524975A (ja) 通信網でのマルチメディアコンテンツ伝送方法及びシステム
US10637953B2 (en) Apparatus, system and method for cache management
US10462319B2 (en) Image reading apparatus transmitting device identification information and reading information to push notification server, and method for controlling the image reading apparatus
US9866407B2 (en) Information processing system, cloud server, device control method, and non-transitory computer-readable recording medium encoded with device control program
US20120307277A1 (en) Information processing apparatus for transferring image data, server apparatus for receiving transferred image data, and control methods and storage media therefor
KR20100071146A (ko) 화상통화 중 데이터 저장 방법 및 시스템
CN110493028A (zh) 一种集群部署方法、系统、装置及计算机可读存储介质
JP4853475B2 (ja) プッシュツートーク通信システム及びプッシュツートーク通信方法
JP2018093433A (ja) 通信システム、画像形成装置とその制御方法、及びプログラム
JP2003076632A (ja) アプライアンス、並びに、アプライアンスと別個のデバイスとの間の通信を可能にする方法
CN111638858A (zh) 多功能打印方法、装置、多功能打印机和存储介质
US9606753B2 (en) Data processing apparatus for transmitting print data, method for controlling date processing apparatus, and storage medium
WO2006054778A1 (ja) 通信システム、通信端末装置、サーバ装置及びそれらに用いる通信方法並びにそのプログラム
US10089050B2 (en) Information processing device, and method and computer-readable medium therefor
CN108471361A (zh) 一种版本升级方法及装置
JP2009514320A (ja) 携帯端末の個人情報伝送装置及びその方法
WO2013140995A1 (ja) 情報処理システム、情報処理方法、通信端末、サーバおよびその制御方法と制御プログラム
JP2004133699A (ja) 自動応答処理システムのクライアント端末装置およびサーバ装置
JP5224964B2 (ja) 受信装置の受信方法及び受信装置並びにプログラム
JP2006178534A (ja) 情報処理装置及びドライバソフトのインストール制御方法
JP6922336B2 (ja) 情報処理装置、情報処理方法、情報処理プログラムおよび情報処理システム
CN110417668B (zh) 报文传输方法及网络设备
JP6207315B2 (ja) 通信装置および通信システム
JP2005301371A (ja) メモリマッピング制御装置、情報記憶制御装置、データ移行方法及びデータ移行プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050920

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20071026

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071026

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071026

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080219

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20080409