JP4067276B2

JP4067276B2 - スピーチ認識システムを構成する方法及びシステム

Info

Publication number: JP4067276B2
Application number: JP2000571437A
Authority: JP
Inventors: アントニーロドリゴ
Original assignee: Nokia Oyj
Current assignee: Nokia Oyj
Priority date: 1998-09-22
Filing date: 1998-09-22
Publication date: 2008-03-26
Anticipated expiration: 2018-09-22
Also published as: ES2198758T3; DE69814181D1; DE69814181T2; US7212970B2; JP2002525689A; US20010047258A1; EP1116373B1; ATE239336T1; WO2000017854A1; AU1025399A; EP1116373A1

Description

【０００１】
【技術分野】
本発明は、ネットワークアプリケーションサーバをスピーチコマンドに基づいて制御するテレコミュニケーションネットワーク用のスピーチ制御システム及び方法に係る。
【０００２】
【背景技術】
分散型のスピーチ認識（ＤＳＲ）システムでは、ユーザは、自動スピーチ認識（ＡＳＲ）手段即ちエンジンに供給される口述制御メッセージに基づいてアプリケーションを制御することができる。この口述制御メッセージは、ＡＳＲエンジンによりテキストコマンドに変換され、これらのテキストコマンドは、対応するネットワークアプリケーションサーバー（ＮＡＳ）において実行されるアプリケーションに送られるか、又はその口述制御メッセージを受信したところの移動ステーション（ＭＳ）のような加入者ターミナルに送られる。
【０００３】
移動アプリケーションの状況における分散型スピーチ認識システムの基本的な機能は、ネットワークに設けられた高能力のＡＳＲエンジン又はＡＳＲサーバーの助けで自動スピーチ認識特徴を与えるという移動ステーションの能力である。それ故、移動ステーションの基本的な機能は、このネットワークＡＳＲエンジンに入力スピーチコマンドを送信して、認識タスクを実行しそしてその結果を返送することである。この結果は、テキストフォーマットの認識されたワード又はコマンドである。次いで、移動ステーションは、このテキストを使用して、必要な機能を遂行することができる。
【０００４】
このようなシステムの別の機能は、スピーチコマンドにより、他のアプリケーションサーバー、即ちインターネットＷＷＷ（ワールドワイドウェブ）、電子メール、音声メール等へのアクセスを移動ステーションに与えることである。それ故、このような形式の移動ステーションをもつユーザは、これらのアプリケーションサーバーに接続しそしてスピーチコマンドを発生することができる。これを達成するために、移動ステーションは、スピーチ信号（音声）をＡＳＲエンジンに送信する。ＡＳＲエンジンは、スピーチ認識を実行して、それに対応するテキストコマンドを得る。これらのテキストコマンドは、移動ステーションへ返送される。次いで、移動ステーションは、これらのテキストコマンドを使用して、それに対応するネットワークアプリケーションサーバー（ＮＡＳ）を制御し、このサーバーは、ＷＷＷ、電子メール読み取り、音声メール等の種々のサービスを提供するインターネットのようなデータネットワークにおける任意のサーバーである。
【０００５】
ＡＳＲエンジンは、通常、他のアプリケーション又は他のタスクも実行できるプラットホームにおいて動作するので、ＡＳＲエンジンに他の機能を転送することもでき、例えば、得られたテキストコマンドを処理して、必要なオペレーションを確かめそして関連サーバーにコンタクトすることができる。次いで、そのコンタクトしたネットワークアプリケーションサーバーから検索された情報を移動ステーションへ返送する。この状態において、移動ステーションは、スピーチ入力を受信してそれをネットワークＡＳＲエンジンへ送信し、ＡＳＲエンジンは、スピーチ認識を実行し、スピーチコマンドに基づいて必要な機能を遂行し、そして検索された情報又は結果を移動ステーションへ送信する。
【０００６】
上記ケースの一例を以下に説明する。
例１：
ユーザは、「ジョン・スミスに電話する」という。この場合、ＡＳＲエンジンは、このスピーチをテキストに変換し、そしてテキスト「ジョン・スミスに電話する(Call John Smith)」を移動ステーションに返送し、そこで、移動ステーションのアプリケーションソフトウェアがジョン・スミスの番号を検索し、発呼動作を実行する。
例２：
移動ステーションにおけるスピーチコマンドは、「レーシング情報」である。この場合、ＡＳＲエンジンは、このスピーチをテキストに変換し、そしてテキスト「レーシング情報(Racing Info)」を移動ステーションへ返送する。従って、移動ステーションのアプリケーションソフトウェアは、ユーザが、競馬情報を提供するネットワークサーバーへのアクセスを希望していることを確認する。従って、移動ステーションは、関連サーバーとの接続を確立し、最新のレース結果を検索し、そしてその結果を移動ステーションのディスプレイに表示する。
【０００７】
例３：
移動ステーションに入力されるスピーチコマンドは、「電子メールの読み取り」である。この場合、ＡＳＲエンジンは、このスピーチをテキストに変換し、そしてテキスト「電子メールの読み取り(Read E-mail)」を移動ステーションへ返送する。従って、移動ステーションのアプリケーションソフトウェアは、ユーザが、ユーザの電子メールボックスへのアクセスを与えるネットワークサーバーにアクセスしたいことを確認する。この場合、移動ステーションは、関連電子メールアプリケーションサーバーとの接続を確立するためのコマンドをＡＳＲエンジンに送信する。ここで、ＡＳＲエンジンは、確認されたスピーチを返送せず、その変換されたスピーチを更に処理する。スピーチコマンドが「メッセージ１」であった場合には、ＡＳＲエンジンは、スピーチを受信し、そしてそれをテキストコマンド「メッセージ１」に変換し、このテキストコマンドを電子メールアプリケーションサーバーへ送信する。次いで、電子メールアプリケーションサーバーは、メッセージ１のテキストをＡＳＲエンジンに返送する。ＡＳＲエンジンは、次いで、このテキストを移動ステーションへ送信する。メッセージ２、３等々でダイアログが続き、ユーザが退出コマンドを発生するか、又はセッションを終了するメッセージが移動ステーションから受信されるまで、ユーザからの各スピーチコマンドがＡＳＲエンジンで処理される。
【０００８】
上記例１及び２では、ＡＳＲエンジンの唯一の機能は、スピーチをテキストに変換し、そしてその結果を、更なる処理のために移動ステーションへ返送することである。それ故、ネットワークアプリケーションサーバーは、移動ステーションからコマンドを直接的に受信する。しかしながら、上記例３では、ＡＳＲエンジンは、変換されたスピーチをそれ自体で処理し、そして関連ネットワークアプリケーションサーバーに直接的にアクセスして、ネットワークアプリケーションサーバーから結果を受け取り、そしてその結果を移動ステーションへ返送する。
従って、移動ステーション又はＡＳＲエンジンは、ネットワークアプリケーションサーバーへユーザコマンドを発生しそしてネットワークアプリケーションサーバーから応答を受け取るためにネットワークアプリケーションサーバーと通信することが必要とされる。
【０００９】
しかしながら、いずれの場合も、次の問題に遭遇する。読み取られるべき電子メールアプリケーションが、最も高いレベルのメニューにおいてＡ｛メッセージ１、メッセージ２、・・メッセージＮ及び退出｝のようなコマンドをサポートすると仮定する。ユーザが既にメッセージを読み取りつつある場合には、このコンテクストにおけるコマンドは、Ｂ｛削除、退出、次のメッセージ｝である。それ故、ユーザが最も高いレベルのメニューにあって、コマンドセットＡ以外のスピーチコマンドを入力する場合には、ネットワークアプリケーションサーバーは、エラーメッセージで応答する。たとえユーザがコマンドセットＢからスピーチコマンドを発しても、このコマンドは、依然、エラーコマンドとなる。というのは、ネットワークアプリケーションサーバーのコンテクスト又は状態が異なるからである。
【００１０】
更に、コンテクストに関わりないコマンドも、ノイズ等のために移動ステーションに入力されることがある。これら全てのスピーチ信号がＡＳＲエンジンによりテキストに変換され、そしてネットワークアプリケーションサーバーに送信され、このサーバーは、エラーメッセージで応答する。
このような状態が頻繁に生じるときには、ネットワークアプリケーションサーバーによる有効なコマンドの処理が遅延される。というのは、そのような無効のコマンドに応答するのに、貴重なネットワーク帯域巾及びアプリケーションサーバー処理時間が必要とされるからである。
更に、上記問題は、入力スピーチメッセージに対するＡＲＳエンジンの応答に遅延を招く。というのは、ネットワークアプリケーションサーバーからの応答を待機しなければならないからである。
従って、移動ステーションの全体的な応答時間が長くなるために、ユーザは、コマンドを繰り返すか又はコマンドを変更し、これにより、遅延が更に増大すると共に、システムの性能低下を招く。
【００１１】
【発明の開示】
本発明の目的は、全体的な応答時間を短縮したスピーチ制御システム及び方法を提供することである。
この目的は、テレコミュニケーションネットワーク用のスピーチ制御システムにおいて、ネットワークアプリケーションサーバーの考えられる状態を定義する状態定義情報をネットワークアプリケーションサーバーからロードするためのロード手段と、上記ネットワークアプリケーションサーバーに対する１組の有効コマンドを上記状態定義情報に基づいて決定するための決定手段と、上記ネットワークアプリケーションサーバーを制御するのに使用される入力スピーチコマンドを変換することにより得られたテキストコマンドの有効性を、そのテキストコマンドを上記決定された１組の有効コマンドと比較することによりチェックするためのチェック手段とを備えたスピーチ制御システムにより達成される。
【００１２】
更に、上記目的は、テレコミュニケーションネットワークのスピーチ制御方法において、ネットワークアプリケーションサーバーの考えられる状態を定義する状態定義情報をネットワークアプリケーションサーバーからロードし、上記ネットワークアプリケーションサーバーに対する１組の有効コマンドを上記状態定義情報に基づいて決定し、そして上記ネットワークアプリケーションサーバーを制御するのに使用されるスピーチコマンドを変換することにより得られたテキストコマンドの有効性を、そのテキストコマンドを上記決定された１組の有効コマンドと比較することによりチェックするという段階を含む方法により達成される。
【００１３】
従って、ネットワークアプリケーションサーバーによって与えられる状態定義情報に基づいて１組の有効なコマンドを決定できるので、得られたテキストコマンドの有効性は、そのテキストコマンドをネットワークアプリケーションサーバーへ送信する前にチェックすることができる。従って、エラーテキストメッセージの送信を防止して、それに対応する遅延や、ネットワークアプリケーションサーバーの処理時間の浪費を防止することができる。
好ましくは、ロード手段は、ネットワークアプリケーションサーバーによってサポートされる有効コマンドの全組を指定する文法及び／又は語彙情報をロードするよう構成することができ、そして上記決定手段は、上記有効コマンドの全組と、上記状態定義情報に含まれた状態移行情報とに基づいて、上記１組の有効コマンドを決定するように構成することができる。
【００１４】
従って、スピーチ制御システムは、状態移行ルールを参照することによりネットワークアプリケーションサーバーの実際の状態に追従し、有効コマンドの全組を、ネットワークアプリケーションサーバーの実際の状態に対応するコマンドに制限することができる。
或いは又、決定手段は、状態定義情報に含まれた状態移行情報に基づいて状態変化を決定するときに、ネットワークアプリケーションサーバーの特定の状態に対して１組の有効コマンドを定義する状態従属文法ファイルを上記ロード手段によりロードさせるように構成することができる。
従って、ネットワークアプリケーションサーバーの特定の状態に適応し得る１組の有効コマンドのみが、状態移行情報を参照することによりロードされる。これにより、精度を改善できると共に、ネットワーク接続をより効率的に使用することができる。
【００１５】
好ましくは、ネットワーク制御システムは、加入者ターミナルから受け取った入力スピーチコマンドを、ネットワークアプリケーションサーバーへ供給されるべきテキストコマンドに変換するためのスピーチ認識手段を備えている。従って、個々の加入者ターミナルによりアクセスできるネットワークに、中央スピーチ制御システムを設けることができる。ワイヤレスアプリケーションプロトコル（ＷＡＰ）が移動ネットワークに使用される場合には、スピーチ制御システムは、ワイヤレス電話アプリケーション（ＷＴＡ）サーバーにおいて実施することができ、ＷＴＡサーバーは、加入者ターミナルから受け取った入力スピーチコマンドを上記テキストコマンドに変換するために、ネットワークスピーチ認識手段からテキストコマンドを受け取るように構成される。これにより、既存のＷＴＡアプリケーションを、最適化されたスピーチ認識で改善することができる。
【００１６】
或いは又、スピーチ制御システムは、スピーチコマンドを入力するための入力手段と、スピーチコマンドをテレコミュニケーションネットワークのスピーチ認識手段に送信するための送信手段と、スピーチ認識手段からテキストコマンドを受け取るための受信手段とを有する加入者ターミナルであり、上記送信手段は、受信したテキストコマンドをネットワークアプリケーションサーバーへ送信するように構成される。
従って、受信したテキストコマンドの有効性のチェックは、それがネットワークアプリケーションサーバーに送信される前に、加入者ターミナル、例えば移動ステーションにおいて実行される。従って、ネットワークアプリケーションサーバは、有効なコマンドしか受信しないので、ネットワークアプリケーションサーバーにおける処理時間を短縮することができる。
【００１７】
状態定義情報は、ワイヤレスマークアップ言語（ＷＭＬ）ファイル又はハイパーテキストマークアップ言語（ＨＴＭＬ）ファイルのようなデータファイルである。このデータファイルは、ネットワークアプリケーションサーバーにより送信される標準的情報の一部分としてスピーチ制御システムにオンラインで送信することができる。
更に、状態定義情報は、状態従属文法及び／又は語彙ファイルをロードするためのロード命令を含む。従って、スピーチ制御システムは、ネットワークアプリケーションサーバーの状態変化が決定された場合には、特定の１組の有効コマンドをロードするためにロード命令を直接的に使用することができる。
好ましくは、状態定義情報は、ネットワークアプリケーションサーバーによりサーバーの設定時間に与えることができる。
【００１８】
更に、状態定義情報は、スピーチ制御システムのハードウェアにおいて動作するネットワークサーバーにコマンドセットと一緒に記憶することができる。
好ましくは、スピーチ制御システムは、複数の売主特有のスピーチ認識手段を備え、これら複数の売主特有のスピーチ認識手段の対応パラメータは、状態定義情報において定義される。これにより、ハードウェア及びソフトウェア独立のプラットホームをベースとするユニバーサルスピーチ制御システムを得ることができる。従って、必要とされる音声処理ハードウェア及び売主特有のスピーチ認識手段を、ネットワークアプリケーションサーバーに基づいて選択することができる。
本発明の更に別の好ましい開発は、従属請求項に記載する。
【００１９】
【発明を実施するための最良の形態】
以下、添付図面を参照して、本発明の好ましい実施形態を詳細に説明する。
本発明の好ましい実施形態によるスピーチ制御システムを含むテレコミュニケーションネットワークがブロック図の形態で図１に示されている。図１において、移動ステーション（ＭＳ）１は、ベースステーションサブシステム（ＢＳＳ）２に無線接続され、このＢＳＳは、移動交換センター（ＭＳＣ）３を経てテレコミュニケーションネットワーク４に接続される。テレコミュニケーションネットワーク４は、種々のサービスを提供するインターネットのようなデータネットワークである。
【００２０】
更に、ネットワークアプリケーションサーバー（ＮＡＳ）５がネットワーク４に接続され、対応するコマンドに基づいて特定のサービスを提供する。又、自動スピーチ認識手段即ちエンジン（ＡＳＲ）６は、移動ステーション１のような加入者ターミナルにスピーチ入力を行えるようにする中央手段として設けられる。
認識プロセスを改善し、そしてより高い精度で認識レートに到達するために、言語特有の特徴がＡＳＲエンジン６に使用される。スピーチ認識の高い精度を達成するために、アプリケーションを必要なコンテクストに微同調させねばならない。これは、アプリケーションのための語彙、及びアプリケーションのコンテクストにおいて有効な文法を指定することにより行われる。語彙とは、基本的に、ＡＳＲエンジン６により認識されるべき１組のワード、例えば、クローズ、リード、メッセージ、オレンジ、ペン、椅子、退出、オープン等のワードである。ＡＳＲエンジン６においては、所与のアプリケーションに対して文法を適用するための手段を設けることができる。これは、例えば、次のようなルールに基づく文法により達成することができる。
公開＜コマンド＞＝［＜丁寧＞］＜行動＞＜目的＞（且つ＜目的＞）＊；
＜行動＞＝読む｜次ぎ｜削除；
＜目的＞＝メッセージ｜項目；
＜丁寧＞＝どうぞ；
【００２１】
このルールに基づく文法では、ユーザにより話される１つの公開ルール＜コマンド＞が指定される。このルールは、サブルール＜行動＞、＜目的＞及び＜丁寧＞の組合せであり、＜丁寧＞の周りの四角い括弧は、その任意性を示す。それ故、上記文法は、コマンド「メッセージを読む(read message)」、「どうぞ、項目及びメッセージを読んで下さい(please read item and message)」、等をサポートする。
コマンドベースのＡＳＲアプリケーションでは、ルールに基づく文法を使用して、アプリケーションが処理するようプログラムされた全ての口述入力を定義する。ルールに基づく文法は、基本的に、アプリケーションによりサポートされる全ての口述コマンド（又はコマンド構文）を指定する。電子メール読取装置の場合には、文法ファイルは、電子メール読み取りアプリケーションが受け入れる全てのコマンドを含む（例えば、メッセージ１、メッセージ２、・・メッセージＮ、退出、削除及び次のメッセージ）。
【００２２】
ＡＳＲエンジン６は、一般に、スピーチ認識を開始する前に、関連文法ファイルをロードする。あるアプリケーションは、ネットワークアプリケーションサーバー５のようなアプリケーションの異なるコンテクストを定義するために多数の文法ファイルをもつことができ、ここで、ＡＳＲエンジン６は、実行時間にコンテクスト従属の文法ファイルをロードすることが要求される。
好ましい実施形態では、文法ファイル、語彙ファイル、及びアプリケーション状態定義ファイル（ＡＳＤファイル）が定義される。それ故、各ネットワークアプリケーションサーバー５は、ＡＳＤファイル、文法ファイル及び／又は語彙ファイルを形成する。文法ファイルは、ＡＳＲエンジン６の要求事項に適用され、異なる売主のＡＳＲエンジン６は、異なる文法ファイルフォーマットを有する。
【００２３】
ＡＳＤファイルは、アプリケーションの全ての考えられる状態と、それら状態間をいかにジャンプするかを、各状態に対する有効コマンドと共に記述するファイルである。従って、ＡＳＤファイルは、コンテクスト従属の文法ファイル及び語彙ファイル名を指定するための手段を形成する。これは重要な特徴である。というのは、所与のアプリケーションは、コンテクストに基づいて異なる文法及び／又は語彙を使用するからである。この情報がＡＳＲエンジン６にオンラインでロードされる場合には、小さな組の有効コマンドと、それにより得られる高い認識精度とにより、スピーチ認識及び全体的な応答時間を著しく改善することができる。
【００２４】
ＡＳＤファイルが、ＨＴＭＬ（ハイパーテキストマークアップ言語）に類似した構文をベースとする場合には、次のように定義することができる。

【００２５】
但し、＜ＡＳＤ＞タグは、ネットワークアプリケーションサーバー５の状態定義を与えるファイル形式としてファイルを識別し、＜ＡＰＰ＞タグは、アプリケーション名を指定し、そして＜ＳＴＡＴＥ＞タグは、所与の状態即ち状態の名称と、この状態に対する有効コマンドを定義し、そして各コマンドで、アプリケーションがジャンプしなければならない次の状態も定義される。このような＜ＳＴＡＴＥ＞タグは、ネットワークアプリケーションの各状態に対して定義される。＜ＧＲＡＭＭＡＲ＞タグは、コマンド及びコマンドの構文を定義する手段を与える。
【００２６】
上記ファイルに基づき、アプリケーションは、メッセージ１、２、３、・・Ｎの後に、状態「Ｒｅａｄ」へジャンプしなければならない。＜ｄｉｇｉｔｓ＞タグは、特定の文法を定義する。ここに示すケースでは、＜ＧＲＡＭＭＡＲ＞タグは、デジットが１、２、３、４又は５でなければならないことを示す。コマンド「Ｅｘｉｔ」の後に、アプリケーションは、退出しなければならない（これは、ナル状態（””）として示される。）「Ｒｅａｄ」状態において「Ｅｘｉｔ」コマンドが発生されたときには、「ＭａｉｎＭｅｎｕ」へ状態が移行しなければならないことに注意されたい。
【００２７】
この解決策を用いると、ＡＳＤファイルは、ＡＳＲエンジン６又は移動ステーション１に、所与のコンテクストに対してどのコマンドが有効であるかを通知する。移動ステーション１又はＡＳＲエンジン６がネットワークアプリケーションサーバー５の状態に追従するために、ＡＳＤファイルには状態移行ルールも設けられる。コンテクスト従属文法ファイルを含む他のタグを使用すると、どの文法又は語彙ファイルをロードすべきかＡＳＲエンジン６に命令することができる。これにより、高い柔軟性が与えられると共に、認識をより正確に行うことができる。というのは、ＡＳＲエンジン６は、ネットワークアプリケーションサーバーのコンテクストに微同調されるからである。このようなタグの一例を以下に示す。

【００２８】
図２は、好ましい実施形態において実行されるスピーチ認識プロセスの一例を示すフローチャートである。
最初に、ＡＳＲエンジン６は、接続されるべきネットワークアプリケーションサーバー５から対応ＡＳＤファイルをロードする（Ｓ１０１）。ロードされたＡＳＤファイルにおいて、ＡＳＲエンジンは、ネットワークアプリケーションサーバー５が状態「Ｒｅａｄ」に入るときに、状態従属文法ファイル、即ち「ＲｅａｄＥｍａｉｌ．ｇｍｒ」をロードするように命令される。或いは又、ＡＳＲエンジン６は、ネットワークアプリケーションサーバー５から一般的な文法ファイルをロードしてもよい（Ｓ１０２）。
【００２９】
次いで、文法ファイルに基づき、スピーチ認識の有効テキストコマンドが決定される（Ｓ１０３）。状態従属文法ファイルの場合には、ロードされた文法ファイルに定義されたコマンドが、スピーチ認識の有効コマンドとして決定される。一般的な文法ファイルの場合には、有効コマンドが、ＡＳＤファイルに与えられた対応情報に基づいて一般的文法ファイルから選択される。従って、この状態では、又は少なくとも異なる文法ファイルがロードされるまでは、この決定された有効コマンドしか許されない。
【００３０】
その後、スピーチコマンドが移動ステーション１から受け取られ（Ｓ１０４）そしてその受け取ったスピーチコマンドに対してスピーチ認識が実行される（Ｓ１０５）。スピーチ認識処理によりその受け取ったスピーチコマンドから導出されたテキストコマンドは、次いで、決定された有効テキストコマンドに対してチェックされる（Ｓ１０６）。
ステップ１０７において有効コマンドが決定された場合には、テキストコマンドがネットワークアプリケーションサーバー５又は移動ステーション１に直接的に送られる（Ｓ１０８）。さもなくば、エラーメッセージが送信され、スピーチコマンドがエラーであることが移動ステーション１に通知される（Ｓ１０９）。
【００３１】
その後、ＡＳＲエンジン６は、ＡＳＤファイルに定義された状態移行ルールを参照し、そしてその送られたコマンドがネットワークアプリケーションサーバー５の状態変化を招くかどうか決定する（Ｓ１１０）。状態変化が決定されない場合には、処理がステップＳ１０４に復帰して、別のスピーチコマンドを受け取ると共に、もし必要であれば、別の受け取ったスピーチコマンドのスピーチ認識を実行する。
状態変化が決定された場合には、処理がステップ１０３に復帰し、そしてＡＳＲエンジン６は、ＡＳＤファイルを参照して、新たな１組の有効テキストコマンドを決定する。これは、ＡＳＤファイルに与えられる命令に基づいて新たな状態従属文法ファイルをロードするか、或いはＡＳＤファイルの対応情報に基づいて一般的な文法ファイルから新たな有効コマンドを選択することにより、達成することができる。その後、ステップ１０４において新たなスピーチコマンドが受け取られ、そしてステップ１０５においてスピーチ認識が継続される。
【００３２】
重要なことは、ＤＳＲ型のアプリケーションは、アプリケーション特有の特徴をＡＳＲエンジン６に通すという標準的な方法をもつ必要があることである。というのは、ＡＳＲエンジン６は、汎用のＡＳＲリソースであり、そしていかなるネットワークアプリケーションも、状態定義及び文法ファイルを形成することによりＡＳＲ特徴を使用できねばならないからである。それ故、好ましい実施形態によれば、ＡＳＲエンジン６は、実行時間に新たな文法ファイルをロードすることができる。これは、ＡＳＲエンジン６が、ＡＳＤファイルを参照することによりネットワークアプリケーションサーバー５の特定の状態／コンテクストに適用できる文法ルールのみをロードするように命令され得ることを意味する。これは、認識の精度及びネットワーク接続使用の効率を著しく改善する。
【００３３】
ネットワークアプリケーションサーバー５及びそのユーザインターフェイスの実施は、使用するソフトウェア及びハードウェアプラットホームに基づいて変化し得る。ほとんどのネットワークアプリケーションサーバー５は、ＨＴＴＰインターフェイス（即ちＨＴＭＬ）、ＷＡＰ（ワイヤレスアプリケーションプロトコル−ＷＭＬ）又は所有のアプリケーションインターフェイス（ＡＰＩ）を与えることができる。ＡＳＤファイルがＷＭＬ（ワイヤレスマークアップ言語）又はＨＴＭＬ（ハイパーテキストマークアップ言語）のいずれかに適用される場合には、それを、ネットワークアプリケーションサーバー５で実行されるいかなる形式のアプリケーションにおいてもアプリケーション状態又はスピーチコマンドに対する汎用定義ファイルとして使用することができる。このＡＳＤ情報を使用して、ＡＳＲエンジン６は、当該ＮＡＳアプリケーションの内部表示を形成することができる。次いで、この表示又はモデルを使用して、ＡＳＲエンジン６をネットワークアプリケーションサーバー５のアプリケーション状態と同期状態に保つことができる。
【００３４】
従って、スピーチ認識特徴を与える各ネットワークアプリケーションサーバー５は、そのスピーチ特有のＷＭＬカード又はＨＴＭＬ位置を有する。一例として、毎日のニュースサービスの場合には、状態定義情報ＵＲＬ（均一リソースロケータ）は、次のようなファイルでよい。
//services.internal.net/dailynews/speechsettings
それ故、スピーチ制御システムは、それが移動ステーション１にあるかネットワークサーバーにあるかに関わりなく、このファイルを所与のＵＲＬからロードすることが必要である。
【００３５】
更に、ネットワークアプリケーションサーバー５が実際にＨＴＴＰ又はＷＡＰ基点サーバーである場合には、このサーバーにより送信される第１のＷＭＬカード又はＨＴＭＬページが、特定のタグのもとで上記特有のＵＲＬを含むことができる。従って、移動ステーション１には、このアプリケーションがスピーチ制御をサポートすること、及びこのＵＲＬにおけるファイルをロードしてスピーチ認識ファシリティを形成する必要があることを通知できる。
従って、ＡＳＤファイルは、ネットワークアプリケーションサーバー５により送信される標準的なＨＴＭＬ／ＷＭＬスクリプトの一部分としてＡＳＲエンジン６へオンラインで送信することができる。ＡＳＲエンジン６は、これらのスクリプトを自動的に解釈し、そしてネットワークアプリケーションサーバー５と歩調を保って、スピーチコマンドを効率的に処理すると共に、文法ファイルのオンラインローディング等の機能を実行する。この場合に、ＡＳＲエンジン６は、ＬＯＡＤＧＲＡＭＭＡＲタグに指定されたＵＲＬを直接参照して、関連文法ファイルを読み取る。
【００３６】
ネットワークアプリケーションサーバー５の他の非ＷＭＬ／ＨＴＭＬアプリケーションについては、ＡＳＤファイルがネットワークアプリケーションサーバー５により設定時に即ちオフラインでＡＳＲエンジン６に供給される。これらのＡＳＤファイルは、上述したＨＴＭＬのような仕様に従って形成されねばならず、そしてＡＳＲエンジン６のハードウェアで動作するＷＷＷサーバー（例えば、ｗｗｗ．ａｓｒ．ｃｏｍ）に文法ファイルと共に記憶される。
ＡＳＲエンジン６とネットワークアプリケーションサーバー５との間の対話の始めに、ＡＳＲエンジン６は、先ず、サーバーｗｗｗ．ａｓｒ．ｃｏｍからＡＳＤファイルをロードし、そしてネットワークアプリケーションサーバー５のアプリケーションの内部状態表示／モデルを形成する。その後、ＡＳＲエンジンは、ネットワークアプリケーションサーバー５の状態と歩調を合わせて、スピーチコマンドを効率的に処理すると共に、文法ファイルのランタイムローディングのような機能を実行する。この場合には、ＬＯＡＤＧＲＡＭＭＡＲタグは、ｗｗｗ．ａｓｒ．ｃｏｍを指す全ＵＲＬを含む。
【００３７】
ネットワークアプリケーションサーバー５のアプリケーションが例えば装置名ｖｍｓｖｒをもつ「音声メールサーバー」である場合には、例えば、次のＵＲＬが使用される。
"http://www.asr.com/vmsvr/Grammar/vmail.gmr"
上記アプリケーションは、ネットワーク４における単一のＡＳＲエンジン６の使用をベースとするものであった。ここで、ＡＳＲエンジン６は、固定ハードウェア及びソフトウェアプラットホームにおいて実施される。移動ステーションのアプリケーションの観点から、この汎用ＡＳＲエンジン６は、ＡＳＲ要求を取り扱い、そして対応するテキストコマンドで応答する。
【００３８】
しかしながら、ＡＳＲエンジン６がハードウェア及びソフトウェアとは独立したプラットホーム、例えば、ＪＳＡＰＩを伴うＪａｖａ（ＪａｖａスピーチＡＰＩ、即ち異なる売主のＡＳＲエンジンに対して共通のＡＰＩを与える現在開発中の標準的ＡＰＩ）をベースとする場合には、ＡＳＤファイルの機能を更に拡張することができる。この場合には、必要な音声処理ハードウェア及び売主特有のＡＳＲエンジン６をネットワークアプリケーションサーバー５のアプリケーションに基づいて選択するという融通性が与えられる。これは、論理的なＡＳＲエンジンを、ネットワークアプリケーションサーバー５のアプリケーション要求に基づいて売主特有の物理的ＡＳＲエンジン６に接続することができ、カスタムハードウェアも音声処理に使用できることを意味する。付加的なタグを使用して、対応する任意のパラメータをＡＳＤファイルに定義することができる。
【００３９】
既存のサービス提供を改善するようにオペレータにより使用できるＷＡＰアプリケーションにおけるＡＳＤファイルの実施例を以下に説明する。上記の例では、コンテクストベースのスピーチ認識を実行するためにＡＳＲサーバー又はエンジン６によりＡＳＤファイルが使用された。この例では、図３に示すように、ＡＳＤファイルが異なるアプリケーションサーバー、即ちＷＡＰにおけるＷＴＡ（ワイヤレス電話アプリケーション）サーバー７により使用され、同様のタスクを実行する。この場合には、ＷＡＰイネーブルされる移動電話又はステーション１を使用すると仮定する。
【００４０】
ＷＡＰイネーブルされる移動ステーション１は、全ＷＡＰスタックをインストールさせ、そしてＷＡＥ（ワイヤレスアプリケーション環境）を実行することができる。ＷＴＡサーバー７は、現在のケースでは標準移動ネットワークであるネットワーク４のサービスを制御する能力を有する。ＷＴＡサーバー７は、原理的な内容発生器として動作する。この内容は、カスタマイズされそしてクライアント、即ちＷＡＰソフトウェアを実行している移動ステーション１にダウンロードされる。又、ＷＴＡサーバー７は、ＷＴＡ事象を通して入呼びの詳細を移動ステーション１に通知するといったコール制御機能も実行することができる。
【００４１】
更に、ネットワークをベースとするＡＳＲサーバー６が設けられ、これは、アプリケーションのＩＤ／アドレス、ＭＳＩＳＤＮ、スピーチエンコード形式、文法ファイルＩＤ（適当な文法ルールを選択するための）及び他の任意なパラメータのようなパラメータに基づいて、アプリケーションをスピーチサーバーに接続できるようにする。更に、ＡＳＲサーバー６は、所与のＭＳＩＳＤＮ番号へ出呼びを与える能力を有し、ＡＳＲサーバー６は、ＰＣＭ、ＣＥＰ又は他のフォーマットを有する受信音声入力を抽出し、その音声入力をスピーチ認識エンジンに供給して、認識されたテキストを得、そしてそのテキストを発呼側アプリケーションのＩＤ／アドレスに送信する。次いで、ＷＴＡサーバー７は、テキストの有効性をチェックし、そして文法ファイル等をロードするようにＡＳＲサーバー６を制御することもできる。
【００４２】
スピーチインターフェイスを有する各ネットワークアプリケーションサーバー５は、ＡＳＤファイルをＷＴＡサーバー７に、そのサーバーに対する基本的なＷＭＬカードデッキ即ちＷＭＬ文書と共に与える。ＷＴＡサーバー７は、ＡＳＤファイルをロードし、そして移動ステーション１に送信されたＷＭＬをＡＳＤファイル設定に基づいて変更することができる。ＡＳＤファイルに基づき、移動ステーション１の音声機能及びＡＳＲサーバー６の設定は、アプリケーションコンテクストに基づいて制御される。
【００４３】
ここに示す例では、ＡＳＤファイルは、実際のアプリケーションに対して使用されるべきＡＳＲエンジン、実際のスピーチイネーブルされるアプリケーションに使用されるＡＳＲエンジンによりサポートされるエンコード形式、使用されるべきデフォールト文法ファイル（ファイル名）、デフォールト語彙（ファイル名又はワード）及び実際のアプリケーションの状態、即ちメニューハイアラーキーのような属性を定義する。各メニューは、メニューにサポートされるコマンド及びそれに対応するＮＥＸＴ状態に対する仕様、以前に設定された値をオーバーライドする新たな文法ルール及び語彙、並びに実際のアプリケーションが、移動ステーション１のマイクロホン又はスピーカがオンであることを必要とするかオフであることを必要とするかを指定するパラメータを与える。
【００４４】
ここに示すＷＡＰベースの例の動作を、天気サービスアプリケーション及び音声メールサービスアプリケーションについて以下に説明する。
天気サービスアプリケーション
サービスプロバイダー（オペレータ）は、天気サービスをその移動加入者に提供し、そしてスピーチインターフェイスを経てそのサービスをオファーする。オペレータは、ＡＳＲサーバー６をそのネットワーク４にインストールしており、そしてこのＡＳＲサーバー６をＷＴＡサーバー７と共に使用して、天気サービスにスピーチインターフェイスを与える。
【００４５】
この場合、移動ステーション１のユーザは、スピーチインターフェイスを使用するように既に準備されている天気メニューをアクチベートする。この要求は、ＷＡＥによってＷＴＡサーバー７へ送信される。次いで、ＷＴＡサーバー７は、天気サービスに関連して対応するネットワークアプリケーションサーバー５から予めロードされたＷＭＬカードのデッキを移動ステーション１に送信する。この点において、移動ステーション１のＷＡＥソフトウェアは、聴取モードに入り、ネットワーク４のＡＳＲサーバー６からの入呼びに応答する。その後に、ＷＴＡサーバー７は、ＡＳＲサーバー６へＡＳＲセッションに対する要求を送信し、これは、ＭＳＩＳＤＮ、ＷＴＡサーバー７との割り当てられたセッションのＩＤ、及び使用されるべき文法ルールのＩＤを含む。文法ルール名は、天気サービスに対して対応するネットワークアプリケーションサーバー５から予めロードされたＡＳＤファイルから導出される。
【００４６】
ＡＳＲサーバー６は、必要なリソース、即ちスピーチエンジンのダイヤルアウトポート及びＡＳＲセッションが得られるように確保し、そしてその確認をＷＴＡサーバー７へ送信する。その後、ＡＳＲサーバー６は、ＭＳＩＳＤＮをコールし、そしてネットワーク４がコール指示を移動ステーション１へ送信する。移動ステーション１のＷＡＥソフトウェアは、自動的にコールに応答し、そしてＡＳＲサーバー６と移動ステーション１との間にスピーチ接続が確立される。実際に、移動ステーション１とＡＳＲサーバー６との間の上記コールシグナリングは、ＷＴＡサーバー７を経て実行される。
ＷＴＡサーバー７から得られたアプリケーション従属のＷＭＬに基づき、移動ステーション１は、そのスピーカをデアクチベートし、そしてそのマイクロホンを経て受け取った音声入力を、確立されたスピーチ接続を通して送信する。音声入力は、ＷＡＥソフトウェアにより、必要なフォーマット、即ちＰＣＭ、ＣＥＰ等に基づいてコード化される。ＡＳＲサーバー６は、受け取った音声入力をテキストに変換し、そしてその得られたテキストをＷＴＡサーバー７へ送信する。
【００４７】
天気セッションが開始されているので、ＷＴＡサーバー７は、それに対応するＡＳＤファイルをロードしており、現在は、受け取ったテキストを有効なコンテクスト従属コマンドと比較する位置にいる。有効なコマンド、即ち「ロンドンＵＫ」が受信された場合には、ＷＴＡサーバー７は、天気サービスを提供するネットワークアプリケーションサーバー５から英国ロンドンのＷＭＬ／ＨＴＭＬを要求する。ネットワークアプリケーションサーバー５は、要求されたロンドンの天気レポートで応答し、ＷＴＡサーバー７は、ロンドンの天気に対するＷＭＬカードデッキを移動ステーション１に供給する。文法ルール又は語彙がＷＭＬカードのセットにおいて変更される場合には、ＡＳＤファイルは、それに対応する情報を含み、そしてＷＴＡサーバー７は、ロンドンの天気について使用されるべき新たな文法ルール又は語彙をＡＳＲサーバー６に送信する。従って、ＡＳＲサーバー６は、新たなＷＭＬカードに対して要求される新たな文法又は語彙を使用する準備ができる。
【００４８】
その後、移動ステーション１から受信したスピーチコマンドからＡＳＲサーバー６により変換されたテキストは、ＷＴＡサーバー７に送信され、該サーバーはその有効性をチェックする。有効コマンド即ち「ヒースロー」が受信された場合には、ＷＴＡサーバー７は、ロンドン・ヒースローの天気情報を要求し、そしてネットワークアプリケーションサーバー５は、要求された天気レポートで応答する。次いで、ロンドン・ヒースローの天気に対するＷＭＬカードデッキがＷＴＡサーバー７により移動ステーション１へ供給される。
音声メールサービスアプリケーション
この場合には、サービスプロバイダー（又はオペレータ）は、音声メールサービスにその移動加入者へのスピーチサービスを与える。
【００４９】
音声メールサービスを提供するネットワークアプリケーションサーバー５は、新たな音声メールメッセージをＷＴＡサーバー７へ送信する。次いで、ＷＴＡサーバー７は、移動ステーション１への音声メールサービスに関連してネットワークアプリケーションサーバー５から予めロードされたＷＭＬカードのデッキを送信する。この点において、移動ステーション１のＷＡＥソフトウェアは、聴取モードに入り、ネットワーク４のＡＳＲサーバー６からの入呼びに応答する。次いで、移動ステーション１は、ＷＴＡサーバー７にＡＳＲ要求を送信し、これは、ユーザが音声メールサービスへのスピーチインターフェイスを使用することを指示する。この点において、ＷＴＡサーバー７は、ネットワーク４に、入呼び指示をＷＴＡサーバー７に送信するよう命令する。
【００５０】
その後、ＷＴＡサーバー７は、ＡＳＲサーバー６にＡＳＲセッションに対する要求を送信し、これは、ＭＳＩＳＤＮ、ＷＴＡサーバー７との割り当てられたセッションのＩＤ、及び使用されるべき文法ルールのＩＤを含む。文法ルール名は、音声メールサービスについて対応するネットワークアプリケーションサーバー５から予めロードされたＡＳＤファイルから導出される。
ＡＳＤサーバー６は、要求されたリソース即ちダイヤルアウトポート及びスピーチエンジンのＡＳＲセッションが得られるように確保し、そしてＷＴＡサーバー７に確認を送信する。その後、ＡＳＲサーバー６は、ＭＳＩＳＤＮにコールし、そしてネットワーク４は、コール指示を移動ステーション１に送信する。移動ステーション１のＷＡＥソフトウェアは、そのコールに自動的に応答し、そしてＡＲＳサーバー６と移動ステーション１との間にスピーチ接続が確立される。
【００５１】
ＷＴＡサーバー７から得られたアプリケーション従属のＷＭＬに基づき、移動ステーション１は、そのスピーカ及びマイクロホンの両方をアクチベートし、そしてそのマイクロホンを経て受信した音声入力を、確立されたスピーチ接続を通して送信する。この音声入力は、必要なフォーマットに基づくＷＡＥソフトウェア、即ちＰＣＭ、ＣＥＰ等によりコード化される。ＡＳＲサーバー６は、その受信した音声入力をテキストに変換する。
ここで、ＷＴＡサーバー７は、所与のＭＳＩＳＤＮにコールするコマンドを、音声メールサービスを提供するネットワークアプリケーションサーバー５へ送信し、該サーバーは、次いで、ＭＳＩＳＤＮにコールする。このケースでは、多当事者コールが設定される。というのは、ＡＳＲサーバー６は、移動ステーション１におけるスピーチ入力を要求し、そしてネットワークアプリケーションサーバー５は、移動ステーション１に音声を送信する必要があるからである。これら２つのサービスは、異なる装置におけるものであり、そしてＡＰＩ（アプリケーションプログラミングインターフェイス）も互いの接続ももたない。両サービスは、移動ステーション１にアクセスすることを必要とするので、多当事者コールの設定が要求され、これについて以下に述べる。
【００５２】
多当事者コールの設定においては、ＷＴＡサーバー７がＭＳＩＳＤＮに対するコール指示を受け取り、そしてコール指示事象メッセージを、多当事者コールにコールの追加を命令する特殊なパラメータと共に移動ステーション１へ送信する。移動ステーション１は、コール１、即ちＡＳＲサーバー６から移動ステーション１へのコールを保留するようにネットワーク４に命令するコール保留メッセージを送信する。次いで、移動ステーション１は、コール２、即ちネットワークアプリケーションサーバー５から移動ステーション１へのコールを受け入れ、スピーチ接続が確立される。その後、移動ステーション１は、多当事者コール、即ちコール１及び２の確立を命令し、ここで、ＡＳＲサーバー６及びネットワークアプリケーションサーバー５の両方が移動ステーション１に接続される。
【００５３】
音声メールセッションがスタートしているので、ＷＴＡサーバー７は、音声メールの対応ＡＳＤファイルをロードしており、現在は、受信したテキストを、有効なコンテクスト従属コマンドと比較する位置にいる。有効なコマンド即ち「アンソニー」が受信された場合には、ＷＴＡサーバー７は、音声メールサービスを提供するネットワークアプリケーションサーバー５に、メッセージ「アンソニー」を再生するよう要求する。従って、ネットワークアプリケーションサーバー５は、メッセージ「アンソニー」の再生を行う。
上記説明及び添付図面は、本発明を単に例示するものに過ぎないことを理解されたい。より詳細には、本発明は、移動電話のスピーチ認識又は制御システムに限定されるものではなく、いかなるデータネットワークにも使用することができる。従って、本発明の装置及び方法は、特許請求の範囲内で種々の変更がなされ得るものである。
【００５４】
状態定義情報がネットワークアプリケーションサーバーからロードされるスピーチ制御システム及び方法について開示した。状態定義情報は、ネットワークアプリケーションサーバーの考えられる状態を定義し、そしてネットワークアプリケーションサーバーの１組の有効なコマンドを決定するのに使用され、入力スピーチコマンドを変換することにより得られたテキストコマンドの有効性は、そのテキストコマンドを上記決定された１組の有効なコマンドと比較することによりチェックできる。これにより、ネットワークアプリケーションサーバーへの誤ったテキストコマンドの送信を防止して、全処理時間及び応答遅延を短縮することができる。
【図面の簡単な説明】
【図１】本発明の好ましい実施形態によるスピーチ制御システムを含むテレコミュニケーションネットワークのブロック図である。
【図２】本発明の好ましい実施形態によるスピーチ制御方法のフローチャートである。
【図３】本発明の好ましい実施形態によるＷＡＰベースのスピーチ制御システムを含むテレコミュニケーションネットワークのブロック図である。

Claims

テレコミュニケーションネットワーク(4)用のスピーチ制御システムにおいて、
ａ）ネットワークアプリケーションサーバー(5)の考えられるすべての状態を定義する状態定義情報をネットワークアプリケーションサーバー(5)からロードするためのロード手段と、
ｂ）上記ネットワークアプリケーションサーバー(5)に対する１組の有効コマンドを上記状態定義情報に基づいて決定するための決定手段と、
ｃ）加入者ターミナル (1) から受け取った入力スピーチコマンドを、上記ネットワークアプリケーションサーバー (5) へ供給されるべきテキストコマンドへと変換するためのスピーチ認識手段 (6) と、
ｄ）上記ネットワークアプリケーションサーバー(5)を制御するのに使用される上記入力スピーチコマンドを変換することにより得られた上記テキストコマンドの有効性を、そのテキストコマンドを上記決定された１組の有効コマンドと比較することによりチェックするためのチェック手段と、
を備えたことを特徴とするスピーチ制御システム。
上記ロード手段は、上記ネットワークアプリケーションサーバーによってサポートされる有効コマンドの全組を指定する文法及び／又は語彙情報をロードするように構成され、そして上記決定手段は、上記有効コマンドの全組と、上記状態定義情報に含まれた状態移行情報とに基づいて、上記１組の有効コマンドを決定するように構成された請求項１に記載のシステム。
上記決定手段は、上記状態定義情報に含まれた状態移行情報に基づいて状態変化を決定するときに、ネットワークアプリケーションサーバー(5)の特定の状態に対して１組の有効コマンドを定義する状態従属文法ファイルを上記ロード手段によりロードさせるように構成された請求項１に記載のシステム。
上記テレコミュニケーションネットワーク(4)は、移動ネットワークであり、上記スピーチ制御システムは、ワイヤレス電話アプリケーション(WTA)サーバー(7)において実施され、そしてこのＷＴＡサーバー(7)は、加入者ターミナル(1)から受け取った入力スピーチコマンドを上記テキストコマンドに変換するために上記スピーチ認識手段(6)から上記テキストコマンドを受け取るように構成される請求項１ないし３のいずれかに記載のシステム。
上記スピーチ制御システムは、スピーチコマンドを入力するための入力手段と、上記スピーチコマンドを上記テレコミュニケーションネットワーク(4)のスピーチ認識手段(6)に送信するための送信手段と、スピーチ認識手段(6)から上記テキストコマンドを受け取るための受信手段とを有する加入者ターミナル(1)を含み、上記送信手段は、受信したテキストコマンドを上記ネットワークアプリケーションサーバー(5)へ送信するように構成される請求項１ないし３のいずれかに記載のシステム。
上記状態定義情報は、状態従属文法ファイルをロードするためのロード命令を含む請求項３に記載のシステム。
上記状態定義情報はデータファイルである請求項１ないし６のいずれかに記載のシステム。
上記データファイルは、ＷＭＬファイルである請求項７に記載のシステム。
上記データファイルは、ＨＴＭＬファイルである請求項７に記載のシステム。
上記データファイルは、上記ネットワークアプリケーションサーバー(5)により送信された標準情報の一部分として上記スピーチ制御システムへオンラインで送信される請求項８又は９に記載のシステム。
上記状態定義情報は、設定時に上記ネットワークアプリケーションサーバー(5)により与えられる請求項１に記載のシステム。
上記状態定義情報は、上記スピーチ制御システムのハードウェアで動作するネットワークサーバーにコマンドセット情報と一緒に記憶される請求項１ないし３のいずれかに記載のシステム。
上記スピーチ制御システムは、複数の売主特有のスピーチ認識手段を備え、そしてこれら複数の売主特有のスピーチ認識手段の対応パラメータが上記状態定義情報において定義される請求項１又は２又は３又は５に記載のシステム。
テレコミュニケーションネットワークのスピーチ制御方法において、
ａ）ネットワークアプリケーションの考えられるすべての状態を定義する状態定義情報をネットワークアプリケーションからロードし、
ｂ）上記ネットワークアプリケーションに対する１組の有効コマンドを上記状態定義情報に基づいて決定し、
ｃ）加入者ターミナルから受け取った入力スピーチコマンドを、スピーチ認識手段においてネットワークアプリケーションサーバーへ供給されるべきテキストコマンドへと変換し、そして
ｄ）上記ネットワークアプリケーションを制御するのに使用される上記入力スピーチコマンドを変換することにより得られた上記テキストコマンドの有効性を、そのテキストコマンドを上記決定された１組の有効コマンドと比較することによりチェックする、
という段階を含むことを特徴とする方法。
上記ネットワークアプリケーションに対して有効コマンドの全組を指定する文法及び／又は語彙情報をロードする段階を更に含み、そして上記決定段階は、上記有効コマンドの全組と、上記状態定義情報に含まれた状態移行情報とに基づいて実行される請求項１４に記載の方法。
上記状態定義情報に含まれた状態移行情報に基づいて状態変化が決定されたときに、上記ネットワークアプリケーションの特定の状態に対して１組の有効コマンドを定義する状態従属文法ファイルをロードする段階を更に含む請求項１４に記載の方法。