JP4842114B2

JP4842114B2 - 自動音声認識システムにおける孤立語句コマンド認識及び接続語句コマンド認識の同時対応

Info

Publication number: JP4842114B2
Application number: JP2006341879A
Authority: JP
Inventors: ガン・ワン; マッテオ・コントリニ; チェンギ・チェン; デヴィッド・シャッテネヴァー; ヘインツ−ヴェルナー・スティラー
Original assignee: シュトルツ・エンドスコープ・プロドゥクツィオンス・ゲーエムベーハー
Priority date: 2005-12-20
Filing date: 2006-12-19
Publication date: 2011-12-21
Anticipated expiration: 2026-12-19
Also published as: US20070150288A1; EP1801780B1; CA2570767A1; CA2570767C; JP2007171963A; EP1801780A1; US7620553B2

Description

本発明は、音声認識システムに関し、具体的には、孤立及び接続語句コマンドを同時に認識する音声認識のためのシステム及び方法に関する。

音声認識は、マイクによって受信された音響信号が、コンピュータによってテキスト言葉、番号、又は記号のセットに変換される過程である。その後、これらの認識された言葉は、文書作成、データ入力、及びコマンド制御等の目的のための各種コンピュータソフトウェアアプリケーションで使用されうる。例えば、音声認識システムは、各種医療システム及び装置を制御するために現在の手術室で使用されうる。外科医又は他の使用者は、単純なボイスコマンドを発することによって、音声認識システムによって制御された装置の機能に命令することができる。例えば、外科医は、患者治療台を調整するために、又はポンプの圧力を調整するためにボイスコマンドを述べることができる。

手術室で音声認識を可能にするため、医療装置及び／又は他の機器は、通信チャンネル（例えば、イーサネット（登録商標）接続、デバイスバス等）を介して要素（例えば、通報システム）に接続される。また、音声認識システムは、音声駆動ユーザーインターフェース及び認識ソフトウェアを備え、接続される。ボイスコマンドが出された時、コマンドは、認識され、テキスト文字列に変換されうる。それが、１つの接続された装置に対応する有効コマンドとして首尾よく識別された場合、システムは、所望の制御行為が取られるように適切な信号を送信する。

使用者が何のコマンドを出すことができるかを示すため、一般に当該システムは、ツリー構造のコマンドメニューを採用する。各コマンドメニューレベルは、許容可能なボイスコマンドの集合を含み、それが認識された場合、その後、その各々は、新規コマンドのサブメニューに至る。例えば、米国特許６５９１２３９は、ツリー構造のコマンドメニューを採用するボイス制御手術着を開示する。外科医が手術台を調整しようと試みる場合、まず、外科医は、コマンド“テーブル”を出し、コマンドが認識され、テーブルコマンドサブメニューがロードされるよう一時停止し、サブメニューから適用可能なテーブルコマンドを出す等しなければならない。

故に、一般に、公知の音声認識システムは、手術室において時間を節約しない。外科医は、単独の行為を達成するために多数のボイスコマンドを出さなければならない。また、公知のシステムは、外科医に、ボイスコマンドの不自然な発し方（例えば、孤立音声）を採用することを余儀なくし、その方法は、外科医が効率的にシステムを使用できる前にかなり練習を要する。

故に、単独の発話で伝えられる多数の音声コマンドを認識する、音声コマンドを実行するためのシステム及び方法を提供することが望まれる。

また、再設定を伴わないで非従来のコマンドだけでなく、従来の孤立音声コマンドも両方認識する、音声コマンドを実行するためのシステム及び方法を提供することが望まれる。

従って、本発明の目的は、孤立及び接続又は連続音声に同時対応する音声認識システムを提供することにある。

また、本発明の目的は、多数の音声モードに対応し、さらに公知の音声認識システムの速度及び精度を超える音声認識システムを提供することにある。

これら及び他の目的は、音声入力を用いて１つ以上の装置を動作するためのシステムであって、音声入力を受信するための受信器と、前記受信器と通信する制御器と、前記音声入力をコンピュータ読取可能なデータに変換するための前記制御器上で実行されるソフトウェアと、前記システムの全ての有効コマンドの一部を含むアクティブコマンドテーブルを生成するための前記制御器上で実行されるソフトウェアと、前記データによって示された少なくとも１つのアクティブコマンドを識別するための前記制御器上で実行されるソフトウェアと、前記アクティブコマンドによって動作可能な少なくとも１つの装置に前記アクティブコマンドを送信するための前記制御器上で実行されるソフトウェアとを具備することを特徴とするシステムを提供することによって達成される。

また、音声入力を用いる装置を制御する方法であって、システムの各装置に関連付けられた有効コマンドを判断する段階と、前記有効コマンドの一部を含む有効コマンドテーブルを生成する段階と、音声入力を受信する段階と、前記音声入力をコンピュータ読取可能なデータに変換する段階と、前記データによって示された少なくとも１つのアクティブコマンドを識別する段階と、前記アクティブコマンドが関連する少なくとも１つの装置に前記アクティブコマンドを送信する段階とを具備することを特徴とする方法が提供される。

図１は、本発明による音声入力を用いる１つ以上の装置を動作するためのシステム１００を示す。以下に述べるように、システム１００は、孤立及び連続音声入力又は話しコマンドを用いる１つ以上の装置の動作を提供する。また、システム１００は、初期化又は再設定をしなくても、例えば連続して又は同時に、音声モードに対応することができる。システム１００は、例えば医療手術室における装置及び／又は処理の制御を含む任意の用途数に役立つ。

システム１００は、音声入力１０２を受信するための受信器１０４を含む。受信器１０４は、到来する音声又は音波を受信し、それをデジタル波形及び／又は電流又は電気エネルギー（例えば、音響信号１０６）に変換するための任意の機器又は装置でもよい。例えば、受信器１０４は、マイクでもよい。受信器１０４によって受信された音声入力１０２は、話し言葉又は語句、又は言葉若しくは語句の集合等、使用者による任意の話し発話でもよい。音声入力１０２は、使用者がシステム１００によって通信又は実行されることを望む１つ以上のコマンドを示す言葉又は語句を含むのが好ましい。

また、システム１００は、制御器１０８を含む。制御器１０８は、少なくとも１つの動作を制御するか、又は１つ以上のソフトウェアプログラムを受信及び／又は実行する任意の装置、システム、又はその一部でもよい。例えば、制御器１０８は、デジタル信号プロセッサ、マイクロコントローラ、マイクロプロセッサ、又はコンピュータプログラム可能な論理素子の１つでもよい。制御器１０８に関連付けられた機能は、局所的又は間接的に、中央化又は分散化されうる点に留意すべきである。制御器１０８は、受信器１０４と通信して、音響信号１０６等の情報を受信器１０４から受信することができる。以下に詳細に述べるように、その後、制御器１０８は、装置１１６又はモニタ１１８（例えば、ディスプレイ）にコマンド１１４を送信又はその他伝達することができる。

また、システム１００は、言語モデル１１０を含むことができる。言語モデル１１０は、システム１００のストレージ、一時記憶装置、及び／又はシステムから離れたストレージに存在してもよい。言語モデル１１０は、音声入力１０２によって示されたコマンドを認識するために使用される情報を含む。例えば、言語モデル１１０は、システムによって動作可能な装置に関連する各有効コマンド又はコマンドシーケンスを含むことができる。また、言語モデル１１０は、コマンド認識で用いる、システムの有効コマンド（又は有効コマンドシーケンス）の一部又は小集合を含む、アクティブコマンドテーブルを含むことができる。そのため、制御器１０８は、アクティブコマンドテーブルを生成するためのソフトウェアを含む。

また、システム１００は、コマンド相当語句１１２を含むことができる。コマンド相当語句１１２は、特定の有効コマンドを示すものとして知られる一般的なバリエーション及び／又は“未知語”音声入力を含む。例えば、コマンド相当語句１１２は、有効コマンドの短縮形式、記述的形式、一般的な誤った発音、及び場合によっては、有効コマンドに相当する外国語を含むことができる。コマンド相当語句１１２は、システム１００のストレージ、一時記憶装置、システムから離れたストレージ、及び／又は携帯ストレージ（例えば、システムの特定の使用者に独特な）に存在してもよい。また、コマンド相当語句１１２は、制御器１０８によって実行されるエラー除去アルゴリズム又はソフトウェアと同時に動作することができる。故に、当業者であれば分かるように、コマンド相当語句１１２は、長期間システムによって連続して更新又は改善されうる。

図２は、制御器１０８の分解図を示す。制御器１０８は、変換器２０２を含むことができる。変換器２０２は、音響信号１０６をデータ２０６に変換するために、ハードウェア、ソフトウェア、又はその組合せでもよい。データ２０６は、機械又はコンピュータによって解釈、分析、及び／又は読取りができるコンピュータ読取可能なデータ又は任意のデータ形式を含むことができる。例えば、データ２０６は、使用者の音声入力に対する逐語訳のテキスト表示（例えば、テキスト文字列）を含むことができる。データ２０６は、使用者の全音声入力又は発話を示すことができる。代替として、データ２０６は、特定のアクティブコマンドに関連する、（例えば、リアルタイムで）システムによって認識された一部音声入力を示してもよい。

また、制御器１０８は、認識器２０８を含む。認識器２０８は、ハードウェア、ソフトウェア、又はその組合せでもよい。認識器２０８は、データ２０６によって示された（例えば、アクティブコマンドテーブルからの）少なくとも１つのアクティブコマンドを識別するためのソフトウェアを含むことができる。いくつかの実施形態において、システム１００の認識器２０８は、データを（例えば、音声入力が話されているとして）連続して受信し、リアルタイムでその中に含まれたアクティブコマンドを識別しようと試みることができる。また、認識器２０８は、追加のデータを期待するか否かを判断するために一部コマンドを認識することができる。例えば、本発明による典型的なシステムは、（図３Ｂに示されるように）言葉が“機器”で始まる任意のコマンドシーケンス数を認識できる一方、“設定”で始まるコマンド又はコマンドシーケンスは１つだけ認識できる。故に、認識器２０８は、コマンドシーケンスの早期の中断を防止するために必要な、可変の相互コマンド一時停止を備える。例えば、認識器は、“機器”が認識される時に追加のデータを待つことができる一方、“設定”が認識される時にコマンドを直ちに送信または実行することができる。いくつかの実施形態又は動作モードにおいて、認識器２０８は、アクティブコマンドを識別しようと試みるのに先立ち、全音声発話を示すデータを受信することができる。

また、システム１００の認識器２０８は、１つ以上の潜在的コマンドにデータ２０６を構文解析するためのソフトウェアを含むことができる。その後、認識器２０８は、アクティブコマンドに各潜在的コマンドを一致させようと試みることができる。故に、認識器２０８にさらに含まれるのは、アクティブコマンドを識別するためにアクティブコマンドテーブルに問合せるためのソフトウェアでもよい。上述のように、認識器２０８は、必要に応じて、相当語句コマンドを識別するためにコマンド相当語句１１２及び／又はコマンド相等語句テーブルに同様に問合せることができる。また、制御器１０８は、アクティブコマンドによって動作可能な少なくとも１つの装置にコマンド１１４、即ちアクティブコマンドを送信するためのソフトウェアを含む。

図３Ａは、図１及び図２に示される言語モデル１１０の分解図を示す。言語モデル１１０は、システムコマンドメニュー３００を含む。システムコマンドメニュー３００は、システム１００又はその実質的部分に関連付けられた（例えば、有効コマンドシーケンスを含む）各有効コマンドを含むのが好ましい。図３Ｂを参照すると、システムコマンドメニュー３００は、階層的及び／又は“ツリー構造的”メニューフォーマットで編成又は（モニタ１１８を介して）少なくとも表示可能にしうる。当業者であれば分かるように、システムコマンドメニュー３００は、使用中に利用可能なコマンドの視覚表示をシステム１００の使用者に提供するために表示されるのが好ましい。また、ディスプレイは、使用者による前回の又は現在のコマンド又はメニューレベル選択を強調表示することができる。また、場合によっては、システム１００は（例えば、ディスプレイを介して）、認識されたコマンドを送信及び／又は実行するのに先立ち、使用者から確認を要求してもよい。

図３Ｂに示されるように、メニュー３００は、システムそれ自体に適用可能なシステムレベル及び／又は一般コマンドを含む第１有効コマンドセット３０２を含むことができる。また、メニュー３００は、システム１００によって動作可能な装置に関連付けられた任意のコマンドセット（例えば、即ちノード）数を含むことができる。例えば、メニュー３００は、機器（例えば、医療機器又は装置）に関連する有効コマンド／コマンドシーケンスセット３０４を含むことができる。典型的な機器は、“調整”に関連する３つの第１レベルコマンド（例えば、開始、停止、調整）と２つの第２レベルコマンド（例えば、上、下）とを有することが分かる。また、含まれるものは、追加の装置、それぞれライトとユニットとに関連するセット３０６及び３０８である。しかし、図３Ｂに示されたシステムコマンドメニュー３００とそこに含まれたコマンドとは、メニュー３００の簡単な一例にすぎないことに留意すべきである。当業者であれば分かるように、本発明のメニュー３００及び／又は言語モデル１１０は、任意の所望のフォーマットにすることができ、任意の所望のコマンド及び／又はメニューレベル数を含むことができる。

図３Ａに戻ると、言語モデル１１０（例えば、即ちシステム１００のその他位置又はストレージ）は、前回コマンド３１０を含むことができる。以下でさらに詳細に説明されるように、前回コマンド３１０は、有効コマンドのテーブル又はメニューを生成するのに用いるシステム１００によって保持される。前回コマンド３１０は、制御器１０８によって実行又は装置に送信される最後のアクティブコマンド、即ちシステム１００の使用者によって話される最後のアクティブ又は有効コマンドにすることができる。また、言語モデル１１０は、アクティブコマンドテーブルを生成するのに用いるデプスパラメータ３２０を含むことができる。例えば、デプスパラメータ３２０は、アクティブコマンドメニュー及び／又はメニュー３０２における前回コマンド３１０の位置又は現在の位置からの好ましい偏差で使用するために評価されるべき多数のメニューレベルを示すパラメータにすることができる。システム１００は、単独のデプスパラメータ３２０又は任意数のデプスパラメータ３２０を含んでもよい。例えば、システムによって動作可能な各装置は、それに関連付けられた一つ以上のデプスパラメータを有することができる。また、システムの使用者は、独特及び／又は好ましいデプスパラメータを有することができる。デプスパラメータ３２０は、常にシステムの使用者によって設定及び／又は変更されてもよいことが分かる。

また、言語モデル１１０は、アクティブコマンド３３０、又はアクティブコマンドテーブル若しくはメニューを含む。アクティブコマンド３３０のテーブルは、データ２０６によって示される少なくとも１つのアクティブコマンドを識別する際に、制御器１０８及び／又は認識器２０８によって使用される。以下の説明を読むことによって分かるように、アクティブコマンド３３０のテーブルは、認識器２０８によって使用されるために孤立コマンドと連結コマンドシーケンスとの両方を含む。アクティブコマンド３３０は、システム１００における任意のストレージに、又はシステム１００と通信するよう設置され、及び／又は制御器１０８と通信する一時メモリに設置されうる。また、アクティブコマンド３３０は、常に生成、再生成、及び／又は更新されてもよい。例えば、アクティブコマンド３３０のテーブルは、使用者がメニュー３００におけるレベルを選択若しくは変更する度に、又は使用者が所望のコマンドを話している場合に動的に、生成又は更新されうる。

図３Ｃは、言語モデル１１０のアクティブコマンド３３０の典型的なテーブルを示す。アクティブコマンド３３０は、メニュー３００から選択された任意のコマンド（例えば、コマンドシーケンス）数を含むことができる。また、アクティブコマンド３３０におけるコマンドは、例えば、システムレベルコマンド、即ちコマンドシーケンス（例えば、“機器開始”）等、単独のコマンド言葉を含むことができる。故に、当業者であれば分かるように、アクティブコマンド３３０のテーブルは、孤立及び連続音声入力の同時認識を提供する。

図４は、アクティブコマンド３３０のテーブルを生成する方法を示す。第１段階において、システム１００は、前回コマンド３１０に対して判断又はアクセスすることができる（段階４０１）。当業者であれば分かるように、前回コマンド３１０は、システムが現在“属する”メニュー３００上の特定位置を識別することができる。同時に、又は任意の順番で、また、デプスパラメータは、判断されうる（段階４０３）。故に、現在のメニュー位置（及び／又は前回コマンド３１０）及びデプスパラメータは、どのコマンドが次の音声入力又は発話において認識されうるかを決定するルール基準を提供する。

その後、アクティブコマンドカテゴリ及び／又はノードは、判断される（段階４０５）。アクティブコマンドノードは、常にアクティブコマンドテーブルを生成するために含められるべきかを選択又は判断される。故に、有効及び動作可能なコマンドを有する任意数のノードは、特定時間に含まれないことがある。例えば、アクティブノードの判断は、現在のメニュー位置（又は前回コマンド）のみ、又は使用者若しくはシステム環境との組合せに基づくことができる。１実施形態において、前回コマンド３１０に関連付けられたノードは、１つのアクティブノードとして判断されうる。しかし、追加ノードは、各システムコマンドノードのようにアクティブノードとして判断されるのが好ましい。

他の実施形態において、任意数の他の環境又は設定は、アクティブノードを判断する際に使用されうる。例えば、第１設定（例えば、ノーマル）は、各システムコマンドノードだけでなく、前回コマンドに関連付けられたノードの選択を提供することができる。図３Ｂを参照すると、前回コマンド３１０は、“下”又は“機器調整下”にすることができ、故に関連付けられたノードは、“機器”となる。システムノード（例えば、グローバルノード）は、“システム”、“設定”、“メニュー表示”、“メニュー非表示”、及び“終了”を含む。他の設定は、同一の手順及び／又は装置の系列化に関するノードのような、他のアクティブノードの判断を提供することができる。

次に、アクティブコマンド及び／又はコマンドシーケンスは、アクティブノードから判断される（段階４０７）。デプスパラメータ３２０は、判断を行う際に採用されるのが好ましい。デプスパラメータ３２０は、システムがアクティブコマンドを判断する際に検索すべき各アクティブノードに対する距離がどれくらいか（例えば、レベルがどれくらいか）を決定するのに使用されうる。例えば、デプスパラメータ３２０は、最大で２つのレベルを示してもよい。故に、“機器”がアクティブノードであると判断された場合、以下のコマンドは、アクティブコマンドテーブルに追加される：“機器開始”、“機器停止”、及び“機器調整”。デプスパラメータ３２０は、３つのレベルを示し、また、“機器調整上”及び“機器調整下”が含まれる。

図３Ｃに示されるように、追加のコマンドは、前回コマンド３１０又は現在のメニューレベルに関する孤立コマンド等に含まれうる。例えば、前回コマンドが“機器調整下”又は単に“下”であった場合、アクティブコマンド３３０のテーブルは、いくつかの実施形態では、“上”及び“下”のコマンドを含むことができる。また、アクティブコマンドのテーブルは、所望の場合には、“機器”に関する“開始”及び“停止”を含みうる。

図５は、システム１００によって採用可能な音声入力を処理する方法を示す。方法は、アクティブコマンドメニュー又はアクティブコマンドテーブルを生成する第１段階を含む（段階５０１）。例えば、この段階は、システムを電源オンにすることによって、及び／又は使用者が新規コマンドノードを選択又は新規コマンドを出すことによって実行される。上記記載を読むことによって当業者であれば分かるように、この段階は、既存のテーブル及びアクティブコマンドを更新することを含みうる。次に、音声入力及び／又は音声入力から変換されたデータ２０６が受信される（段階５０３）。いくつかの実施形態において、その後、データは、データにおける潜在的コマンドを識別するために構文解析されうる（段階５０５）。

次の段階において、アクティブコマンドは、一部データ及び／又はデータで識別された潜在的コマンドの何れに関するかを識別される（段階５０７）。アクティブコマンドテーブルは、データの任意部分がアクティブコマンドに対応するか否かを判断するために問合される。任意数のアクティブコマンドは、データから識別されうることが分かる。例えば、使用者は、同じ発話で２つのコマンドを話すことができ、各々が異なる装置に関する。

その後、各々が識別されたコマンドは、モニタを介して表示又は示され（段階５０９）、対応する装置に送信されうる（段階５１１）。いくつかの実施形態において、使用者は、実行に先立ち、表示されたコマンドを容認又は検証するよう促されてもよい。最後に、アクティブコマンドメニュー又はアクティブコマンドテーブルは、新規前回コマンドを前提として、必要に応じて、更新される。

当業者であれば分かるように、本発明のアクティブコマンドテーブルは、システムの速度及び精度を維持又は増加する一方で、孤立及び接続又は連続コマンド認識の両方への同時対応を提供する。故に、本発明は、使用者がモードの一方又は両方を動作するかをいつでも選択できるようにする。また、システムの多数の使用者は、いつでも自分の好ましい音声モードでシステムに対応するよう各々選択することができる。

本発明は、特定要素の配置及び特徴等を参照して説明されたが、全ての可能な配置又は特徴を説明することを意図とせず、実際には様々な改良及び変更が当業者にとって確かめられる。

図１は、本発明によるシステムの概略図である。図２は、図１に示されたシステムの制御器の概略図である。図３Ａは、図１に示されたシステムの言語モデルの概略図である。図３Ｂは、図１に示されたシステムの典型的なシステムコマンドメニューの概略図である。図３Ｃは、図１に示されたシステムの典型的なアクティブコマンドメニューの概略図である。図４は、図１に示されたシステムによって採用可能なアクティブコマンドテーブルを生成する方法である。図５は、図１に示されたシステムによって採用可能な音声入力を処理する方法である。

符号の説明

１０２音声入力
１０４受信器
１０６音響信号
１０８制御器
１１０言語モデル

Claims

音声入力を用いて１つ以上の装置を動作するためのシステムであって、
音声入力を受信するための受信器と、
前記受信器と通信する制御器と、
前記音声入力をコンピュータ読取可能なデータに変換するための前記制御器上で実行されるソフトウェアと、
アクティブコマンドテーブルを生成するための前記制御器上で実行されるソフトウェアであって、前記テーブルは、コマンドメニューの少なくとも２つの異なるレベルから選択されたアクティブコマンドを含む、ソフトウェアと、
前記データによって示された少なくとも１つのアクティブコマンドを識別するための前記制御器上で実行されるソフトウェアと、
前記システムによって動作可能な１つ以上の装置に前記少なくとも１つのアクティブコマンドを送信するための前記制御器上で実行されるソフトウェアと
を具備し、
１組のアクティブコマンドは、現在のコマンドメニュー位置およびデプスパラメータに基づき使用中に動的に生成および更新されることを特徴とするシステム。
前記少なくとも１つのアクティブコマンドは、孤立コマンドであることを特徴とする請求項１に記載のシステム。
少なくとも１つのアクティブコマンドを識別するための前記ソフトウェアは、順番に少なくとも１つの他のアクティブコマンドを識別することを特徴とする請求項１に記載のシステム。
前記少なくとも１つのアクティブコマンド及び少なくとも１つの他のアクティブコマンドの各々は、前記コマンドメニューの異なるレベルからそれぞれ提供された順次コマンドであることを特徴とする請求項３に記載のシステム。
前記アクティブコマンドテーブルは、少なくとも１つのグローバルコマンドを含むことを特徴とする請求項１に記載のシステム。
前記データによって示されたグローバルコマンドを識別するための前記制御器上で実行されるソフトウェアと、
前記グローバルコマンドを実行するための前記制御器上で実行されるソフトウェアと
をさらに具備することを特徴とする請求項５に記載のシステム。
前記システムによって動作可能な前記１つ以上の装置は、医療装置であることを特徴とする請求項１に記載のシステム。
前記音声入力は、孤立音声を含むことを特徴とする請求項１に記載のシステム。
前記音声入力は、連続音声を含むことを特徴とする請求項１に記載のシステム。
前記音声入力は、孤立音声及び連続音声を含むことを特徴とする請求項１に記載のシステム。
前記アクティブコマンドテーブルは、少なくとも１つの孤立コマンド語句及び少なくとも１つの連結コマンド語句を含むことを特徴とする請求項１に記載のシステム。
前記アクティブコマンドは、デプスパラメータに基づき前記コマンドメニューから選択されることを特徴とする請求項１に記載のシステム。
前記デプスパラメータは、現在のメニュー位置からの偏差を示すことを特徴とする請求項１２に記載のシステム。
前記デプスパラメータは、メニューレベルの数を示すことを特徴とする請求項１３に記載のシステム。
少なくとも１つのアクティブコマンドを識別するための前記ソフトウェアは、前記データを１つ以上の潜在的コマンドへ構文解析することを特徴とする請求項１に記載のシステム。
少なくとも１つのアクティブコマンドを識別するための前記ソフトウェアは、前記アクティブコマンドテーブルを問合せることを含むことを特徴とする請求項１に記載のシステム。
少なくとも１つのアクティブコマンドを識別するための前記ソフトウェアは、コマンド相当語句テーブルを問合せることを含むことを特徴とする請求項１に記載のシステム。
音声入力を用いる装置を制御する方法であって、
コマンドメニューから提供されたシステムの各装置に関連付けられたコマンドを判断する段階と、
アクティブコマンドテーブルを生成する段階であって、前記テーブルは、前記コマンドメニューの少なくとも２つの異なるレベルから選択されたアクティブコマンドを含む、段階と、
音声入力を受信する段階と、
前記音声入力をコンピュータ読取可能なデータに変換する段階と、
前記データによって示された少なくとも１つのアクティブコマンドを識別する段階と、
前記アクティブコマンドが関連する少なくとも１つの装置に前記アクティブコマンドを送信する段階と
を具備し、
１組のアクティブコマンドは、現在のコマンドメニュー位置およびデプスパラメータに基づき使用中に動的に生成および更新されることを特徴とする方法。
前記アクティブコマンドテーブルを生成する段階は、前記識別された最後のアクティブコマンドを判断することを含むことを含むことを特徴とする請求項１８に記載の方法。
前記アクティブコマンドテーブルを生成する段階は、デプスパラメータを利用することを含み、前記デプスは、メニューレベルの数を示すことを特徴とする請求項１８に記載の方法。
少なくとも１つのアクティブコマンドを識別する段階は、前記データを１つ以上の潜在的コマンドへ構文解析することを含むことを特徴とする請求項１８に記載の方法。
前記識別された少なくとも１つのアクティブコマンドを表示する段階をさらに具備することを特徴とする請求項１８に記載の方法。
前記少なくとも１つのアクティブコマンドを識別する段階は、前記システムの使用者への促しを生成することを含むことを特徴とする請求項１８に記載の方法。
前記アクティブコマンドテーブルは、少なくとも１つの孤立コマンド及び少なくとも１つのコマンドシーケンスを含むことを特徴とする請求項１８に記載の方法。