JP2002524776A

JP2002524776A - 音声認識および自然言語処理を使用した対話型ユーザ・インタフェース

Info

Publication number: JP2002524776A
Application number: JP2000569390A
Authority: JP
Inventors: シー．ウィーバー、ディーン
Original assignee: ワンボイステクノロジーズインコーポレーテッド
Priority date: 1998-09-09
Filing date: 1999-09-08
Publication date: 2002-08-06
Also published as: ES2235508T3; WO2000014727A1; ATE287117T1; ES2235520T3; CN1161747C; CN1325528A; CN1153190C; CA2343229A1; EP1110205A1; CA2343150A1; AU5813099A; JP2002524806A; EP1110205B1; AU762282B2; DE69923191T2; DE69922971D1; DE69922971T2; DE69923191D1; CN1325527A; US6532444B1

Abstract

(57)【要約】発語、音声処理および自然言語処理を使用してコンピュータと対話するシステムおよび方法。本システムは、発語に対する照合対象語句について第１の文法ファイルを検索し、該第１の文法ファイル内で照合対象語句が見付からない場合には前記照合対象語句について第２の文法ファイルを検索する音声プロセッサを備える。本システムは更に、前記の照合対象語句に対する一致エントリについてデータベースを検索するための自然言語プロセッサと、一致エントリが前記データベース内で見付かった場合に一致エントリに関連付けられた動作を実行するアプリケーションインタフェースを備える。本システムは文脈固有文法を利用することにより、音声認識および自然言語処理の効率を高める。更に上記システムは、単語および語句ならびにそれらの関連意味を適合的にかつ対話的に“学習”する。

Description

【発明の詳細な説明】

【０００１】（発明の背景）Ｉ．発明の分野本発明はコンピュータ用ユーザ・インタフェースの音声認識に関する。より詳
細には本発明は、音声認識および自然言語処理を使用してユーザインタフェース
とコンピュータが対話する新規な方法およびシステムに関する。

【０００２】ＩＩ．関連技術の説明社会にコンピュータが普及するにつれ、コンピュータの理解およびコンピュー
タとの対話が多くの人々に取り困難であることが明らかとなっている。コンピュ
ータ操作の為にユーザは、原始的なコマンドおよび直感的でない手順を学ぶべき
場合が多い。例えば殆どのパーソナルコンピュータは、概してメニュー主導であ
るウィンドウズ（登録商標）式のオペレーティング・システムを使用する。故にユーザは、どのメニュー・コマンドもしくは一連のコマンドが所望結果を与えるのかを学ぶ必要がある。

【０００３】更に、コンピュータに対する習用の対話はキーボードもしくはマウスなどの手
動入力デバイスの故に遅くなることも多い。多くのコンピュータ・ユーザは熟練
タイピストではない。その結果、これらの手動入力デバイスによりコンピュータ
にコマンドおよび単語を入力するには相当の時間が掛かる。故に、コンピュータ
と対話する為の容易かつ高速で更に直感的な方法が必要なことは明らかである。

【０００４】コンピュータとの対話の為に提案されたひとつの方法は、音声認識である。音
声認識は、人間の音声を音響的に検出すると共に検出された音声を一連の単語へ
と翻訳すべく協働するソフトウェアおよびハードウェアを必要とする。当業界に
おいて公知である如く音声認識は、ハードウェアが検出した音を、音素（ｐｈｏ
ｎｅｍｅ）と称される分割不能な更に小さな音へと分解することで機能する。各
音素は別個の音の単位である。例えば“ｔｈｏｓｅ”という単語は３個の音素か
ら成り；第１の音素は“ｔｈ”音であり、第２の音素は“ｏ”音であり、第３の
音素は“ｓ”音である。音声認識ソフトウェアは、検出された各音素を記憶辞書
からの既知の各単語と一致させるべく試行する。音声認識システムの一例は、１
９９８年１１月８日に発行されて“音声認識装置および方法”と称され且つＤｒ
ａｇｏｎＳｙｓｔｅｍｓ，Ｉｎｃ．に譲渡された米国特許第４，７８３，８０
３号に与えられるが、該米国特許第は言及したことにより本明細書中に援用する
。現在では、ＤｒａｇｏｎＳｙｓｔｅｍｓ，Ｉｎｃ．およびＩｎｔｅｒｎａｔ
ｉｏｎａｌＢｕｓｉｎｅｓｓＭａｃｈｉｎｅｓＩｎｃ．などの会社から市
販された多くの音声認識ソフトウェア・パッケージが在る。

【０００５】これらの音声認識ソフトウェア・パッケージもしくはシステムのひとつの制限
は、それらが通常はコマンドおよび制御もしくは聴音書取（ｄｉｃｔａｔｉｏｎ
）機能のみを実施することである。故にユーザは依然として、コンピュータを操
作する為にはコマンドの用語集を学ぶ必要がある。

【０００６】これらの音声認識システムに対して提案された改良は、検出された単語を自然
言語処理システムを用いて処理することである。自然言語処理は一般的に、検出
された単語の文法的関係および相対的文脈を分析することにより各単語の概念的
“意味”（例えば、話し手が意図している意味）を決定する必要がある。例えば
１９８９年１２月１２日に発行されると共に“自然言語テキストに対するパーサ
（ＰＡＲＳＥＲ）”と称され且つＩｎｔｅｒｎａｔｉｏｎａｌＢｕｓｉｎｅｓ
ｓＭａｃｈｉｎｅｓＩｎｃ．に譲渡された米国特許第４，８８７，２１２号
は言及したことにより本明細書中に援用するが、該米国特許第は単語分離、形態
学的分析、辞書検索および文法分析を使用して入力単語ストリームを解析する方
法を教示している。

【０００７】音声認識とともに自然言語処理を使用すると、話された単語を使用して、キー
ボードもしくはマウスなどの手動入力よりも強力なコンピュータの操作ツールが
提供される。しかし乍ら従来の自然言語処理システムのひとつの欠点は、音声認
識システムにより検出された単語の正しい“意味”を自然言語処理システムが決
定し得ない可能性があることである。斯かる場合にユーザは通常、次回の試行で
はその自然言語処理システムが正しい“意味”を決定することを期待してその語
句を言い換えたり言い直したりする必要がある。これは、ユーザが文もしくはコ
マンドの全体を言い直す必要があるときに相当の遅延に繋がるのは明らかである
。

【０００８】従来システムの別の欠点は、音声認識に必要な処理時間が法外に長くなり得る
ことである。これは主として、処理されるべき大量の情報と比較して処理リソー
スの速度が有限だからである。例えば従来の多くの音声認識プログラムはおいて
は検索される辞書ファイルのサイズの故に、発語（ｕｔｔｅｒａｎｃｅ）の認識
に要する時間は長い。

【０００９】従来の音声認識／自然言語処理システムの更なる欠点は、それらが対話型でな
い点である。結果として、コンピュータとの会話形式対話は不可能である。ユー
ザは、完全な概念をコンピュータに伝達する必要がある。ユーザはまた断片的な
文を話すことが出来ない、と言うのも、（以前の発語の意味に依存する）それら
の断片的な文の意味が失われるからである。

【００１０】必要なものは、上述の各欠点を回避する音声認識および自然言語処理を活用し
た、コンピュータとの対話型ユーザ・インタフェースである。（発明の概要）本発明は、発語、音声処理および自然言語処理を使用してコンピュータと対話
する新規で優れたシステムおよび方法である。概略的に上記システムは音声プロ
セッサを含むが、該音声プロセッサは、上記発語に対する照合対象語句に関して
第１文法ファイルを検索し、且つ、もし上記第１文法ファイル内で上記照合対象
語句が発見されなければ上記照合対象語句に関して第２文法ファイルを検索する
。上記システムはまた、上記照合対象語句に対する一致エントリに関してデータ
ベースを検索する自然言語プロセッサ、および、もし上記一致エントリが上記デ
ータベース内で発見されたならば該一致エントリに関連付けられた動作を実施す
るアプリケーション・インタフェースも含む。

【００１１】好適実施例において上記自然言語プロセッサは、上記一致エントリが上記デー
タベース内で発見されなければ上記データベース、上記第１文法ファイルおよび
上記第２文法ファイルの少なくともひとつを上記照合対象語句により更新する。

【００１２】上記第１文法ファイルは文脈固有文法ファイルである。文脈固有文法ファイル
とは、特定主題に相当に関連する単語および語句を含むファイルである。上記第
２文法ファイルは一般文法ファイルである。一般文法ファイルとは、文脈に鑑み
て解釈の不要な単語および語句を含むファイルである。すなわち、上記一般文法
ファイル内の単語および語句は一切の起源文脈に属さない。本発明では上記一般
文法ファイルを検索する前に上記文脈固有文法ファイルを検索することから、ユ
ーザは更に会話的な形式でコンピュータと意志疎通でき、その場合に話された単
語は、もし上記文脈固有文法ファイル内で発見されれば、最も最近に話された主
題に鑑みて解釈される。

【００１３】本発明の更なる側面において上記音声プロセッサは、もし上記照合対象語句が
上記一般文法ファイル内で発見されなければ上記照合対象語句に関して聴音書取
文法を検索する。上記聴音書取文法は、一般的な単語および語句の大規模な用語
集である。上記文脈固有文法および一般文法を最初に検索することにより音声認
識時間が相当に短縮されることが期待されるが、これは、上記文脈固有文法およ
び一般文法は上記聴音書取文法よりも物理的に小さいからである。

【００１４】本発明の別の側面において上記自然言語プロセッサは、上記データベースを検
索する前に上記照合対象語句の少なくとも一個の単語を置換する。この置換は、
上記照合対象語句の少なくとも一個の単語をワイルドカードで置換する上記自然
言語プロセッサ内の変数リプレーサにより達成され得る。上記語句内の（“単語
変数”と称される）一定の単語をワイルドカードで置換することにより、上記デ
ータベース内のエントリ数は相当に減少され得る。更に上記自然言語プロセッサ
内の代名詞サブスティテュータは上記照合対象語句内の代名詞を固有名称に置換
することにより、上記データベース内にユーザ特有事実が記憶されるのを許容す
る。

【００１５】本発明の別の側面において文字列フォーマッタは上記データベースを検索する
前に上記照合対象語句をテキスト・フォーマットする。また単語ウェイタは、上
記データベースを検索する前に個々の単語の相対的重要度に従い上記照合対象語
句内の個々の単語を加重する。これらの工程によれば上記データベースの更に高
速かつ正確な検索が許容される。

【００１６】上記自然言語プロセッサ内の検索エンジンは、上記一致エントリに対する確信
値を生成する。また上記自然言語プロセッサは上記確信値をスレッショルド値と
比較する。ブーリアン・テスタは、上記照合対象語句からの必要個数の単語が上
記一致エントリ内に存在するか否かを決定する。このブーリアン・テストは、上
記検索エンジンにより戻される結果を検証する役割を果たす。

【００１７】上記照合対象語句からの必要個数の単語が上記一致エントリ内に存在しなけれ
ば、曖昧さを排除すべく上記自然言語プロセッサはユーザに対し、上記一致エン
トリが上記発語の正しい解釈であるか否かを問い質す。上記一致エントリが上記
発語の正しい解釈でなければ、上記自然言語プロセッサはユーザに対し付加的情
報を問い質す。この付加的情報により、上記データベース、上記第１文法ファイ
ルおよび上記第２文法ファイルの少なくともひとつが更新される。この様にして
本発明は付加的な発語の意味を適合的に“学習”することにより、上記ユーザ・
インタフェースの効率を高める。

【００１８】最後に上記音声プロセッサは、引き続く発語に対する引き続く照合対象語句に
関連付けられた文脈固有文法を有効化して検索する。これにより、最も適切な単
語および語句が最初に検索されて音声認識時間を短縮することが確実となる。

【００１９】（好適実施例の詳細な説明）次に、図１の好適なコンピュータ・システム１００の機能ブロック図を参照し
て本発明を開示する。図１においてコンピュータ・システム１００は、中央処理
ユニット（ＣＰＵ）１０２を含んでいる。ＣＰＵ１０２は、図３Ａ乃至図３Ｄ
に関して本明細書中で記述される方法を実施すべく適切にプログラムされた当業
界では公知の任意の汎用マイクロプロセッサもしくはマイクロコントローラとさ
れ得る。例えばＣＰＵ１０２は、Ｉｎｔｅｌ社などにより製造されたＰｅｎｔ
ｉｕｍＩＩプロセッサなどの習用のマイクロプロセッサとされ得る。

【００２０】ＣＰＵ１０２は、ディスプレイ１０４、手動入力器１０６、記憶媒体１０８
、マイクロホン１１０、スピーカ１１２、及びデータ入力ポート１１４などの複
数の周辺装置と通信する。ディスプレイ１０４は、ユーザに対してイメージおよ
びテキストを視覚表示する当業界で公知のＣＲＴ、ＬＣＤ画面、タッチパネルま
たは他のモニタなどの視覚的ディスプレイとされ得る。手動入力器１０６は、習
用のキーボード、キーパッド、マウス、トラックボール、または、データの手動
入力の為に当業界で公知の他の入力デバイスとされ得る。記憶媒体１０８は、磁
気ディスク・ドライブ、フロッピー（登録商標）・ディスク・ドライブ、ＣＤ− ＲＯＭ、シリコン・メモリ、または、データの記憶および読出しの為に当業界で公知の他のメモリ・デバイスとされ得る。重要な点として、記憶媒体１０８はＣＰＵ１０２から離間して配置され得ると共に、ローカル・エリア・ネットワーク（ＬＡＮ）もしくはワイド・エリア・ネットワーク（ＷＡＮ）もしくはインターネットなどのネットワークを介してＣＰＵ１０２に接続され得る。マイクロホン１１０は、ＣＰＵ１０２に対してオーディオ信号を提供する当業界で公知の任意の適切なマイクロホンとされ得る。スピーカ１１２は、ＣＰＵ１０２からのオーディオ信号を再生する当業界で公知の任意の適切なスピーカとされ得る。マイクロホン１１０およびスピーカ１１２は、適切ならばデジタル／アナログおよびアナログ／デジタル変換回路を含み得る。データ入力ポート１１４は、ＲＳ−２３２、ユニバーサル・シリアル・バスなどのデータ・プロトコルを使用して外部付属品とインタフェースする当業界で公知の任意のデータ・ポートとされ得る。故に図１は、コンピュータ・システム１００の各機能要素を示している。コンピュータ・システム１００の各要素は、上述の如き適切な既製の構成要素とされ得る。本発明は、音声を使用してコンピュータ・システム１００とインタフェースする方法およびシステムを提供する。

【００２１】次に図２を参照すると、図２はＣＰＵ１０２および記憶媒体１０８の拡大機
能ブロック図を示している。ＣＰＵ１０２は、音声認識プロセッサ２２０、自
然言語プロセッサ２０２およびアプリケーション・インタフェース２２０を含む
。自然言語プロセッサ２０２は更に、変数リプレーサ２０４、文字列フォーマッ
タ２０６、単語ウェイタ（ｗｏｒｄｗｅｉｇｈｔｅｒ）２０８、ブーリアン・
テスタ２１０、代名詞リプレーサ２１１および検索エンジン２１３を含んでいる
。記憶媒体１０８は、複数の文脈固有文法ファイル２１２、一般文法ファイル２
１４、聴音書取文法２１６、および自然言語処理（ＮＬＰ）データベース２１８
とを含んでいる。好適実施例において各文法ファイル２１２、２１４および２１
６は、ユーザが話す言語の構造を記述するバッカス・ナウア記法（ＢＮＦ）ファ
イルである。ＢＮＦファイルは言語の構造を記述するものとして当業界で公知で
あることから、ＢＮＦファイルの詳細は本明細書中では論じない。ＢＮＦファイ
ルのひとつの利点は、語句もしくは単語のシーケンスを記述する上でこれらの単
語シーケンスの全ての組合せを明示的に記述することなく、階層ツリー状構造が
使用され得ることである。故に、該好適実施例においてＢＮＦファイルを使用す
ることにより記憶媒体１０８内の各ファイル２１２、２１４および２１６の物理
的サイズは最小化され、以下に記述される如くこれらのファイルが有効化されて
検索され得る速度が高まる。但し代替実施例においては、他のファイル構造が使
用される。

【００２２】次に図３Ａ乃至図３Ｄのフローチャートを参照し、図２の各機能要素の動作お
よび相互作用を記述する。図３Ａにおいて、フローはブロック３００にて開始し
、音声プロセッサ２００に対して発語（ｕｔｔｅｒａｎｃｅ）を提供する。発語
とは、始まりおよび終わりを有する一連の音であり、話された単語を一個以上含
み得る。話された単語を捕捉するマイクロホン１１０はブロック３００の工程を
実施し得る。代替的に、発語はデータ入力ポート１１４を介して記憶媒体１０８
から音声プロセッサ２００へと提供され得る。好適には、上記発語は公知の“．
ｗａｖ”オーディオ・ファイル・フォーマットなどのデジタル・フォーマットで
ある。

【００２３】フローは判断３０２に進み、其処で音声プロセッサ２００は、文脈固有文法２
１２のひとつが有効化されているか否かを決定する。好適実施例において各文脈
固有文法２１２は、起源文脈（ｐａｒｅｎｔｃｏｎｔｅｘｔ）に関する単語お
よび語句を含むＢＮＦファイルである。概略的に、文脈が対象領域である。例え
ばパーソナルコンピュータに適用可能な本発明の一実施例において、文脈の例は
“ニュース（ｎｅｗｓ）”、または“気象（ｗｅａｔｈｅｒ）”もしくは“株（
ｓｔｏｃｋｓ）”などである。斯かる場合に各文脈固有文法２１２は、これらの
文脈の夫々に対応するコマンド、制御単語、説明、修飾語もしくはパラメータを
含むことになる。各文脈を使用すると、情報の形式に対して階層構造が提供され
る。各文脈およびそれらの用法は、ＮＬＰデータベース２１８を参照して以下で
更に説明する。

【００２４】もし文脈固有文法２１２が有効化されていれば、文脈固有文法２１２はブロッ
ク３００にて提供された上記発語に対する一致に関して検索される。但し文脈固
有文法２１２が未だ有効化されていなければ、フローはブロック３０８へと進み
、其処で一般文法２１４が有効化される。

【００２５】好適実施例において一般文法２１４は単語および語句を含むＢＮＦファイルで
あり、斯かる単語および語句自体は起源文脈に属しないが、文脈固有文法ファイ
ル２１２が存在する関連文脈を有し得る。換言すると、一般文法２１４中の単語
および語句は階層的文脈構造のルートに存在し得る。例えばパーソナルコンピュ
ータに適用可能な一実施例において、一般文法２１４はコマンドおよび制御語句
を含むことになる。

【００２６】ブロック３１０にて一般文法２１４は、ブロック３００にて提供された発語に
対する照合対象単語もしくは語句に関して検索される。もし一致が見られなけれ
ば、聴音書取文法２１６が有効化される。好適実施例において聴音書取文法２１
６は各単語のリストを含むＢＮＦファイルであり、各単語自体は起源文脈も関連
文脈も有さない。例えばパーソナルコンピュータに適用可能な一実施例において
、聴音書取文法２１６は一般的辞書に類似した一般的単語の比較的に大きなリス
トを含んでいる。

【００２７】ブロック３１６にて上記聴音書取文法は、ブロック３００にて提供された発語
の各単語に対する照合対象単語に関して検索される。照合対象単語が発見されな
ければ、ディスプレイ１０４に視覚的エラー・メッセージが選択的に表示され、
または、スピーカ１１２により可聴エラー・メッセージが選択的に再生される。
而して上記プロセスは、ブロック３００にて音声プロセッサ２００に対し別の発
語が提供されるまで停止する。

【００２８】故に上記記述から理解され得る如く、音声プロセッサ２００に対して発語が提
供されたとき、もし有効化された文脈固有文法ファイル２１２があれば、その文
脈固有文法ファイル２１２が先ず検索される。有効化された文脈固有文法ファイ
ル２１２内で一致が無ければ、一般文法２１４が有効化され且つ検索される。も
し一般文法２１４でも一致しなければ、聴音書取文法３１６が有効化され且つ検
索される。

【００２９】好適実施例において音声認識プロセッサ２００が文脈固有文法２１２または一
般文法２１４のいずれかを検索しているとき、それは“コマンド／制御”モード
に在ると称される。このモードにおいて音声認識プロセッサ２００は、発語全部
を全体として上記文法中の各エントリと比較する。これと対照的に、音声認識プ
ロセッサ２００が上記聴音書取文法を検索しているとき、それは“聴音書取”モ
ードに在ると称される。このモードにおいて音声認識プロセッサ２００は、聴音
書取文法２１６内の各エントリに対し、上記発語を一度に一単語ずつ比較する。
上記コマンド／制御モードにおいて発語全体に対する一致を検索することは、聴
音書取モードにおいて一度に一単語ずつ検索することよりも一般的に高速である
と期待される。

【００３０】更に、任意の個々の文脈固有文法２１２は一般文法２１４よりもサイズが小さ
く（すなわち合計の単語および語句が少なく）、一般文法２１４自体は聴音書取
文法２１６よりもサイズが小さいことも期待される。故に、有効化された任意の
文脈固有文法２１２を最初に検索すれば、少なくとも部分的な理由としてファイ
ル・サイズが小さい故に、一致があれば更に迅速に発見されると思われる。同様
に、聴音書取文法２１６の前に一般文法２１４を検索することにより、一致があ
れば更に迅速に発見されると思われる。

【００３１】また、文脈固有文法２１２および一般文法２１４の両者に対して適合的に付加
される本発明の機能に関して以下で更に説明される如く、これらの文法は最も一
般的な発語を含んでいる。その故に、聴音書取文法２１６におけるよりも文脈固
有文法２１２もしくは一般文法２１４における方が更に迅速に一致が発見される
ことが期待される。

【００３２】最後に、以下で更に説明される如く、有効化された文脈固有文法２１２におけ
る単語および語句はユーザにより発語される可能性が更に高いものである、と言
うのも、それらの単語および語句はユーザが最も最近に話した主題に相当に関連
する単語だからである。これにより、有効化された文脈固有文法２１２に従って
ユーザの各単語の意味が解釈され乍ら、ユーザは断片的な文を使用して更に会話
的な形式で話すことができる。

【００３３】本発明は上述のシーケンスで検索を行うことから、予測される全ての単語およ
び語句を含む単一の大きなリストで一度にひとつのエントリを検索するよりも更
に効率的な検索を行い得る。

【００３４】判定３０６に戻ると、文脈固有文法２１２内で一致が発見されたなら、図３Ａ
に示された３つの可能的な次工程が在る。有効化された文脈固有文法２１２内の
各一致エントリに対し、音声認識プロセッサ２００により行われる関連動作が在
り得る。ブロック３２２はひとつの動作がアプリケーション・インタフェース２
２０に指示を行い、該アプリケーション・インタフェース２２０が別体のソフト
ウェア・アプリケーションもしくはエントリに関して一定の動作を行い得ること
を示している。例えばアプリケーション・インタフェース２２０は、Ｍｉｃｒｏ
ｓｏｆｔによる音声アプリケーション・プログラミング・インタフェース（ＳＡ
ＰＩ）規格を使用して外部アプリケーションと通信し得る。上記外部アプリケー
ションに対しては例えば、特定のインターネット・ウェブ・サイトＵＲＬにアク
セスすること、または、テキストを音声に変換して特定語句を話すこと、が指示
され得る。他の動作は、図４のＮＬＰデータベース２１８に関して以下で更に論
じられる如く行われ得る。

【００３５】ブロック３２４は別の動作として、自然言語処理（ＮＬＰ）データベース２１
８におけるひとつの行（ｒｏｗ）に直接的にアクセスすることにより、以下で更
に記述される各自然言語処理工程をバイパスし得ることを示している。ブロック
３２６は別の動作として、文脈固有文法３０６で発見された照合対象単語もしく
は語句に対し、有効化された文脈の単語もしくは語句を前方付属（ｐｒｅｐｅｎ
ｄ）し得ることを示している。例えば有効化された文脈が“映画（ｍｏｖｉｅｓ
）”であり且つ照合対象発語が“８時（８ｏ’ｃｌｏｃｋ）”であれば、単語
“映画”が語句“８時”に前方付属されて“８時の映画（ｍｏｖｉｅｓａｔ
８ｏ’ｃｌｏｃｋ）”という語句が形成される。

【００３６】同様に、もし一般文法２１４内に一致が発見されればフローは、ブロック３２
２に進み其処でアプリケーション・インタフェース２２０に上記の動作を行うこ
とを指示し、または、ブロック３２４に進み其処でＮＬＰデータベース内のひと
つの行が直接的にアクセスされる。但し一般文法２１４において一致が発見され
たときに文脈の前方付属は生じない、と言うのも、上述の如く一般文法２１４内
の各エントリはそれら自体が起源文脈を有さないからである。

【００３７】最後に図３Ａを参照すると、各単語は手動入力器１０６を介して手動で入力さ
れ得る。この場合に音声認識は不要であるが、入力された単語の自然言語処理は
依然として望ましい。故にフローは図３Ｂへと進む。

【００３８】図３Ｂのブロック３２８において、自然言語プロセッサ２０２は自然言語処理
分析の為に上記語句をフォーマットする。このフォーマットは、文字列フォーマ
ッタ２０６により達成されると共に、各単語間の二重空白を除去し、全ての文字
を小文字（もしくは大文字）にし、短縮を広げる（例えば、“ｉｔ’ｓ”を“ｉ
ｔｉｓ”に変更する）などのテキスト処理を含み得る。このフォーマット工程
の目的は、語句を解析に対して準備することである。

【００３９】フローはブロック３３０へと続き、該ブロックにては、ＮＬＰデータベース２
１８へのアクセスに備えて変数リプレーサ２０４により関連ワイルドカード機能
により一定の“単語変数（ｗｏｒｄ−ｖａｒｉａｂｌｅ）”が置換される。本明
細書中で使用される“単語変数”とは、量、日付、時間、通貨などを表す単語も
しくは語句を指している。例えば一実施例において“８時にはどの映画が放映さ
れるか（ｗｈａｔｍｏｖｉｅｓａｒｅｐｌａｙｉｎｇａｔ８ｏ’ｃ
ｌｏｃｋ）”という語句はブロック３３０にて“時間にはどの映画が放映される
か（ｗｈａｔｍｏｖｉｅｓａｒｅｐｌａｙｉｎｇａｔｔｉｍｅ）”と
変換されるが、この場合に“時間（ｔｉｍｅ）”は任意の時間値を表すべく使用
されるワイルドカード機能である。別の場合の一実施例においては、“ＩＢＭの
株を１００ドルで売る（ｓｅｌｌＩＢＭｓｔｏｃｋａｔ１００ｄｏｌ
ｌａｒｓ）”という語句はブロック３３０にて“ＩＢＭの株をドルで売る（ｓｅ
ｌｌＩＢＭｓｔｏｃｋａｔｄｏｌｌａｒｓ）”と変換されるが、この場
合に“ドル（ｄｏｌｌａｒｓ）”は任意のドル値を表すべく使用されるワイルド
カード機能である。この工程は簡単なループにより達成され得るが、該ループは
“ドル”もしくは“時（ｏ’ｃｌｏｃｋ）”などの単語であるキー・トークンに
関して語句を検索し、且つ、特定のワイルドカード機能により単語変数を置換す
るものである。置換が行われた語句内の箇所を追跡する為に配列が使用され得る
。これにより、ＮＬＰデータベース２１８が検索された後で一定の位置にて上記
語句へと元の単語変数を戻すべく再置換することが許容される。

【００４０】ブロック３３０にて単語変数を関連ワイルドカード機能により置換する目的は
、ＮＬＰデータベース２１８内に存在すべきエントリの個数を減少することであ
る。例えばＮＬＰデータベース２１８は、８時（８ｏ’ｃｌｏｃｋ）、９時（
９ｏ’ｃｌｏｃｋ）、１０時（１０ｏ’ｃｌｏｃｋ）などの別体のエントリ
ではなく、“時間にはどの映画が放映されるか（ｗｈａｔｍｏｖｉｅｓａｒ
ｅｐｌａｙｉｎｇａｔｔｉｍｅ）”という語句のみを含む。ＮＬＰデータ
ベース２１８は以下で更に記述される。

【００４１】ブロック３３２にては、上記語句内の各代名詞が代名詞リプレーサ２１１によ
り適切な名称で置換される。例えば一実施例において、代名詞“私（Ｉ）”、“
私の（ｍｙ）”もしくは“私のもの（ｍｉｎｅ）”は話し手の氏名で置換される
。この工程の目的は、ユーザがＮＬＰデータベース２１８内にユーザ特有の事実
を記憶してアクセスするのを許容することである。例えば“誰が私の子供ですか
（ｗｈｏａｒｅｍｙｃｈｉｌｄｒｅｎ）”という文は、“誰がＤｅａｎの
子供ですか（ｗｈｏａｒｅＤｅａｎ’ｓｃｈｉｌｄｒｅｎ）”に変換され
、この場合に“Ｄｅａｎ”は話し手の固有名称である。此処でも、この工程は簡
単なループにより達成され得るが、該ループは、代名詞に関して上記語句を検索
し、発見された代名詞を適切な固有名称に置換する。置換が行われた語句内の箇
所を追跡する為に配列が使用され得る。

【００４２】ブロック３３４にては語句内の個々の単語が単語ウェイタ２０８により、該語
句の全体的意味に対する“重要性”もしくは“有意性”に従い加重される。例え
ば一実施例においては、割当てられる３種の加重係数が在る。最低加重係数は、
“ａ”、“ａｎ”、“ｔｈｅ”および他の品詞などの単語に割当てられる。最高
加重係数は、上記語句の意味に対して有意性を有すると思われる単語に対して与
えられる。例えばそれらの単語とは、ＮＬＰデータベース２１８内の全ての動詞
、名詞、形容詞および固有名称である。中間加重係数は、上記語句内の他の全て
の単語に与えられる。この加重の目的は、ＮＬＰデータベース２１８に対する更
に強力な検索を許容することである。

【００４３】図４には、一実施例におけるＮＬＰデータベース２１８の選択列の例が示され
ている。ＮＬＰデータベース２１８は複数の列４００〜４１０および複数の行４
１２Ａ〜４１２Ｎを備えている。列４００において各エントリは、上記ＮＬＰデ
ータベースに対して“既知”の語句を表している。列４０２においては、列４０
０における各エントリに対して必要な単語の個数が示される。列４０４において
は、列４００における各エントリに対する関連文脈または下位文脈が示される。
列４０８および４１０においては、列４００における各エントリに対し、一個以
上の関連動作が示される。尚、図４に示されたＮＬＰデータベース２１８は本発
明を教示すべく簡素化された例に過ぎないことを銘記されたい。他の実施例は、
種々のエントリにより更に多くのもしくは更に少ない列を有し得る。

【００４４】図３Ｂに戻ると、ブロック３３６にてＮＬＰデータベース２１８は、該ＮＬＰ
データベース２１８の列４００内のエントリが上記語句内の各単語（またはそれ
らの同義語）のいずれかを含むか否かということと、これらの単語の相対重みと
に基づき、上記語句に対する可能的一致に関して検索される。ブロック３３８に
ては、上記語句内における各単語の発生回数と、各単語の相対重みとに基づき、
可能的一致エントリの各々に対して確信値が生成される。データベースの加重単
語検索は当業界で公知であり、且つ、バージニア州、アーリントンのＤＴＳｏ
ｆｔｗａｒｅ，Ｉｎｃ．による製品“ｄｔｓｅａｒｃｈ”などの市販の検索エ
ンジンにより実施され得る。同様に、同義語を使用した検索は、当業界で公知で
あり、且つ、ニュージャージー、プリンストンのプリンストン大学の認識科学研
究所（ＣｏｇｎｉｔｉｖｅＳｃｉｅｎｃｅＬａｂｏｒａｔｏｒｙ）により開
発された“ＷｏｒｄＮｅｔ”の如き公開ツールなどを使用して達成され得る。上
記検索エンジンは、自然言語プロセッサ２０２の一体的部分とされ得る。

【００４５】判定３４０にて自然言語プロセッサ２０２は、可能的一致エントリのいずれか
が、一定の所定最小スレッショルドＴ以上である確信値を有するか否かを決定す
る。このスレッショルドＴは、ＮＬＰデータベース２１８内の各エントリのいず
れかに対して上記語句が一致したか否かに関する判定が為される為の容認可能最
低確信値を表す。もしＴ以上の確信値を有する可能的一致エントリが無ければフ
ローはブロック３４２へと進み、選択的エラー・メッセージがユーザに対してデ
ィスプレイ１０４上で視覚的表示され、または、スピーカ１１２を介して音響的
に再生される。一実施例においてユーザに対して表示されるエラー・メッセージ
があれば、そのエラー・メッセージの形式は、最高確信ＮＬＰデータベース・エ
ントリ内で何個の“適合（ｈｉｔ）”（すなわち、上記語句の何個の照合対象単
語）が発見されたかに依存し得る。また、ゼロもしくは１個の適合であった場合
には、２個以上の適合だった場合とは異なる形式のエラー・メッセージが生成さ
れる。

【００４６】但しＮＬＰデータベース２１８内において、当該エントリに対してＴ以上の確
信値が存在する少なくとも一個のエントリが在れば、フローはブロック３４４へ
と進み其処で上記語句からは“ノイズ（ｎｏｉｓｅ）”単語が廃棄される。“ノ
イズ”単語としては、上記語句内の他の単語と比較して該語句の全体的意味に関
してそれほど寄与しない単語が挙げられる。斯かる単語としては、冠詞、代名詞
、接続詞、および同様の性質の単語が挙げられる。“非ノイズ（ｎｏｎ−ｎｏｉ
ｓｅ）”単語は、上記語句の全体的意味に関して相当に寄与する単語が挙げられ
る。“非ノイズ”単語としては、動詞、名詞、形容詞、固有名称、および同様の
性質の単語が挙げられる。

【００４７】フローは図３Ｃに進みブロック３４６にては、最高確信一致エントリに関して
ＮＬＰデータベース２１８の列４０２から非ノイズ単語要件が読出される。例え
ば、もし最高確信照合対象語句が行４１２Ａ内のエントリ（例えば、“時間には
どの映画が放映されるか（ｗｈａｔｍｏｖｉｅｓａｒｅｐｌａｙｉｎｇ
ａｔｔｉｍｅ）”）であれば、非ノイズ単語必要個数は３である。

【００４８】判定３４８にては、上記語句からの非ノイズ単語必要個数が、ＮＬＰデータベ
ース２１８から読出された最高確信エントリ内に実際に存在するか否かを決定す
るテストが行われる。このテストはブロック３３６において実施された適合形式
検索（ｒｅｌｅｖａｎｃｅ−ｓｔｙｌｅｓｅａｒｃｈ）の精度の検証であり、
上記語句と容認可能に一致しなくてもエントリは最小スレッショルドＴよりも大
きな確信値を生成する可能性が在ることは理解される。

【００４９】判定３４８で実施される上記テストの性質は、ブーリアン・テスタ２１０によ
り実施される論理的“ＡＮＤ”テストである。このテストは、上記語句（もしく
はその同義語）内の非ノイズ単語の各々が上記最高確信エントリ内に実際に存在
するか否かを決定するものである。もし上記最高確信エントリ内に実際に存在す
る十分な個数の必要単語が在れば、フローはブロック３５０へと進み、其処で自
然言語プロセッサ２０２はアプリケーション・インタフェース２２０に対して列
４０８もしくは４１０からの関連動作を行うことを指示する。付加的な動作列も
存在し得ることは理解されよう。

【００５０】例えば、最高確信エントリが行４１２Ａ内のエントリであり、且つ、判定３４
８のブーリアン・テストが、列４００内のエントリ内の語句には実際に３個の非
ノイズ単語が在ることを決定したなら、列４０８における関連動作（例えば、映
画ウェブ・サイトにアクセスする）が行われる。上記ＮＬＰデータベースにおけ
る他の各エントリは他の関連動作を有する。例えば、最高確信エントリが行４１
２Ｅにおけるエントリ（例えば、“いま何時（ｗｈａｔｔｉｍｅｉｓｉｔ
）”）であれば関連動作は、自然言語プロセッサ２０２が（不図示の）テキスト
／音声アプリケーションに対し、スピーカ１１２を介してユーザに現在時刻を音
声発生することを指示することである。他の例として、もし最高確信エントリが
行４１２Ｎのエントリ（例えば、“ニュースを見せて下さい（ｓｈｏｗｍｅ
ｔｈｅｎｅｗｓ）”）であれば、第１の関連動作はインターネット上の所定の
ニュース・ウェブ・サイトにアクセスすることであり、且つ、第２の関連動作は
（不図示の）イメージ表示アプリケーションに対し、上記ニュースに関連するイ
メージを表示することを指示することであり得る。別のもしくは付加的な動作も
実施され得る。

【００５１】同様に、もし最高確信エントリが判定３４８で決定された如き上記語句からの
非ノイズ単語必要個数を含むならば、自然言語プロセッサ２０２は音声認識プロ
セッサ２００に対し、列４０４の関連文脈に対して文脈固有文法２１２を有効化
することを命令する。故に行４１２Ａに対しては、“映画（ｍｏｖｉｅｓ）”と
いう文脈に関する文脈固有文法２１２が有効化される。故に、図３Ａのブロック
３００にて音声認識プロセッサ２００に対して次の発語が提供されたとき、音声
認識プロセッサ２００は一般文法２１４を検索する前に“映画（ｍｏｖｉｅｓ）
”に対する有効化文脈固有文法２１２を検索する。前述の如く、適切な文脈固有
文法２１２を有効化すると高速で好結果な音声認識の可能性が高まると共に、会
話的な形式でコンピュータと対話するユーザの能力が強化される。

【００５２】但し判定３４８にて、ＮＬＰデータベース２１８から読出された最高確信エン
トリ内に上記語句からの非ノイズ単語必要個数が実際に存在しなければ、フロー
はブロック３５４に進み、其処でユーザはディスプレイ１０４もしくはスピーカ
１１２を介し、最高確信エントリが表されたか否かが問われる。例えばユーザが
“今日のＩＢＭ株の売りはいくらか（ＨｏｗｍｕｃｈｉｓＩＢＭｓｔｏ
ｃｋｓｅｌｌｉｎｇｆｏｒｔｏｄａｙ）”と発語すると、ＮＬＰデータベ
ース２１８内の最高確信エントリは行４１２Ｂ内のエントリである。この場合、
適合率は高いが、必要単語（もしくはそれらの同義語）の個数は十分でない。故
にユーザはブロック３５４にて、ユーザが“１９９８年８月２８日のＩＢＭ株の
値段はいくらか（ｗｈａｔｉｓｔｈｅｐｒｉｃｅｏｆＩＢＭｓｔｏ
ｃｋｏｎＡｕｇｕｓｔ２８，１９９８）”）を意味したか否かが問われ
る。

【００５３】ユーザは、肯定的にもしくは否定的に応答し得る。ユーザが肯定的に応答した
と判定３５６で決定されたなら、ブロック３５０にては最高確信エントリに関連
する動作が行われ、且つ、ブロック３５２にては関連する文脈固有文法２１２が
有効化される。

【００５４】但し判定３５６にてユーザが否定的に応答したならフローは図３Ｄへと進み、
其処で、上記最高確信エントリに関してＮＬＰデータベース２１８の列４０４か
ら関連文脈が読出され、且つ、ブロック３６０にてユーザは文脈用対話型ダイア
ログを使用して情報が問われる。例えばユーザが“ＸＩＣＯＲ株の今日の値段は
いくらか（ｗｈａｔｉｓｔｈｅｐｒｉｃｅｏｆＸＩＣＯＲｓｔｏｃ
ｋｔｏｄａｙ）”と発語すると共にＮＬＰデータベース２１８からの最高確信
エントリは行４１２Ｂ（例えば“日付のＩＢＭ株の値段はいくらか（ｗｈａｔ
ｉｓｔｈｅｐｒｉｃｅｏｆＩＢＭｓｔｏｃｋｏｎｄａｔｅ）”）
であったとすれば、ブロック３５４でユーザは、それがユーザの意図した処であ
るか否かが問われる。

【００５５】もしユーザが否定的に応答したなら、“株（ｓｔｏｃｋ）”という文脈がブロ
ック３５８にて列４０４から読出され、ディスプレイ１０４およびスピーカ１１
２を介してユーザには株文脈に対する文脈用対話型ダイアログが呈示される。斯
かる文脈用対話型ダイアログは、ＸＩＣＯＲ株に対する名称および相場表示器記
号に関してユーザに問う段階を含み得る。ユーザは必要情報を話すことで応答し
得る。各可能的文脈に対しては、異なる文脈用対話型ダイアログが使用され得る
。例えば“気象（ｗｅａｔｈｅｒ）”文脈用対話型ダイアログは、気象情報が所
望される場所（例えば市）の名称をユーザに問う段階を含み得る。また“ニュー
ス（ｎｅｗｓ）”文脈用対話型ダイアログは、記事の種類、ニュース・ソース、
ニュース・サイトに対するインターネットＵＲＬ、または、他の関連情報をユー
ザに問う段階を含み得る。

【００５６】上記文脈用対話型ダイアログが完了したなら、ＮＬＰデータベース２１８、一
般文法２１４および文脈固有文法２１２は新情報を含むべく更新される。この様
にして、ユーザは次回にてその情報を要求し、適切な一致が発見され、且つ、更
なる情報をユーザに問うこと無く適切な動作が行われる。故に本発明は、ユーザ
により発語された語句を認識すべく適合的に“学習”する。

【００５７】本発明の一実施例においては、ＮＬＰデータベース２１８、文脈固有文法２１
２、一般文法２１４および聴音書取文法２１６のひとつ以上が、各エントリに関
連する（不図示の）タイムスタンプ値も含み得る。一致エントリが使用される毎
に、そのエントリに関連するタイムスタンプ値は更新される。定期的間隔にて、
または、ユーザにより開始されたとき、一定の日付および時刻より以前のタイム
スタンプ値を有する各エントリは夫々のデータベース／文法から削除される。こ
の様にして上記データベース／文法は古いもしくは期限経過エントリを“一掃”
することで効率的サイズに保持され得る。これは、誤った一致の回避も促進する
。

【００５８】要約すると、本発明はコンピュータの為の対話型ユーザ・インタフェースに対
する方法およびシステムを提供する。文脈固有文法を使用することにより、本発
明は音声認識時間を短縮すると共に、ユーザが会話的な形式でコンピュータと対
話する能力を高める。更に、種々の文法およびＮＬＰデータベースを適合更新す
ることにより、本発明は対話効率を更に高める。

【００５９】各好適実施例に関する上記記述は、当業者が本発明を実施もしくは使用し得る
様に提供されたものである。当業者であればこれらの実施例の種々の改変例は容
易に明らかであると共に、本明細書中で定義された包括的原理は発明能力を使用
せずとも他の実施例に適用され得る。故に本発明は本明細書中に示された各実施
例に限定されることは意図されず、本明細書中に開示された原理および新規特徴
に一致する最大範囲に従うものとする。

【図面の簡単な説明】

【図１】本発明と共に使用される好適なコンピュータ・システムの機能ブロ
ック図。

【図２】図１のコンピュータ・システムにおける本発明のＣＰＵ１０２お
よび記憶媒体１０８の拡大機能ブロック図。

【図３Ａ】本発明の方法を示すフローチャート。

【図３Ｂ】本発明の方法を示すフローチャート。

【図３Ｃ】本発明の方法のフローチャート。

【図３Ｄ】本発明の方法を示すフローチャート。

【図４】本発明の好適な自然言語処理（ＮＬＰ）データベースの選択列を示
す図。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 15/06 Ｇ１０Ｌ 3/00 ５２１Ｖ 15/22 ５５１Ｐ 15/28 ５７１Ｔ５６１Ｃ (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＣＹ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＯＡ(ＢＦ，ＢＪ，ＣＦ，ＣＧ，ＣＩ，ＣＭ，ＧＡ，ＧＮ，ＧＷ，ＭＬ，ＭＲ，ＮＥ，ＳＮ，ＴＤ，ＴＧ)，ＡＰ(ＧＨ，ＧＭ，ＫＥ，ＬＳ，ＭＷ，ＳＤ，ＳＬ，ＳＺ，ＵＧ，ＺＷ)，ＥＡ(ＡＭ，ＡＺ，ＢＹ，ＫＧ，ＫＺ，ＭＤ，ＲＵ，ＴＪ，ＴＭ)，ＡＥ，ＡＬ，ＡＭ，ＡＴ，ＡＵ，ＡＺ，ＢＡ，ＢＢ，ＢＧ，ＢＲ，ＢＹ，ＣＡ，ＣＨ，ＣＮ，ＣＲ，ＣＵ，ＣＺ，ＤＥ，ＤＫ，ＤＭ，ＥＥ，ＥＳ，ＦＩ，ＧＢ，ＧＤ，ＧＥ，ＧＨ，ＧＭ，ＨＲ，ＨＵ，ＩＤ，ＩＬ，ＩＮ，ＩＳ，ＪＰ，ＫＥ，ＫＧ，ＫＰ，ＫＲ，ＫＺ，ＬＣ，ＬＫ，ＬＲ，ＬＳ，ＬＴ，ＬＵ，ＬＶ，ＭＤ，ＭＧ，ＭＫ，ＭＮ，ＭＷ，ＭＸ，ＮＯ，ＮＺ，ＰＬ，ＰＴ，ＲＯ，ＲＵ，ＳＤ，ＳＥ，ＳＧ，ＳＩ，ＳＫ，ＳＬ，ＴＪ，ＴＭ，ＴＲ，ＴＴ，ＵＡ，ＵＧ，ＵＳ，ＵＺ，ＶＮ，ＹＵ，ＺＡ，ＺＷＦターム(参考） 5B075 PP07 PP24 5B091 AA15 CA12 CA14 CB12 CC03 CC15 5D015 GG01 GG03 HH21 KK03 LL04 LL09

Claims

【特許請求の範囲】

【請求項１】発語を利用してコンピュータと対話するための方法であって
、前記発語に対する照合対象語句について第１の文法ファイルを検索する工程と
、前記第１の文法ファイル内で前記照合対象語句が見付からない場合に前記照合
対象語句について第２の文法ファイルを検索する工程と、前記照合対象語句に対する一致エントリについてデータベースを検索する工程
と、前記データベース内で前記一致エントリが見付かった場合に、前記一致エント
リに関連付けられた動作を実行する工程とを含む方法。
【請求項２】前記データベース内で前記一致エントリが見付からない場合
に、前記データベース、前記第１の文法ファイル、及び前記第２の文法ファイル
の少なくとも１つを前記照合対象語句にて更新する工程を更に含む請求項１に記
載の方法。
【請求項３】前記第１の文法ファイルは文脈固有文法ファイルである請求
項２に記載の方法。
【請求項４】前記第２の文法ファイルは一般文法ファイルである請求項３
に記載の方法。
【請求項５】前記一般文法ファイル内で前記照合対象語句が見付からない
場合に前記照合対象語句について聴音書取文法を検索する工程を更に含む請求項
４に記載の方法。
【請求項６】前記照合対象語句の少なくとも１個の単語を置換する工程を
前記データベースを検索する前記工程の前に更に含む請求項１に記載の方法。
【請求項７】前記少なくとも１個の単語を置換する前記工程は、前記少な
くとも１個の単語をワイルドカードで置き換えることを含む請求項６に記載の方
法。
【請求項８】前記少なくとも１個の単語を置換する前記工程は、前記少な
くとも１個の単語を適当な名称で置き換えることを含む請求項６に記載の方法。
【請求項９】前記照合対象語句をテキストフォーマットする工程を、前記
データベースを検索する前記工程の前に更に含む請求項１に記載の方法。
【請求項１０】前記照合対象語句中の個々の単語を該個々の単語の相対的重
要度に基いて重み付けする工程を、前記データベースを検索する前記工程の前に
更に含む請求項１に記載の方法。
【請求項１１】前記一致エントリに対する確信値を生成する工程を更に含む
請求項１に記載の方法。
【請求項１２】前記確信値をスレッショルド値と比較する工程を更に含む請
求項１１に記載の方法。
【請求項１３】前記一致エントリ内に前記照合対象語句からの必要な数の単
語が存在するか否かを判定する工程を更に含む請求項１２に記載の方法。
【請求項１４】前記照合対象語句からの必要な数の単語が前記一致エントリ
内に存在しない場合、前記一致エントリが前記発語の正しい解釈であるか否かを
ユーザに対して問い質す工程を更に含む請求項１３に記載の方法。
【請求項１５】前記一致エントリが前記発語の正しい解釈でない場合にユー
ザに対して更なる情報を問い質す工程を更に含む請求項１４に記載の方法。
【請求項１６】前記データベース、前記第１の文法ファイル、及び前記第２
の文法ファイルの少なくとも１つを前記更なる情報にて更新する工程を更に含む
請求項１５に記載の方法。
【請求項１７】次の発語に対する次の照合対象語句について前記一致エント
リに関連付けられた文脈固有文法を検索する工程を更に含む請求項２に記載の方
法。
【請求項１８】発語を利用してコンピュータと対話するためのシステムであ
って、前記発語に対する照合対象語句について第１の文法ファイルを検索し、前記第
１の文法ファイル内で前記照合対象語句が見付からない場合には前記照合対象語
句について第２の文法ファイルを検索する音声プロセッサと、前記照合対象語句に対する一致エントリについてデータベースを検索するため
の自然言語プロセッサと、前記一致エントリが前記データベース内で見付かった場合に前記一致エントリ
に関連付けられた動作を実行するアプリケーションインタフェースとを備えるシ
ステム。
【請求項１９】前記自然言語プロセッサは、前記データベース内で前記一致
エントリが見付からない場合に、前記データベース、前記第１の文法ファイル、
及び前記第２の文法ファイルの少なくとも１つを前記照合対象語句にて更新する
請求項１８に記載のシステム。
【請求項２０】前記第１の文法ファイルは文脈固有文法ファイルである請求
項１９に記載のシステム。
【請求項２１】前記第２の文法ファイルは一般文法ファイルである請求項２
０に記載のシステム。
【請求項２２】前記音声プロセッサは、前記一般文法ファイル内で前記照合
対象語句が見付からない場合に前記照合対象語句について聴音書取文法を検索す
る請求項２１に記載のシステム。
【請求項２３】前記自然言語プロセッサは、前記データベースを検索するこ
との前に前記照合対象語句の少なくとも１個の単語を置換する請求項１８に記載
のシステム。
【請求項２４】前記照合対象語句中の前記少なくとも１個の単語をワイルド
カードで置き換えるための前記自然言語プロセッサ内の変数リプレーサを更に有
する請求項２３に記載のシステム。
【請求項２５】前記照合対象語句中の前記少なくとも１個の単語を適当な名
称で置き換える前記自然言語プロセッサ内の代名詞サブスティテュータを更に有
する請求項２３に記載のシステム。
【請求項２６】前記データベースを検索することの前に前記照合対象語句を
テキストフォーマットするための文字列フォーマッタを更に有する請求項１８に
記載のシステム。
【請求項２７】前記データベースを検索することの前に前記照合対象語句中
の個々の単語を該個々の単語の相対的重要度に基いて重み付けする単語ウェイタ
を更に有する請求項１８に記載のシステム。
【請求項２８】前記一致エントリに対する確信値を生成するための前記自然
言語プロセッサ内の検索エンジンを更に有する請求項１８に記載のシステム。
【請求項２９】前記自然言語プロセッサは前記確信値をスレッショルド値と
比較する請求項２８に記載のシステム。
【請求項３０】前記一致エントリ内に前記照合対象語句からの必要な数の単
語が存在するか否かを判定するためのブーリアンテスタを更に有する請求項２９
に記載のシステム。
【請求項３１】前記自然言語プロセッサは、前記照合対象語句からの必要な
数の単語が前記一致エントリ内に存在しない場合、前記一致エントリが前記発語
の正しい解釈であるか否かをユーザに対して問い質す請求項３０に記載のシステ
ム。
【請求項３２】前記自然言語プロセッサは、前記一致エントリが前記発語の
正しい解釈でない場合にユーザに対して更なる情報を問い質す請求項３０に記載
のシステム。
【請求項３３】前記自然言語プロセッサは、前記データベース、前記第１の
文法ファイル、及び前記第２の文法ファイルの少なくとも１つを前記更なる情報
にて更新する請求項３２に記載のシステム。
【請求項３４】前記音声プロセッサは、次の発語に対する次の照合対象語句
について前記一致エントリに関連付けられた文脈固有文法を検索する請求項１９
に記載のシステム。