JP2004295837A

JP2004295837A - 音声制御方法、音声制御装置、音声制御プログラム

Info

Publication number: JP2004295837A
Application number: JP2003090923A
Authority: JP
Inventors: Takefumi Yamazaki; 毅文山崎; Tetsuro Amakasu; 哲朗甘粕; Tasuku Shinozaki; 翼篠崎
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2003-03-28
Filing date: 2003-03-28
Publication date: 2004-10-21

Abstract

【課題】自由な発話入力でコンピュータネットワーク上の任意のアドレスをアクセスする。
【解決手段】利用者が入力する音声情報を音声認識し、その認識結果を単語列で出力し、この単語列の中から登録されているキーワードの存在を抽出する。抽出したキーワードでキーワード対アクセス先アドレス対応表を参照し、抽出したキーワードに対応するアクセス先アドレスを検出する。複数のアクセス先アドレスが検出された場合、抽出したキーワードと組合せが予想されるキーワードを使った質問文を生成し、不足したキーワードの入力を促し、不足したキーワードを入力させてアクセス先アドレスの絞り込みを行う。
【選択図】図２

Description

【０００１】
【発明の属する技術分野】
この発明は音声入力を音声認識し、認識結果を利用してコンピュータネットワーク上の任意のアドレスをアクセスし、アクセスしたアドレスから所望の情報を取得してその情報を表示器に表示させる音声制御型ハイパーテキスト表示装置に適用することができる音声制御方法、音声制御装置、プログラムに関する。
【０００２】
【従来の技術】
インターネット等のコンピュータネットワークを用いて、ｈｔｍｌ等のハイパーテキストを受信して、表示することが有力な情報収集手段になっている。
この際に用いられる表示装置は一般にブラウザと呼ばれるハイパーテキスト表示装置が用いられる。一般的なブラウザでは、入力手段としてマウスが用いられ、マウスによって表示器に表示されている複数のテキストの中の、例えば内容を詳細に知りたいとするテキスト表示位置にカーソルの位置を合わせ、クリックを入力することにより、そのテキストに貼り付けられているアクセス先のアドレス（ＵＲＬ）がコンピュータネットワーク上で呼び出され、そのアクセス先のアドレスに格納されている内容が表示器に表示される。新たに表示された表示の内容の中で更に詳しく知りたい記述が存在する場合は、その記述の部分にカーソルをあわせ、その位置でクリックを入力することにより、そのクリックした位置に埋入まれているアクセス先のアドレスがコンピュータネットワーク上でアクセスされ、そのアドレスからデータが読み出されて新たな内容が表示される。このようにして順次調べたい内容を探し出すことができる。
【０００３】
ところで、ブラウザの入力手段をマウスに替えて音声によって制御したい要求がある。この要求に応える技術の一つに「ハイパーテキスト音声制御方法、及び装置がある（特許文献１）。
【０００４】
【特許文献１】
特開平１０−２２２３４２号公報
【０００５】
【発明が解決しようとする課題】
上記した特許文献１で提案されている従来技術では、キーワードとこのキーワードで指定されるアクセス先のアドレスとが１対１で対応付けされて用意されており、更に入力する音声情報が全てキーワードであるものとして取り扱うから、利用者は予めアクセス先のアドレスに対応付けされている単語（キーワード）を一字一句間違えることなく発声する必要があり、キーワード以外の言語を付け加えたり、言い淀みや、言い直しによる音声入力ができず利用者にとって使い難いものであった。
【０００６】
この発明の目的は上記したハイパーテキスト音声制御方法及び装置において、自由な発話の中から制御に必要なキーワードを抽出し、抽出したキーワードを用いてアクセス先のアドレスを検出し、検出したアドレスをアクセスして表示の切替を可能とした音声制御方法及び音声制御装置、音声制御プログラムを提案しようとするものである。
【０００７】
【課題を解決するための手段】
この発明では、入力された音声情報を音声認識し、その音声認識結果を単語列で出力する音声認識処理と、この単語列の中から、登録されているキーワードと一致するキーワードを抽出するキーワード抽出処理と、抽出したキーワードでキーワード対アクセス先アドレス対応表を参照し、抽出したキーワードに対応するアクセス先アドレスを検出するアクセス先アドレス検出処理と、複数のアクセス先アドレスが検出された場合、抽出したキーワードと組み合わせが予想されるキーワードを使った質問文を生成し、不足したキーワードの入力を促し、アクセス先アドレスの絞り込みを行う質問文生成処理とを含む音声制御方法を提案する。
【０００８】
この発明では更に、入力された音声情報を音声認識し、音声認識結果を単語列に変換して出力する音声認識処理と、音声認識処理により出力された単語列の中から、登録されているキーワードに一致するキーワードを抽出するキーワード抽出処理と、キーワード抽出処理で抽出したキーワードをキーワード管理テーブルに格納する処理と、抽出されたキーワードを用いてキーワード対アクセス先アドレスとの対応表を参照し、抽出したキーワードに対応するアクセス先アドレスを検出するアクセス先アドレス検出処理と、アクセス先アドレス検出手段が検出したアクセス先アドレスが単一か複数かを判定する判定処理と、この判定処理の結果が複数と判定された場合に抽出したキーワードと組み合わせが予想される他のキーワードの入力を促す質問文を生成する質問文生成処理と、判定処理の結果が単一であると判定した場合に抽出したキーワードで指定されるアクセス先アドレスに関わる情報を利用者に表示し、確認を求める確認処理と、この確認処理の結果、肯定語が入力されたことを検出して検出したアクセス先アドレスをコンピュータネットワークに発信し、そのアクセス先アドレスから所望の情報を取得し表示する表示手段と、確認処理の確認に対して否定語が検出された場合は、キーワード管理テーブルに格納したキーワードを他のキーワードに更新するキーワード更新処理とを含む音声御方法を提案する。
【０００９】
この発明では更に、入力される音声情報を音声認識し、認識結果を単語列で出力する音声認識手段と、この音声認識手段が出力する単語列の中から予め登録されているキーワードと一致するキーワードを抽出するキーワード抽出手段と、抽出したキーワードを格納するキーワード管理テーブルと、このキーワード管理テーブルに格納されているキーワードを用いてキーワード対アクセス先アドレスとの対応表を参照し、抽出したキーワードに対応するアクセス先アドレスを検出するアクセス先アドレス検出手段と、アクセス先アドレス検出手段が検出したアクセス先アドレスが単一か複数かを判定する判定手段と、この判定手段が複数と判定した場合に起動され、抽出したキーワードと組み合わせが予想される他のキーワードの入力を促す質問文を生成する質問文生成手段と、アクセス先アドレス検出手段が検出したアクセス先アドレスの数が判定手段が単一であると判定した場合に起動され、抽出したキーワードで指定されるアクセス先アドレスに関わる情報を利用者に表示し確認を求める確認手段と、この確認手段の確認に対して肯定語が入力された場合に検出したアクセス先アドレスをコンピュータネットワークに発信し、そのアクセス先アドレスから所望の情報を取得し表示する表示手段と、確認手段の確認に対して否定語が検出された場合は、キーワード管理テーブルに格納されているキーワードを他のキーワードに更新するキーワード更新手段とによって構成した音声制御装置を提案する。
この発明では更に、コンピュータが解読可能な符号列によって記述され、コンピュータに上記した音声制御方法のいずれかを実行させる音声制御プログラムを提案する。
【００１０】
作用
この発明によれば音声認識結果を文字列で出力し、単語列の中から予め登録されているキーワード群の中の該当するキーワードを検索してキーワードを抽出する方法を採ったから、キャラクタコードのレベルで文字列を照合することができ、また、登録されているキーワードに一致するキーワードを抽出するから、この結果音声認識で取得した文字列にキーワード以外の言語が付加されていても、音声認識により得られた単語列の中から目的とするキーワードを確実に抽出することができる。
また、この発明では抽出したキーワードに対応するアクセス先アドレスを検出した場合、複数のアクセス先アドレスが検出された場合は、絞り込みのために、抽出したキーワードと組合せが予想される他のキーワードの入力を促す質問文を生成し、この質問文を利用者に表示し、利用者に他のキーワードを入力させ、先に抽出したキーワードと新たに入力されたキーワードとの組合せによりアクセス先アドレスを特定する。
【００１１】
更に、この発明によれば単一のアクセス先アドレスが検出された場合でも、その単一のキーワードで検出されたアクセス先アドレスに関わる情報を利用者に提示し、利用者が希望する内容と一致しているか否かを確認した後に、不一致であった場合は、利用者に否定後を発話させ、先に抽出したキーワードを他のキーワードに更新して再度アクセス先アドレスの検出を実行させるから、誤った入力をした場合でも初めから入力のやり直しを行わなくてよい。従って、利用者には使い勝手のよい音声制御装置を提供することができる。
【００１２】
【発明の実施の形態】
図１を用いてこの発明による音声制御装置を搭載し、音声によってアクセス先アドレスを指定することができる音声制御型ハイパーテキスト表示装置の概要を説明する。
図１に示す音声制御型ハイパーテキスト表示装置１００はブラウザと呼ばれるハイパーテキスト表示装置２００と、音声入力のための対話シナリオを実行する対話表示装置３００と、この発明による音声制御装置４００とによって構成される。
【００１３】
対話表示装置３００は対話シナリオ解釈手段３０１と、キャラクタ制御手段３０２と、音声合成手段３０３と、音声出力手段３０４とを具備して構成される。
ハイパーテキスト表示装置２００はコンピュータネットワークｗｅｂに接続され、コンピュータネットワークｗｅｂにアクセス先アドレス（ＵＲＬ）を発信することができ、アドレスの発信に伴ってコンピュータネットワークｗｅｂ上で定められているアドレス（ＵＲＬ）からハイパーテキストデータを読み込んで、そのハイパーテキストデータをハイパーテキストに付加されている表示制御機能に従って表示器に表示する。
【００１４】
ハイパーテキスト表示装置２００はコンピュータネットワークｗｅｂから対話シナリオ（利用者と音声制御型ハイパーテキスト表示装置１００との間で交わされる応答内容を想定して作成した対話シナリオ）を含むｈｔｍｌファイルを読み込む。ｈｔｍｌファイルには対話シナリオの他にキャラクタ制御手段３０２で利用されるキャラクタ表示ファイル、音声制御装置４００で利用される言語モデルファイル、音響モデルファイル、キーワード抽出のために利用されるキーワードファイル、肯定／否定表現ファイルが指定されており、これらのファイルもｈｔｍｌファイルの読み込みと同時にハイパーテキスト表示装置２００に読み込まれる。但し、これらのファイルは上記ハイパーテキスト表示装置２００に予め格納しておいてもよい。
【００１５】
ｈｔｍｌファイルがハイパーテキスト表示装置２００に読み込まれると、対話表示装置３００が起動される。ｈｔｍｌファイルの中の対話シナリオ部分が対話シナリオ解釈手段３０１で解釈され対話シナリオの記述に従って順次実行される。対話シナリオの例としてはキャラクタ制御手段３０２にキャラクタ表示ファイルを読み込み、ハイパーテキスト表示装置２００に装備されている表示器にキャラクタを表示する。キャラクタとしては例えば利用者にとって対話相手となる人形等が考えられる。
【００１６】
キャラクタの表示と共に、対話シナリオの中の音声ファイルが音声合成手段３０３に入力され、利用者に音声入力を促す音声を音声合成手段３０３で合成し、音声出力手段３０４から出力する。又は、他の方法としてコンピュータネットワークｗｅｂ上のサーバに予め音声ファイル（ＷＡＶファイル等）を用意し、対話シナリオを読み込んだ際に、同時にこの音声ファイルを読み込んで、この音声ファイルを音声出力手段３０４に渡して音声を再生することもできる。このとき音声に同期してキャラクタが動作し、キャラクタが利用者との対話相手の役を果たす。
【００１７】
音声制御装置４００には利用者からの音声情報が入力される。音声制御装置４００は入力された音声情報からキーワードを抽出し、その抽出したキーワードを用いてキーワード対アクセス先アドレス対応表を参照し、抽出したキーワードに対応するアクセス先アドレスを対応表から検出する。検出されたアクセス先アドレスはハイパーテキスト表示装置２００に入力される。ハイパーテキスト表示装置２００はそのアクセス先アドレスをコンピュータネットワークｗｅｂに発信し、そのアクセス先アドレスから所望のハイパーテキストデータを取り込み、表示器に表示する。
以上は音声制御型ハイパーテキスト表示装置１００の概要である。
【００１８】
以下に、この発明による音声制御装置４００及び音声制御方法の実施例を図２を用いて詳細に説明する。
この発明による音声制御装置４００は音声入力待ち受け手段４０１と、音声認識手段４０２と、この音声認識手段４０２の音声認識で用いる言語モデルファイル・音響モデルファイルを格納する第１記憶領域４０３Ａと、音声理解手段４０４と、この音声理解手段４０４がキーワードの抽出に用いるキーワードファイル及び音声情報の中の肯定表現及び否定表現を検出するための肯定／否定表現ファイルを格納する第２記憶領域４０３Ｂと、キーワード管理テーブル４０５と、キーワード更新手段４０６と、アクセス先アドレス検出手段４０７と、キーワード対アクセス先アドレス対応表を格納する第３記憶領域４０３Ｃと、判定手段４０８と、質問文生成手段４０９と、確認手段４１０とによって構成される。
【００１９】
ハイパーテキスト表示装置２００が起動されると先にも説明したように、ハイパーテキスト表示装置２００はコンピュータネットワークｗｅｂから、対話シナリオファイルと、音声認識に用いる言語モデルファイル・音響モデルファイル及びキーワードファイル及び肯定表現・否定表現ファイル、キーワード対アクセス先アドレス対応表を読み込む（但し、これらの各ファイルをハイパーテキスト表示装置２００を構成するコンピュータに予め内蔵している場合はこの限りではない）。
コンピュータネットワークｗｅｂから読み込まれた各ファイルは音声制御装置４００に用いられるファイルに関しては上記した第１記憶領域４０３Ａから第３記憶領域４０３Ｃの各記憶領域に格納される。各ファイルが第１記憶領域４０３Ａ乃至第３記憶領域４０３Ｃに格納されると、音声制御装置４００が動作可能となる。
【００２０】
音声入力待ち受け手段４０１は対話シナリオファイルの記述に従って、例えばハイパーテキスト表示装置２００に装備されている表示器にキャラクタを表示し、音声の入力待ちであることを表示する。利用者から音声が入力されると音声認識手段４０２は入力された音声を音声認識し、更に第１記憶領域４０３Ａに格納した言語モデルファイル及び音響モデルファイルを使って音声情報を文字列に変換する。音声情報を文字列に変換する方法は、オーム社鹿野清宏著「音声認識システム」第８章ディクテーション技術に基づく。
音声認識手段４０２は利用者が入力した音声情報を音声認識し、その認識結果をテキストデータ構造の単語列で出力する。音声認識手段４０２から出力されたテキストデータ構造の単語列データは音声理解装置４０４に入力される。
【００２１】
音声理解手段４０４では第２記憶領域４０３Ｂに格納されたキーワードファイルを参照してキーワードファイルに登録されているキーワードと合致するキーワードを単語列から抽出する。単語列からキーワードを抽出することにより、入力された音声情報に含まれるキーワードの前後にキーワード以外の言語が付加されていても単語列の一致検索であるから、付加されている言語に邪魔されることなく、キーワードファイルに登録されているキーワードに合致するキーワードを抽出することができる。
【００２２】
音声理解手段４０４はキーワードの抽出以外に入力された音声情報の中から肯定／否定表現ファイルを用いて肯定表現及び否定表現を検出する。肯定表現とは例えば「はい」「そうです」「よろしいです」「けっこうです」「ＯＫです」…であり、否定表現とは「いいえ」「ちがいます」「間違えました」「そうでなく」「ＮＯです」「キーワードＡじゃなくてキーワードＢ」…等である。これら肯定表現及び否定表現が第２記憶領域４０３Ｂに格納されている。第２記憶領域４０３Ｂに格納した肯定／否定表現ファイルを参照して肯定表現及び否定表現を検出する。
【００２３】
これらの肯定表現及び否定表現を検出することにより、その検出結果を利用して制御符号を発信することができる。例えば音声情報の入力中に入力の間違いが発生した場合、「あ、間違えた」と発話したとすると、「間違え」が否定表現として検出され、その入力中の項目の入力をやり直す制御符号として利用するか、又は音声入力中にキーワードとして登録されている例えば「大きい」又は「小さい」等を発話した後に「あ、間違えた」「大きいじゃなくて小さいだった」といい直した場合に、「…じゃなくて小さい」の発話内容からキーワード「小さい」を新たに抽出し、先に抽出し、キーワード管理テーブル４０５に保持されているキーワード「大きい」に対して新たに抽出したキーワード「小さい」が「じゃなくて」の内容に調和するか否かを調べ、調和する場合はキーワード管理テーブル４０５に格納しているキーワード「大きい」を「小さい」に更新する制御符号として利用する。
【００２４】
また肯定表現の場合は音声情報の入力中に「ＯＫです」と発話したとすると、肯定表現として検出され、その項目の入力が全て完了したと判定する制御符号として利用することができる。音声理解手段４０４で抽出したキーワード及び肯定表現及び否定表現の有無、更にキーワードの変更の有無をキーワード管理テーブル４０５に格納する。
キーワード管理テーブル４０５に格納されたキーワードはアクセス先アドレス検出手段４０７に読み込まれ、このアクセス先アドレス検出手段４０７でキーワード対アクセス先アドレス対応表を参照して音声理解手段４０４で抽出したキーワードに対応付けされたアクセス先アドレスを検出する。
【００２５】
図３にキーワード対アクセス先アドレス対応表の内部構造、図４にキーワード管理テーブルの内部構造の一例を示す。図３に示すキーワード対アクセス先アドレス対応表には設定キーワードと、この設定キーワードと対応付けされたアクセス先アドレスが格納されている。各アクセス先アドレスにはページタイトルが付加されており、アクセス先アドレスが抽出された時点でページタイトルを表示できるように構成した場合を示す。
【００２６】
図３に示す例では、設定キーワードにスロット１とスロット２が設けられ、２つのキーワードの組合せが揃った状態で目的とするアクセス先アドレスが特定される例を示す。キーワードに割当られるスロットの数は利用者の用件に応じて任意に設定される。この例では、対話表示装置３００からの初期の問い合わせが例えば「どのようなご用件ですか？」に対して利用者が「水道の申し込みをしたいのですが」と応答した場合について説明する。この場合、音声理解手段４０４は「水道」と「申し込み」をキーワードとして抽出する。２個のキーワード「水道」と「申し込み」が抽出されたことにより、キーワード管理テーブル４０５では図４ＡとＢに示すキーワード１とキーワード２の現在値の欄に「水道」と「申し込み」が書き込まれる。
【００２７】
これと共に、キーワード１はキーワード対アクセス先アドレス対応表ではスロット１に対応付けされ、キーワード２はキーワード対アクセス先アドレス対応表ではスロット２に対応付けされて照合が実行される。
キーワード１が「水道」キーワード２が「申し込み」である場合、この組合せがキーワード対アクセス先アドレス対応表に存在し、１つのアクセス先アドレス（ＵＲＬ＝〜／ｓｕｉｄｏｕ１．ｈｔｍｌ）を特定できる。この結果、判定手段４０８は検出したアクセス先アドレスが単一であると判定し、その判定結果を確認手段４１０に入力する。
【００２８】
確認手段４１０は検出したアクセス先アドレスに関わる情報をハイパーテキスト表示装置２００に送り込み、その内容を表示させる。検出したアクセス先アドレスに関わる情報としては音声理解手段４０４で抽出したキーワード（利用者が発話した言語に含まれるキーワードと一致しているかを確認する）でもよく、またはキーワード対アクセス先アドレス対応表で取得したページタイトル（この例では「水道申し込みページ」）を表示器に表示し、利用者に、確認を求める。
【００２９】
表示されたページタイトルが利用者の目的と合致している場合は利用者が、例えば「はい」「けっこうです」等と肯定表現の音声を入力すれば、確認手段４１０はハイパーテキスト表示手段２００にキーワード対アクセス先アドレス対応表から取得したアクセス先アドレス（〜／ｓｕｉｄｏｕ１．ｈｔｍｌ）を受け渡し、ハイパーテキスト表示手段２００にアクセス先アドレスをアクセスさせる。アクセスの結果、ハイパーテキスト表示装置２００の表示器にはこの例では「水道申し込みページ」に格納されている情報が表示される。
【００３０】
ここで、対話表示装置３００の「どのようなご用件ですか？」の問い合わせに対し、利用者が例えば「水道の申しあいをしたいのですが？」と不明瞭な音声情報を入力した場合にはキーワードは「水道」のみが抽出され、この時点ではキーワードの数は「１」と判定される。キーワードが「水道」のみの場合、アクセス先アドレス検出手段４０７は複数のアクセス先アドレスを検出する。この結果判定手段４０８は音声情報の入力により複数のアクセス先アドレスを検出したと判定し、この場合には質問文生成手段４０９を起動させ、抽出されたキーワードと組合せを予想される不足するキーワード（図３に示す設定キーワードのスロット１とスロット２に対応するキーワード）を使って質問文を生成させる。質問文としては、例えば（ページが絞りきれません。「水道」の「申し込み」ですか「停止」ですか？「故障」ですか？）と生成させる。質問文はハイパーテキスト表示装置２００に送られ、利用者に表示される。また、音声合成手段３０３で音声で利用者に表示することも考えられる。
【００３１】
この質問文に対して利用者が「申し込みです」と対応すると、「申し込み」がキーワードとして検出され、先に検出したキーワード「水道」と共にキーワード管理テーブル４０５に格納される。この時点でキーワードの数は「２」と判定され、「水道」と「申し込み」とから成るキーワードの組合せでキーワード対アクセス先アドレス対応表を照合し、対応するアクセス先アドレス（ＵＲＬ＝〜／Ｓｕｉｄｏｕ１．ｈｔｍｌ）を検出し、このアクセス先アドレスをアクセスする。
【００３２】
尚、ここで対話表示装置３００の「どのようなご用件ですか？」の問い合わせに対し、利用者が例えば（「水道」の「申し込み」の「料金」）について知りたいのですが）と入力した場合にはキーワードは「水道」「申し込み」「料金」と３つになる。この場合には３つのキーワードをスロット１、スロット２、スロット３に割当てたキーワード対アクセス先アドレス対応表（このキーワード対アクセス先アドレス対応表も初期化の時点で第３記録領域４０３Ｃに格納されている）を参照することになる。つまり、利用者の目的とする用件に応じてキーワードの数が決定され、決定したキーワードの数に対応したキーワード対アクセス先アドレス対応表を選択して参照することになる。
【００３３】
以上の説明では、キーワードが抽出されたままの変更のない状態でアクセス先アドレスが決定された場合を説明した。その対話例を図５と図６に示す。図５は正常な終了例、図６はキーワードの数が不足してアクセス先アドレスが複数検出される場合の対話例である。これらの対話例では否定表現の発話がなく、キーワードの内容が修正された例を示していない。その状態は図４に示すキーワード管理テーブルの中のキーワード１の前値が「ＮＵＬＬ」＝空、キーワード１のフラッグが「ＮＵＬＬ」＝空、キーワード２の前値が「ＮＵＬＬ」＝空、キーワード２のフラッグが「ＮＵＬＬ」＝空の表記で説明される。尚、図４に示したキーワード管理テーブルは利用者の用件に応じて決定されるキーワードの数だけ用意される。
【００３４】
次に、発話に否定表現が存在し、キーワードの内容が変更される例を説明する。図７にその対話例を示す。この対話例でステップＳＰ７で利用者は「いや、やっぱり申し込みでなく停止のページに」と否定表現を発話している。この発話の内容は音声理解手段４０４で肯定／否定表現ファイルを参照して検出される。
否定表現が検出された場合、キーワード更新手段４０６は図８Ｂに示すキーワード２の現在値を「申し込み」から「停止」に変更する。これと共に、キーワード２の状態に「変更あり」を記入し、キーワード２の前値に「申し込み」を記入し、キーワード２のフラグに「否定」を記入してキーワード管理テーブル４０５の更新を終了する。
【００３５】
更新されたキーワード管理テーブルからキーワード「水道」と「停止」がアクセス先アドレス検出手段４０６に送り出され、この２つのキーワードの組合せによりキーワード対アクセス先アドレス対応表を参照し、アクセス先アドレス（ＵＲＬ＝〜／ｓｕｉｄｏｕ３．ｈｔｍｌ）を検出する。検出されたアクセス先アドレスは先にも説明したようにハイパーテキスト表示手段２００に引き渡され、そのアクセス先アドレスをアクセスし、ハイパーテキスト表示手段２００の表示状態を水道の停止ページに更新する。ページの更新と共にキーワード管理テーブル４０５は初期化される。
尚、水道の停止ページがハイパーテキスト表示手段２００に取り込まれるのと同時に、ハイパーテキスと表示手段２００は水道の停止ページに付随する対話シナリオファイル、キャラクタ表示ファイルをコンピュータネットワークｗｅｂから取り込み、各記憶領域に格納する。この動作は新たなページを取り込む毎に実行される。
【００３６】
以上説明した音声制御方法、音声制御装置はコンピュータと、コンピュータにインストールした音声制御プログラムによって実現される。プログラムはコンピュータが解読可能な符号列によって記述され、コンピュータが読み取り可能な磁気ディスク又はＣＤ−ＲＯＭ等の記録媒体に記録され、記録媒体からコンピュータにインストールするか、又は通信回線を通じてコンピュータにインストールする。また、図２に示した第１記憶領域４０３Ａ、第２記憶領域４０３Ｂ、第３記憶領域４０３Ｃ及び図３、図４、図８に示したキーワード対アクセス先アドレス対応表及びキーワード管理テーブルにそれぞれ所定の種別のデータが格納され、更に質問文生成手段４０９には質問文候補またはその断片が予め記憶部に記憶されて用意される。コンピュータにインストールされた音声制御プログラムはコンピュータに備えられている中央演算処理装置によって解読されてコンピュータに上述した音声制御方法を実行させる。
【００３７】
【発明の効果】
上述したように、この発明によれば利用者は対話シナリオの指示に従って、音声で受け答えすれば、利用者が希望する情報を格納しているアドレス（ＵＲＬ）を特定することができ、そのアドレスから希望する情報を取得することができる。特に、この発明によれば、音声認識結果を文字列に変換し、文字列の中から予め登録されているキーワードと一致するキーワードを抽出する方法を採ったから、キーワードの前後に、キーワード以外の言語が付加されていてもキーワードのみを確実に抽出することができる。この結果、利用者は自由な発話が許され、自由な発話で目的とする情報をコンピュータネットワークから取得することができる。
【００３８】
更に、この発明ではキーワードの数が不足して複数のアクセス先アドレスが検出された場合には既に抽出したキーワードと組合せが予想されるキーワードを使って質問文を生成し、利用者に不足しているキーワードの入力を促すから、可及的に少ない対話回数で目的とするアクセス先アドレスを検出することができる。
【図面の簡単な説明】
【図１】この発明の音声制御装置を搭載した音声制御型ハイパーテキスト表示装置の概要を説明するためのブロック図。
【図２】この発明の音声制御装置の一実施例を説明するための機能構成図。
【図３】この発明の音声制御装置に用いるキーワード対アクセス先アドレス対応表の一例を説明するための図。
【図４】この発明の音声制御装置に用いるキーワード管理テーブルの内部構造を説明するための図。
【図５】この発明の音声制御装置と利用者との間の対話の例を説明するための図。
【図６】図５と同様の図。
【図７】図５と同様の図。
【図８】図７に示した対話の経過に伴って管理テーブルの内部が変化する様子を説明するための図。
【符号の説明】
１００音声制御型ハイパーテキスト表示装置
２００ハイパーテキスト表示装置４０３Ａ第１記憶領域
３００対話表示装置４０３Ｂ第２記憶領域
３０１対話シナリオ解釈手段４０３Ｃ第３記憶領域
３０２キャラクタ制御手段４０４音声理解手段
３０３音声合成手段４０５キーワード管理テーブル
３０４音声出力手段４０６キーワード更新手段
４００音声制御装置４０７アクセス先アドレス検出手段
４０１音声入力待ち受け手段４０８判定手段
４０２音声認識手段４０９質問文生成手段
４１０確認手段

Claims

入力された音声情報を音声認識し、その音声認識結果を単語列で出力する音声認識処理と、
この単語列の中から、登録されているキーワードと一致するキーワードを抽出するキーワード抽出処理と、
抽出したキーワードでキーワード対アクセス先アドレス対応表を参照し、上記抽出したキーワードに対応するアクセス先アドレスを検出するアクセス先アドレス検出処理と、
上記アクセス先アドレス検出手段が検出したアクセス先アドレスが単一か複数かを判定する判定処理と、
この判定処理の結果が複数と判定された場合に上記抽出したキーワードと組み合わせが予想されるキーワードを使った質問文を生成し、不足したキーワードの入力を促し、アクセス先アドレスの絞り込みを行う質問文生成処理と、
を含むことを特徴とする音声制御方法。
請求項１記載の音声制御方法に、
キーワード抽出処理で抽出したキーワードをキーワード管理テーブルに格納する処理と、
上記判定処理の結果が単一であると判定した場合に上記抽出したキーワードで指定されるアクセス先アドレスに関わる情報を利用者に表示し、確認を求める確認処理と、
この確認処理の結果、肯定語が入力されたことを検出して上記検出したアクセス先アドレスをコンピュータネットワークに発信し、そのアクセス先アドレスから所望の情報を取得し表示する表示手段と、
上記確認処理の確認に対して否定語が検出された場合は、上記キーワード管理テーブルに格納したキーワードを他のキーワードに更新するキーワード更新処理と、
を付加して実行することを特徴とする音声制御方法。
入力される音声情報を音声認識し、認識結果を単語列で出力する音声認識手段と、
この音声認識手段が出力する単語列の中から予め登録されているキーワードと一致するキーワードを抽出するキーワード抽出手段と、
抽出したキーワードを格納するキーワード管理テーブルと、
このキーワード管理テーブルに格納されているキーワードを用いてキーワード対アクセス先アドレスとの対応表を参照し、抽出したキーワードに対応するアクセス先アドレスを検出するアクセス先アドレス検出手段と、
上記アクセス先アドレス検出手段が検出したアクセス先アドレスが単一か複数かを判定する判定手段と、
この判定手段が複数と判定した場合に起動され、上記抽出したキーワードと組み合わせが予想される他のキーワードの入力を促す質問文を生成する質問文生成手段と、
上記アクセス先アドレス検出手段が検出したアクセス先アドレスの数が上記判定手段が単一であると判定した場合に起動され、上記抽出したキーワードで指定されるアクセス先アドレスに関わる情報を表示し確認を求める確認手段と、
この確認手段の確認に対して肯定語が入力された場合に上記検出したアクセス先アドレスをコンピュータネットワークに発信し、そのアクセス先アドレスから所望の情報を取得し表示する表示手段と、
上記確認手段の確認に対して否定語が検出された場合は、上記キーワード管理テーブルに格納されているキーワードを他のキーワードに更新するキーワード更新手段と、
によって構成したことを特徴とする音声制御装置。
コンピュータが解読可能な符号列によって記述され、コンピュータに請求項１又は２記載の音声制御方法のいずれかを実行させる音声制御プログラム。