JP2004295837A - 音声制御方法、音声制御装置、音声制御プログラム - Google Patents

音声制御方法、音声制御装置、音声制御プログラム Download PDF

Info

Publication number
JP2004295837A
JP2004295837A JP2003090923A JP2003090923A JP2004295837A JP 2004295837 A JP2004295837 A JP 2004295837A JP 2003090923 A JP2003090923 A JP 2003090923A JP 2003090923 A JP2003090923 A JP 2003090923A JP 2004295837 A JP2004295837 A JP 2004295837A
Authority
JP
Japan
Prior art keywords
keyword
access destination
destination address
voice
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003090923A
Other languages
English (en)
Inventor
Takefumi Yamazaki
毅文 山崎
Tetsuro Amakasu
哲朗 甘粕
Tasuku Shinozaki
翼 篠崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003090923A priority Critical patent/JP2004295837A/ja
Publication of JP2004295837A publication Critical patent/JP2004295837A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】自由な発話入力でコンピュータネットワーク上の任意のアドレスをアクセスする。
【解決手段】利用者が入力する音声情報を音声認識し、その認識結果を単語列で出力し、この単語列の中から登録されているキーワードの存在を抽出する。抽出したキーワードでキーワード対アクセス先アドレス対応表を参照し、抽出したキーワードに対応するアクセス先アドレスを検出する。複数のアクセス先アドレスが検出された場合、抽出したキーワードと組合せが予想されるキーワードを使った質問文を生成し、不足したキーワードの入力を促し、不足したキーワードを入力させてアクセス先アドレスの絞り込みを行う。
【選択図】 図2

Description

【0001】
【発明の属する技術分野】
この発明は音声入力を音声認識し、認識結果を利用してコンピュータネットワーク上の任意のアドレスをアクセスし、アクセスしたアドレスから所望の情報を取得してその情報を表示器に表示させる音声制御型ハイパーテキスト表示装置に適用することができる音声制御方法、音声制御装置、プログラムに関する。
【0002】
【従来の技術】
インターネット等のコンピュータネットワークを用いて、html等のハイパーテキストを受信して、表示することが有力な情報収集手段になっている。
この際に用いられる表示装置は一般にブラウザと呼ばれるハイパーテキスト表示装置が用いられる。一般的なブラウザでは、入力手段としてマウスが用いられ、マウスによって表示器に表示されている複数のテキストの中の、例えば内容を詳細に知りたいとするテキスト表示位置にカーソルの位置を合わせ、クリックを入力することにより、そのテキストに貼り付けられているアクセス先のアドレス(URL)がコンピュータネットワーク上で呼び出され、そのアクセス先のアドレスに格納されている内容が表示器に表示される。新たに表示された表示の内容の中で更に詳しく知りたい記述が存在する場合は、その記述の部分にカーソルをあわせ、その位置でクリックを入力することにより、そのクリックした位置に埋入まれているアクセス先のアドレスがコンピュータネットワーク上でアクセスされ、そのアドレスからデータが読み出されて新たな内容が表示される。このようにして順次調べたい内容を探し出すことができる。
【0003】
ところで、ブラウザの入力手段をマウスに替えて音声によって制御したい要求がある。この要求に応える技術の一つに「ハイパーテキスト音声制御方法、及び装置がある(特許文献1)。
【0004】
【特許文献1】
特開平10−222342号公報
【0005】
【発明が解決しようとする課題】
上記した特許文献1で提案されている従来技術では、キーワードとこのキーワードで指定されるアクセス先のアドレスとが1対1で対応付けされて用意されており、更に入力する音声情報が全てキーワードであるものとして取り扱うから、利用者は予めアクセス先のアドレスに対応付けされている単語(キーワード)を一字一句間違えることなく発声する必要があり、キーワード以外の言語を付け加えたり、言い淀みや、言い直しによる音声入力ができず利用者にとって使い難いものであった。
【0006】
この発明の目的は上記したハイパーテキスト音声制御方法及び装置において、自由な発話の中から制御に必要なキーワードを抽出し、抽出したキーワードを用いてアクセス先のアドレスを検出し、検出したアドレスをアクセスして表示の切替を可能とした音声制御方法及び音声制御装置、音声制御プログラムを提案しようとするものである。
【0007】
【課題を解決するための手段】
この発明では、入力された音声情報を音声認識し、その音声認識結果を単語列で出力する音声認識処理と、この単語列の中から、登録されているキーワードと一致するキーワードを抽出するキーワード抽出処理と、抽出したキーワードでキーワード対アクセス先アドレス対応表を参照し、抽出したキーワードに対応するアクセス先アドレスを検出するアクセス先アドレス検出処理と、複数のアクセス先アドレスが検出された場合、抽出したキーワードと組み合わせが予想されるキーワードを使った質問文を生成し、不足したキーワードの入力を促し、アクセス先アドレスの絞り込みを行う質問文生成処理とを含む音声制御方法を提案する。
【0008】
この発明では更に、入力された音声情報を音声認識し、音声認識結果を単語列に変換して出力する音声認識処理と、音声認識処理により出力された単語列の中から、登録されているキーワードに一致するキーワードを抽出するキーワード抽出処理と、キーワード抽出処理で抽出したキーワードをキーワード管理テーブルに格納する処理と、抽出されたキーワードを用いてキーワード対アクセス先アドレスとの対応表を参照し、抽出したキーワードに対応するアクセス先アドレスを検出するアクセス先アドレス検出処理と、アクセス先アドレス検出手段が検出したアクセス先アドレスが単一か複数かを判定する判定処理と、この判定処理の結果が複数と判定された場合に抽出したキーワードと組み合わせが予想される他のキーワードの入力を促す質問文を生成する質問文生成処理と、判定処理の結果が単一であると判定した場合に抽出したキーワードで指定されるアクセス先アドレスに関わる情報を利用者に表示し、確認を求める確認処理と、この確認処理の結果、肯定語が入力されたことを検出して検出したアクセス先アドレスをコンピュータネットワークに発信し、そのアクセス先アドレスから所望の情報を取得し表示する表示手段と、確認処理の確認に対して否定語が検出された場合は、キーワード管理テーブルに格納したキーワードを他のキーワードに更新するキーワード更新処理とを含む音声御方法を提案する。
【0009】
この発明では更に、入力される音声情報を音声認識し、認識結果を単語列で出力する音声認識手段と、この音声認識手段が出力する単語列の中から予め登録されているキーワードと一致するキーワードを抽出するキーワード抽出手段と、抽出したキーワードを格納するキーワード管理テーブルと、このキーワード管理テーブルに格納されているキーワードを用いてキーワード対アクセス先アドレスとの対応表を参照し、抽出したキーワードに対応するアクセス先アドレスを検出するアクセス先アドレス検出手段と、アクセス先アドレス検出手段が検出したアクセス先アドレスが単一か複数かを判定する判定手段と、この判定手段が複数と判定した場合に起動され、抽出したキーワードと組み合わせが予想される他のキーワードの入力を促す質問文を生成する質問文生成手段と、アクセス先アドレス検出手段が検出したアクセス先アドレスの数が判定手段が単一であると判定した場合に起動され、抽出したキーワードで指定されるアクセス先アドレスに関わる情報を利用者に表示し確認を求める確認手段と、この確認手段の確認に対して肯定語が入力された場合に検出したアクセス先アドレスをコンピュータネットワークに発信し、そのアクセス先アドレスから所望の情報を取得し表示する表示手段と、確認手段の確認に対して否定語が検出された場合は、キーワード管理テーブルに格納されているキーワードを他のキーワードに更新するキーワード更新手段とによって構成した音声制御装置を提案する。
この発明では更に、コンピュータが解読可能な符号列によって記述され、コンピュータに上記した音声制御方法のいずれかを実行させる音声制御プログラムを提案する。
【0010】
作用
この発明によれば音声認識結果を文字列で出力し、単語列の中から予め登録されているキーワード群の中の該当するキーワードを検索してキーワードを抽出する方法を採ったから、キャラクタコードのレベルで文字列を照合することができ、また、登録されているキーワードに一致するキーワードを抽出するから、この結果音声認識で取得した文字列にキーワード以外の言語が付加されていても、音声認識により得られた単語列の中から目的とするキーワードを確実に抽出することができる。
また、この発明では抽出したキーワードに対応するアクセス先アドレスを検出した場合、複数のアクセス先アドレスが検出された場合は、絞り込みのために、抽出したキーワードと組合せが予想される他のキーワードの入力を促す質問文を生成し、この質問文を利用者に表示し、利用者に他のキーワードを入力させ、先に抽出したキーワードと新たに入力されたキーワードとの組合せによりアクセス先アドレスを特定する。
【0011】
更に、この発明によれば単一のアクセス先アドレスが検出された場合でも、その単一のキーワードで検出されたアクセス先アドレスに関わる情報を利用者に提示し、利用者が希望する内容と一致しているか否かを確認した後に、不一致であった場合は、利用者に否定後を発話させ、先に抽出したキーワードを他のキーワードに更新して再度アクセス先アドレスの検出を実行させるから、誤った入力をした場合でも初めから入力のやり直しを行わなくてよい。従って、利用者には使い勝手のよい音声制御装置を提供することができる。
【0012】
【発明の実施の形態】
図1を用いてこの発明による音声制御装置を搭載し、音声によってアクセス先アドレスを指定することができる音声制御型ハイパーテキスト表示装置の概要を説明する。
図1に示す音声制御型ハイパーテキスト表示装置100はブラウザと呼ばれるハイパーテキスト表示装置200と、音声入力のための対話シナリオを実行する対話表示装置300と、この発明による音声制御装置400とによって構成される。
【0013】
対話表示装置300は対話シナリオ解釈手段301と、キャラクタ制御手段302と、音声合成手段303と、音声出力手段304とを具備して構成される。
ハイパーテキスト表示装置200はコンピュータネットワークwebに接続され、コンピュータネットワークwebにアクセス先アドレス(URL)を発信することができ、アドレスの発信に伴ってコンピュータネットワークweb上で定められているアドレス(URL)からハイパーテキストデータを読み込んで、そのハイパーテキストデータをハイパーテキストに付加されている表示制御機能に従って表示器に表示する。
【0014】
ハイパーテキスト表示装置200はコンピュータネットワークwebから対話シナリオ(利用者と音声制御型ハイパーテキスト表示装置100との間で交わされる応答内容を想定して作成した対話シナリオ)を含むhtmlファイルを読み込む。htmlファイルには対話シナリオの他にキャラクタ制御手段302で利用されるキャラクタ表示ファイル、音声制御装置400で利用される言語モデルファイル、音響モデルファイル、キーワード抽出のために利用されるキーワードファイル、肯定/否定表現ファイルが指定されており、これらのファイルもhtmlファイルの読み込みと同時にハイパーテキスト表示装置200に読み込まれる。但し、これらのファイルは上記ハイパーテキスト表示装置200に予め格納しておいてもよい。
【0015】
htmlファイルがハイパーテキスト表示装置200に読み込まれると、対話表示装置300が起動される。htmlファイルの中の対話シナリオ部分が対話シナリオ解釈手段301で解釈され対話シナリオの記述に従って順次実行される。対話シナリオの例としてはキャラクタ制御手段302にキャラクタ表示ファイルを読み込み、ハイパーテキスト表示装置200に装備されている表示器にキャラクタを表示する。キャラクタとしては例えば利用者にとって対話相手となる人形等が考えられる。
【0016】
キャラクタの表示と共に、対話シナリオの中の音声ファイルが音声合成手段303に入力され、利用者に音声入力を促す音声を音声合成手段303で合成し、音声出力手段304から出力する。又は、他の方法としてコンピュータネットワークweb上のサーバに予め音声ファイル(WAVファイル等)を用意し、対話シナリオを読み込んだ際に、同時にこの音声ファイルを読み込んで、この音声ファイルを音声出力手段304に渡して音声を再生することもできる。このとき音声に同期してキャラクタが動作し、キャラクタが利用者との対話相手の役を果たす。
【0017】
音声制御装置400には利用者からの音声情報が入力される。音声制御装置400は入力された音声情報からキーワードを抽出し、その抽出したキーワードを用いてキーワード対アクセス先アドレス対応表を参照し、抽出したキーワードに対応するアクセス先アドレスを対応表から検出する。検出されたアクセス先アドレスはハイパーテキスト表示装置200に入力される。ハイパーテキスト表示装置200はそのアクセス先アドレスをコンピュータネットワークwebに発信し、そのアクセス先アドレスから所望のハイパーテキストデータを取り込み、表示器に表示する。
以上は音声制御型ハイパーテキスト表示装置100の概要である。
【0018】
以下に、この発明による音声制御装置400及び音声制御方法の実施例を図2を用いて詳細に説明する。
この発明による音声制御装置400は音声入力待ち受け手段401と、音声認識手段402と、この音声認識手段402の音声認識で用いる言語モデルファイル・音響モデルファイルを格納する第1記憶領域403Aと、音声理解手段404と、この音声理解手段404がキーワードの抽出に用いるキーワードファイル及び音声情報の中の肯定表現及び否定表現を検出するための肯定/否定表現ファイルを格納する第2記憶領域403Bと、キーワード管理テーブル405と、キーワード更新手段406と、アクセス先アドレス検出手段407と、キーワード対アクセス先アドレス対応表を格納する第3記憶領域403Cと、判定手段408と、質問文生成手段409と、確認手段410とによって構成される。
【0019】
ハイパーテキスト表示装置200が起動されると先にも説明したように、ハイパーテキスト表示装置200はコンピュータネットワークwebから、対話シナリオファイルと、音声認識に用いる言語モデルファイル・音響モデルファイル及びキーワードファイル及び肯定表現・否定表現ファイル、キーワード対アクセス先アドレス対応表を読み込む(但し、これらの各ファイルをハイパーテキスト表示装置200を構成するコンピュータに予め内蔵している場合はこの限りではない)。
コンピュータネットワークwebから読み込まれた各ファイルは音声制御装置400に用いられるファイルに関しては上記した第1記憶領域403Aから第3記憶領域403Cの各記憶領域に格納される。各ファイルが第1記憶領域403A乃至第3記憶領域403Cに格納されると、音声制御装置400が動作可能となる。
【0020】
音声入力待ち受け手段401は対話シナリオファイルの記述に従って、例えばハイパーテキスト表示装置200に装備されている表示器にキャラクタを表示し、音声の入力待ちであることを表示する。利用者から音声が入力されると音声認識手段402は入力された音声を音声認識し、更に第1記憶領域403Aに格納した言語モデルファイル及び音響モデルファイルを使って音声情報を文字列に変換する。音声情報を文字列に変換する方法は、オーム社鹿野清宏著「音声認識システム」第8章ディクテーション技術に基づく。
音声認識手段402は利用者が入力した音声情報を音声認識し、その認識結果をテキストデータ構造の単語列で出力する。音声認識手段402から出力されたテキストデータ構造の単語列データは音声理解装置404に入力される。
【0021】
音声理解手段404では第2記憶領域403Bに格納されたキーワードファイルを参照してキーワードファイルに登録されているキーワードと合致するキーワードを単語列から抽出する。単語列からキーワードを抽出することにより、入力された音声情報に含まれるキーワードの前後にキーワード以外の言語が付加されていても単語列の一致検索であるから、付加されている言語に邪魔されることなく、キーワードファイルに登録されているキーワードに合致するキーワードを抽出することができる。
【0022】
音声理解手段404はキーワードの抽出以外に入力された音声情報の中から肯定/否定表現ファイルを用いて肯定表現及び否定表現を検出する。肯定表現とは例えば「はい」「そうです」「よろしいです」「けっこうです」「OKです」…であり、否定表現とは「いいえ」「ちがいます」「間違えました」「そうでなく」「NOです」「キーワードAじゃなくてキーワードB」…等である。これら肯定表現及び否定表現が第2記憶領域403Bに格納されている。第2記憶領域403Bに格納した肯定/否定表現ファイルを参照して肯定表現及び否定表現を検出する。
【0023】
これらの肯定表現及び否定表現を検出することにより、その検出結果を利用して制御符号を発信することができる。例えば音声情報の入力中に入力の間違いが発生した場合、「あ、間違えた」と発話したとすると、「間違え」が否定表現として検出され、その入力中の項目の入力をやり直す制御符号として利用するか、又は音声入力中にキーワードとして登録されている例えば「大きい」又は「小さい」等を発話した後に「あ、間違えた」「大きいじゃなくて小さいだった」といい直した場合に、「…じゃなくて小さい」の発話内容からキーワード「小さい」を新たに抽出し、先に抽出し、キーワード管理テーブル405に保持されているキーワード「大きい」に対して新たに抽出したキーワード「小さい」が「じゃなくて」の内容に調和するか否かを調べ、調和する場合はキーワード管理テーブル405に格納しているキーワード「大きい」を「小さい」に更新する制御符号として利用する。
【0024】
また肯定表現の場合は音声情報の入力中に「OKです」と発話したとすると、肯定表現として検出され、その項目の入力が全て完了したと判定する制御符号として利用することができる。音声理解手段404で抽出したキーワード及び肯定表現及び否定表現の有無、更にキーワードの変更の有無をキーワード管理テーブル405に格納する。
キーワード管理テーブル405に格納されたキーワードはアクセス先アドレス検出手段407に読み込まれ、このアクセス先アドレス検出手段407でキーワード対アクセス先アドレス対応表を参照して音声理解手段404で抽出したキーワードに対応付けされたアクセス先アドレスを検出する。
【0025】
図3にキーワード対アクセス先アドレス対応表の内部構造、図4にキーワード管理テーブルの内部構造の一例を示す。図3に示すキーワード対アクセス先アドレス対応表には設定キーワードと、この設定キーワードと対応付けされたアクセス先アドレスが格納されている。各アクセス先アドレスにはページタイトルが付加されており、アクセス先アドレスが抽出された時点でページタイトルを表示できるように構成した場合を示す。
【0026】
図3に示す例では、設定キーワードにスロット1とスロット2が設けられ、2つのキーワードの組合せが揃った状態で目的とするアクセス先アドレスが特定される例を示す。キーワードに割当られるスロットの数は利用者の用件に応じて任意に設定される。この例では、対話表示装置300からの初期の問い合わせが例えば「どのようなご用件ですか?」に対して利用者が「水道の申し込みをしたいのですが」と応答した場合について説明する。この場合、音声理解手段404は「水道」と「申し込み」をキーワードとして抽出する。2個のキーワード「水道」と「申し込み」が抽出されたことにより、キーワード管理テーブル405では図4AとBに示すキーワード1とキーワード2の現在値の欄に「水道」と「申し込み」が書き込まれる。
【0027】
これと共に、キーワード1はキーワード対アクセス先アドレス対応表ではスロット1に対応付けされ、キーワード2はキーワード対アクセス先アドレス対応表ではスロット2に対応付けされて照合が実行される。
キーワード1が「水道」キーワード2が「申し込み」である場合、この組合せがキーワード対アクセス先アドレス対応表に存在し、1つのアクセス先アドレス(URL=〜/suidou1.html)を特定できる。この結果、判定手段408は検出したアクセス先アドレスが単一であると判定し、その判定結果を確認手段410に入力する。
【0028】
確認手段410は検出したアクセス先アドレスに関わる情報をハイパーテキスト表示装置200に送り込み、その内容を表示させる。検出したアクセス先アドレスに関わる情報としては音声理解手段404で抽出したキーワード(利用者が発話した言語に含まれるキーワードと一致しているかを確認する)でもよく、またはキーワード対アクセス先アドレス対応表で取得したページタイトル(この例では「水道申し込みページ」)を表示器に表示し、利用者に、確認を求める。
【0029】
表示されたページタイトルが利用者の目的と合致している場合は利用者が、例えば「はい」「けっこうです」等と肯定表現の音声を入力すれば、確認手段410はハイパーテキスト表示手段200にキーワード対アクセス先アドレス対応表から取得したアクセス先アドレス(〜/suidou1.html)を受け渡し、ハイパーテキスト表示手段200にアクセス先アドレスをアクセスさせる。アクセスの結果、ハイパーテキスト表示装置200の表示器にはこの例では「水道申し込みページ」に格納されている情報が表示される。
【0030】
ここで、対話表示装置300の「どのようなご用件ですか?」の問い合わせに対し、利用者が例えば「水道の申しあいをしたいのですが?」と不明瞭な音声情報を入力した場合にはキーワードは「水道」のみが抽出され、この時点ではキーワードの数は「1」と判定される。キーワードが「水道」のみの場合、アクセス先アドレス検出手段407は複数のアクセス先アドレスを検出する。この結果判定手段408は音声情報の入力により複数のアクセス先アドレスを検出したと判定し、この場合には質問文生成手段409を起動させ、抽出されたキーワードと組合せを予想される不足するキーワード(図3に示す設定キーワードのスロット1とスロット2に対応するキーワード)を使って質問文を生成させる。質問文としては、例えば(ページが絞りきれません。「水道」の「申し込み」ですか「停止」ですか?「故障」ですか?)と生成させる。質問文はハイパーテキスト表示装置200に送られ、利用者に表示される。また、音声合成手段303で音声で利用者に表示することも考えられる。
【0031】
この質問文に対して利用者が「申し込みです」と対応すると、「申し込み」がキーワードとして検出され、先に検出したキーワード「水道」と共にキーワード管理テーブル405に格納される。この時点でキーワードの数は「2」と判定され、「水道」と「申し込み」とから成るキーワードの組合せでキーワード対アクセス先アドレス対応表を照合し、対応するアクセス先アドレス(URL=〜/Suidou1.html)を検出し、このアクセス先アドレスをアクセスする。
【0032】
尚、ここで対話表示装置300の「どのようなご用件ですか?」の問い合わせに対し、利用者が例えば(「水道」の「申し込み」の「料金」)について知りたいのですが)と入力した場合にはキーワードは「水道」「申し込み」「料金」と3つになる。この場合には3つのキーワードをスロット1、スロット2、スロット3に割当てたキーワード対アクセス先アドレス対応表(このキーワード対アクセス先アドレス対応表も初期化の時点で第3記録領域403Cに格納されている)を参照することになる。つまり、利用者の目的とする用件に応じてキーワードの数が決定され、決定したキーワードの数に対応したキーワード対アクセス先アドレス対応表を選択して参照することになる。
【0033】
以上の説明では、キーワードが抽出されたままの変更のない状態でアクセス先アドレスが決定された場合を説明した。その対話例を図5と図6に示す。図5は正常な終了例、図6はキーワードの数が不足してアクセス先アドレスが複数検出される場合の対話例である。これらの対話例では否定表現の発話がなく、キーワードの内容が修正された例を示していない。その状態は図4に示すキーワード管理テーブルの中のキーワード1の前値が「NULL」=空、キーワード1のフラッグが「NULL」=空、キーワード2の前値が「NULL」=空、キーワード2のフラッグが「NULL」=空の表記で説明される。尚、図4に示したキーワード管理テーブルは利用者の用件に応じて決定されるキーワードの数だけ用意される。
【0034】
次に、発話に否定表現が存在し、キーワードの内容が変更される例を説明する。図7にその対話例を示す。この対話例でステップSP7で利用者は「いや、やっぱり申し込みでなく停止のページに」と否定表現を発話している。この発話の内容は音声理解手段404で肯定/否定表現ファイルを参照して検出される。
否定表現が検出された場合、キーワード更新手段406は図8Bに示すキーワード2の現在値を「申し込み」から「停止」に変更する。これと共に、キーワード2の状態に「変更あり」を記入し、キーワード2の前値に「申し込み」を記入し、キーワード2のフラグに「否定」を記入してキーワード管理テーブル405の更新を終了する。
【0035】
更新されたキーワード管理テーブルからキーワード「水道」と「停止」がアクセス先アドレス検出手段406に送り出され、この2つのキーワードの組合せによりキーワード対アクセス先アドレス対応表を参照し、アクセス先アドレス(URL=〜/suidou3.html)を検出する。検出されたアクセス先アドレスは先にも説明したようにハイパーテキスト表示手段200に引き渡され、そのアクセス先アドレスをアクセスし、ハイパーテキスト表示手段200の表示状態を水道の停止ページに更新する。ページの更新と共にキーワード管理テーブル405は初期化される。
尚、水道の停止ページがハイパーテキスト表示手段200に取り込まれるのと同時に、ハイパーテキスと表示手段200は水道の停止ページに付随する対話シナリオファイル、キャラクタ表示ファイルをコンピュータネットワークwebから取り込み、各記憶領域に格納する。この動作は新たなページを取り込む毎に実行される。
【0036】
以上説明した音声制御方法、音声制御装置はコンピュータと、コンピュータにインストールした音声制御プログラムによって実現される。プログラムはコンピュータが解読可能な符号列によって記述され、コンピュータが読み取り可能な磁気ディスク又はCD−ROM等の記録媒体に記録され、記録媒体からコンピュータにインストールするか、又は通信回線を通じてコンピュータにインストールする。また、図2に示した第1記憶領域403A、第2記憶領域403B、第3記憶領域403C及び図3、図4、図8に示したキーワード対アクセス先アドレス対応表及びキーワード管理テーブルにそれぞれ所定の種別のデータが格納され、更に質問文生成手段409には質問文候補またはその断片が予め記憶部に記憶されて用意される。コンピュータにインストールされた音声制御プログラムはコンピュータに備えられている中央演算処理装置によって解読されてコンピュータに上述した音声制御方法を実行させる。
【0037】
【発明の効果】
上述したように、この発明によれば利用者は対話シナリオの指示に従って、音声で受け答えすれば、利用者が希望する情報を格納しているアドレス(URL)を特定することができ、そのアドレスから希望する情報を取得することができる。特に、この発明によれば、音声認識結果を文字列に変換し、文字列の中から予め登録されているキーワードと一致するキーワードを抽出する方法を採ったから、キーワードの前後に、キーワード以外の言語が付加されていてもキーワードのみを確実に抽出することができる。この結果、利用者は自由な発話が許され、自由な発話で目的とする情報をコンピュータネットワークから取得することができる。
【0038】
更に、この発明ではキーワードの数が不足して複数のアクセス先アドレスが検出された場合には既に抽出したキーワードと組合せが予想されるキーワードを使って質問文を生成し、利用者に不足しているキーワードの入力を促すから、可及的に少ない対話回数で目的とするアクセス先アドレスを検出することができる。
【図面の簡単な説明】
【図1】この発明の音声制御装置を搭載した音声制御型ハイパーテキスト表示装置の概要を説明するためのブロック図。
【図2】この発明の音声制御装置の一実施例を説明するための機能構成図。
【図3】この発明の音声制御装置に用いるキーワード対アクセス先アドレス対応表の一例を説明するための図。
【図4】この発明の音声制御装置に用いるキーワード管理テーブルの内部構造を説明するための図。
【図5】この発明の音声制御装置と利用者との間の対話の例を説明するための図。
【図6】図5と同様の図。
【図7】図5と同様の図。
【図8】図7に示した対話の経過に伴って管理テーブルの内部が変化する様子を説明するための図。
【符号の説明】
100 音声制御型ハイパーテキスト表示装置
200 ハイパーテキスト表示装置 403A 第1記憶領域
300 対話表示装置 403B 第2記憶領域
301 対話シナリオ解釈手段 403C 第3記憶領域
302 キャラクタ制御手段 404 音声理解手段
303 音声合成手段 405 キーワード管理テーブル
304 音声出力手段 406 キーワード更新手段
400 音声制御装置 407 アクセス先アドレス検出手段
401 音声入力待ち受け手段 408 判定手段
402 音声認識手段 409 質問文生成手段
410 確認手段

Claims (4)

  1. 入力された音声情報を音声認識し、その音声認識結果を単語列で出力する音声認識処理と、
    この単語列の中から、登録されているキーワードと一致するキーワードを抽出するキーワード抽出処理と、
    抽出したキーワードでキーワード対アクセス先アドレス対応表を参照し、上記抽出したキーワードに対応するアクセス先アドレスを検出するアクセス先アドレス検出処理と、
    上記アクセス先アドレス検出手段が検出したアクセス先アドレスが単一か複数かを判定する判定処理と、
    この判定処理の結果が複数と判定された場合に上記抽出したキーワードと組み合わせが予想されるキーワードを使った質問文を生成し、不足したキーワードの入力を促し、アクセス先アドレスの絞り込みを行う質問文生成処理と、
    を含むことを特徴とする音声制御方法。
  2. 請求項1記載の音声制御方法に、
    キーワード抽出処理で抽出したキーワードをキーワード管理テーブルに格納する処理と、
    上記判定処理の結果が単一であると判定した場合に上記抽出したキーワードで指定されるアクセス先アドレスに関わる情報を利用者に表示し、確認を求める確認処理と、
    この確認処理の結果、肯定語が入力されたことを検出して上記検出したアクセス先アドレスをコンピュータネットワークに発信し、そのアクセス先アドレスから所望の情報を取得し表示する表示手段と、
    上記確認処理の確認に対して否定語が検出された場合は、上記キーワード管理テーブルに格納したキーワードを他のキーワードに更新するキーワード更新処理と、
    を付加して実行することを特徴とする音声制御方法。
  3. 入力される音声情報を音声認識し、認識結果を単語列で出力する音声認識手段と、
    この音声認識手段が出力する単語列の中から予め登録されているキーワードと一致するキーワードを抽出するキーワード抽出手段と、
    抽出したキーワードを格納するキーワード管理テーブルと、
    このキーワード管理テーブルに格納されているキーワードを用いてキーワード対アクセス先アドレスとの対応表を参照し、抽出したキーワードに対応するアクセス先アドレスを検出するアクセス先アドレス検出手段と、
    上記アクセス先アドレス検出手段が検出したアクセス先アドレスが単一か複数かを判定する判定手段と、
    この判定手段が複数と判定した場合に起動され、上記抽出したキーワードと組み合わせが予想される他のキーワードの入力を促す質問文を生成する質問文生成手段と、
    上記アクセス先アドレス検出手段が検出したアクセス先アドレスの数が上記判定手段が単一であると判定した場合に起動され、上記抽出したキーワードで指定されるアクセス先アドレスに関わる情報を表示し確認を求める確認手段と、
    この確認手段の確認に対して肯定語が入力された場合に上記検出したアクセス先アドレスをコンピュータネットワークに発信し、そのアクセス先アドレスから所望の情報を取得し表示する表示手段と、
    上記確認手段の確認に対して否定語が検出された場合は、上記キーワード管理テーブルに格納されているキーワードを他のキーワードに更新するキーワード更新手段と、
    によって構成したことを特徴とする音声制御装置。
  4. コンピュータが解読可能な符号列によって記述され、コンピュータに請求項1又は2記載の音声制御方法のいずれかを実行させる音声制御プログラム。
JP2003090923A 2003-03-28 2003-03-28 音声制御方法、音声制御装置、音声制御プログラム Pending JP2004295837A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003090923A JP2004295837A (ja) 2003-03-28 2003-03-28 音声制御方法、音声制御装置、音声制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003090923A JP2004295837A (ja) 2003-03-28 2003-03-28 音声制御方法、音声制御装置、音声制御プログラム

Publications (1)

Publication Number Publication Date
JP2004295837A true JP2004295837A (ja) 2004-10-21

Family

ID=33404421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003090923A Pending JP2004295837A (ja) 2003-03-28 2003-03-28 音声制御方法、音声制御装置、音声制御プログラム

Country Status (1)

Country Link
JP (1) JP2004295837A (ja)

Cited By (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009193532A (ja) * 2008-02-18 2009-08-27 Oki Electric Ind Co Ltd 対話管理装置、方法及びプログラム、並びに意識抽出システム
JP2011076627A (ja) * 2010-12-16 2011-04-14 Oki Electric Industry Co Ltd 対話管理装置、方法及びプログラム、並びに意識抽出システム
JP2012003403A (ja) * 2010-06-15 2012-01-05 Nec Corp 意見分析装置、意見分析方法、および意見分析用プログラム
JP2014222509A (ja) * 2010-01-18 2014-11-27 アップル インコーポレイテッド インテリジェント自動アシスタント
JP2015511746A (ja) * 2012-03-14 2015-04-20 ファーマナー, ギャリーFarmaner, Gary 会話式情報検索システムおよび方法
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US9620104B2 (en) 2013-06-07 2017-04-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9626955B2 (en) 2008-04-05 2017-04-18 Apple Inc. Intelligent text-to-speech conversion
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US9633674B2 (en) 2013-06-07 2017-04-25 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9646614B2 (en) 2000-03-16 2017-05-09 Apple Inc. Fast, language-independent method for user authentication by voice
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US9798393B2 (en) 2011-08-29 2017-10-24 Apple Inc. Text correction processing
JP2018041443A (ja) * 2016-07-14 2018-03-15 株式会社シーサイドジャパン ディープラーニング人工神経網基盤のタスク提供プラットフォーム
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9953088B2 (en) 2012-05-14 2018-04-24 Apple Inc. Crowd sourcing information to fulfill user requests
US9966068B2 (en) 2013-06-08 2018-05-08 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10102359B2 (en) 2011-03-21 2018-10-16 Apple Inc. Device access using voice authentication
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US10185542B2 (en) 2013-06-09 2019-01-22 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10283110B2 (en) 2009-07-02 2019-05-07 Apple Inc. Methods and apparatuses for automatic speech recognition
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
CN110246494A (zh) * 2019-05-20 2019-09-17 深圳壹账通智能科技有限公司 基于语音识别的服务请求方法、装置及计算机设备
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
CN113571055A (zh) * 2020-04-29 2021-10-29 顾家家居股份有限公司 一种智能语音沙发控制系统
US11217255B2 (en) 2017-05-16 2022-01-04 Apple Inc. Far-field extension for digital assistant services
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
JP7488617B1 (ja) 2023-09-29 2024-05-22 カラクリ株式会社 プログラム、方法、情報処理装置、システム

Cited By (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9646614B2 (en) 2000-03-16 2017-05-09 Apple Inc. Fast, language-independent method for user authentication by voice
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
JP2009193532A (ja) * 2008-02-18 2009-08-27 Oki Electric Ind Co Ltd 対話管理装置、方法及びプログラム、並びに意識抽出システム
US9626955B2 (en) 2008-04-05 2017-04-18 Apple Inc. Intelligent text-to-speech conversion
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US10283110B2 (en) 2009-07-02 2019-05-07 Apple Inc. Methods and apparatuses for automatic speech recognition
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
JP2014222509A (ja) * 2010-01-18 2014-11-27 アップル インコーポレイテッド インテリジェント自動アシスタント
US9548050B2 (en) 2010-01-18 2017-01-17 Apple Inc. Intelligent automated assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
JP2012003403A (ja) * 2010-06-15 2012-01-05 Nec Corp 意見分析装置、意見分析方法、および意見分析用プログラム
JP2011076627A (ja) * 2010-12-16 2011-04-14 Oki Electric Industry Co Ltd 対話管理装置、方法及びプログラム、並びに意識抽出システム
US10102359B2 (en) 2011-03-21 2018-10-16 Apple Inc. Device access using voice authentication
US9798393B2 (en) 2011-08-29 2017-10-24 Apple Inc. Text correction processing
JP2015511746A (ja) * 2012-03-14 2015-04-20 ファーマナー, ギャリーFarmaner, Gary 会話式情報検索システムおよび方法
US9953088B2 (en) 2012-05-14 2018-04-24 Apple Inc. Crowd sourcing information to fulfill user requests
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9620104B2 (en) 2013-06-07 2017-04-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9633674B2 (en) 2013-06-07 2017-04-25 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US10657961B2 (en) 2013-06-08 2020-05-19 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US9966068B2 (en) 2013-06-08 2018-05-08 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10185542B2 (en) 2013-06-09 2019-01-22 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10904611B2 (en) 2014-06-30 2021-01-26 Apple Inc. Intelligent automated assistant for TV user interactions
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
JP2018041443A (ja) * 2016-07-14 2018-03-15 株式会社シーサイドジャパン ディープラーニング人工神経網基盤のタスク提供プラットフォーム
US10553215B2 (en) 2016-09-23 2020-02-04 Apple Inc. Intelligent automated assistant
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US11217255B2 (en) 2017-05-16 2022-01-04 Apple Inc. Far-field extension for digital assistant services
CN110246494A (zh) * 2019-05-20 2019-09-17 深圳壹账通智能科技有限公司 基于语音识别的服务请求方法、装置及计算机设备
CN113571055A (zh) * 2020-04-29 2021-10-29 顾家家居股份有限公司 一种智能语音沙发控制系统
JP7488617B1 (ja) 2023-09-29 2024-05-22 カラクリ株式会社 プログラム、方法、情報処理装置、システム

Similar Documents

Publication Publication Date Title
JP2004295837A (ja) 音声制御方法、音声制御装置、音声制御プログラム
US9858039B2 (en) Voice recognition of commands extracted from user interface screen devices
JP4028375B2 (ja) 言語に無関係な音声ベースのサーチ・システム
US6801897B2 (en) Method of providing concise forms of natural commands
CN105931644B (zh) 一种语音识别方法及移动终端
EP2824596B1 (en) Speech- Enabled Web Content Searching Using a Multimodal Browser
JP4267081B2 (ja) 分散システムにおけるパターン認識登録
US6587822B2 (en) Web-based platform for interactive voice response (IVR)
CN101197868B (zh) 在web页框架中启用语法的方法和系统
US8380512B2 (en) Navigation using a search engine and phonetic voice recognition
JP5257330B2 (ja) 発言記録装置、発言記録方法、プログラム及び記録媒体
US20080255835A1 (en) User directed adaptation of spoken language grammer
JP2001188777A (ja) 音声をテキストに関連付ける方法、音声をテキストに関連付けるコンピュータ、コンピュータで文書を生成し読み上げる方法、文書を生成し読み上げるコンピュータ、コンピュータでテキスト文書の音声再生を行う方法、テキスト文書の音声再生を行うコンピュータ、及び、文書内のテキストを編集し評価する方法
US11093110B1 (en) Messaging feedback mechanism
JP2004355629A (ja) 高度対話型インターフェースに対する理解同期意味オブジェクト
JP2007220045A (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP2008083855A (ja) 機械翻訳を行う装置、システム、方法およびプログラム
JP5753769B2 (ja) 音声データ検索システムおよびそのためのプログラム
JPWO2011033834A1 (ja) 音声翻訳システム、音声翻訳方法および記録媒体
Kandhari et al. A voice controlled e-commerce web application
Edlund et al. Higgins-a spoken dialogue system for investigating error handling techniques.
JP2005215726A (ja) 話者に対する情報提示システム及びプログラム
JP2003162524A (ja) 言語処理装置
JP7297266B2 (ja) 検索支援サーバ、検索支援方法及びコンピュータプログラム
JP7257010B2 (ja) 検索支援サーバ、検索支援方法及びコンピュータプログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20061107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070814

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071011

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071127