JP3705735B2 - オンデマンド・インタフェース装置とそのウィンドウ表示装置 - Google Patents

オンデマンド・インタフェース装置とそのウィンドウ表示装置 Download PDF

Info

Publication number
JP3705735B2
JP3705735B2 JP2000258418A JP2000258418A JP3705735B2 JP 3705735 B2 JP3705735 B2 JP 3705735B2 JP 2000258418 A JP2000258418 A JP 2000258418A JP 2000258418 A JP2000258418 A JP 2000258418A JP 3705735 B2 JP3705735 B2 JP 3705735B2
Authority
JP
Japan
Prior art keywords
voice
input
window
agent
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000258418A
Other languages
English (en)
Other versions
JP2002073322A (ja
Inventor
健一 黒武者
二寛 青木
育雄 芥子
潤子 中川
謙一 乾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2000258418A priority Critical patent/JP3705735B2/ja
Priority to US09/906,858 priority patent/US7028265B2/en
Priority to EP01117943A priority patent/EP1184782A3/en
Publication of JP2002073322A publication Critical patent/JP2002073322A/ja
Application granted granted Critical
Publication of JP3705735B2 publication Critical patent/JP3705735B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0489Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using dedicated keyboard keys or combinations thereof
    • G06F3/04895Guidance during keyboard input operation, e.g. prompting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Digital Computer Display Output (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、コンピュータ・アプリケーション、OA機器、家電製品などにおいて使用者の操作をアシストするヘルプ機能、自動実行機能を行うオンデマンド・インタフェース装置とそれに使用するウィンドウ表示装置に関する。
【0002】
【従来の技術】
音声認識を使ったアプリケーションが増えてきているが、そのほとんどはコマンドを用いたコマンド起動型のものである。
【0003】
また、擬人化されたキャラクターであるエージェントを表示して操作の説明等を行うオンデマンド・インタフェース装置として特開2000-207085号公報に記載の技術がある。利用者の入力する要求文に対して操作説明のデータベースから最も適切なものを検索して、その結果に関連付けられているスクリプトを実行してエージェントが操作の説明を行うものである。
【0004】
【発明が解決しようとする課題】
音声入力を行うアプリケーションで自然言語入力を可能にするためにコマンドではなくディクテーションを用いて音声入力を行う場合、その認識精度はコマンドだけを用いる場合より必然的に悪くなり、その後の処理にも影響が出てくる。音声認識エンジンが提供しているエンロールを行えば認識精度を高くすることができるが、一般ユーザにはエンロールという概念に馴染みが薄く、使用しているアプリケーションがうまく動かないのが音声認識の精度が悪いためだとは気付きにくい。
【0005】
また、この音声認識の精度が低い間はアプリケーションの使用が思うようにできず、何か音声入力する度に「分かりません」というような同じメッセージばかりが出力され、ユーザ側の使う気が失せてしまう問題がある。
【0006】
次に、音声入力とキーボード入力の両方が行えるアプリケーションの場合、音声入力を開始するためには音声入力ボタンを、キー入力を開始するためにはキー入力ボタンを押すようにすればいいのだが、常に表示されるダイアログのようなものがなく、擬人化キャラクターを使用したインタフェース・エージェントを表示している場合、そのようなボタンを表示することはできない。そこで、キーボード等に音声入力開始、キーボード入力開始のコマンドを割り当てる方法が考えられるが、2つのキーを割り当てると利用者が混同してしまう虞れがある。
【0007】
次に、エージェントを表示して操作の説明を行う場合、操作の説明を開始するときにエージェントを表示し、説明が終了した時にエージェントを消去する場合は問題ないが、常にエージェントを表示している場合には、操作の説明がいつ終了したのか分かり辛いという問題がある。
【0008】
また、エージェントに操作説明を行わせる場合で、検索結果を表示するダイアログを用意せずエージェントだけのインタフェースにした場合、もう一度同じ説明を行わせるために、同じ要求文を入力して再度検索を行わせなければならないという問題がある。また、エージェントだけのインタフェースの場合、検索対象のモードや、音声入力時の音量レベル表示、キーボード入力時のエディットボックスがエージェントと関係なく画面上の特定の位置に表示されていたり、エージェントとは独立したウィンドウに表示されていると、利用者の目は常にエージェントに向いているので利用者には分かり辛いという問題がある。
【0009】
また、初めてオンデマンド・インタフェース装置を起動させた時に、利用者は何をしていいのか分からないという問題がある。
【0010】
本発明は、以上のような状況に鑑みてなされたもので、使い勝手を向上したオンデマンド・インタフェース装置の提供を目的としている。
【0011】
【課題を解決するための手段】
本発明はこうした従来技術における課題を解決するための手段を提供するもので、各請求項の発明は、以下の技術手段で構成される。
【0012】
請求項1の発明は、利用者が音声を入力するための音声入力手段と、音声入力手段から入力された音声を音声認識する音声認識手段と、検索対象であるデータベースと、音声認識手段で音声認識された結果を要求文として前記データベースの検索を行う検索手段と、検索手段の検索結果を出力するための出力手段と、出力手段に出力された結果の中から利用者が所望する結果を選択するための選択手段を備えたオンデマンド・インタフェース装置において、選択手段での選択結果あるいは何も選択しなかったことを記憶する記憶手段と、記憶手段に記憶された内容がn回連続していずれの選択結果も選択されなかった場合に音声入力手段の調整を行うことを利用者に勧める音声認識調整勧告手段、あるいは、前記音声入力手段による音声入力の方法の説明を前記出力手段に出力する音声入力方法説明表示手段、の少なくとも何れかを備えることを特徴としている。
【0036】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態を説明する。
【0037】
図1に、本発明による音声オンデマンド・インタフェース装置の一例の概略構成を示す。この音声オンデマンド・インタフェース装置は、検索要求文や利用者の指示を音声で入力するためのマイク等の音声入力手段1、検索要求文や利用者の指示を音声以外で入力するためのキーボード等の要求文入力手段2、音声入力手段1や要求文入力手段2で要求文の入力や利用者の指示を入力を開始することを制御手段5に知らせるための入力開始手段3、音声入力手段1で入力された音声の認識を行う音声認識手段4、音声オンデマンド・インタフェース装置の制御を行う制御手段5、出力手段7から出力された検索結果の中から利用者の所望の結果を選択するための選択手段6、音声入力手段1や要求文入力手段2から入力された要求文に対する機能DB8の検索結果や擬人化されたキャラクターであるエージェントの画像や音声を出力するためのディスプレイやスピーカ等の出力手段7、音声オンデマンド・インタフェース装置の搭載されている機器の説明を行うためのヘルプ説明文や操作手順を示したスクリプトが格納されている機能DB8、音声入力手段1や要求文入力手段2から入力された要求文に対する機能DB8の検索結果が0件だった時に出力手段7に出力するメッセージやエージェントの動作スクリプトが格納されている検索失敗応答DB9、制御手段5に指示を与えるためのコマンドが格納されているコマンドDB10からなる。
【0038】
音声入力手段1は選択手段6を兼ねてもよいし、要求文入力手段2は入力開始手段3と選択手段6を兼ねてもよい。また、機能DB8、検索失敗応答DB9、コマンドDB10は制御手段5に接続された外部記憶装置に格納されたものでもよく、分散型でもよく、ネットワーク上に存在するものでもよい。
【0039】
図2に、制御手段5の一例の概略構成を示す。この制御手段5は、機能DB8の検索を行うための検索手段11、検索手段11で検索された結果の中から利用者がどの結果を選択手段6によって選択したかを記憶する記憶手段12、記憶手段12を参照してn回以上連続して利用者がいずれの検索結果も選択しなかった時に音声認識手段4の音声認識の調整を利用者に勧めるための音声認識調整勧告手段13、検索手段11で検索を行った時の結果が0件だった時に検索失敗応答DB9の内容をランダムに出力手段7に出力する検索失敗出力手段14、検索手段11で検索を行った時の結果が0件だったことを記憶するための検索失敗回数記憶手段15、利用者の要求文や指示の入力のモードが音声入力であるかどうかを記憶する入力モード記憶手段16、機能DB8を検索手段11で検索した結果の中から利用者が選択手段6で選択した機能の実行を行う機能実行手段17、擬人化されたキャラクターであるエージェントを出力手段7に出力するエージェント出力手段18、エージェント出力手段18によって出力されているエージェントの画面上の位置を記憶するエージェント位置記憶手段19、エージェント出力手段18によって出力されているエージェントの位置を変更するエージェント位置復帰手段20、音声入力手段1や要求文入力手段2から入力された要求文がコマンドDB10に格納されているものと一致する時にコマンドの処理を行うコマンド処理手段21、出力手段7に出力されるメインウィンドウの移動に合わせて1つ以上のサブウィンドウの移動を行うサブウィンドウ移動手段22、一定時間毎に制御手段5に対して割込みを掛けるタイマ手段23、サブウィンドウ移動手段22によるサブウィンドウの移動を行うかどうかを各サブウィンドウ毎に設定を行うサブウィンドウ移動設定手段24、サブウィンドウ移動手段22によるサブウィンドウの表示を行うかどうかを各サブウィンドウ毎に設定を行うサブウィンドウ表示設定手段25、サブウィンドウ移動手段22によるサブウィンドウの移動によってサブウィンドウが出力手段7の画面上から外に出る時にそのサブウィンドウを画面内に表示されるようにその位置を補正するサブウィンドウ画面内表示位置補正手段26、サブウィンドウ移動手段22によるサブウィンドウの移動によってサブウィンドウがメインウィンドウと重なって出力手段7に表示される時にメインウィンドウとは重ならないように該当するサブウィンドウの位置を補正する対メインウィンドウサブウィンドウ位置補正手段27、サブウィンドウ移動手段22によるサブウィンドウの移動によってサブウィンドウ同士が出力手段7の画面上に重なって表示される時に各サブウィンドウ同士を重ならないように該当サブウィンドウの位置を補正するサブウィンドウ間位置補正手段28、サブウィンドウ移動手段22によるサブウィンドウの移動によってメインウィンドウと各サブウィンドウが重なる時にどのウィンドウを優先して上に表示するかの設定を行うウィンドウ表示優先順位設定手段29、ウィンドウ表示優先順位設定手段29の設定に従って出力手段7の画面上にメインウィンドウと各サブウィンドウの表示優先順位の変更を行うウィンドウ表示優先順位変更手段30、サブウィンドウ移動手段22によるサブウィンドウの移動によって出力手段7の画面上に表示されるメインウィンドウと各サブウィンドウの総表示面積を少なくするようにサブウィンドウの位置を補正する総表示面積減少用サブウィンドウ位置補正手段31、サブウィンドウ移動手段22によるサブウィンドウの移動によって出力手段7の画面上に表示される各サブウィンドウの総表示面積を少なくするようにサブウィンドウの位置を補正するサブウィンドウ表示面積減少用位置補正手段32、各サブウィンドウがメインウィンドウや各サブウィンドウ以外の他のウィンドウの下に隠れて表示されないように出力手段7の画面上に各サブウィンドウの表示を行うサブウィンドウ前面表示手段33、検索手段11で行われる検索のモードを出力手段7に出力するためのステータス出力手段34、音声入力手段1から入力されている音声の音量レベルを出力手段7に出力するための音声レベル出力手段35、要求文入力手段2で入力されている文字列の表示とカーソルの表示を行う要求文入力出力手段36、記憶手段12を参照してn回以上連続して利用者がいずれの検索結果も選択しなかった時に音声入力手段1による音声入力の方法の説明を出力手段7に出力するための音声入力方法説明表示手段37、音声入力手段1から一定時間以上入力がなかった時に出力手段7に入力を促すメッセージを出力する音声入力促進手段38からなる。
【0040】
図3に音声認識調整勧告手段13と検索失敗出力手段14の処理の流れ図の一例を示す。利用者は音声入力手段1から機能DB8を検索するための検索要求文を入力する(S1)。機能DB8の一例を図4に示す。機能名と機能説明文が検索対象文字列になり、操作手順の説明、アクションスクリプトは機能実行手段17、エージェント出力手段18によってエージェントによる操作の説明の時に使用される。機能の実行音声入力手段1で入力された音声は音声認識手段4によって文字列に変換される(S2)。この変換された文字列は制御手段5に送られ、制御手段5内の検索手段11によって機能DB8の検索を行う(S3)。ここでは、音声認識手段4による音声認識結果が「文書」だったとする。すると、検索手段11は機能DB8から検索を行い、出力手段7に
実行する機能を選択してください
1.プリント
2.セーブ
と検索結果を出力する(S5)。ここで、選択手段6によって利用者が「1」と入力した(S6)場合には、「プリント」の機能の実行を機能実行手段17、エージェント出力手段18で行い(S7)記憶手段12に実行を行ったことを記憶させ、「ありません」と答えたり(S6)、次の検索を実行した(S3)場合には記憶手段12に実行を行わなかったことを記憶させる。記憶手段12に記憶される内容は、
「センタリング」
「セーブ」
実行なし
のようになる。音声認識調整勧告手段13では、記憶手段12を監視していて、記憶手段12に連続してn回以上実行を行わなかったと記憶された時(S8)に出力手段7に音声認識手段4の調整を行った方がいいという勧告を利用者に対して行う(S11)。例えば、5回以上実行を行わなかった時に、
音声が正常に認識されていない可能性があります
音声認識エンジンのエンロールを行いますか?
と出力手段7に出力して、利用者に音声認識システムのエンロールを行うことを勧める。前述の手順で検索手段11で検索を行った時(S3)に、検索結果が0件だった時(S4)に、検索失敗応答DB9を参照して検索失敗出力手段14が出力手段7に検索が失敗した旨を出力する(S9)。検索失敗応答DB9の一例を図5に示す。この場合、検索結果が0件だった時には検索失敗出力手段14がこの中からランダムに応答文を選択して、
出力手段7に
声の調子が悪いの?
のように出力する。また、検索手段11は検索結果が件数の検索失敗回数記憶手段15にさせる(S3)。検索失敗回数記憶手段15に記憶される内容は
8件
10件
0件
のようになる。音声認識調整勧告手段13では、検索失敗回数記憶手段15を監視していて、検索失敗回数記憶手段15に連続してn回以上検索件数が0件だったと記憶された時(S10)に出力手段7に音声認識手段4の調整を行った方がいいという勧告を利用者に行う(S11)。例えば、5回以上連続して検索結果が0件だった時に、
音声が正常に認識されていない可能性があります
音声認識エンジンのエンロールを行いますか?
と出力手段7に出力して、利用者に音声認識システムのエンロールを行うことを勧める。
【0041】
次に、上記説明中の音声認識調整勧告手段13の代わりに音声入力方法説明表示手段37を使用することによって、連続してn回以上実行を行わなかった時や、連続してn回以上検索件数が0件だった時に音声入力手段1による音声入力の方法を利用者に説明する。例えば、5回以上連続して実行を行わなかった時に、
音声入力を行うには入力開始ボタンを押しながら、「文字を大きくしたい」のように喋って下さい
と出力手段7に出力して、利用者に音声認識の方法を説明する。音声入力方法説明表示手段37では、このように音声入力の方法を説明するだけでなく、機能DB8にどのような機能名の機能が含まれているのかを説明したり、機能DB8を実行した時の様子を表した見本画面の表示を行ったり、音声オンデマンド・インタフェース装置のヘルプを表示したりしてもよい。
【0042】
図6に本発明の他の処理の流れ図を示す。機能DB8の検索を行うために音声入力手段1あるいは要求文入力手段2から要求文を入力する必要があるが、その時点の入力モードが音声入力であるかどうかを入力モード記憶手段18に記憶しておく。要求文入力を開始する時に入力開始手段3に開始の合図を送り(S12)、入力モード記憶手段18に記憶されている入力モードを参照して(S13)、音声入力モードであれば音声入力手段1からの入力を開始し(S14)、音声入力モードでなければ要求文入力手段2からの入力を開始する(S15)。例えば、入力開始手段3として入力ボタンを用意しておき、音声入力モードになっていれば入力ボタンを押した時に音声入力が開始され、音声入力モードになっていなければ文字入力用のダイアログを出力手段7の画面上に表示するようにする。
【0043】
図7は、本発明の音声オンデマンド・インタフェース装置で機能の説明を行わせた時の様子の一例を示す。これは、機能DB8が図4のようであり、この中の「センタリング」を実行させた時の一例である。ここの記述されているアクションスクリプトに従って、機能実行手段17が機能の実行を、エージェント出力手段18が出力手段7へエージェントの出力を行う。この「センタリング」機能の場合は、センタリングする文字を選択するようにエージェントが説明してから、編集メニューのセンタリングを選択することをエージェントが移動しながらその場所を指し示して教えている。図8に本発明の処理の流れ図の他のを示す。まず、エージェント位置記憶手段19によって、出力手段7の画面上に表示されているエージェントの座標を記憶する(S16)。次に、上で説明した手順でエージェントが操作の説明を行う(S17)。そして、操作説明が終わった後にエージェント位置記憶手段19に記憶されている座標を参照してエージェント位置復帰手段20がエージェントを操作説明を行う前にいた位置にエージェントの座標を移動させる(S18)。図7の表示例で言えば、「センタリング」機能の説明(図7(b),(c))をした後エージェントは操作説明を行う前にいた位置(図7(a))戻ることになる。
【0044】
図9に本発明の他の処理の流れ図の例を示す。音声入力手段1あるいは要求文入力手段2から入力された要求文(S19)は、コマンド処理手段21に送られコマンドDB10に格納されているコマンドと一致するかを確認して(S20)、一致しなければ通常の検索処理を検索手段11で行い(S21)、一致する場合にはコマンド処理をコマンド処理手段21で行う(S22)。コマンドDB10の内容の一例を図10に示す。例えば、「もう一度」と入力した場合には、この入力はコマンドだと解釈され、予め決めれられたコマンド実行を行う。この場合は、直前に実行させた操作説明をもう一度行わせる。その他にも、直前に実行させた操作説明のヘルプを表示させたり、直前に実行させた操作説明をゆっくりともう一度実行させるコマンド等を実装することが考えられる。
【0045】
11に、本音声オンデマンド・インタフェース装置のエージェントと検索モード、音声レベル、要求文入力エディットボックスの出力手段7の画面への表示例を示す。(a)はエージェント出力手段18によるエージェントの単体表示、(b)はステータス出力手段34によって検索モードを同時に表示したもの、(c)は音声レベル出力手段35によって音声レベル表示をさらに行ったもの、(d)は(c)で音声レベル表示の代わりに要求文出力手段35によって要求文入力のためのエディットボックスを表示させた例である。本音声オンデマンド・インタフェース装置では、エージェントの位置を利用者が移動させたり、エージェントに操作説明をさせてエージェント自身が画面上を移動した時に、エージェント以外の関連ウィンドウも同時に移動される。その時の処理の流れを図12に示す。まず、タイマ手段23から割込みが掛かるまでは何もしない(S23)。例えば、この割込みの発生間隔は0.1秒とする。タイマ手段23による割込みが発生すると、最初に各サブウィンドウが表示されるものかどうかをサブウィンドウ表示設定手段25に格納されている設定に基づき表示するものであれば表示処理を、表示されないものであれば非表示にする(S24)。例えば、図11の(c)では要求文入力用エディットボックスは非表示になっているし、(d)では音声レベル表示が非表示になっている。
【0046】
次に、各サブウィンドウが移動されるものであるかどうかをサブウィンドウ移動設定手段24の格納されている設定に基づき移動するものであれば移動処理を、移動されないものであれば移動処理を行わない(S25)。例えば、図11の(b)で表示されている検索モードのようなステータス表示をエージェントに付随させて移動させることなく決まった位置に固定したい場合は、移動しない設定にしておく。次に、サブウィンドウ移動手段22がエージェントの現在の座標を調べ、サブウィンドウをエージェントの移動した先へ移動させる(S26)。例えば、図11の(e−1)のような状態でエージェントと検索モードを表すステータス表示が行われている時に、(e−2)のようにエージェントが移動すると、サブウィンドウ移動手段22はステータス表示を(e−3)のようにエージェントの移動先に移動させる。次に、サブウィンドウ画面内表示位置補正手段25が移動したサブウィンドウが画面外に隠れて表示されていないか確認して(S27)、画面外に隠れてしまった場合には画面内に移動させる(S31)。例えば、図11の(f−1)のようにステータス表示が移動してしまい画面の外に隠れてしまった場合に、(f−2)のようにステータス表示の位置を補正して画面内に表示されるようにする。次に、対メインウィンドウサブウィンドウ位置補正手段27が移動したサブウィンドウとエージェントが重なっているかを確認して(S28)、重なって表示されている場合にはサブウィンドウをエージェントと重ならないように表示する(S32)。例えば、図11の(f−2)のようにエージェントとステータス表示が重なって表示されている場合には、(f−3)のようにステータス表示をエージェントと重ならない位置に補正して表示されるようにする。
【0047】
エージェントとサブウィンドウが重なる時の別の処理方法として、ウィンドウ表示優先順変更手段30が移動したサブウィンドウとエージェントが重なっているかを確認して(S28)、重なって表示されている場合にはウィンドウ表示優先順位設定手段29に格納されているメインウィンドウとサブウィンドウの表示優先順位に従って各ウィンドウの表示の優先順位の決定を行う(S32)という方法もある。例えば、図11の(f−2)のようにエージェントとステータス表示が重なって表示されている場合で、ウィンドウ表示優先順位設定手段29にエージェントを優先して表示するように設定されている場合には、(f−4)のようにステータス表示をエージェントの下に隠れるように表示されるようにする。エージェントは利用者とのインタフェースになっているので通常は(f−4)のようにエージェントを優先して表示するが、エディットボックスから要求文を入力する時にエディットボックスがエージェントの下に隠れると入力がし辛くなるので、例えば(g−1)のようにエージェントとエディットボックスが重なる場合は、(g−2)のようにエディットボックスを優先して表示するように設定することもできる。次に、サブウィンドウ間位置補正手段28が移動しサブウィンドウ同士が重ならないかを確認して(S29)、重なる場合にはサブウィンドウ同士が重ならないようにサブウィンドウを移動させる(S33)。例えば、図11の(h−1)のようにステータス表示と音声レベル表示が重なっている場合は、(h−2)のようにステータス表示を移動させる。次に、サブウィンドウ最面表示手段33がサブウィンドウがエージェントや他のサブウィンドウ以外のウィンドウの下に隠れていないかを確認して(S30)、隠れている場合にはそのサブウィンドウを前面に表示するようにさせる(S34)。例えば、図11の(g−1)のように他のアプリケーションのウィンドウがステータス表示のウィンドウを隠してしまっている場合に、(g−2)のようにステータス表示のウィンドウを前面に表示して他のアプリケーションの下に隠れないようにする。そして、サブウィンドウ位置の補正が終わると再びタイマの割込みが発生するのを待つ(S23)。
【0048】
また、出力手段7の画面上に表示されるエージェントやサブウィンドウの表示が邪魔になった時には、総表示面積減少用サブウィンドウ位置補正手段31を使ってエージェントとサブィンドウの総表示面識を少なくしたり、サブウィンドウ表示面積減少用補正手段32を使ってサブウィンドウの総表示面積を少なくさせることができる。この処理の流れ図の一例を図13に示す。エージェントも含めてサブウィンドウの総表示面積を減少させる場合(S35でyes)には、エージェントと各サブウィンドウの左上の座標が同一になるようにサブウィンドウの位置を補正し(S36)、サブウィンドウだけの総表示面積を減少させる場合(S35でno)には各サブウィンドウの左上の座標が同一になるようにサブウィンドウの位置を補正する(S37)。例えば、図14の(a)のようにエージェントと各サブウィンドウが表示されている場合、総表示面積減少用サブウィンドウ位置補正手段31を使ってエージェントとサブィンドウの総表示面識を少なくする場合は(b)のようにサブウインドウとエージェントとサブウインドウを重ねて表示し、サブウィンドウ表示面積減少用補正手段32を使ってサブウィンドウの総表示面積を少なくさせる場合は(c)のようにサブウインドウ同士を重ねて表示する。
【0049】
15に音声入力促進手段38の処理の流れを示す。タイマ手段23を利用してタイマが発生した場合(S38)に、今までのタイマの累積カウント数を調べて一定時間以上の時間が経過しているかを調べ(S39)、時間が経過している場合にはタイマのカウント中に音声入力手段1から音声入力が行われたかどうかを調べ(S40)、もし音声入力が行われていなければ出力手段7から音声入力を行う旨のメッセージを出力する(S41)。例えば、音声オンデマンド・インタフェース装置を初めて起動させた時から50秒経っても音声入力が行われない場合に、音声入力を行うには入力開始ボタンを押しながら喋ります「文字を大きくしたい」のような質問を入力して下さいのようなメッセージを出力手段7に出力する。
【0050】
以上、ここまで挙げた実施形態における内容は、本発明の主旨を変えない限り、上記記載に限定されるものではない。
【0051】
【発明の効果】
本発明における情報処理装置では、以下のような効果が得られる。
【0052】
発明では、n回連続して検索結果を選択しなかった時に、音声認識の精度が悪く検索に失敗していると予想して利用者にエンロールを行うことを勧めること、あるいは、音声入力の仕方が悪く検索に失敗していると予想して利用者に音声入力の方法を説明することが可能になる。
【図面の簡単な説明】
【図1】 本発明の音声オンデマンド・インタフェース装置の一例の概略構成図である。
【図2】 制御手段5の一例の概略構成図である。
【図3】 音声認識調整勧告手段、検索失敗出力手段の処理の流れの一例を示す図である。
【図4】 機能DB8の内容の一例を示す図である。
【図5】 検索失敗応答DB9の内容の一例を示す図である。
【図6】 発明の処理の流れの一例を示す図である。
【図7】 本発明の音声オンデマンド・インタフェース装置で機能の説明を行わせた時の様子の一例を示す図である。
【図8】 発明の処理の流れの他の例を示す図である。
【図9】 発明の処理の流れの他の例を示す図である。
【図10】 コマンドDB10の内容の一例を示す図である。
【図11】 本発明の音声オンデマンド・インタフェース装置で表示させるエージェント、検索モード、音声レベル表示、要求文入力エディットボックスの表示方法の一例を示す図である。
【図12】 本発明の音声オンデマンド・インタフェース装置のサブウィンドウ位置補正処理の流れの一例を示す図である。
【図13】 表示されるウィンドウの総表示面積を減少させるための処理の流れ図の一例を示す図である。
【図14】 表示されるウィンドウの総表示面積を減少させるための処理を行った時の表示の一例を示す図である。
【図15】 本発明の音声オンデマンド・インタフェース装置の音声入力促進処理の流れの一例を示す図である。
【符号の説明】
1…音声入力手段、2…要求文入力手段、3…入力開始手段、4…音声認識手段、5…制御手段、6…選択手段、7…出力手段、8…機能DB、9…検索失敗応答DB、10…コマンドDB、11…検索手段、12…記憶手段、13…音声認識調整勧告手段、14…検索失敗出力手段、15…検索失敗回数記憶手段、16…入力モード記憶手段、17…機能実行手段、18…エージェント出力手段、19…エージェント位置記憶手段、20…エージェント位置復帰手段、21…コマンド処理手段、22…サブウィンドウ移動手段、23…タイマ手段、24…サブウィンドウ移動設定手段、25…サブウィンドウ表示設定手段、26…サブウィンドウ画面内表示位置補正手段、27…対メインウィンドウサブウィンドウ位置補正手段、28…サブウィンドウ間位置補正手段、29…ウィンドウ表示優先順位設定手段、30…ウィンドウ表示優先順位変更手段、31…総表示面積減少用サブウィンドウ位置補正手段、32…サブィンドウ表示面積減少用位置補正手段、33…サブウィンドウ前面表示手段、34…ステータス出力手段、35…音声レベル出力手段、36…要求文入力出力手段、37…音声入力方法説明表示手段、38…音声入力促進手段。

Claims (1)

  1. 利用者が音声を入力するための音声入力手段と、
    前記音声入力手段から入力された音声を音声認識する音声認識手段と、
    検索対象であるデータベースと、
    前記音声認識手段で音声認識された結果を要求文として前記データベースの検索を行う検索手段と、
    前記検索手段の検索結果を出力するための出力手段と、
    前記出力手段に出力された結果の中から利用者が所望する結果を選択するための選択手段を備えたオンデマンド・インタフェース装置において、
    前記選択手段での選択結果あるいは何も選択しなかったことを記憶する記憶手段と、
    前記記憶手段に記憶された内容がn回連続していずれの選択結果も選択されなかった場合に
    前記音声入力手段の調整を行うことを利用者に勧める音声認識調整勧告手段
    あるいは、
    前記音声入力手段による音声入力の方法の説明を前記出力手段に出力する
    音声入力方法説明表示手段、の少なくとも何れかを備える
    ことを特徴とするオンデマンド・インタフェース装置。
JP2000258418A 2000-08-29 2000-08-29 オンデマンド・インタフェース装置とそのウィンドウ表示装置 Expired - Fee Related JP3705735B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2000258418A JP3705735B2 (ja) 2000-08-29 2000-08-29 オンデマンド・インタフェース装置とそのウィンドウ表示装置
US09/906,858 US7028265B2 (en) 2000-08-29 2001-07-18 Window display system and method for a computer system
EP01117943A EP1184782A3 (en) 2000-08-29 2001-07-24 On-demand interface device and window display for the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000258418A JP3705735B2 (ja) 2000-08-29 2000-08-29 オンデマンド・インタフェース装置とそのウィンドウ表示装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005161194A Division JP2005327306A (ja) 2005-06-01 2005-06-01 オンデマンド・インタフェース装置とそのウィンドウ表示装置

Publications (2)

Publication Number Publication Date
JP2002073322A JP2002073322A (ja) 2002-03-12
JP3705735B2 true JP3705735B2 (ja) 2005-10-12

Family

ID=18746736

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000258418A Expired - Fee Related JP3705735B2 (ja) 2000-08-29 2000-08-29 オンデマンド・インタフェース装置とそのウィンドウ表示装置

Country Status (3)

Country Link
US (1) US7028265B2 (ja)
EP (1) EP1184782A3 (ja)
JP (1) JP3705735B2 (ja)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040030559A1 (en) * 2001-09-25 2004-02-12 Payne Michael J. Color as a visual cue in speech-enabled applications
US20030061054A1 (en) * 2001-09-25 2003-03-27 Payne Michael J. Speaker independent voice recognition (SIVR) using dynamic assignment of speech contexts, dynamic biasing, and multi-pass parsing
US20030061053A1 (en) * 2001-09-27 2003-03-27 Payne Michael J. Method and apparatus for processing inputs into a computing device
US20030065740A1 (en) * 2001-09-28 2003-04-03 Karl Allen Real-time access to health-related information across a network
US7324947B2 (en) 2001-10-03 2008-01-29 Promptu Systems Corporation Global speech user interface
US7099829B2 (en) * 2001-11-06 2006-08-29 International Business Machines Corporation Method of dynamically displaying speech recognition system information
US20030130875A1 (en) * 2002-01-04 2003-07-10 Hawash Maher M. Real-time prescription renewal transaction across a network
US20030130868A1 (en) * 2002-01-04 2003-07-10 Rohan Coelho Real-time prescription transaction with adjudication across a network
US6910911B2 (en) 2002-06-27 2005-06-28 Vocollect, Inc. Break-away electrical connector
US8260874B1 (en) * 2003-01-10 2012-09-04 Northwestern University Request initiated collateral content offering
CN1739086A (zh) * 2003-01-14 2006-02-22 皇家飞利浦电子股份有限公司 重排计算机屏幕上的视图
WO2004063923A1 (en) * 2003-01-15 2004-07-29 Koninklijke Philips Electronics N.V. Rearranging views on a computer screen
US20050010418A1 (en) * 2003-07-10 2005-01-13 Vocollect, Inc. Method and system for intelligent prompt control in a multimodal software application
US20050010892A1 (en) * 2003-07-11 2005-01-13 Vocollect, Inc. Method and system for integrating multi-modal data capture device inputs with multi-modal output capabilities
US20050091610A1 (en) * 2003-10-22 2005-04-28 International Business Machines Corporation Selective display of windows on an auxiliary output device
JP4012143B2 (ja) * 2003-12-16 2007-11-21 キヤノン株式会社 情報処理装置およびデータ入力方法
US7441204B2 (en) * 2004-02-06 2008-10-21 Microsoft Corporation Method and system for automatically displaying content of a window on a display that has changed orientation
US7620895B2 (en) * 2004-09-08 2009-11-17 Transcensus, Llc Systems and methods for teaching a person to interact with a computer program having a graphical user interface
US7643999B2 (en) * 2004-11-24 2010-01-05 Microsoft Corporation Microphone feedback and control
US20070180384A1 (en) * 2005-02-23 2007-08-02 Demetrio Aiello Method for selecting a list item and information or entertainment system, especially for motor vehicles
KR100644159B1 (ko) * 2005-09-05 2006-11-10 엔에이치엔(주) 검색 컨트롤러 제어 방법 및 그 장치
US20070106501A1 (en) * 2005-11-07 2007-05-10 General Electric Company System and method for subvocal interactions in radiology dictation and UI commands
US20070124507A1 (en) * 2005-11-28 2007-05-31 Sap Ag Systems and methods of processing annotations and multimodal user inputs
US7861159B2 (en) 2006-04-07 2010-12-28 Pp Associates, Lp Report generation with integrated quality management
US20070265929A1 (en) * 2006-04-26 2007-11-15 Michael Danninger Portal page personalization offering a direct manipulative window arrangement functionality
KR100699050B1 (ko) * 2006-06-30 2007-03-28 삼성전자주식회사 문자정보를 음성정보로 출력하는 이동통신 단말기 및 그방법
JP2008022493A (ja) * 2006-07-14 2008-01-31 Fujitsu Ltd 受付支援システムとそのプログラム
USD626949S1 (en) 2008-02-20 2010-11-09 Vocollect Healthcare Systems, Inc. Body-worn mobile device
US8156060B2 (en) * 2008-02-27 2012-04-10 Inteliwise Sp Z.O.O. Systems and methods for generating and implementing an interactive man-machine web interface based on natural language processing and avatar virtual agent based character
US8386261B2 (en) 2008-11-14 2013-02-26 Vocollect Healthcare Systems, Inc. Training/coaching system for a voice-enabled work environment
CN102439544A (zh) * 2009-03-20 2012-05-02 谷歌股份有限公司 与输入法编辑器计算设备的交互
US8659397B2 (en) 2010-07-22 2014-02-25 Vocollect, Inc. Method and system for correctly identifying specific RFID tags
USD643400S1 (en) 2010-08-19 2011-08-16 Vocollect Healthcare Systems, Inc. Body-worn mobile device
USD643013S1 (en) 2010-08-20 2011-08-09 Vocollect Healthcare Systems, Inc. Body-worn mobile device
US9600135B2 (en) 2010-09-10 2017-03-21 Vocollect, Inc. Multimodal user notification system to assist in data capture
JP5998861B2 (ja) * 2012-11-08 2016-09-28 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
CN102968992B (zh) * 2012-11-26 2014-11-05 北京奇虎科技有限公司 用于浏览器的语音识别处理方法和浏览器
CN104240707A (zh) * 2012-11-26 2014-12-24 北京奇虎科技有限公司 用于浏览器的语音识别处理方法和浏览器
US9280981B2 (en) 2013-02-27 2016-03-08 Blackberry Limited Method and apparatus for voice control of a mobile device
JP6312053B2 (ja) * 2013-09-06 2018-04-18 株式会社ユピテル システム及びプログラム
US11132173B1 (en) * 2014-02-20 2021-09-28 Amazon Technologies, Inc. Network scheduling of stimulus-based actions
US10726197B2 (en) * 2015-03-26 2020-07-28 Lenovo (Singapore) Pte. Ltd. Text correction using a second input
US10845956B2 (en) 2017-05-31 2020-11-24 Snap Inc. Methods and systems for voice driven dynamic menus
CN108108391A (zh) * 2017-11-21 2018-06-01 众安信息技术服务有限公司 用于数据可视化的信息的处理方法以及装置
US20200135189A1 (en) * 2018-10-25 2020-04-30 Toshiba Tec Kabushiki Kaisha System and method for integrated printing of voice assistant search results
KR20200109467A (ko) 2019-03-13 2020-09-23 삼성전자주식회사 전자 장치 및 그 제어 방법
JP7448350B2 (ja) * 2019-12-18 2024-03-12 トヨタ自動車株式会社 エージェント装置、エージェントシステム、及びエージェントプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU1258195A (en) * 1993-11-17 1995-06-06 Collegeview Method and apparatus for displaying three-dimensional animated characters upon a computer monitor's screen
US5838318A (en) * 1995-11-10 1998-11-17 Intel Corporation Method and apparatus for automatically and intelligently arranging windows on a display device
JPH1055372A (ja) 1996-05-14 1998-02-24 Sharp Corp オンデマンド・インターフェース装置及びコンピュータ読み取り可能な記録媒体
US5808610A (en) * 1996-08-28 1998-09-15 Macromedia, Inc. Method and system of docking panels
US5760772A (en) * 1996-08-30 1998-06-02 Novell, Inc. Method for automatically resizing a child window
US6054985A (en) * 1997-01-27 2000-04-25 International Business Machines Corporation Data processing system and method for simulating compound objects
US6094476A (en) * 1997-03-24 2000-07-25 Octel Communications Corporation Speech-responsive voice messaging system and method
US5977973A (en) * 1997-05-14 1999-11-02 Microsoft Corporation Window linking
EP0895396A3 (en) * 1997-07-03 2004-01-14 Texas Instruments Incorporated Spoken dialogue system for information access
JP2000207085A (ja) 1998-11-09 2000-07-28 Sharp Corp オンデマンド・インタ―フェ―ス装置及びコンピュ―タ読み取り可能な記録媒体
US6654036B1 (en) * 2000-06-05 2003-11-25 International Business Machines Corporation Method, article of manufacture and apparatus for controlling relative positioning of objects in a windows environment

Also Published As

Publication number Publication date
US20020026320A1 (en) 2002-02-28
JP2002073322A (ja) 2002-03-12
EP1184782A2 (en) 2002-03-06
EP1184782A3 (en) 2007-08-29
US7028265B2 (en) 2006-04-11

Similar Documents

Publication Publication Date Title
JP3705735B2 (ja) オンデマンド・インタフェース装置とそのウィンドウ表示装置
US8380509B2 (en) Synchronise an audio cursor and a text cursor during editing
JP5366955B2 (ja) ユーザインタフェース生成装置
EP1544719A2 (en) Information processing apparatus and input method
KR100549482B1 (ko) 정보 처리 장치, 정보처리 방법, 및 프로그램을 기억하는 컴퓨터 판독가능 기억 매체
JP2004529381A (ja) 認識音声に対する同期再生中の文字編集
US20080162143A1 (en) System and methods for prompting user speech in multimodal devices
JP2006061679A (ja) 医療用超音波装置でヘルプ情報を提供するための装置及び方法
JP2005327306A (ja) オンデマンド・インタフェース装置とそのウィンドウ表示装置
JP2005327306A5 (ja)
JP3088399B2 (ja) 文書データ音声合成方式
JP2007004575A (ja) 表示処理方法、表示処理プログラムおよびマークアップ言語処理装置
JPH09282137A (ja) 文章読み上げ装置
JP7298958B1 (ja) 外国語動詞学習支援装置及び外国語動詞学習支援プログラム
JP3021983B2 (ja) 文書作成装置
JP5057764B2 (ja) 音声合成装置及び音声合成プログラム
JP3271386B2 (ja) 入力制御装置
JP2010026963A (ja) スケジュール管理装置およびスケジュール管理プログラム
JPH045703A (ja) シーケンスプログラム作成装置
JP6296121B2 (ja) エミュレータ装置、プログラム及び表示方法
JP6459920B2 (ja) 情報表示装置、情報表示プログラム及び音声出力方法
JP2576371B2 (ja) ジャンプ信号名付与方法
JPH1152983A (ja) 音声認識装置
JP2002007015A (ja) 情報処理装置およびコンピュータ読み取り可能な記憶媒体
JP2006133296A (ja) 音声対話装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041001

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050726

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050726

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080805

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090805

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090805

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100805

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110805

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110805

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120805

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120805

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130805

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees