JP2002278587A - 音声認識入力装置 - Google Patents

音声認識入力装置

Info

Publication number
JP2002278587A
JP2002278587A JP2001072937A JP2001072937A JP2002278587A JP 2002278587 A JP2002278587 A JP 2002278587A JP 2001072937 A JP2001072937 A JP 2001072937A JP 2001072937 A JP2001072937 A JP 2001072937A JP 2002278587 A JP2002278587 A JP 2002278587A
Authority
JP
Japan
Prior art keywords
display
screen
input
voice recognition
highlighting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001072937A
Other languages
English (en)
Inventor
Chiharu Kawai
千晴 河合
Hiroshi Katayama
浩 片山
Takehiro Nakai
丈裕 中井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001072937A priority Critical patent/JP2002278587A/ja
Publication of JP2002278587A publication Critical patent/JP2002278587A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 複数の入力選択項目に対応させて異なる種類
の表示形態で各入力選択項目を表示し、発声された表示
形態の種類を音声認識して入力項目を選択する音声認識
入力装置に関し、オリジナルの表示画面のデザインを損
なうことなく、音声認識対象の入力選択項目を表示す
る。 【解決手段】 リンク先情報等の音声認識対象の入力項
目を含むWebページ等のオリジナル画面は画面生成回
路1−2により生成され、表示装置1−6に表示され
る。操作者は音声認識対象の項目を確認するときだけ、
シフトボタン1−1を押すと、画面切り替え回路1−5
は、オリジナル画面を、音声認識対象の入力項目を強調
表示した強調表示画面に切り替えて表示装置1−6に送
出する。強調表示画面は、認識対象抽出回路1−3、強
調表示リストテーブル1−11、変換テーブル生成回路
1−10、強調表示画面生成回路1−4の協働によって
生成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識入力装置
に関し、表示画面に複数の選択可能な入力項目を表示す
ると共に、該入力項目の各々を種類の異なる表示形態で
表示し、該複数の入力項目の表示形態から、操作者が選
択して発声した一つの種類の表示形態を音声認識し、該
音声認識した表示形態の種類に対応する入力項目を出力
する音声認識入力装置に関する。
【0002】
【従来の技術】図32に特許第3038261号公報等
に開示された従来の音声認識入力装置を示す。従来の音
声認識入力装置は、同図の(a)に示すように、音声認
識装置32−1、制御回路32−2、表示器32−3、
被制御機器32−4、マイクロホン32−5、及び記号
イメージ動作命令変換回路32−6を備える。
【0003】音声認識入力装置は、ラジオ、エアコンデ
ィショナ、カセットテープレコーダ、コンパクトディス
クプレーヤ、ナビゲーション機器等の各種電気機器又は
電子機器である被制御機器32−4の機能選択子を表示
器32−3に表示し、該機能選択子の表示形態(記号イ
メージ)の種類と、該機能選択子が示す動作指令とを対
応させてイメージ動作命令変換回路32−6内の記憶手
段に記憶する。
【0004】被制御機器32−4の操作者は、表示器3
2−3に表示された機能選択子の表示形態の種類を音声
により発声し、音声認識装置32−1は該発生を音声認
識して表示形態の種類に対応した記号イメージコードに
変換する。該記号イメージコードは、記号イメージ動作
命令変換回路32−6内の前記記憶手段によって対応付
けられた動作命令コードに変換され、該動作命令コード
が制御回路32−2に送出される。制御回路32−2
は、該動作命令コードに従って、被制御機器32−4を
制御し動作させる。
【0005】例として、カセットテープレコーダの操作
について説明する。記号イメージ動作命令変換回路32
−6は、図32の(b)に示すような変換テーブルを備
え、記号イメージと動作命令と対応付けたリストを保持
する。そして、表示器32−3は、この対応付けに従っ
て『巻き戻し』の文字列を赤色、『再生』の文字列を青
色、…、『スキップ』の文字列を茶色で表示する。
【0006】今、操作者がカセットテープレコーダを再
生動作させたい場合、操作者は『再生』の文字列が青色
で表示されているを見て、「アオ」と発声する。音声認
識装置32−1は、この発声「アオ」を認識し、『青』
の記号イメージコードを記号イメージ動作命令変換回路
32−6に送出する。記号イメージ動作命令変換回路3
2−6は、変換テーブルを参照して『青』の記号イメー
ジコードを『再生』の動作命令コードに変換し、制御回
路32−2に送出する。制御回路32−2は、『再生』
の動作命令コードの入力により、被制御機器32−4
(カセットテープレコーダ)に対して『再生』動作を行
うように制御する。
【0007】操作者が表示器32−3の入力選択項目を
見て動作命令を発声し、該動作命令を音声認識して入力
する装置の場合、操作者は表示器32−3に表示された
入力選択項目の文字列を読み取り、該文字列の呼称を発
生しなければならないが、該文字列の表示形態に係る色
彩等の記号イメージは、一見しただけで容易に判別する
ことができ、該記号イメージの発声により、直感的かつ
簡単に被制御機器32−4に対する機能選択の入力を容
易に行うことができる。
【0008】また、被制御機器32−4としてカセット
テープレコーダ以外に適用されるラジオやエアコン等の
他の機器に対して、その操作や機能選択等の発声を音声
認識により入力する場合、機器の種類によって動作命令
が異なるので、動作命令を音声認識して入力する装置で
は各機器毎の固有の動作命令を識別しなければならない
が、記号イメージと動作命令と対応付けておき、記号イ
メージの発声を音声認識によって識別することにより、
記号イメージと動作命令とを対応付ける変換テーブルを
入れ替えるだけで、各種の被制御機器に対応することが
できるようになり、音声認識装置32−1は、各機器固
有の動作命令の呼称を音声認識する必要がなく、各機器
に共通の記号イメージの音声を認識すればよいので、認
識すべき語彙を大幅に減少させることができる。
【0009】記号イメージとしては前述の色彩の外に、
動作命令の文字列の前又は後ろに四角形や円形等の図形
的な記号イメージを表示し、該図形の特徴を発声するよ
うにしてもよく、また、動作命令の文字列を表示画面内
の上、中、下、左、右の何れかの位置に配置し、該配置
位置(「ミギ」、「ウエ」など)を発声することとして
もよい。その外、従来の音声認識入力装置として、同様
の技術のものが特開平5−313691号公報等に開示
されている。
【0010】
【発明が解決しようとする課題】前述したような従来の
音声認識入力装置を用い、リンク先情報を含むWebペ
ージ画面等に対して、リンク先情報に記号イメージを対
応付けて表示し、該記号イメージの発声を音声認識して
該リンク先のWebページ画面ヘ切り替えるような場
合、以下に述べるような問題が生じる。
【0011】一般にWebページ画面は、多様多彩なカ
ラー表示画面で構成されるため、記号イメージの表示形
態として色彩を使用することが困難となる。例えば、記
号イメージの種類の一つとして『赤』を使用した場合、
Webページ画面上の他の部分に『赤』で表示された部
分が有ると、それがリンク先情報であるのか、元々のW
ebページ画面のデザインとして『赤』で表現されてい
る部分なのかを区別することができない。
【0012】また、Webページ画面で使われてない色
彩を記号イメージに割り当てるようにしたとしても、記
号イメージに割り当て得る色彩が非常に制限され、ま
た、操作者はどの色彩が記号イメージに割り当てられて
いるのかを分別することができず、更に、表示画面がオ
リジナルのWebページ画面と異なるデザインのものと
なってしまうなどの問題が生じる。
【0013】逆に、記号イメージに割り当てる色彩を固
定し、記号イメージと同じ色彩は使わずにWebページ
画面を表示するようにした場合、記号イメージに割り当
てる色彩の制約はなくなり、どの色彩が記号イメージに
割り当てられているかは、操作者にも分かるようになる
が、やはり、表示されたWebページ画面はオリジナル
のWebページ画面のデザインと異なったものとなって
しまう。また、記号イメージとして図形的な特徴や配置
位置を用いたとしても、同様にオリジナルのWebペー
ジ画面と異なったものとなってしまうという問題が生じ
る。
【0014】本発明は、複数の入力選択項目に対応させ
て異なる種類の表示形態で各入力選択項目を表示し、操
作者は該当する入力項目の表示形態の種類を発声し、該
発声された表示形態の種類を音声認識により識別して入
力項目を選択する音声認識入力装置において、オリジナ
ルの表示画面のデザインを損なうことなく表示し、か
つ、音声によって入力し得る音声認識対象項目を、種類
の異なる表示形態で表示し、該表示形態の種類の発声に
より選択項目を入力し得る音声認識入力装置を提供する
ことを目的とする。
【0015】
【課題を解決するための手段】本発明の音声認識入力装
置は、(1)音声認識対象の入力項目を含む画面を表示
する表示手段と、該入力項目の表示形態の種類を特定す
る音声信号を認識する音声認識手段と、該入力項目の表
示形態の種類と入力項目との対応を記憶する記憶手段と
を備え、入力項目の表示形態の種類を特定する音声を認
識して、該表示形態の種類に対応した入力項目を出力す
る音声認識入力装置において、前記表示手段は、前記音
声認識対象の入力項目を含む元々の画面と、前記音声認
識対象の入力項目を強調して表示した強調表示画面と
を、スイッチのオン/オフ操作に応じて切り替えて表示
する手段を備えたものである。
【0016】また、(2)前記強調表示の種類として、
表示形態の類型の異なる複数の種類を用い、該類型の異
なる複数の種類の表示形態を組み合わせて、前記音声認
識対象の入力項目を強調表示した強調表示画面を生成す
る手段を備えたものである。また、(3)前記音声認識
手段は、前記スイッチの操作に応じて強調表示画面を表
示している期間にのみ入力される音声信号を認識するこ
とを特徴とするものである。
【0017】また、(4)各音声認識対象の入力項目を
複数のグループに分割し、前記スイッチの操作回数に応
じて1つのグループを特定し、該特定されたグループに
属する音声認識対象の入力項目だけを強調表示した強調
表示画面を生成する手段を備えたものである。また、
(5)各音声認識対象の入力項目を、その使用頻度を基
にグループに分割したものである。
【0018】
【発明の実施の形態】図1に発明の音声認識入力装置を
示す。以下、リンク先情報を含むWebページ画面上の
表示項目の中から、記号イメージに対応付けて表示した
リンク先情報を選択して入力するの発明の表示形態をに
ついて説明する。操作者は所望のリンク先情報の記号イ
メージの表示形態を発声することにより、所望のリンク
先Webページ画面へ表示画面を切り替えることができ
る。
【0019】図1に示す発明の音声認識入力装置は、シ
フトボタン1−1のスイッチオン/オフ操作により画面
切り替え回路1−5を制御し、表示装置1−6で表示さ
れるオリジナルWebページ画面と音声認識対象の表示
項目を強調した画面(以下、「強調表示画面」とい
う。)とを切り替える。
【0020】強調表示画面では、音声認識対象の表示項
目を記号イメージとして強調して表示し、それ以外の部
分を非強調表示とすることで、操作者が一目で音声認識
対象の表示項目を判別できるようにしたものである。操
作者は、画面切り替え等の指令の入力のために、音声に
より入力可能な項目の表示が必要となった場合のみ、シ
フトボタン1−1を操作して強調表示画面に切り替え、
通常はオリジナルのWebページ画面を見ることができ
る。
【0021】画面生成回路1−2はインターネットに接
続され、Webページ画面の構成情報を収集し、該画面
構成情報を、認識対象抽出回路1−3、強調表示画面生
成回路1−4、画面切り替え回路1−5に送出する。画
面構成情報は主にHTML型式の言語で記述され、表示
する文字や画像の情報と共に、それらを画面上のどの位
置に表示するかの情報も含んでいる。また、多くの場
合、他のWebページ画面へのリンク先情報も含んでい
る。
【0022】これら元々のWebページ画面の構成情報
を、オリジナル画面の構成情報と呼ぶことにする。認識
対象抽出回路1−3は、オリジナル画面の構成情報か
ら、認識対象となるリンク先情報のみを抽出し、該リン
ク先情報を変換テーブル生成回路1−10にリンク先リ
ストとして送出する。強調表示リストテーブル1−11
は、強調表示の種類をリストにした強調表示リストを記
憶保持する。変換テーブル生成回路1−10は、前記リ
ンク先リストと強調表示リストとを一対一に対応付けた
変換テーブルを生成する。
【0023】強調表示画面生成回路1−4は、オリジナ
ル画面の構成情報を非強調表示し、リンク先情報の部分
を強調表示した画面に変換する。リンク先情報の部分
は、強調表示変換テーブルに基づいて強調表示に変換す
る。この画面情報を強調表示画面の構成情報と呼ぶこと
とする。
【0024】画面切り替え回路1−5は、シフトボタン
1−1が押されていないときはオリジナル画面の構成情
報を出力し、シフトボタン1−1が押されているときは
強調表示画面の構成情報を表示装置1−6に出力する。
表示装置1−6は、画面切り替え回路1−5から入力さ
れた画面構成情報に応じてWebページ画面を表示す
る。
【0025】シフトボタン1−1が押されていない場
合、オリジナル画面が表示され、シフトボタン1−1が
押された場合、強調表示画面が表示される。操作者は、
シフトボタン1−1を押して所望のリンク先情報の強調
表示形態の種類を把握し、マイクロフォン1−7に向か
って該強調表示形態の種類を発声する。
【0026】操作者が発声した強調表示形態の種類は、
音声認識装置1−8で認識され、該認識結果は強調表示
/認識対象変換回路1−9に送出される。強調表示/認
識対象変換回路1−9は変換テーブルを基に、音声認識
された強調表示形態の種類をリンク先情報に変換し、該
リンク先情報を画面生成回路1−2に送出する。画面生
成回路1−2は、リンク先情報に従って切り替えたリン
ク先Webページ画面を生成する。
【0027】通常、操作者はシフトボタン1−1を操作
せずにオフとしたままにしてオリジナル画面を見ること
ができる。リンク先のWebページ画面へ切り替えたい
場合、操作者はシフトボタン1−1を操作してオンとす
ることにより、リンク先情報の強調表示形態の種類を調
べ、その種類を発声することでWebページ画面を切り
替えることができる。リンク先情報以外は非強調表示と
なっているため、容易に強調表示の種類を識別すること
ができる。
【0028】画面の切り替えについて、シフトボタン1
−1のオン/オフ操作以外に切替を指示し得る入力手段
であれば他の手段であってもよい。例えば、パーソナル
コンピュータを利用している場合、マウスボタンやキー
ボードの特定のキースイッチのオン/オフ操作で行うよ
うにしてもよい。また、シフトボタン又はマウスボタン
等を押す度に、オリジナル画面と強調表示画面とを交互
に切り替える構成としてもよい。
【0029】更に、画面切り替え回路1−5にタイマー
を内臓し、シフトボタン又はマウスボタン等が操作され
てから所定時間だけ強調表示画面に切り替える構成とす
ることも可能であり、また、音声認識装置1−8におい
て所定のキーワードを受け付けた時だけ、強調表示画面
に切り替える構成とすることもできる。例えば、前述の
タイマー内蔵の構成例と組み合わせて、音声認識装置1
−8が『センタク』という発声を認識した時に1秒間だ
け強調表示画面を表示する構成も容易に実施することが
できる。
【0030】図2に色彩による強調表示の変換テーブル
生成の具体例を示す。同図は色彩による強調表示を行う
例を示している。画面生成回路1−2により、例えば図
2(a)に示すようなWebページ画面が生成される。
この中でリンク先情報は『経済産業省』、『国土交通
省』、『環境省』、『農林水産省』の4つであるとす
る。図2(a)はWebページ画面をイメージで表示し
ているが、画面生成回路1−2は、実際はHTML等の
言語で記述されたオリジナル画面の構成情報を出力す
る。
【0031】認識対象抽出回路1−3は、オリジナル画
面の構成情報から音声認識対象であるリンク先情報を抽
出し、図2(b)に示すようなリンク先リストを変換テ
ーブル生成回路1−10に出力する。HTMLの言語で
はリンク先情報であることを示す特殊な情報が付加され
ており、専用のプログラムを用いてリンク先情報を容易
に抽出することができる。
【0032】強調表示リストは強調表示の種類のリスト
を格納し、図2(c)に示すように、強調表示の種類は
『赤』、『青』、『緑』、『黄』の4種類である。変換
テーブル生成回路1−10は、リンク先リスト及び強調
表示リストの各要素をそれぞれ一対一に対応付け、『経
済産業省』は『赤』、『国土交通省』は『青』、『環境
省』は『緑』、『農林水産省』は『黄』に対応付けた図
2(d)に示すような変換テーブルを生成する。
【0033】強調表示画面生成回路1−4は、リンク先
情報以外のオリジナル画面の構成情報を非強調表示した
ものに変換する。非強調表示の第1の手法としては、輝
度を落とすことにより非強調表示にすることができる。
色彩は赤、青、緑の3色の組み合わせによって表示さ
れ、各色彩は明るさの情報(即ち輝度)を有している。
輝度が高いほど明るく、輝度が低いほど暗くなる。
【0034】図3に輝度低下による非強調表示画面の輝
度変化を示す。同図の左側はオリジナル画面を示し、同
図の右側は非強調表示画面を示し、オリジナル画面の
『白色』及び『黄緑色』の変化例を示している。『白
色』は赤、青、緑の3色の輝度が一様に高い。『黄緑
色』は緑の輝度が高く、続いて赤の輝度が高く、青の輝
度は低い。図3の例では、オリジナル画面の各3色の輝
度に対して、係数0.25を掛けて輝度を下げて非強調
表示画面とし、『白色』は『灰色』に、『黄緑色』は
『暗い黄緑色』に変換される。
【0035】図4はオリジナル画面の輝度を落とした強
調表示画面の例を示す。同図の(a)はオリジナル画面
を示し、同図の(b)は強調表示画面を示す。強調表示
画面のリンク先情報は、同図(c)の変換テーブルによ
って指示される色彩に置き換えられて表示される。同図
(c)の変換テーブルによれば、『経済産業省』は赤
色、『国土交通省』は青色、『環境省』は緑色、『農林
水産省』は黄色で表示される。リンク先情報以外の画面
構成情報は暗い色彩で表示され、リンク先情報は明るい
色彩で表示されるため、操作者は『明るい色彩=リンク
先情報』として容易に判別することができる。
【0036】画面切り替え回路1−5は、表示装置1−
6に送出する画面構成情報を、シフトボタン1−1のオ
ン/オフ操作に応じて、強調表示画面又はオリジナル画
面の何れかに切り替える。操作者は例えば、『国土交通
省』を選択する場合、シフトボタン1−1を押してリン
ク先情報の色彩を確認する。図4の場合、『国土交通
省』は『青』で表示されるので、「アオ」と発声する。
操作者の発声は、マイクロフォン1−7を通して音声認
識装置1−8に送られる。
【0037】音声認識装置1−8は、認識結果「アオ」
を強調表示/認識対象変換回路1−9に送る。強調表示
/認識対象変換回路1−9は、変換テーブルを基に音声
認識装置1−8からの出力「アオ」を『国土交通省』に
変換し、画面生成回路1−2に送る。画面生成回路1−
2では、『国土交通省』のWebページ画面を生成す
る。
【0038】非強調表示の第2の手法として、リンク先
情報以外の画面構成部分をモノクロ表示とすることがで
きる。図5にモノクロ表示する非強調表示画面の輝度の
変化を示す。同図の左側はオリジナル画面を示し、同図
の右側は非強調表示画面を示す。モノクロ表示は、オリ
ジナル画面の各構成情報の赤、青、緑の3色の輝度を平
均化した輝度(3色の輝度を加算して3で割ったもの)
を、3色共通の輝度とする。非強調表示の部分は、黒
色、灰色又は白色のモノクロで表示され、強調表示の種
類としてカラーを使うことにより、操作者は容易に音声
認識情報を判別することができる。
【0039】強調表示/非強調表示の組み合わせとし
て、変換テーブルに従ってリンク先情報の色彩を変化さ
せた上で、リンク先情報のみを点滅表示させ、リンク先
情報以外は非点滅表示とすることも可能である。リンク
先情報とそれ以外の画面構成情報とが、同一の色彩で表
示されるケースが生じるが、リンク先情報の部分は点滅
表示されるので操作者は容易に判別することができる。
【0040】図6は点滅表示による強調表示画面の例を
示す。同図の(a)はオリジナル画面を示し、同図の
(b)は強調表示画面を示す。同図に示す例の場合、強
調表示画面のリンク先情報の『経済産業省』は、表題の
『再編後の中央省庁』と共に赤色で表示されるが、リン
ク先情報である『経済産業省』の部分のみ点滅表示され
るため、『経済産業省』はリンク先情報、『再編後の中
央省庁』はリンク先以外であると判別される。
【0041】Webページ画面の場合、画面の一部を点
滅表示させたり、アニメーション(動画)化させたりす
る指示も容易に可能である。非強調表示では、Webペ
ージ画面の構成情報に対して、認識対象抽出回路1−3
で抽出した構成情報以外の点滅指示の部分を非点滅に書
き換え、アニメーション部分を固定イメージに置き換る
等の処理を行う。アニメーションは複数のイメージを所
定時間毎に切り替えることにより実現され、特定のイメ
ージのみを抜き出して固定イメージとするか、又はシス
テムで予め用意しておいたイメージを固定イメージとし
て使用することも容易に実施可能である。
【0042】図7は他の強調表示の手法として、記号の
向きで強調表示の種類を表す実施形態の変換テーブル生
成例を示す。強調表示リストテーブル1−11は強調表
示の種類として図7の(c)に示すように『右』、
『左』、『上』、『下』の4種類を強調表示リストとし
て格納する。変換テーブル生成回路1−10は、同図
(d)に示すように、リンク先リスト(b)と強調表示
リスト(c)の各要素を一対一に対応付けた変換テーブ
ルを生成する。強調表示画面生成回路1−4は、オリジ
ナル画面の構成情報を非強調表示し、リンク先情報を強
調表示した画面に変換する。
【0043】非強調表示の手法としては前述の手法の外
に第3の手法として、画面の背景の模様を無地にする手
法を用いることができる。HTMLの言語は背景の表示
についての情報を含んでおり、この情報を無地のものに
書き換えることにより、非強調表示とすることができ
る。リンク先情報の背景は、変換テーブルに示される
『右』、『左』、『上』、『下』の記号を連想させる記
号イメージの模様とする。この記号イメージとして、
右、左、上、下の向きに『>』等の先端の向きを合わせ
た模様を用い、この模様の向きにより強調表示の種類を
区別させることができる。
【0044】図8に背景の模様による強調表示画面の例
を示す。同図の(a)はオリジナル画面を示し、同図の
(b)は強調表示画面を示す。同図(c)の変換テーブ
ルの対応付けにより、強調表示画面のリンク先情報の
『経済産業省』は『右』向きを示す『>』の背景模様
で、『国土交通省』は『左』向きを示す『<』の背景模
様で、『環境省』は『上』向きを示す『∧』の背景模様
で、『農林水産省』は『下』向きを示す『∨』の背景模
様を表示する。リンク先情報以外の画面構成情報は無地
の背景模様で表示し、操作者は上下左右の何れかを示す
背景模様を見てリンク先情報を容易に識別することがで
きる。
【0045】操作者は例えば『国土交通省』を選択する
場合、シフトボタン1−1を押し、リンク先情報の背景
模様を確認する。図8の場合、『国土交通省』は『左』
向きを示す『<』の背景模様が表示されていることを確
認し、「ヒダリ」と発声する。操作者の発声は、マイク
ロフォン1−7を通して音声認識装置1−8に送られ
る。
【0046】音声認識装置1−8は、認識結果「ヒダ
リ」を強調表示/認識対象変換回路1−9に送る。強調
表示/認識対象変換回路1−9は、変換テーブルを基に
音声認識装置1−8からの出力「ヒダリ」を『国土交通
省』に変換し、画面生成回路1−2に送る。画面生成回
路1−2は、『国土交通省』のWebページ画面を生成
する。
【0047】図8の実施形態では、上下左右の向きの何
れかを示す記号を背景模様にし、該記号の向きを変えて
強調表示の種類を示しているが、各強調表示の種類を個
別に定めた背景模様とすることもできる。例えば、強調
表示の種類としてトランプカードのハート形、ダイヤ
形、スペード形、クラブ形等の背景模様とすることもで
きる。この場合でも、非強調表示は前述のように背景の
輝度を落とす、又は背景をモノクロにする等の手法を適
用することができる。
【0048】更に、音声認識対象となる選択項目が多数
有る場合、一つの認識対象を種類の異なる複数の強調表
示の組み合わせで表示することにより、認識対象の数が
強調表示の種類より多い場合でも、強調表示が可能とな
る。図9に複数の強調表示の組み合わせを用いた本発明
の第1の実施形態を示す。
【0049】この実施形態は、第1及び第2の強調表示
リストテーブル9−1,9−2を備える。変換テーブル
生成回路1−10は、第1及び第2の強調表示リストテ
ーブル9−1,9−2の組み合わせとリンク先リストと
を対応付けた変換テーブルを生成する。
【0050】対応付けの手法としては、2種類の強調表
示リストテーブル9−1,9−2の組み合わせを生成
し、該組合せを順にリンク先リストの各項目に割り当て
ればよい。2種類の強調表示として、『色彩』と『背景
模様』とを用いた変換テーブルの構成例を図10に示
す。図10(d)の変換テーブルは、『色彩』の種類を
記憶保持した同図(a)の第1の強調表示リストと、
『背景模様』の種類を記憶保持した同図(b)の第2の
強調表示リストとを組み合わせて生成した記号の組を、
同図(c)のリンク先リストの各項目に順に割り当てて
生成される。
【0051】この変換テーブルに基づいて、強調表示画
面生成回路1−4はオリジナル画面の構成情報を非強調
表示し、リンク先情報を強調表示したものに変換する。
この場合、リンク先情報以外の画面構成情報をモノクロ
化し、背景を無地で表示するものとする。図10に示す
例において、操作者が『経済産業省』を選択する場合、
『経済産業省』の強調表示は色彩として『赤』で表示さ
れ、背景の模様として『右』を示す模様で表示されるの
で、操作者は「アカ・ミギ」又は「ミギ・アカ」と発声
する。
【0052】この発声は音声認識装置1−8で認識さ
れ、強調表示/認識対象変換回路1−9に送られる。強
調表示/認識対象変換回路1−9は、変換テーブルを基
に認識結果を『経済産業省』に変換し、画面生成回路1
−2に送る。画面生成回路1−2は、強調表示/認識対
象変換回路1−9からの結果を基に、『経済産業省』の
Webページ画面を生成する。
【0053】図11に複数の強調表示の組み合わせを用
いた本発明の第2の実施形態を示す。この第2の実施形
態の構成は、変換テーブル生成回路1−10以外、図9
に示した実施形態と共通である。認識結果バッファ11
−1は初期状態でクリアされている。図10に示すリン
ク先リスト並びに第1及び第2の強調表示リストと同じ
ものを用いて、リンク先情報と強調表示とが対応付けら
れているとき、操作者は例えば『経済産業省』を選択す
る場合、先ず「アカ」と発声する。
【0054】操作者の発声は音声認識装置1−8で認識
され、認識結果は認識結果バッファ11−1に送出され
る。認識結果バッファ11−1は、最初、認識結果がク
リアされているため、音声認識装置1−8からの認識結
果をそのまま蓄積する。変換テーブル生成回路1−10
は、認識結果バッファ11−1がクリアされている場
合、図9の第1の実施形態と同様に図12の(a)に示
す変換テーブルを生成する。一方、認識結果バッファ1
1−1に認識結果が蓄積されている場合、図12の
(a)の変換テーブルから認識結果を含む部分のみを取
出した図12の(b)に示すような変換テーブルを生成
する。
【0055】図12の(b)の変換テーブルは、認識結
果バッファ11−1に「アカ」が蓄積されている場合、
記号『赤』を含むリンク先情報は『経済産業省』、『厚
生労働省』、『法務省』であるため、この3つのリンク
先情報だけを含む変換テーブルを生成する。この結果、
『経済産業省』、『厚生労働省』、『法務省』だけが強
調表示された強調表示画面が生成される。次に、操作者
は『経済産業省』を選択するため、「ミギ」と発声す
る。発声は音声認識装置1−8で認識され、認識結果バ
ッファ11−1に送られる。
【0056】認識結果バッファ11−1は、蓄積済みの
認識結果と音声認識装置1−8からの認識結果とが、互
いに異なる強調表示リストに含まれる項目である場合、
音声認識装置1−8からの認識結果を、強調表示/認識
対象変換回路1−9に送り、蓄積済みの認識結果をクリ
アする。蓄積済みの認識結果と音声認識装置1−8から
の認識結果とが、同じ強調表示リストに含まれる項目同
士である場合、認識結果バッファ11−1の内容を音声
認識装置1−8からの認識結果に置き換える。
【0057】認識結果バッファ11−1の蓄積済み認識
結果は「アカ」で、音声認識装置1−8からの認識結果
が「ミギ」で、互いに異なる強調表示リストに含まれる
項目であるため、認識結果バッファ11−1は「ミギ」
の認識結果を強調表示/認識対象変換回路1−9に送出
する。強調表示/認識対象変換回路1−9は、変換テー
ブルを基に認識結果バッファ11−1からの認識結果
(「ミギ」)を『経済産業省』に変換し、画面生成回路
1−2に送出する。画面生成回路1−2は『経済産業
省』のWebページ画面を生成する。以上の認識結果バ
ッファ11−1の蓄積状態に応じた処理動作を図13に
まとめて示している。
【0058】上記の例では、強調表示リストテーブル9
−1の要素→強調表示リストテーブル9−2の要素の順
(「アカ」→「ミギ」)に認識したが、逆の順(「ミ
ギ」→「アカ」)に認識するように構成することも可能
である。また、強調表示リストが3つ以上ある場合、ど
の強調表示リストの要素から音声認識されても、所望の
リンク先情報が選択されるように構成することができ
る。
【0059】「アカ」の音声を認識した段階で、強調表
示すべき部分が絞り込まれるため、操作者がリンクの強
調表示を見間違えたり、音声認識装置1−8が誤認識し
て所望のリンク先情報が強調表示されなかった場合、操
作者は正しい強調表示を言い直せばよい。認識結果バッ
ファ11−1は、蓄積済みの認識結果と音声認識装置1
−8の認識結果とが同じ強調表示リストの要素なら、蓄
積済み認識結果を音声認識装置1−8の認識結果で置き
換えるため、言い直しにより所望の正しいリンク先情報
が強調表示される。
【0060】次に、図14、図15を基にキーワードに
よる音声入力の実施形態について説明する。この実施形
態は、認識対象からキーワードを抽出し、該キーワード
の部分のみを強調表示する。操作者は強調表示の種類と
キーワードの両方を判別することができる。音声認識装
置1−8は、強調表示の種類及びキーワードの何れも認
識可能とする。操作者は、強調表示の種類又はキーワー
ドのどちらか言い易い方を発声すればよい。
【0061】この実施形態において、画面生成回路1−
2、認識対象抽出回路1−3、画面切り替え回路1−
5、表示装置1−6、音声認識装置1−8、変換テーブ
ルは図1に示したものと同様である。キーワード抽出回
路14−1は、リンク先情報名からキーワードを抽出す
る。キーワードの抽出方法としては、リンク先情報名の
先頭から適当なn個の文字を切り出してキーワードとす
ることができる。図15の具体例では2文字分を切り出
してキーワードとする例を示している。複数のリンク先
情報に対して同一のキーワードとなってしまう場合、そ
れらのリンク先情報はキーワードなしとする。図15の
例では『公安調査庁』と『公安審査委員会』とは最初の
2文字が同一のため、共にキーワードなしとする。
【0062】変換テーブル生成回路1−10は、リンク
先リスト(図15の(a))、強調表示リスト(同図
(b))及びキーワードリスト(同図(c))から変換
テーブル(同図(d))を生成する。強調表示画面生成
回路1−4は、該変換テーブル(同図(d))を基に強
調表示画面を生成する。図15の例では、リンク先情報
部分を含むオリジナル画面(同図(e))に対して、そ
の全体をモノクロ化して非強調表示に変更する一方、キ
ーワードを含むリンク先情報についてはキーワード部分
のみを強調表示し、キーワードを含まないリンク先情報
はリンク先名全体を強調表示して強調表示画面(同図
(f))を生成する。
【0063】キーワードの有無を操作者が判別し易くす
るため、図15に示す例のようにキーワード部分のみを
反転表示する等して、キーワードの有無に応じて強調表
示の仕方を変更する。操作者は、シフトボタン1−1を
押して強調表示画面を表示し、所望のリンク先情報の強
調表示の種類又はキーワードを発声する。
【0064】操作者の発声は音声認識装置1−8で認識
され、強調表示・キーワード/認識対象変換回路14−
2に送られる。強調表示・キーワード/認識対象変換回
路14−2は、変換テーブルを基に認識結果をリンク先
情報に変換し、画面生成回路1−2に送る。操作者は、
強調表示の種類又はキーワードのうち言い易い方を発声
すればよいため、リンク先の選択が容易になる。
【0065】キーワードの抽出方法としては、リンク先
情報名を構文解析して名詞を抽出し、抽出した名詞をキ
ーワードとするなどにより抽出することができる。1つ
のリンク先情報名から複数の名詞が抽出される場合、各
リンク先情報同士でキーワードが競合しないように選択
する。キーワードが競合する場合、それらのリンク先に
対してはキーワード無しとする。
【0066】次に、図16、図17を基にシフトボタン
を押した時だけ音声認識を行う実施形態について説明す
る。シフトボタンを押した時だけ音声認識を行う構成と
することにより、発声区間の検出精度が向上するため、
音声認識率の精度を向上させることができる。
【0067】この実施形態において、音声認識装置1−
8以外は図1に示した実施形態と同様である。音声認識
装置1−8は、シフトボタン1−1が押されている期間
内に入力された音声信号だけを認識する。リンク先情報
を選択する場合、操作者はシフトボタン1−1を押し、
強調表示を確認して発声するため、シフトボタン1−1
が押されている期間内の音声信号だけを認識させる構成
としても、操作者には違和感が無く自然である。
【0068】音声認識装置1−8は、背景雑音が入力さ
れると誤認識動作を起こし易い。図17に示すように、
操作者の発声の前後に背景雑音が発生する場合、シフト
ボタン1−1のオン/オフと無関係に音声認識処理を行
うと、発声の前や後ろの背景雑音による誤認識を起こす
可能性がある。しかし、シフトボタン1−1のオンの期
間のみ音声認識処理を行うことにより、背景雑音に対し
て認識処理を行う確率が減少するため、音声認識の精度
が向上する。
【0069】次に、図18、図19、図20を基に、シ
フトボタンの操作回数に応じて特定のグループの認識対
象のみを強調表示する実施形態を説明する。この実施形
態によれば、認識対象の数が強調表示の種類より多い場
合でも、強調表示が可能となる。
【0070】図18に示すこの発明の実施形態におい
て、画面生成回路1−2、認識対象抽出回路1−3、表
示装置1−6、音声認識装置1−8、強調表示リストテ
ーブル1−11は図1等の実施形態と同様である。変換
テーブル生成回路1−10は、リンク先情報が強調表示
の種類より多い場合、リンク先情報を複数のグループに
分け、グループ毎にリンク先情報と強調表示とを対応付
ける。
【0071】図19は生成される変換テーブルの例を示
し、同図の(a)に示すWebページ画面の場合、リン
ク先情報は同図(b)のリンク先リストに示すように7
件であり、これは同図(c)の強調表示リストに示す強
調表示の種類の数4より多数あるので、同図(d)の変
換テーブルのようにリンク先情報を2つのグループ#
1,#2に分ける。
【0072】強調表示画面生成回路1−4は、一つのグ
ループ内のリンク先情報のみを強調表示した強調表示画
面を生成し、非強調表示としてモノクロ化を適用し、図
2の(a)に示すように前述の第1のグループ#1を強
調表示した第1の強調表示画面#1、及び同図(b)に
示すように第2のグループ#2を強調表示した第2の強
調表示画面#2を生成する。
【0073】画面切り替え回路1−5は、シフトボタン
1−1を押す度に、オリジナル画面、第1の強調表示画
面#1、第2の強調表示画面#2に順次切り替える。操
作者は、選択したいリンク先情報が強調表示されている
ときに、強調表示の種類を発声する。
【0074】音声認識装置1−8で認識された強調表示
の種類は、強調表示/認識対象変換回路1−9に送られ
る。強調表示/認識対象変換回路1−9は、現在どの強
調表示画面が表示されているかの情報を画面切り替え回
路1−5より入手し、この画面に対応したグループ情報
を基に、変換テーブルよりリンク先情報を選択し、画面
生成回路1−2に送る。
【0075】オリジナル画面が表示されている場合は、
認識音声を無視する。図20の例では、第2の強調表示
画面#2の表示中に発声「アオ」が認識された場合、第
2のグループ#2で「アオ」の強調表示に対応するリン
ク先情報『文部科学者』を選択する。通常、判別し易く
発声し易い強調表示の種類の数はそれ程多くないが、限
られた強調表示の種類で多数のリンク先情報に対応付け
ることができる。
【0076】次に、図21〜図24を基に、グループ毎
に共通の強調表示を行う実施形態について説明する。操
作者は強調表示の種類を発声して特定のグループを選択
する。そして、選択されたグループに対してのみその認
識対象を強調表示し、個々の認識対象を選択し得るよう
にする。こうすることにより、認識対象の数が強調表示
の種類より多い場合でも強調表示が可能となる。
【0077】この実施形態において、認識結果バッファ
11−1、強調表示/認識対象変換回路1−9、変換テ
ーブル生成回路1−10、強調表示画面生成回路1−4
以外は図1等の実施形態と同様のため説明を省略する。
変換テーブル生成回路1−10は、リンク先情報の数が
強調表示の種類より多い場合、リンク先情報を複数のグ
ループに分け、各グループに強調表示を対応付ける。
【0078】また、各グループ内におけるリンク先情報
と強調表示の対応付けも行う。図22の例の場合、リン
ク先情報の数は7個あり、これは強調表示の種類の数4
個より多いので、リンク先情報を2つのグループに分
け、図22(d)の変換テーブル#0に示すように、第
1のグループ#1を『赤』の強調表示に、第2のグルー
プ#2を『青』の強調表示に対応付ける。
【0079】認識結果バッファ11−1は、第1の発声
の認識結果#1及び第2の発声の認識結果#2を蓄積
し、初期の状態では第1及び第2の認識結果ともクリア
しておく。変換テーブル生成回路1−10は、第1及び
第2の認識結果ともクリアされているため、変換テーブ
ル#0を基に、グループ毎の強調表示とリンク先情報か
らなる第1の変換テーブル#1(図23の(b))を生
成し、強調表示画面生成回路1−4に送る。
【0080】強調表示画面生成回路1−4は、グループ
毎に強調表示された第1の強調表示画面#1(図23の
(c))を生成する。操作者は、所望のリンクを含むグ
ループの強調表示の種類を発声する。図23の例では、
『環境省』を選択する場合、『環境省』を含む第1のグ
ループ#1の強調表示「アカ」を発声する。該発声は音
声認識装置1−8で認識され、認識結果バッファ11−
1の第1の認識結果#1として蓄積される。
【0081】変換テーブル生成回路1−10は、変換テ
ーブル#0を基に、第1の認識結果#1の『赤』に対応
したグループのみを抽出した第2の変換テーブル#2
(図24の(b))を生成し、強調表示画面生成回路1
−4に送る。強調表示画面生成回路1−4では、第2の
変換テーブル#2に対応した第2の強調表示画面#2を
生成する(図24の(c))。
【0082】図24の例では、『環境省』は強調表示が
『緑』になっているため、操作者は「ミドリ」と発声す
る。この発声は音声認識装置1−8で認識され、認識結
果バッファ11−1に第2の認識結果#2として蓄積さ
れる。第1及び第2の認識結果が確定した時点で、該第
1及び第2の認識結果は強調表示/認識対象変換回路1
−9に送られる。
【0083】強調表示/認識対象変換回路1−9では、
変換テーブル#0と第1及び第2の認識結果よりリンク
先情報『環境省』が選択されたと判断し、『環境省』の
リンク先情報を画面生成回路1−2に送る。通常、判別
し易く発声し易い強調表示の種類はそれ程多くないが、
限られた強調表示だけで多数のリンク先情報に対応する
ことができる。
【0084】次に、図25を基に認識対象を選択頻度に
応じてグループ分けする実施形態について説明する。こ
の実施形態は、利用頻度の高いグループを簡易に操作で
きるようにし、操作者が利用頻度の高い認識対象を簡便
に利用することができるようにしたものである。
【0085】図25において、使用頻度バッファ25−
1と変換テーブル生成回路1−10以外は図1等の実施
形態と同様である。使用頻度バッファ25−1は、強調
表示/認識対象変換回路1−9から送られるリンク先情
報を基に、各リンク先情報が選択される頻度を示す情報
を蓄積し、現在表示されている画面に関する頻度情報を
変換テーブル生成回路1−10に送出する。
【0086】変換テーブル生成回路1−10は、使用頻
度の最も高いリンク先情報群を第1のグループに、次に
使用頻度の高いリンク先情報群を第2のグループといっ
たように、使用頻度の順にリンク先情報を各グループに
割り当てる。そして、操作者がシフトボタン1−1を押
す毎に、オリジナル画面→第1のグループの強調表示画
面→第2のグループの強調表示画面→…の順に表示を切
り替える。従って、使用頻度の高いリンク先情報のグル
ープほど早期に強調表示され、操作者は使用頻度の高い
リンク先情報を効率良く選択することができる。
【0087】更に、リンク先情報を使用頻度の高いもの
から順に割り当てた各グループ1,2,3,に対して強
調表示を対応付ける際に、前述の図21〜図24に示し
たグループ毎に共通の強調表示を行う実施形態を適用
し、判別し易い又は言い易い強調表示を、使用頻度の高
いグループ順に割り当てることができる。
【0088】こうすることにより、使用頻度の高いリン
ク先情報ほど、判別し易い又は言い易いため、操作者の
使い勝手が向上する。なお、この実施形態において、強
調表示/認識対象変換回路1−9から送られるリンク先
情報を基に使用頻度を算出したが、Webページ画面の
構成情報の中に各リンク先情報の使用頻度情報が含まれ
ている場合、その情報を利用して使用頻度情報を入手す
る構成とすることも可能である。
【0089】次に、図26、図27を基に、画面上で近
傍に表示される認識対象同士を同じグループに割当てる
実施形態について説明する。同じグループに属する認識
対象が表示画面上の特定の領域に集中するため、或る認
識対象がどのグループに含まれているかが判別しやすく
なり、グループ選択が容易になる。
【0090】図26において、配置情報抽出回路26−
1と変換テーブル生成回路1−10以外は図21等の実
施形態と同様であるため説明を省略する。配置情報抽出
回路26−1は、画面に表示される構成情報の全要素に
ついて画面上での表示位置を抽出する。変換テーブル生
成回路1−10は、画面上での表示位置の近いリンク先
情報同士を同じグループに分類する。
【0091】強調表示画面では、互いに近寄った表示位
置の同じグループのリンク先情報を同一の強調表示で表
示する。操作者は所望のリンク先情報の表示位置が分か
れば、発声すべき強調表示を容易に判別することができ
る。図27の強調表示画面の例の場合、画面の左上のリ
ンク先情報は『赤』、右上のリンク先情報は『青』、下
側のリンク先情報は『緑』で表示されている。操作者は
『外務省』を選択したい場合、『外務省』は画面の下側
に表示されているので、「ミドリ」と発声すればよいこ
とが瞬時に分かる。
【0092】次に、図28、図29を基に、認識対象の
有無を通知する実施形態について説明する。この実施形
態は、操作者はシフトボタンを押さなくても、表示中の
画面を見ただけで、該画面に認識対象のリンク先情報が
含まれているかどうかを判別することができるようにし
たものである。
【0093】図28において、認識対象表示回路28−
1と表示装置1−6以外は図1等の実施形態と同様であ
るため説明を省略する。認識対象表示回路28−1は、
認識対象抽出回路1−3で抽出された認識対象を受け取
り、認識対象の有無を表示する画面を生成し、表示装置
1−6に送出する。認識対象の有無の表示方法として
は、図29に示すように、(i )リンク先情報の有無を
アイコン29−1の有無又は形状等により表示する方
法、又は、(ii)表示中の画面に含まれる認識対象(リ
ンク先情報)の数を示す数字29−2又はバー29−3
の長さ等により表示する方法、又は、(iii )リンク先
情報の有無を枠29−4の色彩で表示する等の何れかの
方法によって表示可能である。
【0094】表示装置1−6は、画面切り替え回路1−
5から送られてきた画面情報を、認識対象表示回路28
−1から送られてくる認識対象の有無を表示する画面情
報と合成して表示する。こうすることにより操作者は、
シフトボタン1−1を押さなくても、画面の表示を見て
リンク先情報の有無を確認することができる。リンク先
情報の有無の表示方法としては、画面での表示以外に、
音・振動・LEDの点滅等により表示することも可能で
ある。
【0095】次に、図30、図31を基に、認識対象の
有無及びその表示位置を通知する実施形態について説明
する。この実施形態は、オリジナル画面上の特定位置の
表示部分が認識対象になっているかどうかを、操作者が
ボタンを押さなくても判別することができるようにした
ものである。図30において、配置情報抽出回路30−
1及び認識対象表示回路28−1以外は図28の実施形
態と同様である。
【0096】配置情報抽出回路30−1は、画面に表示
される全要素について画面上での表示位置を抽出し、該
情報を認識対象表示回路28−1に送出する。認識対象
表示回路28−1は、認識対象及びその表示位置を基
に、認識対象の存在領域を示す画面を生成し、表示装置
1−6に送出する。
【0097】認識対象の存在領域の表示方法としては、
認識対象が表示されたオリジナル画面又は強調表示画面
の脇に、認識対象の存在位置を示す存在領域表示エリア
を設けて該エリアに表示することができる。図31は表
示例を示し、表示画面の左端に存在領域表示エリア31
−1を設け、認識対象が表示されている画面上の表示位
置が近傍のもの同士を、上部のものから順にグループ化
し、同図に示すように第1のグループ#1の認識対象、
第2のグループ#2の認識対象、第3のグループ#3の
認識対象として分割する。
【0098】認識対象表示回路28−1は、各グループ
内の一番上の認識対象と一番下の認識対象とを選択し、
該二つの認識対象に挟まれた存在領域表示エリア31−
1の部分を、そのグループに対応付けた色彩による強調
表示を表示する。図31の表示例では、第1のグループ
#1の存在領域表示エリア31−1は赤色を、第2のグ
ループ#2の存在領域表示エリア31−1は青色を、第
3のグループ#3の存在領域表示エリア31−1は緑色
により表示している。
【0099】操作者は、シフトボタン1−1を押さなく
ても、存在領域表示エリア31−1の強調表示部分を見
て、表示画面上のどのあたりに認識対象が存在するのか
を判別することができる。そして、選択する認識対象の
表示位置の左側に表示されている存在領域表示エリア3
1−1の強調表示の種類を発声することにより、そのグ
ループの選択と次の強調表示画面への切り替えとを同時
に行うことができる。
【0100】(付記1) 音声認識対象の入力項目を含
む画面を表示する表示手段と、該入力項目の表示形態の
種類を特定する音声信号を認識する音声認識手段と、該
入力項目の表示形態の種類と入力項目との対応を記憶す
る記憶手段とを備え、入力項目の表示形態の種類を特定
する音声を認識して、該表示形態の種類に対応した入力
項目を出力する音声認識入力装置において、前記表示手
段は、前記音声認識対象の入力項目を含む元々の画面
と、前記音声認識対象の入力項目を強調して表示した強
調表示画面とを、スイッチのオン/オフ操作に応じて切
り替えて表示する手段を備えたことを特徴とする音声認
識入力装置。 (付記2) 前記強調表示の種類として、種類の異なる
色彩又は種類の異なる背景模様を用いた強調表示画面を
表示することを特徴とする付記1に記載の音声認識入力
装置。 (付記3) 前記強調表示の種類として、表示形態の類
型の異なる複数の種類を用い、該類型の異なる複数の種
類の表示形態を組み合わせて、前記音声認識対象の入力
項目を強調表示した強調表示画面を生成する手段を備え
たことを特徴とする付記1又は2に記載の音声認識入力
装置。 (付記4) 前記音声入力機能選択装置は、前記音声認
識対象の入力項目からキーワードを抽出し、該キーワー
ドを強調表示した強調表示画面を生成する手段を備え、
前記音声認識手段は、キーワードの音声及び強調表示の
種類の音声の何れの音声信号も認識し、該認識したキー
ワード又は強調表示の種類に対応する入力項目を出力す
ることを特徴とする付記1、2又は3に記載の音声認識
入力装置。 (付記5) 前記音声認識手段は、前記スイッチの操作
に応じて強調表示画面を表示している期間にのみ入力さ
れる音声信号を認識することを特徴とする付記1乃至4
の何れかに記載の音声認識入力装置。 (付記6) 各音声認識対象の入力項目を複数のグルー
プに分割し、前記スイッチの操作回数に応じて1つのグ
ループを特定し、該特定されたグループに属する音声認
識対象の入力項目だけを強調表示した強調表示画面を生
成する手段を備えたことを特徴とする付記1乃至5の何
れかに記載の音声認識入力装置。 (付記7) 各音声認識対象の入力項目を、その使用頻
度を基にグループに分割したことを特徴とする付記6に
記載の音声認識入力装置。 (付記8) 各音声認識対象の入力項目を、その各表示
画面上での表示位置を基にグループに分割したことを特
徴とする付記6に記載の音声認識入力装置。 (付記9) 前記表示手段は、音声認識対象の入力項目
を含む画面に、音声認識対象の入力項目が存在すること
又は存在する個数を示す小図形又は図像等の標識を表示
することを特徴とする付記1乃至8の何れかに記載の音
声認識入力装置。 (付記10) 前記表示手段は、音声認識対象の入力項
目の存在を示す標識を、音声認識対象の入力項目の存在
位置を示す位置に表示し、又は存在位置を示す付加情報
と共に表示することを特徴とする付記9に記載の音声認
識入力装置。
【0101】
【発明の効果】以上説明したように、本発明によれば、
音声認識対象の入力項目を含む元々のオリジナル画面
と、前記音声認識対象の入力項目を強調して表示した強
調表示画面とを、スイッチのオン/オフ操作に応じて切
り替えて表示することにより、通常時はオリジナル画面
のデザインを変えずに表示し、音声入力を行うときだ
け、音声認識対象項目を種類の異なる表示形態で表示し
た強調表示画面に切り替え、操作者は該強調表示画面の
表示形態の種類を発声して所望の項目を入力することが
できる。
【図面の簡単な説明】
【図1】発明の音声認識入力装置を示す図である。
【図2】色彩による強調表示の変換テーブルの生成の具
体例を示す図である。
【図3】輝度低下による非強調表示画面の輝度変化を示
す図である。
【図4】オリジナル画面及び輝度を落とした強調表示画
面の例を示す図である。
【図5】モノクロ表示による非強調表示画面の輝度変化
を示す図である。
【図6】点滅表示による強調表示画面の例を示す図であ
る。
【図7】背景の模様による強調表示の変換テーブル生成
の具体例を示す図である。
【図8】背景の模様による強調表示画面の例を示す図で
ある。
【図9】複数の強調表示の組み合わせを用いた本発明の
第1の実施形態を示す図である。
【図10】色彩と背景模様の強調表示を用いた変換テー
ブルの例を示す図である。
【図11】複数の強調表示の組み合わせを用いた本発明
の第2の実施形態を示す図である。
【図12】複数の強調表示の組み合わせを用いた第2の
実施形態で生成される変換テーブルの例を示す図であ
る。
【図13】複数の強調表示の組み合わせを用いた第2の
実施形態における認識結果バッファの蓄積に応じた処理
動作を示す図である。
【図14】キーワードによる音声認識入力装置の構成を
示す図である。
【図15】キーワードによる音声認識入力処理の具体例
を示す図である。
【図16】シフトボタンを押した時だけ音声認識を行う
実施形態の構成を示す図である。
【図17】音声認識を行う区間を示す図である。
【図18】シフトボタンの操作回数に応じて強調表示す
る実施形態の構成を示す図である。
【図19】シフトボタンの操作回数に応じた強調表示の
際に生成される変換テーブルの例を示す図である。
【図20】シフトボタンの操作回数に応じて表示される
強調表示画面の例を示す図である。
【図21】グループ毎に共通の強調表示を行う実施形態
の構成を示す図である。
【図22】グループ毎に共通の強調表示を行う際に生成
される変換テーブルの例を示す図である。
【図23】グループ毎に共通の強調表示を行った第1の
強調表示画面の例を示す図である。
【図24】グループ毎に共通の強調表示を行った第2の
強調表示画面の例を示す図である。
【図25】認識対象を選択頻度に応じてグループ分けす
る実施形態の構成を示す図である。
【図26】画面上で近傍に表示される認識対象同士を同
じグループに割当てる実施形態の構成を示す図である。
【図27】画面上で近傍に表示される認識対象同士を同
じグループに割当てた強調表示画面を示す図である。
【図28】認識対象の有無を通知する実施形態の構成を
示す図である。
【図29】認識対象の有無を表示した表示画面の例を示
す図である。
【図30】認識対象の有無及びその表示位置を通知する
実施形態の構成を示す図である。
【図31】認識対象の有無及びその表示位置を表示した
表示画面の例を示す図である。
【図32】従来の音声認識入力装置を示す図である。
【符号の説明】
1−1 シフトボタン 1−2 画面生成回路 1−3 認識対象抽出回路 1−4 強調表示画面生成回路 1−5 画面切り替え回路 1−6 表示装置 1−7 マイクロホン 1−8 音声認識装置 1−9 強調表示/認識対象変換回路 1−10 変換テーブル生成回路 1−11 強調表示リストテーブル
───────────────────────────────────────────────────── フロントページの続き (72)発明者 中井 丈裕 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 Fターム(参考) 5D015 AA01 AA04 BB02 LL05 LL10

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 音声認識対象の入力項目を含む画面を表
    示する表示手段と、該入力項目の表示形態の種類を特定
    する音声信号を認識する音声認識手段と、該入力項目の
    表示形態の種類と入力項目との対応を記憶する記憶手段
    とを備え、入力項目の表示形態の種類を特定する音声を
    認識して、該表示形態の種類に対応した入力項目を出力
    する音声認識入力装置において、 前記表示手段は、前記音声認識対象の入力項目を含む元
    々の画面と、前記音声認識対象の入力項目を強調して表
    示した強調表示画面とを、スイッチのオン/オフ操作に
    応じて切り替えて表示する手段を備えたことを特徴とす
    る音声認識入力装置。
  2. 【請求項2】 前記強調表示の種類として、表示形態の
    類型の異なる複数の種類を用い、該類型の異なる複数の
    種類の表示形態を組み合わせて、前記音声認識対象の入
    力項目を強調表示した強調表示画面を生成する手段を備
    えたことを特徴とする請求項1に記載の音声認識入力装
    置。
  3. 【請求項3】 前記音声認識手段は、前記スイッチの操
    作に応じて強調表示画面を表示している期間にのみ入力
    される音声信号を認識することを特徴とする請求項1又
    は2に記載の音声認識入力装置。
  4. 【請求項4】 各音声認識対象の入力項目を複数のグル
    ープに分割し、前記スイッチの操作回数に応じて1つの
    グループを特定し、該特定されたグループに属する音声
    認識対象の入力項目だけを強調表示した強調表示画面を
    生成する手段を備えたことを特徴とする請求項1乃至3
    の何れかに記載の音声認識入力装置。
  5. 【請求項5】 各音声認識対象の入力項目を、その使用
    頻度を基にグループに分割したことを特徴とする請求項
    4に記載の音声認識入力装置。
JP2001072937A 2001-03-14 2001-03-14 音声認識入力装置 Pending JP2002278587A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001072937A JP2002278587A (ja) 2001-03-14 2001-03-14 音声認識入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001072937A JP2002278587A (ja) 2001-03-14 2001-03-14 音声認識入力装置

Publications (1)

Publication Number Publication Date
JP2002278587A true JP2002278587A (ja) 2002-09-27

Family

ID=18930449

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001072937A Pending JP2002278587A (ja) 2001-03-14 2001-03-14 音声認識入力装置

Country Status (1)

Country Link
JP (1) JP2002278587A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005004032A (ja) * 2003-06-13 2005-01-06 Sony Corp 音声認識装置及び音声認識方法
JP2005242183A (ja) * 2004-02-27 2005-09-08 Toshiba Corp 音声認識装置、表示制御装置、レコーダ装置、表示方法およびプログラム
JP2008059359A (ja) * 2006-08-31 2008-03-13 Sanyo Electric Co Ltd 表示制御装置及び表示制御方法
US20150052169A1 (en) * 2013-08-19 2015-02-19 Kabushiki Kaisha Toshiba Method, electronic device, and computer program product
JP2016218868A (ja) * 2015-05-22 2016-12-22 富士通株式会社 表示制御方法、情報処理装置及び表示制御プログラム
KR20180107909A (ko) * 2017-03-23 2018-10-04 네이버랩스 주식회사 알림에 대한 음성 조작 방법 및 시스템
WO2019203016A1 (ja) * 2018-04-19 2019-10-24 ソニー株式会社 情報処理装置、情報処理方法、及び、プログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005004032A (ja) * 2003-06-13 2005-01-06 Sony Corp 音声認識装置及び音声認識方法
JP2005242183A (ja) * 2004-02-27 2005-09-08 Toshiba Corp 音声認識装置、表示制御装置、レコーダ装置、表示方法およびプログラム
JP2008059359A (ja) * 2006-08-31 2008-03-13 Sanyo Electric Co Ltd 表示制御装置及び表示制御方法
US20150052169A1 (en) * 2013-08-19 2015-02-19 Kabushiki Kaisha Toshiba Method, electronic device, and computer program product
JP2016218868A (ja) * 2015-05-22 2016-12-22 富士通株式会社 表示制御方法、情報処理装置及び表示制御プログラム
US10558425B2 (en) 2015-05-22 2020-02-11 Fujitsu Limited Display control method, data process apparatus, and computer-readable recording medium
KR20180107909A (ko) * 2017-03-23 2018-10-04 네이버랩스 주식회사 알림에 대한 음성 조작 방법 및 시스템
KR102011036B1 (ko) * 2017-03-23 2019-08-14 네이버랩스 주식회사 알림에 대한 음성 조작 방법 및 시스템
WO2019203016A1 (ja) * 2018-04-19 2019-10-24 ソニー株式会社 情報処理装置、情報処理方法、及び、プログラム

Similar Documents

Publication Publication Date Title
US5461399A (en) Method and system for enabling visually impaired computer users to graphically select displayed objects
US5956029A (en) User interface conversion method and apparatus
Brewster et al. Earcons as a method of providing navigational cues in a menu hierarchy
US6714223B2 (en) Interactive-type user interface device having root scenario
US10521186B2 (en) Systems and methods for prompting multi-token input speech
WO1999008175A2 (en) Universally accessible computing system
EP1207516B1 (en) Device setter, device setting system, and recorded medium where device setting program is recorded
JP2002278587A (ja) 音声認識入力装置
US5987416A (en) Electronic community system using speech recognition for use by the visually impaired
KR20040044704A (ko) 사운드카드와 이를 사용하는 컴퓨터 시스템 및 그 제어방법
JP2000278624A (ja) 情報表示装置
JPH09282137A (ja) 文章読み上げ装置
JPH0312891A (ja) 選曲機
JPH0312889A (ja) 選曲機
JP3818423B2 (ja) 情報出力システム
KR20080052306A (ko) 네비게이션 시스템에 이용되는 음성 인식 방법 및 장치
JP2004062517A (ja) 音声制御装置、音声制御方法、およびプログラム
KR20060112584A (ko) 한글 입력용 키패드 및 이를 이용한 한글 입력 방법
JPH10198393A (ja) 会話記録装置
JPH04235599A (ja) 認識候補情報グループ別表示処理方式
JP2001175320A (ja) プラント監視装置
JP2002189490A (ja) ピンイン音声入力の方法
JPS562040A (en) Audio input discrimination system
US20040122663A1 (en) Apparatus and method for switching audio mode automatically
JPS62150294A (ja) 認識結果確認方式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060328

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090820

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090929