JPH1152984A

JPH1152984A - 音声認識装置における認識対象表示方式

Info

Publication number: JPH1152984A
Application number: JP9215308A
Authority: JP
Inventors: Akihiro Kimura; 晋太木村; Yasuo Sato; 泰雄佐藤; Tomio Koide; 富夫小出
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1997-08-08
Filing date: 1997-08-08
Publication date: 1999-02-26
Anticipated expiration: 2017-08-08
Also published as: JP4279909B2; US20010012995A1; US6374218B2

Abstract

(57)【要約】【課題】ユーザが認識対象単語をよく知らない場合に
おいても、音声認識装置の操作性を向上させ、その効用
を大きくする。【解決手段】認識対象単語を格納する手段１１と、入
力される音声の特徴に基づいて、手段１１に格納されて
いる全ての単語の中で入力音声に最も類似する単語を求
めて認識結果とする手段１２と、ユーザの音声入力を助
けるために、手段１１に格納されている単語を自動的に
表示する手段１３とを備える。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声認識装置に係
り、更に詳しくは音声認識の認識対象となる単語をディ
スプレイ画面上に自動的に表示することによってユーザ
の音声入力を助ける、音声認識装置における認識対象表
示方式に関する。

【０００２】

【従来の技術】図２２は音声認識装置の従来例の構成ブ
ロック図である。同図において音声認識装置は音声が入
力され、電気信号に変換されるマイク１、例えば高速フ
ーリエ変換や、線形予測分析などを用いて入力された音
声を分析する分析部２、音声の分析結果から特徴を抽出
する特徴抽出部３、認識対象としての単語を格納する単
語辞書部４、単語辞書部４に格納されている全ての単語
と入力音声を、特徴抽出部３によって抽出された特徴に
基づいて照合し、入力音声に最も類似した単語を求める
単語照合部５、単語照合部５によって出力される単語の
認識結果と、単語辞書部４に格納されている単語を表示
する表示部６、単語辞書部４に格納されている単語の表
示部６による表示に際して、単語辞書部４に格納されて
いる単語の数が多く、１つの画面上に全ての単語を表示
することができないため、表示単語のスクロールを行う
スクロール制御部７、スクロール制御部７にスクロール
の指示を与えるためのマウス８を備えている。

【０００３】単語照合部５では、入力音声と単語辞書部
４に格納されている全ての単語の照合が行われるが、そ
の手法としては、例えば入力音声の時間方向の伸び縮み
を吸収するための手法としてのＤＰマッチング法、また
は単語音声の確率モデルを使用する隠れマルコフモデル
法（ＨＭＭ法）などが用いられる。この照合の結果とし
ての認識結果は、前述のように表示部６に表示される
が、本発明が対象とする音声認識装置では、認識結果と
共に音声認識の対象としての単語辞書部４に格納されて
いる単語が、同時に表示部６によって表示される。

【０００４】本発明が対象とする音声認識装置では、認
識対象としての単語を音声認識装置のユーザが必ずしも
よく知らないということを前提としている。音声認識装
置が、例えばコマンドの入力用に使用されるものである
時、ユーザはコマンドをよく知っていないため、表示部
６によって表示されるコマンドを見ながら、入力すべき
コマンドが表示された時にそのコマンドを音声入力する
ことによって、コマンドの入力を実行できるものとす
る。そのためにスクロール制御部７によって、単語辞書
部４に格納されている全てのコマンドをディスプレイ画
面上でスクロールさせながら表示して、ユーザのコマン
ド入力を助けることになる。

【０００５】

【発明が解決しようとする課題】前述のように、本発明
が対象とする音声認識装置では、どのような単語が認識
対象となっているかをユーザはあまりよく知らず、図２
２においてはマウス８によってディスプレイ画面上に表
示されている認識対象単語、例えばコマンドをスクロー
ルさせながら入力すべきコマンドを探して、音声入力を
行うことが必要であった。このように従来例ではマウス
を使って入力すべき単語を探しているためディスプレイ
画面上にその単語を見つけた時にマウスによってその単
語をクリックすれば、その単語、例えばコマンドの入力
を行うことができることになり、そもそも音声認識を用
いる必要性がはっきりしないという問題点があった。

【０００６】本発明は、音声認識の対象となる単語を、
例えばディスプレイ画面上で自動的にスクロールさせな
がら表示することにより、マウス操作を行うことを不必
要にさせ、音声認識装置の効用を大きくすることであ
る。

【０００７】

【課題を解決するための手段】図１および図２は本発明
の原理構成ブロック図である。これらの図は入力される
音声を認識する音声認識装置、特に認識対象の単語をデ
ィスプレイ画面上に表示する音声認識装置の原理構成ブ
ロック図である。

【０００８】図１は第１の発明の原理構成ブロック図で
ある。同図において、認識用単語格納手段１１は入力音
声の認識対象としての単語、例えばコマンドの全てを格
納しているものである。音声認識手段１２は入力される
音声の特徴に基づいて、認識用単語格納手段１１に格納
されている全ての認識対象単語、例えばコマンドの中か
ら最も入力音声に類似した単語を求めて、認識結果とし
て出力するものである。更に表示手段１３は音声認識装
置のユーザの音声入力を助けるために、認識用単語格納
手段１１に格納されている単語を自動的に表示するもの
である。

【０００９】第１の発明においては表示手段１３によっ
て、例えばディスプレイ画面上で認識対象単語が自動的
に表示され、ユーザは表示されている単語の中で自分が
入力すべき単語を見つけた時点でその単語の音声入力を
行う。入力された音声は、その特徴に基づいて認識用単
語格納手段１１に格納されている全ての認識対象単語と
照合され、最も入力音声に類似した単語が認識結果とし
て音声認識手段１２から出力される。

【００１０】第１の発明の実施の形態においては、表示
手段１３による単語の自動的表示に様々な方式が用いら
れる。その方式としては、例えば認識用単語格納手段１
１に格納されている全ての単語が、自動的にスクロール
制御によって表示されたり、自動的に改ページされて表
示されたり、あるいは少なくとも１単語ずつの単位で順
次に読み出されて表示されたり、単語に付けられた番号
に対応する乱数の値に基づいて読み出されて表示された
りすることができる。これによってユーザがマウス操作
を行う必要はなくなる。

【００１１】図２は第２の発明の原理構成ブロック図で
ある。同図において単語格納手段１５は、入力音声の認
識対象となる可能性のある単を全て格納しているもので
ある。認識用単語格納手段１６は、現在の時点の入力音
声の認識対象となる単語を格納するものである。音声認
識手段１７は、入力される音声の特徴に基づいて、認識
用単語格納手段１６に格納されている全ての単語の中か
ら入力音声に最も類似した単語を求めて、認識結果とし
て出力するものである。

【００１２】表示手段１８は音声認識装置のユーザの音
声入力を助けるためのものであり、単語格納手段１５に
格納されている単語、すなわち認識対象となる可能性の
ある単語を自動的に表示するものである。表示単語抽出
手段１９は、表示手段１８によって現在までに表示され
た単語の中で、最近表示された単語を認識対象となる単
語として抽出し、認識用単語格納手段１６に格納するも
のである。

【００１３】第２の発明においては、第１の発明におけ
ると同様に単語格納手段１５に格納されている全ての単
語が例えばスクロール制御や、改ページ制御、少なくと
も１単語ずつの単位による順次読み出しの制御によって
ディスプレイ画面上に自動的に表示される。表示手段１
８によって表示された単語の中で最近表示された単語が
表示単語抽出手段１９によって抽出され、認識用単語格
納手段１６に格納されて、現在の入力音声の認識対象と
なる単語として使用される。入力音声は、この認識用単
語格納手段１６に格納されている単語と照合されて、入
力音声と最も類似した単語が認識結果として音声認識手
段１７によって出力されることになる。これによって第
２の発明では認識対象は、最近表示された単語に絞られ
ることになる。ユーザが入力する単語の種類が比較的少
なく、かつ最近表示された単語と同じ単語が多い場合に
は、このように認識対象を限定することによって音声認
識の性能を向上させることができる。

【００１４】また、本発明は入力される音声の特徴に基
づいて、認識用単語格納手段に格納されている全ての認
識対象単語の中から入力音声に最も類似する単語を求め
て認識結果とする第１の手順と、ユーザの音声入力を助
けるために、前記認識用単語格納手段に格納されている
単語を自動的に表示する第２の手順とをコンピュータに
実行させるプログラムを記憶したコンピュータ読み取り
可能な記憶媒体を構成する。

【００１５】さらに、本発明は入力される音声の特徴に
基づいて、現在の入力音声の認識対象となる単語が格納
される認識用単語格納手段に格納されている全ての認識
対象単語の中から入力音声に最も類似した単語を求めて
認識結果とする第１の手順と、前記音声認識装置のユー
ザの音声入力を助けるために、入力音声の認識対象とな
る可能性のある単語を格納した単語格納手段に格納され
ている単語を自動的に表示する第２の手順と、該第２の
手順によって現在までに表示された単語の中で最近表示
された単語を、前記認識対象となる単語として抽出し、
前記認識用単語格納手段に格納する第３の手順とをコン
ピュータに実行させるプログラムを記憶したコンピュー
タ読み取り可能な記憶媒体を構成する。

【００１６】

【発明の実施の形態】図３は本発明における音声認識装
置の第１の実施形態の構成ブロック図である。同図にお
いて従来例の図２２と同じ動作をする部分には同じ符号
を付してある。図２２と異なる部分はスクロール制御部
２１と、クロック部２２である。

【００１７】この第１の実施形態においては、単語辞書
部４に格納されている認識対象単語が表示部６によって
表示されるが、その表示はスクロール制御部２１によっ
て制御される。このスクロール動作は、図２２と異なっ
て自動的に行われる。すなわちクロック部２２の発生す
るクロック信号によって、例えば１クロック毎にスクロ
ールが行われ、単語辞書部４に格納されている認識対象
単語がｍ単語、常に画面上に表示される形式でスクロー
ル制御される。

【００１８】図４は図３の第１の実施形態における全体
処理のフローチャート、図５は図４における認識プロセ
スの処理フローチャートである。図４において処理が開
始されると、まずステップＳ１で認識プロセスが起動さ
れた後に、ステップＳ２で単語辞書部４の内容のスクロ
ール表示が開始され、ステップＳ３でディスプレイ画面
上の、例えばｍ単語のスクロール表示の１行スクロール
が繰り返される。

【００１９】図５の認識プロセスでは、まずステップＳ
５でマイク１からの音声入力が受け取られ、ステップＳ
６でその音声が分析部２によって分析され、ステップＳ
７でその分析結果から特徴抽出部３によって入力音声の
特徴が抽出され、ステップＳ８で、その特徴が単語照合
部５によって、単語辞書部４に格納されている全ての単
語と照合され、ステップＳ９でその照合結果、すなわち
最も類似した単語が認識結果としてアプリケーションに
通知されて、マイク１からの次の音声入力を待つ状態と
なる。

【００２０】図６は図３の第１の実施形態における複数
単語の表示イメージの説明図である。同図においては山
手線の駅名が連続した順序で１つの画面上に５つ表示さ
れ、クロック毎に１駅ずつ上にずれる形式でスクロール
表示される。

【００２１】図７は図３におけるスクロール制御部２１
の詳細構成ブロック図である。同図においてスクロール
制御部２１は、１つの画面上での表示開始位置、例えば
一番上の位置の単語の番号を格納する表示開始単語番号
レジスタ２５、表示開始単語番号レジスタ２５の出力Ａ
と１つの画面上に表示される表示単語数から１を減算し
たＢとを加算する加算器２６、加算器２６の出力を１つ
の画面上での表示終了位置、例えば一番下の単語の番号
として格納する表示終了単語番号レジスタ２７、図３の
単語辞書部４に格納されている全ての単語数Ａと加算器
２６の出力Ｂとを比較して、ＢがＡを越えた時にカウン
タ２９をリセットする比較器２８、クロック信号によっ
てカウント値がインクリメントされ、表示開始単語番号
レジスタ２５にカウント値を出力するカウンタ２９から
構成されている。

【００２２】図８はクロック信号に対応する表示開始単
語番号と表示終了単語番号の説明図である。同図におい
て１つの画面上に表示される単語の数はｍであり、図３
の単語辞書部４に格納されている単語の数はｎであるも
のと仮定している。クロックが進む毎に表示開示単語番
号が大きくなり、ｎ番目の単語が表示開始位置にきた時
には表示終了単語番号はｎ＋ｍ−１となる。そして次の
クロックでは表示開始単語番号は１となり、クロックの
進行と共に単語表示のスクロール制御が繰り返される。

【００２３】図９は音声認識装置の第２の実施形態の構
成ブロック図である。同図を図３の第１の実施形態と比
較すると、スクロール制御部２１に代わって一単語読み
出し部３１が備えられている点だけが異なっている。こ
の第２の実施形態においては、単語辞書部４に格納され
ている音声認識の対象語の表示にあたってスクロール制
御が用いられず、単語辞書部４の内容が１単語ずつ一単
語読み出し部３１に従って読み出され、表示部６によっ
て順次表示される。この１単語ずつの読み出しは、クロ
ック部２２が出力するクロック信号に同期して行われ
る。なおここでは１単語ずつを読み出すものとしたが、
実施形態としては１単語ずつに限定されず、例えば２単
語ずつとか、３単語ずつのように語数を増やしたり、例
えばユーザからの指示に応じて読み出すべき単語数を変
化させたりすることも当然可能である。

【００２４】図１０は第２の実施形態における全体処理
のフローチャートである。同図において処理が開始さ
れると、まずステップＳ１１で認識プロセスが起動され
る。この認識プロセスの処理は図５におけると同じであ
るので、その説明を省略する。

【００２５】続いてステップＳ１２でポインタが単語辞
書部４の先頭の単語を指すように置かれ、ステップＳ１
３でポインタで指定された単語が表示され、ステップＳ
１４でポインタが１単語分進められ、ステップＳ１５で
ポインタが単語辞書部４に格納されている単語の最後に
達したか否かが判定され、まだ達していない場合にはス
テップＳ１３以降の処理が繰り返される。単語辞書部４
に格納されている単語の最後に達したと判定されると、
ステップＳ１２でポインタが単語辞書の先頭に戻された
後に、ステップＳ１３以降の処理が繰り返される。

【００２６】図１１は第２の実施形態において認識対象
語が１単語ずつ順次読み出される場合の表示イメージの
説明図である。同図に示すように、山手線の駅名がクロ
ック毎に１つずつ読み出されて表示される。

【００２７】図１２は図９の一単語読み出し部３１の構
成ブロック図である。同図において一単語読み出し部３
１は読み出すべき単語番号を指定するカウンタ３３、単
語辞書部４から読み出された単語が一時的に格納され、
その単語が表示部６に出力される単語バッファ３４から
構成されている。カウンタ３３には、カウント値をイン
クリメントさせるためのクロック信号、および単語辞書
部４に格納されている単語数ｎが入力され、カウンタ３
３のカウント値はクロック信号に同期してインクリメン
トされ、ｎに達した時点で自動的にリセットされる。

【００２８】図１３は音声認識装置の第３の実施形態の
構成ブロック図である。同図を図９の第２の実施形態と
比較すると、クロック部２２に代わって乱数発生部３６
が備えられている点が異なっている。一単語読み出し部
３５は、乱数発生部３６によって発生される乱数の値の
単語番号を持つ単語を単語辞書部４から一単語ずつ読み
出して、その単語が表示部６によって表示される。

【００２９】図１４は図１３の第３の実施形態における
全体処理のフローチャートである。同図において処理が
開始されると、ステップＳ１６で認識プロセスが起動さ
れる。この認識プロセスによる処理は図５と同じである
ので、その説明を省略する。続いてステップＳ１７で単
語辞書部４から、乱数発生部３６が出力する乱数に基づ
いて、認識対象単語が一単語ランダムに取り出され、ス
テップＳ１８でその単語が表示され、以後ステップＳ１
７および１８の処理が繰り返される。

【００３０】図１５は図１３における一単語読み出し部
３５の構成ブロック図である。同図において一単語読み
出し部３５は、読み出すべき単語番号を単語辞書部４に
与える単語番号バッファ３８、単語辞書部４から読み出
された単語を一時的に格納し、表示部６に出力するため
の単語バッファ３９から構成されている。そして乱数発
生部３６によって出力される乱数が単語番号バッファ３
８に格納され、その乱数によって指定される単語番号を
持つ認識対象単語が単語辞書部４から読み出されて、単
語バッファ３９を介して表示部６によって表示されるこ
とになる。

【００３１】図１６は音声認識装置の第４の実施形態の
構成ブロック図である。同図を第１の実施形態を示す図
３と比較すると、図３の構成要素に加えて認識用一時単
語辞書部４１と表示単語抽出部４２が追加され、単語辞
書部４の格納内容はスクロール制御部２１のみに与えら
れる点が異なっている。この第４の実施形態では、単語
照合部５において用いられる認識対象の単語は単語辞書
部４に格納されている単語ではなく、認識用一時単語辞
書部４１に格納されている単語だけに限定される。この
認識用一時単語辞書部４１に格納される認識用単語は、
表示単語抽出部４２によって抽出された単語である。

【００３２】この表示単語抽出部４２の動作については
更に後述するが、抽出部４２は表示部６によって最近表
示された単語を抽出して、認識用単語として認識用一時
単語辞書部４１に格納する。表示部６によって表示され
る単語は、単語照合部５の出力、すなわち認識結果とし
ての単語と、スクロール制御部２１によってスクロール
制御される、単語辞書部４に格納されている単語のうち
の一部であるが、表示単語抽出部４２によって抽出され
る認識用単語には単語照合部５の出力、すなわち認識結
果としての単語は含まれない。

【００３３】本発明が対象とする音声認識装置は、前述
のようにユーザが音声認識の対象語をよく知らないよう
な場合を対象としている。例えばコマンドを入力するた
めの音声認識装置では、ユーザはコマンドの名前をあま
り知らず、表示部６によって表示されるコマンドの中か
ら自分の入力すべきコマンドを知って、それを音声入力
することになる。

【００３４】このような場合にはユーザが入力したいコ
マンドの種類はそれほど多くなく、表示部６によって最
近表示されたものを再度入力することが多くなるため、
認識用一時単語辞書部４１に格納され、単語照合部５に
よって音声認識の対象として用いられる単語を最近表示
されたものに限定することによって認識の速度を向上さ
せ、また認識エラーを減少させることができる。

【００３５】一般に音声認識においては入力される音声
が１つの音毎に正しく認識されることが要求される。そ
こで認識の対象となる単語が多ければ多いほど、単語照
合部５による照合に時間がかかり、またマイクの特性や
人の声のくせなどのために、正しい認識を行うことが困
難になり、認識エラーが生ずる可能性がある。この第４
の実施形態においては、単語照合部５における認識対象
を表示部６によって最近表示されたものに限定すること
によって、認識に要する時間を減少させ、かつ認識エラ
ーを少なくすることが可能となる。

【００３６】図１７は第４の実施形態における全体処理
のフローチャート、図１８は認識プロセスによる処理の
フローチャートである。図１７を第１の実施形態に対す
る図４と比較すると、ステップＳ３において１行のスク
ロールが行われた後に、ステップＳ２０で最近表示され
た単語を抽出し、認識用一時単語辞書部４１に格納する
処理が追加されている点が異なっている。

【００３７】図１８を第１〜第３の実施形態に対する図
５と比較すると、ステップＳ８で入力音声の特徴が単語
辞書部４に格納されている単語と照合される代わりに、
ステップＳ２１で認識用一時単語辞書部４１に格納され
ている単語と照合される点が異なっている。

【００３８】図１９は図１６における表示単語抽出部４
２の構成ブロック図である。図２０はその中でのリング
バッファにおける処理内容の説明図である。図１９にお
いて表単語抽出部４２は、表示部６に表示されている単
語を格納する表示単語バッファ４４、表示単語バッファ
４４の出力を格納するリングバッファ４５、リングバッ
ファ４５の内容を読み出し、認識用一時単語辞書部４１
に出力する読み出し部４６から構成されている。

【００３９】図２０においてリングバッファ４５のバッ
ファメモリには、例として山手線の駅の名前が７つ格納
されている。表示部６に現在表示され、図１９の表示単
語バッファ４４に格納された単語は、バッファメモリの
内部で一番古いデータに上書きする形式で書込まれる。
そしてバッファメモリに格納されている単語、ここでは
７つの駅の名前が、読み出し部４６を介して認識用一時
単語辞書部４１に与えられることになる。

【００４０】図２１は音声認識装置の第５の実施形態の
構成ブロック図である。同図を第４の実施形態を示す図
１６と比較すると、スクロール制御部２１、クロック部
２２に代わって、一単語読み出し部３５、乱数発生部３
６が備えられている点が異なっている。この一単語読み
出し部３５、および乱数発生部３６の動作は図１３に示
した第３の実施形態におけると同じであり、単語辞書部
４に格納されている単語は、乱数発生部３６の発生する
乱数に対応する単語番号に基づいて、一単語読み出し部
３５によって一単語ずつ読み出され、表示部６によって
表示されることになる点だけが第４の実施形態と異なっ
ている。なお乱数発生部３６に代わってクロック部を設
け、クロック部が発生するクロック信号に従って、一単
語読み出し部３５が一単語ずつ読み出しを行うことも当
然可能である。

【００４１】

【発明の効果】以上詳細に説明したように、本発明によ
ればユーザはディスプレイ画面上に自動的に表示される
音声認識対象単語の中から自分の入力したい単語を見つ
けて単語の入力を行うことができ、マウスの操作が不必
要となり、音声認識装置の操作性が向上する。また最近
表示された単語だけを音声認識対象として用いることに
よって認識速度を向上させ、認識エラーを減少させるこ
とができ、音声認識装置の実用性の向上に寄与するとこ
ろが大きい。

【図面の簡単な説明】

【図１】第１の発明の原理構成ブロック図である。

【図２】第２の発明の原理構成ブロック図である。

【図３】本発明における音声認識装置の第１の実施形態
の構成ブロック図である。

【図４】第１の実施形態における全体処理のフローチャ
ートである。

【図５】第１の実施形態における認識プロセスの処理フ
ローチャートである。

【図６】第１の実施形態における複数単語の表示イメー
ジの説明図である。

【図７】図３におけるスクロール制御部の構成ブロック
図である。

【図８】図７における表示開始単語番号と表示終了単語
番号のクロック信号による変化の説明図である。

【図９】音声認識装置の第２の実施形態の構成ブロック
図である。

【図１０】第２の実施形態における全体処理のフローチ
ャートである。

【図１１】第２の実施形態における一単語読み出しの表
示イメージの説明図である。

【図１２】図９における一単語読み出し部の構成ブロッ
ク図である。

【図１３】音声認識装置の第３の実施形態の構成ブロッ
ク図である。

【図１４】第３の実施形態における全体処理フローチャ
ートである。

【図１５】図１３における一単語読み出し部の構成ブロ
ック図である。

【図１６】音声認識装置の第４の実施形態の構成ブロッ
ク図である。

【図１７】第４の実施形態における全体処理フローチャ
ートである。

【図１８】第４の実施形態における認識プロセスの処理
フローチャートである。

【図１９】図１６における表示単語抽出部の構成ブロッ
ク図である。

【図２０】図１９におけるリングバッファの処理内容の
説明図である。

【図２１】音声認識装置の第５の実施形態の構成ブロッ
ク図である。

【図２２】音声認識装置の従来例の構成ブロック図であ
る。

【符号の説明】

１マイク２分析部３特徴抽出部４単語辞書部５単語照合部６表示部１１認識用単語格納手段１２，１７音声認識手段１３，１８表示手段１５単語格納手段１６認識用単語格納手段１９表示単語抽出手段２１スクロール制御部２２クロック部３１，３５一単語読み出し部３６乱数発生部４１認識用一時単語辞書部４２表示単語抽出部

Claims

【特許請求の範囲】

【請求項１】入力される音声を認識する音声認識装置
において、該入力音声の認識対象としての単語を格納した認識用単
語格納手段と、入力される音声の特徴に基づいて、該認識用単語格納手
段に格納されている全ての認識対象単語の中から入力音
声に最も類似する単語を求めて認識結果とする音声認識
手段と、前記音声認識装置のユーザの音声入力を助けるために、
前記認識用単語格納手段に格納されている単語を自動的
に表示する表示手段とを備えることを特徴とする音声認
識装置における認識対象表示方式。
【請求項２】前記表示手段が、前記認識用単語格納手
段に格納されている認識対象単語をディスプレイ画面上
で自動的にスクロールさせながら表示することを特徴と
する請求項１記載の音声認識装置における認識対象表示
方式。
【請求項３】前記表示手段が、前記認識用単語格納手
段に格納されている認識対象単語をディスプレイ画面上
で自動的に改ページさせながら表示することを特徴とす
る請求項１記載の音声認識装置における認識対象表示方
式。
【請求項４】前記表示手段が、前記認識用単語格納手
段に格納されている認識対象単語を、少なくとも１単語
ずつの単位で順次読み出して、ディスプレイ画面上に自
動的に表示することを特徴とする請求項１記載の音声認
識装置における認識対象表示方式。
【請求項５】前記表示手段が、前記スクロール、また
は改ページのタイミング、あるいは少なくとも１単語ず
つを単位とする順次読み出しのタイミングをクロック信
号に基づいて決定することを特徴とする請求項２、３、
または４記載の音声認識装置における認識対象表示方
式。
【請求項６】前記表示手段が、前記認識用単語格納手
段に格納されている認識対象単語を、少なくとも１単語
以上ずつの単位で単語に付けられた番号に対応する乱数
の値に基づいて読み出して、ディスプレイ画面上に自動
的に表示することを特徴とする請求項１記載の音声認識
装置における認識対象表示方式。
【請求項７】入力される音声を認識する音声認識装置
において、入力される音声の特徴に基づいて、現在の入力音声の認
識対象となる単語が格納される認識用単語格納手段に格
納されている全ての認識対象単語の中から入力音声に最
も類似した単語を求めて認識結果とする音声認識手段
と、前記音声認識装置のユーザの音声入力を助けるために、
入力音声の認識対象となる可能性のある単語を格納した
単語格納手段に格納されている単語を自動的に表示する
表示手段と、該表示手段によって現在までに表示された単語の中で最
近表示された単語を、前記認識対象となる単語として抽
出し、前記認識用単語格納手段に格納する表示単語抽出
手段とを備えることを特徴とする音声認識装置における
認識対象表示方式。
【請求項８】前記表示手段が、前記認識用単語格納手
段に格納されている認識対象単語をディスプレイ画面上
で自動的にスクロールさせながら表示することを特徴と
する請求項７記載の音声認識装置における認識対象表示
方式。
【請求項９】前記表示手段が、前記認識用単語格納手
段に格納されている認識対象単語をディスプレイ画面上
で自動的に改ページさせながら表示することを特徴とす
る請求項７記載の音声認識装置における認識対象表示方
式。
【請求項１０】前記表示手段が、前記認識用単語格納
手段に格納されている認識対象単語を、少なくとも１単
語ずつの単位で順次読み出して、ディスプレイ画面上に
自動的に表示することを特徴とする請求項７記載の音声
認識装置における認識対象表示方式。
【請求項１１】前記表示手段が、前記スクロール、ま
たは改ページのタイミング、あるいは少なくとも１単語
ずつを単位とする順次読み出しのタイミングをクロック
信号に基づいて決定することを特徴とする請求項８、
９、または１０記載の音声認識装置における認識対象表
示方式。
【請求項１２】前記表示手段が、前記認識用単語格納
手段に格納されている認識対象単語を、少なくとも１単
語以上ずつの単位で単語に付けられた番号に対応する乱
数の値に基づいて読み出して、ディスプレイ画面上に自
動的に表示することを特徴とする請求項７記載の音声認
識装置における認識対象表示方式。
【請求項１３】入力される音声の特徴に基づいて、認
識用単語格納手段に格納されている全ての認識対象単語
の中から入力音声に最も類似する単語を求めて認識結果
とする第１の手順と、ユーザの音声入力を助けるために、前記認識用単語格納
手段に格納されている単語を自動的に表示する第２の手
順とをコンピュータに実行させるプログラムを記憶した
コンピュータ読み取り可能な記憶媒体。
【請求項１４】入力される音声の特徴に基づいて、現
在の入力音声の認識対象となる単語が格納される認識用
単語格納手段に格納されている全ての認識対象単語の中
から入力音声に最も類似した単語を求めて認識結果とす
る第１の手順と、前記音声認識装置のユーザの音声入力を助けるために、
入力音声の認識対象となる可能性のある単語を格納した
単語格納手段に格納されている単語を自動的に表示する
第２の手順と、該第２の手順によって現在までに表示された単語の中で
最近表示された単語を、前記認識対象となる単語として
抽出し、前記認識用単語格納手段に格納する第３の手順
とをコンピュータに実行させるプログラムを記憶したコ
ンピュータ読み取り可能な記憶媒体。
【請求項１５】入力される音声を認識する音声認識装
置において、入力音声の認識対象としての単語を格納する第１の手順
と、入力される音声の特徴に基づいて、格納されている全て
の認識対象単語の中から入力音声に最も類似する単語を
求めて認識結果とする第２の手順と、ユーザの音声入力を助けるために、格納されている単語
を自動的に表示する第３の手順とからなることを特徴と
する音声認識装置における認識対象表示方法。
【請求項１６】入力される音声の特徴に基づいて、現
在の入力音声の認識対象となる全ての認識対象単語の中
から入力音声に最も類似した単語を求めて認識結果とす
る第１の手順と、前記音声認識装置のユーザの音声入力を助けるために、
入力音声の認識対象となる可能性のある単語を格納した
単語格納手段に格納されている単語を自動的に表示する
第２の手順と、該第２の手順によって現在までに表示された単語の中で
最近表示された単語を、前記認識対象となる単語として
抽出し、前記認識用単語格納手段に格納する第３の手順
とを備えることを特徴とする音声認識方法。