JPH1152984A - 音声認識装置における認識対象表示方式 - Google Patents
音声認識装置における認識対象表示方式Info
- Publication number
- JPH1152984A JPH1152984A JP9215308A JP21530897A JPH1152984A JP H1152984 A JPH1152984 A JP H1152984A JP 9215308 A JP9215308 A JP 9215308A JP 21530897 A JP21530897 A JP 21530897A JP H1152984 A JPH1152984 A JP H1152984A
- Authority
- JP
- Japan
- Prior art keywords
- word
- recognition
- speech
- input
- display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims description 62
- 238000010586 diagram Methods 0.000 description 34
- 238000000605 extraction Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 3
- 230000008602 contraction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
おいても、音声認識装置の操作性を向上させ、その効用
を大きくする。 【解決手段】 認識対象単語を格納する手段11と、入
力される音声の特徴に基づいて、手段11に格納されて
いる全ての単語の中で入力音声に最も類似する単語を求
めて認識結果とする手段12と、ユーザの音声入力を助
けるために、手段11に格納されている単語を自動的に
表示する手段13とを備える。
Description
り、更に詳しくは音声認識の認識対象となる単語をディ
スプレイ画面上に自動的に表示することによってユーザ
の音声入力を助ける、音声認識装置における認識対象表
示方式に関する。
ロック図である。同図において音声認識装置は音声が入
力され、電気信号に変換されるマイク1、例えば高速フ
ーリエ変換や、線形予測分析などを用いて入力された音
声を分析する分析部2、音声の分析結果から特徴を抽出
する特徴抽出部3、認識対象としての単語を格納する単
語辞書部4、単語辞書部4に格納されている全ての単語
と入力音声を、特徴抽出部3によって抽出された特徴に
基づいて照合し、入力音声に最も類似した単語を求める
単語照合部5、単語照合部5によって出力される単語の
認識結果と、単語辞書部4に格納されている単語を表示
する表示部6、単語辞書部4に格納されている単語の表
示部6による表示に際して、単語辞書部4に格納されて
いる単語の数が多く、1つの画面上に全ての単語を表示
することができないため、表示単語のスクロールを行う
スクロール制御部7、スクロール制御部7にスクロール
の指示を与えるためのマウス8を備えている。
4に格納されている全ての単語の照合が行われるが、そ
の手法としては、例えば入力音声の時間方向の伸び縮み
を吸収するための手法としてのDPマッチング法、また
は単語音声の確率モデルを使用する隠れマルコフモデル
法(HMM法)などが用いられる。この照合の結果とし
ての認識結果は、前述のように表示部6に表示される
が、本発明が対象とする音声認識装置では、認識結果と
共に音声認識の対象としての単語辞書部4に格納されて
いる単語が、同時に表示部6によって表示される。
識対象としての単語を音声認識装置のユーザが必ずしも
よく知らないということを前提としている。音声認識装
置が、例えばコマンドの入力用に使用されるものである
時、ユーザはコマンドをよく知っていないため、表示部
6によって表示されるコマンドを見ながら、入力すべき
コマンドが表示された時にそのコマンドを音声入力する
ことによって、コマンドの入力を実行できるものとす
る。そのためにスクロール制御部7によって、単語辞書
部4に格納されている全てのコマンドをディスプレイ画
面上でスクロールさせながら表示して、ユーザのコマン
ド入力を助けることになる。
が対象とする音声認識装置では、どのような単語が認識
対象となっているかをユーザはあまりよく知らず、図2
2においてはマウス8によってディスプレイ画面上に表
示されている認識対象単語、例えばコマンドをスクロー
ルさせながら入力すべきコマンドを探して、音声入力を
行うことが必要であった。このように従来例ではマウス
を使って入力すべき単語を探しているためディスプレイ
画面上にその単語を見つけた時にマウスによってその単
語をクリックすれば、その単語、例えばコマンドの入力
を行うことができることになり、そもそも音声認識を用
いる必要性がはっきりしないという問題点があった。
例えばディスプレイ画面上で自動的にスクロールさせな
がら表示することにより、マウス操作を行うことを不必
要にさせ、音声認識装置の効用を大きくすることであ
る。
の原理構成ブロック図である。これらの図は入力される
音声を認識する音声認識装置、特に認識対象の単語をデ
ィスプレイ画面上に表示する音声認識装置の原理構成ブ
ロック図である。
ある。同図において、認識用単語格納手段11は入力音
声の認識対象としての単語、例えばコマンドの全てを格
納しているものである。音声認識手段12は入力される
音声の特徴に基づいて、認識用単語格納手段11に格納
されている全ての認識対象単語、例えばコマンドの中か
ら最も入力音声に類似した単語を求めて、認識結果とし
て出力するものである。更に表示手段13は音声認識装
置のユーザの音声入力を助けるために、認識用単語格納
手段11に格納されている単語を自動的に表示するもの
である。
て、例えばディスプレイ画面上で認識対象単語が自動的
に表示され、ユーザは表示されている単語の中で自分が
入力すべき単語を見つけた時点でその単語の音声入力を
行う。入力された音声は、その特徴に基づいて認識用単
語格納手段11に格納されている全ての認識対象単語と
照合され、最も入力音声に類似した単語が認識結果とし
て音声認識手段12から出力される。
手段13による単語の自動的表示に様々な方式が用いら
れる。その方式としては、例えば認識用単語格納手段1
1に格納されている全ての単語が、自動的にスクロール
制御によって表示されたり、自動的に改ページされて表
示されたり、あるいは少なくとも1単語ずつの単位で順
次に読み出されて表示されたり、単語に付けられた番号
に対応する乱数の値に基づいて読み出されて表示された
りすることができる。これによってユーザがマウス操作
を行う必要はなくなる。
ある。同図において単語格納手段15は、入力音声の認
識対象となる可能性のある単を全て格納しているもので
ある。認識用単語格納手段16は、現在の時点の入力音
声の認識対象となる単語を格納するものである。音声認
識手段17は、入力される音声の特徴に基づいて、認識
用単語格納手段16に格納されている全ての単語の中か
ら入力音声に最も類似した単語を求めて、認識結果とし
て出力するものである。
声入力を助けるためのものであり、単語格納手段15に
格納されている単語、すなわち認識対象となる可能性の
ある単語を自動的に表示するものである。表示単語抽出
手段19は、表示手段18によって現在までに表示され
た単語の中で、最近表示された単語を認識対象となる単
語として抽出し、認識用単語格納手段16に格納するも
のである。
ると同様に単語格納手段15に格納されている全ての単
語が例えばスクロール制御や、改ページ制御、少なくと
も1単語ずつの単位による順次読み出しの制御によって
ディスプレイ画面上に自動的に表示される。表示手段1
8によって表示された単語の中で最近表示された単語が
表示単語抽出手段19によって抽出され、認識用単語格
納手段16に格納されて、現在の入力音声の認識対象と
なる単語として使用される。入力音声は、この認識用単
語格納手段16に格納されている単語と照合されて、入
力音声と最も類似した単語が認識結果として音声認識手
段17によって出力されることになる。これによって第
2の発明では認識対象は、最近表示された単語に絞られ
ることになる。ユーザが入力する単語の種類が比較的少
なく、かつ最近表示された単語と同じ単語が多い場合に
は、このように認識対象を限定することによって音声認
識の性能を向上させることができる。
づいて、認識用単語格納手段に格納されている全ての認
識対象単語の中から入力音声に最も類似する単語を求め
て認識結果とする第1の手順と、ユーザの音声入力を助
けるために、前記認識用単語格納手段に格納されている
単語を自動的に表示する第2の手順とをコンピュータに
実行させるプログラムを記憶したコンピュータ読み取り
可能な記憶媒体を構成する。
基づいて、現在の入力音声の認識対象となる単語が格納
される認識用単語格納手段に格納されている全ての認識
対象単語の中から入力音声に最も類似した単語を求めて
認識結果とする第1の手順と、前記音声認識装置のユー
ザの音声入力を助けるために、入力音声の認識対象とな
る可能性のある単語を格納した単語格納手段に格納され
ている単語を自動的に表示する第2の手順と、該第2の
手順によって現在までに表示された単語の中で最近表示
された単語を、前記認識対象となる単語として抽出し、
前記認識用単語格納手段に格納する第3の手順とをコン
ピュータに実行させるプログラムを記憶したコンピュー
タ読み取り可能な記憶媒体を構成する。
置の第1の実施形態の構成ブロック図である。同図にお
いて従来例の図22と同じ動作をする部分には同じ符号
を付してある。図22と異なる部分はスクロール制御部
21と、クロック部22である。
部4に格納されている認識対象単語が表示部6によって
表示されるが、その表示はスクロール制御部21によっ
て制御される。このスクロール動作は、図22と異なっ
て自動的に行われる。すなわちクロック部22の発生す
るクロック信号によって、例えば1クロック毎にスクロ
ールが行われ、単語辞書部4に格納されている認識対象
単語がm単語、常に画面上に表示される形式でスクロー
ル制御される。
処理のフローチャート、図5は図4における認識プロセ
スの処理フローチャートである。図4において処理が開
始されると、まずステップS1で認識プロセスが起動さ
れた後に、ステップS2で単語辞書部4の内容のスクロ
ール表示が開始され、ステップS3でディスプレイ画面
上の、例えばm単語のスクロール表示の1行スクロール
が繰り返される。
5でマイク1からの音声入力が受け取られ、ステップS
6でその音声が分析部2によって分析され、ステップS
7でその分析結果から特徴抽出部3によって入力音声の
特徴が抽出され、ステップS8で、その特徴が単語照合
部5によって、単語辞書部4に格納されている全ての単
語と照合され、ステップS9でその照合結果、すなわち
最も類似した単語が認識結果としてアプリケーションに
通知されて、マイク1からの次の音声入力を待つ状態と
なる。
単語の表示イメージの説明図である。同図においては山
手線の駅名が連続した順序で1つの画面上に5つ表示さ
れ、クロック毎に1駅ずつ上にずれる形式でスクロール
表示される。
の詳細構成ブロック図である。同図においてスクロール
制御部21は、1つの画面上での表示開始位置、例えば
一番上の位置の単語の番号を格納する表示開始単語番号
レジスタ25、表示開始単語番号レジスタ25の出力A
と1つの画面上に表示される表示単語数から1を減算し
たBとを加算する加算器26、加算器26の出力を1つ
の画面上での表示終了位置、例えば一番下の単語の番号
として格納する表示終了単語番号レジスタ27、図3の
単語辞書部4に格納されている全ての単語数Aと加算器
26の出力Bとを比較して、BがAを越えた時にカウン
タ29をリセットする比較器28、クロック信号によっ
てカウント値がインクリメントされ、表示開始単語番号
レジスタ25にカウント値を出力するカウンタ29から
構成されている。
語番号と表示終了単語番号の説明図である。同図におい
て1つの画面上に表示される単語の数はmであり、図3
の単語辞書部4に格納されている単語の数はnであるも
のと仮定している。クロックが進む毎に表示開示単語番
号が大きくなり、n番目の単語が表示開始位置にきた時
には表示終了単語番号はn+m−1となる。そして次の
クロックでは表示開始単語番号は1となり、クロックの
進行と共に単語表示のスクロール制御が繰り返される。
成ブロック図である。同図を図3の第1の実施形態と比
較すると、スクロール制御部21に代わって一単語読み
出し部31が備えられている点だけが異なっている。こ
の第2の実施形態においては、単語辞書部4に格納され
ている音声認識の対象語の表示にあたってスクロール制
御が用いられず、単語辞書部4の内容が1単語ずつ一単
語読み出し部31に従って読み出され、表示部6によっ
て順次表示される。この1単語ずつの読み出しは、クロ
ック部22が出力するクロック信号に同期して行われ
る。なおここでは1単語ずつを読み出すものとしたが、
実施形態としては1単語ずつに限定されず、例えば2単
語ずつとか、3単語ずつのように語数を増やしたり、例
えばユーザからの指示に応じて読み出すべき単語数を変
化させたりすることも当然可能である。
のフローチャートである。 同図において処理が開始さ
れると、まずステップS11で認識プロセスが起動され
る。この認識プロセスの処理は図5におけると同じであ
るので、その説明を省略する。
書部4の先頭の単語を指すように置かれ、ステップS1
3でポインタで指定された単語が表示され、ステップS
14でポインタが1単語分進められ、ステップS15で
ポインタが単語辞書部4に格納されている単語の最後に
達したか否かが判定され、まだ達していない場合にはス
テップS13以降の処理が繰り返される。単語辞書部4
に格納されている単語の最後に達したと判定されると、
ステップS12でポインタが単語辞書の先頭に戻された
後に、ステップS13以降の処理が繰り返される。
語が1単語ずつ順次読み出される場合の表示イメージの
説明図である。同図に示すように、山手線の駅名がクロ
ック毎に1つずつ読み出されて表示される。
成ブロック図である。同図において一単語読み出し部3
1は読み出すべき単語番号を指定するカウンタ33、単
語辞書部4から読み出された単語が一時的に格納され、
その単語が表示部6に出力される単語バッファ34から
構成されている。カウンタ33には、カウント値をイン
クリメントさせるためのクロック信号、および単語辞書
部4に格納されている単語数nが入力され、カウンタ3
3のカウント値はクロック信号に同期してインクリメン
トされ、nに達した時点で自動的にリセットされる。
構成ブロック図である。同図を図9の第2の実施形態と
比較すると、クロック部22に代わって乱数発生部36
が備えられている点が異なっている。一単語読み出し部
35は、乱数発生部36によって発生される乱数の値の
単語番号を持つ単語を単語辞書部4から一単語ずつ読み
出して、その単語が表示部6によって表示される。
全体処理のフローチャートである。同図において処理が
開始されると、ステップS16で認識プロセスが起動さ
れる。この認識プロセスによる処理は図5と同じである
ので、その説明を省略する。続いてステップS17で単
語辞書部4から、乱数発生部36が出力する乱数に基づ
いて、認識対象単語が一単語ランダムに取り出され、ス
テップS18でその単語が表示され、以後ステップS1
7および18の処理が繰り返される。
35の構成ブロック図である。同図において一単語読み
出し部35は、読み出すべき単語番号を単語辞書部4に
与える単語番号バッファ38、単語辞書部4から読み出
された単語を一時的に格納し、表示部6に出力するため
の単語バッファ39から構成されている。そして乱数発
生部36によって出力される乱数が単語番号バッファ3
8に格納され、その乱数によって指定される単語番号を
持つ認識対象単語が単語辞書部4から読み出されて、単
語バッファ39を介して表示部6によって表示されるこ
とになる。
構成ブロック図である。同図を第1の実施形態を示す図
3と比較すると、図3の構成要素に加えて認識用一時単
語辞書部41と表示単語抽出部42が追加され、単語辞
書部4の格納内容はスクロール制御部21のみに与えら
れる点が異なっている。この第4の実施形態では、単語
照合部5において用いられる認識対象の単語は単語辞書
部4に格納されている単語ではなく、認識用一時単語辞
書部41に格納されている単語だけに限定される。この
認識用一時単語辞書部41に格納される認識用単語は、
表示単語抽出部42によって抽出された単語である。
更に後述するが、抽出部42は表示部6によって最近表
示された単語を抽出して、認識用単語として認識用一時
単語辞書部41に格納する。表示部6によって表示され
る単語は、単語照合部5の出力、すなわち認識結果とし
ての単語と、スクロール制御部21によってスクロール
制御される、単語辞書部4に格納されている単語のうち
の一部であるが、表示単語抽出部42によって抽出され
る認識用単語には単語照合部5の出力、すなわち認識結
果としての単語は含まれない。
のようにユーザが音声認識の対象語をよく知らないよう
な場合を対象としている。例えばコマンドを入力するた
めの音声認識装置では、ユーザはコマンドの名前をあま
り知らず、表示部6によって表示されるコマンドの中か
ら自分の入力すべきコマンドを知って、それを音声入力
することになる。
マンドの種類はそれほど多くなく、表示部6によって最
近表示されたものを再度入力することが多くなるため、
認識用一時単語辞書部41に格納され、単語照合部5に
よって音声認識の対象として用いられる単語を最近表示
されたものに限定することによって認識の速度を向上さ
せ、また認識エラーを減少させることができる。
が1つの音毎に正しく認識されることが要求される。そ
こで認識の対象となる単語が多ければ多いほど、単語照
合部5による照合に時間がかかり、またマイクの特性や
人の声のくせなどのために、正しい認識を行うことが困
難になり、認識エラーが生ずる可能性がある。この第4
の実施形態においては、単語照合部5における認識対象
を表示部6によって最近表示されたものに限定すること
によって、認識に要する時間を減少させ、かつ認識エラ
ーを少なくすることが可能となる。
のフローチャート、図18は認識プロセスによる処理の
フローチャートである。図17を第1の実施形態に対す
る図4と比較すると、ステップS3において1行のスク
ロールが行われた後に、ステップS20で最近表示され
た単語を抽出し、認識用一時単語辞書部41に格納する
処理が追加されている点が異なっている。
5と比較すると、ステップS8で入力音声の特徴が単語
辞書部4に格納されている単語と照合される代わりに、
ステップS21で認識用一時単語辞書部41に格納され
ている単語と照合される点が異なっている。
2の構成ブロック図である。図20はその中でのリング
バッファにおける処理内容の説明図である。図19にお
いて表単語抽出部42は、表示部6に表示されている単
語を格納する表示単語バッファ44、表示単語バッファ
44の出力を格納するリングバッファ45、リングバッ
ファ45の内容を読み出し、認識用一時単語辞書部41
に出力する読み出し部46から構成されている。
ファメモリには、例として山手線の駅の名前が7つ格納
されている。表示部6に現在表示され、図19の表示単
語バッファ44に格納された単語は、バッファメモリの
内部で一番古いデータに上書きする形式で書込まれる。
そしてバッファメモリに格納されている単語、ここでは
7つの駅の名前が、読み出し部46を介して認識用一時
単語辞書部41に与えられることになる。
構成ブロック図である。同図を第4の実施形態を示す図
16と比較すると、スクロール制御部21、クロック部
22に代わって、一単語読み出し部35、乱数発生部3
6が備えられている点が異なっている。この一単語読み
出し部35、および乱数発生部36の動作は図13に示
した第3の実施形態におけると同じであり、単語辞書部
4に格納されている単語は、乱数発生部36の発生する
乱数に対応する単語番号に基づいて、一単語読み出し部
35によって一単語ずつ読み出され、表示部6によって
表示されることになる点だけが第4の実施形態と異なっ
ている。なお乱数発生部36に代わってクロック部を設
け、クロック部が発生するクロック信号に従って、一単
語読み出し部35が一単語ずつ読み出しを行うことも当
然可能である。
ればユーザはディスプレイ画面上に自動的に表示される
音声認識対象単語の中から自分の入力したい単語を見つ
けて単語の入力を行うことができ、マウスの操作が不必
要となり、音声認識装置の操作性が向上する。また最近
表示された単語だけを音声認識対象として用いることに
よって認識速度を向上させ、認識エラーを減少させるこ
とができ、音声認識装置の実用性の向上に寄与するとこ
ろが大きい。
の構成ブロック図である。
ートである。
ローチャートである。
ジの説明図である。
図である。
番号のクロック信号による変化の説明図である。
図である。
ャートである。
示イメージの説明図である。
ク図である。
ク図である。
ートである。
ック図である。
ク図である。
ートである。
フローチャートである。
ク図である。
説明図である。
ク図である。
る。
Claims (16)
- 【請求項1】 入力される音声を認識する音声認識装置
において、 該入力音声の認識対象としての単語を格納した認識用単
語格納手段と、 入力される音声の特徴に基づいて、該認識用単語格納手
段に格納されている全ての認識対象単語の中から入力音
声に最も類似する単語を求めて認識結果とする音声認識
手段と、 前記音声認識装置のユーザの音声入力を助けるために、
前記認識用単語格納手段に格納されている単語を自動的
に表示する表示手段とを備えることを特徴とする音声認
識装置における認識対象表示方式。 - 【請求項2】 前記表示手段が、前記認識用単語格納手
段に格納されている認識対象単語をディスプレイ画面上
で自動的にスクロールさせながら表示することを特徴と
する請求項1記載の音声認識装置における認識対象表示
方式。 - 【請求項3】 前記表示手段が、前記認識用単語格納手
段に格納されている認識対象単語をディスプレイ画面上
で自動的に改ページさせながら表示することを特徴とす
る請求項1記載の音声認識装置における認識対象表示方
式。 - 【請求項4】 前記表示手段が、前記認識用単語格納手
段に格納されている認識対象単語を、少なくとも1単語
ずつの単位で順次読み出して、ディスプレイ画面上に自
動的に表示することを特徴とする請求項1記載の音声認
識装置における認識対象表示方式。 - 【請求項5】 前記表示手段が、前記スクロール、また
は改ページのタイミング、あるいは少なくとも1単語ず
つを単位とする順次読み出しのタイミングをクロック信
号に基づいて決定することを特徴とする請求項2、3、
または4記載の音声認識装置における認識対象表示方
式。 - 【請求項6】 前記表示手段が、前記認識用単語格納手
段に格納されている認識対象単語を、少なくとも1単語
以上ずつの単位で単語に付けられた番号に対応する乱数
の値に基づいて読み出して、ディスプレイ画面上に自動
的に表示することを特徴とする請求項1記載の音声認識
装置における認識対象表示方式。 - 【請求項7】 入力される音声を認識する音声認識装置
において、 入力される音声の特徴に基づいて、現在の入力音声の認
識対象となる単語が格納される認識用単語格納手段に格
納されている全ての認識対象単語の中から入力音声に最
も類似した単語を求めて認識結果とする音声認識手段
と、 前記音声認識装置のユーザの音声入力を助けるために、
入力音声の認識対象となる可能性のある単語を格納した
単語格納手段に格納されている単語を自動的に表示する
表示手段と、 該表示手段によって現在までに表示された単語の中で最
近表示された単語を、前記認識対象となる単語として抽
出し、前記認識用単語格納手段に格納する表示単語抽出
手段とを備えることを特徴とする音声認識装置における
認識対象表示方式。 - 【請求項8】 前記表示手段が、前記認識用単語格納手
段に格納されている認識対象単語をディスプレイ画面上
で自動的にスクロールさせながら表示することを特徴と
する請求項7記載の音声認識装置における認識対象表示
方式。 - 【請求項9】 前記表示手段が、前記認識用単語格納手
段に格納されている認識対象単語をディスプレイ画面上
で自動的に改ページさせながら表示することを特徴とす
る請求項7記載の音声認識装置における認識対象表示方
式。 - 【請求項10】 前記表示手段が、前記認識用単語格納
手段に格納されている認識対象単語を、少なくとも1単
語ずつの単位で順次読み出して、ディスプレイ画面上に
自動的に表示することを特徴とする請求項7記載の音声
認識装置における認識対象表示方式。 - 【請求項11】 前記表示手段が、前記スクロール、ま
たは改ページのタイミング、あるいは少なくとも1単語
ずつを単位とする順次読み出しのタイミングをクロック
信号に基づいて決定することを特徴とする請求項8、
9、または10記載の音声認識装置における認識対象表
示方式。 - 【請求項12】 前記表示手段が、前記認識用単語格納
手段に格納されている認識対象単語を、少なくとも1単
語以上ずつの単位で単語に付けられた番号に対応する乱
数の値に基づいて読み出して、ディスプレイ画面上に自
動的に表示することを特徴とする請求項7記載の音声認
識装置における認識対象表示方式。 - 【請求項13】 入力される音声の特徴に基づいて、認
識用単語格納手段に格納されている全ての認識対象単語
の中から入力音声に最も類似する単語を求めて認識結果
とする第1の手順と、 ユーザの音声入力を助けるために、前記認識用単語格納
手段に格納されている単語を自動的に表示する第2の手
順とをコンピュータに実行させるプログラムを記憶した
コンピュータ読み取り可能な記憶媒体。 - 【請求項14】 入力される音声の特徴に基づいて、現
在の入力音声の認識対象となる単語が格納される認識用
単語格納手段に格納されている全ての認識対象単語の中
から入力音声に最も類似した単語を求めて認識結果とす
る第1の手順と、 前記音声認識装置のユーザの音声入力を助けるために、
入力音声の認識対象となる可能性のある単語を格納した
単語格納手段に格納されている単語を自動的に表示する
第2の手順と、 該第2の手順によって現在までに表示された単語の中で
最近表示された単語を、前記認識対象となる単語として
抽出し、前記認識用単語格納手段に格納する第3の手順
とをコンピュータに実行させるプログラムを記憶したコ
ンピュータ読み取り可能な記憶媒体。 - 【請求項15】 入力される音声を認識する音声認識装
置において、 入力音声の認識対象としての単語を格納する第1の手順
と、 入力される音声の特徴に基づいて、格納されている全て
の認識対象単語の中から入力音声に最も類似する単語を
求めて認識結果とする第2の手順と、 ユーザの音声入力を助けるために、格納されている単語
を自動的に表示する第3の手順とからなることを特徴と
する音声認識装置における認識対象表示方法。 - 【請求項16】 入力される音声の特徴に基づいて、現
在の入力音声の認識対象となる全ての認識対象単語の中
から入力音声に最も類似した単語を求めて認識結果とす
る第1の手順と、 前記音声認識装置のユーザの音声入力を助けるために、
入力音声の認識対象となる可能性のある単語を格納した
単語格納手段に格納されている単語を自動的に表示する
第2の手順と、 該第2の手順によって現在までに表示された単語の中で
最近表示された単語を、前記認識対象となる単語として
抽出し、前記認識用単語格納手段に格納する第3の手順
とを備えることを特徴とする音声認識方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21530897A JP4279909B2 (ja) | 1997-08-08 | 1997-08-08 | 音声認識装置における認識対象表示方式 |
US09/026,612 US6374218B2 (en) | 1997-08-08 | 1998-02-20 | Speech recognition system which displays a subject for recognizing an inputted voice |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21530897A JP4279909B2 (ja) | 1997-08-08 | 1997-08-08 | 音声認識装置における認識対象表示方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1152984A true JPH1152984A (ja) | 1999-02-26 |
JP4279909B2 JP4279909B2 (ja) | 2009-06-17 |
Family
ID=16670177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP21530897A Expired - Lifetime JP4279909B2 (ja) | 1997-08-08 | 1997-08-08 | 音声認識装置における認識対象表示方式 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6374218B2 (ja) |
JP (1) | JP4279909B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003015687A (ja) * | 2001-06-29 | 2003-01-17 | Clarion Co Ltd | ナビゲーション装置及び方法並びにナビゲーション用ソフトウェア |
US6556970B1 (en) | 1999-01-28 | 2003-04-29 | Denso Corporation | Apparatus for determining appropriate series of words carrying information to be recognized |
US7076425B2 (en) | 2001-03-19 | 2006-07-11 | Nissam Motor Co., Ltd. | Voice recognition device with larger weights assigned to displayed words of recognition vocabulary |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002132287A (ja) * | 2000-10-20 | 2002-05-09 | Canon Inc | 音声収録方法および音声収録装置および記憶媒体 |
JP2007047575A (ja) * | 2005-08-11 | 2007-02-22 | Canon Inc | パターンマッチング方法およびその装置、および音声情報検索システム |
US20070073917A1 (en) * | 2005-09-07 | 2007-03-29 | Vubotics, Inc. | Method for controlling the rate of automated flow and navigation through information presented on a digitally controlled electronic device |
JP2007171809A (ja) * | 2005-12-26 | 2007-07-05 | Canon Inc | 情報処理装置及び情報処理方法 |
US20130132079A1 (en) * | 2011-11-17 | 2013-05-23 | Microsoft Corporation | Interactive speech recognition |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5782899A (en) * | 1980-11-12 | 1982-05-24 | Canon Kk | Voice recognition apparatus |
US4394538A (en) * | 1981-03-04 | 1983-07-19 | Threshold Technology, Inc. | Speech recognition system and method |
US4489435A (en) * | 1981-10-05 | 1984-12-18 | Exxon Corporation | Method and apparatus for continuous word string recognition |
JPS59131828A (ja) | 1983-01-18 | 1984-07-28 | Matsushita Electric Ind Co Ltd | 加熱装置 |
US4720802A (en) * | 1983-07-26 | 1988-01-19 | Lear Siegler | Noise compensation arrangement |
US4914704A (en) * | 1984-10-30 | 1990-04-03 | International Business Machines Corporation | Text editor for speech input |
US4866778A (en) * | 1986-08-11 | 1989-09-12 | Dragon Systems, Inc. | Interactive speech recognition apparatus |
JP2815579B2 (ja) * | 1987-03-10 | 1998-10-27 | 富士通株式会社 | 音声認識における単語候補削減装置 |
US5027406A (en) * | 1988-12-06 | 1991-06-25 | Dragon Systems, Inc. | Method for interactive speech recognition and training |
US5007081A (en) * | 1989-01-05 | 1991-04-09 | Origin Technology, Inc. | Speech activated telephone |
US5329609A (en) * | 1990-07-31 | 1994-07-12 | Fujitsu Limited | Recognition apparatus with function of displaying plural recognition candidates |
US5386494A (en) * | 1991-12-06 | 1995-01-31 | Apple Computer, Inc. | Method and apparatus for controlling a speech recognition function using a cursor control device |
JPH05181496A (ja) | 1992-01-07 | 1993-07-23 | Sanyo Electric Co Ltd | 音声認識制御装置 |
WO1993018506A1 (en) * | 1992-03-06 | 1993-09-16 | Dragon Systems, Inc. | Speech recognition system for languages with compound words |
US5890122A (en) * | 1993-02-08 | 1999-03-30 | Microsoft Corporation | Voice-controlled computer simulateously displaying application menu and list of available commands |
US5623681A (en) * | 1993-11-19 | 1997-04-22 | Waverley Holdings, Inc. | Method and apparatus for synchronizing, displaying and manipulating text and image documents |
US5799325A (en) * | 1993-11-19 | 1998-08-25 | Smartpatents, Inc. | System, method, and computer program product for generating equivalent text files |
US5774841A (en) * | 1995-09-20 | 1998-06-30 | The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration | Real-time reconfigurable adaptive speech recognition command and control apparatus and method |
JP3581752B2 (ja) * | 1995-10-09 | 2004-10-27 | 株式会社リコー | 音声認識装置及び音声認識方法 |
US5758319A (en) * | 1996-06-05 | 1998-05-26 | Knittle; Curtis D. | Method and system for limiting the number of words searched by a voice recognition system |
-
1997
- 1997-08-08 JP JP21530897A patent/JP4279909B2/ja not_active Expired - Lifetime
-
1998
- 1998-02-20 US US09/026,612 patent/US6374218B2/en not_active Expired - Lifetime
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6556970B1 (en) | 1999-01-28 | 2003-04-29 | Denso Corporation | Apparatus for determining appropriate series of words carrying information to be recognized |
US7076425B2 (en) | 2001-03-19 | 2006-07-11 | Nissam Motor Co., Ltd. | Voice recognition device with larger weights assigned to displayed words of recognition vocabulary |
JP2003015687A (ja) * | 2001-06-29 | 2003-01-17 | Clarion Co Ltd | ナビゲーション装置及び方法並びにナビゲーション用ソフトウェア |
JP4727852B2 (ja) * | 2001-06-29 | 2011-07-20 | クラリオン株式会社 | ナビゲーション装置及び方法並びにナビゲーション用ソフトウェア |
Also Published As
Publication number | Publication date |
---|---|
US20010012995A1 (en) | 2001-08-09 |
JP4279909B2 (ja) | 2009-06-17 |
US6374218B2 (en) | 2002-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH03224055A (ja) | 同時通訳向き音声認識システムおよびその音声認識方法 | |
US20090048832A1 (en) | Speech-to-text system, speech-to-text method, and speech-to-text program | |
US20160055763A1 (en) | Electronic apparatus, pronunciation learning support method, and program storage medium | |
JPH10187709A (ja) | 音声認識中に可変数の代替ワードを表示する方法及びシステム | |
KR20080031357A (ko) | 대안들의 목록을 사용하는 오인된 단어들의 다시 받아쓰기 | |
JPS62239231A (ja) | 口唇画像入力による音声認識方法 | |
JP2001265326A (ja) | 演奏位置検出方法および楽譜表示装置 | |
US6393398B1 (en) | Continuous speech recognizing apparatus and a recording medium thereof | |
US20170372695A1 (en) | Information providing system | |
JP3104661B2 (ja) | 日本語文章作成装置 | |
JP4279909B2 (ja) | 音声認識装置における認識対象表示方式 | |
JP3399674B2 (ja) | 画面制御装置とその方法 | |
US20170309269A1 (en) | Information presentation system | |
JPH06274533A (ja) | マルチメデイア提示内で音声的サーチ・パターンを使用するためのシステム及びその方法 | |
CN110782899B (zh) | 信息处理装置、存储介质及信息处理方法 | |
CN111710203A (zh) | 一种基于大数据的英语发音纠正系统 | |
JP6641680B2 (ja) | 音声出力装置、音声出力プログラムおよび音声出力方法 | |
JP2007188410A (ja) | 電子辞書装置、電子辞書検索方法、及び電子辞書プログラム | |
JPH01112299A (ja) | 音声認識装置 | |
JPH07181992A (ja) | 文書読上げ装置及び方法 | |
CN110428668B (zh) | 一种数据提取方法、装置、计算机系统及可读存储介质 | |
JP2002268667A (ja) | プレゼンテーションシステムおよびその制御方法 | |
JPH0944600A (ja) | オンライン文字認識に於ける入力文字予測方法、及びその装置 | |
JP3242224B2 (ja) | 手書文字認識装置 | |
JP2004171174A (ja) | 文章読み上げ装置、読み上げのためのプログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040701 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061201 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070605 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070723 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070813 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20080314 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20080502 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20080627 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090313 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120319 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130319 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140319 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |