JPH1152984A - 音声認識装置における認識対象表示方式 - Google Patents

音声認識装置における認識対象表示方式

Info

Publication number
JPH1152984A
JPH1152984A JP9215308A JP21530897A JPH1152984A JP H1152984 A JPH1152984 A JP H1152984A JP 9215308 A JP9215308 A JP 9215308A JP 21530897 A JP21530897 A JP 21530897A JP H1152984 A JPH1152984 A JP H1152984A
Authority
JP
Japan
Prior art keywords
word
recognition
speech
input
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9215308A
Other languages
English (en)
Other versions
JP4279909B2 (ja
Inventor
Akihiro Kimura
晋太 木村
Yasuo Sato
泰雄 佐藤
Tomio Koide
富夫 小出
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP21530897A priority Critical patent/JP4279909B2/ja
Priority to US09/026,612 priority patent/US6374218B2/en
Publication of JPH1152984A publication Critical patent/JPH1152984A/ja
Application granted granted Critical
Publication of JP4279909B2 publication Critical patent/JP4279909B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 ユーザが認識対象単語をよく知らない場合に
おいても、音声認識装置の操作性を向上させ、その効用
を大きくする。 【解決手段】 認識対象単語を格納する手段11と、入
力される音声の特徴に基づいて、手段11に格納されて
いる全ての単語の中で入力音声に最も類似する単語を求
めて認識結果とする手段12と、ユーザの音声入力を助
けるために、手段11に格納されている単語を自動的に
表示する手段13とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声認識装置に係
り、更に詳しくは音声認識の認識対象となる単語をディ
スプレイ画面上に自動的に表示することによってユーザ
の音声入力を助ける、音声認識装置における認識対象表
示方式に関する。
【0002】
【従来の技術】図22は音声認識装置の従来例の構成ブ
ロック図である。同図において音声認識装置は音声が入
力され、電気信号に変換されるマイク1、例えば高速フ
ーリエ変換や、線形予測分析などを用いて入力された音
声を分析する分析部2、音声の分析結果から特徴を抽出
する特徴抽出部3、認識対象としての単語を格納する単
語辞書部4、単語辞書部4に格納されている全ての単語
と入力音声を、特徴抽出部3によって抽出された特徴に
基づいて照合し、入力音声に最も類似した単語を求める
単語照合部5、単語照合部5によって出力される単語の
認識結果と、単語辞書部4に格納されている単語を表示
する表示部6、単語辞書部4に格納されている単語の表
示部6による表示に際して、単語辞書部4に格納されて
いる単語の数が多く、1つの画面上に全ての単語を表示
することができないため、表示単語のスクロールを行う
スクロール制御部7、スクロール制御部7にスクロール
の指示を与えるためのマウス8を備えている。
【0003】単語照合部5では、入力音声と単語辞書部
4に格納されている全ての単語の照合が行われるが、そ
の手法としては、例えば入力音声の時間方向の伸び縮み
を吸収するための手法としてのDPマッチング法、また
は単語音声の確率モデルを使用する隠れマルコフモデル
法(HMM法)などが用いられる。この照合の結果とし
ての認識結果は、前述のように表示部6に表示される
が、本発明が対象とする音声認識装置では、認識結果と
共に音声認識の対象としての単語辞書部4に格納されて
いる単語が、同時に表示部6によって表示される。
【0004】本発明が対象とする音声認識装置では、認
識対象としての単語を音声認識装置のユーザが必ずしも
よく知らないということを前提としている。音声認識装
置が、例えばコマンドの入力用に使用されるものである
時、ユーザはコマンドをよく知っていないため、表示部
6によって表示されるコマンドを見ながら、入力すべき
コマンドが表示された時にそのコマンドを音声入力する
ことによって、コマンドの入力を実行できるものとす
る。そのためにスクロール制御部7によって、単語辞書
部4に格納されている全てのコマンドをディスプレイ画
面上でスクロールさせながら表示して、ユーザのコマン
ド入力を助けることになる。
【0005】
【発明が解決しようとする課題】前述のように、本発明
が対象とする音声認識装置では、どのような単語が認識
対象となっているかをユーザはあまりよく知らず、図2
2においてはマウス8によってディスプレイ画面上に表
示されている認識対象単語、例えばコマンドをスクロー
ルさせながら入力すべきコマンドを探して、音声入力を
行うことが必要であった。このように従来例ではマウス
を使って入力すべき単語を探しているためディスプレイ
画面上にその単語を見つけた時にマウスによってその単
語をクリックすれば、その単語、例えばコマンドの入力
を行うことができることになり、そもそも音声認識を用
いる必要性がはっきりしないという問題点があった。
【0006】本発明は、音声認識の対象となる単語を、
例えばディスプレイ画面上で自動的にスクロールさせな
がら表示することにより、マウス操作を行うことを不必
要にさせ、音声認識装置の効用を大きくすることであ
る。
【0007】
【課題を解決するための手段】図1および図2は本発明
の原理構成ブロック図である。これらの図は入力される
音声を認識する音声認識装置、特に認識対象の単語をデ
ィスプレイ画面上に表示する音声認識装置の原理構成ブ
ロック図である。
【0008】図1は第1の発明の原理構成ブロック図で
ある。同図において、認識用単語格納手段11は入力音
声の認識対象としての単語、例えばコマンドの全てを格
納しているものである。音声認識手段12は入力される
音声の特徴に基づいて、認識用単語格納手段11に格納
されている全ての認識対象単語、例えばコマンドの中か
ら最も入力音声に類似した単語を求めて、認識結果とし
て出力するものである。更に表示手段13は音声認識装
置のユーザの音声入力を助けるために、認識用単語格納
手段11に格納されている単語を自動的に表示するもの
である。
【0009】第1の発明においては表示手段13によっ
て、例えばディスプレイ画面上で認識対象単語が自動的
に表示され、ユーザは表示されている単語の中で自分が
入力すべき単語を見つけた時点でその単語の音声入力を
行う。入力された音声は、その特徴に基づいて認識用単
語格納手段11に格納されている全ての認識対象単語と
照合され、最も入力音声に類似した単語が認識結果とし
て音声認識手段12から出力される。
【0010】第1の発明の実施の形態においては、表示
手段13による単語の自動的表示に様々な方式が用いら
れる。その方式としては、例えば認識用単語格納手段1
1に格納されている全ての単語が、自動的にスクロール
制御によって表示されたり、自動的に改ページされて表
示されたり、あるいは少なくとも1単語ずつの単位で順
次に読み出されて表示されたり、単語に付けられた番号
に対応する乱数の値に基づいて読み出されて表示された
りすることができる。これによってユーザがマウス操作
を行う必要はなくなる。
【0011】図2は第2の発明の原理構成ブロック図で
ある。同図において単語格納手段15は、入力音声の認
識対象となる可能性のある単を全て格納しているもので
ある。認識用単語格納手段16は、現在の時点の入力音
声の認識対象となる単語を格納するものである。音声認
識手段17は、入力される音声の特徴に基づいて、認識
用単語格納手段16に格納されている全ての単語の中か
ら入力音声に最も類似した単語を求めて、認識結果とし
て出力するものである。
【0012】表示手段18は音声認識装置のユーザの音
声入力を助けるためのものであり、単語格納手段15に
格納されている単語、すなわち認識対象となる可能性の
ある単語を自動的に表示するものである。表示単語抽出
手段19は、表示手段18によって現在までに表示され
た単語の中で、最近表示された単語を認識対象となる単
語として抽出し、認識用単語格納手段16に格納するも
のである。
【0013】第2の発明においては、第1の発明におけ
ると同様に単語格納手段15に格納されている全ての単
語が例えばスクロール制御や、改ページ制御、少なくと
も1単語ずつの単位による順次読み出しの制御によって
ディスプレイ画面上に自動的に表示される。表示手段1
8によって表示された単語の中で最近表示された単語が
表示単語抽出手段19によって抽出され、認識用単語格
納手段16に格納されて、現在の入力音声の認識対象と
なる単語として使用される。入力音声は、この認識用単
語格納手段16に格納されている単語と照合されて、入
力音声と最も類似した単語が認識結果として音声認識手
段17によって出力されることになる。これによって第
2の発明では認識対象は、最近表示された単語に絞られ
ることになる。ユーザが入力する単語の種類が比較的少
なく、かつ最近表示された単語と同じ単語が多い場合に
は、このように認識対象を限定することによって音声認
識の性能を向上させることができる。
【0014】また、本発明は入力される音声の特徴に基
づいて、認識用単語格納手段に格納されている全ての認
識対象単語の中から入力音声に最も類似する単語を求め
て認識結果とする第1の手順と、ユーザの音声入力を助
けるために、前記認識用単語格納手段に格納されている
単語を自動的に表示する第2の手順とをコンピュータに
実行させるプログラムを記憶したコンピュータ読み取り
可能な記憶媒体を構成する。
【0015】さらに、本発明は入力される音声の特徴に
基づいて、現在の入力音声の認識対象となる単語が格納
される認識用単語格納手段に格納されている全ての認識
対象単語の中から入力音声に最も類似した単語を求めて
認識結果とする第1の手順と、前記音声認識装置のユー
ザの音声入力を助けるために、入力音声の認識対象とな
る可能性のある単語を格納した単語格納手段に格納され
ている単語を自動的に表示する第2の手順と、該第2の
手順によって現在までに表示された単語の中で最近表示
された単語を、前記認識対象となる単語として抽出し、
前記認識用単語格納手段に格納する第3の手順とをコン
ピュータに実行させるプログラムを記憶したコンピュー
タ読み取り可能な記憶媒体を構成する。
【0016】
【発明の実施の形態】図3は本発明における音声認識装
置の第1の実施形態の構成ブロック図である。同図にお
いて従来例の図22と同じ動作をする部分には同じ符号
を付してある。図22と異なる部分はスクロール制御部
21と、クロック部22である。
【0017】この第1の実施形態においては、単語辞書
部4に格納されている認識対象単語が表示部6によって
表示されるが、その表示はスクロール制御部21によっ
て制御される。このスクロール動作は、図22と異なっ
て自動的に行われる。すなわちクロック部22の発生す
るクロック信号によって、例えば1クロック毎にスクロ
ールが行われ、単語辞書部4に格納されている認識対象
単語がm単語、常に画面上に表示される形式でスクロー
ル制御される。
【0018】図4は図3の第1の実施形態における全体
処理のフローチャート、図5は図4における認識プロセ
スの処理フローチャートである。図4において処理が開
始されると、まずステップS1で認識プロセスが起動さ
れた後に、ステップS2で単語辞書部4の内容のスクロ
ール表示が開始され、ステップS3でディスプレイ画面
上の、例えばm単語のスクロール表示の1行スクロール
が繰り返される。
【0019】図5の認識プロセスでは、まずステップS
5でマイク1からの音声入力が受け取られ、ステップS
6でその音声が分析部2によって分析され、ステップS
7でその分析結果から特徴抽出部3によって入力音声の
特徴が抽出され、ステップS8で、その特徴が単語照合
部5によって、単語辞書部4に格納されている全ての単
語と照合され、ステップS9でその照合結果、すなわち
最も類似した単語が認識結果としてアプリケーションに
通知されて、マイク1からの次の音声入力を待つ状態と
なる。
【0020】図6は図3の第1の実施形態における複数
単語の表示イメージの説明図である。同図においては山
手線の駅名が連続した順序で1つの画面上に5つ表示さ
れ、クロック毎に1駅ずつ上にずれる形式でスクロール
表示される。
【0021】図7は図3におけるスクロール制御部21
の詳細構成ブロック図である。同図においてスクロール
制御部21は、1つの画面上での表示開始位置、例えば
一番上の位置の単語の番号を格納する表示開始単語番号
レジスタ25、表示開始単語番号レジスタ25の出力A
と1つの画面上に表示される表示単語数から1を減算し
たBとを加算する加算器26、加算器26の出力を1つ
の画面上での表示終了位置、例えば一番下の単語の番号
として格納する表示終了単語番号レジスタ27、図3の
単語辞書部4に格納されている全ての単語数Aと加算器
26の出力Bとを比較して、BがAを越えた時にカウン
タ29をリセットする比較器28、クロック信号によっ
てカウント値がインクリメントされ、表示開始単語番号
レジスタ25にカウント値を出力するカウンタ29から
構成されている。
【0022】図8はクロック信号に対応する表示開始単
語番号と表示終了単語番号の説明図である。同図におい
て1つの画面上に表示される単語の数はmであり、図3
の単語辞書部4に格納されている単語の数はnであるも
のと仮定している。クロックが進む毎に表示開示単語番
号が大きくなり、n番目の単語が表示開始位置にきた時
には表示終了単語番号はn+m−1となる。そして次の
クロックでは表示開始単語番号は1となり、クロックの
進行と共に単語表示のスクロール制御が繰り返される。
【0023】図9は音声認識装置の第2の実施形態の構
成ブロック図である。同図を図3の第1の実施形態と比
較すると、スクロール制御部21に代わって一単語読み
出し部31が備えられている点だけが異なっている。こ
の第2の実施形態においては、単語辞書部4に格納され
ている音声認識の対象語の表示にあたってスクロール制
御が用いられず、単語辞書部4の内容が1単語ずつ一単
語読み出し部31に従って読み出され、表示部6によっ
て順次表示される。この1単語ずつの読み出しは、クロ
ック部22が出力するクロック信号に同期して行われ
る。なおここでは1単語ずつを読み出すものとしたが、
実施形態としては1単語ずつに限定されず、例えば2単
語ずつとか、3単語ずつのように語数を増やしたり、例
えばユーザからの指示に応じて読み出すべき単語数を変
化させたりすることも当然可能である。
【0024】図10は第2の実施形態における全体処理
のフローチャートである。 同図において処理が開始さ
れると、まずステップS11で認識プロセスが起動され
る。この認識プロセスの処理は図5におけると同じであ
るので、その説明を省略する。
【0025】続いてステップS12でポインタが単語辞
書部4の先頭の単語を指すように置かれ、ステップS1
3でポインタで指定された単語が表示され、ステップS
14でポインタが1単語分進められ、ステップS15で
ポインタが単語辞書部4に格納されている単語の最後に
達したか否かが判定され、まだ達していない場合にはス
テップS13以降の処理が繰り返される。単語辞書部4
に格納されている単語の最後に達したと判定されると、
ステップS12でポインタが単語辞書の先頭に戻された
後に、ステップS13以降の処理が繰り返される。
【0026】図11は第2の実施形態において認識対象
語が1単語ずつ順次読み出される場合の表示イメージの
説明図である。同図に示すように、山手線の駅名がクロ
ック毎に1つずつ読み出されて表示される。
【0027】図12は図9の一単語読み出し部31の構
成ブロック図である。同図において一単語読み出し部3
1は読み出すべき単語番号を指定するカウンタ33、単
語辞書部4から読み出された単語が一時的に格納され、
その単語が表示部6に出力される単語バッファ34から
構成されている。カウンタ33には、カウント値をイン
クリメントさせるためのクロック信号、および単語辞書
部4に格納されている単語数nが入力され、カウンタ3
3のカウント値はクロック信号に同期してインクリメン
トされ、nに達した時点で自動的にリセットされる。
【0028】図13は音声認識装置の第3の実施形態の
構成ブロック図である。同図を図9の第2の実施形態と
比較すると、クロック部22に代わって乱数発生部36
が備えられている点が異なっている。一単語読み出し部
35は、乱数発生部36によって発生される乱数の値の
単語番号を持つ単語を単語辞書部4から一単語ずつ読み
出して、その単語が表示部6によって表示される。
【0029】図14は図13の第3の実施形態における
全体処理のフローチャートである。同図において処理が
開始されると、ステップS16で認識プロセスが起動さ
れる。この認識プロセスによる処理は図5と同じである
ので、その説明を省略する。続いてステップS17で単
語辞書部4から、乱数発生部36が出力する乱数に基づ
いて、認識対象単語が一単語ランダムに取り出され、ス
テップS18でその単語が表示され、以後ステップS1
7および18の処理が繰り返される。
【0030】図15は図13における一単語読み出し部
35の構成ブロック図である。同図において一単語読み
出し部35は、読み出すべき単語番号を単語辞書部4に
与える単語番号バッファ38、単語辞書部4から読み出
された単語を一時的に格納し、表示部6に出力するため
の単語バッファ39から構成されている。そして乱数発
生部36によって出力される乱数が単語番号バッファ3
8に格納され、その乱数によって指定される単語番号を
持つ認識対象単語が単語辞書部4から読み出されて、単
語バッファ39を介して表示部6によって表示されるこ
とになる。
【0031】図16は音声認識装置の第4の実施形態の
構成ブロック図である。同図を第1の実施形態を示す図
3と比較すると、図3の構成要素に加えて認識用一時単
語辞書部41と表示単語抽出部42が追加され、単語辞
書部4の格納内容はスクロール制御部21のみに与えら
れる点が異なっている。この第4の実施形態では、単語
照合部5において用いられる認識対象の単語は単語辞書
部4に格納されている単語ではなく、認識用一時単語辞
書部41に格納されている単語だけに限定される。この
認識用一時単語辞書部41に格納される認識用単語は、
表示単語抽出部42によって抽出された単語である。
【0032】この表示単語抽出部42の動作については
更に後述するが、抽出部42は表示部6によって最近表
示された単語を抽出して、認識用単語として認識用一時
単語辞書部41に格納する。表示部6によって表示され
る単語は、単語照合部5の出力、すなわち認識結果とし
ての単語と、スクロール制御部21によってスクロール
制御される、単語辞書部4に格納されている単語のうち
の一部であるが、表示単語抽出部42によって抽出され
る認識用単語には単語照合部5の出力、すなわち認識結
果としての単語は含まれない。
【0033】本発明が対象とする音声認識装置は、前述
のようにユーザが音声認識の対象語をよく知らないよう
な場合を対象としている。例えばコマンドを入力するた
めの音声認識装置では、ユーザはコマンドの名前をあま
り知らず、表示部6によって表示されるコマンドの中か
ら自分の入力すべきコマンドを知って、それを音声入力
することになる。
【0034】このような場合にはユーザが入力したいコ
マンドの種類はそれほど多くなく、表示部6によって最
近表示されたものを再度入力することが多くなるため、
認識用一時単語辞書部41に格納され、単語照合部5に
よって音声認識の対象として用いられる単語を最近表示
されたものに限定することによって認識の速度を向上さ
せ、また認識エラーを減少させることができる。
【0035】一般に音声認識においては入力される音声
が1つの音毎に正しく認識されることが要求される。そ
こで認識の対象となる単語が多ければ多いほど、単語照
合部5による照合に時間がかかり、またマイクの特性や
人の声のくせなどのために、正しい認識を行うことが困
難になり、認識エラーが生ずる可能性がある。この第4
の実施形態においては、単語照合部5における認識対象
を表示部6によって最近表示されたものに限定すること
によって、認識に要する時間を減少させ、かつ認識エラ
ーを少なくすることが可能となる。
【0036】図17は第4の実施形態における全体処理
のフローチャート、図18は認識プロセスによる処理の
フローチャートである。図17を第1の実施形態に対す
る図4と比較すると、ステップS3において1行のスク
ロールが行われた後に、ステップS20で最近表示され
た単語を抽出し、認識用一時単語辞書部41に格納する
処理が追加されている点が異なっている。
【0037】図18を第1〜第3の実施形態に対する図
5と比較すると、ステップS8で入力音声の特徴が単語
辞書部4に格納されている単語と照合される代わりに、
ステップS21で認識用一時単語辞書部41に格納され
ている単語と照合される点が異なっている。
【0038】図19は図16における表示単語抽出部4
2の構成ブロック図である。図20はその中でのリング
バッファにおける処理内容の説明図である。図19にお
いて表単語抽出部42は、表示部6に表示されている単
語を格納する表示単語バッファ44、表示単語バッファ
44の出力を格納するリングバッファ45、リングバッ
ファ45の内容を読み出し、認識用一時単語辞書部41
に出力する読み出し部46から構成されている。
【0039】図20においてリングバッファ45のバッ
ファメモリには、例として山手線の駅の名前が7つ格納
されている。表示部6に現在表示され、図19の表示単
語バッファ44に格納された単語は、バッファメモリの
内部で一番古いデータに上書きする形式で書込まれる。
そしてバッファメモリに格納されている単語、ここでは
7つの駅の名前が、読み出し部46を介して認識用一時
単語辞書部41に与えられることになる。
【0040】図21は音声認識装置の第5の実施形態の
構成ブロック図である。同図を第4の実施形態を示す図
16と比較すると、スクロール制御部21、クロック部
22に代わって、一単語読み出し部35、乱数発生部3
6が備えられている点が異なっている。この一単語読み
出し部35、および乱数発生部36の動作は図13に示
した第3の実施形態におけると同じであり、単語辞書部
4に格納されている単語は、乱数発生部36の発生する
乱数に対応する単語番号に基づいて、一単語読み出し部
35によって一単語ずつ読み出され、表示部6によって
表示されることになる点だけが第4の実施形態と異なっ
ている。なお乱数発生部36に代わってクロック部を設
け、クロック部が発生するクロック信号に従って、一単
語読み出し部35が一単語ずつ読み出しを行うことも当
然可能である。
【0041】
【発明の効果】以上詳細に説明したように、本発明によ
ればユーザはディスプレイ画面上に自動的に表示される
音声認識対象単語の中から自分の入力したい単語を見つ
けて単語の入力を行うことができ、マウスの操作が不必
要となり、音声認識装置の操作性が向上する。また最近
表示された単語だけを音声認識対象として用いることに
よって認識速度を向上させ、認識エラーを減少させるこ
とができ、音声認識装置の実用性の向上に寄与するとこ
ろが大きい。
【図面の簡単な説明】
【図1】第1の発明の原理構成ブロック図である。
【図2】第2の発明の原理構成ブロック図である。
【図3】本発明における音声認識装置の第1の実施形態
の構成ブロック図である。
【図4】第1の実施形態における全体処理のフローチャ
ートである。
【図5】第1の実施形態における認識プロセスの処理フ
ローチャートである。
【図6】第1の実施形態における複数単語の表示イメー
ジの説明図である。
【図7】図3におけるスクロール制御部の構成ブロック
図である。
【図8】図7における表示開始単語番号と表示終了単語
番号のクロック信号による変化の説明図である。
【図9】音声認識装置の第2の実施形態の構成ブロック
図である。
【図10】第2の実施形態における全体処理のフローチ
ャートである。
【図11】第2の実施形態における一単語読み出しの表
示イメージの説明図である。
【図12】図9における一単語読み出し部の構成ブロッ
ク図である。
【図13】音声認識装置の第3の実施形態の構成ブロッ
ク図である。
【図14】第3の実施形態における全体処理フローチャ
ートである。
【図15】図13における一単語読み出し部の構成ブロ
ック図である。
【図16】音声認識装置の第4の実施形態の構成ブロッ
ク図である。
【図17】第4の実施形態における全体処理フローチャ
ートである。
【図18】第4の実施形態における認識プロセスの処理
フローチャートである。
【図19】図16における表示単語抽出部の構成ブロッ
ク図である。
【図20】図19におけるリングバッファの処理内容の
説明図である。
【図21】音声認識装置の第5の実施形態の構成ブロッ
ク図である。
【図22】音声認識装置の従来例の構成ブロック図であ
る。
【符号の説明】
1 マイク 2 分析部 3 特徴抽出部 4 単語辞書部 5 単語照合部 6 表示部 11 認識用単語格納手段 12,17 音声認識手段 13,18 表示手段 15 単語格納手段 16 認識用単語格納手段 19 表示単語抽出手段 21 スクロール制御部 22 クロック部 31,35 一単語読み出し部 36 乱数発生部 41 認識用一時単語辞書部 42 表示単語抽出部

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 入力される音声を認識する音声認識装置
    において、 該入力音声の認識対象としての単語を格納した認識用単
    語格納手段と、 入力される音声の特徴に基づいて、該認識用単語格納手
    段に格納されている全ての認識対象単語の中から入力音
    声に最も類似する単語を求めて認識結果とする音声認識
    手段と、 前記音声認識装置のユーザの音声入力を助けるために、
    前記認識用単語格納手段に格納されている単語を自動的
    に表示する表示手段とを備えることを特徴とする音声認
    識装置における認識対象表示方式。
  2. 【請求項2】 前記表示手段が、前記認識用単語格納手
    段に格納されている認識対象単語をディスプレイ画面上
    で自動的にスクロールさせながら表示することを特徴と
    する請求項1記載の音声認識装置における認識対象表示
    方式。
  3. 【請求項3】 前記表示手段が、前記認識用単語格納手
    段に格納されている認識対象単語をディスプレイ画面上
    で自動的に改ページさせながら表示することを特徴とす
    る請求項1記載の音声認識装置における認識対象表示方
    式。
  4. 【請求項4】 前記表示手段が、前記認識用単語格納手
    段に格納されている認識対象単語を、少なくとも1単語
    ずつの単位で順次読み出して、ディスプレイ画面上に自
    動的に表示することを特徴とする請求項1記載の音声認
    識装置における認識対象表示方式。
  5. 【請求項5】 前記表示手段が、前記スクロール、また
    は改ページのタイミング、あるいは少なくとも1単語ず
    つを単位とする順次読み出しのタイミングをクロック信
    号に基づいて決定することを特徴とする請求項2、3、
    または4記載の音声認識装置における認識対象表示方
    式。
  6. 【請求項6】 前記表示手段が、前記認識用単語格納手
    段に格納されている認識対象単語を、少なくとも1単語
    以上ずつの単位で単語に付けられた番号に対応する乱数
    の値に基づいて読み出して、ディスプレイ画面上に自動
    的に表示することを特徴とする請求項1記載の音声認識
    装置における認識対象表示方式。
  7. 【請求項7】 入力される音声を認識する音声認識装置
    において、 入力される音声の特徴に基づいて、現在の入力音声の認
    識対象となる単語が格納される認識用単語格納手段に格
    納されている全ての認識対象単語の中から入力音声に最
    も類似した単語を求めて認識結果とする音声認識手段
    と、 前記音声認識装置のユーザの音声入力を助けるために、
    入力音声の認識対象となる可能性のある単語を格納した
    単語格納手段に格納されている単語を自動的に表示する
    表示手段と、 該表示手段によって現在までに表示された単語の中で最
    近表示された単語を、前記認識対象となる単語として抽
    出し、前記認識用単語格納手段に格納する表示単語抽出
    手段とを備えることを特徴とする音声認識装置における
    認識対象表示方式。
  8. 【請求項8】 前記表示手段が、前記認識用単語格納手
    段に格納されている認識対象単語をディスプレイ画面上
    で自動的にスクロールさせながら表示することを特徴と
    する請求項7記載の音声認識装置における認識対象表示
    方式。
  9. 【請求項9】 前記表示手段が、前記認識用単語格納手
    段に格納されている認識対象単語をディスプレイ画面上
    で自動的に改ページさせながら表示することを特徴とす
    る請求項7記載の音声認識装置における認識対象表示方
    式。
  10. 【請求項10】 前記表示手段が、前記認識用単語格納
    手段に格納されている認識対象単語を、少なくとも1単
    語ずつの単位で順次読み出して、ディスプレイ画面上に
    自動的に表示することを特徴とする請求項7記載の音声
    認識装置における認識対象表示方式。
  11. 【請求項11】 前記表示手段が、前記スクロール、ま
    たは改ページのタイミング、あるいは少なくとも1単語
    ずつを単位とする順次読み出しのタイミングをクロック
    信号に基づいて決定することを特徴とする請求項8、
    9、または10記載の音声認識装置における認識対象表
    示方式。
  12. 【請求項12】 前記表示手段が、前記認識用単語格納
    手段に格納されている認識対象単語を、少なくとも1単
    語以上ずつの単位で単語に付けられた番号に対応する乱
    数の値に基づいて読み出して、ディスプレイ画面上に自
    動的に表示することを特徴とする請求項7記載の音声認
    識装置における認識対象表示方式。
  13. 【請求項13】 入力される音声の特徴に基づいて、認
    識用単語格納手段に格納されている全ての認識対象単語
    の中から入力音声に最も類似する単語を求めて認識結果
    とする第1の手順と、 ユーザの音声入力を助けるために、前記認識用単語格納
    手段に格納されている単語を自動的に表示する第2の手
    順とをコンピュータに実行させるプログラムを記憶した
    コンピュータ読み取り可能な記憶媒体。
  14. 【請求項14】 入力される音声の特徴に基づいて、現
    在の入力音声の認識対象となる単語が格納される認識用
    単語格納手段に格納されている全ての認識対象単語の中
    から入力音声に最も類似した単語を求めて認識結果とす
    る第1の手順と、 前記音声認識装置のユーザの音声入力を助けるために、
    入力音声の認識対象となる可能性のある単語を格納した
    単語格納手段に格納されている単語を自動的に表示する
    第2の手順と、 該第2の手順によって現在までに表示された単語の中で
    最近表示された単語を、前記認識対象となる単語として
    抽出し、前記認識用単語格納手段に格納する第3の手順
    とをコンピュータに実行させるプログラムを記憶したコ
    ンピュータ読み取り可能な記憶媒体。
  15. 【請求項15】 入力される音声を認識する音声認識装
    置において、 入力音声の認識対象としての単語を格納する第1の手順
    と、 入力される音声の特徴に基づいて、格納されている全て
    の認識対象単語の中から入力音声に最も類似する単語を
    求めて認識結果とする第2の手順と、 ユーザの音声入力を助けるために、格納されている単語
    を自動的に表示する第3の手順とからなることを特徴と
    する音声認識装置における認識対象表示方法。
  16. 【請求項16】 入力される音声の特徴に基づいて、現
    在の入力音声の認識対象となる全ての認識対象単語の中
    から入力音声に最も類似した単語を求めて認識結果とす
    る第1の手順と、 前記音声認識装置のユーザの音声入力を助けるために、
    入力音声の認識対象となる可能性のある単語を格納した
    単語格納手段に格納されている単語を自動的に表示する
    第2の手順と、 該第2の手順によって現在までに表示された単語の中で
    最近表示された単語を、前記認識対象となる単語として
    抽出し、前記認識用単語格納手段に格納する第3の手順
    とを備えることを特徴とする音声認識方法。
JP21530897A 1997-08-08 1997-08-08 音声認識装置における認識対象表示方式 Expired - Lifetime JP4279909B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP21530897A JP4279909B2 (ja) 1997-08-08 1997-08-08 音声認識装置における認識対象表示方式
US09/026,612 US6374218B2 (en) 1997-08-08 1998-02-20 Speech recognition system which displays a subject for recognizing an inputted voice

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21530897A JP4279909B2 (ja) 1997-08-08 1997-08-08 音声認識装置における認識対象表示方式

Publications (2)

Publication Number Publication Date
JPH1152984A true JPH1152984A (ja) 1999-02-26
JP4279909B2 JP4279909B2 (ja) 2009-06-17

Family

ID=16670177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21530897A Expired - Lifetime JP4279909B2 (ja) 1997-08-08 1997-08-08 音声認識装置における認識対象表示方式

Country Status (2)

Country Link
US (1) US6374218B2 (ja)
JP (1) JP4279909B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003015687A (ja) * 2001-06-29 2003-01-17 Clarion Co Ltd ナビゲーション装置及び方法並びにナビゲーション用ソフトウェア
US6556970B1 (en) 1999-01-28 2003-04-29 Denso Corporation Apparatus for determining appropriate series of words carrying information to be recognized
US7076425B2 (en) 2001-03-19 2006-07-11 Nissam Motor Co., Ltd. Voice recognition device with larger weights assigned to displayed words of recognition vocabulary

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002132287A (ja) * 2000-10-20 2002-05-09 Canon Inc 音声収録方法および音声収録装置および記憶媒体
JP2007047575A (ja) * 2005-08-11 2007-02-22 Canon Inc パターンマッチング方法およびその装置、および音声情報検索システム
US20070073917A1 (en) * 2005-09-07 2007-03-29 Vubotics, Inc. Method for controlling the rate of automated flow and navigation through information presented on a digitally controlled electronic device
JP2007171809A (ja) * 2005-12-26 2007-07-05 Canon Inc 情報処理装置及び情報処理方法
US20130132079A1 (en) * 2011-11-17 2013-05-23 Microsoft Corporation Interactive speech recognition

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5782899A (en) * 1980-11-12 1982-05-24 Canon Kk Voice recognition apparatus
US4394538A (en) * 1981-03-04 1983-07-19 Threshold Technology, Inc. Speech recognition system and method
US4489435A (en) * 1981-10-05 1984-12-18 Exxon Corporation Method and apparatus for continuous word string recognition
JPS59131828A (ja) 1983-01-18 1984-07-28 Matsushita Electric Ind Co Ltd 加熱装置
US4720802A (en) * 1983-07-26 1988-01-19 Lear Siegler Noise compensation arrangement
US4914704A (en) * 1984-10-30 1990-04-03 International Business Machines Corporation Text editor for speech input
US4866778A (en) * 1986-08-11 1989-09-12 Dragon Systems, Inc. Interactive speech recognition apparatus
JP2815579B2 (ja) * 1987-03-10 1998-10-27 富士通株式会社 音声認識における単語候補削減装置
US5027406A (en) * 1988-12-06 1991-06-25 Dragon Systems, Inc. Method for interactive speech recognition and training
US5007081A (en) * 1989-01-05 1991-04-09 Origin Technology, Inc. Speech activated telephone
US5329609A (en) * 1990-07-31 1994-07-12 Fujitsu Limited Recognition apparatus with function of displaying plural recognition candidates
US5386494A (en) * 1991-12-06 1995-01-31 Apple Computer, Inc. Method and apparatus for controlling a speech recognition function using a cursor control device
JPH05181496A (ja) 1992-01-07 1993-07-23 Sanyo Electric Co Ltd 音声認識制御装置
WO1993018506A1 (en) * 1992-03-06 1993-09-16 Dragon Systems, Inc. Speech recognition system for languages with compound words
US5890122A (en) * 1993-02-08 1999-03-30 Microsoft Corporation Voice-controlled computer simulateously displaying application menu and list of available commands
US5623681A (en) * 1993-11-19 1997-04-22 Waverley Holdings, Inc. Method and apparatus for synchronizing, displaying and manipulating text and image documents
US5799325A (en) * 1993-11-19 1998-08-25 Smartpatents, Inc. System, method, and computer program product for generating equivalent text files
US5774841A (en) * 1995-09-20 1998-06-30 The United States Of America As Represented By The Adminstrator Of The National Aeronautics And Space Administration Real-time reconfigurable adaptive speech recognition command and control apparatus and method
JP3581752B2 (ja) * 1995-10-09 2004-10-27 株式会社リコー 音声認識装置及び音声認識方法
US5758319A (en) * 1996-06-05 1998-05-26 Knittle; Curtis D. Method and system for limiting the number of words searched by a voice recognition system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6556970B1 (en) 1999-01-28 2003-04-29 Denso Corporation Apparatus for determining appropriate series of words carrying information to be recognized
US7076425B2 (en) 2001-03-19 2006-07-11 Nissam Motor Co., Ltd. Voice recognition device with larger weights assigned to displayed words of recognition vocabulary
JP2003015687A (ja) * 2001-06-29 2003-01-17 Clarion Co Ltd ナビゲーション装置及び方法並びにナビゲーション用ソフトウェア
JP4727852B2 (ja) * 2001-06-29 2011-07-20 クラリオン株式会社 ナビゲーション装置及び方法並びにナビゲーション用ソフトウェア

Also Published As

Publication number Publication date
US20010012995A1 (en) 2001-08-09
JP4279909B2 (ja) 2009-06-17
US6374218B2 (en) 2002-04-16

Similar Documents

Publication Publication Date Title
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
US20090048832A1 (en) Speech-to-text system, speech-to-text method, and speech-to-text program
US20160055763A1 (en) Electronic apparatus, pronunciation learning support method, and program storage medium
JPH10187709A (ja) 音声認識中に可変数の代替ワードを表示する方法及びシステム
KR20080031357A (ko) 대안들의 목록을 사용하는 오인된 단어들의 다시 받아쓰기
JPS62239231A (ja) 口唇画像入力による音声認識方法
JP2001265326A (ja) 演奏位置検出方法および楽譜表示装置
US6393398B1 (en) Continuous speech recognizing apparatus and a recording medium thereof
US20170372695A1 (en) Information providing system
JP3104661B2 (ja) 日本語文章作成装置
JP4279909B2 (ja) 音声認識装置における認識対象表示方式
JP3399674B2 (ja) 画面制御装置とその方法
US20170309269A1 (en) Information presentation system
JPH06274533A (ja) マルチメデイア提示内で音声的サーチ・パターンを使用するためのシステム及びその方法
CN110782899B (zh) 信息处理装置、存储介质及信息处理方法
CN111710203A (zh) 一种基于大数据的英语发音纠正系统
JP6641680B2 (ja) 音声出力装置、音声出力プログラムおよび音声出力方法
JP2007188410A (ja) 電子辞書装置、電子辞書検索方法、及び電子辞書プログラム
JPH01112299A (ja) 音声認識装置
JPH07181992A (ja) 文書読上げ装置及び方法
CN110428668B (zh) 一种数据提取方法、装置、计算机系统及可读存储介质
JP2002268667A (ja) プレゼンテーションシステムおよびその制御方法
JPH0944600A (ja) オンライン文字認識に於ける入力文字予測方法、及びその装置
JP3242224B2 (ja) 手書文字認識装置
JP2004171174A (ja) 文章読み上げ装置、読み上げのためのプログラム及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040701

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061201

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070723

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070813

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20080314

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20080502

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080627

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090313

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120319

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130319

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140319

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term