JPH08190398A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH08190398A
JPH08190398A JP7001692A JP169295A JPH08190398A JP H08190398 A JPH08190398 A JP H08190398A JP 7001692 A JP7001692 A JP 7001692A JP 169295 A JP169295 A JP 169295A JP H08190398 A JPH08190398 A JP H08190398A
Authority
JP
Japan
Prior art keywords
voice
recognition result
speech recognition
voice recognition
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7001692A
Other languages
English (en)
Inventor
Hiroaki Ogawa
浩明 小川
Masao Watari
雅男 渡
Kazuo Ishii
和夫 石井
Yasuhiko Kato
靖彦 加藤
Masanori Omote
雅則 表
Kazuo Watanabe
一夫 渡辺
Katsuki Minamino
活樹 南野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP7001692A priority Critical patent/JPH08190398A/ja
Publication of JPH08190398A publication Critical patent/JPH08190398A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 ユーザに煩わしさを感じさせることなく、正
しい音声認識結果を得ることができるようにする。 【構成】 マイク1に入力された音声が、音声認識部5
で音声認識され、スピーカ9から、その音声認識結果が
出力される。一方、マイク1に音声が入力された後は、
タイマ回路14で所定の時間が計時され、その所定の時
間の経過前に、マイク1に音声が入力された場合には、
その音声が、前に入力された音声の言い直しとして音声
認識される。そして、音声が入力されずに所定の時間が
経過した場合には、直前に、スピーカ9から出力された
音声認識結果が、最終的な音声認識結果として確定され
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声を認識する音声認
識装置に関する。
【0002】
【従来の技術】最近では、ユーザインターフェイスの向
上のため、音声認識装置を備える、いわば音声認識機能
付きの装置が実用化されている。このような音声認識機
能付きの装置では、コマンドなどの音声が入力される
と、その音声が音声認識装置で音声認識され、その音声
認識結果に対応して、処理が行われるようになされてい
る。
【0003】ところで、いまのところ、100%の精度
の音声認識処理は難しく、従って音声認識機能付きの装
置においては、音声認識装置による音声認識結果が誤っ
ている場合、ユーザが意図した処理と異なる処理が行わ
れることになる。そこで、これを防止するため、通常
は、音声認識結果をユーザに提示して、その正誤を確認
させるようになされている。
【0004】即ち、一般的に、音声認識処理によれば、
入力された音声に対する尤度とともに音声認識結果が得
られるので、音声認識結果には、その尤度にしたがって
順位を付けることができる(例えば、M個の語彙を音声
認識の対象とした場合、最も尤度の高い音声認識結果
(語彙)の順位を1位、次に尤度の高い音声認識結果の
順位を2位、・・・、最も尤度の低い音声認識結果の順
位をM位とすることができる)。
【0005】そこで、上述したような音声認識機能付き
装置では、例えば1位の音声認識結果が、例えば合成音
で出力されたり、あるいは表示されることによって、ユ
ーザに提示され、その確認が行われるようになされてお
り、さらに音声認識結果が正しいことが確認された場合
には、その音声認識結果にしたがった処理が行われ、ま
た音声認識結果が誤っていることが確認された場合に
は、例えば次の順位の音声認識結果が提示されたり、あ
るいは発話の言い直しが要求されるようになされてい
る。
【0006】
【発明が解決しようとする課題】従って、ユーザには、
音声認識結果の確認後、その正誤を装置に認識させるた
めの入力を行ってもらう必要がある。そこで、装置に
は、この入力を行うための手段として、例えばボタンや
キーなどの操作部が設けられている。即ち、例えば音声
認識結果が正しい場合に操作されるボタン(正ボタン)
と、誤っている場合に操作されるボタン(誤ボタン)が
設けられている。
【0007】よって、装置に所定の処理を行わせるため
に、ユーザには、音声による入力だけではなく、正ボタ
ンおよび誤ボタンを操作することによる入力も要求され
ることになり、このような2種類の入力を要求すること
は、ユーザインターフェイスの向上のために音声認識装
置を設けたのにも関わらず、却ってユーザに煩わしさを
感じさせることになる。
【0008】さらに、音声認識結果が誤っている場合
に、誤ボタンの操作により次の順位の音声認識結果が提
示されるようになされているときには、ユーザは、正し
い音声認識結果が提示されるまで、誤ボタンを操作し、
さらに正しい音声認識結果が提示された場合には、正ボ
タンを操作しなければならず、従って音声認識結果の正
誤に関わらず、ボタンの操作を行う必要があった。
【0009】そこで、誤ボタンのみ設けられ、音声認識
結果の提示後一定期間、誤ボタンが操作されなかった場
合には、その音声認識結果を正しいものとして扱う装置
(例えば、東芝社製の音声認識機能内臓電話機FF−7
0AIなど)がある。このような装置では、音声認識結
果の提示後一定期間内に誤ボタン(NEXTボタン)が
操作された場合には、その音声認識結果に代えて、次の
順位の音声認識結果が提示され、音声認識結果の提示後
一定期間内に誤ボタン(NEXTボタン)が操作されな
かった場合には、その音声認識結果が正しいものとして
確定されるようになされている。
【0010】上述の装置によれば、ボタンの操作は、誤
ボタンの操作だけで済む。しかしながら、やはり音声お
よびボタンの操作による2種類の入力が要求され、ユー
ザに煩わしさを感じさせることになる。
【0011】一方、音声認識機能付き装置には、上述し
たように1位の音声認識結果のみだけでなく、順位の高
い順に所定数の音声認識結果を、例えばメニュー形式で
表示することにより、複数の音声認識結果を、ユーザに
提示し、その中から、正しいものをユーザに選択させる
ようになされているものがある。
【0012】しかしながら、このような装置でも、ボタ
ン(キー)などを操作することにより、複数の音声認識
結果の中から、正しいものを選択する必要があり、やは
りユーザに煩わしさを感じさせる課題があった。
【0013】さらに、例えば音声認識時に混入するノイ
ズやユーザの言い間違いなどによって、正しい音声認識
結果が、提示された複数の音声認識結果に含まれていな
い場合には、ユーザは、言い直しをする必要があるが、
この場合、音声認識結果の選択処理を終了して音声認識
処理を開始することを装置に認識させるために、さらに
他の操作をしなければならなかった。
【0014】また、例えば音声認識時に混入するノイズ
やユーザの言い間違いなどがなかった場合であっても、
音声認識処理性能が不足しているときには、正しい音声
認識結果が、提示された複数の音声認識結果に含まれな
いことがある。音声認識結果の順位は、言い直すことに
よってそれほど大きく変化するものではなく、従って、
正しい音声認識結果が、順位の低いものとされている場
合には、何度言い直しを行っても、正しい音声認識結果
が提示されないことになる。
【0015】本発明は、このような状況に鑑みてなされ
たものであり、ユーザに煩わしさを感じさせることな
く、即ち容易に正しい音声認識結果を得ることができる
ようにするものである。
【0016】
【課題を解決するための手段】本発明の音声認識装置
は、音声を入力する入力手段(例えば、図1や図5に示
すマイク1など)と、入力手段に入力された音声を音響
分析する分析手段(例えば、図1や図5に示す音声分析
部2など)と、分析手段の分析結果に基づいて、入力手
段に入力された音声を音声認識する音声認識手段(例え
ば、図1や図5に示す音声認識部5など)と、音声認識
手段の音声認識結果を出力する出力手段(例えば、図1
に示すスピーカ9や図5に示す認識候補表示部21な
ど)と、入力手段に音声が入力された後、所定の時間を
計時する計時手段(例えば、図1や図5に示すタイマ回
路14など)と、所定の時間の経過前に、入力手段に音
声が入力された場合に、その音声を、前に入力された音
声の言い直しとして、音声認識手段に音声認識させる制
御を行い、入力手段に音声が入力されずに、所定の時間
が経過した場合に、最終的な音声認識結果を確定する制
御手段(例えば、図1に示す中央処理部4や図5に示す
中央処理部23など)とを備えることを特徴とする。
【0017】この音声認識装置においては、音声認識手
段には、音声認識結果を、その尤度にしたがった順位と
ともに出力させ、制御手段には、最新の音声認識結果か
ら、その前までに得られた、順位が1位の音声認識結果
を除いたもののうち、順位の最も高いものを、最新の音
声認識結果の順位が1位のものとする順位入れ替えも行
わせ、出力手段には、最新の音声認識結果のうちの順位
が1位のものを出力させることができる。
【0018】また、音声認識手段には、音声認識結果
を、その尤度にしたがった順位とともに出力させ、制御
手段には、最新の音声認識結果から、その前までに得ら
れた、順位が1乃至L位の音声認識結果を除いたものの
うち、順位の高い順にL個を、最新の音声認識結果の順
位が1乃至L位のものとする順位入れ替えも行わせ、出
力手段には、最新の音声認識結果のうちの順位が1乃至
L位のものを、少なくとも出力させることができる。
【0019】さらに、音声認識手段には、音声認識結果
を、その尤度にしたがった順位とともに出力させるとと
もに、前に入力された音声の言い直しとして入力手段に
入力された音声を、それまでに得られた音声認識結果の
うちの順位が上位のもの以外を音声認識の対象語彙とし
て、音声認識させることができる。
【0020】また、所定の時間の経過後に、前に入力さ
れた音声の言い直しをする期間が終了した旨を報知する
報知手段(例えば、図1や図5に示すビープ音出力部1
1など)をさらに備えることができる。
【0021】
【作用】上記構成の音声認識装置においては、マイク1
に入力された音声が、音声分析部2で音響分析される。
そして、音声認識部5で、その分析結果に基づいて、マ
イク1に入力された音声が音声認識され、スピーカ9か
ら、その音声認識結果が出力される。一方、マイク1に
音声が入力された後は、タイマ回路14で所定の時間が
計時され、その所定の時間の経過前に、マイク1に音声
が入力された場合には、その音声が、前に入力された音
声の言い直しとして音声認識される。そして、マイク1
に音声が入力されずに、所定の時間が経過した場合に
は、最終的な音声認識結果が確定される。従って、ユー
ザは、スピーカ9から出力された音声認識結果が誤って
いる場合には、所定の時間の経過前に、再度発話すれば
良く、また音声認識結果が正しい場合には、所定の時
間、発話しなければ良いので、ユーザに煩わしさを感じ
させることなく、正しい音声認識結果を得ることができ
る。
【0022】また、音声認識部5に、音声認識結果を、
その尤度にしたがった順位とともに出力させ、中央処理
部4に、最新の音声認識結果から、その前までに得られ
た、順位が1位の音声認識結果を除いたもののうち、順
位の最も高いものを、最新の音声認識結果の順位が1位
のものとする順位入れ替えも行わせ、スピーカ9に、最
新の音声認識結果のうちの順位が1位のものを出力させ
る場合、音声認識部5に、音声認識結果を、その尤度に
したがった順位とともに出力させ、中央処理部23に、
最新の音声認識結果から、その前までに得られた、順位
が1乃至L位の音声認識結果を除いたもののうち、順位
の高い順にL個を、最新の音声認識結果の順位が1乃至
L位のものとする順位入れ替えも行わせ、認識候補表示
部21に、最新の音声認識結果のうちの順位が1乃至L
位のものを、少なくとも出力させる場合、および音声認
識部5に、音声認識結果を、その尤度にしたがった順位
とともに出力させるとともに、前に入力された音声の言
い直しとしてマイク1に入力された音声を、それまでに
得られた音声認識結果のうちの順位が上位のもの以外を
音声認識の対象語彙として、音声認識させる場合におい
ては、言い直しの音声の音声認識結果として、それまで
に出力された、誤った音声認識結果が出力されないの
で、正しい音声認識結果が出力されなくなることを防止
することができる。
【0023】さらに、所定の時間の経過後に、前に入力
された音声の言い直しをする期間が終了した旨を報知す
るビープ音出力部11を備える場合においては、ユーザ
に、言い直しが可能か否かを認識させることができる。
【0024】
【実施例】図1は、本発明の音声認識装置の一実施例の
構成を示している。マイク1には、利用者が発した音声
が入力され、そこでは、その音声が電気信号としての音
声信号に変換されるようになされている。音声分析部2
は、マイク1より出力される音声信号をA/D変換し、
その結果得られるディジタル信号としての音声信号を、
音響分析(例えば、線形予測分析や、バンドパスフィル
タ群によるフィルタバンク分析など)して、音声の特徴
パラメータ(音響パラメータ)を算出するようになされ
ている。音声区間検出部3は、音声分析部2で得られた
特徴パラメータに基づいて、マイク1に入力された音声
の音声区間を検出し、その音声区間における特徴パラメ
ータを、中央処理部4に供給するようになされている。
【0025】中央処理部4は、装置を構成する各ブロッ
クを制御するようになされている。
【0026】音声認識部5は、中央処理部4に制御さ
れ、そこから供給される特徴パラメータを用い、認識語
彙音韻列辞書6を参照して、マイク1に入力された音声
を音声認識するようになされている。即ち、認識語彙音
韻列辞書6には、音声認識部5で音声認識の対象とする
語彙の音韻列が記憶されており、音声認識部5は、中央
処理部4から特徴パラメータが供給されると、認識語彙
音韻列辞書6に登録されている各音韻列(各音韻列に対
応する特徴パラメータ)が、その特徴パラメータに類似
している度合いに相当する尤度を求め、各音韻列に、そ
の尤度にしたがった順位を付して、中央処理部4に出力
するようになされている。
【0027】なお、音声認識部5は、順位を付した音声
認識結果(認識語彙音韻列辞書6に登録されている各音
韻列)の他、その尤度も、中央処理部4に供給するよう
になされている。また、中央処理部4は、音声認識を行
う必要があるかいなかを判断するようになされており、
その必要があると判断した場合のみ、特徴パラメータ
を、音声認識部5に供給するようになされている。さら
に、中央処理部4は、音声認識部5から音声認識結果、
その順位、および尤度を受信すると、それに必要な処理
を施して、認識結果記憶部7に供給するようになされて
いる。
【0028】認識結果記憶部7は、中央処理部4から供
給される音声認識結果、その順位、および尤度を記憶す
るようになされている。
【0029】テキスト音声合成部8は、中央処理部4か
ら供給されるテキストに対応する合成音を生成し、スピ
ーカ9に供給するようになされている。ここで、中央処
理部4は、音声認識結果、その順位、および尤度を認識
結果記憶部7に供給して記憶させるとともに、その認識
結果記憶部7に記憶させた音声認識結果(音韻列)のう
ちの順位が1位のものに対応するテキスト(テキスト情
報)を生成し、テキスト音声合成部8に供給するように
なされている。従って、テキスト音声合成部8では、順
位が1位の音声認識結果(音韻列)の合成音が生成され
る。
【0030】スピーカ9は、テキスト音声合成部8から
供給される合成音、即ち順位が1位の音声認識結果、お
よび後述するビープ音出力部11から供給されるビープ
音を出力するようになされている。ビープ音出力部11
は、中央処理部4の制御にしたがって、スピーカ9にビ
ープ音を供給するようになされている。
【0031】ROM12には、システムプログラムおよ
び必要なアプリケーションプログラムが記憶されてい
る。RAM12は、中央処理部4の動作上必要なデータ
を記憶するようになされている。中央処理部4は、この
ROM12に記憶されているプログラムにしたがった処
理を、必要に応じて、RAM13に対してデータの読み
書きを行いながら実行する。
【0032】タイマ回路14は、例えばカウンタを内蔵
し、中央処理部4から所定の値が供給されると、その値
をカウンタにセットし、図示せぬクロック回路から供給
されるクロックに同期して、カウンタのカウント値を1
ずつデクリメントするようになされている。そして、タ
イマ回路14は、カウント値が0になると、制御信号を
中央処理部4に出力するようになされている。即ち、タ
イマ回路14は、中央処理部4から所定の値が供給され
てから、その所定の値に相当する時間(所定の時間)を
計時し、その所定の時間の経過後、制御信号を中央処理
部4に供給するようになされている。
【0033】ここで、中央処理部4は、マイク1に音声
が入力された後、所定の値をタイマ回路14に供給する
ようになされている。
【0034】次に、図2のフローチャートを参照して、
その動作について説明する。なお、図2のフローチャー
トは、中央処理部4の処理を示している。
【0035】装置が音声認識可能な状態とされると、ま
ず最初にステップS1において、認識結果がクリアさ
れ、即ち認識結果記憶部7の記憶内容がクリアされ、ス
テップS2に進み、マイク1に音声が入力されたか否か
が判定される。
【0036】ここで、利用者(ユーザ)によって発話が
なされ、その音声がマイク1に入力されると、その音声
は、音声分析部2に供給される。音声分析部2では、マ
イク1より供給された音声から、上述したようにして特
徴パラメータが抽出され、音声区間検出部3に供給され
る。音声区間検出4では、マイク1に入力された音声の
音声区間が検出され、その音声区間における特徴パラメ
ータが、中央処理部4に供給される。中央処理部4で
は、ステップS2において、音声区間検出部3から特徴
パラメータが送信されてきたか否かで、マイク1に音声
が入力されたか否かが判定される。
【0037】ステップS2において、マイク1に音声が
入力されていないと判定された場合、ステップS2に戻
り、マイク1に音声が入力されたと判定されるまで、ス
テップS2の処理を繰り返す。また、ステップS2にお
いて、マイク1に音声が入力されたと判定された場合、
即ち、中央処理部4において、音声区間検出部3からの
特徴パラメータが受信された場合、ステップS3に進
み、その特徴パラメータが、音声認識部5に供給され
る。
【0038】その後、ステップS4に進み、音声認識部
5から音声認識結果(本実施例においては、音声認識結
果とは、狭義には、認識語彙音韻列辞書6に登録されて
いる各音韻列を意味するが、広義には、認識語彙音韻列
辞書6に登録されている各音韻列、その順位、および尤
度を意味し、ここでの音声認識結果は、広義の音声認識
結果を意味する)が送信されて否か否かが判定される。
【0039】ここで、音声認識部5では、中央処理部4
から特徴パラメータを受信すると、その特徴パラメータ
を用いての音声認識が行われ、その音声認識結果が中央
処理部4に送信される。
【0040】ステップS4において、音声認識部5から
音声認識結果が送信されてきていないと判定された場
合、ステップS4に戻る。また、ステップS4におい
て、音声認識部5から音声認識結果が送信されてきたと
判定された場合、ステップS5に進み、その音声認識結
果が、認識結果記憶部7に供給される。認識結果記憶部
7は、中央処理部4から音声認識結果を受信すると、そ
れを一時記憶する。
【0041】以上の処理後、中央処理部4では、ステッ
プS6において、いま認識結果記憶部7に供給した最新
の音声認識結果(音韻列)から、既に認識結果記憶部7
に記憶されている、その前までに得られた、順位が1位
の音声認識結果を除いたもののうち、順位の最も高いも
のを、最新の音声認識結果の順位が1位のものとする順
位入れ替え処理(詳細は、後述する)が行われる。そし
て、最新の音声認識結果は、この順位入れ替え処理によ
り入れ替えられた順位で、認識結果記憶部7に記憶し直
される。
【0042】但し、ステップS2でマイク1に入力され
たと判定された音声の音声認識結果、即ち最初の音声認
識結果が、認識結果記憶部7に供給された時点では、認
識結果記憶部7には、まだ音声認識結果(過去の音声認
識結果)が記憶されていないから、中央処理部4では、
上述のステップS6の処理はスキップされ、ステップS
7の処理が行われる。
【0043】ステップS7では、タイマ回路14の設定
が行われる。即ち、中央処理部4は、所定の値をタイマ
回路14に供給する。これにより、タイマ回路14で
は、上述したようにして、所定の時間の計時が開始され
る。
【0044】中央処理部4では、タイマ回路14の設定
後、ステップS8において、ステップS6で順位並べ替
え処理の結果、順位が1位となった音声認識結果(音韻
列)を利用者(ユーザ)に提示する処理が行われる。即
ち、ステップS8では、認識結果記憶部7に記憶されて
いる、最新の音声認識結果の順位が1位のものに対応す
るテキストが生成され、テキスト音声合成部8に出力さ
れる。テキスト音声合成部8では、中央処理部4からの
テキストに対応する合成音が生成されて、スピーカ9に
供給され、これによりスピーカ9からは、最新の音声認
識結果(音韻列)の順位が1位のものが、合成音で出力
される。
【0045】なお、ステップS8においては、ステップ
S6の順位並べ替え処理がスキップされた場合には、音
声認識部5より出力された状態において順位が1位の音
声認識結果が、利用者に提示される。
【0046】以上のようにして、順位が1位の音声認識
結果が利用者に提示された後、その音声認識結果が誤っ
ている場合には、利用者によって、前に発せられた音声
が言い直される。この言い直された音声は、マイク1に
入力され、以下、上述した場合と同様にして、音声分析
部2および音声区間検出部3で処理が行われ、その音声
の特徴パラメータが、中央処理部4に供給される。
【0047】そこで、中央処理部4では、ステップS9
において、ステップS2における場合と同様にして、マ
イク1に音声(言い直しの音声)が入力されたか否かが
判定される。ステップS9において、マイク1に音声が
入力されていないと判定された場合、ステップS10に
進み、タイマ回路14から制御信号が送信されてきたか
否かが判定される。ステップS10において、タイマ回
路14から制御信号が送信されてきていないと判定され
た場合、即ち、ステップS7でタイマ回路14の設定が
行われてから所定の時間が経過していない場合、ステッ
プS9に戻り、再び、上述した判定処理が行われる。
【0048】従って、所定の時間が計時するまでは、中
央処理部4は、前に入力された音声の言い直しを受け付
けるため待機する。
【0049】そして、ステップS9において、マイク1
に音声が入力されたと判定された場合、ステップS3に
戻り、音声区間検出部3より供給される特徴パラメータ
を、音声認識部5に送信することにより、いまマイク1
に入力された音声を、前に入力された音声の言い直しと
して音声認識させる。そして、以下、上述した場合と同
様の処理が行われる。
【0050】ここで、ステップS9において、マイク1
に入力されたと判定された音声は、言い直しの音声であ
るから、認識結果記憶部7には、既に、その前までに得
られた音声認識結果が記憶されている。従って、この場
合、ステップS6の順位入れ替え処理が行われることに
なる。
【0051】上述したように、ステップS6の順位入れ
替え処理では、最新の音声認識結果(音韻列)から、既
に認識結果記憶部7に記憶されている、その前までに得
られた、順位が1位の音声認識結果、即ち、既に利用者
に提示された音声認識結果を除いたもののうち、順位の
最も高いものが、最新の音声認識結果の順位が1位のも
のとされる。
【0052】従って、言い直しを行うことによって、既
に利用者に提示された音声認識結果は提示されないの
で、利用者が発した音声が、音声認識対象語彙であれ
ば、即ち認識語彙音韻列辞書6に登録されているいずれ
かの音韻列であれば、何度言い直しを行っても、正しい
音声認識結果が提示されない状態となることを防止する
ことができる。その結果、見かけ上の音声の認識率を向
上させることができる。
【0053】ここで、図3は、N−1回の言い直し、即
ち同一内容の音声についてN回の音声認識処理が行わ
れ、さらにステップS6の順位入れ替え処理が行われた
後の、認識結果記憶部7の記憶内容を示している。この
場合、同図に示すように、認識結果記憶部7は、N回分
の音声認識結果(音韻列)c(i,j)を記憶した状態
となる。但し、1≦i≦N,1≦j≦Mで、iは音声認
識の回数を、jは順位を、それぞれ意味する。また、M
は、認識語彙音韻列辞書6に登録されている語彙(音韻
列)の総数を意味する。
【0054】認識結果記憶部7の記憶内容が、図3に示
した状態である場合に、ユーザに提示される音声認識結
果は、順位入れ替え処理が行われた最新の音声認識結果
(N回目の音声認識結果)のうちの順位が1位のもので
あるc(N,1)(これは、c(1,1)乃至c(N−
1,1)のいずれでもない)である。
【0055】なお、認識結果記憶部7には、N回分の順
位が付された音声認識結果c(i,j)の他、図3に示
すように、同一内容の音声についての音声認識処理の回
数Nも記憶されるようになされている。この音声認識回
数Nは、中央処理部4より認識結果記憶部7に供給され
るようになされている。また、図3には図示していない
が、認識結果記憶部7には、上述したように、音声認識
結果(音韻列)の尤度も記憶されるようになされてい
る。
【0056】図2に戻り、ステップS10において、タ
イマ回路14から制御信号が送信されてきたと判定され
た場合、即ち、ステップS7でタイマ回路14の設定が
行われてから、マイク1に音声が入力されずに所定の時
間が経過した場合、ステップS11に進み、スピーカ9
からビープ音を出力させる処理が行われる。即ち、ステ
ップS11では、中央処理部4から、ビープ音出力部1
1に制御信号が出力される。ビープ音出力部11は、中
央処理部4からの制御信号を受信すると、ビープ音を生
成し、スピーカ9に供給する。スピーカ9からは、ビー
プ音が出力され、これにより利用者に対し、前に入力さ
れた音声の言い直しをする期間が終了した旨が報知され
る。
【0057】ここで、利用者は、ステップS8で提示さ
れた音声認識結果が正しければ、タイマ回路14で所定
の時間が計時されるまで、発話せずに待機する。マイク
1に音声が入力された後、タイマ回路14で所定の時間
が計時された場合には、上述したようにビープ音が出力
されるから、利用者は、言い直しの期間が終了し、新た
な発話の受け付けが可能な状態になったことを認識する
ことができる。
【0058】ビープ音が出力された後、ステップS12
に進み、いままでマイク1に入力された音声の認識結果
が、認識結果記憶部7に記憶されているc(N,1)に
確定(最終確定)され、処理を終了する。そして、再び
ステップS1からの処理が開始され、以下、新たな発話
に対して、同様の処理が行われる。
【0059】次に、図4は、図2のステップS6の順位
入れ替え処理の詳細を説明するフローチャートである。
まず最初に、ステップS1において、順位を示す変数r
に、初期値としての1がセットされ、ステップS2に進
み、最新の音声認識結果(音韻列)のうちの1位のもの
を示す変数wに、N回目の音声認識結果のうちのr位の
ものがセットされる。即ち、最初にステップS22の処
理が行われる場合においては、変数wに、音声認識部5
から出力されたN回目の音声認識結果のうちの1位のも
のがセットされる。その後、ステップS23において、
音声認識回数をカウントするための変数tに、初期値と
しての1がセットされ、ステップS24に進み、変数t
が、N−1以下であるか否かが判定される。ステップS
24において、変数tが、N−1以下であると判定され
た場合、ステップS25に進み、変数wが、認識結果記
憶部7に既に記憶されている、t回目の音声認識結果の
うちの1位のものc(t,1)と等しいか否かが判定さ
れる。
【0060】ステップS25において、変数wが、t回
目の音声認識結果のうちの1位のものc(t,1)と等
しいと判定された場合、即ち変数wにセットされている
N回目の音声認識結果が、既に利用者に提示されたもの
である場合、ステップS27に進み、変数rが1だけイ
ンクリメントされ、ステップS22に戻る。従って、こ
の場合、変数wにN回目の音声認識結果のうちの1位の
ものがセットされていたときには、変数wに、N回目の
音声認識結果のうちの2位のものがセットされ、以下上
述した処理が繰り返される。
【0061】一方、ステップS25において、変数w
が、t回目の音声認識結果のうちの1位のものc(t,
1)と等しくないと判定された場合、ステップS26に
進み、変数tが1だけインクリメントされ、ステップS
24に戻る。即ち、変数wにセットされた音声認識結果
が、t回目の音声認識結果のうちの1位のものと等しく
ない場合には、t+1回目の音声認識結果のうちの1位
のものを対象として、同様の処理が行われる。
【0062】そして、ステップS24において、変数t
が、N−1以下でないと判定された場合、即ち変数wに
セットされたN回目の音声認識結果が、1乃至N−1回
目のいずれの音声認識結果のうちの1位のものとも等し
くない場合、ステップS28に進み、変数wにセットさ
れた音声認識結果が、N回目の音声認識結果の1位とさ
れるとともに、それ以外のN回目の音声認識結果が、そ
の順位に対応して入れ替えられる。即ち、音声認識部5
から出力された、1,2,・・・,m,・・・,M位の
N回目の音声認識結果のうち、ステップS24の処理の
終了後に変数wに、m位のものがセットされていた場合
には、例えば、このm位の音声認識結果が1位にされ、
1位の音声認識結果が2位にされ、・・・、m−1位の
音声認識結果がm位にされ、以下m+1乃至M位の音声
認識結果は、そのままとされる。
【0063】以上のようにして、最新の音声認識結果
(N回目の音声認識結果)から、既に認識結果記憶部7
に記憶されている、その前までに得られた、順位が1位
の音声認識結果を除いたもののうち、順位の最も高いも
のが、最新の音声認識結果の順位が1位のものとされ、
上述したように、認識結果記憶部7に記憶される。
【0064】次に、図5は、本発明の音声認識装置の第
2実施例の構成を示している。なお、図中、図1におけ
る場合と対応する部分については、同一の符号を付して
ある。即ち、この音声認識装置は、中央処理部4または
テキスト音声合成部8に代えて、中央処理部23または
認識候補表示部21がそれぞれ設けられ、さらにメニュ
ー操作リモコン22が新たに設けられている他は、図1
の音声認識装置と同様に構成されている。
【0065】認識候補表示部21は、中央処理部23か
ら供給される音声認識結果を表示するようになされてい
る。なお、認識候補表示部21は、L個の音声認識結果
を同時に表示することができるようになされている。メ
ニュー操作リモコン22は、例えば図6に示すように、
上キー31、下キー32、およびエンタ(ENTER)
キー33で構成され、各キーが操作されると、そのキー
に対応した操作信号を、中央処理部23に出力するよう
になされている。
【0066】中央処理部23は、図1の中央処理部4と
ほぼ同様の処理を行う他、リモコン22からの操作信号
に対応して、所定の処理を行うようにもなされている。
さらに、中央処理部23は、必要に応じて、認識結果記
憶部7から最新の音声認識結果を読み出し、その音声認
識結果を、L個単位で、認識候補表示部21に表示させ
るようにもなされている。
【0067】次に、その動作について説明する。この音
声認識装置においては、図1で説明した場合とほぼ同様
にして、認識結果記憶部7に音声認識結果が記憶される
と、中央処理部23において、認識結果記憶部7に記憶
された最新の音声認識結果(N回目の音声認識結果)の
うちの1乃至L位のものが読み出され、認識候補表示部
21に供給されて、メニュー形式で表示される。これに
より、利用者に1乃至L位の音声認識結果が提示され
る。
【0068】このとき、認識候補表示部21には、1乃
至L位の音声認識結果のうちの、例えば1位の音声認識
結果が、注目音声認識結果として、例えば反転表示され
る。利用者は、注目音声認識結果が正しいものである場
合には、リモコン22(図6)のエンタキー33を操作
する。中央処理部23では、エンタキー33の操作に対
応する操作信号を受信すると、注目音声認識結果が、最
終的な音声認識結果として確定される。
【0069】また、利用者は、注目音声認識結果が誤っ
ているものである場合、リモコン22(図6)の上キー
31または下キー32を操作して、注目音声認識結果
を、正しいものに変更する。以下、上述した場合と同様
に、エンタキー33を操作することで、最終的な音声認
識結果が確定される。なお、中央処理部23は、上キー
31または下キー32の操作に対応する操作信号を受信
すると、注目音声認識結果を、1つ上または下に表示さ
れている音声認識結果に変更するようになされている。
また、中央処理装置23は、認識候補表示部21に、A
+1乃至A+L位の音声認識結果が表示されており、A
+1位またはA+L位の音声認識結果が注目音声認識結
果とされている場合に、上キー31または下キー32の
操作に対応する操作信号を受信すると、認識候補表示部
21の表示が、A乃至A+L−1またはA+2乃至A+
L+1位の音声認識結果となるように下または上スクロ
ールさせ、注目音声認識結果を、それぞれA位またはA
+L+1位の音声認識結果とするようになされている。
【0070】ここで、図7は、L=3の場合の、認識候
補表示部21の表示画面を示している。図7(a)は、
3乃至5位の音声認識結果(認識候補3乃至5)が表示
されており、注目音声認識結果が、4位の音声認識結果
とされている様子を示している。この状態において、エ
ンタキー33が操作されると、4位の音声認識結果が最
終的な音声認識結果として確定(選択)される。また、
図7(a)に示した場合において、上キー31が操作さ
れると、図7(b)に示すように、注目音声結果が、3
位の音声認識結果とされる。
【0071】図7(b)に示した場合において、下キー
32が操作されると、図7(a)に示した表示状態に戻
り、またエンタキー33が操作されると、3位の音声認
識結果が最終的な音声認識結果として確定される。さら
に、図7(b)に示した場合において、上キー31が操
作されると、表示画面が下スクロールされ、図7(c)
に示すように、2乃至4位の音声認識結果が表示され、
そのうちの2位の音声認識結果が注目音声認識結果とさ
れる。
【0072】一方、図7(a)に示した場合において、
下キー32が操作されると、図7(d)に示すように、
注目音声結果が、5位の音声認識結果とされる。
【0073】図7(c)に示した場合において、上キー
31が操作されると、図7(a)に示した表示状態に戻
り、またエンタキー33が操作されると、5位の音声認
識結果が最終的な音声認識結果として確定される。さら
に、図7(d)に示した場合において、下キー32が操
作されると、表示画面が上スクロールされ、図7(e)
に示すように、4乃至6位の音声認識結果が表示され、
そのうちの6位の音声認識結果が注目音声認識結果とさ
れる。
【0074】なお、表示画面の最上行または最下行に、
1位またはM位(最下位)の音声認識結果が表示され、
かつそれが注目音声認識結果とされている場合に、上キ
ー31または下キー32が操作されたときには、画面の
表示は変化しないようになされている。
【0075】次に、図8は、図5の中央処理部23の処
理を説明するフローチャートである。中央処理部23で
は、まずステップS31乃至S35において、図2のス
テップS1乃至S5で説明した場合と同様の処理がそれ
ぞれ行われる。そして、その後、即ちステップS35に
おいて、音声認識部5から出力された最新の音声認識結
果を認識結果記憶部7に送信して一時記憶させた後、ス
テップS36に進み、その最新の音声認識結果から、既
に認識結果記憶部7に記憶されている、その前までに得
られた、順位が1乃至L位の音声認識結果を除いたもの
のうち、順位の高い順にL個を、最新の音声認識結果の
順位が1乃至L位のものとする順位入れ替え処理(詳細
は、後述する)が行われる。そして、最新の音声認識結
果は、この順位入れ替え処理により入れ替えられた順位
で、認識結果記憶部7に記憶し直される。
【0076】但し、図2で説明した場合と同様に、ステ
ップS2でマイク1に入力されたと判定された音声の音
声認識結果、即ち最初の音声認識結果が、認識結果記憶
部7に供給された時点では、認識結果記憶部7には、ま
だ音声認識結果(過去の音声認識結果)が記憶されてい
ないから、中央処理部23では、上述のステップS36
の処理はスキップされ、ステップS37の処理が行われ
る。
【0077】ステップS37では、タイマ回路14の設
定が行われ、ステップS38に進み、ステップS36で
順位入れ替え処理の結果、順位が1乃至L位となった音
声認識結果を利用者(ユーザ)に提示する処理が行われ
る。即ち、ステップS38では、認識結果記憶部7か
ら、順位が1乃至L位の最新の音声認識結果が読み出さ
れ、認識候補表示部21に供給される。これにより、認
識結果表示部21では、順位が1乃至L位の最新の音声
認識結果が、そのうちの、例えば1位のものが注目音声
認識結果とされて表示される。
【0078】そして、ステップS39に進み、マイク1
に音声が入力されたか否かが判定される。ステップS3
9において、マイク1に音声が入力されたと判定された
場合、即ち、前に入力された音声の言い直しがなされた
場合、ステップS33に戻る。また、ステップS39に
おいて、マイク1に音声が入力されていないと判定され
た場合、ステップS40に進み、リモコン22が操作さ
れたか否かが判定される。ステップS40において、リ
モコン22が操作されていないと判定された場合、ステ
ップS41に進み、タイマ回路14から制御信号が送信
されてきたか否かが判定される。
【0079】ステップS41において、タイマ回路14
から制御信号が送信されてきていないと判定された場
合、即ち、ステップS37でタイマ回路14の設定がな
されてから、まだ所定の時間が経過していない場合、ス
テップS39に戻る。また、ステップS41において、
タイマ回路14から制御信号が送信されてきたと判定さ
れた場合、即ち、ステップS37でタイマ回路14の設
定がなされてから、所定の時間が経過した場合、ステッ
プS42に進み、図2のステップS11で説明した場合
と同様にして、スピーカ9からビープ音を出力させる処
理が行われる。
【0080】そして、ステップS43に進み、いま注目
音声認識結果とされている最新の音声認識結果、即ちリ
モコン20の操作がされていなければ、1位の音声認識
結果が、最終的な音声認識結果として確定され、ステッ
プS31に戻り、以下、新たな発話に対して、同様の処
理が行われる。
【0081】従って、タイマ回路14が所定の時間を計
時している間に、リモコン22が操作されない限りは、
1乃至L位の音声認識結果を対象に、ステップS36の
順位入れ替え処理が行われる点が異なる他は、図1の音
声認識装置と同様の処理が行われる。よって、図5の音
声認識装置においても、言い直しを行うことによって、
既に利用者に提示された音声認識結果は提示されないの
で、利用者が発した音声が、音声認識対象語彙であれ
ば、即ち認識語彙音韻列辞書6に登録されているいずれ
かの音韻列であれば、何度言い直しを行っても、正しい
音声認識結果が提示されない状態となることを防止する
ことができる。その結果、見かけ上の音声の認識率を向
上させることができる。
【0082】ところで、図5の音声認識装置では、上述
したように、認識候補表示部21に1乃至L位の音声認
識結果が表示されるので、最初に注目音声認識結果とさ
れる1位の音声認識結果ではなく、2乃至L位の音声認
識結果のいずれかが、正しい音声認識結果である場合が
ある。そして、このような場合は、言い直しを行うより
も、リモコン22を操作した方が、迅速に正しい音声認
識結果を得ることができる。
【0083】また、1乃至L位の音声認識結果が正しい
音声認識結果でない場合であっても、L位より幾分下位
の音声認識結果が正しいものである可能性も高い。従っ
て、利用者によっては、リモコン22を少し操作するだ
けで、正しい音声認識結果を得ることができる可能性が
高いならば、言い直しを行うよりも、リモコン22を操
作した方が良いと考える者もいる。
【0084】そこで、中央処理部23では、上述したよ
うに、ステップS40において、リモコン22が操作さ
れたか否かを判定するようになされている。ステップS
40において、リモコン22(図6)が操作されたと判
定された場合には、ステップS44に進み、リモコン2
2を構成する上キー31または下キー32のいずれかが
操作されたか否かが判定される。ステップS44におい
て、上キー31または下キー32のいずれかが操作され
たと判定された場合、ステップS47に進み、認識候補
表示部21の表示画面が、図7で説明したように変更さ
れ、ステップS48に進む。
【0085】また、ステップS44において、上キー3
1または下キー32のいずれも操作されていないと判定
された場合、ステップS45に進み、リモコン22を構
成するエンタキー33が操作されたか否かが判定され
る。ステップS45において、エンタキー33が操作さ
れていないと判定された場合、ステップS48に進み、
ステップS40における場合と同様に、リモコン22が
操作されたか否かが判定される。ステップS48におい
て、リモコン22が操作されたと判定された場合、ステ
ップS44に進み、以下、上述した処理が行われる。
【0086】一方、ステップS48において、リモコン
22が操作されていないと判定された場合、ステップS
49に進み、マイク1に音声が入力されたか否かが判定
される。ステップS49において、マイク1に音声が入
力されていないと判定された場合、ステップS48に戻
り、以下、ステップS48でリモコン22が操作された
と判定されるか、あるいはステップS49でマイク1に
音声が入力されたと判定されるまで、ステップS48お
よびS49の処理を繰り返す。
【0087】従って、ステップS40でリモコン22が
操作されたと判定された後は、タイマ回路14による所
定の時間の計時は無視され、リモコン22の操作と、音
声(言い直し)の入力を待つ状態となる。
【0088】そして、ステップS49において、マイク
1に音声が入力されたと判定された場合、ステップS3
3に戻る。従って、利用者は、リモコン22を操作し
て、正しい音声認識結果を検索したが、例えば即座に見
つからなかった場合などにおいては、特にリモコン22
の操作を行わずに、音声を発するだけで、前に入力した
音声の言い直しを行うことができる。
【0089】一方、ステップS45において、エンタキ
ー33が操作されたと判定された場合、ステップS43
に進み、いま注目音声認識結果とされている音声認識結
果が、最終的な音声認識結果として確定され、処理を終
了する。そして、再びステップS31からの処理が開始
され、以下、新たな発話に対して、同様の処理が行われ
る。
【0090】次に、図9は、図8のステップS36の順
位入れ替え処理のより詳細を説明するフローチャートで
ある。このステップS36の順位入れ替え処理において
は、今までに得られた音声認識結果を総合的に考慮し
て、上述したように、最新の音声認識結果(N回目の音
声認識結果)から、その前までに得られた、順位が1乃
至L位の音声認識結果を除いたもののうち、順位の高い
順にL個が、最新の音声認識結果の順位が1乃至L位の
ものとされるようになされている。
【0091】即ち、ステップS51では、順位をカウン
トする変数rまたはpに初期値としての1またはL+1
がそれぞれセットされ、ステップS52に進み、変数w
に、音声認識部5より出力される最新の音声認識結果
(N回目の音声認識結果)のうちの順位がr位のものc
(N,r)がセットされ、ステップS53に進む。ステ
ップS53では、音声認識の回数をカウントする変数t
に、初期値としての1がセットされ、ステップS54に
進み、変数tが、N−1以下であるか否かが判定され
る。ステップS54において、変数tが、N−1以下で
あると判定された場合、ステップS55に進み、1乃至
L位の順位をカウントする変数jに、初期値としての1
がセットされる。そして、ステップS56に進み、変数
jがL以下であるか否かが判定される。ステップS56
において、変数jがL以下であると判定された場合、ス
テップS58に進み、t回目の音声認識結果のうちの順
位がj位のものc(t,j)(これは、既に、利用者に
提示され、認識結果記憶部7に記憶されている)が、変
数wに等しいか否かが判定される。
【0092】ステップS58において、c(t,j)
が、変数wに等しくないと判定された場合、即ち、最新
の音声認識結果(N回目の音声認識結果)のうちのr位
のもの(c(N,r))(これは、ステップS52で変
数wにセットされている)が、t回目の音声認識結果の
うちの順位がj位のものc(t,j)とは等しくない場
合、ステップS59に進み、変数jが1だけインクリメ
ントされ、ステップS56に戻る。従って、この場合、
t回目の音声認識結果のうちの順位がj+1位のものc
(t,j+1)について、ステップS58における比較
処理が行われる。
【0093】一方、ステップS58において、c(t,
j)が、変数wに等しいと判定された場合、即ち、最新
の音声認識結果(N回目の音声認識結果)のうちのr位
のもの(c(N,r))が、t回目の音声認識結果のう
ちの順位がj位のものc(t,j)と等しく、従って、
過去に、利用者に提示されているものである場合、ステ
ップS60,S61に順次進み、最新の音声認識結果
(N回目の音声認識結果)のうちのr位のものc(N,
r)と、p位のものc(N,p)との順位が入れ替えら
れ、これにより音声認識部5より出力された時点でL位
以上であった順位の音声認識結果c(N,r)が、L+
1位以下の順位に繰り下げられるとともに、音声認識部
5より出力された時点でL+1位以下であった順位の音
声認識結果c(N,p)が、L位以上の順位に繰り上げ
られる。
【0094】即ち、ステップS60では、変数c(N,
r)に、変数c(N,p)がセットされ、ステップS6
1に進み、変数c(N,p)に、変数w(これには、ス
テップS52でc(N,r)がセットされている)がセ
ットされる。そして、ステップS62に進み、変数pが
1だけインクリメントされ、ステップS52に戻る。
【0095】一方、ステップS56において、変数jが
L以下でないと判定された場合、即ち、t回目の音声認
識結果のうち順位がL位以上のもの(利用者に既に提示
されたt回目の音声認識結果)すべてについて、ステッ
プS58の比較処理を終了した場合、ステップS57に
進み、変数tが1だけインクリメントされ、ステップS
54に戻る。
【0096】そして、ステップS54において、変数t
が、N−1以下でないと判定された場合、即ち、過去の
音声認識結果(N−1回目までの音声認識結果)のうち
の1乃至L位のものすべてについて、ステップS58の
比較処理を終了した場合、ステップS63に進み、変数
rが1だけインクリメントされる。その後、ステップS
64に進み、変数rがLより大きいか否が判定される。
ステップS64において、変数rがLより大きくないと
判定された場合、即ち音声認識部5から出力された、最
新の音声認識結果のうち1乃至L位のすべてについて、
過去の音声認識結果(N−1回目までの音声認識結果)
のうちの1乃至L位のものとの比較が、まだ終了してい
ない場合、ステップS52に戻る。
【0097】一方、ステップS64において、変数rが
Lより大きいと判定された場合、即ち音声認識部5から
出力された、最新の音声認識結果のうち1乃至L位のす
べてについて、過去の音声認識結果(N−1回目までの
音声認識結果)のうちの1乃至L位のものとの比較が終
了した場合、ステップS65に進み、変数c(N,1)
乃至c(N,L)にセットされている、最新の音声認識
結果が、その尤度にしたがった順位となるように(尤度
の高い順に上位になるように)ソートされ、処理を終了
する。
【0098】即ち、ステップS60およびS61の処理
により、変数c(N,1)乃至c(N,L)には、最新
の音声認識結果(N回目の音声認識結果)から、その前
までに得られた、順位が1乃至L位の音声認識結果(既
に、利用者に提示された音声認識結果)を除いたものの
うち、順位の高い順にL個がセットされるが、その順位
は、尤度にしたがったものとなっているとは限らないの
で、ステップS65では、変数c(N,1)乃至c
(N,L)にセットされている音声認識結果が、その尤
度順に並べ替えられる。なお、この並べ替えは、認識結
果記憶部7に記憶されている尤度を参照して行われる。
【0099】ここで、以上の処理の結果得られる変数c
(N,L+1)乃至c(N,M)には、最新の音声認識
結果(N回目の音声認識結果)が、ほぼ尤度順にセット
されていると考えられるので、本実施例においては、そ
の並べ替えは行わないようになされているが、変数c
(N,L+1)乃至c(N,M)についても、音声認識
結果が正確に尤度順に並ぶように処理を行うようにして
も良い。
【0100】なお、本実施例においては、過去の音声認
識結果を認識結果記憶部7に記憶させておき、最新の音
声認識結果から、認識結果記憶部7に記憶されている、
利用者に既に提示した1位、あるいは1乃至L位の音声
認識結果を除いたものを提示するようにしたが、このよ
うな提示方法は、例えば、音声認識部5に、前に入力さ
れた音声の言い直しとしてマイク1に入力された音声
を、それまでに得られた音声認識結果のうちの順位が上
位(あるいは1位)のもの以外を音声認識の対象語彙と
して、音声認識させることによっても実現することがで
きる。この場合、例えば認識語彙音韻列辞書6に記憶さ
れている音韻列にフラグを追加し、中央処理部4(また
は中央処理部23)に、認識語彙音韻列辞書6に記憶さ
れている音韻列のうち、利用者に提示した音声認識結果
(音韻列)に追加されているフラグをセットさせるよう
にし、音声認識部5には、フラグがセットされていない
音韻列を、音声認識の対象語彙として、音声認識させる
ようにすれば良い。
【0101】以上のようにしても、正しい音声認識結果
が提示されない状態となることを防止することができ、
その結果、見かけ上の音声の認識率を向上させることが
できる。
【0102】また、図1においては、1位の音声認識結
果を音声(合成音)で出力するようにしたが、その他、
例えば図5における場合と同様に表示するようにするこ
とも可能である。
【0103】
【発明の効果】請求項1に記載の音声認識装置によれ
ば、ユーザは、提示された音声認識結果が誤っている場
合には、所定の時間の経過前に、再度発話すれば良く、
また音声認識結果が正しい場合には、所定の時間、発話
しなければ良いので、ユーザに煩わしさを感じさせるこ
となく、正しい音声認識結果を得ることができる。
【0104】請求項2乃至4に記載の音声認識装置によ
れば、言い直しの音声の音声認識結果として、それまで
に出力された、誤った音声認識結果が出力されないの
で、正しい音声認識結果が出力されなくなることを防止
することができる。さらに、その結果、見かけ上の音声
の認識率を向上させることができる。
【0105】請求項5に記載の音声認識装置によれば、
ユーザに、言い直しが可能か否かを認識させることがで
きる。
【図面の簡単な説明】
【図1】本発明の音声認識装置の第1実施例の構成を示
すブロック図である。
【図2】図1の中央処理部4の動作を説明するフローチ
ャートである。
【図3】図1の認識結果記憶部7の記憶内容を説明する
図である。
【図4】図2のステップS6の順位入れ替え処理のより
詳細を説明するフローチャートである。
【図5】本発明の音声認識装置の第2実施例の構成を示
すブロック図である。
【図6】図5のリモコン22のより詳細な構成例を示す
図である。
【図7】図5の認識候補表示部21の表示画面を説明す
る図である。
【図8】図5の中央処理部23の動作を説明するフロー
チャートである。
【図9】図8のステップS36の順位入れ替え処理のよ
り詳細を説明するフローチャートである。
【符号の説明】
1 マイク 2 音声分析部 3 音声区間検出部 4 中央処理部 5 音声認識部 6 認識語彙音韻列辞書 7 認識結果記憶部 8 テキスト音声合成部 9 スピーカ 11 ビープ音出力部 12 ROM 13 RAM 14 タイマ回路 21 認識候補表示部 22 メニュー操作リモコン 23 中央処理部 31 上キー 32 下キー 33 エンタキー
───────────────────────────────────────────────────── フロントページの続き (72)発明者 加藤 靖彦 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 表 雅則 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 渡辺 一夫 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 南野 活樹 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力する入力手段と、 前記入力手段に入力された音声を音響分析する分析手段
    と、 前記分析手段の分析結果に基づいて、前記入力手段に入
    力された音声を音声認識する音声認識手段と、 前記音声認識手段の音声認識結果を出力する出力手段
    と、 前記入力手段に音声が入力された後、所定の時間を計時
    する計時手段と、 前記所定の時間の経過前に、前記入力手段に音声が入力
    された場合に、その音声を、前に入力された音声の言い
    直しとして、前記音声認識手段に音声認識させる制御を
    行い、前記入力手段に音声が入力されずに、前記所定の
    時間が経過した場合に、最終的な音声認識結果を確定す
    る制御手段とを備えることを特徴とする音声認識装置。
  2. 【請求項2】 前記音声認識手段は、前記音声認識結果
    を、その尤度にしたがった順位とともに出力し、 前記制御手段は、最新の音声認識結果から、その前まで
    に得られた、順位が1位の音声認識結果を除いたものの
    うち、順位の最も高いものを、前記最新の音声認識結果
    の順位が1位のものとする順位入れ替えも行い、 前記出力手段は、前記最新の音声認識結果のうちの順位
    が1位のものを出力することを特徴とする請求項1に記
    載の音声認識装置。
  3. 【請求項3】 前記音声認識手段は、前記音声認識結果
    を、その尤度にしたがった順位とともに出力し、 前記制御手段は、最新の音声認識結果から、その前まで
    に得られた、順位が1乃至L位の音声認識結果を除いた
    もののうち、順位の高い順にL個を、前記最新の音声認
    識結果の順位が1乃至L位のものとする順位入れ替えも
    行い、 前記出力手段は、前記最新の音声認識結果のうちの順位
    が1乃至L位のものを、少なくとも出力することを特徴
    とする請求項1に記載の音声認識装置。
  4. 【請求項4】 前記音声認識手段は、前記音声認識結果
    を、その尤度にしたがった順位とともに出力するととも
    に、前に入力された音声の言い直しとして前記入力手段
    に入力された音声を、それまでに得られた音声認識結果
    のうちの順位が上位のもの以外を音声認識の対象語彙と
    して、音声認識することを特徴とする請求項1に記載の
    音声認識装置。
  5. 【請求項5】 前記所定の時間の経過後に、前に入力さ
    れた音声の言い直しをする期間が終了した旨を報知する
    報知手段をさらに備えることを特徴とする請求項1乃至
    4のいずれかに記載の音声認識装置。
JP7001692A 1995-01-10 1995-01-10 音声認識装置 Pending JPH08190398A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7001692A JPH08190398A (ja) 1995-01-10 1995-01-10 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7001692A JPH08190398A (ja) 1995-01-10 1995-01-10 音声認識装置

Publications (1)

Publication Number Publication Date
JPH08190398A true JPH08190398A (ja) 1996-07-23

Family

ID=11508586

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7001692A Pending JPH08190398A (ja) 1995-01-10 1995-01-10 音声認識装置

Country Status (1)

Country Link
JP (1) JPH08190398A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11143487A (ja) * 1997-11-11 1999-05-28 Osaka Gas Co Ltd 音声文字変換方法と音声文字変換装置
JP2001083990A (ja) * 1999-09-09 2001-03-30 Toshiba Corp 音声認識装置および方法
JP2005055827A (ja) * 2003-08-07 2005-03-03 Denso Corp 音声認識装置、及び音声認識方法
KR100560915B1 (ko) * 2001-06-30 2006-03-14 주식회사 케이티 음성인식 결과값을 이용한 인식음성의 저장방법
JP2008145697A (ja) * 2006-12-08 2008-06-26 Mitsubishi Electric Corp 音声情報選択装置及び音声情報選択方法
JP2009151314A (ja) * 2008-12-25 2009-07-09 Sony Corp 情報処理装置及び情報処理方法
JP2020021040A (ja) * 2018-08-03 2020-02-06 ソフトバンク株式会社 情報処理装置、音声出力方法、音声出力プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11143487A (ja) * 1997-11-11 1999-05-28 Osaka Gas Co Ltd 音声文字変換方法と音声文字変換装置
JP2001083990A (ja) * 1999-09-09 2001-03-30 Toshiba Corp 音声認識装置および方法
KR100560915B1 (ko) * 2001-06-30 2006-03-14 주식회사 케이티 음성인식 결과값을 이용한 인식음성의 저장방법
JP2005055827A (ja) * 2003-08-07 2005-03-03 Denso Corp 音声認識装置、及び音声認識方法
JP2008145697A (ja) * 2006-12-08 2008-06-26 Mitsubishi Electric Corp 音声情報選択装置及び音声情報選択方法
JP2009151314A (ja) * 2008-12-25 2009-07-09 Sony Corp 情報処理装置及び情報処理方法
JP2020021040A (ja) * 2018-08-03 2020-02-06 ソフトバンク株式会社 情報処理装置、音声出力方法、音声出力プログラム

Similar Documents

Publication Publication Date Title
US6321196B1 (en) Phonetic spelling for speech recognition
EP1768103B1 (en) Device in which selection is activated by voice and method in which selection is activated by voice
JP3672573B2 (ja) 音声認識を目的とする動的に調整された習熟訓練のためのシステムと方法
US7680658B2 (en) Method and apparatus for speech recognition
JPH10187709A (ja) 音声認識中に可変数の代替ワードを表示する方法及びシステム
JPH0612092A (ja) 音声認識装置およびその動作方法
JP2008309856A (ja) 音声認識装置及び会議システム
JP2014063088A (ja) 音声認識装置、音声認識システム、音声認識方法および音声認識プログラム
JPH10503033A (ja) 新ワードのモデル化に基づく音声認識方法及びその装置
JP2006267319A (ja) 音声書き起こし支援装置及びその方法ならびに修正箇所決定装置
JP4634156B2 (ja) 音声対話方法および音声対話装置
JPH08190398A (ja) 音声認識装置
JPH11149294A (ja) 音声認識装置および音声認識方法
JP3526101B2 (ja) 音声認識装置
JP2002221989A (ja) テキスト入力方法及びその装置
EP1213706A1 (en) Method for online adaptation of pronunciation dictionaries
JP4684583B2 (ja) 対話装置
JP3340163B2 (ja) 音声認識装置
JPH10187184A (ja) 認識された音声を修正するときに認識されたワードを選択する方法及びシステム
JP4498906B2 (ja) 音声認識装置
JP2006058641A (ja) 音声認識装置
JP2003177788A (ja) 音声対話システムおよびその方法
JP3285954B2 (ja) 音声認識装置
JP2015143866A (ja) 音声認識装置、音声認識システム、音声認識方法および音声認識プログラム
Lea What causes speech recognizers to make mistakes?

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20031008