JPH0675588A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0675588A
JPH0675588A JP4228109A JP22810992A JPH0675588A JP H0675588 A JPH0675588 A JP H0675588A JP 4228109 A JP4228109 A JP 4228109A JP 22810992 A JP22810992 A JP 22810992A JP H0675588 A JPH0675588 A JP H0675588A
Authority
JP
Japan
Prior art keywords
voice
level
noise
speaker
utterance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4228109A
Other languages
English (en)
Inventor
Ryosuke Hamazaki
良介 濱崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4228109A priority Critical patent/JPH0675588A/ja
Publication of JPH0675588A publication Critical patent/JPH0675588A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】音声信号を入力してパターンマッチングにより
認識する装置の使用環境状態を発声者に認識させながら
音声認識を行う音声認識装置に関し、装置の使用環境を
発声者が十分に認識して適正な強さの発声ができるよう
にする。 【構成】発声以前に、雑音検出手段28で検出された雑
音レベルに基づいて発声者に装置の使用環境を環境報知
手段60で知らせると共に、発声時には音声レベルと雑
音レベルに基づいて装置の使用環境における発声状況を
環境報知手段60で知らせる。例えば発声以前の雑音レ
ベルを予め定めた閾値と比較し、閾値以下のとき雑音レ
ベルが適正な範囲にあることを発声者に知らせ、閾値よ
り大きいときには適正な範囲にないことを発声者に知ら
せる。同時に、発声時の音声レベルを予め定めた閾値と
比較し、閾値以上のとき音声レベルが適正な範囲にある
ことを発声者に知らせ、閾値より小さいときには適正な
範囲にないことを発声者に知らせる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号を入力してパ
ターンマッチングにより認識する音声認識装置に関し、
装置の使用環境の状態を発声者に認識させながら音声認
識を行う音声認識装置に関する。音声認識装置を使用す
る環境は様々であり、雑音の大きさに応じた強さで発声
すれば、雑音レベルが高くても、認識可能な場合もあ
る。しかし、装置の使用環境における雑音状態がどの程
度のものであり、どの程度の強さで発声したら適正なの
かは判りづらく、この点の改善が望まれる。
【0002】
【従来の技術】従来、音声認識装置を使用して実際に音
声認識を行う環境としては様々な環境が考えられ、例え
ば高いレベルの雑音が存在する環境で認識を行う場合に
は、雑音レベルに見合った大きな声で発音する必要があ
る。しかし、発声者は装置の使用環境における雑音がど
の程度のものかを正しく認識していないため、音声レベ
ルが不足して音声認識に失敗する場合が多々存在する。
【0003】この理由としては、(1)物理的な雑音レ
ベルと心理的(聴覚的)な雑音レベルとが一致していな
いため、発声環境があまり気にならない、(2)音声認
識装置がどの程度の雑音に弱いのか直観的に把握するこ
とができない、(3)自分が発声している音声のレベル
が適正であるか判断できない、などが考えられる。
【0004】この問題を解決するため例えば特開昭63
−603795号にあっては、音声認識に誤りが生じた
場合に、SN比が低いことが原因で認識誤りが起きたも
のと判断して話者に対し「もう少し大きな声で発声して
下さい」等の発声レベルに関する指示を出すようにして
いる。また特開平3−9400号にあっては、雑音レベ
ルを検出し、雑音レベルの大小に応じて話者に対し声の
大きさを指示し、更に、雑音レベルに応じて予め用意し
ておいた低雑音用テンプレートと高雑音用テンプレート
の辞書メモリを切替えて音声認識に使用するようにして
いる。
【0005】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の音声認識装置にあっては、音声認識に失敗し
た場合に強く発音する指示を話者に対して発するか、S
N比の大小に応じて話者に対して声の大きさを指示する
だけであり、いずれの場合にも実際の入力音声レベルが
どうであろうとも、そのまま音声認識を実行しており、
認識の成功、失敗を待たなければ話者は発声レベルが適
正であったか否か判らないという問題があった。
【0006】即ち強く発音する指示を受けても、実際に
発声した音声レベルが適正か否かは発声時には判らず、
もし認識に成功すれば結果として発声レベルが適正であ
ったことが判るに過ぎない。一方、認識に失敗した場合
は、失敗して初めて発声環境に対する発声レベルが適正
でなかったことを知ることとなり、更に強く発音して結
果を待つこととなり、音声入力に手間取る問題があっ
た。
【0007】このように従来装置では、発声者が音声認
識装置にとって有利となる発声の環境状態を知って積極
的に発声の強さを自らコントロールすることが十分にで
きなため、装置の使用環境に対し適正な音声レベルがな
かなか得られず、認識の失敗が多発し、効率的な認識処
理ができないという問題があった。本発明の目的は、装
置の使用環境を発声者が十分に認識して適正な強さの発
声ができるようにした音声認識装置を提供する。
【0008】本発明の他の目的は、発声前の雑音レベル
と発声時の音声レベルとに基づいて装置の使用環境を発
声者に知らせるようにした音声認識装置を提供する。本
発明の他の目的は、発声前の雑音レベルの大小を発声者
に知らせると共に発声者に音声レベルが適正範囲にある
か否かを知らせるようにした音声認識装置を提供する。
【0009】本発明の他の目的は、発生前の雑音レベル
の大小を発声者に知らせ、発生時SN比に基づいた適正
範囲にあるか否かを発声者に知らせるようにした音声認
識装置を提供する。本発明の他の目的は、発声者に対す
る適正範囲にあるか否かを2種類の表示ランプ、メッセ
ージ表示又は音声メッセージで知らせるようにした音声
認識装置を提供する。
【0010】本発明の他の目的は、装置の使用環境が適
正範囲になかった場合には、音声入力に対し音声認識を
禁止して再度音声入力を促すようにした音声認識装置を
提供する。
【0011】
【課題を解決するための手段】図1は本発明は原理説明
図である。まず本発明の音声認識装置は、発声者の音声
を電気信号に変換して入力する音声入力手段12と、音
声入力手段12により入力した音声信号を分析して入力
音声パターンを求め、辞書20に予め登録した標準パタ
ーンとの照合により音声内容を認識し、認識結果を出力
又は表示する音声認識手段14とを備える。
【0012】さらに本発明の音声認識装置は、装置の使
用環境における背景雑音を電気信号に変換して入力する
雑音入力手段26と、雑音入力手段26により入力した
雑音信号の雑音レベルを検出する雑音レベル検出手段2
8と、音声入力手段12で入力した音声信号の音声レベ
ルを検出する音声レベル検出手段34と、雑音検出手段
28で検出された雑音レベルに基づいて発生前に発声者
に装置の使用環境を知らせると共に、発声時には音声レ
ベルと雑音レベルに基づいて装置の使用環境における発
声状況を知らせる環境状態報知手段60とを設けたこと
を特徴とする。
【0013】ここで、環境状態報知手段60は、発声以
前の雑音レベルが適正範囲であるかどうかを発声者に指
示すると共に、発声時の音声レベルが適正範囲であるか
どうか発声者に指示する。具体的には、発声以前の雑音
レベルを予め定めた閾値と比較し、閾値以下のとき雑音
レベルが適正な範囲にあることを発声者に知らせ、閾値
より大きいときには適正な範囲にないことを発声者に知
らせる。
【0014】同時に、発声時の音声レベルを予め定めた
閾値と比較し、閾値以上のとき音声レベルが適正な範囲
にあることを発声者に知らせ、閾値より小さいときには
適正な範囲にないことを発声者に知らせる。また環境状
態報知手段60は、発声前の雑音レベルが予め定めた雑
音閾値以下の場合に使用する第1音声閾値と、発声前の
雑音レベルが前記雑音閾値より大きい場合に使用する前
記第1音声閾値より大きい第2音声閾値と有する。
【0015】この場合、発声前の雑音レベルが雑音閾値
以下のときは、発声時の音声レベルを第1音声閾値と比
較し、第1音声閾値以上のとき音声レベルが適正な範囲
にあることを発声者に知らせ、第1音声閾値より小さい
ときには適正な範囲にないことを発声者に知らせる。一
方、発声前の雑音レベルが雑音閾値より大きい場合は、
発声時の音声レベルを第2音声閾値と比較し、第2音声
閾値以上のとき音声レベルが適正な範囲にあることを発
声者に知らせ、第2音声閾値より小さいときには適正な
範囲にないことを発声者に知らせる。
【0016】また環境状態報知手段60は、発声時に音
声レベルの雑音レベルに対するSN比を求め、SN比の
値が適正範囲であるかどうかを発声者に知らせる。具体
的には、発声時に計算したSN比を予め定めた閾値と比
較し、閾値以上のとき音声レベルが適正な範囲にあるこ
とを発声者に知らせ、閾値より小さいときには適正な範
囲にないことを発声者に知らせる。
【0017】さらに、適正範囲にあることを指示するた
めに点灯する第1表示ランプと、適正範囲にないことを
指示するために点灯する第2表示ランプとを設ける。こ
れは第1表示ランプとして緑色の表示ランプを使用し、
第2表示ランプとして赤色の表示ランプを使用する。表
示ランプは1つのみでもよいし、3つ以上でもよい。勿
論、メッセージ表示や音声メッセージの出力により発声
者に知らせてもよい。
【0018】更にまた、環境状態報知手段60は発声時
に使用環境が適正範囲にないことを検出した場合には、
音声認識手段14に対し認識処理の禁止を指示し、且つ
発声者に再度の音声入力を促すことを特徴とする。
【0019】
【作用】このような構成を備えた本発明の音声認識装置
によれば、装置に向かって音声を発声するまえに、事前
に認識装置が置かれている環境状態、即ち背景雑音の状
態を発声者に知らせると共に、発声時の音声レベルをも
チェックし、雑音レベル及び音声レベルに基づく状況判
断から装置にとって認識が可能であるかそうでないかを
判断し、常にそれらの情報を発声者に知らせることによ
ってフィードバックする。
【0020】このため発声者は音声認識装置がおかれて
いる状況と自分の発声に関する状況について容易に判断
できるので、装置の使用環境に見合った適切な発声がで
きる。また、判断の結果、認識できない可能性が大きい
状況では、認識処理を行わないようにロックをかけ、直
ちに発声者に再発声を促すことにより、効率の良い認識
が可能となる。
【0021】
【実施例】図2は本発明の第1実施例を示した実施例構
成図である。図2において、まず音声認識側はマイクロ
ホン10,音声入力部12,分析部16,照合部18,
辞書20および結果表示部22で構成される。ここで、
音声認識のための分析部16と照合部18は、例えばD
SP14によるプログラム制御で実現され、辞書20を
用いて高速に音声認識を実行することができる。
【0022】一方、装置の使用環境における雑音状態お
よび音声入力中の状態を発声者に知らせるため、背景雑
音を電気信号に変換するマイクロホン24,雑音入力部
26,雑音レベル計算部30,雑音レベル判定部32,
音声レベル計算部34,音声レベル判定部36,総合判
定部38およびランプ表示部40が設けられる。ここ
で、雑音レベル計算部30,雑音レベル判定部32,音
声レベル計算部34,音声レベル判定部36および総合
判定部38はMPU28のプログラム制御により実現さ
れる。ランプ表示部40には、この実施例にあっては音
声入力に適した環境状態にあることを示す緑色ランプ
(第1表示ランプ)、音声入力に適した環境状態にない
ことを示す赤色ランプ(第2表示ランプ)が設けられ、
この緑色ランプおよび赤色ランプとしては発光ダイオー
ド等を使用することができる。
【0023】次に図2の実施例の動作を説明する。ま
ず、雑音入力部26からはマイクロホン24で電気信号
に変換された背景雑音を示す信号が常時入力されてお
り、雑音レベル計算部30において雑音レベルが計算さ
れ、雑音レベル判定部32に与えられている。雑音レベ
ル判定部32には予め雑音閾値THnが設定されてお
り、雑音レベル計算部30で計算した雑音レベルと雑音
閾値THnとを比較し、閾値THnより大きいかどう
か、つまり周りがうるさくて音声認識が困難であるかど
うかを判定する。
【0024】一方、音声入力部12からはマイクロホン
10で得た発生された音声の音声信号を入力し、音声レ
ベル計算部34において音声レベルを計算し、音声レベ
ル判定部36に入力する。音声レベル判定部36は入力
した音声レベルが予め定めた閾値より大きいかどうか判
定する。即ち、十分な大きさで音声が発声されているか
どうかが判定される。
【0025】この実施例において、音声レベル判定部3
6は雑音レベルが雑音閾値THnより小さいときに使用
する第1の音声閾値TH1 と、雑音レベルが雑音閾値T
H以上のときに使用する第2の音声閾値TH2 を予め設
定しており、雑音レベルが小さいときと大きいときで異
なる音声閾値を使用して音声レベルとの比較判定を行っ
ている。
【0026】勿論、雑音レベルが小さいときに使用する
音声閾値TH1 と雑音レベルの大きいときに使用する閾
値TH2 との間にはTH1 <TH2 の関係がある。雑音
レベル判定部32の判定結果および音声レベル判定部3
6の判定結果は総合判定部38に与えられ、雑音レベル
と音声レベルの2つの状況に対する論理判断を行って、
音声認識に適した環境状態にあるか、あるいは音声認識
に適していない環境状態にあるかの判定結果をランプ表
示部40に出力する。ランプ表示部40は総合判定部3
8より音声認識に適した装置の使用環境にあることを示
す判定結果が得られた場合には、緑色ランプを点灯す
る。一方、音声認識に適さない装置の使用環境の判定結
果が出力された場合には赤色ランプを点灯する。
【0027】例えば、発声前に雑音レベルが雑音閾値T
Hn以上で周りがうるさいときには赤ランプを点灯して
音声認識に適した装置の使用環境にないことを発声者に
知らせる。このためランプ表示部40の赤色ランプが点
灯した場合には、発声者は周りを静かにさせるか、ある
いは静かな場所に移動するか等の対応措置をとることが
できる。
【0028】勿論、雑音レベルが雑音閾値THnより小
さく、周りが静かなときには、ランプ表示部40の緑ラ
ンプが点灯し、音声認識に適した使用環境にあることを
知らせるので、緑ランプが点灯している状態で発声して
音声認識を行わせるようになる。また、発声前に周りが
静かで緑ランプが点灯状態で発声した場合、雑音レベル
が小さいときに使用する音声閾値TH1 より音声レベル
が小さかった場合には赤ランプが点灯し、もっと大きな
声で発声するように発声者に対し指示を出す。従って、
発声時に赤ランプが点灯した場合には発声者はもっと大
きな声で発声すれば、音声レベルが音声閾値TH1 以上
となって緑ランプの点灯に切り替わる。
【0029】一方、発声前に周囲がうるさくて雑音レベ
ルが雑音閾値THn以上となって赤ランプが点灯してい
るときにも、大きい声で発声すれば緑ランプの点灯に切
り替わる。即ち、雑音レベルが雑音閾値THn以上であ
った場合にはランプ表示部40の赤色ランプが点灯して
いるが、このとき大きい声で発声すると音声レベル判定
部36において、雑音レベルが大きいときに使用する音
声閾値TH2 以上となる音声認識に十分な音声レベルが
得られることから、緑色ランプの点灯に切り替わり、発
声者に対し周囲がうるさくても音声認識に適した十分な
レベルの音声入力が行われたことを知らせる。
【0030】一方、音声入力部12からの音声信号は分
析部16において周波数分析されて入力音声パターンに
変換される。分析部16で分析された入力音声パターン
は照合部18に与えられ、照合部18は辞書20に予め
登録している標準パターンと分析後の入力音声パターン
との照合を行い、各標準パターンに対する入力音声パタ
ーンの距離を計算する。
【0031】結果表示部22では照合部18で計算した
距離が小さい順に1または複数の認識候補を認識結果と
して表示する。結果表示部22に複数の認識候補が表示
された場合には発声者の入力操作で指定された候補が最
終的な認識結果となる。図3は図2のMPU28におけ
る雑音レベルと音声レベルに基づく環境状態の判定処理
を示したフローチャートである。
【0032】図3において、まずステップS1で音声入
力の有無を監視しており、発声前にあってはステップS
2に進んで雑音レベルと雑音閾値THnとを比較する。
雑音レベルが雑音閾値THn以下であれば周りが静かな
ことから、音声認識に適した装置の使用環境にあるもの
と判断してステップS3で緑色ランプを点灯する。一
方、雑音レベルが雑音閾値THnより大きい場合には周
囲がうるさく音声認識に適した装置の使用環境にないも
のと判断し、ステップS4で赤色ランプを点灯する。
【0033】次に発声時にあっては、ステップS1で音
声入力有りが判定され、ステップS5に進み、雑音レベ
ルと雑音閾値THnを比較する。雑音レベルが雑音閾値
THn以下で静かなときにはステップS6に進み、雑音
レベルが小さいときに使用する音声閾値TH1 とそのと
きの音声レベルを比較する。音声レベルが音声閾値TH
1 以上であれば音声認識に適した音声レベルにあるもの
と判定し、ステップS7で緑色ランプを点灯する。
【0034】一方、音声レベルが音声閾値TH1 より小
さければ音声認識には不十分な発声状態と判定し、ステ
ップS8で赤ランプを点灯し、大きい声で発声するよう
に発声者に促す。またステップS5で雑音レベルが雑音
閾値THnより大きかった場合にはステップS9に進
み、雑音レベルが大きいときに使用する音声閾値TH2
と音声レベルを比較する。音声レベルが音声閾値TH2
より大きければ雑音レベルが高いが十分に大きな声で発
声されたと判定し、ステップS10で緑ランプを点灯す
る。
【0035】ステップS9で音声レベルが音声閾値TH
2 より小さければ雑音レベルが高い状態では十分な音声
レベルが得られず、適正な音声認識ができないものとし
てステップS11で赤ランプを点灯し、より大きな声で
発声するように発声者に促す。図4は図2の実施例のD
SP14で行われる音声認識処理を示したフローチャー
トである。
【0036】図4において、まずステップS1で音声入
力の有無をチェックしており、音声入力があるとステッ
プS2に進み、音声データを分析部16に取り込む。続
いてステップS3で分析部16による周波数分析を実行
し、入力音声パターンを生成する。次にステップS4で
照合部18が辞書20に登録した標準パターンと入力音
声パターンとの距離を計算し、ステップS5で距離の短
い順に1または複数の候補を選択し、ステップS6で結
果表示部22に表示する。
【0037】結果表示部22に複数候補が選択された場
合には、発声者による入力指示で指定された候補を認識
結果として選択し、再びステップS1に戻って次の音声
入力を待つようになる。尚、図2の第1実施例にあって
は、ランプ表示部40に発声環境の適否を示す赤色ラン
プと緑色ランプの2種類のランプを用いているが、更に
赤色ランプと緑色ランプの中間範囲を示す黄色ランプを
入れるなど、3個以上の表示ランプを用いてもよい。ま
た、単一の表示ランプのみを設け、発声環境が適正でな
い場合にのみランプを点灯するようにしてもよい。
【0038】図5は本発明の第2実施例を示した実施例
構成図であり、この実施例にあっては音声レベルと雑音
レベルからSN比を計算して、発声時に音声認識に適し
た状況か否か判定するようにしたことを特徴とする。図
5において、音声認識側は音声入力部12,分析部1
6,照合部18,結果表示部22および辞書20を備
え、図2の第2実施例と同じである。また、音声認識の
ための装置の使用環境の判定側としてマイクロホン2
4,雑音入力部26,雑音レベル計算部30,雑音レベ
ル判定部32,音声レベル計算部34、更にランプ表示
部40が設けられている点は図2の第2実施例と同じで
あるが、この実施例にあっては新たにSN比計算部42
とSN比判定部44が設けられる。
【0039】図2の第1実施例にあっては、発声時の発
声環境の状態判定に背景雑音と発声音声の各々の状態を
判定した後、論理的な総合判定を行っているのに対し、
図5の第2実施例にあっては、背景雑音の雑音レベルと
発声音声の音声レベルからSN比を算出し、単に発声し
た音声レベルを判定するのではなく、背景雑音に対する
発声状態を考慮した判定を行っている。
【0040】このようなSN比に基づく判定は音声認識
装置にとっては単に背景雑音の雑音レベルが大きいこ
と、あるいは発声音声の音声レベルが小さいことのいず
れも認識率悪化の要因と考えることができるが、更に認
識率の要因は背景雑音の雑音レベルに対し発声音声の音
声レベルがどの程度あるかによって判断することもでき
るからである。
【0041】即ち、多少、背景雑音の雑音レベルが大き
くて、第1実施例における雑音閾値を越えていたとして
も、その分大きな音声レベルで発声すれば雑音レベルが
相対的に小さくなったと考えることができ、従ってSN
比による判定の方がより適切な発声環境の状態を判定す
ることができる。図5のSN比判定部44には、例えば
図6に示すような閾値THが設定されている。図6は実
験的に求めたSN比(横軸)に対する音声認識装置のエ
ラーレート(縦軸)を示したもので、例えば0.5%の
エラーレートに対応するSN比を閾値THと設定する。
勿論、必要に応じて任意のエラーレートに対応したSN
比を閾値として設定することができる。
【0042】図7は図5の第2実施例におけるSN比に
基づく音声認識の使用環境の状態判定を示したフローチ
ャートである。図7において、まずステップS1で音声
入力の有無を判定しており、発声以前にあってはステッ
プS2に進み、雑音レベルを雑音閾値THnと比較して
おり、雑音レベルが小さければステップS3で緑色ラン
プを点灯し、雑音レベルが大きければステップS4で赤
色ランプを点灯している。
【0043】続いて発声による音声入力があった場合に
はステップS1からステップS5に進み、このときの雑
音レベルと音声レベルからSN比を計算し、ステップS
6で閾値THと大小を比較する。SN比が閾値TH以上
であれば音声認識に適した発声環境にあるものと判定し
て、ステップS7で緑色ランプを点灯する。SN比が閾
値THを下回れば音声認識に適した発声環境にないもの
と判定し、ステップS8で赤色ランプを点灯する。
【0044】図8は本発明の第3実施例を示した実施例
構成図であり、この第3実施例にあっては図2の第1実
施例で設けていたランプ表示部40の代わりにメッセー
ジ表示部46とメッセージ登録部48を設けるようにし
たことを特徴とし、他の構成は図2の第1実施例と同じ
である。メッセージ登録部48には照合判定部38の判
定結果に対応したメッセージが予め登録されている。例
えば、発声前の雑音レベルが大きい場合の判定結果に対
しては「周りを静かにさせてください」または「静かな
場所に移動してください」がメッセージ登録されてい
る。また、音声レベルが音声閾値より小さい場合の判定
結果に対しては「もっと大きな声で発声してください」
等のメッセージ登録が行われる。
【0045】一方、雑音レベルが小さく周りが静かなと
きには「音声を入力してください」等のガイダンスメッ
セージを登録する。また、音声レベルが適切な範囲にあ
った場合には「適正な発声が行われています」等のメッ
セージ登録をすればよい。このように第3実施例にあっ
ては、メッセージ表示部46に総合判定部38に対応し
た具体的なガイダンスメッセージが表示されるため、発
声者は表示メッセージに対応した音声入力を行うこと
で、常に最適環境での音声認識を行わせることができ
る。
【0046】図9は本発明の第4実施例を示した実施例
構成図であり、この実施例にあっては図2の第1実施例
に設けているランプ表示部40の代わりに音声メッセー
ジ再生部50と音声メッセージ登録部52を設けたこと
を特徴とする。音声メッセージ登録部52には総合判定
部38の判定結果に対応した音声メッセージが予め登録
されており、判定結果に対する音声メッセージの内容は
図8の第3実施例の場合と同様であり、発声前および発
声時の総合判定部38の判定結果に応じ、音声メッセー
ジ再生部50が対応する音声メッセージを音声メッセー
ジ登録部52から読み出してスピーカ56により発声者
に判定結果を知らせるようになる。
【0047】図10は本発明の第5実施例を示した実施
例構成図であり、この実施例にあっては総合判定部38
による発声時の発声環境の状態判定結果から適正範囲に
ないことの判定結果が得られたとき、DSP14側で行
っている音声認識処理を禁止し、新たな音声入力を発声
者に促すようにしたことを特徴とする。図10におい
て、音声認識側の音声入力部12に通じて、DSP14
内に新たに認識モードロック部54を設けており、認識
モードロック部54がロック状態にあると、次の分析部
16および照合部18による音声認識処理を認識するこ
とができる。認識モードロック部54のロック制御およ
びアンロック制御は総合判定部38の判定結果、即ち発
声時に音声認識に適した環境にないことの判定結果が得
られたときに認識モードロック部54をロック制御する
ようにしている。それ以外の構成は図2の第1実施例と
同じである。
【0048】この第5実施例の特徴は図2の第1実施例
にあっては、発声前の背景雑音の雑音レベルを監視し
て、その状態を表示し、発声時に発声音声の音声レベル
を監視して、その状態を表示しているが、仮に発声状況
が音声認識装置にとって適正でない場合にも認識モード
に入って音声認識を実行している。これは雑音レベル判
定部32および音声レベル判定部36で適性でないと判
定されたとしても必ずしも認識が不可能とは言えず、認
識が可能な状態であることから認識モードに入っている
ものである。
【0049】しかしながら、雑音レベル判定部及びまた
は音声レベル判定部36で適性でないとの判定結果が得
られた場合には、発声した音声内容が認識候補第1位と
して認識されない場合の頻度が多くなり、再度、発声す
る必要が生じたり、複数の認識候補の中から下位の候補
を選択しなければならないなど、音声認識装置の操作性
が低下する。
【0050】また、ランプ表示部40で適正な使用環境
にあることを示していても発声者にとっては認識性能の
程度が不鮮明となり、どの程度の背景雑音や発声音声の
レベルだと認識困難であるかが分からなくなる恐れがあ
る。従って、総合判定部38において、発声時の状況が
予め定めた判断結果となったときには認識モードロック
部54をロック制御し、分析部16および照合部18に
よる音声認識処理を実行せずに再度、音声入力を促すよ
うにする。例えば、総合判定部38において、発声前に
雑音レベルが雑音閾値THnを上回っており、発声時の
音声レベルが大きい雑音レベルに対応した音声閾値TH
2 以上であっても、予め定めた値以上でなければ適正な
認識結果は得られないものと判定し、認識モードロック
部54をロック制御し、ランプ表示部40の赤色ランプ
を点灯し、発声者に次の音声入力を促す。
【0051】図11は図10の第5実施例の処理動作を
示したフローチャートであり、図11において、ステッ
プS1〜S11の処理は図3に示した第1実施例と基本
的に同じである。これに加えて図11の処理にあって
は、ステップS8において、雑音レベルが小さくても音
声レベルが小さいために適正な範囲にないと判定された
場合の赤ランプの点灯、またはステップS11で雑音レ
ベルが大きく、これに対し十分に大きな音声レベルの発
声が行われなかったときの赤ランプの点灯について、ス
テップS12に進み、DSP14の認識モードロック部
54に対し認識モードのロックを指示し、ステップS1
3でランプ表示部40の例えば赤ランプの点滅等により
再入力を指示し、続いてステップS14で音声入力が終
了した時点で認識モードロック部54のロックを解除
し、再びステップS1に戻って音声再入力を待つように
なる。
【0052】この第5実施例に設けた音声モードロック
部54については、SN比を計算して判定する図5の第
2実施例、メッセージ表示を行う図8の第3実施例、更
に音声メッセージを出力する図9の第4実施例について
も全く同様に適用することができる。
【0053】
【発明の効果】以上説明してきたように本発明によれ
ば、発声前に現在、音声認識装置が置かれている使用環
境における背景雑音の状況を発声者が認識できるため、
背景雑音の大小に適合した強さで発声することとなり、
認識率を向上することができる。また、発声中には背景
雑音に対する発声音声の割合がどの程度になっているか
を知ることができるため、背景雑音が高い場合には十分
に大きく発声して認識率を向上することができ、あるい
は現在の環境で音声認識が無理であれば緩い環境に場所
を移して発声することによって認識率を向上させること
ができる。
【0054】更に、正確な音声認識が保証されない環境
状態については、発声時に音声認識を禁止して次の音声
認識を促すことで、音声認識が保証できないような環境
でも無理な音声入力の繰返しを防ぐことができ、使用場
所を移す等して、より適切な環境での音声認識を行うこ
とができる。
【図面の簡単な説明】
【図1】本発明の原理説明図
【図2】本発明の第1実施例を示した実施例構成図
【図3】図2の装置使用環境の判定処理を示したフロー
チャート
【図4】図2の音声認識処理を示したフローチャート
【図5】本発明の第2実施例を示した実施例構成図
【図6】図5で用いるSN比の判定に使用する閾値TH
を決めるためのSN比とエラーレートの特性図
【図7】図5の装置使用環境の判定処理を示したフロー
チャート
【図8】本発明の第3実施例を示した実施例構成図
【図9】本発明の第4実施例を示した実施例構成図
【図10】本発明の第5実施例を示した実施例構成図
【図11】図10の装置使用環境の判定処理を示したフ
ローチャート
【符号の説明】
10:マイクロホン(音声用) 12:音声入力部(音声入力手段) 14:DSP(音声認識手段) 16:分析部 18:照合部 20:辞書 22:結果表示部 24:マイクロホン(背景雑音用) 26:雑音入力部(雑音入力手段) 28:MPU 30:雑音レベル計算部(雑音レベル検出手段) 32:雑音レベル判定部 34:音声レベル計算部(音声レベル検出手段) 36:音声レベル判定部 38:総合判定部 40:ランプ表示部 42:SN比計算部 44:SN比判定部 46:メッセージ表示部 48:メッセージ登録部 50:音声メッセージ再生部 52:音声メッセージ登録部 54:認識モードロック部 56:スピーカ

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】発声者の音声を電気信号に変換して入力す
    る音声入力手段(12)と、 該音声入力手段(12)により入力した音声信号を分析
    して入力音声パターンを求め、辞書(20)に予め登録
    した標準パターンとの照合により音声内容を認識する音
    声認識手段(14)と、 装置の使用環境における背景雑音を電気信号に変換して
    入力する雑音入力手段(26)と、 該雑音入力手段(26)により入力した雑音信号の雑音
    レベルを検出する雑音レベル検出手段(28)と、 前記音声入力手段(12)で入力した音声信号の音声レ
    ベルを検出する音声レベル検出手段(34)と、 前記雑音検出手段(28)で検出された雑音レベルに基
    づいて発声以前に発声者に装置の使用環境を知らせると
    共に、発声時には音声レベルと雑音レベルに基づいて装
    置の使用環境における発声状況を知らせる環境状態報知
    手段(60)と、を設けたことを特徴とする音声認識装
    置。
  2. 【請求項2】請求項1記載の音声認識装置に於いて、前
    記環境状態報知手段(60)は、発声以前の雑音レベル
    が適正範囲であるかどうかを発声者に知らせると共に、
    発声時の音声レベルが適正範囲であるかどうか発声者に
    知らせることを特徴とする音声認識装置。
  3. 【請求項3】請求項2記載の音声認識装置に於いて、前
    記環境状態報知手段(60)は、発声以前の雑音レベル
    を予め定めた閾値と比較し、該閾値以下のとき雑音レベ
    ルが適正な範囲にあることを発声者に知らせ、該閾値よ
    り大きいときには適正な範囲にないことを発声者に知ら
    せることを特徴とする音声認識装置。
  4. 【請求項4】請求項2記載の音声認識装置に於いて、前
    記環境状態報知手段(60)は、発声時の音声レベルを
    予め定めた閾値と比較し、該閾値以上のとき音声レベル
    が適正な範囲にあることを発声者に知らせ、該閾値より
    小さいときには適正な範囲にないことを発声者に知らせ
    ることを特徴とする音声認識装置。
  5. 【請求項5】請求項2記載の音声認識装置に於いて、前
    記環境状態報知手段(60)は、発声前の雑音レベルが
    予め定めた雑音閾値以下の場合に使用する第1音声閾値
    と、発声前の雑音レベルが前記雑音閾値より大きい場合
    に使用する前記第1音声閾値より大きい第2音声閾値と
    を有し、 発声前の雑音レベルが前記雑音閾値以下の場合は、発声
    時の音声レベルを前記第1音声閾値と比較し、該第1音
    声閾値以上のとき音声レベルが適正な範囲にあることを
    発声者に知らせ、該第1音声閾値より小さいときには適
    正な範囲にないことを発声者に知らせ、 更に、発声前の雑音レベルが前記雑音閾値より大きい場
    合は、発声時の音声レベルを前記第2音声閾値と比較
    し、該第2音声閾値以上のとき音声レベルが適正な範囲
    にあることを発声者に知らせ、該第2音声閾値より小さ
    いときには適正な範囲にないことを発声者に知らせるこ
    とを特徴とする音声認識装置。
  6. 【請求項6】請求項2記載の音声認識装置に於いて、前
    記環境状態報知手段(60)は、発声時に前記音声レベ
    ルの雑音レベルに対するSN比を求め、該SN比の値が
    適正範囲であるかどうかを発声者に知らせることを特徴
    とする音声認識装置。
  7. 【請求項7】請求項6記載の音声認識装置に於いて、前
    記環境状態報知手段(60)は、発声時に計算したSN
    比を予め定めた閾値と比較し、該閾値以上のとき音声レ
    ベルが適正な範囲にあることを発声者に知らせ、該閾値
    より小さいときには適正な範囲にないことを発声者に知
    らせることを特徴とする音声認識装置。
  8. 【請求項8】請求項1乃至7記載の音声認識装置に於い
    て、環境状態報知手段(60)は、適正範囲にあること
    を知らせるために点灯する第1表示ランプと、適正範囲
    にないことを知らせるために点灯する第2表示ランプと
    を備えたことを特徴とする音声認識装置。
  9. 【請求項9】請求項8記載の音声認識装置に於いて、使
    用環境が適正範囲にあることを知らせる第1表示ランプ
    として緑色の表示ランプを使用し、使用環境が適正範囲
    にないことを知らせる第2表示ランプとして赤色の表示
    ランプを使用したことを特徴とする音声認識装置。
  10. 【請求項10】請求項1乃至7記載の音声認識装置に於
    いて、環境状態報知手段(60)は、適正範囲にあるこ
    とを知らせるために点灯する第1表示ランプ、適正範囲
    にないことを知らせるために点灯する第2表示ランプ、
    及び適正範囲と適正でない範囲の中間の範囲にあること
    を知らせるために点灯する第3表示ランプを備えたこと
    を特徴とする音声認識装置。
  11. 【請求項11】請求項1乃至7記載の音声認識装置に於
    いて、環境状態報知手段(60)は、適正範囲にないこ
    とを知らせるために点灯する表示ランプのみを備えたこ
    とを特徴とする音声認識装置。
  12. 【請求項12】請求項1乃至7記載の音声認識装置に於
    いて、環境状態報知手段(60)は、使用環境が適正範
    囲にあること又は適正範囲にないことをメッセージ表示
    により発声者に知らせることを特徴とする音声認識装
    置。
  13. 【請求項13】請求項1乃至7記載の音声認識装置に於
    いて、環境状態報知手段(60)は、使用環境が適正範
    囲にあること又は適正範囲にないことを音声メッセージ
    の出力により発声者に知らせることを特徴とする音声認
    識装置。
  14. 【請求項14】請求項1乃至7記載の音声認識装置に於
    いて、環境状態報知手段(60)は、発声時に使用環境
    が適正範囲にないことを検出した場合には、前記音声認
    識手段(14)に対し認識処理の禁止を知らせ、且つ発
    声者に再度の音声入力を促すことを特徴とする音声認識
    装置。
JP4228109A 1992-08-27 1992-08-27 音声認識装置 Pending JPH0675588A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4228109A JPH0675588A (ja) 1992-08-27 1992-08-27 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4228109A JPH0675588A (ja) 1992-08-27 1992-08-27 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0675588A true JPH0675588A (ja) 1994-03-18

Family

ID=16871350

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4228109A Pending JPH0675588A (ja) 1992-08-27 1992-08-27 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0675588A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004502985A (ja) * 2000-06-29 2004-01-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 以後のオフライン音声認識のための音声情報を記録する記録装置
KR20040035150A (ko) * 2002-10-18 2004-04-29 현대모비스 주식회사 차량용 음성인식 장치의 작동방법
JP2006505003A (ja) * 2002-11-02 2006-02-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識システムの動作方法
JP2008102384A (ja) * 2006-10-20 2008-05-01 Fujitsu Ltd 音声入力支援プログラム、音声入力支援装置、音声入力支援方法
JP2009069707A (ja) * 2007-09-17 2009-04-02 Nippon Seiki Co Ltd 車両用音声認識装置
JPWO2007138741A1 (ja) * 2006-05-26 2009-10-01 日本電気株式会社 音声入力システム、対話型ロボット、音声入力方法、および、音声入力プログラム
JP2012093508A (ja) * 2010-10-26 2012-05-17 Nec Corp 音声認識支援システム、音声認識支援装置、利用者端末、方法およびプログラム
JP2013080994A (ja) * 2011-09-30 2013-05-02 Brother Ind Ltd 音声処理装置、音声処理方法、および音声処理プログラム
KR20190055526A (ko) * 2017-11-15 2019-05-23 네이버 주식회사 인공지능 기기의 자동 불량 검출을 위한 방법 및 시스템
CN111199736A (zh) * 2018-11-16 2020-05-26 丰田自动车株式会社 语音识别辅助装置以及语音识别辅助程序
KR20200078698A (ko) * 2008-11-10 2020-07-01 구글 엘엘씨 멀티센서 음성 검출

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4917729B2 (ja) * 2000-06-29 2012-04-18 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 以後のオフライン音声認識のための音声情報を記録する記録装置
JP2004502985A (ja) * 2000-06-29 2004-01-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 以後のオフライン音声認識のための音声情報を記録する記録装置
KR20040035150A (ko) * 2002-10-18 2004-04-29 현대모비스 주식회사 차량용 음성인식 장치의 작동방법
JP2006505003A (ja) * 2002-11-02 2006-02-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識システムの動作方法
JP5018773B2 (ja) * 2006-05-26 2012-09-05 日本電気株式会社 音声入力システム、対話型ロボット、音声入力方法、および、音声入力プログラム
JPWO2007138741A1 (ja) * 2006-05-26 2009-10-01 日本電気株式会社 音声入力システム、対話型ロボット、音声入力方法、および、音声入力プログラム
JP2008102384A (ja) * 2006-10-20 2008-05-01 Fujitsu Ltd 音声入力支援プログラム、音声入力支援装置、音声入力支援方法
JP2009069707A (ja) * 2007-09-17 2009-04-02 Nippon Seiki Co Ltd 車両用音声認識装置
KR20200078698A (ko) * 2008-11-10 2020-07-01 구글 엘엘씨 멀티센서 음성 검출
JP2012093508A (ja) * 2010-10-26 2012-05-17 Nec Corp 音声認識支援システム、音声認識支援装置、利用者端末、方法およびプログラム
JP2013080994A (ja) * 2011-09-30 2013-05-02 Brother Ind Ltd 音声処理装置、音声処理方法、および音声処理プログラム
US9142223B2 (en) 2011-09-30 2015-09-22 Brother Kogyo Kabushiki Kaisha Sound processing to produce target volume level
KR20190055526A (ko) * 2017-11-15 2019-05-23 네이버 주식회사 인공지능 기기의 자동 불량 검출을 위한 방법 및 시스템
CN111199736A (zh) * 2018-11-16 2020-05-26 丰田自动车株式会社 语音识别辅助装置以及语音识别辅助程序

Similar Documents

Publication Publication Date Title
US9230538B2 (en) Voice recognition device and navigation device
US9413864B2 (en) Controlling mute function on telephone
JPH0675588A (ja) 音声認識装置
JPH03223900A (ja) 音声制御方式
JPH05181494A (ja) 音声パターンの識別装置と方法
CN112078590B (zh) 一种驾驶行为监测方法及系统
JP2003114698A (ja) コマンド受付装置及びプログラム
JPH11119792A (ja) 音声認識機能付き機器制御装置および音声認識装置
JP2008033198A (ja) 音声対話システム、音声対話方法、音声入力装置、プログラム
JPH11126092A (ja) 音声認識装置および車両用音声認識装置
JP6716968B2 (ja) 音声認識装置、音声認識プログラム
JP3082618B2 (ja) エレベータの音声入力装置
JP2647207B2 (ja) エレベータの呼び登録装置
JP2003330491A (ja) 音声認識装置および音声認識方法ならびにプログラム
JPH0627986A (ja) 音声認識装置利用の機器制御システム
JP3079006B2 (ja) 音声認識制御装置
JP3285704B2 (ja) 音声対話のための音声認識方法及び装置
JPS59180599A (ja) 車載用音声認識制御装置
JP3114757B2 (ja) 音声認識装置
JPH05108091A (ja) 音声認識装置
JPH02305776A (ja) エレベータ装置
JPH1069291A (ja) 音声認識装置
JP2009025518A (ja) 音声対話装置
JPH0535294A (ja) 音声認識装置
JP2001175279A (ja) 音声認識方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20020827