JPH10240291A - 音声認識装置における音声入力可能状態報知方法及びその装置 - Google Patents

音声認識装置における音声入力可能状態報知方法及びその装置

Info

Publication number
JPH10240291A
JPH10240291A JP9270248A JP27024897A JPH10240291A JP H10240291 A JPH10240291 A JP H10240291A JP 9270248 A JP9270248 A JP 9270248A JP 27024897 A JP27024897 A JP 27024897A JP H10240291 A JPH10240291 A JP H10240291A
Authority
JP
Japan
Prior art keywords
noise
recognition
voice
state
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9270248A
Other languages
English (en)
Inventor
Sunao Aizawa
直 相澤
Mitsuhiro Inazumi
満広 稲積
Yasunaga Miyazawa
康永 宮沢
Hiroshi Hasegawa
浩 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP9270248A priority Critical patent/JPH10240291A/ja
Publication of JPH10240291A publication Critical patent/JPH10240291A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声認識装置に音声入力を行う際、環境ノイ
ズを検知してその検知結果に基づいて音声認識が適切に
行えるか否かをユーザに知らせる必要がある。 【解決手段】 音声認識装置の認識率に影響を及ぼす可
能性のあるノイズを検出し(ステップs1)、そのノイ
ズが音声認識に与える影響を分析して、その分析結果に
基づいて、ノイズの状態を判定し(ステップs2)、そ
の判定結果に基づいて、認識のための音声入力が可能な
状態か否かを、ノイズの状態に応じた内容でユーザに報
知する(ステップs3)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識装置に音
声入力を行う際、環境ノイズを検知してその検知結果に
基づいて音声認識が適切に行えるか否かをユーザに知ら
せる音声認識装置における音声入力可能状態報知方法お
よびその装置に関する。
【0002】
【従来の技術】ユーザの入力する音声が適切な大きさで
あるか否かということが音声認識装置の認識性能に大き
く影響を与えるが、周囲のノイズによってもその認識性
能は大きく左右され、ノイズが大きい環境下で音声入力
を行っても好結果は得られない場合が多い。
【0003】従来の音声認識技術においては、ユーザ自
身の入力音声の大きさが適切かどうかを、単にパワーメ
ータで表示するものや、さらには、入力音声の大きさを
監視し、音声の大きさに異常が有れば、ユーザに対して
入力音声をもっと大きくするかあるいは小さくするか
を、ディスプレイ上に表示したり、音声でユーザに直接
指示するものがある。
【0004】
【発明が解決しようとする課題】しかしながら、前述し
たように、音声認識性能はユーザの入力する音声の大き
さとともに、周囲のノイズにも大きく左右されるため、
環境ノイズに対しても考慮する必要がある。
【0005】最近、音声認識技術は、玩具や家電製品な
ど一般の人が日常的に使用する機器にも用いられるよう
になってきている。特にこのような機器においては、子
どもやこの種の機器の取り扱いに不慣れなユーザが使用
する場合も多く、また、使用する環境も様々である。た
とえば、音声認識技術を用いた玩具を子どもが使用する
とき、子どもは周囲のノイズについては何等考慮しない
のが普通である。これは玩具だけではなく他の機器にお
いても同様であり、一般に、ユーザはノイズがどの程度
音声認識に影響を及ぼしているかについてあまり考えな
いのが普通である。特に一定のノイズが長時間続くよう
な場合には、たとえ、そのノイズが認識に影響を及ぼす
ような大きいノイズであっても、ユーザは、そのような
ノイズ環境に慣れてしまうと、ノイズをノイズとして感
じなくなって、そのノイズが認識に悪影響を及ぼしてい
るということに気づかないことも多い。
【0006】また、ノイズが認識率を悪くする原因の一
つであるということが全くが理解できないこともある。
したがって、ノイズの多い環境下で音声認識装置を使用
する場合、認識率が悪いのは認識装置そのものの性能が
悪いと評価されることになりかねない。
【0007】このような問題を解消するためには、その
時点におけるノイズの大きさを検出して、ユーザに対し
て、その音声認識装置の使用環境が認識動作を行わせる
に適切かどうかを知らせる必要がある。
【0008】また、ここでいうノイズとは音声認識の認
識率に影響を及ぼすすべての要因を指している。ノイズ
には様々な性質のノイズがあるが、その様々な性質のノ
イズに対して考慮する必要がある。
【0009】そこで、本発明は、音声認識装置の使用環
境下におけるノイズを自動的に測定し、そのノイズの大
きさやノイズの性質が認識に悪影響を及ぼすか否かを判
定し、その判定結果をユーザに対して何らかの手段で報
知することを目的とする。
【0010】
【課題を解決するための手段】本発明の音声認識装置に
おける音声入力可能状態報知方法において、請求項1記
載の発明は、音声認識装置の認識率に影響を及ぼす可能
性のあるノイズを検出し、そのノイズが認識率に与える
影響を分析して、その分析結果に基づいて、認識のため
の音声入力が可能な状態か否かをノイズの状態に応じた
内容で報知するようにしたことを特徴としている。
【0011】また、請求項2の発明は請求項1の発明に
おいて、前記ノイズが音波ノイズである場合、認識対象
話者の発話する音声と前記音波ノイズの大きさの差を求
め、その差を基に音波ノイズの状態を判定し、その判定
結果に基づいて認識のための音声入力が可能な状態か否
かをノイズの状態に応じた内容で報知するようにしてい
る。
【0012】また、請求項3の発明は請求項1の発明に
おいて、前記ノイズが音波ノイズである場合、入力され
た音波ノイズの波形の相関を調べ、その結果を基に音波
ノイズの状態を判定し、その判定結果に基づいて、認識
のための音声入力が可能な状態か否かをノイズの状態に
応じた内容で報知するようにしている。
【0013】また、請求項4の発明は請求項1の発明に
おいて、前記ノイズが音波ノイズである場合、入力され
た音波ノイズを音声認識し、その認識結果を基に音波ノ
イズの状態を判定し、その判定結果に基づいて認識のた
めの音声入力が可能な状態か否かをノイズの状態に応じ
た内容で報知するようにしている。
【0014】さらに、請求項5の発明は請求項1の発明
において、前記ノイズが電磁波ノイズ、電源ノイズ、熱
ノイズ、振動ノイズである場合、それぞれのノイズの種
類に応じたノイズ検出を行い、検出されたノイズの状態
を判定し、その判定結果に基づいて認識のための音声入
力が可能な状態か否かをノイズの状態に応じた内容で報
知するようにしている。
【0015】また、請求項6の発明は、音声入力部から
入力される認識用音声の大きさとノイズ用の音入力部か
ら入力されるノイズの大きさをそれぞれ検出し、それぞ
れの大きさを比較してその差(Pd)を求め、求められ
た差(Pd)を予め設定された設定値(Ps)と比較
し、差(Pd)が設定値(Ps)より大きいときは、認
識のための音声入力が可能であることを示す内容の報知
を行い、前記差(Pd)が設定値(Ps)より小さいと
きは、ノイズ波形の相関を調べ、相関が大と判断された
場合は、認識のための音声入力に適さないことを表す報
知を行い、相関が小と判定された場合は、認識のための
音声入力可能状態をノイズパワーに応じた内容で報知す
ることを特徴としている。
【0016】また、本発明の音声認識装置における音声
入力可能状態報知装置において、請求項7記載の発明
は、音声認識装置の認識率に影響を及ぼす可能性のある
ノイズを検出し、そのノイズが認識率に与える影響を分
析して、その分析結果に基づいて、ノイズの状態を判定
するノイズ分析手段と、その分析結果に基づいて認識の
ための音声入力が可能な状態か否かをノイズの状態に応
じた内容で報知する報知手段とを有することを特徴とし
ている。
【0017】また、請求項8の発明は請求項7の発明に
おいて、前記ノイズが音波ノイズである場合、認識対象
話者の発話する音声と前記音波ノイズの大きさの差を求
める比較手段と、この比較手段で求められた差を基に音
波ノイズの状態を判定する判定手段と、その判定結果に
基づいて認識のための音声入力が可能な状態か否かをノ
イズの状態に応じた内容で報知するノイズ報知手段とを
有するものである。
【0018】また、請求項9の発明は請求項7の発明に
おいて、前記ノイズが音波ノイズである場合、入力され
た音波ノイズの波形の相関を調べる手段と、その結果を
基に音波ノイズの状態を判定する判定手段と、その判定
結果に基づいて認識のための音声入力が可能な状態か否
かをノイズの状態に応じた内容で報知するノイズ報知手
段とを有するものである。
【0019】また、請求項10の発明は請求項7の発明
において、前記ノイズが音波ノイズである場合、入力さ
れた音波ノイズを音声認識し、その認識結果を基に音波
ノイズの状態を判定する判定手段と、その判定結果に基
づいて認識のための音声入力が可能な状態か否かをノイ
ズの状態に応じた内容で報知するノイズ報知手段とを有
するものである。
【0020】さらに、請求項11の発明は請求項7の発
明において、前記ノイズが電磁波ノイズ、電源ノイズ、
熱ノイズ、振動ノイズである場合、それぞれのノイズの
種類に応じたノイズ検出を行うノイズ検出手段と、検出
されたノイズの状態を判定する判定手段と、その判定結
果に基づいて認識のための音声入力が可能な状態か否か
をノイズの状態に応じた内容で報知するノイズ報知手段
とを有するものである。
【0021】また、請求項12の発明は、認識対象話者
の発話する音声を入力する音声入力手段と、ノイズを入
力するための音入力手段と、前記音声入力手段から入力
される認識のための音声の大きさと、ノイズ用の音入力
手段から入力されるノイズの大きさをそれぞれ検出する
それぞれのパワー検出手段と、これらパワー検出手段か
ら出力される認識のための音声の大きさとノイズの大き
さを比較してその差(Pd)を求める比較手段と、この
比較手段で求められた差(Pd)を予め設定された設定
値(Ps)と比較し、その比較結果を出力する差判定手
段と、この差判定手段から出力される前記差(Pd)が
設定値(Ps)より小さいことを示す信号を受けて、ノ
イズ波形の分析する音声信号分析手段と、この音声信号
分析手段で分析された結果および前記差判定手段からの
前記差(Pd)が設定値(Ps)より大きいことを示す
信号を受けて、ノイズ状態を報知するための制御信号を
出力する報知制御手段と、この報知制御手段により制御
され、ノイズの状態を報知するノイズ状態報知手段とを
有し、前記差(Pd)が設定値(Ps)より大きい場合
は、前記報知制御手段は、ノイズ状態報知手段に対し
て、認識のための音声の入力が可能であることを示す内
容を報知させる制御を行い、また、前記差(Pd)が設
定値(Ps)より小さい場合は、前記報知制御手段は、
前記音声信号分析部で分析された結果からノイズ波形の
相関が大小を調べ、相関が大であるときは、認識のため
の音声入力に適さないことを表す内容を報知させる制御
を行い、相関が小でさるときは、認識のための音声入力
可能状態をノイズパワーに応じた内容で報知させる制御
を行うことを特徴としている。
【0022】このように、本発明では、音声認識装置に
入るノイズを検出し、そのノイズが音声認識に与える影
響を分析して、その分析結果に基づいて、ノイズの状態
を判定して、認識のための音声入力可能状態を報知する
ようにしている。
【0023】これにより、環境下に存在するノイズの状
態に応じて、ユーザに対して音声入力が適切な状態であ
るかどうかを何らかの形で知らせることができる。した
がって、ユーザは、音声認識が適切に行える状態かとい
うことを即座に知ることができ、適切でない状態であれ
ば、音声認識率が悪いのはノイズが原因であると判断で
きる。
【0024】また、ノイズが音波ノイズである場合、認
識対象話者の発話する音声と前記音波ノイズの大きさの
差を求め、その差を基に音波ノイズの状態を判定して、
認識のための音声入力可能状態をユーザに報知するよう
にしている。具体的には、たとえば、認識用の音声入力
を行うマイクロホンとノイズを収集するためのマイクロ
ホンを設け、それぞれのマイクロホンに入力される信号
の大きさを比較して差を求める。そして、その差の大き
さからノイズの大きさを判断してノイズの状態をユーザ
に知らせる。これにより、その時点における状況が音声
認識を行うに適した環境か否かを的確に知ることができ
る。
【0025】また、入力された音波ノイズの波形の相関
を調べ、その結果を基に音波ノイズの状態を判定するよ
うにしている。具体的な動作は、たとえば、次のようで
ある。
【0026】波形に相関が大きい場合には、ノイズは音
声である可能性が高いため、認識対象話者の音声認識動
作に大きく影響を及ぼす可能性が有るとして、認識動作
を行うには適切でないことを表す表示を行う。このよう
に、波形に相関の大きいノイズの場合には、ユーザに対
して認識動作を行うには適切でないことを表す表示を行
うことができ、音声ノイズに対して的確な表示を行うこ
とができる。
【0027】また、入力された音波ノイズを音声認識さ
せ、その認識結果を基に音波ノイズの状態を判定する。
具体的には、以下のようにして行う。
【0028】認識対象話者が認識させようとして発話す
る音声は、それぞれの単語やセンテンス間に合間が必ず
存在する。周囲にノイズが存在すれば、この合間にもそ
のノイズは入力される。装置側は単語やセンテンスの区
切りをユーザの入力音声信号レベルの大きさなどから知
ることができるので、単語やセンテンスの合間に一定以
上の信号が入力された場合は、単語やセンテンスの合間
に入力される信号を音声認識処理してその結果から判定
する。つまり、装置側では、単語やセンテンスの合間に
は入力音声はないことがわかっており、その合間に、入
力された何らかの音声(ノイズ)に対してその認識結果
が出される場合は、その入力は音声ノイズであるとし、
ユーザに対して、認識動作を行うには適切でないことを
表す表示を行う。これにより、音声ノイズに対して的確
な表示を行うことができる。
【0029】さらに、ノイズが電磁波ノイズ、電源ノイ
ズ、熱ノイズ、振動ノイズである場合には、それぞれの
ノイズの種類に応じたノイズ検出を行い、検出されたノ
イズの状態を判定し、その判定結果に基づいて認識のた
めの音声入力可能状態をノイズの状態に応じた内容で報
知するので、様々なノイズに対応できる。
【0030】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照しながら説明する。
【0031】図1は本発明の処理手順であり、大きく分
けて3つの手順によって処理がなされる。まず、音声認
識装置に入力されるノイズを検出して(ステップs
1)、検出されたノイズを分析し(ステップs2)、そ
の分析結果に基づいて、そのノイズが音声認識を行うに
当たってどの程度の影響を与えるかを表す内容をユーザ
に何らかの手段で報知する(ステップs3)。
【0032】なお、ここでいうノイズとは前述したよう
に、音声認識の認識率に影響を及ぼすすべての要因を指
し、たとえば、次のようなものが挙げられる。
【0033】(1)環境音波ノイズ この環境音波ノイズとしては、たとえば、空調ノイズ、
風の音、雑踏、機械ノイズ、エンジン音などであり、さ
らに、音声認識装置のマイクロホンに入力されてしまう
認識対象話者以外の音声ノイズ(例として、認識対象話
者の周囲にいる人間の話し声など)も含むものとする。
【0034】(2)環境電磁波ノイズ この環境電磁波ノイズは、電磁波発生源から発射される
電磁波ノイズであり、たとえば、携帯電話、コンピュー
タ、送電線、エンジンなどがその発生源となり得る。
【0035】(3)電源ノイズ これは音声認識装置の電源として供給される電圧に重畳
するノイズである。
【0036】(4)熱ノイズ 音声認識装置が正常に動作しなくなるような熱(たとえ
ば、きわめて高温あるいは低温の環境下)によるもので
ある。
【0037】(5)振動ノイズ 音声認識装置が正常に動作しなくなるような振動による
ものである。
【0038】以上のような性質の異なる様々なノイズに
対して、(1)の環境音波ノイズはマイクロホン、
(2)環境電磁波ノイズはアンテナ、(3)の電源ノイ
ズはA/D変換器、(4)の熱ノイズは温度センサ、
(5)の振動ノイズは振動センサなどによってそれぞれ
検出する。
【0039】この実施の形態では、これら性質の異なる
各種のノイズのうち、前記音声ノイズなど音として入力
される環境音波ノイズを例にとって説明する。
【0040】図2は本発明の実施の形態である音声入力
可能状態報知装置の構成を示すブロック図であり、マイ
クロホン11,12、パワー検出部13,14、比較部
15、差判定部16、表示制御部17、LPC分析部1
8、ノイズ表示部19により構成されている。なお、実
際にには、マイクロホン11,12の後段にはA/D変
換器や増幅器なども必要に応じて設けられるが、ここで
はこれらについては図示を省略している。
【0041】マイクロホン11は、認識対象話者の発話
する音声を入力するものであり、マイクロホン12は、
ノイズとしての音を入力するためのものである。以下、
マイクロホン11を第1のマイクロホン11、マイクロ
ホン12を第2のマイクロホン12という。
【0042】なお、第1のマイクロホン11は、認識対
象話者の音声を効率よく入力するために指向性に優れた
ものを用いる。そして、その指向性を考慮して話者の発
話する音声を入力することで、話者の発話する音声を効
率よく入力することができる。また、第2のマイクロホ
ン12は、第1のマイクロホン11から一定距離をおい
た位置に設置することでノイズを効率よく入力できる。
【0043】第1のマイクロホン11に入力された認識
対象話者の発話する音声は、パワー検出部13に入力さ
れてそのパワーが検出される。また、第2のマイクロホ
ン12に入力された音(ノイズ)は、パワー検出部14
に入力されてそのパワーが検出される。
【0044】そして、それぞれの音声のパワー(認識対
象話者の音声パワーをPi、ノイズのパワーをPnで表
す)は比較部15で比較されその差Pd(=Pi−P
n)が求められる。この比較部15で求められた差Pd
は差判定部16に入力される。差判定部16では、その
差Pdの大きさを、予め設定された値(これをPsとす
る)と比較し、Pd>Psのときは差Pdが大であるこ
とを示す信号を表示制御部17に出力し、Pd>Psで
ないときは差Pdが小であることを示す信号をLPC分
析部18に出力する。
【0045】なお、差判定部16における設定値Psは
ある程度大きな値に設定しておき、ノイズのパワーがご
く小さく、入力音声との差Pdがきわめて大きい(認識
に殆ど影響を及ぼさないほどノイズが小さい)ときの
み、差Pdが大であることを示す信号を出力するように
しておく。
【0046】表示制御部17は、差判定部16からの差
Pdが大であることを示す信号を受けると、ノイズ表示
部19に対して、表示制御信号を送る。ノイズ表示部1
9は、表示制御部17からの表示制御信号により、ノイ
ズの状態を、たとえば、赤、黄、青の3つの発光素子
R,Y,Bで点灯表示するものである。したがって、表
示制御部17は、差判定部16からの差Pdが大である
ことを示す信号を受けた場合には、ノイズが認識対象話
者の音声に比べて十分小さく、ノイズは認識に殆ど影響
を及ぼさないとし判断し、ノイズ表示部19に対して、
青の発光素子Bを点灯させるような制御を行う。
【0047】LPC分析部18は、差判定部16からの
差Paが小であることを示す信号を受けると、前記第2
のマイクロホン12に入力されたノイズ信号をLPC分
析し、波形の相関を求める。このLPC分析部18で分
析されて得られた相関の大きさを示す信号は表示制御部
17に入力される。表示制御部17では、差判定部16
からの相関の大きさを示す信号に基づいて、ノイズの状
態を判断し、ノイズ表示部19に対して表示制御信号を
出力する。ノイズ表示部19は、表示制御部17からの
表示制御信号により、ノイズの状態を、たとえば、赤、
黄、青の3つの発光素子R,Y,Bで点灯表示する。
【0048】このとき、表示制御部17は、ノイズ表示
部19に対して、きわめて低い認識率しか得られないよ
うなノイズである場合には、赤の発光素子Rを点灯させ
る信号をノイズ表示部19に出力し、ある程度の認識は
可能であるがその認識率はせいぜい50%程度しか得ら
れないようなノイズである場合には、黄色の発行素子Y
を点灯させる信号をノイズ表示部19に出力する。
【0049】なお、この図2に示す構成では、LPC分
析部18を設け、このLPC分析部18が差判定部16
からの差Pdが小であることを示す信号を受けると、ノ
イズ信号をLPC分析して、ノイズ波形の相関を求める
ようにしている。これは、音声認識装置が認識対象話者
の発話する入力音声をLPC分析を行って波形の相関を
調べる処理を行うような方式である場合に、第2のマイ
クロホン12から入ってくるノイズが、音声ノイズであ
ると、認識すべき入力音声と間違えて音声認識するおそ
れもあるので、LPC分析を行って相関性を調べ、その
結果に基づいてノイズ表示部19の表示を決めるように
する。
【0050】すなわち、入力されるノイズ信号が波形に
相関の大きい音声ノイズであると判定された場合には、
音声ノイズのパワーが比較的小さくても赤ランプRを点
灯するような制御を行う。
【0051】図3はこのような音声入力可能状態報知装
置を組み込んだ音声認識装置の外観を概略的に示すもの
で、音声認識装置20には認識用音声を入力するための
第1のマイクロホン11、ノイズを入力するための第2
のマイクロホン12、ノイズの状態を赤、黄、青の3段
階で表示するための3つの表示部R,Y,B、音声認識
装置20側からの応答を行うものにあってはスピーカ2
1などが設けられる。また、内部には、第2図で示した
ような、パワー検出部13,14、比較部15、差判定
部16、表示制御部17、LPC分析部18などの他
に、音声認識装置として必要な装置が組み込まれてい
る。なお、ここでは、音声認識動作については直接関係
しないのでその説明は省略する。
【0052】このような構成において、認識対象話者
(ユーザという)が音声認識装置20の第1のマイクロ
ホン11から音声を入力しているものとする。このと
き、周囲にはノイズがあるものとし、そのノイズは第2
のマイクロホン12から入力される。
【0053】ここで、第1のマイクロホン11から入力
される音声は、ユーザが音声認識装置20に対して認識
させようとして、マイクロホン11の近くで発話される
ユーザの音声であり、一方、周囲のノイズは第2のマイ
クロホン12に自然に入力されるものである。したがっ
て、両者のパワーは、少なくともユーザの音声のパワー
の方が第1のマイクロホン11の近くで発話される分だ
けノイズより大きいものとなる。
【0054】比較部15では、第1のマイクロホン11
から入力されるユーザの音声のパワーPiと、第2のマ
イクロホン12から入力されるノイズパワーPnとを比
較し、両者の差Pdを求める。
【0055】そして、その差Pdが差判定手段16に入
力され、予め設定された値Psより大きいか否かを判定
し、差Pdがその設定値Psよりも大きいときは、差が
大であることを示す信号を表示制御部17に出力する。
【0056】表示制御部17では、差Pdが設定値Ps
よりも大きいことを示す信号を受け取ると、ユーザの発
話する音声の方がノイズよりも十分大きく、ノイズは認
識に殆ど影響を与えないと判断し、ノイズ表示部19に
対して青の発光素子Bを点灯するような制御信号を送
る。これにより、ノイズ表示部19では青の発光素子B
が点灯される。
【0057】ユーザはこの青の発光素子Bの点灯を確認
することにより、現在はノイズの影響を受けることなく
認識処理が行える状態であることを知る。
【0058】一方、ノイズがある程度大きいときは、パ
ワー検出部14で検出されるノイズパワーPnも大きく
なり、ユーザの入力音声のパワーPiとの差Pdが小さ
くなる。その差Pdは差判定手段14に入力され、予め
設定された値Psより大きいか否かが判定され、差Pd
がその設定値Psよりも小さいときは、差が小であるこ
とを示す信号をLPC分析部18に出力する。
【0059】LPC分析部18では、差判定部16から
差が小であることを示す信号を受けると、第2のマイク
ロホン12から入力されたノイズ信号をLPC分析し、
信号波形の相関を調べる。
【0060】表示制御部17では、LPC分析の結果を
受け取るとともに、比較部15からの差Pdを受け取
り、LPC分析結果と差Pdの値に基づいて、ノイズ表
示部19に対して、赤の発光素子Rを点灯させるか黄の
発光素子Yを点灯させるかを判断する。
【0061】すなわち、差Pdが設定値Psよりも小さ
い(ユーザ音声パワーとノイズパワーの差Pdが設定値
Psより小さい)という条件において、LPC分析の結
果、ノイズ波形の相関が小さいと判定された場合は、そ
の差Pdの大きさを見て、その差Pdが比較的大きい部
類に属するときは、そのノイズは、認識に少し影響を与
える程度であると判断して、黄の発光素子Yを点灯させ
るような制御を行う。つまり、相関が小さい場合は、一
般のホワイトノイズである可能性が高いと判断し、ノイ
ズのパワー(差Pdの大きさから判断できる)に応じ
て、そのパワーの大きさから、認識率を少し悪くする程
度であると判断した場合には、ノイズ表示部19に対し
て黄の発光素子Yを点灯するような制御信号を送る。
【0062】これに対して、差Pdが設定値Psよりも
小さい(ユーザ音声パワーとノイズパワーの差Pdが設
定値Psより小さい)という条件において、相関が小さ
いと判定された場合ても、その差Pdが比較的小さい部
類に属するときは、そのノイズは、認識に影響を与える
可能性があると判断して、ノイズ表示部19に対して赤
の発光素子Rを点灯するような制御信号を送るというよ
うな制御を行う。
【0063】一方、差Pdが設定値Psよりも小さい
(ユーザ音声パワーとノイズパワーの差Pdが設定値P
sより小さい)という条件において、LPC分析の結
果、ノイズ波形の相関が大きいと判定された場合には、
ノイズは認識に大きな影響を与える可能性が高いとし
て、赤の発光素子Rを点灯させような制御を行う。
【0064】このように、LPC分析の結果、相関が大
きいと判定した場合に、赤の発光素子Rを点灯させるよ
うな制御を行うのは、相関が大きいということは、その
ノイズは音声である可能性が高いため、認識対象話者の
音声認識動作に大きく影響を及ぼす可能性が有るからで
ある。
【0065】以上のような表示制御により、現在のノイ
ズの状態に応じた色の発光素子が点灯される。ユーザは
その表示を見ることにより、認識動作が適切に行われる
状態か否かを判断する。たとえば、赤の発光素子Rが点
灯していれば、現在はノイズの影響を大きく受けて適切
な認識動作が行われる状況ではないことを知る。
【0066】図4は以上の処理の流れを示すフローチャ
ートである。この図4の処理手順は以上説明したとおり
であるので、ここでは簡単に説明する。
【0067】図4において、まず、第1のマイクロホン
11から入力されるユーザの音声のパワーPiと第2の
マイクロホン12から入力されるノイズのパワーPnを
それぞれ検出し(ステップs11)、それぞれのパワー
の大きさを比較してその差Pdを求める(ステップs1
2)。そして、求められた差Pdを予め設定された設定
値Psと比較し、PdがPsより小さければ(ステップ
s13)、LPC分析を行う(ステップs14)。この
LPC分析の結果、相関が大と判断された場合は(ステ
ップs15)、ノイズパワーが比較的小さくても赤の発
光素子Rを点灯させ(ステップs16)、ステップs1
5にて相関が小と判定された場合は、ノイズパワーに応
じて、黄の発光素子Yまたは赤の発光素子Rを点灯させ
る(ステップs17)。
【0068】一方、前記ステップs13にて、Pd>P
sである場合、つまり、差Pdが設定値Psより大きい
ときは、ユーザの音声がノイズよりも十分大きい場合で
あるため、ノイズは認識に殆ど影響を与えないとして、
青の発光素子Bを点灯させる(ステップs18)。
【0069】以上のようにこの実施の形態では、ユーザ
は、発光素子の点灯状態を見ながら、現在のノイズの状
況を把握でき、たとえば、赤の発光素子Rが点灯してい
るときはノイズの影響が大きく、適切な認識が行えない
状況であるということがわかる。
【0070】なお、以上の実施の形態は、本発明を説明
するに当たって好適な実施の形態であるが、これに限定
されるものではなく、本発明の要旨を逸脱しない範囲で
種々変形実施可能なものである。
【0071】たとえば、図2の構成で説明した例では、
音声ノイズに対処するためにノイズ信号をLPC分析す
る例が示されているが、ノイズ信号に対し必ずしもLP
C分析を行う必要があるわけではない。すなわち、第1
のマイクロホン11から入力される音声のパワーと、第
2のマイクロホン12から入力されるノイズのパワーと
の差を求め、その差の大きさだけからノイズ表示部19
を作動させるようにしてもよい。
【0072】また、この実施の形態では、ノイズ用とし
て第2のマイクロホン12を別に用意したが、音声認識
用のマイクロホン(第1のマイクロホン11)だけでも
本発明を実現することは可能である。
【0073】すなわち、音声認識動作は、ユーザがひっ
きりなし発話することはなく、単語あるいは短いセンテ
ンスに区切って行うのが普通である。従って、それぞれ
の単語やセンテンスの切れ目には、必ず合間が存在す
る。周囲にノイズが存在すれば、この合間にもそのノイ
ズは入力される。音声認識装置側は単語やセンテンスの
区切りをユーザの入力音声信号レベルの大きさなどから
知ることができるので、単語やセンテンスの合間に一定
以上の信号が入力された場合は、ノイズと判定して、そ
のノイズのパワーの大きさに応じてノイズ表示部19を
作動させるようにしたり、あるいは、LPC分析をして
相関を調べてその相関の大きさに基づいてノイズ表示部
19を作動させるようにする。さらに、このとき、ノイ
ズかどうかの判定を行う方法として、単語やセンテンス
の合間に入力される信号を強制的に音声認識処理して、
その結果から判定する方法もある。つまり、音声認識装
置側では、単語やセンテンスの合間にはユーザからの入
力音声はないことがわかっており、その合間に、入力さ
れた何らかの音声(ノイズ)に対してその認識結果が出
される場合は、その入力信号は音声ノイズあるいは他の
ノイズであるが、認識に悪影響を及ぼす可能性が非常に
高いノイズであると判断する。
【0074】そして、そのノイズのパワーの大きさに応
じてノイズ表示部19を作動させるようにしたり、ある
いは、LPC分析をして相関を調べてその相関の大きさ
に基づいてノイズ表示部19を作動させるようにする。
【0075】また、ここで説明した実施の形態では、ノ
イズ表示部19の表示手段として、ノイズの状態に応じ
て、赤、黄、緑の3種類の色の発光素子のいずれかをを
点灯させるようにしたが、これは3種類ではなく、さら
に、細分化することも可能であり、また、2段階の表示
でもよく、さらには、1つの発光素子のみを用いて、た
とえば、正常な状態では、連続的な点灯状態とし、異常
があると点滅するようにしてもよい。
【0076】また、ノイズの状態をユーザに報知する方
法としては、色の異なる発光素子を発行させる方式では
なく、液晶パネルなどに、たとえば、「ノイズが大きく
て認識不能です」というような文字による表示や、音声
による報知、さらには、ブザー、電子音など何らかの警
告音を発してユーザに報知させる方法なども可能であ
る。さらに、ノイズが大きく認識不能である場合は、認
識動作を行わせないように、自動的に電源をオフすると
いうことも可能である。
【0077】また、ここで説明した実施の形態では、ノ
イズとしては音声などの音波ノイズについて説明した
が、本発明は、音波ノイズだけではなく、前述したよう
に、電磁波ノイズ、電源ノイズ、熱ノイズ、振動ノイズ
など認識率に影響を及ぼすすべてのノイズに対応できる
ものである。
【0078】前記電磁波ノイズに対しては、たとえば、
1つ以上のアンテナで収集した電磁波ノイズ信号を分析
し、その分析結果に基づいて、ノイズの状態を表示する
方法や、音声認識装置の回路中にノイズの測定ポイント
を設け、その点の電圧を検出してその乱れを分析して、
その分析結果に基づいて、ノイズの状態を表示する方法
などがある。
【0079】前記電源ノイズについては、たとえば、電
源電圧をA/D変換したときにその変換後の出力に変動
があった場合、その変動の大きさを分析して、その分析
結果に基づいて、ノイズの状態を表示する方法や、電源
が直流電圧である場合には、その直流電圧をコンデンサ
を通して交流成分(ノイズ成分)のみを取り出し、その
交流成分を分析して、その分析結果に基づいて、ノイズ
の状態を表示する方法などがある。
【0080】また、前記熱ノイズや振動ノイズについて
は、それぞれのノイズが検出できるセンサを設け、それ
ぞれのセンサによって得られた信号を分析して、その分
析結果に基づいて、ノイズの状態を表示する方法があ
る。
【0081】さらに、音声認識装置の用途などによって
は、以上説明した各種のノイズに対応できるようにして
もよく、また、そのうちの幾つかを選択して組み合わせ
て、それぞれのノイズを分析して、その分析結果に基づ
いて、ノイズの状態を表示するようにしてもよい。
【0082】たとえば、最近では、自動車用のカーナビ
ゲーションなどにも音声認識技術が用いられているもの
もあり、このような車載用の機器に搭載される音声認識
装置にあっては、同乗者の話し声、エンジン音、周囲の
交通音、インジェクションノイズ、振動、熱、電磁波な
ど様々な種類のノイズに対応する必要がある。したがっ
て、これら様々なノイズに対応できるように、それぞれ
のノイズを検出して分析し、その分析結果に基づいて、
ノイズの状態を表示することで、的確なノイズ状態をユ
ーザに知らせることができる。
【0083】なお、本発明の処理を行う処理プログラム
は、フロッピィディスク、光ディスク、ハードディスク
などの記憶媒体に記憶させておくことができ、本発明
は、それらの記憶媒体をも含むものであり、また、ネッ
トワークからデータを得る形式でもよい。
【0084】
【発明の効果】以上説明したように、本発明によれば、
音声認識装置の認識率に影響を及ぼす可能性のあるノイ
ズを検出し、そのノイズが音声認識に与える影響を分析
して、その分析結果に基づいて、ノイズの状態を判定
し、その判定結果に基づいて、認識のための音声入力が
可能な状態か否かを、ノイズの状態に応じた内容でユー
ザに報知するようにしたので、環境下に存在する様々な
ノイズの状態に応じて、ユーザに対して音声入力が適切
な状態であるかどうかを何らかの形で知らせることがで
きる。これにより、ユーザは、音声認識が適切に行える
状態かということを即座に知ることができ、適切でない
状態であれば、音声認識率が悪いのはノイズが原因であ
ると判断でき、そのノイズがユーザ自身で除去できるノ
イズであればノイズの原因を除去した後、再び、音声認
識を行うというようなこともできる。また、本発明は、
音のノイズ以外にも、たとえば、電磁波ノイズ、電源ノ
イズ、熱ノイズ、振動ノイズなど様々なノイズに対して
も対応できるので、このようなノイズを受けやすい環境
下において音声認識を行う際にも、それぞれのノイズを
分析して、ノイズの状態に応じて、音声認識が適切に行
える状態かどうかを即座にユーザに報知することができ
る。
【図面の簡単な説明】
【図1】本発明の基本的な処理手順を説明するフローチ
ャート。
【図2】本発明の実施の形態における音声入力可否報知
装置の構成を説明するブロック図。
【図3】本発明の実施の形態における音声入力可否報知
装置を組み込んだ音声認識装置の概略的な外観構成図。
【図4】本発明の実施の形態における音声入力可否報知
処理手順を説明するフローチャート。
【符号の説明】
11 第1のマイクロホン 12 第2のマイクロホン 13、14 パワー検出部 15 比較部 16 差判定部 17 表示制御部 18 LPC分析部 19 ノイズ状態表示部 20 音声認識装置
フロントページの続き (72)発明者 長谷川 浩 長野県諏訪市大和3丁目3番5号 セイコ ーエプソン株式会社内

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 音声認識装置の認識率に影響を与える可
    能性のあるノイズを検出し、そのノイズが認識率に与え
    る影響を分析して、その分析結果に基づいて、認識のた
    めの音声入力が可能な状態であるか否かをノイズの状態
    に応じた内容で報知するようにしたことを特徴とする音
    声認識装置における音声入力可能状態報知方法。
  2. 【請求項2】 前記ノイズが音波ノイズである場合、認
    識対象話者の発話する音声と前記音波ノイズの大きさの
    差を求め、その差を基に音波ノイズの状態を判定し、そ
    の判定結果に基づいて認識のための音声入力が可能な状
    態であるか否かをノイズの状態に応じた内容で報知する
    ことを特徴とする請求項1記載の音声認識装置における
    音声入力可能状態報知方法。
  3. 【請求項3】 前記ノイズが音波ノイズである場合、入
    力された音波ノイズの波形の相関を調べ、その結果を基
    に音波ノイズの状態を判定し、その判定結果に基づい
    て、認識のための音声入力が可能な状態であるか否かを
    ノイズの状態に応じた内容で報知することを特徴とする
    請求項1記載の音声認識装置における音声入力可能状態
    報知方法。
  4. 【請求項4】 前記ノイズが音波ノイズである場合、入
    力された音波ノイズを音声認識し、その認識結果を基に
    音波ノイズの状態を判定し、その判定結果に基づいて認
    識のための音声入力が可能な状態であるか否かをノイズ
    の状態に応じた内容で報知することを特徴とする請求項
    1記載の音声認識装置における音声入力可能状態報知方
    法。
  5. 【請求項5】 前記ノイズが電磁波ノイズ、電源ノイ
    ズ、熱ノイズ、振動ノイズである場合、それぞれのノイ
    ズの種類に応じたノイズ検出を行い、検出されたノイズ
    の状態を判定し、その判定結果に基づいて認識のための
    音声入力が可能な状態であるか否かをノイズの状態に応
    じた内容で報知することを特徴とする請求項1記載の音
    声認識装置における音声入力可能状態報知方法。
  6. 【請求項6】 音声入力部から入力される認識用音声の
    大きさと、ノイズ用の音入力部から入力されるノイズの
    大きさをそれぞれ検出し、それぞれの大きさを比較して
    その差(Pd)を求め、求められた差(Pd)を予め設
    定された設定値(Ps)と比較し、差(Pd)が設定値
    (Ps)より大きいときは、認識のための音声入力が可
    能であることを示す内容の報知を行い、前記差(Pd)
    が設定値(Ps)より小さいときは、ノイズ波形の相関
    を調べ、相関が大と判断された場合は、認識のための音
    声入力に適さないことを表す報知を行い、相関が小と判
    定された場合は、認識のための音声入力可能状態をノイ
    ズパワーに応じた内容で報知を行うことを特徴とする音
    声認識装置における音声入力可能状態報知方法。
  7. 【請求項7】 音声認識装置の認識率に影響を与える可
    能性のあるノイズを検出し、そのノイズが認識率に与え
    る影響を分析して、その分析結果に基づいて、ノイズの
    状態を判定するノイズ分析手段と、その分析結果に基づ
    いて認識のための音声入力が可能な状態であるか否かを
    ノイズの状態に応じた内容で報知する報知手段とを有す
    ることを特徴とする音声認識装置における音声入力可能
    状態報知装置。
  8. 【請求項8】 前記ノイズが音波ノイズである場合、認
    識対象話者の発話する音声と前記音波ノイズの大きさの
    差を求める比較手段と、この比較手段で求められた差を
    基に音波ノイズの状態を判定する判定手段と、その判定
    結果に基づいて認識のための音声入力が可能な状態であ
    るか否かをノイズの状態に応じた内容で報知するノイズ
    報知手段とを有することを特徴とする請求項7記載の音
    声認識装置における音声入力可能状態報知装置。
  9. 【請求項9】 前記ノイズが音波ノイズである場合、入
    力された音波ノイズの波形の相関を調べる手段と、その
    結果を基に音波ノイズの状態を判定する判定手段と、そ
    の判定結果に基づいて認識のための音声入力が可能な状
    態であるか否かをノイズの状態に応じた内容で報知する
    ノイズ報知手段とを有することを特徴とする請求項7記
    載の音声認識装置における音声入力可能状態報知装置。
  10. 【請求項10】 前記ノイズが音波ノイズである場合、
    入力された音波ノイズを音声認識し、その認識結果を基
    に音波ノイズの状態を判定する判定手段と、その判定結
    果に基づいて認識のための音声入力が可能な状態である
    か否かをノイズの状態に応じた内容で報知するノイズ報
    知手段とを有することを特徴とする請求項7記載の音声
    認識装置における音声入力可能状態報知装置。
  11. 【請求項11】 前記ノイズが電磁波ノイズ、電源ノイ
    ズ、熱ノイズ、振動ノイズである場合、それぞれのノイ
    ズの種類に応じたノイズ検出を行うノイズ検出手段と、
    検出されたノイズの状態を判定する判定手段と、その判
    定結果に基づいて認識のための音声入力が可能な状態で
    あるか否かをノイズの状態に応じた内容で報知するノイ
    ズ報知手段とを有することを特徴とする請求項7記載の
    音声認識装置における音声入力可能状態報知装置。
  12. 【請求項12】 認識対象話者の発話する音声を入力す
    る音声入力手段と、 ノイズを入力するための音入力手段と、 前記音声入力手段から入力される認識のための音声の大
    きさと、ノイズ用の音入力手段から入力されるノイズの
    大きさをそれぞれ検出するそれぞれのパワー検出手段
    と、 これらパワー検出手段から出力される認識のための音声
    の大きさとノイズの大きさを比較してその差(Pd)を
    求める比較手段と、 この比較手段で求められた差(Pd)を予め設定された
    設定値(Ps)と比較し、その比較結果を出力する差判
    定手段と、 この差判定手段から出力される前記差(Pd)が設定値
    (Ps)より小さいことを示す信号を受けて、ノイズ波
    形の分析する音声信号分析手段と、 この音声信号分析手段で分析された結果および前記差判
    定手段からの前記差(Pd)が設定値(Ps)より大き
    いことを示す信号を受けて、ノイズ状態を報知するため
    の制御信号を出力する報知制御手段と、 この報知制御手段により制御され、ノイズの状態を報知
    するノイズ状態報知手段と、 を有し、 前記差(Pd)が設定値(Ps)より大きい場合は、前
    記報知制御手段は、ノイズ状態報知手段に対して、認識
    のための音声の入力が可能であることを示す内容を報知
    させる制御を行い、また、前記差(Pd)が設定値(P
    s)より小さい場合は、前記報知制御手段は、前記音声
    信号分析部で分析された結果からノイズ波形の相関が大
    小を調べ、相関が大であるときは、認識のための音声入
    力に適さないことを表す内容を報知させる制御を行い、
    相関が小でさるときは、認識のための音声入力可能状態
    をノイズパワーに応じた内容で報知させる制御を行うこ
    とを特徴とする音声認識装置における音声入力可能状態
    報知装置。
JP9270248A 1996-12-26 1997-10-02 音声認識装置における音声入力可能状態報知方法及びその装置 Withdrawn JPH10240291A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9270248A JPH10240291A (ja) 1996-12-26 1997-10-02 音声認識装置における音声入力可能状態報知方法及びその装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP34817296 1996-12-26
JP8-348172 1996-12-26
JP9270248A JPH10240291A (ja) 1996-12-26 1997-10-02 音声認識装置における音声入力可能状態報知方法及びその装置

Publications (1)

Publication Number Publication Date
JPH10240291A true JPH10240291A (ja) 1998-09-11

Family

ID=26549123

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9270248A Withdrawn JPH10240291A (ja) 1996-12-26 1997-10-02 音声認識装置における音声入力可能状態報知方法及びその装置

Country Status (1)

Country Link
JP (1) JPH10240291A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003241797A (ja) * 2002-02-22 2003-08-29 Fujitsu Ltd 音声対話システム
JP2004502985A (ja) * 2000-06-29 2004-01-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 以後のオフライン音声認識のための音声情報を記録する記録装置
KR100408857B1 (ko) * 1994-12-07 2004-03-19 가부시키가이샤 야스가와덴끼 산업용로봇에있어서의리드선처리구조
JP2011081541A (ja) * 2009-10-06 2011-04-21 Canon Inc 入力装置及びその制御方法
CN111199736A (zh) * 2018-11-16 2020-05-26 丰田自动车株式会社 语音识别辅助装置以及语音识别辅助程序
KR20200124456A (ko) * 2019-04-24 2020-11-03 주식회사 한국스테노 방송 자막 제작 시스템
WO2022059911A1 (ko) * 2020-09-17 2022-03-24 삼성전자주식회사 전자 장치 및 그 제어 방법

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100408857B1 (ko) * 1994-12-07 2004-03-19 가부시키가이샤 야스가와덴끼 산업용로봇에있어서의리드선처리구조
JP2004502985A (ja) * 2000-06-29 2004-01-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 以後のオフライン音声認識のための音声情報を記録する記録装置
JP4917729B2 (ja) * 2000-06-29 2012-04-18 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー 以後のオフライン音声認識のための音声情報を記録する記録装置
JP2003241797A (ja) * 2002-02-22 2003-08-29 Fujitsu Ltd 音声対話システム
JP2011081541A (ja) * 2009-10-06 2011-04-21 Canon Inc 入力装置及びその制御方法
CN111199736A (zh) * 2018-11-16 2020-05-26 丰田自动车株式会社 语音识别辅助装置以及语音识别辅助程序
JP2020085953A (ja) * 2018-11-16 2020-06-04 トヨタ自動車株式会社 音声認識支援装置及び音声認識支援プログラム
KR20200124456A (ko) * 2019-04-24 2020-11-03 주식회사 한국스테노 방송 자막 제작 시스템
WO2022059911A1 (ko) * 2020-09-17 2022-03-24 삼성전자주식회사 전자 장치 및 그 제어 방법
US11922970B2 (en) 2020-09-17 2024-03-05 Samsung Electronics Co., Ltd. Electronic apparatus and controlling method thereof

Similar Documents

Publication Publication Date Title
CN104580699B (zh) 一种待机时声控智能终端方法及装置
US20060195316A1 (en) Voice detecting apparatus, automatic image pickup apparatus, and voice detecting method
JP2008085476A (ja) 警報音発生装置
US20080079571A1 (en) Safety Device
JP5538662B2 (ja) 車両接近通報装置、およびその故障診断方法
US8466805B2 (en) Emergency vehicle siren indicator
JP2008519989A (ja) 音声認識システムと同システムを用いたセキュリティ装置
JPH10240291A (ja) 音声認識装置における音声入力可能状態報知方法及びその装置
Vladyko et al. Method of early pedestrian warning in developing intelligent transportation system infrastructure
JP4238224B2 (ja) 警報音自動検知方法とその装置及びそれを用いた補聴器
US20170334292A1 (en) Information providing apparatus for vehicle
JP2015001776A (ja) 運転支援装置
US8461986B2 (en) Audible event detector and analyzer for annunciating to the hearing impaired
JP2003345391A (ja) 端末、音声認識サーバ、音声認識システムおよびコンピュータプログラム
JP2000163098A (ja) 音声認識装置
US9744906B2 (en) Vehicle information notification device
KR20040091262A (ko) 타 차량의 경적 알림 장치 및 방법
TWI741816B (zh) 車體異音檢測裝置及其方法
JP2020085953A (ja) 音声認識支援装置及び音声認識支援プログラム
JP2007163336A (ja) 車両ノイズ音検知装置および車両ノイズ音検知方法
JP3926280B2 (ja) 音声認識システム
JPH0883090A (ja) 環境音検出装置
KR101710695B1 (ko) 차량용 음성 인식을 위한 마이크로폰 제어 시스템 및 그 제어 방법
US11295742B2 (en) Voice output apparatus and voice output method
JPH09136573A (ja) 車両用周囲状況監視装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20041207