JP3003130B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP3003130B2
JP3003130B2 JP63302104A JP30210488A JP3003130B2 JP 3003130 B2 JP3003130 B2 JP 3003130B2 JP 63302104 A JP63302104 A JP 63302104A JP 30210488 A JP30210488 A JP 30210488A JP 3003130 B2 JP3003130 B2 JP 3003130B2
Authority
JP
Japan
Prior art keywords
output
voice
sound
signal
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63302104A
Other languages
English (en)
Other versions
JPH02146600A (ja
Inventor
博重 浅田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP63302104A priority Critical patent/JP3003130B2/ja
Publication of JPH02146600A publication Critical patent/JPH02146600A/ja
Application granted granted Critical
Publication of JP3003130B2 publication Critical patent/JP3003130B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 【産業上の利用分野】
本発明は合成音の出力期間中における音声の誤反応を
防止した音声認識装置に関する。
【従来技術】
従来から、各種の装置の操作を音声によって指示する
音声認識装置が知られている。この装置では、合成音を
使って操作者に必要な情報を提供するようにしている。
例えば、入力された指令音声を操作者に確認するための
音声を出力したり、操作を一定の手順で行う必要が有る
場合に手順通りの指令音声を要求する案内のための音声
を出力したり、操作の選択を促すための音声を出力した
りしている。 そして、自動車に搭載されたラジオ、エアコン、カセ
ットテープ装置等の各種の装置は、運転者が運転中に操
作する場合には、特に、上記音声認識装置を使用する音
声指令によって操作するのが便利である。
【発明が解決しようとする課題】
ところが、出力された合成音がマイクロホンに入力さ
れ、その合成音を操作者により音声された指令音声とし
て誤認して音声認識を行い、その音声認識結果に応じて
再び合成音が出力されるという発振現象が生じたり、合
成音の出力が完了する前に指令音声が入力されて合成音
と指令音声が重畳することにより誤認識やリジェクトを
生じ、認識性能を低下させるという問題があった。そこ
で、この問題を解決するためには、合成音が出力されて
いる期間、マイクロホンの出力信号を遮断して、音声認
識を行わないようにすることが提案されている(特開昭
62−299997,特開昭59−109093号公報)。 しかし、合成音の出力期間、全く指令音声の認識を行
わないとすると、緊急指令の場合には不便であり、又、
操作指令が緩慢となり操作者に焦燥感を持たせたりする
等の問題がある。
【課題を解決するための手段】
上記課題を解決するための発明の構成は、マイクロホ
ンから入力された音声を認識する認識手段と、操作者に
必要な情報を合成音で提供するための合成音発生手段
と、を備えた音声認識装置において、合成音の出力に応
じて制御信号を出力する制御手段と、この制御手段の出
力する制御信号に応じて、マイクロホンが出力する音声
信号を合成音の出力期間中、常時、減衰して出力する信
号減衰手段と、この信号減衰手段の出力する減衰音声信
号に基づいて、音声区間を検出する区間検出手段と、マ
イクロホンが出力する音声信号に基づいて、音響分析を
行う音響分析手段とを設け、制御手段は、合成音の出力
期間の終期において、減衰量を漸減させ、認識手段は、
区間検出手段により検出された音声区間におけるマイク
ロホンが出力する音声信号の音響分析手段による分析結
果に基づいて、マイクロホンから入力された音声を認識
することを特徴とする。
【作用】
信号減衰手段は、マイクロホンの出力する音声信号を
入力しており、制御手段の出力する合成音の出力に応じ
た制御信号により、合成音が出力されていない期間は、
マイクロホンの出力する音声信号を減衰させることなく
認識用の音声信号として出力し、合成音が出力されてい
る期間では、常時、マイクロホンの出力する音声信号を
所定特性又は合成音の出力レベルに応じた特性で減衰さ
せて音声区間を検出するための信号として出力する。こ
の時、制御手段は、合成音の出力期間の終期において、
減衰量を漸減させている。又、音響分析手段はマイクロ
ホンの出力する音声信号に基づいて、音響分析を行う。
そして、認識手段は、検出された音声区間における音声
信号の分析結果を用いて、マイクロホンから入力された
音声を認識する。 上記の音声認識において、上記の信号減衰手段の減衰
量は出力された合成音により音声認識装置が誤反応しな
い程度に適正に設定されている。この結果、単に合成音
が出力されている場合には、音声区間の検出がなく、マ
イクロホンから入力された合成音を操作者により発生さ
れた指令音声として誤反応することが防止される。その
一方において、緊急指令等の場合には操作者が通常より
大きな声で発生することによりその指令音声は信号減衰
手段で減衰されたとしても、所定の音声レベルを超える
ことになり、音声区間の検出が行われる。よって、この
音声区間におけるマイクロホンから入力された減衰処理
しない音声信号の音響分析結果により音声認識が行われ
るので、合成音出力期間中の操作者による緊急指令等に
も対応することができる。さらに、合成音の出力期間の
終期において、減衰量は漸減しているので、急激な変化
から生じる誤反応を防止することができる。
【実施例】
以下、本発明を具体的な実施例に基づいて説明する。 第1図は実施例に係る音声認識装置の構成を示したブ
ロックダイヤグラムである。 第1図において、操作者の発声した指令音声を収音す
るハンズフリーマイクロホン7は、マイクロホン7の出
力する音声信号を減衰させる電子減衰器8に接続されて
おり、その電子減衰器8の出力する音声信号及びマイク
ロホン7の出力する音声信号は、予め登録された音声パ
ターンと照合して音声を認識する音声認識部9に入力し
ている。又、電子減衰器8には音声入力制御部6から出
力される合成音が出力されている期間を示す制御信号が
入力されており、合成音の出力期間でない場合には入力
された音声信号を減衰することなく音声認識部9に出力
し、一方、合成音の出力期間の場合には、入力音声信号
を所定量だけ減衰させて音声認識部9に出力する機能を
有している。 合成音は、合成された音声・ブザー音等のガイド音を
含む音として定義する。その合成音は音声合成手段2に
よりその音声合成手段2に接続されたスピーカ1から出
力される。そして、その音声合成手段2はスピーカ1が
接続される音声出力部3と、その音声出力部3に接続さ
れる音声出力制御部4とで構成されている。音声出力制
御部4は音声認識部9の認識結果に応じて確認の音声や
操作者に操作の為のガイド音等の合成音の出力を音声出
力部3に指令する他、合成音出力中であることを音声入
力制御部6に知らせる機能を有している。又、音声出力
部3は予め出力する音声やガイド音などの合成音を登録
する機能を有しており、音声出力制御部4の指令によ
り、登録された合成音から指令された合成音を選択し
て、その選択された合成音をスピーカ1から空間に出力
する機能を有している。 制御部5は音声認識部9を制御して音声登録モードや
音声認識モード間のモード切換を行ったり、音声認識部
9から認識結果を入力し、認識結果に応じて音声出力制
御部4を起動したりする機能を有している。 又、第2図は音声認識部9を更に詳しく示したブロッ
ク図である。 電子減衰器8の出力する音声信号は音声区間検出部13
にのみ入力しており、その音声区間検出部13は入力信号
のパワーを利用して音声区間を決定する機能を有してお
り、検出された音声区間を示す制御信号は音響分析部11
に入力している。又、マイクロホン7の出力する音声信
号は電子減衰器8と音響分析部11に入力しており、その
音響分析部11は、音声区間検出部13によって検出された
音声区間の入力された音声信号を分析し、特徴ベクトル
の時系列を作成する機能を有している。 又、音響分析部11の出力信号は、音声認識と音声登録
とを切換えるスイッチ10に入力しており、そのスイッチ
10の出力はマッチング部12と音声パターン格納部14に接
続されている。そして、マッチング部12は音響分析部11
によって作成された入力音声を特徴づける入力音声パタ
ーンと予め音声パターン格納部14に登録してある音声パ
ターンとのマッチングをとり、その一致度から音声認識
を行う機能を有している。又、音声パターン格納部14は
マッチングの対象となる音声の標準パターンを登録する
機能を有している。 次に、本装置の動作を説明する。 操作者は、マイクロホン7に向かって認識させたい指
令音声を発声する。マイクロホン7はこの音声を収音し
電気信号に変換し音声信号を音声認識部9へ送出する。
音声認識部9は、この音声信号を登録音声と比較し、入
力音声を認識した後、確認の為、音声やブザー等の合成
音を音声出力制御部4、音声出力部3の制御によりスピ
ーカ1を介して出力する。これら一連の動作は、制御部
5によって制御されている。 音声出力制御部4は、音声出力部3へ合成音を特定す
るコードと合成音出力のスターと信号を送出すると同時
に音声入力制御部6へも合成音の出力期間を示す信号が
出力される。そして、音声入力制御部6はその信号によ
り合成音出力期間となったことを判定し、合成音出力期
間を示す制御信号を電子減衰器8に出力する。電子減衰
器8はその制御信号を入力して合成音出力期間では減衰
機能を作動させて入力された音声信号を一定量だけ減衰
させた信号を音声認識部9へ出力する。従って、音声認
識部9にはスピーカ1から合成音の出力期間中は小さな
パワーレベルの音しか入力されずスピーカ1からの出力
音に反応することはない。 合成音の出力が完了すると再び音声出力制御部4は、
音声入力制御部6へ合成音の出力が完了したことを伝達
し、音声入力制御部6は、その信号により電子減衰器8
の減衰機能を不作動とする制御信号を電子減衰器8に出
力する。すると、電子減衰器8は減衰を不作動として、
入力信号は減衰することなく、音声認識部9に出力され
る。このことにより、スピーカ1から合成音が出力され
ていない期間では、操作者の通常音量での発声による音
声認識が可能となる。 次に、この時の各部の信号を第3図によって説明す
る。 第3図(a)に示す出力信号21は、スピーカ1からの
出力信号のパワー波形であり、時間t1から始まり時間t2
において終了する。この出力信号21に同期して、第3図
(b)に示すように、出力信号区間を知らせる制御信号
22が音声出力制御部4から音声入力制御部6へ出力さ
れ、音声入力制御部6は、この信号22に基づき電子減衰
器8をコントロールし、第3図(c)に示すように、電
子減衰器8の減衰量を一定の減衰量Aとする。 第3図(c)に示すように、合成音の出力が完了した
時点(時間t2)において電子減衰器8はオフし、減衰量
は0となる。更に本実施例においては、第2図に示す如
く電子減衰器8を通した信号は、音声区間検出部13のみ
に入力され、音響分析部11には電子減衰器8を通さない
信号が入力される構成としている。 従って、スピーカ1から合成音やガイド音などが出力
中で音声入力制御部6からの信号によって電子減衰器8
がオンされた状態において利用者が指令音声を発声した
場合においても音響分析部11にはマイクロホン7からの
信号がそのまま入力され、広いダイナミックレンジでの
分析を可能としている。 又、本実施例の音声認識装置は第7図に示すように自
動車30に搭載された各種の装置を音声指令により作動さ
せる装置であるが、スピーカ1はドアー31の内壁等に配
設され、マイクロホン7はステアリングコラムカバー32
上に配設されている。電子減衰器8の減衰量Aは、係る
第7図に示すマイクロホン7とスピーカ1の配置におい
て、音声区間検出部13がスピーカ1からの出力音を操作
者による入力音声として誤検出することがない最小の値
を設定するものとする。これにより音声やガイド音等の
合成音がスピーカ1から出力されている期間でも、操作
者が電子減衰器8による減衰を僅かでも越える大きな声
で発声すれば、音声認識部9の音声区間検出部13は音声
区間を検出可能とすることができる。従って、広いダイ
ナミックレンジでその区間の入力音声の分析を行うこと
が可能となる。これは、合成音の出力終了直前に次の認
識語を発声するような場合、その認識性能向上への大き
な効果がある。 一般的に何らかの音が存在する場合の人間の発声は、
静かな状況での発声に比べより大きな声でなされるのが
自然であり、この点からスピーカ1から合成音が出力さ
れている状況において大きな声で発声するのは操作者に
ごく自然に受け入れられる操作方法であるといえる。 以上説明したように、音声認識装置において、合成音
が出力されている間、音声認識部9の構成要素である音
声区間検出部13へ電子減衰器8を介して信号を入力する
構成とすることにより合成音により音声認識部9が反応
してしまい、使いがってを悪くしたり使用不能となるこ
とを防ぐという優れた効果がある。更に、合成音が出力
されている間でも、これらが出力されていない時より大
きな声で指令音声の発声をすることにより、音声認識部
9による認識を可能とするという利点をも有する。 尚、上記実施例は、音声認識を使用する特定話者音声
認識装置における認識モードでの一例であるが、音声を
登録する登録モードなどについても同様に用いることが
できる。又、不特定話者認識装置の各操作にも同様に適
用することができる。 又、上記実施例においては、音声区間検出部13の前に
電子減衰器8を入れることによりスピーカ1から出力さ
れる合成音のまわり込みによる音声認識部9の誤反応を
防いだが、第6図に示す如く音声区間と判定するための
音声信号のパワーのしきい値をスピーカ1から合成音が
出力されている期間には、大きな値とするようにしても
良い。即ち、合成音が出力されていない期間では、入力
音声のパワーレベルがP1の値を越えた区間を音声区間と
して検出し、その区間でスペクトル分析等による音声認
識処理を実行する。かし、合成音がスピーカ1から出力
されている期間では、しきい値P1より一定値だけ大きな
しきい値P2で、音声区間を検出することにより、合成音
による誤認識を防止するようにしても良い。 更に、上記実施例においては、スピーカ1から合成音
が出力されている期間の電子減衰器8の減衰量を第3図
(c)に示すように一定量Aとしたが、これを第4図に
示す如くスピーカ1から出力され合成音のパワーに比例
するようにダイナミックに可変するようにしても良い。
即ち、音声区間の検出のための音声信号の減衰量は、合
成音の出力が大きい程大きく、反対に、合成音の出力が
小さい程小さくなるので、合成音の出力が小さい場合に
は、相対的に小さい音声信号も認識可能となる。従っ
て、スピーカ1から出力される合成音のまわり込みによ
る音声認識部9の誤反応を防ぐと共に、操作者の音声入
力と合成音とが重畳する場合に操作者の音声を効果的に
検出することができるという利点がある。 又、同様に、音声区間と判定するための音声信号のパ
ワーのしきい値をスピーカ1から出力される合成音のパ
ワーレベルに応じて変化させても良い。 更に、第5図に示す如く電子減衰器8の減衰量の急激
な変化による音声認識部9への悪影響を最小限にするた
め、特に電子減衰器8をオフし減衰量を0とした時に周
囲騒音によって音声認識部9が誤反応するのを防ぐため
や合成音の残響による誤反応を防ぐため、減衰量を緩や
かに変化させるようにしても良い。 更に、上記実施例においては電子減衰器8は音声入力
制御部6のみからコントロールされているが、音声認識
部9内部のAGCなどの制御信号も加えてコントロールす
るようにしても良い。 又、上記実施例においては、スピーカ1からの出力音
は、音声出力部3からの合成音やガイド音としたが、他
のオーディオ機器等からの出力音に関してもその音が出
力されていることを示す制御信号を音声入力制御部6へ
入力することにより、全く同様に音声認識装置への影響
を排除する制御が可能である。
【発明の効果】
以上述べたように、本発明は、マイクロホンが出力す
る音声信号を合成音の出力期間中、常時、減衰して出力
する信号減衰手段と、この減衰音声信号に基づいて、音
声区間を検出する区間検出手段と、音声信号に基づいて
音響分析を行う音響分析手段とを設け、制御手段は、合
成音の出力期間の終期において、減衰量を漸減させ、認
識手段は、区間検出手段により検出された音声区間にお
けるマイクロホンが出力する音声信号の音響分析手段に
よる分析結果に基づいて、マイクロホンから入力された
音声を認識するようにしている。よって、出力された合
成音を入力してもその合成音はその合成音の出力期間に
おいて減衰されるため、減衰音声信号からは音響分析の
対象となる音声区間が検出されない。この結果、合成音
の出力があっても、操作者の音声と誤認することが防止
される。又、合成音の出力期間の終期において、減衰量
は漸減しているので、急激な変化から生じる誤反応を防
止することができる。さらに、合成音が出力されている
期間であっても、大きな音声の入力があれば、音声レベ
ルが上がり音声区間の検出が可能となる。よって、その
音声に対する音声認識が実行されるので、緊急指令等の
場合に有効であり、装置の操作性が向上する。
【図面の簡単な説明】
第1図は本発明の具体的な一実施例に係る音声認識装置
の構成を示したブロックダイヤグラム、第2図は同実施
例装置の音声認識部の詳細な構成を示したブロックダイ
ヤグラム、第3図は同実施例装置の作動を説明するため
の特性図、第4図、第5図、第6図は他の実施例に係る
音声認識装置の動作を説明するための特性図、第7図は
音声認識装置を自動車に搭載した場合のマイクロホン7
とスピーカ1の配設位置を示した説明図である。 1……スピーカ、2……音声合成手段 3……音声出力部、4……音声出力制御部 6……音声入力制御部、8……電子減衰器 9……音声認識部、7……マイクロホン
フロントページの続き (56)参考文献 特開 昭63−240598(JP,A) 特開 昭63−121096(JP,A) 特開 昭62−299997(JP,A) 特開 昭59−195739(JP,A) 特開 昭59−109093(JP,A) 特開 昭58−83898(JP,A) 特開 昭59−176099(JP,A) 実開 昭59−194800(JP,U) 特公 昭61−51800(JP,B2) 特公 平2−24044(JP,B2) 特公 昭63−67198(JP,B2) (58)調査した分野(Int.Cl.7,DB名) G10L 3/00 - 9/20

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】マイクロホンから入力された音声を認識す
    る認識手段と、 操作者に必要な情報を合成音で提供するための合成音発
    生手段と、を備えた音声認識装置において、 合成音の出力に応じて制御信号を出力する制御手段と、 この制御手段の出力する制御信号に応じて、前記マイク
    ロホンが出力する音声信号を前記合成音の出力期間中、
    常時、減衰して出力する信号減衰手段と、 この信号減衰手段の出力する減衰音声信号に基づいて、
    音声区間を検出する区間検出手段と、 前記マイクロホンが出力する前記音声信号に基づいて、
    音響分析を行う音響分析手段と、 を設け、 前記制御手段は、前記合成音の出力期間の終期におい
    て、減衰量を漸減させ、 前記認識手段は、前記区間検出手段により検出された前
    記音声区間における前記マイクロホンが出力する前記音
    声信号の前記音響分析手段による分析結果に基づいて、
    前記マイクロホンから入力された音声を認識することを
    特徴とする音声認識装置。
  2. 【請求項2】前記信号減衰手段は、前記制御手段により
    付与されるしきい値を減衰量とし、前記マイクロホンが
    出力する音声信号のしきい値レベルを超える信号を前記
    減衰音声信号とし、前記区間検出手段はその減衰音声信
    号が出力される期間を音声区間とすることを特徴とする
    請求項1に記載の音声認識装置。
  3. 【請求項3】前記制御手段は、前記減衰量を前記合成音
    の出力レベルに応じて設定することを特徴とする請求項
    1又は請求項2に記載の音声認識装置。
  4. 【請求項4】前記制御手段は、前記減衰量を前記合成音
    の出力レベルに比例して連続的に変化させることを特徴
    とする請求項1又は請求項2に記載の音声認識装置。
JP63302104A 1988-11-29 1988-11-29 音声認識装置 Expired - Fee Related JP3003130B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63302104A JP3003130B2 (ja) 1988-11-29 1988-11-29 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63302104A JP3003130B2 (ja) 1988-11-29 1988-11-29 音声認識装置

Publications (2)

Publication Number Publication Date
JPH02146600A JPH02146600A (ja) 1990-06-05
JP3003130B2 true JP3003130B2 (ja) 2000-01-24

Family

ID=17904981

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63302104A Expired - Fee Related JP3003130B2 (ja) 1988-11-29 1988-11-29 音声認識装置

Country Status (1)

Country Link
JP (1) JP3003130B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2005045807A1 (ja) * 2003-11-05 2007-05-24 三洋電機株式会社 電子機器

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6151800A (ja) * 1984-08-20 1986-03-14 富士写真フイルム株式会社 ストロボ装置
JPS63240598A (ja) * 1987-03-27 1988-10-06 日本電気株式会社 音声応答認識装置

Also Published As

Publication number Publication date
JPH02146600A (ja) 1990-06-05

Similar Documents

Publication Publication Date Title
US4558459A (en) Speech recognition system for an automotive vehicle
EP1901282B1 (en) Speech communications system for a vehicle
US4538295A (en) Speech recognition system for an automotive vehicle
US20070150287A1 (en) Method for driving a dialog system
US20080249779A1 (en) Speech dialog system
JPH11126092A (ja) 音声認識装置および車両用音声認識装置
JP3524370B2 (ja) 音声起動システム
JP3003130B2 (ja) 音声認識装置
JP3384165B2 (ja) 音声認識装置
JP2701431B2 (ja) 音声認識装置
JPH0673800U (ja) 音声認識装置
JPH023520B2 (ja)
EP0100773B1 (en) Speech recognition system for an automotive vehicle
WO2019175960A1 (ja) 音声処理装置および音声処理方法
JP2000039900A (ja) 自己診断機能付き音声対話装置
JPH11109987A (ja) 音声認識装置
JP3294286B2 (ja) 音声認識システム
JP2825272B2 (ja) エレベータ装置
JPH03200298A (ja) 音声制御装置
JP3049261B2 (ja) 音響選択装置
JPH03160499A (ja) 音声認識装置
JPH05197385A (ja) 音声認識装置
JP2002182691A (ja) 音を出力する機器を制御する制御装置
JPH0451376B2 (ja)
JP2000062549A (ja) 車両用音声認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees