JP3003037B2 - 音声入力装置 - Google Patents
音声入力装置Info
- Publication number
- JP3003037B2 JP3003037B2 JP1077776A JP7777689A JP3003037B2 JP 3003037 B2 JP3003037 B2 JP 3003037B2 JP 1077776 A JP1077776 A JP 1077776A JP 7777689 A JP7777689 A JP 7777689A JP 3003037 B2 JP3003037 B2 JP 3003037B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- frequency
- noise
- frequency characteristic
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
【発明の詳細な説明】 [発明の目的] [産業上の利用分野] 本発明は、音声入力装置に関し、例えば、音声認識に
よって車上機器を制御する場合に利用できる。
よって車上機器を制御する場合に利用できる。
[従来の技術] 例えば車輌上でドライバが各種車載機器を操作する場
合、操作可能なスイッチの数が多いと、操作すべきスイ
ッチの位置を捜し、指をそのスイッチ上に位置決めする
までの確認を視覚的に行なう必要があるので、車輌の走
行中は安全性の点で問題がある。
合、操作可能なスイッチの数が多いと、操作すべきスイ
ッチの位置を捜し、指をそのスイッチ上に位置決めする
までの確認を視覚的に行なう必要があるので、車輌の走
行中は安全性の点で問題がある。
そこで、視覚的な操作を不要にするために、音声認識
装置を用いて、車載機器を音声入力によって制御するこ
とが提案されている。
装置を用いて、車載機器を音声入力によって制御するこ
とが提案されている。
ところが、特に車上においては、入力音声とともに認
識装置に入力される外部雑音のレベルが大きい場合があ
り、音声認識に著しく不都合をきたす場合がある。外部
雑音としては、車外からの音,自車のエンジン音,車内
の音響装置からの音等々がある。
識装置に入力される外部雑音のレベルが大きい場合があ
り、音声認識に著しく不都合をきたす場合がある。外部
雑音としては、車外からの音,自車のエンジン音,車内
の音響装置からの音等々がある。
そこで、特公昭63−29755号公報の技術においては、
特定のスイッチが操作されると、音声入力に備えて、雑
音のレベルを低減するために、音声装置の出力を下げ、
窓ガラスを閉じるようにしている。
特定のスイッチが操作されると、音声入力に備えて、雑
音のレベルを低減するために、音声装置の出力を下げ、
窓ガラスを閉じるようにしている。
[発明が解決しようとする課題] 従来例(特公昭63−29755号公報)によれば、雑音の
影響を小さくし、音声認識装置の確認率を向上させるこ
とができる。しかしながら、音声認識を行なう度にドラ
イバがスイッチを操作しなければならないし、窓ガラス
が全閉になるまで待たなければならないので、音声入力
を開始できるまでに時間がかかり、ドライバは煩わしい
操作を強いられる。
影響を小さくし、音声認識装置の確認率を向上させるこ
とができる。しかしながら、音声認識を行なう度にドラ
イバがスイッチを操作しなければならないし、窓ガラス
が全閉になるまで待たなければならないので、音声入力
を開始できるまでに時間がかかり、ドライバは煩わしい
操作を強いられる。
本発明は、各種の音声入力装置において、目的とする
音声以外の雑音成分を低減し明瞭な音声信号を出力する
ことを課題とする。
音声以外の雑音成分を低減し明瞭な音声信号を出力する
ことを課題とする。
[発明の構成] [課題を解決するための手段] 音声を電気信号に変換する、音声入力手段; 前記音声入力手段から出力される電気信号の周波数特
性を調整する可変フィルタ手段; 前記音声入力手段から出力される電気信号を分析して
その周波数特性を検知する、周波数特性検知手段;及び 車輌のイグニッションスイッチがアクセサリ位置に切
換わるとそれに応答して、前記周波数特性検知手段の分
析動作を開始し、分析が終了するとその分析結果に応じ
て前記可変フィルタ手段の周波数特性を調整し、分析が
終了する前に前記イグニッションスイッチがイグニッシ
ョンオン位置に切換わった場合には、分析動作を中止
し、前記可変フィルタ手段の周波数特性はそれ以前の設
定状態を維持する、制御手段; を備える車輌上の音声入力装置。
性を調整する可変フィルタ手段; 前記音声入力手段から出力される電気信号を分析して
その周波数特性を検知する、周波数特性検知手段;及び 車輌のイグニッションスイッチがアクセサリ位置に切
換わるとそれに応答して、前記周波数特性検知手段の分
析動作を開始し、分析が終了するとその分析結果に応じ
て前記可変フィルタ手段の周波数特性を調整し、分析が
終了する前に前記イグニッションスイッチがイグニッシ
ョンオン位置に切換わった場合には、分析動作を中止
し、前記可変フィルタ手段の周波数特性はそれ以前の設
定状態を維持する、制御手段; を備える車輌上の音声入力装置。
[作用] これによれば、音声は、例えばマイクロホンなどの音
声入力手段によって電気信号に変換された後、可変フィ
ルタ手段を通り、出力される。可変フィルタ手段は、例
えばバンドパスフィルタを構成し、目的とする音声の周
波数帯域以外の雑音成分を低減する。また、可変フィル
タ手段の周波数特性は、スイッチ手段の動作に応答して
起動する調整モードにおいて、制御手段により自動的に
設定される。
声入力手段によって電気信号に変換された後、可変フィ
ルタ手段を通り、出力される。可変フィルタ手段は、例
えばバンドパスフィルタを構成し、目的とする音声の周
波数帯域以外の雑音成分を低減する。また、可変フィル
タ手段の周波数特性は、スイッチ手段の動作に応答して
起動する調整モードにおいて、制御手段により自動的に
設定される。
即ち、外部雑音が実質上存在しない状態(例えば自動
車のエンジンスタート前)で、実際の話者(例えばドラ
イバ)がスイッチ手段を操作して、調整モードを起動し
た後、その話者が音声を発すると、雑音を含まない音声
成分だけの周波数特性が分析され、その周波数特性と対
応するように、つまりその話者の音声帯域の信号だけを
通過させ他の周波数成分を低減するように、可変フィル
タ手段の周波数特性が調整される。
車のエンジンスタート前)で、実際の話者(例えばドラ
イバ)がスイッチ手段を操作して、調整モードを起動し
た後、その話者が音声を発すると、雑音を含まない音声
成分だけの周波数特性が分析され、その周波数特性と対
応するように、つまりその話者の音声帯域の信号だけを
通過させ他の周波数成分を低減するように、可変フィル
タ手段の周波数特性が調整される。
音声認識などを行なう場合、雑音成分を低減するため
にフィルタを設けることは従来でも行なわれている。し
かし、人間の発する音声の周波数特性には大きな個人差
があるので、不特定話者の音声認識を行なう場合にはフ
ィルタの通過帯域を狭くすることはできず、従来の装置
では、実際の話者の周波数帯域を外れる雑音成分を充分
に低減することができなかった。
にフィルタを設けることは従来でも行なわれている。し
かし、人間の発する音声の周波数特性には大きな個人差
があるので、不特定話者の音声認識を行なう場合にはフ
ィルタの通過帯域を狭くすることはできず、従来の装置
では、実際の話者の周波数帯域を外れる雑音成分を充分
に低減することができなかった。
それに対して本発明を用いれば、スイッチ手段の操作
に応答して、実際の話者の音声の周波数特性が測定さ
れ、それに適合するように可変フィルタ手段の周波数特
性が自動的に調整されるので、フィルタの帯域を狭くす
ることができ、話者の周波数帯域を外れる周波数の雑音
成分を大幅に低減することができる。
に応答して、実際の話者の音声の周波数特性が測定さ
れ、それに適合するように可変フィルタ手段の周波数特
性が自動的に調整されるので、フィルタの帯域を狭くす
ることができ、話者の周波数帯域を外れる周波数の雑音
成分を大幅に低減することができる。
周波数帯域特性の調整を行なう必要がないときには、
ドライバは停止状態のエンジンをスタートする時に通常
の操作を行なえばよい。ドライバが、イグニションスイ
ッチの位置をオフ位置からアクセサリ位置に切換えた
後、時間待ちをすることなく直ちにイグニションオン位
置に切換えれば、可変フィルタ手段の特性は、以前に調
整した周波数帯域特性と同一の特性に設定される。
ドライバは停止状態のエンジンをスタートする時に通常
の操作を行なえばよい。ドライバが、イグニションスイ
ッチの位置をオフ位置からアクセサリ位置に切換えた
後、時間待ちをすることなく直ちにイグニションオン位
置に切換えれば、可変フィルタ手段の特性は、以前に調
整した周波数帯域特性と同一の特性に設定される。
なお、本発明の音声入力装置は、音声認識に限らず、
雑音状況下で特定話者の音声信号だけを抽出する必要の
ある様々な用途(例えば電話,放送,録音等々)におい
ても利用できるのは言うまでもない。
雑音状況下で特定話者の音声信号だけを抽出する必要の
ある様々な用途(例えば電話,放送,録音等々)におい
ても利用できるのは言うまでもない。
本発明の他の目的及び特徴は、以下の、図面を参照し
た実施例説明により明らかになろう。
た実施例説明により明らかになろう。
[実施例] 第1図に、本発明を実施する装置を搭載した自動車の
車室内の外観を示す。この実施例においては、ナビゲー
ション装置の操作を音声入力によって行なうシステムが
備わっている。
車室内の外観を示す。この実施例においては、ナビゲー
ション装置の操作を音声入力によって行なうシステムが
備わっている。
第1図を参照すると、センタコンソール部分にナビゲ
ーション装置のモニタテレビ3が組込まれており、その
近傍の隠れた位置に、ナビゲーション装置の本体である
ナビゲーションユニット4が設けられている。また、モ
ニタテレビ3の上方の、ダッシュボード1上の略中央部
(車輌の左右方向に対する中央)に、マイクロホン2が
組込まれている。このマイクロホン2は、ドライバが発
生する音声を検知するために設けられている。
ーション装置のモニタテレビ3が組込まれており、その
近傍の隠れた位置に、ナビゲーション装置の本体である
ナビゲーションユニット4が設けられている。また、モ
ニタテレビ3の上方の、ダッシュボード1上の略中央部
(車輌の左右方向に対する中央)に、マイクロホン2が
組込まれている。このマイクロホン2は、ドライバが発
生する音声を検知するために設けられている。
また、リアトレイ5上には、左端及び右端の互いに対
称な位置に、スピーカ7及び8が組込まれている。これ
らのスピーカ7,8は、車上に備わったオーディオ装置及
びテレビ受信機の音信号を音響に変換して出力するため
に利用される。更にリアトレイ5上には、その左右方向
の中央部(スピーカ7と8に対して等距離の位置)に、
マイクロホン6が組込まれている。このマイクロホン6
は、主としてスピーカ7,8から出力される音響を、音声
認識の際のノイズとして検出するために設けられてい
る。
称な位置に、スピーカ7及び8が組込まれている。これ
らのスピーカ7,8は、車上に備わったオーディオ装置及
びテレビ受信機の音信号を音響に変換して出力するため
に利用される。更にリアトレイ5上には、その左右方向
の中央部(スピーカ7と8に対して等距離の位置)に、
マイクロホン6が組込まれている。このマイクロホン6
は、主としてスピーカ7,8から出力される音響を、音声
認識の際のノイズとして検出するために設けられてい
る。
即ち、前方のマイクロホン2は、ドライバの音声の他
に、スピーカ7,8から出る音響や様々な空気振動を同時
に検出してしまうので、マイクロホン2で検出される電
気信号には比較的大きなノイズ成分が含まれる場合が多
い。そこで、後方のマイクロホン6でノイズ成分の信号
を検出し、2つのマイクロホン2,6で検出した電気信号
を合成することにより、ノイズ成分のレベルが小さく比
較的明瞭度の高い音声信号を抽出するようにしている。
に、スピーカ7,8から出る音響や様々な空気振動を同時
に検出してしまうので、マイクロホン2で検出される電
気信号には比較的大きなノイズ成分が含まれる場合が多
い。そこで、後方のマイクロホン6でノイズ成分の信号
を検出し、2つのマイクロホン2,6で検出した電気信号
を合成することにより、ノイズ成分のレベルが小さく比
較的明瞭度の高い音声信号を抽出するようにしている。
ところで、ステレオ音源の音響を再生する場合、2つ
のスピーカ7,8は、互いに異なる音響を発生する。従っ
て、2つのスピーカ7,8から出る各々のノイズの成分
を、マイクロホン2で検出した信号から除去するために
は、検出される各々のノイズ成分と、それらのマイクロ
ホン2で検出されるノイズ成分との時間及び振幅を、そ
れぞれ一致させる必要がある。
のスピーカ7,8は、互いに異なる音響を発生する。従っ
て、2つのスピーカ7,8から出る各々のノイズの成分
を、マイクロホン2で検出した信号から除去するために
は、検出される各々のノイズ成分と、それらのマイクロ
ホン2で検出されるノイズ成分との時間及び振幅を、そ
れぞれ一致させる必要がある。
しかしこの実施例では、前方のマイクロホン2が前方
中央部に配置してあり、ノイズ源であるスピーカ7,8は
車室内の互いに左右対称な位置に配置されているので、
左側のスピーカ7から出た音響がマイクロホン2で検出
されるまでの伝播遅延時間と、右側のスピーカ8から出
た音響がマイクロホン2で検出されるまでの伝播遅延時
間とは実質上一致する。しかも、後方のマイクロホン6
が2つのスピーカ7,8の中央部に配置してあるので、左
側のスピーカ7から出た音響がマイクロホン6で検出さ
れるまでの伝播遅延時間と、右側のスピーカ8から出た
音響がマイクロホン6で検出されるまでの伝播遅延時間
とが一致する。
中央部に配置してあり、ノイズ源であるスピーカ7,8は
車室内の互いに左右対称な位置に配置されているので、
左側のスピーカ7から出た音響がマイクロホン2で検出
されるまでの伝播遅延時間と、右側のスピーカ8から出
た音響がマイクロホン2で検出されるまでの伝播遅延時
間とは実質上一致する。しかも、後方のマイクロホン6
が2つのスピーカ7,8の中央部に配置してあるので、左
側のスピーカ7から出た音響がマイクロホン6で検出さ
れるまでの伝播遅延時間と、右側のスピーカ8から出た
音響がマイクロホン6で検出されるまでの伝播遅延時間
とが一致する。
従って、左側のスピーカ7から出た同一の音響が前方
のマイクロホン2で検出される時と、後方のマイクロホ
ン6で検出される時との時間差TdLと右側のスピーカ8
から出た同一の音響が前方のマイクロホン2で検出され
る時と、後方のマイクロホン6で検出される時との時間
差Tdrとが一致する。
のマイクロホン2で検出される時と、後方のマイクロホ
ン6で検出される時との時間差TdLと右側のスピーカ8
から出た同一の音響が前方のマイクロホン2で検出され
る時と、後方のマイクロホン6で検出される時との時間
差Tdrとが一致する。
つまり、特定の時間差Td(=Tdl=Tdr)によって、マ
イクロホン6で検出した信号を遅延させてやれば、遅延
した信号のタイミングを、マイクロホン2で検出した信
号のノイズ成分のタイミングと一致させることができ、
それらの差分を抽出することにより、左及び右のいずれ
のスピーカから出たノイズについても、それを低減し
て、音声成分を明瞭にすることができる。この場合、ノ
イズ成分を検出するためのマイクロホン及びそれが検出
した信号を処理する電気回路が1組だけで済み、装置の
構成が簡単になる。
イクロホン6で検出した信号を遅延させてやれば、遅延
した信号のタイミングを、マイクロホン2で検出した信
号のノイズ成分のタイミングと一致させることができ、
それらの差分を抽出することにより、左及び右のいずれ
のスピーカから出たノイズについても、それを低減し
て、音声成分を明瞭にすることができる。この場合、ノ
イズ成分を検出するためのマイクロホン及びそれが検出
した信号を処理する電気回路が1組だけで済み、装置の
構成が簡単になる。
第2図に、第1図の自動車の搭載した音声入力装置の
電装部の構成を示す。第2図の参照して説明する。前方
のマイクロホン2で検出された音声を主体とする信号
は、ローパスフィルタ10で周波数の高い成分(A/D変換
のサンプリング周波数の半分以上の周波数)が除去され
た後、A/D(アナログ/デジタル)変換器20によってデ
ジタル信号に変換され、バンドパスフィルタ30を通り、
増幅器(乗算器)40を通って、ノイズキャンセラ200の
一方の入力端子に印加される。また、後方のマイクロホ
ン6で検出されたノイズを主体とする信号は、ローパス
フィルタ50で周波数の高い成分が除去された後、A/D変
換器60によってデジタル信号に変換され、バンドパスフ
ィルタ70を通り、増幅器(乗算器)80を通ってノイズキ
ャンセラ200の他方の入力端子に印加される。
電装部の構成を示す。第2図の参照して説明する。前方
のマイクロホン2で検出された音声を主体とする信号
は、ローパスフィルタ10で周波数の高い成分(A/D変換
のサンプリング周波数の半分以上の周波数)が除去され
た後、A/D(アナログ/デジタル)変換器20によってデ
ジタル信号に変換され、バンドパスフィルタ30を通り、
増幅器(乗算器)40を通って、ノイズキャンセラ200の
一方の入力端子に印加される。また、後方のマイクロホ
ン6で検出されたノイズを主体とする信号は、ローパス
フィルタ50で周波数の高い成分が除去された後、A/D変
換器60によってデジタル信号に変換され、バンドパスフ
ィルタ70を通り、増幅器(乗算器)80を通ってノイズキ
ャンセラ200の他方の入力端子に印加される。
バンドパスフィルタ30及び70は、話者、即ちドライバ
の音声の周波数帯域と一致する周波数の信号成分だけを
通過させるデジタルフィルタである。勿論、人間の音声
の周波数帯域には大きな個人差があるので、バンドパス
フィルタ30及び70の特性を実際の話者の特性に適合させ
る調整作業が必要になる。
の音声の周波数帯域と一致する周波数の信号成分だけを
通過させるデジタルフィルタである。勿論、人間の音声
の周波数帯域には大きな個人差があるので、バンドパス
フィルタ30及び70の特性を実際の話者の特性に適合させ
る調整作業が必要になる。
しかしこの実施例においては、バンドパスフィルタ3
0,70の周波数特性の調整を自動的に行なうように構成し
てあるので、通常の音声入力時における調整は不要にな
っている。
0,70の周波数特性の調整を自動的に行なうように構成し
てあるので、通常の音声入力時における調整は不要にな
っている。
即ち、この装置に備わったマイクロコンピュータ(以
下、CPUと記載する)90は、特定の条件の時にA/D変換器
20から出力される信号の周波数特性を分析し、その結果
に応じてバンドパスフィルタ30,70の特性を調整するよ
うになっている。
下、CPUと記載する)90は、特定の条件の時にA/D変換器
20から出力される信号の周波数特性を分析し、その結果
に応じてバンドパスフィルタ30,70の特性を調整するよ
うになっている。
CPU90には、それに指示を与えるために、イグニッシ
ョンスイッチIGSとキャンセルスイッチCSが接続されて
いる。
ョンスイッチIGSとキャンセルスイッチCSが接続されて
いる。
CPU90の動作の概略を第3図に示す。第3図を参照し
てCPU90の動作を説明する。ステップ1では、イグニッ
ションスイッチIGSの電気接点がアクセサリ位置ACCにあ
るか否かを識別する。IGSがACC位置になると、次の処理
に進む。
てCPU90の動作を説明する。ステップ1では、イグニッ
ションスイッチIGSの電気接点がアクセサリ位置ACCにあ
るか否かを識別する。IGSがACC位置になると、次の処理
に進む。
ステップ2ではタイマ1をスタートし、ステップ3で
はタイマ1の計数する時間t1を参照する。t1が0.5秒に
なると、つまりイグニッションステップがACC位置にな
ってから0.5秒が経過すると、ステップ4に進む。
はタイマ1の計数する時間t1を参照する。t1が0.5秒に
なると、つまりイグニッションステップがACC位置にな
ってから0.5秒が経過すると、ステップ4に進む。
ステップ4では、タイマ2をスタートし次のステップ
5に進む。ステップ5では、A/D変換器20から一定のサ
ンプリング周期で出力されるデジタル信号を順次に入力
し、内部のメモリ上にストアする。ステップ5の処理
は、t2、即ちタイマ2の計数値が2秒になるまで繰り返
される。つまり、2秒間の間に検出された音響情報のデ
ジタルデータが、メモリ上に蓄積される。
5に進む。ステップ5では、A/D変換器20から一定のサ
ンプリング周期で出力されるデジタル信号を順次に入力
し、内部のメモリ上にストアする。ステップ5の処理
は、t2、即ちタイマ2の計数値が2秒になるまで繰り返
される。つまり、2秒間の間に検出された音響情報のデ
ジタルデータが、メモリ上に蓄積される。
CPU90がステップ5,6を実行する際中には、話者となる
ドライバは、任意の言葉を発声する必要がある。ドライ
バが2秒間の発声を行なうと、その音声波形の情報が測
定され、その結果がメモリ上に保存される。
ドライバは、任意の言葉を発声する必要がある。ドライ
バが2秒間の発声を行なうと、その音声波形の情報が測
定され、その結果がメモリ上に保存される。
CPU90は、ステップ7に進むと、メモリ上に蓄積され
た音声波形の情報について、公知の高速フーリエ変換
(FFT)処理を実行する。その結果、測定したドライバ
の音声エネルギーの周波数分布のデータが得られる。こ
のデータを更に処理し、音声周波数帯域の上限周波数と
下限周波数を求める。具体的には、この実施例では、エ
ネルギー分布の最大値に対して所定比率以上のエネルギ
ーが検知された全周波数範囲の上限及び下限を求めるよ
うにしている。
た音声波形の情報について、公知の高速フーリエ変換
(FFT)処理を実行する。その結果、測定したドライバ
の音声エネルギーの周波数分布のデータが得られる。こ
のデータを更に処理し、音声周波数帯域の上限周波数と
下限周波数を求める。具体的には、この実施例では、エ
ネルギー分布の最大値に対して所定比率以上のエネルギ
ーが検知された全周波数範囲の上限及び下限を求めるよ
うにしている。
次のステップ8では、ステップ7で求めた周波数の上
限値及び下限値と一致する選択信号を生成する。
限値及び下限値と一致する選択信号を生成する。
第2図を参照すると、CPU90に接続されたROM100に
は、バンドパスフィルタ30及び70の周波数特性を決定す
る係数のデータが、周波数帯域毎に区分して、互いに異
なるアドレス領域に予め記憶させてある。従って、CPU9
0は、ステップ7で求めた周波数帯域に割り当てた係数
データを記憶したメモリアドレスを選択する信号SELを
生成し、それをROM100のアドレス端子に印加する。
は、バンドパスフィルタ30及び70の周波数特性を決定す
る係数のデータが、周波数帯域毎に区分して、互いに異
なるアドレス領域に予め記憶させてある。従って、CPU9
0は、ステップ7で求めた周波数帯域に割り当てた係数
データを記憶したメモリアドレスを選択する信号SELを
生成し、それをROM100のアドレス端子に印加する。
次のステップ9では、キャンセルスイッチCSの状態を
チェックする。キャンセルスイッチCSがオンの場合に
は、ステップ2に戻って再び分析の処理を行なう。
チェックする。キャンセルスイッチCSがオンの場合に
は、ステップ2に戻って再び分析の処理を行なう。
次のステップ10では、イグニッションスイッチIGS
が、ON位置か否かを識別する。ON位置を検知した場合に
は次にステップ11に進む。
が、ON位置か否かを識別する。ON位置を検知した場合に
は次にステップ11に進む。
ステップ11では、バンドパスフィルタ30及び70を制御
して、ROM100が出力する係数データPfを各々のフィルタ
に係数としてラッチさせる。
して、ROM100が出力する係数データPfを各々のフィルタ
に係数としてラッチさせる。
ステップ12では、イグニッションスイッチIGSがOFF位
置か否かを識別する。OFF位置を検知すると、次にスイ
ッチ1に戻る。
置か否かを識別する。OFF位置を検知すると、次にスイ
ッチ1に戻る。
つまり、自動車のエンジンが停止している状態(IGS
がOFF位置)でイグニッションキーをOFF位置からACC位
置に動かすと、ドライバの声の周波数特性を分析するモ
ードに入り、ノイズの少ない状態でドライバの音声のみ
の周波数特性を自動的に測定し、それに適合するよう
に、バンドパスフィルタ30,70の特性が自動的に調整さ
れる。
がOFF位置)でイグニッションキーをOFF位置からACC位
置に動かすと、ドライバの声の周波数特性を分析するモ
ードに入り、ノイズの少ない状態でドライバの音声のみ
の周波数特性を自動的に測定し、それに適合するよう
に、バンドパスフィルタ30,70の特性が自動的に調整さ
れる。
なお、CPU90はその内部に不揮発性メモリを備えてお
り、CPU90が出力する選択信号SELの状態は、装置の電源
がオフした場合でも保存される。この実施例では一担、
話者の特性にバンドパスフィルタの特性を適合させた後
は、話者、即ちドライバが変わらない限り、再びその調
整を行なう必要はない。
り、CPU90が出力する選択信号SELの状態は、装置の電源
がオフした場合でも保存される。この実施例では一担、
話者の特性にバンドパスフィルタの特性を適合させた後
は、話者、即ちドライバが変わらない限り、再びその調
整を行なう必要はない。
つまり、バンドパスフィルタの調整が済んでいる場合
には、ドライバは停止状態のエンジンをスタートする時
に通常の操作を行えばよい。ドライバが、イグニッショ
ンキーの位置をOFF位置からACC位置に切換えた後、時間
待ちをすることなく直ちにON位置に切換えれば、CPU90
の処理は、第3図のステップ1−2−3−13を通って11
に進むので、選択信号SELの更新は行なわれず、電源が
オフする前と同一の選択信号SELによって、バンドパス
フィルタ30,70の特性は、以前に調整した周波数特性と
同一の特性に設定される。
には、ドライバは停止状態のエンジンをスタートする時
に通常の操作を行えばよい。ドライバが、イグニッショ
ンキーの位置をOFF位置からACC位置に切換えた後、時間
待ちをすることなく直ちにON位置に切換えれば、CPU90
の処理は、第3図のステップ1−2−3−13を通って11
に進むので、選択信号SELの更新は行なわれず、電源が
オフする前と同一の選択信号SELによって、バンドパス
フィルタ30,70の特性は、以前に調整した周波数特性と
同一の特性に設定される。
再び第2図を参照すると、ノイズキャンセラ200に
は、遅延回路210,適応フィルタ220及び係数制御回路230
が備わっている。遅延回路210は、所定時間(6.4msec)
入力信号を遅延した信号dkを出力する。適応フィルタ22
0は、127段の遅延要素(Z-1),128段の可変増幅要素(A
1〜A128:乗算器)及び128段の加算要素を含んでおり、
可変増幅要素の各々に設定する係数を調整することによ
り、このフィルタの特性を様々に変化させることができ
る。
は、遅延回路210,適応フィルタ220及び係数制御回路230
が備わっている。遅延回路210は、所定時間(6.4msec)
入力信号を遅延した信号dkを出力する。適応フィルタ22
0は、127段の遅延要素(Z-1),128段の可変増幅要素(A
1〜A128:乗算器)及び128段の加算要素を含んでおり、
可変増幅要素の各々に設定する係数を調整することによ
り、このフィルタの特性を様々に変化させることができ
る。
係数制御回路230は、遅延回路210が出力する信号dkと
適応フィルタ220が出力する信号ykとの差分ekを入力
し、その二乗平均値が最小になるような係数群を生成
し、それらを可変増幅要素の各々に印加する。この例で
は、係数制御回路230は、公知のLMSアルゴリズムを実行
するようになっている。
適応フィルタ220が出力する信号ykとの差分ekを入力
し、その二乗平均値が最小になるような係数群を生成
し、それらを可変増幅要素の各々に印加する。この例で
は、係数制御回路230は、公知のLMSアルゴリズムを実行
するようになっている。
つまり、ドライバの音声を目的とする信号成分(S)
とし、それ以外の音響を全てノイズ成分(N)とみなせ
ば、増幅器40からノイズキャンセラ200に印加される電
気信号には、SとNの両方の成分が含まれ、増幅器80か
らノイズキャンセラ200に印加される電気信号は、主と
してNの成分で構成されるので、両者を合成した結果を
最小にすることは、Sの成分だけを抽出することを意味
する。
とし、それ以外の音響を全てノイズ成分(N)とみなせ
ば、増幅器40からノイズキャンセラ200に印加される電
気信号には、SとNの両方の成分が含まれ、増幅器80か
らノイズキャンセラ200に印加される電気信号は、主と
してNの成分で構成されるので、両者を合成した結果を
最小にすることは、Sの成分だけを抽出することを意味
する。
ノイズキャンセラ200に入力される2つの電気信号に
含まれるノイズ成分は互いに時間及び振幅が異なるが、
その違いに各々の信号を遅延回路210及び適応フィルタ2
20を通すことによってなくすることができる。
含まれるノイズ成分は互いに時間及び振幅が異なるが、
その違いに各々の信号を遅延回路210及び適応フィルタ2
20を通すことによってなくすることができる。
ノイズキャンセラ200によって出力される抽出された
音声信号は、音声認識ユニット300に印加される。この
音声認識ユニット300は、公知の認識アルゴリズムを実
行して、ドライバの発した音声の認識を行ない、更に、
認識した音声情報と予め定めた指令語(拡大,縮小,オ
ン,オフ,上,下,右,左等々)の各々との適合の有無
を識別し、適合した場合には、その指令語に対応する指
令信号を、ナビゲーションユニット400に出力する。
音声信号は、音声認識ユニット300に印加される。この
音声認識ユニット300は、公知の認識アルゴリズムを実
行して、ドライバの発した音声の認識を行ない、更に、
認識した音声情報と予め定めた指令語(拡大,縮小,オ
ン,オフ,上,下,右,左等々)の各々との適合の有無
を識別し、適合した場合には、その指令語に対応する指
令信号を、ナビゲーションユニット400に出力する。
従ってこの例では、ドライバの音声入力によって、ナ
ビゲーションユニット400に指示を与えてそれを制御す
ることができる。
ビゲーションユニット400に指示を与えてそれを制御す
ることができる。
なお、イグニッションスイッチIGSがACC位置の場合、
アクセサリであるオーディオ装置にも電源が供給される
ので、それの電源スイッチがオンであれば、ドライバの
音声の周波数帯域を測定するモードでも、オーディオ装
置から出力される音響、即ちノイズが検出され、測定に
誤りを生じる恐れがある。従ってその場合には、次のよ
うな構成に変更するので望ましい。即ち、オーディオ装
置の電源をオン/オフするリレーなどのスイッチを設け
るとともに、第3図のステップ4の中で、該ステップを
オフしてオーディオ装置の電源を遮断し、ステップ7の
中でスイッチをオンしてオーディオ装置の電源供給を許
可するように制御を変える。
アクセサリであるオーディオ装置にも電源が供給される
ので、それの電源スイッチがオンであれば、ドライバの
音声の周波数帯域を測定するモードでも、オーディオ装
置から出力される音響、即ちノイズが検出され、測定に
誤りを生じる恐れがある。従ってその場合には、次のよ
うな構成に変更するので望ましい。即ち、オーディオ装
置の電源をオン/オフするリレーなどのスイッチを設け
るとともに、第3図のステップ4の中で、該ステップを
オフしてオーディオ装置の電源を遮断し、ステップ7の
中でスイッチをオンしてオーディオ装置の電源供給を許
可するように制御を変える。
なお、上記実施例においては、バンドパスフィルタ3
0,70の特性調整を行なうCPU90とノイズキャンセラ200の
適応フィルタの制御を行なう係数制御回路230とをそれ
ぞれ独立に設けたが、両方の処理を1つのCPUで実行す
ることも可能である。
0,70の特性調整を行なうCPU90とノイズキャンセラ200の
適応フィルタの制御を行なう係数制御回路230とをそれ
ぞれ独立に設けたが、両方の処理を1つのCPUで実行す
ることも可能である。
また実施例においては、デジタル信号処理によってド
ライバの音声の周波数分析及びバンドパスフィルタの調
整を行なっているが、これらの処理はアナログ電気回路
におき換えても同様に行なうことができる。バンドパス
フィルタ30,70をアナログ回路におき換える場合には、
例えば、多数のコンデンサをアナログスイッチによって
切換えるように構成すれば、デジタル処理の場合と同様
にフィルタの周波数特性を切換えることができる。
ライバの音声の周波数分析及びバンドパスフィルタの調
整を行なっているが、これらの処理はアナログ電気回路
におき換えても同様に行なうことができる。バンドパス
フィルタ30,70をアナログ回路におき換える場合には、
例えば、多数のコンデンサをアナログスイッチによって
切換えるように構成すれば、デジタル処理の場合と同様
にフィルタの周波数特性を切換えることができる。
更に、実施例では音声認識の場合を示したが、本発明
は、単純にアナログ信号を処理する用途に利用する場合
であっても、同様に様々なノイズを含む音声信号の中か
ら特定話者の音声成分だけを抽出することができる。
は、単純にアナログ信号を処理する用途に利用する場合
であっても、同様に様々なノイズを含む音声信号の中か
ら特定話者の音声成分だけを抽出することができる。
[発明の効果] 以上のとおり本発明によれば、可変フィルタ手段の周
波数特性を実際の話者の周波数帯域に正確に一致させる
ことができるので、フィルタの通過帯域幅を充分に狭く
することができ、不必要な周波数成分を全てノイズとし
て除去し必要な音声成分だけを抽出することができる。
しかも、可変フィルタ手段の特性の調整は自動的に行な
われるので操作上の煩わしさが生じない。
波数特性を実際の話者の周波数帯域に正確に一致させる
ことができるので、フィルタの通過帯域幅を充分に狭く
することができ、不必要な周波数成分を全てノイズとし
て除去し必要な音声成分だけを抽出することができる。
しかも、可変フィルタ手段の特性の調整は自動的に行な
われるので操作上の煩わしさが生じない。
周波数帯域特性の調整を行なう必要がないときには、
ドライバは停止状態のエンジンをスタートする時に通常
の操作を行なえばよい。ドライバが、イグニッションス
イッチの位置をオフ位置からアクセサリ位置に切換えた
後、時間待ちをすることなく直ちにイグニッションオン
位置に切換えれば、可変フィルタ手段の特性は、以前に
調整した周波数帯域特性と同一の特性に設定される。
ドライバは停止状態のエンジンをスタートする時に通常
の操作を行なえばよい。ドライバが、イグニッションス
イッチの位置をオフ位置からアクセサリ位置に切換えた
後、時間待ちをすることなく直ちにイグニッションオン
位置に切換えれば、可変フィルタ手段の特性は、以前に
調整した周波数帯域特性と同一の特性に設定される。
第1図は、本発明の装置を搭載した自動車の車室内の外
観を示す斜視図である。 第2図は、実施例の音声入力装置を構成を示すブロック
図である。 第3図はCPU90の動作の概略を示すフローチャートであ
る。 2:マイクロホン(音声入力手段) 3:モニタテレビ、7,8:スピーカ 10,50:ローパスフィルタ 20,60:A/D変換器 30,70:バンドパスフィルタ(可変フィルタ手段) 90:マイクロコンピュータ(周波数特性検知手段,制御
手段)、100:ROM 200:ノイズキャンセラ 210:遅延回路、220:適応フィルタ 230:係数制御回路、300:音声認識ユニット 400:ナビゲーションユニット IGS:イグニッションユニット(スイッチ手段) CS:キャンセルスイッチ
観を示す斜視図である。 第2図は、実施例の音声入力装置を構成を示すブロック
図である。 第3図はCPU90の動作の概略を示すフローチャートであ
る。 2:マイクロホン(音声入力手段) 3:モニタテレビ、7,8:スピーカ 10,50:ローパスフィルタ 20,60:A/D変換器 30,70:バンドパスフィルタ(可変フィルタ手段) 90:マイクロコンピュータ(周波数特性検知手段,制御
手段)、100:ROM 200:ノイズキャンセラ 210:遅延回路、220:適応フィルタ 230:係数制御回路、300:音声認識ユニット 400:ナビゲーションユニット IGS:イグニッションユニット(スイッチ手段) CS:キャンセルスイッチ
フロントページの続き (56)参考文献 特開 昭57−161800(JP,A) 特開 昭58−70285(JP,A) 特開 昭58−70292(JP,A) 特開 昭63−163498(JP,A) 特開 昭60−140399(JP,A) 特開 昭61−272799(JP,A) 特開 昭58−190994(JP,A) 特公 平8−33738(JP,B2) 特公 平2−2157(JP,B2) 特公 平3−41840(JP,B2) 特公 昭63−29755(JP,B2) (58)調査した分野(Int.Cl.7,DB名) G10L 3/02 301 G10L 3/00 513 G10L 3/00 551 G10L 3/00 571 B60R 16/02 655
Claims (1)
- 【請求項1】音声を電気信号に変換する、音声入力手
段; 前記音声入力手段から出力される電気信号の周波数特性
を調整する可変フィルタ手段; 前記音声入力手段から出力される電気信号を分析してそ
の周波数特性を検知する、周波数特性検知手段;及び 車輌のイグニッションスイッチがアクセサリ位置に切換
わるとそれに応答して、前記周波数特性検知手段の分析
動作を開始し、分析が終了するとその分析結果に応じて
前記可変フィルタ手段の周波数特性を調整し、分析が終
了する前に前記イグニションスイッチがイグニションオ
ン位置に切換わった場合には、分析動作を中止し、前記
可変フィルタ手段の周波数特性はそれ以前の設定状態を
維持する、制御手段; を備える車輌上の音声入力装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1077776A JP3003037B2 (ja) | 1989-03-29 | 1989-03-29 | 音声入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1077776A JP3003037B2 (ja) | 1989-03-29 | 1989-03-29 | 音声入力装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02254499A JPH02254499A (ja) | 1990-10-15 |
JP3003037B2 true JP3003037B2 (ja) | 2000-01-24 |
Family
ID=13643360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1077776A Expired - Fee Related JP3003037B2 (ja) | 1989-03-29 | 1989-03-29 | 音声入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3003037B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6963759B1 (en) * | 1999-10-05 | 2005-11-08 | Fastmobile, Inc. | Speech recognition technique based on local interrupt detection |
US7924324B2 (en) | 2003-11-05 | 2011-04-12 | Sanyo Electric Co., Ltd. | Sound-controlled electronic apparatus |
JP2005164988A (ja) * | 2003-12-03 | 2005-06-23 | Xanavi Informatics Corp | 周波数切替装置および情報処理装置 |
-
1989
- 1989-03-29 JP JP1077776A patent/JP3003037B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH02254499A (ja) | 1990-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6529605B1 (en) | Method and apparatus for dynamic sound optimization | |
US6549629B2 (en) | DVE system with normalized selection | |
KR100718478B1 (ko) | 차량탑재 음향 재생 장치 | |
JP2002544552A (ja) | 音声認識のための非定常の干渉信号のキャンセル | |
EP1247428B1 (en) | Speech distribution system | |
JP2012025270A (ja) | 車両用の音量制御装置および音量制御装置用のプログラム | |
JP3003037B2 (ja) | 音声入力装置 | |
JPH0573073A (ja) | 能動型騒音制御装置 | |
US7542577B2 (en) | Input sound processor | |
JP2003241767A (ja) | ノイズキャンセル装置 | |
JP3877271B2 (ja) | 音声認識用オーディオキャンセル装置 | |
JP2881803B2 (ja) | 音声入力装置 | |
JP2000148200A (ja) | 音声入力装置 | |
JP2874176B2 (ja) | 音声信号処理装置 | |
US12039965B2 (en) | Audio processing system and audio processing device | |
JPH06195091A (ja) | 車室内騒音低減装置 | |
JP2002171587A (ja) | 車載音響装置の音量調節装置およびそれを用いた音声認識装置 | |
JP2965301B2 (ja) | 集音装置 | |
JP4522509B2 (ja) | オーディオ装置 | |
JP3822397B2 (ja) | 音声入出力方式 | |
JP2000132200A (ja) | 音声認識機能付きオーディオ/ビデオ装置および音声認識方法 | |
JPH01140199A (ja) | 自動車の疑似排気音発生装置 | |
JPH0759200A (ja) | 音響再生装置 | |
JPH02244098A (ja) | 音声信号処理装置 | |
JP3049261B2 (ja) | 音響選択装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071119 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081119 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |