JP2004085963A - Navigation voice compensating device - Google Patents

Navigation voice compensating device Download PDF

Info

Publication number
JP2004085963A
JP2004085963A JP2002248016A JP2002248016A JP2004085963A JP 2004085963 A JP2004085963 A JP 2004085963A JP 2002248016 A JP2002248016 A JP 2002248016A JP 2002248016 A JP2002248016 A JP 2002248016A JP 2004085963 A JP2004085963 A JP 2004085963A
Authority
JP
Japan
Prior art keywords
sound
voice
navigation
microphone
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002248016A
Other languages
Japanese (ja)
Inventor
Toru Marumoto
丸本 徹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP2002248016A priority Critical patent/JP2004085963A/en
Publication of JP2004085963A publication Critical patent/JP2004085963A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Traffic Control Systems (AREA)
  • Navigation (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Instructional Devices (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To improve articulation of navigation voice by utilizing an existing navigation device without separately adding hardware such as a microphone and a microphone amplifier thereto. <P>SOLUTION: A microphone 11 is shared in voice recognition processing and articulation improving processing and either processing is performed by switching an operation mode by a mode switching section 14. Thereby the need of separately adding hardware such as the microphone and the microphone amplifier only for improving articulation is eliminated and cost an increase of the cost can be suppressed. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明はナビゲーション音声補正装置に関し、特に、ナビゲーション装置の案内音声の音圧レベルを周囲の騒音等に応じて補正する装置に用いて好適なものである。
【0002】
【従来の技術】
車両の走行案内を行うナビゲーション装置においては、車両の現在位置を検出してDVD等の記録媒体から車両位置周辺の地図データを読み出し、地図画像をディスプレイ装置に描画するとともに、その地図画像の所定位置に車両位置マーク(自車位置マーク)を重ねて描画する。そして、車両が移動するに伴って地図画像をスクロールして、車両位置周辺の地図情報が一目で判るようにしている。
【0003】
このようなナビゲーション装置は、出発地から目的地までの誘導経路を設定する機能、誘導経路を地図画像上に表示する機能、誘導経路上の案内交差点において曲がる方向を音声で案内する機能等を備えている。すなわち、この種のナビゲーション装置では、地図データを用いて出発地から目的地までを結ぶ最もコストが小さな経路を、幅優先探索(BFS)法あるいはダイクストラ法などのシミュレーションを行って自動探索し、その探索した経路を誘導経路として記憶する。
【0004】
そして、車両の走行中に地図画像上で誘導経路を他の道路と識別可能に表示するとともに、車両が誘導経路上の案内交差点から所定距離内に近づいたときに、交差点案内図(交差点拡大図とこの交差点での進行方向を示す矢印)を表示し、いずれの道路を走行すればよいか、交差点でどの方向に進んだらよいかを提示する。また、交差点における進行方向が右折の場合には「この先を右です」等のように音声案内を行い、現在の車両位置から案内交差点までの距離が相当ある場合には「しばらく道なりです」等の音声案内を適宜行う。
【0005】
ところで、上述したナビゲーション装置の案内音声(以下、ナビゲーション音声と呼ぶ)は、種々の騒音(走行中のエンジン音、ロードノイズ、風切り音等)やカーオーディオの出力音があると、非常に聴き取りにくくなる。このような問題に対して、所定の信号処理を行うことによってナビゲーション音声の明瞭度を高めるようにしたシステムが提案されている(例えば、特開平11−166835号公報)。
【0006】
図7は、上記従来のシステムの構成を示すブロック図である。図7に示すように、従来のシステムでは、カースピーカ1から出力されるオーディオ音、モニタスピーカ2から出力されるナビゲーション音声、車内に発生する走行ノイズを全てマイク3から入力する。そして、このマイク入力された音声信号をもとに、適応フィルタ(ADF)5の伝達関数とゲイン制御部6のラウドネス補償ゲインとを可変制御することにより、騒音の大きさに関わりなく常に適切な音量等でナビゲーション音声を再生できるようにしている。
【0007】
【発明が解決しようとする課題】
しかしながら、上記従来のシステムでは、騒音量を推定するために、オーディオ音、ナビゲーション音声および走行ノイズを入力するためのマイク3を用いる必要がある。また、この推定部においては、車室内で時々刻々と変化している騒音量に合わせて、適応フィルタ5の伝達関数(フィルタ係数)を逐次更新する必要がある。そのため、マイク3は常にアクティブ状態としておかなければならない。
【0008】
以上のことから、現状のナビゲーション装置にナビゲーション音声の明瞭度改善機能を搭載することを考えた場合、マイクやマイクアンプなどのハードウェアを明瞭度改善処理用に別途追加する必要があり、コストアップとなる問題が生じていた。
【0009】
本発明は、このような問題を解決するために成されたものであり、マイクやマイクアンプなどのハードウェアを別途追加することなく、既存のナビゲーション装置を利用して、ナビゲーション音声の明瞭度を改善できるようにすることを目的とする。また、このことを、明瞭度改善処理の性能を落とさずに実現できるようにすることも目的としている。
【0010】
【課題を解決するための手段】
上記した課題を解決するために、本発明のナビゲーション音声補正装置では、ナビゲーション装置が音声認識処理のために元々備えている発話音声入力用のマイクを、明瞭度改善処理の際にナビゲーション音声および周囲音を入力するためにも共用し、明瞭度改善処理と音声認識処理との何れかに動作モードを切り替えてマイク入力音声を利用するようにしている。本発明において好ましくは、動作モードが音声認識処理に切り替えられたときに、明瞭度改善処理における適応フィルタ処理を停止させるように制御する。
【0011】
上記のように構成した本発明によれば、明瞭度改善処理のためだけにマイクやマイクアンプなどのハードウェアを別途追加する必要がなくなり、既存のナビゲーション装置にナビゲーション音声の明瞭度改善機能を搭載する際のコストアップを抑止することができる。また、モードの切り替えを行うことにより、明瞭度改善機能の適応フィルタに対するマイク入力音声のレベルが急変するが、その際に適応フィルタ処理は停止されるので、モード切替時における急激なレベル変動により悪影響を受けることが少なくなる。
【0012】
【発明の実施の形態】
以下、本発明の一実施形態を図面に基づいて説明する。本実施形態のナビゲーション音声補正装置は、エンジン音やロードノイズ、風切り音等の走行ノイズや、音楽等のオーディオ音の音圧レベルを監視し、これらの音圧レベルに応じてナビゲーション音声に適切なゲインを与えることによって、ナビゲーション音声を聴き取りやすくするものである。
【0013】
図1は、本実施形態によるナビゲーション音声補正装置の構成を示すブロック図である。図1に示すように、本実施形態のナビゲーション音声補正装置100は、モニタスピーカ2、適応フィルタ(ADF)5、ゲイン制御部6、イコライザ7、マイク11、マイクアンプ12、トークスイッチ13、モード切替部14およびモード制御部15を備えて構成されている。
【0014】
なお、このナビゲーション音声補正装置100とは別に、オーディオ音再生装置(図示せず)および音声認識エンジン20が備えられている。オーディオ音再生装置は、CD、MD、DVD、ラジオ放送等の各種オーディオソースを再生する再生部(図示せず)とカースピーカ1とを含んでおり、カースピーカ1からオーディオ再生音が出力される。また、音声認識エンジン20は、マイク入力された話者音声を認識して、その話者音声に対応するコマンドをナビゲーション装置に対して実行する。
【0015】
マイク11は、ナビゲーション装置が音声認識処理のために元々備えている話者音声入力用のものであり、本実施形態ではこれを明瞭度改善処理にも共用する。すなわち、話者音声だけでなく、カースピーカ1から出力されるオーディオ音、モニタスピーカ2から出力されるナビゲーション音声、車室内に発生する走行ノイズを全て同じマイク11から入力する。マイクアンプ12は、マイク11から入力された音声信号を増幅する。
【0016】
トークスイッチ13は、発話による音声認識処理の開始を指示するためのスイッチである。すなわち、このトークスイッチ13を操作したタイミングに合わせて、発話による音声入力受付状態となる。モード切替部14は、ナビゲーション音声、オーディオ音および走行ノイズをマイク11から入力してナビゲーション音声の補正を行う明瞭度改善モードと、発話音声をマイク11から入力して音声認識を行う音声認識モードとの何れかに動作モードを切り替える。
【0017】
一般に、ナビゲーション音声の出力は、走行中の現在位置に応じて行われ、どのタイミングで音声出力されるかは分からない。そのため、その不定のタイミングで出力されるナビゲーション音声の明瞭度を改善するためには、逐次変化する周りの騒音量に合わせて、適応フィルタ5の伝達関数を常に更新していなければならない。そこで、モード切替部14は、明瞭度改善処理をデフォルトの動作モードとして常時稼動させ、トークスイッチ13がオンとされたときのみ音声認識モードに切り替えるようにする。
【0018】
音声認識モードに切り替えられたとき、マイク11から入力された発話音声は音声認識エンジン20に供給される。これにより、発話コマンドに対応した処理が実行される。一方、明瞭度改善モードに切り替えられたときは、マイク11から入力されたナビゲーション音声、オーディオ音および走行ノイズは、減算器4に供給される。減算器4は、マイク11より入力されたナビゲーション音声、オーディオ音および走行ノイズから、適応フィルタ5から出力されるナビゲーション音声を引くことによって誤差を演算し、オーディオ音と走行ノイズのみを抽出する。
【0019】
適応フィルタ5は、図2に示すように、同定用フィルタ21および音声補正用フィルタ22を含んで構成されている。同定用フィルタ21は、音響系のインパルス応答(音声補正用フィルタ22のフィルタ係数)を同定するためのフィルタであり、LMS(Least Mean Square )アルゴリズムやN−LMS(Normalized−LMS)アルゴリズムによる適応フィルタが用いられている。この同定用フィルタ21は、減算器4から出力される誤差e(n)のパワーが最小になるように動作して音響系のインパルス応答を同定する。
【0020】
音声補正用フィルタ22は、同定用フィルタ21により決定されたフィルタ係数w(n)と、制御対象となるナビゲーション音声x(n)とを用いて畳み込み演算することにより、ナビゲーション音声x(n)に対してイコライザ7と同一の伝達特性を与える。この音声補正用フィルタ22より出力されるフィルタ制御後のナビゲーション音声y(n)は、減算器4に供給され、ここで演算された誤差e(n)が同定用フィルタ21にフィードバックされる。
【0021】
ゲイン制御部6は、適応フィルタ5から出力されるフィルタ制御後のナビゲーション音声と、減算器4から出力されるオーディオ音および走行ノイズとに基づいて、ナビゲーション装置から出力される制御対象のナビゲーション音声に対して加える最適のゲインを算出し、この算出されたゲイン値をイコライザ7に出力する。
【0022】
イコライザ7は、ナビゲーション音声に対してゲイン補正を行う。すなわち、ナビゲーション装置から入力されるナビゲーション音声に対して、ゲイン制御部6によって算出されたゲインを与えることにより、当該ナビゲーション音声を補正する。この補正は、例えば、複数に分割された周波数帯域のそれぞれ毎に行う。
【0023】
モード制御部15は、トークスイッチ13のオン/オフに応じてモード切替部14を制御し、動作モードを明瞭度改善モードと音声認識モードとの何れかに切り替えるようにする。モード制御部15はまた、音声認識モードに切り替えたときに、適応フィルタ5による伝達関数の適応処理を停止させる。そして、音声認識が終了した(ナビゲーション装置が認識終了のフラグを立てた)段階で、適応フィルタ5の計算を再開するように制御する。
【0024】
上述のように、明瞭度改善モードでは、マイク11より入力される音声(ナビゲーション音声、オーディオ音、走行ノイズ)から、適応フィルタ5で求められたナビゲーション音声の推定値を減算器4にて減算し、その差分値を適応フィルタ5にフィードバックすることにより、図3に示すような伝達関数の振幅特性を持つフィルタ係数の計算を常に行っている。
【0025】
このような状態で、トークスイッチ13の操作に応じて動作モードを明瞭度改善モードから音声認識モードに切り替えると、マイク11から減算器4に対して入力される音声レベルは0となる。逆に、音声認識モードから明瞭度改善モードに戻したときは、マイク11から減算器4に対して突然に大きなレベルの音声が入力される。
【0026】
このように、動作モードを切り替えると、減算器4により算出される差分値が大きく変動する。このとき、適応フィルタ5の計算を継続して行っていると、適応フィルタ5によって計算されるフィルタ係数値が大幅に異なるか、発散してしまう。これにより、ナビゲーション音声と周囲音の分離性能(明瞭度改善性能)に悪影響が出てしまうことになる。
【0027】
これに対し、本実施形態では、音声認識モード中には適応フィルタ5による伝達関数の適応処理を停止させ、明瞭度改善モードへの復帰時に適応処理を再開させるようにしている。これにより、動作モードの切り替えによって減算器4に対する音声入力レベルが大きく変動しても、そのときの大きな変動値によって伝達関数の推定が行われることはなくなる。したがって、伝達関数の推定精度が悪くなる(すなわち、適応アルゴリズムの推定誤差が大きくなる)という不都合を回避することができる。
【0028】
なお、音声認識モード中は、適応フィルタ5による伝達関数の適応処理が一時的に停止状態となるが、これによる影響は少ない。すなわち、現状のナビゲーション装置では、音声を正しく認識させるために、「ハンドルを握った自然な姿勢で」発話動作を行うことが推奨されている。そのため、音声認識モード中の数秒間で、周囲の騒音量に大きな変化が生じることは起こりにくく、動作モードの切替前後で伝達関数の振幅特性にも大きな差分は生じない。
【0029】
図4は、動作モードの切替前後に得られる伝達関数の振幅特性の差分を示す図である。図4において、横軸は周波数を示し、縦軸は切替前後における伝達関数の差分を示す。この図4に示されるように、動作モードの切替前後で伝達関数の振幅特性に大きな差分は生じていない。したがって、音声認識モード中に伝達関数の適応処理を一時的に停止しても、伝達関数の推定精度が悪くなるということは殆どない。
【0030】
図5は、トークスイッチ13が押下されたときの動作を示すフローチャートである。図5において、トークスイッチ13が押下されると、モード制御部15は、適応フィルタ5における伝達関数の適応処理(フィルタ係数の更新)を停止させる(ステップS1)。具体的には、停止制御信号を適応フィルタ5に出力する。その後、モード制御部15はモード切替部14を制御して、動作モードを音声認識モードに切り替える(ステップS2)。
【0031】
次に、ナビゲーション装置は、発話音声の入力受付を開始する合図音を出力した後(ステップS3)、音声認識処理を実行する(ステップS4)。なお、この音声認識処理の際に、トークスイッチ13の押下による音声認識処理のキャンセルも受け付けている。次いで、ナビゲーション装置は、音声認識が終了したかどうかを判定する(ステップS5)。音声認識が終了していない場合は、ステップS4の音声認識処理を続行する。
【0032】
一方、音声認識処理が終了した場合、モード制御部15はモード切替部14を制御して、動作モードを明瞭度改善モードに切り替える(ステップS6)。このとき、適応フィルタ5における伝達関数の適応処理(フィルタ係数の更新)を再開させる。具体的には、停止制御信号の出力を中止する。その後、上記ステップS4で音声認識されたコマンドを実行する(ステップS7)。このようにコマンド実行前に動作モードの切り替えを行っているのは、時間のかかる伝達関数の計算を少しでも早く開始させるためである。
【0033】
図6は、適応フィルタ5の動作を示すフローチャートである。なお、この図6では、適応フィルタ5にLMSアルゴリズムを適用した例について示している。図6において、適応フィルタ5は、所定時間間隔1/Fsごとの割り込みの発生に応じて、演算に必要なデータ(明瞭度改善処理の制御対象となるナビゲーション音声x(n)や、減算器4からフィードバックされる誤差e(n)等)を取り込む(ステップS11)。
【0034】
そして、図2の音声補正用フィルタ22において、同定用フィルタ21により決定されたフィルタ係数w(n)と、上記入力された制御対象のナビゲーション音声x(n)とを用いて畳み込み演算をすることにより、フィルタ制御後のナビゲーション音声y(n)を得る(ステップS12)。
【0035】
次に、適応フィルタ5は、トークスイッチ13がオンとなっているか否か、すなわち音声認識モード中であるか否かを判定する(ステップS13)。音声認識モード中は、モード制御部15から適応フィルタ5に対して停止制御信号(フラグ)が送られているので、このフラグを見ることによってトークスイッチ13の状態を判定することができる。
【0036】
ここで、トークスイッチ13がアクティブとなっていない場合は、通常通り同定用フィルタ21においてフィルタ係数の更新を行う(ステップS15)。一方、トークスイッチ13がアクティブとなっている場合は、同定用フィルタ21におけるフィルタ係数の更新処理は行うことなく、割り込み処理を終了する。すなわち、音声認識モード中は、適応フィルタ5のフィルタ係数がw(n+1)=w(n)のままで扱われ、その間は畳み込み演算だけが行われることとなる。
【0037】
以上詳しく説明したように、本実施形態では、音声認識処理と明瞭度改善処理とでマイク11を共用し、トークスイッチ13の操作に応じて動作モードを切り替えるようにしている。これにより、明瞭度改善処理のためだけにマイクやマイクアンプなどのハードウェアを別途追加する必要がなくなり、既存のナビゲーション装置に音声明瞭度改善機能を搭載する際のコストアップを抑止することができる。
【0038】
また、本実施形態では、音声認識モードの動作中は適応フィルタ5における伝達関数の適応処理を停止させるようにしている。これにより、動作モードの切り替えを行うことによって適応フィルタ5に対するマイク入力音声のレベルが急変しても、その急激なレベル変動によって伝達関数の推定精度が悪影響を受けることはなく、適応アルゴリズムの推定誤差が大きくなるという不都合を回避することができる。
【0039】
以上のように、本実施形態によれば、1つのマイク11およびマイクアンプ12を用いて、明瞭度改善処理と音声認識処理の双方を、性能を落とすことなく同時処理することができる。
【0040】
なお、上記実施形態は、本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその精神、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
【0041】
【発明の効果】
本発明は上述したように、音声認識処理と明瞭度改善処理とで同じ音声入力デバイスを共用し、動作モードを切り替えて何れかの処理を行うようにしているので、明瞭度改善処理のためだけにマイクやマイクアンプなどのハードウェアを別途追加する必要がなくなり、コストアップを抑止することができる。
【0042】
また、本発明の他の特徴によれば、音声認識モードの動作中は明瞭度改善処理における適応フィルタ処理を停止させるようにしているので、モードの切り替えに応じてマイク入力音声のレベルが急変しても、その急激なレベル変動によって伝達関数の推定精度が悪影響を受けることがなく、音声認識用の1つの音声入力デバイスを用いて明瞭度改善処理と音声認識処理との双方を、性能を落とすことなく処理することができる。
【図面の簡単な説明】
【図1】本実施形態によるナビゲーション音声補正装置の構成例を示すブロック図である。
【図2】適応フィルタの構成を示す図である。
【図3】適応フィルタにおける伝達関数の振幅特性を示す図である。
【図4】動作モード切替前後における伝達関数の振幅特性の差分を示す図である。
【図5】トークスイッチが押下されたときの動作を示すフローチャートである。
【図6】適応フィルタの動作を示すフローチャートである。
【図7】従来のナビゲーション音声補正装置の構成を示すブロック図である。
【符号の説明】
4 減算器
5 適応フィルタ
6 ゲイン制御部
7 イコライザ
11 マイク
12 マイクアンプ
13 トークスイッチ
14 モード切替部
15 モード制御部
21 同定用フィルタ
22 音声補正用フィルタ
100 ナビゲーション音声補正装置
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a navigation sound correction device, and is particularly suitable for use in a device for correcting the sound pressure level of a guidance sound of a navigation device according to ambient noise and the like.
[0002]
[Prior art]
2. Description of the Related Art In a navigation device for guiding a vehicle, a current position of the vehicle is detected, map data around the vehicle position is read from a recording medium such as a DVD, a map image is drawn on a display device, and a predetermined position of the map image is displayed. A vehicle position mark (own vehicle position mark) is overlaid on the drawing. Then, as the vehicle moves, the map image is scrolled so that the map information around the vehicle position can be understood at a glance.
[0003]
Such a navigation device has a function of setting a guidance route from a departure point to a destination, a function of displaying a guidance route on a map image, a function of giving a voice guidance of a turning direction at a guidance intersection on the guidance route, and the like. ing. That is, in this type of navigation device, a route with the smallest cost from the departure point to the destination is automatically searched for by using a map data to perform a simulation such as a breadth-first search (BFS) method or a Dijkstra method, and the search is performed. The obtained route is stored as a guidance route.
[0004]
While the vehicle is traveling, the guidance route is displayed on the map image so as to be distinguishable from other roads, and when the vehicle approaches within a predetermined distance from the guidance intersection on the guidance route, an intersection guide map (intersection enlarged view) And an arrow indicating the direction of travel at the intersection) are displayed to indicate which road should be run and in which direction the vehicle should travel at the intersection. Also, if the direction of travel at the intersection is a right turn, voice guidance such as "You are ahead right" is given, and if there is a considerable distance from the current vehicle position to the guidance intersection, "It will be a little while" Voice guidance is provided as appropriate.
[0005]
By the way, the above-mentioned guidance sound of the navigation apparatus (hereinafter referred to as navigation sound) is very audible when there are various noises (engine sound during running, road noise, wind noise, etc.) and car audio output sound. It becomes difficult. To solve such a problem, a system has been proposed in which predetermined signal processing is performed to enhance the clarity of the navigation sound (for example, Japanese Patent Application Laid-Open No. H11-166835).
[0006]
FIG. 7 is a block diagram showing a configuration of the conventional system. As shown in FIG. 7, in the conventional system, the audio sound output from the car speaker 1, the navigation sound output from the monitor speaker 2, and the running noise generated in the vehicle are all input from the microphone 3. The transfer function of the adaptive filter (ADF) 5 and the loudness compensation gain of the gain control unit 6 are variably controlled based on the audio signal input to the microphone, so that the transfer function is always appropriate regardless of the noise level. The navigation sound can be reproduced at the volume or the like.
[0007]
[Problems to be solved by the invention]
However, in the above-mentioned conventional system, it is necessary to use the microphone 3 for inputting audio sound, navigation sound and running noise in order to estimate the noise amount. Further, in this estimating unit, it is necessary to sequentially update the transfer function (filter coefficient) of the adaptive filter 5 in accordance with the amount of noise that is constantly changing in the vehicle interior. Therefore, the microphone 3 must always be in the active state.
[0008]
From the above, considering that the current navigation system is equipped with a function to improve the clarity of navigation voice, it is necessary to separately add hardware such as a microphone and a microphone amplifier for clarity improvement processing, which increases costs. Problem had arisen.
[0009]
The present invention has been made to solve such a problem, and the clarity of navigation sound can be improved by using an existing navigation device without separately adding hardware such as a microphone and a microphone amplifier. The aim is to be able to improve. It is another object of the present invention to realize this without deteriorating the performance of the clarity improvement processing.
[0010]
[Means for Solving the Problems]
In order to solve the above-described problems, in the navigation sound correction device of the present invention, the navigation device originally includes an utterance sound input microphone provided for the speech recognition process, and the navigation sound and the surrounding sound are included in the clarity improvement process. It is also used for inputting sound, and the operation mode is switched to one of the intelligibility improvement processing and the speech recognition processing to use the microphone input voice. Preferably, in the present invention, when the operation mode is switched to the speech recognition processing, control is performed so that the adaptive filter processing in the intelligibility improvement processing is stopped.
[0011]
According to the present invention configured as described above, it is not necessary to separately add hardware such as a microphone and a microphone amplifier only for the intelligibility improvement processing, and an existing navigation device is provided with a function for improving the intelligibility of navigation voice. It is possible to suppress an increase in cost when performing. In addition, the mode switching causes a sudden change in the level of the microphone input sound to the adaptive filter of the intelligibility improvement function. At that time, however, the adaptive filter processing is stopped. Receiving less.
[0012]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings. The navigation sound correction device according to the present embodiment monitors the sound pressure levels of engine noise, road noise, running noise such as wind noise, and audio sounds such as music, and appropriately adjusts the navigation sound according to these sound pressure levels. By giving a gain, the navigation sound can be easily heard.
[0013]
FIG. 1 is a block diagram illustrating a configuration of the navigation sound correction device according to the present embodiment. As shown in FIG. 1, the navigation audio correction device 100 of the present embodiment includes a monitor speaker 2, an adaptive filter (ADF) 5, a gain control unit 6, an equalizer 7, a microphone 11, a microphone amplifier 12, a talk switch 13, a mode switch. And a mode control unit 15.
[0014]
Note that, apart from the navigation sound correcting device 100, an audio sound reproducing device (not shown) and a sound recognition engine 20 are provided. The audio sound reproducing apparatus includes a reproducing unit (not shown) for reproducing various audio sources such as a CD, MD, DVD, and radio broadcast, and a car speaker 1, and an audio reproduced sound is output from the car speaker 1. . Further, the voice recognition engine 20 recognizes the speaker voice input through the microphone, and executes a command corresponding to the speaker voice to the navigation device.
[0015]
The microphone 11 is used for inputting the speaker's voice originally provided for the voice recognition processing of the navigation device, and is also used for the intelligibility improvement processing in the present embodiment. That is, not only the speaker's voice but also the audio sound output from the car speaker 1, the navigation voice output from the monitor speaker 2, and the running noise generated in the vehicle compartment are all input from the same microphone 11. The microphone amplifier 12 amplifies an audio signal input from the microphone 11.
[0016]
The talk switch 13 is a switch for instructing the start of voice recognition processing by utterance. That is, the voice input by utterance is accepted at the timing when the talk switch 13 is operated. The mode switching unit 14 includes a clarity improvement mode in which navigation voice, audio sound, and running noise are input from the microphone 11 to correct the navigation voice, and a voice recognition mode in which speech voice is input from the microphone 11 to perform voice recognition. The operation mode is switched to any one of.
[0017]
In general, the output of the navigation sound is performed in accordance with the current position during traveling, and it is not known at which timing the sound is output. Therefore, in order to improve the intelligibility of the navigation sound output at the undefined timing, the transfer function of the adaptive filter 5 must be constantly updated in accordance with the amount of noise that changes sequentially. Therefore, the mode switching unit 14 always operates the clarity improvement processing as a default operation mode, and switches to the voice recognition mode only when the talk switch 13 is turned on.
[0018]
When the mode is switched to the voice recognition mode, the uttered voice input from the microphone 11 is supplied to the voice recognition engine 20. Thereby, processing corresponding to the utterance command is executed. On the other hand, when the mode is switched to the intelligibility improvement mode, the navigation voice, audio sound, and running noise input from the microphone 11 are supplied to the subtractor 4. The subtracter 4 calculates an error by subtracting the navigation sound output from the adaptive filter 5 from the navigation sound, audio sound, and running noise input from the microphone 11, and extracts only the audio sound and running noise.
[0019]
The adaptive filter 5 includes an identification filter 21 and a voice correction filter 22, as shown in FIG. The identification filter 21 is a filter for identifying an impulse response of the acoustic system (a filter coefficient of the audio correction filter 22), and is an adaptive filter based on an LMS (Least Mean Square) algorithm or an N-LMS (Normalized-LMS) algorithm. Is used. The identification filter 21 operates so that the power of the error e (n) output from the subtractor 4 is minimized to identify the impulse response of the acoustic system.
[0020]
The voice correction filter 22 performs a convolution operation using the filter coefficient w (n) determined by the identification filter 21 and the navigation voice x (n) to be controlled, thereby converting the navigation voice x (n). On the other hand, the same transfer characteristics as those of the equalizer 7 are provided. The filtered navigation sound y (n) output from the sound correction filter 22 is supplied to the subtractor 4, and the error e (n) calculated here is fed back to the identification filter 21.
[0021]
The gain controller 6 converts the navigation sound after the filter control output from the adaptive filter 5 and the navigation sound to be controlled output from the navigation device based on the audio sound and the traveling noise output from the subtractor 4. An optimum gain to be added to the signal is calculated, and the calculated gain value is output to the equalizer 7.
[0022]
The equalizer 7 performs gain correction on the navigation sound. That is, by giving the gain calculated by the gain control unit 6 to the navigation sound input from the navigation device, the navigation sound is corrected. This correction is performed, for example, for each of a plurality of divided frequency bands.
[0023]
The mode control unit 15 controls the mode switching unit 14 according to ON / OFF of the talk switch 13 so as to switch the operation mode between the intelligibility improvement mode and the voice recognition mode. The mode control unit 15 also stops the adaptive filter 5 from adapting the transfer function when switching to the speech recognition mode. Then, at the stage when the speech recognition has been completed (the navigation device has set the flag of recognition end), control is performed so that the calculation of the adaptive filter 5 is restarted.
[0024]
As described above, in the intelligibility improvement mode, the subtractor 4 subtracts the estimated value of the navigation sound obtained by the adaptive filter 5 from the sound (navigation sound, audio sound, running noise) input from the microphone 11. By feeding back the difference value to the adaptive filter 5, a filter coefficient having a transfer function amplitude characteristic as shown in FIG. 3 is always calculated.
[0025]
In this state, when the operation mode is switched from the intelligibility improvement mode to the voice recognition mode in response to the operation of the talk switch 13, the voice level input from the microphone 11 to the subtractor 4 becomes zero. Conversely, when returning from the voice recognition mode to the intelligibility improvement mode, a large-level voice is suddenly input from the microphone 11 to the subtractor 4.
[0026]
As described above, when the operation mode is switched, the difference value calculated by the subtractor 4 fluctuates greatly. At this time, if the calculation of the adaptive filter 5 is continuously performed, the filter coefficient values calculated by the adaptive filter 5 are significantly different or diverge. As a result, the performance of separating navigation sound and surrounding sound (intelligibility improvement performance) is adversely affected.
[0027]
On the other hand, in the present embodiment, the adaptation process of the transfer function by the adaptive filter 5 is stopped during the speech recognition mode, and the adaptation process is restarted when returning to the intelligibility improvement mode. As a result, even if the audio input level to the subtractor 4 fluctuates greatly due to the switching of the operation mode, the transfer function is not estimated by the large fluctuation value at that time. Therefore, it is possible to avoid a disadvantage that the estimation accuracy of the transfer function is deteriorated (that is, the estimation error of the adaptive algorithm is increased).
[0028]
In the speech recognition mode, the adaptive processing of the transfer function by the adaptive filter 5 is temporarily stopped, but the influence of this is small. That is, in the current navigation device, it is recommended to perform the utterance operation “in a natural posture with the steering wheel held” in order to correctly recognize the voice. For this reason, a large change in the amount of ambient noise is unlikely to occur within a few seconds in the voice recognition mode, and there is no large difference in the amplitude characteristics of the transfer function before and after the switching of the operation mode.
[0029]
FIG. 4 is a diagram illustrating a difference between amplitude characteristics of a transfer function obtained before and after switching of the operation mode. In FIG. 4, the horizontal axis indicates frequency, and the vertical axis indicates the difference between transfer functions before and after switching. As shown in FIG. 4, there is no large difference between the amplitude characteristics of the transfer function before and after the switching of the operation mode. Therefore, even if the transfer function adaptation processing is temporarily stopped during the voice recognition mode, the transfer function estimation accuracy hardly deteriorates.
[0030]
FIG. 5 is a flowchart showing the operation when the talk switch 13 is pressed. In FIG. 5, when the talk switch 13 is pressed, the mode control unit 15 stops adaptation processing (update of filter coefficients) of the transfer function in the adaptive filter 5 (step S1). Specifically, a stop control signal is output to adaptive filter 5. Thereafter, the mode control unit 15 controls the mode switching unit 14 to switch the operation mode to the voice recognition mode (Step S2).
[0031]
Next, the navigation device outputs a signal sound to start accepting the input of the uttered voice (step S3), and then executes a voice recognition process (step S4). At the time of this voice recognition processing, cancellation of the voice recognition processing by pressing the talk switch 13 is also accepted. Next, the navigation device determines whether the voice recognition has been completed (step S5). If the voice recognition has not been completed, the voice recognition processing in step S4 is continued.
[0032]
On the other hand, when the voice recognition processing is completed, the mode control unit 15 controls the mode switching unit 14 to switch the operation mode to the intelligibility improvement mode (step S6). At this time, the adaptive processing of the transfer function in the adaptive filter 5 (update of the filter coefficient) is restarted. Specifically, the output of the stop control signal is stopped. After that, the command whose voice has been recognized in step S4 is executed (step S7). The reason why the operation mode is switched before the command is executed is to start a time-consuming transfer function calculation as soon as possible.
[0033]
FIG. 6 is a flowchart showing the operation of the adaptive filter 5. FIG. 6 shows an example in which the LMS algorithm is applied to the adaptive filter 5. In FIG. 6, the adaptive filter 5 includes data necessary for calculation (a navigation sound x (n) to be controlled in the intelligibility improvement processing, a subtractor 4) in response to an interrupt at a predetermined time interval 1 / Fs. The error e (n) or the like fed back from the above is fetched (step S11).
[0034]
Then, in the voice correction filter 22 of FIG. 2, a convolution operation is performed using the filter coefficient w (n) determined by the identification filter 21 and the input navigation voice x (n) to be controlled. Thus, the navigation voice y (n) after the filter control is obtained (step S12).
[0035]
Next, the adaptive filter 5 determines whether the talk switch 13 is turned on, that is, whether it is in the voice recognition mode (step S13). During the voice recognition mode, a stop control signal (flag) is sent from the mode control unit 15 to the adaptive filter 5, so that the state of the talk switch 13 can be determined by looking at this flag.
[0036]
If the talk switch 13 is not active, the filter coefficient is updated in the identification filter 21 as usual (step S15). On the other hand, when the talk switch 13 is active, the interrupt processing ends without performing the update processing of the filter coefficient in the identification filter 21. That is, during the speech recognition mode, the filter coefficient of the adaptive filter 5 is handled as w (n + 1) = w (n), and only the convolution operation is performed during that time.
[0037]
As described above in detail, in the present embodiment, the microphone 11 is shared between the voice recognition process and the intelligibility improvement process, and the operation mode is switched according to the operation of the talk switch 13. As a result, it is not necessary to separately add hardware such as a microphone and a microphone amplifier only for the intelligibility improvement processing, and it is possible to suppress an increase in cost when the voice intelligibility improvement function is installed in an existing navigation device. .
[0038]
Further, in the present embodiment, during the operation in the voice recognition mode, the adaptive processing of the transfer function in the adaptive filter 5 is stopped. Thus, even if the level of the microphone input sound to the adaptive filter 5 changes abruptly by switching the operation mode, the abrupt level fluctuation does not adversely affect the estimation accuracy of the transfer function. Can be avoided.
[0039]
As described above, according to the present embodiment, both the intelligibility improvement processing and the voice recognition processing can be performed simultaneously without deteriorating the performance using one microphone 11 and one microphone amplifier 12.
[0040]
Note that the above-described embodiment is merely an example of a concrete example for carrying out the present invention, and the technical scope of the present invention should not be interpreted in a limited manner. That is, the present invention can be embodied in various forms without departing from the spirit or main features thereof.
[0041]
【The invention's effect】
As described above, the present invention shares the same voice input device for the voice recognition process and the intelligibility improvement process, and switches the operation mode to perform any process. This eliminates the need to separately add hardware such as a microphone and a microphone amplifier, thereby suppressing an increase in cost.
[0042]
According to another feature of the present invention, the adaptive filter processing in the intelligibility improvement processing is stopped during the operation in the voice recognition mode, so that the level of the microphone input voice suddenly changes according to the mode switching. However, the abrupt level fluctuation does not adversely affect the estimation accuracy of the transfer function, and the performance of both the intelligibility improvement processing and the speech recognition processing is reduced by using one speech input device for speech recognition. Can be processed without the need.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration example of a navigation sound correction device according to an embodiment.
FIG. 2 is a diagram illustrating a configuration of an adaptive filter.
FIG. 3 is a diagram illustrating amplitude characteristics of a transfer function in an adaptive filter.
FIG. 4 is a diagram illustrating a difference between amplitude characteristics of a transfer function before and after switching operation modes.
FIG. 5 is a flowchart illustrating an operation when a talk switch is pressed.
FIG. 6 is a flowchart showing an operation of the adaptive filter.
FIG. 7 is a block diagram showing a configuration of a conventional navigation sound correction device.
[Explanation of symbols]
4 Subtractor 5 Adaptive filter 6 Gain control unit 7 Equalizer 11 Microphone 12 Microphone amplifier 13 Talk switch 14 Mode switching unit 15 Mode control unit 21 Identification filter 22 Voice correction filter 100 Navigation voice correction device

Claims (2)

ナビゲーション装置の案内音声の音圧レベルと、この案内音声の聴取位置において聴取可能な周囲音の音圧レベルとに基づいて、上記案内音声の明瞭度を改善するように成されたナビゲーション音声補正装置であって、
上記案内音声の明瞭度改善処理に用いる上記案内音声および上記周囲音と、音声認識処理に用いる発話音声とを同じ音声入力デバイスから入力する音声入力手段と、
上記明瞭度改善処理と上記音声認識処理との何れかに動作モードを切り替えるモード切替手段とを備えたことを特徴とするナビゲーション音声補正装置。
A navigation sound correction device configured to improve the clarity of the guidance sound based on the sound pressure level of the guidance sound of the navigation device and the sound pressure level of the ambient sound that can be heard at the listening position of the guidance sound. And
Voice input means for inputting the guidance voice and the surrounding sound used for the intelligibility improvement processing of the guidance voice and the uttered voice used for the voice recognition processing from the same voice input device;
A navigation sound correction device comprising: a mode switching unit that switches an operation mode to one of the clarity improvement processing and the speech recognition processing.
上記動作モードが上記音声認識処理に切り替えられているときは、上記明瞭度改善処理における適応フィルタ処理を停止させるように制御する制御手段を備えたことを特徴とする請求項1に記載のナビゲーション音声補正装置。2. The navigation voice according to claim 1, further comprising control means for controlling to stop the adaptive filter processing in the clarity improvement processing when the operation mode is switched to the voice recognition processing. Correction device.
JP2002248016A 2002-08-28 2002-08-28 Navigation voice compensating device Pending JP2004085963A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002248016A JP2004085963A (en) 2002-08-28 2002-08-28 Navigation voice compensating device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002248016A JP2004085963A (en) 2002-08-28 2002-08-28 Navigation voice compensating device

Publications (1)

Publication Number Publication Date
JP2004085963A true JP2004085963A (en) 2004-03-18

Family

ID=32055496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002248016A Pending JP2004085963A (en) 2002-08-28 2002-08-28 Navigation voice compensating device

Country Status (1)

Country Link
JP (1) JP2004085963A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006023372A (en) * 2004-07-06 2006-01-26 Denso Corp Musical piece playback apparatus
JP2009015209A (en) * 2007-07-09 2009-01-22 Alpine Electronics Inc Speech articulation improving system and speech articulation improving method
JP2009021796A (en) * 2007-07-11 2009-01-29 Panasonic Corp Electronic apparatus
JP2009107438A (en) * 2007-10-29 2009-05-21 Fujitsu Ten Ltd Sound control device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05323993A (en) * 1992-03-16 1993-12-07 Toshiba Corp Speech interactive system
JPH09186540A (en) * 1995-12-28 1997-07-15 Fujitsu Ten Ltd Automatic sound volume adjustment device in response to noise sound feeling
JP2001094370A (en) * 1999-09-27 2001-04-06 Alpine Electronics Inc Audio input/output system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05323993A (en) * 1992-03-16 1993-12-07 Toshiba Corp Speech interactive system
JPH09186540A (en) * 1995-12-28 1997-07-15 Fujitsu Ten Ltd Automatic sound volume adjustment device in response to noise sound feeling
JP2001094370A (en) * 1999-09-27 2001-04-06 Alpine Electronics Inc Audio input/output system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006023372A (en) * 2004-07-06 2006-01-26 Denso Corp Musical piece playback apparatus
JP2009015209A (en) * 2007-07-09 2009-01-22 Alpine Electronics Inc Speech articulation improving system and speech articulation improving method
JP2009021796A (en) * 2007-07-11 2009-01-29 Panasonic Corp Electronic apparatus
JP4522439B2 (en) * 2007-07-11 2010-08-11 パナソニック株式会社 Electronics
JP2009107438A (en) * 2007-10-29 2009-05-21 Fujitsu Ten Ltd Sound control device

Similar Documents

Publication Publication Date Title
JP4583781B2 (en) Audio correction device
JPH11166835A (en) Navigation voice correction device
JP6653957B2 (en) Electronic device, noise reduction program, and noise reduction method
JP4513610B2 (en) In-vehicle device and method for controlling in-vehicle device
CN106911982B (en) Externally coupled speaker system
WO2007123172A1 (en) Acoustic reproduction device
JP2004228937A (en) Acoustic correction system, acoustic correction program, acoustic correction method and acoustic correction device
JP2007208828A (en) Vehicular audio input controller
JPWO2016013667A1 (en) Echo canceller
JP5115944B2 (en) Voice recognition device
JP2004085963A (en) Navigation voice compensating device
JP3877271B2 (en) Audio cancellation device for speech recognition
JP2000231399A (en) Noise reducing device
JP3257832B2 (en) Noise reduction circuit for speech recognition device
JP5105912B2 (en) Speech intelligibility improving apparatus and noise level estimation method thereof
JP4187615B2 (en) Output sound correction device
JP6632246B2 (en) Noise reduction device, noise reduction method, and in-vehicle system
JP4166000B2 (en) Voice recognition device
JP2001095081A (en) Guiding voice correcting device
JPH0787587A (en) On-vehicle audio signal processor
JP2001024459A (en) Audio device
JP2014181988A (en) Audio apparatus
JP4313294B2 (en) Audio output device
JP4235062B2 (en) Output sound processing system
WO2022059214A1 (en) In-vehicle device and in-vehicle system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050328

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071009

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080422