JP4333369B2 - 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置 - Google Patents

雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置 Download PDF

Info

Publication number
JP4333369B2
JP4333369B2 JP2004002387A JP2004002387A JP4333369B2 JP 4333369 B2 JP4333369 B2 JP 4333369B2 JP 2004002387 A JP2004002387 A JP 2004002387A JP 2004002387 A JP2004002387 A JP 2004002387A JP 4333369 B2 JP4333369 B2 JP 4333369B2
Authority
JP
Japan
Prior art keywords
audio signal
audio
signal
noise
noise removal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004002387A
Other languages
English (en)
Other versions
JP2005195895A (ja
Inventor
まなぶ 大塚
一郎 赤堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2004002387A priority Critical patent/JP4333369B2/ja
Priority to US11/023,553 priority patent/US8010354B2/en
Priority to DE200510000818 priority patent/DE102005000818A1/de
Priority to FR0500119A priority patent/FR2864860B1/fr
Priority to CN2006101693648A priority patent/CN1971709B/zh
Priority to CN200510003838.7A priority patent/CN1637857B/zh
Publication of JP2005195895A publication Critical patent/JP2005195895A/ja
Application granted granted Critical
Publication of JP4333369B2 publication Critical patent/JP4333369B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3608Destination input or retrieval using speech input, e.g. using speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Traffic Control Systems (AREA)
  • Navigation (AREA)

Description

本発明は、マイクロフォンから入力される音声信号から、オーディオ機器が再生する音響についての雑音成分を除去する雑音除去装置、及び、それを内蔵する音声認識装置、並びに、その音声認識装置を備えるカーナビゲーション装置に関する。
従来より、利用者が発した音声をマイクロフォンで集音し、これを予め認識語として記憶された音声のパターンと比較し、一致度の高い認識語を利用者が発声した語彙であると認識する音声認識装置が知られている。この種の音声認識装置は、例えばカーナビゲーション装置などに組み込まれる。
音声認識装置の音声認識率は、マイクロフォンから入力される音声信号に含まれる雑音成分の量によって左右されることが知られているが、自動車等の車両内においては、車両に搭載されたオーディオ機器の動作時に、そのオーディオ機器のスピーカにて再生中の音楽等が雑音として利用者の音声と共にマイクロフォンで集音されてしまう。このため、従来では、音声認識の際にオーディオ機器をミュートに設定し、音楽等がマイクロフォンに入力されないようにしていた(例えば、非特許文献1参照)。
しかしながら、このような構成の従来装置では、音声認識の際に一時的に音楽等の再生が中断されてしまうため、利用者に不満が及ぶ可能性が高かった。そこで、近年では、スピーカに入力されるオーディオ信号を取得し、これに基づき、マイクロフォンから得た音声信号に含まれる雑音成分を推定し、その雑音成分を音声信号から除去する雑音除去装置、を音声認識装置に設けることが考えられている。
雑音除去装置としては、雑音成分の推定方法に、LMS(Least Mean Squar)アルゴリズムを用いたものが知られている。この種の雑音除去装置では、オーディオ機器のスピーカに入力されるオーディオ信号を取得し、そのオーディオ信号を適応フィルタにてフィルタリングすることで、音声信号から雑音成分を除去するための雑音除去信号を生成し、この雑音除去信号に基づいて、マイクロフォンから取得した音声信号に含まれる雑音成分を除去する。
また、この雑音除去装置は、雑音除去後の音声信号に基づき、NLMS法(Normalized-LMS法、別名、学習同定法)などを用いて、適応フィルタの特性(フィルタ係数)を変更するフィルタ学習部を備えており、このフィルタ学習部の繰返し動作によって、音声信号に含まれる雑音成分が雑音除去信号により適切に除去されるようにする。
車両に搭載されるオーディオ機器としては、ステレオ再生機能を有するオーディオ機器(以下、ステレオ・オーディオ機器ともいう。)が広く普及しているため、車両用の雑音除去装置では、音楽等がステレオ再生されることを前提として、その音楽等がマイクロフォンにて集音されることにより発生する雑音成分を適切に除去できるようにすることが好ましい。しかしながら、上述した雑音除去装置を、単にステレオ・オーディオ機器用に設計変更しただけでは、音声信号から複数チャンネルの全雑音成分を適切に除去することができないといった問題があった。
ステレオ・オーディオ機器用の雑音除去装置の構成例としては、例えば、各チャンネル毎に、適応フィルタと上記フィルタ学習部とを設けることが考えられるが(例えば特許文献1図25参照)、このような構成では、個々のチャンネルに対応するフィルタ学習部が、他のチャンネルの雑音成分が残存する雑音除去後の音声信号に基づいて、フィルタ係数を更新するため、学習プロセスの相互干渉が起こり、各チャンネルのフィルタ学習部において、フィルタ係数の誤学習が生じる。このため、上記構成の雑音除去装置では、音声信号から複数のチャンネルの全雑音成分を適切に除去することができないのである。
このような問題から、特許文献1記載の音声認識装置では、オーディオ機器のスピーカに入力される各チャンネルのオーディオ信号を取得し、これらをモノラル信号に変換し、そのモノラル信号に基づいて雑音成分を推定し、音声信号から雑音成分を除去するようにしている。
また、特許文献2記載の音響エコーキャンセル方法では、オーディオ機器のスピーカに入力される各チャンネル毎のオーディオ信号を非線形変換することにより、マイクロフォンにて集音されるオーディオ機器の再生音について、チャンネル間の相関関係を低減し、各チャンネルに対応するフィルタ学習部において、フィルタ係数の誤学習が行われないようにしている。
特開2001−100785号公報 特開平10−190848号公報 "発表ニュースリリース「カーAV&ナビゲーションシステム’99夏モデル5機種発売"、[online]、平成11年5月18日、富士通テン株式会社、[平成15年10月16日検索]、インターネット<URL: HYPERLINK "http://www.fujitsu-ten.co.jp/release/1999/0518.html" http://www.fujitsu-ten.co.jp/release/1999/0518.html>
しかしながら、特許文献1記載の音声認識装置では、ステレオ再生された音楽等に関する雑音成分を、オーディオ機器から得たオーディオ信号のモノラル信号に基づいて推定するため、推定誤差が大きく、十分な精度で雑音成分をマイクロフォンの入力信号から除去することができないという問題があった。
また、特許文献2記載の音響エコーキャンセル方法では、各チャンネルのオーディオ信号を非線形変換し、その変換後のオーディオ信号を用いてスピーカから音を発生させるため、音の品質が劣化するといった問題があった。従って、このような音響エコーキャンセル方法を、音楽等の再生を主な用途とするオーディオ機器についての雑音除去装置に適用すると、音楽等の品質が劣化し、利用者に不満が及ぶ可能性があった。
本発明は、こうした問題に鑑みなされたものであり、音響の多チャンネル再生を行うオーディオ機器から各チャンネルのオーディオ信号を取得し、各チャンネルのオーディオ信号に基づき、マイクロフォンから入力される音声信号から、オーディオ機器の再生音に関する雑音成分を除去する雑音除去装置において、雑音の除去性能を向上させることを第一の目的とする。また、このような雑音除去性能に優れた雑音除去装置を用いて、利便性の高い音声認識装置及びカーナビゲーション装置を提供することを第二の目的とする。
かかる目的を達成するためになされた請求項1記載の発明は、音響の多チャンネル再生を行うオーディオ機器から各チャンネルのオーディオ信号を取得し、それら各チャンネルのオーディオ信号に基づいて、マイクロフォンから入力される音声信号から、オーディオ機器の再生音に関する雑音成分を除去する雑音除去装置であって、除去出力手段と、変換手段と、各チャンネル毎の雑音除去信号生成手段と、を備えることを特徴とする。
各雑音除去信号生成手段は、濾波手段を備えており、オーディオ信号取得手段がオーディオ機器から取得した自チャンネルのオーディオ信号を、濾波手段にて、予め設定されたフィルタ係数に従い濾波し、雑音成分を上記音声信号から除去するための雑音除去信号を生成する。
除去出力手段は、これら各チャンネルの雑音除去信号生成手段が生成した雑音除去信号を用いて、マイクロフォンから入力された音声信号に含まれる雑音成分を除去し、その雑音除去後の音声信号を出力する。
また、変換手段は、除去出力手段が出力する音声信号を、非線形変換する構成にされている。上記各雑音除去信号生成手段は、係数更新手段を備えており、オーディオ信号取得手段がオーディオ機器から取得した自チャンネルのオーディオ信号と、変換手段による非線形変換後の音声信号とに基づき、係数更新手段にて、濾波手段に設定されたフィルタ係数を更新する。
このように構成された請求項1記載の雑音除去装置では、除去出力手段から出力される雑音除去後の音声信号を、非線形変換し、その非線形変換後の音声信号を用いて各チャンネル毎に用意された濾波手段のフィルタ係数を、そのチャンネルに対応する係数更新手段にて更新するため、各係数更新手段間で相互干渉が起こりにくく、各係数更新手段においてフィルタ係数の誤学習が起こりにくい。
即ち、各チャンネルの係数更新手段におけるフィルタ係数の学習動作については、従来、自チャンネル以外の他のチャンネルの雑音成分によって大きく影響を受けていたが、本発明の雑音除去装置によれば、非線形変換後の音声信号をフィルタ係数の学習に用いるので、その影響を小さくすることができ、他チャンネルの雑音成分や他チャンネルの係数更新手段の挙動により、各係数更新手段においてフィルタ係数の誤学習が生じるのを抑制することができるのである。
従って、本発明によれば、オーディオ機器によって多チャンネル再生(ステレオ再生)された音楽等の雑音成分が重畳された上記音声信号から、音楽等の雑音成分を、従来より適切に除去することができ、雑音除去装置の雑音除去性能が向上する。
尚、上述の雑音除去装置は、具体的に次のように構成することができる。
即ち、濾波手段は、自身に予め設定されたフィルタ係数W[k]と、オーディオ信号取得手段が取得した自チャンネルのオーディオ信号X(t)とを、関係式(1)に従い畳み込み演算することにより、オーディオ信号X(t)を濾波して、雑音除去信号C(t)を生成する構成にすることができる
Figure 0004333369
また、係数更新手段は、除去出力手段が出力する音声信号U(t)を非線形変換することにより変換手段が生成した非線形変換後の音声信号f(U(t))と、オーディオ信号取得手段が取得した自チャンネルのオーディオ信号X(t)と、濾波手段に既に設定されているフィルタ係数W[k]と、に基づいて、予め設定された定数α,βを含む関係式(2)及び関係式(3)に従い、フィルタ係数F[k]を算出し、このフィルタ係数F[k]を濾波手段に対して設定することにより、フィルタ係数W[k]を更新する構成にすることができる。尚、定数Kは、タップ数を表す2以上の整数である。又、変数tは、時間を表す変数であり、整数値をとる。
Figure 0004333369
また、上述の変換手段は、請求項1記載のように、非線形関数であるtanh関数に上記音声信号U(t)を代入して上記非線形変換を行う構成にすることができる。その他、上述の雑音除去装置における変換手段は、請求項2記載のように、非線形関数であるsign関数を用いて非線形変換を行う構成にされてもよいし、請求項3記載のように、非線形関数である関数g(x)を用いて非線形変換を行う構成にされてもよい。
Figure 0004333369
但し、変数mは、1より大きい正の実数である。
非線形関数の種類によって、当該装置の雑音除去性能及び当該装置の変換手段にかかる処理負荷は変化するが、tanh関数を用いる請求項1記載の雑音除去装置によれば、変換手段にかかる処理負荷を抑えて、雑音除去性能を十分に高めることができる。
また、請求項2記載の雑音除去装置のようにsign関数を用いると、請求項1記載の雑音除去装置と比較して、雑音除去性能が低下するが、反面、変換手段にかかる処理負荷を低減することができる。その他、請求項3記載の雑音除去装置のように関数g(x)を用いると、請求項1記載の雑音除去装置と同程度の雑音除去性能を得つつ、処理負荷を低減することができる。
尚、本発明の雑音除去装置においては、上述したもの以外の非線形関数を用いることができる。この非線形関数の選択は、周知の独立成分分析(ICA)の知見に基づいて行うことができる。独立成分分析については、例えば、『A.J.Bell,T.J.Sejnowski,"An information-maximisation approach to blind separation and blind deconvolution",Neural Computation,7(6),pp.1129-1159,1995』、『H.Mathis,S.Douglas,"On optimal and universal nonlinearities for blind signal separation",Proc.of Intnl.Conf.on Acoustics,Speech and Signal Processing(ICASSP),2001』等の文献を参考にされたい。
以上には、請求項1〜請求項3記載の雑音除去装置について説明したが、これらは音声認識装置に組み込むことができる。請求項4記載の音声認識装置は、請求項1〜請求項3のいずれかに記載の雑音除去装置と、その雑音除去装置より得られる雑音除去後の音声信号に基づき、マイクロフォンに入力された利用者の音声を認識する音声認識手段と、を備えるものである。
請求項4記載の音声認識装置によれば、高い雑音除去能力を有する雑音除去装置によって、音声信号に含まれる雑音成分を除去し、その雑音除去後の音声信号を用いて、マイクロフォンに入力された利用者の音声を認識するので、音声認識率が従来と比べて格段に向上する。
また、従来装置では、オーディオ信号が雑音成分として音声信号に重畳されると、音声認識率が低下することから、音声認識時には一時的にオーディオ機器をミュートに設定していたが、本発明の音声認識装置によれば、オーディオ機器をミュートに設定することなく、音声認識を正確に行うことができる。従って、本発明(請求項4)によれば、音声認識時に音楽等の再生が一時的に中断されることによる利用者の不満を解消することができる。
また、請求項4記載の音声認識装置を、カーナビゲーション装置に組み込めば、車両の運転者等がリモートコントローラを用いずにカーナビゲーション装置を正確に操作することができるようになる。従って、このように構成された請求項5記載のカーナビゲーション装置によれば、装置の操作性が向上する。
以下に本発明の実施例について、図面とともに説明する。図1は、本発明が適用されたカーナビゲーション装置1の概略構成を表すブロック図である。
本実施例のカーナビゲーション装置1は、マイクロフォン3及び車載オーディオ機器5に接続された音声認識装置10と、CPUやメモリ41等を備えモニタ7の表示制御やその他の当該装置各部を統括制御する制御部40と、オーディオ機器5のスピーカSR,SLに接続され、制御部40からの指令信号に従って音声信号を生成しスピーカSR,SLに出力する音声生成部50と、を備える。
このカーナビゲーション装置1は、操作スイッチ類(PTT(Push to Talk)スイッチ9等)から入力される指令信号に従い、制御部40にて各種処理を実行する。カーナビゲーション装置1の制御部40が実行する処理としては、目的地までの経路探索・案内や、周辺施設案内、モニタ7に表示する道路地図の地域・スケール変更など、周知のカーナビゲーション装置が実行する処理が挙げられる。その他、当該カーナビゲーション装置1の制御部40は、後述する音声認識関連処理(図6参照)を実行する。
オーディオ機器5は、音響の多チャンネル再生機能(ステレオ再生機能)を有し、オーディオ機器本体部6と、チャンネル毎のスピーカSR,SLと、を備える。
オーディオ機器本体部6は、スピーカSR,SLから出力される音響の音量を調節するための音量調節部6aを備えており、オーディオ機器本体部6組付の操作パネル(図示せず)や、カーナビゲーション装置1の制御部40から入力される指令信号に従って、音量調節部6aを制御し、スピーカSR,SLから出力される音響の音量を調節する。尚、オーディオ機器本体部6から出力される各チャンネルのオーディオ信号は、そのチャンネルに対応するスピーカSR,SLと、音声認識装置10に入力される。
音声認識装置10は、マイクロフォン3から入力される音声信号をアナログ−ディジタル変換するA/D変換器11と、オーディオ機器5から入力されるLチャンネルのオーディオ信号をアナログ−ディジタル変換するA/D変換器13と、オーディオ機器5から入力されるRチャンネルのオーディオ信号をアナログ−ディジタル変換するA/D変換器15と、オーディオキャンセラ20と、音声認識部30と、を備える。
また、オーディオキャンセラ20は、図2に示すように、加算部21と、上記各チャンネル毎の適応フィルタ23L,23R及びフィルタ学習部25L,25R並びに非線形変換部27L,27Rと、を備える。尚、図2は、オーディオキャンセラ20の概略構成を表した機能ブロック図である。
オーディオキャンセラ20が備える適応フィルタ23Lは、端子S1を介してA/D変換器13から入力されるディジタル変換後のLチャンネルのオーディオ信号XL(t)と、予め設定されたフィルタ係数WL[k]と、を式(5)に従い畳み込み演算することによって、オーディオ信号XL(t)をフィルタ係数WL[k]でフィルタリング(濾波)し、マイクロフォン3から入力された音声信号から、スピーカSLにて出力された音響に関する雑音成分を除去するための雑音除去信号UL(t)を生成する。尚、ここで用いる変数kは、1≦k≦Kを満足する整数値をとる。また、定数Kはタップ数を表すものであり、2以上の整数値をとる。その他、変数tは、サンプリング周期Tを単位とする時間変数であり、整数値をとる。
Figure 0004333369
一方、適応フィルタ23Rは、端子S3を介してA/D変換器15から入力されるディジタル変換後のRチャンネルのオーディオ信号XR(t)と、予め設定されたフィルタ係数WR[k]と、を式(6)に従い畳み込み演算することによって、オーディオ信号XR(t)をフィルタ係数WR[k]でフィルタリング(濾波)し、マイクロフォン3から入力された音声信号から、スピーカSRにて出力された音響に関する雑音成分を除去するための雑音除去信号UR(t)を生成する。
Figure 0004333369
また、加算部21は、端子S2を介してA/D変換器11から入力されるディジタル変換後の音声信号XM(t)と、適応フィルタ23Lから出力される雑音除去信号UL(t)と、適応フィルタ23Rから出力される雑音除去信号UR(t)と、を加算して、スピーカSL,SRにて出力された音響に関する雑音成分を、音声信号XM(t)から除去し、雑音除去後の音声信号U(t)を出力する。
U(t)=XM(t)+UL(t)+UR(t) …式(7)
尚、本実施例では、上記信号XM(t),XL(t),XR(t),UL(t),UR(t),U(t)の取り得る値が、−1以上1以下の実数であるとする。
非線形変換部27L,27Rは、加算部21が出力する上記雑音除去後の音声信号U(t)を取得し、これを非線形関数f(x)に代入して非線形変換し、その非線形変換後の音声信号f(U(t))を出力する。尚、図3は、この非線形変換部27L,27Rで用いられる非線形関数f(x)の例を示した図である。図3(a)は、y=f(x)=tanh(a・x)を示したグラフであり、図3(b)は、y=f(x)=sign(x)を示したグラフである。尚、sign(x)は、xが正の実数であるときに値1をとり、xが負の実数であるときに値−1をとり、xが0であるときに値0をとる関数である。また、図3(c)は、y=f(x)=g(x)を示したグラフである(式(4)参照)。
フィルタ学習部25Lは、この非線形変換部27Lから出力される非線形変換後の音声信号f(U(t))を取得し、この信号f(U(t))と、A/D変換器13から入力されるディジタル変換後のLチャンネルのオーディオ信号XL(t)と、既に適応フィルタ23Lに設定されているフィルタ係数WL[k]と、に基づいて、式(8)に従い、次に適応フィルタ23Lに対して設定すべきフィルタ係数FL[k]を算出する。
Figure 0004333369
この後、フィルタ学習部25Lは、算出したフィルタ係数FL[k]を、既に設定されているWL[k]に代えて、適応フィルタ23Lに設定し、フィルタ係数WL[k]を更新する。
同様に、フィルタ学習部25Rは、非線形変換部27Rから出力される非線形変換後の音声信号f(U(t))を取得し、この信号f(U(t))と、A/D変換器15から入力されるディジタル変換後のRチャンネルのオーディオ信号XR(t)と、既に適応フィルタ23Rに設定されているフィルタ係数WR[k]と、に基づいて、式(10)に従い、次に適応フィルタ23Rに対して設定すべきフィルタ係数FR[k]を算出する。
Figure 0004333369
この後、フィルタ学習部25Rは、算出したフィルタ係数FR[k]を、既に設定されているWR[k]に代えて、適応フィルタ23Rに設定し、フィルタ係数WR[k]を更新する。
以上に、オーディオキャンセラ20の基本構成について説明したが、次にオーディオキャンセラ20が実行する処理全体の流れを説明することにする。図4は、上述した構成のオーディオキャンセラ20が実行する雑音除去処理を表すフローチャートである。この雑音除去処理は、当該カーナビゲーション装置1の起動時若しくは、オーディオ機器5の起動時に実行される。
オーディオキャンセラ20は、まず最初に初期設定を行い、フィルタ係数WL[k],WR[k]を初期値に設定する(S110)。その後、オーディオキャンセラ20は、A/D変換器11から音声信号XM(t)を取得し、A/D変換器13からLチャンネルのオーディオ信号XL(t)を取得し、A/D変換器15からRチャンネルのオーディオ信号XR(t)を取得する(S120)。そして、式(5)に従い雑音除去信号UL(t)を生成し(S130)、式(6)に従い雑音除去信号UR(t)を生成する(S140)。
この後、オーディオキャンセラ20は、音声信号XM(t)に、雑音除去信号UL(t)と雑音除去信号UR(t)とを加算して、音声信号U(t)を生成する(S150)。また、Lチャンネルの過去K・T時間分のオーディオ信号の振幅の平均値normLを算出し(S160)、Rチャンネルの過去K・T時間分のオーディオ信号の振幅の平均値normRを算出する(S170)。
Figure 0004333369
そして、算出したLチャンネルのオーディオ信号の振幅の平均値normLが所定の閾値ALより大きいか否か判断し、normL>ALであると判断すると(S180でYes)、第一フィルタ学習処理(図5(a)参照。詳細後述)を実行し(S190)、その処理後、S200に移行する。一方、normL≦ALであると判断すると(S180でNo)、第一フィルタ学習処理を実行することなく、S200に移行する。
S200では、算出したRチャンネルのオーディオ信号の振幅の平均値normRが所定の閾値ARより大きいか否か判断し、normR>ARであると判断すると(S200でYes)、第二フィルタ学習処理(図5(b)参照。詳細後述)を実行し(S210)、その処理後、S220に移行する。一方、normR≦ARであると判断すると(S200でNo)、第二フィルタ学習処理を実行することなく、S220に移行する。
S220では、制御部40から終了指令信号が入力されているか否か判断し、終了指令信号が入力されていると判断すると、当該雑音除去処理を終了し、終了指令信号が入力されていないと判断すると、S120に処理を戻して、最新の信号XM(t),XL(t),XR(t)を取得し、上述したS120からS220までのステップを再度実行する。
図5(a)は、オーディオキャンセラ20が実行する第一フィルタ学習処理を表すフローチャートである。第一フィルタ学習処理において、オーディオキャンセラ20は、式(9)に従い学習レートαLを算出し(S191)、式(8)に従いフィルタ係数FL[k]を算出する(S193)。その後、フィルタ係数FL[k]を、次回のS130で用いるフィルタ係数WL[k]に設定して(S195)、当該第一フィルタ学習処理を終了する。
また、図5(b)は、オーディオキャンセラ20が実行する第二フィルタ学習処理を表すフローチャートである。第二フィルタ学習処理を実行すると、オーディオキャンセラ20は、式(11)に従い学習レートαRを算出し(S211)、式(10)に従いフィルタ係数FR[k]を算出する(S213)。そして、フィルタ係数FR[k]を、次回のS140で用いるフィルタ係数WR[k]に設定して(S215)、当該第二フィルタ学習処理を終了する。
このように構成されたオーディオキャンセラ20が生成した雑音除去後の音声信号U(t)は、端子S0を介して、音声認識部30に入力される。
音声認識部30は、制御部40から入力される動作開始指令信号に従い動作を開始し、オーディオキャンセラ20から所定期間音声信号U(t)を取得し、取得した所定期間分の音声信号U(t)を音響分析し、音声信号U(t)の特徴量(例えばケプストラム)を得る。尚、音声信号U(t)を取得する上記所定期間を、以下では、音声認識対象区間と表現する。
その後、音声認識部30は、上記特徴量を、周知の技法を用いて、自身が備える図示しない音声辞書に登録された音声パターンと比較し、一致度の高い音声パターンに対応する語彙を、音声認識対象区間に利用者が発声した語彙であると認識して、その認識結果を制御部40に入力する。
また、音声認識部30は、パワー算出部31を備えており、このパワー算出部31によって、音声認識対象区間において利用者が発した音声のパワー(音圧の二乗の時間平均)を算出する構成にされている。このパワー算出部31は、音声認識が行われる度に、音声信号U(t)に基づき算出した音声認識対象区間における音声のパワーP1(z)を、制御部40に入力する。
図6は、制御部40が実行する音声認識関連処理を表すフローチャートである。制御部40は、カーナビゲーション装置1が起動されると、当該カーナビゲーション装置1がオフされるまで、繰返し音声認識関連処理を実行する。
音声認識関連処理を実行すると、制御部40は、PTTスイッチ9から音声認識開始指令信号が入力されるまで待機し、PTTスイッチ9から音声認識開始指令信号が入力されたと判断すると(S310でYes)、ビープ音の生成指令信号を音声生成部50に入力して、スピーカSL,SRからビープ音を出力させる(S320)。その後、制御部40は、オーディオ機器本体部6に音響(音楽等)の再生音量を現在の音量からγ倍するように要求し、オーディオ機器本体部6に、スピーカSR,SLから出力される音響の音量を現在の値からγ倍に変更させる(S330)。
また、制御部40は、音声認識部30に対して動作開始指令信号を入力して、音声認識部30を作動させる(S340)。その後、音声認識部30による音声認識が終了するまで待機し、音声認識が終了したと判断すると(S350でYes)、オーディオ機器5の再生音量を、元の設定値に変更する(S360)。即ち、制御部40は、オーディオ機器5に対してS330での要求によりγ倍させた音量を1/γ倍させて、元の音量に変更させる。その後、制御部40は、音声認識部30から得た認識結果に基づいて、利用者から発せられマイクロフォン3に入力された音声に従う処理を実行する(S370)。
また、制御部40は、今回の音声認識対象区間内に、利用者が発した音声のパワーに関する上記算出値P1(z)を音声認識部30から取得する(S380)。そして、この値P1(z)を、メモリ41に記憶された履歴データファイルに追加書込する(S390)。尚、変数zは、音声認識回数を表す変数である。
この後、制御部40は、メモリ41に記憶された履歴データファイル内に少なくともS回分の算出値P1が書き込まれているか否か判断し(S400)、S回分の算出値P1が書き込まれていないと判断すると(S400でNo)当該音声認識関連処理を終了し、S回分の算出値P1が書き込まれていると判断すると(S400でYes)、S410に移行する。
そして、今回の算出値P1(z)を含む過去S回分の算出値P1(z),P1(z−1),P1(z−2),…P1(z−S+1)の平均値P0(z)を算出し(S410)、その算出値P0(z)をメモリ41に書き込む(S420)。
更に、制御部40は、メモリ41に書き込まれた算出値P0(z)と、予め設定された評価基準許容上限値PUPと、予め設定された評価基準許容下限値PDOWNと、に基づき、γ’を算出する(S440)。
γ’=h(γ,P0(z),PUP,PDOWN) …式(14)
尚、γ’算出の際には、上記γと、P0(z)と、PUP及びPDOWNと、を変数にもつ所定の関数hが用いられる。但し、関数hは、値PUPと比較して値P0(z)が大きい場合に、γより小さい値をとり、値PDOWNと比較して値P0(z)が小さい場合に、γより大きい値をとり、また、値P0(z)が値PDOWN以上でかつ値PUP以下の場合に、γと同一の値をとるものである。具体的に説明すると、γ’は、例えば、次式に従って算出される。尚、εは予め適切に設定された正の実係数である。
Figure 0004333369
この後、制御部40は、算出した値γ’を、変数γに設定し、変数γの値を更新する(S450)。即ち、制御部40は、S330における音量の調節倍率を、前回の値から、算出したγ’の値に変更する。このステップを終了すると、制御部40は、当該音声認識関連処理を終了する。
図7は、上述した構成のカーナビゲーション装置1の動作態様を示したタイムチャートである。当該カーナビゲーション装置1は、PTTスイッチ9から、音声認識開始指令信号としてのトリガ入力があると、ビープ音をスピーカSL,SRから出力し、音声認識を開始する旨を利用者に合図する。その後に、利用者から発せられた所定期間(音声認識対象区間)の音声についての音声信号U(t)を、音声認識部30に取得させ、音声認識させる。また、音声認識対象区間においては、スピーカSL,SRから出力される音響(音楽等)の音量をγ倍に設定する。
以上に、カーナビゲーション装置1の構成について説明したが、このカーナビゲーション装置1によれば、A/D変換器11,13,15と、オーディオキャンセラ20と、からなる雑音除去装置が、音響の多チャンネル再生を行うオーディオ機器5から各チャンネル(Lチャンネル、Rチャンネル)のオーディオ信号を取得し、それら各チャンネルのオーディオ信号に基づいて、マイクロフォン3から入力される音声信号XM(t)から、オーディオ機器5の再生音に関する雑音成分を除去する。
このオーディオキャンセラ20では、変換手段としての非線形変換部27L,27Rが除去出力手段としての加算部21から出力される雑音除去後の音声信号U(t)を非線形変換する。そして、係数更新手段としてのフィルタ学習部25Lが、その非線形変換後の信号f(U(t))と、自身に割り当てられたLチャンネルのオーディオ信号と、に基づいて、式(8)に従い、濾波手段としての適応フィルタ23Lに設定すべきフィルタ係数FL[k]を算出し、これを適応フィルタ23Lに設定して、フィルタ係数WL[k]を更新する。
同様に、係数更新手段としてのフィルタ学習部25Rは、非線形変換後の信号f(U(t))と、自身に割り当てられたRチャンネルのオーディオ信号と、に基づき、式(10)に従い、濾波手段としての適応フィルタ23Rに設定すべきフィルタ係数FR[k]を算出し、これを適応フィルタ23Rに設定して、フィルタ係数WR[k]を更新する。
このように本実施例のオーディオキャンセラ20では、フィルタ学習部25L(フィルタ学習部25R)が、Rチャンネル(Lチャンネル)の雑音成分やフィルタ学習部25R(フィルタ学習部25L)の挙動により影響を受けて、フィルタ係数の誤学習を行うのを抑制するために、加算部21から出力される音声信号U(t)を、非線形変換部27L,27Rにて非線形変換し、非線形変換後の音声信号f(U(t)を用いて、フィルタ学習部25L,25Rにフィルタ係数の学習・更新を行わせるようにした。
従って、本実施例のオーディオキャンセラ20によれば、マイクロフォン3から得た音声信号XM(t)に含まれるオーディオ機器5の再生音に関する雑音成分を、従来装置よりも適切に除去することができる。
よって、このカーナビゲーション装置1では、音声認識時にオーディオ機器5をミュートに設定し、オーディオ機器5にて再生中の音楽等の該再生を中断しなくとも、マイクロフォン3に入力された利用者の音声を、音声認識手段としての音声認識部30で正確に認識し、それに対応する処理を実行することができる。
つまり、このカーナビゲーション装置1によれば、オーディオ機器5から音楽等が流れている場合であっても、音声認識を正確に実行し、それに対応する処理を実行することができ、当該装置の操作性が向上する。更に言えば、音声認識時の音楽再生の中断を原因とする利用者の不満を解消することができる。
尚、非線形変換部27L,27Rにおいて、非線形関数であるtanh関数を用いて上記非線形変換を行うと、簡単な計算で精度よく雑音除去を行うことができ、オーディオキャンセラ20の雑音除去性能が向上すると共に、オーディオキャンセラ20の処理負荷を抑えることができて、安価にオーディオキャンセラ20を製造することができる。
また、非線形変換部27L,27Rにおいて、非線形関数であるsign関数を用いて非線形変換を行うと、tanh関数を用いる場合よりも、雑音除去性能が若干落ちるものの、オーディオキャンセラ20の処理負荷を抑えることができて、安価にオーディオキャンセラ20を製造することができる。
その他、非線形変換部27L,27Rにおいて、非線形関数である式(4)に示す関数g(x)を用いて非線形変換を行うと、tanh関数を用いた場合と、概ね同程度の雑音除去性能を得つつ、オーディオキャンセラ20の処理負荷を抑えることができて、安価にオーディオキャンセラ20を製造することができる。
また、本実施例のカーナビゲーション装置1では、オーディオ機器5の動作時に、PTTスイッチ9から音声認識開始指令信号が入力されると、制御部40が、オーディオ機器5のスピーカSL,SRから出力される音響の音量(オーディオ機器5の再生音量)をγ倍に設定した後(S330)、音声認識部30を作動させる(S340)。
また、音声認識部30が、オーディオキャンセラ20から得られた雑音除去後の音声信号U(t)に基づき、利用者の発声音量を評価し、その評価値P1(z)を制御部40に入力し、制御部40が、その評価値P1(z)を履歴データファイルに書き込んで、利用者の発声音量に関する履歴情報を作成する(S390)。更に、制御部40は、その履歴データファイルに記録された過去S回分の値P1(z)に基づいて、次回の音声認識時にオーディオ機器5に対して設定すべき音量(即ち、γ値)を決定する(S440,S450)。
このように本実施例のカーナビゲーション装置1では、音声認識の前後でオーディオ機器5によって再生される音楽等の音量を変化させ、音声認識の開始を利用者に案内するので、利用者は、その音量の変化によって音声認識が開始されたことを確実に知ることができる。よって、本実施例のカーナビゲーション装置1によれば、音声認識開始時に出力されるビープ音が音楽等に打ち消されてしまうことによって、利用者が音声認識開始のタイミングを把握しづらくなるのを、解消することができる。
その他、本実施例では、履歴データファイルに基づき利用者の発声の大小を評価し(S410)、その評価値P0(z)が評価基準許容上限値PUPより高い場合には、予め定められた基準値(前回のγ値)よりもγ値を小さくし、評価値P0(z)が評価基準許容下限値PDOWNより低い場合には、予め定められた基準値(前回のγ値)よりもγ値を大きくするように(S440,S450)、制御部40を構成した。
従って、本実施例のカーナビゲーション装置1によれば、ロンバート効果を期待でき、声の小さい利用者に対して音声認識対象の音声を大きい声で発せさせることができる。よって、本実施例のカーナビゲーション装置1によれば、ロンバート効果によって音声認識率を向上させることができる。
尚、本発明のオーディオ信号取得手段は、A/D変換器13,15と、オーディオキャンセラ20が実行するS120の処理とにより実現されている
また、本発明の雑音除去装置、及び、音声認識装置、並びに、カーナビゲーション装置は、上記実施例に限定されるものではなく、種々の態様を採ることができる。
例えば、上記実施例では、オーディオキャンセラ20で用いる非線形関数としてtanh関数、sign関数、式(4)に示す関数g(x)を挙げたが、その他の非線形関数を用いても構わない。
また、上記実施例では、Lチャンネル及びRチャンネルの計2チャンネルで音響再生するオーディオ機器5に対応したオーディオキャンセラ20について説明したが、例えば、スピーカを前方左、前方右、中央、後方左、後方右の5か所に配置して立体音響を生み出し、さらにウーファ(低音域用スピーカー)を1か所に配置して低音効果を補強する所謂5.1チャンネルサウンドシステムに対応するように、オーディオキャンセラ20を構成しても構わない。
本発明が適用されたカーナビゲーション装置1の概略構成を表すブロック図である。 オーディオキャンセラ20の機能ブロック図である。 非線形変換部27L,27Rで用いられる非線形関数f(x)を示した図である。 オーディオキャンセラ20が実行する雑音除去処理を表すフローチャートである。 オーディオキャンセラ20が実行する第一フィルタ学習処理を表すフローチャート(a)、及び、オーディオキャンセラ20が実行する第二フィルタ学習処理を表すフローチャート(b)である。 制御部40が実行する音声認識関連処理を表すフローチャートである。 カーナビゲーション装置1の動作態様を示したタイムチャートである。
符号の説明
1…カーナビゲーション装置、3…マイクロフォン、5…オーディオ機器、6…オーディオ機器本体部、6a…音量調節部、7…モニタ、9…PTTスイッチ、10…音声認識装置、11,13,15…A/D変換器、20…オーディオキャンセラ、21…加算部、23L,23R…適応フィルタ、25L,25R…フィルタ学習部、27L,27R…非線形変換部、30…音声認識部、31…パワー算出部、40…制御部、41…メモリ、50…音声生成部、SL,SR…スピーカ

Claims (5)

  1. 音響の多チャンネル再生を行うオーディオ機器から各チャンネルのオーディオ信号を取得し、該各チャンネルのオーディオ信号に基づき、マイクロフォンから入力される音声信号から、前記オーディオ機器の再生音に関する雑音成分を除去する雑音除去装置であって、
    各チャンネル毎の雑音除去信号生成手段と、
    該各雑音除去信号生成手段が生成した雑音除去信号C(t)を用いて、前記マイクロフォンから入力される音声信号に含まれる雑音成分を除去し、その雑音除去後の音声信号U(t)を出力する除去出力手段と、
    該除去出力手段が出力する音声信号U(t)を、非線形変換する変換手段と、
    を備え、
    前記各雑音除去信号生成手段は、
    自身に割り当てられたチャンネルのオーディオ信号X(t)を、前記オーディオ機器から取得するオーディオ信号取得手段と、
    予め設定されたフィルタ係数W[k]と、前記オーディオ信号取得手段が取得したオーディオ信号X(t)とを、次の関係式
    Figure 0004333369
    に従い畳み込み演算することにより、前記オーディオ信号X(t)を濾波して、前記雑音成分を除去するための前記雑音除去信号C(t)を生成する濾波手段と、
    前記変換手段による非線形変換後の音声信号f(U(t))と、前記オーディオ信号取得手段が取得したオーディオ信号X(t)と、前記濾波手段に設定されているフィルタ係数W[k]と、に基づいて、予め設定された定数α,βを含む次の関係式
    Figure 0004333369
    に従い、フィルタ係数F[k]を算出し、このフィルタ係数F[k]を、前記濾波手段に対して設定することにより、前記フィルタ係数W[k]を更新する係数更新手段と、
    を備え、
    前記変換手段は、非線形関数であるtanh関数に、前記音声信号U(t)を代入して、前記非線形変換を行う構成にされていること
    を特徴とする雑音除去装置(但し、定数Kは、タップ数であり、2以上の整数値をとる。又、変数tは、時間を表す変数であり、整数値をとる。)。
  2. 前記変換手段は、前記tanh関数に代えて、非線形関数であるsign関数に、前記音声信号U(t)を代入して、前記非線形変換を行う構成にされていることを特徴とする請求項1記載の雑音除去装置。
  3. 前記変換手段は、前記tanh関数に代えて、非線形関数である関数g(x)に、前記音声信号U(t)を代入して、前記非線形変換を行う構成にされていることを特徴とする請求項1記載の雑音除去装置(但し、変数mは、1より大きい正の実数である。)。
    Figure 0004333369
  4. 請求項1〜請求項3のいずれかに記載の雑音除去装置と、
    該雑音除去装置より得られる雑音除去後の音声信号に基づき、前記マイクロフォンに入力された音声を認識する音声認識手段と、
    を備えることを特徴とする音声認識装置。
  5. 請求項4記載の音声認識装置を備えることを特徴とするカーナビゲーション装置。
JP2004002387A 2004-01-07 2004-01-07 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置 Expired - Fee Related JP4333369B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2004002387A JP4333369B2 (ja) 2004-01-07 2004-01-07 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置
US11/023,553 US8010354B2 (en) 2004-01-07 2004-12-29 Noise cancellation system, speech recognition system, and car navigation system
DE200510000818 DE102005000818A1 (de) 2004-01-07 2005-01-05 Rauschunterdrückungssystem, Spracherkennungssystem und Fahrzeug-Navigationssystem
FR0500119A FR2864860B1 (fr) 2004-01-07 2005-01-06 Systeme d'annulation de bruit, systeme de reconnaissance vocale et systeme de navigation d'automobile
CN2006101693648A CN1971709B (zh) 2004-01-07 2005-01-07 语音识别系统和汽车导航系统
CN200510003838.7A CN1637857B (zh) 2004-01-07 2005-01-07 噪音消除系统、语音识别系统以及汽车导航系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004002387A JP4333369B2 (ja) 2004-01-07 2004-01-07 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2009112777A Division JP4924652B2 (ja) 2009-05-07 2009-05-07 音声認識装置及びカーナビゲーション装置

Publications (2)

Publication Number Publication Date
JP2005195895A JP2005195895A (ja) 2005-07-21
JP4333369B2 true JP4333369B2 (ja) 2009-09-16

Family

ID=34675450

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004002387A Expired - Fee Related JP4333369B2 (ja) 2004-01-07 2004-01-07 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置

Country Status (5)

Country Link
US (1) US8010354B2 (ja)
JP (1) JP4333369B2 (ja)
CN (2) CN1971709B (ja)
DE (1) DE102005000818A1 (ja)
FR (1) FR2864860B1 (ja)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005039621A1 (de) * 2005-08-19 2007-03-01 Micronas Gmbh Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System
KR100751921B1 (ko) 2005-11-11 2007-08-24 고려대학교 산학협력단 멀티채널 음성신호의 잡음제거 방법 및 장치
US7769593B2 (en) * 2006-09-28 2010-08-03 Sri International Method and apparatus for active noise cancellation
JP5034605B2 (ja) * 2007-03-29 2012-09-26 カシオ計算機株式会社 撮像装置、雑音除去方法及びプログラム
CN102934160A (zh) * 2010-03-30 2013-02-13 Nvoq股份有限公司 用于提高音频质量的听写客户端反馈
CN103050125A (zh) * 2011-10-12 2013-04-17 苏州阔地网络科技有限公司 一种网页上实现回音消除的方法
US8731822B2 (en) * 2012-01-17 2014-05-20 Motorola Mobility Llc Systems and methods for interleaving navigational directions with additional audio in a mobile device
US9418672B2 (en) 2012-06-05 2016-08-16 Apple Inc. Navigation application with adaptive instruction text
US9886794B2 (en) 2012-06-05 2018-02-06 Apple Inc. Problem reporting in maps
US9230556B2 (en) 2012-06-05 2016-01-05 Apple Inc. Voice instructions during navigation
US8965696B2 (en) 2012-06-05 2015-02-24 Apple Inc. Providing navigation instructions while operating navigation application in background
US9997069B2 (en) * 2012-06-05 2018-06-12 Apple Inc. Context-aware voice guidance
US9482296B2 (en) 2012-06-05 2016-11-01 Apple Inc. Rendering road signs during navigation
US9111547B2 (en) 2012-08-22 2015-08-18 Kodak Alaris Inc. Audio signal semantic concept classification method
US8880444B2 (en) 2012-08-22 2014-11-04 Kodak Alaris Inc. Audio based control of equipment and systems
WO2014063104A2 (en) * 2012-10-19 2014-04-24 Audience, Inc. Keyword voice activation in vehicles
KR20140052661A (ko) * 2012-10-25 2014-05-07 현대모비스 주식회사 신호처리를 이용한 차량용 마이크로 폰 시스템
CN103813241B (zh) * 2012-11-09 2016-02-10 辉达公司 移动电子设备及其音频播放装置
KR101445186B1 (ko) 2013-08-27 2014-10-01 (주) 로임시스템 비선형 보정 반향 제거장치
JP2015052466A (ja) * 2013-09-05 2015-03-19 株式会社デンソー 車両用装置及び音声切換制御プログラム
US9508345B1 (en) 2013-09-24 2016-11-29 Knowles Electronics, Llc Continuous voice sensing
US9431013B2 (en) * 2013-11-07 2016-08-30 Continental Automotive Systems, Inc. Co-talker nulling for automatic speech recognition systems
US9953634B1 (en) 2013-12-17 2018-04-24 Knowles Electronics, Llc Passive training for automatic speech recognition
US20150179181A1 (en) * 2013-12-20 2015-06-25 Microsoft Corporation Adapting audio based upon detected environmental accoustics
US9466310B2 (en) 2013-12-20 2016-10-11 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Compensating for identifiable background content in a speech recognition device
WO2015141103A1 (ja) * 2014-03-17 2015-09-24 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
US9437188B1 (en) 2014-03-28 2016-09-06 Knowles Electronics, Llc Buffered reprocessing for multi-microphone automatic speech recognition assist
CN103928026B (zh) * 2014-05-12 2017-04-12 安徽江淮汽车集团股份有限公司 一种汽车语音指令采集处理系统及方法
US9743213B2 (en) 2014-12-12 2017-08-22 Qualcomm Incorporated Enhanced auditory experience in shared acoustic space
JP6311136B2 (ja) 2015-10-16 2018-04-18 パナソニックIpマネジメント株式会社 双方向会話補助装置及び双方向会話補助方法
CN106098074A (zh) * 2016-05-20 2016-11-09 北京奇虎科技有限公司 一种数据处理方法和便携式多功能设备
US10567872B2 (en) * 2016-05-30 2020-02-18 Sony Corporation Locally silenced sound field forming apparatus and method
US20170371615A1 (en) * 2016-06-22 2017-12-28 Qualcomm Incorporated Alerting a user to a change in an audio stream
CN105979442B (zh) * 2016-07-22 2019-12-03 北京地平线机器人技术研发有限公司 噪声抑制方法、装置和可移动设备
CN106328137A (zh) * 2016-08-19 2017-01-11 镇江惠通电子有限公司 语音控制方法、装置及系统
CN106356068A (zh) * 2016-11-02 2017-01-25 北京中星微电子有限公司 音频播放方法和装置
US20180166073A1 (en) * 2016-12-13 2018-06-14 Ford Global Technologies, Llc Speech Recognition Without Interrupting The Playback Audio
CN106846803B (zh) * 2017-02-08 2023-06-23 广西交通科学研究院有限公司 基于音频的交通事件检测装置及方法
WO2020026562A1 (ja) * 2018-07-31 2020-02-06 ソニー株式会社 情報処理装置と情報処理方法およびプログラム
KR20200033617A (ko) * 2018-09-20 2020-03-30 현대자동차주식회사 차량용 음성 인식 장치 및 그 제어 방법
JP7153191B2 (ja) * 2018-11-26 2022-10-14 トヨタ自動車株式会社 情報提供装置及び車載装置
EP3667662B1 (en) * 2018-12-12 2022-08-10 Panasonic Intellectual Property Corporation of America Acoustic echo cancellation device, acoustic echo cancellation method and acoustic echo cancellation program
WO2020197975A1 (en) 2019-03-25 2020-10-01 Fintel Labs, Inc. Artificial intelligence-powered cloud for the financial services industry
US11017792B2 (en) * 2019-06-17 2021-05-25 Bose Corporation Modular echo cancellation unit
CN110475180A (zh) * 2019-08-23 2019-11-19 科大讯飞(苏州)科技有限公司 车载多音区音频处理系统及方法
CN112545547A (zh) * 2020-11-25 2021-03-26 北京积水潭医院 呼吸音分析方法及呼吸音分析系统

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4574389A (en) * 1983-07-15 1986-03-04 Larry Schotz Stereophonic receiver having a noise reduction control circuit
US6020782A (en) * 1994-05-25 2000-02-01 The United States Of America As Represented By The Secretary Of The Navy Noise assisted signal processor with nonlinearly coupled arrays of nonlinear dynamic elements
US5828756A (en) * 1994-11-22 1998-10-27 Lucent Technologies Inc. Stereophonic acoustic echo cancellation using non-linear transformations
JP3674990B2 (ja) * 1995-08-21 2005-07-27 セイコーエプソン株式会社 音声認識対話装置および音声認識対話処理方法
JPH10257583A (ja) * 1997-03-06 1998-09-25 Asahi Chem Ind Co Ltd 音声処理装置およびその音声処理方法
JP4166435B2 (ja) 1998-04-08 2008-10-15 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 通信会議システム
GB9910448D0 (en) 1999-05-07 1999-07-07 Ensigma Ltd Cancellation of non-stationary interfering signals for speech recognition
US6665645B1 (en) 1999-07-28 2003-12-16 Matsushita Electric Industrial Co., Ltd. Speech recognition apparatus for AV equipment
JP4554044B2 (ja) 1999-07-28 2010-09-29 パナソニック株式会社 Av機器用音声認識装置
US20030040910A1 (en) * 1999-12-09 2003-02-27 Bruwer Frederick J. Speech distribution system
JP2001100784A (ja) 1999-09-30 2001-04-13 Sony Corp 情報処理装置および情報処理方法、並びに記録媒体
US6529872B1 (en) * 2000-04-18 2003-03-04 Matsushita Electric Industrial Co., Ltd. Method for noise adaptation in automatic speech recognition using transformed matrices
US20020152255A1 (en) * 2001-02-08 2002-10-17 International Business Machines Corporation Accessibility on demand
US7487084B2 (en) * 2001-10-30 2009-02-03 International Business Machines Corporation Apparatus, program storage device and method for testing speech recognition in the mobile environment of a vehicle
US7165028B2 (en) * 2001-12-12 2007-01-16 Texas Instruments Incorporated Method of speech recognition resistant to convolutive distortion and additive distortion
US7142678B2 (en) * 2002-11-26 2006-11-28 Microsoft Corporation Dynamic volume control
US20050089177A1 (en) * 2003-10-23 2005-04-28 International Business Machines Corporation Method, apparatus, and program for intelligent volume control

Also Published As

Publication number Publication date
DE102005000818A1 (de) 2005-09-22
US20050159945A1 (en) 2005-07-21
US8010354B2 (en) 2011-08-30
CN1637857B (zh) 2010-05-26
CN1971709A (zh) 2007-05-30
JP2005195895A (ja) 2005-07-21
FR2864860A1 (fr) 2005-07-08
CN1637857A (zh) 2005-07-13
CN1971709B (zh) 2012-07-04
FR2864860B1 (fr) 2007-04-13

Similar Documents

Publication Publication Date Title
JP4333369B2 (ja) 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置
JP4283212B2 (ja) 雑音除去装置、雑音除去プログラム、及び雑音除去方法
JP5071480B2 (ja) エコー抑制装置、エコー抑制システム、エコー抑制方法及びコンピュータプログラム
CN109389990B (zh) 加强语音的方法、系统、车辆和介质
US20200045166A1 (en) Acoustic signal processing device, acoustic signal processing method, and hands-free communication device
US8098848B2 (en) System for equalizing an acoustic signal
CN111489750B (zh) 声音处理设备和声音处理方法
JP2005084253A (ja) 音響処理装置、方法、プログラム及び記憶媒体
MX2007015446A (es) Mejora de lenguaje multi-sensorial utilizando un modelo de estado de lenguaje.
JP2007251354A (ja) マイクロホン、音声生成方法
US20060184361A1 (en) Method and apparatus for reducing an interference noise signal fraction in a microphone signal
JP6878776B2 (ja) 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム
JP4924652B2 (ja) 音声認識装置及びカーナビゲーション装置
JP2000148200A (ja) 音声入力装置
JP2004198810A (ja) 音声認識装置
JP4187615B2 (ja) 出力音補正装置
JP2007058237A (ja) 雑音除去方法
JP4765394B2 (ja) 音声対話装置
JP4173978B2 (ja) 雑音除去装置、及び、音声認識装置、並びに音声通信装置
JP2009031809A (ja) 音声認識装置
JP2009015209A (ja) 音声明瞭度改善システム及び音声明瞭度改善方法
WO2023149015A1 (ja) 音声処理装置、音声処理方法、音声処理プログラム、および音声処理システム
JP2003099100A (ja) 音声認識装置およびその方法
JP2006084928A (ja) 音声入力装置
JP2010041188A (ja) 音声認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060323

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090602

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090615

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4333369

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130703

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees