JP3688934B2 - Microphone system - Google Patents
Microphone system Download PDFInfo
- Publication number
- JP3688934B2 JP3688934B2 JP10963399A JP10963399A JP3688934B2 JP 3688934 B2 JP3688934 B2 JP 3688934B2 JP 10963399 A JP10963399 A JP 10963399A JP 10963399 A JP10963399 A JP 10963399A JP 3688934 B2 JP3688934 B2 JP 3688934B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- microphone
- output
- adaptive
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【0001】
【発明の属する技術分野】
本発明はマイクロホンシステムに係わり、特に、第1、第2の2つマイクロホンを備え、一方のマイクロホンから出力する信号を目標信号、他方のマイクロホンから出力する信号を参照信号として適応信号処理を行って適応フィルタの係数を決定し、該適応フィルタより出力する信号を用いて話者音声信号のSN比を改善するマイクロホンシステムに関する。
【0002】
【従来の技術】
現在の音声認識システムは、15dB以上のSN比(S:音声/N:ノイズ)が確保されている場合、約95%の認識率を実現できるくらいの技術レベルにまで達している。しかし、周囲に存在するノイズによりSN比が低下すると、それに伴って認識率が急激に低下する性質も有している。図8はSN比と認識性能との関係をいくつかの種類のマイクロホン(無指向性、単一指向性、狭指向性、AMNOR(Adaptive Microphone-array for Noise Reduction))について評価したもので、SN比と認識率がおおむねS字特性100を示す帯の中に包含されている。この図8から明らかなように、認識率はSN比の低下により急激に低下し、SN比が0dBの環境下において約50%にまで低下してしまう。
【0003】
そのため、自動車が発生するノイズ(エンジン音・ロードノイズ・パターンノイズ・風切り音など)が存在する自動車車室内において、上記のような認識性能の劣化は避けられず、音声認識システムを車載化する上で大きな問題の一つとなっている。
前記したような事情から、周囲に存在するノイズの影響を少なくし、高いSN比で音声を受音するための方式が種々提案されており、複数のマイクロホンとディジタル信号処理を用いた高SN比受音システムはその一例である。かかる高SN比受音システムの中で最も簡単な構成のものは図9に示すように2つのマイクロホンを使用するシステムであるが、他にも、Griffith-Jim型アレイやAMNORといった、より高度なシステムが提案されている。
【0004】
図9において、1,2は第1、第2のマイクロホン、3は適応信号処理部であり、誤差信号eが入力されると共にマイクロホン2の出力信号x2が参照信号として入力され、誤差信号eのパワーが最小となるようにLMS(Least Mean Square)アルゴリズムに基づいて適応信号処理を行う。適応信号処理部3において、3aはLMS演算部、3bは例えばFIR型デジタルフィルタ構成の適応フィルタである。LMS演算部3aは適応信号処理により誤差信号eのパワーが最小となるように適応フィルタ3bの係数を決定する。
【0005】
4はマイクロホン1から出力する信号を目標信号として入力される目標応答設定部であり、音響系の逆特性を精度よく近似するためのものである。適応フィルタ3bのタップ長の半分の信号遅延時間(モデリングディレイ)をdとするとき、目標応答設定部4は該時間dの遅延特性を有し、オーディオ周波数帯域でフラットな特性(ゲイン1の特性)を有する。すなわち、目標応答設定部4は、図10(a)に示すようにゲイン1のフラットな周波数特性を備え、図10(b)に示すように遅延時間dを有するインパルス応答特性を有している。この目標応答設定部4は、FIR型デジタルフィルタの遅延時間dに対応する係数を1にし、他の係数を0にすることにより実現できる。
5は減算部であり、目標応答設定部4から出力する目標応答y1より適応フィルタ3bの出力信号y2を減算して誤差信号eを出力する。
【0006】
非音声認識時、マイクロホン1、2にはノイズのみが入力し、適応信号処理部3は適応信号処理により誤差信号eのパワー、すなわち、ノイズ出力が最小となるようにフィルタ係数Wを決定する。一方、音声認識時には、適応信号処理部3はフィルタ係数の更新をせず、前記非音声認識時に決定したフィルタ係数Wを適応フィルタ3bに設定して音声信号を出力する。
【0007】
図9に示すシステムに本来求められている理想的な性能は、音声認識時にノイズ出力を最小とすることである。すなわち、ノイズ出力En(z)に関して、
En(z)=Xn1(z)z-d−Xn2(z)W(z) (1)のとき、
{En(z)}2が最小値となるように、調整可能なパラメータ(適応フィルタ3bの係数)Wを決定することである。
【0008】
ただし、Xn1(z),Xn2(z)はマイクロホン1、2の出力信号に含まれるノイズであり、例としてノイズ源が1個の場合を考えるとノイズ源(ノイズ=xn)から第1、第2のマイクロホン1,2までの伝搬特性をCN1, CN2とすれば、
Xn1(z)=CN1・xn
Xn2(z)=CN2・xn
であり、(1)式は
En(z)=(CN1・z-d−CN2・W(z))xn (2)
となる。
【0009】
以上より、ノイズ源が1個の場合、フィルタ係数W(Z)は理想的には、
W(z)=CN1・z-d/CN2 (3)
となる。
一方、音声認識時、適応信号処理部3はフィルタ係数の更新をせず、前記非音声認識時に決定したフィルタ係数W(Z)を適応フィルタ3bに設定して音声信号を出力する。
【0010】
【発明が解決しようとする課題】
運転者である話者の口元からマイクロホン1,2までの伝搬特性をCS1, CS2とした場合、CS1, CS2は、ほぼ一定であるが、騒音源からマイクロホン1,2までの伝搬特性CN1, CN2は一定でない。これは、自動車が発生するノイズ(エンジン音・ロードノイズ・パターンノイズ・風切り音など)は多種多様であり、走行状態、走行環境などによりノイズの音場が大きく変わるからである。また、第1、第2のマイクロホン出力のどちらを目標信号、参照信号にするかは固定である。このため、騒音状態により適応フィルタWが(CN1/CN2)・Z-dをうまく模擬できず、SN比の改善効果が小さくなる問題がある。
以上から本発明の目的は、騒音源の環境に関係無く大きなSN比の改善効果が得られるマイクロホンシステムを提供することである。
【0011】
【課題を解決するための手段】
上記課題は第1の本発明によれば、(1) 非音声認識時に、▲1▼第1のマイクロホンの出力を目標信号、第2のマイクロホンの出力を参照信号として適応信号処理を行わせてノイズリダクション量を求め、▲2▼ついで、第2のマイクロホンの出力を目標信号、第1のマイクロホンの出力を参照信号として適応信号処理を行わせてノイズリダクション量を求め、▲3▼ノイズリダクション量が大きい方のマイクロホン出力選択状態及びその時のフィルタ係数を保存し、▲4▼以後、上記ノイズリダクション量の大小に基づく保存処理を繰り返し、(2) 音声認識に際して、前記保存してあるマイクロホン出力選択状態に基づいて各マイクロホンの出力を目標信号、参照信号として決定し、かつ、前記保存してあるフィルタ係数を適応フィルタに設定する、ことにより達成される。
すなわち、以上のようにすれば、ノイズの発生状態により騒音源から各マイクロホン1,2迄の伝搬特性が変化しても、ノイズリダクション量が大きくなるようにマイクロホン出力を目標信号、参照信号として決定できるため、SN比を効果的に改善できる。
【0012】
又、上記課題は本発明によれば、(1) 非音声認識時、▲1▼第1のマイクロホンの出力を目標信号、第2のマイクロホンの出力を参照信号として適応信号処理を行わせたときの出力信号をノイズ信号N1とし、▲2▼ついで、第1、第2のマイクロホン出力に替えて第1、第2の伝搬特性設定手段の出力を目標信号、参照信号として適応信号処理を行わせたときの出力信号を音声信号S1とし、▲3▼これらノイズ信号及び音声信号を用いてSN比を計算し、▲4▼しかる後、第2のマイクロホンの出力を目標信号、第1のマイクロホンの出力を参照信号として適応信号処理を行せたときの出力信号をノイズ信号N2とし、▲5▼ついで、第2、第1のマイクロホン出力に替えて第2、第1の伝搬特性設定手段の出力を目標信号、参照信号として適応信号処理を行わせたときの出力信号を音声信号S2とし、▲6▼これらノイズ信号及び音声信号を用いてSN比を計算し、▲7▼SN比が大きい方のマイクロホン出力選択状態及びその時のフィルタ係数を保存し、▲8▼以後、SN比の大小に基づく保存処理を繰り返し、(2) 音声認識に際して、前記保存してあるマイクロホン出力選択状態に基づいて各マイクロホンの出力を目標信号、参照信号として決定し、かつ、前記保存してあるフィルタ係数を適応フィルタに設定する、ことにより達成される。
以上のようにすれば、ノイズの発生状態により騒音源から各マイクロホン1,2迄の伝搬特性が変化しても、SN比が大きくなるようにマイクロホン出力を目標信号、参照信号として決定できるため、SN比の改善効果は大きい。
【0013】
【発明の実施の形態】
(a)第1実施例
図1は本発明の第1実施例のマイクロホンシステム(ノイズリダクションシステム)の構成図であり、図9の従来例と同一部分には同一符号を付している。
図中、1,2は第1、第2のマイクロホン、3は適応信号処理部であり、誤差信号eが入力されると共に適宜マイクロホン1またはマイクロホン2の出力信号が参照信号x2として入力され、誤差信号eのパワーが最小となるようにLMS
(Least Mean Square)アルゴリズムに基づいて適応信号処理を行う。適応信号処理部3において、3aはLMS演算部、3bは例えばFIR型デジタルフィルタ構成の適応フィルタである。LMS演算部3aは適応信号処理により誤差信号eのパワーが最小となるように適応フィルタ3bの係数を決定する。
【0014】
4はマイクロホン1またはマイクロホン2から出力する信号を目標信号x1として入力される目標応答設定部であり、音響系の逆特性を精度よく近似するためのものである。適応フィルタ3bのタップ長の半分の信号遅延時間(モデリングディレイ)をdとするとき、目標応答設定部4は該時間の遅延特性を有し、オーディオ周波数帯域でフラットな特性(ゲイン1の特性)を有する。5は減算部であり、目標応答設定部4から出力する目標応答y1より適応フィルタ3bの出力信号y2を減算して誤差信号eを出力する。この誤差信号eは音声認識時において音声信号となって音声認識処理部(図示せず)に入力する。
【0015】
11は第1、第2のマイクロホン1,2の出力をそれぞれ目標信号x1、参照信号x2として選択的に切り替えるスイッチ部であり、2つのスイッチ11a,11bを有している。21はメモリで、▲1▼マイクロホン出力の選択状態及びその時のノイズリダクション量NR1,NR2及びフィルタ係数W1,W2、▲2▼ノイズリダクション量が大きい方のマイクロホン出力の選択状態及びその時のフィルタ係数Wを記憶する。31は処理部であり、非音声認識時に、ノイズリダクション量が大きくなるマイクロホン出力選択状態及びその時のフィルタ係数Wを決定し、音声認識に際して、非音声認識時に決定したマイクロホン出力選択状態に基づいて各マイクロホンの出力を目標信号、参照信号とし使用し、かつ、非音声認識時に決定したフィルタ係数Wを適応フィルタ3bに設定するものである。
【0016】
図2は第1実施例の目標信号、参照信号決定処理及びフィルタ係数リアルタイム更新処理のフローである。
非音声認識時、処理部31はスイッチ部11を制御し、マイクロホン1の出力を目標信号x1、マイクロホン2の出力を参照信号x2として選択する(ステップ101)。適応信号処理部3は誤差信号eのパワーが最小となるように適応信号処理を行う(ステップ102)。誤差信号eが収束すれば(ステップ103)、処理部31は目標応答設定部4から出力する目標応答y1と誤差信号eのパワーの差であるノイズリダクション量NR1を計算し、該ノイズリダクション量NR1及びその時の適応フィルタ係数W1をメモリ21に記憶する(ステップ104)。
ついで、処理部31はスイッチ部11を制御し、マイクロホン2の出力を目標信号x1、マイクロホン1の出力を参照信号x2として選択する(ステップ105)。適応信号処理部3は誤差信号eのパワーが最小となるように適応信号処理を行う(ステップ106)。誤差信号eが収束すれば(ステップ107)、処理部31は目標応答設定部4から出力する目標応答y1と誤差信号eのパワーの差であるノイズリダクション量NR2を計算し、該ノイズリダクション量NR2及びその時の適応フィルタ係数W2をメモリ21に記憶する(ステップ108)。
【0017】
しかる後、処理部31はノイズリダクション量NR1,NR2の大小を比較し(ステップ109)、NR1>NR2であれば、マイクロホン1の出力を目標信号x1、マイクロホン2の出力を参照信号x2としてメモリ21に記憶すると共にフィルタ係数W1をWとして(W=W1)メモリ21に記憶する(ステップ110)。
一方、NR1≦NR2であれば、マイクロホン2の出力を目標信号x1、マイクロホン1の出力を参照信号x2としてメモリ21に記憶すると共にフィルタ係数W2をWとして(W=W2)メモリ21に記憶する(ステップ111)。
以後、始めに戻って上記処理を繰り返し、ノイズリダクション量が大きい方の最新のマイクロホン選択状態及びその時のフィルタ係数をメモリ21に保存する。
【0018】
図3は第1実施例における音声認識時のマイクロホン出力選択及びフィルタ係数設定処理フローである。
車載ナビゲーション等では音声により指示する場合、トークスイッチ等を操作してから音声入力する。したがって、処理部31は例えばトークスイッチがオンして音声認識状態になったか監視する(ステップ201)。音声認識状態になれば、処理部31は図2の目標信号、参照信号の決定処理及び適応フィルタの係数更新処理を停止する(ステップ202)。
【0019】
ついで、処理部31はメモリ21に保存してあるマイクロホン選択状態に基づいて、スイッチ部11を切り替えて各マイクロホン出力を目標信号x1、参照信号x2として使用し、かつ、非音声認識時に決定したフィルタ係数Wを適応フィルタ3bに設定する(ステップ203)。
かかる状態において、音声が入力するとノイズが減衰した音声信号が減算部5から出力し、音声認識処理部に入力する。
以後、音声認識処理が終了したか監視し(ステップ204)、終了すれば、図2の目標信号、参照信号の決定処理及びフィルタ係数の更新処理を再開する(ステップ205)。
【0020】
(b)第2実施例
図4は本発明の第2実施例のマイクロホンシステム(ノイズリダクションシステム)の構成図であり、図1の第1実施例と同一部分には同一符号を付している。第1実施例ではノイズリダクション量の大小に基づいてマイクロホン出力の選択及びフィルタ係数の設定を行うが、第2実施例ではSN比の大小に基づいてマイクロホン出力の選択及びフィルタ係数の設定を行う。
【0021】
図4のマイクロホンシステムが図1の第1実施例のマイクロホンシステムと異なる点は、
(1) 疑似音声(例えばホワイトノイズ)を発生する疑似音声出力部41を設けた点、
(2) 話者口元からマイクロホン1,2までの伝搬特性CS1、CS2(図5参照)を模擬する伝搬特性設定部51,52を設けたた点、
(3) マイクロホン1,2の出力と第1、第2の伝搬特性設定部51,52の出力を選択的に切り替えるスイッチ部61を設けた点、
(4) 処理部31が、▲1▼マイクロホン1の出力を目標信号x1、マイクロホン2の出力を参照信号x2としたときのSN比(=S1/N1)、▲2▼マイクロホン2の出力を目標信号x1、マイクロホン1の出力を参照信号x2としたときのSN比(=S2/N2)、をそれぞれ計算し、SN比の大きい方のマイクロホン選択状態及びフィルタ係数Wをメモリ21に記憶する点、
である。
【0022】
図6及び図7は第2実施例の目標信号、参照信号決定処理及びフィルタ係数リアルタイム更新処理のフローである。
非音声認識時、処理部31はスイッチ部11,61をそれぞれ切替制御(図中実線状態)し、マイクロホン1の出力を目標信号x1、マイクロホン2の出力を参照信号x2として選択する(ステップ301)。適応信号処理部3は誤差信号eのパワーが最小となるように適応信号処理を行う(ステップ302)。誤差信号eが収束すれば(ステップ303)、処理部31は誤差信号eのパワー(=e2)をノイズ出力N1として記憶する(ステップ304)。
ついで、フィルタ係数W1の更新を停止すると共に、スイッチ部61を制御して第1の伝搬特性設定部51から出力する模擬音声信号を目標応答設定部4に入力し、伝搬特性設定部52から出力する模擬音声信号を適応フィルタ3bに入力する(ステップ305)。そして、かかる状態において、誤差信号eのパワー(=e2)を音声信号出力S1として記憶し(ステップ306)、SN比(=S1/N1)とその時の適応フィルタ係数W1をメモリ21に記憶する(ステップ307)。
【0023】
しかる後、スイッチ部11,61をそれぞれ切替制御し、マイクロホン2の出力を目標信号x1、マイクロホン1の出力を参照信号x2として選択する(ステップ308)。適応信号処理部3は誤差信号eのパワーが最小となるように適応信号処理を行う(ステップ309)。誤差信号eが収束すれば(ステップ310)、処理部31は誤差信号eのパワー(=e2)をノイズ出力N2として記憶する(ステップ311)。
ついで、フィルタ係数W2の更新を停止すると共に、スイッチ部61を制御して第2の伝搬特性設定部52から出力する模擬音声信号を目標応答設定部4に入力し、伝搬特性設定部51から出力する模擬音声信号を適応フィルタ3bに入力する(ステップ312)。そして、かかる状態において、誤差信号eのパワー(=e2)を音声信号出力S2として記憶し(ステップ313)、SN比(=S2/N2)とその時の適応フィルタ係数W2をメモリ21に記憶する(ステップ314)。
【0024】
以上により、SN比(S1/N1, S2/N2)が求まれば、処理部31はこれらSN比S1/N1,S2/N2の大小を比較し(ステップ315)、S1/N1>S2/N2であれば、マイクロホン1の出力を目標信号、マイクロホン2の出力を参照信号としてメモリ21に記憶すると共にフィルタ係数W1をWとして(W=W1)メモリ21に記憶する(ステップ316)。
しかし、S1/N1≦S2/N2であれば、マイクロホン2の出力を目標信号、マイクロホン1の出力を参照信号としてメモリ21に記憶すると共にフィルタ係数W2をWとして(W=W2)メモリ21に記憶する(ステップ317)。
以後、始めに戻って上記処理を繰り返し、SN比が大きい方の最新のマイク選択状態及びその時のフィルタ係数を保存する。
音声認識状態になれば、図3の第1実施例と同一の処理フローにしたがってマイクロホン出力の選択処理及びフィルタ係数の設定処理を実行する。
以上、本発明を実施例により説明したが、本発明は請求の範囲に記載した本発明の主旨に従い種々の変形が可能であり、本発明はこれらを排除するものではない。
【0025】
【発明の効果】
以上本発明によれば、ノイズの発生状態により騒音源から各マイクロホン迄の伝搬特性が変化しても、ノイズリダクション量が大きくなるように各マイクロホン出力を目標信号、参照信号として決定するため、SN比を効果的に改善することができる。
又、本発明によれば、ノイズの発生状態により騒音源から各マイクロホン迄の伝搬特性が変化しても、SN比を計算し、SN比が大きくなるように各マイクロホン出力を目標信号、参照信号として決定するため確実にSN比を改善でき、その改善効果は大きい。
【図面の簡単な説明】
【図1】本発明の第1実施例のマイクロホンシステム(ノイズリダクションシステム)の構成図である。
【図2】第1実施例の目標信号、参照信号の決定処理及びフィルタ係数のリアルタイム更新処理フローである。
【図3】第1実施例の音声認識時におけるマイクロホン出力の選択及びフィルタ係数の設定処理フローである。
【図4】本発明の第2実施例のマイクロホンシステムの構成図である。
【図5】話者口元から各マイクロホンまでの伝搬特性説明図である。
【図6】第2実施例の目標信号、参照信号の決定処理及びフィルタ係数のリアルタイム更新処理フロー(その1)である。
【図7】第2実施例の目標信号、参照信号の決定処理及びフィルタ係数のリアルタイム更新処理フロー(その2)である。
【図8】 SN比と認識率の関係図である。
【図9】従来のマイクロホンを2つ使用した場合の高SN比受音システムである。
【図10】目標応答設定部の特性図である。
【符号の説明】
1,2・・第1、第2のマイクロホン
3・・適応信号処理部
3a・・LMS演算部
3b・・適応フィルタ
4・・目標応答設定部
5・・減算部
11・・スイッチ部
21・・メモリ
31・・処理部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a microphone system, and in particular, includes first and second microphones, and performs adaptive signal processing using a signal output from one microphone as a target signal and a signal output from the other microphone as a reference signal. The present invention relates to a microphone system that determines a coefficient of an adaptive filter and improves an S / N ratio of a speaker voice signal using a signal output from the adaptive filter.
[0002]
[Prior art]
The current speech recognition system has reached a technical level that can achieve a recognition rate of about 95% when a signal-to-noise ratio (S: voice / N: noise) of 15 dB or more is secured. However, when the S / N ratio is reduced due to noise present in the surrounding area, the recognition rate is rapidly lowered. Fig. 8 shows the relationship between SN ratio and recognition performance for several types of microphones (omnidirectional, unidirectional, narrow directivity, AMNOR (Adaptive Microphone-array for Noise Reduction)). Ratios and recognition rates are generally contained within a band showing the S-
[0003]
For this reason, the above-mentioned deterioration in recognition performance is unavoidable in automobile interiors where noise generated by automobiles (engine noise, road noise, pattern noise, wind noise, etc.) is present, and a voice recognition system is mounted on the vehicle. It is one of the big problems.
In view of the circumstances described above, various methods have been proposed for receiving sound with a high S / N ratio while reducing the influence of surrounding noise, and a high S / N ratio using a plurality of microphones and digital signal processing has been proposed. A sound receiving system is an example. The simplest configuration of such a high S / N ratio receiving system is a system using two microphones as shown in FIG. 9, but other advanced systems such as Griffith-Jim type array and AMNOR are also used. A system has been proposed.
[0004]
9, 1 and 2 first, second microphone, 3 is an adaptive signal processing unit, the output signal x 2
[0005]
5 is a subtraction unit, and outputs an error signal e by subtracting the output signal y 2 of the
[0006]
During non-speech recognition, only noise is input to the
[0007]
The ideal performance originally required for the system shown in FIG. 9 is to minimize the noise output during speech recognition. That is, regarding the noise output En (z),
When En (z) = Xn 1 (z) z -d −Xn 2 (z) W (z) (1)
An adjustable parameter (coefficient of the
[0008]
However, Xn 1 (z) and Xn 2 (z) are noises included in the output signals of the
Xn 1 (z) = CN1 xn
Xn 2 (z) = CN2 xn
And equation (1) is
En (z) = (CN1 ・ z -d −CN2 ・ W (z)) xn (2)
It becomes.
[0009]
From the above, when there is one noise source, the filter coefficient W (Z) is ideally
W (z) = CN1 ・ z -d / CN2 (3)
It becomes.
On the other hand, at the time of speech recognition, the adaptive
[0010]
[Problems to be solved by the invention]
If the propagation characteristics from the speaker's mouth to the
From the above, an object of the present invention is to provide a microphone system capable of obtaining a large effect of improving the S / N ratio regardless of the environment of the noise source.
[0011]
[Means for Solving the Problems]
According to the first aspect of the present invention, (1) during non-speech recognition, (1) adaptive signal processing is performed using the output of the first microphone as a target signal and the output of the second microphone as a reference signal. Determine the amount of noise reduction. (2) Then, the amount of noise reduction is obtained by performing adaptive signal processing using the output of the second microphone as the target signal and the output of the first microphone as the reference signal. (3) Noise reduction amount The microphone output selection state with the larger value and the filter coefficient at that time are saved, and after (4), the saving process based on the magnitude of the noise reduction amount is repeated, and (2) the saved microphone output selection is performed for voice recognition. Based on the state, the output of each microphone is determined as a target signal and a reference signal, and the stored filter coefficients are set in the adaptive filter. To be achieved by.
In other words, with the above configuration, the microphone output is determined as the target signal and reference signal so that the amount of noise reduction increases even if the propagation characteristics from the noise source to each of the
[0012]
In addition, according to the present invention, (1) when non-voice recognition is performed, and (1) when adaptive signal processing is performed using the output of the first microphone as a target signal and the output of the second microphone as a reference signal The output signal is the noise signal N1, and (2) then, instead of the first and second microphone outputs, the output of the first and second propagation characteristic setting means is used as the target signal and the reference signal to perform adaptive signal processing. The output signal at that time is the audio signal S1, and (3) the S / N ratio is calculated using the noise signal and the audio signal, and (4) the output of the second microphone is set as the target signal and the output of the first microphone. The output signal when the adaptive signal processing can be performed using the output as a reference signal is the noise signal N2. (5) Next, instead of the second and first microphone outputs, the outputs of the second and first propagation characteristic setting means As the target signal and reference signal The output signal when the adaptive signal processing is performed is the audio signal S2, and (6) the SN ratio is calculated using these noise signal and audio signal, and (7) the microphone output selection state with the larger SN ratio and The filter coefficient at that time is stored, and after (8), the storing process based on the magnitude of the SN ratio is repeated. (2) Upon speech recognition, the output of each microphone is set to the target signal based on the stored microphone output selection state. , Determining as a reference signal, and setting the stored filter coefficients in an adaptive filter.
As described above, since the microphone output can be determined as the target signal and the reference signal so that the SN ratio is increased even if the propagation characteristics from the noise source to each of the
[0013]
DETAILED DESCRIPTION OF THE INVENTION
(A) First Embodiment FIG. 1 is a block diagram of a microphone system (noise reduction system) according to a first embodiment of the present invention. Components identical with those of the conventional example of FIG.
In the figure, 1 and 2 are first and second microphones, 3 is an adaptive signal processing unit, and an error signal e is input and an output signal of the microphone 1 or the
Performs adaptive signal processing based on the (Least Mean Square) algorithm. In the adaptive
[0014]
[0015]
A
[0016]
FIG. 2 is a flowchart of the target signal, reference signal determination process and filter coefficient real-time update process of the first embodiment.
During non-voice recognition, the
Next, the
[0017]
Thereafter, the
On the other hand, if NR1 ≦ NR2, the output of the
Thereafter, returning to the beginning, the above processing is repeated, and the latest microphone selection state with the larger noise reduction amount and the filter coefficient at that time are stored in the
[0018]
FIG. 3 is a flowchart of a microphone output selection and filter coefficient setting process during speech recognition in the first embodiment.
In the case of in-vehicle navigation or the like, when a voice instruction is given, voice input is performed after the talk switch or the like is operated. Therefore, the
[0019]
Next, the
In this state, when a voice is input, a voice signal with attenuated noise is output from the subtracting unit 5 and input to the voice recognition processing unit.
Thereafter, it is monitored whether or not the voice recognition processing is completed (step 204), and if completed, the target signal and reference signal determination processing and filter coefficient updating processing in FIG. 2 are resumed (step 205).
[0020]
(B) Second Embodiment FIG. 4 is a block diagram of a microphone system (noise reduction system) according to a second embodiment of the present invention. Components identical with those of the first embodiment of FIG. . In the first embodiment, the microphone output is selected and the filter coefficient is set based on the magnitude of the noise reduction amount. In the second embodiment, the microphone output is selected and the filter coefficient is set based on the magnitude of the SN ratio.
[0021]
The microphone system of FIG. 4 is different from the microphone system of the first embodiment of FIG.
(1) The provision of a pseudo
(2) Providing propagation
(3) A
(4) SN ratio (= S1 / N1) when the
It is.
[0022]
6 and 7 are flowcharts of the target signal, reference signal determination process and filter coefficient real-time update process of the second embodiment.
At the time of non-speech recognition, the
Next, the updating of the filter coefficient W1 is stopped, the simulated voice signal output from the first propagation
[0023]
Thereafter, the
Next, the updating of the filter coefficient W2 is stopped, and the simulated voice signal output from the second propagation
[0024]
When the SN ratio (S1 / N1, S2 / N2) is obtained as described above, the
However, if S1 / N1 ≦ S2 / N2, the output of the
Thereafter, returning to the beginning, the above process is repeated, and the latest microphone selection state with the larger SN ratio and the filter coefficient at that time are stored.
If the voice recognition state is entered, the microphone output selection process and the filter coefficient setting process are executed according to the same processing flow as in the first embodiment of FIG.
The present invention has been described with reference to the embodiments. However, the present invention can be variously modified in accordance with the gist of the present invention described in the claims, and the present invention does not exclude these.
[0025]
【The invention's effect】
As described above, according to the present invention, each microphone output is determined as the target signal and the reference signal so that the amount of noise reduction is increased even if the propagation characteristic from the noise source to each microphone changes due to the noise generation state. The ratio can be improved effectively.
In addition, according to the present invention, even if the propagation characteristics from the noise source to each microphone change due to the noise generation state, the SN ratio is calculated, and each microphone output is set to the target signal and reference signal so that the SN ratio becomes large. Therefore, the signal-to-noise ratio can be reliably improved, and the improvement effect is great.
[Brief description of the drawings]
FIG. 1 is a configuration diagram of a microphone system (noise reduction system) according to a first embodiment of the present invention.
FIG. 2 is a flow of processing for determining a target signal and a reference signal and a filter coefficient in real time according to the first embodiment.
FIG. 3 is a processing flow for selecting a microphone output and setting a filter coefficient during speech recognition according to the first embodiment;
FIG. 4 is a configuration diagram of a microphone system according to a second embodiment of the present invention.
FIG. 5 is an explanatory diagram of propagation characteristics from a speaker's mouth to each microphone.
FIG. 6 is a flowchart (No. 1) of target signal and reference signal determination processing and filter coefficient real-time update processing according to the second embodiment;
FIG. 7 is a flowchart (part 2) of the target signal / reference signal determination process and filter coefficient real-time update process according to the second embodiment;
FIG. 8 is a relationship diagram between SN ratio and recognition rate.
FIG. 9 shows a high S / N ratio sound receiving system in the case of using two conventional microphones.
FIG. 10 is a characteristic diagram of a target response setting unit.
[Explanation of symbols]
1, 2 ··· First and
Claims (2)
第1、第2のマイクロホン出力をそれぞれ目標信号、参照信号として選択的に切り替える切替手段、
ノイズリダクション量が大きい方のマイクロホン出力選択状態及びその時のフィルタ係数を保存する手段、
非音声認識時に、第1のマイクロホンの出力を目標信号、第2のマイクロホンの出力を参照信号として適応信号処理を行わせてノイズリダクション量を求め、ついで、第2のマイクロホンの出力を目標信号、第1のマイクロホンの出力を参照信号として適応信号処理を行わせてノイズリダクション量を求め、ノイズリダクション量が大きい方のマイクロホン出力選択状態及びその時のフィルタ係数を保存し、以後、上記ノイズリダクション量の大小に基づく保存処理を繰り返し、音声認識に際して、前記保存してあるマイクロホン出力選択状態に基づいて各マイクロホンの出力を目標信号、参照信号として決定し、又、保存してあるフィルタ係数を適応フィルタに設定する処理部、
を備えたことを特徴とするマイクロホンシステム。The first and second microphones are adapted to perform adaptive signal processing using a signal output from one microphone during non-speech recognition as a target signal and a signal output from the other microphone as a reference signal to determine the coefficient of the adaptive filter. In a microphone system comprising a signal processing unit and setting the determined filter coefficient in an adaptive filter at the time of speech recognition to improve the S / N ratio of a speaker speech signal,
Switching means for selectively switching the first and second microphone outputs as the target signal and the reference signal, respectively;
Means for storing the microphone output selection state with the larger noise reduction amount and the filter coefficient at that time,
During non-speech recognition, adaptive signal processing is performed using the output of the first microphone as the target signal and the output of the second microphone as the reference signal to determine the amount of noise reduction, and then the output of the second microphone is set as the target signal. Adaptive signal processing is performed using the output of the first microphone as a reference signal to determine the noise reduction amount, the microphone output selection state with the larger noise reduction amount and the filter coefficient at that time are stored, and thereafter, the noise reduction amount The storage process based on the size is repeated, and at the time of speech recognition, the output of each microphone is determined as a target signal and a reference signal based on the stored microphone output selection state, and the stored filter coefficient is used as an adaptive filter. Processing unit to set,
A microphone system characterized by comprising:
話者の口元から各マイクロホン迄の伝搬特性を模擬する第1、第2の伝搬特性設定手段、
模擬音声を各伝搬特性設定手段に入力する模擬音声発生手段、
第1、第2のマイクロホン出力をそれぞれ目標信号、参照信号として選択的に切り替える第1の切替手段、
第1、第2のマイクロホンの出力と第1、第2の伝搬特性設定手段の出力を選択的に切り替える第2の切替手段、
SN比が大きい方のマイクロホン出力選択状態及びその時のフィルタ係数を保存する手段、
非音声認識時、第1のマイクロホンの出力を目標信号、第2のマイクロホンの出力を参照信号として適応信号処理を行わせたときの出力信号をノイズ信号N1とし、ついで、第1、第2のマイクロホン出力に替えて第1、第2の伝搬特性設定手段の出力を目標信号、参照信号として適応信号処理を行わせたときの出力信号を音声信号S1とし、これらノイズ信号N1及び音声信号S1を用いてSN比を計算し、しかる後、第2のマイクロホンの出力を目標信号、第1のマイクロホンの出力を参照信号として適応信号処理を行せたときの出力信号をノイズ信号N2とし、ついで、第2、第1のマイクロホン出力に替えて第2、第1の伝搬特性設定手段の出力を目標信号、参照信号として適応信号処理を行わせたときの出力信号を音声信号S2とし、これらノイズ信号N2及び音声信号S2を用いてSN比を計算し、SN比が大きい方のマイクロホン出力選択状態及びその時のフィルタ係数を保存し、以後、SN比の大小に基づく保存処理を繰り返し、音声認識に際して、前記保存してあるマイクロホン出力選択状態に基づいて各マイクロホンの出力を目標信号、参照信号として決定し、かつ、保存してあるフィルタ係数を適応フィルタに設定する処理部、
を備えたことを特徴とするマイクロホンシステム。The first and second microphones are adapted to perform adaptive signal processing using a signal output from one microphone during non-speech recognition as a target signal and a signal output from the other microphone as a reference signal to determine the coefficient of the adaptive filter. In a microphone system comprising a signal processing unit and setting the determined filter coefficient in an adaptive filter at the time of speech recognition to improve the S / N ratio of a speaker speech signal,
First and second propagation characteristic setting means for simulating propagation characteristics from the speaker's mouth to each microphone;
Simulated voice generating means for inputting simulated voice to each propagation characteristic setting means,
First switching means for selectively switching the first and second microphone outputs as a target signal and a reference signal, respectively;
Second switching means for selectively switching the output of the first and second microphones and the output of the first and second propagation characteristic setting means;
Means for storing a microphone output selection state having a larger S / N ratio and a filter coefficient at that time;
At the time of non-speech recognition, the output signal when adaptive signal processing is performed using the output of the first microphone as the target signal and the output of the second microphone as the reference signal is the noise signal N1, and then the first and second signals are output. The output signal when the adaptive signal processing is performed using the output of the first and second propagation characteristic setting means as the target signal and the reference signal instead of the microphone output is the audio signal S1, and the noise signal N1 and the audio signal S1 are Then, the S / N ratio is calculated, and then the output signal when the adaptive signal processing can be performed using the output of the second microphone as the target signal and the output of the first microphone as the reference signal is the noise signal N2, Instead of the second and first microphone outputs, the output signal when the adaptive signal processing is performed using the output of the second and first propagation characteristic setting means as the target signal and the reference signal is the audio signal S2. Then, the S / N ratio is calculated using the noise signal N2 and the audio signal S2, the microphone output selection state with the larger S / N ratio and the filter coefficient at that time are stored, and thereafter the storage process based on the S / N ratio is repeated, Upon speech recognition, a processing unit that determines the output of each microphone as a target signal and a reference signal based on the stored microphone output selection state, and sets the stored filter coefficient in an adaptive filter,
A microphone system characterized by comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10963399A JP3688934B2 (en) | 1999-04-16 | 1999-04-16 | Microphone system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10963399A JP3688934B2 (en) | 1999-04-16 | 1999-04-16 | Microphone system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000305594A JP2000305594A (en) | 2000-11-02 |
JP3688934B2 true JP3688934B2 (en) | 2005-08-31 |
Family
ID=14515236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10963399A Expired - Fee Related JP3688934B2 (en) | 1999-04-16 | 1999-04-16 | Microphone system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3688934B2 (en) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007171316A (en) * | 2005-12-20 | 2007-07-05 | Yamaha Corp | Sound pickup device |
WO2007103037A2 (en) | 2006-03-01 | 2007-09-13 | Softmax, Inc. | System and method for generating a separated signal |
US20080208538A1 (en) * | 2007-02-26 | 2008-08-28 | Qualcomm Incorporated | Systems, methods, and apparatus for signal separation |
US8867754B2 (en) | 2009-02-13 | 2014-10-21 | Honda Motor Co., Ltd. | Dereverberation apparatus and dereverberation method |
US9031259B2 (en) | 2011-09-15 | 2015-05-12 | JVC Kenwood Corporation | Noise reduction apparatus, audio input apparatus, wireless communication apparatus, and noise reduction method |
EP2809086B1 (en) * | 2012-01-27 | 2017-06-14 | Kyoei Engineering Co., Ltd. | Method and device for controlling directionality |
DE102012202640A1 (en) * | 2012-02-21 | 2013-08-22 | Wacker Chemie Ag | Polycrystalline silicon fragment and method of cleaning polycrystalline silicon fragments |
-
1999
- 1999-04-16 JP JP10963399A patent/JP3688934B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000305594A (en) | 2000-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5444472B2 (en) | Sound source separation apparatus, sound source separation method, and program | |
JP4283212B2 (en) | Noise removal apparatus, noise removal program, and noise removal method | |
US9002027B2 (en) | Space-time noise reduction system for use in a vehicle and method of forming same | |
JP4513810B2 (en) | Active noise reduction device | |
JP3454190B2 (en) | Noise suppression apparatus and method | |
CN1934903B (en) | Hearing aid with anti feedback system | |
US10904396B2 (en) | Multi-channel residual echo suppression | |
JPH114288A (en) | Echo canceler device | |
JPH08509823A (en) | Single and multi-channel block adaptation method and apparatus for active acoustic and vibration control | |
JP2001128282A (en) | Microphone array processing system for noisy multi-path environment | |
JP2010021982A (en) | Audio reproducing apparatus | |
JP3688934B2 (en) | Microphone system | |
JP3877271B2 (en) | Audio cancellation device for speech recognition | |
JP5383008B2 (en) | Speech intelligibility improvement system and speech intelligibility improvement method | |
JP2003333683A (en) | Noise suppression method and microphone unit | |
JP4141593B2 (en) | Noise / audio sound reduction device | |
JP2008225056A (en) | Speech articulation improving device and noise level estimation method thereof | |
JP4162860B2 (en) | Unnecessary sound signal removal device | |
JP4166000B2 (en) | Voice recognition device | |
JP4495581B2 (en) | Audio output device | |
JP4183338B2 (en) | Noise reduction system | |
JP2002261659A (en) | Multi-channel echo cancellation method, its apparatus, its program, and its storage medium | |
JP2001013989A (en) | Noise reduction system | |
JP3404840B2 (en) | Active noise control method and apparatus for implementing the method | |
JP2002261660A (en) | Multi-channel echo cancellation method, its apparatus, its program, and its storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050524 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050607 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050609 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080617 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090617 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100617 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110617 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120617 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120617 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130617 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130617 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140617 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |