JP4162860B2 - Unnecessary sound signal removal device - Google Patents

Unnecessary sound signal removal device Download PDF

Info

Publication number
JP4162860B2
JP4162860B2 JP2001004845A JP2001004845A JP4162860B2 JP 4162860 B2 JP4162860 B2 JP 4162860B2 JP 2001004845 A JP2001004845 A JP 2001004845A JP 2001004845 A JP2001004845 A JP 2001004845A JP 4162860 B2 JP4162860 B2 JP 4162860B2
Authority
JP
Japan
Prior art keywords
signal
state
adaptive
speaker
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001004845A
Other languages
Japanese (ja)
Other versions
JP2002207500A (en
Inventor
孝一 中田
真吾 木内
利明 浅野
徹 丸本
望 斉藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP2001004845A priority Critical patent/JP4162860B2/en
Publication of JP2002207500A publication Critical patent/JP2002207500A/en
Application granted granted Critical
Publication of JP4162860B2 publication Critical patent/JP4162860B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To immediately eliminate an audio sound signal and carry out speech recognition even when a state changes from a hands-free talking state into an audio state. SOLUTION: A microphone 71 detects sounds inside a vehicle outputted from a loudspeaker 52 and a human speaker. An unwanted sound signal eliminating section 73 generates a signal corresponding to an audio reproducing sound with an adaptive signal processing and eliminates the generated signal from the detected signal and then inputs the resultant signal into a speech recognizing device 74 in a first status (audio state), and generates a signal corresponding to the sound outputted from a loudspeaker for a receiver speech 52FR with the adaptive signal processing and eliminates the generated signal from the detected signal and inputs the resultant signal into a transmitter 75 in a second state (calling state). When the state changes from the first state into the second state, an adaptive filter parameter updated by the adaptive signal processing in the first state is stored in a parameter storage section 83, and when the state changes from the second state into the first state, the stored adaptive filter parameter is set on the adaptive filter and the adaptive signal processing is carried out.

Description

【0001】
【発明の属する技術分野】
本発明は不要音信号除去装置に係わり、特に、スピーカ及び話者から車室内に出力する音を検出し、検出信号よりスピーカから出力する音に応じた不要音信号を除去する不要音信号除去装置に関する。
【0002】
【従来の技術】
近年ナビゲーションシステムなど、車載機器のヒューマンインタフェース(入出力手段)として音声認識装置が一般化してきている。しかし、音声認識装置は、認識の対象とする音声以外の外乱(車両走行ノイズやオーディオ再生音)の影響で認識性能が低下するという問題があり、さまざまな騒音対策が実現されている。その一例としてマイク受信信号から車室内のオーディオ再生音を除去(抑圧)するオーディオ音キャンセル装置が提案されている。
また、近年移動電話機の爆発的な普及により、運転しながらの通話による事故が増大し、安全上の観点から、走行中での携帯電話等による通話は法律によって禁止されている。このため、送受話器を外したりしなくても通話ができるハンズフリーテレフォン装置(HFT)が普及してきている。HFTでは、音声をオーディオシステムのスピーカより出力するが、このスピーカから再生出力された通話相手音声がマイクにより検出されて通信相手に送信されるという所謂エコー現象が発生する。このため、かかるエコーを除去するためのエコーキャンセラが実用化されている。
【0003】
・オーディオ音キャンセル装置
図8は従来のオーディオ音キャンセル装置の構成図であり、11はオーディオソース、12はオーディオ信号を入力され、オーディオ音を音響空間に放射するスピーカ、13は音響空間に放射されたオーディオ音及び話者からの話者音声を検出するマイクロホン、14はエラー信号eのパワーが最小となるように適応信号処理を行い、適応フィルタの係数Wを更新する適応信号処理部、15はマイクロホンによる検出信号と適応フィルタ出力の差を演算してエラー信号eを出力する演算部である。16はオーディオ音がキャンセルされた話者音声より音声認識する音声認識装置である。
適応信号処理部14は、オーディオ信号x(n)を参照信号として入力されると共に、前記演算部15から出力されるエラ−信号e(n)を入力され、該エラ−信号のパワーが最小となるように適応信号処理を行って信号y(n)を出力する。適応信号処理部14は適応信号演算部14aと、FIR型のデジタルフィルタ構成の適応フィルタ14bを有している。
【0004】
適応信号演算部14aは聴取位置におけるエラー信号e(n)と参照信号としてのオーディオ信号x(n)が入力され、これらの信号を用いて聴取位置におけるオーディオ信号がキャンセルされるように適応信号演算を行って適応フィルタ14bの係数を決定する。例えば、適応信号演算部14aは周知のLMS(Least Mean Square)適応アルゴリズムに従って、エラ−信号e(n)のパワーが最小となるように適応フィルタ14bの係数を決定する。適応フィルタ14bは適応信号演算部14aにより決定された係数に従ってオーディオ信号x(n)にデジタルフィルタ処理を施して信号y(n)を出力する。従って、適応信号処理によりエラー信号e(n)のパワーが最小となるように適応フィルタ14bの係数が収束すれば、適応フィルタはスピーカからマイクロホンまでの伝達特性を模擬することになりその出力信号y(n)はマイクロホン1から出力するオーディオ信号成分と等しくなり、演算部15から話者音声のみが音声認識装置16に入力される。
【0005】
適応フィルタ14bは図9に示すように、NタップのFIR型デジタルフィルタで構成され、例えば、入力信号を順次1サンプリング時間遅延する(N-1)個の遅延要素DL1,DL2・・・DLN-1と、各遅延要素出力に係数w0(n),w1(n),w2(n)・・・wN-1(n)を乗算するN個の乗算部ML0,ML1,・・・MLN-1と、各乗算部出力を順次加算する加算部AD0,AD1・・・ADN-1で実現される。すなわち、現時刻n・Tsにおける参照信号をx(n)、その時の各乗算器の係数をw0(n),w1(n),w2(n)・・・wN-1(n)、出力信号をy(n)とすれば、適応フィルタ14bは次式 y(n)=Σiwi(n)・x(n-i) (i=0〜N-1) ・・・(1)
の演算を実行して信号y(n)を出力する。ただし、(n)は現サンプリング時刻の値、(n-1)は1サンプリング時刻前の値、(n-2)は2サンプリング時刻前の値、・・・である
【0006】
適応信号演算部14aは、現時刻から1サンプリング時刻Ts後の次の時刻 (n+1)・Tsにおける適応フィルタ14bの係数w0(n+1),w1(n+1),w2(n+1)・・・wN-1(n+1)を、現時刻n・Tsにおける係数w0(n),w1(n),w2(n)・・・wN-1(n)とエラー信号e(n)と入力信号x(n)を用いて次の係数更新式
j(n+1)=wj(n)+α・e(n)・x(n) (j=0〜N-1) ・・・(2)
により決定する。ただし、(n+1)は1サンプリング時刻後の値、αは適応フィルタ係数を更新するステップを決める定数(ステップサイズパラメータ)であり、1以下の適当な値に設定される。LMS適応アルゴリズムによる処理においては、上記演算を1サンプリング時間内に行って、信号y(n)を出力する。
【0007】
以上のように、適応信号処理部14は、オーディオ信号x(n)を参照信号、マイクロホン13から出力するオーディオ再生音に応じた信号を目標信号とし、エラー信号eのパワーが最小となるように適応フィルタ14bの係数w0(n),w1(n),w2(n)・・・wN-1(n)を更新する。すなわち、適応信号処理により、適応フィルタ14bはスピーカ12からマイクロホン13までの伝達特性Cを模擬するようになり、演算部15の出力からオーディオ再生音に応じた信号が除去される。従って、話者が音声でナビゲーションシステム等に動作を指示する際、話者音声のみが音声認識装置16に入力し、音声認識装置16は正しく音声認識することができる。
【0008】
・4スピーカのオーディオ音キャンセル装置
以上はキャンセルすべきオーディオ信号が1つのスピーカより出力する場合であるが、車室内では通常はステレオ再生であるため左右2個以上のスピーカよりオーディオ信号が出力する。図10はスピーカが4つの場合において各スピーカから出力するオーディオ信号をキャンセルするオーディオ音キャンセル装置の構成図であり、図8と同一部分には同一符号を付している。
図10において、21〜22は右側前後のスピーカであり、オーディオソースよりRチャンネルのオーディオ信号x1(n)が入力される。23〜24は左側前後のスピーカであり、オーディオソースよりLチャンネルのオーディオ信号x2(n)が入力される。25、26はそれぞれRチャンネルオーディオ信号、Lチャンネルオーディオ信号をキャンセルするための適応信号処理部、27は適応信号処理部25,26から出力する信号y1(n),y2(n)を加算する加算器である。
【0009】
適応信号処理部25は図8の適応信号処理部14と同一の適応信号処理を行なう。すなわち、適応信号処理部25はRチャンネルオーディオ信号x1(n)を参照信号、マイクロホン13により検出されるRチャンネル信号成分を目標信号とし、エラー信号e(n)のパワーが最小となるように適応フィルタ(図示せず)の係数w10(n),w11(n),w12(n)・・・w1N-1(n)を更新する。この係数の更新を繰り返すことにより、適応フィルタはスピーカ21,22からマイクロホン13までの伝達特性CRを模擬するようになり、エラー信号e(n)よりRチャンネルオーディオ音に応じた信号がキャンセルされる。
同様に、適応信号処理部26は図8の適応信号処理部14と同一の適応信号処理を行なう。すなわち、適応信号処理部26はLチャンネルオーディオ信号x2(n)を参照信号、マイクロホン13により検出されるLチャンネル信号成分を目標信号とし、エラー信号e(n)のパワーが最小となるように適応フィルタ(図示せず)の係数w20(n),w21(n),w22(n)・・・w2N-1(n)を更新する。この係数の更新を繰り返すことにより、適応フィルタはスピーカ23,24からマイクロホン13までの伝達特性CLを模擬するようになり、エラー信号e(n)よりLチャンネルオーディオ音に応じた信号がキャンセルされる。
【0010】
図10ではRチャンネルフロントスピーカ、Rチャンネルリアスピーカ共通に1つの適応信号処理部を設けた場合であるが、Rチャンネルフロントスピーカより出力するRチャンネルオーディオ信号、Rチャンネルリアスピーカより出力するRチャンネルオーディオ信号をそれぞれキャンセルするために別個に適応信号処理部を設けることもできる。同様に、Lチャンネルフロントスピーカより出力するLチャンネルオーディオ信号、Lチャンネルリアスピーカより出力するLチャンネルオーディオ信号をそれぞれキャンセルするために別個に適応信号処理部を設けることもできる。かかる場合には4つの適応信号処理部の各適応フィルタはスピーカ21〜24からマイクロホン13までの伝達特性CFR,CRR,CFL,CRLをそれぞれ模擬するようになり、エラー信号e(n)からオーディオ音が正しくキャンセルされる。
【0011】
・エコーキャンセラ
図11はハンズフリーテレフォン装置においてエコーをキャンセルするエコーキャンセラの構成図であり、31はハンズフリーテレフォン装置(HFT)であり、受話音声出力部31a、話者音声送信部31bを備えている。32は受話音声出力部より受話音声信号を入力され、受話音声を音響空間に放射するスピーカ(受話音声用スピーカ)、33は音響空間に放射された受話音声及び話者(ドライバ)の通話音声を検出するマイクロホン、34はエラー信号e(n)のパワーが最小となるように適応信号処理を行い、適応フィルタ(図示せず)の係数Wを更新する適応信号処理部、35はマイクロホンによる検出信号と適応フィルタ出力の差を演算してエラー信号e(n)を出力する演算部である。適応信号処理部34は、図8のオーディオ音キャンセルの場合と同様に適応信号処理を行ってエラー信号eから受話音声を除去する。すなわち、適応信号処理部34は、受話音声出力部から入力する受話音声信号x′(n)を参照信号、マイクロホン33により検出された受話音声信号を目標信号とし、エラー信号e(n)のパワーが最小となるように適応フィルタ(図示せず)の係数w0(n),w1(n),w2(n)・・・wN-1(n)を更新する。この係数の更新を繰り返すことにより、適応フィルタはスピーカ32からマイクロホン33までの伝達特性C′を模擬するようになり、エラー信号e(n)より受話音声に応じた信号がキャンセルされる。従って、ドライバが通話する際、ドライバの音声のみがハンズフリーテレフォン装置31の話者音声送信部31bに入力し、エコーをキャンセルすることができる。
【0012】
【発明が解決しようとする課題】
音声認識のためのオーディオキャンセル装置とHFT用のエコーキャンセラの仕組みは原理的に同じであるが、これらを統合したシステムが実現されていないのが現状である。このため、現状では、オーディオキャンセル装置、エコーキャンセラをそれぞれ別個に設けており、システムが大規模化すると共にコストアップの原因になり好ましくなかった。以下に統合できない理由を説明する。
【0013】
オーディオキャンセル装置は、音声認識のために必要なものであり、音声認識処理を行っていないときは必ずしも必要ではない。しかし、オーディオキャンセル装置でオーディオ音をキャンセルするには適応信号処理により適応フィルタの係数を更新し、適応フィルタ特性を時々刻々と変動するマイクとスピーカ間の音響的な伝達特性に近似あるいは一致させる必要がある(伝達特性の同定)。適応信号処理において、適応フィルタ係数が収束して上記伝達特性と同等の特性を示すようになるまでには時間を要する。すなわち、オーディオキャンセル装置を起動してからオーディオ音をキャンセルして正しい音声認識が可能となるまでに相当の時間を要し、その間音声認識処理を停止する必要があり、音声入力ができない問題が生じる。そこで、音声認識処理を行っていないときでもオーディオキャンセル装置に適応信号処理動作を継続させ、これにより適応フィルタ特性をマイクとスピーカ間の音響的な伝達特性と同等の特性にしておき、音声認識が必要になったとき、直ちに音声認識処理を行えるようにしている。
【0014】
オーディオキャンセル装置とエコーキャンセラを統合して適応信号処理を共通化すると、統合システムをエコーキャンセラとして使用する場合があり、システムを常時、オーディオキャンセル装置として動作させることができなくなる。オーディオキャンセルに求められるフィルタ特性(フィルタ係数)とエコーキャンセルに求められるフィルタ特性は同一であれば問題はないが、異なる。すなわち、HFTにおける相手受話音声は、通常運転席近傍のスピーカのみから出力されるが、オーディオ音は2つ以上(通常は4つ)のスピーカから出力され、オーディオキャンセルに求められるフィルタ特性とエコーキャンセルに求められるフィルタ特性は異なる。以上より、統合システムにおいて、システムをエコーキャンセラからオーディオキャンセラとして動作させる際、フィルタ特性の収束に時間を要し、直ちに音声認識処理が行えない問題が発生する。又、逆に、統合システムをオーディオキャンセラからエコーキャンセラとして動作させる際にも、フィルタ特性の収束に時間を要し、通話開始時に十分にエコーキャンセルできない問題が発生する。以上が統合できない理由である
【0015】
以上より、本発明の目的はオーディオキャンセル装置とHFT用のエコーキャンセラを統合してもオーディオ音を直ちにキャンセルして音声認識を行え、又、受話音声を直ちにキャンセルして通話開始時にエコーキャンセルを行えるようにすることである。
本発明の別の目的は、ハンズフリー通話中、全スピーカからのオーディオ再生音の出力を停止し、運転席近傍のスピーカからのみ相手受話音声を出力する場合であっても、オーディオキャンセル装置とHFT用のエコーキャンセラを統合できるようにすることである。
本発明の別の目的は、ハンズフリー通話中、助手席側のスピーカからオーディオ再生音を出力する場合であっても、オーディオキャンセル装置とHFT用のエコーキャンセラを統合できるようにすることである。
本発明の別の目的は、ハンズフリー通話中、助手席側のスピーカからオーディオ再生音を出力し、オーディオ再生音がマイクで受信されてしまう場合であっても、通話音声のSN比を低下させることなく良好なエコーキャンセルができるようにすることである。
【0016】
【課題を解決するための手段】
本発明は、スピーカ及び話者から出力する音を検出し、検出信号よりスピーカから出力する音に応じた信号を除去する不要音信号除去装置であり、(1) スピーカ及び話者から出力された音を検出して検出信号を出力する音検出部、(2) 第1の状態において第1のスピーカ群より出力された音に応じた第1の信号を適応信号処理により発生し、該第1の信号を前記検出信号より除去し、又、第2の状態において少なくとも1個の第2のスピーカ群より出力された音に応じた第2の信号を適応信号処理により発生し、該第2の信号を前記検出信号より除去する不要音信号除去部、(3) 第1の状態から第2の状態に切り替わる際、第1の状態における適応信号処理により更新されている第1のパラメータ(適応フィルタ係数)を保存する保存部を備え、(4) 不要音信号除去部は、第2の状態から第1の状態に切り替わる際、前記保存してある第1のパラメータを用いて適応信号処理を行なう。又、不要音信号除去部は、第2の状態から第1の状態に切り替わる際、第2の状態における適応信号処理により更新されている第2のパラメータを前記保存部に保存し、第1の状態から第2の状態に切り替わる際、保存してある第2のパラメータを用いて適応信号処理を行なう。
【0017】
具体的には、第2の状態はハンズフリー電話機による通話状態であり、第1の状態は第2状態以外の状態(オーディオ状態)である。第1状態における音声認識時に前記検出信号より第1の信号を除去した信号を音声認識装置に入力し、第2状態のハンズフリー通話時に前記検出信号より第2の信号を除去した信号をハンズフリー電話機に入力する。
以上のようにすれば、オーディオキャンセル装置とHFT用のエコーキャンセラを統合することができ、しかも、状態変更時であっても、オーディオ音を直ちにキャンセルして音声認識を行え、あるいは、受話音声を直ちにキャンセルして通話開始時にエコーキャンセルを行うことができる。
又、ハンズフリー電話機による通話状態(第2状態)において、助手席側のスピーカからオーディオ再生音を出力する場合であっても、オーディオ信号及び受話音声信号を検出信号より直ちにキャンセルでき、通話音声のSN比を低下させることなく良好なエコーキャンセルができる。
【0018】
【発明の実施の形態】
(A)第1実施例
(a)第1、第2状態
図1は第1実施例の状態説明図であり、自動車51の車室内には4つのスピーカ52FR,52FL,52RR,52RLが設けられている。スピーカ52FR,52RRはRチャンネルオーディオ信号が入力される車室内右側の前後のスピーカであり、スピーカ52FRは運転席53の近傍に設けられている。この運転席近傍に設けられたスピーカ52FRにはハンズフリー電話機による通話時、受話音声信号が入力される。スピーカ52FL,52RLはLチャンネルオーディオ信号が入力される車室内左側の前後のスピーカであり、スピーカ52FLは助手席54の近傍に設けられている。55は後部座席である。
【0019】
本発明では、ハンズフリー電話機による通話状態以外の状態を第1状態(オーディオ状態)、ハンズフリー電話機による通話状態を第2状態と定義する。ドライバは、ハンズフリー電話機で電話中にナビゲーション装置などに音声で動作を指示することはありえない。すなわち、音声認識は第1状態において必要になり、第2状態において必要性でない。
第1状態において、図1(A)に示すように左側スピーカ52FL,52RLにLチャンネルオーディオ信号が入力され、これらスピーカよりLチャンネルオーディオ再生音が車室内に放射される。又、右側スピーカ52FR,52RRにはRチャンネルオーディオ信号が入力され、これらスピーカよりRチャンネルオーディオ再生音が車室内に放射される。この第1状態において音声認識モードになれば、不要音信号除去部(後述)は車室内に設けた音声検出部により検出された信号よりオーディオ再生音に応じた信号を除去して音声認識装置に入力する。
第2状態においては、図1(B)に示すようにいずれのスピーカにもオーディオ信号を入力せず、運転席近傍のスピーカ52FRのみにハンズフリー電話機から受話音声信号を入力し、該スピーカより受話音声を車室内に放射する。
【0020】
(b)第1実施例の不要音信号除去装置
図2は第1実施例の不要音信号除去装置の構成図であり、第1状態の音声認識時、車室内に設けた音声検出部の検出信号よりオーディオ再生音に応じた信号を除去して音声認識装置に入力し、第2状態のハンズフリー通話時、検出信号より受話音声に応じた信号を除去してハンズフリー電話機に入力する。
オーディオソース61はLチャンネルオーディオ信号ASL、Rチャンネルオーディオ信号ASRを出力し、ハンズフリー電話機62は通話時に通信相手からの音声信号(受話音声信号)RSを出力する。又、ハンズフリー電話機62は発信時及び着信時に通話状態になったとき通話信号SPを制御部63に入力すると共に、終話状態になったとき終話信号SEを制御部63に入力する。制御部63は、通話信号SPと終話信号SEに基づいて、現状態が第1状態(通話状態以外の状態)であるか、第2状態(通話状態)であるか監視すると共に、音声認識開始/終了信号SRSEに基づいて現状態が音声認識状態であるか否かを監視する。又、制御部63は現在の状態に基づいてスイッチ64〜66及び切替器67を制御する。
【0021】
スイッチ(SW1〜SW3)64〜66は第1状態(オーディオ状態)において図1(C)に示すように動作し、オーディオ信号を各スピーカに入力する。すなわち、第1状態においてスイッチ(SW1,SE3)64、66はオンし、スイッチ(SW2)65は端子A側に切り替わる。この結果、第1状態において、Lチャンネルオーディオ信号が可変利得アンプ68FL,68RLを介して左側スピーカ52FL,52RLに入力し、Rチャンネルオーディオ信号が可変利得アンプ68FR,68RR介して右側スピーカ52FR,52RRに入力する。又、第2状態においてスイッチ64、66はオフし、スイッチ65は端子B側に切り替わる。この結果、第2状態(HFT通話状態)において、全スピーカ52FL,52RL,52FR,52RRにオーディオ信号は入力せず、運転席近傍のスピーカ52FRのみにハンズフリー電話機62から受話音声信号RSが可変利得アンプ69,68FRを介して入力する。従って、第1状態(オーディオ状態)において、左側スピーカ52FL,52RLからLチャンネルオーディオ再生音が、右側スピーカ52FR,52RRからRチャンネルオーディオ再生音が車室内に放射される。又、第2状態(通話状態)において運転席近傍のスピーカ(受話音声用スピーカ)52FRから受話音声が車室内に放射される。
【0022】
ドライバの口元近傍に設けられたマイクロホン71は車室内の音、すなわち、各スピーカから放射される音声及びドライバが発する音声を検出して音声検出信号d(n)を出力し、遅延部72は後述する適応信号処理に要する時間、例えばフィルタ91のタップ数の半分程度に相当するサンプリング時間分音声検出信号d(n)を遅延する。
不要音信号除去部73は第1の状態(オーディオ状態)において車室内スピーカ52FL,52RL,52FR,52RRより車室内に放射されたオーディオ再生音に応じた信号(推定オーディオ信号という)y(n)を適応信号処理により発生し、該推定オーディオ信号y(n)を検出信号d(n)より除去する。又、不要音信号除去部73は、第2の状態(通話状態)において受話音声用スピーカ52FRより車室内に放射された受話音声に応じた信号(推定受話音声信号という)y(n)を適応信号処理により発生し、該推定受話音声信号を検出信号d(n)より除去する。
切替器67は、制御部63かの制御信号に基づいて不要音信号除去部73から出力する信号を、第1状態の音声認識時に音声認識装置74に入力し、第2状態の通話状態時にハンズフリー電話機の送話部74に入力する。
【0023】
(c)不要音信号除去部
不要音信号除去部73において、誤差信号発生部81は、第1状態の適応信号処理により発生する推定オーディオ信号y(n)と検出信号d(n)との誤差信号e(n)を発生し、第2状態の適応信号処理により発生する推定受話音声信号y(n)と検出信号d(n)との誤差信号e(n)を発生する。
適応信号処理部82は第1状態の適応信号処理によりオーディオ信号を推定して推定オーディオ信号y(n)を出力し、第2状態の適応信号処理により受話音声信号を推定して推定受話音声信号y(n)を出力する。
フィルタ係数保存部83は、第1状態から第2状態に切り替わる際、第1状態の適応信号処理により更新されている適応フィルタ係数を保存すると共に、第2状態から第1状態に切り替わる際、第2状態の適応信号処理により更新されている適応フィルタ係数を保存する。
【0024】
(d)適応信号処理部
適応信号処理部82は、第1、第2の適応信号処理部91,92と加算器93で構成されている。加算器93は、第1状態において第1、第2の適応信号処理部91,92から出力する信号を加算して推定オーディオ信号y(n)を出力し、第2状態において第1、第2の適応信号処理部91,92から出力する信号を加算して推定受話音声信号を出力する。
第1の適応信号処理部91は図3(A)に示すように適応信号演算部91aと適応フィルタ91bを備え、第2の適応信号処理部92は図3(B)に示すように適応信号演算部92aと適応フィルタ92bを備えており、共に図8で説明した適応信号処理を実行する。
【0025】
すなわち、第1状態(オーディオ状態)において、適応信号演算部91aは、Rチャンネルオーディオ信号ASR(=x1(n))と誤差信号e(n)を用いて適応信号演算を行って適応フィルタ91bの係数値を更新し、適応フィルタ91bはRチャンネルの推定オーディオ信号y1(n)を出力する。又、適応信号演算部92aは、Lチャンネルオーディオ信号ASL(=x2(n))と誤差信号e(n)を用いて適応信号演算を行って適応フィルタ92bの係数値を更新し、適応フィルタ92bはLチャンネルの推定オーディオ信号y2(n)を出力する。加算器93は、第1状態において第1、第2の適応信号処理部91,92から出力する信号y1(n),y2(n)を加算して推定オーディオ信号y(n)を出力する。
【0026】
又、第2状態(通話状態)において、適応信号演算部91aは、受話音声信号RS(=x1(n))と誤差信号e(n)を用いて適応信号演算を行って適応フィルタ91bの係数値を更新し、適応フィルタ91bは推定受話音声信号y1(n)を出力する。又、適応信号演算部92aは、Lチャンネルオーディオ信号ASL(=x2(n)=0)と誤差信号e(n)を用いて適応信号演算を行って適応フィルタ92bの係数値を更新し、適応フィルタ92bはLチャンネルの推定オーディオ信号y2(n)=0を出力する。加算器93は、第2状態において第1、第2の適応信号処理部91,92から出力する信号y1(n),y2(n)を加算して推定受話音声信号y(n)を出力する。
【0027】
(e)全体の動作
第1状態(オーディオ状態)において、Rチャンネルオーディオ信号ASRは右側スピーカ52FR,52RRに入力し、これらスピーカよりRチャンネルオーディオ再生音が車室内に放射される。又、Lチャンネルオーディオ信号ASLは左側スピーカ52FL,52RLに入力し、これらスピーカよりLチャンネルオーディオ再生音が車室内に放射される。ドライバの口元近傍に設けられたマイクロホン71は車室内の音、すなわち、各スピーカから放射されるオーディオ再生音を検出して検出信号d(n)を出力し、遅延部72は因果性を満たすための時間分、音声検出信号d(n)を遅延する。
【0028】
適応信号処理部91の適応信号演算部91a(図3(A))は、Rチャンネルオーディオ信号ASR(=x1(n))と誤差信号e(n)を用いて適応信号処理を行って適応フィルタ91bの係数値を更新し、適応フィルタ91bはRチャンネルの推定オーディオ信号y1(n)を出力する。又、適応信号処理部92の適応信号演算部 92aは、Lチャンネルオーディオ信号ASL(=x2(n))と誤差信号e(n)を用いて適応信号演算を行って適応フィルタ92bの係数値を更新し、適応フィルタ92bはLチャンネルの推定オーディオ信号y2(n)を出力する。加算器93は、第1、第2の適応信号処理部91,92、すなわち、適応フィルタ91b,92bから出力するRチャンネルおよびLチャンネルの推定オーディオ信号y1(n),y2(n)を加算して推定オーディオ信号y(n)を出力する。
誤差信号発生部81は、適応信号処理により発生する推定オーディオ信号y(n)と検出信号d(n)との誤差信号e(n)を発生し、第1、第2の適応信号処理部91,92に入力する。
【0029】
以後、第1状態において上記適応信号処理を繰り返すことにより適応フィルタ91bの特性は右側スピーカ52FR,52RRからマイクロホン71までの伝達特性と同等の特性になる。そして、乗員の姿勢変化などにより伝達特性が変化しても常時適応信号処理を行っているため適応フィルタ91bは該伝達特性を模擬する。同様に、第1状態において適応信号処理を繰り返すことにより適応フィルタ92bの特性は左側スピーカ52FL,52RLからマイクロホン71までの伝達特性と同等の特性になる。そして、乗員の姿勢変化などにより伝達特性が変化しても常時適応信号処理を行っているため適応フィルタ92bは該伝達特性を模擬する。この結果、誤差信号発生部81の出力である誤差信号e(n)は略零になって、オーディオ信号キャンセル状態になっている。
【0030】
かかる状態において、ナビゲーション装置などに音声で指示する必要が生じればドライバは所定のスイッチを操作して音声認識モードにする。これにより制御部63は切替器67を制御し、不要音信号除去部73から出力する不要音除去信号(誤差信号)e(n)を音声認識装置74に入力する。この音声認識モードにおいて、ドライバが音声でナビゲーション装置に指示を出すと、該ドライバ音声とオーディオ再生音の合成音がマイクロホン71により検出され、検出信号d(n)が誤差信号発生部81に入力する。又、適応信号処理部82から推定オーディオ信号y(n)が誤差信号発生部81に入力する。誤差信号発生部81は検出信号d(n)から推定オーディオ信号y(n)を減算し、得られた信号を切替器67を介して音声認識装置74に入力する。前述のように推定オーディオ信号は実際のオーディオ信号とほぼ等しいため、音声認識装置74にはドライバの音声信号が入力し、音声認識装置74は正しく音声認識ができる。
【0031】
次に、状態変化時の動作を図4の処理フローに従って説明する。
第1の状態(オーディオ状態)において、制御部63はハンズフリー電話機 62に着信があり、あるいはハンズフリー電話機より発信して通話状態になったか否かを監視する(ステップ101)。ハンズフリー電話機が通話状態になれば、制御部は第1の信号処理部91に適応フィルタ91bのフィルタ係数W1(n)を係数保存部83にWtemp(n)として保存するよう指示すると共に、係数保存部 83に保存されているフィルタ係数W'(n)を読み出して適応フィルタ91bにフィルタ係数W1(n)としてセットするよう指示する。この指示に従って、第1の信号処理部91はフィルタ係数の保存および保存されている係数の読み出し/設定を実行する(ステップ102〜103)。尚、フィルタ係数W'(n)は前回の第2状態の適応信号処理により更新された最新の適応フィルタ係数である。このため、乗員の姿勢変化などにより受話音声用スピーカ52FRからマイクロホン71までの伝達特性が変動していても、この係数をセットされた適応フィルタの特性は該伝達特性に近似している。
【0032】
ついで、制御部63はスイッチ64,66をオフ、スイッチ65をB接点側に切り替える(ステップ104)。これにより、全スピーカにオーディオ信号が入力しなくなり、運転席近傍の受話音声用スピーカ52FRのみにハンズフリー電話機62から受話音声信号RSが可変利得アンプ69,68FRを介して入力し、受話音声用スピーカ52FRから受話音声が車室内に放射される。又、制御部63は切替器67を制御し、不要音信号除去部73から出力する誤差信号e(n)をハンズフリー電話機の送話器75に入力する。
【0033】
ドライバの口元近傍に設けられたマイクロホン71は車室内の音、すなわち、受話音声用スピーカ52FRから放射されるドライバの通話音声を検出して検出信号d(n)を出力し、遅延部72は因果性を満たすための時間分、音声検出信号 d(n)を遅延する。一方、適応信号演算部91aは、受話音声信号RS(=x1(n))と誤差信号e(n)を用いて適応信号演算を行って適応フィルタ91bの係数値を更新し、適応フィルタ91bは推定受話音声信号y1(n)を出力する。又、適応信号演算部92aは、Lチャンネルオーディオ信号ASL(=x2(n)=0)と誤差信号e(n)を用いて適応信号演算を行って適応フィルタ92bの係数値を更新し、適応フィルタ92bはLチャンネルの推定オーディオ信号y2(n)=0を出力する。加算器93は、第2状態において第1、第2の適応信号処理部91,92から出力する信号y1(n),y2(n)を加算して推定受話音声信号y(n)を出力する。
誤差信号発生部81は、適応信号処理により発生する推定受話音声信号y(n)と検出信号d(n)との誤差信号e(n)を発生し、第1、第2の適応信号処理部91,92に入力する。以後、第2状態において上記適応信号処理を繰り返すことにより適応フィルタ91bの特性は受話音声用スピーカ52FRからマイクロホン71までの伝達特性と同等の特性になる。この場合、適応フィルタ91bに前回の第2状態において求めてある最新のフィルタ係数W'(n)を設定して適応信号処理を行うため、短時間で適応フィルタ91bの特性は該伝達特性と同等の特性になる。
【0034】
この結果、第1状態から第2状態に切り替わると、直ちに、検出信号d(n)より推定受話音声信号y(n)が除去され、ドライバの音声に応じた信号のみが送話器75に入力してエコーキャンセルを実現できる(ステップ105)。
以後、制御部63は通話が終了したか監視し(ステップ106)、通話が終了すれば、第1の適応信号処理部91に対し、適応フィルタ91bの係数W1(n)をW'(n)として係数保存部83に保存し、係数保存部83に保存してある係数Wtemp(n)を適応フィルタ91bにW1(n)としてセットするよう指示する。この指示により、第1の信号処理部91はフィルタ係数の保存および保存されている係数の読み出し/設定を実行する(ステップ107,108)。尚、フィルタ係数Wtemp(n)は前回の第1状態において更新された最新の適応フィルタ係数であり、前回の第1状態における右側スピーカ52FR,52RRからマイクロホン71までの伝達特性を模擬する係数である。従って、乗員の姿勢変化などにより上記伝達特性が若干変動していたとしても、この係数をセットされた適応フィルタ特性は該伝達特性に近似している。
【0035】
ついで、制御部63はスイッチ64,66をオン、スイッチ65をA接点側に切り替える。又、制御部63は切替器67を制御し、不要音信号除去部73から出力する誤差信号e(n)を音声認識装置74に入力する(ステップ109)。
以上により、左側スピーカにLチャンネルオーディオ信号が入力され、右側スピーカにRチャンネルオーディオ信号が入力され、各スピーカからオーディオ再生音が車室内に放射される。以後、前述の第1状態におけるオーディオ音キャンセル処理が行われる。この場合、適応フィルタ91bに前回の第1状態において求めてあるフィルタ係数Wtemp(n)を設定して適応信号処理を行うため、乗員の姿勢変化などにより右側スピーカからマイクロホンまでの伝達特性が変動していても、短時間で適応フィルタ91bの特性は該伝達特性と同等の特性になり、検出信号よりオーディオ再生音に応じた信号をキャンセルする(ステップ110)。以後、はじめに戻って以降の処理が繰り返される。
【0036】
以上、第1実施例によれば、オーディオキャンセル装置とHFT用のエコーキャンセラを統合でき、しかも、フィルタ係数を保存しておき必要時に読み出して適応信号処理を継続するため、音声認識時にオーディオ音を直ちにキャンセルして音声認識を行え、又、ハンズフリー通話時に受話音声を直ちにキャンセルしてエコーキャンセルを行うことができる。
又、第1実施例によれば、通話中、全スピーカからのオーディオ再生音の出力を停止し、かつ、運転席部のスピーカから相手受話音声を出力する構成であっても、オーディオキャンセル装置とHFT用のエコーキャンセラを統合することができる。
【0037】
(B)第2実施例
第1実施例ではハンズフリー通話状態(第2の状態)において全スピーカからオーディオ再生音の出力を停止する場合であるが、第2実施例はオーディオ再生音を聴取しながら電話できるようにしたものである。
図5は第2実施例の状態説明図であり、図1と同一部分には同一符号を付している。第2実施例においては、第1状態はハンズフリー電話機による通話状態以外の状態であり、第2状態はハンズフリー電話機による通話状態である。
【0038】
第2実施例の第1状態は第1実施例の第1状態と同様に、図5(A)に示すように左側スピーカ52FL,52RLにLチャンネルオーディオ信号が入力され、これらスピーカよりLチャンネルオーディオ再生音が車室内に放射される。又、右側スピーカ52FR,52RRにはRチャンネルオーディオ信号が入力され、これらスピーカよりRチャンネルオーディオ再生音が車室内に放射される。第1状態において音声認識モードになれば、不要音信号除去部は車室内に設けた音声検出部により検出された信号よりオーディオ再生音に応じた信号を除去して音声認識装置に入力する。
第2状態においては、図5(B)に示すように左側スピーカ52FL,52RLにLチャンネルオーディオ信号が入力され、これらスピーカよりLチャンネルオーディオ再生音が車室内に放射される。しかし、運転席と同じ側の右側スピーカ52FR,52RRにはオーディオ信号は入力されず、運転席近傍のスピーカ(受話音声用スピーカ)52FRのみにハンズフリー電話機から受話音声信号が入力し、該スピーカより受話音声が車室内に放射される。
【0039】
図6は第2実施例の不要音信号除去装置の構成図であり、図2の第1実施例と異なる点は、第1実施例のスイッチ64を除去した点であり、これにより第2状態のハンズフリー通話時、左側スピーカ52FL,52RLにLチャンネルオーディオ信号を入力し、受話音声用スピーカ52FRにハンズフリー電話機から受話音声信号を入力することができる。
図7は状態変化時の第2実施例の処理フローである。尚、第1状態における動作は第1実施例とまったく同じであるため説明は省略する。
【0040】
第1の状態(オーディオ状態)において、制御部63はハンズフリー電話機 62に着信があり、あるいはハンズフリー電話機より発信して通話状態になったか否かを監視する(ステップ201)。ハンズフリー電話機が通話状態になれば、制御部は第1の信号処理部91に対し、適応フィルタ91bのフィルタ係数W1(n)を係数保存部83にWtemp(n)として保存するよう指示すると共に、係数保存部 83に保存されているフィルタ係数W'(n)を読み出して適応フィルタ91bにフィルタ係数W1(n)としてセットするよう指示する。この指示に従って、第1の信号処理部91はフィルタ係数の保存および保存されている係数の読み出し/設定を実行する(ステップ202〜203)。尚、フィルタ係数W'(n)は前回の第2状態の適応信号処理により更新された最新の適応フィルタ係数である。このため、乗員の姿勢変化などにより受話音声用スピーカ52FRからマイクロホンまでの伝達特性が変動していても、この係数をセットされた適応フィルタ特性は該伝達特性に近似している。
【0041】
ついで、制御部63は図5(C)に示すようにスイッチ(SW2)66をオフ、スイッチ(SW1)65をB接点側に切り替える(ステップ204)。これにより、継続して左側スピーカ52FL,52RLにLチャンネルオーディオ信号が入力されるが、右側スピーカ52FR,52RRにはオーディオ信号は入力されず、受話音声用スピーカ52FRにハンズフリー電話機62から受話音声信号RSが可変利得アンプ69,68FRを介して入力し、受話音声用スピーカ52FRから受話音声が車室内に放射される。又、制御部63は切替器67を制御し、不要音信号除去部73から出力する誤差信号e(n)をハンズフリー電話機の送話器75に入力する。
【0042】
ドライバの口元近傍に設けられたマイクロホン71は車室内の音、すなわち、Lチャンネルスピーカから放射するLチャンネルオーディオ再生音と受話音声用スピーカ52FRから放射されるドライバの通話音声を検出して検出信号d(n)を出力し、遅延部72は適応信号処理に要する時間分、音声検出信号d(n)を遅延する。一方、適応信号演算部91aは、受話音声信号RS(=x1(n))と誤差信号 e(n)を用いて適応信号演算を行って適応フィルタ91bの係数値を更新し、適応フィルタ91bは推定受話音声信号y1(n)を出力する。又、適応信号演算部92aは、Lチャンネルオーディオ信号ASL(=x2(n))と誤差信号e(n)を用いて適応信号演算を行って適応フィルタ92bの係数値を更新し、適応フィルタ92bはLチャンネルの推定オーディオ信号y2(n)を出力する。加算器93は、第2状態において第1、第2の適応信号処理部91,92から出力する信号y1(n), y2(n)を加算して推定合成音信号y(n)を出力する。
【0043】
誤差信号発生部81は、適応信号処理により発生する推定合成音信号y(n)と検出信号d(n)との誤差信号e(n)を発生し、第1、第2の適応信号処理部91,92に入力する。以後、第2状態において上記適応信号処理を繰り返すことにより適応フィルタ91bの特性は受話音声用スピーカ52FRからマイクロホン71までの伝達特性と同等の特性になる。又、適応フィルタ92bの特性は左側スピーカ52FL,52RLからマイクロホン71までの伝達特性と同等の特性になる。この場合、適応フィルタ91bに前回の第2状態において求めてあるフィルタ係数W'(n)を設定して適応信号処理を行うため、乗員の姿勢変化などにより上記伝達特性が若干変化していても短時間で適応フィルタ91bの特性は該伝達特性と同等の特性になる。この結果、第1状態から第2状態に切り替わると、直ちに、検出信号d(n)より推定合成音信号y(n)が除去され、ドライバの音声に応じた信号のみが送話器75に入力してエコーキャンセルを実現できる(ステップ205)。
【0044】
以後、制御部63は通話が終了したか監視し(ステップ206)、通話が終了すれば第1の適応信号処理部91に対し、適応フィルタ91bの係数W1(n)を W'(n)として係数保存部83に保存し、係数保存部83に保存してある係数 Wtemp(n)を適応フィルタ91bにW1(n)としてセットするよう指示する。この指示に従って、第1の信号処理部91はフィルタ係数の保存および保存されている係数の読み出し/設定を実行する(ステップ207,208)。尚、フィルタ係数Wtemp(n)は前回の第1状態において更新された最新の適応フィルタ係数であり、前回の第1状態における右側スピーカ52FR,52RRからマイクロホンまでの伝達特性を模擬する。従って、乗員の姿勢変化などにより上記伝達特性が若干変動していたとしても、この係数をセットされた適応フィルタの特性は該伝達特性に近似している。
ついで、制御部63はスイッチ(SW2)66をオン、スイッチ(SW1)65をA接点側に切り替える。又、制御部63は切替器67を制御し、不要音信号除去部73から出力する誤差信号e(n)を音声認識装置74に入力する(ステップ209)。
【0045】
以上により、左側スピーカにLチャンネルオーディオ信号が入力され、右側スピーカにRチャンネルオーディオ信号が入力され、各スピーカからオーディオ再生音が車室内に放射される。以後、第1状態におけるオーディオ音キャンセル処理が行われる。この場合、適応フィルタ91bに前回の第1状態において求めてあるフィルタ係数Wtemp(n)を設定して適応信号処理を行うため、乗員の姿勢変化などにより右側スピーカからマイクロホンまでの伝達特性が変動していても、短時間で適応フィルタ91bの特性は該伝達特性と同等の特性になり、検出信号よりオーディオ再生音に応じた信号をキャンセルする(ステップ210)。
第2実施例によれば、オーディオキャンセル装置とHFT用のエコーキャンセラを統合でき、しかも、フィルタ係数を保存しておき必要時に読み出して適応信号処理を継続するため、音声認識時にオーディオ音を直ちにキャンセルして音声認識を行え、又、ハンズフリー通話時に受話音声を直ちにキャンセルしてエコーキャンセルを行うことができる。
【0046】
又、第2実施例によれば、ハンズフリー通話中、助手席側のスピーカからオーディオ再生音を出力する構成であっても、オーディオキャンセル装置とHFT用のエコーキャンセラを統合することができる。この場合、第2実施例によれば、Lチャンネルのオーディオキャンセル処理と通話音声のエコーキャンセル処理が同時にできる。
以上では、第1の状態をオーディオ状態、第2の状態を通話状態として説明したが、第1、第2の状態は実施例に限定されるものではない。
以上では、運転席が右側に存在する車両について説明したが、左側に存在する車両にも本発明を適用できることは勿論である。
以上、本発明を実施例により説明したが、本発明は請求の範囲に記載した本発明の主旨に従い種々の変形が可能であり、本発明はこれらを排除するものではない。
【0047】
【発明の効果】
以上本発明によれば、オーディオキャンセル装置とHFT用のエコーキャンセラを統合でき、この結果、装置規模を小型化でき、しかも、安価な構成とすることができる。
又、本発明によれば、フィルタ係数を保存しておき必要時に読み出して適応信号処理を継続するため、音声認識時にオーディオ音を直ちにキャンセルして音声認識を行え、又、ハンズフリー通話時に受話音声を直ちにキャンセルしてエコーキャンセルを行うことができる。
【0048】
又、本発明によれば、ハンズフリー通話中、全スピーカからのオーディオ再生音の出力を停止し、かつ、運転席部のスピーカから相手受話音声を出力する構成であっても、オーディオキャンセル装置とHFT用のエコーキャンセラを統合することができる。
又、本発明によれば、ハンズフリー通話中、助手席側のスピーカからオーディオ再生音を出力する構成であっても、オーディオキャンセル装置とHFT用のエコーキャンセラを統合することができ、Lチャンネルのオーディオキャンセル処理と通話音声のエコーキャンセル処理が同時にできる。
【図面の簡単な説明】
【図1】第1実施例の状態説明図である。
【図2】第1実施例の不要音信号除去装置の構成図である。
【図3】適応信号処理部の構成図である。
【図4】第1実施例の状態変化時の処理フローである。
【図5】第2実施例の状態説明図である。
【図6】第2実施例の不要音信号除去装置の構成図である。
【図7】第2実施例の状態変化時の処理フローである。
【図8】従来のオーディオ音キャンセル装置の構成図である。
【図9】適応フィルタの構成図である。
【図10】車室内スピーカのオーディオ音キャンセル装置の構成図である。
【図11】エコーキャンセラーの構成図である。
【符号の説明】
52FL,52RL,52FR,52RR・・スピーカ
61・・オーディオソース
62・・ハンズフリー電話機
63・・制御部
64〜66・・スイッチ
67・・切替器
71・・マイクロホン
73・・不要音信号除去部
74・・音声認識装置
75・・ハンズフリー電話機の送話部
81・・誤差信号発生部
82・・適応信号処理部
83・・フィルタ係数保存部
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an unnecessary sound signal removing device, and in particular, an unnecessary sound signal removing device that detects sound output from a speaker and a speaker into a vehicle interior and removes an unnecessary sound signal corresponding to sound output from the speaker from a detection signal. About.
[0002]
[Prior art]
In recent years, speech recognition apparatuses have become common as human interfaces (input / output means) for in-vehicle devices such as navigation systems. However, the speech recognition apparatus has a problem that the recognition performance is deteriorated due to the influence of disturbances other than the speech to be recognized (vehicle running noise and audio reproduction sound), and various noise countermeasures are realized. As an example, there has been proposed an audio sound canceling apparatus that removes (suppresses) audio reproduction sound in a vehicle interior from a microphone reception signal.
In recent years, due to the explosive spread of mobile phones, accidents caused by calls while driving have increased, and from the viewpoint of safety, calls using mobile phones while traveling are prohibited by law. For this reason, a hands-free telephone device (HFT) capable of making a call without removing the handset has become widespread. In HFT, sound is output from a speaker of an audio system, and a so-called echo phenomenon occurs in which a call partner's voice reproduced and output from this speaker is detected by a microphone and transmitted to a communication partner. For this reason, echo cancellers for removing such echoes have been put into practical use.
[0003]
・ Audio sound canceling device
FIG. 8 is a configuration diagram of a conventional audio sound canceling apparatus, in which 11 is an audio source, 12 is an audio signal input, a speaker that radiates audio sound into the acoustic space, and 13 is an audio sound and speech radiated into the acoustic space. A microphone for detecting a speaker voice from a speaker, 14 an adaptive signal processing unit for performing adaptive signal processing so that the power of the error signal e is minimized, and updating a coefficient W of the adaptive filter, and 15 a signal detected by the microphone. It is a calculation part which calculates the difference of an adaptive filter output and outputs the error signal e. Reference numeral 16 denotes a voice recognition device that recognizes voice from a speaker voice whose audio sound has been canceled.
The adaptive signal processing unit 14 is input with the audio signal x (n) as a reference signal and the error signal e (n) output from the arithmetic unit 15, and the power of the error signal is minimized. The adaptive signal processing is performed so that the signal y (n) is output. The adaptive signal processing unit 14 includes an adaptive signal calculation unit 14a and an adaptive filter 14b having a FIR type digital filter configuration.
[0004]
The adaptive signal calculation unit 14a receives the error signal e (n) at the listening position and the audio signal x (n) as a reference signal, and uses these signals to cancel the audio signal at the listening position. To determine the coefficient of the adaptive filter 14b. For example, the adaptive signal calculation unit 14a determines a coefficient of the adaptive filter 14b according to a known LMS (Least Mean Square) adaptive algorithm so that the power of the error signal e (n) is minimized. The adaptive filter 14b performs digital filter processing on the audio signal x (n) according to the coefficient determined by the adaptive signal calculation unit 14a and outputs a signal y (n). Therefore, if the coefficient of the adaptive filter 14b converges so that the power of the error signal e (n) is minimized by the adaptive signal processing, the adaptive filter simulates the transfer characteristic from the speaker to the microphone, and the output signal y (n) is equal to the audio signal component output from the microphone 1, and only the speaker voice is input from the calculation unit 15 to the voice recognition device 16.
[0005]
As shown in FIG. 9, the adaptive filter 14b is composed of an N-tap FIR digital filter, and for example, (N-1) delay elements DL that sequentially delay the input signal by one sampling time. 1 , DL 2 ... DL N-1 And a coefficient w for each delay element output 0 (n), w 1 (n), w 2 (n) ... w N-1 N multipliers ML for multiplying (n) 0 , ML 1 ・ ・ ・ ・ ・ ・ ML N-1 And an adder AD that sequentially adds the outputs of each multiplier 0 , AD 1 ... AD N-1 It is realized with. That is, the reference signal at the current time n · Ts is x (n), and the coefficient of each multiplier at that time is w 0 (n), w 1 (n), w 2 (n) ... w N-1 (n), where y (n) is the output signal, the adaptive filter 14b is given by the following equation y (n) = Σ i wi (n) x (ni) (i = 0 to N-1) (1)
And the signal y (n) is output. However, (n) is a value at the current sampling time, (n-1) is a value before one sampling time, (n-2) is a value before two sampling times, and so on.
[0006]
The adaptive signal calculation unit 14a calculates the coefficient w of the adaptive filter 14b at the next time (n + 1) · Ts one sampling time Ts after the current time. 0 (n + 1), w 1 (n + 1), w 2 (n + 1) ... w N-1 (n + 1) is the coefficient w at the current time n · Ts 0 (n), w 1 (n), w 2 (n) ... w N-1 (n), error signal e (n), and input signal x (n)
w j (n + 1) = w j (n) + α · e (n) · x (n) (j = 0 to N-1) (2)
Determined by However, (n + 1) is a value after one sampling time, α is a constant (step size parameter) that determines the step of updating the adaptive filter coefficient, and is set to an appropriate value of 1 or less. In the processing by the LMS adaptive algorithm, the above calculation is performed within one sampling time, and a signal y (n) is output.
[0007]
As described above, the adaptive signal processing unit 14 uses the audio signal x (n) as the reference signal and the signal corresponding to the audio reproduction sound output from the microphone 13 as the target signal so that the power of the error signal e is minimized. Coefficient w of adaptive filter 14b 0 (n), w 1 (n), w 2 (n) ... w N-1 Update (n). That is, by the adaptive signal processing, the adaptive filter 14b simulates the transfer characteristic C from the speaker 12 to the microphone 13, and a signal corresponding to the audio reproduction sound is removed from the output of the arithmetic unit 15. Therefore, when the speaker instructs the navigation system or the like by voice, only the speaker's voice is input to the voice recognition device 16, and the voice recognition device 16 can correctly recognize the voice.
[0008]
・ 4-speaker audio sound canceling device
The above is the case where the audio signal to be canceled is output from one speaker. However, since the stereo reproduction is usually performed in the vehicle interior, the audio signal is output from two or more left and right speakers. FIG. 10 is a configuration diagram of an audio sound canceling apparatus that cancels an audio signal output from each speaker when there are four speakers. The same parts as those in FIG. 8 are denoted by the same reference numerals.
In FIG. 10, reference numerals 21 to 22 denote right and left speakers, which are R channel audio signals x from the audio source. 1 (n) is input. Reference numerals 23 to 24 denote left and right speakers, which are L channel audio signals x from the audio source. 2 (n) is input. Reference numerals 25 and 26 denote adaptive signal processing units for canceling the R channel audio signal and the L channel audio signal, respectively. 27 denotes a signal y output from the adaptive signal processing units 25 and 26. 1 (n), y 2 This is an adder for adding (n).
[0009]
The adaptive signal processing unit 25 performs the same adaptive signal processing as the adaptive signal processing unit 14 of FIG. That is, the adaptive signal processing unit 25 performs the R channel audio signal x 1 The coefficient w of the adaptive filter (not shown) is set so that the power of the error signal e (n) is minimized with (n) as the reference signal and the R channel signal component detected by the microphone 13 as the target signal. Ten (n), w 11 (n), w 12 (n) ... w 1N-1 Update (n). By repeatedly updating this coefficient, the adaptive filter transfers the transfer characteristic C from the speakers 21 and 22 to the microphone 13. R The signal corresponding to the R channel audio sound is canceled from the error signal e (n).
Similarly, the adaptive signal processing unit 26 performs the same adaptive signal processing as the adaptive signal processing unit 14 of FIG. That is, the adaptive signal processing unit 26 performs the L channel audio signal x 2 The coefficient w of the adaptive filter (not shown) is set so that the power of the error signal e (n) is minimized with (n) as the reference signal and the L channel signal component detected by the microphone 13 as the target signal. 20 (n), w twenty one (n), w twenty two (n) ... w 2N-1 Update (n). By repeatedly updating this coefficient, the adaptive filter transfers the transfer characteristic C from the speakers 23 and 24 to the microphone 13. L The signal corresponding to the L channel audio sound is canceled from the error signal e (n).
[0010]
FIG. 10 shows a case where one adaptive signal processing unit is provided in common for the R channel front speaker and the R channel rear speaker, but the R channel audio signal output from the R channel front speaker and the R channel audio output from the R channel rear speaker. A separate adaptive signal processing unit may be provided to cancel each signal. Similarly, an adaptive signal processing unit can be separately provided to cancel the L channel audio signal output from the L channel front speaker and the L channel audio signal output from the L channel rear speaker. In such a case, each of the adaptive filters of the four adaptive signal processing units has a transfer characteristic C from the speakers 21 to 24 to the microphone 13. FR , C RR , C FL , C RL And the audio sound is correctly canceled from the error signal e (n).
[0011]
・ Echo canceller
FIG. 11 is a configuration diagram of an echo canceller that cancels echoes in the hands-free telephone device. Reference numeral 31 denotes a hands-free telephone device (HFT), which includes a received voice output unit 31a and a speaker voice transmission unit 31b. 32 is a speaker that receives a received voice signal from the received voice output unit and radiates the received voice to the acoustic space (speaker for received voice), and 33 is the received voice radiated to the acoustic space and the voice of the speaker (driver). The detecting microphone 34 performs adaptive signal processing so that the power of the error signal e (n) is minimized, and an adaptive signal processing unit 35 updates the coefficient W of an adaptive filter (not shown). 35 is a detection signal by the microphone. And an error signal e (n) by calculating the difference between the output and the adaptive filter output. The adaptive signal processing unit 34 performs adaptive signal processing in the same manner as in the case of audio sound cancellation in FIG. 8 to remove the received voice from the error signal e. That is, the adaptive signal processing unit 34 uses the received voice signal x ′ (n) input from the received voice output unit as a reference signal, the received voice signal detected by the microphone 33 as a target signal, and the power of the error signal e (n). The coefficient w of the adaptive filter (not shown) so that is minimized 0 (n), w 1 (n), w 2 (n) ... w N-1 Update (n). By repeating this coefficient update, the adaptive filter simulates the transfer characteristic C ′ from the speaker 32 to the microphone 33, and the signal corresponding to the received voice is canceled from the error signal e (n). Therefore, when the driver makes a call, only the voice of the driver can be input to the speaker voice transmission unit 31b of the hands-free telephone device 31, and the echo can be canceled.
[0012]
[Problems to be solved by the invention]
The mechanism of the audio cancel device for speech recognition and the echo canceller for HFT is the same in principle, but a system in which these are integrated has not been realized. For this reason, at present, an audio canceling device and an echo canceller are provided separately, which is not preferable because the system becomes large and costs increase. The reason why it cannot be integrated is explained below.
[0013]
The audio cancel device is necessary for voice recognition, and is not necessarily required when voice recognition processing is not performed. However, in order to cancel the audio sound with the audio canceling device, it is necessary to update the coefficient of the adaptive filter by adaptive signal processing and approximate or match the adaptive filter characteristic with the acoustic transfer characteristic between the microphone and the speaker that changes every moment. There is (identification of transfer characteristics). In the adaptive signal processing, it takes time until the adaptive filter coefficients converge and exhibit the same characteristics as the above transfer characteristics. That is, it takes a considerable time from the start of the audio cancel device to canceling the audio sound and enabling correct speech recognition, and during that time it is necessary to stop the speech recognition processing, resulting in a problem that speech input cannot be performed. . Therefore, even when voice recognition processing is not performed, the audio canceling apparatus continues the adaptive signal processing operation, so that the adaptive filter characteristic is set to a characteristic equivalent to the acoustic transfer characteristic between the microphone and the speaker, and the voice recognition is performed. When necessary, voice recognition processing can be performed immediately.
[0014]
If an audio canceling device and an echo canceller are integrated to share adaptive signal processing, the integrated system may be used as an echo canceller, and the system cannot be operated as an audio canceling device at all times. There is no problem as long as the filter characteristics (filter coefficients) required for audio cancellation and the filter characteristics required for echo cancellation are the same, but they are different. That is, the other party's received voice in HFT is output from only speakers near the normal driver's seat, but audio sound is output from two or more (usually four) speakers, and the filter characteristics and echo cancellation required for audio cancellation. Different filter characteristics are required. As described above, in the integrated system, when the system is operated from the echo canceller to the audio canceller, it takes time to converge the filter characteristics, and there arises a problem that voice recognition processing cannot be performed immediately. On the contrary, when the integrated system is operated from the audio canceller as an echo canceller, it takes time to converge the filter characteristics, and there arises a problem that the echo cannot be sufficiently canceled at the start of a call. This is why you cannot integrate
[0015]
As described above, the object of the present invention is to immediately cancel the audio sound and perform voice recognition even if the audio cancel device and the echo canceller for HFT are integrated, and to cancel the received voice immediately and perform echo cancellation at the start of the call. Is to do so.
Another object of the present invention is to stop the output of audio playback sound from all speakers during a hands-free call, and to output the other party's received voice only from the speakers near the driver's seat. It is to be able to integrate an echo canceller for use.
Another object of the present invention is to enable integration of an audio cancellation device and an HFT echo canceller even when audio reproduction sound is output from a passenger side speaker during a hands-free call.
Another object of the present invention is to reduce the signal-to-noise ratio of call speech even when audio playback sound is output from a speaker on the passenger seat side during a hands-free call and the audio playback sound is received by a microphone. It is to enable good echo cancellation without any problems.
[0016]
[Means for Solving the Problems]
The present invention is an unnecessary sound signal removing device that detects a sound output from a speaker and a speaker and removes a signal corresponding to the sound output from the speaker from a detection signal. (1) Output from the speaker and the speaker A sound detection unit for detecting sound and outputting a detection signal; (2) generating a first signal according to the sound output from the first speaker group in the first state by adaptive signal processing; The second signal corresponding to the sound output from at least one second speaker group in the second state is generated by adaptive signal processing in the second state. (3) a first parameter (adaptive filter) updated by adaptive signal processing in the first state when switching from the first state to the second state; (4) Yooto signal removal unit, when switching from the second state to the first state, the adaptive signal processing using the first parameter that is to the storage. In addition, when the unnecessary sound signal removing unit switches from the second state to the first state, the unnecessary sound signal removing unit stores the second parameter updated by the adaptive signal processing in the second state in the storage unit, When the state is switched to the second state, adaptive signal processing is performed using the stored second parameter.
[0017]
Specifically, the second state is a call state using a hands-free telephone, and the first state is a state other than the second state (audio state). A signal obtained by removing the first signal from the detection signal at the time of voice recognition in the first state is input to the voice recognition device, and a signal obtained by removing the second signal from the detection signal at the time of the hands-free call in the second state. Type on the phone.
In this way, the audio cancel device and the HFT echo canceller can be integrated, and even when the state is changed, the audio sound can be immediately canceled and voice recognition can be performed, or the received voice can be Cancel immediately and perform echo cancellation at the beginning of the call.
Further, even when audio playback sound is output from the speaker on the passenger seat side in the call state (second state) by the hands-free telephone, the audio signal and the received voice signal can be canceled immediately from the detection signal, Good echo cancellation can be performed without reducing the S / N ratio.
[0018]
DETAILED DESCRIPTION OF THE INVENTION
(A) First embodiment
(A) First and second states
FIG. 1 is an explanatory diagram of the state of the first embodiment. FR , 52 FL , 52 RR , 52 RL Is provided. Speaker 52 FR , 52 RR Are front and rear speakers on the right side of the vehicle interior to which the R channel audio signal is input. FR Is provided in the vicinity of the driver's seat 53. Speaker 52 provided near the driver's seat FR Is a received voice signal during a call using a hands-free telephone. Speaker 52 FL , 52 RL Are front and rear speakers on the left side of the vehicle interior to which an L channel audio signal is input. FL Is provided in the vicinity of the passenger seat 54. Reference numeral 55 denotes a rear seat.
[0019]
In the present invention, a state other than a call state with a hands-free telephone is defined as a first state (audio state), and a call state with a hands-free telephone is defined as a second state. The driver cannot instruct the navigation device or the like to operate by voice during a call with a hands-free telephone. That is, voice recognition is required in the first state and not necessary in the second state.
In the first state, as shown in FIG. FL , 52 RL The L channel audio signal is input to the speaker, and the L channel audio reproduction sound is radiated from the speakers into the vehicle interior. The right speaker 52 FR , 52 RR The R channel audio signal is input to R, and the R channel audio reproduction sound is radiated from the speakers into the vehicle interior. If the voice recognition mode is set in this first state, an unnecessary sound signal removal unit (described later) removes a signal corresponding to the audio reproduction sound from the signal detected by the voice detection unit provided in the vehicle interior, and the voice recognition apparatus input.
In the second state, as shown in FIG. 1B, the audio signal is not input to any speaker, and the speaker 52 near the driver's seat is used. FR Only the reception voice signal is input from the hands-free telephone, and the reception voice is radiated from the speaker into the vehicle interior.
[0020]
(B) Unnecessary sound signal removing apparatus of the first embodiment
FIG. 2 is a block diagram of the unnecessary sound signal removing apparatus according to the first embodiment. During the speech recognition in the first state, the signal corresponding to the audio reproduction sound is removed from the detection signal of the voice detection unit provided in the vehicle interior. When a hands-free call in the second state is input to the voice recognition device, a signal corresponding to the received voice is removed from the detection signal and input to the hands-free telephone.
The audio source 61 is an L channel audio signal AS L , R channel audio signal AS R The hands-free telephone 62 outputs a voice signal (received voice signal) RS from the communication partner during a call. Further, the hands-free telephone 62 inputs the call signal SP to the control unit 63 when it enters a call state at the time of outgoing and incoming calls, and also inputs the end signal SE to the control unit 63 when it enters the call end state. Based on the call signal SP and the call end signal SE, the control unit 63 monitors whether the current state is the first state (a state other than the call state) or the second state (the call state) and recognizes the voice. Based on the start / end signal SRSE, it is monitored whether or not the current state is a voice recognition state. The control unit 63 controls the switches 64 to 66 and the switch 67 based on the current state.
[0021]
The switches (SW1 to SW3) 64 to 66 operate as shown in FIG. 1C in the first state (audio state), and input an audio signal to each speaker. That is, in the first state, the switches (SW1, SE3) 64 and 66 are turned on, and the switch (SW2) 65 is switched to the terminal A side. As a result, in the first state, the L channel audio signal is converted into the variable gain amplifier 68. FL , 68 RL Left speaker 52 via FL , 52 RL The R channel audio signal is input to the variable gain amplifier 68. FR , 68 RR Right speaker 52 FR , 52 RR To enter. In the second state, the switches 64 and 66 are turned off, and the switch 65 is switched to the terminal B side. As a result, in the second state (HFT call state), all the speakers 52 FL , 52 RL , 52 FR , 52 RR No audio signal is input to the speaker 52 near the driver's seat. FR Only the received voice signal RS from the hands-free telephone 62 is variable gain amplifiers 69 and 68. FR Enter through. Therefore, in the first state (audio state), the left speaker 52 FL , 52 RL L channel audio playback sound from the right speaker 52 FR , 52 RR R channel audio reproduction sound is emitted from the vehicle interior. In the second state (calling state), a speaker near the driver's seat (speaker for received voice) 52 FR The incoming voice is radiated into the passenger compartment.
[0022]
The microphone 71 provided in the vicinity of the driver's mouth detects the sound in the vehicle interior, that is, the sound emitted from each speaker and the sound emitted by the driver, and outputs the sound detection signal d (n). The delay unit 72 is described later. The audio detection signal d (n) is delayed by a sampling time corresponding to the time required for the adaptive signal processing to be performed, for example, about half the number of taps of the filter 91.
The unnecessary sound signal removing unit 73 is the vehicle interior speaker 52 in the first state (audio state). FL , 52 RL , 52 FR , 52 RR A signal (referred to as an estimated audio signal) y (n) corresponding to the audio reproduction sound radiated into the passenger compartment is generated by adaptive signal processing, and the estimated audio signal y (n) is removed from the detection signal d (n). . Further, the unnecessary sound signal removing unit 73 receives the received voice speaker 52 in the second state (call state). FR A signal (referred to as an estimated received voice signal) y (n) corresponding to the received voice radiated into the passenger compartment is generated by adaptive signal processing, and the estimated received voice signal is removed from the detected signal d (n).
The switch 67 inputs a signal output from the unnecessary sound signal removal unit 73 based on the control signal from the control unit 63 to the voice recognition device 74 during the voice recognition in the first state, and hands in the voice state in the second state. Input to the transmitter 74 of the free telephone.
[0023]
(C) Unnecessary sound signal removal unit
In the unnecessary sound signal removing unit 73, the error signal generating unit 81 generates an error signal e (n) between the estimated audio signal y (n) generated by the adaptive signal processing in the first state and the detection signal d (n). Then, an error signal e (n) between the estimated received voice signal y (n) and the detection signal d (n) generated by the adaptive signal processing in the second state is generated.
The adaptive signal processing unit 82 estimates the audio signal by the adaptive signal processing in the first state and outputs an estimated audio signal y (n), estimates the received voice signal by the adaptive signal processing in the second state, and estimates the received voice signal. Output y (n).
When switching from the first state to the second state, the filter coefficient storage unit 83 stores the adaptive filter coefficient updated by the adaptive signal processing in the first state, and at the time of switching from the second state to the first state, The adaptive filter coefficient updated by the two-state adaptive signal processing is stored.
[0024]
(D) Adaptive signal processing unit
The adaptive signal processing unit 82 includes first and second adaptive signal processing units 91 and 92 and an adder 93. The adder 93 adds the signals output from the first and second adaptive signal processing units 91 and 92 in the first state and outputs an estimated audio signal y (n). In the second state, the adder 93 outputs the first and second signals. The signals output from the adaptive signal processing units 91 and 92 are added to output an estimated received voice signal.
As shown in FIG. 3A, the first adaptive signal processing unit 91 includes an adaptive signal calculation unit 91a and an adaptive filter 91b, and the second adaptive signal processing unit 92 includes an adaptive signal as shown in FIG. An arithmetic unit 92a and an adaptive filter 92b are provided, and both execute the adaptive signal processing described with reference to FIG.
[0025]
That is, in the first state (audio state), the adaptive signal calculation unit 91a performs the R channel audio signal AS. R (= x 1 (n)) and the error signal e (n) are used to perform an adaptive signal calculation to update the coefficient value of the adaptive filter 91b. The adaptive filter 91b 1 Output (n). In addition, the adaptive signal calculation unit 92a receives the L channel audio signal AS. L (= x 2 (n)) and the error signal e (n) are used to perform an adaptive signal operation to update the coefficient value of the adaptive filter 92b, and the adaptive filter 92b uses the L channel estimated audio signal y. 2 Output (n). The adder 93 outputs a signal y output from the first and second adaptive signal processing units 91 and 92 in the first state. 1 (n), y 2 (n) is added and the estimated audio signal y (n) is output.
[0026]
In the second state (call state), the adaptive signal calculation unit 91a receives the received voice signal RS (= x 1 (n)) and the error signal e (n) are used to perform an adaptive signal calculation to update the coefficient value of the adaptive filter 91b. The adaptive filter 91b 1 Output (n). In addition, the adaptive signal calculation unit 92a receives the L channel audio signal AS. L (= x 2 (n) = 0) and the error signal e (n) are used to perform an adaptive signal calculation to update the coefficient value of the adaptive filter 92b. The adaptive filter 92b then estimates the L channel estimated audio signal y. 2 (n) = 0 is output. The adder 93 outputs a signal y output from the first and second adaptive signal processing units 91 and 92 in the second state. 1 (n), y 2 (n) is added to output an estimated received voice signal y (n).
[0027]
(E) Overall operation
In the first state (audio state), the R channel audio signal AS R Is the right speaker 52 FR , 52 RR R channel audio reproduction sound is radiated into the vehicle interior from these speakers. Also, the L channel audio signal AS L Is the left speaker 52 FL , 52 RL The L channel audio reproduction sound is radiated into the passenger compartment from these speakers. The microphone 71 provided in the vicinity of the driver's mouth detects the sound in the passenger compartment, that is, the audio reproduction sound radiated from each speaker, and outputs the detection signal d (n), and the delay unit 72 satisfies the causality. The voice detection signal d (n) is delayed by the amount of time.
[0028]
The adaptive signal calculation unit 91a (FIG. 3A) of the adaptive signal processing unit 91 receives the R channel audio signal AS. R (= x 1 (n)) and the error signal e (n) are used to perform adaptive signal processing to update the coefficient value of the adaptive filter 91b, and the adaptive filter 91b uses the R channel estimated audio signal y. 1 Output (n). In addition, the adaptive signal calculation unit 92a of the adaptive signal processing unit 92 includes an L channel audio signal AS. L (= x 2 (n)) and the error signal e (n) are used to perform an adaptive signal operation to update the coefficient value of the adaptive filter 92b, and the adaptive filter 92b uses the L channel estimated audio signal y. 2 Output (n). The adder 93 outputs the R channel and L channel estimated audio signals y output from the first and second adaptive signal processing units 91 and 92, that is, the adaptive filters 91b and 92b. 1 (n), y 2 (n) is added and the estimated audio signal y (n) is output.
The error signal generator 81 generates an error signal e (n) between the estimated audio signal y (n) generated by the adaptive signal processing and the detection signal d (n), and the first and second adaptive signal processors 91. , 92.
[0029]
Thereafter, by repeating the adaptive signal processing in the first state, the characteristic of the adaptive filter 91b becomes the right speaker 52. FR , 52 RR To the microphone 71. The adaptive filter 91b simulates the transfer characteristic because the adaptive signal processing is always performed even if the transfer characteristic changes due to a change in the posture of the occupant. Similarly, by repeating the adaptive signal processing in the first state, the characteristic of the adaptive filter 92b becomes the left speaker 52. FL , 52 RL To the microphone 71. The adaptive filter 92b simulates the transfer characteristic because the adaptive signal processing is always performed even if the transfer characteristic changes due to a change in the posture of the occupant. As a result, the error signal e (n), which is the output of the error signal generator 81, becomes substantially zero, and the audio signal is canceled.
[0030]
In such a state, if it is necessary to give a voice instruction to the navigation device or the like, the driver operates a predetermined switch to set the voice recognition mode. As a result, the control unit 63 controls the switch 67 to input the unnecessary sound removal signal (error signal) e (n) output from the unnecessary sound signal removal unit 73 to the speech recognition device 74. In this voice recognition mode, when the driver gives an instruction to the navigation device by voice, a synthesized sound of the driver voice and the audio reproduction sound is detected by the microphone 71, and the detection signal d (n) is input to the error signal generator 81. . The estimated audio signal y (n) is input from the adaptive signal processing unit 82 to the error signal generating unit 81. The error signal generator 81 subtracts the estimated audio signal y (n) from the detection signal d (n), and inputs the obtained signal to the voice recognition device 74 via the switch 67. As described above, since the estimated audio signal is substantially equal to the actual audio signal, the voice signal of the driver is input to the voice recognition device 74, and the voice recognition device 74 can correctly recognize the voice.
[0031]
Next, the operation when the state changes will be described according to the processing flow of FIG.
In the first state (audio state), the control unit 63 monitors whether there is an incoming call to the hands-free telephone 62 or whether a call is made by calling from the hands-free telephone (step 101). When the hands-free telephone is in a call state, the control unit instructs the first signal processing unit 91 to store the filter coefficient W1 (n) of the adaptive filter 91b as Wtemp (n) in the coefficient storage unit 83, and The filter coefficient W ′ (n) stored in the storage unit 83 is read out and the adaptive filter 91b is instructed to be set as the filter coefficient W1 (n). In accordance with this instruction, the first signal processing unit 91 stores the filter coefficient and reads / sets the stored coefficient (steps 102 to 103). The filter coefficient W ′ (n) is the latest adaptive filter coefficient updated by the adaptive signal processing in the second state of the previous time. For this reason, the received voice speaker 52 is caused by a change in the posture of the occupant. FR Even if the transfer characteristic from to the microphone 71 fluctuates, the characteristic of the adaptive filter in which this coefficient is set approximates the transfer characteristic.
[0032]
Next, the control unit 63 turns off the switches 64 and 66 and switches the switch 65 to the B contact side (step 104). As a result, no audio signal is input to all speakers, and the received voice speaker 52 near the driver's seat is used. FR Only the received voice signal RS from the hands-free telephone 62 is variable gain amplifiers 69 and 68. FR The received voice speaker 52 FR The incoming voice is radiated into the passenger compartment. Further, the control unit 63 controls the switch 67 to input the error signal e (n) output from the unnecessary sound signal removal unit 73 to the transmitter 75 of the hands-free telephone.
[0033]
The microphone 71 provided in the vicinity of the driver's mouth is a sound in the passenger compartment, that is, a speaker for received voice 52. FR The driver's call voice radiated from is detected and a detection signal d (n) is output, and the delay unit 72 delays the voice detection signal d (n) by the time required to satisfy the causality. On the other hand, the adaptive signal calculator 91a receives the received voice signal RS (= x 1 (n)) and the error signal e (n) are used to perform an adaptive signal calculation to update the coefficient value of the adaptive filter 91b. The adaptive filter 91b 1 Output (n). In addition, the adaptive signal calculation unit 92a receives the L channel audio signal AS. L (= x 2 (n) = 0) and the error signal e (n) are used to perform an adaptive signal calculation to update the coefficient value of the adaptive filter 92b. The adaptive filter 92b then estimates the L channel estimated audio signal y. 2 (n) = 0 is output. The adder 93 outputs a signal y output from the first and second adaptive signal processing units 91 and 92 in the second state. 1 (n), y 2 (n) is added to output an estimated received voice signal y (n).
The error signal generator 81 generates an error signal e (n) between the estimated received voice signal y (n) and the detection signal d (n) generated by the adaptive signal processing, and the first and second adaptive signal processors 91 and 92. Thereafter, by repeating the adaptive signal processing in the second state, the characteristic of the adaptive filter 91b is changed to the received voice speaker 52. FR To the microphone 71. In this case, since the adaptive filter 91b performs the adaptive signal processing by setting the latest filter coefficient W ′ (n) obtained in the previous second state, the characteristic of the adaptive filter 91b is equivalent to the transfer characteristic in a short time. It becomes the characteristic of.
[0034]
As a result, when the first state is switched to the second state, the estimated received voice signal y (n) is immediately removed from the detection signal d (n), and only the signal corresponding to the driver's voice is input to the transmitter 75. Thus, echo cancellation can be realized (step 105).
Thereafter, the control unit 63 monitors whether the call is finished (step 106). If the call is finished, the coefficient W1 (n) of the adaptive filter 91b is set to W ′ (n) for the first adaptive signal processing unit 91. Is stored in the coefficient storage unit 83, and the coefficient Wtemp (n) stored in the coefficient storage unit 83 is instructed to be set as W1 (n) in the adaptive filter 91b. In response to this instruction, the first signal processing unit 91 stores the filter coefficient and reads / sets the stored coefficient (steps 107 and 108). The filter coefficient Wtemp (n) is the latest adaptive filter coefficient updated in the previous first state, and the right speaker 52 in the previous first state. FR , 52 RR To the microphone 71 is a coefficient that simulates the transfer characteristic. Therefore, even if the transfer characteristic is slightly changed due to a change in the posture of the occupant, the adaptive filter characteristic in which this coefficient is set approximates the transfer characteristic.
[0035]
Next, the control unit 63 turns on the switches 64 and 66 and switches the switch 65 to the A contact side. Further, the control unit 63 controls the switch 67 to input the error signal e (n) output from the unnecessary sound signal removal unit 73 to the voice recognition device 74 (step 109).
As described above, the L channel audio signal is input to the left speaker, the R channel audio signal is input to the right speaker, and the audio reproduction sound is radiated from each speaker into the vehicle interior. Thereafter, the audio sound canceling process in the first state is performed. In this case, since the adaptive signal processing is performed by setting the filter coefficient Wtemp (n) obtained in the previous first state to the adaptive filter 91b, the transfer characteristic from the right speaker to the microphone fluctuates due to a change in the posture of the occupant. Even in this case, the characteristic of the adaptive filter 91b becomes equivalent to the transfer characteristic in a short time, and the signal corresponding to the audio reproduction sound is canceled from the detection signal (step 110). Thereafter, returning to the beginning, the subsequent processing is repeated.
[0036]
As described above, according to the first embodiment, the audio cancel device and the echo canceller for HFT can be integrated, and the filter coefficient is stored and read out when necessary to continue the adaptive signal processing. The voice can be recognized by canceling immediately, and the received voice can be canceled immediately and echo can be canceled during a hands-free call.
According to the first embodiment, the audio canceling device and the audio canceling device can be configured to stop the output of the audio reproduction sound from all the speakers during the call and to output the other party's received voice from the speaker of the driver's seat. An echo canceller for HFT can be integrated.
[0037]
(B) Second embodiment
In the first embodiment, the output of the audio playback sound is stopped from all the speakers in the hands-free call state (second state). However, the second embodiment can make a call while listening to the audio playback sound. It is.
FIG. 5 is an explanatory diagram of the state of the second embodiment, and the same components as those in FIG. In the second embodiment, the first state is a state other than a call state using a hands-free phone, and the second state is a call state using a hands-free phone.
[0038]
The first state of the second embodiment is the same as the first state of the first embodiment, as shown in FIG. FL , 52 RL The L channel audio signal is input to the speaker, and the L channel audio reproduction sound is radiated from the speakers into the vehicle interior. The right speaker 52 FR , 52 RR The R channel audio signal is input to R, and the R channel audio reproduction sound is radiated from the speakers into the vehicle interior. If the voice recognition mode is set in the first state, the unnecessary sound signal removal unit removes a signal corresponding to the audio reproduction sound from the signal detected by the voice detection unit provided in the passenger compartment and inputs the signal to the voice recognition device.
In the second state, as shown in FIG. FL , 52 RL The L channel audio signal is input to the speaker, and the L channel audio reproduction sound is radiated from the speakers into the vehicle interior. However, the right speaker 52 on the same side as the driver seat FR , 52 RR No audio signal is input to the speaker (speaker for received voice) 52 near the driver's seat. FR Only a reception voice signal is input from the hands-free telephone, and the reception voice is radiated from the speaker into the passenger compartment.
[0039]
FIG. 6 is a block diagram of the unnecessary sound signal removing apparatus of the second embodiment. The difference from the first embodiment of FIG. 2 is that the switch 64 of the first embodiment is removed. Left hand speaker 52 during hands-free call FL , 52 RL The L channel audio signal is input to the speaker 52 for the received voice. FR An incoming voice signal can be input from a hands-free telephone.
FIG. 7 is a processing flow of the second embodiment when the state changes. Since the operation in the first state is exactly the same as that of the first embodiment, description thereof is omitted.
[0040]
In the first state (audio state), the control unit 63 monitors whether there is an incoming call to the hands-free telephone 62 or whether a call is made by calling from the hands-free telephone (step 201). When the hands-free telephone is in a call state, the control unit instructs the first signal processing unit 91 to store the filter coefficient W1 (n) of the adaptive filter 91b in the coefficient storage unit 83 as Wtemp (n). Then, the filter coefficient W ′ (n) stored in the coefficient storage unit 83 is read out and the adaptive filter 91b is instructed to be set as the filter coefficient W1 (n). In accordance with this instruction, the first signal processing unit 91 stores the filter coefficient and reads / sets the stored coefficient (steps 202 to 203). The filter coefficient W ′ (n) is the latest adaptive filter coefficient updated by the adaptive signal processing in the second state of the previous time. For this reason, the received voice speaker 52 is caused by a change in the posture of the occupant. FR Even if the transfer characteristic from the microphone to the microphone fluctuates, the adaptive filter characteristic set with this coefficient approximates the transfer characteristic.
[0041]
Next, the control unit 63 turns off the switch (SW2) 66 and switches the switch (SW1) 65 to the B contact side as shown in FIG. 5C (step 204). Thereby, the left speaker 52 continues. FL , 52 RL L channel audio signal is input to the right speaker 52. FR , 52 RR No audio signal is input to the received voice speaker 52. FR Next, the received voice signal RS from the hands-free telephone 62 is converted into variable gain amplifiers 69 and 68. FR The received voice speaker 52 FR The incoming voice is radiated into the passenger compartment. Further, the control unit 63 controls the switch 67 to input the error signal e (n) output from the unnecessary sound signal removal unit 73 to the transmitter 75 of the hands-free telephone.
[0042]
A microphone 71 provided in the vicinity of the driver's mouth is a sound in the passenger compartment, that is, an L channel audio reproduction sound radiated from the L channel speaker and a speaker for received voice 52. FR The driver's call voice radiated from is detected and a detection signal d (n) is output, and the delay unit 72 delays the voice detection signal d (n) by the time required for adaptive signal processing. On the other hand, the adaptive signal calculator 91a receives the received voice signal RS (= x 1 (n)) and the error signal e (n) are used to perform an adaptive signal calculation to update the coefficient value of the adaptive filter 91b. The adaptive filter 91b 1 Output (n). In addition, the adaptive signal calculation unit 92a receives the L channel audio signal AS. L (= x 2 (n)) and the error signal e (n) are used to perform an adaptive signal operation to update the coefficient value of the adaptive filter 92b, and the adaptive filter 92b uses the L channel estimated audio signal y. 2 Output (n). The adder 93 outputs a signal y output from the first and second adaptive signal processing units 91 and 92 in the second state. 1 (n), y 2 (n) is added to output the estimated synthesized sound signal y (n).
[0043]
The error signal generator 81 generates an error signal e (n) between the estimated synthesized sound signal y (n) and the detection signal d (n) generated by the adaptive signal processing, and the first and second adaptive signal processors 91 and 92. Thereafter, by repeating the adaptive signal processing in the second state, the characteristic of the adaptive filter 91b is changed to the received voice speaker 52. FR To the microphone 71. The characteristic of the adaptive filter 92b is the left speaker 52. FL , 52 RL To the microphone 71. In this case, since the adaptive signal processing is performed by setting the filter coefficient W ′ (n) obtained in the previous second state to the adaptive filter 91b, even if the transfer characteristic changes slightly due to a change in the posture of the occupant. In a short time, the characteristic of the adaptive filter 91b becomes equivalent to the transfer characteristic. As a result, when the first state is switched to the second state, the estimated synthesized sound signal y (n) is immediately removed from the detection signal d (n), and only the signal corresponding to the driver's voice is input to the transmitter 75. Thus, echo cancellation can be realized (step 205).
[0044]
Thereafter, the control unit 63 monitors whether or not the call is finished (step 206). When the call is finished, the coefficient W1 (n) of the adaptive filter 91b is set to W ′ (n) for the first adaptive signal processing unit 91. The coefficient storage unit 83 stores the coefficient Wtemp (n) stored in the coefficient storage unit 83 and instructs the adaptive filter 91b to set it as W1 (n). In accordance with this instruction, the first signal processing unit 91 stores the filter coefficient and reads / sets the stored coefficient (steps 207 and 208). The filter coefficient Wtemp (n) is the latest adaptive filter coefficient updated in the previous first state, and the right speaker 52 in the previous first state. FR , 52 RR Simulate the transfer characteristics from to the microphone. Therefore, even if the transfer characteristic is slightly changed due to a change in the posture of the occupant, the characteristic of the adaptive filter to which this coefficient is set approximates the transfer characteristic.
Next, the control unit 63 turns on the switch (SW2) 66 and switches the switch (SW1) 65 to the A contact side. In addition, the control unit 63 controls the switch 67 and inputs the error signal e (n) output from the unnecessary sound signal removal unit 73 to the voice recognition device 74 (step 209).
[0045]
As described above, the L channel audio signal is input to the left speaker, the R channel audio signal is input to the right speaker, and the audio reproduction sound is radiated from each speaker into the vehicle interior. Thereafter, the audio sound cancellation process in the first state is performed. In this case, since the adaptive signal processing is performed by setting the filter coefficient Wtemp (n) obtained in the previous first state to the adaptive filter 91b, the transfer characteristic from the right speaker to the microphone fluctuates due to a change in the posture of the occupant. Even in this case, the characteristic of the adaptive filter 91b becomes equivalent to the transfer characteristic in a short time, and the signal corresponding to the audio reproduction sound is canceled from the detection signal (step 210).
According to the second embodiment, the audio cancel device and the HFT echo canceller can be integrated, and the filter coefficients are stored and read out when necessary to continue the adaptive signal processing. Thus, voice recognition can be performed, and the received voice can be canceled immediately at the time of a hands-free call to perform echo cancellation.
[0046]
Further, according to the second embodiment, the audio canceling device and the echo canceller for HFT can be integrated even when the audio reproduction sound is output from the speaker on the passenger seat side during the hands-free call. In this case, according to the second embodiment, the L channel audio canceling process and the call voice echo canceling process can be performed simultaneously.
In the above description, the first state is the audio state and the second state is the call state, but the first and second states are not limited to the embodiment.
In the above, the vehicle having the driver's seat on the right side has been described, but the present invention can of course be applied to a vehicle on the left side.
The present invention has been described with reference to the embodiments. However, the present invention can be variously modified in accordance with the gist of the present invention described in the claims, and the present invention does not exclude these.
[0047]
【The invention's effect】
As described above, according to the present invention, the audio cancellation apparatus and the HFT echo canceller can be integrated. As a result, the apparatus scale can be reduced, and the structure can be reduced.
Further, according to the present invention, the filter coefficient is stored and read out when necessary, and the adaptive signal processing is continued, so that the audio sound can be canceled immediately at the time of the voice recognition, and the voice recognition can be performed. Can be canceled immediately to perform echo cancellation.
[0048]
Further, according to the present invention, during a hands-free call, even if the configuration is such that output of audio playback sound from all speakers is stopped and the other party's received voice is output from the speaker in the driver's seat, An echo canceller for HFT can be integrated.
In addition, according to the present invention, the audio canceling device and the HFT echo canceller can be integrated even if the audio reproduction sound is output from the passenger side speaker during the hands-free call. Audio cancel processing and call echo cancel processing can be performed simultaneously.
[Brief description of the drawings]
FIG. 1 is an explanatory diagram of a state of a first embodiment.
FIG. 2 is a configuration diagram of an unnecessary sound signal removing apparatus according to the first embodiment.
FIG. 3 is a configuration diagram of an adaptive signal processing unit.
FIG. 4 is a processing flow at the time of a state change of the first embodiment.
FIG. 5 is a state explanatory diagram of a second embodiment.
FIG. 6 is a configuration diagram of an unnecessary sound signal removing apparatus according to a second embodiment.
FIG. 7 is a processing flow at the time of a state change of the second embodiment.
FIG. 8 is a configuration diagram of a conventional audio sound canceling apparatus.
FIG. 9 is a configuration diagram of an adaptive filter.
FIG. 10 is a configuration diagram of an audio sound canceling apparatus for a vehicle interior speaker.
FIG. 11 is a configuration diagram of an echo canceller.
[Explanation of symbols]
52 FL , 52 RL , 52 FR , 52 RR ..Speakers
61. Audio source
62. Hands-free telephone
63 .. Control part
64-66 switch
67 ・ ・ Switching device
71. Microphone
73. Unnecessary sound signal removal unit
74. Voice recognition device
75. Hands-free telephone transmitter
81 .. Error signal generator
82 .. Adaptive signal processing section
83 .. Filter coefficient storage unit

Claims (12)

スピーカ及び話者から出力する音を検出し、検出信号よりスピーカから出力する音に応じた信号を除去する不要音信号除去装置において、
スピーカ及び話者から出力された音を検出して検出信号を出力する音検出部、
第1の状態において第1のスピーカ群より出力された音に応じた第1の信号を適応信号処理により発生し、該第1の信号を前記検出信号より除去し、又、第2の状態において少なくとも1個の第2のスピーカ群より出力された音に応じた第2の信号を適応信号処理により発生し、該第2の信号を前記検出信号より除去する不要音信号除去部、
第1の状態から第2の状態に切り替わる際、第1の状態における適応信号処理により更新されている第1のパラメータを保存する保存部、
を備え、不要音信号除去部は、第2の状態から第1の状態に切り替わる際、前記保存してある第1のパラメータを用いて適応信号処理を行なう、
ことを特徴とする不要音信号除去装置。
In an unnecessary sound signal removing device that detects a sound output from a speaker and a speaker and removes a signal corresponding to a sound output from the speaker from a detection signal.
A sound detection unit that detects sound output from a speaker and a speaker and outputs a detection signal;
A first signal corresponding to the sound output from the first speaker group in the first state is generated by adaptive signal processing, the first signal is removed from the detection signal, and in the second state An unnecessary sound signal removing unit that generates a second signal corresponding to sound output from at least one second speaker group by adaptive signal processing, and removes the second signal from the detection signal;
A storage unit that stores the first parameter updated by the adaptive signal processing in the first state when switching from the first state to the second state;
And the unnecessary sound signal removing unit performs adaptive signal processing using the stored first parameter when switching from the second state to the first state.
The unnecessary sound signal removal apparatus characterized by the above-mentioned.
第2の状態から第1の状態に切り替わる際、第2の状態における適応信号処理により更新されている第2のパラメータを前記保存部に保存し、不要音信号除去部は、第1の状態から第2の状態に切り替わる際、前記保存してある第2のパラメータを用いて適応信号処理を行なう、
ことを特徴とする請求項1記載の不要音信号除去装置。
When switching from the second state to the first state, the second parameter updated by the adaptive signal processing in the second state is stored in the storage unit, and the unnecessary sound signal removing unit is started from the first state. When switching to the second state, adaptive signal processing is performed using the stored second parameter.
The unnecessary sound signal removing apparatus according to claim 1.
第1状態であって、音声認識時に前記検出信号より第1の信号を除去した信号を音声認識装置に入力し、第2状態のハンズフリー通話時に前記検出信号より第2の信号を除去した信号をハンズフリー電話機に入力する手段、
を有することを特徴とする請求項2記載の不要音信号除去装置。
A signal in the first state, in which the first signal is removed from the detection signal during speech recognition, is input to the speech recognition device, and the second signal is removed from the detection signal during a hands-free call in the second state To enter the hands-free phone,
The unnecessary sound signal removing apparatus according to claim 2, further comprising:
ハンズフリー電話機による通話状態を第2の状態、第2の状態でない状態を第1の状態として、現状態を監視する状態監視部、
を有することを特徴とする請求項3記載の不要音信号除去装置。
A state monitoring unit that monitors the current state with the hands-free telephone call state as the second state and the non-second state as the first state;
The unnecessary sound signal removing apparatus according to claim 3, further comprising:
前記不要音信号除去部は、
第1の状態において適応信号処理により発生する前記第1の信号と前記検出信号との誤差信号を発生し、第2の状態において適応信号処理により発生する前記第2の信号と前記検出信号との誤差信号を発生する誤差信号発生部、
適応信号処理を行う適応信号処理部、
を備え、該適応信号処理部は、
第1の状態において第1のスピーカ群へ入力する信号を入力されて前記第1の信号を発生し、第2の状態において第2のスピーカ群へ入力する信号を入力されて前記第2の信号を発生する適応フィルタ、
第1、第2のそれぞれの状態において、第1、第2のスピーカ群に入力する信号と前記誤差信号を用いて適応信号演算を行って各状態における適応フィルタの係数値を更新する適応信号演算部、
を備え、適応フィルタの係数値を前記パラメータとする、
ことを特徴とする請求項1又は2又は3記載の不要音信号除去装置。
The unnecessary sound signal removing unit is
An error signal between the first signal generated by adaptive signal processing in the first state and the detection signal is generated, and the second signal generated by adaptive signal processing in the second state and the detection signal An error signal generator for generating an error signal,
An adaptive signal processing unit for performing adaptive signal processing,
The adaptive signal processing unit comprises:
In the first state, a signal input to the first speaker group is input to generate the first signal, and in the second state, a signal input to the second speaker group is input to the second signal. Adaptive filter, which generates
Adaptive signal calculation in which the adaptive signal calculation is performed using the signals input to the first and second speaker groups and the error signal in each of the first and second states, and the coefficient value of the adaptive filter in each state is updated. Part,
And using the coefficient value of the adaptive filter as the parameter,
The unnecessary sound signal removing apparatus according to claim 1, 2, or 3.
前記第1のスピーカ群を車室内の全スピーカとし、第2のスピーカ群を運転席近傍のスピーカとし、前記第1の状態を全スピーカから出力するオーディオ再生音に応じた第1信号を検出信号より除去するオーディオ状態とし、第2の状態をハンズフリー電話機からの受話音声に応じた第2信号を検出信号より除去するハンズフリー通話状態とするとき、第1状態の音声認識時に前記検出信号より第1の信号を除去した信号を音声認識装置に入力し、第2状態において前記検出信号より第2の信号を除去した信号をハンズフリー電話機に入力する手段を有する、
ことを特徴とする請求項1又は2記載の不要音信号除去装置。
The first speaker group is set as all speakers in the passenger compartment, the second speaker group is set as speakers near the driver's seat, and the first signal corresponding to the audio reproduction sound output from all the speakers is detected as the first state. When the audio state is more removed, and the second state is the hands-free call state in which the second signal corresponding to the received voice from the hands-free telephone is removed from the detection signal, the detection signal is used when the voice is recognized in the first state. Means for inputting a signal from which the first signal has been removed to the voice recognition device, and for inputting a signal from which the second signal has been removed from the detection signal in the second state to a hands-free telephone;
The unnecessary sound signal removing apparatus according to claim 1 or 2, wherein:
前記不要音信号除去部は、
第1の状態において適応信号処理により発生する第1の信号と前記検出信号との誤差信号を発生し、第2の状態において適応信号処理により発生する第2の信号と前記検出信号との誤差信号を発生する誤差信号発生部、
適応信号処理を行う適応信号処理部、を備え、
該適応信号処理部は、
第1、第2の適応信号処理部、
第1状態において第1、第2の適応信号処理部から出力する信号を加算して前記第1の信号を出力し、第2状態において第1、第2の適応信号処理部から出力する信号を加算して前記第2の信号を出力する加算部、
を備え、第1の適応信号処理部は、
第1の状態において、運転席と同一側のスピーカへ入力されるオーディオ信号を入力され、該運転席と同一側のスピーカから出力するオーディオ再生音に応じた信号を発生し、第2の状態において受話音声信号が入力され、運転席近傍のスピーカから出力する受話音声に応じた信号を発生する第1の適応フィルタ、
第1の状態において、運転席と同一側のスピーカに入力する信号と前記誤差信号を用いて適応信号演算を行って前記第1の適応フィルタの係数値を更新すると共に、第2の状態において、運転席近傍のスピーカに入力する受話音声信号と前記誤差信号を用いて適応信号演算を行って前記第1の適応フィルタの係数値を更新する第1の適応信号演算部、
を備え、第2の適応信号処理部は、
第1、第2のそれぞれの状態において運転席と反対側のスピーカへ入力されるオーディオ信号を入力されて該スピーカから出力するオーディオ再生音に応じた信号を発生する第2の適応フィルタ、
第1、第2のそれぞれの状態において、運転席と反対側のスピーカに入力するオーディオ信号と前記誤差信号を用いて適応信号演算を行って各状態における第2の適応フィルタの係数値を更新する第2の適応信号演算部、
を備え、第1の適応フィルタの係数値を前記パラメータとする、
ことを特徴とする請求項6記載の不要音信号除去装置。
The unnecessary sound signal removing unit is
An error signal between the first signal generated by adaptive signal processing in the first state and the detection signal is generated, and an error signal between the second signal generated by adaptive signal processing in the second state and the detection signal. An error signal generator,
An adaptive signal processing unit for performing adaptive signal processing,
The adaptive signal processing unit
First and second adaptive signal processing units;
In the first state, the signals output from the first and second adaptive signal processing units are added to output the first signal, and in the second state, the signals output from the first and second adaptive signal processing units. An adder for adding and outputting the second signal;
The first adaptive signal processing unit includes:
In the first state, an audio signal input to the speaker on the same side as the driver's seat is input, a signal corresponding to the audio reproduction sound output from the speaker on the same side as the driver's seat is generated, and in the second state A first adaptive filter that receives a received voice signal and generates a signal corresponding to the received voice output from a speaker near the driver's seat;
In the first state, the adaptive signal calculation is performed using the signal input to the speaker on the same side as the driver's seat and the error signal to update the coefficient value of the first adaptive filter, and in the second state, A first adaptive signal calculation unit that performs adaptive signal calculation using a received voice signal input to a speaker in the vicinity of the driver's seat and the error signal to update a coefficient value of the first adaptive filter;
The second adaptive signal processing unit includes:
A second adaptive filter that receives an audio signal input to a speaker opposite to the driver's seat in each of the first and second states and generates a signal corresponding to the audio reproduction sound output from the speaker;
In each of the first and second states, the adaptive signal calculation is performed using the audio signal input to the speaker opposite to the driver's seat and the error signal, and the coefficient value of the second adaptive filter in each state is updated. A second adaptive signal calculation unit;
And using the coefficient value of the first adaptive filter as the parameter,
The unnecessary sound signal removing apparatus according to claim 6.
前記第2の状態において、いずれのスピーカにもオーディオ信号を入力しないようにする手段を有する、
ことを特徴とする請求項7記載の不要音信号除去装置。
In the second state, the audio signal is not input to any speaker.
The unnecessary sound signal removing apparatus according to claim 7.
前記第2の状態において、運転席と反対側のスピーカにオーディオ信号を入力し、運転席と同一側のスピーカにはオーディオ信号を入力しないようにする手段を有する、
ことを特徴とする請求項7記載の不要音信号除去装置。
In the second state, an audio signal is input to the speaker on the opposite side to the driver's seat, and the audio signal is not input to the speaker on the same side as the driver's seat.
The unnecessary sound signal removing apparatus according to claim 7.
第1の状態において、運転席と反対側のスピーカにLチャンネル、Rチャンネルの一方のチャンネルのオーディオ信号を入力し、運転席と同一側のスピーカに他方のチャンネルのオーディオ信号を入力し、第2の状態において、運転席と反対側のスピーカに前記一方のチャンネルのオーディオ信号を入力し、運転席と同一側のスピーカにオーディオ信号を入力しないようにする手段を有する、
ことを特徴とする請求項9記載の不要音信号除去装置。
In the first state, the audio signal of one of the L channel and the R channel is input to the speaker on the side opposite to the driver's seat, the audio signal of the other channel is input to the speaker on the same side as the driver's seat, and the second In this state, it has means for inputting the audio signal of the one channel to the speaker on the side opposite to the driver's seat and not inputting the audio signal to the speaker on the same side as the driver's seat,
The unnecessary sound signal removing apparatus according to claim 9.
車室内スピーカ及び話者から出力する音を検出し、音声認識時に検出信号より該車室内スピーカから出力するオーディオ再生音に応じた第1の不要音信号を除去して音声認識装置に入力し、ハンズフリー電話機による通話時に受話音声出力用スピーカから出力する受話音声に応じた第2の不要音信号を除去してハンズフリー電話機に入力する不要音信号除去装置において、
ハンズフリー電話機による通話状態を第2の状態とし、第2の状態以外の状態を第1の状態とするとき、各状態においてスピーカ及び話者から出力された音を検出して検出信号を出力する検出部、
第1の状態において車室内スピーカより出力されたオーディオ再生音に応じた第1の不要音信号を適応信号処理により発生し、該第1不要音信号を前記検出信号より除去し、又、第2の状態において受話音声用スピーカより出力された受話音声に応じた第2の不要音信号を適応信号処理により発生し、該第2不要音信号を前記検出信号より除去する不要音信号除去部、
第1状態において第1の不要音信号を除去された検出信号を音声認識装置に入力し、第2状態において第2の不要音信号を除去された検出信号をハンズフリー電話機に入力する手段、
第1の状態から第2の状態に切り替わる際、第1の状態における適応信号処理により更新されている第1のパラメータを保存すると共に、第2の状態から第1の状態に切り替わる際、第2の状態における適応信号処理により更新されている第2のパラメータを保存するパラメータ保存部、
を備え、不要音信号除去部は、第2の状態から第1の状態に切り替わる際、前記保存してある第1のパラメータを用いて適応信号処理を行ない、第1の状態から第2の状態に切り替わる際、前記保存してある第2のパラメータを用いて適応信号処理を行なう、
ことを特徴とする不要音信号除去装置。
Detecting the sound output from the speaker in the vehicle and the speaker, removing the first unnecessary sound signal corresponding to the audio reproduction sound output from the speaker in the vehicle from the detection signal at the time of voice recognition, and inputting it to the voice recognition device; In the unnecessary sound signal removing apparatus for removing the second unnecessary sound signal corresponding to the reception voice output from the reception voice output speaker during the call by the hands-free telephone and inputting it to the hands-free telephone,
When the hands-free telephone conversation state is the second state and the state other than the second state is the first state, the sound output from the speaker and the speaker is detected in each state and a detection signal is output. Detection unit,
A first unnecessary sound signal corresponding to the audio reproduction sound output from the vehicle interior speaker in the first state is generated by adaptive signal processing, the first unnecessary sound signal is removed from the detection signal, and the second An unnecessary sound signal removing unit that generates a second unnecessary sound signal corresponding to the received voice output from the received voice speaker in the state of the adaptive signal processing and removes the second unnecessary sound signal from the detection signal;
Means for inputting a detection signal from which the first unnecessary sound signal has been removed in the first state to a voice recognition device, and inputting the detection signal from which the second unnecessary sound signal has been removed in the second state to a hands-free telephone;
When switching from the first state to the second state, the first parameter updated by the adaptive signal processing in the first state is stored, and when switching from the second state to the first state, A parameter storage unit for storing the second parameter updated by the adaptive signal processing in the state of
The unnecessary sound signal removal unit performs adaptive signal processing using the stored first parameter when switching from the second state to the first state, and performs the second state from the first state. When switching to, the adaptive signal processing is performed using the stored second parameter,
The unnecessary sound signal removal apparatus characterized by the above-mentioned.
前記不要音信号除去部は、
第1の状態において適応信号処理により発生する前記第1の不要音信号と前記検出信号との誤差信号を発生し、第2の状態において適応信号処理により発生する前記第2の不要音信号と前記検出信号との誤差信号を発生する誤差信号発生部、
適応信号処理を行う適応信号処理部、
を備え、該適応信号処理部は、
第1の状態において車室内スピーカへ入力するオーディオ信号を入力されて前記第1の不要音信号を発生し、第2の状態において受話音声用スピーカへ入力する信号を入力されて前記第2不要音信号を発生する適応フィルタ、
第1、第2のそれぞれの状態において、車室内スピーカ、受話音声用スピーカにそれぞれ入力する信号と前記誤差信号を用いて適応信号演算を行って各状態における適応フィルタの係数値を更新する適応信号演算部、
を備え、適応フィルタの係数値を前記パラメータとする、
ことを特徴とする請求項11記載の不要音信号除去装置。
The unnecessary sound signal removing unit is
An error signal between the first unnecessary sound signal and the detection signal generated by adaptive signal processing in the first state is generated, and the second unnecessary sound signal generated by adaptive signal processing in the second state and the An error signal generator for generating an error signal with the detection signal;
An adaptive signal processing unit for performing adaptive signal processing,
The adaptive signal processing unit comprises:
In the first state, an audio signal to be input to the vehicle interior speaker is input to generate the first unnecessary sound signal, and in the second state, a signal to be input to the reception voice speaker is input to input the second unnecessary sound. An adaptive filter that generates a signal,
In each of the first and second states, an adaptive signal that performs adaptive signal calculation using the signal input to the vehicle interior speaker and the reception voice speaker and the error signal, and updates the coefficient value of the adaptive filter in each state. Arithmetic unit,
And using the coefficient value of the adaptive filter as the parameter,
The unnecessary sound signal removing apparatus according to claim 11.
JP2001004845A 2001-01-12 2001-01-12 Unnecessary sound signal removal device Expired - Fee Related JP4162860B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001004845A JP4162860B2 (en) 2001-01-12 2001-01-12 Unnecessary sound signal removal device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001004845A JP4162860B2 (en) 2001-01-12 2001-01-12 Unnecessary sound signal removal device

Publications (2)

Publication Number Publication Date
JP2002207500A JP2002207500A (en) 2002-07-26
JP4162860B2 true JP4162860B2 (en) 2008-10-08

Family

ID=18872976

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001004845A Expired - Fee Related JP4162860B2 (en) 2001-01-12 2001-01-12 Unnecessary sound signal removal device

Country Status (1)

Country Link
JP (1) JP4162860B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100806769B1 (en) * 2003-09-02 2008-03-06 닛본 덴끼 가부시끼가이샤 Signal processing method and apparatus
JP4484678B2 (en) * 2004-11-29 2010-06-16 アルパイン株式会社 Audio output device and audio output method
JP4506604B2 (en) 2005-07-27 2010-07-21 株式会社デンソー Hands-free device
DE602006005228D1 (en) * 2006-04-18 2009-04-02 Harman Becker Automotive Sys System and method for multi-channel echo cancellation
WO2009028023A1 (en) 2007-08-24 2009-03-05 Fujitsu Limited Echo suppressing apparatus, echo suppressing system, echo suppressing method, and computer program

Also Published As

Publication number Publication date
JP2002207500A (en) 2002-07-26

Similar Documents

Publication Publication Date Title
JP4975073B2 (en) Acoustic echo canceller using digital adaptive filter and same filter
EP3312839B1 (en) Device for assisting two-way conversation and method for assisting two-way conversation
EP1855457B1 (en) Multi channel echo compensation using a decorrelation stage
EP1858295B1 (en) Equalization in acoustic signal processing
JPH08234766A (en) Noise canceler
EP3754654B1 (en) Cancellation of road-noise in a microphone signal
US10601998B2 (en) Efficient reutilization of acoustic echo canceler channels
JP2001095083A (en) Method and device for compensating loss of signal
US20190045066A1 (en) Mitigating impact of double talk for residual echo suppressors
JP2000502861A (en) Convergence measurement device and convergence measurement method
JP4162860B2 (en) Unnecessary sound signal removal device
JP2002111552A (en) Acoustic echo canceler and hands-free telephone
EP3833045B1 (en) Conversation assistance system, method therefor, and program
JPS6343451A (en) Amplified speaking circuit
JP2005247181A (en) Vehicle-mounted handsfree system
US20220189450A1 (en) Audio processing system and audio processing device
JPH09130306A (en) Loud speaking device and echo canceller
JP3220979B2 (en) Voice switch
JP4141593B2 (en) Noise / audio sound reduction device
JP3403655B2 (en) Method and apparatus for identifying unknown system using subband adaptive filter
JP2581763B2 (en) Echo canceller
JP2907091B2 (en) Adaptive denoising mobile phone
KR100747330B1 (en) Communicaton terminal having a echo canceller setting function for wireless headset and echo cancelling mtehod thereof
JPH10210131A (en) Automobile telephone system
JPH066440A (en) Hand-free telephone set for automobile telephone system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060131

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080722

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080723

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4162860

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130801

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130801

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140801

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees