JPWO2006049260A1 - 信号処理の方法、信号処理の装置および信号処理用プログラム - Google Patents

信号処理の方法、信号処理の装置および信号処理用プログラム Download PDF

Info

Publication number
JPWO2006049260A1
JPWO2006049260A1 JP2006542452A JP2006542452A JPWO2006049260A1 JP WO2006049260 A1 JPWO2006049260 A1 JP WO2006049260A1 JP 2006542452 A JP2006542452 A JP 2006542452A JP 2006542452 A JP2006542452 A JP 2006542452A JP WO2006049260 A1 JPWO2006049260 A1 JP WO2006049260A1
Authority
JP
Japan
Prior art keywords
signal
noise
detection
adaptive filter
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006542452A
Other languages
English (en)
Other versions
JP4697465B2 (ja
Inventor
昭彦 杉山
昭彦 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2006542452A priority Critical patent/JP4697465B2/ja
Publication of JPWO2006049260A1 publication Critical patent/JPWO2006049260A1/ja
Application granted granted Critical
Publication of JP4697465B2 publication Critical patent/JP4697465B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/002Devices for damping, suppressing, obstructing or conducting sound in acoustic devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • H04B3/23Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
    • H04B3/234Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers using double talk detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/002Damping circuit arrangements for transducers, e.g. motional feedback circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02163Only one microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/05Noise reduction with a separate noise microphone

Abstract

適応フィルタ5と、雑音推定回路10と、ダブルトーク検出回路81とを備え、雑音推定回路10によって得られた推定雑音を用いてダブルトーク検出回路81がダブルトーク検出を行うように動作する。雑音推定手段を備え、推定雑音とマイクロフォン信号と擬似エコーを用いてダブルトークを検出する。本発明のエコー除去の方法および装置は、0と1の間の連続値で表される信頼係数を用いてダブルトークを検出する。0と1の2値の代わりに連続値を用いることによって、検出誤りの影響を小さくすることができる。

Description

本発明は信号処理の方法、信号処理の装置および信号処理用プログラムに関し、特にエコーやノイズなどの妨害信号に重畳された雑音が存在する環境において高い妨害信号除去能力を提供することができる信号処理の方法、信号処理の装置および信号処理用プログラムに関する。
目的とする信号に重畳された妨害信号として、通信回線の2線/4線変換回路において発生する回線エコー、音響信号を再生するスピーカとマイクロフォンの間に生じる音響結合によって生じる音響エコー、目的信号を捕捉するマイクロフォンにおいて混入する背景雑音や他人の音声などの妨害信号がある。
2線/4線変換回路の4線側において送信側から受信側へ漏れ込むエコーを除去する技術として、例えば、非特許文献1に記載されているエコーキャンセラが知られている。エコーキャンセラは、エコー経路のインパルス応答長に等しいか又はこれを越える数のタップ係数を有する適応フィルタを用いて、送信信号に対応した擬似エコー(エコー・レプリカ)を生成することにより、2線/4線変換回路の4線側において送信回路から受信回路へ漏れ込むエコーを抑圧するように動作する。
一方、同様の原理で、音響信号を再生するスピーカとマイクロフォンの間に生じる音響結合によって生じる音響エコーを除去する技術として、非特許文献2に記載されている音響エコーキャンセラが知られている。音響エコーキャンセラは、エコー経路のインパルス応答長に等しいか又はこれを越える数のタップ係数を有する適応フィルタを用いて、送信信号に対応した擬似エコー(エコー・レプリカ)を生成することにより、スピーカとマイクロフォンの間に生じる音響結合によってスピーカからマイクロフォンへ漏れ込むエコーを抑圧するように動作する。
これらのエコーキャンセラにおいて、適応フィルタの各タップ係数は、エコーと受信信号の混在する混在信号から擬似エコーを差引いて得られる誤差信号と送信信号との相関をとることにより修正される。このような適応フィルタの係数修正アルゴリズムの代表的なものとして、非特許文献1に記載されているLMSアルゴリズムと非特許文献3に記載されている正規化LMS(NLMS)アルゴリズムが広く用いられている。
図12は、従来の音響エコーキャンセラの一構成例を示したブロック図である。入力端子1に供給された参照信号x(k)は、スピーカ2に伝達されて、音響信号として音響空間に放射される。ここにkは時間を表す添字である。近端音声信号v(k)を捕捉するためのマイクロフォン3は、同時にスピーカ2が放射する音響信号によって生じたエコーy(k)も合わせて捕捉し、減算器6に伝達する。
参照信号x(k)は同時に適応フィルタ5にも供給されており、その出力として擬似エコーy(k)ハットが得られる。このy(k)ハットを減算器6に供給し、マイクロフォン3から供給される信号から差し引くことによって、エコーが除去された信号e(k)が得られる。
e(k)=v(k)+ y(k)− y(k)ハット…(1)
によって得られたe(k)は、出力として、出力端子4に伝達される。式(1)において、y(k)−y(k)ハットは、残留エコーと呼ばれる。
前述のLMSアルゴリズムを仮定すれば、適応フィルタ5のm番目の係数w(k)は、次式に従って更新される。
(k+1)=w(k)+μ・e(k)・x(k)…(2)
N個の係数全てに関する式(2)を行列形式で表せば、
W(k+1)=W(k)+μ・e(k)・X(k)…(3)
となる。ここに、W(k)とX(k)はそれぞれ次式で与えられる。
W(k) = [w(k) (k) … wN−1(k) ]…(4)
X(k)=[x(k)x(k) … xN−1(k) …(5)
係数更新回路7は、参照信号x(k)とエコー消去信号e(k)を受け、式(2)の右辺第二項を計算する。適応フィルタ5は、係数更新回路7から供給される式(2)の右辺第二項を受けて、係数を更新する。一方、NLMSアルゴリズムでは式(3)の代りに、式(6)に従って係数の更新が行われる。
W(k+1)=W(k)+(μ/Nσ 2 )・e(k)・X(k)…(6)
σ 2 は適応フィルタ5に入力される参照信号x(k)の平均電力である。Nσx 2 はステップ・サイズμの値を前記平均電力に反比例させ、安定な収束を行なわせるために用いられる。Nσ 2 を求めるためにはいくつかの方法があるが、例えば過去Nサンプルのx(k)を全て加算することによって求めることができる。
式(1)に示すように、エコーが除去された信号e(k)は係数更新に必要な残留エコーy(k)−y(k)ハットに加えて、近端音声信号v(k)を含む。v(k)は、係数更新に対する妨害信号として働き、残留エコーと比較して相対的に無視できないときには、係数更新を破綻させることもある。このため、一般的にダブルトーク検出回路8を用いて近端音声v(k)の存在を検出し、その結果を用いて係数更新を制御する。ダブルトーク検出回路8の出力はスイッチ9に伝達されており、ダブルトークが検出されたとき(近端音声が存在するとき)に、係数更新回路7から適応フィルタ5に至る回路を開くことによって、係数更新を一時的に停止する。
ダブルトーク検出の第一の従来例が特許文献1に開示されている。第一の従来例では、マイクロフォン信号と誤差信号から計算されるエコー消去量が第一の閾値以下のときはマイクロフォン信号と参照信号のレベル比較でダブルトークを検出し、第一の閾値以上の場合は参照信号とマイクロフォン信号の相互相関を用いてダブルトークを検出する。しかし、あらゆる場合に対して、あらかじめ適切な閾値を設定することは容易でない。
第二の従来例が、特許文献2に開示されている。第二の従来例では、誤差信号の自己相関と参照信号の自己相関を用いてダブルトークを検出する。この構成ではエコーキャンセラ本体が多重化されており、複数の適応フィルタ出力に対応した複数の誤差信号のパワー比較を行う。このため、複数の適応フィルタが必要となり、演算量が増加する。
第三の従来例が、特許文献3に開示されている。第三の従来例では、複数の適応フィルタ係数の組を必要とするために、所要メモリ量が増大するという問題がある。
第四の従来例が、特許文献4に開示されている。第四の従来例では、誤差と参照信号のパワー比、マイクロフォン信号と参照信号のパワー比、または誤差と擬似エコーのパワー比を閾値と比較することでダブルトークと系変動を区別なく検出し、さらに誤差と擬似エコーの相関を擬似エコーパワーで正規化した値を閾値と比較し、ダブルトークを検出する。
第五の従来例が、特許文献5に開示されている。第五の従来例は、複数マイクロフォンで捕捉した信号の相関または共分散を用いたダブルトーク検出である。このため、複数のマイクロフォンを必要とし、単一マイクロフォンを有するシステムには適用できない。
第六の従来例が、特許文献6に開示されている。第六の従来例は、参照信号とマイクロフォン信号のパワー差でダブルトーク検出を行う。音響系では、一般にエコー経路利得が未知であり、検出閾値の設定に困難がある。
第七の従来例が、特許文献7に開示されている。第七の従来例では、マイクロフォン信号と擬似エコーの相互相関と擬似エコーの自己相関との比を閾値と比較してダブルトーク検出を行う。マイクロフォン信号には背景雑音が含まれており、前記閾値を背景雑音の性質に応じて適切に設定しなければならない。このため、閾値の設定に困難がある。
第八の従来例が、特許文献8に開示されている。第八の従来例では、参照信号とマイクロフォン信号の分析パラメータの変動に関する相互相関でダブルトーク検出を行う。参照信号とマイクロフォン信号の分析パラメータを求めなければならないために、演算量が増加するという問題がある。
第九の従来例が、特許文献9に開示されている。第九の従来例では、誤差の飽和頻度と誤差パワーを用いてダブルトーク検出を行うが、飽和閾値設定に困難がある。
第十の従来例が、特許文献10に開示されている。第十の従来例では、参照信号とマイクロフォン信号のパワー比にマージンを加算した値と閾値を比較してダブルトークを検出する。このため、検出性能がマージンに依存し、マージンの決定が困難である。
第十一の従来例が特許文献11に、第十二の従来例が特許文献12にそれぞれ開示されている。これらの従来例は、どちらも二つのマイクロフォンを用いており、単一マイクロフォンを装備したシステムには適用できない。
第十三の従来例が、特許文献13に開示されている。第十三の従来例では、マイクロフォン信号の自己相関、擬似エコーの自己相関、両者の相互相関をもって定義される行列式の値を閾値と比較してダブルトークを検出する。しかし、行列式の値は環境によって変動し、閾値設定に困難がある。
参照信号とマイクロフォン信号の正規化相互相関ベクトルを用いたダブルトーク検出の一例が、非特許文献4に開示されている。
非特許文献4では、ダブルトーク検出に参照信号x(k)とマイクロフォン信号m(k)の正規化相互相関ベクトルcxmを用いる。
Figure 2006049260
ここに、σ はm(k)の分散、rxm=Rxxhはx(k)とm(k)の相互相関、Rxx=E[X(k)X(k)]は参照信号x(k)の自己相関行列,E[・]は、数学的期待値を表す演算子、hはスピーカ2からマイクロフォン3に至る音響経路のインパルス応答で
h(k)=[h… hN−1…(8)
である。ただし、マイクロフォン信号に含まれる近端音声と参照信号、並びに背景雑音と参照信号は無相関であると仮定している。
ダブルトーク検出の判定変数ξは、σ 2がスカラであることに注意して|cxm|を用いれば、
Figure 2006049260
となる。ξが1より小さい値をとるときに、ダブルトークと判定する。
特開平3−218150号公報 特開平6−13940号公報 特開平6−14100号公報 特開平7−226793号公報 特開平7−250397号公報 特開平7−264103号公報 特開平7−288493号公報 特開平7−303070号公報 特開平10−41858号公報 特開平11−215033号公報 特開2000−324233号公報 特開2004−40161号公報 特開2004−517579号公報 「1985年、アダプティブ・シグナル・プロセシング(Adaptive Signal Processing), 1985, Prentice-Hall Inc., USA」 「1999年7月、アコースティック・エコー・コントロール(Acoustic Echo Control), アイ・イー・イー・イー・シグナル・プロセシング・マガジン(IEEE SIGNAL PROCESSING MAGAZINE、PP.42-69, JUL, 1999)、42〜69ページ」 「1985年、アダプティブ・フィルタ(Adaptive Filters), 1985, Kulwer Academic Publishers, USA」 「2000年3月、アイ・イー・イー・イー・トランザクションズ・オン・スピーチ・アンド・オーディオ・プロセシング(IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING, PP.168-172, MAR, 2000)、168〜172ページ」
式(9)のξを計算するためには、根号内の相互相関や自己相関を求めなければならない。非特許文献4では、適応フィルタ5が収束していることを想定して、
Figure 2006049260
と近似し、さらに
Figure 2006049260
によって計算することが、実際的な相関の推定方法として開示されている。式(5)からX(k)はN次ベクトルであるから、式(11)の計算を行うためには、1サンプリング周期あたり、M乗算とMN加算が必要である。非特許文献4はMの値を500、Nを2048としており、ダブルトーク検出に必要な演算量が多くなるという問題がある。
また、式(9)のξが、シングルトークでも1にならない可能性がある。それは、マイクロフォン信号m(k)に含まれる雑音成分n(k)の影響が、式(9)では考慮されていないからである。すなわち、式(9)の分母には雑音成分n(k)が含まれるが、分子には参照信号x(k)と音響経路のインパルス応答であるhの情報だけしか含まれない。したがって、n(k)が大きくなるにつれて、シングルトークのときのξは1から減少することになる。分母は近端音声v(k)のパワーから増大するが、分子は影響を受けない。このため、非特許文献4のダブルトーク検出では、シングルトークをダブルトークと検出して必要な係数更新の頻度が減少し、エコー除去性能が劣化する。
さらに、これまでのダブルトーク検出では係数更新制御を0と1のいずれかで制御していたので、0と1の間の判定誤りの影響が大きく、性能劣化につながる可能性があった。
そこで、本発明は上記課題に鑑みて発明されたものであって、その目的は、検出精度が高く、検出誤りの影響が小さく、演算量が少ないダブルトーク検出機能を備えたエコー除去の方法および装置を提供することにある。
上記課題を解決する第1の発明は、エコー、近端信号、雑音を含む信号を入力信号とし、前記入力信号と参照信号をフィルタリング処理してエコー信号を推定し、前記入力信号から前記推定されたエコー信号を減算し、前記減算結果と前記参照信号の相関を求め前記フィルタリング処理の係数を更新するエコー除去方法において、前記混在信号中に含まれる雑音を推定して推定雑音を求め、前記推定雑音を用いて前記混在信号に含まれる近端信号を推定し、前記推定された近端信号に応じて前記係数更新を制御することを特徴とする。
上記課題を解決する第2の発明は、適応フィルタで参照信号を処理して出力を計算し、エコー、近端信号、並びに雑音を少なくとも含む混在信号から前記適応フィルタの出力を減算し、前記減算結果と前記参照信号の相関をとることによって前記係数を適応的に更新するエコー除去方法において、前記混在信号中に含まれる雑音を推定して推定雑音を求め、前記推定雑音を用いて前記混在信号に含まれる近端信号を検出し、前記近端信号の有無に応じて2つの離散値を定め、前記2つの離散値に応じて前記係数更新程度を適応的に制御することを特徴とする。
上記課題を解決する第3の発明は、適応フィルタで参照信号を処理して出力を計算し、エコー、近端信号、並びに雑音を少なくとも含む混在信号から前記適応フィルタの出力を減算し、前記減算結果と前記参照信号の相関をとることによって前記係数を適応的に更新するエコー除去方法において、前記混在信号中に含まれる雑音を推定して推定雑音を求め、前記推定雑音を用いて前記混在信号に含まれる近端信号を検出して、検出の信頼度に対応した連続な値を求め、前記連続の値に応じて前記係数更新程度を適応的に制御することを特徴とする。
上記課題を解決する第4の発明は、適応フィルタで参照信号を処理して出力を計算し、妨害信号、目的信号、並びに雑音を少なくとも含む混在信号から前記適応フィルタの出力を減算し、前記減算結果と前記参照信号の相関をとることによって前記係数を適応的に更新するノイズ除去方法において、前記混在信号中に含まれる雑音を推定して推定雑音を求め、前記推定雑音を用いて前記混在信号に含まれる目的信号を検出して、検出の信頼度に対応した値を求め、前記信頼度に対応した値に応じて前記係数更新程度を適応的に制御することを特徴とする。
上記課題を解決する第5の発明は、複数のマイクロフォンで受けた、妨害信号、目的信号、並びに雑音を少なくとも含む混在信号を第1の適応フィルタ群で処理することによって目的信号を抑圧した目的ブロック信号を生成し、前記目的ブロック信号を第2の適応フィルタ群で処理することによって擬似妨害信号を生成し、前記混在信号を固定フィルタ群で処理することによって目的信号を強調した目的強調信号を生成し、前記目的強調信号から前記擬似妨害信号を差し引くことによって妨害信号を除去するように動作する信号処理方法において、前記混在信号中に含まれる雑音を推定して推定雑音を求め、前記推定雑音を用いて前記混在信号に含まれる目的信号を検出して、検出の信頼度に対応した値を求め、前記信頼度に対応した値に応じて前記第1及び第2の適応フィルタ群の係数更新程度を適応的に制御することを特徴とする。
上記課題を解決する第6の発明は、参照信号を処理して出力を計算する適応フィルタと、エコー、近端信号、並びに雑音を少なくとも含む混在信号から前記適応フィルタの出力を減算する減算器と、前記減算器出力と前記参照信号の相関をとることによって係数更新量を計算する係数更新回路を少なくとも含むエコー除去装置において、前記混在信号中に含まれる雑音を推定して推定雑音を求める雑音推定回路と、前記推定雑音を用いて前記混在信号に含まれる近端信号の存在に関する情報を求めるダブルトーク検出回路と、前記ダブルトーク検出回路の出力を受けて前記係数更新回路の出力を選択的に前記適応フィルタに伝達するスイッチとを有することを特徴とする。
上記課題を解決する第7の発明は、参照信号を処理して出力を計算する適応フィルタと、妨害信号、目的信号、並びに雑音を少なくとも含む混在信号から前記適応フィルタの出力を減算する減算器と、前記減算器出力と前記参照信号の相関をとることによって係数更新量を計算する係数更新回路を少なくとも含む構成のノイズ除去装置において、前記混在信号中に含まれる雑音を推定して推定雑音を求める雑音推定回路と、前記推定雑音を用いて前記混在信号に含まれる目的信号の存在に関する情報を求めるダブルトーク検出回路と、前記ダブルトーク検出回路の出力を受けて前記係数更新回路の出力を修整してから前記適応フィルタに伝達する乗算器とを有することを特徴とする。
上記課題を解決する第8の発明は、複数のマイクロフォンと、前期複数のマイクロフォンで受けた、妨害信号、目的信号、並びに雑音を少なくとも含む混在信号を処理することによって目的信号を抑圧した目的ブロック信号を生成する第1の適応フィルタ群と、前記目的ブロック信号を処理することによって擬似妨害信号を生成する第2の適応フィルタ群と、前記混在信号を処理することによって目的信号を強調した目的強調信号を生成する固定フィルタ群と、前記目的強調信号から前記擬似妨害信号を差し引く減算器を少なくとも含む信号処理装置において、前記混在信号中に含まれる雑音を推定して推定雑音を求める雑音推定回路と、前記推定雑音を用いて前記混在信号に含まれる目的信号の存在に関する情報を求めるダブルトーク検出回路と、前記ダブルトーク検出回路の出力を受けて前記係数更新回路の出力を修整してから前記適応フィルタに伝達する乗算器とを少なくとも具備し、前記ダブルトーク検出回路の出力に対応して前記第1及び第2の適応フィルタ群の係数更新を適応的に制御することを特徴とする。
上記課題を解決する第9の発明は、エコー、近端信号、並びに雑音を少なくとも含む混在信号中に含まれる雑音を推定して推定雑音を求め、前記推定雑音を用いて前記混在信号に含まれる近端信号を検出することを特徴とするダブルトーク検出方法である。
上記課題を解決する第10の発明は、エコー、近端信号、並びに雑音を少なくとも含む混在信号中に含まれる雑音を推定して推定雑音を求める雑音推定回路と、前記推定雑音を用いて前記混在信号に含まれる近端信号の存在に関する情報を求めるダブルトーク検出回路とを有することを特徴とするダブルトーク検出装置である。
上記課題を解決する第11の発明は、参照信号を処理して出力を計算する適応フィルタ処理と、エコー、近端信号、並びに雑音を少なくとも含む混在信号から前記適応フィルタの出力を減算する処理と、前記減算処理結果と前記参照信号の相関をとることによって係数更新量を計算する係数更新処理と、前記混在信号中に含まれる雑音を推定して推定雑音を求める雑音推定処理と、前記推定雑音を用いて前記混在信号に含まれる近端信号の存在に関する情報を求めるダブルトーク検出処理と、前記ダブルトーク検出処理結果を受けて前記係数更新処理結果を修整してから前記適応フィルタに伝達する乗算処理とをコンピュータに実行させるためのプログラムである。
上記課題を解決する第12の発明は、参照信号を処理して出力を計算する適応フィルタ処理と、妨害信号、目的信号、並びに雑音を少なくとも含む混在信号から前記適応フィルタの出力を減算する処理と、前記減算処理結果と前記参照信号の相関をとることによって係数更新量を計算する係数更新処理と、前記混在信号中に含まれる雑音を推定して推定雑音を求める雑音推定処理と、前記推定雑音を用いて前記混在信号に含まれる近端信号の存在に関する情報を求めるダブルトーク検出処理と、前記ダブルトーク検出処理結果を受けて前記係数更新処理結果を修整してから前記適応フィルタに伝達する乗算処理とをコンピュータに実行させるためのプログラムである。
上記課題を解決する第13の発明は、複数のマイクロフォンで受けた、妨害信号、目的信号、並びに雑音を少なくとも含む混在信号を処理することによって目的信号を抑圧した目的ブロック信号を生成する第1の適応フィルタ処理と、前記目的ブロック信号を処理することによって擬似妨害信号を生成する第2の適応フィルタ処理と、前記混在信号を処理することによって目的信号を強調した目的強調信号を生成する固定フィルタ処理と、前記目的強調信号から前記擬似妨害信号を差し引く減算処理と、前記混在信号中に含まれる雑音を推定して推定雑音を求める雑音推定処理と、前記推定雑音を用いて前記混在信号に含まれる目的信号の存在に関する情報を求めるダブルトーク検出処理と、前記ダブルトーク検出処理結果を受けて前記係数更新処理結果を修整してから前記適応フィルタに伝達する乗算処理と、前記ダブルトーク検出処理結果に対応して前記第1及び第2の適応フィルタ処理の係数更新を適応的に制御する処理とをコンピュータに実行させるためのプログラムである。
本発明のエコー除去の方法および装置は、雑音推定手段を備え、推定雑音とマイクロフォン信号と擬似エコーを用いてダブルトークを検出する。擬似エコーとマイクロフォン信号から得られた情報を推定雑音で補正してダブルトークを検出することによって、本発明の目的を達成することができる。さらに、本発明のエコー除去の方法および装置は、0と1の間の連続値で表される信頼係数を用いてダブルトークを検出する。0と1の2値の代わりに連続値を用いることによって、検出誤りの影響を小さくすることができる。
第1の効果は、高いエコー除去能力を達成できることにある。その理由は、マイクロフォン信号に混入する雑音を推定し、推定雑音で補正した情報を用いてダブルトークを検出し、正確な係数更新制御を行うことができるためである。
第2の効果は、演算量を削減できることにある。その理由は、ダブルトーク検出に複雑な行列またはベクトル演算を使用しないためである。
第3の効果は、検出誤りの影響を小さくできることにある。その理由は、ダブルトーク検出に0と1の間の連続値で表される信頼度係数を使用するためである。
本発明の最良の形態および実施例1および実施例2の構成を示すブロック図である。 本発明の実施例3を示すブロック図である。 本発明の実施例4を示すブロック図である。 本発明の実施例5を示すブロック図である。 本発明の実施例6を示すブロック図である。 本発明の実施例7を示すブロック図である。 本発明の実施例8を示すブロック図である。 本発明の実施例9の構成を示すブロック図である。 本発明の実施例10の構成を示すブロック図である。 本発明の実施例11の構成を示すブロック図である。 本発明の実施例12の構成を示すブロック図である。 従来例の構成を示すブロック図である。
符号の説明
1 入力端子
2 スピーカ
3、31、30、31、32、33・・・3M-1 マイクロフォン
4 出力端子
5 適応フィルタ
6 減算器
7 係数更新回路
8、81、82、821 ダブルトーク検出回路
9、822 スイッチ
10、11 雑音推定回路
12 固定ビームフォーマ
13 ブロッキング行列
14 多入力キャンセラ
91 乗算器
823 係数変化評価回路
824 情報統合回路
次に、発明を実施するための最良の形態について図面を参照して詳細に説明する。
図1を参照すると、本発明の第1の実施の形態は、適応フィルタ5と、減算器6と、雑音推定回路10と係数更新回路7とスイッチ9とダブルトーク検出回路81を含む。適応フィルタ5と、減算器6と、雑音推定回路10と係数更新回路7とスイッチ9の動作に関しては、既に従来例として図12を参照して説明した通りである。雑音推定回路10は、誤差を受けて雑音を推定する。ダブルトーク検出回路81は、擬似エコー、マイクロフォン信号、及び推定雑音を受けて、ダブルトークを検出する。
ダブルトーク検出回路81には、マイクロフォン信号m(k)と擬似エコーy(k)ハットが供給されている。これらの信号を用いてダブルトークを検出する手続きは、次の通りである。
式(9)にrxm=Rxxhを適用すると、式(12)が得られる。
Figure 2006049260
式(10)の近似、すなわちh=W(k)を用い、E[hX(k)]=E[y(k)ハット]に注意すると、次式を得る。
Figure 2006049260
ここに、ξは時変となるので、kの関数とした。式(13)の計算は、根号内の分子に対して1乗算、同じく分母に対して1乗算である。実際は、σ はマイクロフォン信号m(k)の平均パワーであり、
Figure 2006049260
で求める。式(14)はm(k)の移動平均なので、過去の値に対して、実質的にはm(k)の加算とm(k−M)の減算から計算できる。すなわち、2加算が必要となる。
また、E[y(k)ハット]も同様に
Figure 2006049260
で求める。従って、式(14)と同様に2加算が必要となる。以上説明したように、式(13)のξ(k)を計算するためには、2乗算、4加算に加えて根号開平演算が必要となる。このために、非特許文献4に開示された方式と比較して、少ない演算量で同等の性能を得ることができる。
式(14)の計算に用いるマイクロフォン信号m(k)は、
m(k)=y(k)+v(k)+n(k)…(16)
と表すことができる。y(k)、v(k)、n(k)がそれぞれ無相関であれば、
E[m(k)]=E[y(k)]+E[v(k)]+E[n(k)]…(17)
が成立する。E[m(k)]=σ (k)、E[y(k)]=σ (k)、E[v(k)]=σ (k)、E[n(k)]=σ (k)とおけば、
σ (k)=σ (k)+σ (k)+σ (k)…(18)
となる。シングルトークではv(k)=0なので、
σ (k)=σ (k)+σ (k)…(19)
である。すなわち、式(13)の分母は、E[n(k)]=σ (k)の影響を受ける。これに対して、式(13)の分子にはn(k)に関する情報が含まれていない。従って、本来1となるべきシングルトーク時のξ(k)は、雑音パワーが大きいほど、1から離れた小さな値になる。
本発明では、雑音の影響を防ぐために、雑音を推定し、その値で式(13)を補正する。推定雑音をn(k)ハットとすると、推定雑音によって補正されたξ(k)は、式(20)で与えられる。
Figure 2006049260
本発明では、ダブルトーク検出回路81で、式(20)のξ(k)を計算する。推定雑音パワーn(k)ハットは雑音推定回路10から供給する。
雑音推定回路10には、誤差信号e(k)が供給されている。雑音推定回路10は、
(k)ハット=Ave[e(k)]…(21)
に従って、推定雑音パワーn(k)ハットを計算する。ここに、Ave[・]は平均を求めるための演算子である。平均値演算としては、式(14)、(15)に示した移動平均や、
(k+1)ハット=δ・n(k)ハット+(1−δ)・e(k)…(22)
で表される1次漏れ積分を用いることができる。ここにδは平均化の時定数である。
e(k)=y(k)−y(k)ハット+v(k)+n(k)…(23)
なので、v(k)=0かつ残留エコーが十分小さいときだけ、式(21)を計算してn(k)ハットを更新する。
v(k)=0を評価するためには、e(k)の瞬時自己相関をその平均値で正規化して得られる、正規化瞬時自己相関を用いることができる。隣接サンプル間瞬時相関の平均値をρ(k)とすれば、ρ(k)は次式で計算することができる。
ρ(k+1)=δρ(k)+(1−δ)・e(k)e(k−1)…(24)
ここに、δは平均化の時定数である。ρ(k)/ρ(k)で与えられる正規化瞬時自己相関を閾値γと比較して、小さいときだけ式(21)を計算し、それ以外は値を保持する。これは、e(k)の自己相関が小さいときに相当する。e(k)に近端音声v(k)が含まれていたり、残留エコーが大きいときにはe(k)の自己相関が大きいので、v(k)=0かつ残留エコーが十分小さいときだけ、式(20)を計算してn(k)ハットを更新することができる。
式(22)に示した1次漏れ積分において、平均化時定数δの選択は重要である。δが大きいと推定雑音の雑音に対する追従性が悪いが高精度な推定が可能となり、反対にδが小さいと追従性が良いが推定精度が劣化する。このトレードオフに対処するために、δを適応制御することも可能である。一般的には、雑音推定の初期に比較的大きな値のδを用い、推定雑音が実際の雑音(の平均値)に近づくにつれて、δの値を小さくすることが望ましい。
δの適応制御には、推定雑音の時間に対する傾き(グラディエント)に関する情報を用いることができる。推定雑音が真の雑音の平均値に近づくと、前記傾きは小さくなる。すなわち、前記傾きが大きいときにはδの値を大きく、小さいときにはδの値を小さくすることで、δの値を適切に制御することができる。前記傾きを、推定雑音の変化(隣接サンプル差分)で近似することもできる。
前記傾きを用いてδの値を制御するためには、前記傾きの符号を用いることができる。推定雑音が真の雑音の平均値に十分近づいたときには、前記傾きは正と負の値をほぼ同じ確率でとる。従って、前記傾きの符号を一定時間観測し、その偏りに従ってδの値を制御することができる。一例として、前記傾きの連続する二つの符号を比較し、これらが同じときにはδの値を大きくし、異なるときには小さくする方法があげられる。連続する二つの符号の代わりに、一定時間における正負符号の発生確率を比較して、これをδの値を制御する指標として用いることもできる。
擬似エコーy(k)ハットがエコーy(k)を、推定雑音n(k)ハットが雑音n(k)を十分に近似するという仮定のもとに、式(17)を式(20)の分母に適用すると、
Figure 2006049260
エコーE[y(k)]が雑音E[n(k)]より十分大きく、E[y(k)]がE[y(k)]ハットで、E[n(k)]がE[n(k)]ハットで近似できるとすれば、式(25)から(26)が得られる。
Figure 2006049260
すなわち、ξ(k)はシングルトークのときに1となり、ダブルトークのときはエコーと近端音声の比で定まる1より小さい値となる。従って、ξ(k)が1以外のときにダブルトークであると判定し、スイッチ9を開いて係数更新を行わない。
実施例2では、ξ(k)に時変の閾値を適用する。式(26)から、ダブルトークのときのξ(k)の値は、近似的に近端信号パワーとエコーパワーの比に依存する。このため、近端信号パワーとエコーパワーを推定することができれば、ダブルトークのときのξ(k)の値を求めることができる。エコーパワーは、擬似エコーパワーで近似すれば、逐次求めることができる。近端信号パワーは、式(21)と同様に、
(k)ハット=Ave[e(k)]…(27)
で計算することができる。Ave[・]としては、式(14)、(15)に示した移動平均や、
(k+1)ハット=δ・v(k)ハット+(1−δ)・e(k)…(28)
で表される1次漏れ積分を用いることができる。ここにδは平均化の時定数である。δに関しても、δと同様の適応制御を用いることができる。
式(23)から明らかなように、残留エコーと雑音が十分小さいときだけ、式(28)を計算してv(k)ハットを更新する。このようにして求めた近端信号パワーと擬似エコーパワーを用いて、ダブルトークに対応したξ(k)の値ξDT(k)を求めることができる。
ξDT(k)が定まれば、ξDT(k)<ξTH(k)<1を満足する閾値ξTH(k)を定めることによって、その閾値より大きいξ(k)をシングルトーク、小さいξ(k)をダブルトークと判定することができる。このダブルトーク判定において、ξDT(k)に一次漏れ積分を適用して平均化したξDT(k)バーをξDT(k)の代わりに用いることもできる。
図2に示す実施例3では、スイッチ9に代えて、乗算器91を有する。ダブルトーク検出回路81からは、0と1の間の連続値で表されるダブルトークの信頼係数が乗算器91に供給される。乗算器91は、係数更新回路7から供給された係数更新量にこの信頼係数を乗算してから適応フィルタ5に伝達する。従って、ダブルトークの信頼係数に対応する量の係数更新が実行される。これは、ダブルトークであることが十分信頼できるときには完全に係数更新を停止し、不確実であるときにはその信頼度に対応した量の係数更新が行われることを意味する。このため、係数更新を行うか停止するかの二者択一制御の場合に比べて、エコー除去の性能を改善することができる。
信頼係数をθ(k)とすると、
θ(k)={ξ(k)−ξDT(k)}/{1−ξDT(k)}…(29)
によってθ(k)を求めることができる。式(29)において、θ(k)はξ(k)の線形関数であるが、ξ(k)の非線形関数としてもよい。また、線形関数および非線形関数のどちらの場合でも、これまでの説明と同様に、ξDT(k)バーをξDT(k)の代わりに用いることができる。さらに、これまでの説明では、1とξDT(k)が1と0に対応するように設定していたが、1とξDT(k)の間のより狭い区間を1と0に対応させ、それより広い区間では値を0と1にクリップすることも可能である。
なお、乗算器91を用いた信頼係数に基づくダブルトーク制御は、すでに説明した実施例1および実施例2にも適用できることは、明白である。
図3に示す実施例4では、雑音推定回路10に代えて雑音推定回路11を有する。雑音推定回路11には、誤差信号e(k)に加えてダブルトーク検出情報が供給されている。雑音推定回路11は、誤差信号e(k)を用いたv(k)の存在評価に加えて、ダブルトーク検出回路81から供給される0または1のダブルトーク情報、または0と1の間の連続値で表される信頼係数θ(k)を、v(k)の存在情報として用いることができる。すなわち、正規化瞬時自己相関とダブルトーク情報または信頼係数の併用による近端信号の存在検出である。
例えば、正規化瞬時自己相関が閾値γより小さくても、ダブルトーク情報が1であるか信頼係数があらかじめ定められた閾値よりも大きい場合には、近端信号存在と判定することができる。また、信頼係数が1と0から離れた特定の範囲の値であるときに、正規化瞬時自己相関の値と閾値の相互関係を参照することもできる。さらに、正規化瞬時自己相関に関する情報を全く用いず、ダブルトーク情報または信頼係数だけを用いて、近端信号の存在を評価することも可能である。
図4に示す実施例5では、図3のダブルトーク検出回路81に代えてダブルトーク検出回路82を有する。ダブルトーク検出回路82は、これまで説明したダブルトーク検出回路81と新たなダブルトーク検出回路821を内部に有し、これらの出力をスイッチ822で切り替えて出力する。スイッチ822の切り替えは、係数変化評価回路823の出力で制御する。係数変化評価回路823は、適応フィルタ5から係数値を受けて、それらの変化を評価する。
ダブルトーク検出回路821には、参照信号x(k)、擬似エコーy(k)ハット、およびマイクロフォン信号m(k)が供給されており、参照信号とエコーの比Rxy(k)を用いて計算したm(k)・Rxy(k)と参照信号x(k)を比較することで、ダブルトークを検出する。シングルトークのときには、m(k)がエコーy(k)にほぼ等しくなるので、m(k)・Rxy(k)は参照信号にほぼ等しい。一方、ダブルトークのときには、m(k)がv(k)を含むためにシングルトークのときよりも大きな値となる。すなわち、m(k)・Rxy(k)は参照信号よりも大きくなる。これらの大小関係を用いて、m(k)・Rxy(k)を評価することで、ダブルトークの検出が可能となる。m(k)・Rxy(k)と参照信号x(k)の比較は、双方の連続する複数サンプルの最大値同士や平均値同士、あるいはこれらのいずれかと瞬時値とを用いることもできる。
参照信号とエコーの比Rxy(k)は、近似的に参照信号x(k)と擬似エコーy(k)ハットのひとして計算することができる。高精度で安定したRxy(k)の値を得るために、参照信号x(k)と擬似エコーy(k)ハットにそれぞれ一次漏れ積分や移動平均を適用し、平均化した値を求めてから利用することもできる。また、ダブルトーク検出に適切なマージンを持たせるために、参照信号x(k)をβ・m(k)・Rxy(k)と比較してもよい。ここに、βは1近傍の定数である。
適応フィルタ5の係数の初期値が一般的にゼロであるために、擬似エコーy(k)ハットの初期値もゼロとなり、Rxy(k)の初期値は無限大となる可能性がある。これを防ぐために、擬似エコーy(k)ハットには初期値を与えるとよい。2線/4線変換回路の利得は一般的に−6dB以下であるので、Rxy(k)の初期値としては−6dBが適切である。音響結合によるエコーの場合には、マイクロフォンから減算器6に至る経路の途中に存在する可能性のある正の利得のために、Rxy(k)は0dBより大きい可能性もある。そこで、初期値としては例えば0dBを設定する。
係数変化評価回路823は、適応フィルタ5から受けた係数値W(k)を用いて、それらの変化を評価する。変化を評価する一つの方法は、係数値W(k)の要素の二乗総和S(k)を式(30)によって求め、これを評価することである。
Figure 2006049260
係数値W(k)はゼロベクトルを初期値として係数更新が始まるので、S(k)はゼロから始まり徐々に増加する。係数がほぼ収束すると、S(k)の増加は停止し、飽和する。この特性を用いて、S(k)の増分{S(k)―S(k−1)}を評価することによって、適応フィルタ5の収束を検出することができる。
前記増分の評価としては、{S(k)―S(k−1)}の符号を用いることができる。すなわち、前記符号が変化せず同じ符号が続く間は収束過程にあり、交番するようになったときに収束と判定する。この符号の変化は、1サンプル毎に評価してもよいし、複数サンプルをまとめて評価してもよい。複数サンプルをまとめて評価する際には、複数サンプルの符号の総和を評価してもよいし、符号の多数決をとったものを評価することもできる。
また、前記増分の評価としては、{S(k)―S(k−1)}の絶対値または二乗値を用いることもできる。すなわち、前記絶対値または二乗値が大きい間は収束過程にあり、ゼロに極めて近くなったときに収束と判定する。このために、前記絶対値または二乗値を閾値と比較する。この絶対値または二乗値は、1サンプル毎に評価してもよいし、複数サンプルをまとめて評価してもよい。複数サンプルをまとめて評価する際には、複数サンプルに渡る絶対値または二乗値の総和を評価してもよいし、平均値を評価することもできる。
さらに、前記増分の評価としては、{S(k)―S(k−1)}の絶対値または二乗値をS(k)で正規化して得られる正規化絶対値または正規化二乗値を用いることもできる。すなわち、前記正規化絶対値または正規化二乗値が大きい間は収束過程にあり、ゼロに極めて近くなったときに収束と判定する。このために、前記正規化絶対値または正規化二乗値をを閾値と比較する。この正規化絶対値または正規化二乗値は、1サンプル毎に評価してもよいし、複数サンプルをまとめて評価してもよい。複数サンプルをまとめて評価する際には、複数サンプルに渡る正規化絶対値または正規化二乗値の総和を評価してもよいし、平均値を評価することもできる。
これまで、S(k)は係数値W(k)の要素の二乗総和として説明したが、同様の性質を示す別の指標を用いることもできる。このような指標の例として、係数値W(k)の要素の絶対値総和、係数値W(k)の一部の要素の二乗和または絶対値和などがある。特に、一部の要素としてその絶対値が大きいものを選ぶと、演算量を削減しつつ、総和の場合と同等の特性を得ることができる。
以上説明した動作によって、係数変化評価回路823は、適応フィルタ5の収束状態を評価することができる。係数変化評価回路823は、スイッチ822が、適応フィルタ5が収束するまではダブルトーク検出回路821の出力を、収束してからはダブルトーク検出回路81の出力を、それぞれ選択して出力するように制御する。実際には、係数変化評価回路823は、適応フィルタ5の収束だけではなく、一般的な係数更新量を評価していることになる。このため、係数変化評価回路823は、適応フィルタ5の係数更新量が大きいときにはダブルトーク検出回路821の出力を、小さいときにはダブルトーク検出回路81の出力を、スイッチ822が選択して出力するように制御する。
このような構成とすることにより、ダブルトーク検出精度を高くすることができる。これは、ダブルトーク検出回路81では、擬似エコーy(k)ハットをエコーy(k)の近似として用いているからである。適応フィルタ5が収束過程にあるときなど係数変化量(修正量)が大きいときには、擬似エコーy(k)ハットはエコーy(k)を十分な精度で近似しない。このため、擬似エコーy(k)ハットをエコーy(k)の近似として用いない別のダブルトーク検出回路821の検出結果を用いることで、検出精度を高くすることができる。
このような制御の特殊な例として、適応フィルタ5が収束するまではダブルトーク検出回路821の出力を、収束後はダブルトーク検出回路81の出力を、スイッチ822が選択して乗算器91と雑音推定回路11に供給するように構成することができる。
図5に示す実施例6では、図4のダブルトーク検出回路821の入力が、マイクロフォン信号m(k)ではなく、エコーが除去された信号e(k)となっている。ダブルトーク検出回路821は、実施例5と同様に動作する。参照信号とエコーの比Rxy(k)を用いて計算したe(k)・Rxy(k)と参照信号x(k)を比較して、ダブルトークを検出する。シングルトークのときには、e(k)が適応フィルタ5の収束程度に応じたエコーy(k)とゼロの間の値となる。従って、e(k)・Rxy(k)は参照信号にほぼ等しい値から、適応フィルタ5の収束に対応してより小さい値となり、収束後はほぼゼロとなる。一方、ダブルトークのときには、e(k)がv(k)を含むためにシングルトークのときよりも大きな値となる。すなわち、e(k)・Rxy(k)は参照信号よりも大きくなる。これらの大小関係を用いて、e(k)・Rxy(k)を評価することで、ダブルトークの検出が可能となる。
図6に示す実施例7では、図5の係数変化評価回路823の入力が、適応フィルタ5から供給される係数値ではなく、係数更新回路7の出力となっている。係数更新回路7の出力は、式(3)の右辺第二項なので、係数変化量そのものである。実施例5で説明したように、係数更新回路7から供給される式(3)の右辺第二項に関する二乗総和、絶対値総和、一部要素の二乗和、絶対値和を係数変化評価回路823で評価することによって、実施例5と同様にスイッチ822を制御することができる。また、実施例7として説明した式(3)の右辺第二項に関する二乗総和、絶対値総和、一部要素の二乗和、絶対値和を用いたスイッチ822の制御は、実施例6にも適用できることは明らかである。
図7に示す実施例8では、図5のスイッチ822に代えて情報統合回路824を有する。情報統合回路824は、係数変化評価回路823から供給される適応フィルタ5の係数変化量(修正量)に応じて、ダブルトーク検出回路81と821の出力を統合して用いることによって、出力を計算する。最も簡単な情報統合回路824の動作は、係数変化量(修正量)に応じてダブルトーク検出回路81または821の出力を切り替えて排他的に出力することであり、情報統合回路824の動作はスイッチ822と等しくなる。また、係数変化量(修正量)に応じてダブルトーク検出回路81と821の出力を混合して出力することもできる。最も簡単な混合は、係数変化量(修正量)に応じてダブルトーク検出回路81と821の出力を比例配分することである。適応フィルタ5の係数収束に応じて、ダブルトーク検出回路821の重点的な利用からダブルトーク検出回路81の重点的な利用へと、スムーズに遷移する。また、別の混合として、ダブルトーク検出回路821とダブルトーク検出回路81の出力の論理和がある。いずれかのダブルトーク検出回路がシングルトークであると判定したときに情報統合回路824の出力をシングルトークとする構成と、いずれかのダブルトーク検出回路がダブルトークであると判定したときに情報統合回路824の出力をダブルトークとする構成がある。これらの構成では、それぞれシングルトークまたはダブルトークと判定されやすい傾向が現れる。反対に、ダブルトーク検出回路821とダブルトーク検出回路81の出力の論理積を、情報統合回路824の出力とすることもできる。両方のダブルトーク検出回路が揃ってシングルトークまたはダブルトークと判定したときに、情報統合回路824の出力をシングルトークまたはダブルトークとする。ここに具体的に示した統合方法以外にも、様々な情報統合を行うことが可能である。
尚、実施例4以降では、乗算器91を用いるものとして説明したが、実施例1から実施例3に説明したように、スイッチ9を用いた構成が可能なことは明白である。さらに、実施例1〜実施例8までのそれぞれの特徴的な構成要素は、互いに交換して適用することが可能である。
図8は、本発明の実施例9として、本発明をノイズキャンセラに適用した例を示している。
ノイズキャンセラに関する基本的な説明は、非特許文献1を参照することができる。図8に示す本発明の第2の実施の形態は、非特許文献1で説明されている構成に雑音推定回路11およびダブルトーク検出回路82を追加した構成となっている。
また、図8を、図7を用いてすでに説明した実施例8と比較すると、入力端子1がなくなり、スピーカ2の代わりにマイクロフォン31を具備している。ノイズキャンセラでは、マイクロフォン31で捕捉した雑音を適応フィルタ5で処理することにより、マイクロフォン3に漏れこむ雑音成分y(k)を模擬する擬似雑音y(k)ハットを生成し、これを減算器6で差し引くことによって、マイクロフォン3に混入する雑音y(k)を消去する。その際に、ダブルトーク検出回路82に基づく適切なステップサイズ制御を適応フィルタ5に適用することによって、出力端子4において得られる信号中に残留する雑音を小さく、音声信号成分に付随する歪みを小さくすることができる。その他の動作および効果は、図7を用いて説明した実施例8に等しいので、詳細な説明を省略する。
図9に、本発明の実施例10として、本発明をマイクロフォンアレイに適用した例を示している。マイクロフォンアレイに関する基本的な説明は、文献「1982年1月、オルタナティブ・アプローチ・トゥー・リニア・コンストレインド・アダプティブ・ビームフォーミング(An Alternative Approach to Linear Constrained Adaptive Beamforming), アイ・イー・イー・イー・トランザクションズ・オン・アンテナス・アンド・プロパゲイションズ(IEEE Trans. on Antennas and Propagations、PP.27-34, JUN, 1982)、27〜34ページ」を参照することができる。
図9に示す実施例10は、上記の文献で説明されている構成に雑音推定回路11およびダブルトーク検出回路82を追加した構成となっている。また、図9を、図7を用いてすでに説明した実施例8と比較すると、x(k)が入力端子からではなく多入力キャンセラ14から供給されており、マイクロフォン信号に相当する信号が固定ビームフォーマ12の出力として供給されている。マイクロフォンアレイでは、複数のマイクロフォン3〜3M−1で捕捉される信号を用いて目的信号v(k)を固定ビームフォーマ12で強調して、強調信号を生成する。同時に、複数のマイクロフォン3〜3M−1で捕捉される信号を用いてブロッキング行列13で目的信号v(k)を抑圧し、その出力を用いて多入力キャンセラ14で妨害信号y(k)の擬似信号y(k)ハットを生成する。減算器6で強調信号から擬似妨害信号を差し引くことによって得られた信号を、出力として出力端子4に供給する。ブロッキング行列13と多入力キャンセラ14は、共に複数の適応フィルタから構成されており、前者はブロッキング行列13の出力が、後者は減算器6の出力が、それぞれ最小化される。多入力キャンセラには、通常、マイクロフォンの数に等しい適応フィルタが含まれており、各適応フィルタの入力(参照信号)はブロッキング行列13から供給されている。
これらの参照信号を、x(k)〜x(k)とすると、これらの参照信号x(k)〜x(k)と減算器6の出力である誤差を用いて、適応フィルタの係数更新を行う。その際に、ダブルトーク検出回路82に基づく適切なステップサイズ制御を多入力キャンセラ14に適用することによって、出力端子4において得られる信号中に残留する妨害信号成分を小さく、音声信号成分に付随する歪みを小さくすることができる。図9において、ダブルトーク検出回路82の出力は、ブロッキング行列13にも供給されている。これは、ブロッキング行列13 と多入力キャンセラ14は、互いに異なったタイミングで係数更新を行うために、同じダブルトーク情報を用いて係数を制御するためである。すなわち、ブロッキング行列13は目標信号v(k)が存在するときに、多入力キャンセラ14は目標信号v(k)が存在しないときに係数を更新する。そのため、ダブルトーク検出回路82で得られたv(k)の存在に関する情報を用いて、ブロッキング行列13と多入力キャンセラ14の双方における係数更新を適切に制御することができる。ブロッキング行列13と多入力キャンセラ14は基本的に排他的に係数更新を行うが、既に実施例3で説明したように、信頼度係数を用いた制御を行うことにより、双方同時に係数更新を行うことも可能となる。その他の動作および効果は、図7を用いて説明した実施例8に等しいので、詳細な説明を省略する。
なお、特開平8−122424号公報には目標信号方向誤差に対して許容度の高いマイクロフォンアレイ及びビームフォーマが開示されている。ここに開示された構成では、ブロッキング行列と多入力キャンセラにリーク適応フィルタや係数拘束適応フィルタを利用していることが、文献「1982年1月、オルタナティブ・アプローチ・トゥー・リニア・コンストレインド・アダプティブ・ビームフォーミング(An Alternative Approach to Linear Constrained Adaptive Beamforming), アイ・イー・イー・イー・トランザクションズ・オン・アンテナス・アンド・プロパゲイションズ(IEEE Trans. on Antennas and Propagations、PP.27-34, JUN, 1982)、27〜34ページ」に開示された構成との違いである。したがって、これまで説明したダブルトーク検出回路82及びその類似技術が適用できることは明らかである。
次に、本発明の実施例11について図面を参照して詳細に説明する。
図10を参照すると、本発明の実施例11は、プログラム制御により動作するコンピュータ(中央処理装置;プロセッサ;データ処理装置)900と、入力端子1と、マイクロフォン3と、出力端子4とから構成されている。
コンピュータ(中央処理装置;プロセッサ;データ処理装置)900は、適応フィルタ5と、減算器6と、ダブルトーク検出回路82と、雑音推定回路11と、係数更新回路7と、乗算器91とを含む。
適応フィルタ5は、入力端子を経て供給された参照信号を受け、擬似エコーを生成する。減算器6は、マイクロフォン3から供給された信号から擬似エコーを差し引き、結果を係数更新回路7、雑音推定回路11、及び出力端子4に伝達する。ダブルトーク検出回路82は、参照信号とマイクロフォン3から供給された信号と適応フィルタ5の出力である擬似エコーと減算器6の出力と雑音推定回路11の出力と適応フィルタ5の係数値を受けて、近端信号v(k)の存在に関する情報であるダブルトーク情報を生成し、乗算器91と雑音推定回路11に伝達する。雑音推定回路11は、減算器6の出力とダブルトーク検出回路82の出力を受けて、マイクロフォンにおいて得られる信号に混入する雑音を推定する。係数更新回路7は、参照信号と、減算器6の出力と、雑音推定回路11の出力である推定雑音を受けて、係数更新量を求める。乗算器91は、係数更新量とダブルトーク検出回路82の出力を受けて乗算し、結果を係数更新のために適応フィルタ5に伝達する。
なお、本実施例11の他の態様として、コンピュータ900が上述した実施例9、実施例10に相当する機能を含む構成も可能である。
次に、本発明の実施例12について図面を参照して詳細に説明する。
図11を参照すると、本発明の実施例12は、上述した実施例1から実施例10に記載された発明を実施するための形態をプログラムにより構成した場合に、そのプログラムにより動作するコンピュータの構成図である。
当該プログラムは、コンピュータ(中央処理装置;プロセッサ;データ処理装置)910に読み込まれ、コンピュータ910の動作を制御する。コンピュータ910はプログラムの制御により以下の処理、すなわち本発明の第2の発明におけるコンピュータ900による処理と同一の処理、を実行する。
本発明は、回線用エコーキャンセラ、音響エコーキャンセラなどのエコー消去システム、等化器、さらにはマイクロフォンアレイ、ノイズキャンセラなどの妨害信号除去システム、これらの実現形態としてのロボット、テレビ会議システム、携帯電話、音声認識システム、自動車用ハンズフリーシステム、これらをコンピュータで実現するためのプログラムなどの用途に適用できる。

Claims (43)

  1. エコー、近端信号、雑音を含む信号を入力信号とし、前記入力信号と参照信号をフィルタリング処理してエコー信号を推定し、前記入力信号から前記推定されたエコー信号を減算し、前記減算結果と前記参照信号の相関を求め前記フィルタリング処理の係数を更新するエコー除去方法において、
    前記混在信号中に含まれる雑音を推定して推定雑音を求め、
    前記推定雑音を用いて前記混在信号に含まれる近端信号を推定し、
    前記推定された近端信号に応じて前記係数更新を制御する
    ことを特徴とするエコー除去方法。
  2. 適応フィルタで参照信号を処理して出力を計算し、エコー、近端信号、並びに雑音を少なくとも含む混在信号から前記適応フィルタの出力を減算し、前記減算結果と前記参照信号の相関をとることによって前記係数を適応的に更新するエコー除去方法において、
    前記混在信号中に含まれる雑音を推定して推定雑音を求め、
    前記推定雑音を用いて前記混在信号に含まれる近端信号を検出し、
    前記近端信号の存在に応じて2つの離散値を定め、
    前記2つの離散値に応じて前記係数更新程度を適応的に制御する
    ことを特徴とするエコー除去方法。
  3. 適応フィルタで参照信号を処理して出力を計算し、エコー、近端信号、並びに雑音を少なくとも含む混在信号から前記適応フィルタの出力を減算し、前記減算結果と前記参照信号の相関をとることによって前記係数を適応的に更新するエコー除去方法において、
    前記混在信号中に含まれる雑音を推定して推定雑音を求め、
    前記推定雑音を用いて前記混在信号に含まれる近端信号を検出して、検出の信頼度に対応した連続な値を求め、
    前記連続の値に応じて前記係数更新程度を適応的に制御する
    ことを特徴とするエコー除去方法。
  4. 前記混在信号中に含まれる雑音の推定に際して、前記2つの離散値、もしくは前記連続の値を用いることを特徴とする請求項1から請求項3のいずれかに記載のエコー除去方法。
  5. 前記近端信号の検出を行う際に、
    第1の検出方法で検出を行って第1の検出結果を求め、
    第2の検出方法で検出を行って第2の検出結果を求め、
    前記第1と第2の検出結果のうちいずれかを用いて最終的な検出結果とすることを特徴とする請求項1から請求項4のいずれかに記載のエコー除去方法。
  6. 前記近端信号の検出を行う際に、
    第1の検出方法で検出を行って第1の検出結果を求め、
    第2の検出方法で検出を行って第2の検出結果を求め、
    前記第1と第2の検出結果を統合して最終的な検出結果を求めることを特徴とする請求項1から請求項4のいずれかに記載のエコー除去方法。
  7. 前記近端信号に関する最終的な検出結果を、前記第1と第2の検出結果を用いて決定する際に、前記適応フィルタの係数値に関する情報を用いることを特徴とする請求項5又は請求項6に記載のエコー除去方法。
  8. 前記近端信号に関する最終的な検出結果を、前記第1と第2の検出結果を用いて決定する際に、前記適応フィルタの係数値の変化に関する情報を用いることを特徴とする請求項5又は請求項6に記載のエコー除去方法。
  9. 前記近端信号に関する最終的な検出結果を、前記第1と第2の検出結果を用いて決定する際に、前記適応フィルタの収束程度に関する情報を用いることを特徴とする請求項5又は請求項6に記載のエコー除去方法。
  10. 適応フィルタで参照信号を処理して出力を計算し、妨害信号、目的信号、並びに雑音を少なくとも含む混在信号から前記適応フィルタの出力を減算し、前記減算結果と前記参照信号の相関をとることによって前記係数を適応的に更新するノイズ除去方法において、
    前記混在信号中に含まれる雑音を推定して推定雑音を求め、
    前記推定雑音を用いて前記混在信号に含まれる目的信号を検出して、検出の信頼度に対応した値を求め、
    前記信頼度に対応した値に応じて前記係数更新程度を適応的に制御する
    ことを特徴とするノイズ除去方法。
  11. 前記混在信号中に含まれる雑音の推定に際して、前記信頼度に対応した値を用いることを特徴とする請求項10に記載のノイズ除去方法。
  12. 前記目的信号の検出を行う際に、
    第1の検出方法で検出を行って第1の検出結果を求め、
    第2の検出方法で検出を行って第2の検出結果を求め、
    前記第1と第2の検出結果を統合して最終的な検出結果を求めることを特徴とする請求項10又は請求項11に記載のノイズ除去方法。
  13. 前記目的信号に関する最終的な検出結果を、前記第1と第2の検出結果を用いて決定する際に、前記適応フィルタの係数値に関する情報を用いることを特徴とする請求項12に記載のノイズ除去方法。
  14. 前記目的信号に関する最終的な検出結果を、前記第1と第2の検出結果を用いて決定する際に、前記適応フィルタの係数値の変化に関する情報を用いることを特徴とする請求項12に記載のノイズ除去方法。
  15. 前記目的信号に関する最終的な検出結果を、前記第1と第2の検出結果を用いて決定する際に、前記適応フィルタの収束程度に関する情報を用いることを特徴とする請求項12に記載のノイズ除去方法。
  16. 複数のマイクロフォンで受けた、妨害信号、目的信号、並びに雑音を少なくとも含む混在信号を第1の適応フィルタ群で処理することによって目的信号を抑圧した目的ブロック信号を生成し、前記目的ブロック信号を第2の適応フィルタ群で処理することによって擬似妨害信号を生成し、前記混在信号を固定フィルタ群で処理することによって目的信号を強調した目的強調信号を生成し、前記目的強調信号から前記擬似妨害信号を差し引くことによって妨害信号を除去するように動作する信号処理方法において、
    前記混在信号中に含まれる雑音を推定して推定雑音を求め、
    前記推定雑音を用いて前記混在信号に含まれる目的信号を検出して、検出の信頼度に対応した値を求め、
    前記信頼度に対応した値に応じて前記第1及び第2の適応フィルタ群の係数更新程度を適応的に制御する
    ことを特徴とする信号処理方法。
  17. 前記混在信号中に含まれる雑音の推定に際して、前記信頼度に対応した値を用いることを特徴とする請求項16に記載の信号処理方法。
  18. 前記目的信号の検出を行う際に、
    第1の検出方法で検出を行って第1の検出結果を求め、
    第2の検出方法で検出を行って第2の検出結果を求め、
    前記第1と第2の検出結果を統合して最終的な検出結果を求めることを特徴とする請求項16又は請求項17に記載の信号処理方法。
  19. 前記目的信号に関する最終的な検出結果を、前記第1と第2の検出結果を用いて決定する際に、前記第2の適応フィルタ群の係数値に関する情報を用いることを特徴とする請求項18に記載の信号処理方法。
  20. 前記目的信号に関する最終的な検出結果を、前記第1と第2の検出結果を用いて決定する際に、前記第2の適応フィルタ群の係数値の変化に関する情報を用いることを特徴とする請求項18に記載の信号処理方法。
  21. 前記目的信号に関する最終的な検出結果を、前記第1と第2の検出結果を用いて決定する際に、前記第2の適応フィルタ群の収束程度に関する情報を用いることを特徴とする請求項18に記載の信号処理方法。
  22. 参照信号を処理して出力を計算する適応フィルタと、エコー、近端信号、並びに雑音を少なくとも含む混在信号から前記適応フィルタの出力を減算する減算器と、前記減算器出力と前記参照信号の相関をとることによって係数更新量を計算する係数更新回路を少なくとも含むエコー除去装置において、
    前記混在信号中に含まれる雑音を推定して推定雑音を求める雑音推定回路と、
    前記推定雑音を用いて前記混在信号に含まれる近端信号の存在に関する情報を求めるダブルトーク検出回路と、
    前記ダブルトーク検出回路の出力を受けて前記係数更新回路の出力を選択的に前記適応フィルタに伝達するスイッチと
    を有することを特徴とするエコー除去装置。
  23. 前記スイッチに代えて、前記ダブルトーク検出回路の出力を受けて前記係数更新回路の出力を修整してから前記適応フィルタに伝達する乗算器を有することを特徴とする請求項22に記載のエコー除去装置。
  24. 前記雑音推定回路は、前記ダブルトーク検出回路で得られる情報を用いて雑音を推定することを特徴とする請求項22又は請求項23に記載のエコー除去装置。
  25. 前記ダブルトーク検出回路が第1のダブルトーク検出回路と第2のダブルトーク検出回路を少なくとも含み、
    前記第1と第2のダブルトーク検出回路の出力をスイッチで切り替えて用いることを特徴とする請求項22から請求項24のいずれかに記載のエコー除去装置。
  26. 前記第1と第2のダブルトーク検出回路の出力を受け、前記第1と第2の検出結果を統合して新たなダブルトーク情報を求める情報統合回路を有し、
    前記情報統合回路の出力をダブルトーク検出情報として用いることを特徴とする請求項25に記載のエコー除去装置。
  27. 前記適応フィルタの係数値の変化に関する情報を求める第1の係数変化量評価回路を有し、
    前記第1の係数変化量評価回路の出力によって前記情報統合回路を制御することを特徴とする請求項26に記載のエコー除去装置。
  28. 前記係数更新回路の出力を用いて前記適応フィルタの係数値の変化に関する情報を求める第2の係数変化量評価回路を有し、
    前記第2の係数変化量評価回路の出力によって前記情報統合回路を制御することを特徴とする請求項26に記載のエコー除去装置。
  29. 参照信号を処理して出力を計算する適応フィルタと、妨害信号、目的信号、並びに雑音を少なくとも含む混在信号から前記適応フィルタの出力を減算する減算器と、前記減算器出力と前記参照信号の相関をとることによって係数更新量を計算する係数更新回路を少なくとも含む構成のノイズ除去装置において、
    前記混在信号中に含まれる雑音を推定して推定雑音を求める雑音推定回路と、
    前記推定雑音を用いて前記混在信号に含まれる目的信号の存在に関する情報を求めるダブルトーク検出回路と、
    前記ダブルトーク検出回路の出力を受けて前記係数更新回路の出力を修整してから前記適応フィルタに伝達する乗算器と
    を有することを特徴とするノイズ除去装置。
  30. 前記雑音推定回路は、前記ダブルトーク検出回路で得られる情報を用いて雑音を推定することを特徴とする請求項29に記載のノイズ除去装置。
  31. 前記第1と第2のダブルトーク検出回路の出力を受け、前記第1と第2の検出結果を統合して新たなダブルトーク情報を求める情報統合回路を有し、
    前記情報統合回路の出力をダブルトーク検出情報として用いることを特徴とする請求項29又は請求項30に記載のノイズ除去装置。
  32. 前記適応フィルタの係数値の変化に関する情報を求める第1の係数変化量評価回路を有し、
    前記第1の係数変化量評価回路の出力によって前記情報統合回路を制御することを特徴とする請求項31に記載のノイズ除去装置。
  33. 前記係数更新回路の出力を用いて前記適応フィルタの係数値の変化に関する情報を求める第2の係数変化量評価回路を有し、
    前記第2の係数変化量評価回路の出力によって前記情報統合回路を制御することを特徴とする請求項31に記載のノイズ除去装置。
  34. 複数のマイクロフォンと、前期複数のマイクロフォンで受けた、妨害信号、目的信号、並びに雑音を少なくとも含む混在信号を処理することによって目的信号を抑圧した目的ブロック信号を生成する第1の適応フィルタ群と、前記目的ブロック信号を処理することによって擬似妨害信号を生成する第2の適応フィルタ群と、前記混在信号を処理することによって目的信号を強調した目的強調信号を生成する固定フィルタ群と、前記目的強調信号から前記擬似妨害信号を差し引く減算器を少なくとも含む信号処理装置において、
    前記混在信号中に含まれる雑音を推定して推定雑音を求める雑音推定回路と、
    前記推定雑音を用いて前記混在信号に含まれる目的信号の存在に関する情報を求めるダブルトーク検出回路と、
    前記ダブルトーク検出回路の出力を受けて前記係数更新回路の出力を修整してから前記適応フィルタに伝達する乗算器とを少なくとも具備し、
    前記ダブルトーク検出回路の出力に対応して前記第1及び第2の適応フィルタ群の係数更新を適応的に制御することを特徴とする信号処理装置。
  35. 前記雑音推定回路は、前記ダブルトーク検出回路で得られる情報を用いて雑音を推定することを特徴とする請求項34に記載の信号処理装置。
  36. 前記第1と第2のダブルトーク検出回路の出力を受け、前記第1と第2の検出結果を統合して新たなダブルトーク情報を求める情報統合回路を有し、
    前記情報統合回路の出力をダブルトーク検出情報として用いることを特徴とする請求項34又は請求項35に記載の信号処理装置。
  37. 前記第2の適応フィルタ群の係数値の変化に関する情報を求める第1の係数変化量評価回路を有し、
    前記第1の係数変化量評価回路の出力によって前記情報統合回路を制御することを特徴とする請求項36に記載の信号処理装置。
  38. 前記係数更新回路の出力を用いて前記第2の適応フィルタ群の係数値の変化に関する情報を求める第2の係数変化量評価回路を有し、
    前記第2の係数変化量評価回路の出力によって前記情報統合回路を制御することを特徴とする請求項36に記載の信号処理装置。
  39. エコー、近端信号、並びに雑音を少なくとも含む混在信号中に含まれる雑音を推定して推定雑音を求め、
    前記推定雑音を用いて前記混在信号に含まれる近端信号の存在を検出することを特徴とするダブルトーク検出方法。
  40. エコー、近端信号、並びに雑音を少なくとも含む混在信号中に含まれる雑音を推定して推定雑音を求める雑音推定回路と、
    前記推定雑音を用いて前記混在信号に含まれる近端信号の存在に関する情報を求めるダブルトーク検出回路と
    を有することを特徴とするダブルトーク検出装置。
  41. 参照信号を処理して出力を計算する適応フィルタ処理と、
    エコー、近端信号、並びに雑音を少なくとも含む混在信号から前記適応フィルタの出力を減算する処理と、
    前記減算処理結果と前記参照信号の相関をとることによって係数更新量を計算する係数更新処理と、前記混在信号中に含まれる雑音を推定して推定雑音を求める雑音推定処理と、
    前記推定雑音を用いて前記混在信号に含まれる近端信号の存在に関する情報を求めるダブルトーク検出処理と、
    前記ダブルトーク検出処理結果を受けて前記係数更新処理結果を修整してから前記適応フィルタに伝達する乗算処理と
    をコンピュータに実行させるためのプログラム。
  42. 参照信号を処理して出力を計算する適応フィルタ処理と、
    妨害信号、目的信号、並びに雑音を少なくとも含む混在信号から前記適応フィルタの出力を減算する処理と、
    前記減算処理結果と前記参照信号の相関をとることによって係数更新量を計算する係数更新処理と、
    前記混在信号中に含まれる雑音を推定して推定雑音を求める雑音推定処理と、
    前記推定雑音を用いて前記混在信号に含まれる近端信号の存在に関する情報を求めるダブルトーク検出処理と、
    前記ダブルトーク検出処理結果を受けて前記係数更新処理結果を修整してから前記適応フィルタに伝達する乗算処理と
    をコンピュータに実行させるためのプログラム。
  43. 複数のマイクロフォンで受けた、妨害信号、目的信号、並びに雑音を少なくとも含む混在信号を処理することによって目的信号を抑圧した目的ブロック信号を生成する第1の適応フィルタ処理と、
    前記目的ブロック信号を処理することによって擬似妨害信号を生成する第2の適応フィルタ処理と、
    前記混在信号を処理することによって目的信号を強調した目的強調信号を生成する固定フィルタ処理と、
    前記目的強調信号から前記擬似妨害信号を差し引く減算処理と、
    前記混在信号中に含まれる雑音を推定して推定雑音を求める雑音推定処理と、
    前記推定雑音を用いて前記混在信号に含まれる目的信号の存在に関する情報を求めるダブルトーク検出処理と、
    前記ダブルトーク検出処理結果を受けて前記係数更新処理結果を修整してから前記適応フィルタに伝達する乗算処理と、
    前記ダブルトーク検出処理結果に対応して前記第1及び第2の適応フィルタ処理の係数更新を適応的に制御する処理と
    をコンピュータに実行させるためのプログラム。
JP2006542452A 2004-11-08 2005-11-04 信号処理の方法、信号処理の装置および信号処理用プログラム Expired - Fee Related JP4697465B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006542452A JP4697465B2 (ja) 2004-11-08 2005-11-04 信号処理の方法、信号処理の装置および信号処理用プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2004323908 2004-11-08
JP2004323908 2004-11-08
PCT/JP2005/020319 WO2006049260A1 (ja) 2004-11-08 2005-11-04 信号処理の方法、信号処理の装置および信号処理用プログラム
JP2006542452A JP4697465B2 (ja) 2004-11-08 2005-11-04 信号処理の方法、信号処理の装置および信号処理用プログラム

Publications (2)

Publication Number Publication Date
JPWO2006049260A1 true JPWO2006049260A1 (ja) 2008-08-07
JP4697465B2 JP4697465B2 (ja) 2011-06-08

Family

ID=36319260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006542452A Expired - Fee Related JP4697465B2 (ja) 2004-11-08 2005-11-04 信号処理の方法、信号処理の装置および信号処理用プログラム

Country Status (3)

Country Link
US (3) US8761385B2 (ja)
JP (1) JP4697465B2 (ja)
WO (1) WO2006049260A1 (ja)

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949120B1 (en) * 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
JP2008113371A (ja) * 2006-10-31 2008-05-15 Oki Electric Ind Co Ltd エコーキャンセラ及びエコーキャンセル方法
KR20080052813A (ko) * 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법
US8369511B2 (en) * 2006-12-26 2013-02-05 Huawei Technologies Co., Ltd. Robust method of echo suppressor
JP4821635B2 (ja) * 2007-01-31 2011-11-24 沖電気工業株式会社 信号状態検出装置、エコーキャンセラ及び信号状態検出プログラム
US7920619B2 (en) * 2007-04-25 2011-04-05 Telefonaktiebolaget Lm Ericsson (Publ) Efficient computation of a waveform correlation matrix
JP2008288785A (ja) * 2007-05-16 2008-11-27 Yamaha Corp テレビ会議装置
WO2009028023A1 (ja) * 2007-08-24 2009-03-05 Fujitsu Limited エコー抑制装置、エコー抑制システム、エコー抑制方法及びコンピュータプログラム
WO2009028349A1 (ja) * 2007-08-27 2009-03-05 Nec Corporation 特定信号消去方法、特定信号消去装置、適応フィルタ係数更新方法、適応フィルタ係数更新装置及びコンピュータプログラム
US7809129B2 (en) 2007-08-31 2010-10-05 Motorola, Inc. Acoustic echo cancellation based on noise environment
JP4945429B2 (ja) * 2007-12-26 2012-06-06 株式会社東芝 エコー抑圧処理装置
WO2009104252A1 (ja) * 2008-02-20 2009-08-27 富士通株式会社 音処理装置、音処理方法及び音処理プログラム
FR2946486B1 (fr) * 2009-06-09 2012-04-20 Parrot Procede de detection d'une situation de double parole pour dispositif telephonique "mains libres"
JP2011100029A (ja) * 2009-11-06 2011-05-19 Nec Corp 信号処理方法、情報処理装置、及び信号処理プログラム
CN101719969B (zh) * 2009-11-26 2013-10-02 美商威睿电通公司 判断双端对话的方法、系统以及消除回声的方法和系统
US9232071B2 (en) * 2011-12-16 2016-01-05 Qualcomm Incorporated Optimizing audio processing functions by dynamically compensating for variable distances between speaker(s) and microphone(s) in a mobile device
US9654609B2 (en) 2011-12-16 2017-05-16 Qualcomm Incorporated Optimizing audio processing functions by dynamically compensating for variable distances between speaker(s) and microphone(s) in an accessory device
US9048942B2 (en) * 2012-11-30 2015-06-02 Mitsubishi Electric Research Laboratories, Inc. Method and system for reducing interference and noise in speech signals
US9697847B2 (en) * 2013-03-14 2017-07-04 Semiconductor Components Industries, Llc Acoustic signal processing system capable of detecting double-talk and method
CN103337242B (zh) * 2013-05-29 2016-04-13 华为技术有限公司 一种语音控制方法和控制设备
US9978387B1 (en) * 2013-08-05 2018-05-22 Amazon Technologies, Inc. Reference signal generation for acoustic echo cancellation
GB2515592B (en) * 2013-12-23 2016-11-30 Imagination Tech Ltd Echo path change detector
US9646629B2 (en) * 2014-05-04 2017-05-09 Yang Gao Simplified beamformer and noise canceller for speech enhancement
US10181315B2 (en) * 2014-06-13 2019-01-15 Cirrus Logic, Inc. Systems and methods for selectively enabling and disabling adaptation of an adaptive noise cancellation system
US9344579B2 (en) * 2014-07-02 2016-05-17 Microsoft Technology Licensing, Llc Variable step size echo cancellation with accounting for instantaneous interference
CN105812598B (zh) * 2014-12-30 2019-04-30 展讯通信(上海)有限公司 一种降低回声的方法及装置
CN105812994B (zh) * 2014-12-30 2018-08-21 展讯通信(上海)有限公司 一种降低失真回声的方法及装置
EP3285497B1 (en) 2015-04-17 2021-10-27 Sony Group Corporation Signal processing device and signal processing method
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US9530426B1 (en) * 2015-06-24 2016-12-27 Microsoft Technology Licensing, Llc Filtering sounds for conferencing applications
KR20170032603A (ko) * 2015-09-15 2017-03-23 삼성전자주식회사 전자 장치, 그의 반향 신호 제거 방법 및 비일시적 컴퓨터 판독가능 기록매체
US10014906B2 (en) * 2015-09-25 2018-07-03 Microsemi Semiconductor (U.S.) Inc. Acoustic echo path change detection apparatus and method
JP6279172B2 (ja) * 2015-11-16 2018-02-14 三菱電機株式会社 エコーキャンセラ装置及び通話装置
US10498389B2 (en) * 2015-11-16 2019-12-03 Mitsubishi Electric Corporation Echo canceller device and voice telecommunications device
US9754605B1 (en) * 2016-06-09 2017-09-05 Amazon Technologies, Inc. Step-size control for multi-channel acoustic echo canceller
CN106782504B (zh) * 2016-12-29 2019-01-22 百度在线网络技术(北京)有限公司 语音识别方法和装置
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
US10341794B2 (en) * 2017-07-24 2019-07-02 Bose Corporation Acoustical method for detecting speaker movement
US10542153B2 (en) 2017-08-03 2020-01-21 Bose Corporation Multi-channel residual echo suppression
US10594869B2 (en) * 2017-08-03 2020-03-17 Bose Corporation Mitigating impact of double talk for residual echo suppressors
WO2019070722A1 (en) 2017-10-03 2019-04-11 Bose Corporation SPACE DIAGRAM DETECTOR
US10192567B1 (en) 2017-10-18 2019-01-29 Motorola Mobility Llc Echo cancellation and suppression in electronic device
WO2019231632A1 (en) 2018-06-01 2019-12-05 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
EP3854108A1 (en) 2018-09-20 2021-07-28 Shure Acquisition Holdings, Inc. Adjustable lobe shape for array microphones
US10636435B1 (en) * 2018-12-22 2020-04-28 Microsemi Semiconductor (U.S.) Inc. Acoustic echo cancellation using low-frequency double talk detection
US10819857B1 (en) * 2019-01-22 2020-10-27 Polycom, Inc. Minimizing echo due to speaker-to-microphone coupling changes in an acoustic echo canceler
JP6822505B2 (ja) * 2019-03-20 2021-01-27 沖電気工業株式会社 収音装置、収音プログラム及び収音方法
JP2022526761A (ja) 2019-03-21 2022-05-26 シュアー アクイジッション ホールディングス インコーポレイテッド 阻止機能を伴うビーム形成マイクロフォンローブの自動集束、領域内自動集束、および自動配置
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
CN113841419A (zh) 2019-03-21 2021-12-24 舒尔获得控股公司 天花板阵列麦克风的外壳及相关联设计特征
US10964305B2 (en) 2019-05-20 2021-03-30 Bose Corporation Mitigating impact of double talk for residual echo suppressors
CN114051738A (zh) 2019-05-23 2022-02-15 舒尔获得控股公司 可操纵扬声器阵列、系统及其方法
EP3977449A1 (en) 2019-05-31 2022-04-06 Shure Acquisition Holdings, Inc. Low latency automixer integrated with voice and noise activity detection
US10978086B2 (en) 2019-07-19 2021-04-13 Apple Inc. Echo cancellation using a subset of multiple microphones as reference channels
JP2022545113A (ja) 2019-08-23 2022-10-25 シュアー アクイジッション ホールディングス インコーポレイテッド 指向性が改善された一次元アレイマイクロホン
US10984815B1 (en) * 2019-09-27 2021-04-20 Cypress Semiconductor Corporation Techniques for removing non-linear echo in acoustic echo cancellers
JP2021111097A (ja) * 2020-01-09 2021-08-02 富士通株式会社 ノイズ推定方法、ノイズ推定プログラム及びノイズ推定装置
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
USD944776S1 (en) 2020-05-05 2022-03-01 Shure Acquisition Holdings, Inc. Audio device
WO2021243368A2 (en) 2020-05-29 2021-12-02 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
WO2022165007A1 (en) 2021-01-28 2022-08-04 Shure Acquisition Holdings, Inc. Hybrid audio beamforming system
US11875772B2 (en) * 2022-03-17 2024-01-16 Airoha Technology Corp. Adaptive active noise control system with double talk handling and associated method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04271622A (ja) * 1991-02-27 1992-09-28 Nec Corp エコーキャンセラ
JPH08256089A (ja) * 1995-03-17 1996-10-01 Toshiba Corp エコー打消装置

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2518433B2 (ja) 1990-01-24 1996-07-24 日本電気株式会社 ダブルト―ク検出回路
JP2974503B2 (ja) 1992-06-26 1999-11-10 沖電気工業株式会社 エコーキャンセラ
JP2944310B2 (ja) 1992-06-29 1999-09-06 沖電気工業株式会社 エコーキャンセラ
JPH07226793A (ja) 1994-02-10 1995-08-22 Fujitsu Ltd 信号伝達系の応答の変化を検出する装置
JPH07250397A (ja) 1994-03-09 1995-09-26 Nippon Telegr & Teleph Corp <Ntt> 反響消去方法およびこの方法を実施する装置
JPH07264103A (ja) 1994-03-18 1995-10-13 Nippon Telegr & Teleph Corp <Ntt> 音声の重畳検出方法及び装置とその検出装置を利用する音声入出力装置
JPH07288493A (ja) 1994-04-18 1995-10-31 Fujitsu Ltd ダブルトーク検出装置
JPH07303070A (ja) 1994-05-06 1995-11-14 N T T Idou Tsuushinmou Kk ダブルトーク検出方法
JP3218150B2 (ja) 1994-07-15 2001-10-15 ダイセル化学工業株式会社 非着色性ポリカーボネート樹脂
JP2882364B2 (ja) 1996-06-14 1999-04-12 日本電気株式会社 雑音消去方法及び雑音消去装置
JP3323068B2 (ja) 1996-07-19 2002-09-09 沖電気工業株式会社 エコーキャンセラ
JPH10229354A (ja) * 1997-02-14 1998-08-25 Fujitsu Ltd エコー制御装置
JP3396393B2 (ja) 1997-04-30 2003-04-14 沖電気工業株式会社 エコー・雑音成分除去装置
JP3357284B2 (ja) 1998-01-27 2002-12-16 シャープ株式会社 ダブルトーク検出制御装置およびダブルトーク検出制御方法
DE19831320A1 (de) * 1998-07-13 2000-01-27 Ericsson Telefon Ab L M Digitales adaptives Filter und akustischer Echokompensator
JP2000324233A (ja) 1999-05-11 2000-11-24 Matsushita Electric Ind Co Ltd 拡声電話機
US6560332B1 (en) * 1999-05-18 2003-05-06 Telefonaktiebolaget Lm Ericsson (Publ) Methods and apparatus for improving echo suppression in bi-directional communications systems
CN1243416C (zh) * 2000-03-27 2006-02-22 朗迅科技公司 用自适应判决门限来完成通话重叠检测的方法和装置
US20020041678A1 (en) * 2000-08-18 2002-04-11 Filiz Basburg-Ertem Method and apparatus for integrated echo cancellation and noise reduction for fixed subscriber terminals
GB2371191B (en) 2001-01-11 2005-06-15 Mitel Corp Double-talk and path change detection using a matrix of correlation coefficients
JP4069595B2 (ja) 2001-03-28 2008-04-02 松下電工株式会社 拡声通話装置
JP4483134B2 (ja) * 2001-06-11 2010-06-16 パナソニック電工株式会社 拡声通話システム
JP3568922B2 (ja) * 2001-09-20 2004-09-22 三菱電機株式会社 エコー処理装置
JP3968704B2 (ja) 2002-06-28 2007-08-29 日本電気株式会社 ハンズフリー携帯電話端末装置
US7359504B1 (en) * 2002-12-03 2008-04-15 Plantronics, Inc. Method and apparatus for reducing echo and noise
JP4271622B2 (ja) 2004-06-17 2009-06-03 ポリプラスチックス株式会社 ポリオキシメチレン樹脂製搬送コンベアベルト

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04271622A (ja) * 1991-02-27 1992-09-28 Nec Corp エコーキャンセラ
JPH08256089A (ja) * 1995-03-17 1996-10-01 Toshiba Corp エコー打消装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
JPN6010033248, Akihiko sugiyama, et.al., "Noise−robust double−talk detection based on normalized cross correlation and a noise offset", IEEE International Conference on Acoustics, Speech, and Signal Processing, 2005. Proceedings., 20050318, Vol.3, pages.III/153 − III/156, US, IEEE *
JPN6010033249, Jacob Benesty, et.al., "A new class of doubletalk detectors based on cross−correlation", IEEE Transactions on Speech and Audio Processing, 200003, Vol.8, Issue 2, pages.168−172, US, IEEE *
JPN6010033250, Hua Ye and Bo−Xiu Wu, "A new double−talk detection algorithm based on the orthogonality theorem", IEEE Transactions on Communications, 199111, Vol.39, Issue 11, pages.1542−1545, US, IEEE *
JPN6010033251, Masanori Kato, et.al., "A family of 3GPP−standard noise suppressors for the AMR codec and the evaluation results", IEEE International Conference on Acoustics, Speech, and Signal Processing, 2003. Proceedings., 20030406, Vol.1, pages.I/916−I/919, US, IEEE *
JPN6010033252, Akihiko Sugiyama, "An interference−robust stochastic gradient algorithm with a gradient−adaptive step−size", IEEE International Conference on Acoustics, Speech, and Signal Processing, 1993., 19930427, Vol.3, pages.539−542, US, IEEE *

Also Published As

Publication number Publication date
US20160180862A1 (en) 2016-06-23
JP4697465B2 (ja) 2011-06-08
US9301048B2 (en) 2016-03-29
US10453471B2 (en) 2019-10-22
US20080101622A1 (en) 2008-05-01
US8761385B2 (en) 2014-06-24
WO2006049260A1 (ja) 2006-05-11
US20140247949A1 (en) 2014-09-04

Similar Documents

Publication Publication Date Title
JP4697465B2 (ja) 信号処理の方法、信号処理の装置および信号処理用プログラム
US9805734B2 (en) Signal processing device, signal processing method and signal processing program for noise cancellation
US7957542B2 (en) Adaptive beamformer, sidelobe canceller, handsfree speech communication device
CN105577961B (zh) 增益控制器的自动调谐
US9008327B2 (en) Acoustic multi-channel cancellation
JP5423966B2 (ja) 特定信号消去方法、特定信号消去装置、適応フィルタ係数更新方法、適応フィルタ係数更新装置及びコンピュータプログラム
US9543926B2 (en) Signal processing method and device
KR20060113714A (ko) 비상관된 잡음에 대해 내성을 갖는 적응형 빔포머
JP5391103B2 (ja) 多チャネルエコー消去方法、多チャネルエコー消去装置、多チャネルエコー消去プログラム及びその記録媒体
US20070121926A1 (en) Double-talk detector for an acoustic echo canceller
JPH09139696A (ja) 適応識別とそれに関する適応エコーキャンセラのための方法と装置
KR20160014679A (ko) 에코 제거기
JP5293952B2 (ja) 信号処理方法、信号処理装置、並びに信号処理プログラム
CN111885276B (zh) 消除回声的方法及系统
US8503687B2 (en) System identification device and system identification method
US8270624B2 (en) Noise cancelling device and method, and noise cancelling program
KR100545832B1 (ko) 간섭신호에 강인한 음향 반향 제거장치
CN112863532A (zh) 回音抑制装置、回音抑制方法以及存储介质
JP4591102B2 (ja) エコーキャンセラおよびそれを用いたハンズフリー電話とエコーキャンセル方法
KR20080095422A (ko) 음향 반향 제거기 및 그 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100616

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110215

R150 Certificate of patent or registration of utility model

Ref document number: 4697465

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees