JP3676825B2 - 多チャンネル音響エコー消去方法および多チャンネル音響エコー消去装置 - Google Patents
多チャンネル音響エコー消去方法および多チャンネル音響エコー消去装置 Download PDFInfo
- Publication number
- JP3676825B2 JP3676825B2 JP54356998A JP54356998A JP3676825B2 JP 3676825 B2 JP3676825 B2 JP 3676825B2 JP 54356998 A JP54356998 A JP 54356998A JP 54356998 A JP54356998 A JP 54356998A JP 3676825 B2 JP3676825 B2 JP 3676825B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- signal
- microphone
- channels
- critical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 32
- 238000012937 correction Methods 0.000 claims description 58
- 230000003044 adaptive effect Effects 0.000 claims description 55
- 230000005236 sound signal Effects 0.000 claims description 53
- 238000004364 calculation method Methods 0.000 claims description 34
- 230000006870 function Effects 0.000 claims description 30
- 238000001914 filtration Methods 0.000 claims description 20
- 230000003595 spectral effect Effects 0.000 claims description 20
- 238000001228 spectrum Methods 0.000 claims description 17
- 238000005315 distribution function Methods 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 12
- 238000005314 correlation function Methods 0.000 claims description 11
- 230000008878 coupling Effects 0.000 claims description 11
- 238000010168 coupling process Methods 0.000 claims description 11
- 238000005859 coupling reaction Methods 0.000 claims description 11
- 230000000875 corresponding effect Effects 0.000 claims description 10
- 239000002131 composite material Substances 0.000 claims description 9
- 230000002596 correlated effect Effects 0.000 claims description 8
- 238000009792 diffusion process Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 5
- 230000007480 spreading Effects 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 101100177670 Caenorhabditis elegans hpk-1 gene Proteins 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 210000002469 basement membrane Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Description
この発明は、多チャンネル音響エコー消去方法並びに多チャンネル音響エコー消去装置に関するものである。
発明の背景
音声信号の伝達範囲において、「ハンドフリー」電話法およびテレビ会議のようないくつかのアプリケーションでは、音響エコーが無視できない不都合の源である。音響エコーを打ち消す公知の装置は、通常、考慮される音声信号伝達システムのスピーカーとマイクロフォンとの間の音響結合経路のインパルス応答を同定しかつモデリングするように機能する適応フィルタを具備している。
図1は、従来の音響エコー消去装置の一般的な構造を示している。この装置は、間に音響結合経路またはエコー経路14が存在するスピーカー10とマイクロフォン12に関連している。符号16,18は、それぞれ、受信された音声信号および送信される音声信号を示している。図1のエコー消去装置は、受信された音声信号16をその入力において受信する適応フィルタ20を含んでいる。適応フィルタ20の目的は、マイクロフォン12によって受信された信号からエコーを差し引くために、その係数を通してエコー経路14のインパルス応答を推定することである。この目的のために、適応フィルタ20の出力は、マイクロフォン12により受信された信号から適応フィルタ20により出力された信号を減算する減算器22に接続されている。減算器22からの出力から得られた差信号は、推定誤差24を与える。適応フィルタ20の係数は、推定誤差情報を使用する適当なアルゴリズムによって、漸次調節される。このアルゴリズムの選択はエコー消去装置の性能を決定する要因である。公知のエコー消去方法および装置は、一般に、通常、頭文字によってNLMSと示される正規化確率的勾配と呼ばれるアルゴリズムを使用している。このアルゴリズムの欠点は、その収束速度が、受信した音声信号のスペクトル特性に依存するということである。この発明の目的は、この依存性を低減することである。音響エコーの問題はもちろん、多チャンネル音声信号伝達システム、すなわち、複数のスピーカーおよび複数のマイクロフォン、例えば、ステレオの場合における2つのスピーカーと2つのマイクロフォンとを有するシステムにおいても生ずる。
多チャンネルエコー消去方法および装置は、1チャンネル消去のものと同様の原理に基づいて知られている。図2は、従来のステレオの音響エコー消去装置の部分的なブロック図を、例として示しており、この図においては、明確のために、2つのマイクロフォンチャンネルの内の一方のみが示されている。大まかな構造は、容易に、Nを任意の整数として、N個の音声信号チャンネルを有する音響エコー消去装置のものに一般化することができる。N=2の場合についてのみ以下に説明する。図1のエコー消去装置と同様の方法で、ステレオのエコー消去装置が受信された音声信号チャンネル161,162および送信される音声信号チャンネルに適用される。送信される音声信号チャンネルは、その内の1つのみが符号181により示されている。エコー消去装置は、2つのスピーカー101,102および2つのマイクロフォンに接続されている。マイクロフォンはその内の1つのみが符号121により示されている。4つのエコーチャンネルがあり、その内の2つのエコーチャンネル(141,142)は2つのスピーカー101,102と第1のマイクロフォン121との間に配置され、他の2つのエコーチャンネル(図示略)は、2つのスピーカー101,102と第2のマイクロフォンとの間に配置されている。種々のエコーチャンネルからのインパルス応答を推定するために、適応フィルタが各スピーカーチャンネルと各マイクロフォンチャンネルとの間に設けられている。このように、マイクロフォンチャンネル121が考慮される場合には、受信された音声信号161,162を入力としてそれぞれ受信する2つの適応フィルタ201,202が設けられる。適応フィルタ201,202の出力は、加算器261に、入力として供給される。Nを任意の整数として、Nチャンネルを有するエコー消去装置においては、そのような加算器が各マイクロフォンチャンネルに設けられる。加算器261により供給された適応フィルタの出力信号の合計は、減算器221により、マイクロフォン121により受信された信号から減算される。同じ操作が、各マイクロフォンチャンネルにおいて実行される。減算器221の出力として得られた信号は、考慮されるマイクロフォンチャンネルに対する全ての適応フィルタに共通の推定誤差241を供給する。図2の例では、推定誤差241は、適応フィルタ201,202に共通している。1チャンネルエコー消去装置の場合のように、適応フィルタの係数は、各マイクロフォンチャンネルについて、得られた推定誤差から、適当なアルゴリズムにより、反復する方法で変更される。
多チャンネル消去装置、特に、ステレオエコー消去装置において、適応フィルタの係数の適応アルゴリズムの収束速度は、1チャンネルエコー消去装置の場合のそれらのアルゴリズムの収束速度よりも比較的遅いことを特筆しておく。この収束の低速化は、図2おいて、符号161,162により示されたスピーカーにより受信された音声信号が、相互に相関しているという事実に起因していることがわかっている。
収束の低速化は多くの不都合を生ずる。特に、テレビ会議システムにおいて、離れた部屋に配置されたスピーカーは、システムの始動中またはエコー消去装置が配置されている部屋内における音響的な変化(例えば視聴者の移動)後の会話のエコーを、長時間にわたって検知する。さらに、多チャンネルエコー消去においては、エコーレベルの再現または増加を生ずる、受信した音声信号間の上述した相互の相関のために、離れた部屋における全ての音響的な変化がエコー消去装置の適応フィルタの収束を妨害する。
他方では、各マイクロフォンの信号について、相互に相関しない構成要素が提供されるときには、多チャンネルエコー消去装置の収束を加速する傾向にあるということが、実際にわかってきている。この発明の目的は、多チャンネルエコー消去装置の性能を改良し、かつ、その結果、多チャンネルエコー消去装置を備えた音声信号送信システムにおける通信の品質を向上するために、この相互に相関しない構成要素の性質を使用することである。このために、この発明の一般的な原理は、ある人間の聴覚特性を使用することにより不可聴にされた、相互に相関しない補助信号を、受信された音声信号チャンネルに加えることにある。
発明の概要
より正確には、この発明は、Nを1以上の整数として、各々1つのスピーカーと1つの結合されたマイクロフォンとを有するN個の音声信号チャンネルについてのエコー消去方法を目的としており、Nチャンネルの各々に対して、
(a) 隣接する周波数帯にわたって広がるスペクトルを有し、他のチャンネルについて発生された合成信号とは相関しない、ホワイトノイズのスペクトル特性を有する合成信号が生成され、
(b) 各周波数帯について、人間の聴覚認識力の性質を利用して、考慮されるチャンネルのスピーカーと関連する信号に対応して、周波数遮蔽しきい値が計算され、
(c) 各周波数帯において、補助信号を得るために、前記合成信号のレベルが、前記関連する遮蔽周波数しきい値の値とされ、
(d) 前記補助信号が、考慮されるチャンネルのスピーカーに関連する前記信号に加えられ、前記遮蔽周波数しきい値が前記補助信号を不可聴しかつ前記Nチャンネルの前記補助信号が相互に相関しないものとするように予め計算され、
(e) 前記予め得られた信号が、考慮される音声信号チャンネルに関連するスピーカーとマイクロフォンとの間の音響結合経路のインパルス応答の推定を形成する係数を有する適応フィルタに、入力として供給され、
(f) 各マイクロフォンチャンネルに関連するN個の適応フィルタの出力として得られた信号が計算され、かつ、その結果の信号が、このチャンネルに結合されたマイクロフォンにより受信された信号から減算され、
(g) 前記減算の結果において得られた差から推定誤差が計算され、
(h) 考慮されるマイクロフォンに関連する前記適応フィルタの係数が、関連する推定誤差の関数として補正されることを特徴としている。
この方法の特定の実施形態において、各周波数遮蔽しきい値を計算するために、
(b1) 各々が予め特定された数の音声信号サンプルを含み、2つの連続するブロックが相互に予め特定されたサンプル数にわたって重複する複数のブロックが形成され、
(b2) 各ブロックのサンプルがアポディゼーションウインドウにより重み付けされ、
(b3) 各ブロックのフーリエ変換が演算され、
(b4) その周波数範囲が、特定された下限および上限周波数を有する複数の隣接する臨界帯に分割され、
その後、各ブロックに対し、かつ、各臨界帯において:
(b5) この臨界帯についてのエネルギ分布関数の値を得るために、前記臨界帯に属する異なるスペクトル線のエネルギが加算され、
(b6) 前記エネルギ分布関数と積基底拡散関数との畳み込みが、スペクトル拡散Eiを得るために計算され、かつ、参照テーブルから得られ、
(b7) 音調性指数αiが、異なる臨界帯に属するスペクトル線のエネルギから計算され、
(b8) 補正係数Oiが、上記において計算された音調指数から計算され、
(b9) 周波数遮蔽しきい値Tiが、スペクトル拡散Eiおよび補正係数Oiから計算され、周波数遮蔽しきい値Tiが以下のように定義される。
10log10Ti=10log10Ei−Oi−Ci
ここで、Ciは、Nチャンネルの音声信号の種々の特性から計算された追加のしきい値補正パラメータである。
この方法の特定の実施形態において、追加のしきい値補正パラメータCiから計算するのに供される特性には、Nチャンネルの信号のそれぞれのレベルおよび、少なくとも数対のこれらの信号の内部相関関数の一組の値が含まれ、追加の補正パラメータCiは、この内部相関関数の値とともに増加する関数である。
変形例として、追加のしきい値補正パラメータCiの計算に供される特性は、各チャンネルの種々の臨界帯に含まれているエネルギの合計および少なくとも数対の異なるチャンネルに対する臨界帯毎のエネルギの比を含んでおり、種々の臨界帯内に含まれているエネルギの合計がより大きくなればなるほど、一対のチャンネルの臨界帯毎のエネルギの比が、異なる臨界帯の間で異ならなくなり、したがって、追加の補正パラメータCiがより重要になる。
この発明は、Nを1以上の整数として、各々がスピーカーと関連するマイクロフォンとを有するN個の音声信号チャンネルを有するエコー消去装置であって、
− 連続する2つが、予め特定されたサンプル数にわたって相互に重複する、予め特定された数の音声信号サンプルと各々含むブロック形成手段と;
該ブロック形成手段の出力位置に配置され、アポディゼーションウインドウにより各ブロックのサンプルを重み付けする重み付け手段と;
該重み付け手段の出力位置に配置され、フーリエ変換を計算する計算手段と;
隣接する臨界帯の下限および上限周波数値を計算する計算手段またはこれらの値を含む参照テーブルと;
臨界帯についてのエネルギ分布関数であって、所定の臨界帯について、この臨界帯に属する異なるスペクトル線のエネルギを加算することにより計算されるエネルギ分布関数の値を計算する計算手段と;
所定の臨界帯と各々関連する基底拡散関数を表す値を含む第2の参照テーブルと;
所定の臨界帯について、この臨界帯に関連するエネルギ分布関数と前記拡散関数との畳み込み積を計算することによりスペクトル拡散Eiを計算する計算手段と;
所定の臨界帯と関連する補正係数Oiを計算する計算手段と;
所定の臨界帯と関連する周波数遮蔽しきい値Tiを、該臨界帯と関連するスペクトル拡散および補正係数Oiから、Ciを追加のしきい値補正パラメータとして、
10log10Ti=10log10Ei−Oi−Ci
により計算する計算手段と;
ホワイトノイズのスペクトル特性を有する合成信号を発生する発生手段と;
各臨界帯について、Nチャンネルの複数の音声特性から、追加のしきい値補正パラメータCiを計算するためにN個の音声信号チャンネルに接続された制御手段と;
補助信号を得るために、合成信号のレベルを前記関連する周波数遮蔽しきい値の値にする手段と;
フーリエ逆変換を計算する計算手段と;
連続するブロックの処理の結果を記憶するための記憶手段と;
ブロックの処理結果を前のブロックの処理結果と組み合わせる手段と;
データ速度をブロック速度からサンプリング速度まで推移させるために記憶手段に接続された逐次読み出し手段と;
各チャンネルにおいて、受信した音声信号と関連する補助信号とを加算するために、N個の音声信号チャンネルにそれぞれ配置されたN個の第1の加算器手段と;
を具備する補助信号計算手段と、
− N個のマイクロフォンチャンネルの各々と結合され、各々が、前記N個の音声信号チャンネルの内の1つ結合された前記スピーカーとマイクロフォンとの間の音響結合経路のインパルス応答の推定を形成する係数を有するN個の適応フィルタリング手段を含む、N×N適応フィルタリング手段と、
− これらのN個の適応フィルタリング手段からの出力信号を加算するために、各マイクロフォンチャンネルと関連するN個の適応フィルタリング手段の出力に接続された第2の加算器手段と、
− 各チャンネルについて、前記第2の加算器手段の出力において得られた信号をこのチャンネルのマイクロフォンにより受信された信号から減算するために、前記第2の加算器手段の出力位置に各々配置され、N個の音声信号チャンネルのマイクロフォンにそれぞれ接続されたN個の減算器手段と、
− 各チャンネルのマイクロフォンに接続された前記減算器手段により供給される結果から、各チャンネルについて、推定誤差を計算するN個の計算手段と、
− N個のマイクロフォンチャンネルの各々と結合されたN個の適応フィルタリング手段の各係数を、各マイクロフォンチャンネルに関連する推定誤差の関数として、繰り返しにより補正するN個の補正手段とを具備するエコー消去装置を提案している。
装備は、アプリケーションによって異なり、特に、考慮される音声信号送信システムのスピーカーの数は、マイクロフォンの数と異なっていてもよい。
装置の特定の実施形態において、追加のしきい値補正パラメータCiの計算に供される特性には、N個のチャンネルの信号のそれぞれのレベルおよび少なくとも数対のこれらの信号の一組の内部相関関数の値が含まれており、該追加の補正パラメータCiは、この内部相関関数の値とともに増加する関数である。
変形例として、追加のしきい値補正パラメータCiの計算に供される特性は、各チャンネルの種々の臨界帯に含まれるエネルギの合計および少なくとも数対の異なるチャンネルの臨界帯毎のエネルギの比率を含んでいてもよく、種々の臨界帯に含まれるエネルギの合計が大きければ大きいほど、一対のチャンネルの臨界帯毎のエネルギの比率は、異なる臨界帯の間では異ならなくなり、したがって、追加の補正パラメータCiがより重要になる。
装置の特定の実施形態において、エコー消去装置は、さらに、異なる臨界帯に属するスペクトル線のエネルギから音調性指数αiを計算するための手段と、該音調性指数αiから補正係数Oiを計算する、補正係数Oiの計算手段とを具備している。
装置の特定の実施形態において、音調性指数を計算するための手段は、全ての臨界帯に対して同一であり、
αi=α=min(SFM/SFMmax,1)
により定義される一定の音調性指数を供給する。
ここで、min(a,b)はは、aとbの値の内の小さいものを指し、SFMmaxは、デシベルで表された、純粋な正弦波信号に関連する予め特定された値のパラメータであり、ここで、SFM=10log10G/Aであり、log10は、底を10とする対数を示し、Gは予め特定された数のフーリエ変換点にわたるエネルギの幾何平均を示し、Aは、同数の点にわたる算術平均を示している。
特定の実施形態において、SFMmax=−60dBである。
特定の実施形態において、補正係数Oiの計算手段は、
Oi=max(SO,αi.(k1+Bi)=(1−αi).k2)
によって定義された補正係数Oiを供給する。
ここで、max(s,b)は、aとbの内の大きいものを示し、SO,k1およびk2は予め特定されたパラメータ値をデシベルで示し、αiは、考慮される臨界帯に関連する音調性指数であり、Biは臨界帯の周波数をバーク(Bark)で示している。
装置の特定の実施形態において、SO=24.5dB、k1=14.5dB、k2=5.5dBである。
【図面の簡単な説明】
この発明の他の特徴および利点は、限定しない例として与えられた特定の実施形態の以下の詳細な説明を読むことにより明らかになる。この説明は、添付図面を参照している。
図1は、従来技術に関連しかつ導入部分において説明されている、従来の1チャンネル音響エコー消去装置を表す該略図である。
図2は、従来技術に関連しかつ導入部分において説明されている、従来のステレオの音響エコー消去装置の部分的な概略図であり、1つのマイクロフォンチャンネルのみが示されている。
図3は、特定の実施形態におけるこの発明の方法の段階の連続を概略的に示すフローチャートである。
図4は、この発明の部分的な実施形態における装置を概略的に示している。
図5は、この発明の特定の実施形態における装置に含まれている補助信号計算モジュールの構造を概略的に示している。
図6aは、音響結合経路の実際のインパルス応答と、この発明の特定の実施形態に係るステレオのエコー消去装置の適応フィルタにより推定されたインパルス応答との間の相対的な差の変化を時間の関数として示した第1の例を示すグラフである。
図6bは、従来のステレオのエコー消去装置について描かれた図6aのものと類似するグラフである。
図7aは、音響結合経路の実際のインパルス応答とこの発明の特定の実施形態に係るステレオのエコー消去装置の適応フィルタにより推定されたインパルス応答との相対的な差の変化を、時間の関数として示した第2の例を示すグラフである。
図7bは、従来のステレオのエコー消去装置について描かれた図7aのものと類似するグラフである。
好ましい実施形態の詳細な説明
この発明の方法および装置は、任意の音声信号に適用される。限定しない例として、それは言語信号のみならず音楽信号でもよい。最初に、一実施形態において図3を参照して、多チャンネルエコー消去方法の概括的な構成を説明する。
N個の音声信号チャンネルが想定され、その各々が、1つのスピーカーと1つのマイクロフォンとを具備している。
各受信した音声信号チャンネルにおいて、まず第1に、ホワイトノイズのスペクトル特性を有しかつ隣接する複数の周波数帯にわたって広がるスペクトルを有する信号が合成され、該N個のチャンネルの合成信号は、相互に相関していない。
次に、各周波数帯について、考慮されたチャンネルのスピーカーにより受信された音声信号に対応する周波数遮蔽しきい値が計算される。
遮蔽効果は、他の存在する音声が部分的にまたは完全に不可聴となることにあるということに注意すべきである。この現象が周波数領域において生ずるときには、同時遮蔽または周波数遮蔽と呼ばれる。その値以下において遮蔽された音声の全ての周波数成分が不可聴となる周波数遮蔽しきい値と呼ばれるしきい値が存在する。遮蔽現象のさらなる詳細については、E.ZWICKERおよびR.FELDTKELLERによる「Das Ohr als Nachrichtenempfanger」,Stuttgart,West Germany,Hirzel Verlag,1967の文献を参照することが有効である。
一実施形態においては、周波数遮蔽しきい値の計算が以下のように実行される。まず第1に、音声信号データフローの速度が、サンプリング速度、例えば16kHzからブロック速度まで推移して変換され、各ブロックは、例えば、32msの持続時間を有している。したがって、各ブロックは、予め特定された数のサンプルを含んでいる。2つの連続するブロックは、予め特定された数のサンプル、例えば、16msの持続時間にわたって相互に重なっている。
次に、スペクトルのその後の推定を改良するために、各ブロックのサンプルがアポディゼーションウインドウ、例えば、ハミング(Hamming)またはハニング(Hanning)ウインドウ形式のウインドウにより重み付けされる。
各ブロックのフーリエ変換が、予め特定された数の点、例えば、32msのブロックに対して512点にわたって計算される。このために、高速フーリエ変換アルゴリズムが使用されてもよい。
次いで、受信された音声信号が属しそうな周波数領域が、特定の下限および上限周波数を有する複数の隣接する周波数帯に分割される。これらの周波数帯は、臨界帯と呼ばれる。以下のテーブルは、限定しない例として、E.ZWICKERおよびR.FELDTKELLERにより設定され、かつ、上述した文献に示されている臨界帯(下限および上限および中心周波数)への音声周波数の領域の分解を与えている。各臨界帯の幅は、協定により1バークに等しい。したがって、テーブルは、ヘルツによる周波数スケールとバークの周波数スケールとの間の対応を与えている。
上述したフーリエ変換の適用に代えて、変形例として、複数のフィルタによる分解が使用され、臨界帯への分解を直接得ることが可能となる。
以下の段階は、各臨界帯に属する異なるスペクトル線のエネルギを、この臨界帯におけるエネルギ分布関数の値を得るために加算することにある。
次に、基底拡散と呼ばれる関数と臨界帯毎のエネルギ分布を与える関数との畳み込み積として定義されるスペクトル拡散Eiが計算される。基底拡散関数Ebは、人間の耳の基底膜のエネルギ周波数応答に対応している。それは、音調性、すなわち純粋な音声周波数の知覚から生ずる刺激を表し、上述したE.ZWICKERおよびR.FELDTKLLERの文献にも示されている以下の等式により定義され得る。
10log10Eb=15.81+7.5(B+0.474)-17.5(1+(B+0.474)2)1/2
ここで、log10は、10を底とする対数を表し、Bはバークで表した周波数である。説明される特定の実施形態において、この関数の値は参照テーブル内に読み込まれる。
ノイズを音により遮蔽することがその逆よりも難しいことが例証されてきた。遮蔽しきい値のこの不釣合を考慮に入れるために、所定の臨界帯Biに関連し、音声信号の音調性のまたは非音調性の側面に依存する補正係数Oiが各しきい値に適用される。この音調性のまたは非音調性の側面を評価するために、特定の実施形態において、SFM(スペクトル平坦度測定:spectral Flatness Measure)と呼ばれる測定が使用され、該測定は、予め特定された数のフーリエ変換点にわたるエネルギの幾何平均とその同じ数の点、例えば、512点にわたり計算されたフーリエ変換に対して256点にわたる算術平均の比として定義されている。
得られたSFM値は、純粋な正弦波信号のSFM値と比較され、限定しない例として、協定によりSFM=SFMmax=−60dBと表示され得る。
その後、音調性指数αiが計算され、それは、特定の実施形態において、一定かつ全ての臨界帯について同一であり、
αi=α=min(SFM/SFMmax,1)
により定義される。
ここで、min(a,b)はa,bの内の小さいものを示しており、指数αiは0,1の間の数であり、非音調性成分に対してよりも音調性成分に対してより高い値である。適当と判断される音調性指数の他の任意の計算方法を考えることは可能である。
バークで表された周波数Biの臨界帯に関連する補正係数Oiは、音調性指数αiから以下のように定義される。
Oi=max(SO,αi.(k1+Bi)+(1−αi).k2)
ここで、max(a,b)は、a,bの内の大きいものを示し、SO,k1,k2は、デシベルで表された予め特定されたパラメータ値である。通常、SO=24.5dB、k1=14.5dB、k2=5.5dBが選択され得る。
補正係数Oiは、一般の音調性成分の場合には、臨界帯のランクとともに増加する関数であり、これらの音調性成分に対しては、非音調性成分に対するよりもより大きな重みづけが与えられる。
さらに、追加の補正パラメータCiが、遮蔽しきい値に適用され、該パラメータCiはNチャンネルの音声信号の複数の特徴から計算される。該パラメータCiは、異なる臨界帯に対応する全ての遮蔽しきい値に共通であってもよく、または、各臨界帯に対して特定の値を有していてもよい。
特定の実施形態において、追加のしきい値補正パラメータCiは、Nチャンネルについて受信された音声信号レベルおよび少なくとも数対のこれらの信号からの内部相関関数の一組の値から計算される。この特定の実施形態において、追加のしきい値パラメータCiは、内部相関関数の値とともに増加する関数である。
限定しない例として、複数のマイクロフォンと複数のスピーカーとを備えた典型的な実際のテレビ会議において、マイクロフォンは、ピックアップされた信号間の相関が、2つの隣接するマイクロフォンの間で大きくかつ離れたマイクロフォン間で小さくなるように配置されている。この可変の相関は、送信中の処理によってとり得る変更とともに、受信において、一方では隣接チャンネル間、すなわち2つの直接隣り合うスピーカー間で、他方では離れたチャンネル間、すなわち他の対の離れたスピーカー間においても生ずる。
このようにして、パラメータCiの計算は、直接隣り合うスピーカーの対および2つの隣接する対(これらの対が存在する場合には、スピーカーの総数を考慮に入れる。)に対応するチャンネルの対のレベルおよび内部相関の特徴を利用することに限定され得る。したがって、直接隣り合うスピーカー(HPk、HPk+1)の対が考慮される場合には、それらのレベルおよび内部相関特性が、隣接する対(HPk−1,HPk)(HPk−1とHPkは直接隣り合っている。)および(HPk+1,HPk+2)(HPk+1とHPk+2は直接隣り合っている。)のものと同様に使用される。
他の実施形態において、追加の補正パラメータCiは、各チャンネルの種々の臨界帯に含まれるエネルギの合計および少なくとも数対の異なるチャンネルの臨界帯毎のエネルギの比率から計算される。
上述した実施形態と同様の方法で、このことは、直接隣り合うスピーカーの対および2つの隣接するついに相当するチャンネル対のエネルギ合計およびエネルギ比率の特性を利用することに限定され得る。種々の臨界帯に含まれるエネルギの合計がより大きければ大きいほど、一対のチャンネルの臨界帯毎のエネルギ比率は、異なる臨界帯間において、より異ならないようになり、該パラメータCiがより重要になる。
したがって、2つの所定のチャンネルの音声信号間の内部相関が強く、かつ/または、これら2つの信号が比較可能なエネルギを有する場合には、パラメータCiが高く、すなわち、しきい値の重大な低減、通常は6〜10dBが適用される。他方では、信号があまり相関していない、かつ/またはかなり異なったエネルギのものであるときには、しきい値のあまり大きくない低減、通常は0〜6dBが適用される。この補正は、聴覚特性を考慮している。これは、導入部で述べた補助信号に、最も高いとり得るレベルを与えることを可能にしながら、該補助信号を不可聴にするという目的を有しており、この目的を達成することについては以下に詳細に述べる。
各ブロックについて、かつ、各臨界帯において、周波数遮蔽しきい値Tiが、スペクトル拡散Eiおよび上記において定義された補正係数Oiおよび以下のような追加のしきい値補正係数Ciから得られる。
10log10Ti=10logEi−Oi−Ci
図3に示されるように、この方法の以下の段階は、各チャンネルについて補助信号を得ることにある。このために、特定の実施形態において、各臨界帯内への合成信号のレベルが、関連する周波数遮蔽しきい値にされる。
現在ブロックの処理の結果に対応するフーリエ逆変換が、その後、例えば、高速フーリエ変換アルゴリズムによって計算される。フーリエ変換が使用されない場合であって、上述したようにフィルタバンク(filter banks)により分解される場合には、フィルタバンクによる分解の逆変換に相当する合成段階が、フーリエ逆変換の代わりに実行される。
次に、現在の遮蔽されたノイズブロックを、例えば、「オーバーラップ・加算(overlap-add)」または「オーバーラップ・セーブ(overlap-save)」合成の公知の方法によって、再構築するために前のブロックの結果が、現在ブロックの処理の結果と組み合わせられる。
次にブロック速度が、再度、サンプリング速度まで推移させられる。
上記の全ての段階は、リアルタイムの信号処理により実行されてもよい。
特定の実施形態において、この方法の以下の段階は、図3に示されるように、各チャンネルについての、得られた補助信号のこのチャンネルのスピーカーに関連する信号への加算からなっている。構造により、Nチャンネルの補助信号は、相互に相関のないものであり、かつ、補助信号は関連する周波数遮蔽しきい値を超えないので、不可聴である。
上述した実施形態において、各補助信号は、その全体において、異なる臨界帯から再形成されたのちに、関連するスピーカー信号へ加算される。変形例として、この加算は、異なる臨界帯の各々においても全く同様に行われ得る。
次に、包括的な適応フィルタリング段階が、図3に示されるように実行される。
まず第1に、前記補助信号とスピーカー信号との合計が、適応フィルタへの入力として供給され、該適応フィルタの係数が、考慮される音声信号チャンネルに関連するスピーカーとマイクロフォンとの間の音響結合経路のインパルス応答の推定を形成する。
各チャンネルについて、この手続が行われ、その後、各マイクロフォンチャンネルに関連したN個の適応フィルタの出力において得られた信号が加算される。次に、各マイクロフォンチャンネルについての残りの信号がこのチャンネルと関連するマイクロフォンによって受信された信号から差し引かれる。
このようにして得られた差信号から、各マイクロフォンチャンネルについて、推定誤差が計算され、このマイクロフォンチャンネルに関連する適応フィルタの係数がこの推定誤差の関数として計算される。
上記において詳述された適応フィルタリング段階が、時間領域において実行される。変形例として、適応フィルタリングは、ブロックによりかつサンプルによらずに、特にフーリエ領域における対応する処理の全体の実行により、行われてもよい。周波数適応フィルタリング方法を説明するために、通常は、J.PRADOおよびE.MOULINESによる"Frequency domain adaptive filtering with applications to acoustic echo cancellation",Annales des Telecommunications,49,no.7-8,1994,pages 414-428が参照される。
以下においては、この発明に係るエコー消去装置の一実施形態を図4および図5を参照して説明する。
この実施形態において、スピーカーの数は、マイクロフォンの数と同一である。しかしながら、アプリケーションによっては、種々の装備が可能であり、特にスピーカーの数はマイクロフォンの数と異ならせてもよい。
図4に示されるように、エコー消去装置は、N個のスピーカー301,…,30NおよびN個のマイクロフォン321,…,32Nと結合されている。該エコー消去装置は、補助信号計算モジュール34を含んでおり、その詳細な構造は図5を参照して説明されている。全体的な方法において、補助信号計算モジュール34は、N個のスピーカーチャンネルに接続された制御モジュール36、N個のスピーカーチャンネルおよび前記制御モジュール36にそれぞれ接続されたN個の補助信号生成モジュール381,…,38NおよびN個のスピーカーチャンネルにそれぞれ配置されかつ各々が、考慮されたチャンネルにおいて受信された音声信号を入力として受信しかつこのチャンネルに結合された補助信号生成モジュールから信号を出力するN個の第1の加算器モジュール401,…,40Nを含んでいる。
図4に示されたエコー消去装置は、さらに、N×N適応フィルタリングモジュール42i,jを含んでおり、ここで、iおよびjは1〜Nの間で変化する整数である。N個の適応フィルタリングモジュール42i,1,…,42j,Nは、図4に示されるように、i番目(1≦i≦N)のマイクロフォンチャンネルに結合され、N個のスピーカーチャンネルにそれぞれ結合されている。i番目(1≦i≦N)のマイクロフォンチャンネルに対して、N個の適応フィルタリングモジュール42i,1,…,42j,Nの出力が第2の加算器モジュール44iに接続されている。各第2の加算器モジュール44i(1≦i≦N)の出力は、その非減算入力において、前記i番目のマイクロフォン32iにより受信された信号を受信する、減算器モジュール46iの減算入力に接続されている。各減算器モジュール46iの出力は、N個の適応フィルタリングモジュール42i.1,…,42j,Nの組を、減算器モジュール46iによる結果出力に基づく推定誤差を計算するためのモジュール(図示略)を介して、かつ、得られた推定誤差の関数としてN個の適応フィルタリングモジュール42i,1,…,42j,Nの係数を繰り返す方法で補正するためのモジュール(図示略)を介して制御する。
図5は、制御モジュール36とN個の補助信号生成モジュール381,…,38Nとにより構成される補助信号計算モジュール34のサブアセンブリの構造をより詳細に示している。モジュール48は、受信した音声信号の予め特定した数のサンプルを各々含むブロックを出力する。2つの連続するブロックは、特定数のサンプルにおいて相互に重複している。この方法の特定の実施形態の説明において与えられる数値例は、なおも有効である。
ブロック形成モジュール48は、各ブロックにアポディゼーションウインドウ、例えばハミングまたはハニングウインドウ形式のものを適用する重み付けモジュール50に接続されている。
この重み付けモジュール50は、フーリエ変換計算モジュール52に接続されている。限定しない例として、モジュール52は512点についての高速フーリエ変換を実行してもよい。
補助信号計算モジュール34は、受信した音声信号が属する周波数範囲をカバーする隣接する臨界帯の下限および上限周波数値を計算するためのモジュール54をも含んでいる。変形例として、モジュール54は、これらの値を含む参照テーブルからなっていてもよい。モジュール54は、エネルギ分布関数を計算するためのモジュール56に接続されている。このモジュール56の入力は、フーリエ変換計算モジュールにも接続されている。このモジュール56は、モジュール54により供給された臨界帯の限界周波数値を使用することにより、各臨界帯に属する異なるスペクトル線のエネルギを計算しかつ加算する。モジュール56は、各臨界帯について、エネルギ分布関数の値を出力する。
第2の参照テーブル58は、所定の臨界帯にそれぞれ関連する基底拡散関数を表す値を含んでいる。これらの関数の定義は、この方法の特定の実施形態との関係で上記に与えられている。
第2の参照テーブル58は、スペクトル拡散Eiを計算することができるモジュール50の入力に接続されている。モジュール50の入力は、エネルギ分布関数計算モジュール56にも接続されている。モジュール60は、所定の臨界帯について、この臨界帯に対するスペクトル拡散を出力するために、エネルギ分布関数と拡散関数との畳み込み積を計算する。
図5に示される特定の実施形態において、補助信号計算モジュール34は、さらに、所定の臨界帯にそれぞれ関連する音調性指数αiを計算するためのモジュール62を含んでいる。このモジュール62は、フーリエ変換計算モジュール52の出力に接続されており、異なる臨界帯に属するスペクトル線のエネルギ値を使用する。
この特定の実施形態において、音調性指数を計算するモジュール62は、所定の臨界帯にそれぞれ関連する補正係数Oiを計算するためのモジュール64に接続されている。このモジュール64は、音調性指数αiから補正係数Oiを計算する。
特定の実施形態において、音調性指数計算モジュール62は、全ての臨界帯について同一であり、
αi=α=min(SFM/SFMmax,1)
により定義される一定の音調性指数αiを供給する。ここで、min(a,b)はaとbのうちの小さいものを示しており、SFMmaxは、純粋な正弦波信号に関連してデシベルで表された予め特定した値のパラメータであり、
SFM=10log10G/A
であって、log10は10を底とする対数を表し、Gは、特定数のフーリエ変換点にわたるエネルギの幾何平均を示し、Aは、同じ数の点にわたる算術平均を示している。この実施形態において、補正係数Oi計算モジュール64は、各臨界帯について、下式により定義された補正係数Oiを出力する。
Oi=max(SO,αi.(k1+Bi)+(1−αi).k2)
ここで、max(a,b)は、aとbのうちの大きいものを示し、SO,k1,k2は、デシベルで表された特定値のパラメータであり、αiは考慮される臨界帯に関連する音調性指数であり、Biはバークで表した臨界帯の周波数である。限定しない例として、パラメータSFMmax,SO,k1,k2は、この方法の特定の実施形態に関連して上述した数値を有することができる。
補正係数Oi計算モジュール64およびスペクトル拡散計算モジュール60は、所定の臨界帯にそれぞれ関連する周波数遮蔽しきい値Tiを計算するためのモジュール66の入力に接続されている。モジュール66は、各臨界帯に対して、以下に定義される周波数遮蔽しきい値Tiを出力する。
10log10Ti=10log10Ei−Oi−Ci
ここで、Eiは、スペクトル拡散であり、Oiはこの臨界帯に関連する補正係数であり、Ciは追加のしきい値補正パラメータである。
パラメータCiは、上述した制御モジュール36によって供給される。図4に示されているモジュール36のN個のスピーカーチャンネルへの接続は、より明確にするために、図5においては省略されている。
特定の実施形態において、制御モジュール36は、この方法の特定の実施形態にしたがって上述したように、追加のしきい値パラメータCiをN個のチャンネルからの各信号のレベルおよび少なくとも数対のこれらの信号の内部相関関数の一組の値から各臨界帯に対して計算する。この場合には、パラメータCiは、内部相関関数の値とともに増加する関数であることがわかる。
他の実施形態において、制御モジュール36は、特定の方法の実施形態に関連して示されたように、各チャンネルの種々の臨界帯に含まれるエネルギの合計および少なくとも数対の異なるチャンネルの臨界帯毎とのエネルギの比率から、各臨界帯についてのパラメータCiを計算する。この場合には、種々の臨界帯に含まれているエネルギの合計が大きければ大きいほど、一対のチャンネルの臨界帯毎のエネルギの比率は、異なる臨界帯間において異ならなくなり、したがって、パラメータCiはより重要になる。
補助信号計算モジュール34は、さらに合成信号生成モジュール68を具備している。このモジュールは、各音声信号チャンネルに対して、ホワイトノイズのスペクトル特性を有しかつ他のチャンネルに対して生成された合成信号とは相関しない信号を生成する。
周波数遮蔽しきい値計算モジュール66の出力は、周波数変換モジュール69に接続されている。このモジュール69はモジュール66により供給された遮蔽しきい値のバークからヘルツへの変換を行う。
モジュール70は、モジュール68により生成された合成信号およびモジュール66により計算されモジュール69により変換された周波数遮蔽しきい値を入力として受信する。モジュール70は、補助信号を得るために、各合成信号のレベルを関連する周波数遮蔽しきい値の値とする。
モジュール70の出力は、フーリエ逆変換計算モジュール72の入力に接続されている。モジュール72の出力は、合成モジュール74の入力に接続されている。合成モジュール74は、ランダムアクセスメモリ(図示略)ブロックの処理の結果と、ランダムアクセスメモリにより供給された以前のブロックの処理の結果とを、例えば、「オーバーラップ・加算」または「オーバーラップ・セーブ」合成方法を実行することにより結合する。
逐次読み出しモジュール76は、合成モジュール74およびランダムアクセスメモリに接続されており、データ速度のブロック速度からサンプリング速度への推移を保証している。
上述したモジュール48〜76は、図4に簡略化した方法で示されている一連の補助信号生成モジュール381,…,38Nと等価である。実際に、各モジュール48〜76は、各スピーカーチャンネルに対する補助信号を生成することに寄与している。
このようにして、この発明は、音声信号チャンネルの各受信時に最大限のレベルの補助信号が発せられることを可能とし、収束速度の効果的な増加を保証するとともに、そのために、そのレベルは受信した音声信号による遮蔽のレベルよりも小さい構成により生成される。
この発明の方法および装置は、適応フィルタの収束を改良するために、1チャンネル(N=1の場合)のエコー消去装置にも適用する。
これらは、全ての形式の音響エコー消去装置、特に、周波数領域におけると同様に時間領域においても、または副バンドにおいても適用可能である。
図6a,6b,7a,7bは、この発明の特定の実施形態に係るエコー消去方法および装置によって得られる比較結果の2つの例を示している。
図6a〜図7bのグラフは、全て2つの曲線を含んでいる。破線の曲線は、右側ステレオチャンネルに関係し、点線からなる曲線は左側ステレオチャンネルに関係している。適応フィルタの係数の適応に使用されるアルゴリズムは、確率的正規勾配アルゴリズム(NLMS)である。適応フィルタは、1024個の係数からなるサイズを有している。横軸は、256で除した適応アルゴリズムの繰り返し回数を示している。縦軸は、音響結合経路の実際のインパルス応答とステレオエコー消去装置の適応フィルタのインパルス応答との間の相対的な差をデシベルで示している。
図6a,6bにより示されている第1の比較例は、男性の話者に対応している。NLMSアルゴリズムの適応ピッチは、0.25である。図6aはこの発明を用いることにより得られた相対的な差を示しており、図6bは従来のエコー消去方法および装置、特に補助信号を使用しないものを使用することにより得られた相対的な差を示している。
図7a,7bにより示されている第2の比較例は、女性の話者に対応している。NLMSアルゴリズムの適応ピッチは0.125である。図7a,7bは、それぞれ図6a,6bに類似したものである。
2つの比較例において、この発明の使用により、常に、1より少ない相対的な差(すなわち負のデシベル)が保証され、これは右側チャンネル(破線からなる曲線)についての従来の方法および装置の場合には該当しない。さらに、この発明を使用する場合には、左側チャンネル(点線からなる曲線)は、従来の方法及び装置に対応する曲線について観測される差より数デシベル小さい。したがって、この発明は、音響結合経路の変動が存在する場合に、エコー消去装置の適用における良好な性能を確保することができるという優れた性能を示す。
さらに、2つの例において、遮蔽しきい値に対して適用される補正は、10dBである。この補正の数デシベルの低減を許容してもよく、その場合には、追加されたノイズにより若干変更されてはいるけれども、知覚された対話が、テレビ会議のようなアプリケーションにおいて全く許容し得る品質を維持することになるので、提案された方法および装置の性能をさらに改善するものである。
Claims (12)
- Nを1以上の整数として、各々がスピーカーおよび付随するマイクロフォンを有するN個の音声チャンネルについてのエコー消去方法であって、N個のチャンネルの各々について:
(a) ホワイトノイズのスペクトル特性を有し、そのスペクトルが複数の隣接する周波数帯にわたって広がり、他のチャンネルについて生成された合成信号と相関しない合成信号が生成され、
(b) 各周波数帯について、周波数遮蔽しきい値が人間の聴覚の特性を利用することにより、考慮されたチャンネルのスピーカーに関連する信号に対応して計算され、
(c) 各周波数帯において、前記合成信号のレベルが、補助信号を得るために、関連する周波数遮蔽しきい値の値とされ、
(d) 前記補助信号が、考慮されたチャンネルのスピーカーに関連する信号に加えられ、前記周波数遮蔽しきい値が、前記補助信号を不可聴にし、かつ、前記Nチャンネルの補助信号が相互に相関しないものとするように予め計算され、
(e) 予め得られた前記信号が、考慮される音声信号チャンネルに関連するスピーカーとマイクロフォンとの間の音響結合経路のインパルス応答の推定を形成する係数を有する適応フィルタに、入力として供給され、
(f) 各マイクロフォンチャンネルに関連するN個の適応フィルタから出力として得られた信号が加算され、その結果の信号が、このチャンネルに関連するマイクロフォンにより受信された信号から減算され、
(g) 前記減算の結果において得られた差から推定誤差が計算され、
(h) 考慮されたマイクロフォンチャンネルに関連する適応フィルタの係数が、関連する推定誤差の関数として補正される
ことを特徴とするエコー消去方法。 - 各周波数遮蔽しきい値を計算するために、
(b1) 予め特定された数の音声信号サンプルを各々含むブロックが形成され、連続する2つのブロックが予め特定されたサンプル数にわたって相互に重複し、
(b2) 各ブロックのサンプルが、アポディゼーションウインドウにより重み付けされ、
(b3) 各ブロックのフーリエ変換が計算され、
(b4) その周波数範囲が、特定された上限および下限周波数を有する複数の隣接する臨界帯に分割され、
その後、各部ロックについて、かつ、各臨界帯において、
(b5) この臨界帯に対してエネルギ分布関数の値を得るために、前記臨界帯に属する異なるスペクトル線のエネルギが加算され、
(b6) 該エネルギ分布関数と基底拡散関数との畳み込み積が、スペクトル拡散Eiを得るために計算され、かつ、参照テーブルから得られ、
(b7) 音調性指数αiが、異なる臨界帯に属するスペクトル線のエネルギから計算され、
(b8) 補正係数Oiが、上記において計算された音調指数から計算され、
(b9) CiをNチャンネルからの音声信号の複数の特性から計算された追加のしきい値補正パラメータとして、以下の式により定義される周波数遮蔽しきい値Tiが、前記スペクトル拡散Eiおよび前記補正係数Oiから計算されることを特徴とする請求項1記載の方法。
10log10Ti=10log10Ei−Oi−Ci - 前記追加のしきい値補正パラメータCiの計算に供される特性が、Nチャンネルの信号のそれぞれのレベルおよび少なくとも数対のこれらの信号からの内部相関関数の一組の値を含み、前記追加の補正パラメータCiが、この内部相関関数の値とともに増加する関数であることを特徴とする請求項2記載の方法。
- 前記追加のしきい値補正パラメータCiの計算に供される特性が、各チャンネルの種々の臨界帯に含まれるエネルギの合計および少なくとも数対の異なるチャンネルに対する臨界帯毎のエネルギの比率を含み、前記種々の臨界帯に含まれるエネルギの合計が大きければ大きいほど、一対のチャンネルの臨界帯毎のエネルギの比率が異なる臨界帯の間で異ならなくなり、したがって、前記追加の補正パラメータCiがより重要になることを特徴とする請求項2記載の方法。
- Nを1以上の整数として、各々がスピーカーと関連するマイクロフォンとを有するN個の音声信号チャンネルを有するエコー消去装置であって、
− 連続する2つが、予め特定されたサンプル数にわたって相互に重複する、予め特定された数の音声信号のサンプルを各々含むブロック形成手段と、
該ブロック形成手段の出力位置に配置され、アポディゼーションウインドウにより各ブロックのサンプルを重み付けする重み付け手段と、
該重み付け手段の出力位置に配置され、フーリエ変換を計算する計算手段と、
隣接する臨界帯の下限および上限周波数値を計算する計算手段、または、これらの値を含む参照テーブルと、
前記臨界帯についてのエネルギ分布関数であって、所定の臨界帯について、この臨界帯に属する異なるスペクトル線のエネルギを加算することにより計算されるエネルギ分布関数の値を計算する計算手段と、
所定の臨界帯と各々関連する基底拡散関数を表す値を含む第2の参照テーブルと、
所定の臨界帯について、この臨界帯に関連するエネルギ分布関数と前記拡散関数との畳み込み積を計算することにより、スペクトル拡散Eiを計算する計算手段と、
所定の臨界帯と関連する補正係数Oiを計算する計算手段と、
所定の臨界帯と関連する周波数遮蔽しきい値Tiを、該臨界帯と関連するスペクトル拡散および補正係数Oiから、Ciを追加のしきい値補正パラメータとして、
10log10Ti=10log10Ei−Oi−Ci
により計算する計算手段と、
ホワイトノイズのスペクトル特性を有する合成信号を発生する発生手段と、
各臨界帯について、Nチャンネルからの音声信号の複数の特性から、前記追加のしきい値補正パラメータCiを計算するために、N個の音声信号チャンネルに接続された制御手段と、
補助信号を得るために、合成信号のレベルを前記関連する周波数遮蔽しきい値の値にする手段と、
フーリエ逆変換を計算する計算手段と、
連続するブロックの処理の結果を記憶する記憶手段と、
ブロックの処理結果を前のブロックの処理結果と組み合わせる手段と、
データ速度をブロック速度からサンプリング速度まで推移させるために記憶手段に接続された逐次読み出し手段と、
各チャンネルについて、受信した音声信号と関連する補助信号とを加算するために、N個の音声信号チャンネルにそれぞれ配置されたN個の第1の加算器手段と、
を具備する補助信号計算手段と、
− N個のマイクロフォンチャンネルの各々と結合され、各々が、N個の音声信号チャンネルの内の1つと結合された、前記スピーカーと前記マイクロフォンとの間の音響結合経路のインパルス応答の推定を形成する係数を有する、N個の適応フィルタリング手段を含む、N×N適応フィルタリング手段と、
− これらのN個の適応フィルタリング手段からの出力信号を加算するために、各マイクロフォンチャンネルに関連するN個の適応フィルタリング手段の出力に接続された第2の加算器手段と、
− 各マイクロフォンチャンネルについて、前記第2の加算器手段からの出力において得られた信号を、このチャンネルのマイクロフォンにより受信された信号から減算するために、それぞれが前記第2の加算器手段の出力位置に配置されかつN個の音声信号チャンネルのマイクロフォンにそれぞれ接続されたN個の減算器手段と、
− このチャンネルのマイクロフォンに接続された前記減算器手段により供給される結果から、各マイクロフォンチャンネルについて、推定誤差を計算する計算手段と、
− N個のマイクロフォンチャンネルの各々と結合されたN個の適応フィルタリング手段の各係数を、各マイクロフォンチャンネルに関連する推定誤差の関数として、繰り返しにより補正する補正手段とを具備するエコー消去装置。 - 前記追加のしきい値補正パラメータCiの計算に供される特性が、N個のチャンネルの信号のそれぞれのレベルと、少なくとも数対のこれらの信号の婦負部相関関数の一組の値とを含み、前記追加の補正パラメータCiがこの内部相関関数の値とともに増加する関数であることを特徴とする請求項5記載の装置。
- 前記追加のしきい値補正パラメータCiの計算に供される特性が、各チャンネルの種々の臨界帯に含まれるエネルギの合計と、少なくとも数対の異なるチャンネルの臨界帯毎のエネルギの比率とを含み、種々の臨界帯に含まれるエネルギの合計が大きければ大きいほど、一対のチャンネルの臨界帯毎のエネルギの比率が異なる臨界帯間では異ならなくなり、したがって前記追加の補正パラメータCiがより重要になることを特徴とする請求項5記載の装置。
- 前記異なる臨界帯に属するスペクトル線のエネルギから音調性指数αiを計算する手段をさらに含み、前記補正係数Oiの前記計算手段が、前記音調性指数αiから前記補正係数Oiを計算することを特徴とする請求項5記載の装置。
- 前記補正係数Oiの計算手段が、下式により定義される補正係数Oiを供給することを特徴とする請求項8記載の装置。
Oi=max(SO,αi.(k1+Bi)+(1−αi).k2)
ここで、max(a,b)はaとbのうちの大きいものを示し、SO,k1,k2は、予め特定された値をデシベルで示したパラメータであり、αiは、考慮された臨界帯に関連する音調性指数であり、Biは前記臨界帯の周波数をバークで示している。 - SO=24.5dB、k1=14.5dB、k2=5.5dBであることを特徴とする請求項9記載の装置。
- 前記音調性指数の計算手段が、全ての臨界帯について同一でありかつ下式により定義される一定の音調性指数を供給することを特徴とする請求項8記載の装置。
αi=α=min(SFM/SFMmax,1)
ここで、min(a,b)は、aとbの内の小さいものを示し、SFMmaxは、純粋な正弦波信号に関連するデシベルで表された予め特定された値のパラメータであり、SFM−10log10G/Aであり、log10は10を底とする対数を示し、Gは予め特定された数のフーリエ変換点にわたるエネルギの幾何平均を示し、Aは同じ数の点にわたるエネルギの算術平均を示すことを特徴とする請求項8記載の装置。 - 前記SFMmax=−60dBであることを特徴とする請求項11記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9704682A FR2762467B1 (fr) | 1997-04-16 | 1997-04-16 | Procede d'annulation d'echo acoustique multi-voies et annuleur d'echo acoustique multi-voies |
FR97/04682 | 1997-04-16 | ||
PCT/FR1998/000757 WO1998047276A1 (fr) | 1997-04-16 | 1998-04-15 | Procede d'annulation d'echo acoustique multi-voies et annuleur d'echo acoustique multi-voies |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000512832A JP2000512832A (ja) | 2000-09-26 |
JP3676825B2 true JP3676825B2 (ja) | 2005-07-27 |
Family
ID=9505977
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP54356998A Expired - Lifetime JP3676825B2 (ja) | 1997-04-16 | 1998-04-15 | 多チャンネル音響エコー消去方法および多チャンネル音響エコー消去装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US6556682B1 (ja) |
EP (1) | EP0919096B1 (ja) |
JP (1) | JP3676825B2 (ja) |
DE (1) | DE69827911T2 (ja) |
FR (1) | FR2762467B1 (ja) |
WO (1) | WO1998047276A1 (ja) |
Families Citing this family (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6542857B1 (en) * | 1996-02-06 | 2003-04-01 | The Regents Of The University Of California | System and method for characterizing synthesizing and/or canceling out acoustic signals from inanimate sound sources |
SE512903C2 (sv) * | 1997-10-29 | 2000-06-05 | Telia Ab | Metod och anordning vid stereoakustisk ekosläckning |
WO1999053674A1 (en) * | 1998-04-08 | 1999-10-21 | British Telecommunications Public Limited Company | Echo cancellation |
US6560332B1 (en) | 1999-05-18 | 2003-05-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and apparatus for improving echo suppression in bi-directional communications systems |
AU4599300A (en) * | 1999-05-25 | 2000-12-12 | British Telecommunications Public Limited Company | Acoustic echo cancellation |
US7062039B1 (en) | 1999-05-27 | 2006-06-13 | Telefonaktiebolaget Lm Ericsson | Methods and apparatus for improving adaptive filter performance by inclusion of inaudible information |
DE60036958T2 (de) | 1999-09-29 | 2008-08-14 | 1...Ltd. | Verfahren und vorrichtung zur ausrichtung von schall mit einer gruppe von emissionswandlern |
GB0023207D0 (en) * | 2000-09-21 | 2000-11-01 | Royal College Of Art | Apparatus for acoustically improving an environment |
US7747002B1 (en) | 2000-03-15 | 2010-06-29 | Broadcom Corporation | Method and system for stereo echo cancellation for VoIP communication systems |
CN101674512A (zh) * | 2001-03-27 | 2010-03-17 | 1...有限公司 | 产生声场的方法和装置 |
JP3506138B2 (ja) | 2001-07-11 | 2004-03-15 | ヤマハ株式会社 | 複数チャンネルエコーキャンセル方法、複数チャンネル音声伝送方法、ステレオエコーキャンセラ、ステレオ音声伝送装置および伝達関数演算装置 |
GB0301093D0 (en) * | 2003-01-17 | 2003-02-19 | 1 Ltd | Set-up method for array-type sound systems |
GB0304126D0 (en) * | 2003-02-24 | 2003-03-26 | 1 Ltd | Sound beam loudspeaker system |
US7501329B2 (en) * | 2003-05-21 | 2009-03-10 | Micron Technology, Inc. | Wafer gettering using relaxed silicon germanium epitaxial proximity layers |
GB0321676D0 (en) * | 2003-09-16 | 2003-10-15 | 1 Ltd | Digital loudspeaker |
NO319467B1 (no) * | 2003-12-29 | 2005-08-15 | Tandberg Telecom As | System og fremgangsmate for forbedret subjektiv stereolyd |
US7400692B2 (en) * | 2004-01-14 | 2008-07-15 | Interdigital Technology Corporation | Telescoping window based equalization |
US7352858B2 (en) * | 2004-06-30 | 2008-04-01 | Microsoft Corporation | Multi-channel echo cancellation with round robin regularization |
US20070269071A1 (en) * | 2004-08-10 | 2007-11-22 | 1...Limited | Non-Planar Transducer Arrays |
US8457614B2 (en) | 2005-04-07 | 2013-06-04 | Clearone Communications, Inc. | Wireless multi-unit conference phone |
US7376323B2 (en) * | 2005-05-25 | 2008-05-20 | Adc Telecommunications, Inc. | Fiber optic adapter module |
GB0514361D0 (en) * | 2005-07-12 | 2005-08-17 | 1 Ltd | Compact surround sound effects system |
US20080247567A1 (en) * | 2005-09-30 | 2008-10-09 | Squarehead Technology As | Directional Audio Capturing |
EP1770685A1 (en) | 2005-10-03 | 2007-04-04 | Maysound ApS | A system for providing a reduction of audiable noise perception for a human user |
US8126706B2 (en) * | 2005-12-09 | 2012-02-28 | Acoustic Technologies, Inc. | Music detector for echo cancellation and noise reduction |
DE602007005228D1 (de) * | 2006-01-06 | 2010-04-22 | Koninkl Philips Electronics Nv | Akustischer echokompensator |
WO2008056334A1 (en) * | 2006-11-10 | 2008-05-15 | Koninklijke Philips Electronics N.V. | Signal processing system and method |
DK2162879T3 (da) * | 2007-06-19 | 2013-07-22 | Dolby Lab Licensing Corp | Lydstyrkemåling med spektrale ændringer |
US8199927B1 (en) | 2007-10-31 | 2012-06-12 | ClearOnce Communications, Inc. | Conferencing system implementing echo cancellation and push-to-talk microphone detection using two-stage frequency filter |
US8050398B1 (en) | 2007-10-31 | 2011-11-01 | Clearone Communications, Inc. | Adaptive conferencing pod sidetone compensator connecting to a telephonic device having intermittent sidetone |
EP2380339B1 (en) | 2008-12-22 | 2018-08-15 | Koninklijke Philips N.V. | Determining an acoustic coupling between a far-end talker signal and a combined signal |
US8724798B2 (en) | 2009-11-20 | 2014-05-13 | Adobe Systems Incorporated | System and method for acoustic echo cancellation using spectral decomposition |
US7961415B1 (en) * | 2010-01-28 | 2011-06-14 | Quantum Corporation | Master calibration channel for a multichannel tape drive |
FR2969435A1 (fr) * | 2010-12-20 | 2012-06-22 | France Telecom | Mesure de bruit impulsif par detection spectrale |
JP5649488B2 (ja) * | 2011-03-11 | 2015-01-07 | 株式会社東芝 | 音声判別装置、音声判別方法および音声判別プログラム |
KR101930907B1 (ko) | 2011-05-30 | 2019-03-12 | 삼성전자주식회사 | 오디오 신호 처리 방법, 그에 따른 오디오 장치, 및 그에 따른 전자기기 |
JP5443454B2 (ja) * | 2011-09-20 | 2014-03-19 | トヨタ自動車株式会社 | 音源検出装置 |
KR101828448B1 (ko) * | 2012-07-27 | 2018-03-29 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 확성기-인클로져-마이크로폰 시스템 표현을 제공하기 위한 장치 및 방법 |
US9195860B1 (en) | 2014-01-10 | 2015-11-24 | Seagate Technology Llc | Adaptively combining waveforms |
US9712866B2 (en) | 2015-04-16 | 2017-07-18 | Comigo Ltd. | Cancelling TV audio disturbance by set-top boxes in conferences |
US9565493B2 (en) | 2015-04-30 | 2017-02-07 | Shure Acquisition Holdings, Inc. | Array microphone system and method of assembling the same |
US9554207B2 (en) | 2015-04-30 | 2017-01-24 | Shure Acquisition Holdings, Inc. | Offset cartridge microphones |
US9554210B1 (en) * | 2015-06-25 | 2017-01-24 | Amazon Technologies, Inc. | Multichannel acoustic echo cancellation with unique individual channel estimations |
CA2990891A1 (en) | 2015-06-30 | 2017-01-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forchung E.V. | Method and device for associating noises and for analyzing |
US10367948B2 (en) | 2017-01-13 | 2019-07-30 | Shure Acquisition Holdings, Inc. | Post-mixing acoustic echo cancellation systems and methods |
EP3625791A4 (en) * | 2017-05-18 | 2021-03-03 | Telepathy Labs, Inc. | TEXT-SPEECH SYSTEM AND PROCESS BASED ON ARTIFICIAL INTELLIGENCE |
CN107105366B (zh) * | 2017-06-15 | 2022-09-23 | 歌尔股份有限公司 | 一种多通道回声消除电路、方法和智能设备 |
WO2019231632A1 (en) | 2018-06-01 | 2019-12-05 | Shure Acquisition Holdings, Inc. | Pattern-forming microphone array |
US11297423B2 (en) | 2018-06-15 | 2022-04-05 | Shure Acquisition Holdings, Inc. | Endfire linear array microphone |
US11417351B2 (en) | 2018-06-26 | 2022-08-16 | Google Llc | Multi-channel echo cancellation with scenario memory |
WO2020061353A1 (en) | 2018-09-20 | 2020-03-26 | Shure Acquisition Holdings, Inc. | Adjustable lobe shape for array microphones |
US11303981B2 (en) | 2019-03-21 | 2022-04-12 | Shure Acquisition Holdings, Inc. | Housings and associated design features for ceiling array microphones |
US11438691B2 (en) | 2019-03-21 | 2022-09-06 | Shure Acquisition Holdings, Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality |
US11558693B2 (en) | 2019-03-21 | 2023-01-17 | Shure Acquisition Holdings, Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality |
US10652663B1 (en) | 2019-04-30 | 2020-05-12 | Cisco Technology, Inc. | Endpoint device using the precedence effect to improve echo cancellation performance |
US11445294B2 (en) | 2019-05-23 | 2022-09-13 | Shure Acquisition Holdings, Inc. | Steerable speaker array, system, and method for the same |
TW202105369A (zh) | 2019-05-31 | 2021-02-01 | 美商舒爾獲得控股公司 | 整合語音及雜訊活動偵測之低延時自動混波器 |
US11297426B2 (en) | 2019-08-23 | 2022-04-05 | Shure Acquisition Holdings, Inc. | One-dimensional array microphone with improved directivity |
US11552611B2 (en) | 2020-02-07 | 2023-01-10 | Shure Acquisition Holdings, Inc. | System and method for automatic adjustment of reference gain |
USD944776S1 (en) | 2020-05-05 | 2022-03-01 | Shure Acquisition Holdings, Inc. | Audio device |
WO2021243368A2 (en) | 2020-05-29 | 2021-12-02 | Shure Acquisition Holdings, Inc. | Transducer steering and configuration systems and methods using a local positioning system |
US11785380B2 (en) | 2021-01-28 | 2023-10-10 | Shure Acquisition Holdings, Inc. | Hybrid audio beamforming system |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH084243B2 (ja) * | 1993-05-31 | 1996-01-17 | 日本電気株式会社 | 多チャンネルエコー除去方法および装置 |
JP3397269B2 (ja) * | 1994-10-26 | 2003-04-14 | 日本電信電話株式会社 | 多チャネル反響消去方法 |
US5970154A (en) * | 1997-06-16 | 1999-10-19 | Industrial Technology Research Institute | Apparatus and method for echo cancellation |
-
1997
- 1997-04-16 FR FR9704682A patent/FR2762467B1/fr not_active Expired - Lifetime
-
1998
- 1998-04-15 US US09/202,726 patent/US6556682B1/en not_active Expired - Lifetime
- 1998-04-15 WO PCT/FR1998/000757 patent/WO1998047276A1/fr active IP Right Grant
- 1998-04-15 JP JP54356998A patent/JP3676825B2/ja not_active Expired - Lifetime
- 1998-04-15 EP EP98921538A patent/EP0919096B1/fr not_active Expired - Lifetime
- 1998-04-15 DE DE69827911T patent/DE69827911T2/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0919096A1 (fr) | 1999-06-02 |
DE69827911T2 (de) | 2005-12-01 |
FR2762467B1 (fr) | 1999-07-02 |
US6556682B1 (en) | 2003-04-29 |
JP2000512832A (ja) | 2000-09-26 |
DE69827911D1 (de) | 2005-01-05 |
FR2762467A1 (fr) | 1998-10-23 |
EP0919096B1 (fr) | 2004-12-01 |
WO1998047276A1 (fr) | 1998-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3676825B2 (ja) | 多チャンネル音響エコー消去方法および多チャンネル音響エコー消去装置 | |
KR101250124B1 (ko) | 에코 억제 필터를 위한 제어 정보를 계산하는 장치 및 방법 및 지연 값을 계산하는 장치 및 방법 | |
US9502048B2 (en) | Adaptively reducing noise to limit speech distortion | |
JP4417390B2 (ja) | ステレオ音声を向上させるためのシステム及び方法 | |
US6246760B1 (en) | Subband echo cancellation method for multichannel audio teleconference and echo canceller using the same | |
JP3099870B2 (ja) | 音響エコーキャンセラ | |
US8189766B1 (en) | System and method for blind subband acoustic echo cancellation postfiltering | |
CN1197263C (zh) | 通过使用频域非线性处理抑制反射信号的方法和设备 | |
US20090304198A1 (en) | Audio signal decorrelator, multi channel audio signal processor, audio signal processor, method for deriving an output audio signal from an input audio signal and computer program | |
US10455326B2 (en) | Audio feedback reduction utilizing adaptive filters and nonlinear processing | |
US20110182436A1 (en) | Adaptive Noise Reduction Using Level Cues | |
US9699554B1 (en) | Adaptive signal equalization | |
US8259926B1 (en) | System and method for 2-channel and 3-channel acoustic echo cancellation | |
US6134322A (en) | Echo suppressor for a speech input dialogue system | |
Wallin et al. | Perceptual quality of hybrid echo canceler/suppressor | |
Vashkevich et al. | Speech enhancement in a smartphone-based hearing aid | |
RU2485607C2 (ru) | Устройство и способ расчета коэффициентов фильтра эхоподавления |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050502 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080513 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090513 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100513 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100513 Year of fee payment: 5 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100513 Year of fee payment: 5 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110513 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110513 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120513 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130513 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130513 Year of fee payment: 8 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |