JP4414002B2 - 多重チャンネルの音響エコーを低減させ、かつ、音声を空間条件に適合させるための方法および装置 - Google Patents
多重チャンネルの音響エコーを低減させ、かつ、音声を空間条件に適合させるための方法および装置 Download PDFInfo
- Publication number
- JP4414002B2 JP4414002B2 JP55005698A JP55005698A JP4414002B2 JP 4414002 B2 JP4414002 B2 JP 4414002B2 JP 55005698 A JP55005698 A JP 55005698A JP 55005698 A JP55005698 A JP 55005698A JP 4414002 B2 JP4414002 B2 JP 4414002B2
- Authority
- JP
- Japan
- Prior art keywords
- mic
- signal
- cumulative distribution
- distribution function
- location
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 19
- 238000005315 distribution function Methods 0.000 claims description 71
- 230000001186 cumulative effect Effects 0.000 claims description 68
- 230000005540 biological transmission Effects 0.000 claims description 40
- 230000005236 sound signal Effects 0.000 claims description 22
- 238000013016 damping Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 description 11
- 238000002592 echocardiography Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 3
- 239000010445 mica Substances 0.000 description 3
- 229910052618 mica group Inorganic materials 0.000 description 3
- 238000005314 correlation function Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephonic Communication Services (AREA)
Description
本発明は、多重チャンネルの音響エコーを低減し、かつ、聴覚上の釣り合い(auditory perspective)を復元する(すなわち、音声を空間条件に適合させる)ための方法および装置に関する。本発明は、局所的場所と1つ以上の遠隔的場所との間における(各々の場所は幾つかのマイクロフォンと幾つかのラウドスピーカとを有している)幾つかの送信チャンネル上において音声信号をディジタル送信するためのシステムにおいて、特に重要な応用を提供する。このようなシステムは、サウンドテイク(音声は、幾つかのマイクロフォンにより拾われる)と、(幾つかのチャンネル上での)送信と、(幾つかのラウドスピーカによる)音声の復元とに関して“多重チャンネル”システムと称される。
例によれば、これは制限的なものではないが、本発明は、“ポイント・ツー・ポイント(point to point)”構成(この場合には、遠隔的空間からの画像が画面上に表示されるか、または、遠隔的空間の幾つかの観点が幾つかの画面上に表示される)と称される、2つの空間の間の送信に基づいて、および、“マルチポイント(multi-point)”構成(この場合には、遠隔的空間からの画像が幾つかの画面上に表示される)と称される、3つ以上の空間を具備するネットワーク範囲内での送信に関しての双方で、ビデオ会議ルームに関する応用の形式で説明される。
N個のマイクロフォンとM個のラウドスピーカとを有する空間においては、N×M個の音響エコー経路が存在する。一方では、音響エコーを除去するための従来のシステムは、このような状況においては妥当なコストでエコーが制御されることを可能にしない。他方では、局所的な場所における各々のマイクロフォンを考えられる最良の音声分布を得るべく送信する目的のために遠隔的空間のラウドスピーカに接続することは、送信チャンネル数を増加させることになり、これにより、商業開発の点で送信コストが高くなる。
音響エコーを除去するための従来のシステムに加えて、音声信号のレベルの変動に基づいて音響エコーを低減させるためのシステムが公知である。このようなシステムにおいて一般に遭遇する主な不都合点は、相互作用に設けられた制約、すなわち受信品質の低下であり、特に、“ダブルスピーチ”と称されるもの(すなわち、この場合には、所定の場所において、遠隔的空間からの効果的な音声信号とともに存在する効果的な局所的な音声信号が存在する)において受信した際の音声レベルのかなりの変動である。
本発明の目的は、多重チャンネルの音響エコーを低減させかつ音声を空間条件に適合させるための方法および装置を提供することであり、これらの方法および装置によって、相互作用を維持する一方でエコーが低減することが可能になり、かつ、比較的少数の送信チャンネルを用いているが、聴覚上の釣り合いを復元することを保証する。そのビデオ会議への応用において、本発明は、遠隔ミーティングが自然な通信状態として行われることを可能にする。
この目的に対し、本発明は、特に、局所的場所と少なくとも1つの遠隔的場所との間においてP個の送信チャンネル上で音声信号をディジタル送信するためのシステムにおいて音響エコーを低減させかつ音声を空間条件に適合させる方法を提案し、各々の場所はN個のマイクロフォンとM個のラウドスピーカとを有しており(N,P,Mは整数)、N,Mの値は場所によって異なることが可能であるり、これによって、
(a)前記局所的場所からの各々のマイクロフォン信号xi(n)(iは1〜Nの範囲の整数であり、nはサンプルのタイムランクを示す)に関する累積分布関数が計算され、かつ、前記局所的場所からの各々のラウドスピーカ信号zj(n)(jは1〜Mの範囲の整数)に関する累積分布関数が計算され(累積分布関数の概念については後述する)、
以下、全てのiについて、1≦i≦Nとし、
(b)第1減衰率Gmic(i,n)が、以前に得られた前記累積分布関数間の割合に基づいて、前記局所的場所からの前記マイクロフォン信号xi(n)に関して計算され、
(c)前記第1減衰率Gmic(i,n)が、
G’mic(i,n)=S1(Gmic(i,n))
(ここで、Gmic(i,n)≦sならば、S1(Gmic(i,n))=s
s<Gmic(i,n)<1ならば、S1(Gmic(i,n))=Gmic(i,n)
Gmic(i,n)≧1ならば、S1(Gmic(i,n))=1
sは、厳密に1未満の所定の最小閾値である)
のように定義される第2減衰率G’mic(i,n)を得るように調整され、
(d)以前に計算されたマイクロフォン信号の累積分布関数とラウドスピーカ信号の累積分布関数とに基づいて、
第1の状況において、前記マイクロフォン信号xi(n)がエコー信号のみであるのか、あるいは、前記局所的場所のみから生じている信号であるのかどうか、
または、
第2の状況において、前記マイクロフォン信号xi(n)が前記局所的場所からの成分と前記遠隔的場所からの成分とを有しているかどうか
が判断され、
(e)第3減衰率G”mic(i,n)が計算され、該第3減衰率G”mic(i,n)は、前記第1の状況においては、前記第2減衰率G’mic(i,n)と等しく、また、前記第2の状況においては、前記第2減衰率G’mic(i,n)と等しいが、前記第3減衰率G”mic(i,n)を得るために用いられる計算において前記最小閾値sが所定値だけ増加し、
(f)第4減衰率Γ(i,n)が、マイクロフォン信号の前記累積分布関数間の割合に基づいて計算され、
(g)前記第4減衰率Γ(i,n)が、
Γ’(i,n)=S2(Γ(i,n))
(ここで、Γ(i,n)≦s’ならば、S2(Γ(i,n))=s’
s’<Γ(i,n)<1ならば、S2(Γ(i,n))=Γ(i,n)
Γ(i,n)≧1ならば、S2(Γ(i,n))=1
s’は、厳密に1未満の所定の最小閾値である)
のように定義される第5減衰率Γ’(i,n)を得るように調整され、
(h)以前に得られた前記第3減衰率G”mic(i,n)と前記第4減衰率Γ(i,n)との積が、
G★ mic(i,n)=G”mic(i,n)・Γ’(i,n);
により定義される包括的な減衰率G★ mic(i,n)を得るために計算され、
(i)前記包括的な減衰率G★ mic(i,n)が、
βi(n)=S4(G★ mic(i,n))
(ここで、G★ mic(i,n)≦s”ならば、S4(G★ mic(i,n))=s”
s”<G★ mic(i,n)<1ならば、S4(G★ mic(i,n))=G★ mic(i,n)
s”は、厳密に1未満の所定の最小閾値である)
のように定義される重み係数βi(n)を得るように調整され、
(j)信号yk(n)が、
(ここで、αk,i(n)は所定の実符号化係数(real coding coefficients)を示し、βi(n)は以前に得られた重み係数を示す)
のように定義される、重み付き前記マイクロフォン信号xi(n)の1次結合の形式で、各々の送信チャンネル上で送信され(kは1からPまでの整数)、
以下、全てのjについて、1≦j≦Mとし、
(k)第6減衰率GHP(j,n)が、前記局所的場所からの各々の送信された信号yk(n)に関して計算された累積分布関数に基づいて、前記遠隔的場所からの前記ラウドスピーカ信号zj(n)に関して計算され、
(l)前記第6減衰率GHP(j,n)が、
λj(n)=S3(GHP(j,n))
(ここで、GHP(j,n)≦s★ならば、S3(GHP(j,n))=s★
s★<GHP(j,n)<1ならば、S3(GHP(j,n))=GHP(j,n)
GHP(j,n)≧1ならば、S3(GHP(j,n))=1
s★は、厳密に1未満の所定の最小閾値である)
のように定義される重み係数λj(n)を得るように調整され、
(m)前記遠隔的場所の前記ラウドスピーカ信号zj(n)が、
(ここで、γj,k(n)は所定の実符号化係数を示し、λj(n)は以前に得られた重み係数を示す)
のように定義される、重み付き送信信号yk(n)の1次結合に基づいて決定され、また、
(n)こうして得られた前記ラウドスピーカ信号zj(n)が、前記遠隔的場所のj番目のラウドスピーカ上において発せられる。
上記に略述された動作は、送信および受信の両方において、当該のネットワークの全ての空間において同様の方法で行われる。この本文中を通して、説明を簡略化するために、“局所的”空間と称される所定の空間と、1つまたは幾つかの“遠隔的”空間とに着目することにし、かつ、送信時に局所的空間において行われる操作および受信時に遠隔的空間において行われる操作についてのみ説明する。しかしながら、送信時に遠隔的空間において、受信時に局所的空間においてもそれぞれ同様の操作が行われる。
上述した同じ目的のために、本発明は、さらに、局所的場所と少なくとも1つの遠隔的場所との間においてP個の送信チャンネル上で音声信号をディジタル送信するためのシステムにおいて音響エコーを低減させかつ(音声を)空間条件に適合させるための装置を提案し、各々の場所は、N個のマイクロフォンとM個のラウドスピーカとを有しており(N,P,Mは整数)、N,Mの値は場所によって異なることが可能であり、前記装置は、音声信号を符号化するためのモジュールと、前記音声信号を解読するためのモジュールを具備し、
音声信号を符号化するための前記モジュールは、その入力において、前記局所的場所の前記N個のマイクロフォンからそれぞれ発生するN個のディジタル信号xi(n)を受信し(iは1〜Nの範囲の整数、nはサンプルのタイムランクを示す整数である)、この符号化モジュールは、その出力において、
(ここで、αk、i(n)は所定の実符号化係数を示し、βi(n)は前記局所的場所の前記マイクロフォンにより受信された信号の累積分布関数と、前記局所的場所の前記ラウドスピーカにより送信された信号の累積分布関数とに依存する重み係数を示し、P個の信号yk(n)は、前記局所的場所と前記遠隔的場所との間において、P個の送信チャンネル上でそれぞれ送信される)
という式により定義されるP個のディジタル信号yk(n)(kは1〜Pの範囲の整数である)を供給し、
前記音声信号を解読するための前記モジュールは、その入力において前記P個のディジタル信号yk(n)を受信し、かつ、その出力において各々の場所の前記M個のラウドスピーカによりそれぞれ送信すべきM個のディジタル信号zj(n)を供給し(jは1〜Mの範囲の整数、nはサンプルのタイムランクを示す整数である)、前記ディジタル信号zj(n)は、
(ここで、γj.k(n)は所定の実符号化係数を示し、λi(n)は、前記信号yk(n)に依存する重み係数を示す)
という式により定義される
ことを特徴とする。
本発明の他の特徴および利点は、以下の例により与えられる特定の実施形態に関する詳細な説明により明確となるが、この例はあらゆる点において制限的なものではない。説明は、以下の添付図面を参照して与えられる。
図1は、幾つかのマイクロフォンと幾つかのラウドスピーカとを有する形式の従来のビデオ会議ルームの簡略化された概略図であり、主要な構成要素のレイアウトは、非制限的な例により与えられている。
図2は、特定の実施様式において本発明により提案された方法を示す一般的なフローチャートである。
図3は、ある実施形態における本発明の装置を示す図である。
図4は、ある特定の実施形態において示される、本発明により提案された装置内に組み込まれた符号化モジュールを示す図である。
図5は、ある特定の実施形態において示される、本発明により提案された装置内に組み込まれた復号化モジュールの概略図である。
本発明については、ここでは、少なくとも2つのビデオ会議ルームを有するネットワークに応用されたものとして説明する。この応用は、制限的ではないが、局所的場所と1つ以上の遠隔的場所との間で(各々の場所は幾つかのラウドスピーカを有している)音声信号を送信するためのディジタルシステムの例を与える。ここで考慮される音声信号は、一般にスピーチ信号である。
この説明の目的のために、所定の空間において、この空間が局所的空間であろうと遠隔的空間であろうと、マイクロフォンおよびラウドスピーカは、これらの間の接続が負となるように選択されると仮定する。このことは、ラウドスピーカの増幅器の入力と、マイクロフォンが接続されている前置増幅器の出力との間の伝達関数の最大値(dB)が負であることを意味する。したがって、マイクロフォンの前置増幅器からの信号であってかつ同じ空間のラウドスピーカから生じる信号のエネルギーは、このラウドスピーカの増幅器の入力における信号のレベルよりも低い。負の接続は、音響ループの安定性を保証する。詳細には、何のラーセン(Larsen)効果も存在しなくなる。その反面、このことは、エコーと効果的な遠隔音声とを区別することを可能にする。その理由は、エコーの平均レベルが、常に、効果的な遠隔音声のレベルより低いためである。負の接続という仮定は、最も従来的なビデオ会議ルームにおいて検証される。
“所定の瞬間におけるマイクロフォン信号”という語は、この瞬間にマイクロフォンにより拾われた全ての音声信号を示すために用いられる。“所定の瞬間におけるラウドスピーカ信号”という語は、この瞬間にラウドスピーカにより発せられた音声信号を示すために用いられる。
図1に戻ると、幾つかのマイクロフォンと幾つかのラウドスピーカとを有する従来形式の従来のビデオ会議ルーム10が、通常の備品(一般には、1つまたは複数個のテーブルおよび椅子)に加えて、幾つかのマイクロフォン12と、幾つかのラウドスピーカ14と、少なくとも1つの画面16とを有していることが特筆されるべきである。より一層の明確さを保持するために、1つのマイクロフォン12、2つのラウドスピーカ14、1つの画面16、および、1つのテーブル18のみが示されている。
この説明の目的のために、局所的空間は、N個のマイクロフォンとM個のラウドスピーカとを有しており(整数N,Mは、必ずしも等しいとは限らない)、かつ、1つ以上の遠隔的空間もまた、その適用に応じて、N個のマイクロフォンとM個のラウドスピーカとを有している。整数N,Mは、ネットワーク内のある空間から他の空間までにおいて変動し得る。
考慮されている前記ビデオ会議ルームは、一般に、12個のマイクロフォンと16個のラウドスピーカとのみを有している。
本発明の特定の実施形態について、最初に、図2を参照して説明する。
第1段階の間に、累積分布関数と称される統計的値が、局所的空間の各々のマイクロフォンとラウドスピーカとの信号に関して計算される。これらの値は、マイクロフォンおよびラウドスピーカの信号分布を示す。例によって(これは制限的ではないが)、これらの値については、広帯域においてまたは一定の周波数帯域に基づいて評価することができる。
前記累積分布関数は、ソースにおいて得られるランダムベクトルの第2特性関数の連続的な変動関数であることが特筆されるべきである。詳細には、2つの信号a,bに関して、a=bならば、信号a,bの第2次の累積分布関数(この場合には、信号xの第2次の自動累積分布関数(auto-cumulative distribution function)と称される)は、信号xのエネルギーを表し、また、a≠bならば、信号a,bの第2次の累積分布関数(この場合には、信号a,bの第2次の相互−累積分布関数(inter-cumulative distribution function)と称される)は、信号a,bの相互相関関数(inter-correlation function)を表す。
本発明により提案された方法の特定の実施形態において、前記第2次自動累積分布関数は、マイクロフォン信号とラウドスピーカ信号とに関する、すなわち、これらの信号のエネルギーに関する累積分布関数として選択される。所定の空間のi番目のマイクロフォンにより拾われた信号は、xi(n)と記される(iは1〜Nの整数であり、nはサンプルのタイムランクを示す)。所定の空間のj番目のラウドスピーカにより発せられた信号は、zj(n)と記される(jは1〜Mの整数)。マイクロフォン信号およびラウドスピーカ信号のそれぞれのエネルギーは、Cum2(xi(n)),Cum2(zj(n))と記される。
この第1段階は、図2の参照番号1000により示される。
ここには説明されていない他の実施形態においては、前記第2次相互累積分布関数は、すなわち、マイクロフォン信号およびラウドスピーカ信号の相互累積分布関数という累積分布関数として選択され得る。
図2の1001に示されるように、これらの統計的値は、局所的空間の各々のマイクロフォン信号に関して、エコーが局所的空間のラウドスピーカ信号の関数として低減されることを可能にする第1減衰率Gmic(i,n)を計算するために用いられる。
選択された累積分布関数がエネルギーとなる、上述した特定の実施形態において、第1減衰率Gmic(i,n)は、以下の式に基づいて計算される。
ここで、Cは、厳密に1よりも大きい実定数である。ラウドスピーカ信号が存在する場合には、この定数によって、マイクロフォン信号がより急速に減衰され留ことが可能となり、これにより、エコーがより急速に低減されることが可能となる。Cの選択は、特に、空間の音響特性と、用いられているトランスデューサの音響特性とに関連している。(制限的ではないが)特定の音響状況における例によっては、C=8となり得る。
前記第1減衰率Gmic(i,n)の他に、前記累積分布関数については、各々のサンプルを用いて、または、サンプリング周波数よりも低い割合で、または、幾つかのサンプルのフレームによってのいずれかで(これらの例は網羅的なものではないが)、計算してもよい。後者の場合には、累積分布関数および第1減衰率Gmic(i,n)の平均値を、例えば、所定のフレームに基づいて計算してもよく、かつ、この平均値を、このフレームの各々のサンプルに割り当ててもよい。
しかしながら、この場合の第1減衰率Gmic(i,n)は、その現在の状態において、対応するマイクロフォン信号xi(n)には適用されない。
マイクロフォンの飽和状態(saturation)を回避するために、第1減衰率Gmic(i,n)は、1と等しい最大値を有するように、かつ、その最小値が所望減衰となるように調整される(これらのことは、音響エコーのレベルに依存する)。
図2の1002に示されているように、第2減衰率と称される、調整された減衰率が、各々のマイクロフォン信号に関して得られ、この第2減衰率は、G’mic(i,n)と記され、かつ、以下のように定義される。
G’mic(i,n)=S1(Gmic(i,n)) (2)
ここで、Gmic(i,n)≦sならば、S1(Gmic(i,n))=s
s<Gmic(i,n)<1ならば、S1(Gmic(i,n))=Gmic(i,n)
Gmic(i,n)≧1ならば、S1(Gmic(i,n))=1
最小閾値sは、上述した所望の減衰である。C=8である上述の実施形態において、用いられる周波数領域全体上で−20dBの平均値を有するラウドスピーカとマイクロフォンとの間の伝達関数に関して、好都合な最小閾値はs=0.1である。これは、dB形式で、20log10s=−20dBに相当する(ここで、log10は常用対数を示す)。
しかしながら、第2減衰率G’mic(i,n)もまた、その現在の状態において、この場合に対応するマイクロフォン信号xi(n)には適用されない。さもなくば、ダブルスピーチの場合に、すなわち、局所的および遠隔音声が同時に存在する場合に、局所的音声の信号は、エコーと同じ減衰率に委ねられることになり、このことは、相互伝達を制限することになる。この理由のために、さらなる調整が、マイクロフォン信号に適用すべき減衰率に対してなされる。
以前に計算された累積分布関数(1)の比率に基づいて、第1の状況において、マイクロフォン信号xi(n)がエコー信号のみなのかまたは局所的音声のみの信号なのか、または、第2の状況において、xi(n)がダブルスピーチ信号なのかが、マイクロフォン毎に、1〜Nの範囲の全ての整数iについて確認される。
ある実施形態において、第1減衰率Gmic(i,n)が1よりもはるかに小さな値を有していれば、このことは、単一のエコー信号であること意味する。その理由は、ラウドスピーカとマイクロフォンとの接続が負であると仮定されているためである。Gmic(i,n)が1よりもはるかに大きければ、その信号が局所的音声のみを備える信号である。Gmic(i,n)が中間の値であれば、その信号はダブルスピーチ信号である。
各々のマイクロフォン信号の形式を決定するこのプロセスについては、適切と思われる他の任意の方法を用いて行ってもよい。
各々のマイクロフォン信号の形式を決定すれば、それに応じて、第3減衰率G”mic(i,n)が、第2減衰率G’mic(i,n)に基づいて、図2の1003に示されるように、以下の通りに計算される。上述した場合のうちの第1の場合においては(この場合に、マイクロフォン信号xi(n)は、単一のエコー信号または局所的音声信号のみである)、第3減衰率G”mic(i,n)=G’mic(i,n)である。上述した場合のうちの第2の場合においては(この場合に、マイクロフォン信号xi(n)は、ダブルスピーチ信号である)、前記減衰率は“緩和”される。すなわち、第2減衰率G’mic(i,n)の計算において、最小閾値の初期値は、エコーが知覚され得るが問題にはならない程度に、より大きな割合の値に置き換えられる。C=8,s=0.1の場合の上述した例において、累積分布関数(1)の割合が−12dBより大きければ、閾値sを増加させるように選択してもよい。例えば、s=0.7、すなわち、約−3dBに設定するように選択してもよい。この減衰率の緩和は、局所的音声信号を拾うマイクロフォンの場合においてのみ適用され、特に相互伝達を維持するのに役立つ。
上述した段階は、局所的空間の各々のマイクロフォンに関して別個に行われる操作に関連する。これらの操作の各々において、局所的空間に他のマイクロフォンが存在することを考慮すべく、さらなる減衰率が、各々のマイクロフォン信号xi(n)に関して計算され、第4減衰率と称され、かつ、図2の1004に示されるように、Γ(i,n)と記される。
第4減衰率Γ(i,n)は、マイクロフォン信号xq(n)を考慮している(ここで、qは、iとは異なった、1〜Nの範囲の整数である)。この第4減衰率Γ(i,n)は、マイクロフォン信号の累積分布関数間の割合に基づいて計算される。ある実施形態においては、前記第2次自動累積分布関数が、マイクロフォン信号xi(n)のための累積分布関数、すなわち、これらの信号のエネルギーとして選択され、かつ、第4減衰率Γ(i,n)は、以下の式に基づいて、各々のマイクロフォン信号xi(n)に関して計算される。
上述したように、マイクロフォン信号の自動累積分布関数については、一方では、広帯域において、または、一定の周波数帯域に基づいてのいずれかで評価することができ、他方では、各々のサンプリングを用いて、または、幾つかのサンプルのフレームによってのいずれかで評価することができる。
累積分布関数(3)の割合において、i番目のマイクロフォン信号以外のマイクロフォン信号の累積分布関数の積を分母として用いることは、特に好都合である。さらに、変形例として、同じ累積分布関数の和を用いてもよい。
しかしながら、第4減衰率Γ(i,n)は、その現在の状態において、対応するマイクロフォン信号xi(n)には適用されない。
マイクロフォンの飽和状態を回避するために、第4減衰率Γ(i,n)は、前述したように、第1減衰率Gmic(i,n)が調整された場合と同様の段階を行うことにより調整される。
図2の1005に示されているように、第5減衰率第4減衰率Γ’(i,n)が、局所的空間の各々のマイクロフォン信号に関して得られ、以下のように定義される。
Γ’(i,n)=S2(Γ(i,n)) (4)
ここで、Γ(i,n)≦s’ならば、S2(Γ(i,n))=s’
s’<Γ(i,n)<1ならば、S2(Γ(i,n))=Γ(i,n)
Γ(i,n)≧1ならば、S2(Γ(i,n))=1
前記最小閾値は、主に知覚し得る漏話のレベルに、また、僅かではあるがエコーレベルにも依存する所望の閾値である。この場合の漏話は、局所的空間のi番目のマイクロフォンの正面で響くスピーカから生じる音声と、局所的空間の他のマイクロフォンの正面で響くスピーカからの音声であってi番目のマイクロフォンによっても拾われる音声との間での、マイクロフォン信号xi(n)におけるかなりの干渉により特徴づけられる。
C=8,s=0.1(または、ダブルスピーチの場合にはs=0.7)である場合の上述した例において、好都合な最小閾値s’は、s’=0.125、すなわち、約−18である。
以前に得られた、第3減衰率G”mic(i,n)と第4減衰率Γ(i,n)との積は、次に、各々のマイクロフォン信号xi(n)に関して包括的な減衰率G★ mic(i,n)を得るために計算され、以下のように定義される。
G★ mic(i,n)=G”mic(i,n).Γ’(i,n)
この包括的な減衰率は、次に、図2の1006に示されるように、以下のように定義される重み係数βi(n)を、各々のマイクロフォン信号xi(n)に関して得るように調整される。
βi(n)=S4(G★ mic(i,n)) (5)
ここで、G★ mic(i,n)≦s”ならば、S4(G★ mic(i,n))=s”
s”<G★ mic(i,n)<1ならば、S4(G★ mic(i,n))=G★ mic(i,n)
s”は、厳密に1未満の所定の最小閾値である。
C=8,s=0.1(または、ダブルスピーチの場合にはs=0.7)、さらにs’=0.125である場合の上述した例において、好都合な最小閾値s”は、s”=0.1である。
対応する重み係数βi(n)は、各々のマイクロフォン信号xi(n)に関して適用される。
段階1005,1006の変形例として、最初に減衰率Γ”(i,n)を計算し、次に、この減衰率を、対応するマイクロフォン信号xi(n)に適用して、減衰されたマイクロフォン信号を得ることも可能である。次に、減衰率G”mic(i,n)が計算され、かつ、減衰されたマイクロフォン信号に適用される。
局所的空間と1つまたは複数の遠隔的空間との間におけるディジタル送信用に、P個のチャンネルが供給されていると仮定する。
説明される特定の実施形態において、本発明により提案された方法に関する次の段階は、信号yk(n)(kは、1〜Pの範囲の整数)を、図2の1007に示されるように、以下に定義するような重み付きマイクロフォン信号xi(n)の1次結合の形で、各々の送信チャンネル上で送信することにある。
ここで、αk,i(n)は所定の実符号化係数であり、βi(n)は以前に得られた重み係数である。
前記重み係数βi(n)は、時間によって変動し、かつ、特に、エコーの低減に寄与し、その一方で、相互伝達を維持する。さらに、これらの重み係数βi(n)は、アクティブ状態のマイクロフォンに優先権を与えることと、空間に対する音声の適合を高めることとを可能にする。
前記係数αk,i(n)(1≦k≦P,1≦i≦N)は、P行N列の符号化マトリクスを形成する。k0番目の行とi0番目の列との交差点に配置され、αk0,i0(n)(k0は1〜Pの範囲の整数、i0は1〜Nの範囲の整数番)と記される係数は、k0番目の送信チャンネルに対するi0番目のマイクロフォンの寄与(contributions)を示す。
したがって、符号化マトリクスの各々の行は、所定の送信チャンネルに対するN個のマイクロフォンの寄与を供給し、かつ、各々の列は、異なった送信チャンネルに対する所定のマイクロフォンの寄与を供給する。各々の列の係数の和は1である。
これらの寄与、すなわち、係数αk,i(n)は、1以下であり、かつ、音響および映像状況に応じて適切な方法により選択される。係数αk,i(n)は、特に、ビデオ会議ルームのネットワーク構成に依存する。例えば、これらの係数は、前記構成がポイント・ツー・ポイントの形式なのか、または、マルチポイント形式なのかによって異なる(これらの概念については、冒頭で明示している)。さらに、係数αk,i(n)は、前記ネットワークのビデオ会議ルームにおいて撮影され、かつ、異なる空間の画面により供給される音声信号および画像が整合することを確実にするように選択されたカメラ撮影にも依存する。
各々のマイクロフォンは、一般には、局所的空間の領域に割り当てられている。各々のチャンネルは、一般には、マイクロフォンの寄与を同じ領域へ送信する。
制限的ではないが、N=6(6つのマイクロフォン)かつP=2(2つの送信チャンネル)の場合の例として、以下の符号化マトリクスを選択してもよい。
1 1 1/2 1/2 0 0
0 0 1/2 1/2 1 1
この例において、行われた選択は、マイクロフォンが配置された位置に基づいて、第1および第2マイクロフォンが“左側”領域に割り当てられ、かつ、第3および第4マイクロフォンが“中央”領域に割り当てられ、かつ、第5および第6マイクロフォンが“右側”領域に割り当てられた場合のものである。
第1および第2マイクロフォンからの信号は、第1チャンネル上で送信される(α1,1=α1,2=1)。第5および第6マイクロフォンからの信号は、第2チャンネル上で送信される(α2.5=α2.6=1)。第3および第4マイクロフォンからの信号は、50%が第1チャンネル上で、さらに50%が第2チャンネル上で送信される(α1,3=α1,4=α2.3=α2.4=1/2)。第1チャンネルに対する第5および第6マイクロフォンの寄与は、これらのマイクロフォンが“左側”領域から本質的に遠い位置にある場合(α1.5=α1.6=0)には、無視できるものと見なされる。同様に、第2チャンネルに対する第1および第2マイクロフォンの寄与は、これらのマイクロフォンが“左側”領域から本質的に遠い位置にある場合(α5.1=α2.2=0)には、無視できるものと見なされる。
以下の説明は、所定の遠隔的空間における反響に関連する。
前記方法に関する次の段階は、図2の1008に示されるように、上記で考慮された局所的空間から送信された、この遠隔的空間の各々の信号yk(n)に関する累積分布関数から第6減衰率GHP(j,n)を計算することにある。
ある実施形態において、第6減衰率GHP(j,n)は、送信された信号yk(n)の前記第2次自動累積分布関数(エネルギー)と前記第2次相互累積分布関数(相互相関関数)との間の割合から導かれる。上述した累積分布関数の場合と同じ方法で、周波数帯域によって、または、広帯域において計算を行ってもよい。
送信用に計算された前記減衰率に関して、最小閾値は、第6減衰率GHP(j,n)に適用され、s★と記されかつ厳密に1未満であり、かつ、最大閾値は1であり、これにより、この減衰がその最大値として1と有することになり、かつ、所望の減衰が、漏話およびエコーに依存して、その最小値として1を有することになる。
図2の1009に示されるように、重み係数λj(n)がこのようにして得られ、以下のように定義される。
λj(n)=S3(GHP(j,n)) (7)
ここで、GHP(j,n)≦s★ならば、S3(GHP(j,n))=s★
s★<GHP(j,n)<1ならば、S3(GHP(j,n))=GHP(j,n)
GHP(j,n)≧1ならば、S3(GHP(j,n))=1
制限的ではないが、P=2(2つの送信チャンネル)かつM=3(3つのラウドスピーカ)の場合の例として、重み係数を以下のように得ることができる。
λj(n)=S3(GHP(2,n)),ただし、
ここで、Cum2(y1(n))は、送信された信号y1(n)のエネルギーを表す第2次自動累積分布関数であり、さらに、
ここで、Cum2(y2(n))は、送信された信号y2(n)のエネルギーを表す第2次自動累積分布関数である。
同じ例において、以下の式を得るような選択を行ってもよい。
λ1(n)=λ3(n)=1+s★−λ2(n)
これらの式については、一般に、より多数の送信チャンネルおよびラウドスピ
C=8,s=0.1(または、ダブルスピーチの場合にはs=0.7)、さらにs’=0.125である場合の上述した例において、好都合な最小閾値s★は、s★=s’=0.125、すなわち、約−18dBである。
図2の1010に示されるように、次に、遠隔的空間の各々のラウドスピーカ信号zj(n)が、重み付きで送信された信号yk(n)の1次結合に基づいて決定され、以下のように定義される。
ここで、γj.k(n)は所定の実符号化係数を示し、λj(n)は、以前に得られた重み係数を示す。
前記係数λj(n)は、時間によって変動し、かつ、特にラウドスピーカの数Mょりも少ない数であるPチャンネル上で送信する場合に、聴覚上の釣り合いの復元の向上とあらゆる漏話の低減とに、特に寄与する。さらに、前記係数λj(n)は、いつでもアクティブ状態のラウドスピーカの数を制限することにより、音響エコーを低減させるのに役立つ。
前記係数γj.k(n)(1≦j≦M,1≦k≦P)は、P行M列の解読マトリクスを形成する。これらの係数γj.k(n)は、特に、ネットワークのビデオ会議ルームにおけるラウドスピーカのレイアウトと画像の表示とに依存する。前記符号化係数αk,i(n)とは異なり、係数γj.k(n)は、ネットワークがポイント・ツー・ポイントなのかまたはマルチポイント構成なのかには依存しない。
前記方法における次の段階は、遠隔的空間のj番目のラウドスピーカ(全てのjは、1〜Mの範囲の整数)によって、式(8)から得られたラウドスピーカ信号zj(n)を発することにある。
ある実施形態において、積γj.k(n)・λj(n)(1≦j≦M,1≦k≦P)もまた、音声信号と同じ速度でP個の送信チャンネル上で送信される。その結果、各々の送信チャンネルは、信号yk(n)に加えて、遠隔的空間の対応するラウドスピーカによりこの信号が発せられる前に、この信号に適用する必要がある重みを搬送する。このことは、音声の作用を検出し、さらに、対応する情報を送信することと等価である。
この実施形態において、前記符号化マトリクスは、アクティブ状態のスピーカに適するように適合され、かつ、発出の際に用いられる前記解読マトリクスは、符号化マトリクスの特性と音声復元特性とに基づく。
第5減衰率Γ’(i,n)または第3減衰率G”mic(i,n)の値から導かれるような、アクティブ状態のマイクロフォンの数が、送信チャンネルの数以下であれば、アクティブ状態のマイクロフォンから発せられる各々の信号は、これらのチャンネルのうちの1つに切り換えられる。次に、符号化マトリクスは、1または0のみから構成される(1は、アクティブ状態のマイクロフォンに対応する)。
この実施形態において、解読マトリクスは、符号化マトリクスの転置行列である。
M×P係数γj.k(n)については、少数のビットによって送信することができる。例えば、これは制限的ではないが、係数毎に3ビットで十分であるべきである。符号化は、対数形式であってもよく、例えば、この場合に、dBで表される各々の係数は、所定数のレベルに対して一様な方法で定量化される。一例として(これは制限的なものではないが)、8レベルが存在してもよい。
ある特定の実施形態において、遠隔的空間から受信された信号の他に、かつ、該受信された信号よりも低いレベルで、送信すべき信号yk(n)もまた、局所的ラウドスピーカによって局所的空間において散布される。この局所的リターンの拡散は、話者が、最初にそれと気付かずに大音量で話すかまたはマイクロフォンに近づき過ぎる場合に、話者の音声を小さくまたはマイクロフォンから遠い状態にさせる。さらに、この拡散は、所定の空間に共通の音響環境を作成のに役立ち、このことは、同じ空間の異なった部位に位置する話者にとって特に好都合である。
本発明により提案された装置に関する特定の実施形態について、図3に関連して以下に説明する。
この装置は、前記方法において考慮されたものと同じ形式の音声信号を送信するためのディジタルシステム、すなわち、局所的空間と少なくとも1つの遠隔的空間との間においてP個の送信チャンネルを用いるシステムに応用される。これらの空間の各々は、N個のマイクロフォンとM個のラウドスピーカとを有しており、さらに、N,Mの値が部屋毎に異なることも可能である。
図3に示されるように、装置は、音声信号を符号化するためのモジュール20を有している。モジュール20は、その入力において、局所的空間のN個のマイクロフォンからそれぞれ届くN個のディジタル信号xi(n)を受信する。モジュール20は、その出力において、上記の式(6)において定義されるP個のディジタル信号yk(n)を供給する。
P個のディジタル信号yk(n)は、ネットワーク22におけるP個の送信チャンネル上でそれぞれ送信される。
さらに、前記装置は、音声信号を解読するためのモジュール24を有している。モジュール24は、その入力においてP個の信号yk(n)を受信し、かつ、その出力において、上記の式(8)において定義され、各々の空間のM個のラウドスピーカによりそれぞれ発せられるM個の信号zj(n)を供給する。
図4に示された特定の実施形態において、音声信号を符号化するためのモジュール20は、局所的空間からの各々のマイクロフォン信号xi(n)に関する累積分布関数と、局所的空間からの各々のラウドスピーカ信号zj(n)に関する累積分布関数とを計算するためのモジュール26を有している。
さらに、前記モジュール20は、累積分布関数を計算する前記モジュール26により供給された累積分布関数間の割合に基づいて、上述した第1減衰率Gmic(i,n)を、局所的空間からの各々のマイクロフォン信号xi(n)に関して計算するためのモジュール28を有しており、このモジュール28は、モジュール26の出力に接続されている。ある特定の実施形態において、モジュール28は、その出力において、上記の式(1)により定義されるGmic(i,n)の値を供給する。
各々の第1減衰率Gmic(i,n)を変更するためのモジュール30は、モジュール28の出力に接続されている。モジュール30は、その出力において、上記の式(2)により定義される第2減衰率G’mic(i,n)を供給する。
さらに、前記モジュール20は、累積分布関数を計算するための前記モジュール26の出力に接続されたモジュール32を有しており、このモジュール32は、モジュール26により供給されたマイクロフォン信号およびラウドスピーカ信号の累積分布関数に基づいて、各々のマイクロフォン信号xi(n)に関し、
− 上述した前記第1の状況において、このマイクロフォン信号が単一のエコー信号なのかまたは局所的空間からのみ生じる信号なのか、または、
− 前記第2の状況において、このマイクロフォン信号が局所的空間からの成分と、遠隔的空間から生じる他の成分とを有しているのか
を判断する。
上記に定義される第3減衰率G”mic(i,n)を計算するためのモジュール34は、モジュール30,32の出力に接続されている。
さらに、前記モジュール20は、マイクロ信号の累積分布関数間の割合に基づいて第4減衰率Γ(i,n)を計算するためのモジュール36を有しており、このモジュール36は、累積分布関数を計算するためのモジュール26の出力に接続されている。ある特定の実施形態において、モジュール36は、その出力において、上記の式(3)において定義されるΓ(i,n)の値を供給する。
各々の第4減衰率Γ(i,n)を変更するためのモジュール38は、モジュール36の出力に接続されている。モジュール38は、その出力において、上記の式(4)により定義される第5減衰率Γ’(i,n)を供給する。
第3減衰率G”mic(i,n)と第5減衰率Γ’(i,n)との積を計算しかつ調整するためのモジュール40は、モジュール34,38の出力に接続されている。モジュール40は、その出力において、上記の式(5)により定義される重み係数βi(n)を供給する。
図5に示された特定の実施形態において、音声信号を解読するためのモジュール24は、各々の送信された信号yk(n)に関して計算された累積分布関数に基づいて、考慮されている遠隔的空間からの各々のラウドスピーカ信号zj(n)に関して、上記で定義される第6減衰率GHP(j,n)を計算するためのモジュール42を有している。これらの累積分布関数については、図4に示されたような、累積分布関数を計算するモジュール26により供給することができる。
各々の第6減衰率GHP(j,n)を調整するためのモジュール44は、モジュール42の出力に接続されている。モジュール44は、その出力において、上記に与えられた式(7)により定義される重み係数λi(n)を供給する。
Claims (9)
- 局所的場所と少なくとも1つの遠隔的場所との間においてP個の送信チャンネル上で音声信号をディジタル送信するためのシステムにおいて音響エコーを低減させかつ音声を空間条件に適合させる方法であって、
各々の場所はN個のマイクロフォンとM個のラウドスピーカとを有しており(N,P,Mは整数)、N,Mの値は場所によって異なることが可能であり、
(a)前記局所的場所からの各々のマイクロフォン信号xi(n)(iは1〜Nの範囲の整数であり、nはサンプルのタイムランクを示す)に関する累積分布関数が計算され、かつ、前記局所的場所からの各々のラウドスピーカ信号zj(n)(jは1〜Mの範囲の整数)に関する累積分布関数が計算され、
以下、全てのiについて、1≦i≦Nとし、
(b)第1減衰率Gmic(i,n)が、以前に得られた前記累積分布関数間の割合に基づいて、前記局所的場所からの前記マイクロフォン信号xi(n)に関して計算され、
(c)前記第1減衰率Gmic(i,n)が、
G’mic(i,n)=S1(Gmic(i,n))
(ここで、Gmic(i,n)≦Sならば、S1(Gmic(i,n))=s
s<Gmic(i,n)<1ならば、S1(Gmic(i,n))=Gmic(i,n)
Gmic(i,n)≧1ならば、S1(Gmic(i,n))=1
sは、厳密に1未満の所定の最小閾値である)
のように定義される第2減衰率G’mic(i,n)を得るように調整され、
(d)以前に計算されたマイクロフォン信号の累積分布関数とラウドスピーカ信号の累積分布関数とに基づいて、
第1の状況にあり、前記マイクロフォン信号xi(n)がエコー信号のみであるのか、あるいは、前記局所的場所のみから生じている信号であるのかどうか、または、
第2の状況にあり、前記マイクロフォン信号xi(n)が前記局所的場所からの成分と前記遠隔的場所からの成分とを有しているかどうか
が判断され、
(e)第3減衰率G”mic(i,n)が計算され、該第3減衰率G”mic(i,n)は、前記第1の状況においては、前記第2減衰率G’mic(i,n)と等しく、また、前記第2の状況においては、前記第2減衰率G’mic(i,n)と等しいが、前記第3減衰率G”mic(i,n)を得るために用いられる計算において前記最小閾値sが所定値だけ増加し、
(f)第4減衰率Γ(i,n)が、マイクロフォン信号の前記累積分布関数間の割合に基づいで計算され、
(g)前記第4減衰率Γ(i,n)が、
Γ’(i,n)=S2(Γ(i,n))
(ここで、Γ(i,n)≦s’ならば、S2(Γ(i,n))=s’
s’<Γ(i,n)<1ならば、S2(Γ(i,n))=Γ(i,n)
Γ(i,n)≧1ならば、S2(Γ(i,n))=1
s’は、厳密に1未満の所定の最小閾値である)
のように定義される第5減衰率Γ’(i,n)を得るように調整され、
(h)以前に得られた前記第3減衰率G”mic(i,n)と前記第4減衰率Γ(i,n)との積が、
G★ mic(i,n)=G”mic(i,n)・Γ’(i,n);
により定義される包括的な減衰率G★ mic(i,n)を得るために計算され、
(i)前記包括的な減衰率G★ mic(i,n)が、
βi(n)=S4(G★ mic(i,n))
(ここで、G★ mic(i,n)≦s”ならば、S4(G★ mic(i,n))=s”
s”<G★ mic(i,n)<1ならば、S4(G★ mic(i,n))=G★ mic(i,n)
s”は、厳密に1未満の所定の最小閾値である)
のように定義される重み係数βi(n)を得るように調整され、
(j)信号yk(n)が、
(ここで、αk,i(n)は所定の実符号化係数(real coding coefficients)を示し、βi(n)は以前に得られた重み係数を示す)
のように定義される、重み付き前記マイクロフォン信号xi(n)の1次結合の形式で、各々の送信チャンネル上で送信され(kは1からPまでの整数)、
以下、全てのjについて、1≦j≦Mとし、
(k)第6減衰率GHP(j,n)が、前記局所的場所からの各々の送信された信号yk(n)に関して計算された累積分布関数に基づいて、前記遠隔的場所からの前記ラウドスピーカ信号zj(n)に関して計算され、
(1)前記第6減衰率GHP(j,n)が、
λj(n)=S3(GHP(j,n))
(ここで、GHP(j,n)≦s★ならば、S3(GHP(j,n))=s★
s★<GHP(j,n)<1ならば、S3(GHP(j,n))=GHP(j,n)
GHP(j,n)≧1ならば、S3(GHP(j,n))=1
s★は、厳密に1未満の所定の最小閾値である)
のように定義される重み係数λj(n)を得るように調整され、
(m)前記遠隔的場所の前記ラウドスピーカ信号zj(n)が、
(ここで、γj,k(n)は所定の実符号化係数を示し、λj(n)は以前に得られた重み係数を示す)
のように定義される、重み付き送信信号yk(n)の1次結合に基づいて決定され、また、
(n)こうして得られた前記ラウドスピーカ信号zj(n)が、前記遠隔的場所のj番目のラウドスピーカ上において発せられる
ことを特徴とする方法。 - 前記積γj.k(n)・λj(n)(1≦j≦M,1≦k≦P)もまた、前記音声信号と同じ速度で前記P個のチャンネル上で送信されることを特徴とする請求項1から請求項3のいずれかに記載の方法。
- 前記遠隔的空間から受信された信号の他に、かつ、該遠隔的空間から受信された信号よりも低いレベルで、前記送信すべき信号yk(n)もまた、前記局所的ラウドスピーカによって前記局所的空間において散布されることを特徴とする請求項1から請求項4のいずれかに記載の方法。
- 局所的場所と少なくとも1つの遠隔的場所との間においてP個の送信チャンネル上で音声信号をディジタル送信するためのシステムにおいて音響エコーを低減させかつ(音声を)空間条件に適合させるための装置であって、
各々の場所は、N個のマイクロフォンとM個のラウドスピーカとを有しており(N,P,Mは整数)、N,Mの値は場所によって異なることが可能であり、
前記装置は、
音声信号を符号化するための手段(20)と、
前記音声信号を解読するための手段(24)と
を具備し、
音声信号を符号化するための前記手段(20)は、その入力において、前記局所的場所の前記N個のマイクロフォンからそれぞれ発生するN個のディジタル信号xi(n)を受信し(iは1〜Nの範囲の整数、nはサンプルのタイムランクを示す整数である)、前記手段(20)は、その出力において、
(ここで、αk、i(n)は所定の実符号化係数を示し、βi(n)は前記局所的場所の前記マイクロフォンにより受信された信号の累積分布関数と、前記局所的場所の前記ラウドスピーカにより発せられた信号の累積分布関数とに依存する重み係数を示し、P個の信号yk(n)は、前記局所的場所と前記遠隔的場所との間において、P個の送信チャンネル上でそれぞれ送信される)
という式により定義されるP個のディジタル信号yk(n)(kは1〜Pの範囲の整数である)を供給し、
前記音声信号を解読するための前記手段(24)は、その入力において前記P個のディジタル信号yk(n)を受信し、かつ、その出力において各々の場所の前記M個のラウドスピーカによりそれぞれ送信すべきM個のディジタル信号zj(n)を供給し(jは1〜Mの範囲の整数、nはサンプルのタイムランクを示す整数である)、前記ディジタル信号zj(n)は、
(ここで、γj.k(n)は所定の実符号化係数を示し、λi(n)は、前記信号yk(n)に依存する重み係数を示す)
という式により定義され、
音声信号を符号化するための前記手段(20)は、
前記局所的空間の各々のマイクロフォン信号xi(n)に関する累積分布関数と、前記局所的空間の各々のラウドスピーカ信号zj(n)に関する累積分布関数とを計算するための手段(26)と、
累積分布関数を計算するための前記手段(26)により供給された累積分布関数問の割合に基づいて、第1減衰率Gmic(i,n)を、前記局所的空間の各々のマイクロフォン信号xi(n)に関して計算するための手段(28)と、
G’mic(i,n)=S1(Gmic(i,n))
(ここで、Gmic(i,n)≦Sならば、S1(Gmic(i,n))=s
s<Gmic(i,n)<1ならば、S1(Gmic(i,n))=Gmic(i,n)
Gmic(i,n)≧1ならば、S1(Gmic(i,n))=1
sは、厳密に1未満の所定の最小閾値であり、さらに、
全てのiに対し、1≦i≦N)
という式として定義される第2減衰率G’mic(i,n)を得るように、各々の第1減衰率Gmic(i,n)を調整するための手段(30)と、
累積分布関数を計算するための前記手段(26)により供給されたマイクロフォン信号およびラウドスピーカ信号の累積分布関数に基づいて、各々のマイクロフォン信号xi(n)に関し、
− 第1の状況にあり、このマイクロフォン信号xi(n)が単一のエコー信号なのかまたは前記局所的空間からのみ生じる信号なのか、または、
− 第2の状況にあり、このマイクロフォン信号xi(n)が前記局所的空間からの成分と、前記遠隔的空間から生じる他の成分とを有しているのか
を判断するための手段(32)と、
第3減衰率G”mic(i,n)を計算するための手段(34)と、
マイクロ信号の前記累積分布関数間の割合に基づいて第4減衰率Γ(i,n)(全てのiに対し、1≦i≦N)を計算するための手段(36)と、
Γ’(i,n)=S2(Γ(i,n))
(ここで、Γ(i,n)≦s’ならば、S2(Γ(i,n))=s’
s’<Γ(i,n)<1ならば、S2(Γ(i,n))=Γ(i,n)
Γ(i,n)≧1ならば、S2(Γ(i,n))=1
s’は、厳密に1未満の所定の最小閾値である)
という式として定義される第5減衰率Γ’(i,n)を得るように、各々の第4減衰率Γ(i,n)を調整するための手段(38)と、
βi(n)=S4(G★ mic(i,n))
(ここで、G★ mic(i,n)=G”mic(i,n)・Γ’(i,n)
G★ mic(i,n)≦s”ならば、S4(G★ mic(i,n))=s”
s”<G★ mic(i,n)<1ならば、S4(G★ mic(i,n))=G★ mic(i,n)
s”は、厳密に1未満の所定の最小閾値である)
という式として定義される重み係数βi(n)を得るように、前記第3減衰率G”mic(i,n)と前記第5減衰率Γ’(i,n)との積(各々のiに対し、1≦i≦N)を計算しかつ調整するための手段(40)と
を具備し、
前記第3減衰率G”mic(i,n)は、前記第1の状況においては、前記第2減衰率G’mic(i,n)と等しく、また、前記第2の状況においては、前記第2減衰率G’mic(i,n)と等しいが、前記第3減衰率G”mic(i,n)を得るために用いられる計算において前記最小閾値Sが所定値だけ増加する
ことを特徴とする装置。 - 前記音声信号を解読するための前記手段(24)は、
各々の信号yk(n)に関して計算された累積分布関数に基づいて、各々のラウドスピーカ信号zj(n)に関して、第6減衰率GHP(j,n)を計算するための手段(42)と、
λj(n)=S3(GHP(j,n))
(ここで、GHP(j,n)≦s★ならば、S3(GHP(j,n))=s★
s★<GHP(j,n)<1ならば、S3(GHP(j,n))=GHP(j,n)
GHP(j,n)≧1ならば、S3(GHP(j,n))=1
s★は、厳密に1未満の所定の最小閾値である)
という式により定義される前記重み係数λj(n)を得るために、各々の第6減衰率GHP(j,n)を調整するための手段(44)と
を具備することを特徴とする請求項6に記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9706191A FR2763774B1 (fr) | 1997-05-21 | 1997-05-21 | Procede et dispositif de reduction d'echo acoustique multivoies et de spatialisation sonore |
FR97/06191 | 1997-05-21 | ||
PCT/FR1998/001010 WO1998053595A1 (fr) | 1997-05-21 | 1998-05-20 | Procede et dispositif de reduction d'echo acoustique multivoies et de spatialisation sonore |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001526860A JP2001526860A (ja) | 2001-12-18 |
JP4414002B2 true JP4414002B2 (ja) | 2010-02-10 |
Family
ID=9507068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP55005698A Expired - Fee Related JP4414002B2 (ja) | 1997-05-21 | 1998-05-20 | 多重チャンネルの音響エコーを低減させ、かつ、音声を空間条件に適合させるための方法および装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US6424720B1 (ja) |
EP (1) | EP0983678B1 (ja) |
JP (1) | JP4414002B2 (ja) |
DE (1) | DE69831067T2 (ja) |
FR (1) | FR2763774B1 (ja) |
HK (1) | HK1026547A1 (ja) |
WO (1) | WO1998053595A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10217778A1 (de) * | 2002-04-18 | 2003-11-06 | Volkswagen Ag | Kommunikationseinrichtung zur Übertragung akustischer Signale in einem Kraftfahrzeug |
US8189765B2 (en) * | 2006-07-06 | 2012-05-29 | Panasonic Corporation | Multichannel echo canceller |
US8223959B2 (en) * | 2007-07-31 | 2012-07-17 | Hewlett-Packard Development Company, L.P. | Echo cancellation in which sound source signals are spatially distributed to all speaker devices |
JP5130895B2 (ja) * | 2007-12-13 | 2013-01-30 | ソニー株式会社 | 音声処理装置、音声処理システム、音声処理プログラム及び音声処理方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2508574B2 (ja) * | 1992-11-10 | 1996-06-19 | 日本電気株式会社 | 多チャンネルエコ―除去装置 |
JP3397269B2 (ja) * | 1994-10-26 | 2003-04-14 | 日本電信電話株式会社 | 多チャネル反響消去方法 |
DE19517469A1 (de) * | 1995-05-12 | 1996-11-14 | Sel Alcatel Ag | Freisprechverfahren für ein mehrkanaliges Übertragungssystem |
EP0766446B1 (en) * | 1995-09-26 | 2003-06-11 | Nippon Telegraph And Telephone Corporation | Method and apparatus for multi-channel acoustic echo cancellation |
-
1997
- 1997-05-21 FR FR9706191A patent/FR2763774B1/fr not_active Expired - Fee Related
-
1998
- 1998-05-20 EP EP98925756A patent/EP0983678B1/fr not_active Expired - Lifetime
- 1998-05-20 WO PCT/FR1998/001010 patent/WO1998053595A1/fr active IP Right Grant
- 1998-05-20 US US09/424,406 patent/US6424720B1/en not_active Expired - Lifetime
- 1998-05-20 DE DE69831067T patent/DE69831067T2/de not_active Expired - Lifetime
- 1998-05-20 JP JP55005698A patent/JP4414002B2/ja not_active Expired - Fee Related
-
2000
- 2000-09-07 HK HK00105633A patent/HK1026547A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
JP2001526860A (ja) | 2001-12-18 |
FR2763774A1 (fr) | 1998-11-27 |
EP0983678A1 (fr) | 2000-03-08 |
WO1998053595A1 (fr) | 1998-11-26 |
EP0983678B1 (fr) | 2005-08-03 |
DE69831067T2 (de) | 2006-06-01 |
US6424720B1 (en) | 2002-07-23 |
HK1026547A1 (en) | 2000-12-15 |
FR2763774B1 (fr) | 1999-08-06 |
DE69831067D1 (de) | 2005-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8718285B2 (en) | Decoding device, coding and decoding device, and decoding method | |
US7184559B2 (en) | System and method for audio telepresence | |
US6931123B1 (en) | Echo cancellation | |
EP2749016B1 (en) | Processing audio signals | |
US9113034B2 (en) | Method and apparatus for processing audio in video communication | |
GB2495472B (en) | Processing audio signals | |
JP2007081843A (ja) | 音場制御機器 | |
JP2008526162A (ja) | 音響的エコー消去用オーディオシステムと方法 | |
KR20120101457A (ko) | 오디오 줌 | |
CN101953176A (zh) | 音频设备及其操作方法 | |
US7522734B2 (en) | Distributed acoustic reverberation for audio collaboration | |
JPWO2017073324A1 (ja) | 信号処理装置、信号処理方法、並びにプログラム | |
US8194851B2 (en) | Voice processing apparatus, voice processing system, and voice processing program | |
JPH0870344A (ja) | 通信装置 | |
CN102957819B (zh) | 处理音频信号的方法及其设备 | |
JP4414002B2 (ja) | 多重チャンネルの音響エコーを低減させ、かつ、音声を空間条件に適合させるための方法および装置 | |
EP2779161B1 (en) | Spectral and spatial modification of noise captured during teleconferencing | |
CN114143668A (zh) | 音频信号处理、混响检测和会议方法、设备及存储介质 | |
WO2018198790A1 (ja) | コミュニケーション装置、コミュニケーション方法、プログラム、およびテレプレゼンスシステム | |
JP4298466B2 (ja) | 収音方法、装置、プログラム、および記録媒体 | |
US20100185307A1 (en) | Transmission apparatus and transmission method | |
US20230104602A1 (en) | Networked automixer systems and methods | |
CN113299310B (zh) | 声音信号处理方法、装置、电子设备及可读存储介质 | |
CN110121890B (zh) | 处理音频信号的方法和装置及计算机可读介质 | |
JP2023043497A (ja) | リモート会議システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080325 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080625 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080804 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090804 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090904 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091020 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091119 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121127 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121127 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131127 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |