JP5075042B2 - エコー消去装置、エコー消去方法、そのプログラム、記録媒体 - Google Patents

エコー消去装置、エコー消去方法、そのプログラム、記録媒体 Download PDF

Info

Publication number
JP5075042B2
JP5075042B2 JP2008189910A JP2008189910A JP5075042B2 JP 5075042 B2 JP5075042 B2 JP 5075042B2 JP 2008189910 A JP2008189910 A JP 2008189910A JP 2008189910 A JP2008189910 A JP 2008189910A JP 5075042 B2 JP5075042 B2 JP 5075042B2
Authority
JP
Japan
Prior art keywords
signal
echo
frequency
low
outputting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008189910A
Other languages
English (en)
Other versions
JP2010028653A (ja
Inventor
勝宏 福井
朗 中川
陽一 羽田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008189910A priority Critical patent/JP5075042B2/ja
Publication of JP2010028653A publication Critical patent/JP2010028653A/ja
Application granted granted Critical
Publication of JP5075042B2 publication Critical patent/JP5075042B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Description

この発明は、複数の収音手段で収音された収音信号に含まれるエコー信号を消去し、収音信号に含まれる雑音信号を抑圧して出力信号として出力するエコー消去装置、エコー消去方法、そのプログラム、記録媒体に関する。
従来の電話会議やテレビ会議に加えて、近年PC(パーソナルコンピュータ)を用いたテレビ電話デスクトップ会議などハンズフリー拡声通話が利用される機会が増加している。ハンズフリー拡声通話においては、受信した相手の声は再生手段(例えば、スピーカ)から放出される一方、受話者の音声は収音手段(例えば、マイクロホン)で収音されることから、通話しながら議事録の筆記やPCの操作ができるという大きな利点がある。
しかし、スピーカで放出された相手の声は、受話者に届くだけでなく、マイクロホンにも回り込んで収音され、音響エコーとして通話品質を劣化させるとともに、ハウリングの原因にもなる。そこで、このようなエコー信号の成分を消去し、ハウリングの発生を未然に防ぐために、ハンズフリー拡声通話においてエコー消去技術が導入されている。
また、種々の環境雑音の中から利用者の音声を選択的に受音、追従し、雑音抑圧を行ったあと、高精度に話者の音声を収音する適応ビームフォーミング技術がある。この技術は特許文献1の収音方法及び収音装置「マイクロホンアレイによるエコー抑圧、方向別AGCマイクロホンアレイ」に記載されている。この技術は、複数のマイクロホンを用いて音響的指向性を制御することにより、雑音源からの雑音信号を抑圧し、高精度に話者の音声を収音するものである。近年、この適応ビームフォーミング技術はエコー消去装置にも備えられている(非特許文献1参照)。
図1に、適応ビームフォーミングを備えた従来のエコー消去装置100の機能構成例を示す。エコー消去装置100は、N(Nは1以上の整数)個の収音手段(例えば、マイクロホン)に接続されている。エコー消去装置100は、N個のエコー消去部102(n=1,...,N)と適応ビームフォーミング部104とを有する。また、以下の説明では、再生手段2から放出された再生信号をx(t)とし、再生信号x(t)が収音手段4に回り込んだ信号をエコー信号a(t)とし、雑音源よりの雑音信号をb(t)とし、話者8からの話者信号をc(t)とする。エコー信号a(t)、雑音信号b(t)、話者信号c(t)からなる信号を収音信号とし、収音手段4で収音された信号を収音信号をy(t)と示し、エコー信号、雑音信号、話者信号をそれぞれa(t)b(t)c(t)と示す。tは離散時刻を示し、連続時間信号を一定のサンプル間隔Tでサンプリングしたことにより示されるものである。例えば、サンプリング周波数f=48kHz(1秒間に48000回)とする。サンプリング周波数f=1/Tである。また、エコー信号、雑音信号、話者信号が収音手段まで到達するまでは離散時刻ではなく、実時刻で表すべきであるが、説明簡略化のために、全て離散時刻tで示す。エコー消去装置100、以下で説明するエコー消去装置200、300においても離散時刻tで表された信号であるディジタル信号を扱うので、入力されるアナログ信号をDA変換器によりディジタル信号に変換し、出力するディジタル信号をAD変換器によりアナログ信号に変換する必要があるのであるが、このことは当然のことであるので、図1〜図3において、AD変換器、DA変換器については図示しない。また、雑音源6、話者8が存在しない場合は、収音信号には雑音信号、話者信号は含まれない。
説明を図1に戻す。収音信号y(t)は、エコー消去部102に入力される。エコー消去部102は収音信号y(t)からエコー信号a(t)を抑圧する。そして、エコー信号が消去された信号である残留エコー信号e(t)が適応ビームフォーミング部104に入力される。
適応ビームフォーミング部104はN個の残留エコー信号e(t)(=1,...,N)から雑音信号を抑圧し、出力信号z(t)として出力する。エコー消去部102、適応ビームフォーミング部104の詳細な処理については、以下の「発明を実施するための最良の形態」で説明する。
エコー消去装置100の構成は、N個のエコー消去部102の後段に適応ビームフォーミング部104を設置している。従って、適応ビームフォーミング部104の適応ビームフォーミングによる音響的指向性の変動をエコー消去部102のエコー経路モデルに含まないようにできる。
次に、図2に、適応ビームフォーミングを備えた従来のエコー消去装置200の機能構成例を示す。エコー消去装置200の構成は、適応ビームフォーミング部202が前段に、エコー消去部204が後段に設けられる。このように構成することで、適応ビームフォーミング部202よりの出力信号が1つである場合には、エコー消去部204は、その出力信号に対して1回のエコー消去処理(適応フィルタ処理)を行うだけでよく、低演算・低メモリ量の構成となっている。
特許第4104626号 Kellermann,W.,"Strategies for combining acoustic echo cancellation and adaptive beamforming microphone arrays,"IEEE International Conference on Acoustics,Speech,and Signal Processing,vol.1,21-24,pp.219-222,Apr.1997.
上記エコー消去装置100の構成であると、計算コストの高いエコー消去部102を収音手段の数であるN個分、備える必要があるため、膨大な計算コストが必要であった。また、上記エコー消去装置200の構成であると、エコー消去部のエコー経路モデルにおいて、時変ビームフォーミングを考慮しなければならないため、適応ビームフォーミング部202によって音響的指向性の変動が生じれば、エコー消去部204がエコー経路モデル(適応フィルタ)の再推定を行わなければならず、所望のエコー消去量に達しない場合がある。
この発明の目的は、(1)計算コストを少なくし、(2)エコー消去部の所望エコー消去量に達するまでの時間を短くすることで、適応ビームフォーミング処理による音響的指向性の変動に関わらず、所望のエコー消去量に達するエコー消去装置を提供することである。
この発明のエコー消去装置は、N個の収音手段で収音された収音信号に含まれるエコー信号を消去し、当該収音信号に含まれる雑音信号を抑圧して、出力信号として出力するものである。そして当該エコー消去装置は、N個の低域エコー消去部と、適応ビームフォーミング部と、エコー消去部と、を有する。低域エコー消去部は、収音信号の、予め定められた基準値より低い周波数帯域に含まれるエコー信号の成分を消去し、残留エコー信号を出力する。適応ビームフォーミング部は、N個の残留エコー信号から雑音信号を抑圧して、適応ビームフォーミング信号を出力する。エコー消去部は、適応ビームフォーミング信号から、エコー信号を消去することで出力信号を出力する。
この発明では、パワーが低周波数帯域(以下、単に「低域」という。)に集中する話者音声の性質から低周波数帯域の所望エコー消去量が高周波数帯域(以下、単に「高域」という。)の所望エコー消去量より大きいことに着目する。そして、N個の低域エコー消去部は、入力された収音信号の予め定められた基準値より低い低域についてのみエコーを消去するので、エコー消去装置100中のN個のエコー消去部と比較して計算コストを削減できる。従って、エコー消去装置100の問題点を解決できる。
また、この発明のエコー消去装置の構成は、前段からN個の低域エコー消去部、低域ビームフォーミング部、エコー消去部、の順番で構成されている。従って、低域エコー消去部のエコー経路モデルでは、適応ビームフォーミング部104の音響的指向性の変動による再推定を回避できる。また、エコー消去部については、低域エコー消去部によって、低域のエコーを消去したもの、つまり、大半のエコー信号の成分が消去された信号(適応ビームフォーミング信号)についてエコー信号の成分を消去する。従って、エコー消去部内で用いる全域残留エコー信号のパワーを最初から小さくでき、結果として、エコー消去部の所望エコー消去量に達するまでの時間を短くできる。よって、適応ビームフォーミング部による音響指向性変動が生じたとしても、エコー消去部は安定的に所望のエコー消去量を達成できる。また、上記非特許文献1には、エコー消去技術、適応ビームフォーミング技術のそれぞれの処理手順については記載されていない。
以下に、発明を実施するための最良の形態を示す。なお、同じ機能を持つ構成部や同じ処理を行う過程には同じ番号を付し、重複説明を省略する。
図3にエコー消去装置300の機能構成例を示し、図4に処理フローを示す。エコー消去装置300はN個の低域エコー消去部302、適応ビームフォーミング部104、エコー消去部304を有する。図5に低域エコー消去部302の機能構成例を示し、図6に適応ビームフォーミング部104の機能構成例を示し、図7にエコー消去部304の機能構成例を示す。なお、全ての低域エコー消去部302(n=1,...,N)の構成手段は全て同じであるので、図5記載の各構成手段の参照番号については添え字「n」を省略している。また、エコー消去部304は、図2記載のエコー消去部204と同一である。
図5記載のように、この実施例の低域エコー消去部302は、ローパスフィルタ手段3014と、ダウンサンプリング手段3016と、適応フィルタ手段3018と、帯域分割手段3012と、減算手段3020と、帯域合成手段3022と、により構成される。帯域分割手段3012は、ローパスフィルタ手段30122、ハイパスフィルタ手段30124、2つのダウンサンプリング手段30126により構成される。また、図6記載のように、この実施例の適応ビームフォーミング部104は、周波数領域変換手段1042と、適応ビームフォーミング手段1044と、時間領域変換手段1046と、インパルス応答記憶部1050(またはステアリングベクトル記憶部1048)と、により構成される。また、図7記載のように、この実施例のエコー消去部304は、適応フィルタ手段3048、減算手段3051、により構成される。
[低域エコー消去部302の処理(ステップS102)]
まず、収音信号y(t)が、低域エコー消去部302に入力される。エコー消去部302は、収音信号y(t)の予め定められた基準値αより低い周波数帯域に含まれるエコー信号a(t)の成分を消去し、残留エコー信号e(t)を出力する。まず、基準値αについて説明する。この発明では、パワーが低域に集中する話者音声の性質から、低域の所望エコー消去量が高域の所望エコー消去量より大きいことに着目する。例えば、全周波数帯域を24kHzとすると、再生信号の周波数帯域12kHz未満に話者音声は集中する場合が多く、結果として、収音信号の周波数帯域12kHz未満に含まれるエコー信号の成分を消去すれば、大半のエコー信号の成分を消去できることになる。基準値αとは、エコー信号の元となる信号(例えば、話者音声の信号)が集中している帯域の上限の周波数値を示すものである。基準値αは予め定められるものであり、上記の例ではα=12kHzとなる。このように、低域エコー消去部302は、計算コスト削減のために、低域の収音信号y(t)についてのみ、エコー消去処理を行う。この周波数帯域の基準値αは事前に設定しておけばよい。以下、低域エコー消去部302の処理を図5を用いて具体的に説明する。また、収音信号y(t)について、低域エコー消去部302に入力される収音信号を説明簡略化のために「y(t)」と示す。
収音手段により収音され、入力された収音信号y(t)は、帯域分割手段3012中のローパスフィルタ手段30122およびハイパスフィルタ手段30124に入力される。ローパスフィルタ手段30122は収音信号y(t)に対して、ローパスフィルタ(上記の例では、12kHz未満の信号のみ通過させるもの)の係数を畳み込み、低域の収音信号y(t)を出力する。
一方、ハイパスフィルタ手段30124は収音信号y(t)に対して、ハイパスフィルタ(上記の例では、12kHz以上の信号のみ通過させるもの)の係数を畳み込み、高域の収音信号y(t)を出力する。ローパスフィルタ手段30122、ローパスフィルタ手段3014において、通過させる周波数帯域の基準値αを同一にすることが好ましい。
低域収音信号y(t)、高域収音信号y(t)はそれぞれ、ダウンサンプリング手段30126、30128に入力される。そして、ダウンサンプリング手段30126は、低域収音信号y(t)について、例えばM−1個、間引くダウンサンプリング処理を行う。間引き数Mは1以上の正の実数であり、例えば「2」とする。ダウンサンプリング処理後の信号をy(Mt)と表す。同様に、ダウンサンプリング手段30128は、高域収音信号y(t)について、例えばM−1個、間引くダウンサンプリング処理を行う。ダウンサンプリング処理後の信号をy(Mt)と表す。低域収音信号y(Mt)は減算手段3020に入力され、高域収音信号y(Mt)は帯域合成手段3022に入力される。
一方、再生信号x(t)は、再生手段2およびローパスフィルタ手段3014に入力される。ローパスフィルタ手段3014は、ローパスフィルタ(上記の例では、12kHz未満の信号のみ通過させるもの)の係数を再生信号x(t)に対して畳み込むことで、再生信号x(t)の低域の信号(以下、「低域再生信号x(t)」という。)を出力する。低域再生信号x(t)はダウンサンプリング手段3016に入力される。ダウンサンプリング手段3016は、低域再生信号x(t)について、M−1個、間引くダウンサンプリング処理を行う。ダウンサンプリング処理後の信号x(Mt)は適応フィルタ手段3018に入力される。
ここでダウンサンプリング手段3016、30126、30128によるダウンサンプリング処理については、元の標本化周波数より低くなればよい。有理数のダウンサンプリングに関しては、例えば、特願2007−262986号のアップダウンサンプリング装置とアップダウンサンプリング装置およびそのプログラムに詳細に記載されている。また、ダウンサンプリング手段3016、30126、30128は無くても良い。
適応フィルタ手段3018は、低域再生信号x(Mt)に適応フィルタの係数h(Mt)を畳み込むことで、低域擬似エコー信号d(Mt)を出力する。当該畳み込みの式は以下のようになる。
Figure 0005075042
ここで、Sはタップ数を示す。
減算手段3020は、低域収音信号y(Mt)と、低域擬似エコー信号d(Mt)との差をとることで、低域残留エコー信号e(Mt)を出力する。図5の例では、低域収音信号y(Mt)から低域擬似エコー信号d(Mt)が差し引かれる。低域残留エコー信号e(Mt)は帯域合成手段3022および適応フィルタ手段3018に入力される。適応フィルタ手段3018の適応フィルタの係数は、低域再生信号x(Mt)および過去の低域残留エコー信号e(Mt)により更新される。この更新については、様々なアルゴリズムが知られており、例えば、学習同定アルゴリズム(NLMS:Normalized Least-Mean-Squares)や指数重みつけアルゴリズムがあるが、念のため学習同定アルゴリズムについて簡単に説明する。学習同定アルゴリズムにより低域再生信号x(Mt)のベクトルX(Mt)を用いて、以下の式で適応フィルタ係数ベクトルH(Mt)は更新される。
Figure 0005075042
ただし、
(Mt)=[x(Mt)、x(M(t−1))、...、x(M(t−S+1))]
(Mt)=[hL、0(Mt)、hL、1(Mt)、...、hL、S−1(Mt)]であり、βはスカラ量のステップサイズであって、取りうる範囲は0<β<2である。また、δは分母が0になることを防止するための微小な定数である。<学習同定アルゴリズムの説明は以上>
帯域合成手段3022は、低域残留エコー信号e(Mt)と高域収音信号y(Mt)について、帯域合成を行うことで、残留エコー信号e(t)を出力する。処理の詳細の具体例として、低域残留エコー信号e(Mt)と高域収音信号y(Mt)に対して、サンプル間にM−1個の零値を挿入し、アップサンプルで生じるイメージング(アップサンプリングする前のサンプリング周波数の折り返しスペクトル)を取り除くフィルタを畳み込んだそれぞれの出力信号を加算することで、残留エコー信号e(t)を出力する。そして、上記の処理が全ての低域エコー消去部302(n=1,...,N)で行われ、それぞれの低域エコー消去部302から残留エコー信号e(t)が出力される。
[適応ビームフォーミング部104の処理(ステップS104)]
全てのN個の残留エコー信号e(t)(n=1,...,N)は、適応ビームフォーミング部104に入力される。適応ビームフォーミング部104は、N個の残留エコー信号e(t)から雑音信号を抑圧して、適応ビームフォーミング信号s(t)を出力する。以下、図6を用いて具体例を説明する。なお、以下の適応ビームフォーミング部104の説明の詳細については、特開2008−60635号の段落[0004]〜[0010]等に記載されている。
入力されたN個の残留エコー信号e(t)は周波数領域変換手段1042に入力される。周波数領域変換手段1042は、時間領域の信号である残留エコー信号e(t)を周波数領域信号E(f、τ)に変換する。ここで、fは周波数を示し、τは任意の時間を示す。周波数領域の変換については、公知の技術であるフーリエ変換などを用いればよい。E(f、τ)(n=1,...,N)は全て適応ビームフォーミング手段1044に入力される。
適応ビームフォーミング手段1044は、目的信号である話者信号c(t)を強調し、不要信号である雑音信号b(t)をできるだけ抑圧するフィルタ(W(f)、...、W(f)]を推定することで実現される。適応ビームフォーミング手段1044を設計する際には、「話者から各収音手段へのインパルス応答ベクトルg(f)もしくは、g(f)の近似であるステアリングベクトルa(f)=[exp(−i2πfτ),...,exp(−i2πfτ)]が既知である」ということを仮定する。ここでτは話者8よりの話者信号(目的信号)が収音手段nに達する時刻と原点0に達する時間差である。そして、図8に示すように収音手段4を直線状に配置させることが多い。話者8の方向をθとし、収音s手段4を基準(原点)とした場合の収音手段4の座標dとすると、上述のτは、τ=dcosθ/cで与えられる。ここでcは信号の速度である。
図6に説明を戻すと、不要信号を抑圧する適応ビームフォーミング手段1044として、以下の式で表される出力パワーA(W(f))を最小にする適応フィルタ群(ベクトル)1048(n=1,...,N)であるW(f)=[W(f),...,W(f)]を推定する。
A(W(f))=V{|S|(f、τ)}
=V{S(f、τ)S(f、τ)}
=V{W(f)E(f、τ)E(f、τ)W(f)}
=W(f)R(f)W(f) (1)
ここで、V{}は時間τに関する平均操作、AはAの複素共役、R(f)=V{E(f、τ)E(f、τ)}は入力信号の相関行列、S(f、τ)は適応ビームフォーミング手段1044の出力であり、以下の式で表すことが出来る。
S(f、τ)=W(f)E(f、τ) (2)
ここで、意味のない解(W(f)=0=[0、...、0])を回避するために、目的信号が無歪みで得られるという以下の式に示す拘束条件を付与する。
(f)g(f)=1 (3)
これにより、式(3)を満たし、かつ上記式(1)のA(W(f))の値が最小となるW(f)の値を求める問題はLagurangeの未定乗数pを用いて、以下の式(4)で表すことができる。
A’(W(f))=A(W(f))+p(W(f)g(f)−1)(4)
式(4)を解くことにより、適応フィルタ群(ベクトル)W(f)は、以下の式(5)で得られる。
Figure 0005075042
適応ビームフォーミング手段1044から出力された周波数領域の適応ビームフォーミング信号S(f、τ)は時間領域変換手段1046に入力される。時間領域変換手段1046は、例えば公知の技術である逆フーリエ変換などを用いて、周波数領域の信号である適応ビームフォーミング信号S(f、τ)を時間領域の適応ビームフォーミング信号s(t)に変換して出力する。
[エコー消去部304の処理(ステップS106)]
適応ビームフォーミング信号s(t)は、エコー消去部304に入力される。エコー消去部304は、適応ビームフォーミング信号s(t)から、エコー信号を消去することで、出力信号z(t)として出力する。エコー消去部304の処理内容は公知であるが、図7を用いて念のため説明する。
再生信号x(t)は、適応フィルタ手段3048に入力される。適応フィルタ手段3048は、以下の式のように、再生信号x(t)に適応フィルタの係数h(t)を畳み込むことで擬似エコー信号のベクトルd(t)を出力する。
Figure 0005075042
そして、減算手段3051は、適応ビームフォーミング信号s(t)から擬似エコー信号d(t)差し引くことで、残留エコー信号e(t)を出力する。そして、適応フィルタ手段3048の適応フィルタのベクトルは、過去の残留エコー信号と再生信号により、上述した学習同定法等を用いて更新される。
ここで、N個の低域エコー消去部302により、収音信号の低周波数帯域に含まれるエコー信号の成分は消去されており、つまり、適応ビームフォーミング信号に含まれるエコー信号の成分は大半が消去されているので、残留エコー信号e(t)のパワーはかなり小さくなる。従って、所望エコー消去量に達するまでの時間を短くでき、適応ビームフォーミング部104の音響的指向性の変動が生じたとしても、所望のエコー消去量に達することが出来る。
そして、残留エコー信号e(t)は出力信号z(t)として出力される。また、話者信号c(t)が存在する場合には、残留エコー信号e(t)と話者信号c(t)とが出力信号z(t)として出力される。
実施例1のエコー消去部304は入力信号の全周波数帯域についてエコー信号の成分を消去した。しかし、N個の低域エコー消去部302で、低域のエコー信号の成分を消去されているので、エコー消去部では、基準値α(上記の例ではα=12kHz)より高い周波数帯域の適応ビームフォーミング信号から、エコー信号を消去するようにしてもよい。このようにすることで、エコー消去部の計算コストを大幅に削減できる。この場合のエコー消去部の参照符号を306とし、エコー消去部306の機能構成例を図9に示す。エコー消去部306は低域エコー消去部302(図5参照)のハイパスフィルタ手段とローパスフィルタ手段とを入れ替えた構成になっている。エコー消去部306の処理内容を簡単に説明する。
まず、適応ビームフォーミング信号s(t)が、帯域分割手段3062中のハイパスフィルタ手段30622およびローパスフィルタ手段30624に入力される。ハイパスフィルタ手段30622は適応ビームフォーミングs(t)に対して、ハイパスフィルタ(上記の例では、12kHz(=基準値α)以上の信号のみ通過させるもの)の係数を畳み込み、高域の適応ビームフォーミング信号s(t)を出力する。ローパスフィルタ手段30624は適応ビームフォーミング信号s(t)に対して、ローパスフィルタ(上記の例では、12kHz未満の信号のみ通過させるもの)の係数を畳み込み、低域の適応ビームフォーミング信号s(t)を出力する。
高域適応ビームフォーミング信号s(t)、低域適応ビームフォーミング信号s(t)、はそれぞれ、ダウンサンプリング手段30626、30628に入力される。そして、ダウンサンプリング手段30626、30628はそれぞれ、高域適応ビームフォーミング信号s(t)、低域適応ビームフォーミング信号s(t)について、ダウンサンプリング処理を行う。ダウンサンプリング処理後の高域適応ビームフォーミング信号s(Mt)は、減算手段3070に入力され、ダウンサンプリング処理後の低域適応ビームフォーミング信号s(Mt)は、帯域合成手段3072に入力される。
一方、ハイパスフィルタ手段3064は、再生信号x(t)に対して、ハイパスフィルタ(上記の例では、12kHz(=基準値α)以上の信号のみ通過させるもの)の係数を再生信号x(t)に対して畳み込むことで、高域再生信号x(t)を出力する。高域再生信号x(t)はダウンサンプリング手段3066に入力される。ダウンサンプリング手段3066は、高域再生信号x(t)について、ダウンサンプリング処理を行う。ダウンサンプリング処理後の信号x(Mt)は適応フィルタ手段3068に入力される。また、ダウンサンプリング手段3066、30626、30628は無くても良い。
適応フィルタ手段3068は、低域再生信号に適応フィルタを畳み込むことで、高域擬似エコー信号d(Mt)を出力する。減算手段3070は、高域適応ビームフォーミング信号s(Mt)から高域擬似エコー信号d(Mt)を差し引くことで、高域残留エコー信号e(Mt)を出力する。高域残留エコー信号e(Mt)は帯域合成手段3072および適応フィルタ手段3068に入力される。適応フィルタ手段3068の適応フィルタ係数は、高域再生信号x(Mt)および過去の高域残留エコー信号e(Mt)により、上記学習同定アルゴリズム等を用いて、更新される。
帯域合成手段3072は、高域残留エコー信号e(Mt)と低域適応ビームフォーミング信号s(Mt)について、帯域合成およびアップサンプリング処理を行うことで、残留エコー信号e(t)を出力する。帯域合成手段3072の処理の詳細は、帯域合成手段3022の処理と同様なので、省略する。そして、帯域合成手段3072から残留エコー信号e(t)が、出力信号z(t)として出力される。<エコー消去部306の処理の説明以上>
上記のエコー消去装置300は、再生手段2が1つの場合について説明したが、再生手段が2以上の場合であっても、適用できる。
また、低域エコー消去部302、エコー消去部304の処理は時間領域で行い、適応ビームフォーミング部104の処理は周波数領域で行った例を説明した。しかし、低域エコー消去部302、エコー消去部304の処理を周波数領域で行い、適応ビームフォーミング部104の処理は時間領域で行ってもよい。
この発明では、パワーが低域に集中する話者音声の性質から、低域の所望エコー消去量が高域の所望エコー消去量より大きいことに着目する。そして、本実施例のエコー消去装置は、「低域エコー消去部302による低域のエコー消去処理」→「適応ビームフォーミング部104による適応ビームフォーミング処理」→「エコー消去部304によるエコー消去」、の順番で処理を行う。まず、低域エコー消去部302は、収音信号の低周波数帯域のみに含まれるエコー信号の成分を消去する。従って、エコー消去装置100よりも計算コストを削減できる。また、適応ビームフォーミング処理の前に、低域のエコー消去処理を行う。従って、低域エコー消去部のエコー経路モデルでは、適応ビームフォーミング部104の音響的指向性の変動による再推定を回避できる。また、低域のエコー消去処理により収音信号に含まれる大半のエコー信号の成分を消去している。従って、エコー消去部304中の減算手段3051よりの残留エコー信号e(t)のパワーは小さいものとなり、結果として、エコー消去部の所望エコー消去量に達するまでの時間を短くできる。よって、適応ビームフォーミング部104による音響的指向特性の変動が生じたとしても、所望のエコー消去量に達することが出来る。
また、この実施例1のエコー消去装置300が従来のエコー消去装置100よりも優れていることを示す実験結果について説明する。マイクロホン数N=4とし、全周波数帯域を24kHzとし、周波数帯域の基準値α=12kHz、つまり、低域を12kHz未満、高域を12〜24kHzとした場合に、本実施例のエコー消去装置300の計算コストは、エコー消去装置100のエコー消去処理にかかる計算コストより約40%削減できる。
<ハードウェア構成>
本発明は上述の実施の形態に限定されるものではない。また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、エコー消去装置300が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
また、本実施例で説明したエコー消去装置300は、CPU(Central Processing Unit)、入力部、出力部、補助記憶装置、RAM(Random Access Memory)、ROM(Read Only Memory)及びバスを有している(何れも図示せず)。
CPUは、読み込まれた各種プログラムに従って様々な演算処理を実行する。補助記憶装置は、例えば、ハードディスク、MO(Magneto-Optical disc)、半導体メモリ等であり、RAMは、SRAM(Static Random Access Memory)、DRAM (Dynamic Random Access Memory)等である。また、バスは、CPU、入力部、出力部、補助記憶装置、RAM及びROMを通信可能に接続している。
<ハードウェアとソフトウェアとの協働>
本実施例の単語追加装置は、上述のようなハードウェアに所定のプログラムが読み込まれ、CPUがそれを実行することによって構築される。以下、このように構築される各装置の機能構成を説明する。
エコー消去装置300の低域エコー消去部302、適応ビームフォーミング部104、エコー消去部304は、所定のプログラムがCPUに読み込まれ、実行されることによって構築される演算部である。エコー消去装置300の記憶部(図示せず)は上記補助記憶装置として機能する。
従来のエコー消去装置の機能構成例を示した図。 従来のエコー消去装置の機能構成例を示した図。 実施例1のエコー消去装置の機能構成例を示した図。 実施例1のエコー消去装置の処理フローを示した図。 実施例1の低域エコー消去部の機能構成例を示した図。 実施例1の適応ビームフォーミング部の機能構成例を示した図。 実施例1のエコー消去部の機能構成例を示した図。 適応ビームフォーミング処理で用いるτを説明するための図。 実施例2のエコー消去部の機能構成例を示した図。

Claims (8)

  1. N個の収音手段で収音された収音信号に含まれるエコー信号を消去し、当該収音信号に含まれる雑音信号を抑圧して、出力信号として出力するエコー消去装置において、
    それぞれが前記収音信号の、予め定められた基準値より低い周波数帯域に含まれるエコー信号の成分を消去し、残留エコー信号を出力するN個の低域エコー消去部と、
    N個の前記残留エコー信号から前記雑音信号を抑圧して、適応ビームフォーミング信号を出力する適応ビームフォーミング部と、
    前記適応ビームフォーミング信号から、エコー信号を消去することで前記出力信号を出力するエコー消去部と、
    を有するエコー消去装置。
  2. 請求項1記載のエコー消去装置であって、
    前記低域エコー消去部は、
    再生手段から放出される再生信号の低域周波数帯の信号(以下、「低域再生信号」という。)を出力するローパスフィルタ手段と、
    前記収音信号を帯域分割することで、低域収音信号と高域収音信号に分けて出力する帯域分割手段と、
    前記低域再生信号に適応フィルタを畳み込むことで、低域擬似エコー信号を出力する適応フィルタ手段と、
    前記低域収音信号と前記低域擬似エコー信号との差をとることで、低域残留エコー信号を出力する減算手段と、
    前記低域残留エコー信号と前記高域収音信号について帯域合成を行うことで、前記残留エコー信号を出力する帯域合成手段と、を有し、
    前記適応フィルタは、過去の低域残留エコー信号と前記低域再生信号とを用いて更新されることを特徴とするエコー消去装置。
  3. 請求項1または2記載のエコー消去装置であって、
    前記エコー消去部は、
    前記基準値より高い周波数帯域の適応ビームフォーミング信号から、エコー信号を消去するものであることを特徴とするエコー消去装置。
  4. N個の収音手段で収音された収音信号に含まれるエコー信号を消去し、当該収音信号に含まれる雑音信号を抑圧して、出力信号として出力するエコー消去方法において、
    収音手段毎に、前記収音信号の予め定められた基準値より低い周波数帯域に含まれるエコー信号の成分を消去し、残留エコー信号を出力する低域エコー消去過程と、
    N個の前記残留エコー信号から前記雑音信号を抑圧して、適応ビームフォーミング信号を出力する適応ビームフォーミング過程と、
    前記適応ビームフォーミング信号から、エコー信号を消去することで前記出力信号を出力するエコー消去過程と、
    を有するエコー消去方法。
  5. 請求項4記載のエコー消去方法であって、
    前記低域エコー消去過程は、
    再生手段から放出される再生信号の低域周波数帯の信号(以下、「低域再生信号」という。)を出力するローパスフィルタステップと、
    前記収音信号を帯域分割することで、低域収音信号と高域収音信号に分けて出力する帯域分割ステップと、
    前記低域再生信号に適応フィルタを畳み込むことで、低域擬似エコー信号を出力する適応フィルタステップと、
    前記低域収音信号と前記低域擬似エコー信号との差をとることで、低域残留エコー信号を出力する減算ステップと、
    前記低域残留エコー信号と前記高域収音信号について帯域合成を行うことで、前記残留エコー信号を出力する帯域合成ステップと、を有し、
    前記適応フィルタは、過去の低域残留エコー信号と前記低域再生信号とを用いて更新されることを特徴とするエコー消去方法。
  6. 請求項4または5記載のエコー消去方法であって、
    前記エコー消去過程は、
    前記基準値より高い周波数帯域の適応ビームフォーミング信号から、エコー信号を消去することを特徴とするエコー消去方法。
  7. 請求項1〜3のいずれかに記載のエコー消去装置としてコンピュータを動作させるプログラム。
  8. 請求項7記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2008189910A 2008-07-23 2008-07-23 エコー消去装置、エコー消去方法、そのプログラム、記録媒体 Expired - Fee Related JP5075042B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008189910A JP5075042B2 (ja) 2008-07-23 2008-07-23 エコー消去装置、エコー消去方法、そのプログラム、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008189910A JP5075042B2 (ja) 2008-07-23 2008-07-23 エコー消去装置、エコー消去方法、そのプログラム、記録媒体

Publications (2)

Publication Number Publication Date
JP2010028653A JP2010028653A (ja) 2010-02-04
JP5075042B2 true JP5075042B2 (ja) 2012-11-14

Family

ID=41734023

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008189910A Expired - Fee Related JP5075042B2 (ja) 2008-07-23 2008-07-23 エコー消去装置、エコー消去方法、そのプログラム、記録媒体

Country Status (1)

Country Link
JP (1) JP5075042B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111345048A (zh) * 2017-11-14 2020-06-26 日本电信电话株式会社 语音通信装置、语音通信方法、程序

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5060631B1 (ja) 2011-03-31 2012-10-31 株式会社東芝 信号処理装置及び信号処理方法
US8811601B2 (en) * 2011-04-04 2014-08-19 Qualcomm Incorporated Integrated echo cancellation and noise suppression
EP2768242A4 (en) * 2011-10-14 2015-04-29 Fujitsu Ltd SOUND PROCESSING DEVICE, SOUND PROCESSING PROCESS AND PROGRAM
EP2701145B1 (en) * 2012-08-24 2016-10-12 Retune DSP ApS Noise estimation for use with noise reduction and echo cancellation in personal communication
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
US20180358032A1 (en) * 2017-06-12 2018-12-13 Ryo Tanaka System for collecting and processing audio signals
US11523212B2 (en) 2018-06-01 2022-12-06 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
WO2020061353A1 (en) 2018-09-20 2020-03-26 Shure Acquisition Holdings, Inc. Adjustable lobe shape for array microphones
WO2020121545A1 (ja) * 2018-12-14 2020-06-18 日本電信電話株式会社 信号処理装置、信号処理方法、およびプログラム
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
WO2020191380A1 (en) 2019-03-21 2020-09-24 Shure Acquisition Holdings,Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality
US11303981B2 (en) 2019-03-21 2022-04-12 Shure Acquisition Holdings, Inc. Housings and associated design features for ceiling array microphones
WO2020237206A1 (en) 2019-05-23 2020-11-26 Shure Acquisition Holdings, Inc. Steerable speaker array, system, and method for the same
WO2020243471A1 (en) 2019-05-31 2020-12-03 Shure Acquisition Holdings, Inc. Low latency automixer integrated with voice and noise activity detection
US11297426B2 (en) 2019-08-23 2022-04-05 Shure Acquisition Holdings, Inc. One-dimensional array microphone with improved directivity
WO2021087377A1 (en) 2019-11-01 2021-05-06 Shure Acquisition Holdings, Inc. Proximity microphone
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
WO2021243368A2 (en) 2020-05-29 2021-12-02 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
EP4285605A1 (en) 2021-01-28 2023-12-06 Shure Acquisition Holdings, Inc. Hybrid audio beamforming system
CN116962934B (zh) * 2023-09-19 2024-01-09 九音科技(南京)有限公司 一种拾音降噪方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08321796A (ja) * 1995-05-26 1996-12-03 Hitachi Ltd 音響エコーキャンセラ
JP4345208B2 (ja) * 2000-08-25 2009-10-14 沖電気工業株式会社 反響及び雑音除去装置
JP3854188B2 (ja) * 2002-04-24 2006-12-06 株式会社東芝 音声信号処理装置
JP4802708B2 (ja) * 2005-12-28 2011-10-26 ヤマハ株式会社 放収音装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111345048A (zh) * 2017-11-14 2020-06-26 日本电信电话株式会社 语音通信装置、语音通信方法、程序

Also Published As

Publication number Publication date
JP2010028653A (ja) 2010-02-04

Similar Documents

Publication Publication Date Title
JP5075042B2 (ja) エコー消去装置、エコー消去方法、そのプログラム、記録媒体
JP5038143B2 (ja) エコーキャンセル
JP5221117B2 (ja) 低複雑性のエコー補償
US20110013781A1 (en) System and process for regression-based residual acoustic echo suppression
KR101099340B1 (ko) 임의의 플레이백 샘플링 비율들을 갖는 에코우 제거를위한 시스템 및 방법
JP6151236B2 (ja) 雑音抑圧装置、その方法及びプログラム
KR20160076059A (ko) 디스플레이장치 및 그 반향 제거방법
JP5161157B2 (ja) 周波数領域エコー除去装置、周波数領域エコー除去方法、プログラム
CN109215672B (zh) 一种声音信息的处理方法、装置及设备
WO2019098178A1 (ja) 音声コミュニケーション装置、音声コミュニケーション方法、プログラム
JP2003188776A (ja) 音響エコー消去方法、装置及び音響エコー消去プログラム
JP2003250193A (ja) 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
JP6537997B2 (ja) エコー抑圧装置、その方法、プログラム、及び記録媒体
JP2011160429A (ja) エコー消去装置
JP7373947B2 (ja) 音響エコーキャンセル装置、音響エコーキャンセル方法及び音響エコーキャンセルプログラム
JP5583181B2 (ja) 縦続接続型伝達系パラメータ推定方法、縦続接続型伝達系パラメータ推定装置、プログラム
JP2017191987A (ja) エコー消去装置、その方法、プログラム、及び記録媒体
JP5325134B2 (ja) 反響消去方法、反響消去装置、そのプログラムおよび記録媒体
JP4094523B2 (ja) 反響消去装置、方法、及び反響消去プログラム、そのプログラムを記録した記録媒体
JP5526053B2 (ja) 反響消去方法とその装置とプログラム
JP5925149B2 (ja) 音響結合量推定装置、エコー消去装置、その方法及びプログラム
JP6075783B2 (ja) エコー消去装置、エコー消去方法及びプログラム
JP3917116B2 (ja) 反響消去装置、方法、及び反響消去プログラム、そのプログラムを記録した記録媒体
WO2019244535A1 (ja) エコー消去装置、エコー消去方法、プログラム
WO2022195955A1 (ja) エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100726

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120327

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120814

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120824

R150 Certificate of patent or registration of utility model

Ref document number: 5075042

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150831

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees