JP2015019185A - 音声スイッチ装置、音声スイッチ方法、及びそのプログラム - Google Patents
音声スイッチ装置、音声スイッチ方法、及びそのプログラム Download PDFInfo
- Publication number
- JP2015019185A JP2015019185A JP2013144100A JP2013144100A JP2015019185A JP 2015019185 A JP2015019185 A JP 2015019185A JP 2013144100 A JP2013144100 A JP 2013144100A JP 2013144100 A JP2013144100 A JP 2013144100A JP 2015019185 A JP2015019185 A JP 2015019185A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- wave number
- domain
- sound
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000004364 calculation method Methods 0.000 claims abstract description 29
- 238000012545 processing Methods 0.000 claims description 83
- 230000005236 sound signal Effects 0.000 claims description 63
- 230000001629 suppression Effects 0.000 claims description 49
- 238000012546 transfer Methods 0.000 claims description 39
- 230000008569 process Effects 0.000 claims description 26
- 238000001914 filtration Methods 0.000 claims description 18
- 238000006243 chemical reaction Methods 0.000 claims description 17
- 230000002123 temporal effect Effects 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 description 55
- 238000012986 modification Methods 0.000 description 29
- 230000004048 modification Effects 0.000 description 29
- 230000000694 effects Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 16
- 239000008186 active pharmaceutical agent Substances 0.000 description 15
- 238000009499 grossing Methods 0.000 description 14
- 238000001228 spectrum Methods 0.000 description 14
- 238000012937 correction Methods 0.000 description 13
- 230000015572 biosynthetic process Effects 0.000 description 9
- 230000008030 elimination Effects 0.000 description 9
- 238000003379 elimination reaction Methods 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 230000003044 adaptive effect Effects 0.000 description 8
- 230000002238 attenuated effect Effects 0.000 description 8
- 238000005070 sampling Methods 0.000 description 8
- 238000013016 damping Methods 0.000 description 7
- 238000013459 approach Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 3
- 238000012886 linear function Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000002411 adverse Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005404 monopole Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 101100406879 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) par-2 gene Proteins 0.000 description 1
- 101100361282 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rpm1 gene Proteins 0.000 description 1
- 238000000540 analysis of variance Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
Abstract
【課題】波面の進行方向毎に異なるゲインを適用する音声スイッチ装置、音声スイッチ方法、及びそのプログラムを提供する。
【解決手段】音声スイッチ装置300は、P個の第一マイクロホン1pを設置した第一空間の地点(ア)で取得した音波面を、P個の第二スピーカ2pを設置した第二空間の地点(イ)で再合成し、P個の第二マイクロホンを設置した第二空間で取得した音波面を、P個の第一スピーカを設置した第一空間で再合成するものとし、第二スピーカで再生される信号を再生信号とし、第二マイクロホン3pで収音される信号を収音信号とし、波数領域の再生信号と波数領域の収音信号とから、周波数と波数との組合せ毎に、波数領域の再生信号と波数領域の収音信号とに対する減衰ゲインを算出する減衰ゲイン算出部23とを含む。
【選択図】図7
【解決手段】音声スイッチ装置300は、P個の第一マイクロホン1pを設置した第一空間の地点(ア)で取得した音波面を、P個の第二スピーカ2pを設置した第二空間の地点(イ)で再合成し、P個の第二マイクロホンを設置した第二空間で取得した音波面を、P個の第一スピーカを設置した第一空間で再合成するものとし、第二スピーカで再生される信号を再生信号とし、第二マイクロホン3pで収音される信号を収音信号とし、波数領域の再生信号と波数領域の収音信号とから、周波数と波数との組合せ毎に、波数領域の再生信号と波数領域の収音信号とに対する減衰ゲインを算出する減衰ゲイン算出部23とを含む。
【選択図】図7
Description
本発明は、マルチチャネル双方向拡声通話等において通話を安定化するための音声スイッチ装置、音声スイッチ方法、及びそのプログラムに関する。
音声会議装置やテレビ会議装置では、スピーカから再生した音がマイクロホンで収音されて生じる音響エコーを消去するために、音声スイッチ装置を内部に備えたエコーキャンセラを使用する。
拡声通話では、遠隔地からの音声をスピーカで再生し、こちらの音声をマイクロホンで収音して遠隔地に送る。このとき、スピーカで再生された音がマイクロホンで収音される。そのままではエコーとなって遠隔地に送られてしまうために、ハウリングが生じて、通話不能になる。ハウリングを防止するために、音声スイッチ装置を用いて、受話と送話の有無を判定し、受話がない場合には再生信号のゲインを下げ、送話がない場合には収音信号のゲインを下げる。
この音声スイッチ装置の動作を、モノラルチャネルの場合について図1を用いて説明する。音声スイッチ装置9は、受話端1を介して遠隔地から再生信号x(n)を受け取る。また、音声スイッチ装置9は、マイクロホン3で収音した収音信号y(n)を受け取る。減衰ゲイン算出部95は、減衰前の(図1のA点での)再生信号x(n)と減衰前の(図1の点Cでの)収音信号y(n)の大きさから受話と送話のどちらが優勢かを判定する。なお、nは、時刻を表すインデックスである。受話が優勢と判定されたとき、送話側減衰部94で収音信号y(n)を減衰させ、送話端4に出力する。一方、送話が優勢と判定されたとき受話側減衰部93で再生信号x(n)を減衰させ、スピーカ2に出力する。
スピーカ2とマイクロホン3が一体型の音声会議装置では、スピーカ2とマイクロホン3との間の音響結合が既知であることを利用して、送受話判定の精度を上げることができる。具体的には、この音響結合量と減衰後の(図1の点Bでの)再生信号x(n)のレベルからエコーのレベルを推定し、推定値y^(n)を収音信号y(n)のレベルから差し引くことで、より正確に送話のレベルを得ることができる。
さらに、マルチチャネル拡声通話における従来の音声スイッチ方法として、特許文献1が知られている。図2を用いてマルチチャネル拡声通話における従来の音声スイッチ方法を説明する。Pチャネル拡声通話系では、音声スイッチ装置8は、P個の送話音声パワー推定部86pを含み、P個のスピーカ2pとP個のマイクロホン3pとからなる音響系をP個のP入力1出力系に分解する。ただし、p=1,2,…,Pである。そして、送話音声パワー推定部86p(図2ではp=1について説明する。)は、P個のTF変換部861pを含み、TF変換部861pは、時間領域の再生信号x(p,n)を周波数領域に変換する。また、TF変換部862は、収音信号y(n)を周波数領域に変換する。エコー成分比率推定部863は、周波数領域の再生信号Xf(p,i)と収音信号Yf(p,i)とを用いて、収音信号について、エコー成分が占める比率γ2 f(p,i)を推定する。なお、fは周波数のインデックスを、iはフレームのインデックスを表す。送話パワー算出部864は、その比率γ2 f(p,i)からエコー以外の成分として送話パワーPf(p,i)を算出する。
減衰ゲイン制御部85では、Pチャネルの再生信号x(p,n)とPチャネルの送話パワーPf(p,i)から、受話と送話のどちらが優勢かを判定し、判定結果に応じて受話側及び送話側のゲインを算出する。
この受話側及び送話側のゲインは、図3のように受話側と送話側とで変動しても、受話側の全チャネル、または、受話側の全チャネルに同じゲインを適用する。それはチャネルp毎に異なるゲインを適用すると、再生音像の位置が変わったり動いたりするためである。例えばP=2チャネルのときに受話側でチャネルp毎に異なるゲインを適用すると、再生信号x(p,n)のLRバランスが本来のLRバランスから変わってしまい、音像の再生位置が本来より右もしくは左に寄ってしまう。また再生中にLRバランスが変化した場合、再生音像の位置が動いてしまう。
近年、マルチチャネル再生技術は、チャネル数拡大の方向へ、例えばステレオ再生から5.1チャネル再生へと進んでいる。さらに高い立体感で音が再生されるリスニングエリアを大幅に拡大する技術として、Wave Field Synthesis(以下「WFS」ともいう)の研究が進められている。WFSでは、数十以上のマイクロホン、数十以上のスピーカを用いて、図4のようにある地点での音波面を取得し、別の地点で再合成する。このようなWFS収音再生技術として、波面再構成フィルタ11が提案されている(参考文献1参照)。
(参考文献1)小山、「音場再現技術における数理問題」、日本音響学会誌、2012年、Vol.68,No.11,pp.584−589.
(参考文献1)小山、「音場再現技術における数理問題」、日本音響学会誌、2012年、Vol.68,No.11,pp.584−589.
波面再構成フィルタ11では、P個のマイクロホン1pで収音された時間領域の収音信号(以下、スピーカ2pで再生される信号という意味で「再生信号」という)x(p,n)を、多CH短時間フーリエ変換部111及び空間フーリエ変換部112を介して、波数領域の再生信号X_f(k,i)に変換する。ただし、kは波数のインデックスを表す。P個のマイクロホン1pを設置した地点で取得した音波面を、P個のスピーカ2pを設置した地点で再合成するように、フィルタ113は、再生信号X_f(k,i)をフィルタリングし、再生信号X_R,f(k,i)を求める。ただし、下付き添え字Rは、音波面を再合成するためのフィルタリングした信号であることを示す。波数領域の再生信号X_R,f(k,i)を、空間逆フーリエ変換部114及び多CH短時間逆フーリエ変換部115を介して、P個の時間領域の再生信号xR(p,n)に変換する。P個の時間領域の再生信号xR(p,n)がP個のスピーカで再生され、音波面が再合成される。
空間的な音情報の伝送は、数十個のマイクロホンとスピーカの配置を同一にし、マイクロホンで収音した信号をそのまま対応するスピーカから再生することでも、可能である。しかし、収音された音場(以下「収音音場」ともいう)と再生された音場(以下「再生音場」ともいう)との間の関係は、音波伝搬の物理式を満たさなくなる。参考文献2においてBerkhoutらは音波の物理式に従う収音再生を解析し、理想的なダイポール特性を持つマイクロホンと理想的なモノポール特性を持つスピーカを用いれば、収音音場と再生音場との間の関係が音波伝搬の物理式を満たすことを示した。
(参考文献2)A. J. Berkhout, D. de Vries, and P. Vogel, "Acoustic control by wave field synthesis", J. Acoust. Soc. Am, 1993, vol.93, pp.2764-2778
(参考文献2)A. J. Berkhout, D. de Vries, and P. Vogel, "Acoustic control by wave field synthesis", J. Acoust. Soc. Am, 1993, vol.93, pp.2764-2778
このマイクロホンによる収音は、「低域ほどゲインが小さい」という周波数特性を持ち、「脇から入射する音ほどゲインが小さい」という指向特性を持つ。
参考文献1の波面再構成フィルタを用いれば、理想的なダイポール特性を持つマイクロホンでなく、通常入手できるモノポール特性のマイクロホンとスピーカを用いても、音波伝搬の物理式を満たすように音場を収音し、再生することができる。
WFSの収音再生システムは、音空間全体の伝送を目的とするため、伝送する空間の幅、すなわち、マイクロホンアレー及びスピーカアレーの横幅は、例えば大型液晶テレビよりもずっと大きく、3m以上に設定される。そのため各マイクロホンで収音される送話レベルの空間的なピーク位置は話者の位置に応じて変わり、話者から遠いマイクロホンほど送話レベルは減衰する。
WFS収音再生を用いて双方向音声通信を行うことを考える。この場合、図4に示すように、スピーカ2pが配置される空間に、マイクロホン3pを配置し、マイクロホン1pが配置される空間にスピーカ4pを配置し、マイクロホン3pとスピーカ4pとの間に波面再構成フィルタ12を設ける必要がある。波面再構成フィルタ12は、波面再構成フィルタ11と同様の構成であり、マイクロホン3pで収音された収音信号y(p,n)を受け取り、フィルタリングして、収音信号yR(p,n)を出力する。
ここで、従来の音声スイッチ装置を適用することを考える。図5のように対地(双方向通話の通話先、言い換えると、スピーカ2pの再生信号の送信元)との間で話者位置が重ならず、図6のように空間的な送話の信号レベルと受話の信号レベルのピーク位置がずれている場合を考える。
受話の信号レベルと送話の信号レベルとが図6のような概形を持って拮抗している場合、受話と送話のどちらが優勢かを判定するのは困難になる。それでも判定結果に応じて送話もしくは受話の一方を減衰しようとすると、音声レベルの時間変動も影響して、判定結果及び減衰量がバタついてしまい(不安定になり)、音切れが生じやすくなる。また受話と送話の双方を減衰しようとすれば、受話側の全チャネルと送話側の全チャネルに減衰が入り続ける状態となり、どちらの音声も聞き取りが困難になってしまう。また再生信号と収音信号とは、波面再構成フィルタにより周波数特性が大きく異なるために直接比較しても望ましい判定結果を得られる保証はない。
本発明は、受話側の全チャネル、または、受話側の全チャネルに同じゲインを適用するのではなく、波面の進行方向毎に異なるゲインを適用する音声スイッチ装置、音声スイッチ方法、及びそのプログラムを提供することを目的とする。
上記の課題を解決するために、本発明の第一の態様によれば、音声スイッチ装置は、複数の第一マイクロホンを設置した第一空間で取得した音波面を、複数の第二スピーカを設置した第二空間で再合成し、複数の第二マイクロホンを設置した第二空間で取得した音波面を、複数の第一スピーカを設置した第一空間で再合成するものとし、第二スピーカで再生される信号を再生信号とし、第二マイクロホンで収音される信号を収音信号とし、波数領域の再生信号と波数領域の収音信号とから、周波数と波数との組合せ毎に、波数領域の再生信号と波数領域の収音信号とに対する減衰ゲインを算出する減衰ゲイン算出部と、波数領域の再生信号に減衰ゲインを適用する第一減衰ゲイン適用部と、波数領域の収音信号に減衰ゲインを適用する第二減衰ゲイン適用部とを含む。
上記の課題を解決するために、本発明の第二の態様によれば、音声スイッチ方法は、複数の第一マイクロホンを設置した第一空間で取得した音波面を、複数の第二スピーカを設置した第二空間で再合成し、複数の第二マイクロホンを設置した第二空間で取得した音波面を、複数の第一スピーカを設置した第一空間で再合成するものとし、第二スピーカで再生される信号を再生信号とし、第二マイクロホンで収音される信号を収音信号とし、波数領域の再生信号と波数領域の収音信号とから、周波数と波数との組合せ毎に、波数領域の再生信号と波数領域の収音信号とに対する減衰ゲインを算出する減衰ゲイン算出ステップと、波数領域の再生信号に減衰ゲインを適用する第一減衰ゲイン適用ステップと、波数領域の収音信号に減衰ゲインを適用する第二減衰ゲイン適用ステップとを含む。
本発明によれば、波面の進行方向毎に異なるゲインを適用できるという効果を奏する。
以下、本発明の実施形態について説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。また、この明細書の表記においては、A_は
を、A^は
を、A^_は
を表すものとする。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。
<本実施形態のポイント>
本実施形態では、本来あるべき音像の位置と再生音像の位置とを保ちつつ、受話及び送話のゲインを従来よりも柔軟に適用できる方法を提案する。
本実施形態では、本来あるべき音像の位置と再生音像の位置とを保ちつつ、受話及び送話のゲインを従来よりも柔軟に適用できる方法を提案する。
そのために、本実施形態は多チャネルの受話信号及び送話信号を周波数毎に分解し、さらに波面の進行方向毎に分解する。そして進行方向毎に異なるゲインを適用する。これにより受話信号の波面が優勢な方向では送話信号を減衰させ、送話信号が優勢な方向では受話信号を減衰させることが可能となる。また、波面再構成フィルタの適用前の再生信号と収音信号とを比較して送受話状態を判定する。これにより、受話と送話とが混在する状況においても、受話と送話の両方をほぼ減衰させることなく通すことが可能となる。
<第一実施形態に係る音声スイッチ装置300>
図7は本実施形態に係る音声スイッチ装置300の機能ブロック図を、図8はその処理フローを示す。図7では、2地点(ア)と(イ)を、波面合成信号処理と音声スイッチ信号処理により双方向接続したときの処理構成を示す。なお、2地点(ア)と(イ)は、図7に示したものに限定されない。2地点(ア)と(イ)は、隣接していても互いに離れた位置にあってもよい。また、マイクロホン、スピーカの向きもどのようなものであってもよい。
図7は本実施形態に係る音声スイッチ装置300の機能ブロック図を、図8はその処理フローを示す。図7では、2地点(ア)と(イ)を、波面合成信号処理と音声スイッチ信号処理により双方向接続したときの処理構成を示す。なお、2地点(ア)と(イ)は、図7に示したものに限定されない。2地点(ア)と(イ)は、隣接していても互いに離れた位置にあってもよい。また、マイクロホン、スピーカの向きもどのようなものであってもよい。
音声スイッチ装置300は、多CH短時間フーリエ変換部211及び221と、空間フーリエ変換部212及び222と、減衰ゲイン適用部217及び227と、減衰ゲイン制御部23と、波面再構成フィルタ213及び223と、空間逆フーリエ変換部214及び224と、多CH短時間逆フーリエ変換部215及び225とを含む。
地点(ア)のP個のマイクロホン1pで収音されたPチャネルの収音信号(以下、地点(イ)から見て、スピーカ2pで再生される信号という意味で「再生信号」ともいう)x(p,n)は、多CH短時間フーリエ変換部211で周波数領域に変換され(s211)、周波数f毎に空間フーリエ変換部212で波数領域に変換される(s212)ことで方向(波面、波数)毎に分解される。周波数−波数空間で分割された波数領域の再生信号X_f(k,i)は、各周波数fの各波数kについて、減衰ゲイン適用部217で減衰される(s217)。その後、波数領域の波面再構成フィルタ213によりフィルタ処理され(s213)、空間逆フーリエ変換部214及び多CH短時間逆フーリエ変換部215を経て時間領域のPチャネルの再生信号xGR(p,n)に変換されて(s214、s215)、スピーカ2pから再生される。ただし、下付添え字GRは、減衰のためのゲインを適用し、かつ、音波面を再合成するためのフィルタリングした信号であることを示す。
地点(イ)のP個のマイクロホン3pで収音されたPチャネルの収音信号y(p,n)は、多CH短時間フーリエ変換部221で周波数領域に変換され(s221)、周波数f毎に空間フーリエ変換部222で波数領域に変換される(s222)ことで方向(波面、波数)毎に分解される。周波数−波数空間で分割された波数領域の収音信号Y_f(k,i)は、各周波数fの各波数kについて、減衰ゲイン適用部227で減衰される(s227)。その後、波数領域の波面再構成フィルタ223によりフィルタ処理され(s223)、空間逆フーリエ変換部224及び多CH短時間逆フーリエ変換部225を経て時間領域のPチャネルの収音信号yGR(p,n)に変換されて(s224、s225)、地点(ア)のスピーカ4pから再生される。
減衰ゲイン適用部217及び227で適用されるゲインは、減衰ゲイン制御部23で決定される(s23)。減衰ゲイン制御部23では、各周波数f、各波数kにおいて、減衰前の再生信号X_f(k,i)と収音信号Y_f(k,i)とから、受話と送話のどちらが優勢かを判定する。なお、地点(イ)から見て、再生信号X_f(k,i)が受話側の信号であり、収音信号Y_f(k,i)が送話側の信号である。受話が優勢と判定されたとき、送話側の減衰ゲイン適用部227で収音信号Y_f(k,i)を減衰させ、送話が優勢と判定されたとき受話側の減衰ゲイン適用部217で再生信号Y_f(k,i)を減衰させる。
各周波数f、各波数kにおいて入力から出力までのゲイン(音響結合)が事前に分かっている場合には、再生信号X_GR,f(k,i)のレベル、すなわち、波面再構成フィルタ213の出力信号のレベルにこのゲインをかけてエコーレベルを推定し、推定値Y^_f(k,i)を収音信号Y_f(k,i)のレベルから差し引くことで、より正確に送話信号レベルを得ることができ、送話状態か受話状態かをより高い精度で判定できる。
以下、各部の詳細を説明する。
<多CH短時間フーリエ変換部211及び221>
多CH短時間フーリエ変換部211は、Pチャネルの時間領域の再生信号x(p,n)を受け取り、チャネルp毎に周波数領域の再生信号X(p,i)に変換し(s211)、空間フーリエ変換部212に出力する。ただし、iはフレーム番号を表す。なお、周波数領域変換の方法としては、高速フーリエ変換(Fast Fourier Transform;以下「FFT」ともいう)等が考えられる。
多CH短時間フーリエ変換部211は、Pチャネルの時間領域の再生信号x(p,n)を受け取り、チャネルp毎に周波数領域の再生信号X(p,i)に変換し(s211)、空間フーリエ変換部212に出力する。ただし、iはフレーム番号を表す。なお、周波数領域変換の方法としては、高速フーリエ変換(Fast Fourier Transform;以下「FFT」ともいう)等が考えられる。
まず、多CH短時間フーリエ変換部211は、再生信号x(p,n)をF/D個受け取る毎に(言い換えると、n=iF/Dの関係になる毎に)、2F個の再生信号x(p,n−2F+1),x(p,n−2F+2),…,x(p,n)を1フレーム分としてブロック化し、フレーム単位の再生信号x(p,i)を得る。ただし、Fは自然数であり、DはFを割り切る自然数である。例えば、
である。ただし、Tは転置を表す。以下、特に断りが無い限り、各信号を1フレーム=2Fサンプル(フレーム長)、シフト量F/Dサンプル(シフト幅)でブロック化する。FFT計算を簡略化・高速化するために、Fを2のべき乗にとることが多い。以下ではD≧2の場合を示す。
さらに、多CH短時間フーリエ変換部211は、フレーム単位の再生信号x(p,i)を、次式のように周波数領域の再生信号X(p,i)に変換する。
なお、再生信号X(p,i)を含め、周波数領域の各信号は短時間スペクトルにより表される。なお、fは周波数のインデックスを表し、f=0,1,…,2F−1である。信号のサンプリング周波数をfSとすると、Xf(p,i)はフレームiにおけるチャネルpの再生信号の周波数fSf/2F[Hz]の成分を表す。
同様に、多CH短時間フーリエ変換部221は、Pチャネルの時間領域の収音信号y(p,n)を受け取り、チャネルp毎に周波数領域の再生信号Y(p,i)に変換し(s221)、空間フーリエ変換部222に出力する。
<空間フーリエ変換部212及び222>
空間フーリエ変換部212は、Pチャネルの周波数領域の再生信号X(p,i)=[X0(p,i) … Xf(p,i) … X2F-1(p,i)]を受け取り、以下の式(3)や(4)により、周波数f毎に波数領域の再生信号X_f(k,i)に変換し(s212)、波数領域の再生信号X_f(k,i)を減衰ゲイン制御部23及び減衰ゲイン適用部217に出力する。ただし、ここでは、f=0,1,…,Fについて、波数領域の再生信号X_f(k,i)に変換する。F<f≦2F−1については、後述する空間逆フーリエ変換部214において説明する。また、kは波数のインデックスであり、Kを自然数とし、チャネル数Pが偶数でP=2Kのときk=−K+1,−K+2,…,−1,0,1,…,Kであり、チャネル数Pが奇数でP=2K+1のときk=−K,−K+1,…,−1,0,1,…,Kである。
空間フーリエ変換部212は、Pチャネルの周波数領域の再生信号X(p,i)=[X0(p,i) … Xf(p,i) … X2F-1(p,i)]を受け取り、以下の式(3)や(4)により、周波数f毎に波数領域の再生信号X_f(k,i)に変換し(s212)、波数領域の再生信号X_f(k,i)を減衰ゲイン制御部23及び減衰ゲイン適用部217に出力する。ただし、ここでは、f=0,1,…,Fについて、波数領域の再生信号X_f(k,i)に変換する。F<f≦2F−1については、後述する空間逆フーリエ変換部214において説明する。また、kは波数のインデックスであり、Kを自然数とし、チャネル数Pが偶数でP=2Kのときk=−K+1,−K+2,…,−1,0,1,…,Kであり、チャネル数Pが奇数でP=2K+1のときk=−K,−K+1,…,−1,0,1,…,Kである。
(1)チャネル数Pが偶数でP=2Kのとき、
である。
(2)チャネル数Pが奇数でP=2K+1のとき、
(2)チャネル数Pが奇数でP=2K+1のとき、
である。波数領域への変換は、2のべき乗の点数を持つFFTで高速に行うため、以下、チャネル数Pが偶数の場合(P=2K)について説明を進める。なお、再生信号X_f(k,i)を含め、波数領域の各信号は短時間スペクトルにより表される。この処理により、再生信号は、進行方向毎に分解される。以下の減衰ゲイン適用処理は、送話側の全チャネルまたは受話側の全チャネル毎ではなく、方向毎に行われる。
なお、空間フーリエ変換部212は、特定方向にビームを持つマイクロホンアレーをP個並べていると考えることもできる。そして、後述する空間逆フーリエ変換部214により、信号が元のPチャネルの信号に戻ることから、このP個のマイクロホンアレーは逆変換を持つことが分かる。
同様に、空間フーリエ変換部222は、Pチャネルの周波数領域の収音信号Y(p,i)=[Y0(p,i) … Yf(p,i) … Y2F-1(p,i)]を受け取り、周波数f毎に波数領域の収音信号Y_f(k,i)に変換し(s222)、波数領域の収音信号Y_f(k,i)を減衰ゲイン制御部23及び減衰ゲイン適用部227に出力する。
<減衰ゲイン制御部23>
減衰ゲイン制御部23は、P×(F+1)個の波数領域の再生信号X_f(k,i)と収音信号Y_f(k,i)とを受け取り、波数領域の減衰ゲインG_X,f(k,i)及びG_Y,f(k,i)とを求め(s23)、それぞれ減衰ゲイン適用部217及び227に出力する。例えば、減衰ゲインG_X,f(k,i)及びG_Y,f(k,i)は、以下のようにして求める。
減衰ゲイン制御部23は、P×(F+1)個の波数領域の再生信号X_f(k,i)と収音信号Y_f(k,i)とを受け取り、波数領域の減衰ゲインG_X,f(k,i)及びG_Y,f(k,i)とを求め(s23)、それぞれ減衰ゲイン適用部217及び227に出力する。例えば、減衰ゲインG_X,f(k,i)及びG_Y,f(k,i)は、以下のようにして求める。
まず、波数領域の再生信号X_f(k,i)と収音信号Y_f(k,i)とをそれぞれ2乗して平滑化する、もしくは、絶対値をとって平滑化する等の処理により、各信号のレベルlevel(X_f(k,i))及びlevel(Y_f(k,i))を求める。
次に、各信号のレベルから送話がどれくらい優勢か(送話優勢度)を求める。その方法としては、例えば、図9に示すような飽和特性を持つ関数を用い、送話と受話の比率(送話優勢度)level(Y_f(k,i))/level(X_f(k,i))を0〜1にマッピングすることが考えられる。なおこのグラフの横軸はdB単位になっている。また飽和点を決めるパラメータRth[dB]としては、6〜20[dB]を用いる。
さらに、例えば、図10のような関数を用いて、送話優勢度から送話側の減衰ゲインG_Y,f(k,i)を求める。なお減衰ゲインの最小値−Ls[dB]としては、−3〜40[dB]の値が考えられる。受話側の減衰ゲインG_X,f(k,i)は、あらかじめ設定した送話側+受話側の減衰ゲインG_all,f(k,i)を用いて、次式により求める。
このような構成により、図11に示すように、送話側の全チャネルまたは受話側の全チャネル毎ではなく、各周波数fの各波数kについて、減衰ゲインを設定することができる。なお、図11は、色の濃い部分ほど適用される減衰ゲインが小さいことを表す。
<減衰ゲイン適用部217及び227>
減衰ゲイン適用部217は、P×(F+1)個の波数領域の再生信号X_f(k,i)と波数領域の減衰ゲインG_X,f(k,i)とを受け取り、各周波数f(ただし、f≦F)の各波数k(−K<k≦K)において、次式のように、波数領域の再生信号X_f(k,i)に、減衰ゲインG_X,f(k,i)を適用し(乗じ)(s217)、減衰ゲイン適用後の再生信号X_G,f(k,i)を求め、波面再構成フィルタ213に出力する。
減衰ゲイン適用部217は、P×(F+1)個の波数領域の再生信号X_f(k,i)と波数領域の減衰ゲインG_X,f(k,i)とを受け取り、各周波数f(ただし、f≦F)の各波数k(−K<k≦K)において、次式のように、波数領域の再生信号X_f(k,i)に、減衰ゲインG_X,f(k,i)を適用し(乗じ)(s217)、減衰ゲイン適用後の再生信号X_G,f(k,i)を求め、波面再構成フィルタ213に出力する。
同様に、減衰ゲイン適用部227は、波数領域の収音信号Y_f(k,i)と波数領域の減衰ゲインG_Y,f(k,i)とを受け取り、各周波数f(f≦F)において、波数領域(−K<k≦K)で収音信号Y_f(k,i)に、減衰ゲインG_Y,f(k,i)を適用し(乗じ)(s227)、減衰ゲイン適用後の収音信号Y_G,f(k,i)を求め、波面再構成フィルタ223に出力する。
<波面再構成フィルタ213及び223>
波面再構成フィルタ213は、地点(ア)で取得した音波面を地点(イ)で再合成するように、複数のマイクロホン1pで収音した再生信号をフィルタリングし、複数のスピーカ2pで再生する複数の再生信号を求めるためのフィルタである。同様に、波面再構成フィルタ223は、地点(イ)で取得した音波面を地点(ア)で再合成するように、複数のマイクロホン3pで収音した収音信号をフィルタリングし、複数のスピーカ4pで再生する複数の収音信号を求めるためのフィルタである。
波面再構成フィルタ213は、地点(ア)で取得した音波面を地点(イ)で再合成するように、複数のマイクロホン1pで収音した再生信号をフィルタリングし、複数のスピーカ2pで再生する複数の再生信号を求めるためのフィルタである。同様に、波面再構成フィルタ223は、地点(イ)で取得した音波面を地点(ア)で再合成するように、複数のマイクロホン3pで収音した収音信号をフィルタリングし、複数のスピーカ4pで再生する複数の収音信号を求めるためのフィルタである。
波面再構成フィルタ213は、P×(F+1)個の波数領域の再生信号X_G,f(k,i)を受け取り、各周波数f(ただし、f≦F)の各波数k(−K<k≦K)において、次式のように、波数領域の再生信号X_G,f(k,i)にフィルタ係数R_X,f(k)をかけることで、フィルタリングし(s213)、フィルタリング後の再生信号X_GR,f(k,i)を求め、空間逆フーリエ変換部214に出力する。
同様に、波面再構成フィルタ223は、P×(F+1)個の波数領域の収音信号Y_G,f(k,i)を受け取り、各周波数f(ただし、f≦F)の各波数k(−K<k≦K)において、波数領域の収音信号Y_G,f(k,i)にフィルタ係数R_Y,f(k)をかけることで、フィルタリングし(s223)、フィルタリング後の収音信号Y_GR,f(k,i)を求め、空間逆フーリエ変換部224に出力する。
<空間逆フーリエ変換部214及び224>
空間逆フーリエ変換部214は、P×(F+1)個の波数領域の減衰ゲイン適用処理及びフィルタリング処理済みの再生信号X_GR,f(k,i)を受け取り、周波数f≦Fにおいて、次式のように周波数f毎に周波数領域の再生信号XGR,f(p,i)に変換し(s214)、出力する。
空間逆フーリエ変換部214は、P×(F+1)個の波数領域の減衰ゲイン適用処理及びフィルタリング処理済みの再生信号X_GR,f(k,i)を受け取り、周波数f≦Fにおいて、次式のように周波数f毎に周波数領域の再生信号XGR,f(p,i)に変換し(s214)、出力する。
なお、周波数F<f≦2F−1については、実数信号のFFT結果に関する対称性から、次式で周波数領域の再生信号XGR,f(p,i)を求める。
XGR,f(p,i)=conj(XGR,2F-f(p,i))
ただし、conj(A)はA内のスカラーあるいはベクトル、行列の個々の要素に対して複素共役をとることを示す。なお、本実施形態では、周波数F<f≦2F−1について、減衰ゲイン適用部217等の処理を省略しているが、省略せずに全ての周波数0≦f≦2F−1において処理を行ってもよい。
XGR,f(p,i)=conj(XGR,2F-f(p,i))
ただし、conj(A)はA内のスカラーあるいはベクトル、行列の個々の要素に対して複素共役をとることを示す。なお、本実施形態では、周波数F<f≦2F−1について、減衰ゲイン適用部217等の処理を省略しているが、省略せずに全ての周波数0≦f≦2F−1において処理を行ってもよい。
このようにして求めた合計P×2F個の周波数領域の再生信号XGR,f(p,i)を多CH短時間逆フーリエ変換部215に出力する。ただし、このとき、f=0,1,…,2F−1である。なお、逆波数変換方法としては、空間フーリエ変換部212における波数領域変換方法に対応するものを用いればよい。
同様に、空間逆フーリエ変換部224は、P×(F+1)個の波数領域の減衰ゲイン適用処理及びフィルタリング処理済みの収音信号Y_GR,f(k,i)を受け取り、周波数f≦Fにおいて、周波数f毎に周波数領域の収音信号YGR,f(p,i)に変換し(s224)、出力する。
<多CH短時間逆フーリエ変換部215及び225>
多CH短時間逆フーリエ変換部215は、P×2F個の周波数領域の再生信号XGR,f(p,i)を受け取り、次式のように、チャネルp毎に周波数領域の再生信号XGR,f(p,i)を逆FFTし、時間領域の再生信号xGR(p,i)(ベクトルであり、要素数は2F個)に変換する(s215)。
多CH短時間逆フーリエ変換部215は、P×2F個の周波数領域の再生信号XGR,f(p,i)を受け取り、次式のように、チャネルp毎に周波数領域の再生信号XGR,f(p,i)を逆FFTし、時間領域の再生信号xGR(p,i)(ベクトルであり、要素数は2F個)に変換する(s215)。
時間領域変換方法としては、多CH短時間フーリエ変換部211における周波数領域変換方法に対応するものを用いればよい。
さらに、多CH短時間逆フーリエ変換部215は、時間領域の再生信号x(p,i)を合成し、合成した信号を音声スイッチ装置300の出力値として出力する。例えば、多CH短時間フーリエ変換部211において、再生信号x(p,n)をD≧2でフレーム化した場合には、多CH短時間逆フーリエ変換部215は、フレームiで求めた再生信号xGR(p,i)と一つ前のフレームi−1で求めた再生信号xGR(p,i−1)とに対して窓かけ処理を行った上で、合成し、合成後の再生信号x’GR(p,i)(ベクトルであり、要素数はF/D個)の要素xGR(p,n−F/D+1),xGR(p,n−F/D+2),…,xGR(p,n)を逐次、出力値として出力する。ただし、n=iF/Dの関係にある。
同様に、多CH短時間逆フーリエ変換部225は、P×2F個の周波数領域の収音信号YGR,f(p,i)を受け取り、チャネルp毎に周波数領域の収音信号YGR,f(p,i)を逆FFTし、時間領域の収音信号yGR(p,i)(ベクトルであり、要素数は2F個)に変換する(s225)。さらに、多CH短時間逆フーリエ変換部225は、時間領域の収音信号y(p,i)を合成し、合成した信号y’GR(p,i)の要素yGR(p,n−F/D+1),yGR(p,n−F/D+2),…,yGR(p,n)を逐次、出力値として出力する。
<効果>
このような構成により、波面の進行方向毎に異なるゲインを適用できる。つまり、図11のように周波数f毎、波数k毎に減衰ゲインをきめ細かく設定することができる。これにより再生信号の波面が優勢な方向で収音信号を減衰させ、収音信号が優勢な方向で再生信号を減衰させることが可能となり、送話と受話の混在するダブルトーク状況でも通話(受話と送話の両方)をほぼ減衰させることなく双方向に通すことが可能となる。
このような構成により、波面の進行方向毎に異なるゲインを適用できる。つまり、図11のように周波数f毎、波数k毎に減衰ゲインをきめ細かく設定することができる。これにより再生信号の波面が優勢な方向で収音信号を減衰させ、収音信号が優勢な方向で再生信号を減衰させることが可能となり、送話と受話の混在するダブルトーク状況でも通話(受話と送話の両方)をほぼ減衰させることなく双方向に通すことが可能となる。
<変形例>
なお、s212の周波数領域から波数領域への空間フーリエ変換について、式(3)では各周波数fにおけるPチャネルの再生信号Xf(p,i)を対象としてP(=2K)点フーリエ変換を用いている。この場合、空間フーリエ変換部212の入力から空間逆フーリエ変換部214の出力までは巡回畳み込みの処理と見ることができる。巡回畳み込みはPチャネルの空間信号を周期信号として扱うために、その悪影響が空間信号の両端に現れやすい。これを避けるために、次式のようにPチャネルの再生信号Xf(p,i)の両脇にP/2個ずつ0詰めをして、2P(=4K)点フーリエ変換を適用してもよい。
なお、s212の周波数領域から波数領域への空間フーリエ変換について、式(3)では各周波数fにおけるPチャネルの再生信号Xf(p,i)を対象としてP(=2K)点フーリエ変換を用いている。この場合、空間フーリエ変換部212の入力から空間逆フーリエ変換部214の出力までは巡回畳み込みの処理と見ることができる。巡回畳み込みはPチャネルの空間信号を周期信号として扱うために、その悪影響が空間信号の両端に現れやすい。これを避けるために、次式のようにPチャネルの再生信号Xf(p,i)の両脇にP/2個ずつ0詰めをして、2P(=4K)点フーリエ変換を適用してもよい。
この場合、減衰ゲイン制御処理(s23)や減衰ゲイン適用処理(s217)で処理対象となる波数kの範囲が、−K+1≦k≦Kから−2K+1≦k≦2Kへと倍になる。また空間逆フーリエ変換部214は、s214の式(7)の代わりに次式を用い、2P(=4K)点逆フーリエ変換を使用する。そして、その結果の中央部P点を抜き出して、チャネル毎に短時間逆フーリエ変換を適用すればよい。
空間フーリエ変換部222と空間逆フーリエ変換部224についても、同様に2P(=4K)点のフーリエ変換、逆フーリエ変換を用いることができる。
また、音声スイッチ装置300は、少なくとも、減衰ゲイン適用部217及び227と、減衰ゲイン制御部23とを含めばよい。ただし、音声スイッチ装置300は、送話側の全チャネルまたは受話側の全チャネル毎ではなく、方向毎に減衰ゲインを適用するため、WFSによる波面再構成フィルタ213及び223とともに利用するときにのみその効果を生じる。例えば、音声スイッチ装置300は、多CH短時間フーリエ変換部221と、空間フーリエ変換部222と、減衰ゲイン適用部217及び227と、波面再構成フィルタ213と、減衰ゲイン制御部23と、空間逆フーリエ変換部214と、多CH短時間逆フーリエ変換部215とを含み(図7の一点鎖線より右側の構成)、他の構成(多CH短時間フーリエ変換部211と、空間フーリエ変換部212と、波面再構成フィルタ223と、空間逆フーリエ変換部224と、多CH短時間逆フーリエ変換部225)については対地に設置された装置内に設ける構成としてもよい。このような構成により、収音再生+音声スイッチを2地点に分割することができる。
また、本実施形態では、Pが偶数の場合について、説明しているが、Pが奇数(P=2K+1であってもよい。式(3)に代えて式(4)を用い、さらに、式(7)に代えて、次式を用いる。
また、多CH短時間フーリエ変換部211及び221の処理と空間フーリエ変換部212及び222の処理とを同時に行ってもよい。同様に、空間逆フーリエ変換部214及び224の処理と多CH短時間逆フーリエ変換部215及び225の処理とを同時に行ってもよい。
<第二実施形態>
第一実施形態と異なる部分を中心に説明する。図12は第二実施形態に係る音声スイッチ装置の機能ブロック図を、図13はその処理フローを示す。
第一実施形態と異なる部分を中心に説明する。図12は第二実施形態に係る音声スイッチ装置の機能ブロック図を、図13はその処理フローを示す。
第一実施形態とは、送受話判定の入力信号が異なる。第一実施形態は、波面再構成フィルタ213及び223のフィルタリング前の再生信号X_f(k,i)と収音信号Y_f(k,i)とを比較して送受話判定を行った。第二実施形態では、フィルタリング後の再生信号X_R,f(k,i)と収音信号Y_R,f(k,i)とを比較して送受話判定を行う。
<波面再構成フィルタ213及び223>
波面再構成フィルタ213は、P×(F+1)個の波数領域の再生信号X_f(k,i)を受け取り、各周波数f(ただし、f≦F)の各波数k(−K<k≦K)において、次式のように、波数領域の再生信号X_f(k,i)にフィルタ係数R_X,f(k)をかけることで、フィルタリングし(s213)、フィルタリング後の再生信号X_R,f(k,i)を求め、減衰ゲイン適用部217に出力する。
波面再構成フィルタ213は、P×(F+1)個の波数領域の再生信号X_f(k,i)を受け取り、各周波数f(ただし、f≦F)の各波数k(−K<k≦K)において、次式のように、波数領域の再生信号X_f(k,i)にフィルタ係数R_X,f(k)をかけることで、フィルタリングし(s213)、フィルタリング後の再生信号X_R,f(k,i)を求め、減衰ゲイン適用部217に出力する。
同様に、波面再構成フィルタ223は、P×(F+1)個の波数領域の収音信号Y_f(k,i)を受け取り、各周波数f(ただし、f≦F)の各波数k(−K<k≦K)において、波数領域の収音信号Y_f(k,i)にフィルタ係数R_Y,f(k)をかけることで、フィルタリングし(s223)、フィルタリング後の収音信号Y_R,f(k,i)を求め、減衰ゲイン適用部227に出力する。
<減衰ゲイン制御部23>
減衰ゲイン制御部23は、P×(F+1)個の波数領域の再生信号X_R,f(k,i)と収音信号Y_R,f(k,i)とを受け取り、波数領域の減衰ゲインG_X,f(k,i)及びG_Y,f(k,i)とを求め(s23)、それぞれ減衰ゲイン適用部217及び227に出力する。再生信号X_f(k,i)と収音信号Y_f(k,i)に代えて、再生信号X_R,f(k,i)と収音信号Y_R,f(k,i)を用いて、第一実施形態と同様の方法により、波数領域の減衰ゲインを求める。
減衰ゲイン制御部23は、P×(F+1)個の波数領域の再生信号X_R,f(k,i)と収音信号Y_R,f(k,i)とを受け取り、波数領域の減衰ゲインG_X,f(k,i)及びG_Y,f(k,i)とを求め(s23)、それぞれ減衰ゲイン適用部217及び227に出力する。再生信号X_f(k,i)と収音信号Y_f(k,i)に代えて、再生信号X_R,f(k,i)と収音信号Y_R,f(k,i)を用いて、第一実施形態と同様の方法により、波数領域の減衰ゲインを求める。
<減衰ゲイン適用部217及び227>
減衰ゲイン適用部217は、P×(F+1)個の波数領域の再生信号X_R,f(k,i)と波数領域の減衰ゲインG_X,f(k,i)とを受け取り、各周波数f(ただし、f≦F)の各波数k(−K<k≦K)において、次式のように、波数領域の再生信号X_R,f(k,i)に、減衰ゲインG_X,f(k,i)を適用し(乗じ)(s217)、再生信号X_GR,f(k,i)を求め、空間逆フーリエ変換部214に出力する。
減衰ゲイン適用部217は、P×(F+1)個の波数領域の再生信号X_R,f(k,i)と波数領域の減衰ゲインG_X,f(k,i)とを受け取り、各周波数f(ただし、f≦F)の各波数k(−K<k≦K)において、次式のように、波数領域の再生信号X_R,f(k,i)に、減衰ゲインG_X,f(k,i)を適用し(乗じ)(s217)、再生信号X_GR,f(k,i)を求め、空間逆フーリエ変換部214に出力する。
同様に、減衰ゲイン適用部227は、波数領域の収音信号Y_R,f(k,i)と波数領域の減衰ゲインG_Y,f(k,i)とを受け取り、各周波数f(f≦F)において、波数領域(−K<k≦K)で収音信号Y_R,f(k,i)に、減衰ゲインG_Y,f(k,i)を適用し(乗じ)(s227)、減衰ゲイン適用後の収音信号Y_GR,f(k,i)を求め、空間逆フーリエ変換部224に出力する。
このような構成により、第一実施形態と同様の効果を得ることができる。
なお、第二実施形態と第一実施形態の変形例とを組み合わせてもよい。例えば、音声スイッチ装置300は、少なくとも、減衰ゲイン適用部217及び227と、減衰ゲイン制御部23とを含めばよい。例えば、音声スイッチ装置300は、多CH短時間フーリエ変換部221と、空間フーリエ変換部222と、減衰ゲイン適用部217及び227と、波面再構成フィルタ223と、減衰ゲイン制御部23と、空間逆フーリエ変換部214と、多CH短時間逆フーリエ変換部215とを含み(図12の一点鎖線より右側の構成)、他の構成(多CH短時間フーリエ変換部211と、空間フーリエ変換部212と、波面再構成フィルタ213と、空間逆フーリエ変換部224と、多CH短時間逆フーリエ変換部225)については対地に設置された装置内に設ける構成としてもよい。このような構成により、収音再生+音声スイッチを2地点に分割することができる。
<第三実施形態>
第一実施形態と異なる部分を中心に説明する。
第一実施形態と異なる部分を中心に説明する。
図14は音声スイッチ装置300の機能ブロック図を、図15はその処理フローを示す。
音声スイッチ装置300は、多CH短時間フーリエ変換部211及び221と、空間フーリエ変換部212及び222と、減衰ゲイン適用部217及び227と、減衰ゲイン制御部23と、波面再構成フィルタ213及び223と、空間逆フーリエ変換部214及び224と、多CH短時間逆フーリエ変換部215及び225とを含み、さらに、エコー消去部100と、波数領域残留エコー推定消去部523と、ノイズ抑圧部230とを含む。
<エコー消去部100>
図16はエコー消去部100の機能ブロック図を、図17はその処理フローを示す。
図16はエコー消去部100の機能ブロック図を、図17はその処理フローを示す。
エコー消去部100は、Pチャネルの再生信号xGR(p,n)及びPチャネルの収音信号y(p,n)を受け取り、Pチャネルの収音信号y(p,n)からエコー成分を消去し(s100)、エコー成分消去後の収音信号yD(p,n)を出力する。なお、下付添え字Dは、エコー成分を消去した信号であることを示す。
本実施形態に係るエコー消去部100では、P入力P出力の系を波数領域の適応フィルタで処理する。
エコー消去部100は、時空間FFT変換部10、BG波数領域エコーレプリカ生成部21、FG波数領域エコーレプリカ生成部22、時空間逆FFT変換部31及び32、P個の減算部41p、時空間FFT変換部51〜53、エコー経路推定部70、転送判定部60、P個の減算部42p、P個のフレーム合成部80pを含む。
図16に示すように転送判定部60には時空間FFT変換後のFG誤差信号E_FG,f(k,i)、BG誤差信号E_BG,f(k,i)が入力される。Pチャネルの再生信号xGR(p,n)は、P個のスピーカ2pから再生され、P個のマイクロホン3pで収音される。同時に、Pチャネルの再生信号xGR(p,n)は、時空間FFT変換部10において、波数領域の再生信号X_GR,f(k,i)に変換される。FG波数領域エコーレプリカ生成部22及びBG波数領域エコーレプリカ生成部21は、それぞれ波数領域の再生信号X_GR,f(k,i)を受け取り、波数領域のFGエコーレプリカY^_FG,f(k,i)及びBGエコーレプリカY^_BG,f(k,i)を生成する。
時空間逆FFT変換部32により時間領域に変換されたFGエコーレプリカy^FG(p,i)と収音信号y(p,n)との差であるFG誤差信号eFG(p,i)が、フレーム合成部80pでフレーム合成後に、エコー成分を消去した収音信号yD(p,n)として、多CH短時間フーリエ変換部211に出力される。
時空間逆FFT変換部31により時間領域に戻したBGエコーレプリカy^_BG(p,i)と収音信号y(p,n)との差であるBG誤差信号eBG(p,i)は、時空間FFT変換部51において、波数領域に変換され、エコー経路推定部70に入力される。エコー経路推定部70は、波数領域の再生信号X_GR,f(k,i)とBG誤差信号E_BG,f(k,i)とを用いて、波数領域のフィルタ係数H_BG,f(k,k+dk,i)を求め、BG波数領域エコーレプリカ生成部21に出力し、フィルタ係数を更新する。
転送判定部60は、波数領域の再生信号X_GR,f(k,i)、収音信号Y_f(k,i)、FG誤差信号E_FG,f(k,i)及びBG誤差信号E_BG,f(k,i)を比較し、適切と判定したときにBG波数領域エコーレプリカ生成部21のフィルタ係数H_BG,f’(k’,k’+dk,i)をFG波数領域エコーレプリカ生成部22に転送するように、制御信号c(i)をBG波数領域エコーレプリカ生成部21に出力する。ただし、k’、f’は、それぞれ転送判定部60で転送を指示された周波数及び波数のインデックスを表す。フィルタ係数の転送単位は、チャネル毎ではなく、図18のように各周波数fにおける各波数kへと細分される。なお、図18中、網掛け部分に対応するフィルタ係数H_BG,f’(k’,k’+dk,i)を転送する。
本発明のエコー消去部100の詳細を下記に示す。
<時空間FFT変換部10及び53>
時空間FFT変換部10は、Pチャネルの時間領域の再生信号xGR(p,n)を受け取り、波数領域に変換し(s1)、波数領域の再生信号X_GR,f(k,i)を出力する。例えば、多CH短時間フーリエ変換部211及び空間フーリエ変換部212と同様の方法により時間領域の再生信号xGR(p,n)を波数領域の再生信号X_GR,f(k,i)に変換する。
時空間FFT変換部10は、Pチャネルの時間領域の再生信号xGR(p,n)を受け取り、波数領域に変換し(s1)、波数領域の再生信号X_GR,f(k,i)を出力する。例えば、多CH短時間フーリエ変換部211及び空間フーリエ変換部212と同様の方法により時間領域の再生信号xGR(p,n)を波数領域の再生信号X_GR,f(k,i)に変換する。
時空間FFT変換部53も、同様に時間領域の収音信号y(p,i)を波数領域に変換し(s35)、波数領域の収音信号Y_f(k,i)を転送判定部60に出力する。
<BG波数領域エコーレプリカ生成部21>
BG波数領域エコーレプリカ生成部21は、P×(F+1)個の波数領域の再生信号X_GR,f(k,i)と波数領域のフィルタ係数H_BG,f(k,k+dk,i)(詳細は後述する)とを受け取り(ただし、f≦F)、各周波数fの各波数kにおいて、次式のように、波数領域(−K<k≦K)で再生信号X_GR,f(k,i)にフィルタ係数H_BG,f(k,k+dk,i)をかけて、波数領域のエコーレプリカをY^_BG,f(k,i)を生成し(s12)、出力する。
BG波数領域エコーレプリカ生成部21は、P×(F+1)個の波数領域の再生信号X_GR,f(k,i)と波数領域のフィルタ係数H_BG,f(k,k+dk,i)(詳細は後述する)とを受け取り(ただし、f≦F)、各周波数fの各波数kにおいて、次式のように、波数領域(−K<k≦K)で再生信号X_GR,f(k,i)にフィルタ係数H_BG,f(k,k+dk,i)をかけて、波数領域のエコーレプリカをY^_BG,f(k,i)を生成し(s12)、出力する。
なお、次式のように、隣接する空間周波数成分を含めてもよい。
なお、δとして、参考文献3では1もしくは2が推奨されている。
(参考文献3)
M. Schneider, W. Kellermann, "A Wave-domain model for acoustic MIMO systems with reduced complexity", 2011 Joint Workshop on Hands-free Speech Communication and Microphone arrays, 2012, pp. 133-138.
なお、δ=0のとき、式(31)となる。
(参考文献3)
M. Schneider, W. Kellermann, "A Wave-domain model for acoustic MIMO systems with reduced complexity", 2011 Joint Workshop on Hands-free Speech Communication and Microphone arrays, 2012, pp. 133-138.
なお、δ=0のとき、式(31)となる。
<FG波数領域エコーレプリカ生成部22>
FG波数領域エコーレプリカ生成部22は、P×(F+1)個の波数領域の再生信号X_GR,f(k,i)と(ただし、f≦F)、後述する転送判定部60で転送を指示された波数領域のフィルタ係数H_BG,f’(k’,k’+dk,i)とを受け取る。なお、フィルタ係数H_BG,f’(k’,k’+dk,i)の個数は、転送を指示された個数によって変化し、フレームi毎に異なる。
FG波数領域エコーレプリカ生成部22は、P×(F+1)個の波数領域の再生信号X_GR,f(k,i)と(ただし、f≦F)、後述する転送判定部60で転送を指示された波数領域のフィルタ係数H_BG,f’(k’,k’+dk,i)とを受け取る。なお、フィルタ係数H_BG,f’(k’,k’+dk,i)の個数は、転送を指示された個数によって変化し、フレームi毎に異なる。
FG波数領域エコーレプリカ生成部22は、一つ前のフレーム(i−1)において、利用したフィルタ係数H_FG,f(k,k+dk,i−1)のうち、転送判定部60で転送を指示された周波数f’、波数k’に対応するフィルタ係数H_FG,f’(k’,k’+dk,i−1)をフィルタ係数H_BG,f’(k’,k’+dk,i)に置き換え、フィルタ係数H_FG,f’(k’,k’+dk,i)を更新する。
FG波数領域エコーレプリカ生成部22は、BG波数領域エコーレプリカ生成部21と同様に、再生信号X_GR,f(k,i)にフィルタ係数H_FG,f(k,k+dk,i)をかけて、波数領域のエコーレプリカをY^_FG,f(k,i)を生成し(s22)、出力する。
<時空間逆FFT変換部31及び32>
時空間逆FFT変換部31は、P×(F+1)個の波数領域のエコーレプリカY^_BG,f(k,i)を受け取り(ただしf≦F)、時間領域に変換し(s13)、時間領域のエコーレプリカy^BG(p,i)を出力する。例えば、空間逆フーリエ変換部214及び多CH短時間逆フーリエ変換部215と同様の方法により波数領域のエコーレプリカY^_BG,f(k,i)を時間領域のエコーレプリカy^BG(p,i)に変換する。
時空間逆FFT変換部31は、P×(F+1)個の波数領域のエコーレプリカY^_BG,f(k,i)を受け取り(ただしf≦F)、時間領域に変換し(s13)、時間領域のエコーレプリカy^BG(p,i)を出力する。例えば、空間逆フーリエ変換部214及び多CH短時間逆フーリエ変換部215と同様の方法により波数領域のエコーレプリカY^_BG,f(k,i)を時間領域のエコーレプリカy^BG(p,i)に変換する。
同様に、時空間逆FFT変換部32は、P×(F+1)個の波数領域のエコーレプリカY^_FG,f(k,i)を受け取り(ただしf≦F)、時間領域に変換し(s23)、時間領域のエコーレプリカy^FG(p,i)を出力する。
なお、s1の周波数領域から波数領域への空間フーリエ変換換について、式(3)では各周波数fにおけるPチャネルの信号を対象としてP(=2Kまたは2K+1)点FFTを用いている。この場合、時空間FFT変換部10の入力から時空間逆FFT変換部31または32の出力までは巡回畳み込みの処理と見ることができる。よって、第一実施形態の変形例で説明した場合と同様に、Pチャネルの空間信号を周期信号として扱う際に生じる悪影響を低減するために、2P点フーリエ変換を適用してもよい。
<減算部41p及び42p>
減算部41pは、時間領域のエコーレプリカy^BG(p,i)と時間領域の収音信号y(p,n)とを受け取り、収音信号y(p,n)からエコーレプリカy^BG(p,i)を減算し、BG誤差信号eBG(p,i)を求め(s14)、時空間FFT変換部51に出力する。例えば、F個の収音信号y(p,n−F+1),y(p,n−F+2),…,y(p,n)を蓄積し、収音信号y(p,i)=[y(p,n−F+1),y(p,n−F+2),…,y(p,n)]とし、BG誤差信号eBG(p,i)を次式により求める。
減算部41pは、時間領域のエコーレプリカy^BG(p,i)と時間領域の収音信号y(p,n)とを受け取り、収音信号y(p,n)からエコーレプリカy^BG(p,i)を減算し、BG誤差信号eBG(p,i)を求め(s14)、時空間FFT変換部51に出力する。例えば、F個の収音信号y(p,n−F+1),y(p,n−F+2),…,y(p,n)を蓄積し、収音信号y(p,i)=[y(p,n−F+1),y(p,n−F+2),…,y(p,n)]とし、BG誤差信号eBG(p,i)を次式により求める。
同様に、減算部42pは、収音信号y(p,n)からエコーレプリカy^FG(p,i)を減算し、FG誤差信号eFG(p,i)を求め(s24)、時空間FFT変換部52及びフレーム合成部80pに出力する。
<時空間FFT変換部51及び52>
時空間FFT変換部51は、P個の時間領域のBG誤差信号eBG(p,i)を受け取り、波数領域に変換し(s15)、波数領域のBG誤差信号E_BG,f(k,i)を転送判定部60に出力する。
時空間FFT変換部51は、P個の時間領域のBG誤差信号eBG(p,i)を受け取り、波数領域に変換し(s15)、波数領域のBG誤差信号E_BG,f(k,i)を転送判定部60に出力する。
例えば、まず、時空間FFT変換部51は、時間領域のBG誤差信号eBG(p,i)に0詰めをして、周波数領域に変換する。
次に、時空間FFT変換部51は、周波数領域のBG誤差信号EBG(p,i)を波数領域に変換する。
時空間FFT変換部52も、同様に時間領域のBG誤差信号eBG(p,i)を受け取り、波数領域に変換し(s25)、波数領域のBG誤差信号EBG,f(k,i)を転送判定部60に出力する。
<エコー経路推定部70>
エコー経路推定部70は、P×(F+1)個の波数領域の再生信号X_GR,f(k,i)と波数領域のBG誤差信号E_BG,f(k,i)とを受け取り、この値を用いて、BG波数領域エコーレプリカ生成部21内にある適応フィルタのフィルタ係数H_BG,f(k,k+dk,i+1)を求め(s44)、BG波数領域エコーレプリカ生成部21に出力する。
エコー経路推定部70は、P×(F+1)個の波数領域の再生信号X_GR,f(k,i)と波数領域のBG誤差信号E_BG,f(k,i)とを受け取り、この値を用いて、BG波数領域エコーレプリカ生成部21内にある適応フィルタのフィルタ係数H_BG,f(k,k+dk,i+1)を求め(s44)、BG波数領域エコーレプリカ生成部21に出力する。
まず、エコー経路推定部70は、フィルタ係数H_BG,f(k,k+dk,i)の修正量dH_BG,f(k,k+dk,i)を求める。例えば、周波数f(f≦F+1)、波数k(−K+1≦k≦K)の修正量dH_BG,f(k,k+dk,i)を次式により求める。
ただし、−δ≦dk≦δである。右辺分母中のZ_f(k,i)は修正量dH_BG,f(k,k+dk,i)を補正しており,次式により計算される値である。
つまり、Z_f(k,i)は,周波数成分ごとの第k−δ〜k+δの再生信号のパワーの総和である。また、式(33)のρは、分母が0になることを防止するための微小な正定数である。式(34)のβはパワー計算で短時間平均をとるための平滑化定数であり,0〜1の値をとる。
次に、エコー経路推定部70は、次式でBG波数領域エコーレプリカ生成部21内にある適応フィルタのフィルタ係数H_BG,f(k,k+dk,i)を更新し、BG波数領域エコーレプリカ生成部21に出力する。
ただし、μは0〜1の値をとるステップサイズである。なお、エコー経路推定部70では、修正量dH_BG,f(k,k+dk,i)だけを計算し、更新処理(式(35)の処理)はBG波数領域エコーレプリカ生成部21内で行ってもよい。
<転送判定部60>
転送判定部60は、P×(F+1)個の波数領域の再生信号X_GR,f(k,i)と波数領域のBG誤差信号E_BG,f(k,i)と波数領域のFG誤差信号E_FG,f(k,i)と波数領域の収音信号Y_f(k,i)とを受け取り、各周波数fの各波数kについて、BG誤差信号E_BG,f(k,i)とFG誤差信号E_FG,f(k,i)とを比較し、BG誤差信号E_BG,f(k,i)のほうがFG誤差信号E_FG,f(k,i)よりもエコーが消去されているか否かを判定する(s41)。例えば、周波数f(f≦F+1)、波数k(−K+1≦k≦K)において、「下記(A)(B)(C)の条件を同時に満たすか」否かを判定する(s41)。
(A)再生信号X_GR,f(k,i)が所定レベルT1より大きい、
(B)BG誤差信号E_BG,f(k,i)が収音信号Y_f(k,i)+所定レベルT2より小さい、
(C)BG誤差信号E_BG,f(k,i)がFG誤差信号E_FG,f(k,i)+所定レベルT3より小さい、
この条件の一具体例としては、
転送判定部60は、P×(F+1)個の波数領域の再生信号X_GR,f(k,i)と波数領域のBG誤差信号E_BG,f(k,i)と波数領域のFG誤差信号E_FG,f(k,i)と波数領域の収音信号Y_f(k,i)とを受け取り、各周波数fの各波数kについて、BG誤差信号E_BG,f(k,i)とFG誤差信号E_FG,f(k,i)とを比較し、BG誤差信号E_BG,f(k,i)のほうがFG誤差信号E_FG,f(k,i)よりもエコーが消去されているか否かを判定する(s41)。例えば、周波数f(f≦F+1)、波数k(−K+1≦k≦K)において、「下記(A)(B)(C)の条件を同時に満たすか」否かを判定する(s41)。
(A)再生信号X_GR,f(k,i)が所定レベルT1より大きい、
(B)BG誤差信号E_BG,f(k,i)が収音信号Y_f(k,i)+所定レベルT2より小さい、
(C)BG誤差信号E_BG,f(k,i)がFG誤差信号E_FG,f(k,i)+所定レベルT3より小さい、
この条件の一具体例としては、
等が考えられる。ただしE[*]は短時間平均をとることを意味する。
(A)〜(C)を満たす場合には、BG誤差信号E_BG,f(k,i)のほうがFG誤差信号E_FG,f(k,i)よりもエコーが消去されていると判定し、その際の周波数f’及び波数k’に対応するフィルタ係数H_BG,f’(k’,k’+dk,i)(ただし、−δ≦dk≦δ)をFG波数領域エコーレプリカ生成部22に転送するように、制御信号c(i)をBG波数領域エコーレプリカ生成部21に出力する(s42)。
なお、本実施形態の変形例として、信号の短時間平均E[*]の代わりに、所定の時間ピーク値を保持するピークホールドPh[*]を用いてもよい。
例えば、次式によりピークホールドを求める。
ここで、βは減衰定数(0<β<1)であり、max[a,b]はaとbの大きい方の値を出力する関数である。maxは、β×Ph[X_GR,f(k,i−1)](一時点前のピーク値)と直近の値X_GR,f(k,i)を比較する。直近の値X_GR,f(k,i)が小さい場合、βで減衰したピーク値が出力される。減衰定数βの値が1に近いほどピークを保持する期間が長くなる。なお、上記では値の絶対値ノルムを使用しているが、2乗ノルムを使用してもよい。
なお収音信号に小さくない外乱が含まれる場合、エコー経路推定部70によるフィルタ更新でフィルタ係数が劣化してしまうことがある。劣化のためにBG誤差信号がFG誤差信号よりも明らかに大きい状況では、FG波数領域エコーレプリカ生成部22からBG波数領域エコーレプリカ生成部21へフィルタ係数を転送してもよい。この状況は、「下記(A)(B’)(C’)の条件を同時に満たすか」を判定することで検出できる。
(A)再生信号X_GR,f(k,i)が所定レベルT1より大きい、
(B’)BG誤差信号E_BG,f(k,i)が収音信号Y_f(k,i)+所定レベルT12より大きい、
(C’)BG誤差信号E_BG,f(k,i)がFG誤差信号E_FG,f(k,i)+所定レベルT13より大きい、
この条件の一具体例としては、
(A)再生信号X_GR,f(k,i)が所定レベルT1より大きい、
(B’)BG誤差信号E_BG,f(k,i)が収音信号Y_f(k,i)+所定レベルT12より大きい、
(C’)BG誤差信号E_BG,f(k,i)がFG誤差信号E_FG,f(k,i)+所定レベルT13より大きい、
この条件の一具体例としては、
等が考えられる。
(A)、(B’),(C’)を満たす場合には、転送判定部60は、外乱によりフィルタ係数が劣化していると判定し、その際の周波数f’及び波数k’に対応するフィルタ係数H_FG,f’(k’,k’+dk,i)(ただし、−δ≦dk≦δ)をBG波数領域エコーレプリカ生成部21に転送するように、制御信号c’(i)をFG波数領域エコーレプリカ生成部22に出力する。
<フレーム合成部80p>
フレーム合成部80pは、時間領域のFG誤差信号eFG(p,i)を受け取り、そのFG誤差信号eFG(p,i)を合成し(s43)、合成した信号をエコー消去部100の出力値として出力する。例えば、時空間FFT変換部10において、再生信号xGR(p,n)をD≧2でフレーム化した場合には、フレーム合成部80pは、フレームiで求めたFG誤差信号eFG(p,i)と一つ前のフレームi−1で求めたFG誤差信号eFG(p,i−1)とに対して窓かけ処理を行った上で、合成し、合成後の収音信号yD(p,i)(要素数はF/D個)の要素yD(p,n−F/D+1),yD(p,n−F/D+2),…,yD(p,n)を逐次、出力値として出力する。ただし、n=iF/Dの関係にある。
フレーム合成部80pは、時間領域のFG誤差信号eFG(p,i)を受け取り、そのFG誤差信号eFG(p,i)を合成し(s43)、合成した信号をエコー消去部100の出力値として出力する。例えば、時空間FFT変換部10において、再生信号xGR(p,n)をD≧2でフレーム化した場合には、フレーム合成部80pは、フレームiで求めたFG誤差信号eFG(p,i)と一つ前のフレームi−1で求めたFG誤差信号eFG(p,i−1)とに対して窓かけ処理を行った上で、合成し、合成後の収音信号yD(p,i)(要素数はF/D個)の要素yD(p,n−F/D+1),yD(p,n−F/D+2),…,yD(p,n)を逐次、出力値として出力する。ただし、n=iF/Dの関係にある。
このような構成により、波数領域において、FG/BG方式を適用できる。波数領域においてFG適応フィルタとBG適応フィルタを備えるエコー消去法では、再生信号及び誤差信号を波数領域に変換し、波数領域において転送条件を判定する。これにより、波数領域の適応フィルタのように、フィルタ係数と送話チャネルの対応が1対1に対応しない場合でも、FG/BG方式を適用し、ダブルトーク状態に対して安定的にエコー消去を行うことが可能になる。
なお、多CH短時間フーリエ変換部221及び空間フーリエ変換部222は、それぞれ、収音信号y(p,n)及びY(p,i)に代えて、エコー成分を消去した収音信号yD(p,n)及びYD(p,i)を受け取り、各処理行い(s221、s222)、収音信号YD(p,i)及びY_D,f(k,i)を出力する。
<波数領域残留エコー推定消去部523>
波数領域残留エコー推定消去部523は、P×2F個の波数領域の再生信号X_GR,f(k,i)と、P×2F個の波数領域の収音信号Y_D,f(k,i)とを受け取り、これらの値を用いて、f≦Fにおいて、収音信号Y_D,f(k,i)に含まれる残留エコーを推定し、消去し(s523)、残留エコーを消去したP×(F+1)個の波数領域の収音信号Y_DS,f(p,i)を求め、ノイズ抑圧部230に出力する。なお、下付添え字DSは、エコー成分及び残留エコー成分を消去した信号であることを示す。以下、処理の詳細を説明する。
波数領域残留エコー推定消去部523は、P×2F個の波数領域の再生信号X_GR,f(k,i)と、P×2F個の波数領域の収音信号Y_D,f(k,i)とを受け取り、これらの値を用いて、f≦Fにおいて、収音信号Y_D,f(k,i)に含まれる残留エコーを推定し、消去し(s523)、残留エコーを消去したP×(F+1)個の波数領域の収音信号Y_DS,f(p,i)を求め、ノイズ抑圧部230に出力する。なお、下付添え字DSは、エコー成分及び残留エコー成分を消去した信号であることを示す。以下、処理の詳細を説明する。
図19は波数領域残留エコー推定消去部523の機能ブロック図を、図20はその処理フローを示す。
波数領域残留エコー推定消去部523は、入出力相関係数算出部5231と、入出力伝達特性推定部5232と、残留エコー推定部5233と、残留エコー補正部5234と減算部5235とを含む。
((入出力相関係数算出部5231))
入出力相関係数算出部5231は、P×2F個の波数領域の再生信号X_GR,f(k,i)とP×2F個の波数領域の収音信号Y_D,f(k,i)とを受け取り、f≦Fにおいて、波数領域の残留エコー信号を出力とする系の伝達特性を推定するために、時刻n=iF/Dにおける波数領域の再生信号X_GR,f(k,i)と波数領域の収音信号Y_D,f(k,i)とから
Pf(k,i)=E[X_* f(k,i)X_GR,f(k,i)]
Qf(k,i)=E[X_* f(k,i)Y_D,f(k,i)] (41)
により、再生信号のパワースペクトルPf(k,i)と、再生信号と収音信号との間のクロススペクトルQf(k,i)とを算出し(s5231)、入出力伝達特性推定部5232に出力する。
入出力相関係数算出部5231は、P×2F個の波数領域の再生信号X_GR,f(k,i)とP×2F個の波数領域の収音信号Y_D,f(k,i)とを受け取り、f≦Fにおいて、波数領域の残留エコー信号を出力とする系の伝達特性を推定するために、時刻n=iF/Dにおける波数領域の再生信号X_GR,f(k,i)と波数領域の収音信号Y_D,f(k,i)とから
Pf(k,i)=E[X_* f(k,i)X_GR,f(k,i)]
Qf(k,i)=E[X_* f(k,i)Y_D,f(k,i)] (41)
により、再生信号のパワースペクトルPf(k,i)と、再生信号と収音信号との間のクロススペクトルQf(k,i)とを算出し(s5231)、入出力伝達特性推定部5232に出力する。
((入出力伝達特性推定部5232))
入出力伝達特性推定部5232は、P×(F+1)個のパワースペクトルPf(k,i)とP×(F+1)個のクロススペクトルQf(k,i)とを受け取り、f(f≦F)において、パワースペクトルPf(k,i)及びクロススペクトルQf(k,i)から
入出力伝達特性推定部5232は、P×(F+1)個のパワースペクトルPf(k,i)とP×(F+1)個のクロススペクトルQf(k,i)とを受け取り、f(f≦F)において、パワースペクトルPf(k,i)及びクロススペクトルQf(k,i)から
により、再生信号と収音信号との入出力伝達特性を推定し(s5232)、推定値G’f(k,i)を残留エコー推定部5233に出力する。
また、次式により推定値G’f(k,i)を平滑化し、平滑化した推定値Gf(k,i)を残留エコー推定部5233に出力してもよい。
本実施形態では、平滑化した推定値Gf(k,i)を出力するものとする。ここで、βは、入出力伝達特性の推定値を平滑化するための定数であり、0〜1の間の値をとる。
((残留エコー推定部5233))
残留エコー推定部5233は、P×(F+1)個の波数領域の再生信号X_GR,f(k,i)と、P×(F+1)個の推定値Gf(k,i)とを受け取り、f(f≦F)において、次式のように、再生信号X_GR,f(k,i)に推定値Gf(k,i)を乗じて、残留エコーを推定し(s5233)、推定値ΔY_f(k,i)を残留エコー補正部5234に出力する。
ΔY_f(k,i)=Gf(k,i)X_GR,f(k,i) (43)
残留エコー推定部5233は、P×(F+1)個の波数領域の再生信号X_GR,f(k,i)と、P×(F+1)個の推定値Gf(k,i)とを受け取り、f(f≦F)において、次式のように、再生信号X_GR,f(k,i)に推定値Gf(k,i)を乗じて、残留エコーを推定し(s5233)、推定値ΔY_f(k,i)を残留エコー補正部5234に出力する。
ΔY_f(k,i)=Gf(k,i)X_GR,f(k,i) (43)
((残留エコー補正部5234))
残留エコー補正部5234は、P×(F+1)個の推定値ΔY_f(k,i)と、P×(F+1)個の波数領域の収音信号Y_D,f(k,i)とを受け取り、f(f≦F)において、次式で補正し(s5234)、補正後の残留エコーの推定値ΔYII_f(k,i)を減算部5235に出力する。
残留エコー補正部5234は、P×(F+1)個の推定値ΔY_f(k,i)と、P×(F+1)個の波数領域の収音信号Y_D,f(k,i)とを受け取り、f(f≦F)において、次式で補正し(s5234)、補正後の残留エコーの推定値ΔYII_f(k,i)を減算部5235に出力する。
ただし、式中のS_f(k,i)は、送話信号の推定値であり、次式により算出される。
S_f(k,i)=Y_D,f(k,i)-ΔY_f(k,i) (45)
また、Tは各スペクトルの推定の自由度の数であり、入出力相関係数算出部5231においてパワースペクトルPf(k,i)及びクロススペクトルQf(k,i)を算出するときのフレーム数(つまり、各スペクトル推定に使用するフレーム数)が、これにあたる。
Mは入力変数の数であり、式(42)の場合にはM=1になる。またF2M,T−2M,alphaは、自由度n1=2M、n2=T−2MのF分布の100×alpha百分比点である。
S_f(k,i)=Y_D,f(k,i)-ΔY_f(k,i) (45)
また、Tは各スペクトルの推定の自由度の数であり、入出力相関係数算出部5231においてパワースペクトルPf(k,i)及びクロススペクトルQf(k,i)を算出するときのフレーム数(つまり、各スペクトル推定に使用するフレーム数)が、これにあたる。
Mは入力変数の数であり、式(42)の場合にはM=1になる。またF2M,T−2M,alphaは、自由度n1=2M、n2=T−2MのF分布の100×alpha百分比点である。
なお、F分布は、統計学で用いられる連続確率分布である。統計的仮説検定の一手法である分散分析において、観測データにおける変動を誤差変動と各要因の変動に分解し、各要因の効果・有意性を判定する際に使用される。
参考文献4によれば、M=1のとき入出力伝達特性推定部5232において推定される入出力伝達特性の推定値Gf(k,i)の信頼区間は、真値からの比率で
の幅を持つ。
(参考文献4)J.S.ベンダット、A.G.ピアソル、「ランダムデータの統計的処理」、培風館、1976年、p.194〜197
(参考文献4)J.S.ベンダット、A.G.ピアソル、「ランダムデータの統計的処理」、培風館、1976年、p.194〜197
短時間スペクトルに基づく入出力伝達特性推定部5232の推定では、本来よりも送話と残留エコーの相関性を高めに推定しやすく、伝達特性を高めに推定する傾向がある。このことに基づき、上記の補正は残留エコーの信頼区間の下端の値を残留エコーの補正値としている。
((減算部5235))
減算部5235は、P×2F個の波数領域の収音信号Y_D,f(k,i)と、P×(F+1)個の波数領域の補正後の残留エコーの推定値ΔYII_f(k,i)とを受け取り、f(f≦F)において、次式のように波数領域で収音信号Y_D,f(k,i)から残留エコーの推定値ΔYII_f(k,i)を差し引いて(s5235)、差分を、残留エコーを消去した波数領域の収音信号Y_DS,f(k,i)として求め、ノイズ抑圧部230に出力する。
Y_DS,f(k,i)=Y_D,f(k,i)-ΔYII_f(k,i) (47)
減算部5235は、P×2F個の波数領域の収音信号Y_D,f(k,i)と、P×(F+1)個の波数領域の補正後の残留エコーの推定値ΔYII_f(k,i)とを受け取り、f(f≦F)において、次式のように波数領域で収音信号Y_D,f(k,i)から残留エコーの推定値ΔYII_f(k,i)を差し引いて(s5235)、差分を、残留エコーを消去した波数領域の収音信号Y_DS,f(k,i)として求め、ノイズ抑圧部230に出力する。
Y_DS,f(k,i)=Y_D,f(k,i)-ΔYII_f(k,i) (47)
このような構成により、波数領域の再生信号X_GR,f(k,i)と波数領域の収音信号Y_D,f(k,i)とから波数領域で残留エコーを推定し、収音信号Y_D,f(k,i)から残留エコーの推定値ΔY_f(k,i)を差し引く。これにより、波数領域の適応フィルタによるエコー経路推定及び消去が十分でない状態であっても、会話状態によらずに迅速に残留エコーを低減することができるという効果を奏する。
<ノイズ抑圧部230>
ノイズ抑圧部230は、P×(F+1)個の波数領域の収音信号Y_DS,f(k,i)を受け取り(ただし、f≦F)、周波数−波数空間で分割された各収音信号Y_DS,f(k,i)に対してノイズ抑圧処理を施し(s215)、波数領域のノイズ抑圧処理済みの収音信号Y_DSN,f(k,i)を減衰ゲイン適用部227に出力する。なお、下付添え字DSNは、エコー成分及び残留エコー成分を消去し、減衰ゲインを適用した信号であることを示す。図21は、ノイズ抑圧部230の機能ブロック図を、図22はその処理フローを示す。ノイズ抑圧部230は、ノイズレベル推定部2157及びノイズ抑圧ゲイン算出適用部2158を含む。
ノイズ抑圧部230は、P×(F+1)個の波数領域の収音信号Y_DS,f(k,i)を受け取り(ただし、f≦F)、周波数−波数空間で分割された各収音信号Y_DS,f(k,i)に対してノイズ抑圧処理を施し(s215)、波数領域のノイズ抑圧処理済みの収音信号Y_DSN,f(k,i)を減衰ゲイン適用部227に出力する。なお、下付添え字DSNは、エコー成分及び残留エコー成分を消去し、減衰ゲインを適用した信号であることを示す。図21は、ノイズ抑圧部230の機能ブロック図を、図22はその処理フローを示す。ノイズ抑圧部230は、ノイズレベル推定部2157及びノイズ抑圧ゲイン算出適用部2158を含む。
(ノイズレベル推定部2157)
ノイズレベル推定部2157は、P×(F+1)個の波数領域の収音信号Y_DS,f(k,i)を受け取り、そのノイズレベルを推定し(s2157)、その推定値N_f(k,i)を出力する。その推定法としては参考文献5や参考文献6等に記載の方法を用いることができる。
(参考文献5)Rainer Martin, "Noise power spectral density estimation based on optimal smoothing and minimum statistics", IEEE Transactions on Speech and Audio Processing, 2001, Vol. 9, No. 5, pp. 504-512
(参考文献6)Mehrez Souden et al., "A new recursive approach for noise power spectral density tracking", 2012年, 日本音響学会秋季研究発表会講演論文集、pp.-741-742
ノイズレベル推定部2157は、P×(F+1)個の波数領域の収音信号Y_DS,f(k,i)を受け取り、そのノイズレベルを推定し(s2157)、その推定値N_f(k,i)を出力する。その推定法としては参考文献5や参考文献6等に記載の方法を用いることができる。
(参考文献5)Rainer Martin, "Noise power spectral density estimation based on optimal smoothing and minimum statistics", IEEE Transactions on Speech and Audio Processing, 2001, Vol. 9, No. 5, pp. 504-512
(参考文献6)Mehrez Souden et al., "A new recursive approach for noise power spectral density tracking", 2012年, 日本音響学会秋季研究発表会講演論文集、pp.-741-742
例えば、参考文献5をベースに以下の方法でノイズレベルを推定できる。周波数f、波数kの成分の振幅を
で求める。ただしαは0〜1の間の値をとる平滑化定数である。直近のTi個のフレームの振幅、Lev(f,k,i−Ti+1)〜Lev(f,k,i)を保持し、Ti個の振幅の最小値を求める。このTi個の振幅の最小値をフレーム番号iにおける周波数f、波数kでのノイズレベルの推定値N_f(k,i)とする。
(ノイズ抑圧ゲイン算出適用部2158)
ノイズ抑圧ゲイン算出適用部2158は、P個の波数領域の収音信号Y_DS,f(k,i)とP個のノイズレベルの推定値N_f(k,i)とを受け取り、これらの値からノイズ抑圧ゲインG_f(k,i)を求める(s2158A)。例えば、ノイズ抑圧ゲインG_f(k,i)として、波数領域の収音信号Y_DS,f(k,i)の振幅|Y_DS,f(k,i)|とノイズレベルの推定値N_f(k,i)とから、次式のように直接求められるレベル比を用いてもよい。
ノイズ抑圧ゲイン算出適用部2158は、P個の波数領域の収音信号Y_DS,f(k,i)とP個のノイズレベルの推定値N_f(k,i)とを受け取り、これらの値からノイズ抑圧ゲインG_f(k,i)を求める(s2158A)。例えば、ノイズ抑圧ゲインG_f(k,i)として、波数領域の収音信号Y_DS,f(k,i)の振幅|Y_DS,f(k,i)|とノイズレベルの推定値N_f(k,i)とから、次式のように直接求められるレベル比を用いてもよい。
また、例えば、参考文献7のようにこの比を平滑化してノイズ抑圧ゲインG_f(k,i)としてもよい。
(参考文献7)特開2005−348173号公報
(参考文献7)特開2005−348173号公報
例えば、平滑化前のノイズ抑圧ゲインをG_f’(k,i)とし、平滑化後のノイズ抑圧ゲインをG_f(k,i)とすると、平滑化処理の1例は、以下の式で表すことができる。
G_f(k,i)=Σh,j a(h)×G_j’(k,i)/Σh a(h)
この式は、インデックスjで示されるf番目の周波数帯域に隣接する平滑化前のノイズ抑圧ゲインG_f’(k,i)の平均値を求め、f番目の周波数帯域のノイズ抑圧ゲインG_f(k,i)とする平滑化処理を示す。和をとる際のhとjの総数は同数であり、またその総数は最も多くても周波数分析点数以下である。重み係数a(h)は、平滑化前のノイズ抑圧ゲインをG_f’(k,i)の断続性を緩和する。さらに、平滑化後のノイズ抑圧ゲインG_f(k,i)の強調化を行ってもよい。強調化処理は平滑化後のノイズ抑圧ゲインG_f(k,i)の値の大小によって、それぞれのゲイン係数を0もしくは1に近づける処理である。即ち、平滑化後のノイズ抑圧ゲインG_f(k,i)が大きく1に近い場合は、より1に近づけて対象成分をより通し易くし、平滑化後のノイズ抑圧ゲインG_f(k,i)が小さく0に近い場合は、より0に近づけて雑音成分をより大きく低減する様に平滑化後のノイズ抑圧ゲインG_f(k,i)を強調する。この強調化処理の具体的な1例を以下に式で示す。
G_f(k,i)がth1より大きい場合:
G_f(k,i)=th1×(G_f(k,i)/th1)v1
G_f(k,i)がth2より小さい場合:
G_f(k,i)=1-(1-th2){(1-G_f(k,i))/(1-th2)}v2
ここで、v1及びv2は1以上の整数とする。また、th1とth2は、th1≧th2の関係を満たす0以上1以下の整数である。ノイズ抑圧ゲインG_f(k,i)は0から1の範囲の値を持つので、th1より大きい場合、より1に近づき、th2より小さい場合、より0に近づく処理をこの式は実現する。
G_f(k,i)=Σh,j a(h)×G_j’(k,i)/Σh a(h)
この式は、インデックスjで示されるf番目の周波数帯域に隣接する平滑化前のノイズ抑圧ゲインG_f’(k,i)の平均値を求め、f番目の周波数帯域のノイズ抑圧ゲインG_f(k,i)とする平滑化処理を示す。和をとる際のhとjの総数は同数であり、またその総数は最も多くても周波数分析点数以下である。重み係数a(h)は、平滑化前のノイズ抑圧ゲインをG_f’(k,i)の断続性を緩和する。さらに、平滑化後のノイズ抑圧ゲインG_f(k,i)の強調化を行ってもよい。強調化処理は平滑化後のノイズ抑圧ゲインG_f(k,i)の値の大小によって、それぞれのゲイン係数を0もしくは1に近づける処理である。即ち、平滑化後のノイズ抑圧ゲインG_f(k,i)が大きく1に近い場合は、より1に近づけて対象成分をより通し易くし、平滑化後のノイズ抑圧ゲインG_f(k,i)が小さく0に近い場合は、より0に近づけて雑音成分をより大きく低減する様に平滑化後のノイズ抑圧ゲインG_f(k,i)を強調する。この強調化処理の具体的な1例を以下に式で示す。
G_f(k,i)がth1より大きい場合:
G_f(k,i)=th1×(G_f(k,i)/th1)v1
G_f(k,i)がth2より小さい場合:
G_f(k,i)=1-(1-th2){(1-G_f(k,i))/(1-th2)}v2
ここで、v1及びv2は1以上の整数とする。また、th1とth2は、th1≧th2の関係を満たす0以上1以下の整数である。ノイズ抑圧ゲインG_f(k,i)は0から1の範囲の値を持つので、th1より大きい場合、より1に近づき、th2より小さい場合、より0に近づく処理をこの式は実現する。
さらに、ノイズ抑圧ゲイン算出適用部2158は、次式のように、波数領域の収音信号Y_DS,f(k,i)にノイズ抑圧ゲインG_f(k,i)を適用し(ノイズ抑圧ゲインG_f(k,i)を乗じ)(s2158B)、波数領域のノイズ抑圧処理済みの収音信号Y_DSN,f(k,i)を求め、出力する。
ノイズ抑圧部230の効果を図23で説明する。単一話者のターゲット音声xを対象とし、同時に拡散性のノイズnがマイクロホンにより収音されるケースを考える。波数領域のPチャネルの再生信号Y_DS,f(p,i)は、方向毎に分解されている。変換後のターゲット音すなわち対象成分は特定の方向に集中して抽出される。拡散性ノイズは全方向の成分をもち、そのごく一部の特定方向に含まれる分が抽出される。したがって、この特定方向でSN比が良好になり、抑圧処理の歪みは大幅に小さくなる。この信号処理は波数領域で行われているため、ノイズ抑圧後の波面進行方向は抑圧前と同じであり、空間バランスの点で抑圧処理の影響をほとんど受けない。一方、その他の方向ではノイズ成分が大半を占め、非定常の音声成分が少なくなるため、ノイズレベル推定の精度が相対的に高くなり、ノイズが良好に抑圧される。
このような構成により生成した収音信号Y_DSN,f(p,i)を、減衰ゲイン適用部227で減衰し、波面再構成フィルタ223でフィルタリングし、減衰ゲイン適用後、かつ、フィルタリング後の収音信号Y_DSNGR,f(p,i)を対地のスピーカで再生することで、ノイズを抑圧しつつ、所望の音場を再現することができる。
減衰ゲイン制御部23は、収音信号Y_f(k,i)に代えて収音信号Y_DSN,f(p,i)を受け取り、波数領域の減衰ゲインG_X,f(k,i)及びG_Y,f(k,i)とを求め(s23)、それぞれ減衰ゲイン適用部217及び227に出力する。
減衰ゲイン適用部227は、収音信号Y_f(k,i)に代えて、収音信号Y_DSN,f(p,i)を受け取り、減衰ゲインG_Y,f(k,i)を適用し(s227)、減衰ゲイン適用後の収音信号Y_DSNG,f(k,i)を求め、波面再構成フィルタ223に出力する。
波面再構成フィルタ223は、収音信号Y_G,f(k,i)に代えて収音信号Y_DSNG,f(k,i)を受け取り、フィルタ係数R_Y,f(k)をかけることで、フィルタリングし(s223)、フィルタリング後の収音信号Y_DSNGR,f(k,i)を求め、空間逆フーリエ変換部224に出力する。
空間逆フーリエ変換部224は、収音信号Y_GR,f(k,i)に代えて収音信号Y_DSNGR,f(k,i)を受け取り、周波数領域の収音信号YDSNGR,f(p,i)に変換し(s224)、出力する。
多CH短時間逆フーリエ変換部225は、収音信号YGR,f(p,i)に代えて、YDSNGR,f(p,i)を受け取り、逆FFTし、時間領域の収音信号yDSNGR(p,i)に変換する(s225)。さらに、多CH短時間逆フーリエ変換部225は、時間領域の収音信号yDSNGR(p,i)を合成し、合成した信号の要素を逐次、出力値として出力する。
<効果>
このような構成により、第一実施形態の効果に加え、(1)、ダブルトーク状態に対して安定的にエコー消去を行うことが可能になり、(2)これにより、波数領域の適応フィルタによるエコー経路推定及び消去が十分でない状態であっても、会話状態によらずに迅速に残留エコーを低減することができ、(3)ノイズを抑圧しつつ、所望の音場を再現することができる。
このような構成により、第一実施形態の効果に加え、(1)、ダブルトーク状態に対して安定的にエコー消去を行うことが可能になり、(2)これにより、波数領域の適応フィルタによるエコー経路推定及び消去が十分でない状態であっても、会話状態によらずに迅速に残留エコーを低減することができ、(3)ノイズを抑圧しつつ、所望の音場を再現することができる。
なお、音声スイッチ装置300に入力される収音信号Y_f(k,i)についても同様に、エコー消去処理(s100)、残留エコー消去処理(s523)、ノイズ抑圧処理(s215)を行ったほうが、送話状態か受話状態かをより高い精度で判定できる。
また、音声スイッチ装置300は、前述の通り、少なくとも、減衰ゲイン適用部217及び227と、減衰ゲイン制御部23とを含めばよく、他の処理は別装置に再生信号、または、収音信号を他の装置に伝送して他の装置内で行ってもよい。
さらに、波数領域残留エコー推定消去部523は、エコー消去部100とともに用いてもよいし、単独で用いてもよい。エコー消去部100及びノイズ抑圧部230はそれぞれ単独で用いることができる。また、各部の処理の順番は異なってもよい。例えば、第二実施形態で説明したように先に波面再構成用のフィルタリング処理を行い、その後に、ノイズ抑圧を行い、減衰ゲイン制御処理、減衰ゲイン適用処理を行ってもよい。ただし、再生信号X_f(k,i)についても同様に、処理したものを用いることで、送話状態か受話状態かをより高い精度で判定できる。要は、同じ処理(エコー消去処理(s100)、残留エコー消去処理(s523)、ノイズ抑圧処理(s215)、波面再構成用のフィルタリング処理(s213、s223))を行った再生信号と収音信号を用いて判定することで、その精度を向上させることができる。
<第一変形例>
第三実施形態と異なる部分を中心に説明する。
第三実施形態と異なる部分を中心に説明する。
本変形例では、波を周波数−波数空間で見るとき、周波数が低いほど波の存在する範囲が狭いことを利用して、ノイズ抑圧処理の演算量を削減する。
参考文献8によれば、周波数−波数空間で見ると波の存在範囲は周波数に応じて限定される。
(参考文献8)T. Ajdler, L. Sbaiz, and M. Vetterli, "Dynamic measurement of room impulse responses using a moving microphone", The Journal of the Acoustical Society of America, 2007, vol. 122, issue 3, p. 1636-1645
(参考文献8)T. Ajdler, L. Sbaiz, and M. Vetterli, "Dynamic measurement of room impulse responses using a moving microphone", The Journal of the Acoustical Society of America, 2007, vol. 122, issue 3, p. 1636-1645
図24は、単一周波数波の平面波のサンプリングの様子を示す。マイクロホン素子列に角度αで入射する単一の周波数f0の平面波を考える。マイクロホン列をx軸にとると、tを時刻としてx軸上での音圧の時間変動p(x,t)は、
p(x,t)=ej(ω0t+φ0xcosα) (71)
になる。ただし、上付き添え字中のω0及びφ0はそれぞれω0及びφ0を表し、ω0及びφ0はそれぞれ周波数f0の角周波数及び波数を表し、音速をvelocとして、φ0は
φ0=ω0/veloc (72)
である。このx−t軸上の音圧を周波数−波数領域に変換すると
p(x,t)=ej(ω0t+φ0xcosα) (71)
になる。ただし、上付き添え字中のω0及びφ0はそれぞれω0及びφ0を表し、ω0及びφ0はそれぞれ周波数f0の角周波数及び波数を表し、音速をvelocとして、φ0は
φ0=ω0/veloc (72)
である。このx−t軸上の音圧を周波数−波数領域に変換すると
になる。時間−空間領域で単一の周波数の平面波は、周波数−波数領域では1点になる。
全周波数で同一の周波数成分を持ち、時間―空間で
であらわされる平面波は、周波数−波数領域では、
のように直線になる。入射の角度αは0〜180度の範囲をとるため、周波数−波数領域で見ると波の成分は、
の範囲に存在する。
実際のマイクロホン列によるサンプリングは離散的である。時間方向について、サンプリング周波数をfs、フレーム長を2F、2F点−FFTを使用し、空間方向について、P個のマイクロホンは直線上に等間隔に配列されているものとし、マイクロホン間隔をd、マイクロホン数を2KとしてK点−FFTを使用する。このとき、周波数の範囲は0〜fs/2であり、波数kの範囲は−π/d〜π/dである。
なお、このサンプリングにおける最大の周波数f=fs/2の波について、波数はπfs/velocになる。マイクロホン間隔dが十分小さくπ/dがこの値より大きいとき空間エリアシングは生じない。しかしマイクロホン間隔dが相対的に長いために、π/dがこの値より小さい場合に空間エリアシングが生じる。この様子を図25に示す。
第三実施形態では、全周波数及び全波数で処理を行っている。しかし上記の知見によれば、周波数−波数領域において信号成分の存在範囲は、音波の周波数が低いほど狭まっている。この信号成分の存在しない範囲で信号処理を省くことができ、その処理削減の効果は周波数が低いほど大きい。これが本変形例のポイントである。
<第一変形例に係る音声スイッチ装置300>
図26は第一変形例に係る音声スイッチ装置300の機能ブロック図を、図27はその処理フローを示す。音声スイッチ装置300は、多CH短時間フーリエ変換部211及び221と、空間フーリエ変換部212及び222と、減衰ゲイン適用部217及び227と、減衰ゲイン制御部23と、波面再構成フィルタ213及び223と、空間逆フーリエ変換部214及び224と、多CH短時間逆フーリエ変換部215及び225と、エコー消去部100と、波数領域残留エコー推定消去部523と、ノイズ抑圧部230とを含み、さらに、波数限定部218と波数0詰め部219及び229とを含む。
図26は第一変形例に係る音声スイッチ装置300の機能ブロック図を、図27はその処理フローを示す。音声スイッチ装置300は、多CH短時間フーリエ変換部211及び221と、空間フーリエ変換部212及び222と、減衰ゲイン適用部217及び227と、減衰ゲイン制御部23と、波面再構成フィルタ213及び223と、空間逆フーリエ変換部214及び224と、多CH短時間逆フーリエ変換部215及び225と、エコー消去部100と、波数領域残留エコー推定消去部523と、ノイズ抑圧部230とを含み、さらに、波数限定部218と波数0詰め部219及び229とを含む。
はじめに、波数限定部218において、周波数fから波数kの有効範囲を求める。波数限定部218は、減衰ゲイン適用部217及び227と、減衰ゲイン制御部23と、波面再構成フィルタ213及び223と、エコー消去部100と、波数領域残留エコー推定消去部523と、ノイズ抑圧部230の処理をこの波数kの範囲内に限定する。波数0詰め部219及び229は未処理の範囲に0を設定する。
上記処理のために、第一変形例に加える変更の詳細を以下に示す。
(波数限定部218)
波数限定部218は、周波数f≦Fにおいて、周波数f毎に波数kの有効範囲を算出し(s218)、この有効範囲を減衰ゲイン適用部217及び227と、減衰ゲイン制御部23と、波面再構成フィルタ213及び223と、エコー消去部100と、波数領域残留エコー推定消去部523と、ノイズ抑圧部230に出力する(ただし、図中各部への出力を省略する)。例えば、周波数fの一次関数で表す式(77)により波数kの上限max_k(f)を求める。
波数限定部218は、周波数f≦Fにおいて、周波数f毎に波数kの有効範囲を算出し(s218)、この有効範囲を減衰ゲイン適用部217及び227と、減衰ゲイン制御部23と、波面再構成フィルタ213及び223と、エコー消去部100と、波数領域残留エコー推定消去部523と、ノイズ抑圧部230に出力する(ただし、図中各部への出力を省略する)。例えば、周波数fの一次関数で表す式(77)により波数kの上限max_k(f)を求める。
ただし、ceil(A)は、Aを整数へ切り上げる関数である。また、fthはマイクロホン間隔dでのサンプリングするときに空間エリアシングが生じない最大周波数であり、次式で定義される。
なお、式(76)(77)は、波数kの範囲を周波数fの一次関数で表し、波数kの範囲の上限と下限は
で与えられるものであることを表している。言い換えると、式(77)は、音速velocとマイクロホン間隔dとサンプリング周波数fsとに基づき、周波数fに対する波数kの上限を求めている。
各部では、周波数f≦Fにおいて、波数限定部218が周波数fについて求めた波数kの有効範囲
-max_k(f)≦k≦max_k(f) (79)
で、各処理を行う。
-max_k(f)≦k≦max_k(f) (79)
で、各処理を行う。
なお、波数kの有効範囲を算出する際に、周波数fの一次関数を用いることは、一例であり、高周波領域に比べ低周波領域では波数の範囲が狭くなるように波数kの有効範囲を限定するものであれば他の方法により、有効範囲を算出してもよい。
また、波数限定部218における処理は、ノイズ抑圧処理を開始時、または開始前に一度行い、各部に上限max_k(f)を設定しておいてもよい。
(波数0詰め部219及び229)
波数0詰め部219は、波面再構成フィルタ213から(P−2・max_k(f))個の波数領域の再生信号X_GR,f(k,i)を受け取り(ただし、周波数f≦F、−max_k(f)≦k≦max_k(f))、有効範囲外の波数、すなわちk<−max_k(f)及びmax_k(f)<kの範囲で、波数領域の再生信号X_GR,f(k,i)を0とし(s219)、空間逆フーリエ変換部214に出力する。
波数0詰め部219は、波面再構成フィルタ213から(P−2・max_k(f))個の波数領域の再生信号X_GR,f(k,i)を受け取り(ただし、周波数f≦F、−max_k(f)≦k≦max_k(f))、有効範囲外の波数、すなわちk<−max_k(f)及びmax_k(f)<kの範囲で、波数領域の再生信号X_GR,f(k,i)を0とし(s219)、空間逆フーリエ変換部214に出力する。
同様に、波数0詰め部229は、波面再構成フィルタ223から波数領域の収音信号Y_GR,f(k,i)を受け取り、有効範囲外の波数の範囲で、波数領域の収音信号Y_GR,f(k,i)を0とし(s229)、空間逆フーリエ変換部224に出力する。
<効果>
このような構成により、第三実施形態と同様の効果を得ることができ、さらに、計算量を減らすことができるという効果を奏する。
このような構成により、第三実施形態と同様の効果を得ることができ、さらに、計算量を減らすことができるという効果を奏する。
さらに、波数限定部及び波数0詰め部をエコー消去部100内に設けてもよい。この場合、波数領域の処理(つまり、BG波数領域エコーレプリカ生成部21、FG波数領域エコーレプリカ生成部22、エコー経路推定部70、転送判定部60におけるそれぞれの処理s12、s22、s44、s41、s42)を有効範囲内に限定することができ、計算量を減らすことができる。
なお、本変形例と、第一実施形態や第二実施形態、それらの変形例とを組合せてもよい。
<第二変形例>
第三実施形態の転送判定部60において、転送条件としてさらに収音信号Yf(k,i)とエコーレプリカY^_f(k,i)の類似性を判定する条件を追加する。それは、
(D)エコーレプリカの大きさが収音信号の大きさと比較して、小さくない、
(E)所定期間のエコーレプリカと収音信号のコヒーレンスが高い、
の2条件からなる。
第三実施形態の転送判定部60において、転送条件としてさらに収音信号Yf(k,i)とエコーレプリカY^_f(k,i)の類似性を判定する条件を追加する。それは、
(D)エコーレプリカの大きさが収音信号の大きさと比較して、小さくない、
(E)所定期間のエコーレプリカと収音信号のコヒーレンスが高い、
の2条件からなる。
この条件の一例としては、
が考えられる。なおpar1の推奨値は0.5程度、par2の推奨値は0.5程度である。
この2条件は収音信号Yf(k,i)とエコーレプリカY^_f(k,i)の相互相関の強さを評価し、転送を相互相関が強いタイミングに限定する効果を持つ。そのため、ノイズや送話の影響が小さくないタイミングでの転送を効果的に防止でき、転送判定をより頑健にすることができる。
<第三変形例>
第三実施形態と異なる部分についてのみ説明する。波数領域残留エコー推定消去部523の処理(s523)において、残留エコーを補正しない構成としてもよい。この場合、波数領域残留エコー推定消去部523は、残留エコー補正部5234を含まず、減算部5235では、残留エコー推定部5233の出力値である残留エコーの推定値ΔY_f(k,i)を補正せずにそのまま用いる。
第三実施形態と異なる部分についてのみ説明する。波数領域残留エコー推定消去部523の処理(s523)において、残留エコーを補正しない構成としてもよい。この場合、波数領域残留エコー推定消去部523は、残留エコー補正部5234を含まず、減算部5235では、残留エコー推定部5233の出力値である残留エコーの推定値ΔY_f(k,i)を補正せずにそのまま用いる。
このような構成により、第三実施形態と同様の効果を得ることができ、計算量を削減することができる。ただし、伝達特性を高めに推定する可能性がある。
<第四変形例>
第三実施形態またはその第三変形例と異なる部分についてのみ説明する。
第三実施形態またはその第三変形例と異なる部分についてのみ説明する。
波数領域残留エコー推定消去部523の処理内容が、第三実施形態またはその第三変形例とは異なる。
<波数領域残留エコー推定消去部523>
波数領域残留エコー推定消去部523は、波数領域の収音信号Y_D,f(k,i)とFG波数領域エコーレプリカ生成部22で生成されたエコーレプリカY^_FG,f(k,i)の線形和として波数領域の残留エコーを推定する。
波数領域残留エコー推定消去部523は、波数領域の収音信号Y_D,f(k,i)とFG波数領域エコーレプリカ生成部22で生成されたエコーレプリカY^_FG,f(k,i)の線形和として波数領域の残留エコーを推定する。
図28は第四変形例に係る波数領域残留エコー推定消去部523の機能ブロック図を、図29はその処理フローを示す。
波数領域残留エコー推定消去部523は、線形和重み算出部5236と、線形和算出部5237と、減算部5235とを含む。なお、図示されていないが、FG波数領域エコーレプリカ生成部22の出力値であるエコーレプリカY^_FG,f(k,i)が、波数領域残留エコー推定消去部523に入力されるものとする。
((線形和重み算出部5236))
線形和重み算出部5236は、P×2F個の波数領域の再生信号X_GR,f(k,i)と、P×2F個の波数領域の収音信号Y_D,f(k,i)と、P×2F個の波数領域のエコーレプリカY^_FG,f(k,i)とを受け取り、f(f≦F)において、以下のように相互スペクトルを係数とする式を解いて線形和重みc’f,1(k,i)及びc’f,2(k,i)を算出する(s5236)。
線形和重み算出部5236は、P×2F個の波数領域の再生信号X_GR,f(k,i)と、P×2F個の波数領域の収音信号Y_D,f(k,i)と、P×2F個の波数領域のエコーレプリカY^_FG,f(k,i)とを受け取り、f(f≦F)において、以下のように相互スペクトルを係数とする式を解いて線形和重みc’f,1(k,i)及びc’f,2(k,i)を算出する(s5236)。
線形和重み算出部5236は、式(81)によって求めた線形和重みc’f,1(k,i)及びc’f,2(k,i)をそのまま線形和算出部5237に出力してもよいし、次式により平滑化した線形和重みcf,1(k,i)及びcf,2(k,i)を線形和算出部5237に出力してもよい。
本変形例では、平滑化した線形和重みcf,1(k,i)及びcf,2(k,i)を出力するものとする。
((線形和算出部5237))
線形和算出部5237は、P×(F+1)個の線形和重みcf,1(k,i)と、P×(F+1)個の線形和重みcf,2(k,i)と、P×2F個の波数領域の再生信号X_GR,f(k,i)と、P×2F個の波数領域のエコーレプリカY^_FG,f(k,i)とを受け取り、次式のように、f(f≦F)において、再生信号X_GR,f(k,i)とエコーレプリカY^_FG,f(k,i)との線形和Z^_f(k,i)を算出し(s5237)、この線形和Z^_f(k,i)を残留エコーの推定値ΔY_f(k,i)として減算部5235に出力する。
Z^_f(k,i)=X_GR,f(k,i)cf,1(k,i)+Y^_FG,f(k,i)cf,2(k,i) (83)
線形和算出部5237は、P×(F+1)個の線形和重みcf,1(k,i)と、P×(F+1)個の線形和重みcf,2(k,i)と、P×2F個の波数領域の再生信号X_GR,f(k,i)と、P×2F個の波数領域のエコーレプリカY^_FG,f(k,i)とを受け取り、次式のように、f(f≦F)において、再生信号X_GR,f(k,i)とエコーレプリカY^_FG,f(k,i)との線形和Z^_f(k,i)を算出し(s5237)、この線形和Z^_f(k,i)を残留エコーの推定値ΔY_f(k,i)として減算部5235に出力する。
Z^_f(k,i)=X_GR,f(k,i)cf,1(k,i)+Y^_FG,f(k,i)cf,2(k,i) (83)
(減算部5235)
減算部5235は、P×2F個の波数領域の収音信号Y_D,f(k,i)と、P×(F+1)個の波数領域の残留エコーの推定値ΔY_f(k,i)とを受け取り、f(f≦F)において、次式のように波数領域で収音信号Y_D,f(k,i)から波数領域の残留エコーの推定値ΔY_f(k,i)を差し引いて(s5235)、残留エコーを消去した波数領域の収音信号Y_DS,f(k,i)を求め、出力する。
Y_DS,f(k,i)=Y_D,f(k,i)-ΔY_f(k,i)
減算部5235は、P×2F個の波数領域の収音信号Y_D,f(k,i)と、P×(F+1)個の波数領域の残留エコーの推定値ΔY_f(k,i)とを受け取り、f(f≦F)において、次式のように波数領域で収音信号Y_D,f(k,i)から波数領域の残留エコーの推定値ΔY_f(k,i)を差し引いて(s5235)、残留エコーを消去した波数領域の収音信号Y_DS,f(k,i)を求め、出力する。
Y_DS,f(k,i)=Y_D,f(k,i)-ΔY_f(k,i)
<効果>
このような構成により、第三実施形態と同様の効果を得ることができる。本変形例では、第三実施形態に比べ計算量は増えるが、エコーレプリカを残留エコー推定に含めることで、フレーム長が部屋の残響時間と比較して大幅に短い場合でも、残留エコー消去性能の劣化を抑えることができる。
このような構成により、第三実施形態と同様の効果を得ることができる。本変形例では、第三実施形態に比べ計算量は増えるが、エコーレプリカを残留エコー推定に含めることで、フレーム長が部屋の残響時間と比較して大幅に短い場合でも、残留エコー消去性能の劣化を抑えることができる。
なお、第三実施形態またはその変形例と、第一〜第二実施形態またはその変形例とを組み合わせてもよい。
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の実施形態またはその変形例では、全周波数帯域において処理を行っているが、所望の音声処理性能を実現するために、各部、各装置において、対象とする周波数帯域を変更してもよい。例えば、エコー消去部100の処理は、計算量が大きいが、得られるエコー消去効果も大きい。一方、波数領域残留エコー推定消去部523の処理は、エコー消去部100と比べると計算量は小さいが、エコーを消去した場合と比べて、音声の明瞭性はそれほど変わらない。音声スイッチ装置300は、さらに計算量が小さいが、音声の明瞭性はそれほど変わらない。そのため、エコー消去部100の処理対象とする周波数帯域を300〜3400Hz程度に限定し、波数領域残留エコー推定消去部523の処理対象とする周波数帯域を300〜7500Hz程度に限定し、音声スイッチ装置300の処理対象とする周波数帯域を300〜22050Hz程度にする。このような構成とすることで、聴覚上大きな影響を与える周波数帯域においては十分にエコーを消去しつつ、広帯域においてエコーを低減し、全帯域において減衰ゲインを適用することができ、計算量を抑えつつ、音声の明瞭性を効率よく向上させることができる。
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の実施形態またはその変形例では、全周波数帯域において処理を行っているが、所望の音声処理性能を実現するために、各部、各装置において、対象とする周波数帯域を変更してもよい。例えば、エコー消去部100の処理は、計算量が大きいが、得られるエコー消去効果も大きい。一方、波数領域残留エコー推定消去部523の処理は、エコー消去部100と比べると計算量は小さいが、エコーを消去した場合と比べて、音声の明瞭性はそれほど変わらない。音声スイッチ装置300は、さらに計算量が小さいが、音声の明瞭性はそれほど変わらない。そのため、エコー消去部100の処理対象とする周波数帯域を300〜3400Hz程度に限定し、波数領域残留エコー推定消去部523の処理対象とする周波数帯域を300〜7500Hz程度に限定し、音声スイッチ装置300の処理対象とする周波数帯域を300〜22050Hz程度にする。このような構成とすることで、聴覚上大きな影響を与える周波数帯域においては十分にエコーを消去しつつ、広帯域においてエコーを低減し、全帯域において減衰ゲインを適用することができ、計算量を抑えつつ、音声の明瞭性を効率よく向上させることができる。
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
Claims (8)
- 複数の第一マイクロホンを設置した第一空間で取得した音波面を、複数の第二スピーカを設置した第二空間で再合成し、複数の第二マイクロホンを設置した前記第二空間で取得した音波面を、複数の第一スピーカを設置した前記第一空間で再合成するものとし、前記第二スピーカで再生される信号を再生信号とし、前記第二マイクロホンで収音される信号を収音信号とし、
波数領域の再生信号と波数領域の収音信号とから、周波数と波数との組合せ毎に、前記波数領域の再生信号と前記波数領域の収音信号とに対する減衰ゲインを算出する減衰ゲイン算出部と、
前記波数領域の再生信号に前記減衰ゲインを適用する第一減衰ゲイン適用部と、
前記波数領域の収音信号に前記減衰ゲインを適用する第二減衰ゲイン適用部とを含む、
音声スイッチ装置。 - 請求項1記載の音声スイッチ装置であって、
前記第一減衰ゲイン適用部は、前記第一空間で取得した音波面を、前記第二空間で再合成するためのフィルタリング処理を行う前の前記波数領域の再生信号に前記減衰ゲインを適用し、
前記第二減衰ゲイン適用部は、前記第二空間で取得した音波面を、前記第一空間で再合成するためのフィルタリング処理を行う前の前記波数領域の収音信号に前記減衰ゲインを適用する、
音声スイッチ装置。 - 請求項1記載の音声スイッチ装置であって、
前記第一減衰ゲイン適用部は、前記第一空間で取得した音波面を、前記第二空間で再合成するためのフィルタリング処理を行った後の前記波数領域の再生信号に前記減衰ゲインを適用し、
前記第二減衰ゲイン適用部は、前記第二空間で取得した音波面を、前記第一空間で再合成するためのフィルタリング処理を行った後の前記波数領域の収音信号に前記減衰ゲインを適用する、
音声スイッチ装置。 - 請求項1から請求項3の何れかに記載の音声スイッチ装置であって、
さらに、
波数領域の再生信号に第一フィルタ係数をかけて、波数領域の第一エコーレプリカを生成する第一エコーレプリカ生成部と、
波数領域の第一エコーレプリカを時間領域の第一エコーレプリカに変換する第一時空間領域逆変換部と、
時間領域の収音信号から時間領域の第一エコーレプリカを減算して第一誤差信号を求める第一エコーレプリカ減算部と、
波数領域の再生信号に第二フィルタ係数をかけて、波数領域の第二エコーレプリカを生成する第二エコーレプリカ生成部と、
波数領域の第二エコーレプリカを時間領域の第二エコーレプリカに変換する第二時空間領域逆変換部と、
時間領域の収音信号から時間領域の第二エコーレプリカを減算して第二誤差信号を求める第二エコーレプリカ減算部と、
時間領域の第一誤差信号を波数領域に変換する第二時空間領域変換部と、
波数領域の第一誤差信号と波数領域の再生信号とを用いて、前記第一エコーレプリカ生成部内のフィルタ係数を更新するエコー経路推定部と、
各周波数の各波数について、第一誤差信号と第二誤差信号とを比較し、第一誤差信号のほうが第二誤差信号よりもエコーが消去されていると判定したときに、前記第一エコーレプリカ生成部内のフィルタ係数を前記第二エコーレプリカ生成部に転送する転送判定部とを含む、
音声スイッチ装置。 - 請求項4に記載の音声スイッチ装置であって、
さらに、
波数領域の前記再生信号と波数領域の前記第二誤差信号とを用いて、波数領域の前記第二誤差信号に含まれる残留エコーを推定し、消去する波数領域残留エコー推定消去部とを含む、
音声スイッチ装置。 - 請求項1から請求項5の何れかに記載の音声スイッチ装置であって、
さらに、
周波数と波数との組合せ毎に、波数領域の収音信号のノイズレベルを推定するノイズレベル推定部と、
周波数と波数との組合せ毎に、波数領域の収音信号と、波数領域のノイズレベルの推定値との比に基づきノイズ抑圧ゲインを求め、波数領域の収音信号にノイズ抑圧ゲインを乗じ、波数領域のノイズ抑圧処理済みの収音信号を求めるノイズ抑圧ゲイン算出適用部とを含む、
音声スイッチ装置。 - 複数の第一マイクロホンを設置した第一空間で取得した音波面を、複数の第二スピーカを設置した第二空間で再合成し、複数の第二マイクロホンを設置した前記第二空間で取得した音波面を、複数の第一スピーカを設置した前記第一空間で再合成するものとし、前記第二スピーカで再生される信号を再生信号とし、前記第二マイクロホンで収音される信号を収音信号とし、
波数領域の再生信号と波数領域の収音信号とから、周波数と波数との組合せ毎に、前記波数領域の再生信号と前記波数領域の収音信号とに対する減衰ゲインを算出する減衰ゲイン算出ステップと、
前記波数領域の再生信号に前記減衰ゲインを適用する第一減衰ゲイン適用ステップと、
前記波数領域の収音信号に前記減衰ゲインを適用する第二減衰ゲイン適用ステップとを含む、
音声スイッチ方法。 - 請求項1から請求項6の何れかに記載の音声スイッチ装置として、コンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013144100A JP5762479B2 (ja) | 2013-07-10 | 2013-07-10 | 音声スイッチ装置、音声スイッチ方法、及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013144100A JP5762479B2 (ja) | 2013-07-10 | 2013-07-10 | 音声スイッチ装置、音声スイッチ方法、及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015019185A true JP2015019185A (ja) | 2015-01-29 |
JP5762479B2 JP5762479B2 (ja) | 2015-08-12 |
Family
ID=52439820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013144100A Expired - Fee Related JP5762479B2 (ja) | 2013-07-10 | 2013-07-10 | 音声スイッチ装置、音声スイッチ方法、及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5762479B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017154960A1 (ja) * | 2016-03-09 | 2017-09-14 | ヤマハ株式会社 | エコー低減装置、音声通信装置、エコー低減方法、及びエコー低減プログラム |
CN110057321A (zh) * | 2019-04-28 | 2019-07-26 | 西安理工大学 | 基于x-f-k变换快速实现频域解相的三维物体面形测量方法 |
JP2020519070A (ja) * | 2017-04-20 | 2020-06-25 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチチャネル干渉除去のための装置および方法 |
CN113596676A (zh) * | 2021-08-03 | 2021-11-02 | 肇庆市和佳电子有限公司 | 一种麦克风声场切换装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106094598B (zh) * | 2016-08-10 | 2018-12-14 | 广州奥迪威传感应用科技有限公司 | 声控开关控制方法、系统及声控开关 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11168791A (ja) * | 1997-09-04 | 1999-06-22 | Nokia Mobile Phones Ltd | 音声源を検出する装置及び方法 |
JP2004147069A (ja) * | 2002-10-24 | 2004-05-20 | Nippon Telegr & Teleph Corp <Ntt> | 音声スイッチ方法、音声スイッチ及び音声スイッチプログラム、そのプログラムを記録した記録媒体 |
JP2007151047A (ja) * | 2005-11-30 | 2007-06-14 | Nippon Telegr & Teleph Corp <Ntt> | 音声スイッチ方法、音声スイッチ装置、音声スイッチプログラム及びそのプログラムを記録した記録媒体 |
US20080019537A1 (en) * | 2004-10-26 | 2008-01-24 | Rajeev Nongpiur | Multi-channel periodic signal enhancement system |
JP2009509362A (ja) * | 2005-06-24 | 2009-03-05 | ネイダーランゼ、オルガニザティー、ボー、トゥーゲパストナトゥールウェテンシャッペルーク、オンダーツォーク、ティーエヌオー | 複数の音源によって放射される信号から音響信号を抽出するためのシステムおよび方法。 |
US20100260351A1 (en) * | 2009-04-10 | 2010-10-14 | Avaya Inc. | Speakerphone Feedback Attenuation |
JP2011254243A (ja) * | 2010-06-01 | 2011-12-15 | Nippon Telegr & Teleph Corp <Ntt> | 音場収音再生装置、方法及びプログラム |
-
2013
- 2013-07-10 JP JP2013144100A patent/JP5762479B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11168791A (ja) * | 1997-09-04 | 1999-06-22 | Nokia Mobile Phones Ltd | 音声源を検出する装置及び方法 |
JP2004147069A (ja) * | 2002-10-24 | 2004-05-20 | Nippon Telegr & Teleph Corp <Ntt> | 音声スイッチ方法、音声スイッチ及び音声スイッチプログラム、そのプログラムを記録した記録媒体 |
US20080019537A1 (en) * | 2004-10-26 | 2008-01-24 | Rajeev Nongpiur | Multi-channel periodic signal enhancement system |
JP2009509362A (ja) * | 2005-06-24 | 2009-03-05 | ネイダーランゼ、オルガニザティー、ボー、トゥーゲパストナトゥールウェテンシャッペルーク、オンダーツォーク、ティーエヌオー | 複数の音源によって放射される信号から音響信号を抽出するためのシステムおよび方法。 |
JP2007151047A (ja) * | 2005-11-30 | 2007-06-14 | Nippon Telegr & Teleph Corp <Ntt> | 音声スイッチ方法、音声スイッチ装置、音声スイッチプログラム及びそのプログラムを記録した記録媒体 |
US20100260351A1 (en) * | 2009-04-10 | 2010-10-14 | Avaya Inc. | Speakerphone Feedback Attenuation |
JP2011254243A (ja) * | 2010-06-01 | 2011-12-15 | Nippon Telegr & Teleph Corp <Ntt> | 音場収音再生装置、方法及びプログラム |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017154960A1 (ja) * | 2016-03-09 | 2017-09-14 | ヤマハ株式会社 | エコー低減装置、音声通信装置、エコー低減方法、及びエコー低減プログラム |
US20180332174A1 (en) * | 2016-03-09 | 2018-11-15 | Yamaha Corporation | Echo Reducer, Voice Communication Device, Method for Reducing Echo, and Recording Medium |
CN109155642A (zh) * | 2016-03-09 | 2019-01-04 | 雅马哈株式会社 | 回声降低装置、语音通信装置、回声降低方法及回声降低程序 |
US10827075B2 (en) | 2016-03-09 | 2020-11-03 | Yamaha Corporation | Echo reducer, voice communication device, method for reducing echo, and recording medium |
CN109155642B (zh) * | 2016-03-09 | 2022-03-15 | 雅马哈株式会社 | 回声降低装置、语音通信装置、回声降低方法及记录介质 |
JP2020519070A (ja) * | 2017-04-20 | 2020-06-25 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチチャネル干渉除去のための装置および方法 |
JP7003153B2 (ja) | 2017-04-20 | 2022-02-04 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチチャネル干渉除去のための装置および方法 |
CN110057321A (zh) * | 2019-04-28 | 2019-07-26 | 西安理工大学 | 基于x-f-k变换快速实现频域解相的三维物体面形测量方法 |
CN110057321B (zh) * | 2019-04-28 | 2021-01-15 | 西安理工大学 | 基于x-f-k变换快速实现频域解相的三维物体面形测量方法 |
CN113596676A (zh) * | 2021-08-03 | 2021-11-02 | 肇庆市和佳电子有限公司 | 一种麦克风声场切换装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5762479B2 (ja) | 2015-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109727604B (zh) | 用于语音识别前端的频域回声消除方法及计算机储存介质 | |
US9800734B2 (en) | Echo cancellation | |
EP3791565B1 (en) | Method and apparatus utilizing residual echo estimate information to derive secondary echo reduction parameters | |
US10979100B2 (en) | Audio signal processing with acoustic echo cancellation | |
US20130301840A1 (en) | Methods for processing audio signals and circuit arrangements therefor | |
US8682006B1 (en) | Noise suppression based on null coherence | |
JP5762479B2 (ja) | 音声スイッチ装置、音声スイッチ方法、及びそのプログラム | |
JP5391103B2 (ja) | 多チャネルエコー消去方法、多チャネルエコー消去装置、多チャネルエコー消去プログラム及びその記録媒体 | |
KR20130108063A (ko) | 다중 마이크로폰의 견고한 잡음 억제 | |
JP2004537219A (ja) | 高調波計算のための非線形エコーサプレッサを備えたエコーキャンセラ | |
EP4071757A1 (en) | Echo cancellation method and device | |
CN114121031A (zh) | 设备语音降噪、电子设备和存储介质 | |
JP5469564B2 (ja) | 多チャネルエコー消去方法、多チャネルエコー消去装置及びそのプログラム | |
KR20080000478A (ko) | 휴대 단말기에서 복수의 마이크들로 입력된 신호들의잡음을 제거하는 방법 및 장치 | |
KR101587844B1 (ko) | 마이크로폰의 신호 보상 장치 및 그 방법 | |
JP3756839B2 (ja) | 反響低減方法、反響低減装置、反響低減プログラム | |
JP5937451B2 (ja) | エコー消去装置、エコー消去方法及びプログラム | |
JP5774062B2 (ja) | エコー消去装置、エコー消去方法、及びそのプログラム | |
JP2003250193A (ja) | 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体 | |
CN112929506A (zh) | 音频信号的处理方法及装置,计算机存储介质及电子设备 | |
JP5826712B2 (ja) | マルチチャネルエコー消去装置、マルチチャネルエコー消去方法、およびプログラム | |
JP2006066988A (ja) | 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体 | |
Wang et al. | A frequency-domain nonlinear echo processing algorithm for high quality hands-free voice communication devices | |
JP6075783B2 (ja) | エコー消去装置、エコー消去方法及びプログラム | |
JP4504891B2 (ja) | 反響消去方法、反響消去装置、プログラム、記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150511 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150609 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5762479 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |