JP2015019184A - ノイズ抑圧装置、ノイズ抑圧方法、及びそのプログラム - Google Patents
ノイズ抑圧装置、ノイズ抑圧方法、及びそのプログラム Download PDFInfo
- Publication number
- JP2015019184A JP2015019184A JP2013144099A JP2013144099A JP2015019184A JP 2015019184 A JP2015019184 A JP 2015019184A JP 2013144099 A JP2013144099 A JP 2013144099A JP 2013144099 A JP2013144099 A JP 2013144099A JP 2015019184 A JP2015019184 A JP 2015019184A
- Authority
- JP
- Japan
- Prior art keywords
- noise suppression
- signal
- frequency
- domain
- wave number
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 66
- 238000004364 calculation method Methods 0.000 claims abstract description 19
- 230000001629 suppression Effects 0.000 claims description 139
- 230000005236 sound signal Effects 0.000 claims description 22
- 230000008569 process Effects 0.000 description 21
- 230000004048 modification Effects 0.000 description 15
- 238000012986 modification Methods 0.000 description 15
- 230000000694 effects Effects 0.000 description 11
- 238000009499 grossing Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000005070 sampling Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000009825 accumulation Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000012886 linear function Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000002411 adverse Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【課題】マルチチャネル信号処理におけるノイズ抑圧時に生じる歪みを従来よりも低減できるノイズ抑圧装置、ノイズ抑圧方法、及びそのプログラムを提供する。
【解決手段】ノイズ抑圧装置は、複数のマイクロホンを設置した地点で取得した音波面を、複数のスピーカを設置した地点で再合成するものとし、周波数と波数との組合せ毎に、波数領域の入力信号のノイズレベルを推定するノイズレベル推定部と、周波数と波数との組合せ毎に、波数領域の入力信号と、波数領域のノイズレベルの推定値との比に基づきノイズ抑圧ゲインを求め、波数領域の入力信号にノイズ抑圧ゲインを乗じ、波数領域のノイズ抑圧処理済みの出力信号を求めるノイズ抑圧ゲイン算出適用部とを含み、入力信号は複数のマイクロホンで収音する複数のチャネルの収音信号に対応する信号であり、出力信号は複数のスピーカで再生する複数のチャネルの再生信号に対応する信号である。
【選択図】図4
【解決手段】ノイズ抑圧装置は、複数のマイクロホンを設置した地点で取得した音波面を、複数のスピーカを設置した地点で再合成するものとし、周波数と波数との組合せ毎に、波数領域の入力信号のノイズレベルを推定するノイズレベル推定部と、周波数と波数との組合せ毎に、波数領域の入力信号と、波数領域のノイズレベルの推定値との比に基づきノイズ抑圧ゲインを求め、波数領域の入力信号にノイズ抑圧ゲインを乗じ、波数領域のノイズ抑圧処理済みの出力信号を求めるノイズ抑圧ゲイン算出適用部とを含み、入力信号は複数のマイクロホンで収音する複数のチャネルの収音信号に対応する信号であり、出力信号は複数のスピーカで再生する複数のチャネルの再生信号に対応する信号である。
【選択図】図4
Description
本発明は、マルチチャネル信号処理においてノイズを抑圧するノイズ抑圧装置、ノイズ抑圧方法、及びそのプログラムに関する。
音声会議装置やテレビ会議装置では、マイクロホンで収音された信号(以下、「収音信号」ともいう)に、通常ノイズ抑圧処理を適用している。特許文献1がノイズ抑圧の従来技術として知られている。
ノイズ抑圧処理の概要を、図1を用いて説明する。収音信号u(n)は、短時間フーリエ変換部111により、時間領域から周波数領域へ変換される。なお、nはサンプル及びそのサンプルに対応する時刻のインデックスを表す。周波数のインデックスをf、フレームのインデックスをiとし、周波数領域の収音信号をU(f,i)と表す。ここではF+1個の周波数帯域に分割されるとし、f=1,2,…,F+1である。特定周波数ノイズ抑圧部115f内では、ノイズレベル推定部1157において数秒〜数十秒間分の収音信号U(f,i)からノイズレベルN(f,i)を推定する。
そして、ノイズ抑圧ゲイン算出適用部1158では、ノイズレベルN(f,i)と収音信号U(f,i)の瞬時レベルとからノイズ抑圧ゲインG(f,i)を求める。ただし、0≦G(f,i)≦1となるように、ノイズ抑圧ゲインG(f,i)を求める。さらに、ノイズ抑圧ゲイン算出適用部1158は、収音信号U(f,i)にノイズ抑圧ゲインG(f,i)を乗じ、ノイズ抑圧処理を施した周波数領域の出力信号V(f,i)を出力する。短時間逆フーリエ変換部114では、F個の周波数領域の出力信号V(f,i)から、時間領域の出力信号v(n)を求める。この入力と出力のスペクトルの例を図2に示す。ノイズレベルN(f,i)が高精度に推定されていれば、出力信号V(f,i)のスペクトルはノイズを除いた本来のスペクトルに非常に近くなる。
マルチチャネル信号処理においてノイズを抑圧する場合、上記の1チャネル信号用のノイズ抑圧の構成をチャネル数分だけ用意して、チャネル毎にノイズ抑圧処理を行う方法が考えられる。
近年、マルチチャネル再生技術は、チャネル数拡大の方向へ、例えば、ステレオ再生から5.1チャネル再生へと進んでいる。さらに高い立体感で音が再生されるリスニングエリアを大幅に拡大する技術として、波面合成法(Wave Field Synthesis (以下「WFS」ともいう))の研究が進められている。WFSでは、数十以上のマイクロホン、数十以上のスピーカを用いて、ある地点での音波面を取得し、別の地点で再合成する。このようなWFS収音再生技術として、波面再構成フィルタが提案されている(参考文献1参照)。
(参考文献1)小山 翔一著、「音場再現技術における数理問題 : 波面合成・高次アンビソニックスの数理」、日本音響学会誌、2012年、Vol.68、No.11,pp.584−589.
(参考文献1)小山 翔一著、「音場再現技術における数理問題 : 波面合成・高次アンビソニックスの数理」、日本音響学会誌、2012年、Vol.68、No.11,pp.584−589.
このWFS収音再生において、ノイズ抑圧を行なうことを考える。従来法を適用した場合、各チャネルは独立にノイズ抑圧処理されるために、チャネル毎にノイズ抑圧の効果がばらついてしまう。そのため再生信号の左右のバランス(もしくは空間的なバランス)は本来のバランスとは異なる。再生信号のバランスと本来のバランスとの乖離が大きいときに受聴者の知覚する音像が揺らいでしまう。
チャネル毎にノイズ抑圧の効果がばらついてしまうのは、ノイズレベルの推定の精度が均一でないためである。ノイズレベルの推定では、ノイズ成分として定常的な信号を仮定し、対象成分としてノイズレベルの変動の大きい信号を仮定する。そして、対象成分とノイズ成分が混在した信号のみからノイズレベルを推定する。
しかし、実際の対象信号(収音信号に対応する信号)は完全に定常的ではなく非定常な成分も含むために、ノイズレベルの真値と推定値は完全には一致しない。そして、ノイズレベルが実際よりも大きく推定される場合、SN比が低いチャネルほど対象成分が相対的に大きく削られて歪みが大きくなる。
本発明は、マルチチャネル信号処理におけるノイズ抑圧時に生じる歪みとチャネルごとのばらつきを従来よりも低減できるノイズ抑圧装置、ノイズ抑圧方法、及びそのプログラムを提供することを目的とする。
上記の課題を解決するために、本発明の第一の態様によれば、ノイズ抑圧装置は、複数のマイクロホンを設置した地点で取得した音波面を、複数のスピーカを設置した地点で再合成するものとし、周波数と波数との組合せ毎に、波数領域の入力信号のノイズレベルを推定するノイズレベル推定部と、周波数と波数との組合せ毎に、波数領域の入力信号と、波数領域のノイズレベルの推定値との比に基づきノイズ抑圧ゲインを求め、波数領域の入力信号にノイズ抑圧ゲインを乗じ、波数領域のノイズ抑圧処理済みの出力信号を求めるノイズ抑圧ゲイン算出適用部とを含み、入力信号は複数のマイクロホンで収音する複数のチャネルの収音信号に対応する信号であり、出力信号は複数のスピーカで再生する複数のチャネルの再生信号に対応する信号である。
上記の課題を解決するために、本発明の第二の態様によれば、ノイズ抑圧方法は、複数のマイクロホンを設置した地点で取得した音波面を、複数のスピーカを設置した地点で再合成するものとし、周波数と波数との組合せ毎に、波数領域の入力信号のノイズレベルを推定するノイズレベル推定ステップと、周波数と波数との組合せ毎に、波数領域の入力信号と、波数領域のノイズレベルの推定値との比に基づきノイズ抑圧ゲインを求め、波数領域の入力信号にノイズ抑圧ゲインを乗じ、波数領域のノイズ抑圧処理済みの出力信号を求めるノイズ抑圧ゲイン算出適用ステップとを含み、入力信号は複数のマイクロホンで収音する複数のチャネルの収音信号に対応する信号であり、出力信号は複数のスピーカで再生する複数のチャネルの再生信号に対応する信号である。
本発明によれば、マルチチャネル信号処理におけるノイズ抑圧時に生じる歪みを従来よりも低減できる。
以下、本発明の実施形態について説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。また、テキスト中で使用する記号「_」は、本来直前の文字の真下に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。
<第一実施形態に係るノイズ抑圧装置200>
本実施形態では、チャネル毎ではなく、方向毎にノイズを抑圧する。
本実施形態では、チャネル毎ではなく、方向毎にノイズを抑圧する。
図3は第一実施形態に係るノイズ抑圧装置200の配置図を、図4は第一実施形態に係るノイズ抑圧装置200の機能ブロック図を、図5はその処理フローを示す。
P個のマイクロホンmpを用いて音場を収録する。ただし、p=1,2,…,Pである。ノイズ抑圧装置200は、P個のマイクロホンで収音されたPチャネルの収音信号u(p,n)を受け取り、ノイズ抑圧処理を施し、Pチャネルの出力信号v(p,n)を出力する。nは時刻を表す。
波面再構成フィルタ90は、Pチャネルの出力信号v(p,n)を受け取り、フィルタリングを行い、Pチャネルの再生信号y(p,n)を出力する。P個のスピーカspで再生信号y(p,n)を再生する。なお、波面再構成フィルタ90は、Pチャネルの収音信号u(p,n)に対応する信号(本実施形態では、Pチャネルの出力信号v(p,n))から、WFSにより、各スピーカspの再生信号に対応する信号(本実施形態では、Pチャネルの再生信号y(p,n))を得るものであればよく、例えば、参考文献1に記載の方法が考えられる。つまり、波面再構成フィルタ90は、ある地点(複数のマイクロホンを設置した地点)で取得した音波面を、別の地点(複数のスピーカを設置した地点)で再合成するように、複数のマイクロホンで収音した収音信号をフィルタリングし、複数のスピーカで再生する複数の再生信号を求めるためのフィルタである。なお、本実施形態のノイズ抑圧装置200は、チャネル毎ではなく、方向(波面、波数)毎にノイズを抑圧するため、WFSによる波面再構成フィルタとともに利用するときにのみその効果を生じる。
ノイズ抑圧装置200は、多CH短時間フーリエ変換部211、空間フーリエ変換部212、(F+1)個の特定周波数ノイズ抑圧部215f、空間逆フーリエ変換部213、多CH短時間逆フーリエ変換部214及びP個の合成部216pを含む。
<多CH短時間フーリエ変換部211>
多CH短時間フーリエ変換部211は、Pチャネルの時間領域の収音信号u(p,n)を受け取り、チャネルp毎に周波数領域の収音信号U(p,i)に変換し(s1)、空間フーリエ変換部212に出力する。ただし、iはフレーム番号を表す。なお、周波数領域変換の方法としては、高速フーリエ変換(Fast Fourier Transform;以下「FFT」ともいう)等が考えられる。
多CH短時間フーリエ変換部211は、Pチャネルの時間領域の収音信号u(p,n)を受け取り、チャネルp毎に周波数領域の収音信号U(p,i)に変換し(s1)、空間フーリエ変換部212に出力する。ただし、iはフレーム番号を表す。なお、周波数領域変換の方法としては、高速フーリエ変換(Fast Fourier Transform;以下「FFT」ともいう)等が考えられる。
まず、多CH短時間フーリエ変換部211は、収音信号u(p,n)をF/D個受け取る毎に(言い換えると、n=iF/Dの関係になる毎に)、2F個の収音信号u(p,n−2F+1),u(p,n−2F+2),…,u(p,n)を1フレーム分としてブロック化し、フレーム単位の収音信号u(p,i)を得る。ただし、Fは自然数であり、DはFを割り切る自然数である。例えば、
である。ただし、Tは転置を表す。以下、特に断りが無い限り、各信号を1フレーム=2Fサンプル(フレーム長)、シフト量F/Dサンプル(シフト幅)でブロック化する。FFT計算を簡略化・高速化するために、Fを2のべき乗にとることが多い。以下ではD≧2の場合を示す。
さらに、多CH短時間フーリエ変換部211は、フレーム単位の収音信号u(p,i)を、次式のように周波数領域の収音信号U(p,i)に変換する。
なお、収音信号U(p,i)を含め、周波数領域の各信号は短時間スペクトルにより表される。なお、fは周波数のインデックスを表し、f=0,1,…,2F−1である。信号のサンプリング周波数をfSとすると、Uf(p,i)はフレームiにおけるチャネルpの収音信号の周波数fSf/2F[Hz]の成分を表す。
<空間フーリエ変換部212>
空間フーリエ変換部212は、Pチャネルの周波数領域の収音信号U(p,i)=[U0(p,i) … Uf(p,i) … U2F-1(p,i)]を受け取り、以下の式(3)や(4)により、周波数f毎に波数領域の収音信号U_f(i)に変換し(s2)、波数領域の収音信号U_f(i)を特定周波数ノイズ抑圧部215fに出力する。ただし、ここでは、f=0,1,…,Fについて、波数領域の収音信号U_f(i)に変換する。F<f≦2F−1については、後述する空間逆フーリエ変換部213において説明する。また、kを波数のインデックス、Kを自然数とし、チャネル数Pが偶数でP=2Kのときk=−K+1,−K+2,…,−1,0,1,…,Kであり、チャネル数Pが奇数でP=2K+1のときk=−K,−K+1,…,−1,0,1,…,Kである。
(1)チャネル数Pが偶数でP=2Kのとき、
空間フーリエ変換部212は、Pチャネルの周波数領域の収音信号U(p,i)=[U0(p,i) … Uf(p,i) … U2F-1(p,i)]を受け取り、以下の式(3)や(4)により、周波数f毎に波数領域の収音信号U_f(i)に変換し(s2)、波数領域の収音信号U_f(i)を特定周波数ノイズ抑圧部215fに出力する。ただし、ここでは、f=0,1,…,Fについて、波数領域の収音信号U_f(i)に変換する。F<f≦2F−1については、後述する空間逆フーリエ変換部213において説明する。また、kを波数のインデックス、Kを自然数とし、チャネル数Pが偶数でP=2Kのときk=−K+1,−K+2,…,−1,0,1,…,Kであり、チャネル数Pが奇数でP=2K+1のときk=−K,−K+1,…,−1,0,1,…,Kである。
(1)チャネル数Pが偶数でP=2Kのとき、
である。
(2)チャネル数Pが奇数でP=2K+1のとき、
(2)チャネル数Pが奇数でP=2K+1のとき、
である。波数領域への変換は、2のべき乗の点数を持つFFTで高速に行うため、以下、チャネル数Pが偶数の場合(P=2K)について説明を進める。なお、収音信号U_f(k,i)を含め、波数領域の各信号は短時間スペクトルにより表される。この処理により、収音信号は、進行方向毎に分解される。以下のノイズ抑圧処理は、チャネル毎ではなく、方向毎に行われる。
なお、空間フーリエ変換部212は、特定方向にビームを持つマイクロホンアレーをP個並べていると考えることもできる。そして、後述する空間逆フーリエ変換部213により、信号が元のPチャネルの信号に戻ることから、このP個のマイクロホンアレーは逆変換を持つことが分かる。
<特定周波数ノイズ抑圧部215f>
特定周波数ノイズ抑圧部215fは、波数領域の収音信号U_f(i)=[U_f(0,i) … U_f(k,i) … U_f(K,i) U_f(−K,i) … U_f(−1,i)]を受け取り(ただし、f≦F)、周波数−波数空間で分割された各成分U_f(k,i)に対してノイズ抑圧処理を施し(s3)、波数領域のノイズ抑圧処理済みの出力信号V_f(k,i)を空間逆フーリエ変換部213に出力する。特定周波数ノイズ抑圧部215fは、ノイズレベル推定部2157及びノイズ抑圧ゲイン算出適用部2158を含む。
特定周波数ノイズ抑圧部215fは、波数領域の収音信号U_f(i)=[U_f(0,i) … U_f(k,i) … U_f(K,i) U_f(−K,i) … U_f(−1,i)]を受け取り(ただし、f≦F)、周波数−波数空間で分割された各成分U_f(k,i)に対してノイズ抑圧処理を施し(s3)、波数領域のノイズ抑圧処理済みの出力信号V_f(k,i)を空間逆フーリエ変換部213に出力する。特定周波数ノイズ抑圧部215fは、ノイズレベル推定部2157及びノイズ抑圧ゲイン算出適用部2158を含む。
(ノイズレベル推定部2157)
ノイズレベル推定部2157は、P個の波数領域の収音信号U_f(k,i)を受け取り、そのノイズレベルを推定し(s31)、その推定値N_f(k,i)を出力する。その推定法としては参考文献2や参考文献3等に記載の方法を用いることができる。
(参考文献2)Rainer Martin, "Noise power spectral density estimation based on optimal smoothing and minimum statistics", IEEE Transactions on Speech and Audio Processing, 2001, Vol. 9, No. 5, pp. 504-512
(参考文献3)Mehrez Souden et al., "A new recursive approach for noise power spectral density tracking", 2012年, 日本音響学会秋季研究発表会講演論文集、pp.-741-742
ノイズレベル推定部2157は、P個の波数領域の収音信号U_f(k,i)を受け取り、そのノイズレベルを推定し(s31)、その推定値N_f(k,i)を出力する。その推定法としては参考文献2や参考文献3等に記載の方法を用いることができる。
(参考文献2)Rainer Martin, "Noise power spectral density estimation based on optimal smoothing and minimum statistics", IEEE Transactions on Speech and Audio Processing, 2001, Vol. 9, No. 5, pp. 504-512
(参考文献3)Mehrez Souden et al., "A new recursive approach for noise power spectral density tracking", 2012年, 日本音響学会秋季研究発表会講演論文集、pp.-741-742
例えば、参考文献2をベースに以下の方法でノイズレベルを推定できる。周波数インデックスf、波数インデックスkの成分の振幅を
で求める。ただしαは0〜1の間の値をとる平滑化定数である。直近のTi個のフレームの振幅、Lev(f,k,i−Ti+1)〜Lev(f,k,i)を保持し、Ti個の振幅の最小値を求める。このTi個の振幅の最小値をフレーム番号iにおける周波数インデックスf、波数インデックスkでのノイズレベルの推定値N_f(k,i)とする。
(ノイズ抑圧ゲイン算出適用部2158)
ノイズ抑圧ゲイン算出適用部2158は、P個の波数領域の収音信号U_f(k,i)とP個のノイズレベルの推定値N_f(k,i)とを受け取り、これらの値からノイズ抑圧ゲインG_f(k,i)を求める(s32A)。例えば、ノイズ抑圧ゲインG_f(k,i)として、波数領域の収音信号U_f(k,i)の振幅|U_f(k,i)|とノイズレベルの推定値N_f(k,i)とから、次式のように直接求められるレベル比を用いてもよい。
ノイズ抑圧ゲイン算出適用部2158は、P個の波数領域の収音信号U_f(k,i)とP個のノイズレベルの推定値N_f(k,i)とを受け取り、これらの値からノイズ抑圧ゲインG_f(k,i)を求める(s32A)。例えば、ノイズ抑圧ゲインG_f(k,i)として、波数領域の収音信号U_f(k,i)の振幅|U_f(k,i)|とノイズレベルの推定値N_f(k,i)とから、次式のように直接求められるレベル比を用いてもよい。
また、例えば、参考文献4のようにこの比を平滑化してノイズ抑圧ゲインG_f(k,i)としてもよい。
(参考文献4)特開2005−348173号公報
(参考文献4)特開2005−348173号公報
例えば、平滑化前のノイズ抑圧ゲインをG_f’(k,i)とし、平滑化後のノイズ抑圧ゲインをG_f(k,i)とすると、平滑化処理の1例は、以下の式で表すことができる。
G_f(k,i)=Σh,j a(h)×G_j’(k,i)/Σh a(h)
この式は、インデックスjで示されるf番目の周波数帯域に隣接する平滑化前のノイズ抑圧ゲインG_f’(k,i)の平均値を求め、f番目の周波数帯域のノイズ抑圧ゲインG_f(k,i)とする平滑化処理を示す。和をとる際のhとjの総数は同数であり、またその総数は最も多くても周波数分析点数以下である。重み係数a(h)は、平滑化前のノイズ抑圧ゲインをG_f’(k,i)の断続性を緩和する。さらに、平滑化後のノイズ抑圧ゲインG_f(k,i)の強調化を行ってもよい。強調化処理は平滑化後のノイズ抑圧ゲインG_f(k,i)の値の大小によって、それぞれのゲイン係数を0もしくは1に近づける処理である。即ち、平滑化後のノイズ抑圧ゲインG_f(k,i)が大きく1に近い場合は、より1に近づけて対象成分をより通し易くし、平滑化後のノイズ抑圧ゲインG_f(k,i)が小さく0に近い場合は、より0に近づけて雑音成分をより大きく低減する様に平滑化後のノイズ抑圧ゲインG_f(k,i)を強調する。この強調化処理の具体的な1例を以下に式で示す。
G_f(k,i)がth1より大きい場合:
G_f(k,i)=th1×(G_f(k,i)/th1)v1
G_f(k,i)がth2より小さい場合:
G_f(k,i)=1-(1-th2){(1-G_f(k,i))/(1-th2)}v2
ここで、v1及びv2は1以上の整数とする。また、th1とth2は、th1≧th2の関係を満たす0以上1以下の整数である。ノイズ抑圧ゲインG_f(k,i)は0から1の範囲の値を持つので、th1より大きい場合、より1に近づき、th2より小さい場合、より0に近づく処理をこの式は実現する。
G_f(k,i)=Σh,j a(h)×G_j’(k,i)/Σh a(h)
この式は、インデックスjで示されるf番目の周波数帯域に隣接する平滑化前のノイズ抑圧ゲインG_f’(k,i)の平均値を求め、f番目の周波数帯域のノイズ抑圧ゲインG_f(k,i)とする平滑化処理を示す。和をとる際のhとjの総数は同数であり、またその総数は最も多くても周波数分析点数以下である。重み係数a(h)は、平滑化前のノイズ抑圧ゲインをG_f’(k,i)の断続性を緩和する。さらに、平滑化後のノイズ抑圧ゲインG_f(k,i)の強調化を行ってもよい。強調化処理は平滑化後のノイズ抑圧ゲインG_f(k,i)の値の大小によって、それぞれのゲイン係数を0もしくは1に近づける処理である。即ち、平滑化後のノイズ抑圧ゲインG_f(k,i)が大きく1に近い場合は、より1に近づけて対象成分をより通し易くし、平滑化後のノイズ抑圧ゲインG_f(k,i)が小さく0に近い場合は、より0に近づけて雑音成分をより大きく低減する様に平滑化後のノイズ抑圧ゲインG_f(k,i)を強調する。この強調化処理の具体的な1例を以下に式で示す。
G_f(k,i)がth1より大きい場合:
G_f(k,i)=th1×(G_f(k,i)/th1)v1
G_f(k,i)がth2より小さい場合:
G_f(k,i)=1-(1-th2){(1-G_f(k,i))/(1-th2)}v2
ここで、v1及びv2は1以上の整数とする。また、th1とth2は、th1≧th2の関係を満たす0以上1以下の整数である。ノイズ抑圧ゲインG_f(k,i)は0から1の範囲の値を持つので、th1より大きい場合、より1に近づき、th2より小さい場合、より0に近づく処理をこの式は実現する。
さらに、ノイズ抑圧ゲイン算出適用部2158は、次式のように、波数領域の収音信号U_f(k,i)にノイズ抑圧ゲインG_f(k,i)を適用し(ノイズ抑圧ゲインG_f(k,i)を乗じ)(s32B)、波数領域のノイズ抑圧処理済みの出力信号V_f(k,i)を求め、出力する。
<空間逆フーリエ変換部213>
空間逆フーリエ変換部213は、P×(F+1)個の波数領域のノイズ抑圧処理済みの出力信号V_f(k,i)を受け取り、周波数f≦Fにおいて、次式のように周波数f毎に周波数領域の出力信号Vf(p,i)に変換し(s4)、出力する。
空間逆フーリエ変換部213は、P×(F+1)個の波数領域のノイズ抑圧処理済みの出力信号V_f(k,i)を受け取り、周波数f≦Fにおいて、次式のように周波数f毎に周波数領域の出力信号Vf(p,i)に変換し(s4)、出力する。
なお、周波数F<f≦2F−1については、実数信号のFFT結果に関する対称性から、次式で周波数領域の出力信号Vf(p,i)を求める。
Vf(p,i)=conj(V2F-f(p,i))
ただし、conj(A)はA内のスカラーあるいはベクトル、行列の個々の要素に対して複素共役をとることを示す。なお、本実施形態では、周波数F<f≦2F−1について、特定周波数ノイズ抑圧部215f等の処理を省略しているが、省略せずに全ての周波数0≦f≦2F−1において処理を行ってもよい。
Vf(p,i)=conj(V2F-f(p,i))
ただし、conj(A)はA内のスカラーあるいはベクトル、行列の個々の要素に対して複素共役をとることを示す。なお、本実施形態では、周波数F<f≦2F−1について、特定周波数ノイズ抑圧部215f等の処理を省略しているが、省略せずに全ての周波数0≦f≦2F−1において処理を行ってもよい。
このようにして求めた合計P×2F個の周波数領域の出力信号Vf(p,i)を多CH短時間逆フーリエ変換部214に出力する。ただし、このとき、f=0,1,…,2F−1である。なお、逆波数変換方法としては、空間フーリエ変換部212における波数領域変換方法に対応するものを用いればよい。
<多CH短時間逆フーリエ変換部214>
多CH短時間逆フーリエ変換部214は、P×2F個の周波数領域の出力信号Vf(p,i)を受け取り、次式のように、チャネルp毎に周波数領域の出力信号Vf(p,i)を逆FFTし(s5)、時間領域の出力信号ベクトルv(p,i)(要素数は2F個)に変換し(s5)、合成部216pに出力する。
多CH短時間逆フーリエ変換部214は、P×2F個の周波数領域の出力信号Vf(p,i)を受け取り、次式のように、チャネルp毎に周波数領域の出力信号Vf(p,i)を逆FFTし(s5)、時間領域の出力信号ベクトルv(p,i)(要素数は2F個)に変換し(s5)、合成部216pに出力する。
時間領域変換方法としては、多CH短時間フーリエ変換部211における周波数領域変換方法に対応するものを用いればよい。
<合成部216p>
合成部216pは、時間領域の出力信号ベクトルv(p,i)を受け取り、時間領域の出力信号ベクトルv(p,i)を合成し、合成した信号をノイズ抑圧装置200の出力値として出力する。例えば、多CH短時間フーリエ変換部211において、収音信号u(p,n)をD≧2でフレーム化した場合には、合成部216pは、フレームiで求めた出力信号v(p,i)と一つ前のフレームi−1で求めた出力信号v(p,i−1)とに対して窓かけ処理を行った上で、合成し(s6)、合成後の出力信号ベクトルv’(p,i)(要素数はF/D個)の要素v(p,n−F/D+1),v(p,n−F/D+2),…,v(p,n)を逐次、出力値として出力する。ただし、n=iF/Dの関係にある。
合成部216pは、時間領域の出力信号ベクトルv(p,i)を受け取り、時間領域の出力信号ベクトルv(p,i)を合成し、合成した信号をノイズ抑圧装置200の出力値として出力する。例えば、多CH短時間フーリエ変換部211において、収音信号u(p,n)をD≧2でフレーム化した場合には、合成部216pは、フレームiで求めた出力信号v(p,i)と一つ前のフレームi−1で求めた出力信号v(p,i−1)とに対して窓かけ処理を行った上で、合成し(s6)、合成後の出力信号ベクトルv’(p,i)(要素数はF/D個)の要素v(p,n−F/D+1),v(p,n−F/D+2),…,v(p,n)を逐次、出力値として出力する。ただし、n=iF/Dの関係にある。
<効果>
本実施形態の効果を図6で説明する。単一話者のターゲット音声xを対象とし、同時に拡散性のノイズnがマイクロホンにより収音されるケースを考える。空間フーリエ変換部212が各周波数fでPチャネルの収音信号Uf(p,i)を方向毎に分解する。変換後のターゲット音すなわち対象成分は特定の方向に集中して抽出される。拡散性ノイズは全方向の成分をもち、そのごく一部の特定方向に含まれる分が抽出される。したがって、この特定方向でSN比が良好になり、抑圧処理の歪みは大幅に小さくなる。この信号処理は波数領域で行われているため、ノイズ抑圧後の波面進行方向は抑圧前と同じであり、空間バランスの点で抑圧処理の影響をほとんど受けない。一方、その他の方向ではノイズ成分が大半を占め、非定常の音声成分が少なくなるため、ノイズレベル推定の精度が相対的に高くなり、ノイズが良好に抑圧される。その結果、従来法よりもノイズ抑圧処理の品質を上げることができる。
本実施形態の効果を図6で説明する。単一話者のターゲット音声xを対象とし、同時に拡散性のノイズnがマイクロホンにより収音されるケースを考える。空間フーリエ変換部212が各周波数fでPチャネルの収音信号Uf(p,i)を方向毎に分解する。変換後のターゲット音すなわち対象成分は特定の方向に集中して抽出される。拡散性ノイズは全方向の成分をもち、そのごく一部の特定方向に含まれる分が抽出される。したがって、この特定方向でSN比が良好になり、抑圧処理の歪みは大幅に小さくなる。この信号処理は波数領域で行われているため、ノイズ抑圧後の波面進行方向は抑圧前と同じであり、空間バランスの点で抑圧処理の影響をほとんど受けない。一方、その他の方向ではノイズ成分が大半を占め、非定常の音声成分が少なくなるため、ノイズレベル推定の精度が相対的に高くなり、ノイズが良好に抑圧される。その結果、従来法よりもノイズ抑圧処理の品質を上げることができる。
このような構成により生成した出力信号v(p,i)を波面再構成フィルタ90でフィルタリングし、フィルタリング後の再生信号y(p,n)をスピーカspで再生することで、ノイズを抑圧しつつ、所望の音場を再現することができる。
上記の処理はマイクアレー処理の観点から見ることができる。各周波数において、多チャネル信号にアレー処理を適用して方向毎に分解して、方向毎に1入力1出力のノイズ抑圧処理を行っている。上記の多チャネル信号を方向毎に分解するアレー処理により、対象成分とノイズ成分の分離性が向上する。分離性を向上させた状態でノイズ抑圧を適用することで、その歪みを大幅に低減させることが可能になる。またノイズ抑圧の度合いを強めても、処理後の信号が歪みにくくなる。
なお、波面再構成フィルタ90を、ノイズ抑圧装置200の一部としてもよいし、本実施形態のように別装置としてもよい。
<第一変形例>
第一実施形態では、ノイズ抑圧装置200と波面再構成フィルタ90の間は時間領域の信号になるが、波面再構成フィルタのフィルタ係数を波数領域で適用することで、各処理を波数領域で連結し、演算量を削減してもよい。
第一実施形態では、ノイズ抑圧装置200と波面再構成フィルタ90の間は時間領域の信号になるが、波面再構成フィルタのフィルタ係数を波数領域で適用することで、各処理を波数領域で連結し、演算量を削減してもよい。
図7は第一変形例の機能ブロック図を示す。
波面再構成フィルタ90は、時間領域の出力信号v(p,i)に代えて波数領域の出力信号V_f(k,i)を入力とし、時間領域の再生信号y(p,n)に代えて波数領域の再生信号Y_f(k,i)を出力する。
空間逆フーリエ変換部213、多CH短時間逆フーリエ変換部214及び合成部216pは、それぞれ出力信号(V_f(k,i)、Vf(p,i)、v(p,i))に代えて、再生信号(Y_f(k,i)、Yf(p,i)、y(p,i))を入力とし、出力信号(Vf(p,i)、v(p,i)、v(p、n))に代えて、再生信号Yf(p,i)、y(p,i)、y(p,n)を出力する。
このような構成により、第一実施形態と同様の効果を得つつ、演算量を削減することができる。
<第二変形例>
また、図8のように、ノイズ抑圧装置200は、波面再構成フィルタ90においてフィルタリングを行った後に、再生信号y(p,n)に対してノイズ抑圧処理を行ってもよい。
また、図8のように、ノイズ抑圧装置200は、波面再構成フィルタ90においてフィルタリングを行った後に、再生信号y(p,n)に対してノイズ抑圧処理を行ってもよい。
この場合、ノイズ抑圧装置200は、Pチャネルの収音信号u(p,n)に代えてPチャネルの再生信号y(p,n)を受け取り、ノイズ抑圧処理を施し、Pチャネルの出力信号v(p,n)を出力する。
第一変形例と組み合わせてもよい。つまり、図9のように、各処理を波数領域で連結し、演算量を削減してもよい。
ノイズ抑圧装置及び波面再構成フィルタの入力信号は、収音信号のみに限定されない。例えば、ノイズ抑圧装置は収音信号自体に加え、再生信号等を、波面再構成フィルタは収音信号自体に加え、ノイズ抑圧装置の出力信号等を入力信号として用いることができる。収音信号に対応する信号であればよく、例えば、収音信号からエコーを消去した信号を入力としてもよい。
<第三変形例>
なお図4の空間フーリエ変換部212における周波数領域から波数領域への変換について、式(3)では各周波f数におけるPチャネルの収音信号Uf(p,i)を対象としてP(=2K)点FFTを用いている。
なお図4の空間フーリエ変換部212における周波数領域から波数領域への変換について、式(3)では各周波f数におけるPチャネルの収音信号Uf(p,i)を対象としてP(=2K)点FFTを用いている。
この場合、空間フーリエ変換部212の入力から空間逆フーリエ変換部213の出力までは巡回畳み込みの処理と見ることができる。
巡回畳み込みはPチャネルの空間信号を周期信号として扱うために、その悪影響が空間信号の両端に現れやすい。これを避けるために、次式のようにPチャネルの信号の両脇にP/2個ずつ0詰めをして、2P(=4K)点FFTを適用してもよい。
この場合、ノイズ抑圧ゲイン算出適用部2158では、処理対象となるkの範囲が、−K+1≦k≦Kから−2K+1≦k≦2Kへと倍になる。
また空間逆フーリエ変換部213は、式(7)の代わりに次式を用い、2P(=4K)点逆FFTを使用する。そして、その結果の中央のP点を抜き出して、チャネルp毎に短時間逆フーリエ変換を適用すればよい。
このような構成により、Pチャネルの空間信号を周期信号として扱う際に生じる悪影響を低減することができる。
<第二実施形態>
本実施形態の実施例2として、波面の伝送機能もしくは蓄積再現機能80を組み合わせた構成を図10に示す。伝送機能とは、インターネット等の通信回線を介して信号を伝送する機能を意味する。また、蓄積再現機能とは、自己の記憶部や記憶媒体に記憶した信号を読み取ることで収音した時刻とは異なるタイミングで再生し音場を再現する機能を意味する。
本実施形態の実施例2として、波面の伝送機能もしくは蓄積再現機能80を組み合わせた構成を図10に示す。伝送機能とは、インターネット等の通信回線を介して信号を伝送する機能を意味する。また、蓄積再現機能とは、自己の記憶部や記憶媒体に記憶した信号を読み取ることで収音した時刻とは異なるタイミングで再生し音場を再現する機能を意味する。
伝送機能もしくは蓄積再現機能80を、(1)マイクロホンmpとノイズ抑圧装置200との間(図10A参照)、(2)ノイズ抑圧装置200と波面再構成フィルタ90との間(図10B参照)、(3)波面再構成フィルタ90とスピーカspとの間(図10C参照)に設けることができる。
さらに、第一実施形態の第二変形例の構成(波面再構成フィルタ90においてフィルタリングを行った後に、再生信号y(p,n)に対してノイズ抑圧処理を行う構成)と伝送機能もしくは蓄積再現機能80を組み合わせてもよい。その場合の構成を図11に示す。このとき、伝送機能もしくは蓄積再現機能80を、(1)マイクロホンmpと波面再構成フィルタ90との間(図11A参照)、(2)波面再構成フィルタ90とノイズ抑圧装置200との間(図11B参照)、(3)ノイズ抑圧装置200とスピーカspとの間(図11C参照)に設けることができる。
<第三実施形態>
<第三実施形態のポイント>
第一実施形態と異なる部分についてのみ説明する。
<第三実施形態のポイント>
第一実施形態と異なる部分についてのみ説明する。
本実施形態では、波を周波数−波数空間で見るとき、周波数が低いほど波の存在する範囲が狭いことを利用して、ノイズ抑圧処理の演算量を削減する。
参考文献5によれば、周波数−波数空間で見ると波の存在範囲は周波数に応じて限定される。
(参考文献5)T. Ajdler, L. Sbaiz, and M. Vetterli, "Dynamic measurement of room impulse responses using a moving microphone", The Journal of the Acoustical Society of America, 2007, vol. 122, issue 3, p. 1636-1645
(参考文献5)T. Ajdler, L. Sbaiz, and M. Vetterli, "Dynamic measurement of room impulse responses using a moving microphone", The Journal of the Acoustical Society of America, 2007, vol. 122, issue 3, p. 1636-1645
図12は、単一周波数波の平面波のサンプリングの様子を示す。マイクロホン素子列に角度αで入射する単一の周波数f0の平面波を考える。マイクロホン列をx軸にとると、tを時刻としてx軸上での音圧の時間変動p(x,t)は、
p(x,t)=ej(ω0t+φ0xcosα) (31)
になる。ただし、上付き添え字中のω0及びφ0はそれぞれω0及びφ0を表し、ω0及びφ0はそれぞれ周波数f0の角周波数及び波数を表し、音速をvelocとして、φ0は
φ0=ω0/veloc (32)
である。このx−t軸上の音圧を周波数−波数領域に変換すると
p(x,t)=ej(ω0t+φ0xcosα) (31)
になる。ただし、上付き添え字中のω0及びφ0はそれぞれω0及びφ0を表し、ω0及びφ0はそれぞれ周波数f0の角周波数及び波数を表し、音速をvelocとして、φ0は
φ0=ω0/veloc (32)
である。このx−t軸上の音圧を周波数−波数領域に変換すると
になる。時間−空間領域で単一の周波数の平面波は、周波数−波数領域では1点になる。
全周波数で同一の周波数成分を持ち、時間―空間で
であらわされる平面波は、周波数−波数領域では、
のように直線になる。入射の角度αは0〜180度の範囲をとるため、周波数−波数領域で見ると波の成分は、
の範囲に存在する。
実際のマイクロホン列によるサンプリングは離散的である。時間方向について、サンプリング周波数をfs、フレーム長を2F、2F点−FFTを使用し、空間方向について、P個のマイクロホンは直線上に等間隔に配列されているものとし、マイクロホン間隔をd、マイクロホン数を2KとしてK点−FFTを使用する。このとき、周波数の範囲は0〜fs/2であり、波数kの範囲は−π/d〜π/dである。
なお、このサンプリングにおける最大の周波数f=fs/2の波について、波数はπfs/velocになる。マイクロホン間隔dが十分小さくπ/dがこの値より大きいとき空間エリアシングは生じない。しかしマイクロホン間隔dが相対的に長いために、π/dがこの値より小さい場合に空間エリアシングが生じる。この様子を図13に示す。
第一実施形態では、全周波数及び全波数で処理を行っている。しかし上記の知見によれば、周波数−波数領域において信号成分の存在範囲は、音波の周波数が低いほど狭まっている。この信号成分の存在しない範囲で信号処理を省くことができ、その処理削減の効果は周波数が低いほど大きい。これが第三実施形態のポイントである。
<特定周波数ノイズ抑圧部215f>
図14は第三実施形態に係るノイズ抑圧装置内の特定周波数ノイズ抑圧部215fの機能ブロック図を、図15はその処理フローを示す。第三実施形態と第一実施形態との相違は、特定周波数ノイズ抑圧部215fの内部のみである。
図14は第三実施形態に係るノイズ抑圧装置内の特定周波数ノイズ抑圧部215fの機能ブロック図を、図15はその処理フローを示す。第三実施形態と第一実施形態との相違は、特定周波数ノイズ抑圧部215fの内部のみである。
特定周波数ノイズ抑圧部215fは、ノイズレベル推定部2157及びノイズ抑圧ゲイン算出適用部2158を含み、さらに、波数限定部2154と波数0詰め部2155とを含む。
はじめに、波数限定部2154において、周波数fから波数kの有効範囲を求める。波数限定部2154は、ノイズレベル推定部2157及びノイズ抑圧ゲイン算出適用部2158の処理をこの波数kの範囲内に限定する。波数0詰め部2155は未処理の範囲に0を設定する。
上記処理のために、第一実施形態に加える変更の詳細を以下に示す。
(波数限定部2154)
波数限定部2154は、周波数f≦Fにおいて、周波数f毎に波数kの有効範囲を算出し(s30)、この有効範囲を特定周波数ノイズ抑圧部215f内の各部に出力する(ただし、図中各部への出力を省略する)。例えば、周波数fの一次関数で表す式(37)により波数kの上限max_k(f)を求める。
波数限定部2154は、周波数f≦Fにおいて、周波数f毎に波数kの有効範囲を算出し(s30)、この有効範囲を特定周波数ノイズ抑圧部215f内の各部に出力する(ただし、図中各部への出力を省略する)。例えば、周波数fの一次関数で表す式(37)により波数kの上限max_k(f)を求める。
ただし、ceil(A)は、Aを整数へ切り上げる関数である。また、fthはマイクロホン間隔dでのサンプリングするときに空間エリアシングが生じない最大周波数であり、次式で定義される。
なお、式(36)(37)は、波数kの範囲を周波数fの一次関数で表し、波数kの範囲の上限と下限は
で与えられるものであることを表している。言い換えると、式(37)は、音速velocとマイクロホン間隔dとサンプリング周波数fsとに基づき、周波数fに対する波数kの上限を求めている。
特定周波数ノイズ抑圧部215f内の各部では、周波数f≦Fにおいて、波数限定部2154が周波数fについて求めた波数kの有効範囲
-max_k(f)≦k≦max_k(f) (39)
で、各処理(s31,s32A,S32B)を行い、ノイズ抑圧を図る。
-max_k(f)≦k≦max_k(f) (39)
で、各処理(s31,s32A,S32B)を行い、ノイズ抑圧を図る。
なお、波数kの有効範囲を算出する際に、周波数fの一次関数を用いることは、一例であり、高周波領域に比べ低周波領域では波数の範囲が狭くなるように波数kの有効範囲を限定するものであれば他の方法により、有効範囲を算出してもよい。
また、波数限定部2154における処理は、ノイズ抑圧処理を開始時、または開始前に一度行い、各部に上限max_k(f)を設定しておいてもよい。
(波数0詰め部2155)
波数0詰め部2155は、ノイズ抑圧ゲイン算出適用部2158から(P−2・max_k(f))個の波数領域のノイズ抑圧処理済みの出力信号V_f(k,i)を受け取り(ただし、周波数f≦F、−max_k(f)≦k≦max_k(f))、有効範囲外の波数、すなわちk<−max_k(f)及びmax_k(f)<kの範囲で、波数領域の出力信号V_f(k,i)を0とし(s33)、空間逆フーリエ変換部213に出力する。
波数0詰め部2155は、ノイズ抑圧ゲイン算出適用部2158から(P−2・max_k(f))個の波数領域のノイズ抑圧処理済みの出力信号V_f(k,i)を受け取り(ただし、周波数f≦F、−max_k(f)≦k≦max_k(f))、有効範囲外の波数、すなわちk<−max_k(f)及びmax_k(f)<kの範囲で、波数領域の出力信号V_f(k,i)を0とし(s33)、空間逆フーリエ変換部213に出力する。
<効果>
このような構成により、第一実施形態と同様の効果を得ることができ、さらに、計算量を減らすことができるという効果を奏する。
このような構成により、第一実施形態と同様の効果を得ることができ、さらに、計算量を減らすことができるという効果を奏する。
なお、本実施形態と第一実施形態の変形例や第二実施形態、その他の変形例とを組合せてもよい。
<その他の変形例>
ノイズ抑圧装置を構成する各部は、マイクロホンmpが配置された収音空間とスピーカspが配置された再生空間の何れに備えられていてもよい。換言すれば、多CH短時間フーリエ変換部211、空間フーリエ変換部212、特定周波数ノイズ抑圧部215f、空間逆フーリエ変換部213、多CH短時間逆フーリエ変換部214及び合成部216pのそれぞれの処理は、収音空間で実行されてもよいし、再生空間で実行されてもよい。マイクロホンmpで生成された収音信号は、波面再構成フィルタ90及びノイズ抑圧装置200を介して、スピーカspに送信される。
ノイズ抑圧装置を構成する各部は、マイクロホンmpが配置された収音空間とスピーカspが配置された再生空間の何れに備えられていてもよい。換言すれば、多CH短時間フーリエ変換部211、空間フーリエ変換部212、特定周波数ノイズ抑圧部215f、空間逆フーリエ変換部213、多CH短時間逆フーリエ変換部214及び合成部216pのそれぞれの処理は、収音空間で実行されてもよいし、再生空間で実行されてもよい。マイクロホンmpで生成された収音信号は、波面再構成フィルタ90及びノイズ抑圧装置200を介して、スピーカspに送信される。
収音空間と再生空間の位置は、図3、図8、図10、図11等に示したものに限定されない。収音空間と再生空間は、隣接していても互いに離れた位置にあってもよい。また、収音空間と再生空間の向きもどのようなものであってもよい。
ノイズ抑圧装置は、特定周波数ノイズ抑圧部215fを含みさえすれば、他の部を備えていなくてもよい。例えば、ノイズ抑圧装置は、特定周波数ノイズ抑圧部215f、空間逆フーリエ変換部213、多CH短時間逆フーリエ変換部214及び合成部216pから構成されていてもよい。また、ノイズ抑圧装置は、多CH短時間フーリエ変換部211、空間フーリエ変換部212、特定周波数ノイズ抑圧部215fから構成されていてもよい。
多CH短時間フーリエ変換部211の処理と空間フーリエ変換部212の処理とを同時に行ってもよい。同様に、空間逆フーリエ変換部213の処理と多CH短時間逆フーリエ変換部214の処理とを同時に行ってもよい。
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
Claims (6)
- 複数のマイクロホンを設置した地点で取得した音波面を、複数のスピーカを設置した地点で再合成するものとし、
周波数と波数との組合せ毎に、波数領域の入力信号のノイズレベルを推定するノイズレベル推定部と、
周波数と波数との組合せ毎に、波数領域の入力信号と、波数領域のノイズレベルの推定値との比に基づきノイズ抑圧ゲインを求め、波数領域の入力信号にノイズ抑圧ゲインを乗じ、波数領域のノイズ抑圧処理済みの出力信号を求めるノイズ抑圧ゲイン算出適用部とを含み、
前記入力信号は前記複数のマイクロホンで収音する複数のチャネルの収音信号に対応する信号であり、前記出力信号は複数のスピーカで再生する複数のチャネルの再生信号に対応する信号である、
ノイズ抑圧装置。 - 請求項1記載のノイズ抑圧装置であって、
前記入力信号をチャネル毎に周波数領域の収音信号に変換する周波数領域変換部と、
前記周波数領域の収音信号を、周波数毎に波数領域の収音信号に変換する波数領域変換部と、をさらに含む、
ノイズ抑圧装置。 - 請求項1または請求項2記載のノイズ抑圧装置であって、
周波数毎に前記波数領域のノイズ抑圧処理済みの出力信号を周波数領域の出力信号に変換する逆波数領域変換部と、
チャネル毎に前記周波数領域の出力信号を時間領域の出力信号に変換する逆時間領域変換部と、をさらに含む、
ノイズ抑圧装置。 - 請求項1から請求項3の何れかに記載のノイズ抑圧装置であって、
前記周波数毎に波数の有効範囲を算出する波数限定部と、
前記有効範囲外の波数における波数領域のノイズ抑圧処理済みの出力信号を0とする波数0詰め部とをさらに含み、
前記波数限定部及び前記波数0詰め部を除く各部において、前記有効範囲内で処理を行う、
ノイズ抑圧装置。 - 複数のマイクロホンを設置した地点で取得した音波面を、複数のスピーカを設置した地点で再合成するものとし、
周波数と波数との組合せ毎に、波数領域の入力信号のノイズレベルを推定するノイズレベル推定ステップと、
周波数と波数との組合せ毎に、波数領域の入力信号と、波数領域のノイズレベルの推定値との比に基づきノイズ抑圧ゲインを求め、波数領域の入力信号にノイズ抑圧ゲインを乗じ、波数領域のノイズ抑圧処理済みの出力信号を求めるノイズ抑圧ゲイン算出適用ステップとを含み、
前記入力信号は前記複数のマイクロホンで収音する複数のチャネルの収音信号に対応する信号であり、前記出力信号は複数のスピーカで再生する複数のチャネルの再生信号に対応する信号である、
ノイズ抑圧方法。 - 請求項1から請求項4の何れかに記載のノイズ抑圧装置として、コンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013144099A JP5762478B2 (ja) | 2013-07-10 | 2013-07-10 | ノイズ抑圧装置、ノイズ抑圧方法、及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013144099A JP5762478B2 (ja) | 2013-07-10 | 2013-07-10 | ノイズ抑圧装置、ノイズ抑圧方法、及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015019184A true JP2015019184A (ja) | 2015-01-29 |
JP5762478B2 JP5762478B2 (ja) | 2015-08-12 |
Family
ID=52439819
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013144099A Expired - Fee Related JP5762478B2 (ja) | 2013-07-10 | 2013-07-10 | ノイズ抑圧装置、ノイズ抑圧方法、及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5762478B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113156229A (zh) * | 2021-04-30 | 2021-07-23 | 广东电网有限责任公司电力科学研究院 | 二阶超前观测器的噪声干扰水平的在线测量装置及方法 |
CN113176456A (zh) * | 2021-04-30 | 2021-07-27 | 广东电网有限责任公司电力科学研究院 | 二阶超前观测器的噪声干扰水平的在线测量装置及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09258792A (ja) * | 1996-03-25 | 1997-10-03 | Nippon Telegr & Teleph Corp <Ntt> | 雑音低減方法および装置 |
JP2000152372A (ja) * | 1998-09-11 | 2000-05-30 | Mitsubishi Heavy Ind Ltd | 指向性マイクロホン及びこれを用いた音源探査装置 |
JP2009509362A (ja) * | 2005-06-24 | 2009-03-05 | ネイダーランゼ、オルガニザティー、ボー、トゥーゲパストナトゥールウェテンシャッペルーク、オンダーツォーク、ティーエヌオー | 複数の音源によって放射される信号から音響信号を抽出するためのシステムおよび方法。 |
JP2011139378A (ja) * | 2009-12-28 | 2011-07-14 | Fujitsu Ltd | 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム |
JP2013048360A (ja) * | 2011-08-29 | 2013-03-07 | Nippon Telegr & Teleph Corp <Ntt> | 音場収音再生装置、方法及びプログラム |
-
2013
- 2013-07-10 JP JP2013144099A patent/JP5762478B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09258792A (ja) * | 1996-03-25 | 1997-10-03 | Nippon Telegr & Teleph Corp <Ntt> | 雑音低減方法および装置 |
JP2000152372A (ja) * | 1998-09-11 | 2000-05-30 | Mitsubishi Heavy Ind Ltd | 指向性マイクロホン及びこれを用いた音源探査装置 |
JP2009509362A (ja) * | 2005-06-24 | 2009-03-05 | ネイダーランゼ、オルガニザティー、ボー、トゥーゲパストナトゥールウェテンシャッペルーク、オンダーツォーク、ティーエヌオー | 複数の音源によって放射される信号から音響信号を抽出するためのシステムおよび方法。 |
JP2011139378A (ja) * | 2009-12-28 | 2011-07-14 | Fujitsu Ltd | 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム |
JP2013048360A (ja) * | 2011-08-29 | 2013-03-07 | Nippon Telegr & Teleph Corp <Ntt> | 音場収音再生装置、方法及びプログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113156229A (zh) * | 2021-04-30 | 2021-07-23 | 广东电网有限责任公司电力科学研究院 | 二阶超前观测器的噪声干扰水平的在线测量装置及方法 |
CN113176456A (zh) * | 2021-04-30 | 2021-07-27 | 广东电网有限责任公司电力科学研究院 | 二阶超前观测器的噪声干扰水平的在线测量装置及方法 |
CN113156229B (zh) * | 2021-04-30 | 2022-05-27 | 广东电网有限责任公司电力科学研究院 | 二阶超前观测器的噪声干扰水平的在线测量装置及方法 |
CN113176456B (zh) * | 2021-04-30 | 2022-06-03 | 广东电网有限责任公司电力科学研究院 | 二阶超前观测器的噪声干扰水平的在线测量装置及方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5762478B2 (ja) | 2015-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10382849B2 (en) | Spatial audio processing apparatus | |
JP6604331B2 (ja) | 音声処理装置および方法、並びにプログラム | |
JP6508539B2 (ja) | 音場収音装置および方法、音場再生装置および方法、並びにプログラム | |
WO2015159731A1 (ja) | 音場再現装置および方法、並びにプログラム | |
TWI765325B (zh) | 使用頻譜正交音訊分量之副頻帶空間及串擾處理 | |
JP2022101630A (ja) | 空間オーディオ信号のクロストーク処理のためのスペクトル欠陥補償 | |
JP4928382B2 (ja) | 特定方向収音装置、特定方向収音方法、特定方向収音プログラム、記録媒体 | |
JP5060465B2 (ja) | 収音装置、収音方法、収音プログラム、記録媒体 | |
JP5762479B2 (ja) | 音声スイッチ装置、音声スイッチ方法、及びそのプログラム | |
CN111699700A (zh) | 音频信号处理方法、设备及存储介质 | |
JP5762478B2 (ja) | ノイズ抑圧装置、ノイズ抑圧方法、及びそのプログラム | |
JP4568193B2 (ja) | 収音装置とその方法とそのプログラムとその記録媒体 | |
Zheng et al. | Low-latency monaural speech enhancement with deep filter-bank equalizer | |
JP5937451B2 (ja) | エコー消去装置、エコー消去方法及びプログラム | |
JP5774062B2 (ja) | エコー消去装置、エコー消去方法、及びそのプログラム | |
JP4116600B2 (ja) | 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体 | |
JP4886616B2 (ja) | 収音装置、収音方法、その方法を用いた収音プログラム、および記録媒体 | |
JP5889224B2 (ja) | エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム | |
JP5826712B2 (ja) | マルチチャネルエコー消去装置、マルチチャネルエコー消去方法、およびプログラム | |
Beutelmann et al. | Prediction of binaural speech intelligibility with frequency-dependent interaural phase differences | |
JP2013048360A (ja) | 音場収音再生装置、方法及びプログラム | |
JP2015027046A (ja) | 音場収音再生装置、方法及びプログラム | |
JP6075783B2 (ja) | エコー消去装置、エコー消去方法及びプログラム | |
JP5325134B2 (ja) | 反響消去方法、反響消去装置、そのプログラムおよび記録媒体 | |
JP2019090930A (ja) | 音源強調装置、音源強調学習装置、音源強調方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150417 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150609 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5762478 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |