JPWO2009110574A1 - 信号強調装置、その方法、プログラム及び記録媒体 - Google Patents
信号強調装置、その方法、プログラム及び記録媒体 Download PDFInfo
- Publication number
- JPWO2009110574A1 JPWO2009110574A1 JP2010501966A JP2010501966A JPWO2009110574A1 JP WO2009110574 A1 JPWO2009110574 A1 JP WO2009110574A1 JP 2010501966 A JP2010501966 A JP 2010501966A JP 2010501966 A JP2010501966 A JP 2010501966A JP WO2009110574 A1 JPWO2009110574 A1 JP WO2009110574A1
- Authority
- JP
- Japan
- Prior art keywords
- signal
- value
- parameter
- estimated value
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 161
- 230000008569 process Effects 0.000 claims abstract description 120
- 238000001228 spectrum Methods 0.000 claims abstract description 91
- 239000013598 vector Substances 0.000 claims description 155
- 239000011159 matrix material Substances 0.000 claims description 130
- 238000012545 processing Methods 0.000 claims description 127
- 238000009826 distribution Methods 0.000 claims description 89
- 230000001629 suppression Effects 0.000 claims description 66
- 238000003860 storage Methods 0.000 claims description 58
- 238000004364 calculation method Methods 0.000 claims description 17
- 230000001965 increasing effect Effects 0.000 claims description 11
- 230000017105 transposition Effects 0.000 claims description 3
- 238000007476 Maximum Likelihood Methods 0.000 abstract description 12
- 230000006870 function Effects 0.000 description 74
- 230000005540 biological transmission Effects 0.000 description 19
- 238000004422 calculation algorithm Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 15
- 230000003595 spectral effect Effects 0.000 description 12
- 239000000654 additive Substances 0.000 description 9
- 230000000996 additive effect Effects 0.000 description 9
- 230000002194 synthesizing effect Effects 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000013179 statistical model Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 101100425597 Solanum lycopersicum Tm-1 gene Proteins 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
まず、マイクロホン等のセンサや音声ファイル等から取得され、標本化・量子化された時間領域の観測音声の波形信号が帯域分割部に入力される。これらの時間領域の観測信号は、帯域分割部において、周波数帯域ごとの狭帯域信号に分割される。すなわち、時間領域の観測信号が時間周波数領域の観測信号に変換される。以下では、周波数帯域ごとに分割された観測信号の集合を観測信号の複素スペクトログラムと呼ぶ。なお、帯域分割部は、短時間フーリエ変換やポリフェーズフィルタバンク等の従来技術によってこの処理を実行する。ただし、この帯域分割を実施せずに、時間領域の観測信号を直接用いて源信号の強調処理を行う方法もある。また、明細書では、信号を表現する領域を明記していない場合、時間周波数領域であると解釈する。
非特許文献1には、源信号に雑音が加算された観測信号から雑音を抑圧する雑音抑圧技術が提案されている。以下に非特許文献1に開示された各処理部の処理を説明する。
非特許文献2には、源信号に残響が重畳された観測信号から残響を抑圧する残響抑圧技術が提案されている。以下に非特許文献2に開示された各処理部の処理を説明する。
Lim, J. S. and Oppenheim, A. V. , "All-pole modeling of degraded speech," IEEE Trans. Acoust. Speech, Signal Process., Vol. 26, No. 3, pp.197-210 (1978). Yoshioka, T., Hikichi, T. and Miyoshi, M., "Dereverberation by Using Time-Variant Nature of Speech Production System, EURASIP J. Advances in Signal Process., Vol. 2007, (2007), Article ID 65698, 15 pages, doi:10.1155/2007/65698.
雑音と残響がともに存在する環境においてM(M≧1)個のセンサ1000−1〜Mで観測された観測信号は、図2に示す系によって生成されたものであるといえる。すなわち、まず、話者などの信号源1010から発せられた、雑音や残響を含まない信号(「源信号」と呼ぶ)に対し、残響重畳系(室内伝達系)によって各室内インパルス応答が畳み込まれることで残響が付加される。さらに、残響が付加された信号(「残響重畳信号」と呼ぶ)に対し、雑音重畳系によって雑音が加算される。これにより、雑音と残響を含む信号(「雑音残響重畳信号」と呼ぶ)が生成され、各センサで観測される。
まず、本実施形態のパラメータ推定部について述べる。本実施形態のパラメータは、残響パラメータと、信号源パラメータと、雑音パラメータとを含む。残響パラメータは、少なくとも、室内伝達系を多チャンネル自己回帰系としてモデル化したときの回帰行列を含む。なお、この回帰行列からなる多入力多出力インパルス応答を残響重畳信号に畳み込むと、残響重畳信号に含まれる残響が算出される。信号源パラメータは、少なくとも、源信号の短時間パワースペクトル密度を特徴づける線形予測係数と予測残差パワーとを含む。雑音パラメータは、少なくとも、雑音の短時間パワークロススペクトル行列を含む。本実施形態のパラメータ推定部は、残響パラメータと信号源パラメータと雑音パラメータを、ECMアルゴリズム等のEMアルゴリズムの変種を用いて、最尤推定する。
初期化部は、第1パラメータ群のパラメータの推定値と、第2パラメータ群のパラメータの推定値とを初期化する。
次に、観測信号と、第1パラメータ群のパラメータの推定値と、第2パラメータ群のパラメータの推定値とが、第1更新部に入力される。第1更新部は、第1パラメータ群と第2パラメータ群のいずれか一方のパラメータ群のパラメータの推定値を固定し、残る一方のパラメータ群のパラメータのうち、少なくとも一部のパラメータの推定値を更新する。第1更新部は、パラメータの推定値に関する対数尤度関数の値が大きくなるように、パラメータの推定値を更新する。
<本実施形態のパラメータ推定処理の概要>
まず、本実施形態のパラメータ推定処理の概要を説明する。
[観測信号記憶処理]
まず、観測信号記憶処理によって、観測信号が記憶部に格納される。
[初期化処理]
次に、初期化処理によって、第1パラメータ群のパラメータの推定値と、第2パラメータ群のパラメータの推定値とが初期化される。
本実施形態の第1更新処理では、第1パラメータ群、すなわち残響パラメータの推定値が固定された状態で、第2パラメータ群、すなわち信号源パラメータの推定値が更新される。本実施形態の第1更新処理は、具体的には、雑音抑圧処理と、信号源パラメータの更新処理とを含む。
雑音抑圧処理では、観測信号とパラメータの推定値を用いて、残響重畳信号の条件付事後分布p(残響重畳信号|観測信号,パラメータの推定値)を特徴づける複素正規分布の平均と共分散行列が算出される。
信号源パラメータ推定値の更新処理では、残響パラメータの推定値と残響重畳信号の条件付事後分布の平均と共分散行列を用いて、信号源パラメータの推定値が更新される。信号源パラメータの推定値は、パラメータの推定値に関する補助関数の値が最大になるように、更新される。
本実施形態の第2更新処理では、第2パラメータ群、すなわち信号源パラメータの推定値が固定された状態で、第1パラメータ群、すなわち残響パラメータの推定値が更新される。残響パラメータの推定値は、パラメータの推定値に関する補助関数の値が最大になるように、更新される。
終了条件判定処理では、所定の終了条件が満たされているか否かが判定される。終了条件が満たされていない場合、第1更新処理に戻る。終了条件が満たされている場合、その時点におけるパラメータの推定値を出力する。
以上で述べた処理において、残響重畳信号の条件付事後分布の共分散行列は、雑音の分散に対して単調増加する。すなわち、雑音のレベルが大きいほど、残響重畳信号の条件付事後分布の共分散行列も大きくなる。このことは、本実施形態が、雑音抑圧処理で求められる残響重畳信号の不確かさを妥当な方法で評価していることを示している。
次に、本実施形態の原理を説明する。
本実施形態は統計的推定の方法論に基づく。まず、信号源パラメータsΘ、残響パラメータgΘ、及び雑音パラメータdΘが規定される必要がある。また、すべてのパラメータの集合がΘ={sΘ, gΘ, dΘ}と表現される。次に、規定したパラメータΘが、観測信号である雑音残響重畳信号の集合Yに対応づけられなければならない。なお、雑音残響重畳信号の集合Yは、所定の観測区間に属する雑音残響重畳信号の集合である。後述するように、本実施形態の雑音残響重畳信号の集合Yは、雑音残響重畳信号の複素スペクトログラムである。
最初になすべきことは、パラメータΘが与えられた場合における雑音残響重畳信号の集合のYの確率密度関数p(Y|Θ)を定義することである。そのために、観測信号(雑音残響重畳信号)の集合Yの統計的モデルが仮定される。本実施形態では、以下に述べる源信号の全極モデル、室内伝達系の自己回帰モデル及び雑音のモデルが仮定される。
まず、源信号の全極モデルについて述べる。t(0≦t≦T-1)番目のフレーム、w(0≦w≦N-1)番目の周波数帯域における源信号の離散フーリエ係数(複素数)をSt,wとおく。なお、t(0≦t≦T-1)は各フレームに対応するインデックスであり、w(0≦w≦N-1)は各周波数帯域に対応するインデックスである。
St,wは以下の条件を満たすと仮定される。
1.ω∈{‐π,π}を角周波数として、t番目のフレームにおける源信号のパワースペクトル密度sλt(ω)は、以下のようなP次(P≧1)の全極型スペクトル密度で表される。
2.St,wは、以下のように、平均0、分散sλt(2πw/N)の複素正規分布にしたがう。
《室内伝達系のモデル》
次に、室内伝達系のモデルについて述べる。t(0≦t≦T-1)番目のフレーム、w(0≦w≦N-1)番目の周波数帯域における残響重畳信号の離散フーリエ係数をXt,wとおく。室内伝達系は各周波数帯域において自己回帰系として表現できると仮定される。すなわち、w番目の周波数帯域における自己回帰系の回帰係数をg1,w, ..., gKw,wとおくと、残響重畳信号の離散フーリエ係数Xt,wは次式により生成される。ただし、gk,w *はgk,wの複素共役値である。
次に、雑音のモデルについて述べる。本実施形態では、t(0≦t≦T-1)番目のフレーム、w(0≦w≦N-1)番目の周波数帯域における、雑音と雑音残響重畳信号との離散フーリエ係数がそれぞれDt,w,Yt,wとされる。Yt,wは残響重畳信号Xt,wに雑音Dt,wを加算したものである。
Yt,w = Xt,w + Dt,w (7)
また、Dt,wが次に述べる条件を満たすと仮定される。
1.雑音は定常であり、そのパワースペクトル密度をdλ(ω)として(定常であるためフレーム番号tには依存しない)、Dt,wは平均0、分散dλ(2πw/N)の複素正規分布に従う。
2.(t, w)≠(t', w')ならば、Dt,wとDt',w'とは統計的に独立である。
3.任意の(t, w, t', w')について、St,wとDt',w'とは統計的に独立である。
以上の仮定に基づき、雑音残響重畳信号の確率密度関数が定式化される。
本実施形態では、源信号、残響重畳信号及び雑音残響重畳信号の各複素スペクトログラム(源信号、残響重畳信号及び雑音残響重畳信号の各集合に相当)がそれぞれS、X及びYと表現される。すなわち、
S={St,w}0≦t≦T-1, 0≦w≦N-1 (9)
X={Xt,w}0≦t≦T-1, 0≦w≦N-1 (10)
Y={Yt,w}0≦t≦T-1, 0≦w≦N-1 (11)
と表現される。なお、{mα,β}0≦α≦T-1, 0≦β≦N-1は、m0,0 ,..., mT-1,N-1のT・N個の要素からなる集合を表す。
具体的には、雑音残響重畳信号の複素スペクトログラムYの確率密度関数(観測信号の集合Yが与えられたときのパラメータΘに関する尤度関数に相当)は次のように書ける。
前述のように、本実施形態では、観測された雑音残響重畳信号の複素スペクトログラムYから、未知のパラメータの真値Θ〜が、最尤推定法によって推定される。すなわち、雑音残響重畳信号の集合Yが与えられた場合におけるパラメータΘを変数とした尤度関数p(Y|Θ)を最大化するΘが、真値Θ〜の推定値となる。ただし、本実施形態では、雑音パラメータの真値dΘ〜が源信号の存在しない区間から予め独立に推定され、既知となっている為Θ^={sΘ^, gΘ^, dΘ〜}であり、sΘ^とgΘ^が求められることになる。
1.パラメータの推定値の初期値Θ^(0)が決められる。また、繰り返し回数を示すインデックスiが0にされる。
2.E−step(雑音抑圧処理)
残響重畳信号の条件付事後分布p(X|Y, Θ^(i))が計算される。
3.CM−step1(信号源パラメータ推定値の更新処理)
補助関数Q(Θ|Θ^(i))が次式により定義される。
4.CM−step2(残響パラメータ推定値の更新処理)
次の手続きにより、残響パラメータの推定値が更新される。
5.終了条件判定
所定の終了条件を満たしているならばsΘ^=sΘ^(i+1),gΘ^=gΘ^(i+1)として終了。そうでなければ、iを1だけ漸増させて「2.E−step」へ戻る。
以下では、E−step、CM−step1及びCM−step2の各計算方法を説明する。
1.E−stepの計算方法
源信号、残響重畳信号、雑音残響重畳信号のw番目の周波数帯域の離散フーリエ係数系列を、それぞれまとめて次のように表す。
式(24)の残響重畳信号の条件付事後分布p(X|Y, Θ^(i))は、次式に示すように周波数帯域wごとに独立な複数の複素正規分布によって表現できる。
dλT-1 〜(2πw/N)= dλT-2 〜(2πw/N)=...=dλ0 〜(2πw/N)=dλ〜(2πw/N)
である。また、diag{α1,...,αβ}は、任意のスカラー値α1,...,αβを対角要素とする対角行列である。
2.CM−step1の計算方法
t番目のフレームにおける源信号の線形予測係数とその推定値が、それぞれ次のようなベクトルで表現される。
式(25)による信号源パラメータの更新は、次式に示すat及びsσt 2の推定値の更新を全フレーム(0≦t≦T-1)にわたって実行することで実現される。
w番目の周波数帯域における残響パラメータとその推定値が、それぞれ次のようなベクトルで表現される。
式(26)による残響パラメータの更新は、次式に示すgwの推定値の更新を全周波数帯域(0≦w≦N-1)にわたって実行することで実現される。
次に、本実施形態の信号強調装置の構成を説明する。
図3は、第1実施形態の信号強調装置1の構成を示すブロック図である。また、図4は、源信号推定部27の詳細構成を示すブロック図である。
図3に示すように、本実施形態の信号強調装置1は、観測信号記憶部11、パラメータ記憶部12、一時記憶部13、帯域分割部21、雑音パラメータ推定部22、初期パラメータ設定部23、雑音抑圧処理部24、信号源パラメータ推定値更新部25、残響パラメータ推定値更新部26、源信号推定部27、帯域合成部28及び制御部29を有する。また、源信号推定部27は、残響重畳信号推定部27a及び線形フィルタ適用部27bを有する。なお、雑音パラメータ推定部22及び初期パラメータ設定部23は、前述の初期化部に対応する。また、雑音抑圧処理部24及び信号源パラメータ推定値更新部25は、前述の第1更新部に対応する。また、残響パラメータ推定値更新部26は、前述の第2更新部に対応する。
図5は、第1実施形態の信号強調方法を説明するためのフローチャートである。以下、このフローチャートに沿って本実施形態の信号強調方法を説明する。
まず、信号強調装置1の帯域分割部21に、雑音と残響とが共に存在する環境で観測され、所定の標本化周波数でサンプリングされ量子化された時間領域の観測信号Yκが入力される。なお、κは離散時刻のインデックスを示す。帯域分割部21は、短時間フーリエ変換等によって各離散信号Yκを周波数帯域ごとの狭帯域信号に分割し、周波数領域の観測信号Yt,wを生成し、観測信号記憶部11に格納する(ステップS1)。なお、式(11)で示したように、Y={Yt,w}0≦t≦T-1, 0≦w≦N-1を観測信号の複素スペクトログラムと呼ぶ。
その後、帯域合成部28に源信号の推定値St,w^が入力され、帯域合成部28は、これを、逆短時間フーリエ変換などによって、時間領域の源信号の推定値Sκ^に変換して出力する(ステップS12)。
次に、本実施形態の処理を行って得られる効果を確認する実験を行った。まず、ASJ-JNASデー夕ベースから10名(男性5名、女性5名)による発話を抽出した。発話の継続時間はすべて3秒間である。標本化周波数は8kHz、量子化ビット数は16ビットとした。これら源信号に残響時間がおよそ0.5秒の部屋で収録したインパルス応答を畳み込むことで残響重畳信号を合成した。これに、SNR(Signal to Noise Ratio)が10dBとなるように計算機上で合成した定常白色雑音を加算して雑音残響重畳信号とした。
強調後の源信号の品質は、次式で定義されるSASNR(Segmental Amplitude Signal to Noise Ratio)を用いて評価した。
次に、本発明の第2実施形態を説明する。第1実施形態では、信号を測定するセンサが1個に限定されていたのに対して、本実施形態では、信号を観測するセンサの個数に制限が設けられない。すなわち、センサの個数MはM≧1を満たす任意の整数をとる。よって、残響パラメータに含まれる回帰行列は、M行M列の正方行列である。それ以外の点については、本実施形態におけるパラメータ推定処理の概要は、第1実施形態におけるパラメータ推定処理の概要と同じである。また、M=1であってもよいし、M≧2であってもよく、M=1とした本実施形態は、第1実施形態と等価になる。
本実施形態では、第1更新部は第2パラメータ群のパラメータの推定値を更新し、第2更新部は第1パラメータ群のパラメータの推定値を更新する。
[観測信号記憶処理]
まず、観測信号記憶処理によって、観測信号が記憶部に格納される。
[初期化処理]
次に、初期化処理によって、第1パラメータ群のパラメータの推定値と、第2パラメータ群のパラメータの推定値とが初期化される。
本実施形態の第1更新処理では、第1パラメータ群、すなわち残響パラメータの推定値が固定された状態で、第2パラメータ群、すなわち信号源パラメータの推定値が更新される。本実施形態の第1更新処理は、具体的には、雑音抑圧処理と、信号源パラメータの更新処理とを含む。
雑音抑圧処理では、観測信号とパラメータの推定値を用いて、残響重畳信号の条件付事後分布p(残響重畳信号|観測信号,パラメータの推定値)を特徴づける複素正規分布の平均と共分散行列が算出される。
信号源パラメータ推定値の更新処理では、残響パラメータの推定値と残響重畳信号の条件付事後分布の平均と共分散行列を用いて、信号源パラメータの推定値が更新される。信号源パラメータの推定値は、パラメータの推定値に関する補助関数の値が最大になるように、更新される。
本実施形態の第2更新処理では、第2パラメータ群、すなわち信号源パラメータの推定値が固定された状態で、第1パラメータ群、すなわち残響パラメータの推定値が更新される。残響パラメータの推定値は、パラメータの推定値に関する補助関数の値が最大になるように、更新される。
終了条件判定処理では、所定の終了条件が満たされているか否かが判定される。終了条件が満たされていない場合、第1更新処理に戻る。終了条件が満たされている場合、その時点におけるパラメータの推定値を出力する。
次に、本実施形態の原理を説明する。以下では、第1実施形態との相違点を中心に説明し、第1実施形態と共通する事項については説明を省略する。なお、本実施形態でも、信号は音声信号などの音響信号に限定されない。
次に、本実施形態の原理を説明する。本実施形態でもECMアルゴリズムを適用する。すなわち、観測信号である雑音残響重畳信号の集合yを用い、雑音残響重畳信号の集合yとパラメータの推定値Θ^との組合せを前提条件とした残響重畳信号の集合xの条件付事後分布p(x|y,Θ^)の算出処理(E−step)と、源信号パラメータの推定値sΘ^の算出処理(CM−step1)と、残響パラメータgΘの算出処理(CM−step2)とを代わる代わる繰り返し実行して各推定値を更新し、所定の終了条件を充足した時点での各推定値を真値の推定値(最終推定値)とする。なお、E−stepとCM−step1は先に述べた第1更新処理に、CM−step2は先に述べた第2更新処理に該当する。
本実施形態でも、まず、パラメータΘが与えられた場合における雑音残響重畳信号集合のyの確率密度関数p(y|Θ)が定義される。そのために、観測信号(雑音残響重畳信号)の集合yの統計的モデルが仮定される。本実施形態では、以下に述べる源信号の全極モデル、室内伝達系の多チャンネル自己回帰モデル及び雑音のモデルが仮定される。
まず、本実施形態の源信号の全極モデルについて述べる。t(0≦t≦T-1)番目のフレーム、w(0≦w≦N-1)番目の周波数帯域における源信号の離散フーリエ係数(複素数)をSt,wとおく。また、仮に雑音や残響が存在しない場合に、m(1≦m≦M)番目のセンサで観測されるであろう源信号の離散フーリエ係数をSt,w (m)とおく。また、各St,w (m)を要素とする次のようなM次元の源信号ベクトルが定義される。なお、ατはαの非共役転置を示す。
st,w=[St,w (1),...,St,w (M)]τ (49)
1.ω∈{‐π,π}を角周波数として、t番目のフレームにおける源信号のパワースペクトル密度sλt(ω)は、式(1)(2)に示したような全極型スペクトル密度で表される。よって、信号源パラメータsΘは、sΘ={at,1 ,..., at,P, sσt 2}0≦t≦T-1と定義される。ただし、{mα}0≦α≦M-1は、m0, m1 ,..., mM-1のM個の要素からなる集合を表す。
2.st,wは、以下のような、平均0M、共分散行列sλt(2πw/N)IMのM次元複素正規分布にしたがう。
ここで、ζ=Mとして式(4)を式(50)に代入するとst,wの確率密度関数は次式で表される。
||α||2=αH・α (52)
3.(t,w)≠(t',w')ならば、st,wとst',w'は統計的に独立である。
《室内伝達系のモデル》
次に、本実施形態の室内伝達系のモデルについで述べる。m(1≦m≦M)番目のセンサ、t(0≦t≦T-1)番目のフレーム、w(0≦w≦N-1)番目の周波数帯域における残響重畳信号の離散フーリエ係数をXt,w (m)とおく。また、各Xt,w (m)を要素とする次のようなM次元の残響重畳信号ベクトルが定義される。
xt,w=[Xt,w (1),...,Xt,w (M)]τ (53)
本実施形態では、室内伝達系が各周波数帯域においてMチャネル自己回帰系として表現できると仮定される。すなわち、w番目の周波数帯域における回帰系の回帰行列を
次に、雑音のモデルについて述べる。本実施形態では、m(1≦m≦M)番目のセンサ、t(0≦t≦T-1)番目のフレーム、w(0≦w≦N-1)番目の周波数帯域における、雑音と雑音残響重畳信号との離散フーリエ係数がそれぞれDt,w (m),Yt,w (m)とされる。また、各Dt,w (m)を要素とする次のようなM次元の雑音ベクトルが定義される。
dt,w=[Dt,w (1),...,Dt,w (M)]τ (58)
yt,w=[Yt,w (1),...,Yt,w (M)]τ (59)
雑音残響重畳信号ベクトルyt,wは、残響重畳信号ベクトルxt,wに雑音ベクトルdt,wを加算したものである。
yt,w = xt,w + dt,w (60)
1.雑音は定常であり、そのパワークロススペクトル密度をdΛ(ω)として(定常であるためフレーム番号tには依存しない)、dt,wは平均0M、共分散行列dΛ(2πw/N)の複素正規分布に従う。なお、共分散行列dΛ(2πw/N)のw番目の対角要素は、w番目のセンサにおける雑音のパワースペクトルdλ(m)(2πw/N)である。
2.(t, w)≠(t', w')ならば、dt,wとdt',w'とは統計的に独立である。
3.任意の(t, w, t', w')について、st,wとdt,wとは統計的に独立である。
以上の仮定に基づき、雑音残響重畳信号の確率密度関数が定式化される。
本実施形態では、各センサにおける源信号の複素スペクトログラムからなる集合(源信号ベクトルの集合に相当)がsと表現される。また、各センサにおける残響重畳信号の複素スペクトログラムからなる集合(残響重畳信号ベクトルの集合に相当)がxと表現される。また、雑音残響重畳信号の複素スペクトログラムからなる集合(雑音残響重畳信号ベクトルの集合に相当)がyと表現される。
すなわち、
s={st,w}0≦t≦T-1, 0≦w≦N-1 (62)
x={xt,w}0≦t≦T-1, 0≦w≦N-1 (63)
y={yt,w}0≦t≦T-1, 0≦w≦N-1 (64)
と表現される。
前述のように、本実施形態では、観測された雑音残響重畳信号の集合のyから、未知のパラメータの真値Θ〜が、最尤推定法によって推定される。すなわち、雑音残響重畳信号の集合Yが与えられた場合におけるパラメータΘを変数とした尤度関数p(Y|Θ)を最大化するΘが、真値Θ〜の推定値となる。ただし、本実施形態では、雑音パラメータの真値dΘ〜が源信号の存在しない区間から予め独立に推定され、既知となっている為Θ^={sΘ^, gΘ^, dΘ〜}であり、sΘ^とgΘ^が求められることになる。
1.パラメータの推定値の初期値Θ^(0)が決められる。また、繰り返し回数を示すインデックスiが0にされる。
2.E−step(雑音抑圧処理)
残響重畳信号の条件付事後分布p(x|y, Θ^(i))が計算される。
3.CM−step1(信号源パラメータ推定値の更新処理)
補助関数Q(Θ|Θ^(i))が次式により定義される。
4.CM−step2(残響パラメータ推定値の更新処理)
次の手続きにより、残響パラメータの推定値が更新される。
5.終了条件判定
所定の終了条件を満たしているならばsΘ^=sΘ^(i+1),gΘ^=gΘ^(i+1)として終了。そうでなければ、iを1だけ漸増させて「2.E−step」へ戻る。
以下では、E−step、CM−step1及びCM−step2の各計算方法を説明する。
1.E−stepの計算方法
すべてのセンサにおける、源信号、残響重畳信号、雑音残響重畳信号のw番目の周波数帯域の離散フーリエ係数系列を、それぞれまとめて次のように表す。
式(77)の残響重畳信号の条件付事後分布p(x|y, Θ^(i))は、次式に示すように周波数帯域wごとに独立な複数の複素正規分布によって表現できる。
dΛT-1 〜(2πw/N)= dΛT-2 〜(2πw/N)=...=dΛ0 〜(2πw/N)=dΛ〜(2πw/N) (89)
である。
また、後の処理のために、μvm,w (i)を平均μw(Θ^(i),y)のM(T-m-1)+1からM(T-m)番目までの要素で構成される部分ベクトルとし、μvm:n,w (i)(m≧n)を平均μw(Θ^(i),y)のM(T-m-1)+1からM(T-m)番目までの要素で構成される部分ベクトルとする。また、ΣV(m1:n1,m2:n2),w (i)を共分散行列Σw(Θ^ (i))の(M(T-m1-1)+1,M(T-m2-1)+1)番目の要素から(M(T-n1),M(T-n2))番目の要素で構成される部分行列とする。
t番目のフレームにおける源信号の線形予測係数とその推定値が、式(35)のようなベクトルで表現される。
信号源パラメータsΘとその推定値sΘ^は、それぞれ{at, sσt 2}及び{at^, sσ^t 2}の全フレーム(0≦t≦T-1)にわたる集合と等価である。
式(78)による信号源パラメータの更新は、式(36)(37)に示したat及びsσt 2の推定値の更新を全フレーム(0≦t≦T-1)にわたって実行することで実現される。ただし、本実施形態では、式(41)(42)に代えて
3.CM−step2の計算方法
w番目の周波数帯域における残響パラメータとその推定値が、それぞれ次のようなベクトルで表現される。
式(78)による残響パラメータの更新は、次式に示すGwの推定値の更新を全周波数帯域(0≦w≦N-1)にわたって実行することで実現される。
次に、本実施形態の信号強調装置の構成を説明する。
図6は、第2実施形態の信号強調装置100の構成を示すブロック図である。また、図7は、源信号推定部127の詳細構成を示すブロック図である。
図8は、第2実施形態の信号強調方法を説明するためのフローチャートである。以下、このフローチャートに沿って本実施形態の信号強調方法を説明する。
まず、信号強調装置100の帯域分割部121に、M個のセンサによってそれぞれ観測され、量子化された時間領域の観測信号Yκ (m)(1≦m≦M)を要素とする観測信号ベクトル[Yκ (1),...,Yκ (M)]τが入力される。帯域分割部121は、短時間フーリエ変換等によって観測信号ベクトル[Yκ (1),...,Yκ (M)]τを、時間周波数領域の観測信号ベクトルyt,w= [Yt,w (1),...,Yt,w (M)]τに変換し、観測信号記憶部111に格納する(ステップS101)。
算出された源信号の推定値St,w^はパラメータ記憶部112に格納される。
その後、帯域合成部28に源信号の推定値St,w^が入力され、帯域合成部28は、これを、逆短時間フーリエ変換などによって、源信号の推定値Sκ^に変換して出力する(ステップS112)。
次に、本実施形態の処理を行って得られる効果を確認する実験を行った。男女2話者により発話された音声を用意した。各音声の音響信号に対して、残響時間が約0.5秒の部屋で2個のマイクロホンで収録したインパルス応答を畳み込むことで、残響音声信号を合成した。これに、SN比が15dBとなる白色雑音を加算することで、雑音残響音声信号をシミュレートした。
次に、第3実施形態を説明する。
<本実施形態のパラメータ推定処理の概要>
まず、本実施形態のパラメータ推定部における処理の概要を説明する。本実施形態では、第2パラメータ群は、信号源パラメータに加えて、少なくとも、ステアリングベクトルを含む。また、本実施形態では、第1更新部は第2パラメータ群の推定値を更新し、第2更新部は第1パラメータ群のパラメータの推定値を更新する。
まず、観測信号記憶処理によって、観測信号が記憶部に格納される。
[初期化処理]
次に、初期化処理によって、第1パラメータ群のパラメータの推定値と、第2パラメータ群のパラメータの推定値とが初期化される。
[第1更新処理]
本実施形態の第1更新処理では、第1パラメータ群、すなわち残響パラメータの推定値が固定された状態で、第2パラメータ群、すなわち信号源パラメータの推定値が更新される。本実施形態の第1更新処理は、具体的には、源信号推定値更新処理、ステアリングベクトル推定値更新処理、信号源パラメータ推定値更新処理を含む。
源信号推定値更新処理では、まず、観測信号と残響パラメータの推定値を用いて、雑音重畳信号の推定値を算出する。この処理は、雑音残響重畳信号を入力として雑音重畳信号を出力するという点において、残響抑圧処理に相当すると解釈される。
ステアリングベクトル推定値更新処理では、雑音重畳信号推定値と源信号推定値とを用いて、ステアリングベクトルの推定値が更新される。ステアリングベクトルの推定値は、パラメータに関する対数尤度関数が増加するように、更新される。
信号源パラメータ推定値更新処理では、源信号の推定値と誤差分散から、源信号のパワースペクトルの推定値を算出する。このパワースペクトルの推定値に基づいて、信号源パラメータの推定値が更新される。この更新処理は、パラメータに関する対数尤度関数を増加させる。
本実施形態の第2更新処理では、第2パラメータ群、すなわち信号源パラメータ、雑音パラメータ、ステアリングベクトルの各々の推定値が固定された状態で、第1パラメータの群、すなわち残響パラメータの推定値が更新される。本実施形態の第2更新処理は、具体的には、源信号短時間パワースペクトル推定値更新処理、残響パラメータ推定値更新処理、雑音パラメータ推定値更新処理を含む。
源信号短時間パワースペクトル推定値更新処では、信号源パラメータ推定値を用いて源信号のパワースペクトルの推定値を更新する。
次に、雑音パラメータ推定値更新処理では、雑音重畳信号の推定値、源信号の推定値、ステアリングベクトルの推定値を用いて、雑音パラメータの推定値を更新する。この更新処理は、パラメータに関する対数尤度関数を増加させる。
残響パラメータ推定値更新処理では、観測信号と、更新された源信号のパワースペクトルの推定値と、雑音パラメータの推定値を用いて、残響パラメータの推定値を更新する。残響パラメータの推定値は、信号源パラメータの推定値と雑音パラメータの推定値とステアリングベクトルの推定値とが固定されている条件の下で、パラメータに関する対数尤度関数が最大になるように更新される。
終了条件判定処理では、所定の終了条件が満たされているか否かが判定される。終了条件がを満たされていない場合、第1更新処理に戻る。終了条件が満たされている場合、その時点におけるパラメータの推定値を出力する。
次に、本実施形態の原理を説明する。
本実施形態の信号強調装置の源信号推定部は、観測信号に含まれる残響を線形フィルタ処理で抑圧して雑音重畳信号を推定した後に、Wienerフィルタ等の非線形フィルタ処理により雑音重畳信号から雑音を抑圧する。この手順を実現するために、本実施形態のパラメータ推定部が生成するパラメータが第1,2実施形態のパラメータと異なる。
源信号の短時間パワースペクトル密度はP次の全極型の関数で与えられる。すなわち、第tフレームにおける源信号のパワースペクトル密度は、式(102)で与えられる。
《雑音のモデル》
雑音は定常であると仮定すると、雑音の短時間パワースペクトル密度と短時間クロススペクトル密度は時不変である。すなわち、これらはフレーム番号tに依存しない。そこで、これらを式(106)のような行列で表現する。
雑音ベクトルvt,wは、平均O M=[0,…,0]τ、共分散行列が雑音短時間パワークロススペクトル行列vΛwに等しいM次元複素正規分布に従う。すなわち、雑音ベクトルvt,wの確率密度関数は式(108)で与えられる。
したがって、本実施形態のパラメータΘは式(109)〜式(113)で定義される。
本実施形態の源信号推定部は、まず、式(114)に従って観測信号ベクトルyt,wから残響を抑圧して雑音重畳信号ベクトルの推定値残響抑圧信号φt,w^を求める。
《パラメータの対数尤度関数》
上記した源信号及び雑音と、観測信号ベクトルの生成モデル式(99)と式(100)とに基づき、パラメータΘの対数尤度関数
L(Θ;y)=log p(y|Θ) (117)
は、式(118)で表せる。
これと式(99)により、過去の観測信号ベクトルが与えられた下での観測信号ベクトルyt,wの条件付確率密度関数が、式(120)で与えられることが分る。
<本実施形態の構成及び処理>
図9は、第3実施形態の信号強調装置200の機能構成例を示すブロック図である。図10は、第3実施形態の処理を説明するためのフローチャートである。
図11は、第3実施形態のパラメータ推定部310の機能構成例を示すブロック図である。また、図12は、第3実施形態のパラメータ推定処理を説明するためのフローチャートである。本実施形態のパラメータ推定部310は、未知のパラメータΘを最尤推定するために残響パラメータgΘ、ステアリングベクトルbΘ、信号源パラメータsΘ、雑音パラメータvΘのそれぞれの推定値を繰り返し更新する。
信号源パラメータ推定値更新部314は、源信号の推定値St,w (i+1)^のパワーとその誤差分散εt,w (i+1)を式(124)に示すように加算してパワースペクトルγt,w (i+1)を求める。
次に、1フレーム前の観測信号行列MYt−1,wを式(128)のように定義する。
本実施形態の信号強調方法の効果を確認する目的で実験を行った。実験条件を説明する。源信号には、ASJ-JNASデータベースから抽出した10名(男性5名、女性5名)による発話を用いた。これらの音声を残響時間が約0.6秒の部屋でスピーカーから再生し、スピーカーから1.8m離して設置した2個のマイクロホンで録音した。また、同じ部屋、同じマイクロホンで、4箇所に設置したスピーカーから同時に再生したピンクノイズを録音した。その後、録音された残響音声と雑音をSN比が10dBとなるように加算したものを時間領域の観測信号として用いた。なお、録音時の標本化周波数は8kHzとした。
源信号の線形予測次数はP=12とした。回帰次数Kwは、観測信号の周波数が100Hz未満ならばKw=5、100Hz〜200HzならばKw=10、200Hz〜1000HzならばKw=30、1000Hz〜1500HzならばKw=20、1500Hz〜2000HzならばKw=15、2000Hz〜3000HzならばKw=10、3000Hz以上ならばKw=5とした。また、収束判定部は、繰り返し回数が3回で収束したと判定する。
Lim, J. S. and Oppenheim, A. V. , "All-pole modeling of degraded speech," IEEE Trans. Acoust. Speech, Signal Process., Vol. 26, No. 3, pp.197-210 (1978). Yoshioka, T., Hikichi, T. and Miyoshi, M., "Dereverberation by Using Time-Variant Nature of Speech Production System, EURASIP J. Advances in Signal Process., Vol. 2007, (2007), Article ID 65698, 15 pages, doi:10.1155/2007/65698.
前述のように、本実施形態では、観測された雑音残響重畳信号の集合のyから、未知のパラメータの真値Θ〜が、最尤推定法によって推定される。すなわち、雑音残響重畳信号の集合yが与えられた場合におけるパラメータΘを変数とした尤度関数p(y|Θ)を最大化するΘが、真値Θ〜の推定値となる。ただし、本実施形態では、雑音パラメータの真値dΘ〜が源信号の存在しない区間から予め独立に推定され、既知となっている為Θ^={sΘ^,gΘ^, dΘ〜}であり、sΘ^とgΘ^が求められることになる。
源信号短時間パワースペクトル推定値更新処理では、信号源パラメータ推定値を用いて源信号のパワースペクトルの推定値を更新する。
本実施形態の源信号推定部は、まず、式(114)に従って観測信号ベクトルyt,wから残響を抑圧して雑音重畳信号ベクトルの推定値(残響抑圧信号)φt,w^を求める。
次に、1フレーム前の観測信号行列MYt−1,wを式(128)のように定義する。
Claims (17)
- 観測された時間領域信号から変換された時間周波数領域の観測信号を格納する記憶部と、
前記観測信号に含まれる残響の推定値を算出する線形畳み込み演算の回帰係数を含む残響パラメータ推定値と、源信号のパワースペクトルを特定する線形予測係数と予測残差パワーとの推定値を含む信号源パラメータ推定値と、雑音のパワースペクトルの推定値を含む雑音パラメータ推定値と、を含むパラメータ推定値の初期値を設定する初期化部と、
前記観測信号と前記パラメータ推定値とが入力され、前記残響パラメータ推定値および雑音パラメータ推定値の少なくとも一部の更新処理、あるいは前記信号源パラメータ推定値の更新処理、のいずれか一方を実行するように構成され、当該更新処理が前記パラメータ推定値に関する対数尤度関数の値が増加するように実行される処理である、第1更新部と、
前記第1更新部で得られたパラメータ推定値の更新値の少なくとも一部が入力され、前記残響パラメータ推定値および雑音パラメータ推定値の少なくとも一部の更新処理、あるいは前記信号源パラメータ推定値の更新処理のうち、前記第1更新部で実行されなかったものを実行するように構成され、当該更新処理が前記パラメータ推定値の更新値に関する対数尤度関数の値が増加するように実行される処理である、第2更新部と、
終了条件が満たされるか否かを判定する終了条件判定部と、を有し、
前記終了条件が満たされない場合、前記第1更新部と前記第2更新部の処理が再び実行される、信号強調装置。 - 請求項1の信号強調装置であって、
前記時間領域信号が、M個のセンサで観測された信号であり、
前記残響パラメータ推定値が、前記回帰係数を要素にもつM行M列の回帰行列推定値を含み、
前記雑音パラメータ推定値が、前記雑音のパワースペクトルを対角要素とするM行M列の雑音パワークロススペクトル行列推定値を含み、
前記パラメータ推定値が、前記残響パラメータ推定値と、前記信号源パラメータ推定値と、前記雑音パラメータ推定値と、M次元のステアリングベクトル推定値と、を含み、
前記第1更新部が、
源信号推定値更新部と、ステアリングベクトル推定値更新部と、信号源パラメータ推定値更新部と、を含み、
前記源信号推定値更新部は、前記観測信号と前記パラメータ推定値とが入力され、雑音重畳信号推定値と、源信号推定値と、前記源信号推定値の誤差分散とを算出するように構成され、
前記ステアリングベクトル推定値更新部は、前記雑音重畳信号推定値と前記源信号推定値とが入力され、ステアリングベクトル推定値の更新値を算出するように構成され、
前記信号源パラメータ推定値更新部は、前記源信号推定値のパワーと前記誤差分散とを加算してパワースペクトルを算出し、前記パワースペクトルを用いて信号源パラメータ推定値の更新値を算出するように構成され、
前記第2更新部が、源信号パワースペクトル推定値更新部と、雑音パラメータ推定値更新部と、残響パラメータ推定値更新部と、を含み、
前記源信号パワースペクトル推定値更新部は、前記信号源パラメータ推定値の更新値が入力され、前記信号源パラメータ推定値の更新値に対応する源信号パワースペクトル推定値の更新値を算出するように構成され、
前記雑音パラメータ推定値更新部は、前記源信号推定値と、前記雑音重畳信号推定値と、前記ステアリングベクトル推定値の更新値とが入力され、前記雑音パラメータ推定値の更新値を生成するように構成され、
前記残響パラメータ推定値更新部は、前記観測信号と、前記ステアリングベクトル推定値の更新値と、前記源信号パワースペクトル推定値の更新値と、前記雑音パラメータ推定値の更新値とが入力され、前記回帰行列推定値の更新値を算出するように構成される、
信号強調装置。 - 請求項2の信号強調装置であって、
前記雑音パワークロススペクトル行列推定値のm行m列(m∈1,...,M)の要素が、m番目のセンサに対応する前記雑音のパワースペクトルであり、前記雑音パワークロススペクトル行列推定値のm1行m2列(m1,m2∈1,...,M)の要素が、m1番目のセンサに対応する前記観測信号の雑音と、m2番目のセンサに対応する前記観測信号の雑音との間のクロススペクトルであり、
前記雑音重畳信号推定値が、それぞれの要素が各センサに対応する前記観測信号であるM次元ベクトルの非共役転置である観測信号ベクトルから、前記回帰行列推定値と前記観測信号ベクトルとの畳み込み演算結果を減じたM次元ベクトルであり、
前記源信号推定値が、前記源信号パワースペクトル推定値と前記雑音パワークロススペクトル行列推定値と前記ステアリングベクトル推定値とに対応するWienerフィルタのゲインベクトルと、前記雑音重畳信号推定値と、の積であり、
前記源信号推定値の誤差分散が、前記ステアリングベクトル推定値の非共役転置と前記雑音パワークロススペクトル行列推定値の逆行列と前記ステアリングベクトル推定値との積と、前記信号源パラメータ推定値に対応する源信号パワースペクトル推定値の逆数と、の加算値の逆数であり、
前記ステアリングベクトル推定値の更新値が、前記源信号推定値の複素共役値と前記雑音重畳信号推定値との積和を、前記源信号推定値のパワーの積和で割ったベクトルであり、
前記雑音パワークロススペクトル行列推定値の更新値が、前記雑音重畳信号推定値から前記源信号推定値と前記ステアリングベクトル推定値の更新値との積を減じた雑音ベクトルと、当該雑音ベクトルの共役転置との積和であり、
前記回帰行列推定値の更新値の要素からなる成分ベクトルが、前記観測信号を要素とする観測信号行列の共役転置と雑音重畳信号の共分散行列の推定値の逆行列と前記観測信号行列との積和の逆行列と、前記観測信号行列の共役転置と雑音重畳信号の共分散行列の推定値の逆行列と前記観測信号ベクトルとの積和と、の積の共役転置であり、
前記雑音重畳信号の共分散行列の推定値が、前記源信号パワースペクトル推定値の更新値と前記ステアリングベクトル推定値の更新値と前記ステアリングベクトル推定値の更新値の共役転置との積と、前記雑音パワークロススペクトル行列推定値の更新値との和である、信号強調装置。 - 請求項2の信号強調装置であって、
前記残響パラメータ推定値又はその更新値に含まれる回帰行列推定値の回帰次数が、周波数帯域によって異なる、信号強調装置。 - 請求項2の信号強調装置であって、
前記観測信号と残響パラメータ最終推定値とが入力され、前記観測信号ベクトルから、前記残響パラメータ最終推定値と前記観測信号との畳み込み演算結果を減じたM次元ベクトルである雑音重畳信号最終推定値を生成する線形フィルタ処理部と、
信号源パラメータ最終推定値によって特定される源信号パワースペクトル最終推定値と、雑音パラメータ最終推定値に含まれる雑音パワークロススペクトル行列最終推定値と、ステアリングベクトル最終推定値と、前記雑音重畳信号最終推定値とが入力され、前記源信号パワースペクトル最終推定値と前記雑音パワークロススペクトル行列最終推定値と前記ステアリングベクトル最終推定値とに対応するWienerフィルタのゲインベクトルと、前記雑音重畳信号最終推定値と、の積を源信号最終推定値とする非線形フィルタ処理部と、を有し、
前記残響パラメータ最終推定値、前記信号源パラメータ最終推定値、前記雑音パラメータ最終推定値、及び前記ステアリングベクトル最終推定値が、前記終了条件を満たした時点における前記回帰行列推定値の更新値、前記信号源パラメータ推定値の更新値、前記雑音パラメータ最終推定値の更新値、及び前記ステアリングベクトル推定値の更新値を含む、信号強調装置。 - 請求項1の信号強調装置であって、
前記観測信号が1個のセンサで観測された信号であり、
前記残響パラメータ推定値が、前記回帰係数の推定値を含み、
前記雑音パラメータ推定値が、前記雑音のパワースペクトルの推定値を含み、
前記パラメータ推定値が、前記信号源パラメータ推定値と、前記残響パラメータ推定値と、前記雑音パラメータ推定値と、を含み、
前記第1更新部が、
雑音抑圧処理部と、信号源パラメータ推定値更新部と、を含み、
前記雑音抑圧処理部は、
前記観測信号と前記パラメータ推定値とが入力され、所定の観測区間に属する前記観測信号の集合と前記パラメータ推定値との組合せを前提条件とした前記観測区間に属する残響重畳信号の集合の条件付事後分布p(残響重畳信号の集合|観測信号の集合,パラメータ推定値)を特定する複素正規分布の平均及び共分散行列を算出するように構成され、
前記残響重畳信号が、前記観測信号から雑音が取り除かれた信号であり、
前記信号源パラメータ推定値更新部は、
前記残響パラメータ推定値と、前記複素正規分布の平均及び共分散行列とが入力され、 信号源パラメータ推定値の更新値を算出するように構成され、
前記信号源パラメータ推定値の更新値は、残響パラメータが前記残響パラメータ推定値に固定された条件下で、第1補助関数値を最大化する値であり、
前記第1補助関数値が、前記観測信号の集合と前記残響重畳信号の集合とが与えられたときの、前記残響パラメータの推定値と、前記信号源パラメータ推定値の更新値と、前記雑音パラメータ推定値とを含む第2パラメータ推定値に関する尤度関数値p(観測信号の集合,残響重畳信号の集合|第2パラメータ推定値)の対数関数と、前記条件付事後分布p(残響重畳信号の集合|観測信号の集合,パラメータ推定値)の積を、当該残響重畳信号の集合について積分した関数の関数値であり、
前記第2更新部が、
前記信号源パラメータ推定値の更新値と、前記複素正規分布の平均及び共分散行列とが入力され、残響パラメータ推定値の更新値を算出するように構成された残響パラメータ推定値更新部を含み、
前記残響パラメータ推定値の更新値は、信号源パラメータが前記信号源パラメータ推定値の更新値に固定された条件下で、第2補助関数値を最大化する値であり、
前記第2補助関数値が、前記観測信号の集合と前記残響重畳信号の集合とが与えられたときの、前記残響パラメータの推定値の更新値と、前記信号源パラメータ推定値の更新値と、前記雑音パラメータ推定値とを含む第3パラメータ推定値に関する尤度関数値p(観測信号の集合,残響重畳信号の集合|第3パラメータ推定値)の対数関数と、前記条件付事後分布p(残響重畳信号の集合|観測信号の集合,パラメータ推定値)の積を、当該残響重畳信号の集合について積分した関数の関数値である、信号強調装置。 - 請求項1の信号強調装置であって、
前記時間領域信号が、M個のセンサで観測された信号であり、Mが2以上であり、
前記残響パラメータ推定値が、前記回帰係数を要素にもつM行M列の回帰行列推定値を含み、
前記雑音パラメータ推定値が、前記雑音のパワースペクトルの推定値を対角要素とする、M行M列の雑音パワークロススペクトル行列推定値を含み、
前記パラメータ推定値が、前記信号源パラメータ推定値と、前記残響パラメータ推定値と、前記雑音パラメータ推定値と、を含み、
前記第1更新部が、雑音抑圧処理部と、信号源パラメータ推定値更新部と、を含み、
前記雑音抑圧処理部は、
前記観測信号と前記パラメータ推定値とが入力され、所定の観測区間に属する前記観測信号の集合と前記パラメータ推定値との組合せを前提条件とした前記観測区間に属する前記残響重畳信号の集合の条件付事後分布p(残響重畳信号の集合|観測信号の集合,パラメータ推定値)を特定する複素正規分布の平均及び共分散行列を算出するように構成され、
前記残響重畳信号が、前記観測信号から雑音が取り除かれた信号であり、
前記信号源パラメータ推定値更新部は、
前記残響パラメータ推定値と、前記複素正規分布の平均及び共分散行列とが入力され、信号源パラメータ推定値の更新値を算出するように構成され、
前記信号源パラメータ推定値の更新値は、残響パラメータが前記残響パラメータ推定値に固定された条件下で、第1補助関数値を最大化する値であり、
前記第1補助関数値が、前記観測信号の集合と前記残響重畳信号の集合とが与えられたときの、前記残響パラメータの推定値と、前記信号源パラメータ推定値の更新値と、前記雑音パラメータ推定値とを含む第2パラメータ推定値に関する尤度関数値p(観測信号の集合,残響重畳信号の集合|第2パラメータ推定値)の対数関数と、前記条件付事後分布p(残響重畳信号の集合|観測信号の集合,パラメータ推定値)の積を、当該残響重畳信号の集合について積分した関数の関数値であり、
前記第2更新部が、
前記信号源パラメータ推定値の更新値と、前記複素正規分布の平均及び共分散行列とが入力され、残響パラメータ推定値の更新値を算出するように構成された残響パラメータ推定値更新部を含み、
前記残響パラメータ推定値の更新値は、信号源パラメータが信号源パラメータ推定値の更新値に固定された条件下で、第2補助関数値を最大化する値であり、
前記第2補助関数値が、前記観測信号の集合と前記残響重畳信号の集合とが与えられたときの、前記残響パラメータの推定値の更新値と、前記信号源パラメータ推定値の更新値と、前記雑音パラメータ推定値とを含む第3パラメータ推定値に関する尤度関数値p(観測信号の集合,残響重畳信号の集合|第3パラメータ推定値)の対数関数と、前記条件付事後分布p(残響重畳信号の集合|観測信号の集合,パラメータ推定値)の積を、当該残響重畳信号の集合について積分した関数の関数値である、信号強調装置。 - 請求項6又は7の信号強調装置であって、
前記雑音パラメータ推定値は、前記雑音の確率分布を示す複素正規分布の分散である、前記雑音のパワースペクトルの推定値を含み、前記残響重畳信号の集合の条件付事後分布p(残響重畳信号の集合|観測信号,パラメータ推定値)の共分散行列のスケールは、前記雑音の確率分布を示す複素正規分布の分散に対して単調増加する値である、信号強調装置。 - 請求項6又は7の信号強調装置であって、
前記観測信号と、前記終了条件を満たした場合の前記第3パラメータ推定値とが入力され、前記源信号の推定値を生成する源信号推定部を有し、
前記源信号推定部は、
前記観測信号と、前記終了条件を満たした場合の前記第3パラメータ推定値とが入力され、前記残響重畳信号の集合の条件付事後分布p(残響重畳信号の集合|観測信号の集合,パラメータ推定値)の平均を残響重畳信号最終推定値として算出する残響重畳信号推定部と、
前記残響重畳信号最終推定値と、前記終了条件を満たした場合の前記第3パラメータ推定値が含む前記第2残響パラメータ推定値とが入力され、前記残響重畳信号最終推定値から、前記残響重畳信号最終推定値と当該第2残響パラメータ推定値に含まれる回帰係数又は回帰行列との畳み込み演算結果を減じ、源信号最終推定値を生成する線形フィルタ適用部と、を有する、信号強調装置。 - 請求項6又は7の信号強調装置であって、
前記雑音成分のパワースペクトルの推定値が、前記源信号が存在しないと推定される区間の前記観測信号から推定された値である、信号強調装置。 - 請求項6又は7の信号強調装置であって、
前記残響パラメータ推定値及び前記残響パラメータ推定値の更新値に含まれる回帰行列推定値の回帰次数が、周波数帯域によって異なる、信号強調装置。 - (A) 観測された時間領域信号から変換された時間周波数領域の観測信号を記録部に格納するステップと、
(B) 初期化部において、前記観測信号に含まれる残響の推定値を算出する線形畳み込み演算の回帰係数を含む残響パラメータ推定値と、源信号のパワースペクトルを特定する線形予測係数と予測残差パワーとの推定値を含む信号源パラメータ推定値と、雑音のパワースペクトルの推定値を含む雑音パラメータ推定値と、を含むパラメータ推定値の初期値を設定するステップと、
(C) 前記観測信号と前記パラメータ推定値とを第1更新部に入力し、当該第1更新部において、前記残響パラメータ推定値および雑音パラメータ推定値の少なくとも一部の更新処理、あるいは前記信号源パラメータ推定値の更新処理、のいずれか一方を、前記パラメータ推定値に関する対数尤度関数の値が増加するように実行するステップと、
(D) 前記ステップ(C)で得られたパラメータ推定値の更新値の少なくとも一部を第2更新部に入力し、当該第2更新部において、残響パラメータ推定値および雑音パラメータ推定値の少なくとも一部の更新処理、あるいは前記信号源パラメータ推定値の更新処理のうち、前記ステップ(C)で実行されなかったものを、前記パラメータ推定値の更新値に関する対数尤度関数の値が増加するように実行するステップと、
(E) 終了条件判定部において、終了条件が満たされるか否かを判定するステップと、を有し、
前記終了条件が満たされない場合、前記第1更新部と前記第2更新部の処理が再び実行される、信号強調方法。 - 請求項12の信号強調方法であって、
前記時間領域信号が、M個のセンサで観測された信号であり、
前記残響パラメータ推定値が、前記回帰係数を要素にもつM行M列の回帰行列推定値を含み、
前記雑音パラメータ推定値が、前記雑音のパワースペクトルを対角要素とするM行M列の雑音パワークロススペクトル行列推定値を含み、
前記パラメータ推定値が、前記残響パラメータ推定値と、前記信号源パラメータ推定値と、前記雑音パラメータ推定値と、M次元のステアリングベクトル推定値と、を含み、
前記第1更新部が、
源信号推定値更新部と、ステアリングベクトル推定値更新部と、信号源パラメータ推定値更新部と、を含み、
前記ステップ(C)が、
(C-1) 前記源信号推定値更新部において、前記観測信号と前記パラメータ推定値とが入力され、雑音重畳信号推定値と、源信号推定値と、前記源信号推定値の誤差分散とを算出するステップと、
(C-2) 前記ステアリングベクトル推定値更新部において、前記雑音重畳信号推定値と前記源信号推定値とが入力され、ステアリングベクトル推定値の更新値を算出するステップと、
(C-3) 前記信号源パラメータ推定値更新部において、前記源信号推定値のパワーと前記誤差分散とを加算してパワースペクトルを算出し、前記パワースペクトルを用いて信号源パラメータ推定値の更新値を算出するステップと、を含み、
前記第2更新部が、源信号パワースペクトル推定値更新部と、雑音パラメータ推定値更新部と、残響パラメータ推定値更新部とを含み、
前記ステップ(D)が、
(D-1) 前記信号源パラメータ推定値の更新値を前記源信号パワースペクトル推定値更新部に入力し、前記源信号パワースペクトル推定値更新部において、前記信号源パラメータ推定値の更新値に対応する源信号パワースペクトル推定値の更新値を算出するステップと、
(D-2) 前記源信号推定値と、前記雑音重畳信号推定値と、前記ステアリングベクトル推定値の更新値を前記雑音パラメータ推定値更新部に入力し、前記雑音パラメータ推定値更新部において、前記雑音パラメータ推定値の更新値を生成するステップと、
(D-3)前記観測信号と、前記ステアリングベクトル推定値の更新値と、前記源信号パワースペクトル推定値の更新値と、前記雑音パラメータ推定値の更新値とを前記残響パラメータ推定値更新部に入力し、前記残響パラメータ推定値更新部において、前記回帰行列推定値の更新値を算出するステップと、を含む、信号強調方法。 - 請求項12の信号強調方法であって、
前記時間領域信号が1個のセンサで観測された信号であり、
前記残響パラメータ推定値が、前記回帰係数の推定値を含み、
前記雑音パラメータ推定値が、前記雑音のパワースペクトルの推定値を含み、
前記パラメータ推定値が、前記信号源パラメータ推定値と、前記残響パラメータ推定値と、前記雑音パラメータ推定値と、を含み、
前記第1更新部が、
雑音抑圧処理部と、信号源パラメータ推定値更新部と、を含み、
前記ステップ(C)が、
(C-1) 前記観測信号と前記パラメータ推定値とを前記雑音抑圧処理部に入力し、前記雑音抑圧処理部において、所定の観測区間に属する前記観測信号の集合と前記パラメータ推定値との組合せを前提条件とした前記観測区間に属する残響重畳信号の集合の条件付事後分布p(残響重畳信号の集合|観測信号の集合,パラメータ推定値)を特定する複素正規分布の平均及び共分散行列を算出するステップと、
(C-2) 前記残響パラメータ推定値と、前記複素正規分布の平均及び共分散行列とを前記信号源パラメータ推定値更新部に入力し、前記信号源パラメータ推定値更新部において、信号源パラメータ推定値の更新値を算出するステップと、を含み、
前記残響重畳信号が、前記観測信号から雑音が取り除かれた信号であり、
前記信号源パラメータ推定値の更新値は、残響パラメータが前記残響パラメータ推定値に固定された条件下で、第1補助関数値を最大化する値であり、
前記第1補助関数値が、前記観測信号の集合と前記残響重畳信号の集合とが与えられたときの、前記残響パラメータの推定値と、前記信号源パラメータ推定値の更新値と、前記雑音パラメータ推定値とを含む第2パラメータ推定値に関する尤度関数値p(観測信号の集合,残響重畳信号の集合|第2パラメータ推定値)の対数関数と、前記条件付事後分布p(残響重畳信号の集合|観測信号の集合,パラメータ推定値)の積を、当該残響重畳信号の集合について積分した関数の関数値であり、
前記第2更新部が、残響パラメータ推定値更新部を含み、
前記ステップ(D)が、
前記信号源パラメータ推定値の更新値と、前記複素正規分布の平均及び共分散行列とを前記残響パラメータ推定値更新部に入力し、前記残響パラメータ推定値更新部において、前記残響パラメータ推定値の更新値を算出するステップを含み、
前記残響パラメータ推定値の更新値は、信号源パラメータが前記信号源パラメータ推定値の更新値に固定された条件下で、第2補助関数値を最大化する値であり、
前記第2補助関数値が、前記観測信号の集合と前記残響重畳信号の集合とが与えられたときの、前記残響パラメータの推定値の更新値と、前記信号源パラメータ推定値の更新値と、前記雑音パラメータ推定値とを含む第3パラメータ推定値に関する尤度関数値p(観測信号の集合,残響重畳信号の集合|第3パラメータ推定値)の対数関数と、前記条件付事後分布p(残響重畳信号の集合|観測信号の集合,パラメータ推定値)の積を、当該残響重畳信号の集合について積分した関数の関数値である、信号強調方法。 - 請求項12の信号強調方法であって、
前記時間領域信号が、M個のセンサで観測された信号であり、Mが2以上であり、
前記残響パラメータ推定値が、前記回帰係数を要素にもつM行M列の回帰行列推定値を含み、
前記雑音パラメータ推定値が、前記雑音のパワースペクトルの推定値を対角要素とする、M行M列の雑音パワークロススペクトル行列推定値を含み、
前記パラメータ推定値が、前記信号源パラメータ推定値と、前記残響パラメータ推定値と、前記雑音パラメータ推定値と、を含み、
前記第1更新部が、雑音抑圧処理部と、信号源パラメータ推定値更新部と、を含み、
前記ステップ(C)が、
(C-1) 前記観測信号と前記パラメータ推定値とを前記雑音抑圧処理部に入力し、前記雑音抑圧処理部において、所定の観測区間に属する前記観測信号の集合と前記パラメータ推定値との組合せを前提条件とした前記観測区間に属する前記残響重畳信号の集合の条件付事後分布p(残響重畳信号の集合|観測信号の集合,パラメータ推定値)を特定する複素正規分布の平均及び共分散行列を算出するステップと、
(C-2) 前記残響パラメータ推定値と、前記複素正規分布の平均及び共分散行列を前記信号源パラメータ推定値更新部に入力し、前記信号源パラメータ推定値更新部ににおいて、信号源パラメータ推定値の更新値を算出するステップと、を含み、
前記残響重畳信号が、前記観測信号から雑音が取り除かれた信号であり、
前記信号源パラメータ推定値の更新値は、残響パラメータが前記残響パラメータ推定値に固定された条件下で、第1補助関数値を最大化する値であり、
前記第1補助関数値が、前記観測信号の集合と前記残響重畳信号の集合とが与えられたときの、前記残響パラメータの推定値と、前記信号源パラメータ推定値の更新値と、前記雑音パラメータ推定値とを含む第2パラメータ推定値に関する尤度関数値p(観測信号の集合,残響重畳信号の集合|第2パラメータ推定値)の対数関数と、前記条件付事後分布p(残響重畳信号の集合|観測信号の集合,パラメータ推定値)の積を、当該残響重畳信号の集合について積分した関数の関数値であり、
前記第2更新部が、残響パラメータ推定値更新部を含み、
前記ステップ(D)が、
前記信号源パラメータ推定値の更新値と、前記複素正規分布の平均及び共分散行列とを前記残響パラメータ推定値更新部に入力し、前記残響パラメータ推定値更新部において、前記残響パラメータ推定値の更新値を算出するステップを含み、
前記残響パラメータ推定値の更新値は、信号源パラメータが前記信号源パラメータ推定値の更新値に固定された条件下で、第2補助関数値を最大化する値であり、
前記第2補助関数値が、前記観測信号の集合と前記残響重畳信号の集合とが与えられたときの、前記残響パラメータの推定値の更新値と、前記信号源パラメータ推定値の更新値と、前記雑音パラメータ推定値とを含む第3パラメータ推定値に関する尤度関数値p(観測信号の集合,残響重畳信号の集合|第3パラメータ推定値)の対数関数と、前記条件付事後分布p(残響重畳信号の集合|観測信号の集合,パラメータ推定値)の積を、当該残響重畳信号の集合について積分した関数の関数値である、信号強調方法。 - 請求項12から15の何れかの信号強調方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項16のプログラムを格納したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010501966A JP5124014B2 (ja) | 2008-03-06 | 2009-03-05 | 信号強調装置、その方法、プログラム及び記録媒体 |
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008056757 | 2008-03-06 | ||
JP2008056757 | 2008-03-06 | ||
JP2008214066 | 2008-08-22 | ||
JP2008214066 | 2008-08-22 | ||
JP2010501966A JP5124014B2 (ja) | 2008-03-06 | 2009-03-05 | 信号強調装置、その方法、プログラム及び記録媒体 |
PCT/JP2009/054215 WO2009110574A1 (ja) | 2008-03-06 | 2009-03-05 | 信号強調装置、その方法、プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2009110574A1 true JPWO2009110574A1 (ja) | 2011-07-14 |
JP5124014B2 JP5124014B2 (ja) | 2013-01-23 |
Family
ID=41056126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010501966A Active JP5124014B2 (ja) | 2008-03-06 | 2009-03-05 | 信号強調装置、その方法、プログラム及び記録媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8848933B2 (ja) |
JP (1) | JP5124014B2 (ja) |
CN (1) | CN101965613B (ja) |
WO (1) | WO2009110574A1 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4880036B2 (ja) * | 2006-05-01 | 2012-02-22 | 日本電信電話株式会社 | 音源と室内音響の確率モデルに基づく音声残響除去のための方法及び装置 |
JP5550456B2 (ja) * | 2009-06-04 | 2014-07-16 | 本田技研工業株式会社 | 残響抑圧装置、及び残響抑圧方法 |
JP5129794B2 (ja) * | 2009-08-11 | 2013-01-30 | 日本電信電話株式会社 | 目的信号強調装置とその方法と、プログラム |
JP5172797B2 (ja) * | 2009-08-19 | 2013-03-27 | 日本電信電話株式会社 | 残響抑圧装置とその方法と、プログラムと記録媒体 |
JP5561195B2 (ja) * | 2011-02-07 | 2014-07-30 | 株式会社Jvcケンウッド | ノイズ除去装置およびノイズ除去方法 |
JP5699844B2 (ja) * | 2011-07-28 | 2015-04-15 | 富士通株式会社 | 残響抑制装置および残響抑制方法並びに残響抑制プログラム |
US8706657B2 (en) * | 2011-10-13 | 2014-04-22 | National Instruments Corporation | Vector smoothing of complex-valued cross spectra to estimate power spectral density of a noise signal |
US8943014B2 (en) | 2011-10-13 | 2015-01-27 | National Instruments Corporation | Determination of statistical error bounds and uncertainty measures for estimates of noise power spectral density |
US8712951B2 (en) | 2011-10-13 | 2014-04-29 | National Instruments Corporation | Determination of statistical upper bound for estimate of noise power spectral density |
US9754608B2 (en) * | 2012-03-06 | 2017-09-05 | Nippon Telegraph And Telephone Corporation | Noise estimation apparatus, noise estimation method, noise estimation program, and recording medium |
JP5689844B2 (ja) * | 2012-03-16 | 2015-03-25 | 日本電信電話株式会社 | スペクトル推定装置、その方法及びプログラム |
CN102592606B (zh) * | 2012-03-23 | 2013-07-31 | 福建师范大学福清分校 | 一种补偿小空间听音声环境的均衡信号处理方法 |
US9237391B2 (en) * | 2012-12-04 | 2016-01-12 | Northwestern Polytechnical University | Low noise differential microphone arrays |
CN103886867B (zh) * | 2012-12-21 | 2017-06-27 | 华为技术有限公司 | 一种噪声抑制装置及其方法 |
CN105122359B (zh) * | 2013-04-10 | 2019-04-23 | 杜比实验室特许公司 | 语音去混响的方法、设备和系统 |
CN105849804A (zh) * | 2013-12-23 | 2016-08-10 | 美国亚德诺半导体公司 | 过滤噪声的计算高效方法 |
DK2916321T3 (en) * | 2014-03-07 | 2018-01-15 | Oticon As | Processing a noisy audio signal to estimate target and noise spectral variations |
CN104459509B (zh) * | 2014-12-04 | 2017-12-29 | 北京中科新微特科技开发股份有限公司 | 测量待测器件的热阻的方法 |
CN105791722B (zh) * | 2014-12-22 | 2018-12-07 | 深圳Tcl数字技术有限公司 | 电视机声音调整方法及电视机 |
WO2017094862A1 (ja) * | 2015-12-02 | 2017-06-08 | 日本電信電話株式会社 | 空間相関行列推定装置、空間相関行列推定方法および空間相関行列推定プログラム |
JP6677662B2 (ja) | 2017-02-14 | 2020-04-08 | 株式会社東芝 | 音響処理装置、音響処理方法およびプログラム |
JP6748304B2 (ja) * | 2017-08-04 | 2020-08-26 | 日本電信電話株式会社 | ニューラルネットワークを用いた信号処理装置、ニューラルネットワークを用いた信号処理方法及び信号処理プログラム |
EP3460795A1 (en) * | 2017-09-21 | 2019-03-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal processor and method for providing a processed audio signal reducing noise and reverberation |
US10481831B2 (en) * | 2017-10-02 | 2019-11-19 | Nuance Communications, Inc. | System and method for combined non-linear and late echo suppression |
US10572770B2 (en) * | 2018-06-15 | 2020-02-25 | Intel Corporation | Tangent convolution for 3D data |
CN111489760B (zh) * | 2020-04-01 | 2023-05-16 | 腾讯科技(深圳)有限公司 | 语音信号去混响处理方法、装置、计算机设备和存储介质 |
CN113689869A (zh) * | 2021-07-26 | 2021-11-23 | 浙江大华技术股份有限公司 | 语音增强方法、电子设备以及计算机可读存储介质 |
CN113469388B (zh) * | 2021-09-06 | 2021-11-23 | 江苏中车数字科技有限公司 | 轨道交通车辆维保系统及方法 |
CN113840034B (zh) * | 2021-11-29 | 2022-05-20 | 荣耀终端有限公司 | 声音信号处理方法和终端设备 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10257583A (ja) | 1997-03-06 | 1998-09-25 | Asahi Chem Ind Co Ltd | 音声処理装置およびその音声処理方法 |
SE521024C2 (sv) * | 1999-03-08 | 2003-09-23 | Ericsson Telefon Ab L M | Metod och anordning för att separera en blandning av källsignaler |
JP2005249816A (ja) * | 2004-03-01 | 2005-09-15 | Internatl Business Mach Corp <Ibm> | 信号強調装置、方法及びプログラム、並びに音声認識装置、方法及びプログラム |
JP4586577B2 (ja) * | 2005-03-02 | 2010-11-24 | 株式会社国際電気通信基礎技術研究所 | 外乱成分抑圧装置、コンピュータプログラム、及び音声認識システム |
JP4690912B2 (ja) * | 2005-07-06 | 2011-06-01 | 日本電信電話株式会社 | 目的信号区間推定装置、目的信号区間推定方法、プログラム及び記録媒体 |
JP2007235646A (ja) * | 2006-03-02 | 2007-09-13 | Hitachi Ltd | 音源分離装置、方法及びプログラム |
JP4774100B2 (ja) * | 2006-03-03 | 2011-09-14 | 日本電信電話株式会社 | 残響除去装置、残響除去方法、残響除去プログラム及び記録媒体 |
JP4880036B2 (ja) * | 2006-05-01 | 2012-02-22 | 日本電信電話株式会社 | 音源と室内音響の確率モデルに基づく音声残響除去のための方法及び装置 |
-
2009
- 2009-03-05 US US12/920,222 patent/US8848933B2/en active Active
- 2009-03-05 JP JP2010501966A patent/JP5124014B2/ja active Active
- 2009-03-05 CN CN2009801069459A patent/CN101965613B/zh active Active
- 2009-03-05 WO PCT/JP2009/054215 patent/WO2009110574A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2009110574A1 (ja) | 2009-09-11 |
CN101965613A (zh) | 2011-02-02 |
CN101965613B (zh) | 2013-01-02 |
JP5124014B2 (ja) | 2013-01-23 |
US8848933B2 (en) | 2014-09-30 |
US20110044462A1 (en) | 2011-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5124014B2 (ja) | 信号強調装置、その方法、プログラム及び記録媒体 | |
Wang et al. | Complex spectral mapping for single-and multi-channel speech enhancement and robust ASR | |
EP1993320B1 (en) | Reverberation removal device, reverberation removal method, reverberation removal program, and recording medium | |
Kinoshita et al. | Suppression of late reverberation effect on speech signal using long-term multiple-step linear prediction | |
Tan et al. | Real-time speech enhancement using an efficient convolutional recurrent network for dual-microphone mobile phones in close-talk scenarios | |
CN108172231B (zh) | 一种基于卡尔曼滤波的去混响方法及系统 | |
JP5227393B2 (ja) | 残響除去装置、残響除去方法、残響除去プログラム、および記録媒体 | |
Yoshioka et al. | Integrated speech enhancement method using noise suppression and dereverberation | |
US20080294432A1 (en) | Signal enhancement and speech recognition | |
Xiao et al. | The NTU-ADSC systems for reverberation challenge 2014 | |
EP3685378B1 (en) | Signal processor and method for providing a processed audio signal reducing noise and reverberation | |
JP2010282193A (ja) | 残響抑圧装置、及び残響抑圧方法 | |
Lv et al. | A permutation algorithm based on dynamic time warping in speech frequency-domain blind source separation | |
CN111312275B (zh) | 一种基于子带分解的在线声源分离增强系统 | |
Zhao et al. | Robust speech recognition using beamforming with adaptive microphone gains and multichannel noise reduction | |
JP6348427B2 (ja) | 雑音除去装置及び雑音除去プログラム | |
Song et al. | An integrated multi-channel approach for joint noise reduction and dereverberation | |
JP4348393B2 (ja) | 信号歪み除去装置、方法、プログラム及びそのプログラムを記録した記録媒体 | |
Chen et al. | A dual-stream deep attractor network with multi-domain learning for speech dereverberation and separation | |
Yoshioka et al. | Dereverberation by using time-variant nature of speech production system | |
CN113160842B (zh) | 一种基于mclp的语音去混响方法及系统 | |
Miyazaki et al. | Theoretical analysis of parametric blind spatial subtraction array and its application to speech recognition performance prediction | |
Gomez et al. | Robustness to speaker position in distant-talking automatic speech recognition | |
US20230306980A1 (en) | Method and System for Audio Signal Enhancement with Reduced Latency | |
Prasad et al. | Two microphone technique to improve the speech intelligibility under noisy environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110908 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120424 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120622 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121016 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121026 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151102 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5124014 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |