JP4977100B2 - 残響除去装置、残響除去方法、そのプログラムおよび記録媒体 - Google Patents

残響除去装置、残響除去方法、そのプログラムおよび記録媒体 Download PDF

Info

Publication number
JP4977100B2
JP4977100B2 JP2008206784A JP2008206784A JP4977100B2 JP 4977100 B2 JP4977100 B2 JP 4977100B2 JP 2008206784 A JP2008206784 A JP 2008206784A JP 2008206784 A JP2008206784 A JP 2008206784A JP 4977100 B2 JP4977100 B2 JP 4977100B2
Authority
JP
Japan
Prior art keywords
pdf
coefficient
frequency domain
sound source
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008206784A
Other languages
English (en)
Other versions
JP2010044150A (ja
Inventor
智広 中谷
拓也 吉岡
慶介 木下
正人 三好
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008206784A priority Critical patent/JP4977100B2/ja
Publication of JP2010044150A publication Critical patent/JP2010044150A/ja
Application granted granted Critical
Publication of JP4977100B2 publication Critical patent/JP4977100B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、音源が放音した音響信号(以下、「音源信号」という)を残響のある部屋で収音して得られる信号(以下、「観測信号」という)から、残響成分を取り除いた音源信号を抽出する、残響除去装置、残響除去方法、そのプログラム及び記録媒体に関する。
音源信号は、残響のある環境で収音されると、本来の音源信号に残響が重畳された信号として観測される。そのため、本来の音源信号の性質を抽出することが困難になるとともに、音自体の明瞭度が低下する。残響除去処理は、観測信号に重畳した残響成分を取り除くことによって音源本来の性質を抽出しやすくするとともに、音の明瞭度を回復するために行われる。
図10に非特許文献1にて開示されている従来の残響除去装置100の機能構成例を示す。残響除去装置100は、周波数分割処理部110、音源信号PDF推定部140、AR係数推定部150、残響推定部170、残響除去部180及び周波数統合処理部190から構成される。残響除去装置100は、音源10から放音され入力部20で収音された時間領域の観測信号を、あらかじめ全時系列について受け取ってから処理を行う。周波数分割処理部110は、受け取った時間領域の観測信号を周波数領域の観測信号(以下、「周波数領域観測信号」という)に変換する。音源信号PDF推定部140は、周波数領域観測信号に基づき、音源信号の周波数領域での確率密度関数(確率密度関数を以下、「PDF」という)を各周波数ごとに推定する。AR係数推定部150は、全時系列の周波数領域観測信号と音源信号PDF推定部140にて推定した音源信号の周波数領域のPDFとから、観測信号に含まれる残響を予測する長時間自己回帰係数(以下、「AR係数」という)を各周波数ごとに推定する。残響推定部170は、AR係数推定部150で推定したAR係数を周波数領域観測信号に適用して残響の推定値(期待値)を求める。残響除去部180は、周波数領域観測信号から残響の推定値を減算して、周波数領域の音源信号を推定する。そして最後に、周波数統合処理部190が、推定した周波数領域の音源信号を時間領域の音源信号に変換し、残響除去処理を完了する。
Tomohiro Nakatani et al. "BLIND SPEECH DEREVERBERATION WITH MULTI-CHANNEL LINEAR PREDICTION BASED ON SHORT TIME FOURIER TRANSFORM REPRESENTATION ", IEEE International Conference on Acoustics, Speech, and Signal Processing(ICASSP-2008), 2008, p.85-88
従来の残響除去装置は、残響除去処理に先立ち全時系列分の観測信号を受け取る必要があったため、信号の観測開始直後から逐次的に残響除去処理することができなかった。また、その対策として、観測信号を数秒程度の小さなブロックに分割して各ブロック毎に逐次的に残響除去処理を行う方法も考えられるが、従来の残響除去装置においては、AR係数を観測信号のみに基づき推定するため、観測信号長が短いとAR係数の推定精度が悪くなり、残響除去後の信号品質が劣化するという問題があった。
本発明の目的は、信号の観測開始直後から効果的に残響除去処理を行うことが可能な残響除去装置、残響除去方法、そのプログラム及び記録媒体を提供することにある。
本発明の残響処理装置は、周波数分割処理部、ブロック分割部、音源信号事前PDF推定部、AR係数事前PDF記憶部、AR係数事後PDF記憶部、AR係数事後PDF推定部、残響事後PDF推定部、残響除去部及び周波数統合処理部から構成される。
周波数分割処理部は、音源信号を残響のある部屋で逐次収音し、この収音した観測信号を周波数領域観測信号に変換する。ブロック分割部は、周波数領域観測信号を所定の時間間隔ごとのブロックに分割する。音源信号事前PDF推定部は、ブロック単位で周波数領域観測信号を逐次受け取り、音源信号事前PDFを逐次推定する。AR係数事前PDF記憶部は、AR係数事前PDFを記憶する。AR係数事後PDF記憶部は、AR係数事後PDFを記憶する。AR係数事後PDF推定部は、ブロック単位で周波数領域観測信号を逐次受け取るとともに当該各ブロックに対応する音源信号事前PDFを逐次受け取り、更にAR係数事前PDF記憶部からAR係数事前PDFを読み出し、これらからAR係数事後PDFを逐次推定して、AR係数事後PDF記憶部に書き込む。残響事後PDF推定部は、周波数領域観測信号を逐次受け取るとともに、AR係数事後PDF記憶部からAR係数事後PDFを逐次読み出し、これらから残響事後PDFを逐次推定する。残響除去部は、残響事後PDFを用いて周波数領域観測信号から残響成分を除去することにより、周波数領域音源信号を逐次推定する。周波数統合処理部は、周波数領域音源信号を時間領域に変換する。
本発明の残響除去装置においては、AR係数の推定に際し観測信号に加え、予め用意したAR係数の事前PDFを用いることで、信号の観測開始直後においてもAR係数を精度良く推定し、効果的に残響除去処理を行うことができる。
また本発明では、観測信号から除去する残響について、従来技術のように単に期待値のみを求めるだけでなく、PDFとして期待値と共分散行列を求め、それらに基づき残響のパワーを推定して残響除去処理を行う。従って、一般的な音響伝達関数をモデル化するためにAR係数事前PDFの期待値をゼロと設定していて、かつ、信号の観測開始直後で非常に短い観測信号しか得られずに残響の期待値がゼロになってしまうような場合でも、共分散行列にある程度の残響の特性が表現されるため、このような場合においても効果的に残響を除去することができる。
〔第1実施形態〕
図1に本発明の残響処理装置200の機能構成例を、図2にその処理フローを示す。残響処理装置200は、周波数分割処理部110、ブロック分割部220、AR係数事前PDF記憶部230、音源信号事前PDF推定部240、AR係数事後PDF推定部250、AR係数事後PDF記憶部260、残響事後PDF推定部270、残響除去部280及び周波数統合処理部190から構成される。
周波数分割処理部110と周波数統合処理部190は、背景技術にて説明した残響処理装置100の同名の各構成部位と同様に、周波数分割処理部110は時間領域の入力信号を周波数領域に、周波数統合処理部190は周波数領域の入力信号を時間領域にそれぞれ変換して出力する。周波数分割処理部110には例えば、短時間分析窓と短時間フーリエ変換に基づく周波数分割処理や、サブバンド処理による周波数分割処理などの既存の手法を用いることができる。また、周波数統合処理部190には例えば、短時間逆フーリエ変換とオーバラップ加算処理に基づく周波数統合処理や、サブバンド処理による周波数統合処理などの既存の手法を用いることができる。なお、これら以外にもウェーブレット変換や離散コサイン変換など、様々な周波数分割に基づく信号分析合成処理系を用いてもよい。
以下の各実施形態の説明においては、1個の音源10からの音源信号stをM個の入力部20で収音する際に、m番目の入力部の観測信号の残響除去を行う場合を例にとって説明する。また、分割統合処理には短時間フーリエ変換を用いることとし、tを短時間フーリエ変換のフレームのインデックス、xt (m)をm番目の入力部におけるフレームtの時間領域の観測信号とする。
周波数分割処理部110は、時間領域の観測信号xt (m)が入力されると、所定の周波数ビンの数(例えばK個)分の周波数領域の観測信号xt,k (m)(kはk番目の周波数ビン)に分割・変換して出力する(S1)。
ブロック分割部220は、周波数領域観測信号xt,k (m)を所定のフレーム個数(例えばN個)単位でブロック化する(S2)。τ番目のブロック(τ=0、1、・・・)が含むフレームtの集合を以下のようにBτと表現する。なお、t0は観測開始時刻である。
Figure 0004977100
また、τ番目のブロックの時点で、周波数ビンkについて、利用可能な観測信号xt,k (m)の全体を以下のようにξτ,kと表現する。
Figure 0004977100
AR係数事前PDF記憶部230には、AR係数事前PDFを予め記憶しておく。本発明では、音源10から入力部20までの室内伝達関数を、例えば音源の位置や室温に依存して変動する確率変数とみなす。更に、AR係数を伝達関数の変動に応じて変動する要因や後述する式(4)によるモデル化誤差による要因などに基づく確率変数とみなす。
周波数領域観測信号 xt,k (m)は、周波数ごとの長時間自己回帰(AR)過程として以下のようにモデル化することができる。
Figure 0004977100
ここで、dはフレームtの観測信号 xt,k (m)を予測するのに用いる過去の信号系列の遅延の量であり、st,kは周波数領域の音源信号であり、rt,k = vck H・vxt-d,kとおいたとき、rt,kは周波数領域観測信号 xt,k (m)に含まれる周波数領域の残響成分を表す。vckとvxt-d,kは、周波数領域観測信号 xt,k (m)がT次のAR過程に従うとの仮定の下、vckはT次のAR係数ct,k (m)を含むベクトルとして、vxt-d,kはフレームtからdフレーム以上過去の周波数領域観測信号の系列を含むベクトルとして、それぞれ以下のように定義されているものとする。
Figure 0004977100
以上のように定義されたvckについて、AR係数事前PDF p(vck)を次のように定義する。
Figure 0004977100
ここで、N(a;μ,Σ)は、ベクトルa又はスカラーaに対する、期待値μ、共分散行列Σの多変量ガウス過程のPDFを表す。
室内インパルス応答の位相は、話者と入力部の位置に応じて大きく変動するため、一般的な音響伝達関数をモデル化すべく、AR係数事前PDFの期待値μkはゼロとおくことがひとつの有効な方法である。また、共分散行列Σkは、Eを期待値の演算子として、
Figure 0004977100
と定義することができる。なお、Hは行列、ベクトル又はスカラーの複素転置を表す。
いま、期待値μk=0とすると、以下のように共分散行列Σkが対角行列であると仮定することで、話者と入力部の位置の変動に対する残響除去処理の頑健性を更に向上することができる。
Figure 0004977100
式(6)〜(8)からわかるように、この場合のPDFはAR係数のパワー時間包絡のみにより特徴づけられているといえる。我々の予備実験において、AR係数のパワー時間包絡は入力部や話者の位置の違いに敏感ではないことが確認されていることから、このPDFは、ひとつの部屋のAR係数の一般的な事前PDFとして用いることができると考える。
様々な方法で、共分散行列Σkは事前に求めることができる。例えば、ひとつの部屋の室内インパルス応答を異なる設定でいくつか測定して各設定に対応するAR係数を求めた上で、式(6)〜(8)に従って求めることができる。また、ある程度の長さの観測信号を集めて、AR係数を非特許文献1に示されるような既存の残響除去アルゴリズムにより計算した上で、式(6)〜(8)に従って求めることもできる。
一方、音源や入力部の位置がある程度限定されているような環境であれば、期待値をゼロとせずに実際に計測した期待値を用いることで、より精度の高い残響除去が実現できる。この場合の期待値と共分散行列は、例えば想定される音源と入力部の位置に近いいくつかの設定で室内インパルス応答を測定して各インパルス応答に対応するAR係数を求め、それらの期待値と共分散行列として求めることができる。また、ある程度の長さの観測信号を集めて、後述する方法でAR係数事後PDF p(vckτ,k)を求め、その期待値evckと共分散行列CkをAR係数事前PDFの期待値と共分散行列として定めることができる。具体的には、後述する式(18)及び(19)においてη=0として求めたevckとCkを新たにAR係数事前PDFの期待値μk、共分散行列Σkとして以下のように定めることができる。
Figure 0004977100
ここで、LxはAR係数事前PDFを定めるために用いた観測信号の長さ(秒)を表し、共分散行列を観測信号長で正規化するために用いている。
音源信号PDF事前推定部240は、音源信号の事前PDF p(vst)を推定する(S3)。本発明では、時変多変量複素ガウス過程を音源信号の事前PDFとして採用する。その有効性は非特許文献1に示された既存の残響除去方法において確認されている。
音源信号の事前PDF p(vst)を以下のように定義する。
Figure 0004977100
vstはフレームtにおける、音源信号の全周波数ビンを含むベクトルを表す。なお、簡略化のため本発明ではΣtを以下のような対角行列と仮定する。
Figure 0004977100
式(12)及び(13)からわかるように、この場合のPDFは音源信号のパワースペクトルのみにより特徴づけられていると言える。このとき、p(vst)は各周波数ビンごとのPDFの要素の積に分解することができ、以下のように書くこともできる。
Figure 0004977100
もっとも、音源信号のパワースペクトルは事前に与えられないため、何らかの方法で近似する必要がある。そこで、本発明では式(13)において観測信号のパワースペクトル |xt,k (m)|2を音源信号のパワースペクトル |st,k|2の近似として用いる。このアプローチについても、既存の残響除去方法において有効性が確認されている。
AR係数事後PDF推定部250は、AR係数事前PDF記憶部230に記憶されたAR係数事前PDF p(vck)と、音源信号事前PDF推定部240で推定された音源信号事前PDF p(vst)とから、AR係数事後PDF p(vckτ,k)を推定し、AR係数事後PDF記憶部260に書き込む(S4)。
AR係数事後PDF p(vckτ,k)は、ベイズ規則を用いて以下のように表すことができる。
Figure 0004977100
また、式(15)中のp(ξτ,k|vck)は、式(4)を用いて式(16)のように書き換えることができる。
Figure 0004977100
ここで、p(st,k)は式(14)で定義される音源信号事前PDF p(vst)の要素である。そのため、AR係数事後PDF推定部250は、式(15)に基づく推定に際し、p(st,k)を音源信号事前PDF推定部240から逐次受け取る。
式(15)は、式(5)、(11)及び(16)に基づき、式(17)〜(21)により表わされる多変量複素ガウスPDFになるため、AR係数事後PDF推定部250は、これらの式からAR係数事後PDF p(vckτ,k)を推定することができる。
Figure 0004977100
ここで、式(18)及び(19)のηは、AR係数事前PDFから得られる情報と観測信号から得られる情報とがAR係数事後PDF推定に与える影響を制御する制御パラメータで、η≧0である。例えばηに大きな値を設定するほど、AR係数事前PDFがAR係数事後PDF推定に与える影響は大きくなる。
なお、式(20)のvdτ,kと式(21)のDτ,kは、それぞれ以下の更新式を用いてブロックごとに逐次的に推定することもできる。
Figure 0004977100
また、上記の更新式は以下のように忘却係数ζ(0<ζ≦1)を導入することで、比較的近い過去の観測信号の値を重視したAR係数事後PDFを推定することもできる。
Figure 0004977100
残響事後PDF推定部270は、周波数領域観測信号xt,k (m)を逐次受け取るとともに、AR係数事後PDF記憶部260からAR係数事後PDF p(vckτ,k)を読み出し、これらから残響事後PDF p(rt,kτ,k)を推定する(S5)。
周波数領域観測信号xt,k (m)に含まれる残響成分rt,kは式(4)のところで説明した通り、rt,k = vck H・vxt-d,kと表現されることから、p(vckτ,k)が式(17)〜(21)のように与えられると、残響事後PDF p(rt,kτ,k)は、以下のように推定することができる。
Figure 0004977100
ただし、上式の導出において、vckの各要素はξτ,kが与えられた下で相互に無相関と仮定している。
なお、観測信号を受け取り始めた直後で非常に短い観測信号しか得られない場合には、式(20)のvdτ,kと式(21)のDτ,kは実質的にゼロとなるため、式(29)と(30)はそれぞれ以下のように簡略化できる。
Figure 0004977100
更に、一般的な音響伝達関数をモデル化すべく、AR係数事前PDFの期待値μkをゼロとし、共分散行列Σkを対角行列とした場合は、より簡略化され以下のようになる。
Figure 0004977100
ここで、Rt,kは、AR係数と過去の観測信号とのパワースペクトル領域での畳み込みとして計算される。従って、後述する残響除去部280において、式(35)〜(37)に従い観測信号からRt,kをパワースペクトル領域で単純に減算することで残響を除去することができる。すなわち、本発明では観測信号から除去する残響について、従来技術のように単に期待値を求めるだけでなく、PDFとして期待値と共分散行列を求め、それらに基づき残響のパワーを推定して残響除去処理を行う。従って、AR係数事前PDFの期待値をゼロと設定していて、かつ、信号の観測開始直後で非常に短い観測信号しか得られずに、残響の期待値がゼロになってしまうような場合でも、共分散行列にある程度の残響の特性が表現されるため、このような場合においても効果的に残響を除去することができる。
残響除去部280は、残響事後PDFを用いて周波数領域観測信号xt,k (m)から残響成分を除去することにより、周波数領域音源信号gst,kを推定する(S6)。式(28)より残響のパワーは、観測信号ξτ,kが与えられた条件下での|rt,k|2の条件付期待値E{|rt,k|2τ,k}として、以下のように求めることができる。
Figure 0004977100
そして式(4)より、観測信号xt,k (m)は、音源信号st,kに残響rt,k = vck H・vxt-d,kを加算したものであることから、残響のパワーが式(35)により求められると、周波数領域音源信号の推定値gst,kは、観測信号から残響をパワー領域で減算するスペクトル減算技術を用いて、例えば以下のように求めることができる。
Figure 0004977100
ここでα、βは、スペクトル減算において過剰にパワーを減算することが原因でしばしば生じるミュージカル雑音を低減するための制御パラメータで、例えば0≦α≦0.2および0.3≦β≦1.0の範囲の値をとるように設定する。
上記の計算方法以外にもGt,kは、例えば以下のように計算することができる。
音源信号事後PDF p(st,kτ,k)は、AR係数事後PDFp(vckτ,k)を用いて、以下のように求めてもよい。
Figure 0004977100
この音源信号事後PDFを用いると音源信号のパワーを、観測信号ξτ,kが与えられた下での|st,k|2の条件付期待値E{|st,k|2τ,k}として、以下のように求めることができる。
Figure 0004977100
これを用いて、Gt,kは以下のように計算することができる。
Figure 0004977100
最後に、周波数統合処理部190は、周波数領域音源信号の推定値gst,kを時間領域の信号gstに変換し、出力部30に送出する(S7)。
以上に示した第1実施形態の処理フローの例を、図2に従い改めて説明する。
事前に、AR係数事前PDF記憶部230に、上述した方法により予め用意した、すべての周波数ビンについてのAR係数事前PDFの期待値μk、共分散行列Σkを記憶させておく。また、AR係数事後PDF記憶部260に、AR係数事後PDFの期待値及び共分散行列の初期値をそれぞれevck=μk、Ck=Σkとして記憶させておく。
音源10からの音源信号stを、m個目の入力部20で逐次収音した時間領域の観測信号xt (m)を周波数分割処理部110において短時間フレームに分割しつつ、短時間フーリエ変換を適用して周波数領域の観測信号xt,k (m)に分割・変換する(S1)。続いて、ブロック分割部220が観測信号のフレーム列を逐次的にフレームブロックに分割する(S2)。続いて、逐次的に各ブロックに対して、音源信号事前PDF推定部240が、式(13)のσt,k 2について観測信号に基づきσt,k 2=|xt,k (m)|2であるとして音源信号事前PDFを逐次推定し(S3)、AR係数事後PDF推定部250が式(17)〜(25)に従いAR係数事後PDFを逐次推定し、これをAR係数事後PDF記憶部260に書き込んでAR係数事後PDFを更新する(S4)。続いて、逐次的に残響事後PDF推定部270が観測信号のフレーム列を受け取るとともに、AR係数事後PDF記憶部260からAR係数事後PDFを読み出し、式(28)〜(30)に従い残響事後PDFを逐次推定し(S5)、残響除去部280が逐次的に受け取った観測信号のフレーム列と残響事後PDFとから式(35)〜(37)に従い周波数領域音源信号を逐次推定し(S6)、最後に周波数統合処理部190が逆フーリエ変換とオーバラップ加算により時間領域の信号に変換して、出力部30に送出する(S7)。
なお、AR係数事後PDFは、信号が伝搬する部屋の残響状態を表すパラメータであり、式(17)〜(21)からわかるように個別のフレーム毎ではなくフレーム累積的に推定・更新され、残響除去処理はその処理の時点で最新のAR係数事後PDFを用いて行う。従って、(S2)〜(S4)のAR係数事後PDFを推定する処理と(S5)〜(S6)の個別のフレームに対する残響除去処理とは、必ずしも同期をとる必要はなく、並列・非同期的に処理しても構わない。
第1実施形態の残響除去装置200においては、観測信号を所定の時間間隔ごとのブロックに分割して逐次残響除去処理を行うとともに、AR係数の推定に際し観測信号に加え、予め用意したAR係数の事前PDFを用いることで、観測開始直後からAR係数を精度良く推定し、効果的に残響除去処理を行うことができる。
また、本発明ではAR係数事前PDFと観測信号とからAR係数事後PDFを求め、更にこのAR係数事後PDFと観測信号とから残響の事後PDFを求め、この残響の事後PDFを用いて残響除去を実現する。すなわち、本発明では観測信号から除去する残響について、従来技術のように単に期待値を求めるだけではなく、PDFとして期待値と共分散行列を求め、それらに基づき残響のパワーを推定して残響除去処理を行う。従って、一般的な音響伝達関数をモデル化するためにAR係数事前PDFの期待値をゼロと設定していて、かつ、信号の観測開始直後で非常に短い観測信号しか得られずに、残響の期待値がゼロになってしまうような場合でも、共分散行列にある程度の残響の特性が表現されるため、このような場合においても効果的に残響を除去することができる。
〔第2実施形態〕
第1実施形態においては、音源信号の事前PDFとして観測信号のみから求めた事前PDFを用いた。しかし、第1実施形態の処理の中で得られたAR係数事後PDFを用いると、式(38)〜(40)に示したように音源信号の事後PDFを求めることができる。そして、この事後PDFを用いて再度事前PDFを求めることで、観測信号のみから求めた事前PDFと比較して、より精度の高い推定をすることができると考えられる。そこで第2実施形態においては、音源信号の事前PDFとして、観測信号とAR係数事後PDFとから求めた事後PDFを用いる。
第2実施形態の処理フローの例を図3に従い説明する。なお、機能構成については、AR係数事後PDF推定部250から音源信号PDF推定部240に向けた矢印(点線で表記)が加わるという点以外、第1実施形態と同様である。
まず、S1、S2については第1実施形態と同様の処理を行う。続いて、逐次的に各ブロックに対して、音源信号事前PDF推定部240が、式(13)のσt,k 2について観測信号に基づきσt,k 2=|xt,k (m)|2であるとして音源信号事前PDFを推定し(S3´−1)、続いてAR係数事後PDF推定部250は式(17)〜(25)に基づきAR係数事後PDFを推定する(S4´−1)。続いて、音源信号事前PDF推定部240が観測信号とAR係数事後PDFとから式(38)〜(40)に基づき音源信号事後PDFを求め、式(13)のσt,k 2についてσt,k 2=|est,k|2+St,kであるとして音源信号事前PDFを推定する(S3´−2)。続いて、AR係数事後PDF推定部250は再度S4´−1を実行し、以降S3´−2とS4´−1とを繰り返す。そして、AR係数事後PDFが収束するか又は所定の繰り返し回数に達した時点で、AR係数事後PDFをAR係数事後PDF記憶部に書き込む(S4´−2)。S5〜7については第1実施形態と同様である。
〔第3実施形態〕
第3実施形態は、残響除去部280における計算方法が第1実施形態の式(36)及び(37)と異なる形態であり、残響除去部280の入出力内容、及び全体の機能構成・処理フローは第1実施形態と共通である。
残響rt,kは、残響事後PDFの期待値ert,kと期待値からの偏差et,kとに以下のように分解することができる。
Figure 0004977100
このとき、観測信号ξτ,kが与えられた下でのet,kの条件付分散は以下のように表現することができる。
Figure 0004977100
次に、wxt,k=xt,k (m)−ert,kとおくと、式(13)は以下のように書き換えることができる。
Figure 0004977100
式(45)においてet,kはst,kに対して平均ゼロ、共分散行列E{|et,k|2τ,k}の加法性雑音として振る舞う。従って、et,kの推定パワー(=Rt,k)をwxt,kのパワーから式(45)に従いスペクトル減算等を用いて減算することで周波数領域音源信号の推定値gst,kを求めることができる。このスペクトル減算処理は例えば、以下のように実現することができる。
Figure 0004977100
gst,kをこのように計算することで、推定された残響成分のうち期待値ert,kは複素スペクトル領域でwxt,k=xt,k (m)−ert,kのように減算し、共分散はパワースペクトル領域で式(46)、(47)のように減算することになる。一般に、複素スペクトル領域では、信号のパワーだけでなく位相も含めた推定になるのに対し、パワースペクトル領域では信号のパワーのみの推定となる。従って、上記の計算により本実施形態では、期待値に関しては音源信号の位相までをも推定する処理となるため、第1実施形態と比較した場合に、より正確な音源信号を推定できる可能性があると期待される。
〔第4実施形態〕
図4に本発明の残響処理装置300の機能構成例を、図5にその処理フローを示す。残響処理装置300は、周波数分割処理部110、ブロック分割部220、AR係数事前PDF記憶部230、音源信号事前PDF推定部240、AR係数事後PDF推定部250、AR係数事後PDF記憶部260、残響除去部380及び周波数統合処理部190から構成される。残響除去部380以外の各構成部の機能は第1実施形態と同様であるため、それらの機能の説明は省略する。
第4実施形態は、図2に示す第1実施形態の処理フローのS1〜S4までを実行してAR係数事後PDFを推定するまでの処理は第1実施形態と同様であるが、周波数領域音源信号の推定方法が異なる。具体的には、AR係数事後PDFを用いて式(38)〜(40)により求めた音源信号事後PDFの期待値をそのまま周波数領域音源信号の推定値とする。そのため残響処理部380は、周波数領域観測信号xt,k (m)を逐次受け取るとともに、AR係数事後PDF記憶部260からAR係数事後PDFを逐次読み出し、式(38)〜(40)により音源信号事後PDFを求めて、
Figure 0004977100
として周波数領域音源信号の推定値を得る(S8)。なお、S7については第1実施形態と同様である。
第4実施形態の構成では、残響の事後PDFを用いないため、観測開始直後で非常に短い観測信号しか得られない場合において、一般的な音響伝達関数をモデル化すべくAR係数事前PDFの期待値をゼロと設定している場合には残響除去効果が得られない(AR係数事後PDFの期待値evckがゼロになり、式(39)においてest,k=xt,k (m)となるため)が、それ以外の場合には上記の各実施形態より簡易な構成で観測開始直後から効果的に残響を除去することができる。
〔第5実施形態〕
図6に本発明の残響処理装置400の機能構成例を、図7にその処理フローを示す。残響処理装置400は、周波数分割処理部110、AR係数事前PDF記憶部230、残響事後PDF推定部470、残響除去部280及び周波数統合処理部190から構成される。残響事後PDF推定部470以外の各構成部の機能は第1実施形態と同様であるため、それらの機能の説明は省略する。
残響の事後PDF p(rt,kτ,k)の期待値ert,kと共分散行列Rt,kとを推定するのにあたり、式(31)と(32)、又は、式(33)と(34)のみを用いることとした場合には、図1に示す第1実施形態の機能構成のうちAR係数事後PDFの推定に係る部分は不要になる。第5実施形態はこのような場合の実施形態であり、AR係数事後PDFの推定値を用いないため、観測開始直後以外ではAR係数事後PDFの推定値を用いる場合より残響除去の精度が低下するが、より簡易な機能構成で、かつ、より少ない計算量で残響除去を実現したい場合に有効である。
処理フローは、S1については図1に示す第1実施形態の処理フローと同様である。続いて、残響事後PDF推定部470が逐次的に、周波数分割処理部110から周波数領域観測信号xt,k (m)を受け取るとともに、AR係数事前PDF記憶部230からAR係数事前PDFを読み出し、式(31)と(32)、又は、式(33)と(34)により残響事後PDFを推定する(S9)。続くS6、S7については第1実施形態と同様である。
上記の各実施形態の残響除去装置の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、上述した実施形態とは別の実行形態として、コンピュータが可搬型記録媒体から直接このプログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
〔効果の確認〕
本発明の第2実施形態の残響除去方法(以下、「Prop」という)の効果を、非特許文献1の残響除去方法(以下、「Baseline」という)との比較で確認した。ただし、Baselineではバッチ処理により、AR係数を全観測信号が得られた後で全観測信号を用いて推定し、得られたAR係数を用いて観測信号全体の残響除去を実行した(つまり、観測開始直後における観測信号不足による問題は生じない)。これに対しPropでは、AR係数の事後PDFを各ブロックごとに更新し、そのブロックの残響除去はこの事後PDFに基づき実行した。また、AR係数に関する事前知識が残響除去に与える効果を検証するために、Propを更に2つの異なる条件で動作させた。1つは、PropをAR係数事前PDFによる事前知識無しで、すなわち式(18)及び(19)でη=0とおいて動作させた(この条件でのPropの動作を以下、「Posterior」という)。もう1つは、PropをAR係数事前PDFによる事前知識だけで動作させたもので、第5実施形態に該当する(この条件でのPropの動作を以下、「Prior」という)。Prop、Posterior及びPriorはすべて逐次処理で動作させた。本実験では逐次処理によらないBaselineの結果を逐次処理の性能上限値として扱う。
各手法の効果を検証するために、各2人の話者(男性1名、女性1名)からの各5発話、計10発話を用意した。各発話は5単語列で構成されている。観測信号は、各発話に残響のある部屋(残響時間RT60=0.5秒)で測定された1チャンネル室内インパルス応答を畳み込んで合成した。残響除去は各発話単位で実行し、残響除去性能は残響除去前後の信号のケプストラム歪み(以下、「CD」という)で評価した。CD(dB)は以下のように定義される。
Figure 0004977100
ここで、gβkとβkは、それぞれ評価対象の推定音源信号と残響を含まない原音源(発話)信号のケプストラム係数であり、D=12とした。残響除去後の信号に残存する初期反射音の影響を低減するために、CDを計算する前に、両信号に対し平均ケプストラム減算処理を施した。この評価尺度で、エネルギー時間パターン歪みとスペクトル包絡歪みが評価できる。標本化周波数は8kHz、周波数分割・統合処理には複素サブバンド処理を用い、サブバンドの数を129とし、間引き率は1/128とした。逐次処理のブロックサイズは16フレーム(=256ms)とした。これは、AR係数事後PDFの更新周期に相当する。PropとPriorで用いるAR係数の事前PDFを定めるために、同じ部屋の別の場所で測定された室内インパルス応答を畳み込んだ女性の一発話に対し、Baselineを適用して得られたAR係数を用いて、式(6)によりΣを定めた。各周波数ビンにおけるAR係数の次数は24とした。
図8は、観測信号、Baseline、Prop、Prior及びPosteriorを用いて残響除去した信号の平均CDを示したものである。異なる発話にわたって、1番目から5番目の単語までを別々に平均CDを計算した。図8より、PropとPosteriorは、発話中の最初の単語では比較的CDが高いが、残りの単語に対して性能は急速に改善し、Baselineの性能に迫っている。PropとPosteriorとを比べると、Propは最初の単語の品質をPosteriorより大幅に改善できている。一方、Priorも平均CDを安定して最初から低減できているが、改善量は比較的小さい。これらの結果は、AR係数事前PDFによる事前知識が、Propに、逐次処理で発話の最初から非常に少ないアルゴリズム遅延内で効果的に残響除去を実現させることができていることを示している。
図5は、残響除去前後のスペクトログラムを示したものである。図5より、Priorが発話の最初から効果的に残響のパワーを抑圧している一方、Posteriorは発話中の2単語目で急速に残響除去性能を改善していることがわかる。これらに対し、PropはPriorとPosterior双方の方法の効果を享受して逐次処理が実現できていることがわかる。
本発明は、残響除去を行う音響装置等が、信号の観測開始直後から効果的に残響除去を行う必要がある用途のものである場合に特に有用である。
第1、第2実施形態の残響除去装置200の機能構成例を示す図 第1実施形態の処理フローを示す図 第2実施形態の処理フローを示す図 第4実施形態の残響除去装置300の機能構成例を示す図 第4実施形態の処理フローを示す図 第5実施形態の残響除去装置400の機能構成例を示す図 第5実施形態の処理フローを示す図 各動作条件ごとのケプストラム歪みの改善状況の相違を示す図 残響除去前後の各信号のスペクトログラムの相違を示す図 従来技術による残響除去装置100の機能構成例を示す図

Claims (10)

  1. 音源が放音した音響信号(以下、「音源信号」という)を残響のある部屋で逐次収音し、その収音した信号(以下、「観測信号」という)を周波数領域に変換する周波数分割処理部と、
    周波数領域に変換した上記観測信号(以下、「周波数領域観測信号」という)を、所定の時間間隔ごとのブロックに分割するブロック分割部と、
    上記ブロック単位で上記周波数領域観測信号を逐次受け取り、上記音源信号の周波数領域における期待値と上記音源信号の周波数領域における共分散行列により定義される音源信号の確率密度関数(以下、「音源信号事前PDF」という)を逐次推定する音源信号事前PDF推定部と、
    上記周波数領域観測信号に含まれる残響成分を推定する長時間自己回帰係数(以下、「AR係数」という)の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事前PDF」という)が予め記憶されたAR係数事前PDF記憶部と、
    上記周波数領域観測信号が与えられたもとでのAR係数の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事後PDF」という)を記憶するAR係数事後PDF記憶部と、
    上記ブロック単位で上記周波数領域観測信号を逐次受け取るとともに当該各ブロックに対応する上記音源信号事前PDFを逐次受け取り、更に上記AR係数事前PDF記憶部からAR係数事前PDFを読み出し、当該周波数領域観測信号と当該音源信号事前PDFと当該AR係数事前PDFから上記AR係数事後PDFを逐次推定して、上記AR係数事後PDF記憶部に書き込むAR係数事後PDF推定部と、
    上記周波数領域観測信号を逐次受け取るとともに、上記AR係数事後PDF記憶部からAR係数事後PDFを逐次読み出し、当該周波数領域観測信号と当該AR係数事後PDFから残響の周波数領域における期待値と残響の周波数領域における共分散行列により定義される残響のPDF(以下、「残響事後PDF」という)を逐次推定する残響事後PDF推定部と、
    上記残響事後PDFを用いて上記周波数領域観測信号から残響成分を除去することにより、周波数領域の音源信号(以下、「周波数領域音源信号」という)を逐次推定する残響除去部と、
    上記周波数領域音源信号を時間領域に変換する周波数統合処理部と、
    を備える残響除去装置。
  2. 請求項1に記載の残響除去装置において、
    上記音源信号事前PDF推定部は、更に上記AR係数事後PDFを逐次受け取り、周波数領域観測信号とAR係数事後PDFとから音源信号事前PDFを繰り返し推定し、
    上記AR係数事後PDF推定部は、上記音源信号事前PDF推定部が繰り返し推定した音源信号事前PDFを逐次受け取ってAR係数事後PDFを繰り返し推定し、AR係数事後PDFが収束するか又は所定の繰り返し回数に達した時点でAR係数事後PDFを上記AR係数事後PDF記憶部に書き込む
    ことを特徴とする残響除去装置。
  3. 音源が放音した音響信号(以下、「音源信号」という)を残響のある部屋で逐次収音し、その収音した信号(以下、「観測信号」という)を周波数領域に変換する周波数分割処理部と、
    周波数領域に変換した上記観測信号(以下、「周波数領域観測信号」という)を、所定の時間間隔ごとのブロックに分割するブロック分割部と、
    上記ブロック単位で上記周波数領域観測信号を逐次受け取り、上記音源信号の周波数領域における期待値と上記音源信号の共分散行列により定義される音源信号の確率密度関数(以下、「音源信号事前PDF」という)を逐次推定する音源信号事前PDF推定部と、
    上記周波数領域観測信号に含まれる残響成分を推定する長時間自己回帰係数(以下、「AR係数」という)の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事前PDF」という)が予め記憶されたAR係数事前PDF記憶部と、
    上記周波数領域観測信号が与えられたもとでのAR係数の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事後PDF」という)を記憶するAR係数事後PDF記憶部と、
    上記ブロック単位で上記周波数領域観測信号を逐次受け取るとともに当該各ブロックに対応する上記音源信号事前PDFを逐次受け取り、更に上記AR係数事前PDF記憶部から当該各ブロックに対応するAR係数事前PDFを逐次読み出し、当該周波数領域観測信号と当該音源信号事前PDFと当該AR係数事前PDFから上記AR係数事後PDFを逐次推定して、上記AR係数事後PDF記憶部に書き込むAR係数事後PDF推定部と、
    上記周波数領域観測信号を逐次受け取るとともに、上記AR係数事後PDF記憶部からAR係数事後PDFを逐次読み出し、当該周波数領域観測信号と当該AR係数事後PDFから音源信号の事後PDFを逐次推定して、その期待値を周波数領域の音源信号(以下、「周波数領域音源信号」という)として推定する残響除去部と、
    上記周波数領域音源信号を時間領域に変換する周波数統合処理部と、
    を備える残響除去装置。
  4. 音源が放音した音響信号(以下、「音源信号」という)を残響のある部屋で逐次収音し、その収音した信号(以下、「観測信号」という)を周波数領域に変換する周波数分割処理部と、
    周波数領域に変換した上記観測信号(以下、「周波数領域観測信号」という)に含まれる残響を予測する長時間自己回帰係数(以下、「AR係数」という)の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事前PDF」という)が予め記憶されたAR係数事前PDF記憶部と、
    上記周波数領域観測信号を逐次受け取るとともに、上記AR係数事前PDF記憶部からAR係数事前PDFを逐次読み出し、当該周波数領域観測信号と当該AR係数事前PDFから残響の周波数領域における期待値と残響の共分散行列により定義される残響のPDF(以下、「残響事後PDF」という)を逐次推定する残響事後PDF推定部と、
    上記残響事後PDFを用いて上記周波数領域観測信号から残響成分を除去することにより、周波数領域の音源信号(以下、「周波数領域音源信号」という)を逐次推定する残響除去部と、
    推定した上記周波数領域音源信号を時間領域に変換する周波数統合処理部と、
    を備える残響除去装置。
  5. 音源が放音した音響信号(以下、「音源信号」という)を残響のある部屋で逐次収音し、その収音した信号(以下、「観測信号」という)を周波数領域に変換する周波数分割処理ステップと、
    周波数領域に変換した上記観測信号(以下、「周波数領域観測信号」という)を、所定の時間間隔ごとのブロックに分割するブロック分割ステップと、
    上記ブロック単位の上記周波数領域観測信号を用いて、上記音源信号の周波数領域における期待値と上記音源信号の周波数領域における共分散行列により定義される音源信号の確率密度関数(以下、「音源信号事前PDF」という)を逐次推定する音源信号事前PDF推定ステップと、
    上記ブロック単位の上記周波数領域観測信号と、当該各ブロックに対応する上記音源信号事前PDFと、上記周波数領域観測信号に含まれる残響成分を推定する長時間自己回帰係数(以下、「AR係数」という)の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事前PDF」という)とから、上記周波数領域観測信号が与えられたもとでのAR係数の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事後PDF」という)を逐次推定するAR係数事後PDF推定ステップと、
    上記周波数領域観測信号と上記AR係数事後PDFとから、残響の周波数領域における期待値と残響の周波数領域における共分散行列により定義される残響のPDF(以下、「残響事後PDF」という)を逐次推定する残響事後PDF推定ステップと、
    上記残響事後PDFを用いて上記周波数領域観測信号から残響成分を除去することにより、周波数領域の音源信号(以下、「周波数領域音源信号」という)を逐次推定する残響除去ステップと、
    上記周波数領域音源信号を時間領域に変換する周波数統合処理ステップと、
    を実行する残響除去方法。
  6. 請求項5に記載の残響除去方法において、
    上記音源信号事前PDF推定ステップは、更に上記AR係数事後PDFを用い、周波数領域観測信号とAR係数事後PDFとから音源信号事前PDFを繰り返し推定し、
    上記AR係数事後PDF推定ステップは、上記音源信号事前PDF推定ステップにて繰り返し推定した音源信号PDFを逐次受け取ってAR係数事後PDFを繰り返し推定し、AR係数事後PDFが収束するか又は所定の繰り返し回数に達した時点でAR係数事後PDF記憶部に書き込む
    ことを特徴とする残響除去方法。
  7. 音源が放音した音響信号(以下、「音源信号」という)を残響のある部屋で逐次収音し、その収音した信号(以下、「観測信号」という)を周波数領域に変換する周波数分割処理ステップと、
    周波数領域に変換した上記観測信号(以下、「周波数領域観測信号」という)を、所定の時間間隔ごとのブロックに分割するブロック分割ステップと、
    上記ブロック単位で上記周波数領域観測信号を逐次受け取り、上記音源信号の周波数領域における期待値と上記音源信号の周波数領域における共分散行列により定義される音源信号の確率密度関数(以下、「音源信号事前PDF」という)を逐次推定する音源信号事前PDF推定ステップと、
    上記ブロック単位の上記周波数領域観測信号と、当該各ブロックに対応する上記音源信号事前PDFと、当該各ブロックに対応する上記周波数領域観測信号に含まれる残響成分を推定する長時間自己回帰係数(以下、「AR係数」という)の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事前PDF」という)とから、上記周波数領域観測信号が与えられたもとでのAR係数の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事後PDF」という)を逐次推定するAR係数事後PDF推定ステップと、
    上記周波数領域観測信号と上記AR係数事後PDFとから、音源信号の事後PDFを逐次推定して、その期待値を周波数領域の音源信号(以下、「周波数領域音源信号」という)として推定する残響除去ステップと、
    上記周波数領域音源信号を時間領域に変換する周波数統合処理ステップと、
    実行する残響除去方法。
  8. 音源が放音した音響信号(以下、「音源信号」という)を残響のある部屋で逐次収音し、その収音した信号(以下、「観測信号」という)を周波数領域に変換する周波数分割処理ステップと、
    上記周波数領域観測信号と周波数領域に変換した上記観測信号(以下、「周波数領域観測信号」という)に含まれる残響を予測する長時間自己回帰係数(以下、「AR係数」という)の期待値とAR係数の共分散行列により定義されるAR係数の確率密度関数(以下、「AR係数事前PDF」という)とから、残響の周波数領域における期待値と残響の周波数領域における共分散行列により定義される残響のPDF(以下、「残響事後PDF」という)を逐次推定する残響事後PDF推定ステップと、
    上記残響事後PDFを用いて上記周波数領域観測信号から残響成分を除去することにより、周波数領域の音源信号(以下、「周波数領域音源信号」という)を逐次推定する残響除去ステップと、
    推定した上記周波数領域音源信号を時間領域に変換する周波数統合処理ステップと、
    実行する残響除去方法。
  9. 請求項1〜4のいずれかに記載した装置としてコンピュータを機能させるためのプログラム。
  10. 請求項9に記載したプログラムを記録したコンピュータが読み取り可能な記録媒体。
JP2008206784A 2008-08-11 2008-08-11 残響除去装置、残響除去方法、そのプログラムおよび記録媒体 Expired - Fee Related JP4977100B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008206784A JP4977100B2 (ja) 2008-08-11 2008-08-11 残響除去装置、残響除去方法、そのプログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008206784A JP4977100B2 (ja) 2008-08-11 2008-08-11 残響除去装置、残響除去方法、そのプログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2010044150A JP2010044150A (ja) 2010-02-25
JP4977100B2 true JP4977100B2 (ja) 2012-07-18

Family

ID=42015597

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008206784A Expired - Fee Related JP4977100B2 (ja) 2008-08-11 2008-08-11 残響除去装置、残響除去方法、そのプログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP4977100B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101909710B1 (ko) * 2018-04-18 2018-10-18 국방과학연구소 소나 시스템에서 신호의 희소성을 기초로 주파수영역에서의 공분산행렬 기반 압축센싱 도래각 추정방법 및 시스템

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5172536B2 (ja) * 2008-08-22 2013-03-27 日本電信電話株式会社 残響除去装置、残響除去方法、コンピュータプログラムおよび記録媒体
CN102750956B (zh) * 2012-06-18 2014-07-16 歌尔声学股份有限公司 一种单通道语音去混响的方法和装置
EP3460795A1 (en) * 2017-09-21 2019-03-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal processor and method for providing a processed audio signal reducing noise and reverberation

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006234888A (ja) * 2005-02-22 2006-09-07 Nippon Telegr & Teleph Corp <Ntt> 残響除去装置、残響除去方法、残響除去プログラムおよび記録媒体
US8290170B2 (en) * 2006-05-01 2012-10-16 Nippon Telegraph And Telephone Corporation Method and apparatus for speech dereverberation based on probabilistic models of source and room acoustics

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101909710B1 (ko) * 2018-04-18 2018-10-18 국방과학연구소 소나 시스템에서 신호의 희소성을 기초로 주파수영역에서의 공분산행렬 기반 압축센싱 도래각 추정방법 및 시스템

Also Published As

Publication number Publication date
JP2010044150A (ja) 2010-02-25

Similar Documents

Publication Publication Date Title
EP1993320B1 (en) Reverberation removal device, reverberation removal method, reverberation removal program, and recording medium
JP5124014B2 (ja) 信号強調装置、その方法、プログラム及び記録媒体
US8467538B2 (en) Dereverberation apparatus, dereverberation method, dereverberation program, and recording medium
JP5666444B2 (ja) 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法
CN108172231B (zh) 一种基于卡尔曼滤波的去混响方法及系统
JP4977062B2 (ja) 残響除去装置とその方法と、そのプログラムと記録媒体
JP5634959B2 (ja) 雑音/残響除去装置とその方法とプログラム
JP6677662B2 (ja) 音響処理装置、音響処理方法およびプログラム
JP4856662B2 (ja) 雑音除去装置、その方法、そのプログラム及び記録媒体
JP6748304B2 (ja) ニューラルネットワークを用いた信号処理装置、ニューラルネットワークを用いた信号処理方法及び信号処理プログラム
JP2006243290A (ja) 外乱成分抑圧装置、コンピュータプログラム、及び音声認識システム
JP4977100B2 (ja) 残響除去装置、残響除去方法、そのプログラムおよび記録媒体
Oudre Interpolation of missing samples in sound signals based on autoregressive modeling
JP2007065204A (ja) 残響除去装置、残響除去方法、残響除去プログラム及びその記録媒体
KR20220022286A (ko) 잔향 제거 오토 인코더를 이용한 잔향 환경 임베딩 추출 방법 및 장치
JP4348393B2 (ja) 信号歪み除去装置、方法、プログラム及びそのプログラムを記録した記録媒体
JP2016143042A (ja) 雑音除去装置及び雑音除去プログラム
JP6721165B2 (ja) 入力音マスク処理学習装置、入力データ処理関数学習装置、入力音マスク処理学習方法、入力データ処理関数学習方法、プログラム
JP2003533753A (ja) スペクトルのモデル化
JP6827908B2 (ja) 音源強調装置、音源強調学習装置、音源強調方法、プログラム
Evers et al. Multichannel online blind speech dereverberation with marginalization of static observation parameters in a Rao-Blackwellized particle filter
JP5583181B2 (ja) 縦続接続型伝達系パラメータ推定方法、縦続接続型伝達系パラメータ推定装置、プログラム
JP5731929B2 (ja) 音声強調装置とその方法とプログラム
JP5498452B2 (ja) 背景音抑圧装置、背景音抑圧方法、およびプログラム
JP4313740B2 (ja) 残響除去方法、プログラムおよび記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100726

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120403

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120413

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150420

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees