JP3787103B2 - 音声処理装置、音声処理方法、音声処理プログラム - Google Patents

音声処理装置、音声処理方法、音声処理プログラム Download PDF

Info

Publication number
JP3787103B2
JP3787103B2 JP2002071858A JP2002071858A JP3787103B2 JP 3787103 B2 JP3787103 B2 JP 3787103B2 JP 2002071858 A JP2002071858 A JP 2002071858A JP 2002071858 A JP2002071858 A JP 2002071858A JP 3787103 B2 JP3787103 B2 JP 3787103B2
Authority
JP
Japan
Prior art keywords
band
signal
level difference
signals
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002071858A
Other languages
English (en)
Other versions
JP2003271167A (ja
Inventor
真理子 青木
賢一 古家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2002071858A priority Critical patent/JP3787103B2/ja
Publication of JP2003271167A publication Critical patent/JP2003271167A/ja
Application granted granted Critical
Publication of JP3787103B2 publication Critical patent/JP3787103B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、例えば音声、楽音、各種環境音源等から得られたステレオ信号の原音推定に利用することができる音声処理装置、音声処理方法、音声処理プログラムに関する。
【0002】
【従来の技術】
従来よりステレオ信号の原音推定に利用されているゾーン分離収音技術には、例えば、音が持つ次のような特徴を利用したものがある。音はいくつかの周波数成分の和として表現されることが知られている。そこで、複数の音が同時に鳴っている場合、各チャネルのマイクロホンに入力される音源信号を各音源からの周波数成分が周波数軸上で重ならない程度の帯域に分割し、チャネル間の各周波数成分の到達位相差や到達レベル差を基に、各周波数成分のそれぞれがどのゾーンからのものであるかを判定し、同一ゾーンからの成分を集めて合成することにより、各ゾーン毎の音を個別に収音する方法が用いられていた(参考:特願平09−252312号:「音源分離方法、装置および記録媒体」)。
【0003】
【発明が解決しようとする課題】
ところが、この技術では、残響下で2つの音源の角度が近接している場合や2つのマイクロホン間の距離が近い場合に、マイクロホンで受音される信号の、目的音に対する妨害音のレベルが大きくなり(以下、SNが劣化する、と表現する)、その結果、分離処理後の音に歪みが生じるという課題があった(課題1)。本発明は、受音信号に対して逆フィルタ演算をすることにより受音信号のSNを回復する。
また、逆フィルタ演算をすることにより受音信号のSNを回復する方式としては従来、高次統計量を用いて逆フィルタを推定する方法があった。(参考:A.J.Bell and T.J.Sejowski,“An information-maximization approach to blind separation and blind deconvolution,”Neural Comput.,vol.7,1129-1159(1995).)しかし、高次統計量を扱うため、演算量が多いという課題があった(課題2)。
【0004】
【課題を解決するための手段】
この発明では2つのチャネルの信号を、複数の周波数帯域に分割する帯域分割手段と、上記帯域分割手段で分割された各出力チャネル信号の各同一帯域毎に、チャネル間レベル差を算出する帯域別レベル差算出手段と、上記帯域別レベル差算出手段で算出された帯域別チャネル間レベル差を基に、各チャネルの伝達特性を推定する伝達特性推定手段と、上記伝達特性推定手段で推定された伝達特性を基に、逆フィルタ演算をする逆混合行列算出手段と、を有する音声処理装置を提案する。
【0005】
この発明では更に2つのチャネルの信号を、複数の周波数帯域に分割する帯域分割手段と、上記帯域分割手段で分割された各出力チャネル信号の各同一帯域毎に、チャネル間レベル差を算出する帯域別レベル差算出手段と、上記帯域別レベル差算出手段で算出された帯域別チャネル間レベル差を基に、各チャネルの伝達特性を推定する伝達特性推定手段と、上記伝達特性推定手段で推定された伝達特性を基に、逆フィルタ演算をする逆混合行列算出手段と、上記帯域別レベル差算出手段で算出されるチャネル間レベル差に基づき、その帯域の出力信号が、いずれの音源から入力された信号であるかを判定する信号判定手段と、上記信号判定手段の判定に基づき、上記逆混合行列算出手段で得られた出力信号に重み値を乗算することで、同一音源から入力された信号を少なくとも一つ抽出する音源信号選択手段と、上記音源信号選択手段で同一音源からの信号として選択された複数の帯域信号を音源信号として合成する音源信号合成手段と、を有する音声処理装置を提案する。
【0006】
又2つの信号を、複数の周波数帯域に分割する帯域分割手段と、上記帯域分割手段で分割された各出力チャネル信号の各同一帯域毎に、チャネル間レベル差を算出する第1帯域別レベル差算出手段と、上記帯域別レベル差算出手段で算出された帯域別チャネル間レベル差を基に、各チャネルの伝達特性を推定する伝達特性推定手段と、上記伝達特性推定手段で推定された伝達特性を基に、逆フィルタ演算をする逆混合行列算出手段と、上記逆混合行列算出手段からの出力信号を基に、各帯域のチャネル間レベル差を算出する第2帯域別レベル差算出手段と、上記第2帯域別レベル差算出手段で算出されるチャネル間レベル差に基づき、その帯域の出力信号が、いずれの音源から入力された信号であるかを判定する信号判定手段と、上記信号判定手段の判定に基づき、上記逆混合行列算出手段で得られた出力信号に重み値を乗算することで、同一音源から入力された信号を少なくとも一つ抽出する音源信号選択手段と、上記音源信号選択手段で同一音源からの信号として選択された複数の帯域信号を音源信号として合成する音源信号合成手段と、を有する音声処理装置を提案する。
【0007】
この発明では更に2つのチャネルの信号を、複数の周波数帯域に分割する帯域分割処理と、上記帯域分割処理で分割された各出力チャネル信号の各同一帯域毎に、チャネル間レベル差を算出する帯域別レベル差算出処理と、上記帯域別レベル差算出処理で算出された帯域別チャネル間レベル差を基に、各チャネルの伝達特性を推定する伝達特性推定処理と、上記伝達特性推定処理で推定された伝達特性を基に、逆フィルタ演算をする逆混合行列算出処理と、を実行する音声処理方法を提案する。
【0008】
この発明では更に2つのチャネルの信号を、複数の周波数帯域に分割する帯域分割処理と、上記帯域分割処理で分割された各出力チャネル信号の各同一帯域毎に、チャネル間レベル差を算出する帯域別レベル差算出処理と、上記帯域別レベル差算出処理で算出された帯域別チャネル間レベル差を基に、各チャネルの伝達特性を推定する伝達特性推定処理と、上記伝達特性推定処理で推定された伝達特性を基に、逆フィルタ演算をする逆混合行列算出処理と、上記帯域別レベル差算出処理で算出されるチャネル間レベル差に基づき、その帯域の出力信号が、いずれの音源から入力された信号であるかを判定する信号判定処理と、上記信号判定処理の判定に基づき、上記逆混合行列算出処理で得られた出力信号に重み値を乗算することで、同一音源から入力された信号を少なくとも一つ抽出する音源信号選択処理と、上記音源信号選択処理で同一音源からの信号として選択された複数の帯域信号を音源信号として合成する音源信号合成処理と、を実行する音声処理方法を提案する。
【0009】
又2つのチャネルの信号を、複数の周波数帯域に分割する帯域分割処理と、上記帯域分割処理で分割された各出力チャネル信号の各同一帯域毎に、チャネル間レベル差を算出する第1帯域別レベル差算出処理と、上記第1帯域別レベル差算出処理で算出された帯域別チャネル間レベル差を基に、各チャネルの伝達特性を推定する伝達特性推定処理と、上記伝達特性推定処理で推定された伝達特性を基に、逆フィルタ演算をする逆混合行列算出処理と、上記逆混合行列算出処理からの出力信号を基に、各帯域のチャネル間レベル差を算出する第2帯域別レベル差算出処理と、上記第2帯域別レベル差算出処理で算出されるチャネル間レベル差に基づき、その帯域の出力信号が、いずれの音源から入力された信号であるかを判定する信号判定処理と、上記信号判定処理の判定に基づき、上記逆混合行列算出処理で得られた出力信号に重み値を乗算することで、同一音源から入力された信号を少なくとも一つ抽出する音源信号選択処理と、上記音源信号選択処理で同一音源からの信号として選択された複数の帯域信号を音源信号として合成する音源信号合成処理と、を実行する音声処理方法を提案する。
【0010】
この発明では更にコンピュータが読み取り可能な符号によって記述され、上記記載の音声処理方法をコンピュータ上で実行する音声処理プログラムを提案する。
作用
この発明による音声処理装置、音声処理方法によれば受音信号に対して逆フィルタ演算を施すことで、信号のSNを改善し、その信号に対して各帯域がどちらの音源の影響が強いかを判定することで従来と比べ高いSNで歪みを小さくしたまま音源を分離することができる(課題1の解決)。
【0011】
また、逆フィルタ演算を行なう際に従来のように高次統計量を用いず、受音信号を周波数分析し、各帯域における周波数成分のチャネル間の比を算出することで逆混合行列を推定する。そのために、演算量の削減をはかることが出来る(課題2の解決)。
【0012】
【発明の実施の形態】
図1にこの発明の請求項1で提案する音声処理装置の実施例を示す。図中S1及びS2は音源、1及び2は例えばマイクロホンのような収音手段を示す。音源S1の信号をS1(n)、音源S2の信号をS2(n)とする。
尚、この実施例では音源S1とS2が発生する信号S1(n)とS2(n)を収音手段1及び2で収音して2チャネルのステレオ信号を生成した例を示すが、予め収録した2チャネルのステレオ信号を再生して、この発明による音声処理方法を施すことも考えられる。
【0013】
収音手段1は音源S1の信号S1(n)を伝達特性H11を介して収音する信号と、音源S2の信号S2(n)を伝達特性H21を介して収音する信号を出力する。収音手段2は音源S2の信号S2(n)を伝達特性H22を介して収音する信号と、音源S1の信号S1(n)を伝達特性H12を介して収音する信号を出力する。収音手段1が出力する信号をX1(n)、収音手段2が出力する信号をX2(n)とする。
収音手段1及び2が出力する信号X1(n)及びX2(n)は帯域分割手段3に入力される。帯域分割手段3は信号X1(n)及びX2(n)を複数の周波数帯域に分割する。帯域分割の手段としては例えば、フーリエ変換やウェーブレット変換が挙げられる。受音信号を、式(1)、(2)で表す。ここで、lは、信号分析長(フーリエ変換の場合にはフレーム長)のインデックスを表す。
【0014】
1(ω,l)=|X1(ω,l)|exp(jarg(X1(ω,l)) (1)
2(ω,l)=|X2(ω,l)|exp(jarg(X2(ω,l)) (2)
ここで、周波数領域に変換された音源信号S(ω)=[S1(ω),S2(ω)]T と、受音信号X(ω)=[X1(ω),X2(ω)]T の間には式(3)で示される関係が成立する。
H(ω)は音源iからマイクjへの周波数応答(伝達特性)Hji(ω)を要素とする(2×2)の混合行列である。
【0015】
【数1】
Figure 0003787103
【0016】
帯域別レベル差算出手段4においては、X1 ,X2 の信号に対し、式(4)で示す帯域別レベル差を算出する。
【0017】
【数2】
Figure 0003787103
【0018】
伝達特性推定手段5においては、まず、帯域別レベル差をもとに、各帯域の音が音源1、音源2のどちらの影響が強いかを判定する。例えば、あらかじめ定めた1以上の値aに対し、
【0019】
【数3】
Figure 0003787103
【0020】
が成立するならば、その帯域は音源S2の影響が強く、音源S1の信号S1(n)はS1(ω)=0と仮定できると考える。この場合、S1(ω)=0であることから、式(6)が成立する。
【0021】
【数4】
Figure 0003787103
【0022】
そこで、伝達特性の推定値として式(7)を用いる。
【0023】
【数5】
Figure 0003787103
【0024】
同様に、あらかじめ定めた1以上の値bに対し、
【0025】
【数6】
Figure 0003787103
【0026】
が成立するならば、その帯域は音源S1の影響が強く、音源S2の信号S2(n)はS2(ω)=0と仮定できると考える。この場合、S2(ω)=0であることから、式(9)が成立する。
【0027】
【数7】
Figure 0003787103
【0028】
そこで、伝達特性の推定値として式(10)を用いる。
【0029】
【数8】
Figure 0003787103
【0030】
また、式(5)、(7)のいずれにも該当しない帯域については、S1=0,S2=0どちらの仮定も成立しないため、受音信号をそのまま回復させるために、伝達特性の推定値として式(11)を用いる。
【0031】
【数9】
Figure 0003787103
【0032】
次に、各フレームにおいて算出された伝達特性の推定値
【0033】
【数10】
Figure 0003787103
【0034】
を、ある一定時間長バッファに貯め、それを加重平均する。加重平均の式は式(12)で示される。
【0035】
【数11】
Figure 0003787103
【0036】
ここで、βとγの数値としては0<β<1、0<γ<1とする。また、Mは加重平均に用いるフレームの個数とする。Mの数としては例えば100程度が用いられる。
逆混合行列算出手段6においては、式(13)で示される逆混合行列演算により、受音信号X1(ω,l)とX2(ω,l)に逆フィルタ処理を施し、各チャネルの本来の信号(音源S1の信号S1(n)と音源S2の信号S2(n))に分離し、
【0037】
【数12】
Figure 0003787103
【0038】
分離された信号Y1(ω),Y2(ω)を得る。
図1に示した帯域分割手段3、帯域別レベル差算出手段4、伝達特性推定手段5、逆混合行列算出手段6はそれぞれコンピュータ上でこの発明による音声処理プログラムによって実現される。
図2にこの発明による音声処理プログラムの概要を表わすフローチャートを示す。
ステップS10で帯域分割処理を実行する。この帯域分割処理は先にも説明したように、フーリエ変換或はウェーブレット変換を利用することができる。周波数帯域の分割数としては図10に示すように、512,1024,2048,4096等に採ることができる。
【0039】
ステップS20では帯域別レベル差算出処理を実行する。この処理により、各帯域毎にチャネル間のレベル差が算出される。
ステップS30ではステップS20で算出されたチャネル間レベル差を利用して上述した式(7)乃至式(11)により各周波数帯域毎に伝達特性推定処理を施す。
ステップS40ではステップS30で各周波数帯域毎に推定した伝達特性H21(ω)/H11(ω)とH12(ω)/H22(ω)を利用して式(13)により逆混合処理(音源S1,S2と収音手段1,2で生じた混合現象の逆)を施し、分離された信号Y1(ω),Y2(ω)を得る。
【0040】
図3にこの発明の請求項で提案する音声信号処理装置の実施例を示す。この実施例では帯域分割手段3、帯域別レベル差算出手段4、伝達特性推定手段5、逆混合行列算出手段6を用いて逆混合行列算出手段6から逆混合された信号Y1(ω),Y2(ω)を得るまでの構成は図1に示した構成と同じである。この実施例では信号判定手段7と、信号選択手段8と、信号合成手段9とを設けた構成を特徴とするものである。信号判定手段7においては帯域別レベル差算出手段4で算出した各帯域別のチャネル間レベル差に基づき、分離された信号Y1(ω),Y2(ω)に乗算する重み値を決定する。例えば、チャネル間レベル差がある値τより大きい(但しτはτ>1)場合、Y1(ω)には重み値として1となる重み値wei1(ω)を決定し、Y2(ω)には重み値として0または小さな値c(ω)となる重み値wei2(ω)を決定する。
【0041】
信号選択手段8では信号判定手段7で決定した重み値wei1(ω)とwei2(ω)を逆混合行列算出手段6から出力される信号Y1(ω)とY2(ω)に乗算する。
信号合成手段9では重み値wei1(ω)とwei2(ω)が乗算された信号を共に、信号を周波数領域から時間領域に変換することで各音源S1,S2からの音を高いS/Nで抽出することができる。
図4に図2に示した音声処理装置をコンピュータ上で実現するための音声処理プログラムの概要を示す。ステップS10乃至ステップS40までの処理は図2に示したフローチャートと同じである。ここでの特徴はステップS40で逆混合行列算出処理を施した後に信号判定処理ステップS50と、音源信号選択処理ステップS60と音源信号合成処理ステップS70を実行する点を特徴とするものである。
【0042】
信号判定処理ステップS50ではステップS20で算出した帯域別レベル差に従って重み値wei1(ω)とwei2(ω)の値を決定する。音源信号選択処理ステップS60ではステップS50で決定した重み値wei1(ω)とwei2(ω)を逆混合行列算出ステップS40で算出された信号Y1(ω),Y2(ω)に乗算する。音源信号合成処理ステップS70では重み値wei1(ω)とwei2(ω)が乗算された信号を元に、信号を周波数領域から時間領域に変換する。図5はこの発明に関連する音声処理装置の提案例を示す。この提案例では第1帯域別レベル差算出手段4とは別に、第2帯域別レベル差算出手段10を設け、この第2帯域別レベル差算出手段10により逆混合行列算出手段6が出力する信号Y1(ω)とY2(ω)のレベル差を算出し、その算出結果を利用して信号判定手段7で重み値wei1(ω)とwei2(ω)を決定し、これらの重み値を信号選択手段8で信号Y1(ω)とY2(ω)に乗算する構成とした場合を示す。
【0043】
このように構成しても、図3の実施例と同様に各音源S1及びS2からの音を高いS/Nで抽出することができる利点が得られる。 図6に図5に示した提案例をコンピュータ上で実現するための音声処理プログラムの概要を示すフローチャートを示す。ここでは図4に示したフローチャートのステップS40とステップS50の間に第2帯域別レベル差算出処理ステップS80を介挿し、これにより逆混合行列算出処理で得られる信号Y1(ω)とY2(ω)のレベル差に基づいて重み値wei1(ω)とwei2(ω)を決定する処理手順とした点を特徴とするものである。
【0044】
上述したこの発明による音声処理方法はコンピュータが読み取り可能な符号によって記述されたプログラムをコンピュータに実行させることにより実現される。プログラムはCD等の記録媒体或は通信回線を通じてコンピュータにダウンロードされ、インストールされてCPU等で実行される。
【0045】
【発明の効果】
以上説明したように、この発明によれば受音信号に逆混合行列算出処理を施し、SNを改善させた信号Y1(ω),Y2(ω)に対してチャネル間レベル差に基づき各帯域の信号が音源S1,S2のどちらの信号であるかを判定したから、高いSNで音源を分離することが可能となる。
因みに実験結果を例示する。ここではチャネル間比分布の観測(シミュレーション)を行なって、
同時発声の2音声に対してチャネル間比分布を二つに分離して観測できるか否かを調べた。図7は400Hz付近のチャネル間分布を7秒間観測した例である。2音声の混合信号は、信号作成時に到達レベル差(2dB)、到達時間差(0.47ms)を与えて作成した。図7より、チャネル間比分布を分離して観測可能であることが解る。
【0046】
次に、フーリエ変換(FFT)で用いるフレーム長とSN比改善量(残響下)に関する実験例を示す。
本発明による音声処理方法において、FFTフレーム長を変化させた場合のSN比改善量を調べた。図8に収音機器の配置図、図9に実験条件を、結果を図10に示す。
FFTフレーム長2048(ポイント)の場合にSN比改善量が最大となった。FFTフレーム長が短かい場合に性能が劣化するのは、一般に、伝達関数G(ω)を推定する際に、フィルタタップ長が混合系のインパルス応答以上の長さが必要であるためと考えられる。
【0047】
また、FFTフレーム長4096(ポイント)で性能が劣化するのは、フレーム長が長くなることでFFT分析の時間分解能が低下し、その結果2音声信号の同一周波数帯域における重畳度が上り、Si(ω)=0、Sj(ω)≠0の仮定が成立しなくなるためと考えられる。
チャネル間比推定時間長とSN比改善量(残響下)に関して、
長さが15秒の音声データに対し、チャネル間比を観測する時間を変化させた場合に得られるSN比改善量を調べた。FFTフレーム長は2048とした。
結果を図11に示す。図11から推定時間が長い程SN比改善量も増加することが分かった。一方で、5秒の推定でも8dB程度のSN比改善が得られた。
【0048】
SAFIA(特願平9−252312号:音源分離方法、装置および記録媒体)と本発明方法との組合せに対する効果、
SAFIAの前段に本発明の音声処理方法を入れることで得られる効果について調べた。比較のため、本発明の方法の他に周波数領域ICA、不要音声側にNullを向ける2素子の適応ビームフォーマ(以下ABFと称す)をSAFIAの前段に用いた場合について評価した。
評価尺度としては、SAFIA処理を施すことで得られるSN比改善量(SNRSAFIA)を全ての方式で一定にし、そのとき得られる歪改善量(SDRSAFIA)を測定した。また、全ての方式においてSNRSAFIAは24dBとなるようにSAFIA側のパラメータを調整した。これは、先に検討したSAFIA単体でのSDRSAFIA測定時と条件を同一にするためである。
【0049】
結果を図12に示す。SDRSAFIAの値は(本発明+SAFIA)が最も高く(ABF+SAFIA)、(ICA+SAFIA)、SAFIA単体の順になった。(本発明+SAFIA)はSAFIA単体に比べて8dB程度SDRSAFIAが改善した。このことから、本発明法をSAFIAの前段に組み合せる効果が高いことがわかる。
本発明はSAFIAのミュージカルノイズ(歪み)を低減させるため、チャネル間比を観測することで逆混合行列を推定する方法を提案し、SAFIAと組み合わせることによる効果を調べた。本発明方法はSAFIA単体に比べてSNを保ったまま(24dB)、歪(SDRSAFIA)を8dB程度改善することができた。
【0050】
また、この発明によれば逆混合行列算出処理演算(逆フィルタ演算)において、従来の高次統計量を用いるために演算量が大きかったものをチャネル間レベル差の観測という演算負荷の小さい方法で実現することにより、少ない演算量で逆フィルタ演算を可能とし、処理速度の向上も期待できる。
【図面の簡単な説明】
【図1】 この発明の請求項1,2で提案する音声処理装置の一実施例を説明するためのブロック図。
【図2】 この発明の請求項4で提案する音声処理方法及びこの方法を実行するプログラムの概要を説明するためのフローチャート。
【図3】 この発明の請求項で提案する音声処理装置の一実施例を説明するためのブロック図。
【図4】 この発明の請求項で提案する音声処理方法及びこの方法を実行するプログラムの概要を説明するためのフローチャート。
【図5】 この発明の関連する音声処理装置の一提案例を説明するためのブロック図。
【図6】 この発明の関連する音声処理方法及びこの方法を実行するプログラムの概要を説明するためのフローチャート。
【図7】 この発明の効果を説明するための図。
【図8】 この発明の効果を確認するために行なった実験で用いた収音機器の配置の様子を説明するための配置図。
【図9】 図8に示した実験の実験条件を示す図。
【図10】 この発明の音声処理方法において、FFTのフレーム長とSN比改善量を調べた結果を示す図。
【図11】 この発明の音声処理方法においてチャネル間比推定時間長とSN比改善量の関係を調べた結果を示す図。
【図12】 この発明の音声処理方法と他の方法との組合せで得られる効果を調べた結果を示す図。

Claims (7)

  1. 2つの音源が発生する信号を収音する2つの収音手段が出力するチャネル信号を、それぞれフレーム毎に複数の帯域別信号X(ω,l),X(ω,l)[lはフレーム番号]に分割する帯域分割手段と、
    上記帯域分割手段で分割された各出力チャネル信号の各帯域別信号X(ω,l),X(ω,l)から、同一帯域毎に帯域別チャネル間レベル差X(ω,l)/X(ω,l)を算出する帯域別レベル差算出手段と、
    上記帯域別レベル差算出手段で算出された帯域別チャネル間レベル差X(ω,l)/X(ω,l)が第1の閾値以上の場合は、H12(ω,l)/H22(ω,l)がX(ω,l)/X(ω,l)でかつH21(ω,l)/H11(ω,l)が0であると推定し、
    (ω,l)/X(ω,l)が第2の閾値以上の場合は、H21(ω,l)/H11(ω,l)がX(ω,l)/X(ω,l)でかつH12(ω,l)/H22(ω,l)が0であると推定し、
    上記のいずれでもない場合は、H21(ω,l)/H11(ω,l)とH12(ω,l)/H22(ω,l)がいずれも0であると推定し、
    上記伝達特性推定手段で推定されたH21(ω,l)/H11(ω,l)とH12(ω,l)/H22(ω,l)とを用いて
    Figure 0003787103
    により分離された信号Y(ω,l),Y(ω,l)を求める逆混合行列算出手段と、
    を有することを特徴とする音声処理装置。
    (但しH11(ω,l)は第1の音源から第1の収音手段への伝達特性、
    12(ω,l)は第1の音源から第2の収音手段への伝達特性、
    22(ω,l)は第2の音源から第2の収音手段への伝達特性、
    21(ω,l)は第2の音源から第1の収音手段への伝達特性、)
  2. 請求項1に記載の音声処理装置であって、
    上記伝達特性推定手段は上記フレーム毎に推定したH21(ω,l)/H11(ω,l)とH12(ω,l)/H22(ω,l)のそれぞれの所定数のフレームの加重平均H21(ω)/H11(ω)とH12(ω)/H22(ω)を求める手段を有し、
    上記逆混合行列算出手段は上記伝達特性推定手段で推定されたH21(ω)/H11(ω)とH12(ω)/H22(ω)とを用いて
    Figure 0003787103
    により分離された信号Y(ω,l),Y(ω,l)を求める手段を有することを特徴とする音声処理装置。
  3. 請求項1又は2に記載の音声処理装置であって、
    上記帯域別レベル差算出手段で算出される帯域別チャネル間レベル差X(ω,l)/X(ω,l)に基づき、チャネル間レベル差X(ω,l)/X(ω,l)が第3の閾値以上の場合は、重み値wei1(ω,l)を1、及びwei2(ω,l)を0と決定する信号判定手段と、
    上記分離された信号Y(ω,l)に上記重み値wei1(ω,l)を、上記信号Y(ω,l)に上記重み値wei2(ω,l)をそれぞれ乗算する信号選択手段と、
    上記信号選択手段から出力されたそれぞれの上記重み付けされた信号wei1(ω,l)Y(ω,l),wei2(ω,l)Y(ω,l)を音源信号として音声信号を合成する信号合成手段と、
    を有することを特徴とする音声処理装置。
  4. 2つの音源が発生する信号を収音する2つの収音手段が出力するチャネル信号を、それぞれフレーム毎に複数の帯域別信号X(ω,l),X(ω,l)[lはフレーム番号]に分割し、
    上記分割された各出力チャネル信号の各帯域別信号X(ω,l),X(ω,l)から、同一帯域毎に帯域別チャネル間レベル差X(ω,l)/X(ω,l)を算出し、
    上記算出された帯域別チャネル間レベル差X(ω,l)/X(ω,l)が第1の閾値以上の場合は、H12(ω,l)/H22(ω,l)がX(ω,l)/X(ω,l)でかつH21(ω,l)/H11(ω,l)が0であると推定し、
    (ω,l)/X(ω,l)が第2の閾値以上の場合は、H21(ω,l)/H11(ω,l)がX(ω,l)/X(ω,l)でかつH12(ω,l)/H22(ω,l)が0であると推定し、
    上記のいずれでもない場合は、H21(ω,l)/H11(ω,l)とH12(ω,l)/H22(ω,l)がいずれも0であると推定し、
    上記推定されたH21(ω,l)/H11(ω,l)とH12(ω,l)/H22(ω,l)とを用いて
    Figure 0003787103
    により分離された信号Y(ω,l),Y(ω,l)を求めることを特徴とする音声処理方法。
    (但しH11(ω,l)は第1の音源から第1の収音手段への伝達特性、
    12(ω,l)は第1の音源から第2の収音手段への伝達特性、
    22(ω,l)は第2の音源から第2の収音手段への伝達特性、
    21(ω,l)は第2の音源から第1の収音手段への伝達特性、)
  5. 請求項4に記載の音声処理方法であって、
    上記フレーム毎に推定したH21(ω,l)/H11(ω,l)とH12(ω,l)/H22(ω,l)のそれぞれの所定数のフレームの加重平均H21(ω)/H11(ω)とH12(ω)/H22(ω)を求め、
    上記推定されたH21(ω)/H11(ω)とH12(ω)/H22(ω)とを用いて
    Figure 0003787103
    により分離された信号Y(ω,l),Y(ω,l)を求めることを特徴とする音声処理方法。
  6. 請求項4又は5に記載の音声処理方法であって、
    上記帯域別チャネル間レベル差X(ω,l)/X(ω,l)に基づき、チャネル間レベル差X(ω,l)/X(ω,l)が第3の閾値以上の場合は、重み値wei1(ω,l)を1、及びwei2(ω,l)を0と決定し、
    上記分離された信号Y(ω,l)に上記重み値wei1(ω,l)を、上記信号Y(ω,l)に上記重み値wei2(ω,l)をそれぞれ乗算し、
    上記重み付け信号wei1(ω,l)Y(ω,l),wei2(ω,l)Y(ω,l)を音源信号として音声信号を合成することを特徴とする音声処理方法。
  7. コンピュータが読み取り可能な符号によって記述され、上記請求項4乃至6のいずれかに記載の音声処理方法をコンピュータ上で実行する音声処理プログラム。
JP2002071858A 2002-03-15 2002-03-15 音声処理装置、音声処理方法、音声処理プログラム Expired - Fee Related JP3787103B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002071858A JP3787103B2 (ja) 2002-03-15 2002-03-15 音声処理装置、音声処理方法、音声処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002071858A JP3787103B2 (ja) 2002-03-15 2002-03-15 音声処理装置、音声処理方法、音声処理プログラム

Publications (2)

Publication Number Publication Date
JP2003271167A JP2003271167A (ja) 2003-09-25
JP3787103B2 true JP3787103B2 (ja) 2006-06-21

Family

ID=29202021

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002071858A Expired - Fee Related JP3787103B2 (ja) 2002-03-15 2002-03-15 音声処理装置、音声処理方法、音声処理プログラム

Country Status (1)

Country Link
JP (1) JP3787103B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5130895B2 (ja) * 2007-12-13 2013-01-30 ソニー株式会社 音声処理装置、音声処理システム、音声処理プログラム及び音声処理方法
JP4840423B2 (ja) * 2008-09-11 2011-12-21 ソニー株式会社 音声信号処理装置および音声信号処理方法
EP2387032B1 (en) * 2009-01-06 2017-03-01 Mitsubishi Electric Corporation Noise cancellation device and noise cancellation program
JP2013062640A (ja) 2011-09-13 2013-04-04 Sony Corp 信号処理装置、信号処理方法、およびプログラム

Also Published As

Publication number Publication date
JP2003271167A (ja) 2003-09-25

Similar Documents

Publication Publication Date Title
JP5124014B2 (ja) 信号強調装置、その方法、プログラム及び記録媒体
WO2015196729A1 (zh) 一种麦克风阵列语音增强方法及装置
JP4172530B2 (ja) 雑音抑圧の方法及び装置並びにコンピュータプログラム
JP4496186B2 (ja) 音源分離装置、音源分離プログラム及び音源分離方法
JP6019969B2 (ja) 音響処理装置
AU2011253924A1 (en) Method to reduce artifacts in algorithms with fast-varying gain
CN111863015A (zh) 一种音频处理方法、装置、电子设备和可读存储介质
JP4448464B2 (ja) 雑音低減方法、装置、プログラム及び記録媒体
WO2019205796A1 (zh) 减少频域处理量的方法、装置及设备
JP5605574B2 (ja) 多チャンネル音響信号処理方法、そのシステム及びプログラム
KR100917460B1 (ko) 잡음제거 장치 및 방법
US9078077B2 (en) Estimation of synthetic audio prototypes with frequency-based input signal decomposition
JP5034735B2 (ja) 音処理装置およびプログラム
JP5294603B2 (ja) 音響信号推定装置、音響信号合成装置、音響信号推定合成装置、音響信号推定方法、音響信号合成方法、音響信号推定合成方法、これらの方法を用いたプログラム、及び記録媒体
JP3435357B2 (ja) 収音方法、その装置及びプログラム記録媒体
JP3787103B2 (ja) 音声処理装置、音声処理方法、音声処理プログラム
CN112201276B (zh) 基于TC-ResNet网络的麦克风阵列语音分离方法
JP4568193B2 (ja) 収音装置とその方法とそのプログラムとその記録媒体
JP2006227328A (ja) 音声処理装置
US8675881B2 (en) Estimation of synthetic audio prototypes
JP2003250193A (ja) 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
Miyazaki et al. Theoretical analysis of parametric blind spatial subtraction array and its application to speech recognition performance prediction
JP4249697B2 (ja) 音源分離学習方法、装置、プログラム、音源分離方法、装置、プログラム、記録媒体
CN113744752A (zh) 语音处理方法及装置
KR101096091B1 (ko) 음성 분리 장치 및 이를 이용한 단일 채널 음성 분리 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051227

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20051227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060323

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090331

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100331

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110331

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110331

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120331

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130331

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees