JP4891801B2 - 多信号強調装置、方法、プログラム及びその記録媒体 - Google Patents
多信号強調装置、方法、プログラム及びその記録媒体 Download PDFInfo
- Publication number
- JP4891801B2 JP4891801B2 JP2007038819A JP2007038819A JP4891801B2 JP 4891801 B2 JP4891801 B2 JP 4891801B2 JP 2007038819 A JP2007038819 A JP 2007038819A JP 2007038819 A JP2007038819 A JP 2007038819A JP 4891801 B2 JP4891801 B2 JP 4891801B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frequency domain
- frame
- enhancement
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
センサmでの観測信号をxm(t)とし、その短時間フーリエ変換をxm(f,t)とする。また、ビームフォーマの係数をwm(f)、その係数に基づくビームフォーマの出力y(f,t)を、
H.L.Van Trees,"Optimum Array Processing" John Wiley & Sons,2002. R.Haeb-Unbach and E.Warsitz,"Adaptive filter-and-sum beamforming in spatially correlated noise",Proc.IWAENC 2005,pp.125-128,2005.
この発明の他の一態様による多信号強調装置によれば、複数の信号源から発生し複数のセンサで観測された一定の時間長T 1 の時間領域信号を、一定の時間長T 2 (T 1 >T 2 )のフレーム毎に周波数領域変換した周波数領域信号を用いて、上記一定の時間長T 1 のうち、ノイズのみを含む区間を推定するノイズ区間推定手段と、上記一定の時間長T 1 のうち上記推定されたノイズのみを含む区間以外の区間に係る、上記フレーム毎の周波数領域信号から特徴量を算出し、その特徴量をクラスタリングすることにより、上記フレーム毎の周波数領域信号を、上記複数の信号源毎に分類する信号分類手段と、上記分類結果を用いて、上記周波数領域信号を、複数の信号源毎に強調する信号強調手段と、を有し、上記信号分類手段は、上記特徴量をオンラインクラスタリングすることにより、上記フレーム毎の周波数領域信号を、上記複数の信号源毎に分類する手段を含み、上記信号強調手段は、上記特徴量についてのクラスタリングにより生じた各クラスタのセントロイドから、信号源k毎にステアリングベクトルV k (f)を求めるステアリングベクトル生成手段と、ある信号源kに分類された周波数領域信号についての相関行列をR k (f)、それ以外の周波数領域信号についての相関行列をR ¬k (f)、・ H を行列・の共役転置として、上記ステアリングベクトルV k (f)から、下記式により定義される適応ビームフォーマの係数W k (f)を求める係数計算手段と、求まった適応ビームフォーマの係数の共役転置を、上記フレーム毎の周波数領域信号に乗算した値を計算することにより、上記ある信号源について強調された信号を求める強調手段と、を含む。
また、例えば、発話者が入れ変わる会議のような信号源の数が不明である状況においても、各源信号をそれぞれ強調することができる。
図1と図5を参照して、本発明による多信号強調装置10について説明をする。図1は、多信号強調装置10の機能構成を示すブロック図である。図5は、多信号強調装置10の処理の流れを例示するフローチャートである。
複数の話者k(k=1,…,K、Kは任意の自然数)の発話にノイズが乗った信号が、複数のマイクm(m=1,…,M、Mは任意の自然数)によって観測される。
周波数領域変換部1は、各マイクmによって観測された時間領域の観測信号xm(t)を要素とする時間領域の観測信号ベクトルX(t)=[x1(t),…,xM(t)]Tを、短時間フーリエ変換により、周波数毎の時系列信号である観測信号X(f,t)=[x1(f,t),…,xM(f,t)]Tに変換する(ステップS1)。
次に、信号分類部3は、話者の何れかが発話している区間Ρs=Ρ−ΡNにおける観測信号ベクトルX(f,t)を分類し、それぞれの区間がどの話者の発話区間であるかを分類する(ステップS3)。ここで、Ρは全ての時間区間を表す。分類結果は0以上K以下の整数値を取るクラスタ情報C(t)で表され、C(t)が1以上の値kを取れば、その時間区間tにはk番目の話者が存在することを表す。ここで、Kは、話者の数を表す。C(t)=0であれば、その時間区間(フレーム)tはノイズ区間PNに含まれていることを表す。
[周波数領域変換部]
K人の話者の発話にノイズが重畳した音声信号は、M個のマイクで一定の時間長T1観測される。周波数領域変換部1は、各マイクmで観測された時間領域の観測信号xm(t)を、一定の時間長T2(T1>T2)のフレームt毎にフーリエ変換して、周波数領域の観測信号xm(f,t)を生成する(ステップS1)。生成された周波数領域の観測信号xm(f,t)は、ノイズ区間推定部2、信号分類部3、信号強調部4にそれぞれ出力される。
ノイズ区間推定部2は、上記一定の時間長T1のうち、ノイズ区間ΡNを推定する(ステップS2)。これは、後述する信号分類部3において、ノイズによる誤分類を避けるために重要である。推定されたノイズ区間ΡNについての情報は、信号分類部3に出力される。ノイズ区間ΡNとは、誰も発話していない区間、すなわちノイズのみを含む区間のことである。なお、本明細書では、一定の時間長T1のうちノイズ区間ΡNではない区間のことを、非ノイズ区間又は音声区間と呼ぶことがある。
非線形変換部22は、事後SN比にある種の非線形変換を施した後、考慮する全ての周波数における平均値Λ(t)を計算して、判定部23に出力する(詳しくは参考文献1参照。)。
上記閾値ηとη’は、本発明の実施環境に応じて適切な結果が得られるように適宜設定される値である。
[信号分類部]
信号分類部3は、音声区間ΡS=Ρ―ΡNにおける観測信号ベクトルX(f,t)について、それぞれの区間が誰の発話区聞であるかを分類する(ステップS3)。
まず、分類部34が、ノイズ区間推定部2において推定されたノイズ区間ΡNを参照して、
まず、到来時間差推定部31は、音声区間Ρsに属する全てのフレームtについての、マイクjとマイクj’についての信号の到来時間差τjj’(t)を、以下の式に従って算出して、信号源方向推定部32に出力する(ステップS32)。
〔参考文献2〕C.H.Knapp and G.C.Carter, ”The generalized correlation method for estimation of time delay”, IEEE Trans. Acoust.Speech and Signal Processing, vol.24, no.4, pp.320-327, 1976.
まず、更新ステップサイズβ(例えば、β=0.1とする。)と、閾値z(例えば、z=0.2とする。)を設定する(ステップS341)。更新ステップサイズβと閾値zは、本発明を実施する環境に応じて適宜実験的に定めるべき値である。
Ρsの最初のフレームtに係る話者方向ベクトルQ(t)を、第1のセントロイドc1とする(ステップS342)。
tをインクリメントして、次のフレームt∈Ρsに移る(ステップS343)。
‖Q(t)―ck‖と、閾値zとを比較する(ステップS345)。‖Q(t)―ck‖の方が小さければ、ステップS346の処理を行う。そうでなければ、ステップS348の処理を行う。
フレームtに係るクラスタ情報C(t)を、C(t)=kとする(ステップS347)。その後、ステップS3410の処理を行う。
フレームtに係るクラスタ情報C(t)を、C(t)=max(k)+1とする(ステップS349)。
tがΡsの最後のフレームtlastであるかどうかを判断する。t=tlastでない場合には、ステップS343の処理を行う。t=tlastである場合には、ステップS34の処理は終了する。
上記のクラスタリングの結果として、フレームt毎のクラスタ情報C(t)が得られる。C(t)=kの時、その時間フレームtにはk番目の話者の音声が存在することを意味する。C(t)=0の時、その時間フレームtは、ノイズ区間ΡNであることを意味する。
信号強調部4は、検出された各話者k毎にSN比最大化ビームフォーマの係数Wk(f)を構成し、そのSN比最大化ビームフォーマの係数を用いて強調音声Y(f,t)を得る(ステップS4)。
ここでのSN比最大化ビームフォーマは、出力信号Y(f,t)中の話者kの信号成分と、ノイズ成分+他話者成分の比を最大化するビームフォーマとして設計される。これは、式(1)のRT(f)とRN(f)の代わりに、話者kの音声区間{t|C(t)=k}の観測信号の相関行列Rk(f)と、話者kの音声区間以外の区間{t|C(t)≠k}の観測信号の相関行列R¬k(f)とをそれぞれ用いることで実現される。すなわち、
制御部47は、k=1とする(ステップS41)。
相関行列計算部41は、上記式(2)と(3)に基づいて、相関行列Rk(f)、R¬k(f)をそれぞれ計算して、係数計算部42に出力する(ステップS42)。
係数計算部42は、相関行列Rk(f)、R¬k(f)を用いて、上記式(4)で与えられた一般化固有値問題を解き、λ(f)を最大化する固有ベクトルE(f)を求める。そして、E(f)を、SN比最大化ビームフォーマの係数Wk(f)として、強調部43に出力する(ステップS43)。係数計算部42は、ステップS42とステップS43の処理を繰り返すことにより最終的に、全ての周波数fについてSN比最大化ビームフォーマWk(f)を求める。
強調部43は、上記式(5)に基づいて、周波数領域の観測信号ベクトルX(f,t)と、SN比最大化ビームフォーマの係数Wk(f)とを用いて、話者kについての強調信号yk(f,t)を求める(ステップS44)。強調部43は、最終的に、全ての時間周波数スロット(f,t)について、各話者kについての強調信号yk(f,t)を要素とする全ての話者kについての強調信号ベクトルY(f,t)=[y1(f,t),…,yk(f,t),…,yK(f,t)]Tを生成して、時間領域変換部5(図1参照)に出力する。
制御部47は、kと話者の数Kとを比較する(ステップS45)。ここで、「話者の数K」とは、話者数が既知の場合、話者の数K=その既知の話者の数(自然数)であり、話者数が未知の場合、話者の数K=maxC(t)である。k=Kであれば、ステップS4の処理は終了する。そうでなければ、ステップS46の処理を行う。
制御部47は、kを1だけインクリメントする(ステップS46)。その後、ステップS42の処理を行う。このようにして、全ての話者k(k=1,…,K)について強調信号yk(f,t)を求める。
最後に、時間領域変換部5は、逆短時間フーリエ変換を用いて、周波数領域の強調音声信号ベクトルY(f,t)を、時間領域信号Y(t)=[y1(t),…,yK(t)]Tに変換して、出力する(ステップS5)。
図11に示す環境で、3つのマイクで3人の話者の発話を30秒間観測し、その観測信号に対して本発明による多信号強調方法を適用した実験結果を示す。図11に示すように、プロジェクタやPC等が配置された部屋の中心に楕円形の机があり、その机の上に、各マイク1’を含む3つのマイクが、一辺の長さが4cmの正三角形の頂点に位置するように配置されている。各マイクは、その正三角形の中心方向とは反対方向に向いている。また、各マイクと机の間にはタオルが敷かれている。話者1’’〜話者3’’は、上記机を取り囲むように位置している。
既に周波数領域に変換されている観測信号xm(f,t)に対して、本発明による多信号強調方法を行ってもよい。また、信号を強調した後に、時間領域の信号に必ずしも変換しなくてもよい。
分類部34’が、発話者方向Q(f)をクラスタリングするかわりに、図3と図6に破線で示すように、到来時間差τjj’をクラスタリングすることにより、分類結果C(t)を得ても良い。
また、SN比最大化ビームフォーマの代わりに、任意の信号強調手段を用いても良い。SN比最大化ビームフォーマに代えて、適応ビームフォーマを用いる例を説明する。
この場合、信号分類部3の到来時間差推定部31(図3参照)が、ある基準となるマイクjを決め、その基準マイクjとその他のマイクj’に係る全てのマイクペアjj’についての信号の到来時間差τjj’を、上記式(1’)に基づいて計算する。
強調部43は、SN比最大化ビームフォーマと同様に、適応ビームフォーマの係数Wk(f)を用いて、上記式(5)より強調信号Y(f,t)を生成する。
−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
Claims (10)
- 複数の信号源から発生し複数のセンサで観測された一定の時間長T1の時間領域信号を、一定の時間長T2(T1>T2)のフレーム毎に周波数領域変換した周波数領域信号を用いて、上記一定の時間長T1のうち、ノイズのみを含む区間を推定するノイズ区間推定手段と、
上記一定の時間長T1のうち上記推定されたノイズのみを含む区間以外の区間に係る、上記フレーム毎の周波数領域信号から特徴量を算出し、その特徴量をクラスタリングすることにより、上記フレーム毎の周波数領域信号を、上記複数の信号源毎に分類する信号分類手段と、
上記分類結果を用いて、上記周波数領域信号を、複数の信号源毎に強調する信号強調手段と、
を有し、
上記信号分類手段は、上記特徴量をオンラインクラスタリングすることにより、上記フレーム毎の周波数領域信号を、上記複数の信号源毎に分類する手段を含み、
上記信号強調手段は、
ある信号源に分類された周波数領域信号についての相関行列と、それ以外の周波数領域信号についての相関行列とを用いて定義される固有値問題の最大固有値に対応する固有ベクトルであるSN比最大化ビームフォーマの係数を求める係数計算手段と、
求まったSN比最大化ビームフォーマの係数の共役転置を、上記フレーム毎の周波数領域信号に乗算した値を計算することにより、上記ある信号源について強調された信号を求める強調手段と、
を含む、
ことを特徴とする多信号強調装置。 - 請求項1に記載の多信号強調装置において、
上記ある信号源に分類された周波数領域信号についての相関行列をR k (f)とし、上記それ以外の周波数領域信号についての相関行列をR ¬k (f)とし、上記最大固有値をλ(f)とし、上記SN比最大化ビームフォーマの係数をW k (f)として、
上記固有値問題は、R k (f)W k (f)=λ(f)R ¬k (f)W k (f)である、
ことを特徴とする多信号強調装置。 - 複数の信号源から発生し複数のセンサで観測された一定の時間長T1の時間領域信号を、一定の時間長T2(T1>T2)のフレーム毎に周波数領域変換した周波数領域信号を用いて、上記一定の時間長T1のうち、ノイズのみを含む区間を推定するノイズ区間推定手段と、
上記一定の時間長T1のうち上記推定されたノイズのみを含む区間以外の区間に係る、上記フレーム毎の周波数領域信号から特徴量を算出し、その特徴量をクラスタリングすることにより、上記フレーム毎の周波数領域信号を、上記複数の信号源毎に分類する信号分類手段と、
上記分類結果を用いて、上記周波数領域信号を、複数の信号源毎に強調する信号強調手段と、
を有し、
上記信号分類手段は、上記特徴量をオンラインクラスタリングすることにより、上記フレーム毎の周波数領域信号を、上記複数の信号源毎に分類する手段を含み、
上記信号強調手段は、
上記特徴量についてのクラスタリングにより生じた各クラスタのセントロイドから、信号源k毎にステアリングベクトルV k (f)を求めるステアリングベクトル生成手段と、
ある信号源kに分類された周波数領域信号についての相関行列をR k (f)、それ以外の周波数領域信号についての相関行列をR ¬k (f)、・ H を行列・の共役転置として、上記ステアリングベクトルV k (f)から、下記式により定義される適応ビームフォーマの係数W k (f)を求める係数計算手段と、
を含む、
ことを特徴とする多信号強調装置。 - 請求項1から3の何れかに記載の多信号強調装置において、
上記信号強調手段は、さらに上記フレーム毎の周波数領域信号と上記強調された信号との差が最小になるように、上記SN比最大化ビームフォーマの係数又は適応ビームフォーマの係数を補正する手段を含む、
ことを特徴とする多信号強調装置。 - 請求項1から3の何れかに記載の多信号強調装置において、
上記特徴量は、複数のセンサペアについての到来時間差であり、
上記信号分類手段は、上記フレーム毎の周波数領域信号の位相情報から、上記複数のセンサペアについての到来時間差を推定する到来時間差推定手段を含む、
ことを特徴とする多信号強調装置。 - 請求項1から3の何れかに記載の多信号強調装置において、
上記特徴量は、複数のセンサペアについての到来時間差ではなく、信号源の方向ベクトルであり、
上記信号分類手段は、さらに、信号の速さと、センサの位置情報を表す行列の一般化逆行列と、上記推定された到来時間差を要素とするベクトルとの積で定まるベクトルを求めることにより、信号源の方向ベクトルを推定する信号源方向推定手段を含む、
ことを特徴とする多信号強調装置。 - ノイズ区間推定手段が、複数の信号源から発生し複数のセンサで観測された一定の時間長T1の時間領域信号を、一定の時間長T2(T1>T2)のフレーム毎に周波数領域変換した周波数領域信号を用いて、上記一定の時間長T1のうち、ノイズのみを含む区間を推定するノイズ区間推定ステップと、
信号分類手段が、上記一定の時間長T1のうち上記推定されたノイズのみを含む区間以外の区間に係る、上記フレーム毎の周波数領域信号から特徴量を算出し、その特徴量をクラスタリングすることにより、上記フレーム毎の周波数領域信号を、上記複数の信号源毎に分類する信号分類ステップと、
信号強調手段が、上記分類結果を用いて、上記周波数領域信号を、複数の信号源毎に強調する信号強調ステップと、
を有し、
上記信号分類ステップは、上記特徴量をオンラインクラスタリングすることにより、上記フレーム毎の周波数領域信号を、上記複数の信号源毎に分類するステップを含み、 上記信号強調ステップは、
ある信号源に分類された周波数領域信号についての相関行列と、それ以外の周波数領域信号についての相関行列とを用いて定義される固有値問題の最大固有値に対応する固有ベクトルであるSN比最大化ビームフォーマの係数を求める係数計算ステップと、
求まったSN比最大化ビームフォーマの係数の共役転置を、上記フレーム毎の周波数領域信号に乗算した値を計算することにより、上記ある信号源について強調された信号を求める強調ステップと、
を含む、
ことを特徴とする多信号強調方法。 - ノイズ区間推定手段が、複数の信号源から発生し複数のセンサで観測された一定の時間長T1の時間領域信号を、一定の時間長T2(T1>T2)のフレーム毎に周波数領域変換した周波数領域信号を用いて、上記一定の時間長T1のうち、ノイズのみを含む区間を推定するノイズ区間推定ステップと、
信号分類手段が、上記一定の時間長T1のうち上記推定されたノイズのみを含む区間以外の区間に係る、上記フレーム毎の周波数領域信号から特徴量を算出し、その特徴量をクラスタリングすることにより、上記フレーム毎の周波数領域信号を、上記複数の信号源毎に分類する信号分類ステップと、
信号強調手段が、上記分類結果を用いて、上記周波数領域信号を、複数の信号源毎に強調する信号強調ステップと、
を有し、
上記信号分類ステップは、上記特徴量をオンラインクラスタリングすることにより、上記フレーム毎の周波数領域信号を、上記複数の信号源毎に分類するステップを含み、
上記信号強調ステップは、
上記特徴量についてのクラスタリングにより生じた各クラスタのセントロイドから、信号源k毎にステアリングベクトルV k (f)を求めるステアリングベクトル生成ステップと、
ある信号源kに分類された周波数領域信号についての相関行列をR k (f)、それ以外の周波数領域信号についての相関行列をR ¬k (f)、・ H を行列・の共役転置として、上記ステアリングベクトルV k (f)から、下記式により定義される適応ビームフォーマの係数W k (f)を求める係数計算ステップと、
を含む、
ことを特徴とする多信号強調方法。 - 請求項1から6の何れかに記載の多信号強調装置としてコンピュータを機能させるための多信号強調プログラム。
- 請求項9記載の多信号強調プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007038819A JP4891801B2 (ja) | 2007-02-20 | 2007-02-20 | 多信号強調装置、方法、プログラム及びその記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007038819A JP4891801B2 (ja) | 2007-02-20 | 2007-02-20 | 多信号強調装置、方法、プログラム及びその記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008203474A JP2008203474A (ja) | 2008-09-04 |
JP4891801B2 true JP4891801B2 (ja) | 2012-03-07 |
Family
ID=39781061
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007038819A Expired - Fee Related JP4891801B2 (ja) | 2007-02-20 | 2007-02-20 | 多信号強調装置、方法、プログラム及びその記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4891801B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5022387B2 (ja) * | 2009-01-27 | 2012-09-12 | 日本電信電話株式会社 | クラスタリング計算装置、クラスタリング計算方法、クラスタリング計算プログラム並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP5044581B2 (ja) * | 2009-02-03 | 2012-10-10 | 日本電信電話株式会社 | 複数信号強調装置とその方法と、プログラム |
JP5543023B2 (ja) * | 2011-05-24 | 2014-07-09 | 三菱電機株式会社 | 目的音強調装置およびカーナビゲーションシステム |
JP5705190B2 (ja) * | 2012-11-05 | 2015-04-22 | 日本電信電話株式会社 | 音響信号強調装置、音響信号強調方法、およびプログラム |
JP6063843B2 (ja) * | 2013-08-28 | 2017-01-18 | 日本電信電話株式会社 | 信号区間分類装置、信号区間分類方法、およびプログラム |
JP2015161659A (ja) * | 2014-02-28 | 2015-09-07 | 株式会社熊谷組 | 音源方向推定装置、及び、音源推定用画像の表示装置 |
JP6652519B2 (ja) * | 2017-02-28 | 2020-02-26 | 日本電信電話株式会社 | ステアリングベクトル推定装置、ステアリングベクトル推定方法およびステアリングベクトル推定プログラム |
JP6961545B2 (ja) * | 2018-07-02 | 2021-11-05 | 株式会社東芝 | 音信号処理装置、音信号処理方法、およびプログラム |
JP2022533300A (ja) * | 2019-03-10 | 2022-07-22 | カードーム テクノロジー リミテッド | キューのクラスター化を使用した音声強化 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04230799A (ja) * | 1990-05-28 | 1992-08-19 | Matsushita Electric Ind Co Ltd | 音声信号符号化装置 |
JP2759383B2 (ja) * | 1991-07-19 | 1998-05-28 | 株式会社タダノ | クレーン車 |
US5397967A (en) * | 1992-06-30 | 1995-03-14 | Sgs-Thomson Microelectronics, Inc. | Slew rate circuit for high side driver for a polyphase DC motor |
JP3355598B2 (ja) * | 1996-09-18 | 2002-12-09 | 日本電信電話株式会社 | 音源分離方法、装置及び記録媒体 |
JP3677143B2 (ja) * | 1997-07-31 | 2005-07-27 | 株式会社東芝 | 音声処理方法および装置 |
JP2003270034A (ja) * | 2002-03-15 | 2003-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 音情報解析方法、装置、プログラム、および記録媒体 |
DE602004027774D1 (de) * | 2003-09-02 | 2010-07-29 | Nippon Telegraph & Telephone | Signaltrennverfahren, Signaltrenneinrichtung,und Signaltrennprogramm |
JP4767247B2 (ja) * | 2005-02-25 | 2011-09-07 | パイオニア株式会社 | 音分離装置、音分離方法、音分離プログラムおよびコンピュータに読み取り可能な記録媒体 |
JP2006243664A (ja) * | 2005-03-07 | 2006-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体 |
JP4675177B2 (ja) * | 2005-07-26 | 2011-04-20 | 株式会社神戸製鋼所 | 音源分離装置,音源分離プログラム及び音源分離方法 |
-
2007
- 2007-02-20 JP JP2007038819A patent/JP4891801B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008203474A (ja) | 2008-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4891801B2 (ja) | 多信号強調装置、方法、プログラム及びその記録媒体 | |
US10123113B2 (en) | Selective audio source enhancement | |
EP3511937B1 (en) | Device and method for sound source separation, and program | |
JP4746533B2 (ja) | 多音源有音区間判定装置、方法、プログラム及びその記録媒体 | |
US8271277B2 (en) | Dereverberation apparatus, dereverberation method, dereverberation program, and recording medium | |
JP4195267B2 (ja) | 音声認識装置、その音声認識方法及びプログラム | |
JP5124014B2 (ja) | 信号強調装置、その方法、プログラム及び記録媒体 | |
JP6389259B2 (ja) | マイクロホンアレイを使用した残響音の抽出 | |
JP2021036297A (ja) | 信号処理装置、信号処理方法、及びプログラム | |
JP2020034624A (ja) | 信号生成装置、信号生成システム、信号生成方法およびプログラム | |
US9838783B2 (en) | Adaptive phase-distortionless magnitude response equalization (MRE) for beamforming applications | |
JP2011215317A (ja) | 信号処理装置、および信号処理方法、並びにプログラム | |
JP5717097B2 (ja) | 音声合成用の隠れマルコフモデル学習装置及び音声合成装置 | |
JP2009271183A (ja) | 複数信号区間推定装置とその方法と、プログラムとその記録媒体 | |
JP2006243664A (ja) | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体 | |
JP6721165B2 (ja) | 入力音マスク処理学習装置、入力データ処理関数学習装置、入力音マスク処理学習方法、入力データ処理関数学習方法、プログラム | |
Gan et al. | Howling noise cancellation in time–frequency domain by deep neural networks | |
JP5815489B2 (ja) | 音源別音声強調装置、方法、プログラム | |
JP2015037207A (ja) | 音場収音再生装置、方法及びプログラム | |
JP6087856B2 (ja) | 音場収音再生装置、システム、方法及びプログラム | |
EP3557576B1 (en) | Target sound emphasis device, noise estimation parameter learning device, method for emphasizing target sound, method for learning noise estimation parameter, and program | |
JP5044581B2 (ja) | 複数信号強調装置とその方法と、プログラム | |
Makishima et al. | Independent deeply learned matrix analysis with automatic selection of stable microphone-wise update and fast sourcewise update of demixing matrix | |
Ai et al. | Reverberation modeling for source-filter-based neural vocoder | |
JP6285855B2 (ja) | フィルタ係数算出装置、音声再生装置、フィルタ係数算出方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110308 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110509 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110810 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111206 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111216 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4891801 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141222 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |