JP5166460B2 - 残響予測フィルタ算出装置、残響抑圧装置、残響予測フィルタ算出方法、残響抑圧方法、プログラム - Google Patents

残響予測フィルタ算出装置、残響抑圧装置、残響予測フィルタ算出方法、残響抑圧方法、プログラム Download PDF

Info

Publication number
JP5166460B2
JP5166460B2 JP2010026427A JP2010026427A JP5166460B2 JP 5166460 B2 JP5166460 B2 JP 5166460B2 JP 2010026427 A JP2010026427 A JP 2010026427A JP 2010026427 A JP2010026427 A JP 2010026427A JP 5166460 B2 JP5166460 B2 JP 5166460B2
Authority
JP
Japan
Prior art keywords
short
reverberation
power spectrum
harmonic
prediction filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010026427A
Other languages
English (en)
Other versions
JP2011164335A (ja
Inventor
拓也 吉岡
智広 中谷
篤 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010026427A priority Critical patent/JP5166460B2/ja
Publication of JP2011164335A publication Critical patent/JP2011164335A/ja
Application granted granted Critical
Publication of JP5166460B2 publication Critical patent/JP5166460B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、音楽信号に含まれる残響を抑圧する技術に関する。
従来技術として非特許文献1に開示されている残響抑圧方法の処理の流れを、図1−4を参照しながら説明する。
まず、短時間フーリエ変換過程S100において、短時間フーリエ変換部100が、短時間フーリエ変換により、残響を含む観測音声信号x(t)から短時間フーリエ係数列{xn,m0≦n≦N−1,0≦m≦M−1を計算する。ただし、t、n、mはそれぞれ、時間、短時間フレーム、周波数ビンのインデクスである。また、短時間フレームの個数をN、周波数ビンの個数をMとする。以下、短時間フーリエ係数列{xn,m0≦n≦N−1,0≦m≦M−1を観測短時間フーリエ係数列という。
次に、残響予測フィルタ算出過程S110において、残響予測フィルタ算出部110が、各周波数ビンm(0≦m≦M−1)における残響予測フィルタ{gΔm,m,…,gΔm+Km−1,m0≦m≦M−1を計算する。ただし、ΔとKはそれぞれ、mごとに予め定められた、残響予測ステップ数および残響予測次数と呼ばれる定数である。Δは1以上の整数値、Kは0以上の整数値をとる。なお、本明細書では、第1の下付添字に対する第2の下付添字を、テキストで記す場合にはそのまま第1の下付添字と同じように表記していることに留意されたい。
次に、残響抑圧過程S120では、残響抑圧部120が、周波数ビンm(0≦m≦M−1)毎に、式(1)と式(2)に従って、残響予測フィルタ算出過程110で求められた残響予測フィルタ{gΔm,m,…,gΔm+Km−1,m}を観測短時間フーリエ係数列{xn,m0≦n≦N−1に適用することで観測短時間フーリエ係数列{xn,m0≦n≦N−1に含まれる残響成分{rn,m0≦n≦N−1を求め、さらに、残響成分{rn,m0≦n≦N−1を観測短時間フーリエ係数列{xn,m0≦n≦N−1から減算することで残響が抑圧された信号の短時間フーリエ係数列{s n,m0≦n≦N−1を計算する。ただし、記号*は複素共役を表す。なお、この明細書では、記号Aは、記号Aの真上に記号^が付された組み合わせ文字を表す。同様に、記号Aは、記号Aの真上に記号−が付された組み合わせ文字を表す。
Figure 0005166460
最後に、逆短時間フーリエ変換過程S130において、逆短時間フーリエ変換部130が、短時間逆フーリエ変換によりs n,mから出力信号s(t)を算出する。
残響予測フィルタ算出過程S110の詳細な処理について、図3−4を参照しながら説明する。非特許文献1に開示されている残響抑圧方法の残響予測フィルタ算出過程S110は反復処理に基づいて構成されており、初期化過程S111と、残響抑圧過程S113と、音源短時間パワースペクトル推定過程S114と、残響予測フィルタ更新過程S115と、各過程S113〜S115を包含するループ処理(S112,S116,S117)を含んでいる。
初期化過程S111では、制御部111が、すべての周波数ビンm(0≦m≦M−1)について、反復処理により繰り返し得られる残響予測フィルタ{g Δm,m,…,g Δm+Km−1,m0≦m≦M−1の初期値を定める。初期値の設定方法の一例として、式(3)のように、すべての残響予測フィルタ係数g k,mを0で初期化する方法がある。
Figure 0005166460
続いて、制御部111が、繰り返し処理のためのインデクスiを1に設定する(ループ処理112−初期値設定)。
残響抑圧過程S113では、残響暫定抑圧部113が、残響抑圧過程S120と同じ処理を行う。すなわち、残響暫定抑圧部113は、周波数ビンm(0≦m≦M−1)毎に、式(3a)と式(3b)に従って、現時点で暫定的に得られている残響予測フィルタ{g Δm,m,…,g Δm+Km−1,m}を観測短時間フーリエ係数列{xn,m0≦n≦N−1に適用することで観測短時間フーリエ係数列{xn,m0≦n≦N−1に含まれる残響成分の暫定的な推定値{r n,m0≦n≦N−1を求め、この残響成分の暫定的な推定値{r n,m0≦n≦N−1を観測短時間フーリエ係数列{xn,m0≦n≦N−1から減算することで残響が暫定的に抑圧された信号の短時間フーリエ係数列{s n,m0≦n≦N−1を計算する。ここで「暫定」という表現を用いている理由は、後述するように残響予測フィルタの更新を含む反復処理を行うことを予定しているからであり、ここでの「暫定的に得られている残響予測フィルタ」は初期値の場合を除いて、後述の残響予測フィルタ更新過程S115における処理で得られた残響予測フィルタである。
Figure 0005166460
音源短時間パワースペクトル推定過程S114では、音源短時間パワースペクトル推定部114が、残響を含まない未知の音源信号の短時間パワースペクトル系列{λn,0,…,λn,M−10≦n≦N−1を暫定的に推定する。非特許文献1の方法では、各短時間フレームn(0≦n≦N−1)と各周波数ビンm(0≦m≦M−1)について、λn,mの推定値λ n,mは式(4)によって求められる。すなわち、残響が暫定的に抑圧された信号の短時間フーリエ係数列{s n,m0≦n≦N−1,0≦m≦M−1のエネルギースペクトルそのものを、音源信号の短時間パワースペクトル系列の暫定的な推定値{λ n,m0≦n≦N−1,0≦m≦M−1とする。
Figure 0005166460
なお、音源信号の短時間パワースペクトル系列{λn,0,…,λn,M−10≦n≦N−1を推定する別の方法として、非特許文献2には、音声信号の表現に適した全極モデルを用いる方法が開示されている。
本明細書では、エネルギースペクトルとパワースペクトルという用語を区別して用いる。エネルギースペクトルは、短時間フーリエ係数の絶対値を二乗したものを指す。パワースペクトルは、エネルギースペクトルのモデルを指す。非特許文献1の方法のように、パワースペクトルの推定値としてエネルギースペクトルを用いることもできるが、非特許文献2のように、必ずしもこれに限定されない。
残響予測フィルタ更新過程S115では、残響予測フィルタ更新部115が、更新後の残響予測フィルタを式(7)にしたがって算出する。ここでは便宜上、周波数ビンm(0≦m≦M−1)毎に残響予測フィルタ係数を式(5)のようにベクトル表記し、観測短時間フーリエ係数ベクトルを式(6)のように表記する。ただし、上付添字Tは非共役転置を表し、上付添字Hは共役転置を表す。
Figure 0005166460
制御部111は、繰り返し回数iが予め定められた最大繰り返し回数Nに達していればループ処理を終了し(ループ処理116−条件判定)、そうでなければiを1だけ増やして残響抑圧過程S113に戻る制御を行う(ループ処理117−繰り返し制御)。このループ処理が終了した時点で得られている残響予測フィルタ{g Δm,m,…,g Δm+Km−1,m}が残響抑圧過程S120にて用いられる残響予測フィルタ{gΔm,m,…,gΔm+Km−1,m}である。
T. Nakatani, T. Yoshioka, K. Kinoshita, M. Miyoshi, and B.-H. Juang, "Blind speech dereverberation with multi-channel linear prediction based on short time Fourier transform representation," in Proc. Int’l Conf. Acoust. Speech, Signal Process., 2008, pp. 85-88. T. Yoshioka, T. Nakatani, and M. Miyoshi, "Integrated speech enhancement method using noise suppression and dereverberation," IEEE Trans. Audio, Speech, Lang. Process., vol. 17, no. 2, pp. 231-246, 2009.
従来技術は、式(4)のようにノンパラメトリックな(エネルギースペクトルをそのまま用いる)方法で、あるいは非特許文献2に開示されるように全極モデルを用いて、音源信号(残響を含まない音楽信号)の短時間パワースペクトル系列の暫定的な推定値を計算する。このような単純なモデルは、音声信号に対しては十分な効果をもつが、音楽信号を対象とする場合には必ずしも有効ではない。なぜなら、音楽信号に含まれる残響は音声信号の場合よりも強いことが多いため、単純なモデルでは音源信号(残響を含まない音楽信号)の短時間パワースペクトル系列を精度良く推定できないからである。
そこで本発明は、音楽信号に含まれる残響を抑圧する技術を提供することを目的とする。
本発明の残響予測フィルタ算出技術は、次のとおりである。すなわち、観測された音楽信号の短時間フーリエ係数列(観測短時間フーリエ係数列)から差し引かれる残響成分を求めるために観測短時間フーリエ係数列に適用される残響予測フィルタを、残響を含まない音楽信号(すなわち、音源信号)の短時間パワースペクトル系列の暫定的な推定値(暫定短時間パワースペクトル系列)に基づいて更新することにより算出する残響予測フィルタ算出技術であり、
現在の残響予測フィルタを観測短時間フーリエ係数列に適用して得られる残響成分の暫定的な推定値を観測短時間フーリエ係数列から差し引くことにより、観測された音楽信号から残響が抑圧された信号の短時間フーリエ係数列の暫定的な推定値(暫定短時間フーリエ係数列)を得て[残響暫定抑圧処理]、
音源信号の短時間パワースペクトルのモデルとして、調波GMMによる調波成分間のパワースペクトルのギャップを埋めるためのパワースペクトルであるパワースペクトルフロアを当該調波GMMに加算したモデル(フロアつき調波GMM)を用いて、
暫定短時間フーリエ係数列のエネルギースペクトルに基づきフロアつき調波GMMの調波パラメータ(フロアつき調波パラメータ)を推定し、このフロアつき調波パラメータの推定値で規定されるフロアつき調波GMMにより暫定短時間パワースペクトル系列を求め[短時間パワースペクトル推定処理]、
現在の残響予測フィルタを、暫定短時間パワースペクトル系列に基づいて更新し[残響予測フィルタ更新処理]、
残響暫定抑圧処理と、短時間パワースペクトル推定処理と、残響予測フィルタ更新処理を、予め定められた第1の条件を満たすまで繰り返す[制御処理]。
なお、フロアつき調波GMMが表わすパワースペクトルのうち、調波GMMに由来する成分を音源成分、パワースペクトルフロアに由来する成分をフロア成分と呼ぶ。
この残響予測フィルタ算出技術の短時間パワースペクトル推定処理では、フロアつき調波パラメータの推定値として、暫定短時間フーリエ係数列のエネルギースペクトルに対してI−ダイバージェンスを最小化するパワースペクトルを与えるフロアつき調波パラメータ(ダイバージェンス最小化フロアつき調波パラメータ)を求めてもよい。
また、フロアつき調波パラメータが、基本周波数を表すパラメータと、調波GMMに基づくパワースペクトルにおける音量(すなわち、音源成分の音量)を表すパラメータと、パワースペクトルフロアにおける音量(すなわち、フロア成分の音量)を表すパラメータと、第k調波成分の相対強度を表すパラメータと、パワースペクトルフロアの周波数帯域ごとの相対強度を表すパラメータを含むとして、短時間パワースペクトル推定処理にて、音源成分の各調波成分とフロア成分の各周波数帯域に対応して周波数ビンごとに定まる分配係数の算出と、当該分配係数を用いることによるフロアつき調波パラメータの更新とを予め定められた第2の条件を満たすまで繰り返し、当該第2の条件を満たしたときのフロアつき調波パラメータを、ダイバージェンス最小化フロアつき調波パラメータとして求めてもよい。
本発明の残響抑圧技術は、次のとおりである。すなわち、観測された音楽信号の短時間フーリエ係数列(観測短時間フーリエ係数列)を求め[短時間フーリエ変換処理]、本発明の残響予測フィルタ算出技術により残響予測フィルタを算出し[残響予測フィルタ算出処理]、得られた残響予測フィルタを観測短時間フーリエ係数列に適用して得られる残響成分を観測短時間フーリエ係数列から差し引くことにより、観測された音楽信号から残響が抑圧された信号の短時間フーリエ係数列(終局短時間フーリエ係数列)を得て[残響抑圧処理]、終局短時間フーリエ係数列を短時間逆フーリエ変換して得られる信号を出力する[短時間逆フーリエ変換処理]。
あるいは、この残響抑圧技術では、上記残響抑圧処理に替えて、得られた残響予測フィルタを観測短時間フーリエ係数列に適用して得られる残響成分と、残響予測フィルタ算出処理で計算された第1の条件が満たされた時点における暫定短時間パワースペクトル系列とを入力とするWienerフィルタの出力を、観測短時間フーリエ係数列に適用することにより、観測された音楽信号から残響が抑圧された信号の短時間フーリエ係数列(終局短時間フーリエ係数列)を得る残響抑圧処理としてもよい。
本発明に拠れば、残響を含まない音楽信号の短時間パワースペクトル系列のモデルとして、調波GMMによる調波成分間のパワースペクトルのギャップを埋めるためのパワースペクトルであるパワースペクトルフロアを当該調波GMMに加算したモデル(フロアつき調波GMM)を用いているため、残響を含まない音楽信号の短時間パワースペクトル系列を精度良く推定でき、結果、残響が長い場合であっても観測音楽信号に含まれる残響を高精度に抑圧することができる。
従来技術における残響抑圧方法の処理手順を示す図。 従来技術における残響抑圧装置の機能構成を示す図。 従来技術における残響抑圧方法に含まれる残響予測フィルタ算出過程の処理手順を示す図。 従来技術における残響抑圧装置に含まれる残響予測フィルタ算出部の機能構成を示す図。 第1実施形態に関わる残響予測フィルタ算出装置に含まれる残響予測フィルタ算出部の機能構成を示す図。 第2実施形態に関わる残響予測フィルタ算出方法に含まれる残響予測フィルタ算出過程で実行されるフロアつき調波パラメータの算出手順を示す図。 第3実施形態に関わる残響抑圧装置の機能構成を示す図。 フロアつき調波GMMを説明する図。 従来技術と比較して第2実施形態が有する効果を説明する図。
<原理>
音楽信号は明確な調波構造を持つため、残響を含まない音楽信号(音源信号と呼ぶ)のパワースペクトルのモデルとして調波GMM(Harmonic Gaussian Mixture Model)を用いて、音源信号の短時間パワースペクトル系列{λn,m0≦n≦N−1,0≦m≦M−1を推定することを考える。調波GMMは、調波構造を表現するのに適しているため、調波GMMを用いることで音源信号の短時間パワースペクトル系列{λn,m0≦n≦N−1,0≦m≦M−1を精度良く推定できると考えられる。調波GMMについては例えば参考文献Aを参照されたい。
(参考文献A)H. Kameoka, T. Nishimoto, and S. Sagayama, “Multi-pitch trajectory estimation of concurrent speech based on harmonic GMM and nonlinear Kalman filtering,” in Proc. Interspeech, 2004, pp. 2433-2466.
調波GMMは、基本周波数を表すパラメータμ、音量γ、第k調波成分の相対強度α(1≦k≦N)を用いて式(8)のように定義される。ただし、各調波成分の相対強度αは式(9)を満たすとし、f(x;τ,σ)は式(10)で定義される正規分布の確率密度関数である。また、Nは調波成分の個数、Ωは調波成分のスペクトル広がりを表す所与の定数である。基本周波数μ、音量γ、各調波成分の相対強度α(1≦k≦N)をあわせて調波パラメータと呼ぶ。
Figure 0005166460
参考文献Aに開示されているように、与えられた短時間エネルギースペクトルからEMアルゴリズム(下記参考文献B参照)を用いて調波パラメータを推定できる。すなわち、各短時間フレームn(0≦n≦N−1)に対して、残響が暫定的に抑圧された信号の暫定短時間フーリエ係数{s n,m0≦m≦M−1のエネルギースペクトル{|s n,m|0≦m≦M−1から調波パラメータの推定値{μ,γ,αn,1,…,αn,NH}が得られる。これを式(8)に代入して、調波GMMでモデル化された音源信号の短時間パワースペクトルの推定値λ n,mを求めることができる(式(11)参照)。このようにして音源短時間パワースペクトル推定過程S114を構成することができる。
(参考文献B)A. P. Dempster, N. M. Laird and D. B. Rubin, "Maximum Likelihood from Incomplete Data via the EM Algorithm", Journal of the Royal Statistical Society. Series B (Methodological), Vol. 39, No. 1. (1977), pp. 1-38.
Figure 0005166460
しかしながら、この調波GMMでは、調波成分間のパワースペクトルのギャップが大きすぎる、言い換えると倍音周波数以外の点におけるパワーの値が小さすぎる。このようなパワースペクトルのギャップがあると、式(7)右辺の各分母が0に近くなるため、残響予測フィルタ更新過程S115の動作が不安定になってしまう。
そこで、特定の周波数でパワーが小さくなりすぎることを防ぐために、調波成分間のパワースペクトルのギャップを埋めるための、言い換えると倍音周波数以外の点におけるパワーの値を嵩上げするためのパワースペクトルであるパワースペクトルフロアを調波GMMに組み込んだ「フロアつき調波GMM」を用いる。このフロアつき調波GMMは式(12)により定義される。式(12)の右辺第一項(音源成分)と第二項(フロア成分)が表現するパワースペクトルを図8に示す。図8から明らかなように、右辺第一項だけの場合(つまり、調波GMMの場合)、パワースペクトルの値がほとんど0になってしまう周波数が存在する。他方、式(12)の右辺第二項はパワースペクトルフロアを表しており、定数Ωを比較的大きい値に設定することで、なだらかなパワースペクトルフロアを表現できることがわかる。従って、定数Ωを一般的な残響を含まない音楽信号の短時間パワースペクトルに現れる調波成分の広がり程度に設定し、定数Ωを定数Ωよりも十分に大きく設定する。{|β|0≦k≦NIは、このパワースペクトルフロアの周波数帯域k(1≦k≦N)ごとの相対強度である。γとγはそれぞれ、音源成分とフロア成分の音量を表す。ただし、{α0≦k≦NHと{β0≦k≦NIはそれぞれ式(13)と式(14)を満たすとする。
Figure 0005166460
本発明による音源短時間パワースペクトル推定過程S114では、各短時間フレームn(0≦n≦N−1)に対して、残響が暫定的に抑圧された信号の暫定短時間フーリエ係数{s n,m0≦m≦M−1のエネルギースペクトル{|s n,m|0≦m≦M−1からフロアつき調波パラメータの推定値{μ,γn,1,γn,2,αn,1,…,αn,NH,βn,1,…,βn,NI}を計算する。これを式(12)に代入して、短時間パワースペクトルの推定値(すなわち、暫定短時間パワースペクトル系列){λ n,m0≦n≦N−1,0≦m≦M−1を求める(式(15)参照)。つまり、本発明によると従来技術で採用される式(4)が式(15)に置換される。
Figure 0005166460
次に、上述の原理に基づく実施形態を説明する。
<ハードウェア構成>
実施形態における残響予測フィルタ算出装置は、それ単体で独立に存在するよりは、算出された残響予測フィルタを用いて残響抑圧を行う装置(実施形態における残響抑圧装置)を構成する構成要素として存在することが実用的な場合がある。さらに云えば、残響予測フィルタ算出装置は、残響抑圧装置とは容易に分離可能に残響抑圧装置を構成する構成要素ではなく、残響抑圧装置自体を或る機能に着眼して片面的に評価したものと云うこともできる。要するに、残響予測フィルタ算出装置は、残響抑圧装置そのものであることが凡そ実用的と言うことができる。
ただし、残響予測フィルタ算出装置が、単体独立の構成要素として存在すること、残響抑圧装置とは容易に分離可能に残響抑圧装置を構成する構成要素であることを排除する趣旨ではない。例えば残響予測フィルタの算出自体を目的とするならば、残響予測フィルタ算出装置を単体独立の構成要素として実現することに何らの妨げは無い。
ここで残響抑圧装置は、例えば専用のハードウェアで構成された専用機やパーソナルコンピュータのような汎用機といったコンピュータで実現されるとし、単体独立の構成要素として残響予測フィルタ算出装置を実現する場合も同様である。
残響抑圧装置を単体単独の構成要素として、これをコンピュータで実現する場合のハードウェア構成例を説明する。残響予測フィルタ算出装置は、残響抑圧装置を構成する構成要素として説明する。
<残響抑圧装置のハードウェア構成例>
残響抑圧装置は、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、CPU(Central Processing Unit)〔キャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)やROM(Read Only Memory)と、ハードディスクである外部記憶装置、並びにこれらの入力部、出力部、CPU、RAM、ROM、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、残響抑圧装置に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
残響抑圧装置の外部記憶装置には、残響予測フィルタを算出するためのプログラム、残響抑圧のためのプログラム並びにこれらのプログラムの処理において必要となるデータなどが記憶されている〔外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくなどでもよい。〕。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。以下、データやその格納領域のアドレスなどを記憶する記憶装置を単に「記憶部」と呼ぶことにする。
残響抑圧装置の記憶部には、観測された音楽信号に対して短時間フーリエ変換を行うためのプログラム、残響予測フィルタを算出するためのプログラム(このプログラムはさらに、残響抑圧のためのプログラム、音源信号の短時間パワースペクトルを推定するためのプログラム、残響予測フィルタを更新するためのプログラム、上述のループ処理を制御するためのプログラムを含んでいる)、観測された音楽信号に含まれる残響を抑圧するためのプログラム、残響が抑圧された信号に対して短時間逆フーリエ変換を行うためのプログラムが記憶されている。
残響抑圧装置では、記憶部に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAMに読み込まれて、CPUで解釈実行・処理される。この結果、CPUが所定の機能(短時間フーリエ変換部、残響予測フィルタ算出部(これは、さらに機能構成として残響暫定抑圧部、音源短時間パワースペクトル推定部、残響予測フィルタ更新部、制御部を含む)、残響抑圧部、短時間逆フーリエ変換部)を実現することで残響予測フィルタの算出並びに残響抑圧が実現される。
なお、実施形態の残響予測フィルタ算出装置は、残響予測フィルタ算出部つまり残響暫定抑圧部、音源短時間パワースペクトル推定部、残響予測フィルタ更新部、制御部を含んで構成されるが、短時間フーリエ変換部、残響抑圧部、短時間逆フーリエ変換部は、残響予測フィルタ算出装置の必須の構成要素ではない。
<第1実施形態>
第1実施形態は、従来技術として非特許文献1を例に挙げて説明した上述の残響抑圧処理における残響予測フィルタ算出過程S110に含まれる音源短時間パワースペクトル推定過程S114の処理を変更するものである(図5参照)。よって、この変更される部分について説明し、その他の技術事項については上述の残響抑圧処理に関する説明を援用して重複説明を省略する。
第1実施形態では、残響予測フィルタ算出過程S110に含まれる音源短時間パワースペクトル推定過程S114にて、各短時間フレームn(0≦n≦N−1)に対して、音源短時間パワースペクトル推定部114が、残響が暫定的に抑圧された信号の暫定短時間フーリエ係数{s n,m0≦m≦M−1のエネルギースペクトル{|s n,m|0≦m≦M−1が与えられたときに、フロアつき調波パラメータの推定値{μ,γn,1,γn,2,αn,1,…,αn,NH,βn,1,…,βn,NI}を計算し、式(15)に従って音源信号の短時間パワースペクトル系列の推定値(すなわち、暫定短時間パワースペクトル系列){λ n,m0≦m≦M−1を求める。フロアつき調波パラメータの推定値{μ,γn,1,γn,2,αn,1,…,αn,NH,βn,1,…,βn,NI}を計算は下記のとおりである。
非負関数間の距離を測る尺度として、I-ダイバージェンスがある。I-ダイバージェンスは、エネルギースペクトルをλ(ω),パワースペクトルをλ(ω)とすると、式(16)により定義される。ただし、ωは角周波数を表す。I-ダイバージェンスについては参考文献Cを参照されたい。
(参考文献C)I. Csiszar, "I-Divergence Geometry of Probability Distributions and Minimization Problems", The Annals of Probability, Vol. 3, No. 1. (Feb., 1975), pp. 146-158.
Figure 0005166460
この実施形態では、暫定短時間フーリエ係数のエネルギースペクトル{|s n,m|0≦m≦M−1に対してI-ダイバージェンスを最小化するパワースペクトルを与えるフロアつき調波パラメータの値をその推定値として求める。すなわち、式(17)を最大化するフロアつき調波パラメータの推定値{μ,γn,1,γn,2,αn,1,…,αn,NH,βn,1,…,βn,NI}(ダイバージェンス最小化フロアつき調波パラメータ)を求める。ただし、{αn,k0≦k≦NHと{βn,k0≦k≦NIはそれぞれ式(17a)と式(17b)の制約を満たすとする。
Figure 0005166460
なお、式(17)の導出においては、任意のτ,σについて式(18)が成立することを利用した。
Figure 0005166460
第1実施形態では、式(17)を最大化する方法は問わない。例えば最急降下法やニュートン法、準ニュートン法などの一般的な最適化アルゴリズムを用いてもよい。
<第2実施形態>
第2実施形態では、音源短時間パワースペクトル推定部114が式(17)を最大化するフロアつき調波パラメータを計算する方法として、EMアルゴリズムに拠る場合の方法を説明する。
第2実施形態では、図6に示すように、フロアつき調波パラメータを計算する過程は、初期化過程S300と、分配過程S310と、パラメータ更新過程S320と、分配過程S310およびパラメータ更新過程S320を包含するループ処理(S310,S321,S322)を含んでいる。Nを所与の最大繰り返し回数を規定する定数とする。
[初期化過程S300]
初期化過程S300では、制御部111が、フロアつき調波パラメータ{μ,γn,1,γn,2,αn,1,…,αn,NH,βn,1,…,βn,NI}を初期化する。
初期化方法としては例えば、下記のようにフロアつき調波パラメータの初期値を設定してもよい。まず、μの初期値は従来の基本周波数推定方法を用いて設定される。残りのパラメータの初期値は、以下のようにして設定される。
Figure 0005166460
続いて、繰り返し処理のためのインデクスiを1に設定する(ループ処理301−初期値設定)。
[分配過程S310]
分配過程S310では、分配係数と呼ばれる値を計算する。分配係数は、音源成分について、各調波成分k(1≦k≦N)、各周波数ビンm(0≦m≦M−1)に一つ定義される。同様に、フロア成分について、各帯域k(1≦k≦N)、各周波数ビンm(0≦m≦M−1)に一つ定義される。すなわち、分配係数の集合は{w1,1,m,…,w1,NH,m,w2,1,m,…,w2,NI,m0≦m≦M−1と表せる。各{w1,k,m1≦k≦NHおよび各{w2,k,m1≦k≦NIはそれぞれ式(19)、式(20)にしたがって計算される。
Figure 0005166460
[パラメータ更新過程S320]
パラメータ更新過程S320では、フロアつき調波パラメータ{μ,γn,1,γn,2,αn,1,…,αn,NH,βn,1,…,βn,NI}の値を更新する。まず、音源成分とフロア成分の音量γn,1ならびにγn,2は、式(21)と式(22)にしたがって更新される。
Figure 0005166460
各調波成分の相対強度{αn,k1≦k≦NHならびに各帯域の相対強度{βn,k1≦k≦NIは、式(23)と式(24)にしたがって更新される。
Figure 0005166460
最後に、基本周波数μは式(25)により更新される。
Figure 0005166460
式(21)−(25)によるパラメータ更新過程S320が完了した後、繰り返し回数iが予め定められた最大繰り返し回数Nに達していればループ処理を終了する(ループ処理321−条件判定)。そうでなければ、iを1だけ増やして分配過程S310に戻る(ループ処理322−繰り返し制御)。
<第3実施形態>
第3実施形態では、図1に示した残響抑圧処理の流れにおいて、残響抑圧過程S120を式(1)及び式(2)を用いる方法とは異なる方法で実施する。式(1)と式(2)による残響抑圧過程は、残響予測フィルタ{gΔm,m,…,gΔm+Km−1,m0≦m≦M−1のみ用いる。一方、第3実施形態による残響抑圧過程S120では、残響予測フィルタ{gΔm,m,…,gΔm+Km−1,m0≦m≦M−1と音源信号の短時間パワースペクトル系列の推定値{λ n,0,…,λ n,M−10≦n≦N−1の両方が用いられる(図7参照)。ここでの音源信号の短時間パワースペクトル系列の推定値{λ n,0,…,λ n,M−10≦n≦N−1は、第1実施形態によるとダイバージェンス最小化フロアつき調波パラメータが求められた時点において、第2実施形態によるとループ処理321でi=Nが成立した時点において、式(15)により得られているものである。従って、この音源信号の短時間パワースペクトル系列の推定値{λ n,0,…,λ n,M−10≦n≦N−1として第1ないし第2実施形態により得られたものを用いることができる。
具体的には、第3実施形態による残響抑圧過程S120では、式(26)のようにWienerフィルタを用いて残響抑圧部120が残響抑圧処理を行う。
Figure 0005166460
Λは所与の定数、fWiener(・)はWienerフィルタを表し、具体的には式(27)で定義される。なお、rn,mは式(1)で計算される。
Figure 0005166460
このように残響抑圧過程S120において、音楽信号特有の明確な調波構造を考慮することが可能となる。第3実施形態の残響抑圧過程S120の構成方法は、本発明のように調波構造のモデルを用いて音源信号の短時間パワースペクトル系列を推定することによって初めて効果を持つ。
<補記>
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
また、上記実施形態において説明したハードウェアエンティティ(残響予測フィルタ算出装置、残響抑圧装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
本発明の効果を確かめるシミュレーションを行った。MIDI音源を使用して、6種類の音楽のドライソース(残響を含まない音楽信号)を作成した。3種類はバイオリンによる演奏で、残り3種類はフルートによる演奏である。これら各ドライソースに2種類のインパルス応答を畳み込むことで、合計12種類の残響を含む音楽信号を模擬的に作成した。インパルス応答としては、ともに残響時間が1秒より長いものを用いた。この12種類の音楽信号に対して残響抑圧を実施した。残響抑圧方法としては、非特許文献1に記載されているように音源信号の短時間パワースペクトル系列をノンパラメトリックに推定する方法、非特許文献2に記載されているように音源信号の短時間パワースペクトル系列を全極モデルを用いて推定する方法、及び本発明にしたがって音源信号の短時間パワースペクトル系列をフロアつき調波GMMを用いて推定する方法の3つの方法を用いた。本発明に関しては、上述の実施形態2を使用した。実験結果を対数スペクトル距離の改善量で評価したものを図9に示す。図9から明らかなように、フロアつき調波GMMを用いることで、対数スペクトル距離の改善量が大きく向上した。この結果から、本発明の有効性が確認された。

Claims (11)

  1. 観測された音楽信号の短時間フーリエ係数列(以下、観測短時間フーリエ係数列という)から差し引かれる残響成分を求めるために前記観測短時間フーリエ係数列に適用される残響予測フィルタを、残響を含まない音楽信号(以下、音源信号という)の短時間パワースペクトル系列の暫定的な推定値である短時間パワースペクトル系列(以下、暫定短時間パワースペクトル系列という)に基づいて更新することにより算出する残響予測フィルタ算出装置であって、
    現在の残響予測フィルタを前記観測短時間フーリエ係数列に適用して得られる残響成分の暫定的な推定値を前記観測短時間フーリエ係数列から差し引くことにより、前記観測された音楽信号から残響が抑圧された信号の短時間フーリエ係数列の暫定的な推定値(以下、暫定短時間フーリエ係数列という)を得る残響暫定抑圧部と、
    前記音源信号の短時間パワースペクトルのモデルとして、調波GMMによる調波成分間のパワースペクトルのギャップを埋めるためのパワースペクトルであるパワースペクトルフロアを当該調波GMMに加算したモデル(以下、フロアつき調波GMMという)を用いて、前記暫定短時間フーリエ係数列のエネルギースペクトルに基づき前記フロアつき調波GMMの調波パラメータ(以下、フロアつき調波パラメータという)を推定し、この推定されたフロアつき調波パラメータを持つ前記フロアつき調波GMMにより前記暫定短時間パワースペクトル系列を求める短時間パワースペクトル推定部と、
    現在の残響予測フィルタを、前記暫定短時間パワースペクトル系列に基づいて更新する残響予測フィルタ更新部と、
    前記残響暫定抑圧部による処理と、前記短時間パワースペクトル推定部による処理と、前記残響予測フィルタ更新部による処理を、予め定められた第1の条件を満たすまで繰り返す制御を行う制御部と
    を含む残響予測フィルタ算出装置。
  2. 請求項1に記載の残響予測フィルタ算出装置において、
    前記短時間パワースペクトル推定部は、前記推定されたフロアつき調波パラメータとして、前記暫定短時間フーリエ係数列のエネルギースペクトルに対してI−ダイバージェンスを最小化するパワースペクトルを与えるフロアつき調波パラメータ(以下、ダイバージェンス最小化フロアつき調波パラメータという)を求める
    ことを特徴とする残響予測フィルタ算出装置。
  3. 請求項2に記載の残響予測フィルタ算出装置において、
    前記フロアつき調波パラメータは、基本周波数を表すパラメータと、前記調波GMMに基づくパワースペクトルにおける音量を表すパラメータと、前記パワースペクトルフロアにおける音量を表すパラメータと、第k調波成分の相対強度を表すパラメータと、前記パワースペクトルフロアの周波数帯域ごとの相対強度を表すパラメータを含み、
    前記短時間パワースペクトル推定部は、各前記調波成分と各前記周波数帯域に対応して定まる分配係数の算出と、当該分配係数を用いることによる前記フロアつき調波パラメータの更新とを予め定められた第2の条件を満たすまで繰り返し、当該第2の条件を満たしたときの前記フロアつき調波パラメータを、前記ダイバージェンス最小化フロアつき調波パラメータとして求める
    ことを特徴とする残響予測フィルタ算出装置。
  4. 観測された音楽信号に含まれる残響を抑圧する残響抑圧装置であって、
    前記観測された音楽信号の短時間フーリエ係数列(以下、観測短時間フーリエ係数列という)を求める短時間フーリエ変換部と、
    請求項1から請求項3のいずれかに記載の残響予測フィルタ算出装置と、
    前記残響予測フィルタ算出装置によって得られた残響予測フィルタを前記観測短時間フーリエ係数列に適用して得られる残響成分を前記観測短時間フーリエ係数列から差し引くことにより、前記観測された音楽信号から残響が抑圧された信号の短時間フーリエ係数列として推定された短時間フーリエ係数列(以下、終局短時間フーリエ係数列という)を得る残響抑圧部と、
    前記終局短時間フーリエ係数列を短時間逆フーリエ変換して得られる信号を出力する短時間逆フーリエ変換部と
    を含む残響抑圧装置。
  5. 請求項4に記載の残響抑圧装置において、
    前記残響抑圧部に替えて、
    前記残響予測フィルタ算出装置によって得られた残響予測フィルタを前記観測短時間フーリエ係数列に適用して得られる残響成分と、前記残響予測フィルタ算出装置によって得られる前記第1の条件が満たされた時点における前記暫定短時間パワースペクトル系列とを入力とするWienerフィルタの出力を、前記観測短時間フーリエ係数列に適用することにより、前記観測された音楽信号から残響が抑圧された信号の短時間フーリエ係数列の推定値(以下、終局短時間フーリエ係数列という)を得る残響抑圧部を含む
    ことを特徴とする残響抑圧装置。
  6. 観測された音楽信号の短時間フーリエ係数列(以下、観測短時間フーリエ係数列という)から差し引かれる残響成分を求めるために前記観測短時間フーリエ係数列に適用される残響予測フィルタを、残響を含まない音楽信号(以下、音源信号という)の短時間パワースペクトル系列の暫定的な推定値である短時間パワースペクトル系列(以下、暫定短時間パワースペクトル系列という)に基づいて更新することにより算出する残響予測フィルタ算出方法であって、
    現在の残響予測フィルタを前記観測短時間フーリエ係数列に適用して得られる残響成分の暫定的な推定値を前記観測短時間フーリエ係数列から差し引くことにより、前記観測された音楽信号から残響が抑圧された信号の短時間フーリエ係数列の暫定的な推定値(以下、暫定短時間フーリエ係数という)を得る残響暫定抑圧過程と、
    前記音源信号の短時間パワースペクトルのモデルとして、調波GMMによる調波成分間のパワースペクトルのギャップを埋めるためのパワースペクトルであるパワースペクトルフロアを当該調波GMMに加算したモデル(以下、フロアつき調波GMMという)を用いて、前記暫定短時間フーリエ係数列のエネルギースペクトルに基づき前記フロアつき調波GMMの調波パラメータ(以下、フロアつき調波パラメータという)を推定し、この推定されたフロアつき調波パラメータを持つ前記フロアつき調波GMMにより前記暫定短時間パワースペクトル系列を求める短時間パワースペクトル推定過程と、
    現在の残響予測フィルタを、前記暫定短時間パワースペクトル系列に基づいて更新する残響予測フィルタ更新過程と、
    前記残響暫定抑圧過程における処理と、前記短時間パワースペクトル推定過程における処理と、前記残響予測フィルタ更新過程における処理を、予め定められた第1の条件を満たすまで繰り返す制御を行う制御過程と
    を有する残響予測フィルタ算出方法。
  7. 請求項6に記載の残響予測フィルタ算出方法において、
    前記短時間パワースペクトル推定過程では、前記推定されたフロアつき調波パラメータとして、前記暫定短時間フーリエ係数列のエネルギースペクトルに対してI−ダイバージェンスを最小化するパワースペクトルを与えるフロアつき調波パラメータ(以下、ダイバージェンス最小化フロアつき調波パラメータという)を求める
    ことを特徴とする残響予測フィルタ算出方法。
  8. 請求項7に記載の残響予測フィルタ算出方法において、
    前記フロアつき調波パラメータは、基本周波数を表すパラメータと、前記調波GMMに基づくパワースペクトルにおける音量を表すパラメータと、前記パワースペクトルフロアにおける音量を表すパラメータと、第k調波成分の相対強度を表すパラメータと、前記パワースペクトルフロアの周波数帯域ごとの相対強度を表すパラメータを含み、
    前記短時間パワースペクトル推定過程では、各前記調波成分と各前記周波数帯域に対応して定まる分配係数の算出と、当該分配係数を用いることによる前記フロアつき調波パラメータの更新とを予め定められた第2の条件を満たすまで繰り返し、当該第2の条件を満たしたときの前記フロアつき調波パラメータを、前記ダイバージェンス最小化フロアつき調波パラメータとして求める
    ことを特徴とする残響予測フィルタ算出方法。
  9. 観測された音楽信号に含まれる残響を抑圧する残響抑圧方法であって、
    前記観測された音楽信号の短時間フーリエ係数列(以下、観測短時間フーリエ係数列という)を求める短時間フーリエ変換過程と、
    請求項1から請求項3のいずれかに記載の残響予測フィルタ算出方法にしたがってと残響予測フィルタを得る残響予測フィルタ算出過程と、
    前記残響予測フィルタ算出過程において得られた残響予測フィルタを前記観測短時間フーリエ係数列に適用して得られる残響成分を前記観測短時間フーリエ係数列から差し引くことにより、前記観測された音楽信号から残響が抑圧された信号の短時間フーリエ係数列として推定された短時間フーリエ係数列(以下、終局短時間フーリエ係数列という)を得る残響抑圧過程と、
    前記終局短時間フーリエ係数を短時間逆フーリエ変換して得られる信号を出力する短時間逆フーリエ変換過程と
    を有する残響抑圧方法。
  10. 請求項9に記載の残響抑圧方法において、
    前記残響抑圧過程に替えて、
    前記残響予測フィルタ算出過程において得られた残響予測フィルタを前記観測短時間フーリエ係数列に適用して得られる残響成分と、前記残響予測フィルタ算出過程において得られる前記第1の条件が満たされた時点における前記暫定短時間パワースペクトル系列とを入力とするWienerフィルタの出力を、前記観測短時間フーリエ係数列に適用することにより、前記観測された音楽信号から残響が抑圧された信号の短時間フーリエ係数列の推定値(以下、終局短時間フーリエ係数列という)を得る残響抑圧過程を有する
    ことを特徴とする残響抑圧方法。
  11. 請求項1から請求項3のいずれかに記載の残響予測フィルタ算出装置および/または請求項4または請求項5に記載の残響抑圧装置として、コンピュータを機能させるためのプログラム。
JP2010026427A 2010-02-09 2010-02-09 残響予測フィルタ算出装置、残響抑圧装置、残響予測フィルタ算出方法、残響抑圧方法、プログラム Expired - Fee Related JP5166460B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010026427A JP5166460B2 (ja) 2010-02-09 2010-02-09 残響予測フィルタ算出装置、残響抑圧装置、残響予測フィルタ算出方法、残響抑圧方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010026427A JP5166460B2 (ja) 2010-02-09 2010-02-09 残響予測フィルタ算出装置、残響抑圧装置、残響予測フィルタ算出方法、残響抑圧方法、プログラム

Publications (2)

Publication Number Publication Date
JP2011164335A JP2011164335A (ja) 2011-08-25
JP5166460B2 true JP5166460B2 (ja) 2013-03-21

Family

ID=44595084

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010026427A Expired - Fee Related JP5166460B2 (ja) 2010-02-09 2010-02-09 残響予測フィルタ算出装置、残響抑圧装置、残響予測フィルタ算出方法、残響抑圧方法、プログラム

Country Status (1)

Country Link
JP (1) JP5166460B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5923994B2 (ja) * 2012-01-23 2016-05-25 富士通株式会社 音声処理装置及び音声処理方法
JP6677662B2 (ja) * 2017-02-14 2020-04-08 株式会社東芝 音響処理装置、音響処理方法およびプログラム
CN110634285B (zh) * 2019-08-05 2021-10-08 江苏大学 一种基于高斯混合模型的路段出行时间预测方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4313740B2 (ja) * 2004-08-25 2009-08-12 日本電信電話株式会社 残響除去方法、プログラムおよび記録媒体
JP2006251712A (ja) * 2005-03-14 2006-09-21 Univ Of Tokyo 観測データ、特に、複数の音源からの音が混在している音響信号の解析方法
JP4977062B2 (ja) * 2008-02-29 2012-07-18 日本電信電話株式会社 残響除去装置とその方法と、そのプログラムと記録媒体

Also Published As

Publication number Publication date
JP2011164335A (ja) 2011-08-25

Similar Documents

Publication Publication Date Title
JP4107613B2 (ja) 残響除去における低コストのフィルタ係数決定法
JP4517045B2 (ja) 音高推定方法及び装置並びに音高推定用プラグラム
JP6180553B2 (ja) 入力雑音混入信号を強調する方法およびシステム
JP6623376B2 (ja) 音源強調装置、その方法、及びプログラム
JP4977062B2 (ja) 残響除去装置とその方法と、そのプログラムと記録媒体
CN113436643A (zh) 语音增强模型的训练及应用方法、装置、设备及存储介质
JP2019078864A (ja) 楽音強調装置、畳み込みオートエンコーダ学習装置、楽音強調方法、プログラム
CN110998723B (zh) 使用神经网络的信号处理装置及信号处理方法、记录介质
JP2020086434A (ja) 音声検出のための雑音除去変分オートエンコーダ基盤の統合トレーニング方法および装置
JP2009210647A (ja) 雑音除去装置、その方法、そのプログラム及び記録媒体
JP5166460B2 (ja) 残響予測フィルタ算出装置、残響抑圧装置、残響予測フィルタ算出方法、残響抑圧方法、プログラム
KR100701452B1 (ko) 스펙트럼 모델링
JP6567478B2 (ja) 音源強調学習装置、音源強調装置、音源強調学習方法、プログラム、信号処理学習装置
JP6721165B2 (ja) 入力音マスク処理学習装置、入力データ処理関数学習装置、入力音マスク処理学習方法、入力データ処理関数学習方法、プログラム
EP3136387A1 (en) Frequency domain parameter sequence generation method, coding method, decoding method, frequency domain parameter sequence generation device, coding device, decoding device, program, and recording medium
JP4977100B2 (ja) 残響除去装置、残響除去方法、そのプログラムおよび記録媒体
JP5191500B2 (ja) 雑音抑圧フィルタ算出方法と、その装置と、プログラム
JP5583181B2 (ja) 縦続接続型伝達系パラメータ推定方法、縦続接続型伝達系パラメータ推定装置、プログラム
JP6827908B2 (ja) 音源強調装置、音源強調学習装置、音源強調方法、プログラム
JP2020030373A (ja) 音源強調装置、音源強調学習装置、音源強調方法、プログラム
US11758324B2 (en) PSD optimization apparatus, PSD optimization method, and program
JP7173355B2 (ja) Psd最適化装置、psd最適化方法、プログラム
JP7428251B2 (ja) 目的音信号生成装置、目的音信号生成方法、プログラム
WO2023132018A1 (ja) 学習装置、信号処理装置、学習方法及び学習プログラム
JP7218810B2 (ja) 音声非音声判定装置、音声非音声判定用モデルパラメータ学習装置、音声非音声判定方法、音声非音声判定用モデルパラメータ学習方法、プログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110624

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120307

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121220

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151228

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5166460

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees